实体店网上买彩票:微信學術交流群之聊天記錄(6)

微信學術交流群之聊天記錄(6)

 

體系相關

A://biocomp.chem.uw.edu.pl/CABSdock/這個網站的結果怎么比較啊?

殷賦科技:我還沒用過呢,只是在網上搜索到的。你那計算完了,有什么結果啊?

A:

殷賦科技:沒有打分之類的東西?

A:只給了結果,但沒看到這樣排序的依據。

殷賦科技:應該是最上面的是最合適的,那你下載下來就可以用啦!

A:沒看到這樣排序的依據。

殷賦科技:上面有講啊,根據動力學軌跡中出現的概率排序,1表示最可能。

A:我還以為會和vina一樣,有一個數值結果的比較。

殷賦科技:大多數都有個評分,但這個恰好沒有。不過也不妨礙我們使用,評分只是一個參考,通常只具有相對比較的意義,所以,換成概率也是可以的,而概率也只是一個粗略的估計,變成排序更為方便。請根據你對體系的了解,多看幾個model,綜合判斷,選擇一個合適的來做后續工作吧。

殷賦科技:我多說一句,我經常在群里和私聊說,“對體系的了解”,指的是根據你的目標確定你要了解哪些信息,以此篩選、過濾模型。比如,如果我要做分子對接預測蛋白-配體結合模式,那么,除了打分是一個參考指標外,還需要你對這個蛋白的功能、關鍵殘基、抑制劑、激動劑、拮抗劑的作用機理有所了解。掌握的信息越多,判斷就越容易。我們平臺把操作最簡化,但其實對用戶具有更高的要求,要做出科學合理的結果,需要用戶去了解和思考,而非當個操作員。

模型預測

B:想問下大家,ZINC數據庫下載下來的小分子,有沒有相對應的LD50?

C:沒有吧。

D:zinc里面天然產物能知道來源生物嗎?

E:什么數據庫這么強大?

D:我在zinc里面下載的好像ibs還是stock1n。我也不懂,納悶那個物質能查到來源嗎。

B:USCF DOCK對接軟件里,可以預測化合物的LD50嗎?主要是因為我看了這篇文獻,文章里沒說做實驗得到的LD50,我就想不明白這個LD50到底是哪里得來的。

B:

F:數據庫查到的?對接不能預測LD50吧。

殷賦科技:對接軟件不能預測LD50,文獻是個別化合物剛好有人測了LD50。

B:

結果是這樣的一個表格,我也不知道這些LD50哪里來的,關鍵是65個來源于ZINC數據庫的小分子,難道正好都是查到了別人做過的LD50嗎。

F:可能他選的大部分都是測過的吧。

殷賦科技:是啊,不是還有2個沒有LD50嗎?如果是軟件預測,為啥不是全部有呢?

B:也對哈,突然間我也意識到這個問題了。

G:部分化合物有admet數據,可以自己做模型預測。

B:怎么做啊這個?

G:自己訓練模型,我沒有訓練過急性毒性,我做過遺傳毒性。

C:搞個深度學習模型預測ADMET。

G://admet.scbdd.com/。

B:為啥有兩個化合物沒有毒性信息呢?

G://www.pkumdl.cn:8080//DLAOT/DLAOThome.php。有很多文獻,照文獻來就可以,大部分都沒有,只有部分有。

B:我是看文獻,沒看懂。

G:其實現在不用看懂文獻,只要做個合格的數據搬運工: 將數據幫到百度、阿里云、Google上,讓它自動訓練,獲得模型。建議試試Google機器學習,1小時20美金。

B:我看是文獻里對接出打分較高的65個小分子,然后這些小分子做了LD50,直接將這些小分子結構輸入這些網站就能得到LD50?

G:不會,你要首先要訓練它,獲得一個模型; 然后用模型預測。

B:訓練他什么意思?

C:數據結構整理好,輸入模型就可以了。

G:你還是用這個比較好。//www.pkumdl.cn:8080//DLAOT/DLAOThome.php。再看看這個的方法學。

H:請問現在有沒有那種輸入化合物,直接給出合成路線的軟件或網站?尤其是天然產物那種。

G:我也想找一個。

H:通過訓練ai,應該可能實現吧?

G:普通機器學習就可以

H:那怎么沒人搞

D:效果不好唄

G:很多人搞,最好的是simulation pkus。https://www.simulations-plus.com/

G:剛才發的也都是機器學習,比薛定諤強100倍。你試試herg毒性預測就知道比所有的都強,只是學術用的比較少而已。

D:好,我平常用的都是ds帶的ADMET預測,估計也不太靠譜。

G:你試試herg陰性化合物,試試schrodinger與ds,看看預測結果。

I:我之前用nlp的word2vec搞逆合成的深度學習,可惜學藝不精,準確度比較差。就是把化合物的smiles格式字符串變成向量,然后用LSTM神經網絡學習,大概60萬個化學反應。預測準確度很低。

C:反應當做什么,變量還是描述符?

I:就是自然語言處理翻譯,把產物“翻譯”成反應物。這個描述符就是word2vec,把smiles格式變成向量即可。

C:逆合成???

I:是啊。

殷賦科技:LSTM適用于序列預測問題,但逆合成不涉及時間序列吧。你把逆合成的步驟算作序列?

I:lstm在nlp中比較常見,所以我就選它了。

Miscellaneous

I:DS對接出來Energy得分是正的,這代表啥意思啊?

D:是cdock嗎?

I:是的,是cdocker。

G:不管是正值還是負值,解讀應該都一樣。這篇文章里的cdocker也都是正值。

https://www.sciencedirect.com/science/article/pii/S2095754817302119,見表5。

G:正確做法應該讀個說明書與算法,看看結合親和力與打分的關系。再與大家分享一下,文獻之類的都不靠譜。

H:有沒有軟件或網站,能直接給出蛋白活性口袋區域的DNA序列?

G:你是說組成口袋氨基酸殘基對應的dna嗎?

H:對,我想比較一下兩個蛋白的口袋,看看有沒有異同。

G:那直接比蛋白口袋就可以了,序列比對或蛋白疊合就可以了。

K:

K:@殷賦科技 這個地方指的保守的氫鍵網絡是什么啊?

殷賦科技:應該是跟同類多肽、不同種屬、同工蛋白之類的進行比較,這個氫鍵是大家都有的,稱為保守吧。要根據上下文判斷。

貝爾湖:大家好,新來菜鳥報道,請問得到分子對接文件dlg怎么解釋結果合理性呢,怎么解讀結果呢?

殷賦科技:還在用autodock4啊?用vina吧,更推薦用dock6。

貝爾湖:autodock4和dock6有什么大的差異嗎,是結果可靠性還是什么?

殷賦科技:官方數據表明autodock vina比autodock4更快更準,我的經驗是dock6比vina準確,而且能夠解釋更多東西,更有物理意義。

M:嗯,不會用dock6。

殷賦科技:用我們的平臺,有教程,跟著一步一步點擊鼠標就行。

這里還有分析教程:【文獻重現】D715-2441 抑制劑與PB2蛋白的結合模式研究和作圖教程:高質量PyMOL作圖教程。

M:可以win嗎?我還不會linux。

殷賦科技:不用安裝任何軟件,只要瀏覽器,在任何系統都可以。

更多資訊,請登錄哪些平台可以买彩票 或關注微信公眾號“殷賦科技”。我司建立了微信學術交流群,為生物醫藥領域的朋友搭建溝通交流的互動平臺。想入群的朋友,請在微信公眾號菜單欄輸入“加群”,根據提示操作即可。