A:用的cdocker將晶體復合物的配體對接回原來的蛋白質重合度不好啊,rmsd也比較高,請問大家對接時受體蛋白加力場嗎?
B:參數(shù)沒設置好吧。
C:要分析原因哦。
(1)是所有對接計算出來的pose都不好?
(2) 還是打分最好的那個不好,打分差的反而好?
(3)還是根本沒有生成活性構象。
如果生成了活性構象,而打分函數(shù)沒有把他挑出來,說明打分函數(shù)有問題,需要換一個打分函數(shù)。如果根本沒有擺出正確pose,需要改變搜索策略;蛘吒纱鄵Q軟件。
活性預測D:我現(xiàn)在自己做小分子活性預測的深度學習,在建模的過程中有個問題,訓練集多少比較合適?
C:深度學習以不過擬合為準,同一個靶標的QSAR估計你要幾千個數(shù)據點,我做過的都有6000,7000,8000或更多以上。
D:這個訓練集您是以什么標準篩選的,有什么數(shù)據庫嗎?
C:開源的有pubchem,chembl,bindingdb。
D:他的活性值在這些數(shù)據庫都有嗎?需要爬蟲下來?
C:不需要爬蟲啊, 直接可以按靶標搜索。
E:現(xiàn)在什么靶標比較火呀,我也做的深度學習的,描述符有很多。
殷賦科技:不應該選經典成熟的靶標么?
E:用二維描述符+卷積神經網絡。哪個靶標有一萬以上的小分子呢?
C:毒性,代謝是所有藥物上市前都研究的,這些靶標比較多,比如hERG。
蛋白處理與分子對接A:請問如果是鋅結合的抑制劑對接完成后做QM/MM除了將配體,鋅離子以及與鋅離子直接相連的三個氨基酸設為QM區(qū),那些與配體成氫鍵或是pi作用的氨基酸也要設為QM區(qū)嗎?
E:是的。
A:還有請問對于配體的電荷怎么看啊?比如一個羧酸分子,是0嗎?
E:羧酸有H嗎?有H就是0。
A:請問什么叫有氫嗎?我加了charmm力場,羧酸那個O上面沒有H。
E:那是-1,你的qm是dft還是dftb?
A:我不懂,怎么看啊?我是在ds里做的。
E:我以為你是qm/mm/md!
A:不是,沒有做分子動力學。你好,我的配體就是這樣的。
A:這個就算做-1是嗎?還有請問組氨酸電荷是不是+1呢?我天冬氨酸按照-1算的。
E:HID,HIP還是HIE?看你質子化情況。
A:HIS。怎么看質子化啊?我是小白就是按教程做的。
殷賦科技:讓DS處理吧。用UCSF Chimera的Prep Dock就可以處理,我們平臺也會自動處理蛋白,生成的mol2文件就含有質子化氫和偏電荷(partial charge)。
F:你用什么做QMMM?
A:你好,我用的ds@F。下載的pdb晶體里面有一個配體很大,為了對接,清理蛋白質的時候定義活性位點設定的半徑要不要相應增大啊?
G:不知道具體的結合位點?
A:我就選中的原來配體設定的半徑。
H:原來的配體就是活性位點,一般半徑設置10左右吧,半徑太大的話對接時間會長,另外結果不準確,當然半徑太小會對接不進去,可以適當調整。
A:你好,我看教程也是說半徑設為10但是10的話我看無法全部包括原來的配體分子啊。
H:你可以適當增大,12也可以。
I:你們用的什么軟件?我之前對接一個蛋白,用的原配體口袋,對接我的化合物打分挺高的,可是作用的氨基酸跟文獻差好多,這正常么?
A:ds,我主要是現(xiàn)在想要選一個好的晶體,把自帶的配體對接回去和本身的配體重疊查看一下rmsd值。
G:就是對接出來的結果不是那么準確吧。
A:好多晶體對接回去都不好,我現(xiàn)在調大點半徑試試,先對上再說。
I:我之前用薛定諤對接的效果不錯。
A:我感覺你那種情況好像也挺正常,這種對接也不怎么準,尤其是ds。
I:后來用的DS對接效果一般,但是作用的蛋白跟我用薛定諤對接的差不多。
A:薛定諤好像是更靠譜一些。
I:做起來挺慢的。
A:你們有薛定諤的教程嗎?
I:我是跟別人學了兩天,也沒太搞明白。原來學校有個課題組做這個方向的,我畢業(yè)走了,我們學校開始開的計算機輔助藥物設計這門課了!
QSAR疊合構象R:請問,做QSAR分子疊合的時候,有些疊合的不好該怎么搞呢,明明都差不多。殷賦科技:你指的是QSAR模型的預測能力不好吧?如果疊合不整齊,手動調整咯。
R:你是說調訓練測試集嘛?
殷賦科技:你是說結構疊合得不好(不整齊)嗎?還是疊合后做出來的模型預測能力不好?
R:疊合出來的預測能力還行 confa的0.6幾,comsia的有0.7幾,就是疊合的不整齊。
殷賦科技:截圖看如何不整齊。
殷賦科技:你是不是認為有部分結構應該左右反過來疊合才算整齊?
R:反倒是沒反。
殷賦科技:那就沒問題啊。
G:這是什么軟件?
殷賦科技:SYBYL。
R:有幾個明明就一點差別,但是疊合出來就重合的不好。
殷賦科技:那是構像問題了,它已經盡力了,但疊合是剛性的,構像如此,它也很無奈啊。調整構像唄,可以用你認為合適的某個化合物來構建相似結構的結構,構像就接近啦。
殷賦科技:或者產生大量構像,然后用算法去挑選。我不知道SYBYL里邊有沒有這個功能。
R:我剛看了教程找到了你說的利用構象搜索去挑選疊合構象@殷賦科技 感謝你的提醒。
虛擬篩選S:導師讓我做虛擬篩選這塊兒(學autodock) ,但是沒有頭緒,我也不怎么會python,請問有這方面的課程么?
殷賦科技:我們博客上有個腳本,可以用用,不過,并不建議新手去用腳本做篩選。因為計算不是問題,問題是沒有經驗的人的命中率很低,浪費的是買化合物做實驗的錢。
S:有道理,之前同組的同學用svm篩選過酪氨酸酶抑制劑,酶一點點花了八千多。
殷賦科技:我們正在開發(fā)在線方案,聯(lián)合使用vina和dock6對接,再加上根據以往經驗寫成的分析篩選腳本,能極大提高命中率。如果不著急,不妨等一等。
D:您說的基于Vina和dock6對接,然后經過分析后得到數(shù)據的腳本,這個分析是什么個過程?共同命中被選下來?這個的話腳本不難寫,如果這個思路可行的話我也想寫寫試一試。
殷賦科技:主要是兩步,一是根據打分挑選最好的化合物,二是根據結合模式挑選,前者容易實現(xiàn),后者則比較困難。
D:結合模式的話會把關鍵氨基酸以及結合對關鍵氨基酸的影響考慮進去嗎?
殷賦科技:對,分為一般相互作用(比比如氫鍵、pi-pi堆積)和特殊相互作用(針對該體系的關鍵氨基酸及其作用),還有口袋形狀的匹配程度HH。
靶標預測圖G:大家有預測疾病靶點的那種圖嗎?我寫東西想用用。但是找不到啊。
F:舉個例子?
K:什么樣的圖?
殷賦科技 :大概要個網絡圖吧。
G:對就是網絡關系那種。
G:不用顯示具體的物質。我就是想用一下這樣的圖。說明一下預測靶點。
殷賦科技:化合物在中間,周圍是潛在的蛋白靶標,遠近表示可能性大小。http://aAs.cytoscape.org/media/golorize/screenshots/Golorize.jpg。
更多資訊,請登錄www.yinfotek.com 或關注微信公眾號“殷賦科技”。我司建立了微信學術交流群,為生物醫(yī)藥領域的朋友搭建溝通交流的互動平臺。想入群的朋友,請在微信公眾號菜單欄輸入“加群”,根據提示操作即可。