深勢科技推出蛋白結構預測工具Uni-Fold:開源訓練代碼 提供測試接口
12月8日,來自深勢科技的團隊推出了蛋白質結構預測工具Uni-Fold,并開源訓練、推理代碼。Uni-Fold成功復現了曾引起生物學界轟動的Alphafold2的全規模訓練,相應解決方案已集成至深勢科技自主研發的藥物設計平臺Hermite,供廣大用戶測試使用。Uni-Fold克服了Alphafold2未開源訓練代碼、硬件支持單一、模型不可商用等局限性,在訓練與推理環節進行了GPU上的適配、性能優化、功能完善等工作,為更多人參與推動領域進一步發展提供了基礎。
圖1 Uni-Fold預測的蛋白結構
蛋白質是組成生命體的重要物質基礎。不同的蛋白質通過折疊形成不同的三維結構,執行多種多樣的生理功能。從氨基酸序列到對應蛋白質三維結構的預測問題被認為是生物學領域最具有挑戰性的問題之一。在過去幾十年的研究中,科學家們為探測蛋白質結構發展出三大實驗手段:X射線晶體學、核磁共振和冷凍電鏡。但實驗方法成本高、周期長。目前人類已知有數十億氨基酸序列,但還原出結構的只有十幾萬。生物學發展因此頗受掣肘。
近年來AI的發展為這一問題帶來了新的可能。在2020年的國際蛋白質結構預測頂級競賽CASP14(Critical Assessment of protein Structure Prediction 14)上,Google DeepMind推出的AlphaFold2預測的大部分結構準確度均與實驗足夠接近,遠超此前所有方法。這一結果也標志著蛋白質單體的結構問題在一定意義上得到了解決。
不過,盡管DeepMind在半年后開源了AlphaFold2模型的推理代碼,其訓練代碼并未被公布,且模型不可商用。研究者難以通過訓練或調整模型進一步提升AlphaFold2的表現,或遷移至更多應用場景,如蛋白質復合物結構預測、蛋白質與小分子相互作用、與電鏡實驗結合等。此外,該代碼基于Google自研的可微分計算框架JAX及TPU硬件平臺開發,高度依賴Google生態系統。
Uni-Fold打破了這些限制。目前已開源的Uni-Fold訓練代碼,經過MPI并行、數據異步讀取、混合精度訓練等優化工作,支持高效GPU訓練。基于優化后的訓練代碼,深勢科技團隊實現在128塊NVIDIA GPU上進行AlphaFold2模型的全規模訓練,并將持續優化所得模型。Uni-Fold的推理代碼更加輕量、高效,在相同硬件環境下,可獲得與公布的Alphafold2代碼相比2-3倍的效率提升。
在相同的測試條件下,Uni-Fold的預測精度超越了華盛頓大學蛋白設計研究所David Baker教授課題組研發的RoseTTAFold,與DeepMind官方發布的AlphaFold2模型接近。深勢科技團隊使用Uni-Fold對CASP14蛋白預測任務中的序列數據集進行了直接測試,平均Cα-lDDT達到82.6。可以說,Uni-Fold是“訓練公開版的AlphaFold2”,而且硬件適配與效率更加優化。
中科院院士、北京大學教授、深勢科技首席科學顧問鄂維南評價道:“盡管DeepMind開源了推理代碼,但模型的訓練技術才是核心競爭力。在資源比較匱乏的情況下,深勢科技團隊在較短時間內實現模型訓練、開源訓練代碼,這是很不容易的。深勢科技在物理模型方面具備豐富的經驗,Uni-Fold進一步彌補了團隊在數據驅動方面的短板。下一步,物理模型和數據驅動結合的解決方案將為蛋白結構和藥物設計行業提供更好的基礎。”
深勢科技也對Uni-Fold進行了進一步的開發和優化,集成于旗下自主研發的一站式計算輔助藥物設計平臺Hermite中,供用戶使用。Hermite是根植于云計算的臨床前藥物設計全流程計算平臺,致力于為藥物科研工作者提供數據、算法、算力三位一體的一站式解決方案。在Uni-Fold前,Hermite上已集成多個重量級功能。例如基于Uni-Fold等方法得到蛋白結構后進行蛋白的動力學模擬、結構精修或環區優化的RiD模塊;在藥物優化階段比較不同分子與蛋白靶點結合活性差別的Uni-FEP模塊,等等。
圖2 Uni-Fold在深勢科技Hermite藥物設計平臺上的使用
在藥物設計領域,結合Uni-Fold、RiD等AI輔助計算模擬的算法,以及算法與冷凍電鏡等實驗手段的結合,深勢科技正在打造出一套模擬—AI—實驗三者驅動的解決方案,賦能藥物設計行業,加速從業者的藥物研發進程。
芝加哥豐田計算技術研究所的許錦波教授主攻機器學習、優化方法和計算生物學,也是深度學習預測蛋白質結構的先驅。他評價道:“針對AlphaFold未公開訓練代碼的局限性,深勢科技敢于打破現狀,率先公布訓練代碼。Uni-Fold的出現,讓每個研究者都可以訓練自己的模型。這無疑將進一步推動技術的發展。對整個蛋白質折疊領域來說,都是令人激動的消息。”
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。
關鍵詞:
您可能也感興趣:
為您推薦
8家險企股權被掛牌轉讓,為何險企股權不再被追捧?
深圳最低工資標準調整為2360元/月 失業保險金為2124元/月
遼寧實施失業保險省級統籌 對缺口核定等作出詳細規定
排行
最近更新
- 上海璞麗酒店逸居假日邀約您漫選沉浸式旅程
- 輕松重拾美麗與自信 A.O.史密斯軟水燃氣熱水器讓你在家做美容
- 國風設計有多好看?新捷途X70S來了!
- 跨鏈支付網絡cBridge宣布支持Astar Network
- 艾德一站通「每日金股」功能全新升級 開啟“投資陪伴”新風向
- 增速獲客賽道 激活年輕屬性——興業銀行信用卡“圈粉”90后
- 百融云創與某銀行達成戰略合作 SaaS平臺促進數字化轉型
- “高速上違停趕報表”警示了誰?
- 離職文書的“坑”不能僅由勞動者填平
- 脫掉K-9包袱節流減員,新東方在線駛向新“東方”
- 疫情得到控制,防疫仍不可松勁
- ?青海春天一字跌停,2021年預虧超2.65億或將被實施退市風險警示
- 金地集團子公司東莞金展房地產因虛假材料取得商品房預售許可被罰
- 幫助中小企業紓困解難,工信部明確這些舉措!
- 非學科類培訓班寒假惡意漲價需綜合施治
- 機構:2021年126家房企參與收并購 交易金額同比增長21.3%
- 北京:買四類藥品實施新政 市場監管進店查落實
- 營收凈利雙降,沃華醫藥用九成利潤給股東“發紅包”
- 東莞保越實業因虛假材料取得商品房預售許可被罰 其系保利、...
- 北京:保證春節群眾需求不脫銷、不斷檔
- 天津積分落戶新政:取消年度落戶數量限制
- 五糧液集團實現營收1400億元
- 瑞爾集團再遞表港交所:連續三年虧損 淡馬錫持股10.88% 43...
- 豐臺今天開展第二輪全員核酸篩查
- 發改委給高耗能企業定KPI:冬奧會用的神奇綠電,要引入碳交易
- 比亞迪:2021年94名員工因不廉潔、嚴重違規被查處
- 采購進口冷鏈食品需要做好個人防護
- 特斯拉反訴摩根大通 :想借馬斯克發布私有化推特獲利益
- 北京市疫情防控形勢總體可控
- 東莞中海嘉樺房地產因虛假材料取得商品房預售許可被罰 其系...