• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 數據科學

    借助 NVIDIA BioNeMo Cloud API 加速 Receptor.AI 的藥物研發

    藥物研發的核心是尋求新的、有效的治療方法,以治療仍然對當前療法有強烈抵抗力的疾病。隨著加速計算的興起,深度學習等 AI 技術從根本上改善了這一傳統上漫長而昂貴的過程。

    倫敦的藥物研發公司 Receptor.AI,作為NVIDIA 初創加速計劃會員,成功地將NVIDIA BioNeMo集成到其端到端計算機輔助藥物研發 (CADD) 平臺的云 API 中。通過這一集成,該公司實現了從基于 CPU 的傳統處理到 NVIDIA 平臺加速計算的轉變,顯著提升了包括虛擬篩選、ADMET預測和配體姿態預測在內的主要藥物研發任務的效率。

    本文將探討 Receptor.ai 如何將其藥物研發平臺與 NVIDIA BioNeMo 相結合,以及加速計算在 ADMET 預測任務中的優勢。

    NVIDIA BioNeMo 作為平臺的推動者

    NVIDIA BioNeMo 云 API 率先提供了對藥物研發至關重要的高級 AI 模型。研究人員、工程師和藥物獵人可以使用這些模型來擴展和定制大型生物分子的開發和部署,這些模型包括用于蛋白質折疊、分子對接和分子生成的基礎模型。BioNeMo 還包含一個 Playground(圖 1),這是一個實驗性的界面和參考,供開發者創建應用。

    Receptor.AI 首席技術官 Sergii Starosyla 博士說:“ NVIDIA 的 BioNeMo 提供了一個基礎層,其中包含高性能工具和先進的模型,可以輕松進行定制并集成到第三方藥物研發工作流程中。

    Starosyla 博士補充道:“通過將 BioNeMo 的強大功能與 Receptor.AI 的藥物研發云平臺相結合,我們可以獲得由完整的 NVIDIA 硬件和軟件加速堆棧支持的最新深度學習技術。這為處理極具挑戰性的藥物標開辟了新的機會。”

    Receptor.AI 利用內部混合智能藥物研發平臺的強大功能,專注于設計注重選擇性和向蛋白質 – 蛋白質相互作用 (PPI) 的高效療法。

    Screenshot of a protein folding model in NVIDIA BioNeMo Playground
    圖 1.用于模型實驗的 NVIDIA BioNeMo Playground

    基于擴散的生物學和化學模型

    Receptor.AI 利用基于擴散的生成式 AI 對藥物標相互作用 (DTI) 或人體中的蛋白質與藥物相互作用的方式進行建模。通過此系統,他們可以探索數十億個化學空間,同時考慮到上和顯式離蛋白的構象靈活性,以確保優化識別潛在的治療化合物。

    例如,Receptor.AI 相互作用模型可以預測分子是否與特定蛋白質相互作用,從而表明生物活動。同樣,選擇性預測 AI 模型評估潛在的脫相互作用,并根據數千種人類蛋白質對其選擇性進行排名。Receptor.AI 的平臺還評估化合物的吸收、分布、新陳代謝、排便和劇毒 (ADME-Tox),并預測多達 40 個參數,以確保安全性和有效性。

    考慮到訓練和服務基礎模型所涉及的計算復雜性,加速計算平臺已成為運行這些模型的重要組成部分。其中一個模型是進化規模建模(ESM)蛋白質序列編碼模型,可通過 BioNeMo 獲取,該模型為 Receptor.ai 的專有 DTI 和選擇性應用提供輸入功能。有關更多信息,請參閱進化規模的蛋白質序列語言模型支持準確的結構預測

    Screenshot of the web interface of the Receptor.AI drug discovery platform.
    圖 2.Receptor.AI 藥物研發平臺的 Web 界面

    借助基礎模型進行藥物設計

    Receptor.AI 平臺使用戶能夠篩選數十億種化合物,并根據具有高治療潛力的知名目標蛋白評估篩選質量。通過將其平臺的 AI 技術與 NVIDIA BioNeMo 云 API 相結合,Receptor.AI 能夠簡化蛋白質準備、大規模虛擬篩選和對接技術。

    One Receptor.AI 的工作流程專注于理解長鏈多不飽和脂肪酸 (PUFA),這是癌細胞增殖的關鍵。考慮到人體氨基酸脫飽和酶 1 (FADS1,UniProt ID O60427) 在 PUFA 生物合成及其對癌癥起源和生物學中的重要作用,該蛋白質被確定為有前景的藥物靶點。在對 FADS1 進行選擇性評估時,選擇了三個同源氨基酸脫飽和酶域作為潛在的非標靶:FADS2 (ID O95864)、FADS3 (ID Q9Y5Q0) 和 FADS6 (ID Q8N9I5)。

    Receptor.AI 精心策劃了一個龐大的庫,其中包含大約 43 億種用于篩選的硅生成的小分子化合物,其中包括 25 種已知可與 FADS1 (稱為配體)結合的化合物)這用于評估 Receptor.ai 的 AI 工作流程在處理化合物優先級和排序任務時的性能。重要的是,這些配體被排除在 AI 訓練集之外,以保持其無偏測試方法的完整性。此外,Receptor.AI 整合了通過計算從已知 FADS1 配體衍生的分子,以展示 BioNeMo 和 Receptor.AI 平臺強大的生成式 AI 功能。

    用于篩選的預處理蛋白質和分子

    圖 3 概述了虛擬篩選實驗的方案。主要選擇使用了 DTI 和選擇性模型,然后是 ADME-Tox 評估。DTI 排名用于蛋白質組范圍的選擇性評估。使用 BioNemo DiffDock AI 對接獲取入圍化合物的結合姿勢。在最后階段,使用 Receptor.AI 共識函數對頂部候選分子進行排名。

    Diagram of the general scheme of experiment. BioNeMo technology is shown in green and Receptor.AI technology is shown in blue.
    圖 3.實驗的一般方案,包括 BioNeMo (綠色塊)和 Receptor.AI(藍色塊)技術

    蛋白質制備

    FADS1 蛋白沒有可用的實驗性 3D 結構,這是藥物研發活動的基礎。雖然其預測結構存在于 AlphaFold 蛋白質結構數據庫,BioNeMo 通過 BioNeMo Cloud API (圖 4) 在大約 17 分鐘內對其進行了重新計算,具有很高的置信度。在處理新發現或突變的蛋白質時,此類功能至關重要。有關更多詳細信息,請參閱 使用 AlphaFold 實現高度準確的蛋白質結構預測

    配體結合袋由PUResNet模型在NVIDIA Tesla T4 GPU 上進行AI 預測。根據InterPro FADS1 標注

    Model of the predicted 3D structure of FADS1 with the binding pocket location in the middle in blue.
    圖 4.FADS1 的預測 3D 結構和裝訂位置(藍色)

    使用 BioNeMo Cloud API,計算了標和三種非標蛋白質的 ESM 編碼。通過云 API 進行計算大約需要 1.4 秒,而使用 16 個虛擬 CPU 的 CPU 實例大約需要 6。0 秒。

    篩選庫準備

    利用NVIDIA MegaMolBART模型,我們針對44種已知化合物,通過實驗確定了FADS1的活性(IC50=1K nM)。這些數據來自ChEMBL數據庫,我們據此生成了44萬個新分子(每個已知化合物生成1萬個新分子)。圖5展示了生成的一些新分子示例。

    Receptor.AI 將這些 44K 生成的化合物混合到 43 億個虛擬庫中。該庫中的化合物可用作試驗性陰性控制。他們還將 25 個隨機選擇的 FADS1 已知配體添加到篩選數據集,以評估其在最終結果中的排名。這樣做的預期是,相當一部分已知配體會出現在最終排名候選名單之上。

    Screenshot of BioNeMo Playground showing examples of the molecules generated using MegaMolBART.
    圖 5.BioNeMo Playground 中使用 MegaMolBART 生成的分子示例

    GPU 驅動的虛擬篩選

    Receptor.AI 命中識別管線包括 DTI、DTI 等級、選擇性和 ADME-Tox 模塊(圖 6)。它用于將化學空間從大約 43 億個化合物縮小到 500 個最有希望的候選化合物。篩選過程涉及 CPU 密集型和 GPU 密集型任務。表 1 比較了單個 NVIDIA T4 GPU 與具有 16 個 vCPU 的實例在虛擬篩選管線的不同階段的性能。根據任務的不同,使用 GPU 可持續地將性能提升 1.1 倍到 11.3 倍。

    Screenshot of Receptor.AI platform virtual screening setup page.
    圖 6.Receptor.AI 平臺虛擬篩選設置
    技術 分子* CPU 運行時間(小時) GPU 運行時間(小時) 加速系數
    貿易和工業部 43 億 33.9% 11.3 3
    選擇性 1000 萬 1 0.9 1.1
    ADME-Tox 100 萬 1.05 0.4 2.6
    DTI 排名(針對 9.3 K 種蛋白質) 5 萬 6.1 0.8 7.6
    總計: 42.05 13.4 3
    表 1.虛擬篩選庫的推理時間

    然后,Receptor.AI 平臺識別出的前 500 種化合物會在沒有有關鍵合袋位置的先驗信息的情況下,與 FADS1 進行盲目對接。此過程使用了用于 DiffDock 的 BioNeMo 云 API。

    在蛋白質準備過程中,使用 BioNeMo AlphaFold 模塊在不到 17 分鐘的時間內就可以自信地預測 FADS1 蛋白質結構。PUResNet AI 模型確定了配體結合袋。

    在篩選庫準備期間,BioNeMo Cloud API 可以更快地計算標和三個非標的 ESM 編碼。該 API 由 BioNeMo Cloud 提供的相同技術支持,NVIDIA DGX 云與虛擬 CPU 相比。

    最后,Receptor.AI 使用 NVIDIA T4 GPU 完成識別流程,該流程涉及 CPU 密集型和 GPU 密集型任務。具體來說,與 16 個 vCPU 的實例相比,GPU 上 43 億個化合物虛擬篩選庫的推理時間大大縮短。 NVIDIA GPU 提供的這種技術優勢顯著縮短了處理時間,并提高了整個實驗的效率。

    成果

    Receptor.AI 已從已知的 FADS1 配體中成功識別出幾種命中化合物,以及與已知配體相比,與 FADS1 具有更高預測親和力的新型化合物。在已知的 25 種 FADS1 配體中,有 4 種是在前 10 名命中候選配體中檢測到的。在所有已知配體中,近一半(25 種配體中的 12 種)位于前 1K 中(圖 7)。

    Enrichment plot for the known FADS1 ligands mixed into the virtual screening library compared to the curve from the ideal model.
    圖 7.混合到虛擬篩選庫中的已知 FADS1 配體的富集圖

    在最終排名列表中,位置 2、3、7 和 9 的分子是已知的具有高實驗確定活度的配體。與已知配體相比,前 10 中的其他 6 種化合物對三個顯式非目標具有更高的預測選擇性(圖 8)。前三個候選命中目標的預測 ADME-Tox 參數和對接姿勢如圖 9 所示。

    Screenshot of predicted properties for top 10 hit candidates.
    圖 8.排名前 10 的預測 FADS1 命中候選項的屬性
    Screenshot showing the docking poses (top panels) and the radar charts of ADME-Tox parameters (bottom panels) for the top 3 predicted FADS1 hit candidates.
    圖 9.前三大預測 FADS1 命中候選項的對接姿勢(頂部面板)和 ADME-Tox 參數的雷達圖表(底部面板)

    BioNeMo 云 API 提供的生化基礎 AI 模型可以通過Receptor.AI用于在硅藥物研發服務中的應用開發。這些模型在蛋白質結構預測、結合袋識別、蛋白質特征化、分子生成、虛擬化合物庫篩選,以及基于 AI 的分子對接等方面表現出色。

    包含 10 個預測候選項的最終列表包括 4 個經實驗驗證的目標蛋白質配體,這表明擬議的流程具有高度的實際相關性。

    不僅在熱門候選藥物中成功識別了已知的配體,而且新的熱門候選藥物也出現了潛在的高活性和選擇性。這表明擬議的流程在發現具有新型分子支架的潛在命中化合物方面的效用。

    結束語

    Receptor.ai 的一項重要發現是將加速計算集成到虛擬篩選流程中可節省成本。這一變化導致運行時間大幅減少,最終成本總體下降了 99%,從每實例小時 0.43 美元降至 0。22 美元。這展示了在大規模計算藥物研發活動中利用加速計算的經濟和效率優勢,為行業和學術界提供了更經濟高效、更快速的虛擬篩選模型。

    接下來,我們將繼續與 Receptor.AI 合作,利用 BioNeMo 框架和專有數據來訓練 Receptor.AI 模型。我們的目標是基于 AI 技術,在高性能的 NVIDIA 加速工作站和云實例上運行分子動力學模擬,從而生成具有代表性的蛋白質構象集合。這一技術堆棧的進一步開發將致力于為生物技術和制藥公司創建高效的藥物研發平臺。請訪問 BioNeMo 框架高級選擇性工作流程 以獲取更多信息。

    深入了解加速 AI 驅動的藥物研發,使用云 API 來利用強大、可定制的生成式 AI,而無需復雜的基礎架構管理。開始使用 NVIDIA BioNeMo

    ?

    0

    標簽

    人人超碰97caoporen国产