2023年11月1-3日,專(zhuān)注于冷凍電鏡單顆粒分析技術(shù)的培訓(xùn)會(huì)議在南方科技大學(xué)召開(kāi),本次會(huì)議由火山引擎聯(lián)合南方科技大學(xué)冷凍電鏡中心,上海月新生科、英特爾共同舉辦,與會(huì)嘉賓們深入探討了冷凍電鏡技術(shù)在基礎(chǔ)研究、臨床科研和創(chuàng)新生物藥開(kāi)發(fā)中的廣闊前景和應(yīng)用實(shí)踐。
會(huì)上,來(lái)自南方科技大學(xué)、復(fù)旦大學(xué)、中山大學(xué)、北京理工、湖南師范、清華大學(xué)等高校的多名冷凍電鏡領(lǐng)域知名專(zhuān)家學(xué)者分享了精彩的學(xué)術(shù)報(bào)告。在上機(jī)培訓(xùn)過(guò)程中,培訓(xùn)老師通過(guò)耐心地講解,為各位學(xué)員了解冷凍電鏡、拓展研究思路及開(kāi)展技術(shù)研發(fā)等提供了直接的指導(dǎo)和全新的思路。
火山引擎通用解決方案架構(gòu)師高卿在會(huì)上以《火山科研云助力科研新范式》為主題發(fā)表演講,展示了火山引擎近年來(lái)在生物信息計(jì)算和生命科學(xué)領(lǐng)域的研發(fā)成果。他表示:IT&BT正加速融合,即利用數(shù)字化來(lái)賦能基因研究、細(xì)胞工程、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)等多個(gè)生物技術(shù)領(lǐng)域,實(shí)現(xiàn)創(chuàng)新、效能提升和工程化、產(chǎn)業(yè)化,而在數(shù)字化創(chuàng)新多種路徑中,效能提升的最佳方式就是上云。
自主可控的生物醫(yī)學(xué)大數(shù)據(jù)操作系統(tǒng)(Bio-OS)
火山引擎是字節(jié)跳動(dòng)旗下的云服務(wù)平臺(tái), 在數(shù)字化創(chuàng)新過(guò)程中,對(duì)內(nèi)提供抖音集團(tuán)各應(yīng)用的技術(shù)支撐,對(duì)外與千行百業(yè)共創(chuàng)第二增長(zhǎng)曲線。在生命科學(xué)行業(yè)線,火山引擎推出科研、基因、醫(yī)藥和醫(yī)療體系4大細(xì)分領(lǐng)域解決方案,提供可靠的算力、存儲(chǔ)、云原生操作系統(tǒng)等基礎(chǔ)資源,以及研發(fā)、數(shù)據(jù)和人工智能中臺(tái)能力。
火山引擎生命科學(xué)及醫(yī)藥行業(yè)總覽
從生物信息基因計(jì)算領(lǐng)域觀察,隨著技術(shù)發(fā)展,現(xiàn)代全基因組測(cè)序價(jià)格已經(jīng)打破摩爾定律快速降低,研究計(jì)算資源的不平等性愈發(fā)增強(qiáng),同時(shí),行業(yè)的海量數(shù)據(jù)存儲(chǔ)、高效傳輸、數(shù)據(jù)要素分享已經(jīng)成為重要挑戰(zhàn)。
基于行業(yè)共性的問(wèn)題,針對(duì)科研成果的可重復(fù)性差、數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、缺乏行業(yè)標(biāo)準(zhǔn)化、數(shù)據(jù)難以匯聚、分析工程化能力較弱等痛點(diǎn),火山引擎與合作伙伴一起,開(kāi)發(fā)了一套基于國(guó)際標(biāo)準(zhǔn)的生物醫(yī)學(xué)大數(shù)據(jù)操作系統(tǒng)—— Bio-OS,實(shí)現(xiàn)了標(biāo)準(zhǔn)規(guī)范、資源工具、開(kāi)發(fā)環(huán)境和技術(shù)架構(gòu)的統(tǒng)一。
Bio-OS能夠幫助生物學(xué)家、數(shù)據(jù)科學(xué)家以及IT人員,快速的進(jìn)行生信學(xué)構(gòu)建相應(yīng)的分析工作流,屏蔽了較為繁瑣的環(huán)境構(gòu)建、數(shù)據(jù)尋找和大數(shù)據(jù)計(jì)算任務(wù)調(diào)度的問(wèn)題,極大簡(jiǎn)化了整個(gè)研究的過(guò)程,提升分析過(guò)程的效能。并且,火山引擎還將全球各類(lèi)高價(jià)值數(shù)據(jù)集、領(lǐng)域化工作流和工具,進(jìn)行歸集和整理,供應(yīng)用者查詢(xún)、調(diào)用。同時(shí),將Bio-OS平臺(tái)的內(nèi)核進(jìn)行了開(kāi)源,期望通過(guò)開(kāi)放的形式,構(gòu)建行業(yè)生態(tài),實(shí)現(xiàn)“科研資源普惠化”。
三大核心能力助推AIfor Science
當(dāng)前,人工智能驅(qū)動(dòng)的科學(xué)研究(AI for Science,簡(jiǎn)稱(chēng)AI4S)技術(shù)成果,在生物醫(yī)藥、材料和物理領(lǐng)域發(fā)揮越來(lái)越重要的作用,也使得如何利用大模型賦能科研和產(chǎn)業(yè)化,成為行業(yè)變革的核心議題。
為此,火山引擎基于AI4S的基本邏輯,開(kāi)始探索生命科學(xué)領(lǐng)域的“數(shù)字孿生”,期望能夠通過(guò)將基因、蛋白質(zhì)、細(xì)胞、表型、文獻(xiàn)、病歷和病理等各類(lèi)多模態(tài)數(shù)據(jù)進(jìn)行整合和訓(xùn)練,形成一個(gè)可進(jìn)行仿真實(shí)驗(yàn)的數(shù)字生理人模型,幫助科研團(tuán)隊(duì)啟發(fā)研究方向,提升疾病研究和制藥研發(fā)效能。
而經(jīng)過(guò)幾年的項(xiàng)目實(shí)踐,火山引擎在此領(lǐng)域逐步積累了三大核心能力:
? 核心能力一:云原生調(diào)度體系
構(gòu)建和利用全國(guó)的算力網(wǎng)絡(luò),利用云原生容器調(diào)度不同地域、異構(gòu)的算力進(jìn)行快速的任務(wù)交付。例如,Bio-OS云服務(wù)已經(jīng)為農(nóng)業(yè)育種、三代測(cè)序、AI蛋白質(zhì)設(shè)計(jì)等多家企業(yè)和科研機(jī)構(gòu)提供服務(wù),為云上用戶(hù)提供一整套的數(shù)據(jù)傳輸、數(shù)據(jù)存儲(chǔ),到二級(jí)分析、三級(jí)分析、數(shù)據(jù)交付的解決方案,助力基因組醫(yī)學(xué)領(lǐng)域突破。
? 核心能力二:基于大模型的工具鏈體系
利用大模型,訓(xùn)練某一領(lǐng)域內(nèi)的高價(jià)值數(shù)據(jù),并利用向量庫(kù)減輕幻覺(jué)問(wèn)題,幫助科研團(tuán)隊(duì)進(jìn)行研究思路的探索,論文代碼、數(shù)據(jù)集的生成和重現(xiàn)。例如,火山引擎助力某實(shí)驗(yàn)室,利用火山方舟大模型平臺(tái)發(fā)掘論文檢索和實(shí)驗(yàn)數(shù)據(jù)的創(chuàng)新科研思路,并利用知識(shí)庫(kù)進(jìn)行有效的專(zhuān)業(yè)性驗(yàn)證,助力水稻種植科研的跨領(lǐng)域知識(shí)的聯(lián)系和探索。
? 核心能力三:基于火山科研云平臺(tái)不斷拓展領(lǐng)域化生態(tài)應(yīng)用
火山引擎與冷凍電鏡領(lǐng)域的月新科技一起,針對(duì)Relion進(jìn)行基于工作流的多個(gè)計(jì)算任務(wù)的工程化改造。此外,還協(xié)同英特爾,利用至強(qiáng)可擴(kuò)展平臺(tái)為硬件基座,對(duì)Alphafold2實(shí)施端到端的高能量?jī)?yōu)化,加速蛋白結(jié)構(gòu)預(yù)測(cè)服務(wù)。
英特爾人工智能架構(gòu)師楊威在會(huì)議現(xiàn)場(chǎng)展示了AlphaFold2基于火山引擎SPR云實(shí)例g3i上實(shí)際結(jié)果,并詳細(xì)講解了基于英特爾第四代至強(qiáng)處理器以及OpenVINO?工具套件的解決方案。英特爾與火山引擎深度合作,加速AI for Science生命科學(xué)計(jì)算的應(yīng)用實(shí)踐。
END
在冷凍電鏡和結(jié)構(gòu)生物學(xué)領(lǐng)域,火山引擎期望能夠攜手更多學(xué)術(shù)機(jī)構(gòu)和技術(shù)廠商,利用數(shù)字化、云計(jì)算等基礎(chǔ)能力,一同共創(chuàng)冷凍電鏡云,幫助科研團(tuán)隊(duì)解決計(jì)算排隊(duì)、數(shù)據(jù)存儲(chǔ)等核心問(wèn)題,最終實(shí)現(xiàn)推動(dòng)整體領(lǐng)域的工程化、產(chǎn)業(yè)化能力的加速成熟和應(yīng)用。






