蘇報(bào)訊(記者 袁藝 通訊員 寇博)近日,西交利物浦大學(xué)學(xué)生團(tuán)隊(duì)在法國(guó)巴黎舉行的2024國(guó)際基因工程機(jī)器大賽(iGEM)中摘得一金一銅。今年的iGEM大賽吸引了全球400余支團(tuán)隊(duì)、5000余人現(xiàn)場(chǎng)參與。
西浦獲得金獎(jiǎng)和銅獎(jiǎng)的學(xué)生團(tuán)隊(duì)分別為XJTLU-Software和XJTLU-CHINA。據(jù)悉,自2015年以來,西浦學(xué)生團(tuán)隊(duì)在歷年iGEM大賽中共摘得六金三銀一銅。
iGEM由美國(guó)麻省理工學(xué)院于2003年創(chuàng)辦,現(xiàn)已發(fā)展成為全球合成生物學(xué)領(lǐng)域最具影響力的國(guó)際性學(xué)術(shù)競(jìng)賽。作為頂級(jí)的跨學(xué)科大學(xué)生賽事,它融合了生命科學(xué)、化學(xué)、數(shù)學(xué)、信息科學(xué)、工程學(xué)、計(jì)算機(jī)科學(xué)等多領(lǐng)域知識(shí),吸引了包括哈佛大學(xué)、麻省理工學(xué)院、斯坦福大學(xué)、清華大學(xué)、北京大學(xué)在內(nèi)的全球頂尖學(xué)府參與。
XJTLU-Software團(tuán)隊(duì)是在西浦慧湖藥學(xué)院的支持下于2024年1月通過學(xué)生自主組隊(duì)而新成立的團(tuán)隊(duì),共由來自西浦慧湖藥學(xué)院、理學(xué)院和數(shù)理學(xué)院的6位本科生組成,創(chuàng)隊(duì)目標(biāo)是致力于解決合成生物學(xué)中涉及的計(jì)算建模、模擬仿真和數(shù)據(jù)分析等問題,為合成生物學(xué)和iGEM社區(qū)提供全新的計(jì)算解決方案。
在老師的支持下,他們一邊進(jìn)行大語言模型和檢索增強(qiáng)生成RAG系統(tǒng)等大量的自主學(xué)習(xí),同時(shí)也在不斷地挖掘AI醫(yī)療、生物部件庫(kù)、工程化設(shè)計(jì)等值得投入的現(xiàn)實(shí)問題。最終根據(jù)實(shí)際需求并結(jié)合資源情況,XJTLU-Software將參賽項(xiàng)目定為“ChatParts”,即利用大語言模型優(yōu)化iGEM parts數(shù)據(jù)庫(kù)和創(chuàng)建整合了AI助手的線上論壇。
確定參賽主題后,面對(duì)iGEM歷年賽事累積的龐大的生物部件數(shù)據(jù)庫(kù),XJTLU-Software團(tuán)隊(duì)制定了開發(fā)方案,即“收集必需數(shù)據(jù)→構(gòu)建RAG系統(tǒng)和數(shù)據(jù)庫(kù)→訓(xùn)練問答大語言模型→軟件實(shí)現(xiàn)”。使用爬蟲收集信息和腳本自動(dòng)回答格式化問題,通過多周期的高質(zhì)量數(shù)據(jù)收集評(píng)估、RAG系統(tǒng)與本地微調(diào)預(yù)訓(xùn)練模型的結(jié)合,XJTLU-Software最終完成了一個(gè)可回答合成生物學(xué)相關(guān)問題的“ChatParts”本地AI助手。這個(gè)軟件源代碼、數(shù)據(jù)、模型權(quán)重等已分享至Github、Hugging Face等平臺(tái),可進(jìn)行進(jìn)一步的開發(fā)和優(yōu)化。
為了促進(jìn)西浦師生在合成生物學(xué)領(lǐng)域的國(guó)內(nèi)國(guó)際學(xué)術(shù)交流,西浦慧湖藥學(xué)院不僅支持學(xué)生們組隊(duì)參與iGEM大賽,今年還支持這兩支iGEM學(xué)生團(tuán)隊(duì)一起承辦了iGEM第十一屆中國(guó)地區(qū)交流會(huì)。近千人出席會(huì)議,來自清華大學(xué)、北京大學(xué)、浙江大學(xué)、上海交通大學(xué)、復(fù)旦大學(xué)等高校的89支代表隊(duì)與來自中國(guó)人民大學(xué)附屬中學(xué)等高中的35支代表隊(duì),分享和展示iGEM參賽項(xiàng)目,與學(xué)術(shù)界和產(chǎn)業(yè)界的專家深入交流,激發(fā)創(chuàng)新火花。