胰腺導(dǎo)管腺癌(PDAC)是最致命的癌癥之一,其特征是進(jìn)展快速、會發(fā)生轉(zhuǎn)移和難以診斷。然而,當(dāng)前沒有有效的基于體液的檢測方法可用于PDAC檢測。
北京大學(xué)尹玉新教授團(tuán)隊和國內(nèi)其他團(tuán)隊合作在Science Advances?(中科院JCR一區(qū),影響因子:14.136)上發(fā)表了題為“Metabolic detection and systems analyses of pancreatic ductal adenocarcinoma through machine learning, lipidomics, and multi-omics”的文章,介紹了研究者利用機(jī)器學(xué)習(xí)(ML)分階段對大規(guī)模的脂質(zhì)組學(xué)的結(jié)果進(jìn)行分析、訓(xùn)練、測試和驗證,最終找到了17個特征脂質(zhì)代謝物集合有良好的分類效果,可用于診斷PDAC。本研究同時顯示了機(jī)器學(xué)習(xí)和代謝組學(xué)結(jié)合在疾病診斷中的潛在應(yīng)用。


1.發(fā)現(xiàn)隊列的血清脂質(zhì)組學(xué)
實驗組(PDAC):333個PDAC患者血清
對照組(NC):262個健康個體血清
正離子模式下共檢測到1416個代謝物,分屬于19個脂質(zhì)大類;負(fù)離子模式下共檢測到669個代謝物,分屬于16個脂質(zhì)大類。
2.對脂質(zhì)組學(xué)結(jié)果進(jìn)行基于機(jī)器學(xué)習(xí)算法的分類
將發(fā)現(xiàn)隊列的共計595個樣本分為訓(xùn)練隊列495個(訓(xùn)練集:372;交叉驗證集:123)和測試集100個。支持向量機(jī)(SVM,一種機(jī)器學(xué)習(xí)分類算法)分別對正離子和負(fù)離子模式下檢測到的脂質(zhì)代謝物進(jìn)行分類分析。在完成5000次循環(huán)計算后,正離子模式下,SVM分類模型在測試集的平均準(zhǔn)確度為82.26%,特異性為98.05%?,靈敏度為66.48%。負(fù)離子模式下,SVM分類模型,在測試集的平均準(zhǔn)確度為85.88%?,特異性為71.93%?,靈敏度為99.83%。該結(jié)果表明,脂質(zhì)組學(xué)和SVM結(jié)合是檢測PDAC的很有潛力的手段。

貪婪算法通過逐一選擇排名靠前的特征(即脂質(zhì)代謝物)進(jìn)行評估。對于每個當(dāng)前特征,一旦先前選定的特征與當(dāng)前特征的組合達(dá)到更高的性能水平,當(dāng)前特征將被標(biāo)記并添加到選定特征集中。例如,對于第N次迭代,基于包含先前所選特征的特征集,貪婪算法首先將當(dāng)前特征添加到該集中,然后進(jìn)行500次四重交叉驗證以評估平均性能。如果獲得的平均性能優(yōu)于以前的特征集,則意味著當(dāng)前特征是現(xiàn)有選定特征集的補(bǔ)充,對于識別PDAC和健康對照至關(guān)重要,當(dāng)前特征就會被保留在特征集中。
正離子模式下的27個特征脂質(zhì)代謝物構(gòu)成的分類模型在測試集的準(zhǔn)確性為93.61%,特異性為89.92%,靈敏度為97.30%。而負(fù)離子模式下的19個特征脂質(zhì)代謝物構(gòu)成的分類模型在測試集的準(zhǔn)確性為90.40%,特異性為83.15%,靈敏度為97.66%。此外,研究者發(fā)現(xiàn)和傳統(tǒng)的特征選擇相比,基于貪婪算法的特征選擇的精確度更高。


研究者建立基于質(zhì)譜的靶向檢測方法(MRM靶向脂質(zhì)組學(xué)),檢測1898個個體血清樣本中的17個特征脂質(zhì)代謝物。
(1)在前述發(fā)現(xiàn)隊列中進(jìn)行驗證:將前述發(fā)現(xiàn)隊列的595個樣本又分為訓(xùn)練集(n=495)和測試集(n=100),作為內(nèi)部驗證。多元二元邏輯回歸分析表明,性別和年齡狀態(tài)對分類模型的影響有限,表明該分類模型對于PDAC和健康對照的分類是特異性的,與年齡和性別無關(guān)。分類模型在訓(xùn)練集上的準(zhǔn)確率達(dá)到89.49%,特異性為89.15%,靈敏度為89.75%;在測試集上的準(zhǔn)確率為86.00%,特異性為80.00%,靈敏度為92.00%?。訓(xùn)練集的AUC達(dá)到0.9591,測試集的AUC達(dá)到0.9444。這些結(jié)果說明了機(jī)器學(xué)習(xí)算法輔助的基于脂質(zhì)代謝物的PDAC檢測方法的準(zhǔn)確性和有效性。
(2)在獨立隊列中進(jìn)一步驗證:研究者在含有1003個個體血清(600 PDAC和403健康對照)的獨立隊列中對分類模型進(jìn)行進(jìn)一步驗證。分類模型的AUC為0.9309,準(zhǔn)確率為88.24%,靈敏度為93.00%,特異性為81.43%。在600個PDAC樣本中,86.38%(406/470)的早期PDAC(I期-II期)樣本和90%(113/130)的晚期PDAC(III期-IV期)樣本能被準(zhǔn)確檢測。這些結(jié)果表明了機(jī)器學(xué)習(xí)算法輔助的基于脂質(zhì)代謝物的PDAC檢測方法能有效的檢測各階段的PDAC。

(3)在新的臨床隊列中進(jìn)行驗證:研究者在一個前瞻性、單盲的醫(yī)院隊列中檢驗了機(jī)器學(xué)習(xí)輔助的代謝PDAC檢測方法的性能。該隊列包含130名已接受醫(yī)學(xué)檢查的無癌個體和170名接受胰腺手術(shù)的患者,包括70名胰腺良性疾病患者(無癌個體)以及100名診斷為PDAC的患者。分類模型的準(zhǔn)確率達(dá)到85.00%,特異性為81.00%,敏感性為93.00%,AUC為0.9389。在該隊列中,該機(jī)器學(xué)習(xí)輔助的代謝PDAC檢測方法準(zhǔn)確檢測了90.91% (50/55)的早期PDAC(I期-II期)和95.56% (43/45)的晚期PDAC(III期-IV期)樣本。
(4)與其他PDAC檢測方法進(jìn)行比較:機(jī)器學(xué)習(xí)輔助的代謝PDAC檢測方法AUC為0.9309,準(zhǔn)確度為88.24%,敏感性為93.00%,特異性為81.43%。而經(jīng)典的PDAC生物標(biāo)志物碳水化合物抗原CA19-9的AUC為0.8790,準(zhǔn)確率為83.00%,靈敏度為79.00%,特異性為85.00%。CT掃描的AUC為0.7098,準(zhǔn)確率為86.67%,靈敏度為78.00%,特異度為91.00%。此外,在對良性胰腺疾病的檢測分類中,機(jī)器學(xué)習(xí)輔助的代謝PDAC檢測方法也比CA19-9和CT掃描有更好的效果。因此,機(jī)器學(xué)習(xí)輔助的代謝PDAC檢測方法有臨床應(yīng)用價值,同時AI方法和CA-919或CT掃描聯(lián)合或可使PDAC的臨床診斷受益。

(1)基質(zhì)輔助激光解析電離質(zhì)譜成像(MALDI-MSI)對5對PDAC癌組織和癌旁組織樣本中的17個特征脂質(zhì)代謝物進(jìn)行檢測。結(jié)果表明,6個特征脂質(zhì)代謝物的變化趨勢和前述脂質(zhì)組學(xué)的結(jié)果相符。
(2)10個PDAC組織和5個配對的臨近胰腺組織的蛋白質(zhì)組學(xué)結(jié)果,發(fā)現(xiàn)多個和脂質(zhì)代謝相關(guān)的蛋白和通路失調(diào)。
(3)對公開數(shù)據(jù)庫中24178個來自PDAC患者的胰腺組織細(xì)胞和5280個來自正常胰腺組織細(xì)胞的單細(xì)胞RNA測序結(jié)果進(jìn)行分析共產(chǎn)生了10個細(xì)胞譜系。作者根據(jù)大規(guī)模的拷貝數(shù)變異(CNV)情況從上皮細(xì)胞中分辨出PDAC細(xì)胞。通過分析發(fā)現(xiàn),甘油磷脂代謝是PDAC細(xì)胞中最顯著變化的脂質(zhì)代謝相關(guān)途徑。
(4)在TCGA-GTEx數(shù)據(jù)集以及獨立的mRNA?芯片結(jié)果中也有類似的結(jié)果。?
綜合以上結(jié)果表明,PDAC中存在廣泛的脂質(zhì)代謝紊亂。
研究總結(jié)
研究者通過建立了一種結(jié)合機(jī)器學(xué)習(xí)和代謝組學(xué)的原型方法,該方法改進(jìn)了利用機(jī)器學(xué)習(xí)進(jìn)行靶向代謝組學(xué)的疾病檢測測試程序。研究結(jié)果表明,機(jī)器學(xué)習(xí)輔助的代謝PDAC檢測方法的比傳統(tǒng)方法有更良好的效果,證明了該方法在PDAC輔助診斷中的潛在應(yīng)用前景。該方法的適當(dāng)臨床應(yīng)用可能有利于PDAC患者的準(zhǔn)確診斷,并可能指導(dǎo)更加有效的治療。
上海吉凱基因醫(yī)學(xué)科技股份有限公司 商家主頁
地 址: 上海市浦東新區(qū)張江高科技園區(qū)愛迪生路332號
聯(lián)系人:
電 話: 4006210302
傳 真:
Email:service@genechem.com.cn
相關(guān)咨詢
IF:31.37 少吃就不會胖了......嗎? (2024-02-05T00:00 瀏覽數(shù):75010)
多巴胺總讓人感覺愉悅?新研究發(fā)現(xiàn)多巴胺也引起回避行為 (2024-02-05T00:00 瀏覽數(shù):63335)
高效感染造血干細(xì)胞利器——嵌合型腺病毒載體Ad5/F35 (2024-02-05T00:00 瀏覽數(shù):66776)
分子燈籠,傳遞在黑夜中的微光 (2024-02-05T00:00 瀏覽數(shù):62347)
用條形碼文庫病毒輕松給細(xì)胞打上條形碼 (2024-02-04T00:00 瀏覽數(shù):65584)
Science新作:篩選關(guān)鍵神經(jīng)元,逆轉(zhuǎn)完全性截癱 (2024-02-04T00:00 瀏覽數(shù):72709)
Nat Commun:沈陽藥科大學(xué)與新加坡國立大學(xué)報道新型多價IL-15遞送策略 (暫無發(fā)布時間 瀏覽數(shù):61681)
貓咪是我的家人,我才不舍得給她做絕育手術(shù)呢!AAV來為您解憂 (暫無發(fā)布時間 瀏覽數(shù):70700)
一閃一閃亮晶晶 選好熒光很要緊 (暫無發(fā)布時間 瀏覽數(shù):76998)
【硬核】外周對中樞的神經(jīng)環(huán)路示蹤策略 (暫無發(fā)布時間 瀏覽數(shù):76752)
