Science Advances:機(jī)器學(xué)習(xí)+脂質(zhì)多組學(xué)助力胰腺導(dǎo)管腺癌的精準(zhǔn)診斷和機(jī)制研究-環(huán)球風(fēng)云-資訊-生物在線

女人与狗锁死了视频大全|霍金死亡过程恐怖视频|无节社团简谱季免费观看|六间房直播大厅|中文字幕欧美另类精品|久久人人玩人妻潮喷内射人人|亚洲国产一区二区三区在线观看

Science Advances:機(jī)器學(xué)習(xí)+脂質(zhì)多組學(xué)助力胰腺導(dǎo)管腺癌的精準(zhǔn)診斷和機(jī)制研究

作者:上海吉凱基因醫(yī)學(xué)科技股份有限公司 2022-03-18T11:33 (訪問量:7530)

胰腺導(dǎo)管腺癌(PDAC)是最致命的癌癥之一,其特征是進(jìn)展快速、會發(fā)生轉(zhuǎn)移和難以診斷。然而,當(dāng)前沒有有效的基于體液的檢測方法可用于PDAC檢測。


北京大學(xué)尹玉新教授團(tuán)隊和國內(nèi)其他團(tuán)隊合作在Science Advances?(中科院JCR一區(qū),影響因子:14.136)上發(fā)表了題為“Metabolic detection and systems analyses of pancreatic ductal adenocarcinoma through machine learning, lipidomics, and multi-omics”的文章,介紹了研究者利用機(jī)器學(xué)習(xí)(ML)分階段對大規(guī)模的脂質(zhì)組學(xué)的結(jié)果進(jìn)行分析、訓(xùn)練、測試和驗證,最終找到了17個特征脂質(zhì)代謝物集合有良好的分類效果,可用于診斷PDAC。本研究同時顯示了機(jī)器學(xué)習(xí)和代謝組學(xué)結(jié)合在疾病診斷中的潛在應(yīng)用。
研究設(shè)計
研究結(jié)果

1.發(fā)現(xiàn)隊列的血清脂質(zhì)組學(xué)

實驗組(PDAC):333PDAC患者血清
對照組(NC):262個健康個體血清

正離子模式下共檢測到1416個代謝物,分屬于19個脂質(zhì)大類;負(fù)離子模式下共檢測到669個代謝物,分屬于16個脂質(zhì)大類。

2.對脂質(zhì)組學(xué)結(jié)果進(jìn)行基于機(jī)器學(xué)習(xí)算法的分類
將發(fā)現(xiàn)隊列的共計595個樣本分為訓(xùn)練隊列495個(訓(xùn)練集:372;交叉驗證集:123)和測試集100個。支持向量機(jī)(SVM,一種機(jī)器學(xué)習(xí)分類算法)分別對正離子和負(fù)離子模式下檢測到的脂質(zhì)代謝物進(jìn)行分類分析。在完成5000次循環(huán)計算后,正離子模式下,SVM分類模型在測試集的平均準(zhǔn)確度為82.26%,特異性為98.05%?,靈敏度為66.48%。負(fù)離子模式下,SVM分類模型,在測試集的平均準(zhǔn)確度為85.88%?,特異性為71.93%?,靈敏度為99.83%。該結(jié)果表明,脂質(zhì)組學(xué)和SVM結(jié)合是檢測PDAC的很有潛力的手段
3.機(jī)器學(xué)習(xí)尋找能有效分類的特征脂質(zhì)代謝物

貪婪算法通過逐一選擇排名靠前的特征(即脂質(zhì)代謝物)進(jìn)行評估。對于每個當(dāng)前特征,一旦先前選定的特征與當(dāng)前特征的組合達(dá)到更高的性能水平,當(dāng)前特征將被標(biāo)記并添加到選定特征集中。例如,對于第N次迭代,基于包含先前所選特征的特征集,貪婪算法首先將當(dāng)前特征添加到該集中,然后進(jìn)行500次四重交叉驗證以評估平均性能。如果獲得的平均性能優(yōu)于以前的特征集,則意味著當(dāng)前特征是現(xiàn)有選定特征集的補(bǔ)充,對于識別PDAC和健康對照至關(guān)重要,當(dāng)前特征就會被保留在特征集中。

正離子模式下的27個特征脂質(zhì)代謝物構(gòu)成的分類模型在測試集的準(zhǔn)確性為93.61%,特異性為89.92%,靈敏度為97.30%。而負(fù)離子模式下的19個特征脂質(zhì)代謝物構(gòu)成的分類模型在測試集的準(zhǔn)確性為90.40%,特異性為83.15%,靈敏度為97.66%。此外,研究者發(fā)現(xiàn)和傳統(tǒng)的特征選擇相比,基于貪婪算法的特征選擇的精確度更高。
基于前面貪婪算法找到的特征代謝物,選擇了正離子模式下檢測到的12個和負(fù)離子模式下檢測到的8個脂質(zhì)代謝物,共計17個代謝物,作為最終的特征脂質(zhì)代謝物。基于這17個特征脂質(zhì)代謝物組合的分類模型能以最少的數(shù)量達(dá)到優(yōu)質(zhì)的分類效果。
4.在大規(guī)模驗證隊列中對分類模型進(jìn)行驗證

研究者建立基于質(zhì)譜的靶向檢測方法(MRM靶向脂質(zhì)組學(xué)),檢測1898個個體血清樣本中的17個特征脂質(zhì)代謝物。

(1)在前述發(fā)現(xiàn)隊列中進(jìn)行驗證:將前述發(fā)現(xiàn)隊列的595個樣本又分為訓(xùn)練集(n=495)和測試集(n=100),作為內(nèi)部驗證。多元二元邏輯回歸分析表明,性別和年齡狀態(tài)對分類模型的影響有限,表明該分類模型對于PDAC和健康對照的分類是特異性的,與年齡和性別無關(guān)。分類模型在訓(xùn)練集上的準(zhǔn)確率達(dá)到89.49%,特異性為89.15%,靈敏度為89.75%;在測試集上的準(zhǔn)確率為86.00%,特異性為80.00%,靈敏度為92.00%?。訓(xùn)練集的AUC達(dá)到0.9591,測試集的AUC達(dá)到0.9444。這些結(jié)果說明了機(jī)器學(xué)習(xí)算法輔助的基于脂質(zhì)代謝物的PDAC檢測方法的準(zhǔn)確性和有效性。

2)在獨立隊列中進(jìn)一步驗證:研究者在含有1003個個體血清(600 PDAC403健康對照)的獨立隊列中對分類模型進(jìn)行進(jìn)一步驗證。分類模型的AUC0.9309,準(zhǔn)確率為88.24%,靈敏度為93.00%,特異性為81.43%。在600PDAC樣本中,86.38%406/470)的早期PDAC(I-II)樣本和90%(113/130)的晚期PDACIII-IV期)樣本能被準(zhǔn)確檢測。這些結(jié)果表明了機(jī)器學(xué)習(xí)算法輔助的基于脂質(zhì)代謝物的PDAC檢測方法能有效的檢測各階段的PDAC

3)在新的臨床隊列中進(jìn)行驗證:研究者在一個前瞻性、單盲的醫(yī)院隊列中檢驗了機(jī)器學(xué)習(xí)輔助的代謝PDAC檢測方法的性能。該隊列包含130名已接受醫(yī)學(xué)檢查的無癌個體和170名接受胰腺手術(shù)的患者,包括70名胰腺良性疾病患者(無癌個體)以及100名診斷為PDAC的患者。分類模型的準(zhǔn)確率達(dá)到85.00%,特異性為81.00%,敏感性為93.00%AUC0.9389。在該隊列中,該機(jī)器學(xué)習(xí)輔助的代謝PDAC檢測方法準(zhǔn)確檢測了90.91% (50/55)的早期PDAC(I-II)95.56% (43/45)的晚期PDACIII-IV期)樣本。

4)與其他PDAC檢測方法進(jìn)行比較:機(jī)器學(xué)習(xí)輔助的代謝PDAC檢測方法AUC0.9309,準(zhǔn)確度為88.24%,敏感性為93.00%,特異性為81.43%。而經(jīng)典的PDAC生物標(biāo)志物碳水化合物抗原CA19-9AUC0.8790,準(zhǔn)確率為83.00%,靈敏度為79.00%,特異性為85.00%CT掃描的AUC0.7098,準(zhǔn)確率為86.67%,靈敏度為78.00%,特異度為91.00%。此外,在對良性胰腺疾病的檢測分類中,機(jī)器學(xué)習(xí)輔助的代謝PDAC檢測方法也比CA19-9CT掃描有更好的效果。因此,機(jī)器學(xué)習(xí)輔助的代謝PDAC檢測方法有臨床應(yīng)用價值,同時AI方法和CA-919CT掃描聯(lián)合或可使PDAC的臨床診斷受益。
5.多組學(xué)分析顯示PDAC存在廣泛的脂質(zhì)代謝失調(diào)

1)基質(zhì)輔助激光解析電離質(zhì)譜成像(MALDI-MSI)5PDAC癌組織和癌旁組織樣本中的17個特征脂質(zhì)代謝物進(jìn)行檢測。結(jié)果表明,6個特征脂質(zhì)代謝物的變化趨勢和前述脂質(zhì)組學(xué)的結(jié)果相符

210PDAC組織和5個配對的臨近胰腺組織的蛋白質(zhì)組學(xué)結(jié)果,發(fā)現(xiàn)多個和脂質(zhì)代謝相關(guān)的蛋白和通路失調(diào)

3)對公開數(shù)據(jù)庫中24178個來自PDAC患者的胰腺組織細(xì)胞和5280個來自正常胰腺組織細(xì)胞的單細(xì)胞RNA測序結(jié)果進(jìn)行分析共產(chǎn)生了10個細(xì)胞譜系。作者根據(jù)大規(guī)模的拷貝數(shù)變異(CNV)情況從上皮細(xì)胞中分辨出PDAC細(xì)胞。通過分析發(fā)現(xiàn),甘油磷脂代謝是PDAC細(xì)胞中最顯著變化的脂質(zhì)代謝相關(guān)途徑

4)在TCGA-GTEx數(shù)據(jù)集以及獨立的mRNA?芯片結(jié)果中也有類似的結(jié)果。?

綜合以上結(jié)果表明,PDAC中存在廣泛的脂質(zhì)代謝紊亂。

研究總結(jié)
研究者通過建立了一種結(jié)合機(jī)器學(xué)習(xí)和代謝組學(xué)的原型方法,該方法改進(jìn)了利用機(jī)器學(xué)習(xí)進(jìn)行靶向代謝組學(xué)的疾病檢測測試程序。研究結(jié)果表明,機(jī)器學(xué)習(xí)輔助的代謝PDAC檢測方法的比傳統(tǒng)方法有更良好的效果,證明了該方法在PDAC輔助診斷中的潛在應(yīng)用前景。該方法的適當(dāng)臨床應(yīng)用可能有利于PDAC患者的準(zhǔn)確診斷,并可能指導(dǎo)更加有效的治療。
上海吉凱基因醫(yī)學(xué)科技股份有限公司 商家主頁

地 址: 上海市浦東新區(qū)張江高科技園區(qū)愛迪生路332號

聯(lián)系人:

電 話: 4006210302

傳 真:

Email:service@genechem.com.cn

相關(guān)咨詢
ADVERTISEMENT