上一期我們發(fā)布了博奧晶典最新推出的基于10x Genomics平臺的新產品—單細胞ATAC-seq的技術及原理,你是不是還在回味其中呢?不要著急,下面小編通過《Cell》上的一篇文章展示單細胞ATAC-seq的數據分析思路,及其聯合人類GWAS數據解析人類疾病與細胞類型的奧秘,為單細胞ATAC-seq多數據整合提供參考依據
單細胞ATAC-seq繪制哺乳動物
染色質可及性圖譜

| 發(fā)表時間:2018年8月
| 發(fā)表期刊:《Cell》
?
| 影響因子:31.398

?
作者:Darren A. Cusanovich,Andrew J. Hill, DelasaAghamirzaie
?
摘 要:本文通過單細胞ATAC-seq技術對成年雄性小鼠13個組織的單細胞染色質可及性進行了分析。結果共鑒定出85個亞群和40萬種調控元件。為理解不同哺乳動物細胞類型的染色質可及性和解釋人類全基因組關聯疾病奠定了基礎.
亮點
?
? 通過單細胞ATAC-seq技術繪制小鼠不同組織染色質可及性圖譜
? 對哺乳動物不同組織內的轉錄調控因子進行注釋并解析細胞類型
?
? 染色質可及性數據幫助解釋人類特征性疾病和細胞類型的關系
研究思路

研究結果
?
1 評估數據結果
?
?
單細胞ATAC-seq技術研究成年雄性小鼠C57BL/6J的13個組織單細胞染色質可及性(圖1A.B),結果顯示每個組織的細胞總數范圍從小腦2278個到肺9996個。每個細胞可接受的最小讀取深度從骨髓656個到胸腺1734個(圖1D左),共鑒定到436206個可及性位點(圖1D右),并為所有細胞可及性內位點進行活性評分(圖1E)。

?
?
圖1 小鼠單細胞染色質可及性工作流程 2 染色質可及性圖譜繪制
?
質控之后,對13個組織的81173個細胞的染色質可及性繪制t-SNE(圖2A),并鑒定出30個細胞亞群(圖2B),發(fā)現每個細胞亞群大多來自于同一組織(亞群7的細胞97%來自于心臟,可能為心肌細胞)。30個亞群表現出了明顯的異質性,對每個亞群中的細胞進行重復t-SNE和Louvain聚類分析,共識別85個細胞亞群(圖2C)。
?
?
利用相關基因的啟動子對85個亞群的細胞類型進行注釋,除9個亞群細胞類型未知,大多數亞群注釋到特異性細胞類型(圖2D)。

圖2 單細胞染色質可及性圖譜繪制
?
3 單細胞染色質可及性與單細胞轉錄組數據 相關性分析
?
?
構建哺乳動物細胞類型綜合圖譜。將單細胞染色質可及性與單細胞轉錄組比較分析,發(fā)現不同組織的細胞類型表現出一致性。利用Spearman對每個ATAC-seq亞群的平均歸一化活性評分與兩個組織(腎、肺)RNA-seq的平均歸一化基因表達譜進行比較,發(fā)現兩種方法注釋的細胞類型表現出高度一致性(圖3A.B)。RNA-seq表達和ATAC-seq活性評分組合矩陣進行PCA分析,基于KNN分類將RNA-seq中最常見的標記關聯到ATAC-seq數據。發(fā)現它們對細胞類型的分配基本一致(圖3C-3G),因此可以使用更簡單的單細胞ATAC-seq對細胞亞群進行注釋。

圖3 單細胞ATAC-seq數據與單細胞轉錄組數據整合分析注釋細胞類型
?
4 組織中特異性細胞類型
?
?
為研究細胞類型是否表現出組織特異性。對內皮細胞的細胞群進行重分析得到9個不同的亞群(圖4A),每個亞群都顯示出組織特異性(圖4B)。基于活性評分的可及性數據顯示, Flt4和EphB4是靜脈內皮細胞的Marker(圖4C)。數據表明內皮細胞在組織內和組織間具有特殊的染色質可及性。單核細胞、巨噬細胞、樹突狀細胞的染色質可及性都表現出組織特異性(圖4D-F)。

?

?
圖4 染色質可及性反應組織特異性細胞類型
5
染色質可及性反映組織空間構架
為了研究神經元細胞中染色質可及性的異質性,重分析前額皮質的細胞(圖5G),結果發(fā)現,興奮性神經元和中間神經元明顯地與神經膠質細胞、小膠質細胞和內皮細胞分離(圖5H)。在興奮性神經元內仍存在顯著的異質性,可能反映了PFC不同層中的差異表達和甲基化(圖5I)。因此推測細胞類型相對于解剖學坐標而變化。腎臟染色質可及性也表現出這樣的特性(圖J-L)。

圖5 染色質可及性與組織空間構架
?
6 造血過程中染色質可及性動態(tài)變化
?
?
研究骨髓造血部位的染色質可及性t-SNE亞群圖如下(圖6A),染色質可及性不能完全分離細胞,因此利用Monocle 2繪制染色質可及性擬序列分析,探索血液的發(fā)育階段。結果發(fā)現分支F4和F2上更容易獲得紅細胞或淋巴樣細胞的特異性增強子;在F5和兩個小分支(F1和F3)上更容易獲得骨髓特異性增強子(圖6B)。特異性標記基因(Cd3e、Cd19、Hbb-b1和Cd11b / Itgam)的活性評分在根部處于或接近零,但是分別在五個分支的末端急劇上升(圖6C)。這些觀察結果與將造血祖細胞指定為B細胞(F2)、T細胞(F3)、紅細胞(F4)和單核細胞(F5)的結果基本一致。
?

?
圖6 造血過程中的染色質可接近性動態(tài)變化
7
人類基因組關聯分析揭示細胞類型與疾病關系
根據全基因組關聯研究(GWAS)的數據,普通人類特征和疾病的遺傳主要通過遠端調控元件且具有細胞特異性。因此,使用LDSC模型將人類的SNP提升到小鼠基因組中,根據DA峰值的重疊進行注釋,并計算85個亞群中的DA峰值富集情況(圖7A)。結果顯示自身免疫性疾病如遺傳性狼瘡富集發(fā)生在神經元細胞(圖7B下),組織塊富集的峰不明顯(圖7B上),說明單細胞染色質可及性數據定義細胞類型的重要性。如LDL膽固醇、HDL膽固醇和甘油三酯類疾病富集在肝細胞(圖7B下);免疫球蛋白A(IgA)缺乏的疾病富集在T細胞(圖7C)。具有雙相障礙的疾病富集在興奮性神經元(圖7D);阿爾茨海默病最強富集在小膠質細胞(圖7E)。

圖7 小鼠染色質可及性圖譜與可遺傳的人類性狀
?
結論
?
文章通過單細胞ATAC-seq技術繪制小鼠13個組織的染色質可及性圖譜,共分出85個細胞亞群,找到40萬個差異染色質可及性元件,并鑒定出大部分亞群的細胞類型。與轉錄組數據整合注釋細胞類型,證明了染色質可及性注釋細胞類型的可靠性,并且可以反映組織特異性及組織空間構架。最后,小鼠染色質可及性數據與人類基因組數據關聯分析揭示了人類特征性疾病與細胞類型的關系。為深入挖掘單細胞ATAC-seq數據,多數據整合分析提供了新思路。
參考文獻:
?
Darren A. Cusanovich, Andrew J. Hill, Delasa Aghamirzaie,et al. A Single-Cell Atlas of In Vivo Mammalian Chromatin Accessibility.Cell(2018).
