什么是Hi-C
染色體由DNA與組蛋白共同組成,從染色體的一級(jí)結(jié)構(gòu)(繩珠模型)到四級(jí)超螺旋折疊結(jié)構(gòu),DNA分子一共被壓縮了8400倍左右,正是這些折疊和壓縮,導(dǎo)致基因在細(xì)胞中的分布復(fù)雜而又有序。
基于基因組序列,調(diào)控元件和相關(guān)的注釋的信息,科學(xué)家們發(fā)現(xiàn),它們?cè)诳臻g結(jié)構(gòu)上并不是在染色體上呈線性地一字依次排開(kāi),這些離散的調(diào)控元件并不能有效地解釋很多基因的調(diào)控結(jié)果和機(jī)制。由此猜測(cè)其與基因組的三維空間結(jié)構(gòu)相關(guān)。
圖1 loops環(huán)
基因組三維空間結(jié)構(gòu)與功能的研究簡(jiǎn)稱三維基因組學(xué)(Three-Dimensional Genomics, 3D Genomics)。2003年Job Dekker及其合作者提出了染色質(zhì)構(gòu)象捕獲技術(shù)(Chromatin Conformation Capture, 3C),用于測(cè)定特定的點(diǎn)到點(diǎn)之間的染色質(zhì)交互作用。隨后,科學(xué)家們擴(kuò)展了3C技術(shù),開(kāi)發(fā)了4C技術(shù)(Circularized Chromatin Conformation Capture),用于測(cè)定一點(diǎn)到多點(diǎn)之間的染色質(zhì)交互作用。Dostie等人接著開(kāi)發(fā)了5C技術(shù)(Carbon-Copy Chromatin Conformation Capture),用于測(cè)定多點(diǎn)到多點(diǎn)之間的染色質(zhì)交互作用。
為了能捕獲全基因組范圍的染色質(zhì)相互作用,Job Dekker研究組又開(kāi)發(fā)出了現(xiàn)在大家所熟知的Hi-C技術(shù)。其是基于將線性距離遠(yuǎn)、空間結(jié)構(gòu)近的 DNA 片段進(jìn)行交聯(lián),并將交聯(lián)的 DNA 片段富集,接著進(jìn)行高通量測(cè)序,對(duì)測(cè)序數(shù)據(jù)分析可以揭示染色質(zhì)的遠(yuǎn)程相互作用,從而推導(dǎo)出基因組的三維空間結(jié)構(gòu)和可能的基因之間的調(diào)控關(guān)系。
圖2 Hi-C 實(shí)驗(yàn)流程示意圖
(引自Lieberman-Aiden E, van Berkum NL, et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science. 2009, 326(5950):289-93)
圖3 序列裝配過(guò)程圖
(引自TingXie, Jue-FeiZheng, et al. De Novo Plant Genome Assembly Based on Chromatin Interactions: A Case Study of Arabidopsis thaliana. Molecular Plant, 2015, 489-492)
我們優(yōu)化的Hi-C技術(shù)
武漢金開(kāi)瑞生物工程有限公司技術(shù)顧問(wèn)、華中農(nóng)業(yè)大學(xué)教授, 曹罡課題組與華中農(nóng)業(yè)大學(xué)李國(guó)亮教授課題組在國(guó)際著名期刊Nature Genetic(IF=27.125)上聯(lián)合發(fā)表題為“Digestion-ligation-only Hi-C is an efficient and cost-effective method for chromosome conformation capture”的研究論文。該論文主要介紹了一種新的染色體構(gòu)象捕獲技術(shù)(DLO Hi-C),此技術(shù)信噪比高,質(zhì)量控制于早期,為解析基因組三維結(jié)構(gòu)提供了一種新型、高效、經(jīng)濟(jì)的研究方法。
?
圖4 DLO Hi-C實(shí)驗(yàn)流程
新的DLO Hi-C染色體構(gòu)象捕獲技術(shù)(digestion-ligation-only Hi-C,DLO Hi-C),設(shè)計(jì)了巧妙的酶切位點(diǎn),采用同時(shí)酶切酶連的方式,將DNA接頭連接在染色體內(nèi)切酶切口末端上,然后進(jìn)行鄰近酶連,最后再用MmeI內(nèi)切酶酶切消化,回收固定大小互作DNA片段。此方法具有以下特點(diǎn):1. 雙交聯(lián),兩次連接和消化,其中第一次同時(shí)酶切酶連,收集測(cè)序固定片段;2. 無(wú)稀釋液體交聯(lián),無(wú)生物素。
?
圖5 Hi-C生信分析流程
圖6 Hi-C多組學(xué)分析
?
DLO Hi-C和其他Hi-C的衍生技術(shù)的結(jié)果比對(duì)
如表1所示,DLO Hi-C技術(shù)所能獲取的圖譜分辨率高于傳統(tǒng)Hi-C技術(shù)、DNase Hi-C技術(shù)。在非冗余的有效數(shù)據(jù)讀取中in situ DLO Hi-C的讀取效率和in situ Hi-C相似。
表1 幾種不同的Hi-C衍生方法的對(duì)比分析
(引自Lin D, Hong P, et al. Digestion-ligation-only Hi-C is an efficient andcost-effective method for chromosome conformation capture. Nature Genetics, 2018 , 50 (5))
最終所呈現(xiàn)的圖譜如圖7所示。in situ DLO Hi-C和in situ Hi-C所呈現(xiàn)的矩陣清晰度相似,分辨率較高。
圖7 幾種不同的Hi-C的衍生方法的矩陣圖
(引自Lin D, Hong P, et al. Digestion-ligation-only Hi-C is an efficient andcost-effective method for chromosome conformation capture. Nature Genetics, 2018 , 50 (5))
三種Hi-C 技術(shù)在讀取A/B compartments數(shù)據(jù)時(shí),無(wú)論原始數(shù)據(jù)量多大,所讀取的數(shù)據(jù)相似,且2787個(gè)數(shù)據(jù)在三種技術(shù)中均被一致讀取。
圖8 三種Hi-C技術(shù)關(guān)于A/B compartments的讀取
(引自Lin D, Hong P, et al. Digestion-ligation-only Hi-C is an efficient andcost-effective method for chromosome conformation capture. Nature Genetics, 2018 , 50 (5))
三種Hi-C 技術(shù)在讀取TADs數(shù)據(jù)時(shí),in situ DLO Hi-C所讀取的TADs區(qū)最多是3244個(gè)。DLO Hi-C的TADs區(qū)的讀取率最高,且三種技術(shù)讀取了2334個(gè)一致的TADs數(shù)據(jù)。
圖9 三種Hi-C技術(shù)關(guān)于TADs的讀取
(引自Lin D, Hong P, et al. Digestion-ligation-only Hi-C is an efficient andcost-effective method for chromosome conformation capture. Nature Genetics, 2018 , 50 (5))
三種Hi-C 技術(shù)在讀取Loops數(shù)據(jù)時(shí),in situ DLO Hi-C所讀取的loops最多是12780個(gè)。這三種技術(shù)共同讀取的Loops較少,929個(gè)。
圖10 三種Hi-C技術(shù)關(guān)于Loops的讀取
(引自Lin D, Hong P, et al. Digestion-ligation-only Hi-C is an efficient andcost-effective method for chromosome conformation capture. Nature Genetics, 2018 , 50 (5))
綜上所述,DLO Hi-C技術(shù)可獲取的有效的制作矩陣的數(shù)據(jù)、A/B compartments數(shù)據(jù)、TADs數(shù)據(jù)和Loops數(shù)據(jù)較優(yōu)于其他Hi-C的衍生技術(shù)。
?
相關(guān)閱讀
?
如此強(qiáng)大的Hi-C,到底該如何運(yùn)用于生物科學(xué)研究中呢?欲知詳情,且聽(tīng)下回分解,敬請(qǐng)期待!