基本信息
題目:Digestion-ligation-only Hi-C is an efficientand cost-effective method for chromosome
conformation capture
期刊:Nature Genetics
影響因子:31.694
主要技術(shù):DLO Hi-C、原位DLO Hi-C、HCR、高通量測(cè)序、生信分析
研究背景
基因組的三維結(jié)構(gòu)對(duì)DNA的復(fù)制、損傷修復(fù)及轉(zhuǎn)錄調(diào)控起著至關(guān)重要的作用。通過(guò)探索染色質(zhì)間的遠(yuǎn)程調(diào)控作用,可以鑒定得到調(diào)控元件的未知靶基因。
雖然Hi-C有助于揭示基因組的三維結(jié)構(gòu),但是有一些因素限制了它的擴(kuò)大應(yīng)用,比如復(fù)雜繁瑣的實(shí)驗(yàn)流程、隨機(jī)自連的DNA片段帶來(lái)的高噪聲以及缺乏簡(jiǎn)單明確的噪聲評(píng)估方法。Hi-C后來(lái)也衍生出了一些改進(jìn)技術(shù),比如TCC、原位Hi-C、micro-C、RTCC、DNase Hi-C、targeted DNase Hi-C以及capture Hi-C。雖然這些先進(jìn)的方法推動(dòng)了染色體構(gòu)象捕獲技術(shù)的發(fā)展,但是從提高信噪比、簡(jiǎn)化實(shí)驗(yàn)流程,同時(shí)降低實(shí)驗(yàn)和測(cè)序成本來(lái)講,我們?nèi)匀蝗沃氐肋h(yuǎn)。
在本研究中,作者找到了一種方法,這種方法通過(guò)簡(jiǎn)單的酶切酶連步驟,取代了之前的生物素標(biāo)記然后拉取DNA片段的方法。更為重要的是,引入了一種早期的質(zhì)控方法,可以在測(cè)序前快速檢測(cè)隨機(jī)自連的噪聲比例,通過(guò)該方法,可以極大的降低實(shí)驗(yàn)所需時(shí)間和花費(fèi),正是因?yàn)檫@些改進(jìn),我們將DLO Hi-C用于研究K562細(xì)胞系的基因組三維結(jié)構(gòu)。
研究結(jié)果
1. DLO Hi-C的理論驗(yàn)證
DLO Hi-C首先通過(guò)對(duì)細(xì)胞進(jìn)行雙交聯(lián),被固定的染色質(zhì)緊接著被限制性內(nèi)切酶消化,然后再將酶切消化后的染色質(zhì)分別加上兩種不同的20bp的接頭(接頭A和接頭B)。為了防止不同染色質(zhì)分子間的自連,作者設(shè)計(jì)了同步酶切與酶連,正因?yàn)槿绱耍械娜旧|(zhì)片段與接頭的連接都是不可逆的。(Fig. 1)。
2. 測(cè)序前的快速質(zhì)控
為了在測(cè)序前評(píng)估隨機(jī)連接的噪聲情況,作者在DLO Hi-C流程中引入了早期質(zhì)控步驟,設(shè)計(jì)了兩個(gè)不同的接頭A和接頭B,如果連接發(fā)生在染色質(zhì)內(nèi)的交聯(lián)復(fù)合物中,將形成A-A或者B-B結(jié)構(gòu)。如果連接發(fā)生在不同分子中(隨機(jī)連接),形成的A-B或者B-A結(jié)構(gòu)將不含有任何酶切位點(diǎn)。因此,可以通過(guò)酶切對(duì)得到的DLO Hi-C DNA片段進(jìn)行消化處理,以此來(lái)評(píng)估隨機(jī)連接的比例。經(jīng)過(guò)定量檢測(cè)發(fā)現(xiàn)92%的 DLO Hi-C 文庫(kù)DNA被酶解了,這也證實(shí)了DLO Hi-C 文庫(kù)的信噪比很高(Fig. 2)。
3. DLO-HiC/原位Hi-C與其它Hi-C技術(shù)的比較
在高通量測(cè)序后,結(jié)合生信分析,檢測(cè)了A-A、B-B以及A-B、B-A連接所占的比例,結(jié)果顯示只有3.0%的測(cè)序序列是A-B或者B-A連接,這個(gè)結(jié)果也與上面的早期質(zhì)控結(jié)果相近。在其它Hi-C方法中,是沒(méi)有辦法評(píng)估分子間的連接概率的。
為了更好的評(píng)估DLO-HiC的質(zhì)量,作者利用K562細(xì)胞系比較了DLO Hi-C, 原位DLO Hi-C以及其它的Hi-C 方法(original Hi-C, DNase Hi-C以及原位Hi-C)在其基因組三維結(jié)構(gòu)上的差別。經(jīng)過(guò)分析發(fā)現(xiàn),雖然它們具有不同的噪音水平和測(cè)序深度,但是卻發(fā)現(xiàn)了相似的互作關(guān)系(Fig. 3)。
同時(shí)作者也比較三種Hi-C方法(DLO Hi-C :253 million raw reads, 原位DLO:632 million raw reads以及原位Hi-C:1.37 billion raw reads)關(guān)于A/B compartments、TADs和chromatin loops(染色質(zhì)環(huán))的分析,這三種分析方法在A/B compartments和TADs分析上具有高度的一致性。通過(guò)原位DLO Hi-C方法,從632million的原始序列中鑒別到了12780個(gè)loops,這里面有4177個(gè)通過(guò)原位Hi-C也可以鑒定得到。此外,作者做了APA分析三種方法的信噪比,結(jié)果顯示原位DLO Hi-C相對(duì)來(lái)說(shuō)具有較高的信噪比(Fig. 4)。
討論
染色體構(gòu)象捕獲技術(shù)在過(guò)去十年中有了很多改進(jìn),并極大的推動(dòng)了基因組三維結(jié)構(gòu)的研究。 自原位Hi-C技術(shù)發(fā)明以來(lái),Hi-C文庫(kù)的信噪比不斷增加。在這項(xiàng)研究中,作者開發(fā)了另一種Hi-C方法,即僅需要消化連接的Hi-C,這項(xiàng)技術(shù)僅需要在主要實(shí)驗(yàn)步驟中進(jìn)行兩輪消化和連接以探索3D基因組結(jié)構(gòu)。作者利用這項(xiàng)技術(shù)成功的探索了基因組的三維結(jié)構(gòu)和染色體易位,這項(xiàng)技術(shù)有助于探索全基因組的三維結(jié)構(gòu)以及相關(guān)的研究。
DLO Hi-C的三個(gè)主要優(yōu)勢(shì):
1. DLO Hi-C是一種簡(jiǎn)單且高效的實(shí)驗(yàn)方法。
當(dāng)前Hi-C方法有一些限制包括復(fù)雜和昂貴的Hi-C文庫(kù)構(gòu)建過(guò)程和高測(cè)序成本。通過(guò)DLO Hi-C,只需執(zhí)行兩輪簡(jiǎn)單的消化和連接步驟即可獲得高質(zhì)量的文庫(kù)。
2. 高信噪比。
降低背景噪音是Hi-C實(shí)驗(yàn)中的主要挑戰(zhàn)之一。 DLO Hi-C使用多種措施來(lái)減少噪音。首先,作者對(duì)染色質(zhì)進(jìn)行雙交聯(lián)。其次,在接頭連接步驟中,使用限制性內(nèi)切酶(如HindIII)和DNA連接酶同時(shí)消化和連接染色質(zhì)片段和DNA接頭。通過(guò)同時(shí)執(zhí)行這些步驟,幾乎可以完全避免不同染色質(zhì)片段之間的連接。最后,目前的Hi-C方法通過(guò)珠子拉下生物素標(biāo)記的DNA片段來(lái)去除DNA噪音,這也導(dǎo)致會(huì)拉下非鄰近連接環(huán)化的生物素標(biāo)記的懸掛末端并產(chǎn)生噪聲數(shù)據(jù)。
3. 快速的早期質(zhì)控
使用DLO Hi-C方法,可以直接評(píng)估隨機(jī)連接噪聲的水平,只需在深度測(cè)序前用限制性內(nèi)切酶消化最終文庫(kù)即可。該步驟只需要2小時(shí)進(jìn)行酶消化和DNA電泳。在DLO Hi-C方法中,早期的質(zhì)量控制步驟使我們第一次了解高通量測(cè)序前隨機(jī)分子間連接噪聲水平的評(píng)估。
借助DLO Hi-C方法的優(yōu)勢(shì),作者成功將其應(yīng)用于K562和THP-1細(xì)胞系,以揭示其三維基因組結(jié)構(gòu)并鑒定出染色體易位。此外,DLO Hi-C可以在沒(méi)有參考基因組的情況下評(píng)估噪音。通過(guò)這種方式,可以使用高精度的DLO Hi-C數(shù)據(jù)來(lái)協(xié)助未知物種和宏基因組研究的基因組組裝。DLO Hi-C方法也可用于研究三維基因組結(jié)構(gòu)、遠(yuǎn)程基因調(diào)控和染色體易位。
總之,作者成功開發(fā)了一種簡(jiǎn)單、低成本、低噪音的DLO Hi-C技術(shù),可用于全基因組染色體構(gòu)象捕獲。這項(xiàng)技術(shù)為進(jìn)一步探索基因調(diào)控和三維基因組結(jié)構(gòu)鋪平道路,同時(shí)還可以促進(jìn)基因組組裝、染色體易位分析和宏基因組學(xué)研究。