在直播期間及直播結(jié)束有老師問道:LncRNA的qPCR引物如何設(shè)計?在設(shè)計的時候有沒有需要特別注意的地方?如何能設(shè)計出最好的qPCR引物。基于這些問題,總結(jié)自己10年qPCR引物設(shè)計經(jīng)驗(yàn)分享給大家。
LncRNA的qPCR引物相比于編碼基因,是要復(fù)雜。導(dǎo)致其復(fù)雜的原因并不是引物設(shè)計原則上有特別之處,而是在于有太多的LncRNA數(shù)據(jù)庫,數(shù)據(jù)庫之間往往沒有關(guān)聯(lián),且不同數(shù)據(jù)庫的維護(hù)也不盡相同。今天的文章分兩塊:LncRNA數(shù)據(jù)庫介紹和LncRNA引物設(shè)計注意事項(xiàng)。
LncRNA數(shù)據(jù)庫介紹
1、NCBI RefSeq
NCBI不多做介紹,通常LncRNA信息我們參考RefSeq數(shù)據(jù)庫中的數(shù)據(jù),RefSeq數(shù)據(jù)庫中的數(shù)據(jù)參考數(shù)據(jù),是經(jīng)過人工審核,其數(shù)據(jù)信息可信,注釋全面。RefSeq數(shù)據(jù)庫中LncRNA的命名通常是NR_或者XR_開頭,后面加數(shù)字,其外顯子信息位置,數(shù)量信息非常完整。關(guān)于RefSeq數(shù)據(jù)庫的介紹,感興趣的老師可以查看文章《帶你走入RefSeq數(shù)據(jù)庫》,鏈接https://mp.weixin.qq.com/s/ZuE40OSnzxrMk_yrP-Y5ag。
2、Ensembl
相同的LncRNA,Ensembl數(shù)據(jù)庫中信息往往要比NCBI多很多,特別是轉(zhuǎn)錄本數(shù)量。且數(shù)據(jù)變化非??烨易兓瘯艽?,可能昨天瀏覽這個數(shù)據(jù)庫中某個LncRNA只有2個轉(zhuǎn)錄本,隔天再去看的時候,可能就變成3個甚至更多。NCBI就不同,盡管更新頻率也非常的快,但是LncRNA的變化通常很小,轉(zhuǎn)錄本數(shù)量基本不變化,序列變化的可能性也非常的小。關(guān)于不同數(shù)據(jù)中的命名格式可以查看文章《不知道數(shù)據(jù)庫命名規(guī)則怎么能真正了解數(shù)據(jù)庫?》鏈接https://mp.weixin.qq.com/s/D6r2CD1qKj0iMNdYSoqrKQ。

3、UCSC
UCSC數(shù)據(jù)庫的LncRNA數(shù)據(jù)個人認(rèn)為更新相對較慢,但有些LncRNA名稱如uc001ylu就需要前往UCSC數(shù)據(jù)庫查詢其序列信息。UCSC Genome Browser可以根據(jù)基因組的位置、基因ID、轉(zhuǎn)錄本等信息進(jìn)行瀏覽查詢。

4、RNAcentral
RNAcentral 整合了包括 Ensembl、GENCODE、Greengenes、HGNC、LNCipedia、lncRNAdb、miRbase、NONCODE、RDP、RefSeq、Rfam、SILVA 在內(nèi)的多個數(shù)據(jù)庫。

5、NONCODE
NONCODE是一款綜合性的數(shù)據(jù)庫,該數(shù)據(jù)庫是一個比較全面的ncRNA相關(guān)注釋的數(shù)據(jù)庫,尤其是lncRNA信息,不僅支持常用lncRNA的Name、NONCODE Gene ID(例如:NONHSAG036681.2)搜索,部分lncRNA支持其他數(shù)據(jù)庫名字進(jìn)行搜索。該數(shù)據(jù)庫目前收入了很多物種,主要是動物方面的,包括人、小鼠、大鼠、奶牛、雞、果蠅、斑馬魚、線蟲、酵母、擬南芥、黑猩猩、大猩猩、恒河猴、復(fù)鼠、鴨嘴獸、猩猩。數(shù)據(jù)庫包含信息豐富,包括表達(dá)、功能、與疾病關(guān)系、染色體位置、序列保守性等,并可進(jìn)行序列Blast搜索,同時支持?jǐn)?shù)據(jù)下載。

6、Lncipedia
LNCipedia數(shù)據(jù)庫整合了多個人類(Human)LncRNA數(shù)據(jù)庫信息,很大程度上解決了LncRNA數(shù)據(jù)庫各自為政的問題,這些數(shù)據(jù)庫包括LncRNAdb、Broad Institute、Ensembl、Gencode、Refseq、NONCODE、FANTOM,同時還包括Nielsen, Hangauer等多篇文獻(xiàn)中發(fā)現(xiàn)的LncRNA信息。目前已經(jīng)更新到5.2版本,包括127,802 轉(zhuǎn)錄本序列和 56,946 條基因。

7、Lncrnadb
該數(shù)據(jù)庫可以查詢類似LINC00066, NCRNA00066名稱的LncRNA。lncRNAdb數(shù)據(jù)庫是一個真核生物的lncRNA綜合數(shù)據(jù)庫。它包括特異的序列結(jié)構(gòu)信息,如轉(zhuǎn)錄本、基因組位置、表達(dá)、亞細(xì)胞定位和保守位點(diǎn)以及相關(guān)的功能和疾病。
數(shù)據(jù)庫介紹總結(jié):前面提到LncRNA的qPCR引物設(shè)計相比與編碼基因確實(shí)要難,其原因就體現(xiàn)在LncRNA的數(shù)據(jù)庫是在太多,而我們設(shè)計得到的qPCR引物通常都需要進(jìn)行引物特異性比對,最好用的莫過于NCBI Primer-Blast,但是在特異性比對可供選擇的比對數(shù)據(jù)庫都只是NCBI,其他LncRNA數(shù)據(jù)庫無法選擇。接下來,小編就分享下非NCBI RefSeq來源的LncRNA的qPCR引物設(shè)計應(yīng)該怎么做?
LncRNA 的qPCR引物設(shè)計注意事項(xiàng)
LncRNA的qPCR引物設(shè)計最主要的三個原則:跨外顯子設(shè)計,特異性比對,引物位置。
1、跨外顯子設(shè)計
跨外顯子設(shè)計的目的就是避免基因組的污染,跨外顯子設(shè)計有兩種辦法,具體見示意圖:
(1)正向F引物和反向R引物落在不同的外顯子上

此處注意:(a)如果產(chǎn)物大小允許,正向F引物和反向R引物可以落在不同的外顯子上;(b)如果正向F引物和反向R引物只能落在兩個相鄰的外顯子上,那優(yōu)先選擇內(nèi)含子最大的兩個外顯子上。
(2)正向引物或者反向引物跨了兩個外顯子

此處注意:(a)如果能選擇(1)就不要選擇(2)方法設(shè)計,(2)設(shè)計方法引物位置受限,設(shè)計得到的引物參數(shù)可能不是最優(yōu)。(b)如果選擇(2)方法設(shè)計,那跨兩個外顯子的引物的3端序列不要跨第二個外顯子太多序列,建議不要超過6個堿基,否則就相當(dāng)于沒有跨外顯子設(shè)計。
2、特異性比對
從上述數(shù)據(jù)庫中查到LncRNA的序列信息后,建議先使用NCBI進(jìn)行比對,簡單做一個核苷酸比對和基因組比對。核苷酸比對的目的是看看這條LncRNA有沒有與NCBI RefSeq同源性較高的序列信息。如果有,可能涉及到需要判斷他們是否是同一條基因的問題?;蚪M比對的目的是簡單判斷其外顯子個數(shù)組成,因?yàn)橛行㎜ncRNA數(shù)據(jù)庫可能沒有提供外顯子數(shù)量信息和外顯子位置信息。比對其實(shí)就是一個不同數(shù)據(jù)庫之間LncRNA信息的轉(zhuǎn)換,當(dāng)統(tǒng)一后,那LncRNA引物設(shè)計就容易許多。
關(guān)于NCBI blast Database選擇問題可以查看文章《使用NCBI做BLAST,我應(yīng)該選擇哪個Database?》,鏈接https://mp.weixin.qq.com/s/dKGH_GvNzhO_ofRTUuAbEQ。
3、引物位置
引物盡量不要落在LncRNA序列兩端100bp序列以內(nèi),原因是防止兩端序列不準(zhǔn)確。曾經(jīng)碰到一個老師,自己使用RACE驗(yàn)證Ensembl數(shù)據(jù)庫中的LncRNA序列,發(fā)現(xiàn)兩端序列有缺失。
4、同源區(qū)設(shè)計
本人設(shè)計qPCR引物通常都選擇在同源區(qū)設(shè)計,檢測其總RNA情況,具體根據(jù)各自實(shí)驗(yàn)要求而定。這里不多做展開介紹。
