“小陳,我要做的這個基因,NCBI上序列錯啦,怎么在編碼區還有終止密碼子呢?”,前幾天,一位老師這樣問我。
學生物的都知道,細胞通過A、T、C、G(T=U)形成64種三聯密碼子,共計編碼二十種氨基酸及三種終止密碼子TAA、TGA、TAG。終止密碼子都只會位于編碼區最末端,而下述蛋白為何編碼區中間會出現終止密碼子呢,是數據庫錯誤嗎?

前幾年,無論是電視上還是很多保健品商店,市場都在瘋狂“硒”產品概念,什么含硒大米、硒口服液,還出現了世界硒都-恩施,并有硒產品博覽會。硒是人體的微量元素,可防止因氧化而引起的衰老、減慢其變化的速度,并且它還具有活化免疫系統,預防癌癥的功效,還有……
“等等,你跑題啦,我跟你談基因,你跟我安利硒干嘛,你們公司轉型賣保健品了嗎?!”老師顯然對我的滔滔不絕不耐煩了。
老師,您別著急,我們步入正題。NCBI數據庫沒有錯,基因對應位置在細胞內實際就是TGA,但這個TGA不是終止密碼子,而是第二十一種氨基酸:硒半胱氨酸(Sec),存在于少數一些酶中,如谷胱甘肽過氧化酶、甲狀腺素5'-脫碘酶、硫氧還蛋白還原酶、甲酸脫氫酶、甘氨酸還原酶和一些氫化酶等。硒半胱氨酸的結構和半胱氨酸類似,只是其中的硫原子被硒取代。包含硒半胱氨酸殘基的蛋白都稱為硒蛋白,其密碼子就是TGA,氨基酸簡寫是U:

既然TGA既是終止密碼子,也是Sec的密碼子,細胞如何判斷TGA編碼何種情況呢?實際上,所有的硒蛋白都需要一個特殊的序列--硒半胱氨酸插入序列SECIS(SElenoCysteine Insertion Sequence)輔助TGA表達為Sec,SECIS是一段含有頸環結構的序列,在細菌中直接存在于TGA密碼子下游,即SECIS是一段編碼序列,但其RNA含有二級結構;在古細菌以及真核生物中,SECIS位于非翻譯區的3UTR。

人體共表達25二十五種硒蛋白,幾乎都屬于酶類蛋白,其活性催化部位含有一個硒代半胱氨酸(Sec)殘基,比如GPx酶系核心生理功能是作為生物酶催化谷胱甘肽(GSH)清除人體細胞胞質、胞膜和胞外的過氧化氫、脂質過氧化物和有機過氧化物等有害代謝產物,實現微量元素硒的抗氧化能力。
人類的25種硒蛋白

由于人體無法自行合成硒,因此要額外補充。補充硒實際就是為硒蛋白的合成提供原料,實現硒蛋白功能。而硒蛋白主要通過酶促作用實現抗氧化和代謝調節等生理功能,這剛好符合人們對于美容、健康的追求,因此成為商家的一個炒作熱點。
“小陳啊,我懂了,那我要在細胞過表達硒蛋白基因,有什么注意事項嗎?”這位老師接著問。
有,兩個注意點!
硒蛋白表達的注意事項
#1 帶SECIS構建
如果是細菌的基因,比如fdhF,由于SECIS就是位于編碼區,所以依然只是構建編碼區即可;而對于真核基因,硒蛋白的構建一定得帶上3UTR,主要是用到其中的SECIS輔助Sec的翻譯。數據庫收錄了很多SECIS元件的序列,NCBI都可以查閱到:

#2 確認培養液是否含有硒元素
無論是體外還是體內、真核還是原核表達,若不含有硒元素,即便在SECIS的加持下,由于不含有原料供應,TGA只會翻譯出終止密碼子,最終會導致硒蛋白無法翻譯出完整的蛋白而喪失功能。當前,原核表達一定得額外添加甲硫氨酸,細胞及動物實驗可適當添加亞硒酸鈉(Na2SeO3)(也有文獻沒寫額外添加,猜測血清中含有微量的硒元素)。

本文已經列舉了人源的硒蛋白,若要知悉其他物種的以及SECIS位置,看查閱數據庫selenodb,其中收錄了大部分物種已知的硒代蛋白。
正如人類的性別不只“男”“女”兩種,密碼子的世界復雜度也遠超你的想象,在早期定義了二十種氨基酸之后,又發現了本文所講的硒代半胱氨酸,之后又發現了吡咯賴氨酸(Pyrrolysine),其密碼子也是TGA。只是后者目前只在產甲烷菌中出現,所以我們不做討論。我們常規細胞的線粒體、植物的葉綠體,其密碼子都常染色體都有較大差異。拋開這些不談,人的原癌基因MYC,其起始密碼子不是常規的ATG,而是CTG,但此處的CTG竟然編碼ATG的甲硫氨酸,而不是CTG的亮氨酸,你說神奇不!

基因序列本身富含了很多隱藏的信息等待我們發掘,基因的解碼及表達離不開對各類基因特征的充分了解,吉凱基因依托每年海量的為客戶提供的定制基因服務,對基因的表達譜了然于胸,可助力您充分了解基因、分析基因、表達基因提供強有力支持,更是開發出了強表達載體、大包裝容量載體,助力基因功能的研究,快來咨詢吧!!!

