植物質體基因組進化正好是我課題的壹部分,這裏簡要討論壹下植物線粒體基因組的特點,成因和後果。
植物線粒體基因組的主要特點是:基因組大小和結構變異巨大,基因卻極度保守;基因分布非常稀疏,含有大量非編碼序列;存在大量的RNA編輯。
大部分動物的環狀線粒體基因組的大小約15-17kb,且結構相對保守,基因排列緊湊,這些特點都跟植物葉綠體基因組相仿,植物的葉綠體基因組大小在100-200kb之間。然而植物線粒體基因組卻跟前兩者有著迥然不同的特性,其大小壹般在200-750kb之間。有些植物如黃瓜,其線粒體基因組竟然達到了1556kb之大。而且這種基因組大小的差異即便是在近緣物種之間都可以是非常巨大的。如在蠅子草屬(Silene)中,夜花蠅子草(S.noctiflora)的線粒體基因組大小為6.728kb,而叉枝條蠅子草(S.latifolia)的線粒體基因組則有253kb之大。兩者為同屬植物,後者的線粒體基因組大小竟然達到了前者的30多倍。而即便在同壹物種中,其線粒體基因組的差異也非常顯著。如在白玉草(S.vulgaris)中,任何不同種群兩兩之間只有約壹半的線粒體基因組序列是相同的(Sloanetal,2012)。
雖然植物的線粒體基因組非常龐大,但其上的編碼基因卻並不多,排列得非常稀疏。植物的葉綠體基因組上有約100個基因,但比葉綠體基因組大的擬南芥線粒體基因組上,卻只有約50多個基因,而人的線粒體基因組上有37個基因。擬南芥的線粒體基因數量不到人的兩倍,其基因組大小卻是後者的22倍。也就是說,植物線粒體基因組中,大部分都是非編碼序列,這些序列占到了整個擬南芥線粒體基因組的60%以上。這些非編碼序列由重復片段、由葉綠體基因組和和基因組轉移而來的序列,甚至是基因水平轉移獲得的其它物種的序列構成。如最古老的被子植物互葉梅(Amborellatrichopoda)的線粒體基因組中,就有大量來自苔蘚、綠藻和其它被子植物的序列片段(Rice,2013)。
植物線粒體基因組結構變異巨大,線粒體基因卻極度保守,是植物三套基因組中最保守,演化速率最慢的。黃瓜如此龐大的線粒體基因組上,卻只比擬南芥多了四個基因。正是由於植物線粒體基因非常保守,區分度不足,所以壹般不選作系統學研究的分子標記。這跟動物正好相反,動物的線粒體基因演化速率較快,所以在動物系統學研究中,它們是最常用的分子標記。
那麽是什麽導致植物線粒體基因組如此龐大,湧入了如此多的非編碼序列呢?又是什麽導致在這樣瘋狂變異的基因組中,線粒體基因本身卻能獨善其身,處變不驚,穩如泰山呢?目前我們是用發生在線粒體非編碼區和編碼區的兩套不同的DNA修復機制來解釋的。