古詩詞大全網 - 成語用法 - 什麽是基因二代測序?

什麽是基因二代測序?

第二代測序為高通量測序,采用微珠或高密度芯片邊合成邊測序,代表有454,solexa,solid,高通量,可壹次獲得數G數據,相對與第三代,都仍然需要擴增的方法放大信號,擴增後再檢測。

第二代測序技術的核心思想是邊合成邊測序(Sequencing by Synthesis),即通過捕捉新合成的末端的標記來確定DNA的序列,現有的技術平臺主要包括Roche/454 FLX、Illumina/Solexa Genome Analyzer和Applied Biosystems SOLID system。

第壹代測序技術的主要特點是測序讀長可達1000bp,準確性高達99.999%,但其測序成本高,通量低等方面的缺點,嚴重影響了其真正大規模的應用。因而第壹代測序技術並不是最理想的測序方法。

經過不斷的技術開發和改進,以Roche公司的454技術、illumina公司的Solexa,Hiseq技術和ABI公司的Solid技術為標記的第二代測序技術誕生了。

第二代測序技術大大降低了測序成本的同時,還大幅提高了測序速度,並且保持了高準確性,以前完成壹個人類基因組的測序需要3年時間,而使用二代測序技術則僅僅需要1周,但在序列讀長方面比起第壹代測序技術則要短很多。

1)測序文庫的構建(Library Construction)

首先準備基因組(雖然測序公司要求樣品量要達到200ng,但是Gnome Analyzer系統所需的樣品量可低至100ng,能應用在很多樣品有限的實驗中),然後將DNA隨機片段化成幾百堿基或更短的小片段,並在兩頭加上特定的接頭(Adaptor)。如果是轉錄組測序,則文庫的構建要相對麻煩些,RNA片段化之後需反轉成cDNA,然後加上接頭,或者先將RNA反轉成cDNA,然後再片段化並加上接頭。片段的大小(Insert size)對於後面的數據分析有影響,可根據需要來選擇。對於基因組測序來說,通常會選擇幾種不同的insert size,以便在組裝(Assembly)的時候獲得更多的信息。

2)錨定橋接(Surface Attachment and Bridge Amplification)

Solexa測序的反應在叫做flow cell的玻璃管中進行,flow cell又被細分成8個Lane,每個Lane的內表面有無數的被固定的單鏈接頭。上述步驟得到的帶接頭的DNA 片段變性成單鏈後與測序通道上的接頭引物結合形成橋狀結構,以供後續的預擴增使用。

3)預擴增(Denaturation and Complete Amplification)

添加未標記的dNTP 和普通Taq 酶進行固相橋式PCR 擴增,單鏈橋型待測片段被擴增成為雙鏈橋型片段。通過變性,釋放出互補的單鏈,錨定到附近的固相表面。通過不斷循環,將會在Flow cell 的固相表面上獲得上百萬條成簇分布的雙鏈待測片段。

4)單堿基延伸測序(Single Base Extension and Sequencing)

在測序的flow cell中加入四種熒光標記的dNTP 、DNA聚合酶以及接頭引物進行擴增,在每壹個測序簇延伸互補鏈時,每加入壹個被熒光標記的dNTP就能釋放出相對應的熒光,測序儀通過捕獲熒光信號,並通過計算機軟件將光信號轉化為測序峰,從而獲得待測片段的序列信息。從熒光信號獲取待測片段的序列信息的過程叫做Base Calling,Illumina公司Base Calling所用的軟件是Illumina’s Genome Analyzer Sequencing Control Software and Pipeline Analysis Software。讀長會受到多個引起信號衰減的因素所影響,如熒光標記的不完全切割。隨著讀長的增加,錯誤率也會隨之上升。

5)數據分析(Data Analyzing)

這壹步嚴格來講不能算作測序操作流程的壹部分,但是只有通過這壹步前面的工作才顯得有意義。測序得到的原始數據是長度只有幾十個堿基的序列,要通過生物信息學工具將這些短的序列組裝成長的Contigs甚至是整個基因組的框架,或者把這些序列比對到已有的基因組或者相近物種基因組序列上,並進壹步分析得到有生物學意義的結果。

參考資料:

百度百科-第二代DNA測序技術