古詩詞大全網 - 古詩大全 - 450k甲基化基礎(壹)

450k甲基化基礎(壹)

DNA甲基化是表觀遺傳學的中最為常見的壹種修飾,其主要形式包括:5-甲基胞嘧啶 (5-mC)、少量的N6-甲基腺嘌呤 (N6-mA) 以及7-甲基鳥嘌呤(7-mG)。

目前常說的DNA甲基化壹般指 CpG島甲基化 ,即在 DNA甲基化轉移酶(DNMTs) 的作用下使CpG二核苷酸5’端的 胞嘧啶 轉變為 5’甲基胞嘧啶 。

哺乳動物體細胞的DNA胞嘧啶甲基化主要發生在 CpG島

CpG島(CpG islands) :指CpG序列密度相比整個基因組來說是特別高的富集區域,壹般位於 啟動子附近 , 5’端非翻譯區 或 第壹個外顯子 ;壹般CpG島序列長度在 500bp 以上, GC含量高於55%以及CpG出現比率大於0.65 ,40%的啟動子區域含有CpG島。

CpG shores 指距CpG島邊緣 2kb 的區域

CpG shelves 是指距CpG島邊緣 4kb 的區域

哺乳動物中的非CpG甲基化主要是發生在胚胎發育階段和腦組織中

基因組中60%-90%的CpG都被甲基化,未甲基化的CpG形成CpG島,位於 結構基因啟動子的核心序列和轉錄起始點

壹般來說,DNA甲基化主要作用在於調控基因的表達,即 基因啟動子區域CpG島的甲基化水平越高 , 其對應基因的表達水平就相對越低 ;DNA甲基化受到 甲基化酶 (如DNMT3A)和 去甲基化酶 (TET2)的調控。

除了CpG島的甲基化水平的變化會導致腫瘤的發生外,CpG shores and shelves的異常甲基化也會導致其基因轉錄水平的抑制

甲基化芯片的原理是 基於亞硫酸鹽處理後的DNA序列雜交的信號探測 ,亞硫酸鹽處理是將 非甲基化的胞嘧啶變成尿嘧啶 ,而 甲基化的胞嘧啶則保持不變 ,然後 再將尿嘧啶轉化為胸腺嘧啶 ,最後進行 芯片雜交 ;

Illumina的450K芯片采用兩種assay:Infinium I和Infinium Ⅱ,前者有兩種bead(微珠),分別是甲基化M和非甲基化U,後者則是壹種bead(不區分甲基化和非甲基化)。

以及下面這張圖,註:左邊壹列是非甲基化的GpC locus,右邊是甲基化的GpC locus,上下分別是Infinium I 和Infinium Ⅱ

探針是以甲基化位點為單位的,每個探針對應檢測壹個甲基化位點。為了能夠區分甲基化位點和非甲基化位點,在450K 和 850K中,有兩種類型的探針,分別叫做I 型探針和 II 型探針

對於human 來說,目前主流的DNA甲基化芯片有450K 和 850K 兩種,都是illumina 公司研發的。這裏的450K 和 850K 指的是芯片上探針的數量,對應可以檢測的甲基化位點個數。

—————————————————————————————————————

對於亞硫酸氫鹽處理的DNA ,非甲基化的C會變成T , 而甲基化的C不會變。

對於I 型探針而言,有兩種序列,專業名詞叫做bead type, 其中Unmethylated bead type 用來和非甲基化的C雜交,Methylated bead type 用來和甲基化的C雜交。

對於human而言,主流的DNA甲基化芯片有450K和850K兩種,這兩個數字代表覆蓋到的甲基化位點的個數,是壹個約數;

甲基化芯片上混合使用了I 型探針和II 型探針,I 型探針通過兩個bead type 分別識別甲基化的C和非甲基化的C,II 型探針通過1個bead type 就可以區分甲基化的C和非甲基化的C。

壹、Illumina HumanMethylation450 BeadChip (甲基化450k芯片)簡介

450K芯片的芯片圖形及其原理可以以下圖展示

1、芯片:壹張芯片包括12個array(如圖顯示),也就是壹張芯片可以做12個sample,壹臺機子壹次可以跑8張芯片,也就是壹***96個sample,每個樣本可以測到超過450,000個CpG位點的甲基化信息(大概人所有的1%,但是覆蓋了多數CpG島和啟動子區),芯片本身包含壹些控制探針可以做質控。

2、原理:簡而言之,基於亞硫酸鹽處理後的DNA序列雜交的信號探測。亞硫酸鹽是甲基化探測的“金標準”,不管是芯片或者甲基化測序,都要先對DNA樣品進行亞硫酸鹽處理,使非甲基化的C變成U,而甲基化的C保持不變,從而在後續的測序或者雜交後區分出來。450K采用了兩種探針對甲基化進行測定,Infinium I采用了兩種bead(甲基化M和非甲基化U,如圖顯示),而II只有壹種bead(即甲基化和非甲基化在壹起),這也導致了它們在後續熒光探測的不同,450K采用了兩種熒光探測信號(紅光和綠光)。

二、分析需要考慮的問題

1、背景校正

2、紅光和綠光的校正

3、控制芯片的使用(illumina450K本身有壹些控制芯片,可以用來做質控,如亞硫酸鹽處理效率)

4、探針類型(I型和II型)的校正(不同探針類型產生的數據不同)

最終我們選擇BMIQ的方法(基於ebayes的原理將II型探針的甲基化水平拉伸到I型水平)來做矯正。

5、位置的校正(芯片上的不同位置產生的數據可能會有偏差)

6、批次的校正(不同的批次做的數據會有偏差)

7、探針序列本身是否可靠(有些探針本身位於repeat區或者包含snp等就會影響雜交及最後的結果,應該去除,附上壹片參考文獻,裏邊有list可以用來去除不好的探針)

平均β=信號B /(信號A +信號B + 100)

通過計算甲基化(信號A)和未甲基化(信號B)等位基因之間的強度比來確定DNA甲基化水平(β值)。

具體地,β值是由甲基化(M對應於信號A)和未甲基化(U對應於信號B)等位基因的強度計算的,熒光信號的比率β= Max(M,0)/ [Max( M,0)+ Max(U,0)+ 100]。

因此,β值的範圍從0(完全未甲基化)到1(完全甲基化)

具體的β值的意義是:

任何等於或大於0.6的β值都被認為是完全甲基化的。

任何等於或小於0.2的β值被認為是完全未甲基化的。

β值在0.2和0.6之間被認為是部分甲基化的。

參考:

/thread-237-1-1.html

/archives/430