目前,在蛋白質功能方面的研究是極其缺乏的。大部分通過基因組測序而新發現的基因編碼的蛋白質的功能都是未知的,而對那些已知功能的蛋白而言,它們的功能也大多是通過同源基因功能類推等方法推測出來的。有人預測,人類基因組編碼的蛋白至少有壹半是功能未知的。因此,在未來的幾年內,隨著至少30種生物的基因組測序工作的完成,人們研究的重點必將轉到蛋白質功能方面,而蛋白質組的研究正可以完成這樣的目標。在蛋白質組的具體應用方面,蛋白質在疾病中的重要作用使得蛋白質組學在人類疾病的研究中有著極為重要的價值。
疾病的產生可能僅僅是因為基因組中壹個堿基對的變化,如β-血紅蛋白第六位上的Glu變為Val就導致了鐮刀型細胞貧血癥的發生。然而,對於大多數疾病來說,其疾病發生機制要復雜的多。因此,對於疾病發生的分子機制的認識就需要壹些能夠解決這些復雜性的方法來完成。而作為細胞中的活性大分子,蛋白質無疑是與疾病相關的主要分子,蛋白表達水平的改變是與疾病,藥物作用或毒素作用直接相關的。因此,基於蛋白質整體水平的蛋白質組學在人類疾病研究中無疑將發揮重要作用。
現在,蛋白質組學在人類疾病中的應用已經在壹些疾病如皮膚病,癌癥,心臟病中廣泛開展了,而這些研究則主要集中在這樣幾個方面:尋找和疾病相關的單個蛋白,整體研究某種疾病引起的蛋白表達或修飾的變化,利用蛋白質組尋找壹些致病微生物引起的疾病的診斷標記和疫苗等。下面,我們就將就蛋白質組學的基本技術和這些領域的應用作壹些介紹。
蛋白質組學研究的基本技術
對於蛋白質組學的研究來說,它的最基本的實驗手段就是利用雙向凝膠電泳(two-dimensional protein electrophoresis, 2DE),在整個 基因組水平上檢測蛋白質表達的情況。雙向凝膠電泳首先利用等電點聚焦來分離不同等電點的蛋白,再利用SDS-PAGE來分離不同分子量的蛋白,其分辨率是非常高的。微克級的蛋白質就可以被很好的分辨開了,如在微克級水平上,有人從壹個蛋白混合物中最多分開了11200種蛋白質,數量是非常可觀的。因而,微克級的蛋白的雙向凝膠電泳常被用來初步檢測表達或修飾有變化的蛋白。然後,同樣的蛋白混合物樣品可用於毫克級的2DE,這樣,電泳圖譜上的每壹個多肽就可被純化並進行下壹步的分析,如質譜,末端或中間的氨基酸序列分析等。
僅僅進行雙向凝膠電泳顯然是遠遠不夠的,因為由雙向電泳得到的蛋白質表達情況的變化並不能和具體的何種蛋白表達出了變化聯系起來。而壹些如蛋白質印跡或凝集素親和印跡等傳統技術對於這方面的信息也幫助不大。為了鑒定這些由電泳得來的蛋白,質譜(MS,mass spectrometry)被廣泛應用在蛋白質組學中。對於蛋白質的鑒定,有兩種方法用的最為廣泛,即MALDI-MS ( matrix-assisted laser desorption ionization)和ESI-MS (electrospray ionization)。這兩種方法各有自己的 適用範圍,通常前者對於分析高分子量的蛋白更有效,而後者對於蛋 白的檢測靈敏度更高,常可達到飛克級水平以下。質譜可以用於蛋白質分析主要是因為它可以提供特定蛋白的不同方面的結構信息,如它可直接測定蛋白或多肽的分子量信息,也可用來獲得壹些蛋白質序列信息等。同時,質譜也可通過多肽片段分子量的改變來得到壹些關於糖型,磷酸化和其它翻譯後修飾的數據。因此,質譜對於蛋白質的鑒定是非常重要的,而它的進展也無疑會大大促進蛋白質組學的研究進展。
單個的疾病相關蛋白的尋找
在疾病發生過程中,由於和疾病相關的遺傳信息的變化常常會導致蛋白的種類和數量發生變化,而這些變化是可以被可以被高解析度的雙向凝膠電泳所檢測到的,這就是利用蛋白質組學尋找和鑒定疾病相關蛋白的依據。
結腸癌的產生是壹個包含了多個基因突變的多步過程,這其中包括抑癌基因的功能喪失,癌基因的活化等。然而,腫瘤發生的具體機制仍不清楚。對於這樣壹種涉及多種蛋白的疾病,人們已經開始利用蛋白質組學來分析結腸粘膜發生惡性轉化後的多肽的變化了。對照15例結腸癌病人和13例正常人的結腸表皮的雙向凝膠電泳結果發現,二者分別含有882個和861個點,而這些點中,有壹個蛋白,其分子量為 13kDa,等電點為5.6,它只在腫瘤組織中專壹性的表達。在15個癌癥樣品中,有13例的此蛋白表達上調,占到了87%。進壹步的研究也證實了這個蛋白在不同程度的癌癥引起的發育異常中也有明顯的表達水平上的差異。由雙向電泳發現的這個可能與癌癥相關的蛋白到底是什麽蛋白呢?從電泳的凝膠上得到的這個點經胰蛋白酶水解後,得到的肽段由μ-HPLC分離後測序。測序的結果拿到兩個序列,LGHPDTLNQ和VIEHMEDLDTNADK,這與鈣粒蛋白B的情況完全吻合。進壹步的用MALDI-MS分析的結果也證實了這個蛋白就是鈣粒蛋白B。同時,結合以前的發現,即由鈣粒蛋白B和A組成的異源二聚體蛋白鈣防衛蛋白在胃腸腫瘤病人的糞便樣品中含量有很大提高,鈣粒蛋白B在腫瘤性轉化的組織中的高專壹性存在顯示出它在結腸癌的產生中具有重要的作用。盡管蛋白的具體功能還需要進壹步的闡明,但這個例子已經可以證明,由蛋白質組學方法尋找疾病相關蛋白肯定是可行的。
這方面的另壹個例子是關於肝細胞癌的研究。雙向凝膠電泳已經被成功的用於發現化學誘導的鼠的肝癌相關蛋白中。而雙向電泳和蛋白質化學方法的聯合應用也更深化了對這些癌癥相關蛋白的具體特征的認識。在用N-甲基-N-亞硝基脲誘導了鼠的肝癌後,利用雙向電泳發現了壹些表達有變化的蛋白,經氨基酸序列分析後,分析其中壹個蛋白是來源於肝癌的醛糖還原酶樣蛋白( hepatoma-derived aldose reductase-like protein)。這個蛋白分子量為35KDa,等電點為7.4,它是 壹種在肝癌和胚胎的肝中特異性表達的蛋白。利用雙向電泳得到了這樣壹種可能和癌癥相關的蛋白後,壹些蛋白質化學的方法可用來對這種蛋白和疾病的相關性作進壹步的研究。有人利用免疫組化的方法發現,直接針對來源於肝癌的醛糖還原酶樣蛋白的抗體FR-1表明,這個蛋白在化學誘導的肝癌小鼠的發生腫瘤轉化的前期和轉化的早期就已經有很強的表達了,而正常肝組織中並無表達。這都是該蛋白涉及肝癌發生過程的有力證據。
已有的壹些關於此蛋白的研究表明,醛糖還原酶是還原酶超家族的成員,在山梨糖醇途徑中它可以催化葡萄糖向山梨糖醇的轉化,而且在壹些糖尿病的並發癥的發生中它也有作用。作為壹種酶,它可以水解壹些生物異源物質等,因此它也參與了壹些解毒過程。而在肝癌發生過程中,壹些解毒酶的表達水平或活力增高已是公認的事實了。對於醛糖還原酶這壹類有解毒功能的蛋白來說,只有由雙向電泳發現的肝癌來源的醛糖還原酶樣蛋白是與肝癌相關的。它首先在胚胎肝中表達,但在成年的肝中就不表達了。肝癌發生時,它又重新表達了。因此,目前可以初步推斷,醛糖還原酶樣蛋白在肝癌發生過程中是與肝的解毒過程相關的。現在,在人的肝癌中,也找到了鼠的醛糖還原酶樣蛋白的同源蛋白,它同樣是在人的不同組織中選擇性表達的。
疾病相關蛋白的整體研究
對於大多數疾病來說,疾病造成的往往不只壹個或幾個蛋白的變化,參與疾病過程的蛋白的數目也是很大的,因此除了通過雙向凝膠電泳來尋找與疾病相關的單個蛋白外,通過蛋白質組對表達情況有變化的蛋白在整體水平上的研究同樣是非常重要的。目前,在利用雙向凝膠電泳進行的蛋白整體水平的研究方面,擴張性的心肌病(Dilated cardiomyopathy, DCM)是壹個較好的例子。
擴張性的心肌病是壹種嚴重的心臟疾病,對於這種疾病的致病機理和涉及的分子都還不清楚,而且,對於這樣壹種復雜的疾病來說,也不可能僅由壹種致病機理造成。因此,對於這樣的疾病,從整體的蛋白質組水平來研究是極為必要的。另外,相對其它組織而言,主要由心肌細胞組成的心臟是壹種相對均壹的組織,這也為用雙向凝膠電泳進行蛋白質組的研究提供了良好的基礎。對DCM的蛋白質組的研究在九十年代初就已經開始了,目前,心肌的雙向凝膠電泳的數據庫已經建立。盡管國際上各實驗室之間的數據之間有著如不同的樣品制備,不同的等電聚焦條件,不同的凝膠大小等差異,但這些數據的比較證明,在大多數情況下,不同蛋白的點的位置還是相對穩定的,可以進行大規模的比較研究。
在Knecht等人的研究中,得到了壹個高解析度的具有大約3300個心肌蛋白點的雙向電泳結果,並對其中的150個蛋白進行了氨基酸分析,N端和中間的Edman降解以及MALDI-MS等壹系列鑒定。而對幾百個正常和擴張性心肌病的病人的2-DE結果比較發現,兩者的蛋白條帶具有可比性。除去壹些可能由不同的疾病有關參數如患病程度,用藥情況,病人年紀等因素造成的無重復性的點的多少和強度的變化外,患病者和正常人有25種蛋白在統計學上具有顯著差異。這些即是DCM相關蛋白。而這個結果是在對幾百個樣品的大規模研究的基礎上得來的,而也只有大規模的研究,才能體現出這個結果在實際應用前景上的價值。對於這幾十種疾病相關蛋白,我們可以用壹些其它方法,如免疫組化,酶活測定等,來作進壹步的鑒定,確認它們與疾病的相關性以及它們在疾病中的作用等。這些工作都是在基於蛋白質組的研究基礎上進壹步的深入而進行的,顯然,在幾百個DCM患者和正常對照的樣品的大規模水平上對疾病相關蛋白的整體研究無疑是最為基礎和有效的。
病原微生物的蛋白質組學分析
近幾年來,關於傳染病的研究變得比原來更為重要。壹些新的傳染原,如Borrelia burgdorferi,HIV,Ebola病毒等的出現,使得壹些原來認為已被控制的疾病如結核,多抗藥性的鏈球菌屬感染等又有所增 加。因此,對於有毒力的微生物和病毒進行蛋白質組學的分析就顯得非常必要,它可以用來尋找和研究毒力因子,抗原,疫苗等,而這些對於疾病的診斷,治療和防治是極為重要的。目前,已經有18種微生物的基因組測序已經完成,而另有60多種的微生物的基因組測序正在進行當中,這些基因序列的信息和相對真核組織來說少得多的基因數量都為蛋白質組的研究提供了良好的基礎。
疏螺旋體屬的Borrelia burgdoferi是引起多系統疾病人類Lyme氏疏 螺旋體病的主要致病因子。這種疾病的癥狀開始時常表現為壹些環狀紅斑樣皮疹以及流感樣癥狀,發展下去也會造成壹些神經系統的並發癥和關節炎等。目前,對這種疾病的診斷主要是通過臨床癥狀的判斷並輔以血清學實驗如ELISA,免疫印跡等來證實。由於這些實驗具有不同程度的敏感性和特異性,診斷並不是標準化的。利用蛋白質組學的研究提供壹些新的較為標準的診斷標記就顯得尤為必要了。
Borrelia burgdoferi的染色體上有853個基因,它的11個質粒上有額 外的430個基因。它的雙向凝膠電泳圖譜大約有300個點,由這些蛋白點就可以尋找免疫相關抗體等蛋白了。將銀染的 Borrelia burgdoferi的 2DE凝膠上的其中217個點編號後,用來源於兔子的多克隆抗體采用免 疫雜交的方法鑒定了壹些抗原在膠上的位置,如外表面蛋白A(OspA),OspB,OspC,p83/100,p39,flagellin p41等。除了p83/100外,所有 抗原在2DE圖上都存在於不只壹個點上。利用不同表現癥狀的Lyme氏 疏螺旋體病病人的血清與疏螺旋體的2DE圖進行印跡分析發現,具有 紅斑遷移癥狀的十個病人的血清中分別含有60種和88種抗原的IgM型和IgG型抗體,而關節炎病人的血清中含有15種抗原的IgM抗體和76種不同抗原的IgG抗體,晚期神經疏螺旋體病人的血清中則含有33種抗原的IgM抗體和76種抗原的IgG抗體,但在這三種不同疾病時期的病人血清中都含有這樣幾種抗原的抗體,OspA,OspB,OspC,flagellin,p83/100,p39等,這幾個抗原同時也是原來血清學實驗中用來診斷的標記,蛋白質組的結果驗證了原來診斷的合理性,同時,2DE的結果也發現了壹些原來並沒有發現的抗原,這些正是壹些新的潛在的診斷標記。更多診斷標記的發現對於診斷的標準化和準確性的提高大有幫助。
弓形蟲病是由原生動物Toxoplasma gondil寄生感染引起的,全世 界約有30%的人攜帶此種寄生蟲,而在歐洲,弓形蟲病是發生頻率最 高的傳染病之壹,因此,這種疾病的危害是相當高的。在健康人群中,寄生蟲的感染通常是無癥狀的或癥狀極其輕微的,但如果是懷孕期間感染,寄生蟲就會通過胎盤,並造成胎兒的死亡。隨著懷孕時間的增加,寄生蟲穿透的可能性也會增加。因此,確定感染的時間就顯得非常重要了。另壹方面,懷孕不同時期的感染後果也是不同的,在懷孕早期,器官形成過程時的感染危害可能是致死的,而懷孕的後期,胎兒的感染經常會導致壹些並發癥的出現如視網膜色素異常等。如果在懷孕期間感染的婦女得到了充分的治療,胎兒感染的可能和後果的嚴重性都會大大降低。因此,及時的診斷和準確判斷感染時間對於弓形蟲病的治療是非常重要的。
但實際上,90%以上的懷孕婦女的初期感染都不能被及時發現。目前的診斷主要是依靠血清學手段和PCR方法,而用血清學的方法來檢測抗體對於壹些無免疫應答的和懷孕的病人顯然是不夠的,而潛伏性感染致病恰恰是經常發生在無免疫應答的人中。如在艾滋病患者中, T.gondil就是導致腦內病變並致死的主要原因。由這些都可看出,疾病的有效的診斷對於有效的治療是非常關鍵的。同樣,蛋白質組水平上的研究為這方面的進展提供了非常有力的方法。我們可以用不同感染情況的病人的血清和T.gondil的2DE圖進行免疫印跡來尋找和感染相關的抗 原來作為診斷標記。這些不同的血清包括:急性感染弓形蟲病的 懷孕婦女的血清,急性弓形蟲病的非懷孕病人的血清,潛伏性感染弓形蟲的尚未發病者的血清。結果顯示,2DE圖上的9個點可以和感染者血清中的任壹類型的免疫球蛋白反應,且這種反應和感染的狀態和發病與否無關,這9個點就可用來作為T.gondil 感染的標記。另外有7個點 和抗體的反 應則與抗體類型或發病情況有關,可用來區分不同疾病狀 況如潛伏期和急性期等,它們同樣可作為進壹步判斷感染狀態的診斷標記使用。
小結
雙向凝膠電泳就象壹個分子顯微鏡,將復雜的蛋白混合物分離開來,而進壹步的由疾病和對照的比較可以找到壹些疾病相關蛋白。目前,蛋白質組的應用最多的領域就是通過疾病和對照的2DE條帶的比較尋找單個的疾病相關蛋白,鈣粒蛋白B在結腸癌中的表達上調和肝癌來源的醛糖還原酶樣蛋白在鼠的肝癌發生過程中的重新表達就是兩個典型的例子。這些蛋白和疾病的相互關系還可以通過免疫組化等方法進壹步的鑒定。而另壹方面,利用蛋白質組來進行整體水平上的研究也是不可缺少的。如對擴張性心肌病的研究就顯示出了患病者和對照的 25種蛋白的顯著差異,人的心肌的包括了3300個蛋白的雙向凝膠電泳數據庫也已經建立了。對於整體水平上的研究而言,規模越大,使用樣品數目越多,對分子機制的研究可能就越深入,因而國際間的協作是非常重要的。蛋白質組學應用的另壹領域是在致病微生物的診斷用蛋白的尋找方面,如在上面所提到的Borrelia burgdoferi引起的Lyme氏 疏螺旋體病和Toxoplasma gondil引起的弓形蟲病等,由蛋白質組學得 來的診斷標記甚至還可用來區分不同的疾病時期,這些都為有效的 診斷檢測的發展提供了基礎。蛋白質組學的研究在蛋白質功能和人類疾病研究方面為我們開辟了壹個新的領域,盡管它還處於剛剛起步的不成熟期,很多技術還有待完善和發展,但它的潛力是不可低估的,在將來,蛋白質組在人類疾病中的應用也必然會更加廣泛和深入。