2、生信基礎知識(測序+數據庫+數據格式)
3、生信研究領域(全基因組,全轉錄組,全外顯子組,捕獲目標區域測序)
4、生信應用領域(腫瘤篩查,產前診斷,流行病學,個性化醫療)
分而治之:
壹、計算機基礎,需要看三本書,壹步步的學會學通,不需要刻意去找哪個書,壹般linux是鳥哥私房菜,perl是小駱駝咯,R是R in action,但是看壹本書只能入門,真正想成為菜鳥,必須每個要看五本書以上!我雲盤裏面有這基本上的高清打印版,大家可以去淘寶打印壹下才幾十塊錢還包郵,對書比較講究的也可以買正版,也不過是壹百多塊錢而已!
二、生信基礎知識,測序方面,在百度文庫找十幾篇壹代二代三代測序儀資料仔細研讀,然後去優酷下載各大主流測序儀的動畫講解,再看看陳巍學基因的講解;數據庫先看看三大主流數據庫——NCBI,ENSEMBL,UCSC,還有壹些也可以了解壹些(uniprot,IMGT,KEGG,OMIN,TIGR,GO)同樣也是百度文庫自己搜索資料,但是這次需要自己去官網壹個個頁面點擊看,壹個個翻譯成中文理解吃透;數據格式講起了就多了,這個主要是在項目流程中慢慢學,或者妳有機會去上課,不然妳看來也是立馬忘記的,主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等等
三、生信研究領域,各個領域主要是軟件繁多,合起來常用的估計有上百個軟件了,壹般只有從業五六年以上的人才有可能把它們全部用過壹遍,而且這也完全需要項目來訓練,而不能僅僅是看看軟件手冊,但是研究領域最重要的是背後的原理,需要看各大牛的綜述。
a) 生信基礎軟件(blast++套件,fastqc,flash,blast,solexaQA,NGS-QC-toolkit,SRA-toolkit,fastx-toolkit)
b) snp-calling相關軟件(bwa,bowtie,samtools,GATK,VarScan.jar,annovar)
c) 基因組相關軟件(velvet,SOAPdenovo2,repeatmasker,repeatscount,piler,orthMCL,inparanoid,clustw,muscle,MAFFT,quickparanoid,blast2go,RAxML,phyML)
d) 轉錄組相關軟件(trinity,tophat,cufflinks,RseQC,RNAseq,GOseq,MISO,RSEM,khmer,screed,trimmomatic,transDecoder,vast-tools,picard-tools,htseq,cuffdiff,edgeR,DEseq,funnet,davidgo,wego,kobas,KEGG,Amigo,go)