在线视频99_蜜臀av一区二区_久久视频国产_激情五月婷婷综合_亚洲aaa精品_黄上黄在线观看_欧美精品国产白浆久久久久_在线 亚洲欧美在线综合一区

當前位置:首頁 > 技術 > 正文內容

GWAS全基因組關聯分析第一期:數據及格式轉換_abio生物試劑品牌網

abiopp6個月前 (06-12)技術53

GWAS(全基因組關聯研究,Genome-Wide Association Study)是一種通過掃描全基因組范圍內的遺傳變異(如單核苷酸多態性,SNP),尋找與特定性狀或疾病顯著關聯的基因位點的方法。

在進行GWAS分析之前,需要選擇合適的群體,進行數據收集。實際工作中發現有些客戶根本不知道GWAS分析需要什么數據,耽誤分析進度,那需要收集哪些數據呢?主要需要兩個數據:表型數據和基因型數據。

01 表型數據 

談起表型數據,我們先來了解下GWAS的表型性狀。GWAS中的表型性狀可以分為以下三類:
① 數量性狀(Quantitative TrAIts):是指可以用數字值來描述的性狀。比如身高(cm)/體重(kg)/籽粒數(個)/產量(kg/畝),分析時表型直接使用具體數值;
② 質量性狀(Qualitative Traits):與數量性狀相反,其無法用固定數值表示,而是表現出一種狀態。比如花色(紅、黃、白等)/果實形狀(圓、橢圓等)/疾病(有或無),表型可以用數值簡化表示;
③ 分級性狀(Ordinal Traits):是介于質量性狀和數量性狀之間的一類性狀,表現為有序的類別,但這些類別之間的差異不是連續的。比如病毒抵抗性水平(高、中、低)/籽粒顏色(淺黃、深黃、棕色等)/植株高度級別(高、中、低),這些性狀可以用數字值(1、2、3等)來描述。

那表型文件長啥樣呢?這里以常見疾病研究為例,文件一般包含3列:樣本(Sample)、性別(Sex)和表型(Phenotype)。

注意:性別用數值表示,0表示未知、1表示男、2表示女、-9表示缺失;表型也用數值表示,0表示未知、1表示對照組、2表示實驗組、-9表示缺失。不要出現空缺值!

02 基因型數據 

基因型是指一個個體在某個特定基因位點上所擁有的等位基因的組合。每個基因位點可以有不同的等位基因,這些等位基因是由父母各自傳遞的一個單倍體組成。

那基因型數據從哪里獲取呢?通常有兩種方式可以獲取:
① 基于SNP芯片獲取基因型數據
② 基于基因組測序獲取基因型數據

這里我們以VCF文件為例,從”#CHROM”列開始就是變異數據:

注意:由于原始變異文件中有大量不可靠變異,建議使用過濾后的VCF文件(比如篩選PASS)進行后續分析。

由于GWAS分析需要動輒幾百上千例的數據,客戶很難湊齊那么多樣本,特別還要額外的正常樣本作為對照,對客戶而言又是一筆很大的支出!這個時候我們可以采用既有的正常人數據作為對照組,最典型的就是使用千人基因組計劃數據為對照。

現在表型數據和基因型數據都有了,該如何使用呢?由于整個關聯分析流程是基于PLINK軟件,那么就需要將基因型數據轉換為PLINK軟件能識別的格式,同時也利于提高數據處理效率。PLINK中有兩類數據格式,在分析過程都會用到:

1. ped/map格式

> ped格式文件:
包含每個樣本的基本信息(族系、名稱、性別等)、表現型信息(phenotype)、基因型信息(第7列之后)。每行表示一個樣本,該文件沒有表頭,具體列數取決于該樣本所含SNPs位點數。

第一列:Family ID,族系ID;
第二列:Individual ID,個體(如樣本間無族系聯系,Family ID和Individual ID可以一樣);
第三列:Paternal ID,父系ID,0表示未知,-1表示無父親/缺失;
第四列:Maternal ID,母系ID,0表示未知,-1表示無母親/缺失;
第五列:Sex,性別,1 男,2 女,0 或 其他值 表示未知;
第六列:Phenotype,表型值,根據研究類型定義;
后續列:從第七列開始,每兩列代表該樣本所含的一個SNP的基因型:如第七、八列代表第一個基因型(GG),第九、十列代表第二個基因型(GG)等等。

> map格式文件:
記錄每個 SNP 的染色體位置和遺傳學信息。每行對應一個 SNP,該文件沒有表頭,每行包含四列。

第一列:染色體編號;
第二列:變異標識符,這里是rs編號(有的話)或其他方式;
第三列:遺傳距離(摩爾根,單位cM),未知情況下寫0即可;
第四列(可選):SNP在染色體上物理位置,跟第三列必有一列。

2. bed/bim/fam格式

> bed格式文件:
存儲基因型信息(二進制),每行對應一個樣本。由于是二進制格式不能直接打開。

第一列:樣本的 ID(需與 .fam 文件中的 IID 一致);
后續列:每兩列為一個 SNP 的兩個等位基因(按順序排列,如 A/C 或 0/1)。其中0、1、2分別對應了aa、Aa或aA和AA。

> bin格式文件:
存儲每個 SNP 的元信息(染色體位置、遺傳學距離等)。每行對應一個SNP。

第一列:Chr,染色體編號;
第二列:SNP,標記名稱;
第三列:GD,遺傳距離(摩爾根),未知情況下寫0;
第四列:BPP,變異位點物理位置(單位:bp);
第五列:Allele 1,一般情況下為次要等位基因;
第六列:Allele 2,一般情況下為主要等位基因。

> fam格式文件:
存儲樣本的家系關系和表型信息,每行對應一個樣本。

第一列:FID,家系ID;
第二列:IID,個體ID;
第三列:父本個體ID,沒有用0表示,-1表示缺失;
第四列:母本個體ID,沒有用0表示,-1表示缺失;
第五列:SEX,性別,1表示男性,2表示女性,0表示未知;
第六列:Phenotype,表型值。

小結:fam文件就是ped文件前六列。此外這里可以通過手動添加補全表型、性別信息。

那怎么通過vcf格式數據得到ped/map格式和bed/bim/fam格式數據呢?直接上命令:
vcf轉ped/map格式:
plink --vcf test.vcf.gz --recode --out test
vcf轉bed/bim/fam格式:
plink --vcf test.vcf.gz --make-bed --out test
ped/map轉bed/bim/fam格式:
plink --file test --make-bed --out test
bed/bim/fam轉ped/map格式:
plink --bfile test --recode --out test

以上就是本期分享的內容,下一期我們將講解如何對plink格式數據進行質控過濾。

本站“ABIO生物試劑品牌網”圖片文字來自互聯網

如果有侵權請聯系微信: nanhu9181 處理,感謝~

相關文章

功能性近紅外腦成像系統研究不同類型合作行為的神經機制差異_abio生物試劑品牌網

功能性近紅外腦成像系統研究不同類型合作行為的神經機制差異_abio生物試劑品牌網

根據相互預測理論,社交互動中的每個人都有一個控制自己行為的系統和另一個預測他人行為的系統;如果一個人的大腦活動與另一個人的大腦活動相似,這代表他們對共同的環境刺激的反應方式可能相同。隨著超掃描技術的發...

利用等離子體處理優化3D打印PEEK植入物的細胞反應_abio生物試劑品牌網

利用等離子體處理優化3D打印PEEK植入物的細胞反應_abio生物試劑品牌網

聚醚醚酮(PEEK)因其出色的機械性能和生物相容性,在牙科和骨科植入領域得到廣泛應用。盡管如此,PEEK的生物惰性表面限制了其與骨組織的有效結合。傳統上,通過涂覆羥基磷灰石(HA)等生物活性材料來提高...

GelMA水凝膠微球用于再生醫學研究的相關應用_abio生物試劑品牌網

GelMA水凝膠微球用于再生醫學研究的相關應用_abio生物試劑品牌網

通過微流控乳液法、靜電微滴等技術制備出的GelMA微球 不僅保留了GelMA優異的生物相容性和生物活性,而且可作為單獨的細胞培養單元或組裝成多孔支架或模擬仿生微環境,進而應用于細胞3D培養、藥物遞...

小鼠原代小腸類器官培養實驗步驟及應用指南_abio生物試劑品牌網

小鼠原代小腸類器官培養實驗步驟及應用指南_abio生物試劑品牌網

應用指南 | 小鼠原代小腸類器官培養實驗   #應用指南# 2009 年,Hans Clevers 及其團隊利用 Lgr5+ 腸干細胞在體外培養出了三維小腸類器官結構。這種結...

血管生成實驗步驟及常見問題解析_abio生物試劑品牌網

血管生成實驗步驟及常見問題解析_abio生物試劑品牌網

血管生成實驗怎么做?NEST來膠你!   “1971 年,Judah Folkman 教授提出 “腫瘤生長和轉移依賴于血管新生” 理論,認為新血管的形成對于腫瘤生長和轉移至關重要。”...

免费在线国产视频| 亚洲欧美日韩国产一区二区| 亚洲免费精彩视频| 欧美日本一区二区在线观看| 最新日韩在线视频| 日本不卡一区二区| 一区二区免费不卡在线| 嫩呦国产一区二区三区av| 一个人看的免费视频色| 日韩一区二区在线看片| 欧美日韩在线看| 成人av在线网站| 狠狠色丁香婷婷综合| 欧美伦理在线视频| 欧美成人午夜77777| 欧美大片高清| 91p九色成人| 国产一区二区三区免费观看在线| 日韩欧美一区二区三区在线观看 | 99re这里都是精品| 99在线精品免费| 国产片一区二区三区| 国产精品情趣视频| 一个色综合网站| 一本一道波多野结衣一区二区| 国产婷婷色一区二区三区| 欧洲一级在线观看| 中文字幕一区二区视频| 国产精品亚洲а∨天堂免在线| 国产成人在线色| 亚洲一区二区网站| 99亚洲精品| 成人久久久精品乱码一区二区三区 | 欧美福利在线| 日本伊人午夜精品| 久久久久久久久久久久久夜| 亚洲欧洲精品一区二区三区不卡| 17c精品麻豆一区二区免费| www.成人网.com| 亚洲美腿欧美偷拍| 亚洲电影中文字幕在线观看| 制服丝袜中文字幕一区| 免费成年网站| 国产美女在线观看| 成人bbav| 亚洲成人毛片| 亚洲人成毛片在线播放女女| 日本亚洲天堂网| 欧美激情在线免费观看| 在线观看视频91| 精品久久久久久久人人人人传媒 | 2023国产精华国产精品| 日韩电影免费在线看| 国产精品久线观看视频| 亚洲国产精品人久久电影| 免费成人黄色| 中文字幕亚洲在线观看| 亚洲精品在线观看91| 暴力调教一区二区三区| 色综合久久88色综合天天免费| 亚洲电影在线看| sm久久捆绑调教精品一区| av日韩亚洲| 91亚洲成人| 丰满岳乱妇一区二区三区| 色呦呦日韩精品| 亚洲成人三级| 制服丝袜日韩| 91在线视频免费91| 日韩一区二区在线看片| 污视频在线观看免费| aiai久久| 国产又粗又猛又爽又黄91精品| 亚洲精品国产第一综合99久久| 日本18视频网站| 蜜桃视频成人m3u8| 国产综合自拍| 亚洲一区一卡| 欧美日韩调教| 亚洲第一会所| 欧美日韩成人在线一区| eeuss影院在线播放| 国产一区二区三区不卡视频网站| 免费视频一区| 亚洲欧美综合色| 天堂资源在线观看| 国产一区2区| 亚洲乱码国产乱码精品精98午夜| 日本电影在线观看网站| 91精品啪在线观看国产手机| 蜜桃在线一区二区三区| 亚洲精品国产福利| av日韩久久| 久久综合成人精品亚洲另类欧美| 精品精品国产高清a毛片牛牛| 美女精品导航| 亚洲欧美日韩国产一区| 亚洲高清福利视频| xxxxx.日韩| 国产成人丝袜美腿| 久草网在线视频| 午夜久久免费观看| 精品免费在线观看| 亚洲精品成人一区| 2020国产精品| www在线播放| 亚洲一区区二区| 亚洲色图第三页| 一本一本久久| 精品亚洲一区二区| 天堂99x99es久久精品免费| 久久精品无码一区二区三区| 国产精品实拍| 久久99精品久久久久久国产越南 | 姬川优奈av一区二区在线电影| 成人性生交大合| 在线观看视频你懂的| 欧美电影《睫毛膏》| 91国内精品野花午夜精品| 秋霞综合在线视频| 日本韩国欧美一区二区三区| 免费高潮视频95在线观看网站| 久久久久久久久久久电影| 好了av在线| 亚洲精品乱码久久久久久黑人 | 国产精品chinese在线观看| 懂色av影视一区二区三区| 网红女主播少妇精品视频| 亚洲国产成人久久综合| 美女网站在线免费欧美精品| 97蜜桃久久| 日韩欧美视频在线| 狠狠狠色丁香婷婷综合激情 | 一本久道久久综合狠狠爱| 免费在线观看污视频| 国产精品久久久久久妇女6080 | 欧美日韩一区二区在线视频| 国产欧美高清视频在线| 免费观看又污又黄在线观看国产| 成人久久18免费网站麻豆| 欧美成人福利| 亚洲欧美中文字幕| 懂色av一区二区三区免费观看| 欧美一区二区三区思思人| 国产福利电影一区二区三区| 欧美大片免费观看网址| 粗大黑人巨茎大战欧美成人| 五月婷婷综合在线| 黄色日韩在线| 亚洲第一会所| 日韩av一卡二卡| 17c精品麻豆一区二区免费| 欧美xxav| 芒果视频成人app| 欧美日韩一级视频| 成人高清免费观看| 四虎国产精品免费久久5151| 日本国产一区二区| 免费看亚洲片| 日韩福利一区| 亚洲福利视频免费观看| 成人爱爱电影网址| 国产精品久久久久一区二区三区厕所 | 亚洲成av人综合在线观看| 亚洲国产婷婷| japanese国产精品| 诱受h嗯啊巨肉高潮| 亚洲www啪成人一区二区麻豆| 日本视频一区二区| 精品国产123区| 夜鲁夜鲁夜鲁视频在线播放| 色琪琪丁香婷婷综合久久| 91成人国产精品| 日本一区二区三区在线不卡| 欧美色婷婷久久99精品红桃| gay欧美网站| 怡红院在线播放| 亚洲欧美中文字幕| 欧美一级二级三级乱码| 亚洲最新视频在线观看| 91麻豆.com| 久久天堂成人| 国产午夜久久| 久久视频在线| 日韩在线第七页| 妖精视频一区二区三区免费观看| 裸体xxxx视频在线| 午夜精品国产更新| 欧美激情一区三区| 轻轻草成人在线| 欧美在线国产| 神马日本精品| 亚洲最大的免费视频网站| 日本高清在线观看wwwww色| 亚洲缚视频在线观看| 欧美一区二区视频在线观看2020| 色狠狠色噜噜噜综合网| 欧美伊人精品成人久久综合97| 精品福利一区二区| 在线观看视频一区二区欧美日韩|