游戏百科

基因、遗传力、表型,带你秒懂GWAS!

在昨天的内容中,我们具体介绍了生物信息学中主流的几种组学内容,那么今天我们就从基因组学开始,带大家逐步开始学习啦,一定要

在昨天的内容中,我们具体介绍了生物信息学中主流的几种组学内容,那么今天我们就从基因组学开始,带大家逐步开始学习啦,一定要跟上节奏哦!!

1基因型与等位基因的关系

等位基因

指位于同一基因座上的两种或更多种基因变异。每个基因座从父母那里分别继承一个等位基因。

举例:对于眼睛颜色的基因座,父母各自传递一个等位基因,比如“A”和“a”。这些等位基因分别可能表示不同的眼睛颜色(如“蓝色”或“棕色”)。

基因型

是指个体在某一特定基因座上的两种等位基因的组合。

举例:

如果一个人从父亲那继承了“A”,从母亲那继承了“a”,那么这个人就有“Aa”的基因型,表示该个体携带两个不同的等位基因。

AA:两个相同的等位基因(纯合子)。

Aa:两个不同的等位基因(杂合子)。

aa:两个相同的等位基因(纯合子)。

不同组合示意图

总结

等位基因是指同一基因座上的不同版本(例如A和a)。基因型则是指个体在该基因座上的具体基因组合(例如“AA”、“Aa”或“aa”)。

2遗传力:基因的影响有多大?

遗传力

遗传力表示基因对表型(如身高、智力或疾病风险)变异的贡献程度。它告诉我们基因在个体差异中占多大比例。遗传力的范围是从0到1。

举例:

假设身高的遗传力是 0.8,这意味着身高的80%差异由基因决定,剩下的20%差异可能与环境(如营养、运动等)有关。如果某种疾病的遗传力是 0.5,则说明该疾病的50%风险由遗传因素决定,其他50%由环境和生活方式等因素影响。

广义遗传力(H²)

衡量所有遗传因素对表型变异的影响,包括显性效应、基因间互作等。

举例:  如果身高的广义遗传力是0.9,表示几乎所有身高差异都受到基因的影响,少数情况可能受环境因素影响。

狭义遗传力(h²)

仅考虑加性效应,即每个等位基因独立作用对表型的影响。

举例:

对于一个基因,如果它的加性效应是0.4,那么每个等位基因的改变对表型的影响就会单独计算。

3

表型和SNP位点的定义与关系

表型

指个体外在可观察到的特征,通常包括物理特征和疾病状态。表型受基因和环境共同作用。

举例:

身高:基因决定一个人可能的身高范围,而最终身高还受到营养和运动等环境因素的影响。

疾病:如某种遗传性疾病(比如囊性纤维化),表型就是个体是否患病,这由多个基因变异和环境因素共同决定。

SNP位点

单核苷酸多态性(SNP)是基因组中常见的一类遗传变异,它指的是在某一位置上的碱基(A、T、C或G)的变异。每个人在这些位点上可能有不同的碱基,这些变异被称为SNP。

举例:在某个基因的特定位置,可能有两个不同的碱基C和T。如果一个人携带的是C,另一个人携带的是T,那么这个位置就存在一个SNP。

疾病相关SNP

某些SNP变异与特定疾病相关。例如,某些人可能在“C”或“T”位置携带不同的等位基因,这可能影响其罹患某种疾病的风险。

4SNV与SNP的关系

什么是SNV?

SNV 是 单核苷酸变异(Single Nucleotide Variation)的缩写,指的是基因组中某一个碱基发生的单个变化。SNV是一个广义术语,可以描述个体或群体中出现的任何单核苷酸变化。

特点:

1.SNV可以是稀有的或常见的。

2.SNV可能是功能性的(影响基因功能)或中性的(不影响基因功能)。

3.它可以发生在基因组的任何区域,包括编码区(基因部分)和非编码区(如启动子、内含子、调控区等)。

什么是SNP?

SNP 是 单核苷酸多态性(Single Nucleotide Polymorphism)的缩写,指的是群体中频率较高的SNV,即某个位置的变异在一个种群中至少有1%的个体携带。

特点:

1.SNP是SNV的一个子集,但它更强调在群体中的频率。

2.SNP通常用作遗传标记,广泛用于遗传研究(例如GWAS)。

3.因为它是群体中普遍存在的变异,通常不会直接导致严重的疾病或功能性破坏,但可能与某些性状相关联。

举例:

如果一个基因中的某个位点有两个版本(A和G),并且G的频率在种群中超过1%,则这个SNV被称为SNP。

关系图5

GWAS:全基因组关联研究的原理

全基因组关联研究

GWAS(全基因组关联研究)是一种用来寻找基因和表型(如疾病)之间关系的方法。其目标是识别特定基因位点(例如SNP)与某些特征或疾病的关联。

举例:

研究人员通过GWAS研究寻找与某种疾病(例如心脏病、糖尿病等)相关的基因位点。例如,发现某些特定SNP位点的人更容易患心脏病。

回归分析

GWAS通过回归分析模型,评估每个SNP与表型之间的关联强度。常见的回归模型包括线性回归(用于连续表型,如血压值)和逻辑回归(用于二分类表型,如是否患病)。

举例:

线性回归:分析血压值与基因型(如SNP 1的位置C/T)的关系。

逻辑回归:分析是否患病(0或1)与基因型(如“C”和“T”)的关系。

筛选显著SNP

根据计算出的p值,筛选出显著的SNP位点

曼哈顿图

展示SNP与表型的关联性,图中每个点代表一个SNP,y轴代表其与表型的关联强度(通常是log(p-value)),越高的点表示关联越强。

曼哈顿图