2024年07月03日,华南农业大学冰球突破游戏网站在线玩生猪种业工程技术研究中心/猪禽种业全国重点实验室吴珍芳教授课题组在国际知名学术刊物《Nature Communications》在线发表题为“Multi-omic characterization of allele-specific regulatory variation in hybrid pigs”(DOI: https://doi.org/10.1038/s41467-024-49923-5)的重要研究成果。项目组设计了中西方猪种正反交杂交配套实验,首次系统研究了猪等位基因特异性表达(Allele-specific expression,ASE)的时空特异性,揭示了猪在不同发育时期、不同组织中的亲本决定型(Parent-of-Origin Effect, POE)和等位基因型决定型(Allele Genotype Effect, AGE)两种ASE类型,鉴定了174个POE基因(其中154个为首次报道)和394个AGE基因(猪中首次系统报道),并绘制了猪不同发育阶段和不同组织特异性ASE图谱。发现在鉴定出的两类ASE基因中,POE基因与基因组印记相关,在猪早期胚胎发育、疾病的易感性和免疫性、肌肉骨骼生长发育过程中起到关键的调控作用;而AGE基因被认为可能与杂交优势相关,可作为种猪杂交配套、基因组选配的重要参考依据。
研究背景
现代养猪产业普遍采用专门化品系选育和配套系杂交,其目的是充分利用杂种优势。基因表达调控是将基因型转化为表型的关键步骤,而ASE现象被认为是引起猪杂种优势和遗传多样性的潜在机制。ASE与亲本基因型效应密切相关,并受复杂的顺式/反式作用调控,通常被认为在解释杂种和亲本之间基因表达差异方面起着关键作用。然而,大多数研究仅关注稳态RNA丰度,忽略了在不同组织和发育阶段的多层次基因调控变异。对ASE的系统性研究,不仅有助于完善基因表达调控的遗传解析,还为猪杂交育种和复杂疾病的机制研究提供了重要依据。
主要创新
该项目以瘦肉型猪杜洛克(Duroc)和培育品种鲁莱猪(Lulai)为试验材料,开展了系统的“正反交”杂交试验,在杂交后代4个发育时期(40天胎龄、70天胎龄、初生1日龄、成年168日龄)和4种重要组织(大脑、肝脏、肌肉、胎盘)中,探究了ASE对猪遗传调控的影响,解析了甲基化修饰调控基因印记机制。主要研究结果有:
1.开发了一项可高效区分猪双等位基因来源并统计其丰度的分析方法
基于团队前期开发的瘦肉型猪公益性基因组填充数据库(SWine IMputation, SWIM;Communications Biology, 2023, 6, 557;填充网址:https://swim.scau.pigselection.com/swim)中的变异检测流程,研究人员检测了仔猪在4个发育时期内,正交组合(杜洛克猪♀ × 鲁莱猪♂)与反交组合(鲁莱猪♀ × 杜洛克猪♂)中父、母本猪的基因组变异信息,并平均筛选出450万个可用于区分子代双等位基因来源的有效变异位点(图1)。开发了一套基于短序列(Reads)比对的等位基因分配方法,从而克服基于上述变异位点信息构建亲代杜洛克猪与鲁莱猪的个性化基因组,并用以区分子代个体中父本和母本等位基因的来源并统计其丰度。该方法能够提高子代样本总比对率,并可效降低基于SNP常规比对由于比对偏好性带来的等位基因丰度统计误差。
图1 中西方猪“正反交”等位基因特异性表达实验设计
2.全景展现了猪基因表达与染色质可及性在不同组织、不同时期的动态变化
通过转录组以及染色质可及性数据进行系统性分析,发现超过95%的基因在不同发育时期或不同组织内呈现出基因表达量的动态变化。在大脑、肝脏、肌肉和胎盘组织中,分别发现385、179、130和268个基因呈现出组织特异性表达,而仅有59、97、89和12个基因在上述组织中呈现出发育时期特异性表达。本研究还发现,组织特异性表达模式的确立在个体发育早期便已完成且持久,组织特异性表达基因所富集的功能与其组织发挥的主要生理作用相匹配。此外,还发现组织特异性表达基因与发育时期特异性表达基因的表达量与其启动子区染色质可及性呈显著正相关(P<10E-5),基因启动子区的染色质开放状态在调控基因组织特异性和发育阶段特异性表达中起关键作用。
3.全面绘制了猪时空特异、组织特异等位基因特异性表达图谱
基于双等位基因表达量分析与鉴定,将等位基因特异性表达模式划分为父母本决定型(POE)与基因型决定型(AGE),后者与品种基因型相关。共计鉴定了179个POE基因和394个AGE基因,其中包含了20个已被前人报道的POE印记基因,新发现的17个印记基因的父、母本等位基因表达量偏差高达19倍。大多数POE基因表现为组织或发育时期特异性,并在染色体中呈现出明显的成簇分布特征,提示可能存在共享的调控元件机制。父本优势表达的POE基因在许多氨基酸和脂肪酸代谢通路中富集,而母本优势表达的POE基因在基础转录因子、胆汁分泌和PPAR信号通路中富集。
AGE基因同样呈现出组织与发育时期特异性,但其分布相较于POE基因较为分散,表明其调控机制也更加局部化。通过对AGE基因进行通路富集分析,发现杜洛克猪优势表达等位基因在蛋白质消化吸收、丁酸代谢、脂肪酸降解和代谢等代谢通路中富集,而鲁莱猪优势表达等位基因在免疫应答相关基因中富集,与杜洛克猪的生长速度快以及鲁莱猪抗病能力强等特性相对应,表明等位基因特异性表达研究是发掘各品种优势表达等位基因重要途径。
4.确定了染色质开放程度对于等位基因特异性表达调控的影响
为了定量评估等位基因特异性染色质可及性是否是导致等位基因特异性基因表达的原因,研究者进一步分析了ATAC-Seq峰值区域中的双等位基因染色质可及性差异与ASE的关系,发现在179个POE基因中,有25个POE基因呈现出父母本决定的染色质可及性;在394个AGE基因中,有42个AGE基因也呈现基因型决定的染色质可及性。在14个不同的“组织-时期”组合中,除2个组合中的POE基因和1个组合中的AGE基因外,其余组合中的等位基因表达偏向与染色质可及性偏向之间均呈正相关,表明双等位基因之间的差异染色质可及性部分介导但不完全驱动差异等位基因的不平衡表达。
5.揭示了甲基化对于等位基因特异性表达模式的形成机制
DNA甲基化可以通过与反式因子相互作用或通过改变染色体结构而影响基因的表达。为了探究甲基化对于染色质可及性以及基因表达的影响,研究者进一步对70胎龄的4种组织中CpG位点的甲基化水平进行分析,发现大脑和胎盘组织分别拥有最高和最低的全局甲基化水平,而肝脏和胎盘组织中的甲基化在整个基因组中呈现非均匀分布。启动子区域的甲基化与相应基因的表达量以及染色质可及性程度呈负相关(R= -0.46 ~ -0.64),支持了DNA甲基化通过染色质可及性介导基因表达这一假设。在呈现组织特异性表达的基因中,发现染色质可及性和甲基化显示出相似的组织聚类模式。以大脑中特异性表达的STMN4基因为例,该基因在启动子区域显示出显著的ATAC峰,与之对应的是,该区域在大脑中的甲基化水平显著低于其它组织。
此外,研究者发现有多个POE基因与AGE基因在启动子区域甲基化水平、染色质开放程度和父、母本等位基因表达量三个指标上同时存在差异。例如,母本印记基因PEG10,在母本等位基因上的5'端附近具有高甲基化水平,而其父源等位基因染色质开放程度更高、且表达量明显高于母本等位基因。以等位基因决定型基因PM20D1为例,在杜洛克猪等位基因的转录起始位点附近显示高甲基化水平,在鲁莱猪则显示低甲基化水平,而染色质可及性与基因表达量则表现相反。此外,研究者还发现,组织决定的POE甲基化是导致IGF2R基因表现出组织特异性印记的重要原因。上述结果表明,通过控制等位基因的甲基化状态,可调控染色质开放程度,进而影响等位基因的特异性表达。
图2 PEG10、PM20D1与IGF2R基因发生等位基因特异性表达的遗传机制
研究意义
项目组针对基因调控变异导致的双等位基因不平衡表达这一科学问题,聚焦猪等位基因不平衡表达的时空特异性和甲基化修饰调控基因印记机制开展系统研究。通过开发一种基于短序列比对的等位基因分配方法,并整合多组学数据,开展了全面的猪等位基因特异性表达研究。系统地解析了跨组织和多发育阶段的等位基因特异性甲基化、染色质可及性和基因表达的关系,挖掘出一批亲本决定型表达基因及等位基因决定型表达基因。研究成果不仅全面展现了种猪杂交配套过程中基因表达的时空变化,还深入揭示了等位基因特异性表达的潜在遗传机制,丰富了猪基因组中印记基因的数目,且为种猪杂交配套、基因组选配的提供了参考依据。
华南农业大学冰球突破游戏网站在线玩吴珍芳教授、杨杰副研究员、美国密歇根州立大学黄温助理教授为本文共同通讯作者,华南农业大学博士后全建平、仲恺农业工程冰球突破游戏网站在线玩杨明高级畜牧师、华南农业大学蔡更元研究员、华南农业大学博士毕业生王兴旺为共同第一作者。