背景
第二代基因测序(NGS)技术使基因检查得以扩充rhce基因型,影响了临床医学的许多方面。短读序列测序的NGS不支持直接对突变序列进行测序,这促使序列剖析高度依赖于参考的基因组。并且对于不同的具有高度异质性基因的人群来说,所参考基因组难以包含所有的序列。长读测序(LRS)平台可克服NGS对变异程度高的重复或同源基因的限制。
Rh系统是最复杂的血型系统之一rhce基因型,编码Rh抗体为两个连锁的同源基因:RHD(MIM:111680)和RHCE(MIM:111700),这两个基因编码常见的红细胞特异性Rh抗体(D、C、c、E和e)。RH遗传异质性常见于美洲人后裔个体。对于须要频繁输血的镰状细胞病病人(SCD),RH遗传多态性会影响病人和健康献血者红细胞中Rh抗体成份,进而造成血型不相容。
本研究使用DNA富集方式——区域特异性富集(RSE)捕获20kb的长DNA片断,并通过PacificBiosciences(PacBio)平台对其进局长读测序。
方式
1
样品选择和DNA提取:从2名黑人和9名白人个体中获得样本,以代表不同的RH基因型,从新鲜全血中分离基因组DNA,保存在4℃。
2
通过AnthOligo平台设计49个寡核酸序列以靶点和捕获RHD-RHCE区域。
3
通过RSE捕获目标DNA及全基因组扩增与测序。
4
借助单碱基多态性(singlenucleotidepolymorphism,SNP)进行全基因组SNP分型(WholeGenomeSNPGenotyping)以辨识突变。
5
通过PAClindrome生物信息学平台,从PacBio的SMRT(单分子测序)长序列中辨识回文重复序列linux查看磁盘空间,并从重复序列中提取一致序列,以获得具有更高确切度的序列。
6
连锁剖析和基因分型。
结果
表1受试者基因型基本信息
表2RHD-RHCE组装概要
表3在不同群体中相邻的4个SNPs与rs586178(RHCEc.48G)的关联
图1RHD和RHCE的染色体定位、结构及其基于GRCh38参考基因组的对比
图2测序确切性与回文数量的关联
图3受试个体RHD-RHCE区域的组装
图4100个基因组数据库中可代替等位基因的频度
图5已知的主要RH变异的融合位点和断点
推论
借助目标基因捕获技术、长读测序和PAClindrome生物信息学平台,研究者成功地在RH遗传变异频度高的白人个体中获得了确切度高的RHD-RHCE片断序列。才能读取>5kb的长序列对于重复序列和变异频度高的片断重组来说具有很大的意义。本研究有望解决传统基因分型方式中存在的RH相像基因型难以区别的问题linux ftp,包括等位基因缺位和单倍体。
参考文献:
ZhangZ,AnHH,VegeS,etal.Accuratelong-readsequencingallowsassemblyoftheduplicatedRHDandRHCEgenesharboringvariantsrelevanttobloodtransfusion.AmJHumGenet.2022;109(1):180-191.doi:10.1016/j.ajhg.2021.12.003
谢谢湖南省人民诊所输血科来稿
本期编译:杜垚强、陈秉宇