IDT NGS二代测序甲基化测序捕获解决方案
——DNA甲基化文库构建试剂盒、定制化Panel杂交捕获探针组
北京泽平代理的美国IDT NGS二代测序产品,通过基于PostBS单链建库原理的IDT xGen Methyl-Seq 甲基化文库建库试剂盒、用于杂交捕获靶向富集的IDT xGen Custom Hyb Panel 定制探针组,实现从低起始量DNA样本获得高质量的甲基化检测结果,同时提高目标区域覆盖度并降低检测成本,为生命科学实验室基础研究提供强大助力。
摘要
在哺乳动物表观遗传学研究中, DNA甲基化是研究最为深入的修饰之一。在正常细胞中, DNA甲基化可以有效调控基因表达水平。但与此同时,启动子区域的高甲基化会引起某些抑癌基因的失活,已有大量实验研究表明,DNA甲基化在多类癌症中会导致大范围基因沉默。当然,甲基化水平的改变不仅会出现在启动子区域和DNA重复序列中,它还与非编码RNA(如肿瘤抑制作用相关的microRNA)的表达调控有关。
DNA甲基化水平与肿瘤发生与发展过程息息相关,这驱动着人类表观基因组学的进步。甲基化测序是研究不同生命过程中基因调控的重要工具之一(例如细胞分化和疾病进展),并且在包括肿瘤早筛和诊断在内的临床检测中展现出越来越大的应用价值。全基因组甲基化测序(WGBS)允许无偏好性地进行单碱基分辨率检测,是检测目标区域的理想方法。在有明确目标基因组区域存在的情况下,经过杂交捕获后再测序会使测序实验更有针对性,成本更为可控。在评估具有低水平甲基化特征的复杂样本时(如液体活检中的游离DNA),测序深度需求一般比常规全基因组甲基化测序更高,因而,在这类样本的检测中杂交捕获是更为理想的实验方案。
在本应用方案中,通过结合使用IDT xGen Methyl-Seq 建库试剂盒及IDT xGen Custom Hyb Panel 杂交捕获系统,打造了兼具高灵活性及高准确度的甲基化靶向测序工作流程。该流程在实验端结合了IDT的单链文库制备技术和高效稳定的杂交捕获体系,在生信设计端则采用了IDT独特的探针设计算法对探针的表现进行逐条评估;在本文中展示的测试数据证明了该工作流程可应对不同甲基化水平的复杂样本,并可高效准确地还原样本的原始甲基化特征。
主要特点
·实验设计中,同时测试并平行比较了不同甲基化水平的样本,且panel本身探针数目较少,相比常规实验更加考验探针性能;
·不同甲基化水平文库都有着较高的比对率;
·不同甲基化水平文库有着近似的中靶率、覆盖度以及覆盖均一性;
·在120个碱基的长度区间内,即便对于CpG高度密集的目标区域,不同甲基化水平下的覆盖程度也近乎一致。
一、背景介绍
在哺乳动物细胞中, DNA甲基化修饰过程为:胞嘧啶的嘧啶环第5位碳原子在DNA甲基转移酶的作用下添加甲基基团。这类甲基的共价修饰通常发生在CpG二核苷酸(dinucleotide)中的胞嘧啶中,该二核苷酸集中在称为CpG岛的基因组区域中,并且CpG位点常在CpG岛上成簇出现。人类基因组中约有2800万个CpG位点,正常体细胞中约70%的CpG位点为甲基化,但是这些CpG位点的分布并不均匀。大多数CpG岛的长度为500~1000个碱基对(bp),通常集中在启动子区域。
二代测序技术(Next-generation sequencing, NGS)的快速发展使得快速绘制任意物种的DNA甲基化图谱成为可能。全基因组重亚硫酸氢盐测序(WGBS)已成为在全基因组范围内检测甲基化水平的金标准,并且对于不同类型样本的适配程度很高。但如果想同时针对大量样本的特定区域进行甲基化检测,WGBS无疑是一个成本相对较高的技术方案。幸运的是,杂交捕获技术可以在一次反应中检测成千至上百万个目标基因组序列,因此成为了一种性价比非常高的解决方案,在成本允许的情况下可以实现更高的测序深度,赋能多位点甲基化研究。
二、建库方案-PostBS单链建库方法——IDT xGen Methyl-Seq 建库试剂盒
传统甲基化建库流程,也称作PreBS(Pre-Bisulfite)方法,即对PCR扩增前的文库(已连接上测序接头)进行重亚硫酸氢盐处理。重亚硫酸氢盐处理会破坏DNA双链结构并产生片段化文库,大大降低文库的分子复杂度,影响最终的测序质量(如产生较高的冗余率)。为了解决上述难题,重亚硫酸氢盐处理后再进行建库的技术方案(Post-Bisulfite, PostBS)逐渐成为主流。在该技术路线中,以重亚硫酸氢盐处理后的单链或片段化的DNA为初始模板,进而转化成可以用于后续测序的文库。
IDT xGen Methyl-Seq 建库试剂盒基于Adaptase技术,该技术是一种高效且不依赖于模板的单链DNA接头连接方法,通过这种高效率的连接方式,可以利用重亚硫酸氢盐转化处理后的单链及损伤DNA进行文库构建。借助于无偏好性的接头连接,研究者可获得更完整、偏好性更低的甲基化测序文库。成本允许的情况下可以实现更高的测序深度,赋能多位点甲基化研究。
图. 实验流程示意图。物理打断后的基因组DNA经过重亚硫酸氢盐转化,使用IDT xGen Methyl-Seq 建库试剂盒进行文库制备。根据目标区域进行探针定制化设计,在设计时充分考虑了甲基化测序过程中的序列复杂性;捕获实验中用到的DNA探针为IDT xGen Custom Hyb Panels 探针。
图. 甲基化建库流程示意图。物理打断后的基因组DNA经过重亚硫酸氢盐转化,使用IDT xGen Methyl-Seq 建库试剂盒进行文库构建。首先, Adaptase反应可不依赖于模板而在单链DNA 3'末端高效加入截短型测序接头1(P7端),再通过延伸反应,可生成双链并含有部分P7测序接头的文库。在下一步的连接反应中,加入截短型测序接头2( P5端),再通过Indexing PCR反应加入样本标签(sample index),并扩增得到完整长度的文库,该文库可用于后续的WGBS或杂交捕获反应。
三、杂交捕获方案——IDT xGen Custom Hyb Panel 探针
IDT xGen Custom Hyb Panel 探针中的寡核苷酸探针在5'端带有生物素修饰。依托于在工艺中使用的特殊DNA合成设备,以及在核酸合成领域超过30年的技术积淀,IDT可以快速、高质量地合成捕获反应中所需要的长链寡核苷酸探针。以其中的IDT xGen Custom Hyb Panel-Production 探针为例,该panel中的每条探针都单独合成且经过单独质检,在探针混合之前,IDT会对每条探针进行电喷雾电离质谱(ESI-MS)分析和两次定量,以保证每条高保真探针在panel内的浓度相同。相较于传统的芯片合成结合PCR扩增的探针合成方法, IDT的单条合成、单条质检的探针合成工艺在减少批次间差异、提高探针性能稳定性方面具有明显优势。
常规的杂交捕获设计在一定程度上允许探针与目标位点之间的序列差异,即通常所说的错配容忍度。然而,在捕获未知甲基化状态的DNA模板分子时,实验设计面临如下特殊挑战:
①针对特定的目标区域,需要更多的探针序列来应对可能存在的高度复杂度甲基化状态。
②在经过碱基转化后,GC含量改变,可能影响探针与靶点结合能力。
③胞嘧啶脱氨反应后,基因组序列的复杂性也显著降低,对探针结合的特异性要求更高。
与常规的DNA探针设计不同,甲基化检测设计策略需要考虑到不同样本中目标区域的甲基化水平差异,这是因为需要捕获的文库分子在经过重亚硫酸氢盐转化后,从根本上改变了原有的DNA序列。下图展示了IDT通常推荐使用的甲基化捕获探针设计策略。
图. 甲基化杂交捕获探针设计策略。首先,针对目标区域OT(Original top strand,正义链)及OB(Original bottom strand,反义链),假设都为非甲基化状态,经过重盐硫酸氢盐处理及PCR后,OT序列变成Conv-OT(Converted top strand),其中非甲基化的C碱基变成T碱基,RCOT(Reverse complement strands of OT)即为捕获OT链的探针设计序列(5'TACACAAT 3')。反之,经过重盐硫酸盐处理及PCR后,OB序列变成Conv-OB(Converted bottom strand) ,其中ROCB(Reverse complement strands of OB)序列即为OB链的探针设计序列(5'ATCACATA 3')。同样原理,假设OT及OB序列都为甲基化状态,经过重亚硫酸氢盐处理及PCR后,OT序列变成Conv-OT(Converted top strand) ,并且甲基化的C碱基仍保持不变,ROCT(Reverse complement strands of OT)序列即为捕获OT链的探针设计序列(5'TACGCGAT 3')。反之,经过重亚硫酸氢盐处理及PCR后,OB序列变成Conv-OB(Converted bottom strand),其中RCOB(Reverse complement strands of OB)序列即为捕获OB链的探针设计序列(5'ATCGCGTA 3')。
四、案例研究——不同探针设计策略对于关键测序指标参数的影响
为了评估不同探针设计方案(仅针对正义链或同时针对正义链和反义链设计探针)和针对目标区域不同tiling覆盖层数(1×、2×或者4×)对于整体检测结果的影响,用起始量统一为50ng人基因组DNA,制备两个梯度的甲基化样本来模拟不同甲基化水平的样本情况。该两个梯度文库使用来自完全甲基化和完全非甲基化的DNA标准品组合(Zymo Cat. No.D5014-2,D5014-1),模拟分别为15%及85%的全基因组甲基化水平。DNA样本经过物理打断后,使用Zymo EZ DNA Methylation Gold Kit (Zymo Cat. No. D5005)进行重亚硫酸氢盐处理,该试剂盒将未甲基化的胞嘧啶转换为尿嘧啶,得到长度为170~200bp且以单链为主的DNA片段。文库制备使用IDT xGen Methyl-Seq 建库试剂盒(IDT Cat. No.10009824),之后每个文库取500ng用于杂交捕获(3-plex),并且按照IDT xGen Custom Hyb Panels 探针说明书标准流程进行实验操作(65℃过夜杂交)。上机测序平台为Illumina NextSeq(2×75bp读长,混入10% phiX)。去除10bp Adaptase反应所产生的“tail“后,使用Bismark(v0.22.3)和Picard (v2.18.9)进行数据比对及甲基化水平分析。数据量均一化至2M reads/样本进行分析。
比较四种不同探针设计方式对相同128kb目标区域的捕获效果,如表所示,“Panel 1T”及“Panel 2T”代表只针对目标区域DNA序列的正义链进行设计,并且分别使用1×平铺或者2×高密度设计;“Panel 1T1B”及“Panel 2T2B”代表针对目标区域DNA序列的正义链及反义链同时进行设计,并且分别使用2×平铺(正义链及反义链各为1×平铺)及4×高密度设计(正义链及反义链各为2×高密度设计)。
表. 针对相同目标区域的不同探针设计策略
数据分析结果显示上述四种Panel设计有着近似的比对率、中靶率、Fold-80、转化效率值。其中,提高探针覆盖密度对于关键测序指标的提升影响并不显著(“Panel 1T”vs“Panel 2T”或者“Panel 1T1B”vs“Panel 2T2B”);同样的,仅针对正义链设计1×探针覆盖即可达到与同时设计正反义链探针近似的结果。
表. 四种Panel设计策略的性能比较
五、IDT甲基化方案验证——材料与方法
为了检测IDT靶向甲基化测序方案在不同基因组位点、不同甲基化状态下对甲基化区域的捕获效果,IDT仍然选择较小的目标区间进行探针设计和测试(总目标区域大小约为100kb)。在本文第4部分“案例研究——不同探针设计策略对于关键测序指标参数影响”的实验结果中,不同探针平铺密度的Panel 1T1B (正义链及反义链名为1×平铺)及Panel 2T2B(正义链及反义链各为2×高密度设计)有着近似的测序指标,因此在进一步实验验证中采用“Panel 1T1B”探针设计策略。
在实验中,人基因组DNA的起始量统一为50ng,并使用相同的完全甲基化和完全非甲基化的DNA标准品组合,制备以低甲基化水平为主的五个甲基化水平的模拟样本(0%、5%、10%、50%、90%)。样本制备过程中,使用Covaris M220将不同甲基化水平(均为50ng)的DNA样本打断至320bp,经过重亚硫酸氢盐处理(Zymo EZ DNA Methylation-Gold Kit),文库制备使用IDT xGen Methyl-Seq 建库试剂盒(IDT Cat. No.10009824),按照该试剂盒说明书中“Appendix A: Protocol adjustments for targeted hybridization capture”部分所述,调整磁珠纯化比例及PCR循环数(13个循环),最终得到1.5~2ug文库产量。之后,每个文库取500ng用于杂交捕获(5-plex),并且按照说明书标准流程进行实验操作(65℃过夜杂交)。在NovaSeq平台采用PE150进行测序,测序数据均一化到单样本约1Gb数据量。
在数据分析方面,使用Fastp去除原始reads中的接头序列和低质量的碱基,并按照说明书建议使用cutadapt针对read 2的5'端去除15nt,以去掉Adaptase反应过程中加入的“tail”序列。使用Bsmap默认参数,将处理后的reads与人类基因组(hg19)进行比对,并使用Bsmap自带脚本计算甲基化水平。
六、IDT甲基化方案验证——结果
为了验证IDT甲基化测序方案的整体性能,针对所有测试样本的测序性能指标进行逐一评估,包括比对率(mapping rate)、覆盖均一性、甲基化水平等。
6.1文库质控结果
使用样本起始量均为50ng的基因组DNA标准品(物理打断前),经重亚硫酸氢盐处理后,使用IDT xGen Methyl-Seq 建库试剂盒进行文库构建,根据该试剂盒说明书"Appendix A: Protocol adjustments for targeted hybridization capture"部分中的建议,捕获前PCR循环数设置为13个循环,文库产量及浓度结果见表(使用Qubit进行DNA定量):
表. 捕获前文库浓度及产量结果
文库大小分布影响最终关键测序指标的评估,因此需保证有着不同甲基化水平的五个模拟文库有着近似的文库大小分布(309~328bp)。下图中,A-E分别对应甲基化水平为0%、5%、10%、50%、90%的五个杂交捕获前(Pre-hyb)文库大小分布结果,F则展示了在杂交捕获后的文库大小分布(5-plex)。如下图所示,在捕获前后文库(Post-Hyb)中均没有明显的非特异峰,与预期相符。
图. Pre-Hyb及Post-Hyb文库大小分布图
6.2 数据分析结果(比对率、目标甲基化水平、覆盖均一性)
比对率
比对率反映了样本的测序数据和参考基因组之间的相关性,可以衡量测序的整体准确性以及是否在实验中引入DNA污染,比对率越高则代表准确性越好。如下图所示,即便是理论上低甲基化水平的样本,基因组比对率也高于92%。
图. 不同甲基化水平文库比对率结果
不同样本不同位点的甲基化水平可能千差万别,为了评估甲基化杂交捕获方案是否可以正确体现不同的甲基化水平,对模拟不同甲基化水平的标准品文库予以进一步分析,实际检测到的甲基化水平符合预期。
覆盖均一性
覆盖均一性是靶向测序中最重要的性能参数之一,显示了测序数据针刚目标区域的覆盖度分布情况。其体现出有多少目标区域可以达到所需的分析要求,覆盖度越均一,意味着测序数据在目标区域上分配的更平均,从而节省了测序数据量。常用于评估覆盖均一性的指标包括: Fold-80,即为保证80%的目标碱基达到平均深度所需的额外测序倍数,计算公式为:Fold-80=平均深度/80%以上的目标区域覆盖深度。在相同的捕获效率下, Fold-80越低,则测序数据浪费越少。0.2×平均测序深度比例(0.2×mean coverage),即为高于0.2×平均测序深度的目标区域测序覆盖度占比。在相同的目标区域及测序数据量下,覆盖度越均匀,高于0.2×平均测序深度的比例越高越好。如下图所示,不同甲基化水平样本有着近似的Fold-80及高于0.2×平均测序深度的比例。
图. 不同甲基化水平文库Fold-80及0.2×平均测序深度比例图
对于覆盖困难区域,可以通过IGV软件可视化地查看及比较不同区域覆盖度情况,这对比较不同甲基化水平样本的表现尤为必要。下图展示了FAM135B基因的部分区域覆盖情况。FAM135B基因是头颈部鳞癌(HNSCC)的常用甲基化分子标记物,如图所示,在不同甲基化水平下(从上至下依次为:5%、50%、90%),多个样本在7条探针所覆盖区域中有着近似的覆盖深度。除此之外,在7条探针所对应的120bp目标序列窗口中,其包含的CpG位点数量众多,分别为12个、14个、14个、16个、21个、19个和12个,但即便在高CpG密度和高GC含量的情况下,依然获得了理想的覆盖均一度。
图. IGV软件显示位于FAM13B基因的7根探针,其所对应区域中有着近似的覆盖深度
七、总结
基于IDT xGen Methyl-Seq 建库试剂盒与IDT xGen 定制甲基化捕获panel, IDT提供了高性价比的精确靶向甲基化测序解决方案。靶向富集技术的引入,在提升目标区域测序深度的同时减少了测序成本,使得甲基化定向分析的效率大幅提高。在分享的两个实验案例中,使用了更具挑战性的小区域(~100kb)进行验证。分析结果证明,该实验方案能准确地检测目标区域的DNA甲基化水平,对于模拟不同甲基化水平的标准品样本,其测序数据的比对率、覆盖均一性等关键指标均展现出稳定且优异的性能。IDT甲基化靶向捕获方案覆盖了甲基化测序实验中关键的建库和捕获步骤,是表观遗传学研究和生物标志物发现的有力工具。
北京泽平代理的IDT NGS甲基化测序相关产品
产品类型 |
货号 |
产品名称 |
反应数 |
IDT xGen Methyl-Seq建库试剂盒 |
IDT建库试剂盒 |
10009860 |
IDT xGen Methyl-Seq Library Prep |
16 |
10009824 |
96 |
Unique Dual Indexing Primers Plates (UDI引物) |
10005975 |
IDT xGen UDl Primer Pairs, Index 1-16 |
16 |
10005922 |
IDT xGen UDl Primer Pairs, Index 1-96 |
96 |
10009816 |
IDT xGen UDl Primers Plate 2, 8nt |
96 |
10009795 |
IDT xGen Normalase UDl Primers Set 1 |
384 |
10009796 |
IDT xGen Normalase UDl Primers Plate 1 |
96 |
10009797 |
IDT xGen Normalase UDI Primers Plate 2 |
96 |
10009798 |
IDT xGen Normalase UDl Primers Plate 3 |
96 |
10009799 |
IDT xGen Normalase UDl Primers Plate 4 |
96 |
IDT xGen Custom Hyb Panels探针 |
IDT xGen定制化捕获探针 |
定制 |
IDT xGen Custom Hyb Panel |
16 |
IDT xGen Custom Hyb Panel-Accel |
96 |
IDT xGen Custom l lyb Panel-Production |
定制 |
IDT xGen Custom Hyb Panels配套试剂 |
IDT xGen通用封闭剂-TS混合物 |
1075474 |
IDT xGen Universal Blockers TS |
16 |
1075475 |
96 |
1075476 |
384 |
IDT xGen杂交和洗涤试剂盒 |
1080577 |
IDT xGen Hybridization and Wash Kit |
16 |
1080584 |
96 |
IDT通用型扩增引物 |
1077675 |
IDT xGen Library Amplification Primer Mix |
16 |
1077676 |
96 |
1077677 |
192 |
更多IDT NGS二代测序产品,欢迎点击右侧在线咨询
——IDT一级代理商,北京泽平