(1) 应用范围 ①De Novo测序。 (2) 临床应用 ①应用于医学测序、健康管理和基因潜力开发的精准检测 Sanger测序已应用于肿瘤诊断、病情监测、预后和治疗等临床实践中。比如对BRCA基因或APC基因的检测分析,可用于早期发现乳腺癌或结肠癌的易感人群,从而对这些人群采取必要的干预措施。Sanger 测序还可以对肿瘤靶向治疗药物相关基因的突变位点进行检测,例如在非小细胞肺癌的治疗中,靶向药吉非替尼/厄洛替尼用药前必须要检测EGFR基因的状态,可以针对EGFR基因突变热点所在的第18,19,20,21外显子设计特异性扩增和测序引物进行直接测序。 ②为二代测序和芯片测序验证 Sanger 测序是 NGS 基因检测筛选单基因遗传病家系致病基因后进行家系内和正常对照组验证的主要手段。值得注意的是,Sanger 测序目的是寻找与疾病有关的特定基因突变。对于没有明确候选基因或候选基因数量较多的大样本病例筛查是难以完成的,此类测序研究还是要依靠具有高通量测序能力的 NGS。 这类技术是在sanger测序技术基础上发展起来的一个技术,所用仪器与sanger测序所用仪器一样,检测原理也一样。亲子鉴定可以通过对DNA遗传片段的检测,判定父母与子女之间的亲缘关系,而法医鉴定可以通过DNA测序提供死者或者嫌疑人的遗传信息。 ①菌样 ②质粒(除特殊样品,我们一般不建议客户提供质粒) ③PCR已纯化 ④PCR未纯化 5全血 •全血至少需要1ml 测序用引物要求非常严格,不同于PCR用引物。PCR用引物一般只要能和模板结合,3’端的几个碱基能完全配对,即使引物长达80~100多个碱基,只要调整PCR反应条件,也能成功进行PCR反应。而测序用引物便不一样了,必须严格符合以下要求。本公司的测序用引物用引物设计软件Primer及primer5设计。在本公司测序时,我们可免费帮助设计测序用引物。 (1)长度在15~25个碱基左右,一般选择20个碱基(根据GC含量作适当调整), (2)3’端尽量选择G或C碱基(但不绝对),以增加与模板的结合能力。 (3)Tm温度应选择50℃~70℃之间。 (4)GC含量应选择在50%左右,尽量避开A、T、G、C的连续结构。 (5)避开引物自身形成发夹结构或引物二聚体结构等复杂结构。 (6)保证引物和模板100%匹配,特别是3’端的几个碱基一定要100%匹配。同时必须严格保证引物和模板之间只能有一个结合位点。 自备引物要求 1、一代测序结果 测序公司发送的测序结果一般有一个峰图文件和一个序列文件,峰图文件为ABI格式,用chromas软件(网上可下载)打开。峰图用四种颜色的波形代表四种碱基的信号强度;正常的峰图,波峰与波谷清晰,峰与峰之间的距离均匀;比较理想的测序结果在底部应该没有杂峰干扰; 2、起始序列说明 1)测序结果的前几十bp不能用(下图中黄色区域标出的区域),在拼接序列或序列比对时需要先去除这部分不太可靠的数据,以免影响分析结果; 2)在使用PCR引物测序时由于PCR引物上的碱基是不带染料的,所以检测不到信号,在测序结果中也找不到引物的序列。如连接到载体上,使用载体上的通用引物测序则可以找到PCR引物; 3、有效读长 测序公司给出的峰图在1000~1200bp之间,但超过800bp后的各种波之间有重叠,波峰有钝化现象,碱基与碱基间的距离有时突然加大(此图中的812bp~813bp),这些现象都会影响结果的准确性,所以只能做为参考.所以说有效片段为800bp左右. 4、SNP位点 SNP位点为纯合时成单峰,若主杂合子时,会形成套峰现象;测序公司给的结果序列文件通常只读主峰——即序列文件不会报告SNP杂合,需要自己打开峰图文件判读。 1.测序结果不到800Bases是什么原因? (1)G/C rich、G/C Cluster。 这种情况一般表现为测序信号突然减弱或消失(图1,图2) 如在DNA样品中的DNA序列分布匀称,没有复杂结构时,正常的测序反应能保证达到800Bases以上。但有一些DNA样品立体结构复杂,造成聚合酶延伸反应终止,测序信号突然减弱或消失,或者测序结果出现套峰现象,出现这些现象的原因由DNA模板本身所造成。 图1 GC引起的信号减弱 图2 G/C rich引起的信号消失 (2)A、T的Poly结构 这种情况一般表现为A、T连续结构后面的测序结果出现套峰。根据文献记载。原因在于聚合酶进行聚合反应时,由于A或T的连续,聚合酶难以识别完整的每个A或T,在某个A或T的后面便开始进行A或T连续结构以后序列的聚合反应(打滑现象),造成测序结果紊乱,出现套峰。一般在多少个A或T的后面能出现这种情况呢?现在还没有这方面的报道。根据我们的经验,这一情况的出现和A或T的连续结构后面的序列的排列情况有着直接的关系。有时10多个A或T的连续结构后面便出现套峰,但有时60~70个A或T的连续结构后面的序列也一样可以完整地读出来。具体情况还有待考证。一般来说,PCR片段直接测序时,A或T的连续结构后面的序列测序结果都会出现套峰。原因在于测序时经历了PCR反应及测序反应(测序反应本身也是PCR反应)二次聚合酶的打滑现象。 图3 polyA引起的套峰
(3)原因不明的复杂结构,测序结果出现突然信号减弱或消失 从序列上看,DNA碱基排列并无特别异常。估计是DNA整体出现复杂结构,从某一位置开始聚合酶的聚合反应便无法进行。
图4 复杂结构引起的信号中断 2.出现套峰是什么原因? 在测序反应中,模板或引物的原因都可能造成套峰的形成,归结其形成原因有以下几点: (1)测序引物在模板上有两个结合位点(图5);
图5 双引物结合位点引起的套峰 图6 由于质粒或菌液为非单克隆引起的套峰 图7 PCR为非特异性条带引起的套峰 图8 模板特殊结构引起的套峰 图9 引物轻微降解或引物不纯引起的套峰
解决方案汇总 1.样品测序无信号 可能是引物结合位点不存在或被破坏;建议更换引物测序或重新提供样品测序。 2.样品测序信号差 可能是引物或模板的质量不高或是引物和模板的匹配性不好引起的,也可能是样品浓度偏低;建议提供高质量样品测序。 3.样品测序衰减 可能是由于特殊结构如Poly结构、重复序列、回文结构、发卡结构、GCrich、AT富集等导致的测序衰减,由于是样品本身结构问题无法优化建议反向测序进行拼接以得到完整序列,还有一种衰减的情况就是在一段正常峰型后逐渐衰减,可能是模板量反应量不足导致,建议制备高浓度模板测序。 4.样品测序套峰 套峰细分的话有如下几种情形: ①全双峰:多引物结合位点(针对菌液、质粒样品),非特异性扩增(针对PCR产物); ②前双峰:多引物结合位点,其中一套模板测序中断(针对菌液、质粒样品),多引物结合位点(PCR未纯化样品),引物二聚体或小片段干扰(针对PCR已纯化样品); ③中间双峰:非单克隆(针对质粒、菌液样品),碱基缺失或等位基因双模板(针对PCR未纯化样品); ④后双峰:非单克隆(针对菌液、质粒样品),碱基缺失(针对PCR样品); 针对二聚体及小片段干扰的情况建议电泳切胶回收纯化;针对多引物结合位点的情况建议更换引物测序或反方向测通样品;针对碱基缺失建议克隆测序;针对非单克隆建议在克隆无误的前提下重新挑取单克隆测序;针对非特异性扩增建议优化反应条件重新制备样品测序;针对等位基因双模板建议克隆测序。 5.样品测序中断 可能样品存在特殊高级结构,导致dNTP和ddNTP在某一碱基位点后无法与模板结合,测序酶无法继续延伸,建议使用反向引物进行测序经拼接后可以得到完整序列;或酶切后亚克隆测序。 6.样品测序移码 测序从开端发生移码可能是引物发生降解,建议重新提供引物;测序局部出现移码,可能样品存在特殊高级结构,建议反向测通。 7.样品测序底峰干扰 可能测序引物不纯,建议将引物进行PAGE胶纯化后在进行测序或重新提供引物测序;可能测序样品不纯,混有正、反向引物,建议重新制备样品测序。 |