转录组测序 转录组广义上指某个物种或特定细胞在某一生理条件下产生的所有的RNA,包括mRNA、核糖体RNA、转运RNA及非编码RNA等,狭义上指所有mRNA的集合。转录组是研究细胞表型和功能的重要手段。与基因组不同的是,转录组的定义中包含了时间和空间的限定。同一细胞在不同的生长时期及生长环境下,其基因表达情况是不完全相同的。转录组测序是指利用第二代高通量测序技术进行cDNA测序,全面快速地获取某一物种特定器官或组织在某一状态下的几乎所有转录本。相对于传统的基因芯片技术而言,转录组测序无需预先设计探针,即可对任意物种的任意细胞类型的转录组进行检测;能够提供更精确的数字化信号,更高的检测通量以及更广泛的检测范围,是目前深入研究转录组复杂性的强大工具,目前已广泛应用于各物种的基础研究、临床诊断和药物研发等领域。 建库测序流程 进行转录组测序,提取样品总RNA并使用DNase消化DNA后,用带有Oligo(dT)的磁珠富集真核生物mRNA(若为原核生物,则通过试剂盒去除rRNA来富集mRNA);加入打断试剂将 mRNA打断成短片段,以打断后的mRNA为模板,用六碱基随机引物合成一链cDNA,然后配制二链成反应体系合成二链cDNA,并使用试剂盒纯化双链cDNA;纯化的双链cDNA再进行末端修复、加A尾并连接测序接头,然后进行片段大小选择,最后进行PCR扩增;构建好的文库用Agilent 2100 Bioanalyzer质检合格后,使用Illumina HiSeqTM 2500或 Illumina HiSeq X Ten等测序仪进行测序,产生125bp或150bp的的双端数据。质检合格后,使用Illumina测序仪进行测序。 建库测序流程图如下: 生物信息分析流程 样品要求 真核 RNA样品总量: ≥1.5μg 样品纯度:OD260/280=1.80-2.00,RIN≥7.0 28S/18S≥1.0 原核 RNA样品总量: ≥1.5μg 样品纯度:OD260/280=1.80-2.00,RIN≥7.0 23S/16S≥1.0 常见问题 1. 转录组测序是否可以同时检测mRNA、miRNA及其他非编码RNA? Q20:原始数据中Phred数值大于20的碱基数量占总碱基数量的百分比。 Q30:原始数据中Phred数值大于30的碱基数量占总碱基数量的百分比。 4. 原核生物与真核生物在进行转录组测序文库构建时有什么区别? 在原核生物中,mRNA 只占全部 RNA 的 1-5%,其余绝大部分是核糖体 RNA(rRNA),因此若要测序 mRNA,首先需要先将 mRNA 纯化出来。然而,原核生物并不像真核生物 mRNA 具有 polyA 的结构,因此,无法直接利用 oligo(dT) 将 5. 关于转录组 De novo 分析,采用什么软件进行拼接,使用的参数是什么?mRNA 纯化出来。如果拿 total RNA 进行测序,那么测序的效率会比较差,因为大部分的序列都来自 rRNA。目前,提高原核生物中 mRNA 的量,较为主要的方式是去除 total RNA 中 rRNA。 De novo 拼接是指在不依赖参考基因组的情况下,将有 overlap 的 reads 连接成一个更长的序列,经过不断的延伸,拼接成 transcript。我们使用 Trinity (version:trinityrnaseq_r20131110_ 软件 paired-end 的拼接方法,对样本的有效 reads 合并进行 de novo 拼接,取每个 Loci (comp*_c*_) 下较长的转录本作为 Unigene,以此作为后续分析的参考序列。参数为 6. Raw data 如何读取?为什么不提供原始图像数据和中间过程文件?:Trinity.pl --seqTypefq --min_contig_length 200 --JM 400G --left $R1 --right $R2 --SS_lib_type RF --output trinity_out_dir --CPU 80。 测序数据文件以 txt 文本格式为主。对于 Windows 用户,推荐使用 Editplus 或 UltraEdit 作为浏览程序,否则会因文件过大造成死机。Unix 或 Linux 系统比较适于浏览较大的文本文件。由于 Illumina 更新了 pipeline,测序过程中生成的图像文件将实时转化为中间过程文件,这一步完成后图像文件将被自动删除,获取中间过程文件(此文件为二进制文件,只有在 Illumina 机器上才能读取,通常不保留),在 Illumina 分析软件下将其转化为序列文件,即所说的 raw data 。目前各公共数据库接受 fastq 文件,所以我们提供的 raw data 都是 fastq 文件。 1 动物组织样本 快速从活体中获取目的组织后,用预冷的 1×PBS 或生理盐水清洗去除血渍和污物,吸干表面液体,并快速将样品分割成 50~100mg 左右的小块液氮速冻(除了保证 RNA 质量外,还要杜绝因环境的改变而导致的表达调控的变化),放入液氮预冷的 RNase-free 的带螺纹旋盖的冻存管中,-80℃低温保存、干冰运输。组织样品离开活体后,建议在 3min 内进行液氮速冻,速冻前操作时间越长,RNA 降解的可能性越大。 如果使用 RNAlater®一类商业组织 RNA 保护试剂保存组织样品,请严格按照相应产品使用说明进行操作。尽量使组织块尺寸保持在 5mm 左右,过小或过大都不利于后续实验操作。 如果使用 TRIzol 裂解液保存送样,请务必先进行液氮研磨破碎,然后加入 TRIzol 中彻底研磨,小于 100mg 组织可加入 1mL TRIzol 裂解。组织样品切勿过量,常温裂解 5min 后,-80℃低温保存,干冰运输。 2 细胞样本 2.1 贴壁细胞 首先去除细胞培养上液,然后用 1×PBS 漂洗 1~2 次,彻底去除 PBS 溶液;用足量的 TRIzol 对细胞进行裂解(一般 10cm2的培养皿均匀铺满细胞需要 1mL TRIzol),裂解过程中用移液器轻轻反复吹吸,如发现裂解液有明显粘丝现象,表示裂解不是很充分,可以适当增加裂解液的用量,最终应为裂解液澄清,没有细胞碎片团块。然后将细胞裂解液转移到 1.5mL 的 EP 管中,室温静置继续裂解 5min 后,转移至-80℃冰箱长期保存。参考用量为每 5×106个细胞加 1mL TRIzol。备注:贴壁细胞切勿使用胰酶消化后收集,以防样本出现降解。 2.2 悬浮细胞 离心收集细胞,然后用 1×PBS 漂洗 1~2 次,彻底去除 PBS 溶液。注意细胞离心收集速度要适度,一般样本 3,000rpm 离心 5min 即可。不要使细胞离心过实而造成裂解液不能充分渗透,转数过高还会导致细胞破裂,RNA 降解。再用充足量 TRIzol 对细胞进行裂解(方法同 2.3.1 贴壁细胞处理)。裂解在 TRIzol 中的样品,短期保存于-20℃冰箱中(1 周内),如长期保存可转移至-80℃冰箱。参考用量为每 1×106个细胞加 1mL TRIzol。也可离心收集细胞后直接液氮速冻后,转移至-80℃低温长期保存,干冰运输。 2.3 血液样本 用于提取Total RNA的血液,强烈建议使用血液保护剂送样或分离白细胞后送样。常规的EDTA抗凝管收集的全血不太适合用于RNA的研究。推荐使用 BD PAXgene blood tube 保存。PAXgene®血液RNA管内含稳定体内基因转录性状的添加剂,它是通过减少体外RNA降解并将基因诱导减少到最小而发挥作用的。操作流程如下: 2.3.1 PAXgene 血液采集 PAXgene 系统提供标准化的 BD Vacutainer(真空采血管,室温保存),配合使用一次性消毒采血针作静脉穿刺,采血管内的负压会迫使血液自动吸入管中,当搜集的血液达到 2.5 毫升刻度线时停止采血。采血管中本身已经预装了 6.9 毫升的 RNA 稳定试剂,拔出针头后只要将采血管轻轻颠倒 8-10 次将二者混匀即可。如图 1 所示: 图 1 PAXgene 采血示意图 将 PAXgene®血液 RNA 管竖直置于室温(18°C 到 25°C)下平衡,最短 2 小时,最长 72 小时,之后转移至 4°C 过夜,最后置于-80°C 保存,干冰运输。 2.3.2 哺乳动物白细胞的分离方法 使用 EDTA 抗凝管收集的全血样本应立即加入 3 倍体积红细胞裂解液,室温放置 5min,期间颠倒混匀数次。1,500g,离心 5min,弃上清。再加入 1mL 红细胞裂解液重悬沉淀,1,500g,离心 5min,TRIzol 裂解(一般起始量 2mL 全血的沉淀,加 1mL TRIzol)。用移液器反复吹打至看不到细胞团块,溶液呈澄清而不粘稠的状态。放入-80℃冰箱中长期保存,干冰运输。 2.4 血浆样本 取出血液样本,1,600g,4℃离心 10min。离心后血液分为三层,上层的是血浆,中间的是白细胞层,下层的是红细胞层,用移液器吸取血浆至冻存管中。在分离血浆时取至白细胞层以上 3-4mm 处为宜。血浆中含有游离核酸,为去除残余细胞中核酸对游离核酸的干扰,应将血浆进行二次离心。将血浆在 4℃条件下以 16,000g 离心 10 分钟。血浆根据后续的实验要求进行分装,每管样本量为单次实验所需的量为宜,如 300-500μL/管。-80℃冰箱保存,干冰运输。 注意事项: a) 推荐 EDTA 抗凝处理,尽量避免肝素抗凝血,已有研究报道认为高浓度肝素对后续酶学反应有抑制作用,可能会造成检测失败。 b)分离血浆的过程尽量在冰上操作,以维持血细胞的完整性。 c)整个分离操作应在 4 小时内完成。 2.5 血清样本 血清,指血液凝固后,在血浆中除去纤维蛋白原分离出的淡黄色透明液体或指纤维蛋原白已被除去的血浆。为使血液完全凝固,将收集管室温(15-25℃)静置 10min 至 1h。若收集管中有促凝血剂,则凝血时间为 10min。若未加促凝血剂,凝血时间至少为 30min。1,600g,4℃离心10min。小心转移上层血清层至新的离心管。16,000g,4℃离心 10min。小心转移澄清的上清液,冻存于-80℃冰箱备用,干冰运输。 2.6 石蜡包埋样本 至少提供 10 片以上 10μm 厚度的切片或者提供包埋的蜡块。切取石蜡时,如果标本暴露空气中,弃去最初的 2-3 片,切片完成后尽量选取切片中组织含量高的部分,如果石蜡过多可切去石蜡部分。如果需要再从切片上剥离特定区域的组织(如肿瘤),除了提供白片之外,还需要提供 HE 染色的片子,并在 HE 片子上圈出特定区域。 2.7 RNA 客户需提供 NanoDrop®、 Qubit® 或 Agilent 2100® 的样本分析结果:请仔细纯化样品,尽量避免多糖、蛋白质和外切酶的残留,样本必需注明溶剂成分。 一、样本准备应该遵循的基本原则代表性原则取样的代表性关系到实验结果是否具有科学意义,因此您应该根据实验目的慎重选择... 转录组标准版模块1、原始数据处理模块:原始数据质控原始数据统计SE数据质量剪切PE数据质量剪切 原始数据比对转... 软件特色权威度高功能全面分析模块均源于公开发表的文献中分析内容一网打尽简单易上手快速、高效零基础、无需命令行和编程... 做RNA-Seq的**步是提取RNA并质检,每当公司将RNA的质检报告交给你的时候,你是不是从来都是略过过程只看结... 1、界面简洁,轻松实现转录组数据管理,再多的转录组项目和样本也能轻松搞定!2、支持有参转录组分析、扩展支持无参转录... 数据文件配置说明安装数据文件,配置说明!1、下载database.zip文件,本地下载 百度网盘压缩包的目录结构为... 软件界面说明!软件界面的上方是菜单栏和工具栏,集合了一些常用的功能,如新建项目、保存项目、复制、粘贴、数据导入、数... Frequently Asked Question如何在项目编辑窗口中修改文件格式?1、在项目编辑窗口中,在文件名... 韦恩图,又称为venn图,是我们在日常数据处理过程中经常用到的一种图。图虽小,但实用性却非常高!做转录组项目,最重要的就是看每个基因的表达量,根据表达量差异找出差异基因,从而研究差异基因的功能。而在作图之前最重要的就是按照特定条件找出差异基因,此方面我们分为三类来介绍如何按需筛选差异基因:1.共有差异基因;2.共有上调基因或共有下调基因;3.一组上调,另一组下调基因。在转录组项目提供的结果中... 下面,咱们就来看看用EXCEL的函数,简单快捷的实现,将多个表格里面,相同的基因ID对应的信息整理在一起。1首先通过差异倍数或者GO和KEGG的富集分析结果,挑选出一些目的基因,示例如下:2添加表达量信息,打开expression表格,总表中是所有基因的reads count和FPKM,我们将FPKM添加到目的基因表格中:3在1中的表格的B列,输入=VLOOKUP(可以将不同表格对应起来的值... 长链非编码RNA(long non-coding RNA,lncRNA)是一类RNA分子,其长度超过200个核苷酸,不具有编码蛋白质的能力。在过去的几十年中,随着RNA生物学的深入研究,LncRNA作为一个新兴领域引起了广泛的关注。LncRNA的各种功能及其许多亚型以及与其他基因的相互作用关系使得LncRNA的分类和注释极为困难;LncRNA可以与染色质修饰复合物结合,进而调控与发育表达相关... QC主要是统计的测序数据量以及测序质量,会统计下机数据量、clean后的数据量以及碱基质量,一般mRNA转录组测序数据量在6G(人或小鼠,其它物种需要根据参考基因组大小计算)以上即可,即下表Raw bases在6G以上,Q20和Q30是碱基正确率,比例越大越好。QC还进行了可视化展示,A图展示碱基正确率,分布在绿色区域内表示正确率较高;B图展示read长度,我们测序方式为双端150bp测序,... |