|
2009年,Job Dekker 研究团队利用Hi-C技术分析人类正常淋巴母细胞染色体中基因座空间交互信息,首次提出Hi-C技术的概念。 Hi-C技术是染色体构象捕获(Chromosome conformationcapture,简称为3C)的一种衍生技术,是指基于高通量进行染色体构象的捕获,它能够在全基因组范围内捕捉不同基因座位之间的空间交互,研究三维空间中调控基因的DNA元件。 动物群体细胞Hi-C测序:Hi-C技术源于染色体构象捕获(Chromosome Conformation Capture—3C)技术,以整个细胞核为研究对象,利用高通量测序技术,结合生物信息学方法,研究全基因组范围内整个染色质DNA在空间位置上的关系;通过对染色质内全部DNA相互作用模式进行捕获,获得高分辨率的染色质三维结构信息,并与ChIP-seq、转录组数据联合分析,从基因调控网络和表观遗传网络来阐述生物体性状形成的相关机制。 植物群体细胞Hi-C测序:植物Hi-C技术以整个细胞核为研究对象,利用高通量测序技术,结合生物信息分析方法,研究全基因组范围内整个染色质DNA在空间位置上的关系;通过对染色质内全部DNA相互作用模式进行捕获,获得高分辨率的染色质三维结构信息。云生物Hi-C研发团队采用独特的细胞破壁及甲醛固定技术,成功降低文章中的自环比例、提高了有效数据比例。 Hi-C辅助基因组组装:Hi-C技术源于染色体构象捕获技术,利用高通量测序技术,结合生物信息分析方法,研究全基因组范围内整个染色质DNA在空间位置上的关系,获得高分辨率的染色质三维结构信息。基于Hi-C数据中染色质片段间的交互强度呈现出随距离衰减的规律,Hi-C可以用于基因组组装,将杂乱的基因序列组装到染色体水平。 捕获Hi-C测序:捕获Hi-C技术源于染色体构象捕获(Chromosome Conformation Capture—3C)技术,将Hi-C技术与杂交捕获技术相结合,用更小的数据量获取更高分辨率的染色质三维结构信息,并可以与ChIP-seq、转录组数据联合分析,从基因调控网络和表观遗传网络来阐述生物体性状形成的相关机制。 参考文献: 1.Giorgetti L, Lajoie B R, Carter A C, et al. Structural organization of the inactive X chromosome in the mouse[J]. Nature, 2016. 2.Wang C, Liu C, Roqueiro D, et al. Genome-wide analysis of local chromatin packing in Arabidopsis thaliana[J]. Genome Research, 2014, 25(2): 487-93. 3.Xie T, Zheng J F, Liu S, et al. De Novo Plant Genome Assembly Based on Chromatin Interactions: A Case Study of Arabidopsis thaliana[J]. Molecular Plant, 2015, 408(3): 489-492. 4.Jäger R, Migliorini G, Henrion M, et al. Capture Hi-C identifies the chromatin interactome of colorectal cancer risk loci[J]. Nature Communications, 2015, 6. 1. 用甲醛对细胞进行固定,使DNA与蛋白,蛋白与蛋白之间进行交联 2. 进行酶切(如Hind III等限制性内切酶),使交联两侧产生粘性末端 3. 末端修复,引入生物素标记,连接 4. 解交联,使DNA和蛋白、蛋白和蛋白分开,提取DNA,打断,捕获带有生物素标记片段,进行建库 5. 测序 Hi-C实验流程 项目周期 1、动物群体细胞Hi-C测序
2、植物群体细胞Hi-C测序
3、Hi-C辅助基因组组装
4、捕获Hi-C测序
动物群体细胞Hi-C测序样本要求
植物群体细胞Hi-C测序样本要求
Hi-C辅助基因组组装样本要求
捕获Hi-C测序样本要求
1 项目信息 1.1 背景介绍 1.2 实验流程 实验流程图 1.3 信息分析流程 信息分析流程图 1.4 样本信息 2 数据过滤 2.1 原始数据 2.2 数据过滤 2.3 测序数据质量分布 测序质量分布图 2.4 测序数据碱基分布 样品碱基分布图 3 比对分析 3.1 比对到基因组 PE Reads比对 3.2 NT库比对 4 分配到酶切片段 4.1 分子类型统计 4.2 酶切片段覆盖度 4.3 酶切片段深度分布 酶切片段覆盖深度分布图 5 顺反分析 5.1 顺反相互作用比例 顺反式交互比例分布图 5.2 顺反相互作用频率 相互作用强度随距离衰减图 6 染色体相互作用 6.1 染色体间相互作用 染色体相互作用的三维图 标准化之前的相互作用的热图 标准化之后的相互作用的热图 反式相互作用的片段的Circle图 6.2 全基因组交互热图 染色体不同区域相互作用的强弱 6.3 染色体内的相互作用 染色体内相互作用的热图 7 结构分析 7.1 Compartments Iced + Observed/Expected标准化热图 相关性热图 **第二特征向量分类 8 附录 8.1 参考文献 8.2 使用软件列表 1、Hi-C 需不需要做重复? 理论上是需要做 3 个重复的,但是从成本角度考虑,暂时 Hi-C 可以做两个技术重复,即如果一个样本理论上需要测 180G 数据量,那我们建两个文库,每个文库测 90G,分析数据相关性比较高后将两个文库的数据进行整合。 2、样品交联后检测出现降解、DNA 蛋白复合物少怎么办? 1) 植物或者动物组织尽量剪碎,保证充分交联。 2)要注意交联反应温度(25度左右)和时间,甲醛处理时间过长,未及时中和容易导致样本降解。 3)同时要保证样本新鲜。 3、bin size 的真正含义是什么? 在所设定的 binsize 下,80%—90%以上的 bin 对有 reads 支持(80%—90%bin 与 bin 之间有互作),则认为此分辨率是可以达到的。市场上偷换概念者大有人在,把 bin size 设得特别小,但是很多 bin 都是空的,即和其他 bin 没有互作,可能也就 50% 甚至更低的 bin 之间有互作,达不到承诺的分辨率。 4、Hi-C在辅助基因组组装时有什么作用? 1)Hi-C最主要的作用是将零散的基因组序列锚定到染色体上(这一点类似遗传图谱); 2)还可以对组装的基因组进行纠错处理; 3)在某种程度上进一步提升Contig N50. 5、Hi-C技术与遗传图谱的差异? 1)Hi-C应用单个个体就可以完成染色体构建; 2)Hi-C挂载染色体效率高达90%以上; 3)但Hi-C技术不能进行QTL定位。 |