Hi-C-数据分析-入门


经典文章

3C

​ 1.Dekker, J., Rippe, K., Dekker, M. & Kleckner, N. Capturing Chromosome Conformation. Science 295, 1306–1311 (2002).

3C技术可以检测基因组1个位点A对另一个位点B是否在空间上靠近

image-20211026152219376

image-20211026152427517

Primer5-6咋p的?

4C

​ 2.Simonis, M. et al. Nuclear organization of active and inactive chromatin domains uncovered by chromosome conformation capture–on-chip (4C). Nat Genet 38, 1348–1354 (2006).

4C技术可以检测基因组1个位点A对全基因组所有位置的相互作用

image-20211026153657971

5C

​ 3.Dostie, J. et al. Chromosome Conformation Capture Carbon Copy (5C): A massively parallel solution for mapping interactions between genomic elements. Genome Res 16, 1299–1309 (2006).

5C技术可以检测基因组若干个位点对若干个位置的相互作用(已经被淘汰)

Hi-C

​ 4.Lieberman-Aiden, E. et al. Comprehensive Mapping of Long-Range Interactions Reveals Folding Principles of the Human Genome. Science 326, 289–293 (2009).

image-20211026155750729

Hi-C技术可以检测基因组所有位点对所有位点的相互作用

image-20211026155715829

Hi-C的结果一般使用热图的形式来展示

​ 5.Rao, S. S. P. et al. A 3D Map of the Human Genome at Kilobase Resolution Reveals Principles of Chromatin Looping. Cell 159, 1665–1680 (2014).

image-20211026155406521

现在常用改进后的Hi-C技术,2014年这篇Cell的。

raw matrix

image-20211026160625711

  1. 热图是对称的;
  2. 热图有若干个分区,每个分区有或强或弱的分界线。

Cis interaction

image-20211026160341244

一对reads mapping到了同一染色体的不同位置,这种关系叫cis interaction

Trans interaction

image-20211026171521981

image-20211026171709551

image-20211026173257853

什么是compartment?

image-20211026162144953

image-20211026163711275

  • coverage:指每一个纵列的reads数的和
  • genes:基因密度,每一个小格子里的基因数量
  • H3K27^me3^:三号组蛋白第27位的赖氨酸3甲基化的信号强度
  • H3K36^me3^:三号组蛋白第36位的赖氨酸3甲基化的信号强度
  • DNAsel:DNA敏感性信号强度
  • Eigenvector:第一主成分的正负值,PC1正值对应A-compartment,PC1负值对应B-compartment,A代表active,B代表repressive

==基因密度越高、H3K27^me3^越高、H3K36^me3^越高、DNA敏感性信号越高==代表对应的染色体结构越松散、转录越活跃;反之就越不活跃。

所以通过Hi-C可以把基因组分为活跃的部分和不活跃的部分!

什么是TAD?

Topological Associated Domains = TAD (300kb~1M)

​ 6.Dixon, J. R. et al. Topological Domains in Mammalian Genomes Identified by Analysis of Chromatin Interactions. Nature 485, 376–380 (2012).

image-20211026170045356

TAD边界有抑制信号,内部含有gene

TAD内部和TAD边界的ChIP信号不同

  • TAD boundary上CTCF信号很强(CTCF能够帮助DNA缠绕折叠,分布非常广泛,CTCF与cohesion配合作用)
  • H3K4^me3^这种抑制信号比较强
  • TAD内部gene比较多

reas水平的过滤

fragment水平的过滤

matrix的矫正方法

The application of Hi-C

image-20211027144810246

  • 3D-Genome(Mb)
  • A/B compartment(1Mb)
  • TAD(100Kb)

image-20211027145426849

image-20211027145840615

image-20211027150137049

image-20211027150454836

Hi-C数据分析部分

image-20211027151100328

reads level filter

  • remove unmappable reads
  • remove redundant molecules
    • PCR biases
  • remove as mapping results
    • self ligation
    • dangling ends
  • remove special adjacent mapping
    • pseudo pull down

image-20211027152610166