Cell丨转录组学图谱揭示lncRNA与人类疾病的关联

BioArt 2021-05-05 09:38

撰文 | 啾啾椰

责编 | 兮


人类基因组中,只有1.5%是编码基因【1】。其余占据人类基因组98.5%的非编码序列,像“大海”一样包围着零星的编码序列小岛。长链非编码RNA(long noncoding RNA, lncRNA)是非编码基因的转录产物,长度通常在200nt以上。lncRNA在细胞中的丰度远低于mRNA,通常不表达蛋白产物,在基因调控中具有重要作用。根据RNA-seq数据库与已发表的文献总结,人类细胞中共有270,044个lncRNA转录本【2】。但除了一小部分lncRNA与人类疾病的关系已知(如癌症中的HOTAIR【3】,阿尔茨海默氏病中的BACE1-AS【4】,前列腺癌中的PRNCR1和PCGEM1【5】之外,大多数lncRNA与人类疾病的关系仍然有待研究。


2021年4月16日,来自斯坦福大学Stephen B. Montgomery的研究团队在Cell上发表了题为Population-scale tissue transcriptomics maps long non-coding RNAs to complex disease的论文。文章探究了lncRNA与人类疾病的关系。研究者使用了来自基因型-组织表达 (Genotype Tissue Expression,GTEx) 项目v8的数据,分析了来自49种组织中14,100个lncRNA基因的表达,遗传调控和细胞环境,确定了1,432个lncRNA基因-性状关联,揭示了lncRNA与人类疾病之间的联系。



首先,研究人员通过比较不同组织中的lncRNA基因,研究了lncRNA基因表达的组织特异性【6,7】,检测出了316种只在一种组织中表达的lncRNA,并发现组织特异性lncRNA最常在睾丸,大脑,血液和皮肤组织中表达。为了探究基因变异对lncRNA表达的影响,研究人员通过数量性状表达位点(expression quantitative trait locus,eQTL分析基因突变与lncRNA基因表达量之间的相关性。在所研究的14,100个lncRNA基因中,有67.3%的lncRNA基因表达与至少一种遗传变异有关。比起蛋白质编码基因,lncRNA基因与其相关变异基因的转录起始位点(TSS)之间的距离更短,数量性状表达位点的效应量(effect size)要更大,这表明lncRNA表达的调控靶点少,调控方式更简单。


为了了解lncRNA基因的细胞环境,研究人员在不同组织中进行了加权基因共表达网络分析(Weighted gene co-expression network analysis,WGCNA,将相互关联的基因归类为一个基因共表达模块,然后可以提取出与某一特征(如细胞种类或细胞组分)相关的模块【8】。这种方法将lncRNA归类到了各个模块中,揭示了lncRNA所处的细胞环境。他们发现,没有组织特异性的lncRNA常常富集在线粒体与核糖体中,而具有组织特异性的lncRNA与精细胞密切相关。


由于罕见的遗传变异会带来疾病风险【9】,研究者通过异常值富集方法(outlier enrichment approach)来寻找lncRNA基因表达与罕见遗传变异之间的关系。他们发现受测个体中55%的基因间(intergenic)lncRNA异常事件与附近的罕见变异有关,这表明与lncRNA基因表达相关的罕见变异会影响常见的复杂性状,将lncRNA与疾病性状联系了起来。


为了进一步揭示lncRNA基因和疾病的相关性,他们通过数量性状表达位点与全基因组关联(Genome-wide association study,GWAS)共定位分析,发掘出了lncRNA基因在各种性状中的作用。这里的“共定位”指某功能与GWAS基因座之间的紧密联系。有1,432个重要的性状与GWAS基因座被共定位在了一起,这表明这些lncRNA基因与人类疾病有关。


作为lncRNA介导的疾病示例,他们重点介绍了lncRNA基因LINC01475(ENSG00000257582)和RP11-129J12.1(ENSG00000228778)与溃疡性结肠炎之间的共定位。这两个基因在相反的DNA链上重叠,位于蛋白质编码基因NKX2-3的上游(图1)。这两个 lncRNA基因共定位的组织(包括肠道组织、脾脏和小唾液腺)与溃疡性结肠炎有关。在克罗恩氏病的全基因组关联分析中也观察到了与这两种lncRNA的共定位,表明这两种与溃疡性结肠炎和克罗恩氏病有关。


图1. lncRNA基因和附近的蛋白质编码基因NKX2-3的位置。


该研究通过基因型-组织表达项目(GTEx)以及多种分析资源如数量性状表达位点(eQTL),加权基因共表达网络分析(WGCNA)和全基因组关联(GWAS)共定位分析,评估了lncRNA基因的调控模式,揭示了lncRNA在特定细胞环境中与各种复杂性状和疾病的联系。研究中确定了1,432个lncRNA基因-性状关联,其中有800个与被邻近蛋白质编码基因无关。有许多lncRNA与疾病的关系被揭示出来,包括lncRNA与肠炎,1型和 2型糖尿病以及冠状动脉疾病之间的关联。这让人们进一步认识到了lncRNA对人类特征和疾病的作用。


图. 文章总览:通过分析GTEx项目数据,探究lncRNA的表达模式和功能,将lncRNA与人类疾病联系起来。


原文链接:

https://doi.org/10.1016/j.cell.2021.03.050


制版人:十一

参考文献



1. International Human Genome Sequencing Consortium., Initial sequencing and analysis of the human genome. Nature, (2001)

2. Ma, Lina et al., LncBook: a curated knowledgebase of human long non-coding RNAs. Nucleic acids, (2019)

3. Gupta, Rajnish A et al., Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis. Nature, (2010)

4. Faghihi, M., Modarresi, F., Khalil, A. et al., Expression of a noncoding RNA is elevated in Alzheimer's disease and drives rapid feed-forward regulation of β-secretase. Nat Med, (2008).

5. Yang, Liuqing et al., lncRNA-dependent mechanisms of androgen-receptor-regulated gene activation programs. Nature, (2013)

6. Yan, Liying et al. , Single-cell RNA-Seq profiling of human preimplantation embryos and embryonic stem cells. Nature structural & molecular biology, (2013)

7. Liu, Siyuan John et al., Single-cell analysis of long non-coding RNAs in the developing human neocortex. Genome biology, (2016)

8. Langfelder, P., and Horvath, S.,  WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics, (2008)

9. Keinan, A., and Clark, A.G., Recent explosive human population growth has resulted in an excess of rare genetic variants. Science, (2012).

(可上下滑动阅览)

转载须知

【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。