《Nature Genetics》杂志详细介绍了这种称为Cis表达或cis-X的方法,这是一种创新的分析方法,在患者肿瘤的调控非编码DNA中识别新的致病性变体和由这种变体激活的癌基因。cis-X通过识别肿瘤RNA的异常表达发挥作用。研究人员分析了白血病和实体瘤,并证明了这种方法的有效性。
不编码基因的非编码DNA占人类基因组的98%。越来越多的证据表明,超过80%的非编码基因组是功能性的,可能调节基因表达。大量人群研究已经确定了非编码DNA中与癌症风险升高相关的变异。但是,在肿瘤基因组中,只有少量的非编码变异导致了肿瘤的发生。发现这些变异需要对大量肿瘤样本进行全基因组测序分析。
“cis-X是一个根本性的改变,现有的方法需要数千个肿瘤样本,只识别反复发生的非编码变体,”St.Jude计算生物学系主任Jinghui Zhang博士说。她和上海儿童医学中心的Yu Liu博士是本文的通讯作者。刘博士也是第1作者。
“通过使用异常的基因转录来揭示非编码变体的功能,我们开发了cis-X,从而能够在单个肿瘤基因组中发现驱动癌症的非编码变体,”张博士说。“识别导致癌基因失调的变异可以将精-确医学的范围扩大到非编码区域,以确定抑制肿瘤中异常激活癌基因的治疗方案。”
cis-X的灵感来源于2014年Dana Farber癌症研究所的Thomas Look医学博士及其同事的一篇科学论文。Look也是这篇论文的合著者。Look的研究小组在
细胞系中发现了导致癌基因(TAL1)异常激活导致T细胞急性淋巴细胞白血病(T-ALL)的非编码DNA变体。这项研究促使张博士继续她长期以来的兴趣,即研究基因每个拷贝的表达变化。
cis-X通过两种方式寻找表达改变的基因。研究人员利用全基因组和RNA测序来寻找只在一条染色体上表达并在异常高水平表达的基因。
“当分析等位基因之间基因表达的不平衡时,可能会产生噪音,”刘博士说。“这项分析使用了一种新颖的数学模型,使cis-X成为一种强大的发现工具。”
然后cis-X通过在3D基因组结构中寻找非编码DNA调控区域的变化来寻找异常表达的原因。“这种方法模仿了变种在活细胞中的工作方式。这些变化包括染色体重排和点突变等变化。
“如果不确定非编码变体,我们可能无法全面了解导致癌症的原因。”
研究人员使用cis-X分析了13例T-ALL患者的癌症基因组,这些数据是由圣裘德和上海儿童医学中心合作收集的。该算法识别已知和新的癌基因激活非编码变体,以及可能的新的T-ALL癌基因PRLR。
研究人员还表明,这种方法在成人和儿童实体瘤中有效,包括神经母细胞瘤。实体瘤对分析提出了更大的挑战。与白血病不同的是,实体瘤分布在肿瘤内的染色体数目往往不均匀。
“cis-X为研究非编码变体在癌症中的功能作用提供了一种强有力的新方法,这可能会扩大精-确药物治疗由此类变体引起的癌症的范围,”张博士说。