利用深度测序进行全基因组RNA结构检测 通过图示概述了Kertesz(左)和Underwood(右)所用的方法。注意在Underwood的研究中,孵育对照(有或无激酶处理组)是平行完成的。 模平行测序技术使得研究人员能够对基因组进行快速的深度测序,从而从根本上改变了基因组学的发展。在本期的《自然-方法学》(Nature Methods)和《自然》(Nature)杂志两篇最新的论文中Underwood和Kertesz两个研究小组利用高通量测序技术确定了所有RNA转录物的二级结构。
在过去的一些研究中全基因组测序技术被应用于确定细胞结构与DNA区域或mRNAs之间形成的复合物的特征。虽然这些研究提供了关于调控复合物组成的信息,然而研究人员却无法解析这些RNAs的结构
最近的研究证实RNAs在调控基因表达和基因组稳定性中发挥了多重功能,这一课题日益引起了研究界的广泛关注。在这些调控过程中,RNA的结构是一个关键的影响因素——决定了是直接监控外部或内部信号,或是为反式作用因子提供特异的结合位点。
RNA转录物是一种单链分子,当其发生自身折叠并形成Watson-Crick碱基对,可生成各种长度和不同复杂性的发夹结构。发夹结构是RNA中最普通的二级结构形式,其进一步组装则形成了复杂的三维结构。了解RNA二级结构是研究人员揭示RNA活性,发现伴侣蛋白结合印迹及突变影响关键性的第一步。
对于结构稳定的RNAs,检测其二级结构最高效和安全的方法就是对同源序列进行种系发生比较。科学家们认为同源序列可生成相似的折叠,从而维持了相同的核心螺旋数目和长度。在保守的Watson-Crick碱基对区域,Watson-Crick碱基对改变通常是两个核苷酸遵循Watson-Crick碱基配对而同时发生变化。然而在种系发生过程中由于序列具有高度保守性此时该机制不发生作用,从而不显示核苷酸协同变异。
当RNA具有超过一个稳定折叠的结构时,种系发生比较是非常困难的。在这种情况下,研究人员只能借助电脑模拟的方法,基于实验获得碱基对能量集合通过最大化碱基对数目计算出最小的二级结构自由能。
在试验中研究人员可通过化学检测或酶检测的方法解决这些问题。这些试验可在缺乏或存在蛋白质或其他配体以及各种温度或条件下在体外或体内完成。无论是化学检测还是酶检测,RNA的可接近性都是反应的重要标准。在化学检测中,一个成分确定的化合物可通过与RNA碱基上某个精密位点或糖磷骨架发生反应,从而对RNA起作用。
在酶检测中,则是用一种RNA切割酶与RNA的非配对或配对区域发生反应。通过这种检测方法(通常在引物延伸后用凝胶电泳方法检测片段)显示出在结构上与化合物或酶易于接近的碱基。化合物检测生成的是原子水平的信息,而酶检测主要生成螺旋和非螺旋区域的信息。这些实验方法通常工作量大,在各种操作过程中需要多种专业知识。这样的数据可局限性地应用于计算机折叠程序中,利用序列预测RNA的二级结构。
Underwood和Kertesz利用了高通量深度测序策略获得了从细胞中抽提的RNA转录物复合物的二级结构信息(图1)。在两篇论文中,研究人员分别获得了来自酵母或小鼠细胞的RNAs,在确定的实验条件下按照选择的尺寸对其进行酶水解。酶水解的RNA产生了5′-磷酸基,利用接头选择性连接切割的片段而非带有5′-OH片段的水解降解产物。在反转录和PCR扩增后,对生成的文库进行深度测序。
这两篇论文使用的方法不同之处在于所使用的酶以及数据处理的方式。Kertesz等利用了两种酶:RNase V1,可特异识别RNA双链区域;S1单链核酸酶(nuclease S1),可特异性识别RNA单链区域。最后的得分是RNase V1和nuclease S1从分析残基后的核苷酸开始切割形成的片段读数的log值。Underwood等利用了一个特异识别RNA单链区域的P1单链核酸酶(nuclease P1),并设立了两个对照,其中一个未经核酸酶处理以估计内源切割保留的5′磷酸盐的量,另一个则加入了T4连接酶检测未保留5′磷酸盐的切割。最后得分是核酸酶组与对照组计数值的log值。
|