今天给大家介绍一个刊登过《Cell》、《Nature》的分子,这篇文章里面的主角分子是一个lncRNA,而且还是一个已经发过10多篇文章的lncRNA NORAD(也叫LINC00657)。
首先我们看一下pubmed中这个lncRNA NORAD的文章数量也有15篇了,研究方向包括宫颈癌、膀胱癌、丙肝、胰腺癌、食管癌等,它和肿瘤的进展有很强的关系。
那么不禁在想是什么样的作用机理的研究能让一个“lncRNA”既登过《Cell》又上了《Nature》,第一篇是《Nature》,在线刊登在2018年8月27日,第二篇是《Cell》,发表在2016年1月份(如下图),师兄给大家一一道来。
首先咱们一起来看下这个lncRNA NORAD如何发现的?当年是如何发在了《Cell》上,分别通过什么机制调控着基因组的稳定性(Genome Stability)。
1.基因组稳定性
2011年在《Hallmarks of Cancer: The Next Generation》一文中将基因组不稳定性列入肿瘤十大特征之一。生物个体基因组完整性的维持得益于细胞内完善的DNA修复机制。当生物体受到内外界刺激而引起DNA损伤时,细胞会启动快速而准确的修复机制,以避免细胞凋亡、衰老等不可逆转的不良后果。DNA损伤中最为危险一种是DNA双链断裂(double-strand breaks, DSBs)。如不能及时修复,DSBs会导致染色体片段缺失、易位等严重的基因组缺陷,从而可能导致细胞恶性转化为肿瘤细胞。
所以说研究基因组不稳定性和肿瘤的发生和诊断治疗息息相关。
2. lncRNA NORAD首次刊登《Cell》,2年内催生15篇文章
德克萨斯大学西南医学中心的分子生物学家们最先发现NORAD(Noncoding RNA activated by DNA damage)的lncRNA,帮助维持了细胞中染色体的正常数量,当NORAD基因异常激活时,会导致细胞中染色体数量不稳定。
在这篇文章中,当缺失NORAD时,细胞经常会丢失或获得整个染色体。显微成像揭示缺失NORAD的细胞无法在分裂之时正确传递染色体。在细胞分裂过程中NORAD通过调控一个叫做PUMILIO的蛋白质家族的活性控制了染色体分离。在缺失NORAD的细胞中,PUMILIO过度活化会导致基因组不稳定。
NORAD非常保守序列,而且在每个细胞中有500~1000个拷贝。具体分子机制为NORAD会招募PUMILIO的蛋白质家族,这个抑制了PUMILIO结合的靶标mRNA的稳定性和翻译活性。 当细胞缺失NORAD时,PUMILIO 家族蛋白 drive chromosomal instability 过度抑制有丝分裂、DNA损伤、DNA复制因子的方式介导染色体的不稳定性,实验发现了一个高度序列保守且剂量依赖的一个RNA结合蛋白(RNA binding protein)家族PUMILIO,第一次发现lncRNA和RBP蛋白调控了染色质的不稳定性。
3. lncRNA NORAD再次刊登《Nature》,依然还是染色体稳定性!但融合了蛋白质组学。
Cell那篇文章直接上来就研究PUMILIO 的结合NRA,所以本文Nature作者对于NORAD的详细作用蛋白进行了组学实验:通过RNA antisense purification (RAP) 定量液相色谱(RAP MS),对NORAD在正常细胞中结合的蛋白(RNA binding proteins,RBP)进行高通量筛选。而前面所说的PUMILIO 也有在这些蛋白之列,不过却排在了185位,可见前面有太多的RBP蛋白可以去研究的。
RAP-MS获得RBP蛋白序列和种类
最前面41个RBP蛋白大多和DNA解链、复制、修复功能相关,包括 PURA, PURB, TAF15, ALYREF, SFPQ, SRSF1, RBM14,DDX17, RBMX等,
那么接下来作者还要做什么实验呢?当然就是NORAD的核内分布和功能以及分子机制了。
①胞内分布鉴定:smFISH实验,拿GAPDH、MALAT1作为阴性和阳性对照;核质分离后分别做细胞质和胞核的qRT-PCR验证表达量
②NORAD的体内外功能实验还需要做吗?当然还是需要的,作者使用了经典的CRISPR-dCAS9(见文末相关文献)技术将lncRNA在DNA转录层次上沉默(并未破坏DNA双链的完整性),造成的基因组不稳定性表型可以被胞质中的过表达的NORAD逆转,这说明NORAD的功能重要性。
③这个时候该研究哪个RBP蛋白呢?RBMX!为什么选它?
因为通过文献阅读,作者发现众多的RBP蛋白中RBMX敲除后的表型和lncRNA NORAD敲除后的表型非常接近:DNA损伤修复、破坏了姐妹染色单体的分离(就是上面那篇Cell文章中的表型)。于是作者就选择了RBMX蛋白作为NORAD的作用分子来研究。
④RBMX和NORAD的结合位点是什么?还要证明RBMX和NORAD的作用发生在核内,且删除了NORAD和RBMX的结合位点,严重破坏了基因组稳定性。
作者使用了crosslinking and immunoprecipitation (CLIP)技术,发现NORAD的5’端是RBMX是lncRNA的结合位点,5’端有长达800多nt的序列中含有非常多的RBMX的结合位点。这个Nature作者试了一下PUMILIO,发现RBMX在NORAD上的结合位点并没有特别明显结合NORAD,证明了RBMX的结合唯一性。
接下来还需要证明空间上的作用。
⑤故事的最后,NORAD为何只单单对RBMX的结合位点和序列这么多?难道通过RBMX招募了很多其他的蛋白形成调控的复合物?
为了证明这一点,作者用到了co-IP MS检测RBMX蛋白上的其他蛋白,并且在正常细胞中敲减了NORAD(为了证明NORAD调控RBMX的唯一性而不是也同时直接招募其他蛋白一起发挥功能和作用),结果就是检测到的最丰富的蛋白TOP1, TOP1MT, PRPF19, CDC5L, BCAS2
以及 MEPCE并没有在NORAD的RAP-MS的数据中,这也就证明了NORAD并不调控RBMX的结合蛋白,没有任何关系,这一点通过WB就可以在NORAD缺失的细胞中检测。
最后就形成了这样的一个科学假说:lncRNA NORAD通过单独结合RBMX蛋白,调控了RBMX-TOP1等蛋白组成的抑制基因组不稳定性的蛋白复合体的功能行使。
所以通过这篇文章我们学到了RBP蛋白和RNA转录本的研究策略:
如何从过去的经典高分文章中用蛋白质组学的方式挖掘其他众多调控蛋白(RNA��Ѻ,����结合蛋白,RBP),并通过细胞功能回复实验证明其功能上有联合作用;
分子具体结合位点的确定和通过RBP蛋白的CLIP测序分析以及结合位点的删除实验来在功能上相互证明;
最后在RNA分子敲减的情况下,研究RBP蛋白的其他的蛋白复合物(使用co-IP MS实验),从而形成一条完整的机制研究链条,提出自己的假说。