全转录组测序采用去核糖体的链特异性文库、长读长双端测序策略,可全面快速的获取某一条件下组织或细胞中绝大部分转录本的定性和定量情况。与表达谱研究相比,全转录组测序除了可对转录本进行更加准确的定量外,还可进行更为复杂的序列分析,如新转录本和罕见转录本发现、cSNP和 InDel鉴定、lncRNA和circRNA等,获得更为精确完整的基因表达图谱和突破性的发现。
l total RNA大于等于2ug l OD260/280为1.8-2.2 ,RIN值>7 l 适用范围:有无参考基因组皆可
HiSeq4000或者XTEN, PE150
l 全转录组测序分析: 上图中展示的为常规分析的内容,部分内容需要在报告出具且与老师沟通后执行; 部分高级分析内容请点击“生物信息分析”; 定制分析请与业务人员沟通,安排合适的分析人员进行交流。 l LncRNA功能和调控机制预测 l ceRNA分析: l 部分结果展示:
箱线图 相关性分析 PCA分析 样本间聚类 样本相关性热图 火山图 Gene ontology分类图 LncRNA功能和调控机制预测 ceRNA调控网络
1. 研究circRNA,选择全转录组测序还是circRNA测序? 这个问题是我们经常遇到的一个问题。其实各有优劣: 全转录组测序是一种性价比非常高的方案:1、花一份钱,同时得到三种RNA(mRNA,lncRNA,circRNA)的信息;2、同一个体系中出来,系统误差最小;3、在分析时,方便进行三种lncRNA联合分析。劣势在于,如果仅就circRNA研究而言,该种方法没有去除线性RNA,就会带来这样的后果:1、达不到富集circRNA的效果。综合现有文献报道,没有富集的话,较通过去线性RNA的专门的circRNA-seq,检测到的circRNA仅为circRNA-seq 10%-60%不等;2、由于线性RNA的干扰,鉴定到的circRNA假阳性高;3、线性RNA还会影响circRNA定量和差异分析。 CirRNA测序的优点就是去除了线性RNA,对circRNA达到富集效果,且circRNA定量更加准确。缺点就是只能检测到circRNA(其实这也不能算是缺点)。 总而言之,对于需要专门研究circRNA的老师,特别是要建立某些物种circRNA数据库的老师,我们强烈建议采用circRNA测序,而对于想要整体研究RNA,circRNA只是研究中的一部分的老师,全转录组也不失为一个好选择。其实,两种方式还可以综合起来使用,想要探讨的老师可以写邮件至service@orizymes。 2. 全转录组测序为什么去核糖体RNA建库?还需要链特异性建库?需要多大的测序量才能足够? 全转录组测序会同时检测mRNA,circRNA和lncRNA,lncRNA有两类,一类包含polyA尾巴,而更多的一类并没有包含polyA尾,所以如果采用一般富集polyA的方式建库,大量的lncRNA会丢失。 有许多lncRNA与已知基因位置是重合的,只是与已知基因相比,这类型的lncRNA是antisenseRNA,非链特异性建库无法识别这种类型的lncRNA,所以一般是进行链特异性建库。 全转录组测序量建议至少10G以上,如果经费允许,建议测到20G以上。原因有三:1、在分析时我们需要对转录本进行重构从而鉴定lncRNA,而对于真核生物而言,对转录本重构很重要的部分是识别junction区域,如果测序量过低,无法准确鉴定junction区域;2、大量lncRNA是低丰度表达的RNA,而检测低丰度RNA必须要高测序量;3、鉴定circRNA主要是识别backsplice的junction区域,如果测序量过低,支持这样区域的reads过少,不准确。 3. 是否需要生物学重复?重复几次? 生物学重复的设置是实验设计中一个不可或缺的部分。设置生物学重复的目的主要包括如下两个:1通过重复样品的平均值得到更准确的测量结果;2计算样品群体的方差,从统计学方法上判断两组样品质检的差异是否具有显著性。在设计实验时如果没有生物学重复或者生物学重复数量不够,就不能得到有统计意义的实验结果,获得的差异表达基因很可能仅仅是少数个体差异的表现,而不能反映群体的本质特征。所以实验中设计合理数量的生物学重复是非常重要的。 早期基于高通量测序的组学研究,可以不设置生物学重复,或通过将若干生物学重复混合为一个样本后测序的策略,来部分弥补个体差异的影响(如 BMC genomics等SCI期刊上的相关研究普遍采取这个策略)。随着测序价格不断下降,对多个生物重复样本的单独进行测序也逐渐成为高通量测序项目的趋势。2011年7月Hansen发表的文章表明生物学差异是基因自身表达的特性,与检测技术的选择以及数据处理的方式无关。如果不设生物学重复,高影响因子的杂志可能会因此而拒稿。 4. 每组样本应该设置几组生物学重复? 实际应用中,对于重复数目的选取主要考虑以下两个方面:1取样误差;2基因差异的大小。在各种生物学材料中,样本间误差值由低至高依次为培养细胞、动植物组织、人体正常细胞,最后是人体肿瘤组织(往往需要取到6-8重复及以上)。对于样本间误差大、基因差异小的情况应适当增加重复样品的数量。 对于您设计的这个实验,您认为样本间的误差是比较小的,可以适当减少重复的数量。建议您最好能够设置至少3个生物学重复,原因如下:
更多信息可以与我公司业务人员联系或者写邮件至service@orizymes.com咨询。
此处为内容5
此处为内容6