【4.2.1】预测RNA二级结构RNAfold 您所在的位置:网站首页 dna二级结构意义是什么 【4.2.1】预测RNA二级结构RNAfold

【4.2.1】预测RNA二级结构RNAfold

2024-06-02 04:50| 来源: 网络整理| 查看: 265

一、简介

网址:http://rna.tbi.univie.ac.at//cgi-bin/RNAWebSuite/RNAfold.cgi

默认参数会输出以下两种二级结构:

optimal secondary structure。最佳二级结构,保证对应的自由能最小,最小自由能简称MFE, 结果示意如下 centroid secondary structure。自由能表征改变这个结构需要注入的能量大小,对应的数值越小,该结构越稳定。

同时给出了可视化结果,示意如下

一、安装和下载

官网:https://www.tbi.univie.ac.at/RNA/

cd /data/software/viennarna wget -c https://www.tbi.univie.ac.at/RNA/download/sourcecode/2_4_x/ViennaRNA-2.4.14.tar.gz tar -xzvf ViennaRNA-2.4.14.tar.gz cd ViennaRNA-2.4.14 ./configure --prefix /data/software/viennarna/viennarna-install-2.4.14 make make install

运行命令

/data/software/viennarna/viennarna-install-2.4.14/bin/RNAfold -p -d2 --noLP -i test.fa --otest_result.out

输入结果:

>1 2 GAUGCUCGGACGCCCCACCAAGG 3 ....((.((........)).)). ( -1.20) 4 ....,,.((.....,..,}.,,. [ -1.84] 5 ....................... { 0.00 d=2.87} 6 frequency of mfe structure in ensemble 0.355158; ensemble diversity 4.06

结果注解:

The optimal secondary structure in dot-bracket notation with a minimum free energy of -1.20 kcal/mol is given below.

The free energy of the thermodynamic ensemble is -1.84 kcal/mol.

The frequency of the MFE structure in the ensemble is 35.52 %.

The ensemble diversity is 4.06 .

2.2 更多参数说明

-noPS 参数代表不产生二级结构对应的postscript文件,这种文件可以转换为PDF格式,产生的str文件内容如下

>hsa-let-7a-1 UGGGAUGAGGUAGUAGGUUGUAUAGUUUUAGGGUCACACCCACCACUGGGAGAUAACUAUACAAUCUACUGUCUUUCCUA (((((.(((..((((((((((((((((...(((.....))).((....))....))))))))))))))))..)))))))) (-35.60)

采用dot-bracket表示法标记二级结构,上述用法只给出了最佳的二级结构预测结果和对应的自由能。

–noPS Do not produce postscript drawing of the mfe structure.

(default=off) --noDP Do not produce dot-plot postscript file containing base pair or stack probabilitities. (default=off)

不添加 –noPS 参数,会反馈一个碱基于碱基配对的信息,可用于挖局结构信息。

对应的dot配对信息(这个编号,是序列的自然编号的位置):

] def /pairs [ [2 20] [3 19] [7 16] [8 15] [30 47] [31 46] [32 45] [33 43] [34 42] [35 41] ] def

代码解析:

with open(input_ss) as data1: data_here = str(data1.read().strip()).replace('\n','___') # print(data_here) match_info = re.findall('pairs \[.*def',data_here) match_here = match_info[0].split('___')[1:-1] for one_p in match_here: one_p = one_p.replace('[','').replace(']','').split(' ') one_pair = [int(one_p[0]),int(one_p[1])] dot_pair.append(one_pair) print(dot_pair) return dot_pair 二、文献算法解读

修改了用于预测RNA二级结构的动态编程算法,以适应由化学修饰确定的折叠限制,并包括当相邻或被单个错配分开时,螺旋的同轴堆叠(coaxial stacking of helices )的自由能增量。此外,对自由能参数进行了修改,以解决终端不匹配( terminal mismatches )以及发夹,凸起(bulge),内部和多分支回路( internal, and multibranch loops )的最新实验结果。为了证明该方法的适用性,在大肠杆菌和白色念珠菌中对5S rRNA进行了体内修饰,分别使用1-环己基-3-(2-吗啉代乙基)碳二亚胺甲基对对甲苯磺酸盐,硫酸二甲酯和乙二醛。通过使用修饰限制,对于大肠杆菌序列,预测结构中已知碱基对的百分比从26.3%增加到86.8%。对于白色念珠菌,无论有无修改数据,其准确度均保持在87.5%。平均而言,对于这些序列以及从文献中获取的具有已知二级结构和化学修饰数据的一组14个序列,准确性从67%提高到76%。这种增强主要反映了对三个序列的改进,这些序列仅基于能量学的预测精度就小于40%。对于这些序列,包含化学修饰约束条件可将平均准确度从28%提高到78%。对于具有



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有