CGR是一种迭代映射技术,基于CGR坐标提出了一种将DNA序列转换成一个时间序列(CGR-游走序列)的方法,并引入长记忆ARFIMA模型来分析。分析了十条DNA序列的CGR-游走序列,发现都能用长记忆ARFIMA模型高度显著地拟合。因为合适的ARFIMA模型在模型选择时成功率较低,且在参数估计中最大似然计算量较大,考虑利用短记忆ARMA(1,1)过程去近似长记忆ARFIMA(p,d,q)过程,证明了这种适应性方法的均方误差准则,并引入DNA序列的十条CGR-游走序列用以分析,验证了这种近似方法的有效性,为长记忆DNA序列找到了一个算法更为简单的近似模型。在此基础上,还考虑利用ARMA(2,2)模型去逼近ARFIMA(0,d,0)模型。基于ARMA(2,2)模型和ARMA(1, 1)模型有效性损失率的比较可知,ARMA(2,2)近似模型优于ARMA(1,1)近似模型。为验证此结论,引入了服从ARFIMA(0,d,0)模型的CGR-游走序列用以分析,比较了ARMA(1,1)和ARMA(2,2)这两个模型近似ARFIMA(0,d,0)模型的有效性,根据残差标准差的结果可得ARMA(2,2)近似模型优于ARMA(1,1)近似模型。我们修改了Kalman滤波递推公式,解决了长记忆ARFIMA模型的缺失数据问题,并利用DNA序列的CGR-游走序列验证了此方法的有效性。基于已建立的DNA序列的CGR-游走模型,我们建立了连接蛋白质序列的CGR-游走模型,并引入长记忆ARFIMA模型来分析,发现来自12条细菌全基因组的连接蛋白质序列的CGR-游走序列能用长记忆ARFIMA模型显著地拟合。

书籍详述:

ISBN-13:

978-3-639-82418-6

ISBN-10:

3639824180

EAN:

9783639824186

书籍语言:

中文

By (author) :

洁 高

页数 :

104

出版于:

01.06.2016

分类:

Other