这个包里包含了四种常用的时间序列相似性评估算法,包括DTW,LCSS, PLA和PAA,方便学者在进行开展实验时进行对比分析,也可以运用在多种需要评估距离的场景中。
为提高多维时间序列相似性搜索的效率,利用多维时间序列的协方差矩阵的特征值和特征向量构造加权Frobe- nius范数,将其作为多维时间序列主元之间距离,并将其用于对多维时间序列主元相似度的度量.在相似性搜索算法中...
研究两个序列集合之间相似性度量,提出基于拉普拉斯矩阵特征值的分离度概念和公式表示。基于人工序列和真实DNA序列上的实验结果,证实了分离度能够度量序列间的相似程度。
针对目前不同的RNA二级结构可能对应相同...利用Lempel-Ziv复杂度对两组RNA二级结构进行了相似性分析,实验结果表明了该表示法可以有效地提取RNA二级结构的结构信息,避免了不同RNA二级结构可能对应相同特征序列的问题。
LGR)的基础上,提出了一种新型DNA序列的表达方法—矩阵图谱表达法(MGR),并进一步,在DNA序列的上述三种表达式基础上,分别推广建立了基于经典HP模型的蛋白质序列的图谱表达法,对蛋白质序列的相似性进行了比较...
序列相似性比较与同源性分析 首先应该注意区分序列相似性与序列同源性的关系,序列相似不一定同源,但是判定同源性关系的时候有些算法(Maximum likelihood除外)要考虑到序列相似性。序列相似性是将待...
为提高时间序列相似匹配的精度和效率, 提出一种基于小波包变换的时间序列相似匹配算法. 首先利用小 波包可对信号进行精细分析的特点, 对时间序列进行维数约简, 用变换后的低频系数和部分高频均值系数作为特征...
针对现有经典的时序数据相似性度量方法共同主成分分析(CPCA)和二维奇异值分解(2DSVD)中存在无法保存时序数据集合中蕴涵的某些重要局部特征的问题,提出了基于数据分块方式的CPCA方法和2DSVD方法。该算法首先对...
最近提出的DNA四维图形表示是以4种碱基A,T,G,G的3种分类为基础的,这种表示方法给出了,DNA序列的几何中心。...对表1所列的11种不同物种的第一类β球蛋白基因序列构建的相似性分析表,阐述这种方法的应用。
论文研究-中日股价序列相似性的比较分析.pdf, 将时间序列数据挖掘的方法应用到两国证券市场比较问题中,并在聚类分析中定义新的函数以判别最优的分类数. 我们发现:在指数...
台风相似性度量方法的研究对防灾减灾、辅助决策等具有重要...最后,针对台风时间序列的不等长问题,设计了一种基于主成分分析和动态时间弯曲距离的相似性度量方法。通过实验验证,该方法能够实现台风相似性的有效度量。
疏水,带电荷,有极性,甘氨酸,在此基础上给出DNA序列一种新的图形表示方法:将1列DNA序列表示为二维空间中的3条特征曲线,利用计算c(i,j)矩阵的主特征值,给出DNA序列的3维特征向量,得到相似距离矩阵。...
考虑密码子简并性的DNA序列的表征和相似性分析
使用分层聚类算法分析它们在不同的交通流状态辨识中的效果,以此确定交通流时间序列的模式相似性度量方法。以上海南北高架东侧间部分路段固定线圈检测数据为例进行了实证分析,最终确定模式距离与欧氏距离组合方式为...
序列多样性分析 - SeqDivA 1.0 版是一个基于 Python 的工具,具有为 Linux 和 Mac OS 设计的友好 GUI。 效用:运行比对算法(水、针和爆炸)来比较所有蛋白质、DNA 和 RNA 序列。 SeqDivA 提供相似性、恒等性和位...
论文研究-基于多维形态特征表示的时间序列相似性度量.pdf, 特征表示和相似性度量是时间序列数据挖掘的基础工作, 其质量好坏直接影响后期的挖掘结果. 利用正交多项式回归...
一种应用于蛋白质相似性分析的序列分割方法
针对欧几里德距离描述分段趋势的不足和各种模式距离对应分段之间距离值的离散化问题,提出一种基于形态相似距离的时间序列相似性度量方法,标准数据集上完成的识别和聚类实验表明了该方法的可行性和有效性。
本文在分析信息系统与多元时间序列关系的基础上,利用主成分的方差贡献率得到主成分的加权综合属性,从而达到将多元时间序列降为一元时间序列的目的;利用动态时间弯曲距离来刻划两个已经降为一元的时间序列相似性.
编辑距离作为一种重要的相似性度量方法被广泛应用于基因序列的相关分析研究中。针对现有的安全基因序列编辑距离计算方案效率很低没有实用性的...实验结果表明,该方案能够安全有效地实现分布式的基因序列相似性计算。
通过采用二进制数表示旱涝事件序列中的事件,描述了基于二进制信息粒的运算及二进制粒事件序列相似性匹配的相关定义,提出了基于二进制粒事件序列上的多层次全序列匹配算法及相关定义;经实验验证分析,说明了研究的有效...
应用性能参数序列相似性度量方法,潘昆豪,李静林,性能分析是构建高质量应用系统的必需手段,针对应用性能参数时间序列的相似性度量在性能分析中具有重要的意义。目前,时间序列相
编辑距离作为一种重要的相似性度量方法被广泛应用于基因序列的相关分析研究中。针对现有的安全基因序列编辑距离计算方案效率很低没有实用性的...实验结果表明,该方案能够安全有效地实现分布式的基因序列相似性计算。