论文学习——多度量水文时间序列相似性分析_多元时间序列相似度 溯源-程序员宅基地

技术标签: 学习  算法  人工智能  2022.11 论文学习  

多度量组合可以提高相似性分析的准确性。

在这里插入图片描述

摘要

  1. 多度量组合可以提高相似性分析的准确性
  2. 本文方法:首先使用多个单一相似度量分别计算相似时间子序列;然后采用改进的BORDA投票法对各度量分析得到的相似子序列进行组合和排序,得到最终的相似时间子序列。

1 研究背景

1.1 主要研究内容

主要是研究水文时间序列相似性;
目前是k个最近邻水文过程发现,特别是洪水过程的相似性。

1.2 研究背景

众多学者结合水文时间序列的特点,进行了水文时间序列相似性的研究。

  1. 李薇 《水文时间序列相似性查询的分析与研究》
    抽取时间序列的模式特征(包括长度和斜率),然后借鉴动态弯曲的思想定义序列之间的动态模式匹配距离(DPM)

  2. 欧阳如琳《水文时间序列的相似性搜索研究》
    采用DTW距离计算流域内多水文站之间相似性洪水过程,发现流域的洪水过程形态。

  3. 朱跃龙《基于语义相似的水文时间序列相似性挖掘》
    提出基于语义的水文时间序列相似性度量,定义水文时间序列的上升、保持和下降等语义模式,在此基础上,定义序列的语义距离描述序列的相似程度。

在这里插入图片描述

  1. 李士进 《基于BORDA计数法的多元水文时间序列相似性分析》
    针对多维水文时间序列相似性,李士进首先逐维进行一元时间序列相似性分析,然后采用BORDA投票法对各维的相似子序列进行组合和排序,获取多维相似子序列。
    在这里插入图片描述

1.3 启发

目前水文时间序列相似性所示大多采用单一相似度量来评价序列之间的相似性。

[11-12]文献提出多度量相似性分析,采用启发式搜索确定各度量的权重,相似距离为各度量距离的加权和

在这里插入图片描述


2 基于改进BORDA投票法的多度量水文时间序列相似性分析

2.1 研究方法

  • 串行组合处理

  • 并行组合处理

在这里插入图片描述

  • 本文关注h近邻搜索问题,即查询与指定序列最相似的前k个子序列从分类角度来看,k近邻相似搜索可以视为采用相似度量将时间子序列划分为第1相似子序列、第2相似子序列…,第h相似子序列以及不相似子序列。(也就是说,前k个都是相似的,后面都是不相似的)

  • 本文采用改进的BORDA投票法,对多个单一相似度量算法计算得到的相似子序列进行并行组合,得到最终的k近邻子序列。

2.2 BORDA投票法的改进

2.2.1 BORDA 的缺点

本文指定:针对每个投票人的排序,给每个候选人设定一个排序分数,规定排在最后的候选人的排序分数为1分,倒数第2位的候选人为2分,依次类推,排在第1位为p分,候选人的排序分数的累积称为BORDA分数,BORDA分数进入前m名的候选称作BORDA胜者。

BORDA投票法只考虑所有候选人排序先后,没有考虑前后候选人差距的大小,这样可能造成无法计算出真实的排序。【啥意思啊,看不懂啊,候选人差距的大小?感觉根据例子是投票人差距大小吧阿巴阿巴】

如假设,有A、B.C、D四匹马进行四场比赛,四场比赛名次排序分别为:A、B C、D,B、A、D、C,D、C、A、B和C、D、B、A。四匹赛马BORDA分数都为10分,出现了四匹赛马并列第一名的情况,因为BOR-DA投票法仅考虑四匹马的名次排序,而没有考虑各匹马在比赛时成绩的具体差异。

2.2.2 改进的BORDA投票法

在这里插入图片描述
在这里插入图片描述

  • 那么我就自然地提出我的问题了:第一d1 、d2、d3等等是如何确定的?第二 候选人差距是否可以量化是如何确定的?

在这里插入图片描述


在各单一相似度量的查询结果中,出现次数越多,说明其被越多的相似度量认可为相似子序列,其改进BORDA分数将可能越高;若只是在单一相似度量的查询结果靠前,说明可能只是被单一的度量认为是相似子序列,其改进BORDA分数可能不高。

因此,相比于单一相似度量,多度量组合可以在结果中包含参与组合的多个单一相似度量结果中的优秀结果,从而提高相似搜索的准确性。


3 实验验证与分析

  • 为什么选择这一流域的这一个水文站?
    在这里插入图片描述

3.1 实验数据

  • 这里的实验数据介绍的还是很清楚的。

在这里插入图片描述

  • 首先可以看到是11年间的,6-9这四个月的流量数据(标题中的水文序列就是指的是流量序列,水文数据包括了流量数据、水文数据、降水量数据等等),每天是四个检测时间点,也就是说(这里是大概算了一下数据量)11年 * 4个月 * 30天 * 4个时间点 = 5280个数据点 这些数据都是连续的记录型数据,但是要注意的是,这里是洪水过程相似性分析,应该是要对5千个数据点按照一场洪水为单位去划分的,每场洪水大概持续多少天然后大概几十到一百多的流量数据能刻画出一场洪水。

3.2 实验结果分析

  • 这里介绍了查询序列,任务就是在数据库中查询出与之相似的序列。
  • 可以看到这个洪水是7月31日到8月29日,30天*4个数据点,流量序列的长度就是120
    在这里插入图片描述

  • 看表1,这里可以看出洪水的流量序列是被等长切分的,也就是说没有按照单场洪水来划分,而是简单处理成30天的长度,应该是作者想要方便实现和方便计算。

在这里插入图片描述

  • 实验二:双洪峰M型洪水相似性分析

在这里插入图片描述

在这里插入图片描述

  • 分析就不放上来了,无非就是这四种方法不好,然后自己提出的改进BORDA方法好。

4 结语

在这里插入图片描述

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_42521185/article/details/127752134

智能推荐

PPT文本输入控件如何自动换行_poerpoint文件框控件 设置按回车换行-程序员宅基地

文章浏览阅读2k次。找了很久,最后还是自己琢磨出来了打开“开发者工具”,点“文本框控件”,在文本框控件右键,选择“属性表”,在属性表找到“MuLtiLine”,把“MuLtiLine”的值设为“True”如下图_poerpoint文件框控件 设置按回车换行

NASM 汇编编程(七)实战:获取用户输入_汇编怎样从控制台获得输入-程序员宅基地

文章浏览阅读1.5k次,点赞3次,收藏4次。NASM 汇编编程(七)_汇编怎样从控制台获得输入

SQL语句练习(Student,Course,SC表)_创建一张与sc表结构完全相同的基本表sc_like-程序员宅基地

文章浏览阅读8.5k次,点赞22次,收藏132次。Create table Student 主码,姓名(唯一),性别(男、女),年龄(18—25)CREATE TABLE Student (Sno CHAR(9) PRIMARY KEY, /* 列级完整性约束条件,Sno是主码*/ Sname CHAR(20) UNIQUE, /* Sname取唯一值*/ Ssex CHAR(2) check (Ssex in ('男','女')), Sage SMALLINT check (Sage betwe.._创建一张与sc表结构完全相同的基本表sc_like

Gradle 配置国内镜像_gradle国内镜像源-程序员宅基地

文章浏览阅读5.6k次。使用国内源来配置gradle加速下载_gradle国内镜像源

Python自动化测试框架有哪些?(总结几种)-程序员宅基地

文章浏览阅读5.2k次。随着Python语言的使用越来越流行,基于Python的测试自动化框架也越来越流行。在项目选择最佳框架时,开发人员和测试人员会有些无法下手。做出选择是应该判断很多事情,框架的脚本质量,测试用例的简单性以及运行模块并找出其缺点的技术。这篇文章总结了测试自动化领域,适合Web端自动化框架(基于Python语言)以及它们相对于其他方面的优缺点。因此,可以帮助一些人根据需要和实际情况选择合适的的Python框架进行测试自动化。_python自动化测试

ElementUI Pagination 分页修改背景色_el-pagination 美化-程序员宅基地

文章浏览阅读2.4k次。CSS 代码可以在CSS里面增加其他代码,设置选中后的背景颜色等::v-deep .el-pagination.is-background .el-pager li:not(.disabled).active { background-color: #ff2832;}修改前修改后_el-pagination 美化

随便推点

XILINX的IP核GTX的配置_fpga xilinx gtx-程序员宅基地

文章浏览阅读993次,点赞24次,收藏27次。看了众多文章,虽然很多已经写的很详细了,但很少有文章讲到各项配置的意义,选择这些选项是要干嘛,不选会咋样?这些问题在学习过程中一直困扰我,所以我写了这篇文章希望可以和我有同样问题的伙伴一起交流_fpga xilinx gtx

Flutter网络请求框架Dio源码分析以及封装(一)--请求流程分析_flutter dio封装-程序员宅基地

文章浏览阅读4.6k次,点赞3次,收藏7次。利用flutter开发app也已经有些时间了,这个过程中最多接触到的就是网络请求相关的代码。自己目前项目中使用的是现在市面上最流行的网络请求库-dio,相对于flutter自带的HttpClient来说,dio使用起来更简单,功能更强大,支持全局配置、Restful API、FormData、拦截器、 请求取消、Cookie 管理、文件上传/下载、超时以及自定义适配器等。_flutter dio封装

2024牛客寒假算法基础训练营1_2024csp题目-程序员宅基地

文章浏览阅读688次,点赞23次,收藏20次。2024牛客寒假营1【ABCGLMEFI】_2024csp题目

GBase 8a集群性能优化之group by 多列hash重分布_hash group by 优化-程序员宅基地

GBase 8a集群对随机分布表进行多列group by操作时,会以第一列进行hash重分布,可能造成数据倾斜影响性能。

解决 重定向次数过多 尝试清除cookie 的问题_重定向次数过多清除也没用-程序员宅基地

文章浏览阅读10w+次,点赞14次,收藏44次。在做登录防止用户没有登录而访问其他web资源的时候,写了一个过滤器,却在浏览器无法打开,出现重定向次数过多 尝试清除cookie,试过没有用。出现这个问题的原因是因为在过滤器中出现了无限循环重定向。出现无限循环重定向的原因分析如下:先上代码:package net.book.util;import javax.servlet.*;import javax.servlet.a..._重定向次数过多清除也没用

Android实现点击按钮跳转另外页面_android点击按钮跳转到另一个页面-程序员宅基地

文章浏览阅读6.1k次,点赞8次,收藏47次。在manifests->AndroidManifest.xml中添加创建的跳转的界面的activity。_android点击按钮跳转到另一个页面

推荐文章

热门文章

相关标签