当前位置:首页>学术动态

【喜讯】网络与媒体实验室高水平论文被IEEE Internet of Things Journal录用

编辑:netmedia 发布时间:2021-12-02 访问次数:1675

近日,由董亚波老师和许端清老师指导的2020级硕博连读生(2017级硕,2020级博)张浩文同学一篇论文被IEEE Internet of Things Journal录用。该期刊属于信息通信领域的TOP期刊,级别为中科院一区,影响因子9.471。

论文简介

研究背景

随着物联网技术的发展与传感器设备的不断出现,带有时间信息的数据正以爆炸式的速度产生。这些传感器产生的数据往往以时间序列的形式呈现。时间序列数据蕴含丰富的信息,如何对提取这些有价值的信息一直是研究热点。时间数据挖掘内容主要包括分类、聚类、异常检测、相似性查询、预测、模式发现等。其中,相似性查询是其他研究内容的基础。例如,以discord为代表的时间序列异常检测算法需要计算任意子序列之间的相似性;最近邻分类算法是时间序列分类中最常用的手段;模式发现也涉及到子序列之间的相似性计算。因此如何提高相似性查询的效率一直是研究者关心的问题。


研究内容

动态时间规整距离(DTW)是时间序列中最常用的相似性度量。本文探索了如何提高DTW距离下的时间序列相似性查询算法的效率,提出了基于乘积量化的DTW加速算法(PQDTW)。PQDTW算法核心包含四个部分,预处理阶段、在线映射阶段、过滤阶段和精筛阶段。在预处理阶段通过时间序列平均技术(DBA)和乘积量化技术计算子序列中心之间的距离并保存在查找表中。在线映射阶段把查询时间序列映射到子序列中心。过滤阶段通过计算近似的DTW距离剪枝大部分时间序列,由于该步骤可以直接通过查找表计算得到距离,因此速度很快。精筛阶段使用DTW距离的下界技术以及可以计算高效计算任意时间序列的PrunedDTW算法计算查询时间序列与剩余时间序列的精确最近邻。通过以上四个步骤实现了查询过程的优化。


研究结果:

1638345044(1).jpg

在部分数据集上的查询效率


1638345054(1).jpg

在部分数据集上的查询准确率


1638345069(1).jpg

参数敏感性分析


作者简介:

张浩文,2017级博士生,指导老师:许端清、董亚波。主要研究方向:物联网、传感器数据分析、文物本体监测。

1638345088(1).jpg



导师简介:

许端清,浙江大学计算机科学与技术学院教授,主要研究方向:人工智能、深度学习、图像智能处理等。

748179648060858572.jpg


董亚波,浙江大学计算机科学与技术学院副教授,主要研究方向:物联网技术、文物保护技术、传感器数据挖掘及处理等。

5-董亚波.jpg


版权所有:浙江大学网络与媒体实验室   电话 (+86)571-87951388  传真 (+86)571-89751105

您是第4863444位访问者 | 创高软件 管理登录 旧版入口