【喜讯】网络与媒体实验室高水平论文被IEEE Internet of Things Journal录用
近日,由董亚波老师和许端清老师指导的2020级硕博连读生(2017级硕,2020级博)张浩文同学一篇论文被IEEE Internet of Things Journal录用。该期刊属于信息通信领域的TOP期刊,级别为中科院一区,影响因子9.471。
论文简介
研究背景
随着物联网技术的发展与传感器设备的不断出现,带有时间信息的数据正以爆炸式的速度产生。这些传感器产生的数据往往以时间序列的形式呈现。时间序列数据蕴含丰富的信息,如何对提取这些有价值的信息一直是研究热点。时间数据挖掘内容主要包括分类、聚类、异常检测、相似性查询、预测、模式发现等。其中,相似性查询是其他研究内容的基础。例如,以discord为代表的时间序列异常检测算法需要计算任意子序列之间的相似性;最近邻分类算法是时间序列分类中最常用的手段;模式发现也涉及到子序列之间的相似性计算。因此如何提高相似性查询的效率一直是研究者关心的问题。
研究内容
动态时间规整距离(DTW)是时间序列中最常用的相似性度量。本文探索了如何提高DTW距离下的时间序列相似性查询算法的效率,提出了基于乘积量化的DTW加速算法(PQDTW)。PQDTW算法核心包含四个部分,预处理阶段、在线映射阶段、过滤阶段和精筛阶段。在预处理阶段通过时间序列平均技术(DBA)和乘积量化技术计算子序列中心之间的距离并保存在查找表中。在线映射阶段把查询时间序列映射到子序列中心。过滤阶段通过计算近似的DTW距离剪枝大部分时间序列,由于该步骤可以直接通过查找表计算得到距离,因此速度很快。精筛阶段使用DTW距离的下界技术以及可以计算高效计算任意时间序列的PrunedDTW算法计算查询时间序列与剩余时间序列的精确最近邻。通过以上四个步骤实现了查询过程的优化。
研究结果:
在部分数据集上的查询效率
在部分数据集上的查询准确率
参数敏感性分析
作者简介:
张浩文,2017级博士生,指导老师:许端清、董亚波。主要研究方向:物联网、传感器数据分析、文物本体监测。
导师简介:
许端清,浙江大学计算机科学与技术学院教授,主要研究方向:人工智能、深度学习、图像智能处理等。
董亚波,浙江大学计算机科学与技术学院副教授,主要研究方向:物联网技术、文物保护技术、传感器数据挖掘及处理等。