【喜讯】网络与媒体实验室高水平论文被 IEEE TMC录用
近日,由网络与媒体实验室董亚波老师和许端清老师指导的2023级硕博连读生(2021级硕,2023级博)张君如同学一篇题目为DI2SDiff++: Activity Style Decomposition and Diffusion-Based Fusion for Cross-Person Generalization in Activity Recognition的论文被国际顶刊《IEEE Transactions on Mobile Computing》(简称 IEEE TMC)正式接收。
IEEE TMC 是中国计算机学会(CCF)推荐的 A 类国际顶级期刊,同时是中科院 1 区 TOP 期刊,在计算机网络、移动计算领域享有极高的学术声誉。
论文简介
在人体动作识别(HAR)任务中,模型训练常依赖于已有用户的动作数据。然而,实际部署过程中,模型往往需要面对来自未见用户的新数据,存在显著的“个体差异”与“风格多样性”,导致训练域与测试域之间出现分布偏移,严重影响模型在真实场景中的泛化性能。
为此,论文提出了“域填充(Domain Padding)”这一全新视角:通过生成多样化的“风格化活动样本”,在特征空间中填补原始训练数据未覆盖的区域,从而提升模型的跨域泛化能力。
图 :DI2SDiff++中的多头风格条件器
主要技术创新如下:
第一,提出 DI2SDiff 框架:利用对比学习提取活动风格特征,通过条件扩散模型引导数据生成,并通过“风格融合采样”策略实现同类多风格数据的生成,提升训练数据的分布多样性;
第二,升级版 DI2SDiff++ 引入多头风格条件器:将每个动作实例分解为多个“子风格”分量(类相关/无关、对变换敏感/不敏感),实现更细粒度、更具解释性的语义建模;
第三,创新“子风格融合采样机制”:允许从同一类或不同类样本中自由组合多个子风格,引导扩散模型生成更丰富、更自然的时序动作数据,有效增强域内和域间的多样性。
实验部分在三个主流跨人HAR数据集(DSADS、PAMAP2、USC-HAD)上展开大量评估。结果显示,DI2SDiff及其升级版DI2SDiff++在不同架构下均显著优于当前主流领域泛化方法,在数据多样性、模型泛化性和实际适应性方面表现出色。
作者简介
张君如,2021级博士生,指导老师:许端清、董亚波。主要研究方向:传感器时序数据挖掘和分析,研究内容包括基于大语言模型的时序建模、生成模型以及迁移学习等。
导师简介
许端清,浙江大学计算机科学与技术学院教授,主要研究方向:人工智能、深度学习、图像智能处理等。
董亚波,浙江大学计算机科学与技术学院副教授,主要研究方向:物联网技术、文物保护技术、传感器数据挖掘及处理等。