Generative-Semi-supervised-Learning-for-Multivariate-Time-Series-Imputation
一篇来自 AAAI’21 的关于数据补全的work,文章链接 Link
background
对于一段时序数据,包含时序特征和标签。
对于一些具有残缺标签的残缺时序特征,如何进行残缺时序补全
Label 是什么?
针对有些特殊的时序数据,比如病患入院情况,除了正常的一些时序数据如心跳,脉搏等,还有一些特殊情况的标签数据
基本上现有的模型很多都未考虑到真实数据本身具有残缺的问题
传统统计学模型效率较低
一些深度学习模型
从给予RNN 到基于GAN
他们都没有结合补全和数据分析part
该工作更加接近于BRITS,然而BRITS在训练阶段需要完整的数据,会导致在真实情况下有问题
提出了一个具有半监督功能的GAN (SSGAN),其中主要用到了BiRNN作为时序特征提取
method
首先对时序残缺补全问题定义了一些基本概念
然后阐释了BIRNN
接着分别对SSGAN中的Generator, discriminator,classifier三个part分别讲解
Experiement
在三个数据集上进行了验证
Idea
主要针对了带有标签的残缺数据,相较于🈚️标签交通的交通数据集略有区别
亮点:
- 在残缺数据补全上比较早的引入了半监督学习
- 设计了一个整体不错的模型
- 具有数学分析
- 行文流畅通顺
不足:
- 问题适用性范围较小
- 实验做得显得少,分析不够完备
Generative-Semi-supervised-Learning-for-Multivariate-Time-Series-Imputation