Generative-Semi-supervised-Learning-for-Multivariate-Time-Series-Imputation

一篇来自 AAAI’21 的关于数据补全的work,文章链接 Link

background

对于一段时序数据,包含时序特征和标签。

对于一些具有残缺标签的残缺时序特征,如何进行残缺时序补全

Label 是什么?

针对有些特殊的时序数据,比如病患入院情况,除了正常的一些时序数据如心跳,脉搏等,还有一些特殊情况的标签数据

基本上现有的模型很多都未考虑到真实数据本身具有残缺的问题

传统统计学模型效率较低

一些深度学习模型

从给予RNN 到基于GAN

他们都没有结合补全和数据分析part

该工作更加接近于BRITS,然而BRITS在训练阶段需要完整的数据,会导致在真实情况下有问题

提出了一个具有半监督功能的GAN (SSGAN),其中主要用到了BiRNN作为时序特征提取

method

首先对时序残缺补全问题定义了一些基本概念

P3

然后阐释了BIRNN

P2

P4

接着分别对SSGAN中的Generator, discriminator,classifier三个part分别讲解

P2

P5

P6

Experiement

在三个数据集上进行了验证

Idea

主要针对了带有标签的残缺数据,相较于🈚️标签交通的交通数据集略有区别

亮点:

  • 在残缺数据补全上比较早的引入了半监督学习
  • 设计了一个整体不错的模型
  • 具有数学分析
  • 行文流畅通顺

不足:

  • 问题适用性范围较小
  • 实验做得显得少,分析不够完备
作者

Shuyu Zhang

发布于

2021-02-28

更新于

2021-03-03

许可协议

评论