Traffic_DataSet
数据集整理,不定期更新
在这里,我会描述一些使用过的数据集,附带数据来源
如果有数据的话,会根据链接内的数据格式进行简单介绍
🚗🚗🚗🚗🚗🚗
🔥🔥🔥Pems:
目前使用最多的数据集,基于该网站,许多科研人提取出了一些简单好用的公开数据集,本文之后会分别介绍
数据来源:加州地区的sensor station
官网Link (应该是需要翻墙), OG
根据位置不同,共分为了12个区域/districts
附由Davidham3做的python爬取脚本Link
PemsD7 (M/L)
出现于 Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecasting (IJCAI’18)
下载见链接内
PemsD4
出现于 Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting (ASTGCN) (AAAI’19)
下载见链接内
PemsD8
出现于 Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting (ASTGCN) (AAAI’19)
下载见链接内
METR-LA
出现于 Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting
下载见链接内
PEMS-BAY
出现于 Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting
下载见链接内
(作者在原仓库中有附带detector id!)
NavInfo(四维交通)
北京市四维图新公司公布,基于每个时间段内道路区间内的所有车辆的平均速度采样而来,包含中国许多城市(e.g., 北京,上海,广州,深圳等)的交通主干道道路速度和拥挤指数数据。
官网链接
截止 2020.10.24,以于2020.7.22日停止更新
香港道路速度
链接,该数据由香港公共开放数据提供,包括香港各主要道路的平均行车速度。
官方提供数据下载开始自2021年3月10日。
Others (Time-series)
Localization Data for Person Activity Data Set
人类活动数据集(activity)的定位由记录5人进行11种活动的运动状态的多元运动学时间序列组成。每个人都在左右脚踝、胸部和腰带上佩戴四个传感器(标签)来记录三维坐标。在40个连续时间步的实验中使用了4100个时间序列样本。
The PhysioNet Computing in Cardiology Challenge 2012
PhysioNet Challenge 2012数据集(PhysioNet)包含4000个多变量临床时间序列,41个测量值来自重症监护病房(ICU), 554名患者死于医院。每个样本在患者进入ICU后的48小时内采集。原始数据集中有80.67%的缺失值。
Air Quality Data
AQI 1
KDD CUP 2018年数据集(KDD)包含北京市36个监测站2014年5月1日至2015年4月30日每小时PM2.5数据,缺失率为13.30%。在连续24小时内,共有365个相同标签的时间序列样本。
AQI 2
具有大概两三年的AQI指数,包含非常多城市的AQI,时间跨度为天
AQI 3
Link
香港AQI指数,最多细化至每小时,下载方便
Aircraft
FREE MONTHLY ON-TIME PERFORMANCE REPORTS FOR AIRLINES AND AIRPORTS
可以处理出每天关于机场的一些数据
Traffic_DataSet