Traffic_DataSet

数据集整理,不定期更新

在这里,我会描述一些使用过的数据集,附带数据来源

如果有数据的话,会根据链接内的数据格式进行简单介绍

🚗🚗🚗🚗🚗🚗

🔥🔥🔥Pems:

目前使用最多的数据集,基于该网站,许多科研人提取出了一些简单好用的公开数据集,本文之后会分别介绍

数据来源:加州地区的sensor station
官网Link (应该是需要翻墙), OG

根据位置不同,共分为了12个区域/districts

p1

附由Davidham3做的python爬取脚本Link

PemsD7 (M/L)

出现于 Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecasting (IJCAI’18)

下载见链接

PemsD4

出现于 Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting (ASTGCN) (AAAI’19)

下载见链接

PemsD8

出现于 Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting (ASTGCN) (AAAI’19)

下载见链接

METR-LA

出现于 Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting

下载见链接

PEMS-BAY

出现于 Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting

下载见链接

(作者在原仓库中有附带detector id!)

北京市四维图新公司公布,基于每个时间段内道路区间内的所有车辆的平均速度采样而来,包含中国许多城市(e.g., 北京,上海,广州,深圳等)的交通主干道道路速度和拥挤指数数据。

官网链接

截止 2020.10.24,以于2020.7.22日停止更新

香港道路速度

链接,该数据由香港公共开放数据提供,包括香港各主要道路的平均行车速度。

官方提供数据下载开始自2021年3月10日。

Others (Time-series)

Localization Data for Person Activity Data Set

Link

人类活动数据集(activity)的定位由记录5人进行11种活动的运动状态的多元运动学时间序列组成。每个人都在左右脚踝、胸部和腰带上佩戴四个传感器(标签)来记录三维坐标。在40个连续时间步的实验中使用了4100个时间序列样本。

The PhysioNet Computing in Cardiology Challenge 2012

Link

PhysioNet Challenge 2012数据集(PhysioNet)包含4000个多变量临床时间序列,41个测量值来自重症监护病房(ICU), 554名患者死于医院。每个样本在患者进入ICU后的48小时内采集。原始数据集中有80.67%的缺失值。

Air Quality Data

AQI 1

Link

KDD CUP 2018年数据集(KDD)包含北京市36个监测站2014年5月1日至2015年4月30日每小时PM2.5数据,缺失率为13.30%。在连续24小时内,共有365个相同标签的时间序列样本。

AQI 2

Platform

具有大概两三年的AQI指数,包含非常多城市的AQI,时间跨度为天

AQI 3

Link
香港AQI指数,最多细化至每小时,下载方便

Aircraft

FREE MONTHLY ON-TIME PERFORMANCE REPORTS FOR AIRLINES AND AIRPORTS

可以处理出每天关于机场的一些数据

参考论文

OG

https://www.oag.com/monthly-on-time-performance-reports

作者

Shuyu Zhang

发布于

2020-10-15

更新于

2022-10-16

许可协议

评论