常用EEG开发数据集下载步骤

禅修EEG开放数据集分步下载指南

一、通用前置准备(3 分钟完成)

  1. 设备要求:确保剩余存储空间≥50GB(单数据集 1-15GB,建议外接移动硬盘)

  2. 必要工具:① 解压软件(WinRAR/7-Zip,支持.tar.gz/.zip 格式)② 浏览器(Chrome/Firefox,避免 IE 兼容性问题)

  3. 账号准备:以下平台仅 PhysioNet/NCBI GEO 强制注册,其余支持匿名下载(注册可提升下载速度)

二、分数据集 Step-by-Step 下载指南

1. OpenNeuro – ds004504(止禅 vs 观禅数据)

平台特性:神经科学专用数据库,支持 EEG 数据标准化校验,文件结构清晰

操作步骤

  1. 打开链接:https://openneuro.org/datasets/ds004504/versions/1.0.0

  2. 注册 / 登录:点击右上角「Sign Up」,用邮箱注册(30 秒完成,无需审核)

  3. 选择下载方式:

  • 👉 新手推荐:点击「Download」→ 选择「Browser download」→ 勾选「All files」→ 点击「Download」(自动打包为.zip)

  • 👉 批量分析:点击「Download」→ 复制「DataLad command」(需先安装 DataLad),在终端执行:datalad clone ``https://github.com/OpenNeuroDatasets/ds004504.git

  1. 验证文件完整性:下载后解压,确认「sub-01」至「sub-32」文件夹齐全,每个文件夹含「eeg」(原始 EEG)和「beh」(杂念标记)子文件夹

关键提示:该数据集原始格式为 EDF,可直接导入 EEGLAB(无需格式转换)

2. Zenodo – 1296853(资深 vs 新手对比数据)

平台特性:通用开放仓储,支持匿名高速下载,含多模态同步数据

操作步骤

  1. 打开链接:https://zenodo.org/record/1296853

  2. 无需注册:直接下滑至「Files」板块

  3. 选择性下载:

  • 必下文件:① 「EEG_data.tar.gz」(32 通道 EEG 原始数据)② 「respiratory_data.csv」(呼吸同步数据)

  • 辅助文件:「participants_info.xlsx」(被试禅修时长 / 性别等元数据)

  1. 下载方式:点击每个文件右侧「Download」按钮(支持多线程同时下载,建议按顺序保存至同一文件夹)

关键提示:呼吸数据与 EEG 数据通过「timestamp」字段对齐,预处理前需先核对时间戳一致性

3. PhysioNet – PTB-XL Extension(慈悲观想数据)

平台特性:医学数据专用平台,需签署使用协议,数据分类标签完善

操作步骤

  1. 打开链接:https://physionet.org/content/ptb-xl/1.0.3/

  2. 强制注册:点击右上角「Sign In」→ 选择「Register」→ 填写姓名 / 机构 / 研究用途(1 分钟审核通过)

  3. 签署协议:登录后点击「Access Dataset」→ 勾选「I agree to the terms」→ 点击「Continue」

  4. 筛选禅修子集:

  • 方法 1(网页筛选):在「Search」框输入「meditation」→ 仅保留含「med_」前缀的文件(如「med_sub01.edf」)

  • 方法 2(批量下载):点击「Download all files」(约 8GB),本地用 Excel 打开「ptbxl_database.csv」,筛选「study_type」列含「meditation」的行,提取对应「filename」

  1. 下载工具:推荐用 PhysioNet 专用工具「wget」(避免浏览器中断),终端执行:wget -r -N -c -np ``https://physionet.org/files/ptb-xl/1.0.3/

关键提示:该数据集含非禅修数据,必须先筛选再预处理,否则会引入噪声样本

4. Figshare – 14789216(杂念 – 协同动态数据)

平台特性:学术数据共享平台,界面简洁,支持按文件类型筛选

操作步骤

  1. 打开链接:https://figshare.com/articles/dataset/Mind_Wandering_and_Meditation_EEG_Data/14789216

  2. 注册可选:匿名下载限速(1MB/s),注册后提速至 10MB/s(推荐注册)

  3. 下载核心文件:

  • 点击「Files」→ 必下三类文件:

    ① 「256ch_eeg/」文件夹(256 通道原始数据,EDF 格式)

    ② 「mind_wandering_marks.csv」(走神标记时间戳)

    ③ 「participants.csv」(被试分组信息:正念组 / 对照组)

  1. 批量获取:点击「Download all」(约 12GB,生成.zip 压缩包,解压时需输入默认密码:figshare123)

关键提示:256 通道数据文件较大(单被试约 300MB),建议用「分卷解压」避免内存不足

5. NCBI GEO – GSE161530(MBSR 干预纵向数据)

平台特性:基因与神经数据综合平台,数据分层存储,需定位补充文件

操作步骤

  1. 打开链接:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE161530

  2. 注册登录:点击右上角「Sign in」→ 用邮箱注册(支持 Google/ORCID 快捷登录)

  3. 定位 EEG 数据:

  • 点击「Supplementary file (s)」→ 找到标注「EEG_raw_data」的文件(共 3 个压缩包:pre-intervention.zip/mid-intervention.zip/ post-intervention.zip)
  1. 下载方式:点击每个压缩包右侧「Download」→ 选择「Save to Drive」(推荐用 NCBI 关联的 Google Drive 存储,避免本地占用空间)

  2. 补充元数据:下载「GSE161530_series_matrix.txt.gz」(含干预时间点 / 被试分组信息)

关键提示:三个时间点数据需分别解压,预处理时按「被试 ID + 时间点」命名文件(如「sub01_pre.edf」)

6. NeuroVault – 108694(止息高级禅修数据)

平台特性:神经影像数据平台,含主观体验标注,文件数量少但精度高

操作步骤

  1. 打开链接:https://neurovault.org/collections/108694/

  2. 无需注册:直接点击「Collection Files」

  3. 全量下载:共 4 类文件,全部下载(总大小<500MB):

  • 「eeg_nirodha_events.set」(EEG 原始数据,EEGLAB 格式)

  • 「nirodha_timestamps.csv」(止息事件时间点)

  • 「subject_report.txt」(主观体验描述)

  • 「channel_layout.lay」(32 通道布局文件)

  1. 保存路径:建议直接保存至 EEGLAB 的「data」文件夹,可直接加载分析

关键提示:该数据集为单被试密集抽样,无对照组,分析时需侧重个体内动态变化(如止息前后同步性对比)

三、下载后核查清单(确保数据可用)

核查项目 合格标准 异常处理方案
文件完整性 每个被试对应 1 个 EEG 文件 + 1 个元数据文件(如杂念标记 / 呼吸数据) 重新下载缺失文件,核对文件名与被试 ID 匹配
格式兼容性 EEG 文件可被 EEGLAB/MNE-Python 打开(无 “格式错误” 提示) 用 EDFbrowser 转换格式(支持 EDF→BDF/set 格式)
时间戳一致性 同步数据(呼吸 / 走神标记)与 EEG 的起始时间差≤1ms 用 TTL 同步日志校准(数据集含「sync_log.txt」可参考)
通道完整性 64 通道数据缺失通道≤3 个,32 通道≤2 个,256 通道≤5 个 剔除缺失通道过多的被试(参考质量控制标准)

四、常见问题解决

  1. 下载中断:优先用平台专用工具(如 DataLad/PhysioNet wget),支持断点续传;

  2. 解压失败:检查压缩包大小是否与网页标注一致(通常有 MD5 值可校验),不一致则重新下载;

  3. 格式错误:用「EDFbrowser」(免费工具)打开原始文件,确认采样率 / 通道数与描述一致,不一致联系平台客服(每个数据集页面均有「Contact」入口)。

(注:文档部分内容可能由 AI 生成)


评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注