禅修EEG开放数据集分步下载指南
一、通用前置准备(3 分钟完成)
-
设备要求:确保剩余存储空间≥50GB(单数据集 1-15GB,建议外接移动硬盘)
-
必要工具:① 解压软件(WinRAR/7-Zip,支持.tar.gz/.zip 格式)② 浏览器(Chrome/Firefox,避免 IE 兼容性问题)
-
账号准备:以下平台仅 PhysioNet/NCBI GEO 强制注册,其余支持匿名下载(注册可提升下载速度)
二、分数据集 Step-by-Step 下载指南
1. OpenNeuro – ds004504(止禅 vs 观禅数据)
平台特性:神经科学专用数据库,支持 EEG 数据标准化校验,文件结构清晰
操作步骤:
-
注册 / 登录:点击右上角「Sign Up」,用邮箱注册(30 秒完成,无需审核)
-
选择下载方式:
-
👉 新手推荐:点击「Download」→ 选择「Browser download」→ 勾选「All files」→ 点击「Download」(自动打包为.zip)
-
👉 批量分析:点击「Download」→ 复制「DataLad command」(需先安装 DataLad),在终端执行:
datalad clone ``https://github.com/OpenNeuroDatasets/ds004504.git
- 验证文件完整性:下载后解压,确认「sub-01」至「sub-32」文件夹齐全,每个文件夹含「eeg」(原始 EEG)和「beh」(杂念标记)子文件夹
关键提示:该数据集原始格式为 EDF,可直接导入 EEGLAB(无需格式转换)
2. Zenodo – 1296853(资深 vs 新手对比数据)
平台特性:通用开放仓储,支持匿名高速下载,含多模态同步数据
操作步骤:
-
无需注册:直接下滑至「Files」板块
-
选择性下载:
-
必下文件:① 「EEG_data.tar.gz」(32 通道 EEG 原始数据)② 「respiratory_data.csv」(呼吸同步数据)
-
辅助文件:「participants_info.xlsx」(被试禅修时长 / 性别等元数据)
- 下载方式:点击每个文件右侧「Download」按钮(支持多线程同时下载,建议按顺序保存至同一文件夹)
关键提示:呼吸数据与 EEG 数据通过「timestamp」字段对齐,预处理前需先核对时间戳一致性
3. PhysioNet – PTB-XL Extension(慈悲观想数据)
平台特性:医学数据专用平台,需签署使用协议,数据分类标签完善
操作步骤:
-
强制注册:点击右上角「Sign In」→ 选择「Register」→ 填写姓名 / 机构 / 研究用途(1 分钟审核通过)
-
签署协议:登录后点击「Access Dataset」→ 勾选「I agree to the terms」→ 点击「Continue」
-
筛选禅修子集:
-
方法 1(网页筛选):在「Search」框输入「meditation」→ 仅保留含「med_」前缀的文件(如「med_sub01.edf」)
-
方法 2(批量下载):点击「Download all files」(约 8GB),本地用 Excel 打开「ptbxl_database.csv」,筛选「study_type」列含「meditation」的行,提取对应「filename」
- 下载工具:推荐用 PhysioNet 专用工具「wget」(避免浏览器中断),终端执行:
wget -r -N -c -np ``https://physionet.org/files/ptb-xl/1.0.3/
关键提示:该数据集含非禅修数据,必须先筛选再预处理,否则会引入噪声样本
4. Figshare – 14789216(杂念 – 协同动态数据)
平台特性:学术数据共享平台,界面简洁,支持按文件类型筛选
操作步骤:
-
打开链接:https://figshare.com/articles/dataset/Mind_Wandering_and_Meditation_EEG_Data/14789216
-
注册可选:匿名下载限速(1MB/s),注册后提速至 10MB/s(推荐注册)
-
下载核心文件:
-
点击「Files」→ 必下三类文件:
① 「256ch_eeg/」文件夹(256 通道原始数据,EDF 格式)
② 「mind_wandering_marks.csv」(走神标记时间戳)
③ 「participants.csv」(被试分组信息:正念组 / 对照组)
- 批量获取:点击「Download all」(约 12GB,生成.zip 压缩包,解压时需输入默认密码:figshare123)
关键提示:256 通道数据文件较大(单被试约 300MB),建议用「分卷解压」避免内存不足
5. NCBI GEO – GSE161530(MBSR 干预纵向数据)
平台特性:基因与神经数据综合平台,数据分层存储,需定位补充文件
操作步骤:
-
打开链接:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE161530
-
注册登录:点击右上角「Sign in」→ 用邮箱注册(支持 Google/ORCID 快捷登录)
-
定位 EEG 数据:
- 点击「Supplementary file (s)」→ 找到标注「EEG_raw_data」的文件(共 3 个压缩包:pre-intervention.zip/mid-intervention.zip/ post-intervention.zip)
-
下载方式:点击每个压缩包右侧「Download」→ 选择「Save to Drive」(推荐用 NCBI 关联的 Google Drive 存储,避免本地占用空间)
-
补充元数据:下载「GSE161530_series_matrix.txt.gz」(含干预时间点 / 被试分组信息)
关键提示:三个时间点数据需分别解压,预处理时按「被试 ID + 时间点」命名文件(如「sub01_pre.edf」)
6. NeuroVault – 108694(止息高级禅修数据)
平台特性:神经影像数据平台,含主观体验标注,文件数量少但精度高
操作步骤:
-
无需注册:直接点击「Collection Files」
-
全量下载:共 4 类文件,全部下载(总大小<500MB):
-
「eeg_nirodha_events.set」(EEG 原始数据,EEGLAB 格式)
-
「nirodha_timestamps.csv」(止息事件时间点)
-
「subject_report.txt」(主观体验描述)
-
「channel_layout.lay」(32 通道布局文件)
- 保存路径:建议直接保存至 EEGLAB 的「data」文件夹,可直接加载分析
关键提示:该数据集为单被试密集抽样,无对照组,分析时需侧重个体内动态变化(如止息前后同步性对比)
三、下载后核查清单(确保数据可用)
| 核查项目 | 合格标准 | 异常处理方案 |
|---|---|---|
| 文件完整性 | 每个被试对应 1 个 EEG 文件 + 1 个元数据文件(如杂念标记 / 呼吸数据) | 重新下载缺失文件,核对文件名与被试 ID 匹配 |
| 格式兼容性 | EEG 文件可被 EEGLAB/MNE-Python 打开(无 “格式错误” 提示) | 用 EDFbrowser 转换格式(支持 EDF→BDF/set 格式) |
| 时间戳一致性 | 同步数据(呼吸 / 走神标记)与 EEG 的起始时间差≤1ms | 用 TTL 同步日志校准(数据集含「sync_log.txt」可参考) |
| 通道完整性 | 64 通道数据缺失通道≤3 个,32 通道≤2 个,256 通道≤5 个 | 剔除缺失通道过多的被试(参考质量控制标准) |
四、常见问题解决
-
下载中断:优先用平台专用工具(如 DataLad/PhysioNet wget),支持断点续传;
-
解压失败:检查压缩包大小是否与网页标注一致(通常有 MD5 值可校验),不一致则重新下载;
-
格式错误:用「EDFbrowser」(免费工具)打开原始文件,确认采样率 / 通道数与描述一致,不一致联系平台客服(每个数据集页面均有「Contact」入口)。
(注:文档部分内容可能由 AI 生成)
发表回复