How To Use
このページは「まず何で検証する?」に答えるための実務用リストです。EEGFlowでは、公開データを使って L0(再現可能性) と L1〜L2(予測と介入検証) を積み上げることを重視します。
1) まず押さえる共有基盤(置き場)
A
B
C
2) EEGスターターパック(まずこれでL0〜L1)
最初は「使いやすい」「参照が多い」「前処理パイプラインが作りやすい」データから始めるのがおすすめです。 ここでは入口として有名なものを挙げます(網羅ではありません)。
| データセット | 何ができるか(例) | リンク |
|---|---|---|
| EEG Motor Movement/Imagery | 運動/運動想起の分類、前処理の練習、ベースライン比較 | PhysioNet |
| CHB-MIT Scalp EEG | てんかん発作検出、イベント検出、長時間EEGの扱い | PhysioNet |
| Sleep-EDF | 睡眠段階推定、状態遷移のモデル化、縦断的変動の扱い | PhysioNet |
| TUH EEG Corpus(大規模) | スケールするEEG分類、実運用寄りの分布の難しさ、データリーク対策 | TUH EEG |
3) “データがある”だけで終わらせないチェックリスト
Checklist
- 再現:取得手順、ライセンス、前処理条件、乱数、環境が書けるか
- メタデータ:サンプリング、参照、電極配置、イベント定義、同期情報が揃うか
- QC:ノイズ・欠損・アーティファクトが定量化されているか
- 比較:ベースラインがあり、同じ指標で比較できるか
- 反証:データリーク検査、反事実テスト、失敗例の記録があるか
4) EEGFlowで「共有できるデータ」にする最短ルート
EEGFlowが目指すのは、単にデータを集めることではなく、第三者が検証できる形で残すことです。 そのための最短ルートは BIDS/EEG-BIDS に寄せることです。