EEGFlow Commons

Platform

検証基盤:Mind Uploading Verification Commons

PDB×BIDS×PhysioNet×OSFの発想で、WBEの“勝利条件”と“再現可能な前進”を作る

Mind Uploading Research Project

Open Access Last Updated: 2026-02-05 Operational Specification

One Problem

マインドアップロード(WBE)を「物語」ではなく「検証可能な研究プログラム」にするには、前進の定義検証の公共財が先に必要です。EEGFlowは、データ・指標・ルール・再現手順をWebで固定し、研究が積み上がる足場(Commons)を作ります。

TL;DR(人間向け)

3つだけ覚える

  • 主張より先に物差し:「何を満たせば前進か」を固定しないと、成果が比較できない
  • データだけでも不足:規格(標準)+置き場(共有)+評価(ベンチ)がセットで必要
  • WBEは特に“すり替え”が起きる:decode(相関)を emulation(生成/因果)と混同しない

このサイトで解く「1問」

問い:「何を満たせば“前進”と言えるか?」を事前に固定し、第三者が同じ入力(データ)で同じ結論(評価)に到達できる状態を作る。

Outcome

  • 勝利条件の固定:クレーム階段(L0〜L5)を明示し、L1をL4のように語る“すり替え”を防ぐ
  • 再現可能な入力:BIDS等の標準+メタデータで、解析対象を第三者に渡せる
  • 比較可能な出力:スコア・ログ・失敗例まで含む評価スイートを公開する
  • 継続運用:ベンチマーク更新、バージョン管理、監査ログで公共財を積み上げる

これは何ではないか(誤解防止)

Non-goals

このページは「マインドアップロードが可能/不可能」を断言する場所ではありません。EEGFlowが作るのは、断言が可能になるための検証基盤です(測定・評価・反証のルール)。

EEGFlow Commons の成果物(公共財)

01

Data Standard(入力の固定)

BIDS/EEG-BIDSをベースに、課題・刺激・同期・QC・匿名化のメタデータを拡張し、「解析可能な形」で共有できる規格を整備する。

BIDSEEGMetadataQC
02

Benchmark Suite(出力の固定)

デコーディング(相関)だけでなく、反事実・介入予測閉ループ安定性まで含めたタスク群を定義し、同じ物差しで比較できる状態にする。

CounterfactualInterventionClosed-loop
03

Registry & Prereg(“やる前”の固定)

実験・解析計画を事前登録し、探索と検証を区別する。プロトコルと変更履歴を残し、報告バイアスを下げる。

PreregistrationProtocolAudit
04

Leaderboard & Model Cards(比較の運用)

スコアだけでなく、データリーク対策、失敗例、計算資源、既知の弱点を“カード”として公開し、再現性と安全性を担保する。

LeaderboardReproducibilitySafety

具体例:1つの「比較可能な前進」はこう見える

たとえば「EEGから状態を推定するモデル」を例にすると、Commonsとして必要なのは次の4点です。

要素 最低限の中身(例)
入力(Data) BIDS準拠のデータ一式、計測条件、同期ログ、QCログ、匿名化/同意の範囲
手順(Code/Protocol) 前処理→特徴→学習→評価の固定レシピ、環境情報、乱数シード
出力(Metrics) スコア(精度/不確実性/頑健性)、失敗例、ベースラインとの差分
反証(Falsification) データリーク検査、反事実テスト、刺激条件の変更に対する予測外れの記録

これが揃うと「誰がやっても同じ条件で比較できる」ようになり、はじめて進捗が積み上がります。

歴史のケースワークから借りる設計

EEGFlowの設計は“新規発明”ではなく、他分野が既に解いてきた「検証の型」の移植です。代表例は ケースワーク集 に整理しています。

移植のコツ

PDB(単一アーカイブ)やBIDS+OpenNeuro(規格+置き場)、PhysioNet(データ+評価)、OSF/PROSPERO(事前登録)などの型は、分野が違っても「前進を測れる」構造を作ります。WBEは特に、達成条件反証条件を先に固定する必要があります。

最初の90日で実装する必須成果物

90-Day Execution Contract

  • Day 1-14:「前進の定義」を固定し、L0-L5ごとの合格条件・失敗条件・禁止される主張(すり替え)を明文化する。
  • Day 15-28:BIDS拡張メタデータとQCログ仕様を凍結し、必須フィールドを欠くデータは受理しない運用に切り替える。
  • Day 29-60:公開EEGデータで再現可能なベースラインを1本実装し、同一環境で再実行して同一スコアが出ることを確認する。
  • Day 61-90:反事実/介入予測を含む検証ベンチを公開し、モデル比較表(精度・頑健性・失敗例)を週次更新で運用開始する。
期間 必須成果物 受入条件(Doneの定義)
Day 1-14 評価契約書(L0-L5対応) 各レベルで「入力」「指標」「閾値」「反証条件」が空欄なしで定義され、ページ間で矛盾がない。
Day 15-28 BIDS拡張仕様 + QCスキーマ 必須キー欠落時に検証失敗となる。計測条件・同期情報・QCログが機械可読で抽出できる。
Day 29-60 再現可能ベースライン クリーン環境で3回再実行し、主要指標の差分が事前許容幅内に収まる。
Day 61-90 介入込みベンチ + 比較表運用 通常条件だけでなく反事実・介入条件のスコアを公開し、失敗ケースを毎週追記する。
運用ルール

上記4項目のいずれかが未達の場合、「準備中」ではなく「未達」と明記し、次の主張レベルへ進まない。達成条件を満たさない成果は、研究ノートとしては残しても、検証済み成果としては扱わない。