ワードリストの科学：なぜ「犬」は「星雲」に勝るのか

すべての言葉が同じではない

お子さんが電話の相手が本当におばあちゃんなのか、AI音声クローンなのかを確認しなければならないとき、セーフワードは瞬時に出てくる必要があります。ためらいも、「あれ、『深紅』だったっけ『紅』だったっけ？」という迷いも、思い出せない言葉のもどかしさもあってはなりません。うまくいく言葉と失敗する言葉の違いは、数十年にわたる認知科学の研究成果にかかっています。

私たちは心理言語学、記憶研究、セキュリティ研究のエビデンスに基づいて、ワードリストをゼロから再構築しました。科学が示す知見と、それが私たちのジェネレーターのすべての言葉にどう反映されているかをご紹介します。

最も重要な2つのグループ

セーフワードは全員に有効でなければなりませんが、最もリスクの高い2つのグループがあります。高齢者（65歳以上）は音声クローン詐欺の主要ターゲットであり、子ども（6〜12歳）はお迎え確認コードが必要です。これらのグループには特定の認知特性があり、特定の言葉の性質が求められます。

高齢者は「舌先現象（TOT）」——言葉は知っているのに出てこない状態——をより頻繁に経験する。幼少期に覚えた言葉はTOTの失敗に耐性がある。
子どもの語彙は限られている。「コバルト」や「星雲」といった言葉は、まだ知識の中にないかもしれない。
どちらのグループもワーキングメモリの容量が小さく、長い言葉や複雑な言葉の保持と反復が困難。
電話での確認はノイズ、時間的プレッシャー、ストレスが加わり、難しい言葉の想起をさらに低下させる。

基準1：具象性——頭に浮かべられるか？

人が言葉を覚えるかどうかの最も強力な予測因子は具象性——どれだけ容易にメンタルイメージが浮かぶか——です。「犬」と聞けば瞬時に頭に絵が浮かびます。「量子」では浮かびません。これは二重符号化理論（Paivio, 1971）で説明されます：具象的な言葉は言語と視覚の両方の記憶システムに保存され、脳に1つではなく2つの想起経路を提供します。

2倍

の想起優位性——具象的な言葉は自由再生実験で抽象的な言葉の約2倍よく記憶される

Brysbaertら（2014）は40,000語の英単語を具象性について1〜5のスケールで評価しました。私たちは4.0以上のスコアの言葉を優先しました。リストに含まれるすべての動物、食べ物、日用品は鮮明なメンタルイメージを生み出します。「量子」「スペクトル」「デジタル」「コスモ」などの抽象的な用語は具象性評価が3.0未満であるため除外しました。

基準2：習得年齢——早いほど定着する

幼少期に学んだ言葉はより深く保存され、加齢に伴う想起の困難に耐性があります。これは習得年齢（AoA）効果と呼ばれ、心理言語学で最も確立された知見のひとつです。Kupermanら（2012）は30,000語のAoA評価を収集しました。

高齢者にとってこれは極めて重要です。詐欺電話の際にストレスホルモンが脳にあふれると、幼少期に学んだ言葉は残りますが、後に学んだ言葉はアクセスできなくなります。78歳の人は「犬」や「りんご」を常に思い出せますが、「マンドリン」や「パビリオン」はプレッシャー下では出てこないかもしれません。

私たちは習得年齢が6.0以下——つまり通常6歳までに学ぶ言葉——を優先しました。これにより、子どもと高齢者の両方が共通の、深く根付いた語彙を共有できます。

基準3：生物優位性

生き物は無生物よりもよく記憶されます。複数の研究で、生物を表す言葉（動物、人間）は、頻度、具象性、心象性を統制しても、自由再生で一貫して無生物を表す言葉を上回りました。Aka, Phan, and Kahana（2021）が大規模な記憶実験でこの「生物優位性」を実証しています。

105語

の動物語が名詞リストに含まれている——生き物の言葉が最も記憶に残りやすいため、最大のカテゴリ

名詞リストが動物で始まるのはこのためです：犬、猫、馬、クマ、ペンギン、イルカ、ワシ、カメ。これらは単になじみ深いだけでなく、深い進化的認識システムを活性化します。人間の脳は生き物に気づき記憶するよう進化しており、その優位性はストレス下でも持続します。

基準4：電話の安全性——声に出して言ってみる

紙の上では問題ないように見える言葉が、電話では完全に失敗することがあります。MillerとNicely（1955）の古典的研究は、ノイズの中でどの子音が混同されるかをマッピングしました：b/d、m/n、p/t、f/s。NATOフォネティックアルファベットの設計に関する現代の研究でも、特定の音声パターンが劣化した音声チャネルでは本質的にクリアであることが確認されています。

同音異義語：「シンバル」は「シンボル」と同じに聞こえ、「パレット」は「味覚」と紛らわしい
発音のバリエーション：地域によって発音が異なる言葉
聞いただけでは綴れない言葉：外来語の「フォカッチャ」「ブリオッシュ」「ライチ」など
最小対語：電話では紛らわしすぎる言葉のペア

基準5：類義語の罠を排除

再生エラーに関する認知研究によると、似た言葉は互いに干渉します。セーフワードに「深紅」を使っているのにリストに「紅」「えんじ」「ルビー」も含まれていると、プレッシャー下で脳が間違った類義語を引き出す可能性があります。これは「再生置換」——正しい概念だが間違った言葉——と呼ばれます。

私たちは類義語クラスターを体系的に整理しました。「暗い赤」の4語から1語を残し、「勇敢」の3つの類義語から1つを残し、「走る」系の4つの動詞から1つを残しました。ルールは：1つの概念につき最大1語です。

基準6：基本レベルカテゴリ

認知心理学者のエレノア・ロッシュは1976年に、人間は「基本レベル」のカテゴリで自然に思考することを実証しました。犬を見たとき、「哺乳類」（抽象的すぎる）でも「ゴールデンレトリバー」（具体的すぎる）でもなく、「犬」と認識します。基本レベルの言葉は最も速く認識され、最も早く学習され、文化を超えて最も頻繁に使用されます。

私たちはカテゴリ特化型の言葉を基本レベルの同等語に置き換えました。「コンドル」や「ミサゴ」の代わりに「タカ」と「ワシ」——基本レベルの鳥——を使用します。「パースニップ」や「レンズ豆」の代わりに「ニンジン」と「ジャガイモ」を使用します。基本レベルの言葉は、概念から言葉への最速経路なのです。

なぜ2のべき乗サイズなのか？

私たちのリストには形容詞256語、名詞512語、動詞128語がちょうど含まれています。これは恣意的ではなく、技術的理由で選ばれた2のべき乗です。モバイルアプリが時間ベースのコード（TOTP）から言葉を導出する際、暗号ハッシュからバイトを抽出します。ランダムバイトを2のべき乗でない数で割ると、一部の言葉がわずかに出やすくなります（剰余バイアス）。2のべき乗サイズはこのバイアスを完全に排除します。

1,180万通り

の標準セーフワード組み合わせが可能（256 × 512 × 90）——約23.5ビットのエントロピー

除外した言葉とその理由

科学/宇宙関連語（18語）：「パルサー」「クエーサー」「量子」「アイソトープ」「フォトン」——子どもにも高齢者にもなじみがない。具象的な宇宙語「ロケット」「彗星」「日食」など9語は残した。
古い時代のもの（19語）：「フラゴン」「城壁」「王笏」「紡錘」——ほとんどの人が実物を見たことのない中世の物品。
外国の特殊食品（10語）：「フォカッチャ」「ブリオッシュ」「ライチ」——聞いただけでは綴りにくく、多くの人になじみがない。
珍しい動物（12語）：「コンドル」「テナガザル」「ミサゴ」「イッカク」——「犬」「猫」「馬」のように世界共通で知られている動物に置き換えた。
類義語クラスター（30語以上）：3つのリストすべてで、1つの概念につき1語に絞った。

追加した言葉——欠けていた基本語

監査で最も驚いた発見は、英語で最も基本的で普遍的に知られている言葉がリストに欠けていたことでした。「赤」も「青」もない。「犬」も「猫」もない。「りんご」も「バナナ」もない。「スプーン」も「椅子」もない。すべての人が知っていて、すべての子どもが最初に覚え、すべての高齢者が楽に思い出せる言葉——それがリストになかったのです。

基本色：赤、青、緑、黄色、オレンジ、ピンク、白、黒——すべての幼児が知っている色
身近な動物：犬、猫、馬、クマ、カエル、アヒル、フクロウ、クジラ、サル——世界中で認知されている
日常の食べ物：りんご、バナナ、パン、チーズ、ピザ、クッキー——どの台所にもあるもの
日用品：スプーン、フォーク、時計、椅子、コップ、お椀、ドア、鍵——毎日触れるもの
体の動作：走る、歩く、食べる、眠る、笑う——すべての人が行うこと

10項目のバリデーションテスト

リスト内のすべての言葉が10項目のバリデーションチェックリストに合格しています。これはスコアリングではなく、合否判定です。1項目でも不合格なら除外されます。

7歳の子どもが頭に思い浮かべられるか？
6歳の子どもがこの言葉を知っているか？
日常的によく使われる言葉か？
声に出して言ってみて——電話で混乱するリスクはないか？
一度聞いただけで綴れるか？
すでにリストに類義語がないか？
すでにリストに同音異義語がないか？
特定の文化に限定されていないか？
ポジティブまたは中立的——怖い、暴力的、ネガティブではないか？
1〜3音節、3〜8文字が望ましいか？

参考にした研究

私たちの言葉の選定は、複数の分野からの収束的なエビデンスに基づいています。これらは都合のいい研究を拾い集めたものではなく、認知心理学、セキュリティ研究、応用言語学における数十年にわたって再現された知見を代表しています。

Brysbaert, Warriner & Kuperman (2014) ——40,000語の英単語の具象性評価。Behavior Research Methods誌に掲載。
Kuperman, Stadthagen-Gonzalez & Brysbaert (2012) ——30,000語の英単語の習得年齢規範。
Aka, Phan & Kahana (2021) ——生物優位性に焦点を当てた言葉の記憶しやすさの予測。
Rosch (1976) ——基本レベルカテゴリ：なぜ「犬」は「ビーグル」や「動物」より速く認識されるのか。
SUBTLEX-US ——アメリカ映画の字幕5,100万語から導出された単語頻度規範。
EFF Diceware (2016) ——電子フロンティア財団による安全なパスフレーズのための改良ワードリスト基準。
Miller & Nicely (1955) ——雑音環境での子音の混同パターン。電話で安全な言葉の設計の基礎。
Shay et al. (2012, CMU SOUPS) ——場面構成によるパスフレーズの記憶可能性。
NCMEC KidSmartz ——全米行方不明・被搾取児童センターの家族合言葉ガイドライン。

私たちのワードリストはモバイルアプリの時間ベースコードシステムのためにバージョン管理され凍結されています。今日生成されたすべてのセーフワードは、何年後でもオフラインでも検証可能です。言葉の選定の背後にある科学が、世代を超えて記憶に残り続けることを保証しています。

ワードリストの科学：なぜ「犬」は「星雲」に勝るのか

すべての言葉が同じではない

最も重要な2つのグループ

基準1：具象性——頭に浮かべられるか？

基準2：習得年齢——早いほど定着する

基準3：生物優位性

基準4：電話の安全性——声に出して言ってみる

基準5：類義語の罠を排除

基準6：基本レベルカテゴリ

なぜ2のべき乗サイズなのか？

除外した言葉とその理由

追加した言葉——欠けていた基本語

10項目のバリデーションテスト

参考にした研究

関連記事

ディープフェイクとは？ あなたの大切な人を守るために知っておくべきこと

実話：AI音声詐欺で数千ドルを失った人々

信頼する人々を守る準備はできましたか？

ディープフェイクとは？あなたの大切な人を守るために知っておくべきこと