どうも、太陽です。
創造性とは何か。それを数値で測れるのか。そんな疑問を抱きながら、私はナゾロジーの記事で紹介されていた「意味の遠い単語を組み合わせる力」を測定する創造性テスト(DAT: Divergent Association Task)を試してみた。
https://nazology.kusuguru.co.jp/archives/93854
創造的な人は「意味の遠い単語を組み合わせる」のが得意と明らかに
記事によると、創造的な人は「意味の遠い単語を組み合わせる」のが得意であり、このテストは既存の創造性測定テストよりも精度が12倍優れていることが明らかになっているという。
実際にナゾロジー編集部が試した結果は75.62点だったと紹介されていた。
そこで私も挑戦してみた。最初のチャレンジではスコアは78.05点となり、この課題を行った人のうち47.19%より高いという結果だった。
平均スコアは78点で、多くの人は74〜82点に収まるとのことなので、ほとんど「平均ど真ん中」といえる。なお、これまでのサンプルで最も低いスコアは24点、最も高いスコアは96点だったそうだ。
理論上は0から200までの範囲を取れるが、実際には数百万件の回答分析から6〜110点の間に収まる傾向があるという。
このテストでは、スコアは「単語同士の意味的な距離の平均値」で算出される。距離は「単語が似た文脈でどのくらい一緒に使われるか」に基づいて計算され、10個入力した単語のうち最初の有効な7語を使用する仕組みだ。
ミススペルや専門用語など無効な語が含まれても、最大3語までであれば計算可能だという。注意点として、このテストは言語的創造性の一面だけを測るものであり、低いスコアだからといって創造性がないわけではない。
また、実際に現実世界で発揮される多様な創造性の成果をすべてカバーするわけでもない。
結果をChatGPTに訳してもらいました。
スコアと比較
あなたのスコアは 78.05、これはこの課題を行った人の 47.19% より高いです。
平均スコアは 78 で、多くの人は 74~82 の間に収まります。これまでのサンプルで最も低いスコアは 24、最も高いスコアは 96 でした。理論的には 0~200 の範囲を取りますが、実際には 6~110 程度に収まる傾向があります(数百万件のオンライン回答の分析から)。
注意書き
- 低いスコアだからといって創造性がないわけではありません。
- このタスクは「言語的創造性」の一面だけを測るもので、現実世界の多様な創造的成果をカバーするものではありません。
計算方法
- スコアは「単語同士の意味的な距離の平均値」で算出されます。
- この距離は「単語が似た文脈でどのくらい一緒に使われるか」で計算されます。
- 10個の単語のうち、最初の 有効な7語 を使用します。
- ミススペルや専門用語など「無効な語」が3語まで含まれても計算は可能。
- この仕組みを理解した上でもう一度挑戦することもできますが、「最初に出したスコア」だけが有効です。
さらなる研究
- 3分のスマホ利用調査
- 11分のパターン認識調査(モントリオール大学)
解釈(Interpretation)
- 創造性は複雑なプロセスで、このタスクはそのごく一部しか測っていません。
- 焦点は「言語的創造性」と「拡散的思考」(多様な答えを生み出す力)です。
- 研究では、このタスクのスコアは他の創造性尺度とも相関があることが分かっています。
- ただし 限界もあり、創造性の一側面しか測れません。
著者について
- この課題は Dr. Jay Olson によってハーバード大学在籍時に開発されました。
- 彼はカナダの大学院生向けに「資金調達のための本」を執筆。
- 現在はトロント大学の博士研究員であり、カナダ政府の「イノベーション・インパクト部門」の研究員でもあります。
- このタスクは マギル大学 および メルボルン大学 の研究者によって検証されました。
👉 要約すると:
あなたのスコアは「平均ど真ん中」で、創造性の中でも 言語的な多様性を測るテストの範囲内で標準的な結果。低い=創造性なし、高い=天才、という単純な評価ではなく、創造性の一部の測定にすぎません
1回目はよく仕組みがわからないままやったので、もう1回チャレンジしてみたら、以下の結果でした。
スコアと比較
あなたのスコアは 87.51、これはこの課題を行った人の 93.27% より高いです。
平均スコアは 78 で、多くの人は 74~82 の間に収まります。これまでのサンプルで最も低いスコアは 24、最も高いスコアは 96 でした。理論的には 0~200 の範囲を取りますが、実際には 6~110 程度に収まる傾向があります(数百万件のオンライン回答の分析から)。
計算方法
- スコアは「単語同士の意味的な距離の平均値」で算出されます。
- この距離は「単語が似た文脈でどのくらい一緒に使われるか」で計算されます。
- 10個の単語のうち、最初の 有効な7語 を使用します。
- ミススペルや専門用語など「無効な語」が3語まで含まれても計算は可能。
- この仕組みを理解した上でもう一度挑戦することもできますが、「最初に出したスコア」だけが有効です。
さらなる研究
- 3分のスマホ利用調査
- 11分のパターン認識調査(モントリオール大学)
解釈(Interpretation)
- 創造性は複雑なプロセスで、このタスクはそのごく一部しか測っていません。
- 焦点は「言語的創造性」と「拡散的思考」(多様な答えを生み出す力)です。
- 研究では、このタスクのスコアは他の創造性尺度とも相関があることが分かっています。
- ただし 限界もあり、創造性の一側面しか測れません。
著者について
- この課題は Dr. Jay Olson によってハーバード大学在籍時に開発されました。
- 彼はカナダの大学院生向けに「資金調達のための本」を執筆。
- 現在はトロント大学の博士研究員であり、カナダ政府の「イノベーション・インパクト部門」の行動科学フェローでもあります。
- このタスクは マギル大学 および メルボルン大学 の研究者によって検証されました。
👉 今回は 87.51点(上位7%以内) とかなり高い結果が出ています。
つまり、上位6.73%で、偏差値なら64〜65に相当し、IQテストに変換するとIQ122前後となる。
仮に1万人が受験したとすると上位673人以内に入る計算であり、学校で言えば40人クラスの中で2〜3番目にあたる位置にある。
企画や発想は自分の最大の強みだと考えてきたが、それでもこのテストで換算すると偏差値64〜65程度にとどまる。やはり突出するためには、アイデアそのものだけでなく、情報を膨大に浴び、そこから積み重ねを続ける努力で差別化を図る必要があるのだろう。
なお、このテストは2回目もチャレンジできるが、「最初に出したスコア」だけが正式に有効とされる。そのため私の場合は最初の78.05点が公式なスコアとなり、結果は平均ということになる。
創造性をめぐる数値は確かに刺激的だ。しかし本当の勝負は、数値の上下ではなく、それをどう現実の行動や積み重ねにつなげていくかにあるのだと思う。
追記として、AIに創造性テスト(DAT)を理解させた上で、トップレベルのスコアが出る10の英単語を抽出してもらい、それをコピペして試してみた結果が以下だ。
あなたのスコアは 88.39 で、この課題を行った人の 94.84% より高いです。
平均スコアは78で、多くの人は74~82の間に収まります。これまでのサンプルで最も低いスコアは24点、最も高いスコアは96点でした。
理論的には0から200までの範囲を取れますが、実際には数百万件のオンライン回答の分析から6~110点の間に収まる傾向があります。
計算方法
スコアは「単語同士の意味的な距離の平均値」で算出されます。
この距離は「単語が似た文脈でどのくらい一緒に使われるか」に基づいて計算されます。
10個の単語のうち、最初の有効な7語を使用します。冗長性を考慮して、一部の語が無効(例:スペルミスや専門用語など)でも、最大3語までは無効とされつつ全体のスコアは計算可能です。
仕組みを理解したうえで再挑戦することもできますが、正式に有効なのは「最初のスコア」だけです。
さらなる研究
- 3分のスマホ利用調査
- 11分のパターン認識調査(モントリオール大学)
解釈(Interpretation)
創造性は複雑なプロセスであり、このタスクはそのごく一部しか測っていません。
焦点は「言語的創造性」と「拡散的思考」(多様な答えを生み出す力)です。
研究では、このタスクのスコアが他のさまざまな創造性測定とも相関することが確認されています。
ただし、このテストにも限界があり、創造性の一側面しか測定していません。
著者について
この課題は Dr. Jay Olson によってハーバード大学在籍時に開発されました。
彼はカナダの大学院生向けに「資金調達のための本」を執筆。
現在はトロント大学の博士研究員であり、カナダ政府の イノベーション・インパクト部門 に所属する行動科学フェローでもあります。
このタスクは マギル大学 および メルボルン大学 の研究者によって検証されています。
👉 今回は 88.39点(上位約5%) と非常に高い結果でした。
AIで上位約5%である。(ChatGPT5)
さとりさんの結果も載せます。

あなたのスコアは 95.31 で、この課題を完了した人のうち 99.99% よりも高いです。
表(単語ごとのスコア)
- neutrino
- suck → 108
- oracle → 100, 92
- tomahawk → 95, 88, 93
- garbanzo → 97, 92, 85
- significant → 91, 89, 95, 108, 106
- empress → 97, 96, 86, 91, 97, 102
(※行と列の組み合わせで、単語間の意味的な距離スコアを表しています。)
下段の説明文
平均スコアは 78 で、ほとんどの人は 74〜82 の範囲に収まります。
公開されたサンプルでは最低スコアが 24、最高スコアが 96 でした。
スコアは理論上 0〜200 の範囲を取りますが、実際には数百万件の回答の集計後、6〜110 の範囲に収まります。
他の人の結果は Twitter で確認できます。
ツイート本文(さとりさんのコメント)
- 「結構ハイスコア出た。リンク欄にリンクあります。」
- 「昨日セミナーで話したことが研究で証明されていました。」
👉要するに、この人は「創造性テスト(DAT: 遠い意味の単語を選ぶ課題)」を受けて、95.31点という 超トップレベル(99.99%以上) のスコアを出した、という投稿です。
この 95.31 のスコアは 偏差値にするとおよそ 90〜93 程度 で、「上位0.01%」に入る超トップレベルの結果と言えます。
👉 まとめると:
- 偏差値 90 以上
- 東大入試や医師国家試験でもなかなか見られない “怪物レベル” の突出度