丁錬がチェスの新世界チャンピオンになったというニュースは、おそらくほとんどの人が耳にしたことがあるだろう。チェスファンである私は、当然ながら対局の展開を追いかけ、ストックフィッシュというAIボットを使って分析した。
ストックフィッシュのようなチェスエンジンがどのように正確に局面を分析し、評価しているかは不明だが、その出力は人間にも理解できる。肯定的な評価は白の勝利を意味し、引き分けには0という評価が与えられ、否定的な評価は黒の勝利を意味する、といった具合だ。
しかし、この数字はどこから来るのか?それは、Stockfishが独自にポジションを評価し、多くの要素を加味して数字を出力したものです。私たちはよく、この数字が片方が何ポーン分のアドバンテージを持っているかにほぼ等しいと言われる。
しかし、これはチェスプレーヤーにとって、チェスのポジションを理解するための恐ろしく直感的でない方法である。
この数字は私たちに答えを与えてくれる。そして、AIは誰が勝っていて、何が最善の手なのかを評価するために、非常に多くの異なる要素や、将来起こりうる動きなどを考慮に入れているため、その数字は客観的に正しいことがほとんどだ。
はるかに重要なのは、『なぜそのポジションの評価がそうなのか』という問いである。そして、その答えを知っても、その理由をあなたにとって照らし出すことにはならない。
チェスプレイヤーとしては、これは腹立たしいことだ。チェスエンジンの評価の理由を探すのに時間を費やさざるを得ないが、しばしばその理由を見つけるのは難しい。
非常に難しい問題を与え、答えも教えるが、一緒に推理したりヒントを与えたりすることを拒否する教師を想像してみてほしい。あなたは当然、そのような教師は教師として失格だと結論づけるだろう。しかし、その答えはほぼ間違いなく正しい-それには十分な理由がある。
AIアルゴリズムが私たちを困惑させるのは、これだけではない。NetflixやYoutubeのようなウェブサイトでは、AIアルゴリズムが私たちに見るべきビデオを推薦するために使われており、私たちがサイトに長く滞在すればするほど、アルゴリズムはより良くなる。しかし、私たちがその成功を測る指標や、これらのアルゴリズムがアクセスしたデータを指摘する以外には、これらのAIアルゴリズムについて私たちが実際に理解していることはほとんどない。
しかし、彼らが成功した理由を理解することは、私たちに大いに役立つはずであり、これこそがAIの次の大きな発展であるはずだ。
客観性と分かりやすさは同じではない
私たちが理解できるAIを作るというのは、AIの言っていることが理解できるという意味ではなく、直感的に説明できるAIを作るということだ。
ストックフィッシュの対抗馬は、グーグルの子会社ディープマインドが開発したアルファゼロだ。AlphaZeroはチェスのポジションと手を評価し、一見ランダムな数値を出力する代わりに、ポジションを確率で測定する。AlphaZeroが出力する数値は-1から1の間であるのに対し、Stockfishは数百に及ぶ数値を出力することが多く、この数値が何を意味するのか正確にはわからない。
下のグラフは、従来のチェスエンジンの評価(しばしばセンチポーンで示される)とリーラ(アルファゼロの後継)の評価の相関関係を示している。
重要なのは、アルファゼロとリーラが依然として客観的な評価を下していることだ。なぜか?それは、あなたがどれだけそれを感じているかに、よりマッチした評価を与えてくれるからです。
ポジションが0から+5になることは、引き分けから白が高い確率で勝てるようになることと相関する。しかし、ポジションが+5から+10になることと、本当に大きな違いがあるのだろうか?ストックフィッシュは同じ評価の違いを示しているが、0から+5への変化は、勝つ可能性がない状態から勝つ可能性が80%になったことをほぼ反映しているのに対し、+5から+10への変化は、勝つ可能性がさらに10%増えるだけである。
なぜこの指標が優れているのか?なぜなら、この指標はポジションが私たちにどのように感じられるかにより相関しているからだ。引き分け0から+5のアドバンテージになった陣地を見ていると、白がうまく相手にプレッシャーをかけている一方で、相手はそのプレッシャーに屈しているように感じられる。一方、+5から+10へのアドバンテージの増加は、ほとんどの仕事がすでに終わっているため、あまり感じられない。
これは、私がAIをより分かりやすくするという意味の一部であり、この場合のAIはより理解しやすいものだ。はるかに直感的で、客観的に正しいだけでなく、私たちが感じることのできる出力を与えてくれる。
従来のAIは常に客観的であることに長けていたが、AIがその客観性を向上させ続けても、人類が大きな進歩を遂げることはないだろう。これは、ペイパル創業者のピーター・ティールが言うところの「1からnへ」ということだ。そうではなく、必要なのは「0から1へ」であり、何か違うことをすることである。
AlphaZeroはその一端を達成した-出力をより直感的にすることで、AIを人間にとってより理解しやすいものにする道を歩んでいる。しかし、これ以上何ができるだろうか?
人間性を理解する
1983年、エレクトロニック・アーツがある雑誌広告を出した。当時はまだコンピュータが本格的に普及し始めたばかりの時代だった。その中で、広告はパーソナル・コンピューターの可能性を実現することを約束している。
これは重要な質問から始まり、考えるためのヒントを与えてくれる:
「コンピューターはあなたを泣かせることができるか?今のところ、誰にもわからない。その理由のひとつは、多くの人がこの考えを軽薄だと考えるからである。しかし、この質問にうまく答える人は、まず他のいくつかの質問に答えていなければならないからでもある。
なぜ人は泣くのか?なぜ笑ったり、愛したり、微笑んだりするのか?私たちの感情の試金石は何なのか?
これまでは、このような質問をする人は、ソフトウェア会社を経営するような人たちではなかった。その代わりに、作家、映画制作者、画家、音楽家が多かった。彼らは伝統的な意味でのアーティストだった。"
これらの質問は、1983年、つまりコンピューターが大衆消費者向けの製品になり始めたころの、先見の明のある質問であった。しかし、これらは今日にも当てはまる。過去数十年の間に、私たちは計算、客観性、概念理解に優れたAIを開発してきた。
しかし今日、こうした疑問は依然として重要ではあるが、答えるべき唯一の疑問ではなくなりつつある。AIが人間に理解できる方法でどのように自己表現するのか、あるいは人間がAIをよりよく理解するにはどうすればいいのか、といった新たな問いが必要なのだ。
AIが出力する答えの自己説明が改善されれば、何が彼らの決断に反映されたのか、なぜ彼らの答えが正しいのか、はるかに明確になるだろう。結局のところ、研究者が研究成果を発表する場合、重要なのは結論だけではないのだ。
AIから学ぶためには、人類はAIをよりよく理解する必要があり、AIは人類とよりよくコミュニケーションをとる必要がある。どのような判断が下され、どのような計算が行われ、どのような目的でこれらの操作が行われるのかを説明することが、AIがよりよくできるようになるために必要なことなのだ。
AIの次の段階は、コンピュータの計算能力を向上させることではなく、人類がAIをよりよく理解できるような方法で、またプログラマーでなくてもできるような方法で、AIを表現させることによってもたらされるだろう。