インターネットをしばらく閲覧している人なら、CAPTCHAはおなじみのハードルだ。これらの画像ベースの課題は、自転車、信号機、横断歩道などのオブジェクトを識別するようユーザーに要求するもので、人間のユーザーと自動化されたボットを区別するために設計されている。何年もの間、これらのCAPTCHAは、悪意のあるボットがウェブサイトにアクセスするのを防ぐゲートキーパーの役割を果たしてきた。しかし、新しい研究によると、高度な人工知能(AI)システムがこれらのテストを簡単に解読できるようになったため、この保護レイヤーはすぐに時代遅れになる可能性があるという。
チューリッヒ工科大学の博士課程に在籍するアンドレアス・プレスナー(Andreas Plesner)率いる研究者グループが、グーグルのreCAPTCHA v2を100%の成功率で解くボットを開発した。プレプリント論文として発表されたこの研究は、現在進行中の人間とボットの戦いにおける重要な進展であり、人間中心の障害を克服するAIシステムの高度化を浮き彫りにしている。
reCAPTCHAの進化
2014年に初めて導入されたGoogle'のreCAPTCHA v2は、グリッド状の街頭画像から特定のオブジェクト(自転車、階段、信号機など)を識別するようユーザーに求める。このシステムは、人間が簡単に通過できるようにする一方で、視覚的知覚と判断を必要とするタスクでボットを阻止するように設計された。reCAPTCHA v3は、課題を提示する代わりにユーザーの行動を監視するものである。reCAPTCHA v2は、特にv3がユーザーに自信のある"human"レーティングを割り当てるのに苦労したときの予備として、広く使われている。
何年もの間、reCAPTCHA v2はボットによるウェブサイトへのアクセスをブロックする最も信頼できる方法のひとつと考えられていた。しかし、プレズナー氏らの最新の調査結果は、その仮説に疑問を投げかけるものである。
CAPTCHAの掟を破る:AIボットの仕組み
reCAPTCHA v2を解読する鍵は、YOLO(You Only Look Once)オブジェクト認識モデルを使用することにある。YOLOモデルを微調整し、14,000枚のラベル付きトラフィック画像でトレーニングすることで、研究者たちはreCAPTCHA v2の13のオブジェクトカテゴリーから画像を識別する際に、人間レベルの性能に匹敵するシステムを作成することができた。このモデルは、消火栓、自転車、信号機などの物体をほぼ完璧な精度で認識することができ、いくつかのカテゴリーでは100%の成功率を達成した。
より複雑なタイプ2のCAPTCHAを克服するために、研究者たちは2つ目の事前に訓練されたYOLOモデルを採用した。このモデルは、いくつかのカテゴリーで苦戦したものの、より困難なオブジェクトに遭遇したときに新しい画像を要求するのに十分な性能を発揮することができた。
しかし、画像認識だけでは不十分だった。研究者たちは、ボットがCAPTCHAシステム全体を確実に欺くことができるよう、他の一連の対策も実施した。これには、VPNを使用して同じIPアドレスから繰り返し試行されることをマスクすること、人間の行動を模倣するためにリアルなマウスの動きをシミュレートすること、実際のウェブ閲覧セッションから得た偽のブラウザとクッキーのデータを使用することなどが含まれる。
これらの戦術とYOLOモデルを組み合わせることで、ボットはreCAPTCHA v2の課題を一貫して、時には人間のユーザーよりも効率的に解くことができた。
CAPTCHAのセキュリティへの影響
この調査により、ボットとCAPTCHAシステムの間の軍拡競争が新たな段階に入ったことが明らかになった。最近まで、ボットがreCAPTCHAの課題を解決しようとしても、68%から71%の成功率しか達成できなかった。現在では、より高度な画像認識モデルの出現により、その成功率は特定のオブジェクト・カテゴリーでは100%にまで急上昇している。
この研究結果は、reCAPTCHA v2のような従来のCAPTCHAでは、ボットを寄せ付けないためにはもはや十分ではない可能性を示唆している。特に、ボットに対する主要な防御手段としてCAPTCHAに依存しているウェブサイトにとっては。AIがかつては人間にしかできなかった作業をより巧みにこなすようになるにつれ、人間のユーザーと自動化されたシステムとの差は縮まり続けている。
ある意味で、優れたCAPTCHAは、最も知的な機械と最も知的でない人間の境界を正確に示すものである;
見えないCAPTCHAへの移行と今後の課題
このような進化する脅威に対処するため、グーグルはすでに、明示的なチャレンジに頼るのではなく、ユーザーの行動を監視するreCAPTCHA v3に多くの焦点を移している。このシステムは、ユーザーのマウスの動かし方やウェブページとのインタラクションなどの微妙なパターンに基づいてボットを識別することを目的としている。Google Cloudの広報担当者は、このシフトを強調し、「私たちは、視覚的なチャレンジを表示することなく、お客様がユーザーを保護できるようにすることに非常に重点を置いています」と述べている;
それでも、何百万ものウェブサイトが代替手段としてreCAPTCHA v2を使い続けており、Plesner'の研究で説明されたようなAI主導の攻撃に対して脆弱なままであることを意味する。グーグルはreCAPTCHAの保護機能を向上させるために継続的に改良を行っているが、AI開発者とサイバーセキュリティ・チームとの間の競争はまだ終わっていない。
機械学習モデルが人間の行動を模倣する能力が高まるにつれ、人間とボットを区別する作業はますます複雑になっている。より洗練されたCAPTCHAを開発するための戦い、つまり最も高度なAIシステムをも凌駕できるCAPTCHAを開発するための戦いは、間違いなく今後も続くだろう。しかし今のところ、AIはこの進行中の猫とネズミのゲームで優位に立っているようだ。
人間検証の未来
この研究は、ウェブセキュリティとユーザー認証に関する考え方の大きな転換を意味する。AIシステムがCAPTCHAを解く能力で人間を凌駕するようになった今、ウェブ開発者とサイバーセキュリティの専門家は、画面の向こう側にいる人物が実際に人間であることを確認する新たな方法を模索する必要があるだろう。それがより高度な行動分析なのか、バイオメトリクスなのか、あるいはその他の革新的なソリューションなのかは、まだわからない。
ひとつはっきりしていることは、従来のCAPTCHAの時代は終わりつつあるということだ。AI技術が進化し続けるにつれて、悪意のあるボットから私たちのオンラインスペースを守るための方法も進化しなければなりません。