大手出版社で高まるオプトアウト傾向
多くの著名な出版社やソーシャル・プラットフォームは、アップルのAIトレーニングから自社のデータを除外することを選択している。
この開発は、アップルがApplebot-Extendedを導入してから3カ月も経たないうちに行われた。このツールは、ウェブサイト所有者がアップルのAIモデルのトレーニングに自分たちのデータが使用されないようにするためのものだ。
Facebook、Instagram、Craigslist、Tumblrなどの有名企業、ニューヨーク・タイムズ フィナンシャル・タイムズ』、『アトランティック』、『ヴォックス・メディア』、そして『WIRED』の親会社である『コンデナスト』は、このオプションを利用している。
ニューヨーク・タイムズ』紙はいち早くブロックした。
この大きな反響は、AIシステムのトレーニングにおけるウェブデータの利用をめぐる対立の高まりを示すものであり、伝統的に様々なインターネットサービスのための情報収集に採用されてきたウェブクローラーに対する認識の変化を浮き彫りにするものだ。
アップルボットの進化とアップルボット・エクステンデッドの出現
Applebotは2015年に発表され、SiriやSpotlightを含むAppleの検索機能を強化するために設計された。
しかし、アップルのAIへの取り組みが拡大するにつれ、アップルボットの目的も変わっていった。
収集されたデータは、アップルの基本的なAIモデルのトレーニングに使用され始めた。
アップルは、パブリッシャーやコンテンツ制作者のデータ活用に関する懸念に対応するため、アップルボット・エクステンデッドを導入した。
この新しい拡張機能により、ウェブサイトの所有者は、自分たちのデータがAIのトレーニング目的に使用されないよう特別に要求することができる。
検索機能のためにウェブサイトをクロールし続けるオリジナルのアップルボットとは異なり、アップルボット・エクステンデッドはAIプロジェクトのためのデータ利用のみに焦点を当てている。
出版社の反応とデータの洞察
アップルボット・エクステンデッドに対する反応は大きく、多くの出版社がブロックを選択した。
オンタリオ州を拠点とするAI検出スタートアップOriginality AIのデータによると、先週の時点で、アクセス数の多いウェブサイトの約7%(主にニュースやメディア)がApplebot-Extendedをブロックしていた。
今週、Dark Visitorsの分析により、約6%のウェブサイトがこのボットをブロックしていることが明らかになった。
この比較的低い割合は、多くのウェブサイト所有者がまだ競合を認識していないか、Applebot-Extendedを除外するオプションを知らないままであることを示しています。
データジャーナリストのベン・ウェルシュは、彼が調査したニュースサイトの4分の1強がアップルボット・エクステンデッドをブロックしていることを発見した。
これは、53%のニュースサイトがブロッキングしていることと比較している。オープンAI のボットをブロックし、約43%がグーグルのAI専用ボットであるGoogle-Extendedをブロックしている。
ウェルシュ氏は、Applebot-Extendedをブロックしているサイトの数が、徐々に増加していることを指摘している。
戦略的決断とパートナーシップ
アップルボット・エクステンデッドをブロックするか許可するかという大手出版社の決定には、より広範な戦略的考慮が反映されていることが多い。
例えば、コンデナスト社は以前、次のようなブロックをしていた。オープンAI のウェブクローラーをブロックしていたが、先日の提携発表を受けてブロックを解除した。
この動きは、データアクセスが商業契約の一部として交渉されるというビジネス戦略を示唆している。
Vox Mediaも同様に、Applebot-Extendedやその他のAIスクレイピングツールを、パートナーシップを結ばない限りブロックすることを選択し、公開コンテンツの価値を保護する意図を強調している。
これに対して、ニューヨーク・タイムズ紙は、次のように報じている。現在、著作権問題をめぐりOpenAIと訴訟中 は、アップルボット・エクステンデッドのオプトアウトの性質を批判している。
NYTのチャーリー・スタットランダー対外広報部長が指摘した:
法律やタイムズ紙の利用規約が明示しているように、当社のコンテンツをスクレイピングしたり、商業目的で使用したりすることは、当社の書面による事前の許可なくしては禁じられています;
この姿勢は、コンテンツの権利とAIトレーニングがどのように交わるかをめぐる現在進行中の議論を浮き彫りにしている。
Applebot-Extendedをオプトアウトする方法
Applebot-Extendedのオプトアウトを希望するウェブサイト所有者にとっては、手続きは簡単です。
まず、あなたのウェブサイトのrobots.txtファイルを見つけるか、作成します。
アップルボットをブロックするには、以下の行を追加する:
ユーザーエージェントアップルボット
不許可:/
Applebot-Extendedを特別にブロックするには、以下を含める:
ユーザーエージェントアップルボット拡張
不許可:/
最後にファイルを保存し、ウェブサイトのルート・ディレクトリにアップロードする。
こうすることで、アップルはあなたのサイトのデータをAIモデルのトレーニングに使用することはなくなりますが、検索機能であなたのコンテンツにアクセスすることはできます。
アップルはこう説明している:
Applebot-Extendedはウェブページをクロールしません。Applebot-Extendedを許可しないウェブページは、依然として検索結果に含まれる可能性があります。Applebot-Extendedは、Applebotユーザーエージェントによってクロールされたデータの使用方法を決定するためにのみ使用されます;
このようなデジタル環境の調整は、データの権利に関するより広範な議論や、コンテンツ制作と配信におけるAIの役割の進化を反映している。
出版社、テック企業、AI開発者がこのような複雑な問題を解決していく中で、今後さらなる発展がもたらされるだろう。