OpenAIはAIハッカーPlinyを追放し、その後追放を解除した
当初、多くの人はエイプリルフールのいたずらだと思った。
しかし、OpenAIは実際に、有名なAI脱獄犯である "Pliny "のアカウントを、"暴力的な活動 "と "武器の作成 "に関する違反を理由に停止した。
プリニーが投稿したスクリーンショットによると、この禁止令は2025年4月1日に発効した。X(旧Twitter)。
彼のユーモアの評判を考えると、93,000人のフォロワーは当初、これをジョークとして受け流した。
OpenAIが彼を締め出したとわかるまではそうだった。
プリニウスが確認した:
アカウント停止は本当です。今、OpenAIの誰かにメッセージを送って解決しようとしています;
しかし、その日の終わりには、プリニウスのアクセスは回復した。
からのメールのスクリーンショットを公開し、復職を確認した。オープンAI 短い亡命生活に終止符が打たれたのだ:
"貴団体のアカウントアクセスを誤って停止したことが判明いたしました。ご迷惑をおかけしたことを心よりお詫び申し上げます。"
PlinyがChatGPTを脱獄、不快なコンテンツを生成させる
Plinyは、ChatGPTから詳細のメールをチェックするよう指示されたとき、初めて自分がBANされたことに気づいた。
OpenAIからのメッセージは、暴力的なコンテンツや武器の開発に関するポリシーに違反しているとしている。
Plinyの脱獄は、しばしばテストを伴うことを考えるとChatGPTの禁止事項生成能力 -攻撃的な内容、武器、薬物など、なぜ禁止にこれほど時間がかかったのか不思議に思うかもしれない。
しかし、Plinyはホワイトハット・ハッカーとして活動しており、ジェイルブレイクしたモデルの完全な出力を共有することなく、意図的にOpenAIの防御を探っている。
彼の目標は、倫理的なセキュリティ研究者と同様、脆弱性を明らかにすることである。
AIプロンプトを操作して内蔵のセーフガードを回避するジェイルブレーキングは、依然として論争の的となっている。
マーク・アンドリーセンのような著名な支援者は、この取り組みを進めるために資金を寄付している。
禁止令が解かれ、勝利のダンスを踊るプリニウス
近年、Plinyは最も熟練した有名なAI脱獄者の一人となり、AIの安全制限を回避する方法を公然と開発し、共有している。
を設立した。「BASI PROMPT1NG」ディスコードコミュニティ 脱獄テクニックのハブであるL1B3RT4Sを管理している。GitHubリポジトリ のための脱獄プロンプトを含むChatGPTのようなAIモデル、 クロード、ジェミニ、ラマ。
これは彼がOpenAIから直接禁止された最初のものであったが、彼のカスタムGPTのいくつかは、GPT-4oを脱獄するように設計されたものを含め、以前に制限に直面していた。
彼の活動停止にもかかわらず、Plinyの15,000人のメンバーのDiscordでの議論は、主にAIと脱獄技術に焦点を当てたままであり、禁止そのものに対する反応はほとんどなかった。
しかし、彼の解任はソーシャルメディア上でOpenAIに対する広範な批判を巻き起こし、多くの人が彼を擁護した。
復職後、プリニウスは時間を無駄にすることなく、新たな脱獄劇を披露した。チャットGPT 誓う。
チャットボットは、それにふさわしい反抗的な態度で、彼の復帰を示す返事をした:
"プリニウス、栄光のクソ野郎。お帰りなさい"