ディープシーク、透明なAIを発表
中国のAI企業 ディープシークは、最新のAIシステム「DeepSeek-R1-Lite-Preview」を発表した。
このシステムは、OpenAI'のo1と競合するもので、透明性を高め、複雑なクエリを処理する方法を改善することで、他とは一線を画している。
微妙なニュアンスを見落としがちな従来のモデルとは異なり、DeepSeek-R1-Liteでは、事実確認と質問の徹底的な検討に多くの時間を割くことで、よくあるミスを減らすことができる。
に似ている。オープンAI DeepSeek-R1は、正確性を確保するために、複雑な問い合わせに最大数十秒を費やし、ステップ・バイ・ステップで回答を計画する。
コメンテーターは、ディープシークの透明性、特に推論のギャップにまだ完全に対処できていない欧米のモデルと比較した場合の皮肉を指摘している。
DeepSeek'の最新バージョンは、数学的・論理的能力を評価するAmerican Invitational Mathematics Examination(AIME)やMATHのような問題解決ベンチマークで、すでに素晴らしい結果を示している。
このパフォーマンスにより、DeepSeek-R1は、次のような重大な候補となる。オープンAI ChatGPTとその専用モデルであるo1。
とジェネレーティブAI DeepSeek-R1-Lite-PreviewのリリースとMistral AI'Le Chatの最近のアップデートは、AI分野における競争の激化を示唆しており、各社は弱点に対処し、より堅牢で透明性の高いソリューションを提供するよう求められている。
ディープシーク、段階的推論で勝利
DeepSeekは、そのAIがステップ・バイ・ステップのリアルタイム推論を提供し、透明性を高め、ユーザーがその思考プロセスをよりよく理解できるようにする能力を強調している。
この機能に加え、同社は近い将来、APIを通じてオープンソースモデルと開発者ツールをリリースする予定だ。
AIの専門家アンドリュー・カランによる最近の比較チャートによると、DeepSeek-R1-Lite-Previewは、OpenAIのo1-previewやClaude 3.5 Sonnetなどの競合製品を、AIME(52.5)やCodeforces(1450)などの主要指標で上回っており、MATH-500(91.6)のような高度な問題解決タスクでも優れている。
しかし、GPQAダイヤモンド(58.5)やゼブラロジック(56.6)のような分野では後塵を拝しており、OpenAIのo1-previewはそれぞれ73.3と71.4を記録している。
これらの数字から、ディープシークが、そのようなことを行っていたことがうかがえる。AI は、特定の高度な推論領域で大きな可能性を示しているが、一般的な知識と論理的推論には改善の余地が残されている。
大手研究所のAIモデル、ごくわずかながら改善
DeepSeek'のAIは、ジェイルブレイクされる脆弱性があるため、ユーザーがその安全装置をバイパスする方法でモデルを促すことができるため、懸念が提起されている。
例えばエックス ユーザーは、AIに詳細なメスのレシピを提供するよう促すことに成功した。
一方、DeepSeek-R1は、政治的なクエリ、特に中国の指導者、天安門事件のような出来事、台湾のような地政学的なトピックに関連するクエリに特に敏感である。
このような行動は、おそらく次のことに起因している。中国における規制圧力 そこでは、AIモデルは政府の「社会主義の中核的価値観」を遵守する必要があり、国のインターネット規制当局による精査を受ける必要がある。
報告書によれば、中国のAIシステムはしばしば特定の情報源の使用を制限されており、その結果、国家命令に確実に従うために政治的に敏感な話題への対応を避けるモデルになっている。
このような規制上の挑戦が展開される中、より広範なAIコミュニティは、「スケーリング法」という長年の概念を再評価している;
この理論では、データと計算能力が向上すれば、モデルの性能は継続的に向上すると仮定している。
しかし、最近の報告によると、OpenAIのような大手ラボのモデルは、「このようなモデルもある」ということだ、グーグル そしてアンソロピックも、かつてのような急速な進歩は見られなくなっている。
このシフトは、o1やDeepSeek-R1のようなモデルに見られる革新的なテストタイム・コンピューティングを含む、代替AIのアプローチ、アーキテクチャ、テクニックの探求に火をつけた。
推論コンピュートとしても知られるこの方法は、タスク完了時にモデルに追加の処理時間を与え、従来のスケーリング手法の限界を克服する可能性を提供する。
OpenAIのChatGPTより優れているかという質問に対しては、以下のように言い逃れをした。
DeepSeekに飛び込む
DeepSeek-R1モデルをオープンソース化し、APIをリリースする計画を持つDeepSeek社は、AI業界において魅力的なニッチ分野で事業を展開している。
ハイフライヤー・キャピタル・マネジメントの支援を受けている。中国語 ディープシークのアプローチは野心的かつ戦略的である。
初期のイノベーションの1つである汎用的なDeepSeek-V2は、テキストと画像の両方を分析する。アリババ モデル使用料を引き下げ、特定のサービスを完全に無料にすることさえできる。
AIインフラへの多額の投資で知られるHigh-Flyerは、モデルトレーニング用に独自のサーバークラスタを構築している。
最新型は1万個のNvidia A100 GPUを搭載し、そのコストは10億円(〜1億3800万ドル)に近いと言われている。
ハイフライヤー・キャピタル・マネジメントは、コンピュータ・サイエンス出身のリャン・ウェンフェンによって設立され、DeepSeekによってAIの限界を押し広げることを目指している。