2023年に設立された中国のAIスタートアップDeepSeek(ディープシーク)は、わずか数十人規模のチームながら低コストで高性能な大規模言語モデル(LLM)を開発・公開し、世界のテック業界に衝撃を与えています。(※1) 同社がリリースしたモデルは、その性能の高さと提供コストの低さから「DeepSeekショック」とも呼ばれ、シリコンバレーの大手企業や株式市場を震撼させました。(※2) 本記事では、DeepSeekの概要と技術的特徴、生成AI業界へのインパクト、競合環境や市場動向、さらに倫理的・社会的側面について、日本語・英語・中国語の信頼できる情報源を基に詳しく分析します。

1. DeepSeekとは何か?

背景と設立の目的

DeepSeekは2023年5月に中国で創業された新興AI企業で、創業者はヘッジファンド業界とAI業界で著名な梁文鋒(リアン・ウェンフォン)氏です。(※3) 梁氏は自身が設立した中国の大手クオンツヘッジファンド「幻方量化(High-Flyer)」から資金提供を受け、DeepSeekを外部資本に左右されない独立系の研究開発組織として運営しています。(※3)創業当初より「商業的利益ではなく汎用人工知能(AGI)の実現を目指す」ことを掲げており、(※4) 実際に梁氏は「AIモデルを金儲けに使うつもりはない」と言い切っています。(※2) この長期志向(いわゆる「長期主義」)が社名の由来にもなっており、同社は基礎研究を重視しながら着実にモデルの性能向上を図っています。

モデルと技術的特徴

DeepSeekが開発した代表的なモデルは、DeepSeek LLMシリーズです。2023年11月にパラメータ67億(7B)と670億(67B)の2種類のモデル(それぞれ基本モデル=Baseと対話特化モデル=Chat)を公開し、(※5) その後も改良版をリリースしています。注目すべきは、これらのモデルが完全オープンソースで提供されている点です。ソースコードはMITライセンス、モデルはOpenRAILをベースにした独自の「DeepSeekライセンス」で公開されており、研究・商用利用ともに無料で許可されています。(※5,6) 利用にあたって事前申請も不要で、(※6) 改変モデルの再配布時には同ライセンスの利用規約(違法悪用の禁止など)さえ継承すれば、公開義務も課されません。(※6) この寛容なライセンス戦略は、オープンなAI研究の促進と幅広い実用化を意図したものです。

技術面では、DeepSeek LLMはMeta社のLLaMA系モデルに近いTransformerアーキテクチャを採用していますが、いくつか独自の工夫があります。(※7) 例えば7Bモデルは30層67Bモデルは95層ものTransformer層で構成されており、他のオープンモデル(例:LLaMA2-70Bが80層)に比べより深いネットワークになっています。(※8) これはパラメータ数を増やす際に、中間層の幅(隠れサイズ)を肥大化させるのではなく層を積み重ねることで性能向上を図るアプローチで、効率的な学習・推論のためにGrouped-Query Attention(GQA)という手法も導入されています。(※8) また、学習データについては英語と中国語を中心に2兆トークンに及ぶ巨大なコーパスを一から構築し、多様性と独創性を重視しつつ知的財産権にも配慮して収集されています。(※9,7) テキストだけでなくコードや数学問題、文学作品など多岐にわたるデータを含み、不適切な内容や重複はフィルタリングする念の入れようです。(※7) 学習プロセスでは大バッチサイズ・多段階の学習率スケジュールを採用し、トレーニング中の中間チェックポイントを9段階で公開するなど、再現性と研究価値も重視しています。(※5,10)

DeepSeek Chatモデル(指示調整済みモデル)のチューニングには、教師強化学習ならぬ直接的な嗜好最適化(DPO: Direct Preference Optimization)手法が使われています。(※11) ユーザーフィードバックを組み込んだ最適化でモデルの出力品質や安全性を高める手法であり、これにより高度な対話能力安全な応答の両立を図っています。公開されたチャットサービス(後述)でも、中国の規制に抵触するような有害出力を避ける工夫が凝らされているとみられます。

他の主要生成AIとの比較

DeepSeek LLMの性能は公開直後から国内外のベンチマークで検証され、その実力は既存の主要モデルに匹敵、または凌駕することが示されています。(※10) 例えば基本モデルのDeepSeek LLM 67B (Base)は、Meta社のオープンモデルLLaMA2 70Bと比較して、推論・コーディング・数学・中国語読解といった分野で軒並み上回る成績を収めました。(※10) 実際、20近い中英評価指標においてLLaMA2-70Bを凌駕したことが報告されています。(※5) また指示調整済みのDeepSeek LLM 67B (Chat)は、GPT-3.5(ChatGPTのベースモデル)を中国語で上回る性能を示したと評価されています。(※10) 特にプログラミング数学に強みを持ち、コード生成能力を測るHumanEvalベンチマークでは正解率73.78%を達成し、同規模の他モデルを大きく超えました。(※7,10) 数学分野でも、難関の算数データセットGSM8Kを追加微調整なしのゼロショットで84.1%正答するなど卓越した論理・計算力を発揮しています。(※7,10) さらに独自に設定したハンガリー中等教育試験のような未知の課題でも高得点を記録し、汎用的な応用力の高さが示されています。(※10)

気になるOpenAIのGPT-4やAnthropicのClaude 3.5といった最先端モデルとの比較ですが、DeepSeek側も最新モデルであるDeepSeek-R1(2025年1月公開)においてGPT-4に肉薄する性能を主張しています。(※4) 具体的なベンチマーク名は公開されていませんが、OpenAIの最上位モデル(コードネーム「o1」)に匹敵とのこと。(※1,4) 中国メディアも「DeepSeek-R1(67B)はGPT-4相当の性能に達した」と報じており、(※12) 事実、DeepSeek-R1公開後には競合各社が相次いで自社モデルの性能向上を発表する事態となりました(詳細は後述)。もっとも、GPT-4は未知の部分も多く一概に比較はできません。現状公表されている客観指標では、DeepSeek 67BはGPT-3.5+レベル、特定分野ではGPT-4に迫るという位置付けと見るのが妥当でしょう。少なくとも汎用チャットAIとして実用に耐えうる水準にあることは間違いなく、これはリソースの豊富な大企業以外で初めて成し遂げられた快挙です。

一方、他の中国勢のモデルとも比較しておきます。百度(Baidu)の「文心一言(ERNIE Bot)」は2023年3月に中国初のChatGPT相当モデルとして公開されましたが、(※4) 初期バージョンは安定性や応答品質に課題があり、DeepSeek公開時点では性能面で後塵を拝したとされています。また阿里巴巴(Alibaba)は独自のオープン大モデル通義千問(Qwen)シリーズを発表し、DeepSeek台頭後の2025年1月には最新版Qwen 2.5-Maxをリリースして「DeepSeek-V3を上回った」と主張しました。(※4) Bytedance(字節跳動)も社内版チャットボット「豆包(Doubao)」のエンジンとなるLLMを強化し、DeepSeek-R1公開2日後には「OpenAIのモデルを超えたアップデート版」をリリースしています。(※4) Google DeepMindも次世代マルチモーダルモデルGeminiを準備中で、OpenAIもGPT-4の強化やGPT-5開発に注力していると噂されます。つまりDeepSeekは、OpenAIのChatGPTやAnthropicのClaude、GoogleのGemini、MetaのLlama2など錚々たる国内外の競合と肩を並べ、時に先行しうる存在として急浮上しているのです。

2. DeepSeekの生成AI業界への影響

DeepSeekの強みと弱み

DeepSeekがここまで注目を集める最大の理由は、高い性能を驚異的な低コストで実現した点にあります。(※1) 強みとしてまず挙げられるのは、そのオープンソース戦略です。研究者や開発者は誰でもモデルの重みやコードを入手でき、自由に解析・応用・改良できます。ライセンス上も商用利用が許可されているため、企業が自社サービスに組み込んだり、派生モデルを販売したりするといったことも可能です。(※6) 例えばDeepSeekは2023年11月の公開時点で商用利用無料を明言し、競合モデルにありがちな利用制限を設けませんでした。(※5) この開放性は、生成AIの民主化を推し進めるものとして歓迎され、コミュニティの支持を集めています。GitHubのプロジェクトは5000件超のスターを獲得し、Hugging Face上でも注目度が高まっています。(※10,*9)

次にコスト面の優位性があります。DeepSeekは自社モデルを一般公開するだけでなく、自前のクラウドサービス上での提供も開始し、その利用料金を100万トークン当たり1元(約0.14ドル)という破格の安さに設定しました。(※4) これは同時期の他社モデルと比較して桁違いの低価格です(参考:OpenAIのGPT-3.5は同程度のトークン数で数ドル、GPT-4では20ドル以上のコストがかかります)。DeepSeekの登場により、中国国内では大模型の価格破壊が起こり、阿里巴巴のクラウド部門は自社モデルAPIの利用料を最大97%引き下げると発表するなど、(※4) 各社が追随せざるを得ない状況になりました。低コストでサービス提供が可能になった背景には、後述する技術的な工夫(計算資源の効率化やチップ活用)があり、DeepSeekは単に安売りをしているわけではなく構造的にコストを抑えるイノベーションを実現しています。

性能面での強みも見逃せません。前述の通り、DeepSeek 67Bはコード生成や数学問題解決能力に秀で、特定領域での専門性を発揮しています。(※7) また英語と中国語のバイリンガル訓練によって、中英いずれの言語でも高品質な応答が可能であり、中国語に関しては同規模の英語特化モデルを凌ぐパフォーマンスを見せています。(※10) これは中国市場において大きな利点であり、英語圏向けに最適化されたChatGPTやClaudeでは苦手とする中国語の細かなニュアンスにも対応できる点で優位です。加えて、DeepSeekは研究成果の迅速なモデル反映にも強みを持ちます。スケーリング則(モデルサイズと性能の関係)に関する独自研究や、DPOなど最新の最適化技法を積極的に取り入れ、短期間でモデルをアップデートしています。(※1) 実際、創業から半年余りで基盤モデル公開(67B)、8ヶ月で改良版(DeepSeek-V2)、さらに1年足らずで次世代(DeepSeek-V3とR1)と、驚異的なスピードで開発サイクルを回していることが強みと言えるでしょう。

一方、弱みや課題も存在します。まず、DeepSeekはスタートアップゆえのリソース制約があります。モデル規模は最大でも67Bパラメータ級で、OpenAIのGPT-4(推定数百億〜1兆パラメータとも)のような超巨大モデルには達していません。今後さらに性能向上を図るには、より大規模なモデル訓練やマルチモーダル対応なども視野に入れる必要がありますが、計算資源やデータの面で巨額の投資が求められます。現在は梁氏のファンドが資金を提供していますが、収益化を度外視したままどこまで継続できるかは不透明です。もっとも梁氏自身は価格競争は意に介さずAGI達成が第一と述べており、(※4) 当面は出資者の理解も得られている模様ですが、ビジネスモデルの不確かさはゼロではありません。

モデル性能についても、万能ではありません。GPT-4やClaude 3.5が得意とする長大な文脈処理(数万トークンのコンテキスト保持)や、高度な常識推論・創造的文章生成といった面では、DeepSeek 67Bはまだ及ばないとの指摘があります。また2023年後半から各社が注力する画像や音声を含むマルチモーダル能力は、現時点でDeepSeekモデルには実装されていません。純粋なテキスト生成以外のユースケース(画像から説明文生成、音声アシスタント等)では、OpenAIやGoogleの新モデルに一日の長があります。さらに、中国語と英語には強いものの、多言語対応という点では未知数です。データの大半が中英で占められているため、例えば日本語やその他の言語については、能力発揮には追加の微調整やデータ投入が必要でしょう。

もう一点、組織規模の小ささゆえに懸念されるのが人材と運営面です。DeepSeekの開発チームは創業から急拡大したとはいえ約150名程度と報じられています。(※1) しかも多くは中国のトップ大学出身の若手研究者や博士課程の学生で占められており、(※4) 流動性が高い人材集団でもあります。梁氏は大企業型の「コスト高で上意下達」な体制より、少数精鋭で自由度の高い研究所スタイルを志向しています。(※4) このアプローチが長期的に持続可能かは未知数です。優秀な人材の獲得・定着や、開発スピードの維持、ナレッジの継承など、スタートアップならではの運営上の課題も今後表面化する可能性があります。

既存勢力図へのインパクト

DeepSeekの台頭は、既存の生成AI市場に大きなインパクトを与えました。特に中国国内では、その影響は顕著です。前述のように、DeepSeekが2023年11月末にモデルをオープンソース化しサービス提供を開始すると、ただちに「価格破壊」の波が押し寄せました。阿里巴巴クラウド(アリクラウド)は大幅な値下げを余儀なくされ、(※4) 百度やテンセントなど他の中国テック大手も、自社のAI研究開発体制の見直しやサービス強化に動き始めました。(※4) それまで中国の大規模AIモデルは「巨額投資が必要で米国に後れを取っている」分野とみなされていましたが、(※2) DeepSeekはオープンソースと低コスト戦略でその構図を覆せる可能性を示したのです。(※2) この成功は中国国内で「大快挙」ともてはやされ、春節期間中にも関わらずSNSはDeepSeekの話題で持ちきりとなりました。(※2) 創業者の梁氏は中国のネット上で「偉人」扱いされるほどの人気ぶりです。(※2) DeepSeekの急成長と成功は中国AI産業界全体の士気を大いに高め、企業のみならず政府関係者からも注目を浴びています。(13)

国際的にも、DeepSeekの登場は既存プレイヤーに刺激を与えました。OpenAIやGoogle、Anthropicといった米国勢は、高性能モデル開発に巨額の予算を投じていますが、DeepSeekのような小規模チームが短期間で優れたモデルを作り上げたことで、投資効率や開発手法に対する疑問が生じています。実際、DeepSeek-V3とR1の連続リリース直後、米国の大手テック企業の株価が軒並み下落し「AIバブル崩壊か」との声も上がりました。(※4) 投資家の間では「大手AI企業が描く巨額の開発予算計画に疑問符がついた」と報じるメディアもあります。※4) 要するに、DeepSeekの成功が米国のAI開発競争にも再考を促した形です。Meta社はオープンソースモデルに力を入れてきましたが、DeepSeekの出現はオープンな協力路線の重要性を裏付ける追い風となりましたし、GoogleやOpenAIも閉鎖的すぎる戦略にはリスクがあることを認識したでしょう。実際、中国発のオープンモデルが世界的評価を得たことは、オープンソースコミュニティ全体の活性化につながり、各国の研究者がDeepSeekをベースに独自実験を行う動きも出ています。

技術面で見ると、DeepSeekのもたらしたブレイクスルーとして計算資源の効率的活用が挙げられます。中国政府による米国製GPU(NVIDIA A100など)輸出規制の影響で、中国のAI企業は国産チップへの切り替えを迫られていました。(※2) DeepSeekはこの難題にも取り組み、寒武紀(Cambricon)や華為(Huawei)と共同で異種コンピューティング環境を構築し、混合精度訓練技術を開発することで、中国製AIチップの利用率を従来の38%から72%に向上させたと伝えられています。(※14) さらにHuaweiのMindSporeフレームワークを用いた独自の分散学習システムを構築し、1000枚規模のカード(GPU/NPUs)並列時でも89%もの高い効率を達成したとの報告もあります。(※14) これらが事実であれば、DeepSeekチームはハードウェアとソフトウェア両面で国産AI基盤の性能を引き上げたことになり、中国AIエコシステム全体に恩恵をもたらしています。米国の対中制裁が激化する中でも国内AI産業の成長率は23.7%を維持しているとされ、(※14) DeepSeekの存在がその一翼を担っているのは間違いないでしょう。ひるがえって米国側から見れば、NVIDIAなど半導体企業の売上に影響を及ぼしかねない動向であり、実際にDeepSeekのニュースが出た際にはNVIDIA株が急落する場面も見られました。(※2)

DeepSeekがもたらしたもう一つの影響は、研究コミュニティと産業界の橋渡しです。オープンソースでモデルが提供されたことで、大学や独立研究者が最先端のLLMを用いて実験を行いやすくなりました。これまでは高性能モデル=企業の専売特許という状況もありましたが、DeepSeekはその垣根を低くしています。例えば高等教育機関がDeepSeekを使って新たな応用システムを試作したり、中小企業が自社データで微調整して業務特化AIを開発するといった事例が生まれています。(※6) DeepSeek自身も「モデル=サービス(MaaS)」というビジネスモデルを提唱し、既に工業分野の検品ソリューションに組み込んで6ヶ月かかっていた導入期間を3週間に短縮するなどの成果を上げています。(※14) このように、オープンモデルを活用した低コスト・短期間のAIソリューション提供が現実のものとなりつつあり、企業のAI導入ハードルを大きく下げています。ユーザー企業にとっては、従来は莫大な費用が必要だった高度AI技術を安価に試行・採用できるチャンスが広がったと言えます。

以上のように、DeepSeekは技術・ビジネス両面で既存勢力に揺さぶりをかけ、市場構造の再編を促す触媒となっています。ただし、この変化は歓迎される面ばかりではありません。後述する倫理面の課題も含め、業界全体が適応を迫られる局面を迎えています。

ユーザーや企業への影響・展望

DeepSeekの登場によって、ユーザーや企業が享受できるメリットも多く生まれました。まず、前述のように生成AI利用のコスト低下は大きな恩恵です。スタートアップや中小企業でも、大手並みの高度な言語AIを自社製品に組み込んだり業務効率化に使ったりすることが、格段に容易になっています。無料でモデルを入手し、自社データでファインチューニングしてオンプレミスで運用することも可能です。機密性の高いデータを扱う業種(金融、医療、政府など)にとって、クラウドAPIではなくオンサイトでモデルを動かせるオープンLLMは貴重な選択肢でしょう。また、DeepSeekのオープンなコミュニティによって世界中からノウハウが集まりつつあり、使いこなしの情報やツールも充実してきています。例えば、モデルの軽量化(量子化)や専門領域への再学習、推論を高速化するプラットフォーム(Ollamaなど)など、周辺エコシステムが広がっています。(※11,15) これはユーザー企業にとって、自社で一からAI開発をする負担を軽減し、既存の知見を活用してスピーディにAI導入できる土壌となっています。

一方で、ユーザー側が注意すべき点もあります。DeepSeekモデルは確かに高性能ですが、万能の人工知能ではないため、用途に応じた適切な使い分けが必要です。例えば、創造的な文章生成や多言語翻訳では他モデルのほうが適する場合もありますし、最新知識(時事情報など)については学習データの時点によっては答えられないこともあります。また、オープンソースゆえに公式サポートや品質保証が限定的である点も留意すべきです。商用サービスとしては現時点でベータテスト中の部分も多く、安定稼働やセキュリティ対策についてはユーザー側で担保しなければならない場面もあるでしょう。もっとも、DeepSeekはDiscordコミュニティやWechatグループ等で活発にユーザーサポート・情報交換を行っており、(※9) オープンソースながら比較的手厚い対応があるとの声もあります。ユーザー企業はこうしたコミュニティを活用しつつ、自社のリスク管理ポリシーに沿って導入を進めることが重要です。

将来的に、ユーザーや企業はより多様な選択肢を手にすることになりそうです。DeepSeek自身、汎用LLM以外にも専門特化モデルの開発を進めています。2023年11月にはプログラミング特化の「DeepSeek Coder(33B)」も公開しており、(※16) また大量のパラメータを動的に活性化するMixture-of-Experts(MoE)型モデルの研究、(6) 高度な数学問題に特化したモデル(DeepSeek-Math)、3D生成AIのプロジェクト(DreamCraft3D)なども進行中です。(※6) これらが実現すれば、用途ごとに最適化されたモデルを組み合わせて使うことが可能になり、企業は必要な機能を持つAIモジュールを選択的に導入できるようになるでしょう。さらに、DeepSeekがグローバル展開を進める可能性もあります。現在は中国発のプロジェクトですが、英語圏への情報発信(公式サイトや論文の英語公開)にも注力しており、(※10) 海外の研究者や企業ともコラボレーションが始まっています。今後、日本企業を含め世界中の企業がDeepSeekモデルを組み込んだサービスを提供するケースも増えるかもしれません。その意味でDeepSeekは、一企業の枠を超えてグローバルな生成AIエコシステムの一部となりつつあり、ユーザーや企業はその動向から目が離せない状況です。

3. 競争環境と市場動向

競合他社との比較(性能・コスト・独自性)

DeepSeekを取り巻く競争環境は、ここ数ヶ月で激変しました。特に中国国内では、大模型分野におけるスタートアップ vs テック巨頭の構図が鮮明になっています。DeepSeekは前述のように阿里・百度・テンセント・バイトダンスといった大手と真っ向から競合する形になっており、それぞれが対抗モデルや施策を次々と打ち出しています。

性能面では、AlibabaのQwen 2.5-Maxが「GPT-4やDeepSeek-V3をほぼ全ての指標で上回る」と発表するなど、(※4) 熾烈なアピール合戦が展開されています。ただし客観評価としては、各社のモデルは得意分野が異なり、一概に上下関係を決められる段階ではありません。例えば、OpenAIのGPT-4は依然として総合的な知性で最先端と考えられていますが、その詳細はブラックボックスで外部評価にも限界があります。AnthropicのClaude 3.5は10万トークンを超える長文処理や安全面の工夫で定評がありますが、プログラミング能力はGPT-4に及ばないとも言われます。一方、DeepSeek-67Bはコードと数学に強みを持ち中国語に堪能ですが、英語のクリエイティブな文章生成では若干ぎこちなさが残るとの指摘もあり、(※10) 各モデルが一長一短の状況です。(※10) ユーザー視点では、目的に応じて「モデルのポートフォリオ」を組む戦略が有効になるでしょう。実際、複数のオープンモデルを組み合わせてアンサンブル(組み合わせ推論)させる試みや、役割分担させて問題解決させるエージェント的手法も登場しています。

コスト面では、DeepSeekの優位が依然際立っています。モデルの無料公開に加え、推論APIの極端な低価格設定(※4) 市場をリードし、他社も価格を追随せざるを得ませんでした。ただし、大手各社はクラウド基盤や付随サービスの包括力で勝負する構えです。例えば阿里や百度は、自社のクラウド上でモデル提供する際にデータストレージや他のAIサービスとバンドルし、総合的な価値を訴求しています。一方DeepSeekは現状ではモデルそのものを提供する純粋な「モデル屋」ですが、前述のMaaSのようにソリューション提供型ビジネスにも踏み出しており、(※14) 今後は単なる価格競争に巻き込まれない独自路線を模索するでしょう。梁氏も価格破壊自体は目的でなく、あくまでAGIへの布石と語っています。(※4) とはいえ、ユーザー企業側から見ればAI利用コストが大幅低減した事実は歓迎であり、競合各社は利益率確保とのバランスに悩ましい調整を迫られます。オープンソースモデルが増えれば「AIモデルそのものは無料、付加価値サービスでマネタイズ」という構図が一般化する可能性もあり、DeepSeekはその先駆けといえます。

技術独自性の面では、DeepSeekにはいくつか特徴があります。上述した超深層アーキテクチャ国産チップ対応もその一つですが、他にもデータセット構築ノウハウ高速学習フレームワークなど、同社が培った技術資産があります。例えば2兆トークンの高品質データセットは、中国語データ量では他社より豊富とも言われ、(※17) 中国市場のニーズに即したモデルを作る上で強みとなっています。また多数の中間チェックポイントを公開したり、自社で評価ベンチマーク(ハンガリー試験や独自指示データセット)を作成したりと、(※7) モデル開発の透明性・学術性にも注力しています。これはMetaのLLaMAやBLOOMモデルなどのオープン研究コミュニティの流れを汲むもので、研究者から見た独自価値と言えるでしょう。他方、GoogleやOpenAIはスケールの大きさ(数千億〜兆単位のパラメータ、マルチモーダル統合など)で独自性を出そうとしており、単純なモデル性能以外での差別化が進んでいます。今後、DeepSeekもマルチモーダルAIや専門特化AIとの連携を図る可能性が高く、技術ロードマップにはそれらが含まれていると推測されます。

DeepSeekの今後の展望とロードマップ

DeepSeekは将来に向けどのような戦略を描いているのでしょうか。公式には詳細なロードマップは公表されていませんが、これまでの動きや創業者の発言からいくつか展望が読み取れます。

第一に、モデルの継続的なスケーリングです。DeepSeekは「長期主義」を掲げており、より大きなモデルやより優れた性能を追求し続ける意志があります。(※1) 今後は、おそらく1000億~数千億パラメータ級のモデル開発に挑む可能性があります。DeepSeek-R1という名称から推測すると、R2, R3…とさらなる改良版が登場するかもしれません。特に、競合のMetaが次世代のLlamaを405Bパラメータ規模で開発中(噂レベル)との報道もある中、(※4) DeepSeekもモデルサイズを飛躍させて差を詰めることが考えられます。ただしモデル巨大化は計算コストの激増を招くため、DeepSeekは効率的スケーリングに注力するでしょう。これまで通り、賢いアーキテクチャ設計(深さ方向の拡張やMoE活用)訓練手法の工夫で、リソースに見合った最大効果を狙うものと思われます。(※8)

第二に、サービス展開とエコシステム構築です。DeepSeekは単にモデルを出すだけでなく、自社チャットボットの公開や企業向けソリューション提案など応用面にも踏み出しています。(※14) 公式サイトでは対話AIのデモを一般ユーザー向けに提供し始め、(※10) DiscordやWechatでフィードバックを収集しています。(※9) これはChatGPTや文心一言と同様に、リアルユーザとの対話データを蓄積してモデル改良に活かす狙いもあるでしょう。同時に、クローズドベータ的に企業と連携し、特定ドメインでの実証を進めているようです(工業分野での事例など(※14))。今後はこの路線を拡大し、DeepSeekモデルを基盤としたプラットフォームを形成していく可能性があります。例えば、開発者が簡単にDeepSeekを組み込めるAPIツールキットや、クラウド上で動作するFine-tuningサービス、マーケットプレイスのような派生モデル共有サイトなどが考えられます。実際、オープンモデル界隈ではHugging Face Hubを介したモデル配信や、LangChainといったLLM活用フレームワークが盛り上がっており、DeepSeekもそうしたエコシステムとの親和性を高めていくでしょう。梁氏も「大モデルは継続的なイノベーションが必要」と述べ、大企業のトップダウン型では限界があると指摘しています。(※4) その言葉通り、コミュニティと協調したイノベーションを起こす場作りに注力すると見られます。

第三に、グローバル市場での立ち位置です。現在DeepSeekは中国国内を主戦場としていますが、英語論文のarXiv公開(※11) 、Forbesなど海外メディアでの紹介(※3) 見られるように、国際的なプレゼンスも急上昇しています。特に、オープンソースコミュニティでは国籍を問わず優れたモデルは歓迎される傾向にあり、DeepSeekは今や世界的なオープンLLMの代表格の一つとみなされています。将来的には、海外に現地法人を設立したり、国際会議で発表を行ったりといった展開も予想されます。もっと踏み込めば、海外の有力研究機関や企業とパートナーシップを結ぶ可能性もあります。例えば、MicrosoftがOpenAIに出資し自社クラウドでサービス提供しているように、DeepSeekも他国のクラウド事業者と提携してモデル提供するシナリオも考えられます。ただし、中国発の技術であることから、地政学的なリスクや規制も考慮しなければなりません。米国では先端AI技術の対中輸出管理が議論されていますし、逆に中国政府も国産技術の囲い込みを図る可能性があります。この点については次節の倫理・社会側面で触れますが、DeepSeekがグローバルに活躍するには各国規制への適合性を示し、信頼を勝ち取ることが不可欠です。

生成AI業界全体のトレンドとDeepSeekの関与

2023年以降の生成AI業界は、「ChatGPTショック」に始まり急速な群雄割拠の様相を呈しています。その中で浮かび上がったトレンドとして、(1)モデルの大規模化と高性能競争(2)オープンソース化の流れ(3)実ビジネスへの統合が挙げられます。DeepSeekはまさにこれらすべての動きに深く関与しています。

(1) モデルの大規模化競争: 各社こぞってより巨大で高度なモデルを開発しようとしています。OpenAIはGPT-4の次を準備中で、パラメータ数のさらなる増加やマルチモーダル対応が見込まれます。Google DeepMindのGeminiも、おそらく何千億ものパラメータを擁し画像・動画も処理可能な汎用AIを目指しているでしょう。中国でも、テンセントが1000億超モデル「Hunyuan」を発表し、百度もERNIE Botの強化版を投入しています。その中でDeepSeekは、リソース効率を追求した大規模化という独自路線で存在感を示しています。前述のように、単に数を増やすだけでなく賢く大きくすることで競争に加わっており、このアプローチは「反・ムーアの法則的な打開策」として注目されています。(※14) ムーアの法則が緩やかになる中、工夫で性能を引き出すという意味です。今後も、モデルの規模と性能の両面で、DeepSeekは競争の一翼を担い続けるでしょう。

(2) オープンソース化の流れ: Meta社がLLaMAシリーズを研究用途限定ながら公開し、BloomやGLM-130Bなど各国のオープンモデルが登場する中、DeepSeekは商用利用まで許したオープンモデルという点で一歩先を行きました。(※6) この動きは他にも波及し、2023年後半にはAlibabaがQwen-7B/14Bをオープンソース(商用可)で公開し、MicrosoftもLLaMA派生のOrcaを研究公開するなど、モデル公開によるエコシステム拡大を志向する例が増えています。さらに、小規模でも優秀なモデルを作る欧州のMistral AI(7Bモデル公開)や、各国のスタートアップも追随しています。生成AI業界はクローズドvsオープンのせめぎ合いでしたが、DeepSeekの成功によりオープンの有効性が証明されたことで、今後は一層オープン化が進む可能性があります。DeepSeek自身も引き続き現在のモデル群をアップデートしつつ、新規モデルは基本的にオープンにしていく方針と考えられます。もっとも、企業秘密となる要素(例えば学習データの全容やインフラ構成)はすべてが公開されるわけではないでしょう。しかし、モデルというコア資産をオープンにしてユーザーや開発者コミュニティと共創するスタイルは、ひとつの標準として定着しつつあります。DeepSeekはこのトレンドの旗手として、今後もコミュニティ主導の進化を促すでしょう。

(3) 実ビジネスへの統合: 2023年は生成AIが一般にも知られる年となり、多くの企業が実際のサービスにAIモデルを組み込み始めました。ChatGPTプラグインやMicrosoft 365 Copilotのように、既存プロダクトに生成AIを埋め込む動きが活発化しています。中国でも、百度の文心一言が検索エンジンや自動車アシスタントに統合され、テンセントもチャットボットを自社アプリ群に組み込んでいます。DeepSeekも、上述のように産業用途でのPoCに関わったり、自社のチャットインターフェースを提供するなど、(※14) AIを具体的な課題解決に適用する段階へと踏み出しています。将来的には、DeepSeekモデルを搭載した各種アプリケーションやデバイスが登場するかもしれません。例えば、教育分野の対話型チューター、医療分野の問診補助AI、金融分野の分析アシスタントなど、可能性は多岐にわたります。DeepSeekモデルはオープンでカスタマイズ可能なため、縦割り領域ごとの最適化が行いやすく、新興企業がそれらを武器にニッチ市場で成功するケースも出てくるでしょう。こうした群小AIソリューションが増えることは、結果的に生成AI業界全体の裾野拡大につながります。DeepSeekは自らが直接すべてのアプリを提供するのではなく、モデルプロバイダーとしてエコシステムのハブになることで、この潮流に乗っていくものと考えられます。

以上のトレンドにおいて、DeepSeekは破壊者であり加速者の役割を果たしています。大企業中心だった勢力図に新風を吹き込み、オープンな革新と協調を促し、AIの実社会実装を押し進める原動力となっています。今後数年のAI業界を占う上で、DeepSeekの歩みは一つの指標になるでしょう。

4. 倫理的・社会的側面

DeepSeekが直面する課題:倫理・規制・セキュリティ

急速に台頭したDeepSeekですが、その発展には倫理的・社会的な課題も伴います。まず倫理面では、AIモデルの悪用リスクにどう対処するかが重要です。DeepSeekはモデルのオープン提供に際し、ライセンス契約上で違法または危険な目的での利用禁止を明記しています。(※6) 具体的には、暴力の扇動、違法行為の支援、差別やヘイトの助長など、OpenAIの使用規約などでも禁じられている行為への利用を禁止する条項(OpenRAILライセンスの付属Aに準拠)が付されています。(※6) もっとも、これは法的抑止力としては限定的で、実際にモデル自体は誰でも入手・実行可能である以上、悪意ある第三者がこれを用いて有害なコンテンツ生成を行う可能性は否定できません。他のオープンモデル(例:LLaMA流出版やStable Diffusionなど)でも指摘された問題ですが、オープン性と安全性のトレードオフは依然残る課題です。DeepSeek自身は学習データ段階で有害情報を排除し、DPOによる調整で不適切な応答を出しにくくする工夫をしています。(※7, 11) しかし、完璧ではなく、例えばプロンプトを工夫すれば差別的発言や虚偽情報を生成させることも不可能ではないでしょう。そうしたモデルの悪用出力内容の偏り・誤りについて、開発元としてどこまで責任を負うのかは難しい問題です。DeepSeekはライセンス上「モデル出力に起因する損害について一切の責任を負わない」といった免責事項を設けています。(※18) 利用者側にもリスクを理解した上での慎重な運用が求められるでしょう。

中国のAI政策とDeepSeekの関係も見逃せません。中国政府は2023年8月に「生成式人工知能サービス管理暫定弁法」(通称生成AI規制)を施行し、国内で公開される生成AIサービスに対し一定のルールを課しました。(※19) その中では、生成AIによるコンテンツは「社会主義の核心価値観」に合致しなければならないことや、不正確な情報の拡散防止、ユーザーの実名登録制などが盛り込まれています。(※19) また公共向けサービス提供者は当局への届け出義務もあります。(※19) DeepSeekが中国国内ユーザー向けにチャットサービスを提供する場合、これら規制に従う必要があります。実際、DeepSeekはWeChat上での公式アカウントや自社サイトでチャットBotを試験提供しており、恐らく政治的・社会的にデリケートな話題には回答を制限するなどのフィルタを設けていると思われます。モデルそのものはオープンソースですが、中国当局も「研究開発や内部利用は規制対象外」と規定しているため、(※19) DeepSeekがモデルウェイトを公開する行為自体は規制には直接触れません。ただし、それによって不特定多数が自由に利用できる点はグレーゾーンと言えるでしょう。中国の規制当局は「提供者がサービスとして一般公開する場合」に主眼を置いていますが、仮に公開モデルが社会問題を引き起こすような事態になれば、何らかの対応を求められる可能性もあります。DeepSeekとしては、政府のAI政策の範囲内で創意工夫しつつ技術を開放していくという綱渡りが必要です。幸い、同規制はドラフト段階より緩和され「過度に産業発展を阻害しない」バランスとなっていると専門家は指摘しています。(※19) 中国政府も国産AIの発展を奨励する立場であるため、DeepSeekのような先進的事例には一定の理解を示すと思われます。ただし政治的に敏感な分野(検閲やプロパガンダへの悪用)で問題が起きれば、一転して厳しい姿勢を取る可能性もあるため、慎重な舵取りが求められます。

グローバル規制との適合性も課題です。EUでは包括的なAI規制法(AI Act)の制定が進んでおり、高リスクAIの定義や審査・透明性義務が課される見通しです。米国でも連邦・州レベルでAIに関するガイドラインや法整備が進みつつあります。(※20) 国によって規制アプローチは異なりますが、今後大規模言語モデルにも説明責任や公正性の証明が求められる可能性があります。DeepSeekのモデルはオープンで透明性が高いという利点がありますが、それでも例えば出力結果にウォーターマークを入れるとか、AI生成物であることの明示といった要件が課された場合に対応が必要になるかもしれません。また、データセットに関して著作権やプライバシーの問題も潜在しています。DeepSeekはデータ収集時にIP尊重を掲げていますが、(※7) 2兆ものトークンにはWeb上の文章も多く含まれるでしょう。その中には許諾なく使用されたテキストが含まれる可能性も指摘されます。欧州では学習データへの権利処理を求める声もあり、将来的に訴訟リスクが生じることも考えられます(実際、Stable Diffusionの開発元は画像学習データを巡って集団訴訟に直面しました)。DeepSeekは中国企業とはいえグローバルに活動すれば各国法の影響を受けるため、法務面での備えも今後重要になるでしょう。

セキュリティ面では、モデルそのものの安全性利用時の情報保護が課題となります。オープンモデルはソースコードが公開されている分、脆弱性もあれば指摘されやすいという利点がありますが、逆に言えば悪用方法も研究者によって探られやすいです。プロンプトへの特殊な入力でモデルに禁止応答をさせるプロンプトインジェクションや、モデルに学習データを逆算させる訓練データ抽出攻撃など、LLM特有のセキュリティ課題が知られています。DeepSeekもこれらに無縁ではなく、継続的な安全評価と改善が必要でしょう。また、DeepSeekのサービスを利用する際、入力データや出力結果の機密性も問題です。たとえば企業がDeepSeek APIに自社の機密情報を送信して応答を得る場合、データがどのように扱われるか懸念があります。OpenAIはChatGPT利用データを将来モデル改善に使う可能性があるとし物議を醸しましたが、DeepSeekもTerms of Use上でユーザー入力や出力を広範に利用できる権利を主張しているとの指摘があります。(※21) 企業利用者は、自社データが外部に蓄積されないようオンプレミス運用を選ぶ、もしくは契約上の保証を取り付けるといった対策が必要となるでしょう。幸いDeepSeekはモデルをダウンロードして自社サーバで動かすことを認めているため、(※6) この点はOpenAI等に比べコントロールしやすいと言えます。とはいえ、自社運用する場合もモデルから漏洩の可能性がゼロにはならず、生成された機械文が内部情報を含意していないか監査するなど、セキュリティポリシーの見直しが求められるでしょう。

中国のAI戦略とDeepSeekの役割

中国政府は近年AI産業を国家戦略の柱に位置付け、大規模モデルの開発を官民挙げて推進してきました。百度やアリババといったビッグテック企業に加え、清華大学や北京智源研究院など研究機関も大モデル開発に参入しています。DeepSeekはそうした中から突如現れた「黒馬(ダークホース)」であり、その成功は中国のAI政策にも少なからず影響を与えていると考えられます。

まず、DeepSeekは中国における技術自立の象徴として喧伝されています。中国国内メディアや専門家の論調を見ると、DeepSeekの躍進は「外国技術の独占を打破し、中国AIの底力を示すもの」と歓迎されています。(※13) 米国による半導体禁輸や企業リスト制裁など圧力が強まる中で、DeepSeekのように国産チップを活用し最先端モデルを開発できたことは、(※22) 対外アピールとしても価値が高いのです。国政府系メディアの中国日報も「DeepSeekが中国AI新時代を切り開く」と論評し、海外技術への依存脱却への期待を表明しています。(※13) 習近平政権は「科技自立自強」(科学技術の自立と強化)をスローガンに掲げていますが、DeepSeekは民間発ながらその路線に合致する成果と言えます。当然、政府としてもこの成果を利用しない手はなく、今後DeepSeekに何らかの形で支援や協力を提供する可能性もあります(例えば国家プロジェクトへの参画や補助金交付など)。事実、DeepSeekの共同研究という形で華為や寒武紀と協調した実績があるように、(※14) 政府肝いりの産学連携プロジェクトにも関与している模様です。

しかし一方で、政府管理との緊張関係もあります。前述したコンテンツ規制や情報管理の問題に加え、高度AIの軍事転用リスクなども懸念されます。中国はAIを軍事や監視にも活用しており、強力なLLMがサイバー作戦や情報統制に利用される可能性も指摘されています。そのため政府は民間AI企業にも目を光らせており、国家安全に関わると判断すれば統制を強めるでしょう。DeepSeekが公開したモデルが外国で利用され中国に不利な世論操作等に使われる、といった事態になれば、当局が規制を強化する口実になり得ます。もっとも、現時点でそうした兆候はなく、むしろ政府系シンクタンクなどからはDeepSeekへの肯定的な評価が目立ちます。「中国AIの凄みと限界を示した」とする論説では、DeepSeekの成功を称えつつ基礎理論研究の弱さ(トップ会議の被引用数が米国の41%に留まる)に警鐘を鳴らす冷静な分析もあります。(※14) このように、中国国内ではDeepSeekを単なる一企業というより中国AI産業のケーススタディとして論じる向きが強いのです。DeepSeekは否が応でも国家戦略の文脈で語られる立場にあり、技術動向だけでなく政治・政策動向にも影響されるでしょう。

グローバル規制への適応と課題

DeepSeekのようなオープンLLMは、国際的なルール作りの中でも注目されています。各国がAI規制を模索する中、2023年11月には英国主催で初のAI安全サミットが開催され、AI開発各社や政府代表が集まりました。(※20) そこでの議論でも、オープンソースモデルの扱いは一つの論点でした。透明性は高いが管理が及びにくいオープンモデルをどう位置付けるか、各国で見解が割れています。米国などは企業主導の自主規制を尊重する傾向がありますが、EUは法的拘束力のある義務を課そうとしています。(※20) 日本も2023年に生成AIの社会影響に関する提言をまとめ、過度な規制はイノベーションを損なうとして慎重な姿勢を見せています。

こうした中で、DeepSeekは一企業として以上に、オープンモデルの代表例として議論に上る可能性があります。たとえばEUがAI Actで「基盤モデル提供者は適切なリスク対策を講じること」と規定した場合、DeepSeekもその対象となりえます。その際、具体的に何をすべきか(例えばモデルカードで偏り評価を公開する、危険用途を検知するフィルタを添付する等)が求められるでしょう。DeepSeekは既に技術レポートやモデルカードで多くの情報を公開していますが、さらに第三者機関による監査ユーザー教育などが必要になるかもしれません。グローバル市場で信頼を得るには、単に性能が高いだけでなく安全で責任あるAIであると認められることが重要です。オープンソースでコミュニティから検証を受けやすい点は有利ですが、裏を返せば弱点も見つけられやすいということです。DeepSeekチームにはモデル改善だけでなく、倫理・安全面の専門家も加わっていく必要があるでしょう。幸い、Anthropicなど安全志向の企業も研究成果を公開しており、そうした知見を取り入れることで対応可能と思われます。

また、国際協調も課題です。もしDeepSeekが今後国際的な提携を求めるならば、米国の輸出規制など法的障壁をクリアしなければなりません。現在アメリカは先端AI技術の対中輸出を制限していますが、逆のパターン(中国発技術の米国利用)についても安全保障上の懸念が出るかもしれません。例えば米国政府調達では中国企業製AIの使用禁止などが議論される可能性があります.欧州でも、データの出所(人権問題のある地域から収集されたものか等)を気にする声があります。DeepSeekはグローバル展開に際して、自社の立ち位置を「中国企業」ではなく「オープンソースコミュニティの一員」として打ち出すかもしれません。オープンソースである以上、一国家のものではなく人類共通の知的基盤であるという主張です。これは政治的には微妙な問題ですが、技術者コミュニティは国境を越えて協力するものという建前を強調することで、規制の網をくぐり抜ける戦略も考えられます。実際、BLOOMモデルは各国の研究者合同で開発され「フランス発」といった国の色を薄めていました。DeepSeekも将来的に国際共同プロジェクト化する可能性はあります。

総じて、DeepSeekは技術革新とオープン戦略で賞賛される一方、安全管理と規制遵守での責任も背負うことになります。AGI開発競争の最前線に立つ存在として、社会への影響力も大きいため、その動向にはテクノロジーだけでなく倫理・法律の観点からも注視が必要です。

おわりに:DeepSeekが映す未来

中国発のスタートアップDeepSeekは、その名の通り「深く探求する」姿勢で生成AIの最前線に躍り出ました。創業からわずか1年足らずで、高性能な大規模モデルをオープンソースで提供し、世界の大企業を慌てさせたその軌跡は、AI業界における新たな可能性と課題の両方を浮き彫りにしています。

DeepSeekの成功は、巨人に挑む小さなチームが創意工夫と大胆な戦略で道を切り拓けることを示しました。莫大な予算や人員がなくとも、データとアルゴリズムを磨き上げ効率を極めれば、トップクラスのAIを生み出せる——その事実は多くの研究者や開発者に希望を与えました。同時に、大手各社にとっては計画の見直しを迫る警鐘ともなり、価格競争やオープン戦略の検討など、市場のルールを書き換えつつあります。

しかし、DeepSeekが開いた扉の先には、技術的フロンティアと社会的責任が広がっています。さらなる高みを目指す競争は、AGIという夢に人類を近づけるでしょうが、そこには倫理や安全の確保という重石も伴います。DeepSeekが「金儲けではなくAGIを目指す」と宣言する姿勢(※2) は、AI開発のあるべき姿への一石を投じていると言えるでしょう。利潤や囲い込みに走らず、人類全体の知的財産としてAIを育て共有する——その理念が実を結ぶなら、AIは真に我々の生活を豊かにする道具となるでしょう。

日本のビジネスパーソンにとっても、DeepSeekの事例から学べることは多くあります。テクノロジーの急激な進歩にどう向き合うか、オープンイノベーションをどう活用するか、そしてグローバル競争の中で自社の強みをどこに見出すか。DeepSeekが投じた波紋は、日本企業にもAI戦略の再考を促しています。幸い、言語の壁は技術によって低くなりつつあり、仮にDeepSeekモデルに日本語が未熟でも我々自身が微調整で改良できる時代です。重要なのは、最新技術の動向を追い、自社の課題解決に結び付ける柔軟性と大胆さでしょう。

世界を震撼させたDeepSeekは、今まさに新たなページを刻み続けています。その動きから目を離さず、私たちもまた未来への深い探求を続けていきたいものです。

次世代動画ショッピング「7sGood」って何?

本ブログを運営する「7sGood」は香港に本社を置くHHO Limitedが運営する、ショート動画を通して、SNS感覚でお気に入りの商品を探すことができる、次世代型動画ECプラットフォームです。高品質・低コストのユニークなアイデア商品を約10万点展開しています。従来型の大手ECよりも安く、従来型の海外通販ECよりも安心してお買い物をすることが可能です。

7sGoodの特徴

◆ ワクワク商品の殿堂

✅商品の魅力をギュッと濃縮したショート動画で、それぞれのお客様にぴったりの商品がすぐ見つかります。

◆ まるで実店舗

✅実物検証動画・梱包動画をお届けすることで配送プロセスを“見える化”し、見た通り・期待通りの商品をお届けします。

◆ 価格に自信

✅世界中のメーカーの工場から直送することで、無駄なコストを省き、低価格を実現しました。

◆ 安心安全

✅Goodクオリティ・Goodプライスな商品を厳選。品質検証動画で商品の「真実の姿」を伝えます。

✅クレジットカード・スマホ決済・コンビニ決済など、多様で安全な決済手段を利用可能です。

✅迅速応答・迅速対応の充実したカスタマーサービスを提供します。

✅注文した商品は、到着から7日以内は返品・交換可能なため、安心して買い物をお楽しみいただけます。