中国のスタートアップ企業がぶち壊した、世界のAIモデル産業の大きな壁

中国では1月29日に春節(旧正月)を迎えた。その直前にあたる1月20日、中国のAIスタートアップ企業DeepSeekが発表した最新AI言語モデル「R1」は極めて低コストでありながら、世界最先端の言語モデルに匹敵、あるいは凌駕する性能を持つことで瞬く間に世界の注目を集め、中国人の新年の祝賀ムードに華を添えた。

■DeepSeekは2023年創業のスタートアップ企業
2023年に創業した同社はこれまですでに「DeepSeek Coder」をはじめとする数々のAIツールを提供し、開発者がコード生成やデバッグを行う際のコストの大幅な削減に寄与してきた。また、歴代の言語モデルである「V2」や「V3」では高度なテキスト生成や感情分析機能を備えながらも価格を大幅に引き下げることで、AI市場の競争を激化させた。

■強力と低コストを両立した推論能力が大きな武器
そして今月20日にリリースされた最新の言語モデル「R1」は、強力な推論能力と低コストという2つの大きな強みを武器に、OpenAIやGoogleなどAI分野の巨人に対して挑戦状を叩きつけた。R1は、モジュラー型の「混合専門家(MoE)」という機械学習アーキテクチャを採用。6710億パラメータのうち必要な部分だけを活性化することで、計算コストを削減しつつ高い性能を発揮する。また、持続的なフィードバックループによって自己学習し、自己修正・適応を実現する純粋な強化学習(RL)を取り入れ、特に高度な推論や論理分析を必要とする場合に他のAIモデルとは一線を画す問題解決能力を獲得した。

さらに、マルチヘッド潜在的注意(MLA)メカニズムによって文脈関係をより的確に識別しながら、従来のマルチヘッド注意メカニズムに比べてメモリ使用効率を向上させたほか、大規模トレーニング済みモデルの学習内容を小規模モデルに利用する「蒸留」の手法を採用することで、必要な計算リソースの大幅な削減を実現。「R1」の推論コストはOpenAIのモデルのわずか約2%にまで抑えられ、特にコストを重視する企業にとって大きな利点をもたらした。

■クオンツファンドと提携戦略も成功のカギに
DeepSeekが革新的な言語モデルをリリースできたのは、創業者の梁文峰氏が率いるクオンツファンド「ハイフライヤー・クオント(幻方量化)」が資金面でサポートしており、短期的な利益追求から解放された状態でAI研究が行える自由な環境が得られたことが大きい。長期的な研究と革新に焦点を当てた取り組みが継続できているからこそ、AIツールの民主化が進み、多くの企業が手軽に先進的なAI技術にアクセスできるようになったのだ。

また、コストパフォーマンスを考慮しつつも高性能な計算資源を確保するためにAMDと提携し、AMD Instinct GPUとオープンソースROCm(GPUコンピューティングプラットフォーム)を活用したことで、「H100」などNVIDIAの最先端GPUに頼らずとも大規模かつ高性能なAIモデルを構築できることを実証した点も非常に大きな意味を持つ。中国が米国政府から最先端半導体の輸入を規制されている状況を考えれば、その重要性はますます大きいと言える。

■風穴が開いたAIモデル産業の未来は?
今年1月、DeepSeek R1はアップルApp Storeでダウンロード数1位になっており、Google Play Storeでもダウンロード数が急増した。AIの推論過程を可視化する機能「DeepThink」や、ウェブ検索といった新機能が特に注目されており、AIの活用範囲が広がるきっかけになるとの期待も寄せられている。低価格、高性能、オープンソースという特徴を活かして、AI業界に大きな風穴を開けたDeepSeekのさらなる進化と、市場への影響から目が離せない。

(出典:https://baijiahao.baidu.com/s?id=1822392190860590697)