これまでIC産業におけるアメリカ企業と中国企業の差は大きく、中国はICの輸入に関税をかけていないので、中国の国産ICは苦戦してきた。しかし、アメリカがICの輸出規制を強めると、かえって中国のIC産業の発展を促す「幼稚産業保護政策」として機能してしまう可能性がある。

では、DeepSeekは、OpenAIなどに比べて性能が劣るICしか入手できない状況のなかで、いかにしてそれらより効率的に生成AIを作ることができたのだろうか。

OpenAI側はDeepSeekのモデルはOpenAIのモデルを不正に「蒸留」して作成したものだと非難している(『Gigazine』、2025年1月30日)。

ただ、もともと生成AIの訓練にはインターネット上にある膨大な情報を集めて学習するので、DeepSeekの訓練過程で学習した中にはChatGPTが生成した文章などもある。生成AI同士がそうやって互いに参照しあうのはこの業界の常識だという指摘もあるし、果たしてそうしたことだけでライバルの性能を上回るものを作れるのかという疑問もある(『ITmedia AI+』2025年2月7日、劉・屈、2025)。

結局のところ、DeepSeekのモデルがより優れていたからこそ、低コストでGPT-4oなどを上回る成績を上げることができたのではないだろうか。

モデルの概要についてはDeepSeekのウェブサイトに掲載されているテクニカルレポート(DeepSeek-AI, 2025)に書かれている。その内容を理解して紹介する能力は残念ながら私にはないが、Multi-head latent attention とDeepSeekMoEの二つが重要な技術らしい。

成功を招いた2つの独自技術
【関連記事】