DeepSeekがデータ不正を利用したとして、OpenAIとMicrosoftが調査
1月29
ホワイトハウスの人工知能担当官であるデイヴィッド・サックスは、「中国の新興企業ディープシークが、自社技術の開発に役立てるために、オープンAIのモデルの出力を利用したという実質的な証拠がある」と述べた。
White House artificial intelligence czar David Sacks said there’s “substantial evidence that Chinese upstart DeepSeek leaned on the output of OpenAI’s models to help develop its own technology https://t.co/8imgr5Xkua
— Bloomberg (@business) January 29, 2025
OpenAIは、中国の競合企業DeepSeekが自社のAIモデルを使用して競争相手のチャットボットを訓練した証拠を持っていると主張している、とBloomberg Newsが報じた。
Bloomberg Newsによると、マイクロソフトとOpenAIは、中国のAIスタートアップであるDeepSeekがOpenAIのデータを不正に取得した可能性について調査を進めています。報道によれば、DeepSeekに関連するグループがOpenAIのAPIを通じて大量のデータを抽出していたとされている。 
DeepSeekは、最新のAIモデル「DeepSeek R1」を発表し、OpenAIのChatGPTと同等の性能を持ちながら、古いハードウェアと比較的少ない予算で開発されたと主張している。しかし、同社のモデルがOpenAIの機密データを使用して開発された可能性が浮上し、マイクロソフトとOpenAIは警戒を強めている。
http://totalnewsjp.com/2025/01/29/china-459/ 
OpenAIは、中国のAIスタートアップであるDeepSeekが、OpenAIのAIモデルを無断で利用し、自社の競合チャットボットを訓練した可能性があると主張している。この手法は「蒸留(ディスティレーション)」と呼ばれ、大規模なAIモデルの出力を用いて、より小規模なモデルを効率的に訓練する技術である。
OpenAIの利用規約では、競合するモデルの開発を目的とした出力の使用を禁止しており、今回の行為は知的財産権の侵害にあたる可能性がある。OpenAIと主要なパートナーであるMicrosoftは、DeepSeekによる不正なデータ取得の可能性について調査を進めており、米国政府とも連携して、最先端のAIモデルを保護する対策を強化している。 (ft.com, wsj.com)
参考記事
(画像:bloomberg)