宣稱兼具低成本、高效能優勢的中國人工智能(AI)模型DeepSeek本週在美國科技投資界引發震動。在眾多業界人士為美國AI技術領導地位岌岌可危深感擔憂之際,最新分析指出,DeepSeek可能以不正當方式“照搬”了美國OpenAI的產品模型,其真實成本也遠遠沒有此前傳說的那麼低廉。
DeepSeek被指控違規“借用”美國AI模型
美國人工智能研究機構OpenAI 和白宮官員表示,中國人工智能新創公司深度探索可能透過不正當的方式利用了OpenAI的專有技術來開發其自有的AI產品DeepSeek。
OpenAI一名發言人透過電子郵件對美國之音說:“我們知道中華人名共和國的組織正在積極努力使用包括'蒸餾'在內的方法,試圖複製美國先進的人工智能模型。我們意識到並正在評估DeepSeek 可能不恰當地'蒸餾'了我們的模型的跡象,並將在我們了解更多訊息時分享訊息。”
這名發言人還說,OpenAI正在“採取積極、主動的對策來保護我們的技術,並將繼續與美國政府密切合作”,保護在美國建立的功能最強大的AI模型。
“蒸餾”是一種透過訓練小型模型模仿大型模型行為的技術,將複雜模型的知識提煉到簡單模型,廣泛應用於提高AI效率與降低成本。
中國傳媒第一財經說,DeepSeek-V3 的技術文件顯示,該模型使用數據蒸餾技術產生的高品質數據提升了訓練效率,透過現有的高品質模型來合成少量高品質數據,作為新模型的訓練數據,從而達到接近在原始數據上訓練的效果。
OpenAI的發言人介紹說,AI技術開發人員可以合法方式以蒸餾方式來提高其開發的應用的水平,但是根據OpenAI 的官方使用條款,不允許外界使用OpenAI模型的產出來開發與OpenAI競爭的AI模型。
白宮人工智能與加密貨幣事務主管戴維·薩克斯(David Sacks)星期二在接受福克斯新聞採訪時表示,DeepSeek“很可能”竊取了美國的知識產權。
他指出,“蒸餾”技術在AI領域中是一種常見的做法,但從OpenAI 模型中提煉知識的行為可能引發了OpenAI的不滿。阻止外國AI公司“蒸餾”美國技術將可以有效減緩這些公司的抄襲行為。
他說:“有大量證據表明,DeepSeek 在這裡所做的是從OpenAI的模型中提取知識。我認為OpenAI 對此並不滿意。我認為,在接下來的幾個月裡你會看到,我們領先的AI公司採取措施,防止蒸餾。 我們要觀察的是,那些領先的人工智能公司能否阻止第三方公司的蒸餾。
先前,社交媒體流傳的用戶使用DeepSeek V3 模型的對話截圖顯示,DeepSeek 時常在提供答案是”坦言“自己是基於OpenAI 出品的ChatGPT-4 人工智能機械人的設計架構,有時甚至自稱是ChatGPT,這似乎佐證了DeepSeek 直接移植OpenAI 技術的相關指控。
喬治城大學安全與新興科技中心數據研究分析師雅各布·費爾德蓋斯(Jacob Feldgoise)說,AI技術日新月異,其開源的特點為制訂知識產權規則帶來許多挑戰。
費爾德蓋斯對美國之音說,”蒸餾基本上就是一種利用更大、更有能力的模型的輸出,讓較小的模型性能發揮到極致的方法。因此,這一系列關於OpenAI 服務條款和潛在知識產權盜竊的問題,可以總結為DeepSeek 是否使用OpenAI 的o1 模型來訓練DeepSeek 發布的R1 模型。“
他說:“這是一系列的新問題。這不僅是公司必須努力解決的問題,也是美國法律體係也要努力解決的問題。”
低成本說法遭質疑
DeepSeek 的另一個”高明“之處,在於其所聲稱的低開發成本。深度探索公司團隊最初聲稱,其開發DeepSeek-V3 模型僅花費不到600萬美元,這項消息震撼了美國科技投資界。然而,最新的分析質疑,這個數字可能遠低於其實際的研發成本。
半導體研究和顧問公司SemiAnalysis 在1月31日發表的研究報告中說,DeepSeek 的主要投資方幻方量化早在2021年美國出口管制生效前,就囤積了一萬塊英偉達先進的A100 GPU。
報告認為,DeepSeek 僅在GPU方面的投資就超過五億美元,伺服器總資本支出約16億美元,其中高達9.44億美元用於運行其芯片集群。
矽谷科技投資公司Altimeter Capital 創辦人布萊德‧格斯特納(Brad Gerstner) 在X平台上發文指出,先前盛傳的DeepSeek 只用了6百萬美元就研發出媲美OpenAI、Anthropic 等美國公司耗資數十億的AI工具的說法是”假新聞“。
OpenAI並未公開其AI產品”o1“的研發投入。但據格斯特納推測,”o1“成本在150萬美元左右。格斯特納1月28日接受美國CNBC採訪時說,考慮到DeepSeek 發佈時間比OpenAI的o1(預覽版)更晚,研發成本更低是情理之中。
他說:“這不是一個重大的價格突破。這實際上是你所期望的-計算成本每年下降約50%。”
芯片來路引關注
另一方面,也有報導指出,DeepSeek不僅利用了OpenAI 的開源程式碼和數據,並可能透過第三方繞過了美國對高階芯片的出口管制,獲得了大量高階英偉達芯片來支援其AI模型的開發,這已經引發美國政府的關注和調查。
據路透社報導,美國商務部正在調查DeepSeek 是否一直在使用被禁止運往中國的美國芯片。 DeepSeek 表示,使用了英偉達的H800芯片,這款芯片本來可以在2023年合法購買。
彭博社報導說,美國政府也正在調查DeepSeek是否能夠透過新加坡的第三方實體取得高效能的英偉達芯片。
英偉達的發言人透過電子郵件對美國之音說,DeepSeek的成功是一種被稱為“測試時擴展”(test time scaling)技術優勢的典範,但沒有直接回應DeepSeek是否使用了目前受制裁的高階英偉達芯片。
他說,DeepSeek的成就“說明瞭如何使用該技術創建新模型,利用廣泛可用的模型和完全符合出口管制的計算能力。而推理(inference)需要大量的英偉達GPU和高性能網絡。”
同時,白宮本週表示,國家安全委員會已經開始調查DeepSeek 是否對美國國家安全構成影響。
國會眾議院美國與中國共產黨戰略競爭特設委員會主席約翰·穆勒納爾(John Moolenaar)和首席民主黨議員拉賈·克里希納莫蒂(Raja Krishnamoorthi)眾議員本週四致函白宮國安顧問邁克沃爾茲(Mike Waltz),要求白宮方面考慮將目前允許向中國出口的英偉達H20芯片列入出口管制對象,並嚴格管制可以被用於AI推理(inference)的芯片設計技術。
他們也要求聯邦政府設備和關鍵基礎設施禁止安裝中國的AI工具。公開信指出,DeepSeek的隱私權政策明確規定,該軟體將收集的資訊“儲存在位於中華人民共和國的伺服器上”。
公開信要求白宮調查新加坡是否成為了中國實體取得被禁芯片的中轉國,並表示,如果新加坡等國不願意打擊透過向中國轉運芯片的活動,就應該受到更嚴格的許可要求。
在英偉達最近的季度報告中,新加坡佔其收入的22%。該公司本身透露,這些出貨量中的大部分最終都運往新加坡以外的用戶。
英偉達公司的發言人對美國之音表示,與新加坡相關的收入並不意味著有產品轉移到了中國。他說,英偉達的獲利報告中顯示的帳單(bill to)地址不等同最終的出貨(ship to)地址。他說:“我們的許多客戶在新加坡都有商業實體,並將這些實體用於向美國和西方運送產品。”
他強調,英偉達“堅持要求我們的合作夥伴遵守所有適用法律”,如果得知有任何違法情況,會要求其合作夥伴遵守相關法規。
同時,越來越多的國家和地區的政府以安全考量為由,禁止政府設備安裝DeepSeek。義大利政府星期四宣布,出自保護用戶資料隱私的考慮,封鎖DeepSeek 在該國的使用,並對這款AI工具的所有者進行調查。
台灣政府星期五表示,禁止公務機關和關鍵基礎設施使用中國深度求索(DeepSeek)公司推出AI模型和產品。同時,美國德州星期五也宣佈,禁止州政府分發的電子設備安裝DeepSeek 等中國應用;其他被禁的應用程式還包括小紅書和Lemon8。