當(dāng)前位置:首頁(yè) > 外匯資訊 > 正文內(nèi)容

AI屆的拼多多來(lái)了!中國(guó)大模型黑馬“異軍突起”,OpenAI再不出GPT-5就完了?

激石外匯2024-05-08 11:52:16外匯資訊241

激石Pepperstone(http://hppnl.com/)報(bào)道:

開(kāi)源大模型領(lǐng)域新秀再起。

昨天,知名私募巨頭幻方量化旗下的AI公司深度求索(DeepSeek)發(fā)布全新第二代MoE大模型DeepSeek-V2。

這款支持128K上下文窗口的開(kāi)源MoE模型,能憑借低至“谷底”的價(jià)格成為新星嗎?

能力媲美GPT-4,價(jià)格為其百分之一

先看性能。

和當(dāng)前主流大模型相比,DeepSeek-V2毫不遜色。

據(jù)悉,DeepSeek-V2擁有2360億參數(shù),其中每個(gè)token210億個(gè)活躍參數(shù),相對(duì)較少,但仍然達(dá)到了開(kāi)源模型中頂級(jí)的性能,稱得上是最強(qiáng)的開(kāi)源MoE語(yǔ)言模型。

研究團(tuán)隊(duì)構(gòu)建了由8.1T token組成的高質(zhì)量、多源預(yù)訓(xùn)練語(yǔ)料庫(kù)。與DeepSeek 67B使用的語(yǔ)料庫(kù)相比,該語(yǔ)料庫(kù)的數(shù)據(jù)量特別是中文數(shù)據(jù)量更大,數(shù)據(jù)質(zhì)量更高。

據(jù)官網(wǎng)介紹,DeepSeek-V2的中文綜合能力(AlignBench)在眾多開(kāi)源模型中最強(qiáng),超過(guò)GPT-4,與GPT-4-Turbo,文心 4.0等閉源模型在評(píng)測(cè)中處于同一梯隊(duì)。

其次,DeepSeek-V2英文綜合能力(MT-Bench)與最強(qiáng)的開(kāi)源模型LLaMA3-70B處于同一梯隊(duì),超過(guò)最強(qiáng)MoE開(kāi)源模型Mixtral8x22B。

有分析指出,該模型的訓(xùn)練參數(shù)量高達(dá)8.1萬(wàn)億個(gè)token,而DeepSeek V2表現(xiàn)出“難以置信”的訓(xùn)練效率,并且計(jì)算量?jī)H為Meta Llama 3 70B 的1/5。

更直觀地說(shuō),DeepSeek-V2訓(xùn)練所需的運(yùn)算量是GPT-4 的1/20,而性能卻相差不大。

有外國(guó)網(wǎng)友給出了高度評(píng)價(jià):在僅有210億個(gè)活躍參數(shù)的情況下,能達(dá)到如此強(qiáng)的推理能力相當(dāng)驚人。

“如果屬實(shí)的話,那是相當(dāng)驚人的?!?/p>

“原來(lái)是中國(guó)公司?也許這就是‘中國(guó)隊(duì)’在AI領(lǐng)域名列前茅的原因?!?/p>

不過(guò),技術(shù)已經(jīng)不是大模型的唯一宣傳點(diǎn)了。

作為AI技術(shù)的前沿領(lǐng)域,大模型更新?lián)Q代之快有目共睹,再?gòu)?qiáng)的性能也可能在發(fā)布的下一秒就被友商反超。

因此,DeepSeek選擇“卷”價(jià)格。

目前DeepSeek-V2 API的定價(jià)為:每百萬(wàn)token輸入1元、輸出2元(32K上下文)。

和友商相比,僅為GPT-4-Turbo的近百分之一。

DeepSeek表示,采用8xH800 GPU的單節(jié)點(diǎn)峰值吞吐量可達(dá)到每秒50000多個(gè)解碼token。

如果僅按輸出token的API的報(bào)價(jià)計(jì)算,每個(gè)節(jié)點(diǎn)每小時(shí)的收入就是50.4美元,假設(shè)利用率完全充分,按照一個(gè)8xH800節(jié)點(diǎn)的成本為每小時(shí)15美元來(lái)計(jì)算,DeepSeek每臺(tái)服務(wù)器每小時(shí)的收益可達(dá)35.4美元,甚至能實(shí)現(xiàn)70%以上的毛利率。

有分析人士指出,即使服務(wù)器利用率不充分、批處理速度低于峰值能力,DeepSeek也有足夠的盈利空間,同時(shí)顛覆其他大模型的商業(yè)邏輯。

總結(jié)就是,主打一個(gè)“經(jīng)濟(jì)實(shí)惠”。

有網(wǎng)友表示:太便宜了,充50塊能用好幾年。

“日常的任務(wù)都能勝任?!?/p>

“開(kāi)放平臺(tái)送的十塊錢共有500萬(wàn)token。”

全新創(chuàng)新架構(gòu),支持開(kāi)源

價(jià)格是怎么被打下去的?

來(lái)自DeepSeek-V2的全新架構(gòu)。

據(jù)悉,DeepSeek-V2采用Transformer架構(gòu),其中每個(gè)Transformer塊由一個(gè)注意力模塊和一個(gè)前饋網(wǎng)絡(luò)(FFN)組成,并且在注意力機(jī)制和FFN方面,研究團(tuán)隊(duì)設(shè)計(jì)并采用了創(chuàng)新架構(gòu)。?

據(jù)介紹,一方面,該研究設(shè)計(jì)了MLA,利用低秩鍵值聯(lián)合壓縮來(lái)消除推理時(shí)鍵值緩存的瓶頸,從而支持高效推理。

另一方面,對(duì)于FFN,該研究采用高性能MoE架構(gòu) ——DeepSeekMoE,以經(jīng)濟(jì)的成本訓(xùn)練強(qiáng)大的模型。?

DeepSeek-V2基于高效且輕量級(jí)的框架HAI-LLM進(jìn)行訓(xùn)練,采用16-way zero-bubble pipeline并行、8-way專家并行和ZeRO-1數(shù)據(jù)并行。

鑒于DeepSeek-V2的激活參數(shù)相對(duì)較少,并且重新計(jì)算部分算子以節(jié)省激活內(nèi)存,無(wú)需張量并行即可訓(xùn)練,因此DeepSeek-V2減少了通信開(kāi)銷。

并且,DeepSeek-V2完全開(kāi)源(https://huggingface.co/deepseek-ai),可免費(fèi)上用,開(kāi)源模型支持128K上下文,對(duì)話官網(wǎng)/API支持32K上下文(約24000個(gè)token),還兼容OpenAI API接口。

不僅性能好,還這么便宜,甚至直接兼容OpenAI API,DeepSeek-V2這手“王炸”,換誰(shuí)可能都沒(méi)法拒絕。

外國(guó)網(wǎng)友直呼:沒(méi)理由不用!

DeepSeek-V2的性能水平幾乎和與GPT-4一致、提供的API與OpenAI API兼容、可以免費(fèi)使用500個(gè)token、付費(fèi)版本價(jià)格僅為GPT-4的1/100……

“沒(méi)有理由不用它?!?/p>

掃描二維碼推送至手機(jī)訪問(wèn)。

版權(quán)聲明:本文由激石Pepperstone發(fā)布,如需轉(zhuǎn)載請(qǐng)注明出處。

本文鏈接:http://hppnl.com/news/3021.html

標(biāo)簽: OpenAIGPT-5

“AI屆的拼多多來(lái)了!中國(guó)大模型黑馬“異軍突起”,OpenAI再不出GPT-5就完了?” 的相關(guān)文章

不看好格力了?剛剛,15年鐵桿經(jīng)銷商大撤退:一把減持套現(xiàn)35億!

不看好格力了?剛剛,15年鐵桿經(jīng)銷商大撤退:一把減持套現(xiàn)35億!

激石Pepperstone(http://hppnl.com/)報(bào)道: 就在董明珠和秘書孟羽童直播帶貨如火如荼之際,618剛過(guò)又出現(xiàn)了經(jīng)銷商大手筆套現(xiàn)的事情,幾乎重演了兩年前的一幕。 6月24日晚,格力電器公告,京海互聯(lián)于當(dāng)日通過(guò)大宗交易方式減持公司股份1.1億股,占格力電器總股本的...

衰退風(fēng)險(xiǎn)面前,大宗商品“最后的堡壘”崩了,但美聯(lián)儲(chǔ)停不下來(lái)

衰退風(fēng)險(xiǎn)面前,大宗商品“最后的堡壘”崩了,但美聯(lián)儲(chǔ)停不下來(lái)

激石Pepperstone(http://hppnl.com/)報(bào)道:衰退陰云籠罩全球市場(chǎng),大宗商品一片腥風(fēng)血雨,尤其強(qiáng)勢(shì)的油價(jià)更是首當(dāng)其沖。 周二,國(guó)際油價(jià)大幅跳水,創(chuàng)近四個(gè)月來(lái)最大跌幅。WTI 8月原油期貨收跌8.93美元,跌幅8.24%,報(bào)99.50美元/桶。ICE布倫特9月原油期...

龍頭私募“神秘階層”曝光,自有資本培養(yǎng)未來(lái)大腕,破解世紀(jì)“最貴難題”

激石Pepperstone(http://hppnl.com/)報(bào)道:21世紀(jì)最貴的是什么? 是人才。 什么行業(yè)里的人才最貴? 投資行業(yè)的人才! 論資本投入,論培養(yǎng)成本,乃至真正出徒后的或有風(fēng)險(xiǎn)損失。這個(gè)領(lǐng)域在各行各業(yè)中不是第一,也是前三。 近日,資事堂從行業(yè)里獲悉,一批業(yè)內(nèi)頭部私募機(jī)構(gòu)...

不買了?馬斯克單方面宣布終止收購(gòu),Twitter:你想得美

不買了?馬斯克單方面宣布終止收購(gòu),Twitter:你想得美

激石Pepperstone(http://hppnl.com/)報(bào)道:馬斯克收購(gòu) Twitter 的交易,就像他在喬·羅根播客上抽的那支卷草一樣,在他享受完整個(gè)過(guò)程之后,化作一團(tuán)煙,消失不見(jiàn)了。 就在剛才,這位世界首富給美國(guó)證券交易委員會(huì) SEC 和 Twitter 法務(wù)部門發(fā)了一封信,...

巴菲特“大韭菜”上身,拋售萬(wàn)億比亞迪?

巴菲特“大韭菜”上身,拋售萬(wàn)億比亞迪?

激石Pepperstone(http://hppnl.com/)報(bào)道:根據(jù)港交所最新數(shù)據(jù)顯示,7月9日,花旗銀行持有比亞迪股份1.63億股。而到7月11日,花旗銀行持倉(cāng)增加2.25億股至3.88億股,占比35.39%。 眾所周知,巴菲特在2008年以每股8港元的價(jià)格,在港股認(rèn)購(gòu)了比...

又是崩盤夜!油價(jià)暴跌7%,外盤農(nóng)產(chǎn)品、有色“潰敗”,能化系遭重挫,原因找到了?歐盟攤牌:允許沒(méi)收俄在歐資產(chǎn)

激石Pepperstone(http://hppnl.com/)報(bào)道:昨夜,商品市場(chǎng)又崩了! 周二晚間,國(guó)際油價(jià)集體跌超6%,布倫特原油期貨在美股開(kāi)盤一小時(shí)便跌穿100美元/桶關(guān)鍵心理整數(shù)位,美油WTI最低失守97美元/桶。凌晨美油跌幅一度擴(kuò)大至8%。 內(nèi)盤方面,截至23:00收盤,...