一级黄网站_波多野结衣片子_欧美性极品_熟女高潮一区二区三区_亚洲最大成人在线_xxx在线播放

DeepSeek GitHub 星數(shù)超越 OpenAI，僅用時(shí)兩個(gè)月

人工智能AI2025-02-07

我們正在見(jiàn)證歷史：DeepSeek 項(xiàng)目在全球最大代碼托管平臺(tái) GitHub 上的 Star 量超過(guò)了 OpenAI。截至本周五下午兩點(diǎn)，DeepSeek 旗下熱度最高的項(xiàng)目 DeepSeek-V3 大模型 Star 量已達(dá) 7.77 萬(wàn)，超越了同平臺(tái)中 OpenAI 最熱門項(xiàng)目。DeepSeek 項(xiàng)目的星數(shù)還在以肉眼可見(jiàn)的速度增長(zhǎng)。去年 12 月 26 日...

DeepSeek GitHub 星數(shù)超越 OpenAI，僅用時(shí)兩個(gè)月-第1張圖片.jpg

我們正在見(jiàn)證歷史：DeepSeek 項(xiàng)目在全球最大代碼托管平臺(tái) GitHub 上的 Star 量超過(guò)了 OpenAI。

截至本周五下午兩點(diǎn)，DeepSeek 旗下熱度最高的項(xiàng)目 DeepSeek-V3 大模型 Star 量已達(dá) 7.77 萬(wàn)，超越了同平臺(tái)中 OpenAI 最熱門項(xiàng)目。

DeepSeek GitHub 星數(shù)超越 OpenAI，僅用時(shí)兩個(gè)月-第2張圖片.jpg

DeepSeek 項(xiàng)目的星數(shù)還在以肉眼可見(jiàn)的速度增長(zhǎng)。

去年 12 月 26 日，DeepSeek AI 開(kāi)源了其最新混合專家（MoE）大語(yǔ)言模型 DeepSeek-V3，它立即成為通用語(yǔ)言模型的性能標(biāo)桿，受到了全球 AI 社區(qū)熱議。

DeepSeek-V3 模型引入了動(dòng)態(tài)注意力機(jī)制（Dynamic Attention Mechanism），通過(guò)實(shí)時(shí)調(diào)整注意力權(quán)重優(yōu)化文本生成質(zhì)量。其 MoE 架構(gòu)共包含 6710 億參數(shù)，但每 Token 僅激活 370 億參數(shù)，大幅降低了計(jì)算成本，訓(xùn)練成本僅為同類閉源模型的 1/20。

據(jù)技術(shù)報(bào)告介紹，DeepSeek-V3 的預(yù)訓(xùn)練過(guò)程只花費(fèi) 266.4 萬(wàn) H800 GPU Hours，再加上上下文擴(kuò)展與后訓(xùn)練的訓(xùn)練共為 278.8 H800 GPU Hours（訓(xùn)練成本 557.6 萬(wàn)美元）。相較之下，Llama 3 的訓(xùn)練預(yù)算約為 3930 萬(wàn) H100 GPU Hours。

DeepSeek GitHub 星數(shù)超越 OpenAI，僅用時(shí)兩個(gè)月-第3張圖片.jpg

隨后在 1 月 23 日，DeepSeek 以 V3 為基礎(chǔ)使用強(qiáng)化學(xué)習(xí)（Reinforcement Learning）驅(qū)動(dòng)重構(gòu)訓(xùn)練范式，提出了 DeepSeek-R1，徹底改變了開(kāi)源 AI 世界。

DeepSeek R1 性能完全對(duì)標(biāo) OpenAI o1，與 DeepSeek V3 相比性能有大幅提升，其論文指出純強(qiáng)化學(xué)習(xí)可以賦予 LLM 強(qiáng)推理能力，而無(wú)需大量監(jiān)督微調(diào)，震動(dòng)了 AI 業(yè)界。

從技術(shù)角度來(lái)看，DeepSeek 展示了國(guó)內(nèi)科研團(tuán)隊(duì)的創(chuàng)新能力，并在 Scaling Laws 之后揭開(kāi)了大模型發(fā)展的新范式，大幅降低了 AI 對(duì)算力的依賴，并用自我進(jìn)化的方式平衡了數(shù)據(jù)優(yōu)勢(shì)。

R1 還支持將推理能力遷移至更小模型，為邊緣計(jì)算和即時(shí)應(yīng)用開(kāi)辟了大量的可能性。

DeepSeek GitHub 星數(shù)超越 OpenAI，僅用時(shí)兩個(gè)月-第4張圖片.jpg

由于 OpenAI 自 GPT-3 起并未開(kāi)源其基礎(chǔ) AI 大模型，目前 OpenAI 的熱門開(kāi)源項(xiàng)目包括 openai-cookbook，即使用 OpenAI API 完成常見(jiàn)任務(wù)的示例代碼和指南；以及 Whisper，這是一個(gè) 2022 年 9 月開(kāi)源的通用語(yǔ)音識(shí)別模型。

除此之外，同屬開(kāi)源大模型的 Llama 系列最高星數(shù)達(dá)到了 5.75 萬(wàn)，阿里云的 Qwen2.5 有 1.49 萬(wàn) Star，零一萬(wàn)物的 Yi 有 7800 Star。

DeepSeek GitHub 星數(shù)超越 OpenAI，僅用時(shí)兩個(gè)月-第5張圖片.jpg

DeepSeek V3 和 R1 的推出仿佛為全球大模型社區(qū)打了一針強(qiáng)心劑，在 AI 研究領(lǐng)域，圍繞 R1 核心強(qiáng)化學(xué)習(xí)方法 GRPO 的進(jìn)一步研究已經(jīng)出現(xiàn)。

DeepSeek 開(kāi)源的策略也為應(yīng)用創(chuàng)造了大量機(jī)會(huì)。目前雖然 DeepSeek App 官方報(bào)告正在受到高頻次網(wǎng)絡(luò)攻擊，但僅在國(guó)內(nèi)就有阿里云、華為云、騰訊云、百度智能云、360 數(shù)字安全、云軸科技等多個(gè)平臺(tái)宣布上線了 DeepSeek 大模型，方便各路開(kāi)發(fā)者調(diào)用。

在海外，英偉達(dá)、亞馬遜和微軟云服務(wù)也宣布接入了 DeepSeek R1。

DeepSeek 系列模型被公認(rèn)為是目前最先進(jìn)的大語(yǔ)言模型之一，隨著技術(shù)開(kāi)源的推動(dòng)，我們或許將見(jiàn)證生成式 AI 更快的發(fā)展。

標(biāo)簽DeepSeek OpenAI 大模型

上一篇：OpenAI 全面開(kāi)放 ChatGPT 搜索功能

下一篇：臺(tái)積電斷供大陸芯片公司，16/14nm被限！