开运体育中国官方网站 梁文锋冒着我方沦为二流大模子的风险,给通盘中国AI企业探路了


中国 AI 从「跟在后头跑」切换到「能靠我方跑」的分水岭。
开端 |有常识后生
V4 出来这天,DeepSeek 没莳植布会。
只发了一份技艺敷陈,封面上印了两行字:英伟达 GPU,昇腾 NPU。
着重这两行字的章程。这是中国大模子公司第一次,把英伟达和华为放在祛除张技艺敷陈的封面上。
更狠的是后头那一句:模子 1.6 万亿参数,100 万 token 凹凸文,全栈跑通昇腾。
也即是说,这个万亿参数的大模子,不错澈底不依赖英伟达。
01
先看一组数据
前年 5 月,DeepSeek R1 横空出世,硅谷开会研讨中国东说念主怎么作念到的。
一年昔时,国外同业程度是这样的:
OpenAI GPT-5 也曾迭代到 5.4。
Anthropic Claude 4.7 出了。
Gemini 3.1 Pro 上线了。
DeepSeek 这边呢?V3.2 原地不动。
整整 5 个月没出新模子。
同期业内 11 家头部公司平均每 2.8 天发一次迭代。
第三方榜单上,V3.2 轮廓获利跌到全球第 16,代码生成第 17。
外面也曾在传一个判断:DeepSeek 沦为二流了。
这即是题面。
但谁也没念念到,千里默 5 个月不是技艺不行,是我方关了门,干一件比追榜单更难的事。
把 1.6 万亿参数的大模子,从英伟达 CUDA 整套搬到华为昇腾 CANN。
02
这件事到底有多难
得讲少量布景。
你今天用的扫数大模子,险些都跑在英伟达 GPU 上。
CUDA 是英伟达自家的莳植谈话,2007 年到目下,全球险些扫数 AI 工程师都是在 CUDA 生态里长大的。
扫数快、扫数省、扫数舒服的决窍,都千里淀在这套用具链里。
华为昇腾亦然 AI 芯片,但它用我方的谈话,叫 CANN。
让一个万亿参数模子在英伟达上跑通,也曾够难。
让祛除个万亿参数模子同期在昇腾上跑通,性能不可差太多,越过于让一个写惯了汉语的作者,临时学德语,再把《红楼梦》翻译重写一遍,还要让德国读者合计面子。
DeepSeek 把这件事作念了。
技艺细节不难解:
V4 用了 FP4 精度。
这个精度,恰巧是华为本年 3 月新发布的昇腾 950PR 原生维持的。
MoE 群众权重、寥落着重力索引器,全部按昇腾的硬件特质商酌。
通盘工程所有重写了 40 万行算子,全栈架构重作念,精度对都纰谬阻挡在 0.5% 以内。
翻译成大口语:DeepSeek 平直给昇腾量身定作念了一个万亿参数模子。
代价是 484 天没出新版块。
这 484 天里,GPT、Gemini、Claude 在英伟达上各自把版块号往前推了好几代。
DeepSeek 主动把我方最猛烈的那把刀放下,去打磨另一把还没开刃的刀。
03
全部反生意直观的题
这就挑升旨真义了。
按扫数商学院的逻辑,企业要先保我方。
R1 那波之后,DeepSeek 的场面其实相配硬:
第一,全栈跑在英伟达上,CUDA 用了些许年,扫数优化都是熟手。
第二,量化基金幻方作念爹,2025 年收益率 56.6%,一年抽五十亿现款不缺钱。
第三,技艺口碑天花板,融资列队的东说念主能从知春路排到中关村。
最智谋的遴荐,是接着按英伟达这条路猛冲——
把模子作念到全球第一,把品牌作念到顶。
R2 踩 OpenAI,V4 跨过 Gemini,通盘 2026 年的中国 AI 故事不错由 DeepSeek 一个东说念主写。
梁文锋偏巧没这样作念。
他选的是反过来。先作念生态,再保我方。
为什么?因为他看到一个谁都不肯意承认的真相。
中国 AI 通盘行业都在赌一件事:什么时辰,国产芯片能跑万亿参数大模子。
这个赌局,谁都不敢押。
万亿参数模子一朝在国产芯片上跑挂,归天的是几亿好意思元算力账单加半年研发周期。
莫得哪家公司的 CFO 敢签这个字。阿里不签,字节不签,腾讯不签。
DeepSeek 签了。
署名阿谁东说念主是梁文锋。
注册成本从 10 万元酿成 510 万元,他个东说念主握股从 1% 涨到 34%。把身家全压上去,让 V4 同期跑通昇腾和英伟达。
跑通的那一刻,通盘游戏的章程变了。
04
整夜之间,盟友全跟上来了
V4 发布今日,8 家国产 AI 芯片公司同期晓谕完成适配。
华为昇腾 950 超节点、寒武纪、海光、燧原、摩尔线程,一个不少。
阿里、字节、百度,都在我方的云上线了 V4。
更忽闪的是后头这条讯息:阿里、字节、腾讯也曾向华为下单数十万颗昇腾 950PR。
中国 AI 圈很少出现这个画面。
闲居群众是竞争敌手,相互挖东说念主,开运中国相互压价。
这一次暴戾地朝祛除个场所用劲。
为什么?
因为 DeepSeek 把那块最难搬的石头,我方一个东说念主搬开了。
万亿参数模子在昇腾上跑通这件事,越过于一份公开的及格证。
文凭一出,扫数国产芯片厂商都不错走祛除条技艺旅途去适配。
扫数云厂商都敢把国产算力推给客户,因为有 V4 这个标杆站在那儿。
英伟达 CEO 黄仁勋前年说过一句话,被反复援用:
中国如果让 DeepSeek 这种公司用上华为昇腾,那即是英伟达的晦气。
他没念念到这一天来得这样快。
这才是梁文锋真确干的事。
他要的不是榜单第别称的模子。要的是能让国产芯片跑得动的最强模子。
冲榜单,是为我方。把行业抬起来,是给中国 AI 举座趟雷。
05
代价是的确
但代价不是嘴上说说。
第一个代价,东说念主才。
V3 模子最伏击的孝敬者罗福莉,去了小米。
中枢研讨员郭达雅,去了字节。
多模态中枢阮翀、第一代大谈话模子中枢王炳宣,去了腾讯。
每一个名字,背后都是几百万年薪和股权。DeepSeek 给不出市集最高的价。
2026世界杯中国最新押注app第二个代价,市集。
阿里通义千问把 V3 阶段 DeepSeek 占的那部分用户场景,徐徐作念了且归。
豆包靠字节的流量进口,把日活拉到第一。
Kimi 在长凹凸文这条赛说念,也曾走在 DeepSeek 前边。
DeepSeek 月活从 1.38 亿涨到 1.60 亿,看起来还在增长,但增长弧线明显平了。
第三个代价,原则。
前年梁文锋斩钉截铁说过:DeepSeek 暂时不融资。
2026 年 4 月 20 日,DeepSeek 被曝寻求百亿好意思元估值,至少 3 亿好意思元战术融资。阿里、腾讯都在调换名单。
永不融资这条铁律,在 V4 出来前一周,破了。
底层原因不复杂。
R1 当年考试成本是 587 万好意思元,V4 单轮考试成本飙到约 5 亿好意思元。涨了快 100 倍。
昇腾这条路要烧的钱,比英伟达多得多。
芯片产能不够,工程师要再行培训,用具链要重新建。
幻方那点钱,撑不住一个万亿模子时间的全产业链进入。
梁文锋折腰了。
折腰的姿势,是为了把通盘国产 AI 算力产业链拽起来。
06
圈内的新评价
V4 发布后,圈内最准的一句评价是这样的:
V4-Pro 比 GPT-5.4、Gemini 3.1 Pro 逾期 3 到 6 个月。
3 到 6 个月,听起来不长。在 AI 这个行业,饱和把一家公司从第一梯队拉到第二梯队。
逾期是梁文锋我方选的。
V4 是不是 DeepSeek 最强的模子?不是。
V4 是不是 2026 年中国 AI 公司最伏击的一次发布?我倾向于是。
因为它作念的事情,是把通盘国产 AI 生态抬起一截,不是把自家排名再往上挪一格。
第一梯队的位置不错再争。
算力的基础底细如果没打牢,争到也站不住。
07
跟野蛮东说念主有什么关连
绕了这样大一圈,跟野蛮东说念主有什么关连?
第一件,AI 愚弄价钱还会接着掉。
V4 把 API 压到每百万 token 0.3 好意思元。
这个价钱一出来,国内扫数大模子都得随着降。
意味着你以后用的扫数 AI 用具,写文档、作念翻译、改代码、生成图片,成本都要再低一档。
最平直的体感,是各式 AI 会员包月降价。
第二件,国产芯片产业链启动转起来了。
华为昇腾、寒武纪、海光,这些名字以前主如若 A 股投资者存眷。
目下是真有大模子在用,订单是看得见的。
这条产业链凹凸游几百家公司,包括就业器、内存、散热、电源,都随着进入新一轮订单周期。
第三件,AI 这件事不再被一根线绑住。
昔时三年,业内一嫡顾虑一件事:如果好意思国把英伟达十足断供,中国 AI 是不是要原地停摆。
V4 跑通昇腾这件事,把这个最坏假定的概率往下打了一截。还谈不上澈底安全,但至少有了第二条腿。
第四件,离你的使命更近了一步。
价钱低廉的大模子,意味着越来越多公司启动把 AI 接入业务历程。
客服、案牍、商酌、低级编程、报表分析,这些岗亭被替代的速率只会更快。这不是好讯息,然则该提前知说念的事。
08
梁文锋此次的遴荐,可能让 DeepSeek 在改日一年里看起来不那么谛视。
模子评测榜单上的排行会往下掉,融资估值会被国外同业甩开,明星光环会被分给其他公司。
这都是的确的代价。
但如果两年后回头看,会发现2026 年 4 月这周,是中国 AI 从「跟在英伟达后头跑」切换到「能靠我方跑」的一个分水岭。
切这一刀的东说念主,是梁文锋。
你合计他这步棋,赌对了吗?
· END ·