国产大模型「五强争霸」,决战AGI!

搜索
AI-TNT
正文
资源拓展
国产大模型「五强争霸」,决战AGI!
2025-05-13 09:58

中国基础大模型市场,彻底变天了!如今牌桌上的玩家已经变成了「基模五强」——字节、阿里、阶跃星辰、智谱和DeepSeek。接下来的巅峰之战,关键制胜点又会在哪里?


DeepSeek的横空出世,已经彻底改变了全球的AI局势。


从此,不仅中美大模型竞争格局改变,国产大模型的产业版图,也被一举打破!


纵观中国基础大模型的市场,可以看到,如今的基础大模型版图已然改天换地,演变为全新的五强格局——


字节、阿里、阶跃星辰、智谱,以及DeepSeek。


新基模五强突围,下一个制胜点在哪?


脱颖而出的这五强,为何能成为留在最后的玩家?


答案很简单——要么有钱,要么有人。


前者,道理不言自明。训练大模型是明牌重注,要么得自家有粮,要么就得有大腿。


像字节、阿里、DeepSeek,都属于有粮的类型;而智谱和阶跃星辰,则无疑属于后者。


其中,上海队的阶跃星辰,最新一轮融资发生在24年底至25年初,B轮已融资数亿美金;北京队的智谱,在2025年3月已经拿下18亿人民币的融资。


而说到人,当然就是高密度人才,尤其要有行业认可的技术领军人物。


我们仔细盘盘就能发现,五强在这方面是分足鼎立,各有骨干。


字节的吴永辉,阿里的吴泳铭、周靖人,阶跃星辰的姜大昕、张祥雨、朱亦博,智谱的唐杰、张鹏,DeepSeek的梁文锋,都是在业界足以撼动局势的人物。


国产大模型「五强争霸」,决战AGI!


满足了有钱又有人,在这方面起跑线上各家都差不多,接下来要比拼的,就是硬货了。


基模五强,各领风骚


其实仔细分析,就能发现这五强的共性。


要么是全才,模型的能力要能做到全面覆盖,且性能在第一梯队。要么就是专才,模型在某一方面遥遥领先。


阿里:开源王者,全球第三


阿里以「开源王者」的独特定位,不仅在国内市场占据重要席位,更在全球AI开源生态中,稳居全球TOP 3模型贡献者。


国产大模型「五强争霸」,决战AGI!

斯坦福2025年人工智能指数报告


可以说,阿里是国内过最开源自研LLM互联网巨头,也是全球唯一一家实现「全尺寸、全模态」开源的云计算厂商。


可以说,作为开源最早、最完整的大公司,阿里在AI的投入上最坚决,也是如今布局最全、最先赚到钱的中国互联网大厂。


自2023年以来,通义团队累积开源200+模型,涵盖了千问(Qwen)大语言模型和万相(Wan)视觉生成模型两大基座系列。


这些模型覆盖了文本生成、视觉/语音理解生成、文生图,以及视频生成等全模态,参数规模从0.5B到235B不等,跨越119种语言及方言。


两年前,国内LLM市场尚处于「百模」混战阶段,阿里率先将Qwen-7B开源,吸引了全球开发者的关注。


截至目前,Qwen全球下载量超3亿,衍生模型数量超10万,超越Llama成为全球第一开源模型。


在Hugging Face社区,2024年Qwen系列占全球模型下载量的30%以上,稳居第一。


国产大模型「五强争霸」,决战AGI!

25年2月,Hugging Face全球开源大模型榜单中,排名前十开源模型全部基于Qwen二次开发


在这场「烧钱」的游戏中,未来三年,阿里还将投入3800亿元用于AI研发,用于云和AI硬件基础设施,总额超过去十年总和。


这一投入规模在国内互联网公司中首屈一指,恰恰展现了阿里在AI赛道上的战略决心。


相较于其他大模型玩家,阿里凭借成熟的商业化路径和广泛的客户基础,率先实现了投入到回报的闭环。


截止2025年1月底,通过阿里云百炼平台调用通义大模型API的企业已超过29万。


字节:巨型航母,重回创业


字节的大模型以「综合能力强」为特色,覆盖了文本生成、图像理解、视频生成、语音处理等多模态领域。


在这场技术与资源的巅峰对决之中,字节不仅在自研大模型和AI应用领域,展现出了「凶残的战斗力」。


目前,字节旗下的AI应用超20多款,爆火核心产品「豆包」凭借其强大文本生成和多模态能力,迅速占领用户心智,月活用户超1亿。


视频生成工具「即梦」也被赋予了更高的战略优先级,已在虚拟偶像、电商直播等领域,实现商业化落地。


同样,字节在AI编程领域不敢落后。他们推出的AI编程工具Trae,直接对标Cursor等AI集成开发环境。


国产大模型「五强争霸」,决战AGI!


在企业服务方面,基于豆包大模型,火山引擎「飞连」也在多场景落地AI应用等。


字节的全面布局,还体现在其生态整合能力上。通过抖音、今日头条、飞书等平台,字节将大模型嵌入到内容推荐、协同办公中,形成了技术到应用的生态闭环。


而如今,字节以「巨型航母重回创业」姿态,凭借雄厚资金、超高人才密度、多方向全面布局,成为中国AI赛道领跑者之一。


阶跃星辰:低调的大模型国家队


跟其他家相比,阶跃星辰可以算是这五强中最低调的大模型国家队了。


可以说,阶跃星辰是生于上海、长于上海的国家队。2024年底,阶跃星辰完成了总额达数亿美元的融资,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。


如今,才成立2年的阶跃星辰,已累计发布22款自研基座模型,覆盖文字、语音、图像、视频、音乐、推理,其中有16款是多模态模型,性能领跑全行业,成为行业内公认的「多模态卷王」。


其中,Step-1o Vision便在2025年初分别在知名大模型竞技场Chatbot Arena和国内权威评估平台「司南」(OpenCompass)中,分别拿下了视觉领域中国大模型第一,以及多模态模型榜单第一的成绩。


国产大模型「五强争霸」,决战AGI!


国产大模型「五强争霸」,决战AGI!


更难得的是,阶跃星辰的多模态矩阵既全面,又在全行业领先。要知道,多模态模型的核心,就是综合能力,既要求语音、图片、视频多个模态的能力,又要求模型能理解、生成、推理。在此布局上,阶跃星辰的每条线都达到了第一梯队。


而多模还有一大难点,就是融合过程中不能损失单个模特的性能,尤其不能降智。而阶跃星辰采取了原生多模的方式,在此方面经验独到。


在阶跃星辰看来,多模态是通往AGI的必经之路。随着多模态交互和推理的融合愈加成熟,更多Agent会在智能终端上涌现。


现在,阶跃星辰正在发力彻底解决视觉领域根本难题——表征和对齐的基础问题,也即「predict next frame」。


未来,按照阶跃星辰的多模研发路径,AI将能建模物理世界交互,模拟整个世界,构建世界模型。至此,AGI就将实现。


国产大模型「五强争霸」,决战AGI!

在成立之初,姜大昕团队曾绘制过这样一幅智能演进路线图,将智能进化分为模拟世界、探索世界、归纳世界三个阶段


与此同时,阶跃星辰的核心技术人员已经在一线亲历十年AI发展,这支队伍的人才密度极高,既有技术洞察,又有实战经验,堪称是基模的「梦之队」。


其中,创始人、CEO姜大昕曾担任微软全球副总裁,微软亚洲互联网工程院副院长、首席科学家。入选2025年IEEE Fellow的姜大昕博士,是唯一来自中国大模型创业公司的入选者。


而首席科学家张祥雨,其参与著作的《用于图像识别的深度残差学习》论文(ResNet)是21世纪以来全球被引用次数最多的论文,引用量已超过25万次。


商业化方面,目前已有多家头部企业和大量AI应用开发者对阶跃的多模态模型表示认可,纷纷接入。同时,阶跃还将智能终端Agent视为大模型落地的核心突破点,已和吉利汽车、千里科技、OPPO、智元机器人、原力灵机、TCL等达成了深度合作。


智谱:全栈创新,发力智能体


作为国内首个开启IPO大模型创业公司,智谱背靠清华技术底蕴以「学院派」独特气质脱颖而出,在基座模型、多模态技术和智能体展开全面布局。


目前,智谱已经建立了新一代认知大模型技术体系,研发了全栈自主GLM系模型,性能指标与国际顶尖LLM对齐。


去年8月,GLM-4-Plus问世在多个任务上表现优异,与GPT-4系不相上下。


今年4月,智谱再次开源32B/9B系列GLM模型,包括基座、推理和沉思模型。以320亿参数比肩千亿参数主流模型性能。


其中的GLM-Z1-Rumination沉思模型,便是智谱对AGI下一代技术的最新探索。


在智能体方面,智谱先于OpenAI提出Phone Use概念并推出Agent产品,并发布了全球首个集深度研究与实际操作于一体L3级智能体——AutoGLM沉思。


如今,他们正凭借AutoGLM及GLM-PC与全球车企、PC及手机厂商展开深度合作,推动大模型从Chat走向Act。


国产大模型「五强争霸」,决战AGI!


智谱的商业化路径以2G和2B业务为核心,深度绑定政府和企业需求。


其构建了MaaS私有化部署和智能体平台等服务模型,形成了包含百万规模开发者的模型服务新生态。


据统计,MaaS平台支撑80余万企业、应用开发者。


这种学院派创业模式,使得智谱在技术深度和战略稳定上,占据领先优势。


DeepSeek:研究导向,厚积薄发


DeepSeek,则是五强中目前最受国外瞩目的一位。在中美AI竞赛中,也是被提及最多、存在感最强的一家。


可以说,这是一位特立独行的技术奇兵,直接以一己之力,掀翻了大模型的牌桌。


DeepSeek技术的特点,就是聚焦语言模型,特别是数理能力,走坚定的开源路线。


国产大模型「五强争霸」,决战AGI!


今年过年时,DeepSeek-R1给全世界带来了亿点点震撼,以极低的计算资源,取得了媲美GPT-4等顶级AI模型的性能。


相比OpenAI、Anthropic训模型时动辄投入的数亿美元资金、数万张高端GPU,DeepSeek四两拨千斤的核心秘诀,就在于下面这种极致的工程优化。


比如,MoE架构让模型总参数量达到671B,而在运行时却只需激活37B,大幅降低了计算需求;多token预测(MTP),则提高了AI的训练效率,避免逐字预测;多头潜注意力(MLA),让模型更精准地分配了计算资源。


总之,DeepSeek成功的关键,就在于偏研究型的导向,而非以盈利为短期目标。从研究角度鼓励工程师提效,不必面临财务变现压力。


而DeepSeek团队,也汇聚了多位顶尖人才。创始人梁文锋,在用人上也有着自己独特的原则。


比如,以应届和毕业一两年的人才为主,不追求规模,而是构建小而精的团队。


随着大规模的破圈,云厂商、行业伙伴纷纷积极接入,让模型的生命力持续旺盛。


在DeepSeek的热潮下,如今已经有亿万普通用户开始拥抱AI。


决战下一阶段

「智能上限」与「多模态能力」


当「基模五强」的格局初步形成,竞争的焦点也随之转向更为核心和前沿的技术领域。


技术决胜点,聚焦何处?


显然,追求更高的「智能上限」和突破的「多模态能力」,已成为通往AGI路上必须抢攻的两大技术高地。


一方面,追求智能的上限,仍是当下大模型领域最重要的事情。


当前领先的模型虽然在许多任务中表现惊艳,但在逻辑推理、常识理解、长文本处理等方面,仍有较大的提升空间。


提升智能上限的最终目标,是迈向能够执行任何人类智力任务的AGI,这需要模型具备更深层次的理解、学习、推理和创造能力。


另一方面,多模态理解与生成的统一是走向AGI的必经之路。


人类通过多种感官与世界交互,并获取信息。要让AI真正理解并融入复杂的世界,就必须赋予其处理和融合文本、图像、音频、视频等多种模态信息的能力。


当理解与生成统一,不仅能推动智能体在智能终端的普及,还能通过具身智能与物理世界交互,自己收集环境数据,构建世界模型。


在世界模型的基础上,再加上复杂任务的规划、抽象概念归纳的能力,强化学习算法能力,以及超级对齐能力,就有可能实现AGI。


总而言之,未来对更高智能上限的无尽探索和多模态能力的深度融合,将是决定这场竞赛胜负的关键。


如今站在AGI的门槛前,「基模五强」的竞争不仅是技术的较量,更是资源、人才、生态的全面博弈。


字节、阿里、阶跃星辰、智谱、DeepSeek这五大领军者,正以其各自独特的优势和战略远见,引领中国AI不断逼近世界前沿。


而这场竞争的终点,或许正是AGI的曙光。


参考资料:

https://qwenlm.github.io/zh/blog/

https://seed.bytedance.com/zh/

https://platform.stepfun.com/

https://www.deepseek.com/

https://zhipuai.cn/

https://chat.z.ai


文章来自于“新智元”,作者“编辑部 HYZ”。


国产大模型「五强争霸」,决战AGI!

1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales

IOS下载
安卓下载
微信群
沪ICP备2023015588号