2年跻身“AI六小虎”,上海这家“独角兽”全方位突破

行业资讯· 2025-02-21 11:39:11



2月18日,AI大模型独角兽企业阶跃星辰旗下两款多模态大模型宣布开源,其中包含全球范围内参数量最大、性能最好的开源视频生成模型阶跃Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃Step-Audio,一时间在全球开源社区内引发热议。

相较于国内多数大模型企业,阶跃星辰几乎是个“小透明”,但凭借成立不足2年时间内接连推出11款大模型,成功跻身“AI六小虎”之列,还被《麻省理工科技评论》评为“DeepSeek之外值得关注的四家中国人工智能初创公司”之一,认为其展现出不逊于DeepSeek的技术实力。

国内外“百模大战”方兴未艾之际,阶跃星辰如何在短时间内突破?

“卷”技术也“卷”人才

“阶跃星辰在‘AI六小虎’(智谱AI、月之暗面、百川智能、MiniMax、阶跃星辰、零一万物)中成立比较晚,但我们要做最‘卷’的多模态大模型。”约定的采访时间刚到,阶跃星辰副总裁李璟一股风似地来到会议室,语速很快,创业者的精气神扑面而来。

阶跃星辰有多“卷”呢?春节前夕,DeepSeek正席卷全球时,阶跃星辰也没闲着,六天连发了六个模型,涵盖语言、语音、推理、图片理解、视频生成等多类别。新模型不仅在阶跃星辰最擅长的多模态领域继续领跑,推理模型Step R-mini在视觉推理领域也取得突破性进展。

最近,全球大模型掀起了一阵开源潮,阶跃星辰还将性能最好的两款多模态模型面向全球开发者开源。其中Step-Video-T2V参数量达到300亿,可以直接生成204帧、540P分辨率的高质量视频。Step-Audio语音模型在5大主流公开测试集中均超过了行业内同类型开源模型,尤其是在汉语水平考试六级评测中的表现尤为突出,堪称“最懂中国话”的开源语音交互大模型。

“阶跃星辰能在短时间内突围,关键因素是高人才密度对创新的正向反馈。”李璟告诉记者,阶跃星辰团队成员只有500余人,但算法和技术人员的比例接近80%,其中不乏行业内的“大牛”。

作为阶跃星辰的创始人,姜大昕是计算机科学科班出身,在微软工作16年期间负责搜索、智能助手等多项业务,在学界和业界均积累了大量经验。不久前,他成功入选国际电气和电子工程师协会(IEEE)2025年度Fellow名单,也是唯一来自中国大模型创业公司的入选者。

阶跃星辰的首席科学家张祥雨则是一名90后科学家。论文引用量是衡量研究人员学术水平的重要指标,一篇出色的论文引用量通常是1万,而张祥雨的论文引用量超过了30万。据介绍,他参与撰写的ResNet(残差网络)论文,被誉为近年来人工智能领域的关键论文之一。

系统负责人朱亦博曾在谷歌、字节和微软等公司就职,拥有多次单集群万卡以上的系统建设与管理实践经验。数据负责人焦斌星此前是微软必应引擎核心搜索团队负责人,负责利用数据挖掘和NLP算法优化索引和搜索质量……基于这样的团队背景,成立不足2年,阶跃星辰已经发布了11款模型,速度之快、性能之强,不少科技博主在测评后,都给出了几乎一致的评价——“名副其实的卷王”。

闯出另一条路

与豆包、Kimi等大家熟知的大模型App相比,阶跃星辰的跃问App知名度低了不少,但李璟却表示压力并不大。

“我们一直按照节奏来推进C端应用开发,创业公司要把有限的成本放在技术研发上,而不是投流和广告。”在李璟看来,DeepSeek的爆火印证了一个观点——模型即产品,模型性能就是产品能力,阶跃星辰step系列模型的优势在多模态领域,跃问App更应该在图像和视听等差异化体验上有所突破。


多模态模型是阶跃星辰的优势。

以上海游客为例,跃问App提供的上海三日旅游攻略,不仅包含常见的文字介绍,还会生成图文详尽的攻略,游客还能通过拍照了解景点更多资料,跃问App还能进行语音讲解。

“我们的核心能力是面向C端用户,但我们更愿意与合作伙伴共同提供C端服务。”面对DeepSeek、豆包等国产大模型抢占日益拥挤的C端赛道,阶跃星辰正闯出另一条路。早在创立初期,阶跃星辰在金融财经、内容创作、智能终端、消费电子等领域,已经和不少行业龙头达成了合作意向。

面向金融财经领域,去年3月,阶跃星辰与上海报业旗下界面财联社围绕AIGC(生成式人工智能)财经资讯、智能投研等领域推进大模型的应用落地。同时,阶跃星辰还联合国泰君安、界面财联社推出业内首个千亿级参数多模态证券垂直类大模型——君弘灵犀大模型,在行业内首个实现了将大模型能力全面融入客户智能化服务体系之中。“我们和界面财联社共同开发的AI智能体‘小财神’,是面向个人投资者最优秀的产品之一。”李璟说。

在消费零售行业,阶跃星辰凭借多模态模型的优势,与茶百道探索安全巡检等方面的场景应用。今年1月起,全国数千家茶百道门店接入Step-1V多模态理解大模型,实现智能巡检,通过AI精准识别门店内物料储备、环境卫生、生产操作规范、员工衣着等方面的视觉信息,经过分析生成一份质检报告,发给门店的督导员。

哪怕是小料使用后是否盖上了盖子,需要冰水浸泡的食材浸泡水位是否合适等细枝末节,大模型都能准确识别。数据显示,Step-1V平均每天能够为茶百道督导员节约 75%检核时间。

2024年下半年,阶跃星辰多模态API(编程接口)的调用量增长超45倍,Step系列模型积累了一批活跃的应用开发者,多个走红社交网络的AI应用,如“歌词爆改机”“胃之书”“林间疗愈室”等,均采用阶跃星辰的多模态模型。

上下楼就是上下游

谈及迈向通用人工智能(AGI)之路时,业内不少人会提到阶跃星辰的“四步走”:首先是语言大模型,AI像ChatGPT一样拥有与人对话和深度思考的能力,其次是多模态模型,涵盖了AI听说读写及理解图文音视频等能力,然后是世界模型,通过融合语言大模型和多模态模型的能力,AI能够对真实物理世界进行归纳理解,最终实现通用人工智能。


迈向AGI之路的“四步走”。

姜大昕认为,要实现通用人工智能,算力、系统、数据和算法“铁人四项”缺一不可,阶跃星辰在千亿参数规模的基础上,增长一个数量级,面临的挑战都是难以估量的。

“阶跃星辰个作为一家初创型民营企业,发展如此迅猛,离不开上海对算力、数据等基础设施资源的投入和开放。”李璟告诉记者,上海早在2017年就确立了发展人工智能产业的愿景,2018年举办首届世界人工智能大会,这些举措远远早于本轮生成式人工智能热潮。

正是上海的前瞻性,孕育出健康完善的AI生态。记者在西岸智塔的铭牌栏上看到,微软亚洲研究院(上海)、联影智能、得帆科技等知名研发平台和头部企业,都是阶跃星辰的“邻居”。仅一栋楼,就汇聚了数十家人工智能企业和科研机构,形成了集政、产、学、研、用为一体的AI垂直产业生态,“上下楼就是上下游”,让阶跃星辰能快速找到合作方、对接资源和获取服务。

上海人工智能语料数据平台型企业库帕思科技也在不远处。库帕思已全面启动具身智能、金融、制造、教育、医疗、文娱、城市治理等领域的行业语料库建设,语料运营1.0平台已投入实战运营,正加快布局从真实世界到模拟仿真到数据合成平台2.0研制。目前,库帕思已经链接了超过50家语料生态合作伙伴。智能算力方面,上海仪电投产了多个国内领先的“大规模、高等级”万卡智算集群,为阶跃星辰等大模型企业以及研究机构提供低成本算力服务。

“得益于上海市的整体统筹布局,我们和合作方联合自建了大型的训练集群,这是推动我们向更优模型迈进的关键基础设施之一,也是与许多创业公司显著的优势所在。”李璟说道。

原标题:2年跻身“AI六小虎”,上海这家“独角兽”全方位突破



文章链接: http://huangxinwei.com/aizixun/7556.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑,如存在版权问题请发送邮件至398879136@qq.com,我们会在3个工作日内处理。非原创标注的文章,观点仅代表作者本人,不代表炎黄立场。