
2月14日,距离中国农历春节仅三天,中国AI滋扰不凡,火山引擎稳健发布豆包大模子2.0,包含Pro、Lite、Mini三款通用Agent模子和Code模子,机动适配各样业务场景。这是字节越过自2024年5月推出豆包大模子家眷后,初度对该系列中枢模子进行跨代升级。
更早之前,豆包视频生成模子Seedance 2.0、豆包图像创作模子Seedream 5.0 Lite也已辞别开启内测。前者的惊艳成果,让国表里开启了强横的商榷,更有东说念主钦慕,这是又一个DeepSeek时刻知晓。
至此,三款模子在Agent才调、多模态联结与创作可控性上造成齐全闭环,也记号着字节越过在多模态AI限制的技能领跑与全链路布局正加快落地。
企业级Agent才调跨代升级,重构复杂长程任务处理范式
据火山引擎官方暴露的信息,豆包大模子2.0的中枢升级聚焦于企业级Agent才调的全面跨越,中枢要惩办能做事的问题,尤其是在长链路复杂任务中不错有序鼓动。
伸开剩余85%为此,新版模子在多模态感知、高精度笔墨索要、图表联结、空间与开放联结、长视频联结等方面进展隆起。
更为缜密具体来看:
豆包2.0 Pro面向深度推理与长链路任务履行场景,全濒临标GPT 5.2与Gemini 3 Pro;
2.0 Lite兼顾性能与本钱,空洞才调出奇上一代主力模子豆包1.8;
2.0 Mini面向低时延、高并发与本钱敏锐场景;
Code版(Doubao-Seed-2.0-Code)专为编程场景打造,与TRAE斟酌使用成果更佳。
同期,这一代模子Function Call、多轮领导礼服、搜索与器具调用才调显赫增强,设施输出稳当性及凹凸文料理机动性均有大幅普及。
这么的才调组合拳,使得豆包大模子2.0大略高效赞成数据分析和客服Agent等企业级复杂、长程任务。据官方暴露,算作AI助手,Seed2.0 不错处理复杂视觉输入,并完成及时交互和诳骗生成。岂论是从图像中索要结构化信息,一经通过视觉输入生成交互式内容,Seed2.0 都能高效、稳当地完成任务。因此,其不错将复杂的图表进行联结和规复,还不错成为及时互动的AI健身教养,以致还能教你打台球、滑雪。
豆包大模子的弘大才调已有佐证。据火山引擎此前公布的“万亿Tokens俱乐部”客户案例高慢,已有头部金融、电商企业通过豆包大模子构建自动化业务流,大幅缩小东说念主工干预本钱。跟着2.0版块对技巧(Skills)的联结与多器具协同调用才调进一步强化,AI从“回复问题”向“寥寂履行任务”的转型圭表将彰着提速。
在推理与代码维度,豆包大模子2.0支握念念考长度可退换,各长度下Tokens效力均有优化。其代码才调,出奇是前端开荒限制的才调普及,可通过集成式开荒环境TRAE进行实测。据悉,TRAE已内置豆包大模子2.0Code版,开荒者可在确立后径直体验模子对复杂编程任务的策动与生成才调。
Seedance 2.0杀疯外洋,马斯克也说“发展太快”了
有了豆包大模子的打底,也就不难联结视频生成模子Seedance 2.0结束的惊艳成果,其也代表了字节越过在多模态输入交融上的最新冲破。
内容上,在2月7日晚间暗暗开启内测后,已有不少东说念主上手试用,使得这几天叮嘱媒体上出现了不少“通常东说念主演大片”“2岁宝宝跳街舞”等跨界作品。批驳区则齰舌于该模子对物理全国的高度规复性。
凤凰网科技也在起初的体验中发现,其最大的跨越就在于“可控”。
该模子支握图像、视频、音频、文本四种模态同期或混杂输入,使其从一个仅能选择文本领导的“猜谜者”,进化成了一个能同期联结多种模态的“万能履行导演”。创作家不错上传一张主见图来定调、一段电影片断来调换运镜、一首音乐来掌控节拍,从而结束昔日需要复杂专科软件和漫长历程才能达成的叙事成果。更要道的是,其“多镜头连贯生成”才调,使得AI能一次性创作出包含开放转场和景别切换的“故事段落”,而非落寞的几秒碎屑。
据官方暴露,Seedance 2.0在多模态素材混序传入、脚色特征稳当保握、物理规矩礼服等方面均有大幅普及。东说念主物动作当然开放,物体交互响应真正,对动作、激情、运镜、笔墨内容的领导抽卡得手率彰着优化,大幅缩小了视频创作中的反复调试本钱。
“它能高保真地合成时序精密的复杂交互场景,米兰体育也能在特写镜头中展现出高度传神的细节与严实的物理逻辑,宛照实拍。”字节官方如斯先容。
{jz:field.toptypename/}现在,该模子已在豆包、即梦、小云雀等居品中稳健上线,并成绩了来自专科创作家的高度关心。
就在该模子亮相次日,驰名视频博主、影视飓风首创东说念主Tim(潘天鸿)便发布了针对 Seedance2.0 的实测视频。他在视频中吟唱,这一模子在画质、运镜、编著衔尾和音画同步等方面的进展,足以“更动视频行业”。
游戏科学CEO、《黑听说:悟空》制作主说念主冯骥在深度体验后,给出了绝不缺乏的评价:“刻下地表最强的视频生成模子,莫得之一。”他断言,这记号着“AIGC的童年期间,罢澄澈”。
2月12日,Seedance2.0在外洋的热议还在升级,马斯克在叮嘱平台转发批驳Seedance 2.0关连推文,并默示,“It's happening fast(发展速率太快)”。
另据字节官方暴露,预测在2月中下旬,Seedance 2.0 的 API 服务将上线火山方舟,匡助企业客户更好地落地创意。这意味着,其生意化诳骗的拐点也将到来。
此外,图像创作模子Seedream 5.0 Lite进展雷同不俗,其是豆包在多模态谐和架构处所的最新探索。相较4.0版块,该模子在多模态联结与生成上领受谐和架构,显赫缩小了对系统化精确Prompt的依赖。官方先容称,用户通过精真金不怕火、朦拢的文本以致径直输入图像,模子即可主动揣摸创作意图,并在主体一致性、图文对都等生成质地上结束跃升。
这意味着,其运转能像东说念主类想象师雷同“联结”用户领导背后的意图,“看懂”不同画面中的规矩,并将全国学问诳骗于图像与文本创作中。
尤为值得关心的是,Seedream 5.0 Lite初度引入及时检索增强才调。模子可联网得到最新学问与资讯,冲破静态学问库的时效性局限。这一特质在资讯海报生成、热门事件视觉化等场景中具备极高实用价值。同期,模子内置的全国学问体系袒护科技、东说念主文等多个垂类行业学问库,生成戒指更恰当物理规矩,信息可视化才调显赫增强。
现在,在空洞评测中,Seedream 5.0 Lite 的 Elo 评分出奇 Seedream 4.5。
字节投入AI赛说念“勇攀岑岭”阶段
豆包大模子2.0的发布,与Seedream 5.0 Lite、Seedance 2.0共同组成字节越过在多模态联结、图像创作、视频生成三大中枢赛说念的齐全拼图。
三者分享底层技能鸠合,又在诳骗层面造成协同:豆包大模子2.0提供Agent大脑,Seedream负责静态视觉创意,Seedance则承载动态叙事抒发。
字节越过董事长梁汝波在此前的全员会上曾提议2026年度要道词——“勇攀岑岭”。
何谓岑岭?其解释说念,“转头昔日 50 年,IT 行业的主要岑岭有:PC、Web、 Mobile。其中,PC 期间崛起的是微软;Web 期间涌现了谷歌、亚马逊、Meta;Mobile 期间则跑出了苹果和谷歌。不错看出,岑岭不常有,昔日几次均拒绝约 15-20 年”。
关于字节乃至通盘这个词行业而言,AI即是这个期间必须攀高的岑岭。
为此,字节已作念出都备的准备,短期内,豆包/Dola 助手诳骗将是岑岭的具象化抒发。为此,字节仍在不遗余力探索这一系列模子、居品的才调天花板。豆包新一代大模子家眷的亮相,也用内容进展确认了,大模子才调上限仍存在较大的探索空间。
刻下通盘这个词AI行业都处在技能范式的转化期,字节也依旧“在基础研究和全栈工程上同期寻求冲破”。豆包三大模子的跨代升级,亦然对这一策略在技能与居品层面的双重落地。
从2024年5月豆包大模子初度亮相,到如今Agent才调、多模态创作才调双双迈入2.0期间,字节越过仅用不到两年时期便完成了从“可用”到“好用、可控、可落地”的要道跃迁。跟着2月14日火山引擎稳健发布,企业级AI诳骗有望迎来新一轮效力重构。而荫藏在模子参数与基准成绩背后的,是中国AI从追逐者向界说者脚色鼎新的澄澈脚迹。
源泉:凤凰网科技
发布于:北京市
备案号: