♒️豆包大模型2.0迎史诗级加强 全链路AI布局优势凸显✴️

发布时间:2026-02-15 01:08:44 来源: 新华社

  

  临近春节,字节跳动AI好事频发。

  2月14日,豆包大模型2.0发布,这是字节跳动最新推出的多模态Agent模型,也是豆包大模型自2024年5月正式发布以来首次大版本的跨代升级。

  与此同时,豆包新一代AI视频生成模型Seedance2.0及图像创作模型Seedream5.0 Lite的好评如潮,标志着字节跳动已实现多模态Agent、AI图像、视频创作三大维度的全栈式技术突破,全链路AI布局优势日益凸显。

  豆包2.0推理能力登顶,成本优势凸显

  此次升级,豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和Code模型。全面适配从深度推理到成本敏感的不同业务场景。

  整体看,豆包2.0可以进行更强多模态理解:在多模态感知、高精度文字提取、图表理解、空间理解、运动理解、视觉知识和推理、长视频理解等方面表现出色。

  其中,在推理和Agent能力评测中,豆包2.0 Pro在IMO、CMO数学奥赛和ICPC编程竞赛中获得金牌成绩,也超越了Gemini3 Pro在Putnam Bench上的表现,展现了强劲的数学和推理能力。

  豆包2.0 Code是针对编程场景进行优化的版本。模型的代码能力特别是在前端开发领域有显著能力提升。通过TRAE+豆包2.0 Code,仅需1轮提示词即可构建复杂应用的基本架构,5轮提示词即可完成如“TRAE春节小镇·马年庙会”等互动项目。

  值得注意的是,豆包2.0还进一步降低了推理成本,这也一直是豆包的优势之一。其模型效果与业界顶尖大模型相当,但token定价降低了约一个数量级。在目前的AI大战中,这一成本优势将变得更为关键。

  AI技术领跑,视频与图像全球影响力破圈

  随着三大模型的集中升级,字节跳动的AI全链路布局优势日益凸显。数据显示,截至2025年12月,豆包大模型日均使用量突破63万亿Tokens,居中国第一、全球前三。

  在近日举行的字节跳动全员会上,字节跳动CEO梁汝波分享了公司2026年度关键词“勇攀高峰”。他指出,行业高峰不常有,过去50年行业主要高峰(PC、Web、Mobile)间隔期约15年至20年;AI至少是PC+ Web这个级别的高峰,短期而言,高峰就是“豆包/Dola助手应用”。

  目前看,豆包开了一个好头,多模态能力的全面突破,使字节跳动跻身全球AI第一梯队。豆包2.0在大多数视觉理解基准测试中取得最高分;图像创作模型Seedream5.0 Lite开始能像人类设计师一样“理解”用户指令背后的意图,“看懂”不同画面中的规律,并将世界知识应用于图像与文本创作中。

  尤其是Seedance2.0,凭借多模态参考、导演级控制、原生音画同步等能力,让普通用户也能实现“人人皆可当导演”的创作自由。某知名导演给从未面世的真人电影制作了一版预告片,仅用20分钟,花费60美元,借助Seedance2.0完成。

  对于Seedance2.0,游戏科学CEO冯骥甚至给出了“当前地表最强的视频生成模型”的超高评价。他称,Seedance2.0确实如其所言,是一个“杀死比赛”的存在。

  业界分析认为,随着推理成本的大幅降低和企业级Agent能力的增强,AI技术将加速渗透至各行各业,字节跳动正以全栈技术布局,勇攀AI时代的高峰。(完) 😻