4月17日,据报道,今天,字节跳动火山引擎总裁谭待正式发布了备受关注的豆包1.5深度思维模式,在火山引擎AI创新巡展杭州站现场。
谭待指出,豆包1.5深度思维模式在许多关键领域表现出突出的表现。在数学、编程、科学推理等专业领域,能够准确高效地处理复杂问题;它在创造性写作和其他一般任务方面也表现良好。
该模型采用MoE架构,总参数为200B,激活参数为20B ,与行业内类似模型相比,其参数规模减少了50%,这使得其在推理成本方面具有显著优势,可以以较低的成本实现更有效的推理计算。
豆包1.5深度思维模型进一步拓展了功能边界,将视觉理解融入其中,解锁了许多基本功能。例如,它可以根据照片准确分析地形特征;当人们旅行时,帮助他们做出订购决策;在公司的办公场景中,它有助于完成项目管理流程图的绘制,为用户带来更加多样化和便捷的服务体验。
与此同时,火山引擎还大幅升级了豆包生成图模型,并推出了3.0版本。新版本在文本排版方面更加精致,图片生成能力更加精细。它还增加了2K照片直接输出功能,大大提高了图片生成的质量和效率,为用户带来了高质量的视觉内容创作体验。
新模型还具有较强的视频搜索能力,模型可以根据用户搜索视频中的问题找到相应的答案。
此外,谭待表示,豆袋大型模型的使用继续快速增长。截至2025年3月,豆袋大型模型的平均日使用量超过12.7万亿,是发布之初的106倍以上。
赞一个