豆包1.5字节发布深度思维模式:生成“实拍级”图像
研发家 | 2025-04-17 28

4月17日,据报道,今天,字节跳动火山引擎总裁谭待正式发布了备受关注的豆包1.5深度思维模式,在火山引擎AI创新巡展杭州站现场。

谭待指出,豆包1.5深度思维模式在许多关键领域表现出突出的表现。在数学、编程、科学推理等专业领域,能够准确高效地处理复杂问题;它在创造性写作和其他一般任务方面也表现良好。

该模型采用MoE架构,总参数为200B,激活参数为20B ,与行业内类似模型相比,其参数规模减少了50%,这使得其在推理成本方面具有显著优势,可以以较低的成本实现更有效的推理计算。

豆包1.5深度思维模型进一步拓展了功能边界,将视觉理解融入其中,解锁了许多基本功能。例如,它可以根据照片准确分析地形特征;当人们旅行时,帮助他们做出订购决策;在公司的办公场景中,它有助于完成项目管理流程图的绘制,为用户带来更加多样化和便捷的服务体验。

与此同时,火山引擎还大幅升级了豆包生成图模型,并推出了3.0版本。新版本在文本排版方面更加精致,图片生成能力更加精细。它还增加了2K照片直接输出功能,大大提高了图片生成的质量和效率,为用户带来了高质量的视觉内容创作体验。

新模型还具有较强的视频搜索能力,模型可以根据用户搜索视频中的问题找到相应的答案。

此外,谭待表示,豆袋大型模型的使用继续快速增长。截至2025年3月,豆袋大型模型的平均日使用量超过12.7万亿,是发布之初的106倍以上。

赞一个

分享:
打开微信扫一扫
21
版权及免责声明:本网站所有文章除标明原创外,均来自网络。登载本文的目的为传播行业信息,内容仅供参考,如有侵权请联系删除。文章版权归原作者及原出处所有。本网拥有对此声明的最终解释权
招商合作
请您完善以下信息,我们会尽快与您联系!
论文投稿
参加会议
合作办会
期刊合作
论文辅导
科研绘图
论文翻译润色
论文查重
其他
提交
专家招募
个人信息
联系信息
提交
在线客服
商务合作
专家招募
常见问题
手机端
扫描二维码
与学术大咖共探知识边界
出版支持
翻译服务
润色服务
自助查重
排版校对