计算机行业AI+专题系列点评(二十二):豆包AI,多主体互动与高效计算的视频生成

证 券 研 究 报 告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 计算机 2024 年 10 月 16 日 2024 年 10 月 16 日 AI+专题系列点评(二十二) 推荐 (维持) 豆包 AI:多主体互动与高效计算的视频生成 事项:  2024 年 9 月 24 日,字节跳动旗下火山引擎在深圳举办的 AI 创新巡展上正式发布了两款豆包视频生成大模型:Pixel Dance 和 Seaweed,同时开启了面向企业市场的邀测。豆包 AI 视频生成大模型具备多主体协同和复杂任务处理的显著能力,支持复杂的多镜头操作,如变焦、平移和环绕,确保不同镜头切换时视觉风格和细节的一致性。该模型采用动态集成 Transformer(DiT)架构,每分钟处理高达 80 万次 Token,远超行业标准,具备强大的并发处理能力。这些特性使豆包 AI 在视频生成领域,尤其是影视和广告行业,拥有广泛的应用前景和竞争优势。 评论:  多主体互动与复杂任务处理:豆包 AI 视频生成大模型突破了多主体复杂互动的技术障碍,支持深度语义理解,通过复杂指令驱动多个角色的自然互动。这使得生成的视频角色动作、表情高度协调,自然流畅,满足影视、游戏等多角色场景的需求。  多镜头切换与一致性:依托动态集成 Transformer(DiT)架构,模型支持丰富的多镜头操作,如变焦、环绕、平移等,并在不同镜头切换中保持主体风格、氛围的一致性。这解决了传统视频生成中因镜头切换导致视觉不连贯的问题,为视频创作者提供了更灵活的视觉表达手段。  细节处理与风格适应性:该模型具备强大的细节处理能力,能够准确呈现人物的外貌、服装等细微变化,并且适应多种风格需求。即使在复杂的时序转换中,视频内容仍能保持高度一致性,进一步提升视频的表现力与观赏性。  高效计算与扩展能力:豆包 AI 视频生成模型具备每分钟高达 80 万 Token 的并发处理能力,远超行业标准。这使其能够高效应对大规模应用中的高并发需求,确保系统的稳定性和效率。同时,它在影视制作和广告生成等领域展现出巨大的应用潜力。豆包 AI 的技术突破显著提升了生成高质量复杂视频内容的效率,推动了智能化视频生成领域的发展,并在行业中展现了强大的竞争优势。  投资建议:AI 大模型本质应落脚垂类应用,国内大模型正快速追赶美国先进水平,中文大模型的突破有望为下游 AI 应用注入新的活力,看好 AI+应用产品力与商业化落地进程。建议关注以下标的:AI+应用侧:1)安全:永信至诚、深信服;2)办公:金山办公、福昕软件;3)法律:金桥信息、华宇软件、通达海;4)医疗:润达医疗;5)教育:佳发教育、欧玛软件、新开普;6)金融:同花顺、新致软件;7)邮箱:彩讯股份;8)传媒:掌阅科技、华策影视;9)数据:海天瑞声;10)电商:焦点科技;11)OA:致远互联、泛微网络;12)ERP:用友网络、金蝶国际。算力侧:1)算力基础:润泽科技、亚康股份、海光信息、寒武纪、龙芯中科;2)服务器:中科曙光、浪潮信息、紫光股份、神州数码、拓维信息。  风险提示: 商业化后表现不及预期,用户付费意愿低,行业技术迭代速度较快。 证券分析师:吴鸣远 邮箱:wumingyuan@hcyjs.com 执业编号:S0360523040001 联系人:张宇凡 邮箱:zhangyufan1@hcyjs.com 行业基本数据 占比% 股票家数(只) 334 0.04 总市值(亿元) 38,640.80 4.15 流通市值(亿元) 33,472.08 4.57 相对指数表现 % 1M 6M 12M 绝对表现 42.4% 19.4% -4.9% 相对表现 20.3% 10.7% -10.1% 相关研究报告 《计算机行业周报(20241008-20241011):特斯拉新品发布革新未来,引领 Robotaxi 发展》 2024-10-13 《计算机行业重大事项点评:公共数据顶层设计落地,关注数据要素板块性机遇》 2024-10-10 《计算机行业重大事项点评:工业软件更新目标明确,国产化率有望提升》 2024-09-24 -35%-17%0%17%23/1023/1224/0324/0524/0824/102023-10-16~2024-10-15计算机沪深300华创证券研究所 AI+专题系列点评(二十二) 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 2 目 录 一、豆包 AI 视频大模型:多主体交互、灵活镜头切换的视频细节优化 ................... 4 (一)多主体交互与复杂任务处理,高效自然的多角色互动 ..................................... 4 (二)灵活镜头切换与视觉统一,保证流畅的视觉体验 ............................................. 4 (三)精准细节处理与风格统一,呈现高质量视觉体验 ............................................. 4 二、高效计算与扩展能力,支持大规模并发处理,推动视频生成的技术发展 ......... 5 AI+专题系列点评(二十二) 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 3 图表目录 图表 1 豆包 AI 模型价格对比:行业内超低价的优势 ....................................................... 4 图表 2 豆包 AI 视频生产模型发布会:革新技术驱动未来视觉发展 ............................... 5 图表 3 豆包 AI 通用与专业解决方案展示 ........................................................................... 5 图表 4 豆包 AI 大模型广场:多功能智能解决方案展示 ................................................... 6 AI+专题系列点评(二十二) 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 4 一、 豆包 AI 视频大模型:多主体交互、灵活镜头切换的视频细节优化 (一)多主体交互与复杂任务处理,高效自然的多角色互动 豆包 AI 在多角色互动与复杂任务处理上优势显著。其视频生成大模型的核心特点在于卓越的多主体交互和任务执行能力。通过深度语义理解,豆包 AI 能够精准执行复杂指令,使多个角色在互动中保持自然流畅、协调一致。这项技术突破不仅保证了多角色互动的连贯性,还能够准确捕捉和呈现每个角色的动作和表情。特别是在影视制作和游戏等多角色场景中,豆包 AI 确保了角色之间的互动顺畅,大大提升了整体视频生成的质量和表现力。 (二)灵活镜头切换与视觉统一

立即下载
互联网
2024-10-17
华创证券
9页
1.64M
收藏
分享

[华创证券]:计算机行业AI+专题系列点评(二十二):豆包AI,多主体互动与高效计算的视频生成,点击即可下载。报告格式为PDF,大小1.64M,页数9页,欢迎下载。

本报告共9页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共9页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
Meta Movie Gen 文生视频能力的评测效果(数字越大,代表 Movie Gen 超越对应模型的程度越高)
互联网
2024-10-17
来源:传媒行业AI视频(二):海内外视频模型密集发布,API打开商业化空间
查看原文
Meta 采用 Transformer+ Flow Matching,效率更高
互联网
2024-10-17
来源:传媒行业AI视频(二):海内外视频模型密集发布,API打开商业化空间
查看原文
扩散模型的生成从随机噪音开始,通过大量迭代去除噪音,趋近目标
互联网
2024-10-17
来源:传媒行业AI视频(二):海内外视频模型密集发布,API打开商业化空间
查看原文
AI 视频三大落地场景展望
互联网
2024-10-17
来源:传媒行业AI视频(二):海内外视频模型密集发布,API打开商业化空间
查看原文
美图公司旗下 MOKI 的 AI 短片工作流
互联网
2024-10-17
来源:传媒行业AI视频(二):海内外视频模型密集发布,API打开商业化空间
查看原文
字节 AI 耳机 Ola Friend 发布
互联网
2024-10-17
来源:传媒行业AI视频(二):海内外视频模型密集发布,API打开商业化空间
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起