计算机行业:Pika 1.0再掀AI视频热潮,多模态技术路径仍有探索空间

有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 计算机行业 踪 ⚫ 文生视频 Pika 1.0 发布,AI 影像热潮再起。 11 月 29 日,AI 文生视频软件 Pika 1.0版本发布,热度迅速席卷全网。Pika 成立于今年 7 月,Pika 1.0 是其第一个正式推出的版本,能够根据文字自动生成和编辑 3D 动画、动漫、卡通和电影,还能够支持对于视频的实时编辑和修改。 Pika 的创始人是两位斯坦福大学人工智能实验室的前博士生郭文景和 Chenlin Meng,目前 Pika 已融资 3 轮,估值超过 2 亿美元。到现在为止 Pika 已经有了 50 万用户。 ⚫ 近期 AI+视频方向更新频发。11 月以来,海外在 AI 生成视频领域的动作进展较快。11 月 3 日,Runway 发布 Gen-2 模型更新,把生成的视频清晰度提升到了 4K 精度,改进了结果的保真度和一致性。并随后在 11 月 20 日上线了运动笔刷功能,只需对着图像任意位置一刷,就能让静止的一切物体动起来;11 月 16 日,Meta 发布了 Emu Video,能够基于文本和图像输入生成视频剪辑;11 月 18 日,字节跳动发布 PixelDance,在生成视频的动态性上得到了显著提升;11 月 21 日,Stability AI发布了自家的生成视频模型 Stable Video Diffusion,支持文本到视频、图像到视频生成,并且还支持物体从单一视角到多视角的转化,也就是 3D 合成。 ⚫ 大语言模型技术路径已收敛,而视频生成模型仍处于探索期。在 OpenAI 的技术方向引领下,目前语言模型的技术路径基本就是 GPT 这一条路。而多模态技术方面,目前没有一家公司处于绝对领先地位,技术路径仍存在探索的可能。AI 视频的生成面临流畅性、帧生成逻辑、协调性等等问题,模型需要生成每一帧发生的事情,而用户的 prompt 往往非常简略,无法像图像生成一样为每一帧提供详细的描述,种种原因都导致了目前 AI 视频生成技术仍无法做到非常完美,技术路线也多种多样。 ⚫ 语言模型是对物理世界的抽象描述,多模态数据能够更真实反映物理世界属性,能感知真实物理世界的多模态模型应用前景更加广阔。语言作为一种精炼的表述载体,可以对物理世界进行抽象描述,例如文生图和文生视频中,用户都可以用简短的一句话或者几句话来对想要生成的图像或视频进行描述。但是从承载的信息量来讲,语言所能承载的信息是远远不及图像和视频的。而多模态的数据例如图像、视频、音频、振动等信息,则更加能反映出物理世界的真实属性,是真正对于物理世界状态的感知,与人类感知世界的方式更加接近。我们认为,未来的多模态模型将能够真正实现对世界状态的完整感知,也因此能具备更多的应用场景。 ⚫ 多模态是生成式 AI 下一步重点方向,百花齐放的应用场景有望探索。现阶段大语言模型的竞争已经非常激烈,从技术突破的角度来看,我们认为,下一阶段的重点攻克方向必然会是多模态技术。能够真正处理和应用好多模态 AI 能力,才能真正打通物理世界和数字世界的障壁,用最基础的感知世界能力直接生成操作,实现与物理世界最自然的交互。因此,基于多模态的应用场景仍需不断探索,AI 视频生成仅仅是多模态技术路径中的一个小方向,多模态领域的 ChatGPT 时刻还未到来。 我们认为,在多模态模型应用场景上具备良好布局和卡位的公司值得关注。建议关注海康威视(002415,买入)(电子组覆盖)、大华股份(002236,买入)(电子组覆盖)、萤石网络(688475,未评级)(电子组覆盖)、中科创达(300496,买入)、虹软科技(688088,未评级)、科大讯飞(002230,买入)、万兴科技(300624,未评级)等公司 风险提示 技术落地不及预期;政策监管风险 投资建议与投资标的 核心观点 国家/地区 中国 行业 计算机行业 报告发布日期 2023 年 12 月 06 日 浦俊懿 021-63325888*6106 pujunyi@orientsec.com.cn 执业证书编号:S0860514050004 陈超 021-63325888*3144 chenchao3@orientsec.com.cn 执业证书编号:S0860521050002 谢忱 xiechen@orientsec.com.cn 执业证书编号:S0860522090004 杜云飞 duyunfei@orientsec.com.cn 覃俊宁 qinjunning@orientsec.com.cn 宋鑫宇 songxinyu@orientsec.com.cn Pika 1.0 再掀 AI 视频热潮,多模态技术路径仍有探索空间 看好(维持) 计算机行业动态跟踪 —— Pika 1.0再掀AI视频热潮,多模态技术路径仍有探索空间 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 2 目 录 一、文生视频 Pika 1.0 发布,AI 影像热潮再起 ............................................... 4 二、视频模型技术路线尚未确定,多模态技术应用前景广阔 .......................... 5 2.1 AI+视频更新迭代迅速,技术路线尚未收敛 ................................................................... 5 2.2 多模态能感知真实物理世界,应用前景更加广阔 .......................................................... 5 投资建议与投资标的 .................................................................................... 11 风险提示 ...................................................................................................... 11 计算机行业动态跟踪 —— Pika 1.0再掀AI视频热潮,多模态技术路径仍有探索空间 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 3 图表目录 图 1:Pika 支持视频生成和视频实时编辑 ..................................................................................... 4 图 2:Pika Labs 是 G!lab 电影工业化实验室的战略合作伙伴 ...........

立即下载
互联网
2023-12-06
东方证券
13页
1.21M
收藏
分享

[东方证券]:计算机行业:Pika 1.0再掀AI视频热潮,多模态技术路径仍有探索空间,点击即可下载。报告格式为PDF,大小1.21M,页数13页,欢迎下载。

本报告共13页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共13页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
美图公司 PE-Bands 图表5: 美图公司 PB-Bands
互联网
2023-12-06
来源:美图公司(1357.HK)美图MV4.0发布,“设计+视频”拥抱未来AI设计
查看原文
美图公司可比公司估值表
互联网
2023-12-06
来源:美图公司(1357.HK)美图MV4.0发布,“设计+视频”拥抱未来AI设计
查看原文
PS 估值
互联网
2023-12-06
来源:美图公司(1357.HK)美图MV4.0发布,“设计+视频”拥抱未来AI设计
查看原文
美图盈利预测
互联网
2023-12-06
来源:美图公司(1357.HK)美图MV4.0发布,“设计+视频”拥抱未来AI设计
查看原文
表 3 重点公司估值表
互联网
2023-12-06
来源:海外科技行业跟踪点评:11月版号回归,产品潮加速互联网游戏复苏
查看原文
表 1 2023 年 11 月国产游戏版号重点厂商获批情况
互联网
2023-12-06
来源:海外科技行业跟踪点评:11月版号回归,产品潮加速互联网游戏复苏
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起