电子行业动态跟踪:视频大模型快速突破,有望打开视频分析行业天花板

有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 电子行业 ⚫ 视频大模型近期进展多。近日,谷歌发布 AI 大模型 Gemini,包括适用于高度复杂任务的 Gemini Ultra、适用于各种任务的最佳模型 Gemini Pro 以及适用于端侧设备的 Gemini Nano 三个版本。Gemini Ultra 展现出强大的自然语言水平和多模态理解能力,在 MMLU(大规模多任务语言理解)测评上首次超过人类专家,在 32 个多模态基准中取得 30 个 SOTA(当前最优效果);Gemini Pro 和 Nano 版本已发布,加速 AI 赋能谷歌产品。李飞飞的斯坦福团队同谷歌合作,推出了用于生成逼真视频的扩散模型 W.A.L.T。英伟达高级科学家 Jim Fan 评论:2022 年是影像之年,2023是声波之年,而 2024 是视频之年! ⚫ 首个原生多模态模型 Gemini 展示出强大视频理解能力。人工智能的发展从单一视觉或语言任务向多模态自监督学习迈进,而原生多模态大模型具有原生多模态和跨模态理解能力,与既往基于大语言模型的多模态模型存在显著不同。Gemini 模型在多模态基准测试上表现突出,展示了处理复杂图像、推理序列和生成交替文本和图像回应等新能力,这些新能力有望为视频分析等领域开启全新应用途径。 ⚫ 原生多模态技术有望打开视频分析行业天花板。视频分析行业目前在数据处理规模、速度和深度等方面存在亟待解决的问题,原生多模态大模型有望解决行业痛点,打开行业天花板。原生多模态大模型可充分利用安防厂商积累的大量多模态视频数据,具有多模态输入的原生处理能力、跨模态推理和理解能力、高级分析推理能力,能提高大规模数据处理的准确性和鲁棒性,易于模型蒸馏和小型化部署,有望推动视频分析系统功能的跨步迭代升级。 ⚫ 领先厂商已入局,多模态模型将是视频监控行业新机遇与挑战。海康威视、大华股份等视频分析行业领先厂商纷纷投入到多模态大模型研究和行业应用落地进程中去。多模态大模型对算力部署、算法改进、硬件升级提出了新的挑战和新的机遇,有望推动视频分析系统功能迭代升级和多维感知技术商业化步伐加快。 ⚫ 我们认为以 Gemini 为代表的原生多模态大模型有望打开视频分析行业天花板,推动智慧安防和智慧物联产品和解决方案升级,智慧安防和智慧物联行业有望从中受益。建议关注国内智慧安防和智慧物联公司:海康威视、大华股份和萤石网络。 风险提示 ⚫ 原生多模态大模型进展不及预期;下游需求不及预期;行业景气度不及预期。 投资建议与投资标 核心观点 国家/地区 中国 行业 电子行业 报告发布日期 2023 年 12 月 18 日 蒯剑 021-63325888*8514 kuaijian@orientsec.com.cn 执业证书编号:S0860514050005 香港证监会牌照:BPT856 李庭旭 litingxu@orientsec.com.cn 执业证书编号:S0860522090002 韩潇锐 hanxiaorui@orientsec.com.cn 执业证书编号:S0860523080004 杨宇轩 yangyuxuan@orientsec.com.cn 薛宏伟 xuehongwei@orientsec.com.cn 高阶智驾将近,终端销售回暖 2023-12-18 华为与整车厂成立合资公司,有望加速汽车智能化 2023-12-11 特斯拉推进 FSD 落地中国,政策清晰划分事故责任主体 2023-11-26 视频大模型快速突破,有望打开视频分析行业天花板 看好(维持) 电子行业动态跟踪 —— 视频大模型快速突破,有望打开视频分析行业天花板 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 2 目 录 1. 近期视频大模型进展多,谷歌发布 Gemini ................................................. 4 1.1 近期视频大模型进展较多 ............................................................................................ 4 1.2 Gemini MMLU 测试得分首超人类专家 ........................................................................ 4 1.3 Gemini Pro 和 Nano 版本已发布,加速 AI 赋能谷歌产品 ............................................ 5 2. 首个原生多模态模型 Gemini 展示出了强大的视频理解能力 ........................ 6 2.1 人工智能从单模态有监督迈向多模态自监督学习......................................................... 6 2.2 Gemini 是首个发布的原生多模态模型 ......................................................................... 6 2.3 Gemini 模型具有强大的视频理解分析能力 .................................................................. 8 2.4 更多原生多模态大模型有望快速涌现 ........................................................................... 9 3. 原生多模态模型有望解决视频分析行业痛点,打开行业天花板 ................. 10 3.1 视频分析行业在数据处理规模、速度和深度上存在亟待解决的痛点 .......................... 10 3.2 原生多模态模型在视频监控和分析领域价值凸显 ....................................................... 11 3.3 原生多模态模型加持后,视频分析系统有望跨步功能迭代 ........................................ 12 4.领先厂商已入局,多模态模型将是视频监控行业新机遇与挑战 .................. 12 4.1 视频监控行业领先厂商已投入多模态大模型研究中 ................................................... 12 4.2 多模态模型带来新机遇与挑战 ...................................................

立即下载
互联网
2023-12-19
东方证券
20页
1.52M
收藏
分享

[东方证券]:电子行业动态跟踪:视频大模型快速突破,有望打开视频分析行业天花板,点击即可下载。报告格式为PDF,大小1.52M,页数20页,欢迎下载。

本报告共20页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共20页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
中国 2021-2023 年国内月度票房(亿元)
互联网
2023-12-18
来源:策略周报:继续关注有色金属和传媒游戏等赛道赛道
查看原文
中国预制菜相关刺激政策与措施
互联网
2023-12-18
来源:策略周报:继续关注有色金属和传媒游戏等赛道赛道
查看原文
2019 年-2026 年中国预制食品行业市场规模及预测
互联网
2023-12-18
来源:策略周报:继续关注有色金属和传媒游戏等赛道赛道
查看原文
各国人形机器人总专利数及有效发明专利数 图表 19:各国人形机器人有效专利占比(%)
互联网
2023-12-18
来源:策略周报:继续关注有色金属和传媒游戏等赛道赛道
查看原文
2017 至 2026E 全球工业机器人年安装量及同比增长率估计
互联网
2023-12-18
来源:策略周报:继续关注有色金属和传媒游戏等赛道赛道
查看原文
主要经济动能变化情况
互联网
2023-12-18
来源:策略周报:继续关注有色金属和传媒游戏等赛道赛道
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起