2024生成式AI+视频行业发展现状、国内外龙头及未来方向发展分析报告

资讯 » 新零售 2024-08-02

今天分享的是:2024生成式AI+视频行业发展现状、国内外龙头及未来方向发展分析报告

报告共计:49页

《2024 生成式 AI + 视频行业发展现状、国内外龙头及未来方向发展分析报告》由信达证券发布,对生成式 AI + 视频行业进行了全面深入的分析,包括技术发展、市场参与者、应用方向以及未来展望等方面。

一、生成式 AI + 视频行业发展现状

1. 生成式 AI 发展进程

- 生成式 AI 历经文生文、文生图的发展,目前正处于 AI + 视频和 AI + 3d 渗透的阶段。

- AI 视频生成及编辑在市场中占比较多,重要性和产品推进速度较快。

2. 主流 AI 视频生成技术的迭代路径

- GAN + VAE:GAN 用于视频生成,通过生成器和判别器对抗训练生成新数据,但存在训练不稳定等问题;VAE 引入隐变量推断,训练稳定但生成图像缺少细节,两者串联融合可实现数据自动生成和高质量图像生成。

- Transformer 模型:基于注意力机制,具有并行处理、可扩展性、泛化能力等优点,在视频生成领域应用广泛,但存在参数效率低、对输入数据敏感、难以处理时空动态变化等缺点。

- 扩散模型:通过添加噪声和去噪过程生成新数据,分为去噪扩散概率模型、基于噪声条件评分的生成模型和随机微分方程三种类型,在视频生成领域有广泛应用。

- DiT(Transformer + Diffusion):利用 Transformer 处理潜在空间中的图像数据块,具有潜在扩散模型的优点,提高了计算效率,可实现高质量图像生成,但也存在实现复杂性、训练稳定性、对硬件要求高等缺点。

二、市场主流的生成式视频参与者

1. 海外市场

- Luma AI - Dream Machine:能将文本和图像快速转换为视频,具备前后帧输入图片生成连贯视频功能,在电影质感、提示词理解等方面有一定优势,但存在视频内物体变形等问题。

- Runway - Gen 1 - 2 & Gen - 3 Alpha:提供多种 AI 驱动的创作工具,Gen - 3 Alpha 在保真度、一致性和运动方面有重大改进,支持多种视频编辑功能,收费标准为 144 美金/年。

- Pika:专注于让所有创作者都能创作出高质量视频,在文生视频基础上能实现多种编辑功能,如提示词修改指定区域框、更改视频风格等,采用订阅模式收费。

- OpenAI Sora:发布的文生视频模型 Sora 在生成视频质量、分辨率、文本语义还原等方面表现良好,最长可生成 1 分钟视频,功能包括文本生成视频、根据图像生成视频等。

2. 国内市场

- 快手 - 可灵 AI:快手大模型涵盖多种核心技术方向,可灵视频生成大模型具备强大的视频生成能力,重点方向包括合理运动、长视频生成、模拟物理世界特性等,在 APP 端视频生成效果出色,产品迭代速度快。

- 美图 - MiracleVision 4.0 AI 视频:主打 AI 设计与 AI 视频,新增文生视频功能,对提示词理解和物体细节处理较好,支持图生视频及运镜,后续有望更新视频生视频功能。

- PixVerse - 爱诗科技:全球用户量较大的国产 AI 视频生成产品,通过双融合技术路径搭建 AIGC 视觉多模态大模型,PixVerse V2 支持一次生成多个视频片段,人物一致性布局较深,可对生成结果进行二次编辑。

- 即梦 - 字节剪映:AI 作图和 AI 视频生成功能已上线,创新打造首帧照片和尾帧照片输入方式,增强视频生成可控性,支持中文提示词创作,产品使用界面添加了更多用户可控细节功能。

- 清华 - Vidu:视频大模型 Vidu 可根据文本描述直接生成长达 16 秒、分辨率达 1080P 的高清视频内容,强调高一致性和高动态性,采用自研 U - ViT 架构。

- 七火山科技 - Etna:Etna 模型采用最新神经网络架构,融合 Transformer 模型和 Diffusion 模型,致力于通过精确的文本到视频转换,目前暂未对外开放功能测试。

三、从 AI 生成到 AI 剪辑,一站式 AI 视频生成 + 编辑有望成为核心方向

1. 一站式平台型公司

以下为报告节选内容



免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿,经过编辑审核收录,不代表头部财经观点和立场。
证券投资市场有风险,投资需谨慎!请勿添加文章的手机号码、公众号等信息,谨防上当受骗!如若本网有任何内容侵犯您的权益,请及时联系我们。