专题:OpenAI发布首个视频生成模型Sora:输文字出***
国泰君安证券发布研报称,Sora 模型推动 AI 多模态领域飞跃式发展,AI 创作等相关领域将迎来深度变革,AI 赋能范围进一步扩大,多模态相关的训练及推理应用也将进一步提升对算力基础设施的相关需求。
以下为研报核心摘要:
2024 年 2 月 16 日 OpenAI 发布文生***模型 Sora,AI***生成能力实现跨越式发展,模型强大的***生成能力推高行业天花板,产业赋能的深度和广度有望超预期拓展。
投资建议:Sora 模型推动 AI 多模态领域飞跃式发展,AI 创作等相关领域将迎来深度变革,AI 赋能范围进一步扩大,多模态相关的训练及推理应用也将进一步提升对算力基础设施的相关需求。推荐标的:金山办公、科大讯飞、万兴科技、虹软科技、神州数码、中科曙光,受益标的:苏州科达、当虹科技。
OpenAI 发布首个文生***模型 Sora,效果震撼。Sora 模型可以通过文本描述生成 60 秒长***,还可以对***色彩风格等要素精确理解,创造出人物表情丰富、情感生动的***内容。目前 Sora 尚未对公众全面开放,仅邀请部分测试者进行体验,但是 OpenAI CEO 在社交平台上展示了由网友提供文本描述生成的***案例,展现了 Sora 在***生成方面的强大能力。
Sora 三大亮点突出,实现 AIGC 领域的里程碑式进展。首先是 60 秒长***,Sora 可以保持***主体与背景的高度流畅性与稳定性。其次是单***多角度镜头,Sora 在一个***内实现多角度镜头,分镜切换符合逻辑且十分流畅。再是理解真实世界的能力,Sora 对于光影反射、运动方式、镜头移动等细节处理得十分优秀,极大地提升了真实感。
Sora 的技术基础保障了强大功能的持续迭代。Sora 是一种 Diffusion 模型,同时具备良好的扩展性。Sora 使用 DALL·E 3 的 Recaption 技术,使***可以更符合文本指令,此外还具备静图生***、原***拓展补帧等能力。OpenAI 表示 Sora 是构建世界模型的基础,未来将向实现 ***I 继续迈进,我们认为该模型的当前表现展现出了这种潜力。