我国自研视频大模型全球上线

来源: 中国经济网 时间：2024-08-06 07:04:39 阅读量：12793

科技日报讯记者8月3日获悉，亮相2024中关村论坛年会的人工智能视频大模型Vidu日前宣布在全球正式上线。Vidu开放文生视频、图生视频两大核心功能，提供4秒和8秒两种时长选择，分辨率最高达1080P。

Vidu是北京生数科技有限公司联合清华大学发布的自研长时长、高一致性、高动态性视频大模型。据介绍，此次面向全球上线，Vidu在基础功能外新增动漫风格、角色一致性等功能。生数科技有关负责人表示，Vidu实现了业界最快实测推理速度，仅需30秒就能生成一段4秒片段。目前Vidu无需申请，用户直接使用邮箱注册即可上手体验。

今年初，文生视频大模型Sora在全球引发广泛关注。目前业界对视频模型的评价主要围绕三大核心维度:语义理解准确性、画面美观性、主体动态一致性。Vidu较好平衡了这三方面的表现。它能准确理解并生成提示词中的文字，包括字母、数字等，并能生成文字特效。对第一人称、延时摄影等镜头语言，Vidu也能精准表达，用户只需细化提示词，即可大幅提升视频可控性。同时，Vidu支持大幅度、精准的动作生成，保持高流畅、高动态的画面效果。

此外，Vidu在构图、叙事和光影等方面，能达到接近电影级效果。Vidu还能生成影视级特效画面，如烟雾、炫光效果、CG特效等。

声明：以上内容为本网站转自其它媒体，相关信息仅为传递更多企业信息之目的，不代表本网观点，亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险，需谨慎。