Vidu全球推出“国产Sora” 百度百歌提供视频大模型培训支持
发布时间:2025-06-24 17:12:41 作者:北方职教升学中心 阅读量:148
7月30日,Sora是世界上第一个挑战者,也是中国第一个纯自主研发的视频大模型Vidu(www.vidu.studio)正式上线。生数科技宣布Vidu目前不需要申请,用户可以直接通过邮箱注册体验。

作为中国最早布局多模式通用大模型的团队之一,生数科技于今年4月与清华大学联合发布了中国首款全面标杆OpenAI 大模型ViduSora视频。Vidu自4月底首次亮相以来,凭借堪比Sora的文化成长视频能力,迅速在国内外引起广泛关注。Vidu全面开启了文生视频和图生视频两大功能,提供4s和8s两种时长选择,最高分辨率为1080p。
在效果上,Vidu不仅延续了4月份展示的高动态性、高逼真性、高一致性等优势,还在线版本中增加了角色一致性(Character To Video)、特色能力,如动画风格、文字和特效画面的生成。同时,Vidu在影响用户体验的推理速度方面,实现了业界最快的实测推理速度,只需30秒就能生成一段4秒的片段。当市场上的主流人工智能视频工具生成大约4秒的视频片段时,用户通常需要等待1到5分钟甚至更长时间。 Vidu的高效推理不仅给用户带来了接近无缝的创作体验,而且意味着它可以很容易地满足大量用户的需求,提供个性化的服务。
众所周知,视频生成产品开发周期长,成本高。从发布到上线仅三个月,生数技术就完成了Vidu的快速迭代,实现了高质量的视频生成效果,这与Vidu研发团队在模型高效培训方面积累的工程经验是分不开的。密集快节奏的模型训练任务不仅需要大规模的计算能力,还需要从数据准备到模型训练再到模型推理的全链接保证。
在模型训练层面,Vidu采用了百度百歌·AI异构计算平台。百度基于过去多年的百度智能云 AI 以GPU为核心的异构计算平台更适合大模型训练,保证了模型训练的稳定性和效率。
在提高模型培训效率方面,通过芯片性能优化、自动芯片选择、潮汐混合等经验和技术,可以统一管理不同地点、不同规模、不同集群的计算能力,大大提高智能计算能力效率。万卡集群模型有效训练时间占98.8%以上,线性加速比和带宽有效性超过95%,是行业领先的计算能力效率。
在提高模型培训稳定性方面,百歌提供了丰富的运维、可观测工具和容错保障能力,提高了大规模集群长期运行的稳定性,降低了因故障导致异常终止培训任务的概率,减少了业务损失。
同时,百歌支持与昆仑芯、升腾、海光DCU相兼容的多芯混合、英伟达、英特尔等国内外主流人工智能芯片支持不同制造商芯片混合在同一智能计算集群中,最大限度地屏蔽硬件之间的差异,帮助企业摆脱单一芯片的依赖,实现更好的成本,确保更灵活的供应链。在多芯混合训练任务中,百歌可以充分发挥单芯片利用率、芯片间通信效率和集群整体效率。百卡规模性能损失不超过3%,千卡规模性能损失不超过5%,均处于国内领先水平。
高效、稳定、混合多芯的特点可以帮助生数技术实现大模型开发的“快速、稳定、省”,帮助生数技术在短时间内以低成本完成大模型业务。目前,百歌在互联网、教育、汽车、生命科学等行业有着广泛的实践,帮助行业客户实现大模型应用的快速实施。
未来,生数技术将继续在百度百歌·人工智能异构计算能力计算平台的基础上进行培训,提高模型能力,并通过百度智能云千帆平台逐步开放模型服务。