南方财经全媒体记者吴佳霖 广州报道
“30个人的团队在3个月内制作的工作量,生数科技的Vidu大模型可以通过1.5个人在2天之内把所有的素材生成完毕,并通过三天的时间剪辑成功。大大提升效率,缩短制作周期。”生数科技的投融资负责人樊家睿在描述Vidu大模型的应用时,指着屏幕上播放的电影中国水墨风宣传片,举了一个生动的实例。
灵动的画面来自于高精尖的技术。“现在无论是学界还是产业界的一个共识就是,在通用人工智能的道路上,必将经过多模态的融合、多模态的发展。”樊家睿认为,在多模态生成任务上,生数科技的技术团队走在了世界的前列。
“早在2022年9月,生数科技的创始人朱军教授带领核心团队在全球范围内首发第一个融合架构,将Transformer和扩散模型相融合,探索多模态生成任务的又一表现。”樊家睿介绍。
2年后的2024年的春天,生成大模型Sora发布,引爆整个业界。
“Vidu在Sora发布两个月之后在北京中关村论坛成功发布,做到了中国首个长时长,高一致性,高动态性的视频生成模型。6月份进一步将时长突破到了32s,并在32s的维度之上,实现视频和音频两种模态的融合。”樊家睿如此论证Vidu大模型在国内与国际的领先地位。
樊家睿透露,Vidu自发布以来便迅速赢得了国内外众多企业的青睐。“7月30日,Vidu作为面向消费者的C端产品全球发布。目前,我们已经与产业界以及猫眼娱乐、索尼(中国)等知名IP持有方在影视、动漫和文化娱乐领域建立了深厚的商业合作关系。”他进一步举例说明,“在《熊猫计划》项目中,Vidu作为首个院线电影提供AIGC视频生成技术的支持单位,同时也与索尼(中国)合作,打造了国内大模型与国际知名IP的首个商业合作项目,这同时也是全球首个获得知名IP授权、全链路艺术家授权的AIGC生成式短片。”
项目路演最后,一只水墨风格的白虎凛然走出烟雾,樊家睿介绍,“生数科技是唯一一个能够清晰理解白虎和烟雾两个主体的企业。”他表示,“ 在动漫生成方面,被用户评为是唯一一个能够支持情感细腻的主体转换、场景转换和镜头转换幅度极大的动漫风格的生成。”