文化湾企说丨兔展智能:从定义H5到复现“Sora”,All in国产视觉大模型

2024年11月08日 10:04   南方财经全媒体集团   张梦琦

编者按:

2024粤港澳大湾区文化产业投资大会(广东·广州)将于11月20日至22日举办。大会以“文化金融湾区领航,产业科技互促双强”为主题,立足湾区、面向全国,着力打造国家级文化金融品牌平台。南方财经全媒体集团策划推出《文化湾企说》系列报道,走访一批文化科技、数字内容、融合业态等文化领域新质生产力代表,听他们讲述文投大会背后的故事以及自身发展历程,传递广东文化产业新质生产力孕育一线的脉搏。

南方财经全媒体见习记者张梦琦   深圳报道

2014年,当大多数企业还在依赖传统营销传播时,深圳兔展智能科技有限公司(简称“兔展智能”)已决定“换道行驶”,率先定义“H5”这一全新内容表现形式,并成为最早推出H5零代码免费编辑平台的公司之一。随后几年,这一形式风靡微信朋友圈。

如今,面对生成式AI的浪潮,兔展智能再一次立上潮头。Sora发布仅一个月后,兔展智能开始了复现“开源版Sora”计划。

“中国是世界上制造大国,有很多独有的视觉数据资源,期待将Open-Sora Plan打造成深植于产业、赋能产业发展的中国本土视觉大模型,通过产业公司和科研机构的强强联手,以开源的方式对外传播中国团队的技术自信,号召全球社区一起做人类普惠的技术内容。”兔展智能CEO董少灵在接受南方财经全媒体记者采访时表示,公司创立以来自主研发了新一代内容引擎、传播大数据工具、营销云平台、数字人工具等产品,目前已积累了4000万平台注册用户、1500万政企组织客户。

争做中国首个AI视觉爆款产品

今年2月,OpenAI发布的文生视频大模型Sora震惊世界,其用文本生成的视频画质精良逼真,在视频长度、质量以及可控性等方面均达到了当前的技术最高水平。

国内随即引发热切讨论,“我们能否做出本土的、中文版的Sora吗”?

兔展智能基于长期的技术沉淀,在今年3月联合北京大学深圳研究生院推出Open-Sora Plan,集结开源社区的力量,力求在这一炙手可热的视频生成领域有所作为。

“今年3至9月,Open-Sora Plan已成为全球技术社群里引用最高的视觉开源模型。”董少灵介绍,该项目在GitHub上一经发布,就立马引起国际人工智能界相当大的关注。发布一周内就有超5000名技术开发人员为该项目标星,融合了30余次开源创作者的拉取请求(Pull Request),获得14万余次访问,代码被克隆超800次,来自美国、英国、加拿大、德国、澳大利亚、沙特阿拉伯、伊朗等多个国家的技术人员积极参与其中。

董少灵分析,这一波生成式AI是对生产力、生产关系的系统性重塑,也是对人类理解智能、理解人、理解自己的一个重塑,是一场启蒙运动+工业革命。未来应用层的繁荣是必然,会有非常多有价值的应用出现,甚至是未曾涉及的空白领域,并且成功率不会低,可能更多需要的是耐心。

近几年,基于AIGC技术的产品不断涌向市场,AI绘图模型成为最为普遍的一种。而在这个领域里,Midjourney 和 Stable Diffusion 是业内两大龙头,Flux、Imagen 3也尽显优势。

谁能坐上“AI生图”第一把交椅?群雄逐鹿之下,兔展智能近期推出了全球售价最贵的视觉大模型驱动产品——AnyReal,一张图售价可达100元。

这一大胆尝试的背后,是其对技术的笃定。“AnyReal是全球第一款可以把物体的三维一致性、光影、材质、透视关系正确生成的视觉模型驱动的AI产品,可能是继Midjourney和Stable Diffusion之后,全球第三款可能成为爆款的产品。”谈及未来,董少灵表示将继续深耕,“十年继往开来,我们要把公司从H5时代演化的所有数字内容的生产线,与AI视觉底层模型做深度融合,争取尽快推出AI驱动的系列数字内容生产产品。”

All in国产视觉大模型

在不断扩大商业版图的同时,兔展智能也颇受资本市场青睐。2023年上半年,兔展智能完成D+轮融资。

“公司2014年在北大宿舍创立,当时仅靠H5制作平台,半年就获客600万。创立十年来,我们完成了10轮融资,正在进行第11轮、12轮、13轮融资。”董少灵表示,公司赶上了第四次工业革命浪潮,“AI是对社会无孔不入的、本质上的改造,已经成为社会发展的新引擎。在这样巨大的生产力革命面前,激发了很多大胆资本、耐心资本的投资热情,我们公司也受益于此”。

据悉,2015年兔展智能找到对标企业Adobe,决定再现内容工具延展到营销云的发展逻辑。随后兔展智能从一个最早的H5工具逐渐成长为内容引擎和营销云平台,为企业提供一站式营销服务。目前,产品成为中国银行、平安集团、中国农业银行、招商银行、中信建投证券、泰康集团、华润三九、东阿阿胶等众多头部企业的重要选项。

面对如今生成式AI的浪潮,兔展智能更多的是“扎硬寨,打呆仗”。董少灵透露,在D+轮融资过程中,公司就向当时的一批投资人表达,核心方向是要非常笃定地“All in视觉模型”。在此基础上,公司致力于开发具有本土特色的视觉模型,即将我国特有的核心产业数据融入视觉模型,使其实际应用效果在某些领域表现出远超同行的优势,更好地赋能本土产业发展。

他特别谈到,粤港澳大湾区在AIGC领域发展具有强大优势。

一方面,大湾区作为中国制造业的核心区域,拥有扎实的产业基础和高质量的数据资源,这为我们的视觉模型提供了超越国际竞争对手的关键支撑。另一方面,得益于区域内完整的产业链和大量的专业人才,AI在实际应用中的持续优化和迭代得到了有力保障。这些得天独厚的条件,使粤港澳大湾区在拥抱人工智能的浪潮中能够占据先机。

南方财经全媒体记者注意到,在兔展智能所获得的数轮融资中,不乏招商局、深创投、投控东海、越秀产业基金等头部投资机构,且部分机构是结缘于2023粤港澳大湾区文化产业投资大会(简称“文投大会”)。面对今年11月20日即将召开的文投大会,董少灵表示期待:“去年我们结识了很多在文化投资领域卓有建树的投资机构,今年我们会继续参加,希望借这个平台,继续与在文化和科技交叉领域投资的机构进一步产生有效的信息互换,期待未来能达成更多的合作。”

关注我们