腾讯大模型团队致谢阿里云,AI开源再立功

一张图就能生成一段舞蹈视频。近日,腾讯音乐娱乐Lyra实验室公开了全新的图生视频框架MusePose,补齐了其虚拟数字人模型家族的最后一环。

根据腾讯公开的项目信息显示,该模型可生成人物、卡通、动漫等形象视频,视频时长大约在10秒左右。但有意思的是,细心的网友发现,在MusePose的报告中,腾讯特别致谢了阿里的AnimateAnyone和其他开源组件。



对比阿里的Animate Anyone和腾讯的MusePose后,两款模型生成的效果极其相似,展示的demo也几乎一致,不难看出,腾讯的这一框架确实有参考、借鉴阿里的技术路线。

AnimateAnyone是何方神圣?

这是阿里通义实验室自研的一款视频生成模型,同样是输入一张图,就能将静态图像转换成连贯、可控制的视频。不同的是,阿里公开AnimateAnyone论文和多个开源文件的时间也追溯到去年11月。这一模型在当时被国内外开发者广泛关注,仅仅数日GitHub上就斩获了超1万个Star,更是在推特、YouTube等海外社交媒体平台上迅速蹿红,相关视频播放量超1亿。


今年1月,AnimateAnyone技术正式在通义App上线,直接向全民开放,用户仅需上传一张照片,就能让一个毫无舞蹈经验的人立刻跳起“科目三”,多数用户体验过后给出评价称,“科幻得夸张”、“有点强”。彼时网络疯传的兵马俑或马斯克跳“科目三”、奶牛猫跳洗澡舞等视频,背后使用的技术便是来自AnimateAnyone。


在当下的AI大模型领域中,视频生成是最热门的研究方向之一,OpenAI、谷歌、Meta等公司都在积极布局。但如何保证人物形象一致、动作流畅可控、时序细节完美重现等难题,依旧颇令业内头疼。在这一背景下,AnimateAnyone投下了曙光,成为这一领域的标杆之作,尽管Animate Anyone项目已公开近10个月,但时至今日,其对开源社区的价值依然在延续。


通向“科技普惠”的开源之路

开源还是闭源?这一直是人工智能领域中争论不休的一个问题。

站在当前时点,AI大模型之战开始向“更大、更强、更多模态”演进,但随之而来的是大幅攀高的成本。而开源大模型就可以极大降低应用开发的门槛,用户只需下载完成预训练的模型并进行微调,便可以搭起高质量模型或应用。换句话说,在大模型时代,开源路线能帮助更多中小企业组建大规模大模型,这对行业整体技术推进、生态繁荣发展、实现“科技普惠”极为重要。

不过,从0研发一款参数规模大、性能顶尖的大模型需要巨大的算力和人力成本,开源意味着把这些成果免费共享给所有人,纵观全球,能坚持回馈开源社区的科技公司并不多。“国内这方面阿里云做得比较好,肯把比较最好的模型开源出来,”有业内人士表示,“这很难得。”

从全球市场来看,阿里云是国内早期开源自研大模型的科技企业,也是全球开源全尺寸、全模态大模型的云厂商。就在今天,阿里还发布通义千问Qwen2大模型,在Hugging Face和ModelScope上同步开源,其性能超越美国最强的开源模型Llama3-70B,也超过文心4.0、豆包pro、混元pro等一众闭源模型。据悉,阿里开源的Qwen系列模型的下载量已超1600万,目前全球已有1500款基于Qwen二次开发的模型。


海量资讯、精准解读,尽在新浪财经APP

相关知识

腾讯大模型团队致谢阿里云,AI开源再立功
《西游记》把大模型给难倒了
OSS Compass开源指南针发布:系国内首个开源生态健康评估平台
阿里大消息!
“模都”之战打响,又一个城市洗牌机会?
大模型国家队,定了!百度华为阿里等入局,将正式启动制订大模型测试国家标准
百度吴甜:跨模态大模型技术创新带来AIGC应用突破
华为与26家企业、科研院所、高校共同启动基于昇腾AI的大模型联合创新中国大模型超级工厂
90后二次元北大校友做出AI漫画创作工具,融资千万
上海举办国内首个 AI 音乐会

网址: 腾讯大模型团队致谢阿里云,AI开源再立功 http://m.taoroudan.com/newsview201017.html
所属分类:品牌资讯

推荐资讯