百度吴甜:跨模态大模型技术创新带来AIGC应用突破
原标题:百度吴甜:跨模态大模型技术创新带来AIGC应用突破
封面新闻记者 孟梅 欧阳宏宇
从画鸡蛋到创作《蒙娜丽莎》,人类学习作画,即便是达芬奇一般也得从基本功练起,要想画得出众,除了日积月累勤奋练习,还需要一些天赋,以及对世界的精细观察和画家个人的独特创想。进入数字时代,能否借助AI 的能力降低作画的门槛,让人人都能成为“艺术家”?
“基于AI跨模态匹配大模型进行生成画作的结果排序,将帮助人们通过语义筛选的方式,创作出美观度最佳的画作。”8月19日,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜在成都表示,由AI深度学习带来的文生图系统可为大众用户提供一个零门槛绘画创作平台,让每个人都能展现个性化格调,享受艺术创作的乐趣。
由AI文生图生成的画作
记者注意到,目前百度、OpenAI、谷歌等国内外的科技公司均已推了文生图AI工具。在这些工具中,用户可以输入文本,然后得到由AI生成的高清画作,包括国风、油画、水彩、水粉、动漫、写实等十余种不同风格,并支持不同的画幅选择。
面对日益增长的内容创作需要,关键是如何准确理解用户需求,进而精准刻画并满足多样化风格、高质量生成的要求。吴甜表示,足够实用化至关重要。“关键是要从用户需求出发提供全流程解决方案,比如,理解用户需求并在此基础上丰富语义细节,降低用户输入描述成本;对灵活性需求更高的开发者开放开源算法,帮助其完成模型的管理和一键预测诉求。”
事实上,文生图只是AIGC(人工智能生成内容)的外延之一。数据的井喷式增长、算力的持续突破、算法的持续创新为人工智能带来新机遇,预训练大模型凭借优越的泛化性、通用性和应用效果,正成为人工智能发展的重要方向。在吴甜看来,让AI在预训练过程中同时学习模态间和模态内的多种关联性,提升“图像”和“文本”跨模态语义匹配效果,并通过渐进式扩散模型,不断提升文本生成图像的效果。
“让机器具备跨越文本、图像等多种模态的复杂场景理解与生成能力,是人工智能的重要目标之一,也是数字时代科技与产业深度融合创新,催生新业态新模式,加快产业智能化升级的新动能。”吴甜预测,人工智能在艺术领域的学习与创作能力正以蓬勃之势不断刷新人们的认知,也让公众对科技与艺术及文化的融合创新有了更大的想象空间,未来带来创新性探索的同时赋能到广泛的行业领域。
责任编辑:
相关知识
《富山春居图》被“合璧” 李彦宏:AIGC迈向原创阶段
百度数字人度晓晓开卖AI画作,24小时赚了17万
数字人画作卖了17万元 把真人画家羡慕哭
自研机器人Max“进化”:腾讯灵敏运动研究取得新突破
吴磊,赵露思将出席8月24日宝格丽活动,吴露可逃太甜了……
试用三天 手机应用“免费餐”真香吗?
这吻戏赢麻了~吴磊他是真敢亲啊! 单手抱的氛围感甜爆了
京直播|古韵·诗律——吴灵芬与国家大剧院合唱团古诗词作品音乐会
跨岸胯部舞
海尔筹划推自有品牌汽车? 家电企业热衷跨界造车
推荐资讯
- 1李沁肖战已同居领证? 李沁肖 47928
- 2闫妮老公邹伟平简历 闫妮前 43158
- 3王凯蒋欣承认已有一子? 结 38813
- 4王灿前夫 王灿的第一任老公 36175
- 5汪希玥回北京过年,怎料见到汪 32170
- 6张佳宁和宋轶长得像 同属甜美 25314
- 7央视主持孙小梅丈夫曝光,是大 20260
- 860年代,洪秀柱(右后)与父 19568
- 9佟丽娅事件是什么 佟丽娅回应 19032
- 10妻子频繁出轨老外,没想到被丈 18705