AI修复600年传世名画李彦宏定义的AIGC将颠覆内容行业
《富春山居图》是元代画坛宗师黄公望的作品,这幅画作用淡雅的笔墨描绘了富春江变化多样的山水景色,也暗藏了作者寄情山水,追求自然的人生态度,被誉为“中国十大传世名画”之一。清朝初期,这幅画因遭到焚毁,断为一长一短两段。前半段被命名为“剩山图”,现于浙江省博物馆珍藏;后半段被命名为“无用师卷”,现于台北故宫博物院珍藏。
基于对绘画艺术的珍视和对中国优秀传统文化的保护,多年来,文物修复专家和业界相关人士为寻找《富春山居图》的修复方法付出了诸多努力,也取得了不少实践经验。如今,利用百度提供的 AI 技术和文心大模型,《富春山居图》得以补全。
黄公望纪念馆负责人毛传镔评价道:“补全的画作与现存真迹风格一致,使两岸画卷走出博物馆实现了合璧,光线风格统一,山水脉络和谐,不仅符合原画审美特点,视觉上还同样具有观赏价值。”同时,AI 技术还充分遵循传统文化习惯,作文以记之。
近几年来,在世界范围内,作为科技领域的热门技术,AI 的发展可谓是日新月异。今年,IDC 最新发布数据显示,预计 2022 年世界人工智能市场规模将达到 4328 亿美元,到 2023 年将超过 5000 亿美元。中国产业研究院数据显示,预计 2022 年我国人工智能市场规模将达到 2729 亿元。
由于各国对发展 AI 技术都非常重视,未来全球市场规模还将会有更进一步的提升。回顾 AI 技术自概念提出到如今迅猛发展的这一段历程,百度创始人兼 CEO 李彦宏在 2020 年的一则公开演讲中阐述了自己的观点。他认为:“AI 的发展会经历技术智能化、经济智能化和社会智能化这三大历史阶段,而目前正处于经济智能化的发展时期。”
技术智能化是指,在算法加速迭代和 5G、大数据、云计算等新兴技术的不断加持下,AI 朝新型技术平台的方向发展。经济智能化是指,随着数据的爆炸性增长和互联网基础设施的不断健全,AI 开始全方位地向产业领域普及。社会智能化是指,AI 推动全社会向智能协作方向变革。
美国是 AI 技术发展最为先进的国家,在芯片、算法、计算机视觉等领域的发展遥遥领先,不仅具有扎实良好的技术基础和能力,拥有大量尖端人才和优秀的人工智能企业,还制定了全局性的 AI 发展战略。中国 AI 技术在政策、资本和市场等诸多因素的引领下快速发展,目前也居于世界前列地位,主要侧重于需求创新和应用落地等方面。
思考中国 AI 技术的发展状况,主要体现在互联网、公共服务和实体行业等方向。比如,在公共服务领域,AI 技术融入医疗、教育、政务服务等细分行业,深入挖掘有效数据资源,推动社会层面基础设施的创新与升级。在互联网领域,借助大数据、物联网、云计算、5G 等多种新兴技术,基于线上智能平台化模式,淘宝实现了定位精准的商品推荐,字节跳动完成了新闻的推荐算法,美团提供了智能外卖送餐服务。在实体领域,AI 不断向各行各业渗透,推动产业转型升级,探索有效赋能实体经济发展的应用场景和创新路径。
在此背景下,我国科技巨头百度也抓住机遇,迎接挑战,在进行基础研究和创新技术、助推 AI 技术普惠的道路上不断努力。7 月 21 日上午,百度联合央视新闻在线 百度世界大会。
今年的大会以“AI 深耕,万物生长”为主题,百度创始人、董事长兼 CEO 李彦宏和百度各业务部门负责人出席本次会议,与各界共同分享前沿 AI 技术,探讨热点话题,发布最新产品。
基于自动驾驶技术的重大突破,发布第六代无人车 Apollo RT6;在“云智一体”深度融合的基础上,智能云“开物”全新升级至 2.0 版本,聚焦关键场景,为多个行业领域提供超过 200 个工业解决方案;基于对智能生活的不断探索,发布包括小度天天智能健身镜、智能语音闹钟、小度学习机等在内的智能产品;预训练大模型的研发也取得重要进展,不仅完成重大升级,还与中国航天合作共同发布全球首个航天领域的大模型“航天-百度·文心大模型”。
值得一提的是,通常情况下,文物修复专家可能需要投入毕生精力,才能在修复领域内的某一个细分方向里略有所得,而此次借助百度文心大模型补全的画作与以往并不相同。它拥有全民参与的亮点,即每个人都可以按照自己的想法,只需用不到一秒钟的时间,在中部空白的部分简单几笔勾勒,就能补全心目中的名作山水画。
作为一个真正由 AI 驱动的数字人,希加加首次登上央视新闻演播厅,以大会 AI 策划官与主持人的身份发挥作用。她具备 AI 口型驱动、AI 面形驱动、AI 唱跳、多国语言能力、实时语言互动等九大核心能力,拥有如同人类的思维和创造力,不仅可以生动且充满感情地与用户开展有趣的对话,还能够完成作曲、作画、剪辑等颇具创意和艺术气息的工作。
如今,希加加已应用于多个领域。比如,在 2021 年百度 create 开发者大会上,希加加曾就数字人问题与梅耶·马斯克展开了精彩对话。她参加设计由中国探月航天发行的数字藏品,也以“00 号太空数字乘客”的身份登上了我国第一艘数字载人飞船。目前,希加加的粉丝已达 73 万,全平台播放量超过 4.5 亿,整体曝光量超过 6.5 亿。
度晓晓曾因撰写过全国新高考Ⅰ卷名为《本手、妙手、俗手》的作文而引发网络关注。她在超短时间内完成了一篇符合主题、结构严谨的文章,并得到了 48 分的不俗成绩,该成绩已然超过了 75% 的考生。在之后参加上海英语作文考试时,她又交出一份语言优美、逻辑严密的优秀英语作文。度晓晓还参加了由西安美术学院举办的本科生毕业展,并创作了四款主题为“”的画作。这些画作不仅被评价为“具有美院毕业生的水平”,也在百度 APP 上以“数字藏品”的形式展开售卖且于一天内取得 17 万元人民币的销售额。
凭靠 AI 技术的赋能,度晓晓拥有实时可交互、陪伴可养成等特色能力,可以完成唱歌、跳舞、直播、作诗、写小作文、说唱等任务。在百度 APP 中,她还作为“虚拟小助手”,给用户提供交互式搜索和情感交流等智能体验。
AIGC(AI generated content)的意思是由人工智能自主生成内容,它会经历三个发展阶段。第一阶段是 AI 作为助手,辅助人类完成内容生产;第二阶段是 AI 以虚实并存的虚拟人形态出现,可与人类共生;第三阶段是 AI 能够独立完成内容创作的任务。
实际上,上述由百度开发的应用展现出的丰富技能正是 AIGC 能力的主要体现。可以看出,AIGC 能力已经在逐渐成熟并开始进入到独立创作内容的最终阶段。
其实,作为一种全新的内容生产方式,AIGC 将在未来十年里突破当下内容生产模式。它不仅能够有效提升内容生产效率,用最小的成本实现放大千百倍后的生产速度,还能以独立视角原创有价值的内容。
为加速实现 AIGC 的原创进程,需要不断发展深度学习平台和预训练大模型这些支撑 AI 发挥作用的底层技术。
飞桨(PaddlePaddle)是我国第一个开源开放的产业级深度学习平台,由百度自主研发,也相当于人工智能时代的操作系统。它能帮助开发者将丰富的 AI 想法变为现实,推动 AI 应用的落地与创新。目前,已有 477 万个开发者使用飞桨平台完成开发工作。该平台也已完成对 18 万家企事业单位的服务,创建了 56 万个 AI 模型。
百度于 2019 年起开始自主研发预训练大模型,文心大模型是其主推的一款大模型,它包含 NLP 大模型、CV 大模型、跨模态大模型和生物计算大模型,既有适合基础通用的,又有针对重点领域和关键任务的。
作为产业级知识增强大模型,文心融合学习了大规模的知识体系和海量的数据,从文本中的语词、语义、语法等基础知识出发,提高模型的理解和生成能力。同时,它具有“知识增强”的核心特色,且拥有极强的通用能力,能降低模型的开发门槛和成本。
百度集团副总裁袁佛玉曾指出:“随着百度 AI 算法的突破,我们能让数字人制作成本十倍、百倍地下降,还能让数字人生产周期,从动辄几个月,缩短到小时级别。”
首先,在模型层,基于解决产业领域的需求,发布了十个大模型,形成了基础、任务和行业大模型的多层体系。在基础大模型中,发布了 VIMER-UMS、ERNIE 3.0 Zeus、VIMER-StrucTexT 2.0 和 VIMER-UFO 2.0 四个大模型;在任务大模型中,发布了 ERNIE-SAT、ERNIE-GeoL、HELIX-GEM 和 HELIX-Fold 四个大模型;在行业大模型中,结合业务场景和算法设计,已在电力和金融等领域取得成就,联合国家电网研发了“国网-百度·文心”NLP 大模型,联合浦发银行研发了“浦发-百度·文心”NLP 大模型。
目前,文心大模型已被规模化应用到搜索、算法推荐、信息流、对话机器人等产品中,并广泛延伸至科技、医疗、教育、制造等多个领域。
那么,对于《富春山居图》的修复工作来说,文心大模型是如何发挥作用的呢?由于在《富春山居图》画作补全的过程中,需要克服高清晰度、高还原度和全民参与等难点,所以,为了实现更好的效果,研发者采用了“视觉生成大模型+单样本微调”的技术策略,先让文心大模型对大量的中国山水画进行学习,待到拥有较高水平时,再攻克《富春山居图》。这样,模型更容易掌握该画作的精髓,补全出来的内容风格也能与真迹风格保持一致。因为本次参与补全的视觉生成大模型拥有较强的建模能力和较大的参数量,所以能生成高清晰度的画作,提高作品的质量。百度方透露,未来还将借助大模型,尝试开发更多文艺创作方面的新功能,帮助艺术家和非专业人士探索更广阔的创作空间。
“普惠 AI”是这几年的热门词语,怎样借助 AI 技术推动千行百业的数字化转型,给更多生活在地球上的人们带来便捷与舒适,是进入人工智能时代这个大背景下需要思考的问题。返回搜狐,查看更多
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186