这个国外的语音合成网站可以让玩家操控二次元角色说话
能够听见自己所喜爱的游戏角色的倾情告白,这对玩家来说当然是一件好事,不过在国外,已经有网站可以实现让一些特定二次元角色来说出网友想要的话的技术了,而实现这个技术的网站,名叫15.ai。
仅从网页来看,15.ai看起来就很简陋和小成本的工具网站,实际上开发组也只有一人。该项目起初来自于麻省理工学院本科生研究计划,而随着开发者的研究,目前这个网站早已超过了当初计划的规模,比他在大一时制作和搭建的项目要复杂得多,不过总体的想法和精神延续了下来。
简单翻看了一下所支持的角色,不仅有诸如《传送门》的GLaDOS、《半条命》的戈登博士这样的游戏人气角色,还有《小马宝莉》、《史蒂文宇宙》、《海绵宝宝》这样的在国外知名度较高的动漫作品里的角色,各种游戏及动漫角色加在一起多达数十种声音可供选择。
根据开发者的极少,相比传统的语音算法,目前该网站所使用的技术要更加的有效率。只需要很少的数据就可以同时精确地克隆数百个声音,并且保持情绪和自然的完整性,开发者表示,在数据效率和自然性方面,这完全超越了以前已知的任何TTS(Text-To-Speech,语音合成)算法。
我们生活中常见的语音识别,如小米的小爱同学、苹果的Siri等,都是通过TTS来生成的,相比15.ai,这些语音听起来确实缺少了点感情。
网友在油管上看到的许多“深度伪造”视频,都依赖视频创作者从原本数小时的数据资料里进行提取编辑,最终才能制作非常简短的内容,并且呈现效果还很一般。而15.ai的开发者表示,自己的这项技术可以轻松实现那些视频效果(事实上15.ai的许多角色进行深度学习的数据时长只有几十分钟)。
开发者所说的这些话并不是毫无根据的,事实上,在推特上有很多网友已经开始使用15.ai的技术来为自己制作的同人短视频进行配音了,比如让那些经典的儿童动漫角色说一些绝不可能在原本动漫中出现的“粗鄙之语”。
虽然但是,这种二次元角色语音听起来已经非常接近原版了,但是由于情绪表现只能联系上下文进行自动识别,导致这些语音在情感表达上比较“中庸”,一些“极端”的情绪无法通过语音合成正常表达,虽然15.ai里也有小黄油的女角色,不过与AI换脸不同,距离其被正式用于某些NSFW的同人作品,还有很长的路要走。
对这种语音合成技术感兴趣的朋友可以自己去网站上尝试一下,需要说明的是,目前该技术只支持英文,并且一句线个字,且由于服务器等费用全部由开发者自己承担,因此服务器的质量堪忧,人数较多的时候合成转换较慢,再加上近期国外有Kotaku这样的媒体对这个网站的分享宣传,导致现在该网站的用户数量激增,很多时候转换一句话要等一分多钟,相信不久之后,我们就能在网上看到更多使用15.ai制作的视频了。
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186