驱动号
首页 人工智能 阅读正文 :
推荐京东云正式起航发布全新Logo和Slogan

DeepMind AI加持,谷歌推出文本转语音合成服务

来源: 驱动中国 文:吕永康 2018-03-29 11:57 访问量: 编辑:吕永康

驱动中国2018年3月29日消息   据外媒报道,谷歌公司近期正推出一款新的AI语音合成器,用于其机器学习云工具套件。这款语音合成器是一项名为云文本到语音的服务(Cloud Text-to-Speech) ,并由谷歌位于英国的AI子公司DeepMind通过WaveNet提供技术支持。

timg_image&quality=80&size=b9999_10000&sec=1522900355&di=6451ba2cb6472c4ab27aec2f713a5b7a&imgtype=jpg&er=1&src=http%3A%2F%2Fimage.tianjimedia.com%2FuploadImages%2F2017%2F076%2F11%2F2VQ65O8485A1 - 副本

据悉,此次谷歌推出的AI语音合成器,在WaveNet的支持下借助机器学习从头开始生成音频,通过分析人类语音数据库中的波形,并以每秒24,000个样本的速率重新创建这些波形,包括唇音和口音等微妙的声音。

相较而言,目前包括苹果Siri的大多数语音合成器使用了所谓的连接合成技术,即通过其中程序存储单个音节 - 诸如“ba”,“sht”和“oo”的声音 - 并且将它们一起飞起来形成单词和句子。这种几年前在成熟应用的技术,在现在听起来仍然很尴尬。

timg_image&quality=80&size=b9999_10000&sec=1522305630490&di=af3c9a65d0d0b9241163caeffeb629f3&imgtype=0&src=http%3A%2F%2Fimages.ofweek.com%2FUpload%2FNews%2F2017-02%2F23%2FEric%2F1487816100187099452

在谷歌于2014年收购DeepMind之后,这家公司就在探索将AI技术变为有形产品。借助DeepMind AI技术,谷歌数据中心的电力成本降低40%,并将WaveNet直接整合到其云服务中。谷歌表示,DeepMind的AI语音合成技术是业内最先进和最现实的技术之一。

在去年10月份,WaveNet就被整合到Google Assistant中。现在基于Cloud Text-To-Speech,可用于语言的精选。谷歌称,这项新服务提供32种不同的语音,可以说12种语言,用户可以自定义音调和速度等因素。