该API提供了一项功能,可以优化特定类型的扬声器的语音。
上月底,谷歌云宣布其云文本转语音API(Cloud Text-to-Speech API)已经全面可用,这使得开发人员能够向其设备或应用程序添加自然的语音。该API也提供了一项功能,可以优化特定类型的扬声器的语音。谷歌还向API添加了十多种新的WaveNet语音,从而使得使用更多种的自然的语音成为了可能。
今年三月,谷歌首次推出了文本转语音服务,阐述了谷歌是如何利用来自其收购来的Deepmind的技术的。该AI公司创建了WaveNet,这是一个用于原始音频的深度神经网络。WaveNet语音比标准的文本转语音的语音更加自然。
推出之初,文本转语音 API只提供了美式英语这一种WaveNet语音。随着新WaveNet语音的发布,该API现在能够支持26种WaveNet语音,包括美式英语、英式英语、澳大利亚英语、法语、德语、荷兰语、意大利语、韩语/朝鲜语和日语等。
谷歌的文本转语音API会与AWS的Polly语音合成服务进行竞争,后者拥有54种语音。
同时,这款API现在还提供了一个音频资料的测试版,这是一项能够帮助开发人员优化其特定硬件上的语音的功能,比如电话线、手机或扬声器。有了这一功能,文本转语音API就能将音频移动到合适的频率。例如,电话线只有有限的带宽,没有低音和高音。