Google Cloud 的文本转语音API 获重大更新

Claire| 2018-09-20 来源: 云计算 评论数( 0 )

 

该API提供了一项功能,可以优化特定类型的扬声器的语音。

上月底,谷歌云宣布其云文本转语音API(Cloud Text-to-Speech API)已经全面可用,这使得开发人员能够向其设备或应用程序添加自然的语音。该API也提供了一项功能,可以优化特定类型的扬声器的语音。谷歌还向API添加了十多种新的WaveNet语音,从而使得使用更多种的自然的语音成为了可能。

今年三月,谷歌首次推出了文本转语音服务,阐述了谷歌是如何利用来自其收购来的Deepmind的技术的。该AI公司创建了WaveNet,这是一个用于原始音频的深度神经网络。WaveNet语音比标准的文本转语音的语音更加自然。

推出之初,文本转语音 API只提供了美式英语这一种WaveNet语音。随着新WaveNet语音的发布,该API现在能够支持26种WaveNet语音,包括美式英语、英式英语、澳大利亚英语、法语、德语、荷兰语、意大利语、韩语/朝鲜语和日语等。

谷歌的文本转语音API会与AWS的Polly语音合成服务进行竞争,后者拥有54种语音。

同时,这款API现在还提供了一个音频资料的测试版,这是一项能够帮助开发人员优化其特定硬件上的语音的功能,比如电话线、手机或扬声器。有了这一功能,文本转语音API就能将音频移动到合适的频率。例如,电话线只有有限的带宽,没有低音和高音。

聚焦云计算,扫描二维码,关注HostUCan云计算

有好的文章希望站长之间帮助分享推广,猛戳这里我要投稿

您需要登录后才可以评论登录|注冊

暂无评论