皇冠博彩app
热门标签

以太坊开奖(www.326681.com)_中华电信中英双语 AI 客服借助 NVIDIA GPU 加速深度学习 目标为打造可聊天的本土化语音系统

时间:3个月前   阅读:95   评论:1

以太坊开奖www.326681.com)采用以太坊区块链高度哈希值作为统计数据,以太坊开奖(联博统计)数据开源、公平、无任何作弊可能性。联博统计免费提供API接口,支持多语言接入

,

由AI对话助理提供大量资料汇整分析的知识问答服务,可将传统客服人力应用在需要更准确解决问题的情况,例如直接由AI对话助理协助回答哪些方案适合消费者当前的使用需求,而在此基础下可以直接提供精准的漫游方案选购建议,而其他人员则可聚焦在技术问题处理,或是较复杂的客诉情况。

如果曾拨打「123」致电中华电信24小时客服专线,应该都有体验过全台首创声音互动人工智慧(AI)客服,其借由拟真的语音系统提供自助式客服,或是协助转接专人客服,以解决进一步的需求。而这套系统背后采用的便是NVIDIA超大规模模型推论解决方案Triton推论伺服器,搭配旗下GPU加速深度学习系统,让中华电信能以更高的效率完成语音模型训练,进而建构高自然度的拟真语音互动体验。

更拟真的客服专线,原本需要长时间训练建立

中华电信研究院前瞻科技研究所所长汪世昌表示:「目前中华电信自行研发的中英双语语音合成技术,历年来已应用于多个领域,除了用在24小时客服专线,更应用在166、167天气预报、视障辅助等相关应用,以及中华电信旗下i宝贝智慧音箱、AI语意云、智慧广播助理等服务,同时也用于健保署、消防署的语音服务系统。」

在还没有导入AI技术时,中华电信就已着手投入拟真数位语音技术研究,从早期借由语音拼接进行合成,以及后续透过语音参数方式进行合成,到现在已经可以利用深度学习等AI技术,透过足够时间长度规模的声音资料,以及相应的文字内容,训练合成高度自然的语音模型,唯独整个训练流程仍须花费较长时间。

以目前深度神经网路(Deep Neural Network;DNN)技术推动的语音合成效果,已经可以实现逼近真人语调般的自然表现,但是借由自我回归模型(Autoregressive Model)生成诠释声音语调特征的梅尔频谱(Mel-Spectrogram),再透过人声编码器(Vocoder)合成语音内容的过程,往往需要处理大量资料数据,使得整体合成时间变得更长,因此与预期应用在实际服务上的流畅度表现将有所落差。

加上若要打造跨语言的语音系统,过去的作法是透过多种语音系统对应不同语言内容,但会导致不同语言内容以不同音色呈现,而造成使用体验不一致,因此会透过同一人录制多种语言的语音资料,借此建立相同音调的语音系统。

不过,在此需求情况下,更代表需要花费更长时间进行训练,才能顺利建立出像是中华电信此次释出的中英双语语音合成模型,并顺利应用在各类语音服务上。

而在采用NVIDIA旗下的技术资源后,中华电信将原本需要花费约7天才能完成训练的语音模型,缩短至1天即可完成,不仅让合成速度加快10倍,更让训练结果逼近真人语音,呈现更自然语调,大幅降低早期技术产生的明显机器合成语感。

▲模型训练时间缩短,合成速度加快

借助NVIDIA技术大幅缩短训练时间

汪世昌表示,将数位合成的语音系统用于客服,太重的机器合成语感会严重影响使用者的互动意愿,尤其目前越来越多服务仰赖语音互动,自然的语感表现更容易吸引使用者互动。

不过,要打造自然语感的合成语音表现,自然需要庞大的资料量进行深度训练,以过往训练模式须花费更长时间完成,但是借由导入NVIDIA超大规模模型推论解决方案Triton推论伺服器,并搭配TensorRT深度学习推论平台,以及透过GPU加速的cuDNN 函式库等资源,同时,借由NVIDIA Elite合作伙伴丰康科技协助导入NVIDIA的硬体设备,包括NVIDIA DGX-1超级电脑、RTX A6000 GPU与多张NVIDIA T4 Tensor 核心 GPU等进行运算,即可让原本需要花费多时才能完成的模型训练,缩短至1天即可完成,更可在整个训练过程中降低成本支出。

▲NVIDIA Triton推论伺服器架构 ▲语音合成Triton推论工作流程

如此一来,即便语音模型需要重新训练,或是加入不同参数等,都能在更短的时间内完成,借此让合成语音系统能更符合实际应用需求、同时也更自然,甚至反应速度更快。

拟真语调只是初期应用,未来计画创造可聊天互动的AI对话系统

不仅侷限在中、英两种语言,汪世昌进一步说明目前还有台语与客语,未来也会因应市场需求加入更多语言,以及语意理解与上下文衔接,让数位语音系统可以结合AI对话助理,借此实现更广泛的代理服务应用模式,例如从当前的电话客服系统,进一步衍生能够依照致电者需求自然应答的语音互动模式,让餐厅等商家可以在无须增加人手的情况下,即可透过语音系统接下更多订单或处理更多订位需求。

▲机器人客服情境

汪世昌认为,由AI对话助理提供大量资料汇整分析的知识问答服务,可将传统客服人力应用在需要更准确解决问题的情况,例如直接由AI对话助理协助回答哪些方案适合消费者当前的使用需求,而在此基础下可以直接提供精准的漫游方案选购建议,而其他人员则可聚焦在技术问题处理,或是较复杂的客诉情况。

为了建立更有智慧的AI对话助理,需要更庞大的资料与知识问答进行训练,并且透过更强的算力缩短整体训练时间,因此未来中华电信也会持续与NVIDIA合作,并藉其解决方案创造更符合自然语调、精准正确的语音互动体验。

免费开放中英双语语音合成模型及语料库,希望推动更多台湾在地化智慧语音发展

而此次对外免费开放的中英双语语料库,计画于Q3前发布在NVIDIA DeepLearningExample 开源平台,主要是由一名女性专业录音员录制总长达4.5小时、总计2740段中英双语内容,内容更以科技产品相关语句为主,成为亚洲地区第一个免费开放使用的中英双语语料库,借此让更多业者能够打造符合台湾人使用的语音系统,同时推动更多以语音为互动的AI应用发展。

汪世昌进一步表示,主要考量目前市面上适合中英双语使用的语言模型资料稀少,同时取得成本较高、取得管道也相对复杂,因此希望透过此次释出的开放中英双语语音合成模型及语料库,催化台湾产学研界打造更好的语音合成应用,未来也期待能透过更多「广结盟」合作,强化本土技术应用发展。

上一篇:足球免费贴士(www.zq68.vip)_话剧鸳侣 魏绮珊 陈文刚

下一篇:每年自送首饰奖励努力工作 恨嫁Mandy Lieu: 婚戒大小无拘

网友评论