语音识别是模式识别的一个重要分支,也属于信号处理科学领域的范围,同时与语音学、语言学、数理统计及神经生物学等多个学科有非常密切的关系。智能化语音的目的就是让机器“听懂”人类口述的语言,那么智能语音系统如何才能实现更好的发展呢?
一、实现智能产品的有效整合
除了自动语音识别本身不断训练、优化,提高音转字准确率之外,还要和其他关键关联方整合应用。智能化语音对话的关键关联方是智能机器人,那要么智能化语音产品中包含了这样的功能,要么和智能机器人组合起来使用。智能语音分析的关键关联方是大数据分析产品,各种分析模型。很多时候,这些整合使用的关联方好坏,甚至更为重要。
二、搭建自有便捷化系统
有些厂商是提供云服务的方式进行语音识别的,优点是便宜,缺点是云端的模型优化不能完全按照自有的业务特点进行(私有云除外)。而自有系统,就可以按照一些专特有词汇进行语料库的训练优化,现在识别准确率方面的利器就是训练。如果有厂商驻场优化,那是更好。
三、对录音进行预先筛选
一套语音识别系统还是很贵的,尤其是一套自有的系统,越多的转译录音时长,越多的服务器资源。而如果能通过结构化的数据筛选条件,先找出符合条件的录音,再去转译的话,录音时长就少多了,也不用担心随机采集到的样本量太少。比如电销只取销售成功的录音,因为销售失败的不是监管重点;比如只取某某产品的客户录音转译,因为这个产品的咨询、投诉是当前监控的重点。
除此之外,智能语音系统还必须实现压缩前的转译,通常为节省存储,电话录音会被压缩得很厉害。由于电话本身 8K 采样率已经先天不足,再被压缩的话语音识别效果就更差了。所以可以采取先高品质暂存,转译后再压缩。除此之外,还应当进行双声道录音,这个大家都明白的,把客户录音和座席录音分开来,就可以做更多、更准确准的分析。