语音辨识 (Speech Recognition,简称SR) 扮演者收集声音信息的角色,就如同是人类的耳朵。SR 将声音的音波转成数字的讯号经过辨识处理后,成为代表声音内容的讯息。一般应用SR 技术可分为两部分:语音指令(Voice Command )、连续音辨识 (Continuous Recognition )。语音指令就如同一个声音有一个预设好的指令,而连续音的辨识是将声音里面所参杂的词汇辨识出来,但是目前市场上连续音辨识技术的正确率尚不尽理想。
而HPLE应用SR技术撷取出声音内容代表的讯息,而非辨识出关键词汇。也就是说,SR技术将声音的音波转换成数字数据,再由HPLE 的逻辑引擎处理。HPLE的SR技术提供高精确度的辨识和抗噪声语音技术,以及Hmm-base 连续语音辨识,并提供多语系的辨识技术(Multi-Language Recognition)。所以在中文、日文等非拉丁语系的语音辨识领域,由于无法以关键词来处理,所以全球其它大厂仍无法突破口语化连续音的辨识。而 HPLE 引擎仍然可以用理解的方式,达到九成以上惊人的高辨识率。 |