Aibelive HPLE 技术与其它语音辨识国际大厂
技术比较表 |
Features
and Benefits |
世界大厂一般
语音辨识技术 |
Aibelive HPLE
AI 技术 |
说明 |
独家人工智能技术比较 |
NLP应用技术 |
Grammar rule |
HPLE |
HPLE的NLU技术
(Natural Language Understanding)
CCSR–建构式概念表述系统
SNg –概念逻辑推理与演译
Speech Recognition-语音辨识
Dialog Engine–语音互动引擎 |
NLU-
支持自然语言解析
(parsing)能力 |
无 |
有 |
Aibelive的系统有完整定义
(well define) 的知识表述系统
(knowledge representation system),所以能提供NLU的功能,也可真正提供中文的语意理解。 |
NLU-
支持自然语言
模糊推理功能 |
无 |
有 |
可以透过分析语者陈述的内容,分析词汇概念及语意上的特征,藉以抽取出语者的意图并对应到知识表述系统(knowledge representation system) 内的目的(target) |
支持自然语言
相关概念推理功能 |
无 |
有 |
HPLE 能以概念推理方式自动找出语者可能的意图。譬如:语者只说出部分需求“我要查一下账户”,系统会自动找出“支票存款账户”、“定期存款账户”、“活期存款账户”、“台币账户服务”等。 |
支持自然语言语音
辨识噪声清除能力
(NLP base noise filter ability) |
无 |
有 |
HPLE 可以分析区隔出语者陈述内容的概念空间,并透过此方式滤除错误的语音辨识结果。也将以往语音辨识厂商,对于中文复杂无固定句型的理解障碍完全克服。 |
支持语者说错信息
的容错功能 |
无 |
有 |
以HPLE可以分析语者陈述内容的相关概念空间,若语者说错某些信息时,只要程度上不至于影响整体内容时,可以就有限的正确信息找出相关的讯息。 |
口音调整的辨识技术及抗噪声语音技术功能
(Noise & Accent Tolerance) |
部分有 |
有 |
具备口音调整功能。较先进之语音辨识均提供口音调整的辨识技术及抗噪声语音技术功能 |
NLP-
支持语音断词能力
(Term Segmentation) |
有
(Grammar base - keyword spotting) |
有
(NLU base) |
HPLE为NLU base,透过自然语言理解技术解析语音内含各种可能的词汇,透过断词能找出语音内含的词汇语意,而HPLE 的NLP base的断词分析则可将连续音内涵的词汇断出来再做分析,而非只是关键词。 |
语音辨识 - 标准功能比较 |
Features
and Benefits |
世界大厂一般
语音辨识技术 |
Aibelive HPLE
AI 技术 |
说明 |
Voice Command
辨识 |
有
(Grammar Base) |
有
(NLU Base) |
Grammar rule base:根据语者的陈述内容预先定义可能的讲法(rule:one voice one command)。
NLU base:根据欲提供之服务内容建立一专业知识库,此知识库中定义出知识表述系统(knowledge representation system)。透过此方式来对应Command。 |
Natural Speech
(free-type)辨识 |
有
(keyword spotting) |
有
(Understanding) |
世界大厂一般皆采用人工建置 grammar的方式来达成,但是由于语言的说法非常多样,无法以预先定义的grammar规范完整,再加上定义许多grammar后会产生干扰造成辨识的错误。 |
语音指令
Voice Command
辨识率
(accuracy measurement) |
92%~95% |
92%~95% |
世界大厂采用grammar base的语音辨识引擎,对于短语音及固定讲法的辨识每家公司的辨识率都差不多。这里定义的辨识率是以固定的语音辨识内容以及固定的讲法而言,对于一般语者若多说出一些字或说的比较自然的方式(free-style)都不在此辨识范围内。 |
Natural speaking
辨识率
(accuracy measurement ) |
无法达成 |
85%~95% |
HPLE采取的是NLU的方式针对语者说出的内容进行理解,而不是只有单纯的关键词辨识。所以透过此技术可以将整体的服务品质大幅度的提升,也突破全球在中文语音辨识上自然口语辨识的技术瓶颈。 |
整体辨识率
(使用voice command的比例*voice command + natural speaking ) |
无法达成 |
85%~95% |
对于实际上线服务而言,可能有50%的语者使用natural speaking方式而另外50%的语者使用简单的voice command的方式来说出需求,这时候其它世界大厂的语音辨识便无法控制其辨识率(辨识率可能下降到低于50%),而HPLE技术因为提供自然语言的理解技术所以可以将整体辨识率控制在85%~95%之间。 |
中英混合语言
辨识功能
(Multiple & Mixed Language Recognition) |
有 |
有 |
|
插话功能
(Keyword Barge-in) |
有 |
有 |
|
HMM-based
之中文连续语音辨识
( Continuous Speech) |
有 |
有 |
|
非特定语者语音技术
(Speaker independent) |
有 |
有 |
使用者可直接使用,无须在使用前输入语音做训练。 |
阶层式流程扁平
化成为单层 |
有 |
有 |
|
具备在阶层式流程架构中的某一节点中跳到另一节点(Jump) |
有 |
有 |
|