Aibelive HPLE 技術與其他語音辨識國際大廠
技術比較表 |
Features
and Benefits |
世界大廠一般
語音辨識技術 |
Aibelive HPLE
AI 技術 |
說明 |
獨家人工智慧技術比較 |
NLP應用技術 |
Grammar rule |
HPLE |
HPLE的NLU技術
(Natural Language Understanding)
CCSR–建構式概念表述系統
SNg –概念邏輯推理與演譯
Speech Recognition-語音辨識
Dialog Engine–語音互動引擎 |
NLU-
支援自然語言解析
(parsing) 能力 |
無 |
有 |
Aibelive的系統有完整定義
(well define) 的知識表述系統(knowledge representation system ),所以能提供NLU的功能,也可真正提供中文的語意理解。 |
NLU-
支援自然語言
模糊推理功能 |
無 |
有 |
可以透過分析語者陳述的內容,分析詞彙概念及語意上的特徵,藉以抽取出語者的意圖並對應到知識表述系統(knowledge representation system )內的目的(target)。 |
支援自然語言
相關概念推理功能 |
無 |
有 |
HPLE 能以概念推理方式自動找出語者可能的意圖。譬如:語者只說出部分需求“我要查一下帳戶”,系統會自動找出”支票存款帳戶”、”定期存款帳戶”、“活期存款帳戶”、“台幣帳戶服務”等。 |
支援自然語言
語音辨識雜訊清除能力,( NLP base noise filter ability ) |
無 |
有 |
HPLE 可以分析區隔出語者陳述內容的概念空間,並透過此方式濾除錯誤的語音辨識結果。也將以往語音辨識廠商,對於中文複雜無固定句型的理解障礙完全克服。 |
支援語者說錯資訊的容錯功能 |
無 |
有 |
以HPLE可以分析語者陳述內容的相關概念空間,若語者說錯某些資訊時,只要程度上不至於影響整體內容時,可以就有限的正確資訊找出相關的訊息。 |
口音調整的辨識技術及抗雜訊語音技術功能 (Noise & Accent Tolerance) |
部分有 |
有 |
具備口音調整功能。較先進之語音辨識均提供口音調整的辨識技術及抗雜訊語音技術功能 |
NLP-
支援語音斷詞能力
(Term Segmentation) |
有
(Grammar base - keyword spotting) |
有
(NLU base) |
HPLE為NLU base,透過自然語言理解技術解析語音內含各種可能的詞彙,透過斷詞能找出語音內含的詞彙語意,而HPLE的NLP base的斷詞分析則可將連續音內涵的辭彙斷出來再做分析,而非只是關鍵字。 |
語音辨識 - 標準功能比較 |
Features
and Benefits |
世界大廠目前
語音辨識技術 |
Aibelive HPLE
AI 技術 |
說明 |
Voice Command
辨識 |
有
(Grammar Base) |
有
(NLU Base) |
Grammar rule base:根據語者的陳述內容預先定義可能的講法(rule:one voice one command)。
NLU base :根據欲提供之服務內容建立一專業知識庫,此知識庫中定義出知識表述系統(knowledge representation system)。透過此方式來對應Command。 |
Natural Speech
(free-type) 辨識 |
有
(keyword spotting) |
有
(Understanding) |
世界大廠一般皆採用人工建置grammar的方式來達成,但是由於語言的說法非常多樣,無法以預先定義的grammar規範完整,再加上定義許多grammar後會產生干擾造成辨識的錯誤。 |
語音指令
Voice Command
辨識率
(accuracy measurement) |
92%~95% |
92%~95% |
世界大廠採用grammar base的語音辨識引擎,對於短語音及固定講法的辨識每家公司的辨識率都差不多。這裡定義的辨識率是以固定的語音辨識內容以及固定的講法而言,對於一般語者若多說出一些字或說的比較自然的方式(free-style)都不在此辨識範圍內。 |
Natural speaking
辨識率
(accuracy measurement ) |
無法達成 |
85%~95% |
HPLE採取的是NLU的方式針對語者說出的內容進行理解,而不是只有單純的關鍵字辨識。所以透過此技術可以將整體的服務品質大幅度的提升,也突破全球在中文語音辨識上自然口語辨識的技術瓶頸。 |
整體辨識率
(使用voice command的比例*voice command + natural speaking ) |
無法達成 |
85%~95% |
對於實際上線服務而言,可能有50%的語者使用natural speaking方式而另外50%的語者使用簡單的voice command的方式來說出需求,這時候其他世界大廠的語音辨識便無法控制其辨識率(辨識率可能下降到低於50%),而HPLE技術因為提供自然語言的理解技術所以可以將整體辨識率控制在 85%~95%之間。 |
中英混合語言
辨識功能
(Multiple & Mixed Language Recognition) |
有 |
有 |
|
插話功能
(Keyword Barge-in) |
有 |
有 |
|
HMM-based
之中文連續語音辨識
( Continuous Speech) |
有 |
有 |
|
非特定語者語音技術
(Speaker independent) |
有 |
有 |
使用者可直接使用,無須在使用前輸入語音做訓練。 |
階層式流程扁平
化成為單層 |
有 |
有 |
|
具備在階層式流程架構中的某一節點中跳到另一節點(Jump) |
有 |
有 |
|