JP2019535044A - ハイブリッド音声認識複合性能自動評価システム - Google Patents
ハイブリッド音声認識複合性能自動評価システム Download PDFInfo
- Publication number
- JP2019535044A JP2019535044A JP2019541061A JP2019541061A JP2019535044A JP 2019535044 A JP2019535044 A JP 2019535044A JP 2019541061 A JP2019541061 A JP 2019541061A JP 2019541061 A JP2019541061 A JP 2019541061A JP 2019535044 A JP2019535044 A JP 2019535044A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- result
- speech recognition
- recognition
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 120
- 238000012795 verification Methods 0.000 claims abstract description 37
- 239000002131 composite material Substances 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000012360 testing method Methods 0.000 claims description 15
- 238000004891 communication Methods 0.000 claims description 12
- 238000003058 natural language processing Methods 0.000 claims description 10
- 238000012790 confirmation Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 230000007704 transition Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 150000001875 compounds Chemical class 0.000 claims 1
- 230000006870 function Effects 0.000 abstract description 15
- 238000000034 method Methods 0.000 description 24
- 238000005516 engineering process Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000008901 benefit Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 238000004378 air conditioning Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 238000010998 test method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000011511 automated evaluation Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephonic Communication Services (AREA)
- Navigation (AREA)
Abstract
Description
自然語処理モジュールを含んでなり、前記自然語処理モジュールによって処理された音声認識結果テキストから使用者の命令対象値を抽出するための端末言語理解部(140)、
前記抽出された使用者の命令対象値に基づいて予め入力された単語又は文章に近接した結果を命令語と認識し、認識結果値を抽出するための端末音声認識エンジン部(130)、
前記端末言語理解部から提供された音声認識結果テキストから抽出された命令対象値、端末音声認識エンジン部から提供された予め入力された単語又は文章に近接した結果を命令語と認識して抽出された認識結果値、クラウドサーバーのサーバー言語理解部から提供された使用者の抽出された命令対象値、及びクラウドサーバーのサーバー音声認識エンジン部から提供された音声認識結果値を比較していずれか一つの認識結果値を駆動命令値と指定してハイブリッド音声認識ミドルウェア部に提供するための結果調停部(150)、
前記結果調停部によって提供された駆動命令値をログ部(400)に記憶させるためのハイブリッド音声認識ミドルウェア部(120)、
前記駆動命令値を記憶しているログ部(400)、及び
音声認識評価自動化装置(300)と連結され、前記ログ部に記憶されたログ情報を提供するためのインターフェース部(110)を含んでなるハイブリッド端末機(100)と、
前記ハイブリッド端末機(100)から伝送された音声を獲得して使用者の命令対象値を抽出するためのサーバー言語理解部(220)、及び
使用者の命令対象値に基づいて音声認識結果値を抽出するためのサーバー音声認識エンジン部(210)を含んでなるクラウドサーバー(200)と、
音声ボタンを押す場合、音声認識駆動命令を自動化制御部に提供するためのウェイクアップ自動制御部(370)、
前記音声認識駆動命令値を獲得する場合、ハイブリッド端末機のインターフェース部から提供されたログ情報をログ分析部に提供するための自動化制御部(310)、
前記ログ情報に基づいて分析された音声認識開始時点と終了時点の情報を用いて音声認識を開始するか終了するためのログ分析部(320)、
前記ログ情報に基づいてハイブリッド端末機の音声認識結果テキストから抽出された命令対象値、予め入力された単語又は文章に近接した結果を命令語と認識して抽出された認識結果値、クラウドサーバーの抽出された命令対象値、音声認識結果値及び結果調停部によって指定された駆動命令値を分析して評価結果を算出するための統合結果分析部(330)、
端末機の画面に使用者の音声命令と一致する結果値が出力されるかを分析し、使用者の音声命令にマッチする音声確認案内コメントが出力されるかを分析するための整合性結果分析部(340)、
メモリに記憶されたカメラ映像とCAN通信情報を参照して音声認識が行われるとき、周辺環境情報を記録するための音声認識評価環境記録部(350)、及び
前記統合結果分析部によって算出された評価結果、前記整合性結果分析部によって分析された整合性検証結果、前記音声認識評価環境記録部によって記録された周辺環境情報を同時に出力するための結果出力部(360)を含んでなる音声認識評価自動化装置(300)とを含む。
自然語処理モジュールを含んでなり、前記自然語処理モジュールによって処理された音声認識結果テキストから使用者の命令対象値を抽出するための端末言語理解部140、
前記抽出された使用者の命令対象値に基づいて予め入力された単語又は文章に近接した結果を命令語と認識し、認識結果値を抽出するための端末音声認識エンジン部130、
前記端末言語理解部から提供された音声認識結果テキストから抽出された命令対象値、端末音声認識エンジン部から提供された予め入力された単語又は文章に近接した結果を命令語と認識して抽出された認識結果値、クラウドサーバーのサーバー言語理解部から提供された使用者の抽出された命令対象値、及びクラウドサーバーのサーバー音声認識エンジン部から提供された音声認識結果値を比較していずれか一つの認識結果値を駆動命令値と指定してハイブリッド音声認識ミドルウェア部に提供するための結果調停部150、
前記結果調停部によって提供された駆動命令値をログ部400に記憶させるためのハイブリッド音声認識ミドルウェア部120、
前記駆動命令値を記憶しているログ部400、及び
音声認識評価自動化装置300と連結され、前記ログ部に記憶されたログ情報を提供するためのインターフェース部110を含んでなるハイブリッド端末機100と、
前記ハイブリッド端末機から伝送された音声を獲得して使用者の命令対象値を抽出するためのサーバー言語理解部220、及び
使用者の命令対象値に基づいて音声認識結果値を抽出するためのサーバー音声認識エンジン部210を含んでなるクラウドサーバー200と、
音声ボタンを押す場合、音声認識駆動命令を自動化制御部に提供するためのウェイクアップ自動制御部370、
前記音声認識駆動命令値を獲得する場合、ハイブリッド端末機のインターフェース部から提供されたログ情報をログ分析部に提供するための自動化制御部310、
前記ログ情報に基づいて分析された音声認識開始時点と終了時点の情報を用いて音声認識を開始するか終了するためのログ分析部320、
前記ログ情報に基づいてハイブリッド端末機の音声認識結果テキストから抽出された命令対象値、予め入力された単語又は文章に近接した結果を命令語と認識して抽出された認識結果値、クラウドサーバーの抽出された命令対象値、音声認識結果値及び結果調停部によって指定された駆動命令値を分析して評価結果を算出するための統合結果分析部330、
端末機の画面に使用者の音声命令と一致する結果値が出力されるかを分析し、使用者の音声命令にマッチする音声確認案内コメントが出力されるかを分析するための整合性結果分析部340、
メモリに記憶されたカメラ映像とCAN通信情報を参照して音声認識が行われるとき、周辺環境情報を記録するための音声認識評価環境記録部350、及び
前記統合結果分析部によって算出された評価結果、前記整合性結果分析部によって分析された整合性検証結果、前記音声認識評価環境記録部によって記録された周辺環境情報を同時に出力するための結果出力部360を含んでなる音声認識評価自動化装置300と、を含む。
Claims (5)
- ハイブリッド音声認識複合性能自動評価システムであって、
自然語処理モジュールを含んでなり、前記自然語処理モジュールによって処理された音声認識結果テキストから使用者の命令対象値を抽出するための端末言語理解部(140)、
前記抽出された使用者の命令対象値に基づいて予め入力された単語又は文章に近接した結果を命令語と認識し、認識結果値を抽出するための端末音声認識エンジン部(130)、
前記端末言語理解部(140)から提供された音声認識結果テキストから抽出された命令対象値、端末音声認識エンジン部から提供された予め入力された単語又は文章に近接した結果を命令語と認識して抽出された認識結果値、クラウドサーバー(200)のサーバー言語理解部から提供された使用者の抽出された命令対象値、及びクラウドサーバー(200)のサーバー音声認識エンジン部から提供された音声認識結果値を比較していずれか一つの認識結果値を駆動命令値と指定してハイブリッド音声認識ミドルウェア部(120)に提供するための結果調停部(150)、
前記結果調停部(150)によって提供された駆動命令値をログ部(400)に記憶させるためのハイブリッド音声認識ミドルウェア部(120)、
前記駆動命令値を記憶しているログ部(400)、及び
音声認識評価自動化装置(300)と連結され、前記ログ部(400)に記憶されたログ情報を音声認識評価自動化装置(300)に提供するためのインターフェース部(110)を含んでなるハイブリッド端末機(100)と、
前記ハイブリッド端末機(100)から伝送された音声を獲得して使用者の命令対象値を抽出するためのサーバー言語理解部(220)、及び
使用者の命令対象値に基づいて音声認識結果値を抽出するためのサーバー音声認識エンジン部(210)を含んでなるクラウドサーバー(200)と、
音声ボタンを押す場合、音声認識駆動命令を自動化制御部(310)に提供するためのウェイクアップ自動制御部(370)、
音声認識駆動命令値を獲得する場合、ハイブリッド端末機のインターフェース部から提供されたログ情報をログ分析部に提供するための自動化制御部(310)、
前記ログ情報に基づいて分析された音声認識開始時点と終了時点の情報を用いて音声認識を開始するか終了するためのログ分析部(320)、
前記ログ情報に基づいてハイブリッド端末機の音声認識結果テキストから抽出された命令対象値、予め入力された単語又は文章に近接した結果を命令語と認識して抽出された認識結果値、クラウドサーバーの抽出された命令対象値、音声認識結果値及び結果調停部によって指定された駆動命令値を分析して評価結果を算出するための統合結果分析部(330)、
端末機の画面に使用者の音声命令と一致する結果値が出力されるかを分析し、使用者の音声命令にマッチする音声確認案内コメントが出力されるかを分析するための整合性結果分析部(340)、
メモリに記憶されたカメラ映像とCAN通信情報を参照して音声認識が行われるとき、周辺環境情報を記録するための音声認識評価環境記録部(350)、及び
前記統合結果分析部(330)によって算出された評価結果、前記整合性結果分析部によって分析された整合性検証結果、前記音声認識評価環境記録部によって記録された周辺環境情報を同時に出力するための結果出力部(360)を含んでなる音声認識評価自動化装置(300)と、を含む、ハイブリッド音声認識複合性能自動評価システム。 - 前記自動化制御部(310)は、
評価シナリオを記憶している評価シナリオ記憶部(316)と、
前記評価シナリオ記憶部に記憶される評価シナリオを受ける評価シナリオ入力部(311)と、
ログ分析部によって分析された音声認識開始時点と終了時点、プロンプト出力時点の情報を用いて評価シナリオの始めから音声認識自動評価を行い、音声認識開始部を動作させて自動で音声認識が行われるようにする自動評価開始部(312)と、
自動評価開始部の制御によって自動で音声認識を実行するための音声認識開始部(313)と、
音声認識実行時、テスト時間を減らすために案内プロンプトを中断させるための案内プロンプトスキップ部(314)と、
ビープ音が発生した後に録音された音声情報を出力するための認識命令語DB再生部(315)と、
評価シナリオによって評価項目が存在するかを判断し、存在しない場合、評価シナリオを終了するためのシナリオ終了判断部(317)と、を含むことを特徴とする、請求項1に記載のハイブリッド音声認識複合性能自動評価システム。 - 前記統合結果分析部(330)は、
ハイブリッド端末機の音声認識結果テキストから抽出された命令対象値、予め入力された単語又は文章に近接した結果を命令語と認識して抽出された認識結果値、クラウドサーバーの抽出された命令対象値、音声認識結果値及び結果調停部によって指定された駆動命令値の相異なるフォーマットを分析して結果フォーマットの類型を判読するための認識結果フォーマット分別部(331)と、
前記判読された結果フォーマットの類型が記録されている認識結果フォーマット分類記録部(332)と、
前記記録された結果フォーマットの類型を参照してハイブリッド端末機又はクラウドサーバーのうちどこで実行したかを判断するための認識結果類型判断部(333)と、
前記判断された結果値を参照して最終認識結果値として記録するための認識結果決定部(334)とを含んでなることを特徴とする、請求項1に記載のハイブリッド音声認識複合性能自動評価システム。 - 整合性結果分析部(340)は、
音声認識が実行された後、画面GUIの変更をカメラを介して獲得し、正解画面と比較して相違点を区分する画面出力整合性検証モジュールと、
音声認識結果、音声案内コメント出力音を正解音声と比較して整合性を判断する音声出力整合性検証モジュールとを含んでなることを特徴とする、請求項1に記載のハイブリッド音声認識複合性能自動評価システム。 - 前記ログ情報には、
音声認識開始時間情報、マイク開/閉情報、及び音声区間抽出情報の少なくとも一つ以上の自動化処理のための情報と、
音声認識結果情報、シナリオ遷移情報、及び案内プロンプト出力情報の少なくとも一つ以上の認識結果及び案内情報とを含むことを特徴とする、請求項1に記載のハイブリッド音声認識複合性能自動評価システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160131527A KR101700099B1 (ko) | 2016-10-11 | 2016-10-11 | 하이브리드 음성인식 복합 성능 자동 평가시스템 |
KR10-2016-0131527 | 2016-10-11 | ||
PCT/KR2017/009832 WO2018070668A1 (ko) | 2016-10-11 | 2017-09-07 | 하이브리드 음성인식 복합 성능 자동 평가시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019535044A true JP2019535044A (ja) | 2019-12-05 |
JP6826205B2 JP6826205B2 (ja) | 2021-02-03 |
Family
ID=57990618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019541061A Active JP6826205B2 (ja) | 2016-10-11 | 2017-09-07 | ハイブリッド音声認識複合性能自動評価システム |
Country Status (4)
Country | Link |
---|---|
US (1) | US10643605B2 (ja) |
JP (1) | JP6826205B2 (ja) |
KR (1) | KR101700099B1 (ja) |
WO (1) | WO2018070668A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022259498A1 (ja) * | 2021-06-10 | 2022-12-15 | 日本電信電話株式会社 | 学習システム、学習方法及び学習プログラム |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102017213946B4 (de) * | 2017-08-10 | 2022-11-10 | Audi Ag | Verfahren zum Aufbereiten eines Erkennungsergebnisses eines automatischen Online-Spracherkenners für ein mobiles Endgerät |
US11967318B2 (en) * | 2019-01-08 | 2024-04-23 | Samsung Electronics Co., Ltd. | Method and system for performing speech recognition in an electronic device |
KR102026479B1 (ko) * | 2019-03-06 | 2019-09-30 | 주식회사 다이얼로그디자인에이전시 | 병렬처리 플랫폼 기반 인공지능 음성인식 서비스 제공 시스템 |
CN111696523B (zh) * | 2019-03-12 | 2024-03-01 | 大众问问(北京)信息科技有限公司 | 一种语音识别引擎的准确度测试方法、装置、电子设备 |
US11462216B2 (en) * | 2019-03-28 | 2022-10-04 | Cerence Operating Company | Hybrid arbitration system |
CN110211567A (zh) * | 2019-05-13 | 2019-09-06 | 中国信息通信研究院 | 语音识别终端测评系统及方法 |
KR102228549B1 (ko) * | 2019-06-11 | 2021-03-16 | 엘지전자 주식회사 | 음성 인에이블 디바이스 선택 방법, 음성 인에이블 디바이스 선택 장치 및 이를 제어하는 지능형 컴퓨팅 디바이스 |
CN110417589B (zh) * | 2019-07-23 | 2022-11-29 | 徐州工程学院 | 一种车载语音云用户体验质量路测方法 |
CN110781279B (zh) * | 2019-10-16 | 2022-04-01 | 云知声智能科技股份有限公司 | 一种构造asr/nlu引擎交叉优化数据闭环的方法及装置 |
CN110675876A (zh) * | 2019-10-17 | 2020-01-10 | 珠海格力电器股份有限公司 | 一种语义识别智能控制方法、智能控制器、系统及存储介质 |
CN111179907A (zh) * | 2019-12-31 | 2020-05-19 | 深圳Tcl新技术有限公司 | 语音识别测试方法、装置、设备及计算机可读存储介质 |
CN111782543A (zh) * | 2020-07-20 | 2020-10-16 | 王天宝 | 一种在云端进行的评测方法、相关设备及系统 |
CN114079695A (zh) * | 2020-08-18 | 2022-02-22 | 北京有限元科技有限公司 | 记录语音通话内容的方法、装置以及存储介质 |
CN112435671B (zh) * | 2020-11-11 | 2021-06-29 | 深圳市小顺智控科技有限公司 | 汉语精准识别的智能化语音控制方法及系统 |
CN114363835A (zh) * | 2021-12-16 | 2022-04-15 | 四川腾盾科技有限公司 | 一种基于无人机数据链声码化话音的自动ptt方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59162598A (ja) * | 1983-03-08 | 1984-09-13 | 日本電気株式会社 | 音声認識装置認識率検査方式 |
JPH05323992A (ja) * | 1992-05-20 | 1993-12-07 | Mitsui Petrochem Ind Ltd | 音声認識装置用検査教習システム |
JP2013064777A (ja) * | 2011-09-15 | 2013-04-11 | Ntt Docomo Inc | 端末装置、音声認識プログラム、音声認識方法および音声認識システム |
JP2013232001A (ja) * | 2008-08-29 | 2013-11-14 | Multimodal Technologies Inc | ハイブリッド型音声認識 |
JP2014062944A (ja) * | 2012-09-20 | 2014-04-10 | Sharp Corp | 情報処理装置 |
US20140278439A1 (en) * | 2013-03-14 | 2014-09-18 | Accenture Global Services Limited | Voice based automation testing for hands free module |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6964023B2 (en) * | 2001-02-05 | 2005-11-08 | International Business Machines Corporation | System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input |
KR20090013876A (ko) | 2007-08-03 | 2009-02-06 | 한국전자통신연구원 | 음소를 이용한 분산형 음성 인식 방법 및 장치 |
JP5916054B2 (ja) * | 2011-06-22 | 2016-05-11 | クラリオン株式会社 | 音声データ中継装置、端末装置、音声データ中継方法、および音声認識システム |
KR20130029635A (ko) | 2011-09-15 | 2013-03-25 | 현대모비스 주식회사 | 음성인식 성능 평가 모듈 및 그 방법 |
US20130151817A1 (en) * | 2011-12-09 | 2013-06-13 | Nokia Corporation | Method, apparatus, and computer program product for parallel functional units in multicore processors |
US8819345B2 (en) * | 2012-02-17 | 2014-08-26 | Nokia Corporation | Method, apparatus, and computer program product for inter-core communication in multi-core processors |
WO2014129033A1 (ja) * | 2013-02-25 | 2014-08-28 | 三菱電機株式会社 | 音声認識システムおよび音声認識装置 |
KR102225404B1 (ko) | 2014-05-23 | 2021-03-09 | 삼성전자주식회사 | 디바이스 정보를 이용하는 음성인식 방법 및 장치 |
-
2016
- 2016-10-11 KR KR1020160131527A patent/KR101700099B1/ko active IP Right Grant
-
2017
- 2017-09-07 WO PCT/KR2017/009832 patent/WO2018070668A1/ko active Application Filing
- 2017-09-07 US US15/757,751 patent/US10643605B2/en active Active
- 2017-09-07 JP JP2019541061A patent/JP6826205B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59162598A (ja) * | 1983-03-08 | 1984-09-13 | 日本電気株式会社 | 音声認識装置認識率検査方式 |
JPH05323992A (ja) * | 1992-05-20 | 1993-12-07 | Mitsui Petrochem Ind Ltd | 音声認識装置用検査教習システム |
JP2013232001A (ja) * | 2008-08-29 | 2013-11-14 | Multimodal Technologies Inc | ハイブリッド型音声認識 |
JP2013064777A (ja) * | 2011-09-15 | 2013-04-11 | Ntt Docomo Inc | 端末装置、音声認識プログラム、音声認識方法および音声認識システム |
JP2014062944A (ja) * | 2012-09-20 | 2014-04-10 | Sharp Corp | 情報処理装置 |
US20140278439A1 (en) * | 2013-03-14 | 2014-09-18 | Accenture Global Services Limited | Voice based automation testing for hands free module |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022259498A1 (ja) * | 2021-06-10 | 2022-12-15 | 日本電信電話株式会社 | 学習システム、学習方法及び学習プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2018070668A1 (ko) | 2018-04-19 |
US20180342236A1 (en) | 2018-11-29 |
JP6826205B2 (ja) | 2021-02-03 |
US10643605B2 (en) | 2020-05-05 |
KR101700099B1 (ko) | 2017-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2019535044A (ja) | ハイブリッド音声認識複合性能自動評価システム | |
US11276407B2 (en) | Metadata-based diarization of teleconferences | |
US10929514B2 (en) | User registration method and device for smart robots | |
WO2021128741A1 (zh) | 语音情绪波动分析方法、装置、计算机设备及存储介质 | |
US11545139B2 (en) | System and method for determining the compliance of agent scripts | |
CN111164676A (zh) | 经由环境语境采集进行的语音模型个性化 | |
CN110047481B (zh) | 用于语音识别的方法和装置 | |
CN110136749A (zh) | 说话人相关的端到端语音端点检测方法和装置 | |
CN105070290A (zh) | 人机语音交互方法及系统 | |
US11133002B2 (en) | Systems and methods of real-time vehicle-based analytics and uses thereof | |
US20160275968A1 (en) | Speech detection device, speech detection method, and medium | |
KR20180052347A (ko) | 음성 인식 장치 및 방법 | |
CN109712610A (zh) | 用于识别语音的方法和装置 | |
DE112018007847B4 (de) | Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm | |
CN116324984A (zh) | 用于生成音频信号的元数据的系统和方法 | |
CN105575402A (zh) | 网络教学实时语音分析方法 | |
CN113779208A (zh) | 用于人机对话的方法和装置 | |
KR102020773B1 (ko) | 음성합성엔진을 이용한 멀티미디어 음성인식 자동 평가시스템 | |
CN107680592A (zh) | 一种移动终端语音识别方法、及移动终端及存储介质 | |
US20180366127A1 (en) | Speaker recognition based on discriminant analysis | |
CN115547345A (zh) | 声纹识别模型训练及相关识别方法、电子设备和存储介质 | |
US11710476B2 (en) | System and method for automatic testing of conversational assistance | |
US11741989B2 (en) | Non-verbal utterance detection apparatus, non-verbal utterance detection method, and program | |
CN112861816A (zh) | 异常行为检测方法及装置 | |
CN114077840A (zh) | 语音对话系统的优化方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190410 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200424 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200526 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200820 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6826205 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |