JP2019211689A - 認識装置、認識システム、端末装置、サーバ装置、方法及びプログラム - Google Patents
認識装置、認識システム、端末装置、サーバ装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2019211689A JP2019211689A JP2018109442A JP2018109442A JP2019211689A JP 2019211689 A JP2019211689 A JP 2019211689A JP 2018109442 A JP2018109442 A JP 2018109442A JP 2018109442 A JP2018109442 A JP 2018109442A JP 2019211689 A JP2019211689 A JP 2019211689A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- data set
- data
- model
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 158
- 230000008569 process Effects 0.000 claims abstract description 147
- 238000012545 processing Methods 0.000 claims abstract description 89
- 238000000605 extraction Methods 0.000 claims abstract description 23
- 238000004364 calculation method Methods 0.000 claims description 18
- 239000000284 extract Substances 0.000 abstract description 5
- 238000012790 confirmation Methods 0.000 description 25
- 238000013210 evaluation model Methods 0.000 description 15
- 238000011156 evaluation Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 238000012353 t test Methods 0.000 description 6
- 238000000692 Student's t-test Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000009193 crawling Effects 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/083—Recognition networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
本実施形態に係る認識装置は、音声認識モデルを用いて音声データを認識し、当該音声データをテキストに変換する処理(音声認識処理)を実行するために用いられる音声認識装置を含む。以下、本実施形態に係る認識装置は音声認識装置であるものとして説明する。
Claims (15)
- 予め定められた条件で収集された第1認識対象データ及び当該第1認識対象データから認識されるべき第1正解データを含む第1データセットに基づいて作成された第1認識モデル、当該第1データセット及び当該条件を表すタグを、当該第1認識モデル毎に対応づけて格納する格納手段と、
第2認識対象データ及び当該第2認識対象データから認識されるべき第2正解データを含む第2データセットを取得する取得手段と、
前記格納手段に格納されている第1認識モデルの各々を用いて前記第2データセットに含まれる第2認識対象データに対する認識処理を実行する認識処理手段と、
前記認識処理結果及び前記第2データセットに含まれる第2正解データに基づいて、前記認識処理に用いられた第1認識モデルに対応づけて前記格納手段に格納されているタグの中から有意なタグを抽出する抽出手段と、
前記取得された第2データセット及び前記抽出されたタグに対応づけて前記格納手段に格納されている第1データセットに基づいて第2認識モデルを作成するモデル作成手段と
を具備する認識装置。 - 前記第1データセットに含まれる第1認識対象データは、第1音声データを含み、
前記第1データセットに含まれる第1正解データは、前記第1音声データから書き起こされた第1テキストを含み、
前記第2データセットに含まれる第2認識対象データは、第2音声データを含み、
前記第2データセットに含まれる第2正解データは、前記第2音声データから書き起こされた第2テキストを含み、
前記認識処理は、音声データから音声を認識し、当該音声をテキストに変換する処理を含む
請求項1記載の認識装置。 - 第3音声データを入力する入力手段を更に具備し、
前記認識処理手段は、前記作成された第2認識モデルを用いて前記第3音声データを第3テキストに変換する
請求項2記載の認識装置。 - 前記抽出手段は、前記第1認識モデルを用いた前記第2音声データに対する認識処理結果及び前記第2テキストを比較することによって前記第1認識モデルの認識精度を算出し、前記算出された第1認識モデルの認識精度を用いて統計量の算出を行い、当該第1認識モデルに対応づけて前記格納手段に格納されているタグの中から当該認識精度が有意に高いタグを抽出する請求項2記載の認識装置。
- 前記抽出されたタグを表示する表示処理手段を更に具備し、
前記モデル作成手段は、前記取得された第2データセット及び前記表示されたタグのうちユーザによって指定されたタグに対応づけて前記格納手段に格納されている第1データセットに基づいて第2認識モデルを作成する
請求項2記載の認識装置。 - 前記表示処理手段は、前記抽出されたタグに関連するタグを更に表示する請求項5記載の認識装置。
- 算出手段及び表示処理手段を更に具備し、
前記認識処理手段は、前記作成された第2認識モデルを用いて前記第2データセットに含まれる第2音声データに対する認識処理を実行し、
前記算出手段は、前記作成された第2認識モデルを用いた前記第2音声データに対する認識処理結果及び前記第2テキストを比較することによって前記第2認識モデルの認識精度を算出し、
前記表示処理手段は、前記算出された第2認識モデルの認識精度を表示する
請求項2記載の認識装置。 - 前記モデル作成手段は、前記第2データセットに基づいて第3認識モデルを作成し、
前記認識処理手段は、前記作成された第3認識モデルを用いて前記第2データセットに含まれる第2音声データに対する認識処理を実行し、
前記算出手段は、前記作成された第3認識モデルを用いた前記第2音声データに対する認識処理結果及び前記第2データセットに含まれる第2テキストを比較することによって前記第3認識モデルの認識精度を算出し、
前記表示処理手段は、前記第2認識モデルの認識精度及び前記第3認識モデルの認識精度を表示する
請求項7記載の認識装置。 - 前記取得された第2データセット及び前記抽出されたタグに対応づけて前記格納手段に格納されている第1データセットのデータ量が十分であるか否かを判定する判定手段と、
前記第2データセット及び前記第1データセットのデータ量が十分でないと判定された場合、前記第2データセットに基づいて第3データセットを生成する生成手段と
を更に具備し、
前記モデル作成手段は、前記取得された第2データセット、前記抽出されたタグに対応づけて前記格納手段に格納されている第1データセット及び前記生成された第3データセットに基づいて第2認識モデルを作成する
請求項2記載の認識装置。 - 前記生成手段は、前記第2データセットに含まれる第2テキストから抽出されたキーワードに基づいて取得された第3テキストから第3音声データを生成することによって、当該第3音声データ及び第3テキストを含む第3データセットを生成する請求項9記載の認識装置。
- 端末装置と当該端末装置と通信可能に接続されるサーバ装置とを備える認識システムにおいて、
予め定められた条件で収集された第1認識対象データ及び当該第1認識対象データから認識されるべき第1正解データを含む第1データセットに基づいて作成された第1認識モデル、当該第1データセット及び当該条件を表すタグを、当該第1認識モデル毎に対応づけて格納する格納手段と、
第2認識対象データ及び当該第2認識対象データから認識されるべき第2正解データを含む第2データセットを取得する取得手段と、
前記格納手段に格納されている第1認識モデルの各々を用いて前記第2データセットに含まれる第2認識対象データに対する認識処理を実行する認識処理手段と、
前記認識処理結果及び前記第2データセットに含まれる第2正解データに基づいて、前記認識処理に用いられた第1認識モデルに対応づけて前記格納手段に格納されているタグの中から有意なタグを抽出する抽出手段と、
前記取得された第2データセット及び前記抽出されたタグに対応づけて前記格納手段に格納されている第1データセットに基づいて第2認識モデルを作成するモデル作成手段と
を具備する認識システム。 - 予め定められた条件で収集された第1認識対象データ及び当該第1認識対象データから認識されるべき第1正解データを含む第1データセットに基づいて作成された第1認識モデル、当該第1データセット及び当該条件を表すタグを、当該第1認識モデル毎に対応づけて格納する格納手段を備えるサーバ装置と通信可能に接続される端末装置において、
取得手段及び表示処理手段を具備し、
前記取得手段は、第2認識対象データ及び当該第2認識対象データから認識される第2正解データを含む第2データセットを取得し、
前記サーバ装置は、
前記格納手段に格納されている第1認識モデルの各々を用いて前記第2データセットに含まれる第2認識対象データに対する認識処理を実行する認識処理手段と、
前記認識処理結果及び前記第2データセットに含まれる第2正解データに基づいて、前記認識処理に用いられた第1認識モデルに対応づけて前記格納手段に格納されているタグの中から有意なタグを抽出する抽出手段と、
前記取得された第2データセット及び前記抽出されたタグに対応づけて前記格納手段に格納されている第1データセットに基づいて第2認識モデルを作成するモデル作成手段と
を含み、
前記表示処理手段は、前記作成された第2認識モデルの登録をユーザに指示させるための画面を表示する
端末装置。 - 端末装置と通信可能に接続されるサーバ装置において、
予め定められた条件で収集された第1認識対象データ及び当該第1認識対象データから認識されるべき第1正解データを含む第1データセットに基づいて作成された第1認識モデル、当該第1データセット及び当該条件を表すタグを、当該第1認識モデル毎に対応づけて格納する格納手段と、
第2認識対象データ及び当該第2認識対象データから認識される第2正解データを含む第2データセットを前記端末装置から取得する取得手段と、
前記格納手段に格納されている第1認識モデルの各々を用いて前記第2データセットに含まれる第2認識対象データに対する認識処理を実行する認識処理手段と、
前記認識処理結果及び前記第2データセットに含まれる第2正解データに基づいて、前記認識処理に用いられた第1認識モデルに対応づけて前記格納手段に格納されているタグの中から有意なタグを抽出する抽出手段と、
前記取得された第2データセット及び前記抽出されたタグに対応づけて前記格納手段に格納されている第1データセットに基づいて第2認識モデルを作成するモデル作成手段と、
前記作成された第2認識モデルの登録をユーザに指示させるための画面を前記端末装置に表示する表示処理手段と
を具備するサーバ装置。 - 予め定められた条件で収集された第1認識対象データ及び当該第1認識対象データから認識されるべき第1正解データを含む第1データセットに基づいて作成された第1認識モデル、当該第1データセット及び当該条件を表すタグを、当該第1認識モデル毎に対応づけて格納する格納手段を備える認識装置が実行する方法であって、
第2認識対象データ及び当該第2認識対象データから認識されるべき第2正解データを含む第2データセットを取得するステップと、
前記格納手段に格納されている第1認識モデルの各々を用いて前記第2データセットに含まれる第2認識対象データに対する認識処理を実行するステップと、
前記認識処理結果及び前記第2データセットに含まれる第2正解データに基づいて、前記認識処理に用いられた第1認識モデルに対応づけて前記格納手段に格納されているタグの中から有意なタグを抽出するステップと、
前記取得された第2データセット及び前記抽出されたタグに対応づけて前記格納手段に格納されている第1データセットに基づいて第2認識モデルを作成するステップと
を具備する方法。 - 予め定められた条件で収集された第1認識対象データ及び当該第1認識対象データから認識されるべき第1正解データを含む第1データセットに基づいて作成された第1認識モデル、当該第1データセット及び当該条件を表すタグを、当該第1認識モデル毎に対応づけて格納する格納手段を備える認識装置のコンピュータによって実行されるプログラムであって、
前記コンピュータに、
第2認識対象データ及び当該第2認識対象データから認識されるべき第2正解データを含む第2データセットを取得するステップと、
前記格納手段に格納されている第1認識モデルの各々を用いて前記第2データセットに含まれる第2認識対象データに対する認識処理を実行するステップと、
前記認識処理結果及び前記第2データセットに含まれる第2正解データに基づいて、前記認識処理に用いられた第1認識モデルに対応づけて前記格納手段に格納されているタグの中から有意なタグを抽出するステップと、
前記取得された第2データセット及び前記抽出されたタグに対応づけて前記格納手段に格納されている第1データセットに基づいて第2認識モデルを作成するステップと
を実行させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018109442A JP6910987B2 (ja) | 2018-06-07 | 2018-06-07 | 認識装置、認識システム、端末装置、サーバ装置、方法及びプログラム |
US16/429,911 US11600262B2 (en) | 2018-06-07 | 2019-06-03 | Recognition device, method and storage medium |
CN201910490584.8A CN110580905B (zh) | 2018-06-07 | 2019-06-06 | 识别装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018109442A JP6910987B2 (ja) | 2018-06-07 | 2018-06-07 | 認識装置、認識システム、端末装置、サーバ装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019211689A true JP2019211689A (ja) | 2019-12-12 |
JP6910987B2 JP6910987B2 (ja) | 2021-07-28 |
Family
ID=68764244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018109442A Active JP6910987B2 (ja) | 2018-06-07 | 2018-06-07 | 認識装置、認識システム、端末装置、サーバ装置、方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11600262B2 (ja) |
JP (1) | JP6910987B2 (ja) |
CN (1) | CN110580905B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022020062A (ja) * | 2020-11-23 | 2022-01-31 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 特徴情報のマイニング方法、装置及び電子機器 |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7689416B1 (en) * | 1999-09-29 | 2010-03-30 | Poirier Darrell A | System for transferring personalize matter from one computer to another |
US6941264B2 (en) * | 2001-08-16 | 2005-09-06 | Sony Electronics Inc. | Retraining and updating speech models for speech recognition |
US8055503B2 (en) * | 2002-10-18 | 2011-11-08 | Siemens Enterprise Communications, Inc. | Methods and apparatus for audio data analysis and data mining using speech recognition |
WO2004047076A1 (ja) * | 2002-11-21 | 2004-06-03 | Matsushita Electric Industrial Co., Ltd. | 標準モデル作成装置及び標準モデル作成方法 |
CN101432801B (zh) * | 2006-02-23 | 2012-04-18 | 日本电气株式会社 | 语音识别词典制作支持系统、语音识别词典制作支持方法 |
WO2008033439A2 (en) * | 2006-09-13 | 2008-03-20 | Aurilab, Llc | Robust pattern recognition system and method using socratic agents |
JP5530729B2 (ja) * | 2009-01-23 | 2014-06-25 | 本田技研工業株式会社 | 音声理解装置 |
US10224036B2 (en) * | 2010-10-05 | 2019-03-05 | Infraware, Inc. | Automated identification of verbal records using boosted classifiers to improve a textual transcript |
JP5916054B2 (ja) * | 2011-06-22 | 2016-05-11 | クラリオン株式会社 | 音声データ中継装置、端末装置、音声データ中継方法、および音声認識システム |
US9601107B2 (en) * | 2011-08-19 | 2017-03-21 | Asahi Kasei Kabushiki Kaisha | Speech recognition system, recognition dictionary registration system, and acoustic model identifier series generation apparatus |
JP2013064951A (ja) * | 2011-09-20 | 2013-04-11 | Toyota Motor Corp | 音響モデル適応装置、その適応方法及びプログラム |
US8793136B2 (en) * | 2012-02-17 | 2014-07-29 | Lg Electronics Inc. | Method and apparatus for smart voice recognition |
US20130346066A1 (en) * | 2012-06-20 | 2013-12-26 | Microsoft Corporation | Joint Decoding of Words and Tags for Conversational Understanding |
US9697827B1 (en) * | 2012-12-11 | 2017-07-04 | Amazon Technologies, Inc. | Error reduction in speech processing |
US9495955B1 (en) * | 2013-01-02 | 2016-11-15 | Amazon Technologies, Inc. | Acoustic model training |
US9514741B2 (en) * | 2013-03-13 | 2016-12-06 | Nuance Communications, Inc. | Data shredding for speech recognition acoustic model training under data retention restrictions |
US9514740B2 (en) * | 2013-03-13 | 2016-12-06 | Nuance Communications, Inc. | Data shredding for speech recognition language model training under data retention restrictions |
JP6216560B2 (ja) | 2013-07-25 | 2017-10-18 | 株式会社Nttドコモ | 通信端末、プログラム |
JP6284462B2 (ja) * | 2014-09-22 | 2018-02-28 | 株式会社日立製作所 | 音声認識方法、及び音声認識装置 |
JP6320963B2 (ja) | 2015-03-25 | 2018-05-09 | 日本電信電話株式会社 | 音声認識システム、クライアント装置、音声認識方法、プログラム |
US10255907B2 (en) * | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US9786270B2 (en) * | 2015-07-09 | 2017-10-10 | Google Inc. | Generating acoustic models |
CN107578769B (zh) * | 2016-07-04 | 2021-03-23 | 科大讯飞股份有限公司 | 语音数据标注方法和装置 |
US10403268B2 (en) * | 2016-09-08 | 2019-09-03 | Intel IP Corporation | Method and system of automatic speech recognition using posterior confidence scores |
KR102384641B1 (ko) * | 2017-02-20 | 2022-04-08 | 엘지전자 주식회사 | 다국어 처리를 수행하는 인공 지능 시스템의 제어 방법 |
US10354642B2 (en) * | 2017-03-03 | 2019-07-16 | Microsoft Technology Licensing, Llc | Hyperarticulation detection in repetitive voice queries using pairwise comparison for improved speech recognition |
US10706843B1 (en) * | 2017-03-09 | 2020-07-07 | Amazon Technologies, Inc. | Contact resolution for communications systems |
US10497370B2 (en) * | 2017-08-18 | 2019-12-03 | 2236008 Ontario Inc. | Recognition module affinity |
KR102428148B1 (ko) * | 2017-08-31 | 2022-08-02 | 삼성전자주식회사 | 가전 기기의 음성 인식을 위한 시스템과 서버, 방법 |
US10672388B2 (en) * | 2017-12-15 | 2020-06-02 | Mitsubishi Electric Research Laboratories, Inc. | Method and apparatus for open-vocabulary end-to-end speech recognition |
US10699697B2 (en) * | 2018-03-29 | 2020-06-30 | Tencent Technology (Shenzhen) Company Limited | Knowledge transfer in permutation invariant training for single-channel multi-talker speech recognition |
US10573312B1 (en) * | 2018-12-04 | 2020-02-25 | Sorenson Ip Holdings, Llc | Transcription generation from multiple speech recognition systems |
-
2018
- 2018-06-07 JP JP2018109442A patent/JP6910987B2/ja active Active
-
2019
- 2019-06-03 US US16/429,911 patent/US11600262B2/en active Active
- 2019-06-06 CN CN201910490584.8A patent/CN110580905B/zh active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022020062A (ja) * | 2020-11-23 | 2022-01-31 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 特徴情報のマイニング方法、装置及び電子機器 |
JP7300492B2 (ja) | 2020-11-23 | 2023-06-29 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 特徴情報のマイニング方法、装置及び電子機器 |
Also Published As
Publication number | Publication date |
---|---|
US11600262B2 (en) | 2023-03-07 |
JP6910987B2 (ja) | 2021-07-28 |
US20190378496A1 (en) | 2019-12-12 |
CN110580905A (zh) | 2019-12-17 |
CN110580905B (zh) | 2023-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110264991B (zh) | 语音合成模型的训练方法、语音合成方法、装置、设备及存储介质 | |
JP6465077B2 (ja) | 音声対話装置および音声対話方法 | |
WO2019196306A1 (zh) | 基于语音的口型动画合成装置、方法及可读存储介质 | |
WO2020015153A1 (zh) | 为歌词文本生成乐曲的方法、装置及计算机可读存储介质 | |
US20200135213A1 (en) | Electronic device and control method thereof | |
KR20160030168A (ko) | 음성 인식 방법, 장치 및 시스템 | |
WO2020238045A1 (zh) | 智能语音识别方法、装置及计算机可读存储介质 | |
JP2018159788A (ja) | 情報処理装置、方法及びプログラム | |
US10836044B2 (en) | Robot control device and robot control method | |
JP6873805B2 (ja) | 対話支援システム、対話支援方法、及び対話支援プログラム | |
JP2014038132A (ja) | 情報処理装置、プログラム、及び情報処理方法 | |
JP2020034683A (ja) | 音声認識装置、音声認識プログラムおよび音声認識方法 | |
CN109947971A (zh) | 图像检索方法、装置、电子设备及存储介质 | |
US10699224B2 (en) | Conversation member optimization apparatus, conversation member optimization method, and program | |
JP5396530B2 (ja) | 音声認識装置および音声認識方法 | |
US10269349B2 (en) | Voice interactive device and voice interaction method | |
JP6910987B2 (ja) | 認識装置、認識システム、端末装置、サーバ装置、方法及びプログラム | |
US10978076B2 (en) | Speaker retrieval device, speaker retrieval method, and computer program product | |
JP2006251042A (ja) | 情報処理装置、情報処理方法およびプログラム | |
CN113539234B (zh) | 语音合成方法、装置、系统及存储介质 | |
JP6786065B2 (ja) | 音声評定装置、音声評定方法、教師変化情報の生産方法、およびプログラム | |
JP2008293098A (ja) | 応答スコア情報生成装置、対話処理装置 | |
JP2013088488A (ja) | 音声検索装置、音声検索方法及びプログラム | |
JP5949634B2 (ja) | 音声合成システム、及び音声合成方法 | |
JP2007010995A (ja) | 話者認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200710 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210519 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210608 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210707 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6910987 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |