JP6790003B2 - 編集支援装置、編集支援方法及びプログラム - Google Patents
編集支援装置、編集支援方法及びプログラム Download PDFInfo
- Publication number
- JP6790003B2 JP6790003B2 JP2018018642A JP2018018642A JP6790003B2 JP 6790003 B2 JP6790003 B2 JP 6790003B2 JP 2018018642 A JP2018018642 A JP 2018018642A JP 2018018642 A JP2018018642 A JP 2018018642A JP 6790003 B2 JP6790003 B2 JP 6790003B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- voice
- weight
- utterance
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 19
- 238000000605 extraction Methods 0.000 claims description 32
- 238000004364 calculation method Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 12
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 238000012559 user support system Methods 0.000 description 2
- 235000001537 Ribes X gardonianum Nutrition 0.000 description 1
- 235000001535 Ribes X utile Nutrition 0.000 description 1
- 235000016919 Ribes petraeum Nutrition 0.000 description 1
- 244000281247 Ribes rubrum Species 0.000 description 1
- 235000002355 Ribes spicatum Nutrition 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
第1実施形態の編集支援装置は、例えば音声認識に使用される辞書を編集可能な音声認識システムで使用される。はじめに、第1実施形態の編集支援装置の機能構成の例について説明する。
図1は第1実施形態の編集支援装置10の機能構成の例を示す図である。第1実施形態の編集支援装置10は、記憶部1、単語取得部2、発話取得部3、抽出部4、推定部5、出力制御部6及び出力部7を備える。
例えば、抽出部4は、単語の読みを利用して発話音声集合から関連発話音声を抽出する。具体的には、まず、抽出部4は、上述の発話データに含まれる文字列情報の読みを取得する。
また例えば、抽出部4は、発話音声集合に含まれる発話音声を音声認識することにより得られた音声認識結果に、単語の表記の一部又は全部を含む発話音声を、関連発話音声として抽出する。第1実施形態では、発話音声を音声認識することにより得られた音声認識結果は、上述の図3Aの文字列情報である。例えば、抽出部4は、単語IDが「2」の「[総務]」の場合、発話IDが「4」の文字列情報に「総務」が含まれるため、発話IDが「4」の発話音声を関連発話音声として抽出する。
R_surface = 1/(2×言語的特徴量に基づく編集距離) ・・・(3)
また例えば、抽出部4は、発話音声集合に含まれる発話音声を音声認識することにより得られた音声認識結果に、単語の表記の一部又は全部を含む発話音声を、関連発話音声として抽出する。第1実施形態では、発話音声を音声認識することにより得られた音声認識結果は、上述の図3BのStringである。例えば、抽出部4は、WordIDが「2」の「[Admin Div.]」の場合、SpIDが「4」のStringに「[Admin Div.]」のPhone(図2B参照)が含まれるため、SpIDが「4」の発話音声を関連発話音声として抽出する。
図7は第1実施形態の編集支援方法の例を示すフローチャートである。はじめに、単語取得部2が、記憶部1から単語の表記と読みとを取得する(ステップS1)。次に、発話取得部3が、記憶部1から発話音声集合を取得する(ステップS2)。
次に第2実施形態について説明する。第2実施形態の説明では、第1実施形態と同様の説明については省略し、第1実施形態と異なる箇所について説明する。
図8は第2実施形態の編集支援装置10−2の機能構成の例を示す図である。第2実施形態の編集支援装置10−2は、記憶部1、単語取得部2、発話取得部3、抽出部4、推定部5、出力制御部6−2、出力部7及び算出部8を備える。すなわち、第2実施形態の編集支援装置10−2は、第1実施形態の編集支援装置10の構成に更に算出部8が追加されている。また、第2実施形態の編集支援装置10−2では、出力制御部6−2の動作が第1実施形態の動作から変更されている。
図9は第1実施形態の編集支援装置10のハードウェア構成の例を示す図である。第1実施形態の編集支援装置10は、制御装置301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305及び通信装置306を備える。制御装置301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305及び通信装置306は、バス310を介して接続されている。
2 単語取得部
3 発話取得部
4 抽出部
5 推定部
6 出力制御部
7 出力部
8 算出部
10 編集支援装置
301 制御装置
302 主記憶装置
303 補助記憶装置
304 表示装置
305 入力装置
306 通信装置
310 バス
Claims (8)
- 音声認識に使用される辞書に追加された単語の読み及び表記の少なくとも一方に基づいて、発話音声集合から前記単語に関連する関連発話音声を抽出する抽出部と、
前記単語の認識されやすさを調整する重みと、前記重みが設定された場合に前記関連発話音声から認識されることが推定される推定認識結果とを推定する推定部と、
設定された前記重みに応じて、前記推定認識結果の出力を制御する出力制御部と、
を備える編集支援装置。 - 前記抽出部は、前記発話音声集合に含まれる発話音声を音声認識することにより得られた音素列を取得し、前記音素列に、前記単語の読みから変換された音素列の一部又は全部を含む発話音声を、関連発話音声として抽出する、
請求項1に記載の編集支援装置。 - 前記抽出部は、前記発話音声集合に含まれる発話音声を音声認識することにより得られた音声認識結果に、前記単語の表記の一部又は全部を含む発話音声を、関連発話音声として抽出する、
請求項1に記載の編集支援装置。 - 前記出力制御部は、前記単語を含む第1の推定認識結果と、前記単語を含まない第2の推定認識結果とが区別された出力情報を出力部に出力することにより、前記推定認識結果の出力を制御する、
請求項1に記載の編集支援装置。 - 既にユーザにより設定された第1の単語の重みに基づいて、まだユーザにより重みが設定されていない第2の単語の重みの推奨値を算出する算出部を更に備え、
前記出力制御部は、前記推奨値の出力を更に制御する、
請求項4に記載の編集支援装置。 - 前記算出部は、前記第1の単語について、前記第1の推定認識結果の数を前記関連発話音声の数で除算した第1の認識許容値を算出し、前記第2の単語の重みの推奨値として、前記第2の単語の第2の認識許容値が、前記第1の認識許容値の平均値以上になる重みを算出する、
請求項5に記載の編集支援装置。 - 音声認識に使用される辞書に追加された単語の読み及び表記の少なくとも一方に基づいて、発話音声集合から前記単語に関連する関連発話音声を抽出するステップと、
前記単語の認識されやすさを調整する重みと、前記重みが設定された場合に前記関連発話音声から認識されることが推定される推定認識結果とを推定するステップと、
設定された前記重みに応じて、前記推定認識結果の出力を制御するステップと、
を含む編集支援方法。 - コンピュータを、
音声認識に使用される辞書に追加された単語の読み及び表記の少なくとも一方に基づいて、発話音声集合から前記単語に関連する関連発話音声を抽出する抽出部と、
前記単語の認識されやすさを調整する重みと、前記重みが設定された場合に前記関連発話音声から認識されることが推定される推定認識結果とを推定する推定部と、
設定された前記重みに応じて、前記推定認識結果の出力を制御する出力制御部、
として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018018642A JP6790003B2 (ja) | 2018-02-05 | 2018-02-05 | 編集支援装置、編集支援方法及びプログラム |
CN201810918988.8A CN110136720B (zh) | 2018-02-05 | 2018-08-14 | 编辑支援装置、编辑支援方法以及程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018018642A JP6790003B2 (ja) | 2018-02-05 | 2018-02-05 | 編集支援装置、編集支援方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019135529A JP2019135529A (ja) | 2019-08-15 |
JP6790003B2 true JP6790003B2 (ja) | 2020-11-25 |
Family
ID=67568258
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018018642A Active JP6790003B2 (ja) | 2018-02-05 | 2018-02-05 | 編集支援装置、編集支援方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6790003B2 (ja) |
CN (1) | CN110136720B (ja) |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4056711B2 (ja) * | 2001-03-19 | 2008-03-05 | 日産自動車株式会社 | 音声認識装置 |
JP5040909B2 (ja) * | 2006-02-23 | 2012-10-03 | 日本電気株式会社 | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム |
JP2011107251A (ja) * | 2009-11-13 | 2011-06-02 | Ntt Docomo Inc | 音声認識装置、言語モデル生成装置および音声認識方法 |
JP2011170087A (ja) * | 2010-02-18 | 2011-09-01 | Fujitsu Ltd | 音声認識装置 |
JP5694102B2 (ja) * | 2011-09-22 | 2015-04-01 | 株式会社東芝 | 音声認識装置、音声認識方法およびプログラム |
CN103177721B (zh) * | 2011-12-26 | 2015-08-19 | 中国电信股份有限公司 | 语音识别方法和系统 |
JP5546565B2 (ja) * | 2012-02-22 | 2014-07-09 | 日本電信電話株式会社 | 単語追加装置、単語追加方法、およびプログラム |
JP5713963B2 (ja) * | 2012-06-18 | 2015-05-07 | 日本電信電話株式会社 | 音声認識単語追加装置とその方法とプログラム |
JP6107003B2 (ja) * | 2012-09-05 | 2017-04-05 | 日本電気株式会社 | 辞書更新装置、音声認識システム、辞書更新方法、音声認識方法、および、コンピュータ・プログラム |
JP6327848B2 (ja) * | 2013-12-20 | 2018-05-23 | 株式会社東芝 | コミュニケーション支援装置、コミュニケーション支援方法およびプログラム |
JP2015125499A (ja) * | 2013-12-25 | 2015-07-06 | 株式会社東芝 | 音声通訳装置、音声通訳方法及び音声通訳プログラム |
JP6453631B2 (ja) * | 2014-11-28 | 2019-01-16 | 株式会社東芝 | 認識システム、認識方法およびプログラム |
-
2018
- 2018-02-05 JP JP2018018642A patent/JP6790003B2/ja active Active
- 2018-08-14 CN CN201810918988.8A patent/CN110136720B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019135529A (ja) | 2019-08-15 |
CN110136720A (zh) | 2019-08-16 |
CN110136720B (zh) | 2022-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7962341B2 (en) | Method and apparatus for labelling speech | |
JP3232289B2 (ja) | 記号挿入装置およびその方法 | |
KR101183310B1 (ko) | 일반적인 철자 기억용 코드 | |
US8577679B2 (en) | Symbol insertion apparatus and symbol insertion method | |
JP6245846B2 (ja) | 音声認識における読み精度を改善するシステム、方法、およびプログラム | |
WO2007006769A1 (en) | System, program, and control method for speech synthesis | |
US20210082311A1 (en) | Computer implemented method and apparatus for recognition of speech patterns and feedback | |
JPWO2019065263A1 (ja) | 発音誤り検出装置、発音誤り検出方法、プログラム | |
US9460718B2 (en) | Text generator, text generating method, and computer program product | |
JP2008046538A (ja) | テキスト音声合成を支援するシステム | |
WO2011036769A1 (ja) | 翻訳装置、及びプログラム | |
JP5451982B2 (ja) | 支援装置、プログラムおよび支援方法 | |
JP4354299B2 (ja) | 事例検索プログラム、事例検索方法及び事例検索装置 | |
JP4859125B2 (ja) | 発音評定装置、およびプログラム | |
JP6790003B2 (ja) | 編集支援装置、編集支援方法及びプログラム | |
JP6436806B2 (ja) | 音声合成用データ作成方法、及び音声合成用データ作成装置 | |
CN110580905A (zh) | 识别装置及方法 | |
JP4296290B2 (ja) | 音声認識装置、音声認識方法及びプログラム | |
JP2003186489A (ja) | 音声情報データベース作成システム,録音原稿作成装置および方法,録音管理装置および方法,ならびにラベリング装置および方法 | |
US20240005906A1 (en) | Information processing device, information processing method, and information processing computer program product | |
JP7195593B2 (ja) | 語学学習用装置および語学学習用プログラム | |
Martens et al. | Word Segmentation in the Spoken Dutch Corpus. | |
WO2023047623A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP6567372B2 (ja) | 編集支援装置、編集支援方法及びプログラム | |
JPS62223798A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190814 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200522 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201006 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201104 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6790003 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |