JP7102986B2 - 音声認識装置、音声認識プログラム、音声認識方法および辞書生成装置 - Google Patents
音声認識装置、音声認識プログラム、音声認識方法および辞書生成装置 Download PDFInfo
- Publication number
- JP7102986B2 JP7102986B2 JP2018127546A JP2018127546A JP7102986B2 JP 7102986 B2 JP7102986 B2 JP 7102986B2 JP 2018127546 A JP2018127546 A JP 2018127546A JP 2018127546 A JP2018127546 A JP 2018127546A JP 7102986 B2 JP7102986 B2 JP 7102986B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- words
- voice
- dictionary
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
図1は、第1実施形態にかかる音声認識装置の機能構成例を示すブロック図である。図1に示すように、音声認識装置1は、音声データを含む入力データの入力を受け付け、音声をテキストに変換した音声認識結果を出力する情報処理装置である。例えば、音声認識装置1は、PC(パーソナルコンピュータ)などであり、LAN(Local Area Network)やインターネット等の通信ネットワーク(図示しない)を介して入力端末2および学習装置3と接続する。
図5は、第2実施形態にかかる音声認識装置の機能構成例を示すブロック図である。図5に示すように、音声認識装置1aは、インターネットなどにおける辞書サイトなどのビックデータD3に対して検索を行う検索部60を更に有する構成である。
図7は、第3実施形態にかかる音声認識装置の機能構成例を示すブロック図である。図7に示すように、音声認識装置1bは、IDFデータ70(IDF:Inverse Document Frequency)などの各単語の出現頻度を示す頻度情報をもとに、単語辞書に含まれる単語の優先度を設定する優先度制御部21を有する。
前記テキストデータに含まれる単語を抽出し、入力された単語に対して関連する単語を出力するように学習した学習モデルをもとに、抽出した前記単語に関連する単語を含む単語辞書を生成する辞書生成部と、
前記音声データから認識した音素と、生成した前記単語辞書とをもとに、前記音声データに含まれる音声をテキストに変換する音声認識部と、
を有することを特徴とする音声認識装置。
ことを特徴とする付記1に記載の音声認識装置。
前記音声認識部は、生成した前記単語辞書に検索した単語を加えた辞書に含まれる単語群の中から前記音素に対応する単語を抽出して前記音声をテキストに変換する(図6)、
ことを特徴とする付記1に記載の音声認識装置。
前記音声認識部は、設定された前記優先度に基づき、前記単語辞書の中からテキストへの変換に用いる単語を選択する、
ことを特徴とする付記1乃至3のいずれか一に記載の音声認識装置。
ことを特徴とする付記4に記載の音声認識装置。
前記テキストデータに含まれる単語を抽出し、入力された単語に対して関連する単語を出力するように学習した学習モデルをもとに、抽出した前記単語に関連する単語を含む単語辞書を生成し、
前記音声データから認識した音素と、生成した前記単語辞書とをもとに、前記音声データに含まれる音声をテキストに変換する、
処理をコンピュータに実行させることを特徴とする音声認識プログラム。
ことを特徴とする付記6に記載の音声認識プログラム。
前記変換する処理は、生成した前記単語辞書に検索した単語を加えた辞書に含まれる単語群の中から前記音素に対応する単語を抽出して前記音声をテキストに変換する、
ことを特徴とする付記6に記載の音声認識プログラム。
前記変換する処理は、設定された前記優先度に基づき、前記単語辞書の中からテキストへの変換に用いる単語を選択する、
ことを特徴とする付記6乃至8のいずれか一に記載の音声認識プログラム。
ことを特徴とする付記9に記載の音声認識プログラム。
前記テキストデータに含まれる単語を抽出し、入力された単語に対して関連する単語を出力するように学習した学習モデルをもとに、抽出した前記単語に関連する単語を含む単語辞書を生成し、
前記音声データから認識した音素と、生成した前記単語辞書とをもとに、前記音声データに含まれる音声をテキストに変換する、
処理をコンピュータが実行することを特徴とする音声認識方法。
ことを特徴とする付記11に記載の音声認識方法。
前記変換する処理は、生成した前記単語辞書に検索した単語を加えた辞書に含まれる単語群の中から前記音素に対応する単語を抽出して前記音声をテキストに変換する、
ことを特徴とする付記11に記載の音声認識方法。
前記変換する処理は、設定された前記優先度に基づき、前記単語辞書の中からテキストへの変換に用いる単語を選択する、
ことを特徴とする付記11乃至13のいずれか一に記載の音声認識方法。
ことを特徴とする付記14に記載の音声認識方法。
前記テキストデータに含まれる単語を抽出し、入力された単語に対して関連する単語を出力するように学習した学習モデルをもとに、抽出した前記単語に関連する単語を含む、前記音声認識に用いる単語辞書を生成する辞書生成部と、
を有することを特徴とする辞書作成装置。
2…入力端末
3…学習装置
10…入出力部
20…制御部
21…優先度制御部
30…動的辞書生成部
31…入出力部
32…形態素解析部
33…単号辞書生成部
40…学習モデル
50…音声認識部
51…音響モデル
52…単語辞書(固定)
60…検索部
70…IDFデータ
101…CPU
102…入力装置
103…モニタ
104…スピーカ
105…媒体読取装置
106…インタフェース装置
107…通信装置
108…RAM
109…ハードディスク装置
110…バス
111…プログラム
112…各種データ
301…テキスト入力部
302…形態素解析部
303…学習処理部
24…I/F部
D1…入力データ
D2…テキストデータ
D3…ビックデータ
Claims (6)
- 音声データと、当該音声データに対応するテキストデータとの入力を受け付ける入力部と、
前記テキストデータに含まれる単語を抽出し、入力された単語に対して関連する単語を出力するように学習した学習モデルをもとに、抽出した前記単語に関連する単語を含む単語辞書を生成する辞書生成部と、
前記音声データから認識した音素と、生成した前記単語辞書とをもとに、前記音声データに含まれる音声をテキストに変換する音声認識部と、
各単語の出現頻度を示す頻度情報をもとに、前記単語辞書に含まれる単語の重要度を設定する設定部と、を有し、
前記設定部は、前記単語辞書に含まれる単語の中で、所定の単語よりも出現頻度がより低い単語の重要度を前記所定の単語より高く設定し、
前記音声認識部は、設定された前記重要度に基づき、前記単語辞書の中からテキストへの変換に用いる単語を選択する、
ことを特徴とする音声認識装置。 - 前記音声認識部は、所定の単語辞書に生成した前記単語辞書を加えた辞書に含まれる単語群の中から前記音素に対応する単語を抽出して前記音声をテキストに変換する、
ことを特徴とする請求項1に記載の音声認識装置。 - 外部データにアクセスして前記テキストデータに含まれる単語に関連する単語を検索する検索部を更に有し、
前記音声認識部は、生成した前記単語辞書に検索した単語を加えた辞書に含まれる単語群の中から前記音素に対応する単語を抽出して前記音声をテキストに変換する、
ことを特徴とする請求項1に記載の音声認識装置。 - 音声データと、当該音声データに対応するテキストデータとの入力を受け付け、
前記テキストデータに含まれる単語を抽出し、入力された単語に対して関連する単語を出力するように学習した学習モデルをもとに、抽出した前記単語に関連する単語を含む単語辞書を生成し、
各単語の出現頻度を示す頻度情報をもとに、前記単語辞書に含まれる単語の中で、所定の単語よりも出現頻度がより低い単語の重要度を前記所定の単語より高くなるように、前記単語辞書に含まれる単語の重要度を設定し、
前記音声データから認識した音素と、生成した前記単語辞書と、設定された前記重要度と、をもとに、前記単語辞書の中からテキストへの変換に用いる単語を選択し、前記音声データに含まれる音声をテキストに変換する、
処理をコンピュータに実行させることを特徴とする音声認識プログラム。 - 音声データと、当該音声データに対応するテキストデータとの入力を受け付け、
前記テキストデータに含まれる単語を抽出し、入力された単語に対して関連する単語を出力するように学習した学習モデルをもとに、抽出した前記単語に関連する単語を含む単語辞書を生成し、
各単語の出現頻度を示す頻度情報をもとに、前記単語辞書に含まれる単語の中で、所定の単語よりも出現頻度がより低い単語の重要度を前記所定の単語より高くなるように、前記単語辞書に含まれる単語の重要度を設定し、
前記音声データから認識した音素と、生成した前記単語辞書と、設定された前記重要度と、をもとに、前記単語辞書の中からテキストへの変換に用いる単語を選択し、前記音声データに含まれる音声をテキストに変換する、
処理をコンピュータが実行することを特徴とする音声認識方法。 - 音声認識の対象とする音声データと、当該音声データに対応するテキストデータとの入力を受け付ける入力部と、
前記テキストデータに含まれる単語を抽出し、入力された単語に対して関連する単語を出力するように学習した学習モデルをもとに、抽出した前記単語に関連する単語を含む、前記音声認識に用いる単語辞書を生成する辞書生成部と、
各単語の出現頻度を示す頻度情報をもとに、前記単語辞書に含まれる単語の重要度を設定する設定部と、を有し、
前記設定部は、前記単語辞書に含まれる単語の中で、所定の単語よりも出現頻度がより低い単語の重要度を前記所定の単語より高く設定する、
ことを特徴とする辞書作成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018127546A JP7102986B2 (ja) | 2018-07-04 | 2018-07-04 | 音声認識装置、音声認識プログラム、音声認識方法および辞書生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018127546A JP7102986B2 (ja) | 2018-07-04 | 2018-07-04 | 音声認識装置、音声認識プログラム、音声認識方法および辞書生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020008637A JP2020008637A (ja) | 2020-01-16 |
JP7102986B2 true JP7102986B2 (ja) | 2022-07-20 |
Family
ID=69151342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018127546A Active JP7102986B2 (ja) | 2018-07-04 | 2018-07-04 | 音声認識装置、音声認識プログラム、音声認識方法および辞書生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7102986B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12118983B2 (en) | 2021-04-02 | 2024-10-15 | Samsung Electronics Co., Ltd. | Electronic device and operation method thereof |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008197229A (ja) | 2007-02-09 | 2008-08-28 | Konica Minolta Business Technologies Inc | 音声認識辞書構築装置及びプログラム |
JP2008287210A (ja) | 2007-04-16 | 2008-11-27 | Sony Corp | 音声チャットシステム、情報処理装置、音声認識方法およびプログラム |
JP2018055224A (ja) | 2016-09-27 | 2018-04-05 | 日本電気株式会社 | データ生成装置、方法、及びプログラム |
-
2018
- 2018-07-04 JP JP2018127546A patent/JP7102986B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008197229A (ja) | 2007-02-09 | 2008-08-28 | Konica Minolta Business Technologies Inc | 音声認識辞書構築装置及びプログラム |
JP2008287210A (ja) | 2007-04-16 | 2008-11-27 | Sony Corp | 音声チャットシステム、情報処理装置、音声認識方法およびプログラム |
JP2018055224A (ja) | 2016-09-27 | 2018-04-05 | 日本電気株式会社 | データ生成装置、方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020008637A (ja) | 2020-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7280386B2 (ja) | 多言語音声合成およびクロスランゲージボイスクローニング | |
JP6493866B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN111145718B (zh) | 一种基于自注意力机制的中文普通话字音转换方法 | |
EP1089256A2 (en) | Speech recognition models adaptation from previous results feedback | |
Watts | Unsupervised learning for text-to-speech synthesis | |
JP2008134475A (ja) | 入力された音声のアクセントを認識する技術 | |
JP2001101187A (ja) | 翻訳装置および翻訳方法、並びに記録媒体 | |
JP2005321730A (ja) | 対話システム、対話システム実行方法、及びコンピュータプログラム | |
EP2329489A1 (en) | Stochastic phoneme and accent generation using accent class | |
CN111508466A (zh) | 一种文本处理方法、装置、设备及计算机可读存储介质 | |
JP2008276543A (ja) | 対話処理装置、応答文生成方法、及び応答文生成処理プログラム | |
CN113823259B (zh) | 将文本数据转换为音素序列的方法及设备 | |
Viacheslav et al. | System of methods of automated cognitive linguistic analysis of speech signals with noise | |
JP7102986B2 (ja) | 音声認識装置、音声認識プログラム、音声認識方法および辞書生成装置 | |
JP2020060642A (ja) | 音声合成システム、及び音声合成装置 | |
Rajendran et al. | A robust syllable centric pronunciation model for Tamil text to speech synthesizer | |
JP2015084047A (ja) | 文集合作成装置、文集合作成方法および文集合作成プログラム | |
CN114373445B (zh) | 语音生成方法、装置、电子设备及存储介质 | |
Samuel Manoharan | A novel text-to-speech synthesis system using syllable-based HMM for Tamil language | |
CN113327583A (zh) | 一种基于ppg一致性的最优映射跨语言音色转换方法及系统 | |
JP2001117921A (ja) | 翻訳装置および翻訳方法、並びに記録媒体 | |
JP5336779B2 (ja) | 文字列変換を行う情報処理装置、文字列変換方法、プログラム、および情報処理システム | |
JP2001100788A (ja) | 音声処理装置および音声処理方法、並びに記録媒体 | |
JP6309852B2 (ja) | 強調位置予測装置、強調位置予測方法及びプログラム | |
JP7012935B1 (ja) | プログラム、情報処理装置、方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220620 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7102986 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |