JP7479249B2 - 未知語検出方法及び未知語検出装置 - Google Patents
未知語検出方法及び未知語検出装置 Download PDFInfo
- Publication number
- JP7479249B2 JP7479249B2 JP2020147193A JP2020147193A JP7479249B2 JP 7479249 B2 JP7479249 B2 JP 7479249B2 JP 2020147193 A JP2020147193 A JP 2020147193A JP 2020147193 A JP2020147193 A JP 2020147193A JP 7479249 B2 JP7479249 B2 JP 7479249B2
- Authority
- JP
- Japan
- Prior art keywords
- unknown
- unknown word
- speech
- words
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 71
- 230000015572 biosynthetic process Effects 0.000 claims description 77
- 238000003786 synthesis reaction Methods 0.000 claims description 77
- 238000006243 chemical reaction Methods 0.000 claims description 32
- 230000000877 morphologic effect Effects 0.000 claims description 29
- 238000000034 method Methods 0.000 claims description 24
- 238000010586 diagram Methods 0.000 description 25
- 230000006870 function Effects 0.000 description 17
- 238000012545 processing Methods 0.000 description 14
- 238000012790 confirmation Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 241001067759 Senta Species 0.000 description 2
- 241000282797 Tapirus Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
図1Aは、従来の音声認識部(音声認識システム)の構成を示す図である。従来から、音声認識部30は、予め設定された音響モデル310を用いて入力音声から音声特徴を抽出する音響特徴解析部31と、予め設定された言語モデル320を用いて音響特徴からテキストに変換(デコード)するテキスト変換部で構成される。本実施例は、このような音声システムの言語モデルをチューニングする未知語自動検出装置を想定している。なお、以下では、音響モデル310と言語モデル320を合わせて音声認識辞書300とする。
図1Bは、本発明の実施例1による未知語自動検出装置100の概略構成の一例を示すブロック図である。
図2は、未知語自動検出装置100の構成の一例を説明する図である。図2に示すように、未知語自動検出装置100は、テキスト入力部10と、音声合成部20と、音声合成ユーザ辞書登録部50と、テキスト変換部32と、未知語検出部40と、音声認識ユーザ辞書登録部60を機能として有している。
以上のように、上記実施例1~3の未知語自動検出装置100は、以下のような構成とすることができる。
20 音声合成部
30 音声認識部
40 未知語検出部
50 音声合成ユーザ辞書登録部
60 音声認識ユーザ辞書登録部
100 未知語自動検出装置
101 記憶装置
102 テキスト入力I/F
103 CPU
104 メモリ
105 音声出力I/F
106 テキスト提示I/F
210 音声合成辞書
220 形態素辞書
230 フレーズ辞書
310 音響モデル
320 言語モデル
Claims (8)
- プロセッサとメモリを有する計算機が、入力テキストから未知語を検出する未知語検出方法であって、
前記計算機が、前記入力テキストを音素配列に変換する音素変換ステップと、
前記計算機が、前記音素配列を受け付けて、予め設定された言語モデルを参照して前記音素配列を出力テキストに変換する認識ステップと、
前記計算機が、前記入力テキストと上記変換された前記出力テキストを比較して未知語を検出する未知語検出ステップと、
を含み、
前記音素変換ステップは、
形態素解析によって前記入力テキストを、同形異音語の形態素配列を含む、形態素配列に変換するステップと、
変換された前記形態素配列を、所定のポーズに囲まれるフレーズ単位に切り出してフレーズ単位の形態素配列を生成するステップと、
前記フレーズ単位の形態素配列から、前記フレーズ単位の音素配列を生成するステップと、
前記フレーズ単位の音素配列に対して音声合成を行って音声を生成するステップと、
前記音声を予め設定された音声モデルを参照して前記音素配列に変換するステップと、
を含むことを特徴とする未知語検出方法。 - 請求項1に記載の未知語検出方法であって、
前記計算機が、前記未知語を前記言語モデルに登録する単語登録ステップを、さらに含むことを特徴とする未知語検出方法。 - 請求項1に記載の未知語検出方法であって、
前記音素変換ステップでは、
予め設定した音声合成辞書で前記形態素配列を前記音素配列に変換し、
前記音声合成辞書は、前記言語モデルとは異なる手法で構成されたことを特徴とする未知語検出方法。 - 請求項2に記載の未知語検出方法であって、
前記単語登録ステップでは、
前記言語モデルに前記未知語を登録する際には、使用方法が類似する単語の統計情報を当該未知語の統計情報として登録することを特徴とする未知語検出方法。 - プロセッサとメモリを有し、入力テキストから未知語を検出する未知語検出装置であって、
前記入力テキストを音素配列に変換する音素変換部と、
前記音素配列を受け付けて、予め設定された言語モデルを参照して前記音素配列を出力テキストに変換する認識部と、
前記入力テキストと上記変換された前記出力テキストを比較して未知語を検出する未知語検出部と、
を有し、
前記音素変換部は、
形態素解析によって前記入力テキストを、同形異音語の形態素配列を含む、形態素配列に変換し、
変換された前記形態素配列を、所定のポーズに囲まれるフレーズ単位に切り出してフレーズ単位の形態素配列を生成し、
前記フレーズ単位の形態素配列から、前記フレーズ単位の音素配列を生成し、
前記フレーズ単位の音素配列に対して音声合成を行って音声を生成し、
前記音声を予め設定された音声モデルを参照して前記音素配列に変換することを特徴とする未知語検出装置。 - 請求項5に記載の未知語検出装置であって、
前記未知語を前記言語モデルに登録する単語登録部を、さらに有することを特徴とする未知語検出装置。 - 請求項5に記載の未知語検出装置であって、
前記音素変換部は、
予め設定した音声合成辞書で前記形態素配列を前記音素配列に変換し、前記音声合成辞書は、前記言語モデルとは異なる手法で構成されたことを特徴とする未知語検出装置。 - 請求項6に記載の未知語検出装置であって、
前記単語登録部は、
前記言語モデルに前記未知語を登録する際には、使用方法が類似する単語の統計情報を当該未知語の統計情報として登録することを特徴とする未知語検出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020147193A JP7479249B2 (ja) | 2020-09-02 | 2020-09-02 | 未知語検出方法及び未知語検出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020147193A JP7479249B2 (ja) | 2020-09-02 | 2020-09-02 | 未知語検出方法及び未知語検出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022042033A JP2022042033A (ja) | 2022-03-14 |
JP7479249B2 true JP7479249B2 (ja) | 2024-05-08 |
Family
ID=80629281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020147193A Active JP7479249B2 (ja) | 2020-09-02 | 2020-09-02 | 未知語検出方法及び未知語検出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7479249B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007097176A1 (ja) | 2006-02-23 | 2007-08-30 | Nec Corporation | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム |
JP2010039539A (ja) | 2008-07-31 | 2010-02-18 | Ntt Docomo Inc | 言語モデル作成装置および言語モデル作成方法 |
-
2020
- 2020-09-02 JP JP2020147193A patent/JP7479249B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007097176A1 (ja) | 2006-02-23 | 2007-08-30 | Nec Corporation | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム |
JP2010039539A (ja) | 2008-07-31 | 2010-02-18 | Ntt Docomo Inc | 言語モデル作成装置および言語モデル作成方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2022042033A (ja) | 2022-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6952665B1 (en) | Translating apparatus and method, and recording medium used therewith | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
US8954333B2 (en) | Apparatus, method, and computer program product for processing input speech | |
US7236922B2 (en) | Speech recognition with feedback from natural language processing for adaptation of acoustic model | |
JP5040909B2 (ja) | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム | |
US7904291B2 (en) | Communication support apparatus and computer program product for supporting communication by performing translation between languages | |
US8566076B2 (en) | System and method for applying bridging models for robust and efficient speech to speech translation | |
US20090138266A1 (en) | Apparatus, method, and computer program product for recognizing speech | |
CN113396455B (zh) | 用于语音识别训练和评分的音译 | |
US9135912B1 (en) | Updating phonetic dictionaries | |
JP2015049254A (ja) | 音声データ認識システム及び音声データ認識方法 | |
Alsharhan et al. | Evaluating the effect of using different transcription schemes in building a speech recognition system for Arabic | |
Geneva et al. | Building an ASR corpus based on Bulgarian Parliament speeches | |
Sazhok et al. | Punctuation Restoration for Ukrainian Broadcast Speech Recognition System based on Bidirectional Recurrent Neural Network and Word Embeddings. | |
AbuZeina et al. | Cross-word modeling for Arabic speech recognition | |
JP7479249B2 (ja) | 未知語検出方法及び未知語検出装置 | |
JP2004133003A (ja) | 音声認識辞書作成方法及びその装置と音声認識装置 | |
US6772116B2 (en) | Method of decoding telegraphic speech | |
JP2003271183A (ja) | 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体 | |
JP2003162524A (ja) | 言語処理装置 | |
Iso-Sipila et al. | Multi-lingual speaker-independent voice user interface for mobile devices | |
JP2005208483A (ja) | 音声認識装置、音声認識プログラム、言語モデル生成方法、及び言語モデル生成装置 | |
JP2001100788A (ja) | 音声処理装置および音声処理方法、並びに記録媒体 | |
JP2001117583A (ja) | 音声認識装置および音声認識方法、並びに記録媒体 | |
Al-Daradkah et al. | Automatic grapheme-to-phoneme conversion of Arabic text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231013 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240423 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7479249 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |