JP6552999B2 - テキスト補正装置、テキスト補正方法、およびプログラム - Google Patents
テキスト補正装置、テキスト補正方法、およびプログラム Download PDFInfo
- Publication number
- JP6552999B2 JP6552999B2 JP2016131807A JP2016131807A JP6552999B2 JP 6552999 B2 JP6552999 B2 JP 6552999B2 JP 2016131807 A JP2016131807 A JP 2016131807A JP 2016131807 A JP2016131807 A JP 2016131807A JP 6552999 B2 JP6552999 B2 JP 6552999B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition result
- speech recognition
- speech
- text correction
- syllable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
明日;アス;名詞
は;ワ;格助詞
快晴;カイセイ;名詞
ですよねー;デスヨネー;終助詞
明日は;アスワ;名詞
快晴;カイセイ;名詞
ですよねー;デスヨネー;終助詞
1位 明日は、かひ、快晴ええですよねー
2位 明日はかい、快晴えーですよねー
3位 明日は、たい、快晴えですよねー
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
2 文法生成部
3 音声認識部
4 認識結果選定部
5 発音辞書記憶部
Claims (7)
- 発話音声を書き起こした書き起こしテキストの形態素解析結果に対して形態素境界毎に不要語を挿入して文法モデルを生成する文法生成部と、
上記文法モデルを用いて上記発話音声の音声データを音声認識した複数の音声認識結果候補を生成する音声認識部と、
各音声認識結果候補についてその音声認識結果候補に含まれる音節列である不要語とその不要語に続く単語との類似度を算出し、その類似度に基づいて上記音声認識結果候補から上記発話音声の音声認識結果を選定する認識結果選定部と、
を含むテキスト補正装置。 - 請求項1に記載のテキスト補正装置であって、
上記文法生成部は、上記形態素解析結果に対して形態素解析境界毎に、フィラー、音節、または無音を含む上記不要語を挿入して上記文法モデルを生成するものである、
を含むテキスト補正装置。 - 請求項2に記載のテキスト補正装置であって、
上記文法生成部は、上記形態素解析結果に対して形態素解析境界毎に、任意のフィラーが連続するフィラー連続、複数の音節が連続する音節連続を含む上記不要語を挿入して上記文法モデルを生成するものである、
を含むテキスト補正装置。 - 請求項1から3のいずれかに記載のテキスト補正装置であって、
上記認識結果選定部は、上記音声認識結果候補に含まれる音節列である不要語とその不要語に続く単語の音節列とで音節表記が一致している音節の個数を上記類似度として算出するものである、
テキスト補正装置。 - 請求項1から3のいずれかに記載のテキスト補正装置であって、
上記認識結果選定部は、上記音声認識結果候補に含まれる音節列である不要語の音素列とその不要語に続く単語の音節列の音素列との編集距離を上記類似度として算出するものである、
テキスト補正装置。 - 文法生成部が、発話音声を書き起こした書き起こしテキストの形態素解析結果に対して形態素境界毎に不要語を挿入して文法モデルを生成し、
音声認識部が、上記文法モデルを用いて上記発話音声の音声データを音声認識した複数の音声認識結果候補を生成し、
認識結果選定部が、各音声認識結果候補についてその音声認識結果候補に含まれる各不要語の音節列とその不要語に続く単語の音節列との類似度を算出し、その類似度に基づいて上記音声認識結果候補から上記発話音声の音声認識結果を選定する、
テキスト補正方法。 - 請求項1から5のいずれかに記載のテキスト補正装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016131807A JP6552999B2 (ja) | 2016-07-01 | 2016-07-01 | テキスト補正装置、テキスト補正方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016131807A JP6552999B2 (ja) | 2016-07-01 | 2016-07-01 | テキスト補正装置、テキスト補正方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018004947A JP2018004947A (ja) | 2018-01-11 |
JP6552999B2 true JP6552999B2 (ja) | 2019-07-31 |
Family
ID=60944952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016131807A Active JP6552999B2 (ja) | 2016-07-01 | 2016-07-01 | テキスト補正装置、テキスト補正方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6552999B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7159756B2 (ja) | 2018-09-27 | 2022-10-25 | 富士通株式会社 | 音声再生区間の制御方法、音声再生区間の制御プログラムおよび情報処理装置 |
JP7243106B2 (ja) | 2018-09-27 | 2023-03-22 | 富士通株式会社 | 修正候補提示方法、修正候補提示プログラムおよび情報処理装置 |
JP7119857B2 (ja) | 2018-09-28 | 2022-08-17 | 富士通株式会社 | 編集プログラム、編集方法および編集装置 |
CN113836900B (zh) * | 2021-09-24 | 2024-01-26 | 青海民族大学 | 一种基于文法向量乘法的藏文音节校对方法 |
CN116580701B (zh) * | 2023-05-19 | 2023-11-24 | 国网物资有限公司 | 告警音频识别方法、装置、电子设备和计算机介质 |
-
2016
- 2016-07-01 JP JP2016131807A patent/JP6552999B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018004947A (ja) | 2018-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11587569B2 (en) | Generating and using text-to-speech data for speech recognition models | |
CN113168828B (zh) | 基于合成数据训练的会话代理管线 | |
JP7092953B2 (ja) | エンドツーエンドモデルによる多言語音声認識のための音素に基づく文脈解析 | |
JP6552999B2 (ja) | テキスト補正装置、テキスト補正方法、およびプログラム | |
JP4528535B2 (ja) | テキストから単語誤り率を予測するための方法および装置 | |
CN112435654B (zh) | 通过帧插入对语音数据进行数据增强 | |
Gutkin et al. | TTS for low resource languages: A Bangla synthesizer | |
US20080027725A1 (en) | Automatic Accent Detection With Limited Manually Labeled Data | |
WO2018192186A1 (zh) | 语音识别方法及装置 | |
Kurimo et al. | Modeling under-resourced languages for speech recognition | |
CN117099157A (zh) | 用于端到端自动语音识别置信度和删除估计的多任务学习 | |
JP6031316B2 (ja) | 音声認識装置、誤り修正モデル学習方法、及びプログラム | |
JP5180800B2 (ja) | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム | |
Mary et al. | Searching speech databases: features, techniques and evaluation measures | |
JP6631883B2 (ja) | クロスリンガル音声合成用モデル学習装置、クロスリンガル音声合成用モデル学習方法、プログラム | |
JP6183988B2 (ja) | 音声認識装置、誤り修正モデル学習方法、及びプログラム | |
Kayte et al. | Implementation of Marathi Language Speech Databases for Large Dictionary | |
Gutkin et al. | Building statistical parametric multi-speaker synthesis for bangladeshi bangla | |
JP2013117683A (ja) | 音声認識装置、誤り傾向学習方法、及びプログラム | |
JP7146038B2 (ja) | 音声認識システム及び方法 | |
JP5366050B2 (ja) | 音響モデル学習装置、音声認識装置、及び音響モデル学習のためのコンピュータプログラム | |
Qiu et al. | Context-aware neural confidence estimation for rare word speech recognition | |
JP6546070B2 (ja) | 音響モデル学習装置、音声認識装置、音響モデル学習方法、音声認識方法、およびプログラム | |
Baranwal et al. | Improved Mispronunciation detection system using a hybrid CTC-ATT based approach for L2 English speakers | |
Laryea et al. | Automatic Speech Recognition System for Somali in the interest of reducing Maternal Morbidity and Mortality. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180830 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190612 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190703 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6552999 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |