JP6125991B2 - 発音辞書変換モデル作成装置と発音辞書変換装置とそれらの方法と、プログラムとその記録媒体 - Google Patents
発音辞書変換モデル作成装置と発音辞書変換装置とそれらの方法と、プログラムとその記録媒体 Download PDFInfo
- Publication number
- JP6125991B2 JP6125991B2 JP2013266469A JP2013266469A JP6125991B2 JP 6125991 B2 JP6125991 B2 JP 6125991B2 JP 2013266469 A JP2013266469 A JP 2013266469A JP 2013266469 A JP2013266469 A JP 2013266469A JP 6125991 B2 JP6125991 B2 JP 6125991B2
- Authority
- JP
- Japan
- Prior art keywords
- pronunciation
- pronunciation dictionary
- dictionary conversion
- label
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
〔発音辞書変換ラベル整備部〕
図4に、発音辞書変換ラベル整備部110のより具体的な機能構成例を示す。その動作フローを図5に示す。発音辞書変換ラベル整備部110は、形態素解析手段111と、文脈自由文法構築手段112と、文脈自由文法記憶手段113と、最尤系列探索手段114と、ラベル生成手段115と、を備える。
図6に、発音辞書変換モデル学習部140の機能構成例を示す。その動作フローを図7に示す。発音辞書変換モデル学習部140は、素性ベクトル抽出手段141と、発音辞書変換装置モデルパラメータ学習手段142と、を備える。
図8に、この発明の発音辞書変換装置200の機能構成例を示す。その動作フローを図9に示す。発音辞書変換装置200は、発音辞書変換モデル210と、発音辞書素性化部220と、発音変動観測部230と、発音辞書構築部240と、を具備する。
Claims (8)
- 単語系列を構成する元単語と当該元単語の音声データとの組と、発音変動パターンを入力として、上記音声データを、音響モデルと上記発音変動パターンを考慮した文脈自由文法とを用いて音声認識し、上記発音変動パターンに対応した上記元単語と変動後のパターンとの組から成る発音辞書変換ラベルを、上記元単語と上記音声データとの組の数分出力する発音辞書変換ラベル整備部と、
上記発音辞書変換ラベルを入力として、当該発音辞書変換ラベルを構成する元単語の単語情報から抽出した素性ベクトルxを入力した場合に当該発音辞書変換ラベルを構成する変動後のパターンを示す出力ラベルyが出力される条件付き確率P(y|x)を機械学習によってモデル化した発音辞書変換モデルを学習する発音辞書変換モデル学習部と、
を具備する発音辞書変換モデル作成装置。 - 請求項1に記載した発音辞書変換モデル作成装置において、
上記発音辞書変換ラベル整備部は、
上記単語系列から、読み情報付き形態素解析結果を得る形態素解析手段と、
上記読み情報付き形態素解析結果と上記発音変動パターンを入力として、文脈自由文法を構築する文脈自由文法構築手段と、
上記文脈自由文法を記憶する文脈自由文法記憶手段と、
上記元単語の音声データを、音響モデルと上記文脈自由文法を用いて音声認識した最尤系列を出力する最尤系列探索手段と、
上記読み情報付き形態素解析結果と上記最尤系列を入力として、上記元単語と変動後のパターンとから成る発音辞書変換ラベルを生成するラベル生成手段と、
を備えることを特徴とする発音辞書変換モデル作成装置。 - 請求項1又は2に記載した発音辞書変換モデル作成装置において、
上記発音辞書変換モデル学習部は、
上記発音辞書変換ラベルを入力として、当該発音辞書変換ラベルを構成する上記元単語の単語情報から素性ベクトルを抽出し、当該素性ベクトルを入力特徴ベクトルとし、上記変動後のパターンを出力ラベルとする対を学習ラベルとして出力する素性ベクトル抽出手段と、
上記学習ラベルを入力として、上記素性ベクトルを入力特徴ベクトルとして上記出力ラベルが出力される条件付き確率を求めるモデルパラメータである発音辞書変換モデルを、最大エントロピーモデルを用いてモデル化する発音辞書変換装置モデルパラメータ学習手段と、
を備えることを特徴とする発音辞書変換モデル作成装置。 - 請求項1乃至3の発音辞書変換モデル作成装置で作成した発音辞書変換モデルと、
正規の読み仮名のみが付与された変換元発音辞書内の辞書エントリを入力として、当該辞書エントリに対して正規読み素性ベクトルを構築する発音辞書素性化部と、
上記正規読み素性ベクトルを入力として、上記発音辞書変換モデルを用い各発音変動パターンの確率値を求める発音変動観測部と、
上記発音変動パターンの確率値ごとに辞書エントリを配列して発音変動が考慮された発音辞書を構築する発音辞書構築部と、
を具備する発音辞書変換装置。 - 発音辞書変換ラベル整備部が、単語系列を構成する元単語と当該元単語の音声データとの組と、発音変動パターンを入力として、上記音声データを、音響モデルと上記発音変動パターンを考慮した文脈自由文法とを用いて音声認識し、上記発音変動パターンに対応した上記元単語と変動後のパターンとの組から成る発音辞書変換ラベルを、上記元単語と上記音声データとの組の数分出力する発音辞書変換ラベル整備過程と、
発音辞書変換モデル学習部が、上記発音辞書変換ラベルを入力として、当該発音辞書変換ラベルを構成する元単語の単語情報から抽出した素性ベクトルxを入力した場合に当該発音辞書変換ラベルを構成する変動後のパターンを示す出力ラベルyが出力される条件付き確率P(y|x)を機械学習によってモデル化した発音辞書変換モデルを学習する発音辞書変換モデル学習過程と、
を備える発音辞書変換モデル作成方法。 - 発音辞書素性化部が、正規の読み仮名のみが付与された変換元発音辞書内の辞書エントリを入力として、当該辞書エントリに対して正規読み素性ベクトルを構築する発音辞書素性化過程と、
発音変動観測部が、上記正規読み素性ベクトルを入力として、請求項5に記載した発音辞書変換モデル作成方法で作成した発音辞書変換モデルを用い各発音変動パターンの確率値を求める発音変動観測過程と、
発音辞書構築部が、上記発音変動パターンの確率値ごとに辞書エントリを配列して発音変動が考慮された発音辞書を構築する発音辞書構築過程と、
を備える発音辞書変換方法。 - 請求項1乃至3の何れかに記載した発音辞書変換モデル作成装置、請求項4に記載した発音辞書変換装置、の何れかの装置の各部の機能を、コンピュータに実行させるためのプログラム。
- 請求項7に記載した何れかのプログラムを記録したコンピュータで読み取り可能な記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013266469A JP6125991B2 (ja) | 2013-12-25 | 2013-12-25 | 発音辞書変換モデル作成装置と発音辞書変換装置とそれらの方法と、プログラムとその記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013266469A JP6125991B2 (ja) | 2013-12-25 | 2013-12-25 | 発音辞書変換モデル作成装置と発音辞書変換装置とそれらの方法と、プログラムとその記録媒体 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2015121731A JP2015121731A (ja) | 2015-07-02 |
| JP6125991B2 true JP6125991B2 (ja) | 2017-05-10 |
Family
ID=53533377
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2013266469A Expired - Fee Related JP6125991B2 (ja) | 2013-12-25 | 2013-12-25 | 発音辞書変換モデル作成装置と発音辞書変換装置とそれらの方法と、プログラムとその記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6125991B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN113936642B (zh) * | 2021-10-20 | 2025-08-01 | 科大讯飞股份有限公司 | 发音词典构建方法、语音识别方法及相关装置 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6389394B1 (en) * | 2000-02-09 | 2002-05-14 | Speechworks International, Inc. | Method and apparatus for improved speech recognition by modifying a pronunciation dictionary based on pattern definitions of alternate word pronunciations |
| WO2009078256A1 (ja) * | 2007-12-18 | 2009-06-25 | Nec Corporation | 発音変動規則抽出装置、発音変動規則抽出方法、および発音変動規則抽出用プログラム |
-
2013
- 2013-12-25 JP JP2013266469A patent/JP6125991B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2015121731A (ja) | 2015-07-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110782870B (zh) | 语音合成方法、装置、电子设备及存储介质 | |
| JP4968036B2 (ja) | 韻律語グルーピング方法及び装置 | |
| CN108073574A (zh) | 用于处理自然语言以及训练自然语言模型的方法和设备 | |
| JP6810580B2 (ja) | 言語モデル学習装置およびそのプログラム | |
| CN112185361B (zh) | 一种语音识别模型训练方法、装置、电子设备及存储介质 | |
| Bokka et al. | Deep Learning for Natural Language Processing: Solve your natural language processing problems with smart deep neural networks | |
| CN118043885A (zh) | 用于半监督语音识别的对比孪生网络 | |
| Kurimo et al. | Modeling under-resourced languages for speech recognition | |
| CN114662503A (zh) | 一种基于lstm和语法距离的方面级情感分析方法 | |
| CN114896966A (zh) | 一种中文文本语法错误定位方法、系统、设备及介质 | |
| JP5976037B2 (ja) | モデル学習装置、ランキング装置、方法、及びプログラム | |
| Zhao et al. | Tibetan Multi-Dialect Speech and Dialect Identity Recognition. | |
| Pascual et al. | Prosodic break prediction with RNNs | |
| Liu et al. | Paraphrastic language models | |
| JP6125991B2 (ja) | 発音辞書変換モデル作成装置と発音辞書変換装置とそれらの方法と、プログラムとその記録媒体 | |
| JP6558856B2 (ja) | 形態素解析装置、モデル学習装置、及びプログラム | |
| Sakti et al. | Incremental sentence compression using LSTM recurrent networks | |
| JP6067616B2 (ja) | 発話生成手法学習装置、発話生成手法選択装置、発話生成手法学習方法、発話生成手法選択方法、プログラム | |
| JP5860439B2 (ja) | 言語モデル作成装置とその方法、そのプログラムと記録媒体 | |
| CN113035170B (zh) | 一种基于元音和谐的土耳其语的语音识别方法及系统 | |
| JP5744150B2 (ja) | 発話生成装置、方法、及びプログラム | |
| Pala et al. | Unsupervised stemmed text corpus for language modeling and transcription of Telugu broadcast news | |
| JP5959598B2 (ja) | モデル学習装置、ランキング装置、方法、及びプログラム | |
| Abdulhameed | Cross Language Information Transfer Between Modern Standard Arabic and Its Dialects–a Framework for Automatic Speech Recognition System Language Model | |
| Lyes et al. | Building a pronunciation dictionary for the Kabyle language |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160222 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170216 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170307 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170330 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170404 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170406 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6125991 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |
