JP2009129258A - 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置 - Google Patents
形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置 Download PDFInfo
- Publication number
- JP2009129258A JP2009129258A JP2007304663A JP2007304663A JP2009129258A JP 2009129258 A JP2009129258 A JP 2009129258A JP 2007304663 A JP2007304663 A JP 2007304663A JP 2007304663 A JP2007304663 A JP 2007304663A JP 2009129258 A JP2009129258 A JP 2009129258A
- Authority
- JP
- Japan
- Prior art keywords
- kanji
- proficiency level
- word
- analysis
- text data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Electrically Operated Instructional Devices (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】制御部1は、テキストデータに形態素解析を行なう場合、このテキストデータに対応する漢字の習熟度を操作部5を介して取得する。制御部1は、基本単語辞書4aに登録された各単語の漢字で、取得した習熟度よりも高い習熟度の漢字を仮名に変換して解析用辞書に登録する。そして、制御部1は、このような解析用辞書の登録内容に基づく形態素解析を前記テキストデータに実行する。
【選択図】図1
Description
以下に、本発明に係る形態素解析装置を、実施形態1を示す図面に基づいて詳述する。図1は本発明に係る形態素解析装置の構成例を示すブロック図である。本発明に係る形態素解析装置10は、例えば公知のパーソナルコンピュータであり、制御部1、ROM2、RAM3、HDD4、操作部5、表示部6等を備え、これらのハードウェア各部はそれぞれバス1aを介して相互に接続されている。
形態素解析部14は、テキスト読込部13によってRAM3に読み込まれたテキストデータに対して、辞書変換部12によって生成された解析用辞書4cの登録内容に基づく形態素解析を行なう。
以下に、本発明に係る形態素解析装置を、実施形態2を示す図面に基づいて詳述する。なお、本実施形態2の形態素解析装置は、上述した実施形態1の形態素解析装置10と同様の構成によって実現することができるので、同様の構成については同一の符号を付して説明を省略する。
本実施形態2の形態素解析装置10では、制御部1は、テキスト読込部13によってRAM3に読み込まれたテキストデータに含まれる各漢字の習熟度に基づいて、このテキストデータに対する漢字の習熟度を検出するように構成されている。
以下に、本発明に係る形態素解析装置を備えた本発明に係る音声合成装置及び音声照合装置を、実施形態3である音読練習支援装置を示す図面に基づいて詳述する。なお、本実施形態3の音読練習支援装置は、上述した実施形態1の形態素解析装置10の構成を備えており、同様の構成については同一の符号を付して説明を省略する。
音声出力部8は、音声増幅回路及びスピーカ等を備えており、例えばRAM3又はHDD4に記憶されている音声信号(音声波形)に基づく音声を出力する。
テキストデータに形態素解析を行なう形態素解析装置において、
漢字の習熟度を受け付ける習熟度受付手段と、
習熟度毎に複数の漢字を記憶してある漢字記憶手段と、
複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段と、
前記漢字記憶手段の記憶内容に基づいて、前記単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断する判断手段と、
該判断手段によって前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換手段と、
該変換手段が変換した各単語を記憶する解析用辞書記憶手段と、
該解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なう手段と
を備えることを特徴とする形態素解析装置。
前記テキストデータに含まれる漢字を抽出する手段と、
抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出する手段と、
検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定する手段とを備え、
前記習熟度受付手段は、特定された習熟度を受け付けるように構成されていることを特徴とする付記1に記載の形態素解析装置。
前記単語辞書記憶手段は、各単語に対応付けて、各単語に含まれる漢字の仮名への変換を許可又は禁止する情報を記憶する構成としてあり、
前記単語辞書記憶手段の記憶内容に基づいて、前記判断手段によって前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を含む単語が、仮名への変換が許可された単語であるか否かを判断する手段を備え、
前記変換手段は、仮名への変換が許可された単語であると判断された場合、前記漢字を前記単語辞書記憶手段に記憶してある仮名に変換するように構成してあることを特徴とする付記1又は2に記載の形態素解析装置。
テキストデータに形態素解析を行なう形態素解析方法において、
漢字の習熟度を受け付ける習熟度受付ステップと、
習熟度毎に複数の漢字を記憶してある漢字記憶手段の記憶内容に基づいて、複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断するステップと、
前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換ステップと、
該変換ステップで変換した各単語を解析用辞書記憶手段に記憶させるステップと、
前記解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なうステップと
を含むことを特徴とする形態素解析方法。
前記テキストデータに含まれる漢字を抽出するステップと、
抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出するステップと、
検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定するステップとを含み、
前記習熟度受付ステップは、特定された習熟度を受け付けることを特徴とする付記4に記載の形態素解析方法。
前記単語辞書記憶手段には、各単語に対応付けて、各単語に含まれる漢字の仮名への変換を許可又は禁止する情報が記憶してあり、
前記単語辞書記憶手段の記憶内容に基づいて、前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を含む単語が、仮名への変換が許可された単語であるか否かを判断するステップを含み、
前記変換ステップは、仮名への変換が許可された単語であると判断された場合、前記漢字を前記単語辞書記憶手段に記憶してある仮名に変換することを特徴とする付記4又は5に記載の形態素解析方法。
コンピュータに、テキストデータに形態素解析を行なわせるためのコンピュータプログラムにおいて、
習熟度毎に複数の漢字を記憶してある漢字記憶手段と、複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段とを備えるコンピュータに、
前記漢字記憶手段の記憶内容に基づいて、前記単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、予め取得しておいた習熟度よりも高い習熟度の漢字であるか否かを判断するステップと、
予め取得しておいた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換ステップと、
該変換ステップで変換した各単語を解析用辞書記憶手段に記憶させるステップと、
前記解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なうステップと
を実行させるためのコンピュータプログラム。
前記コンピュータに、
前記テキストデータに含まれる漢字を抽出するステップと、
抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出するステップと、
検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定するステップと、
特定した習熟度を取得するステップと
を実行させるための付記7に記載のコンピュータプログラム。
前記コンピュータに、取得しておいた習熟度よりも高い習熟度の漢字であると判断された漢字を含む単語が、該単語に含まれる漢字の仮名への変換が許可された単語であるか否かを判断するステップを実行させ、
前記変換ステップは、仮名への変換が許可された単語であると判断された場合、前記漢字を前記単語辞書記憶手段に記憶してある仮名に変換することを特徴とする付記7又は8に記載のコンピュータプログラム。
テキストデータから合成音声を生成する音声合成装置において、
付記1乃至3のいずれかひとつに記載の形態素解析装置と、
該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成する音素列生成手段と、
該音素列生成手段が生成した音素列情報に基づいて合成音声を生成する合成音声生成手段と
を備えることを特徴とする音声合成装置。
予め用意された音声情報と照合対象の音声情報とを照合する音声照合装置において、
付記1乃至3のいずれかひとつに記載の形態素解析装置と、
該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成する音素列生成手段と、
該音素列生成手段が生成した音素列情報における音響パラメータを生成する音響パラメータ生成手段と、
外部から音声情報を取得する音声情報取得手段と、
該音声情報取得手段が取得した音声情報から音響パラメータを抽出する音響パラメータ抽出手段と、
前記音響パラメータ生成手段が生成した音響パラメータ及び前記音響パラメータ抽出手段が抽出した音響パラメータを照合する照合手段と
を備えることを特徴とする音声照合装置。
前記照合手段による照合結果を出力する手段を備えることを特徴とする付記11に記載の音声照合装置。
1 制御部
11 漢字習熟度受付部(習熟度受付手段)
12 辞書変換部(判断手段、変換手段)
4 HDD(単語辞書記憶手段、漢字記憶手段、解析用辞書記憶手段)
4a 基本単語辞書
4b 習熟度別漢字リスト
4c 解析用辞書
21 音素列生成部(音素列生成手段)
22 音声合成部(合成音声生成手段)
24 音声照合部(音響パラメータ抽出手段、音響パラメータ生成手段、照合手段)
26 ユーザインタフェース部(音声情報取得手段)
Claims (7)
- テキストデータに形態素解析を行なう形態素解析装置において、
漢字の習熟度を受け付ける習熟度受付手段と、
習熟度毎に複数の漢字を記憶してある漢字記憶手段と、
複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段と、
前記漢字記憶手段の記憶内容に基づいて、前記単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断する判断手段と、
該判断手段によって前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換手段と、
該変換手段が変換した各単語を記憶する解析用辞書記憶手段と、
該解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なう手段と
を備えることを特徴とする形態素解析装置。 - 前記テキストデータに含まれる漢字を抽出する手段と、
抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出する手段と、
検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定する手段とを備え、
前記習熟度受付手段は、特定された習熟度を受け付けるように構成されていることを特徴とする請求項1に記載の形態素解析装置。 - テキストデータに形態素解析を行なう形態素解析方法において、
漢字の習熟度を受け付ける習熟度受付ステップと、
習熟度毎に複数の漢字を記憶してある漢字記憶手段の記憶内容に基づいて、複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断するステップと、
前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換ステップと、
該変換ステップで変換した各単語を解析用辞書記憶手段に記憶させるステップと、
前記解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なうステップと
を含むことを特徴とする形態素解析方法。 - コンピュータに、テキストデータに形態素解析を行なわせるためのコンピュータプログラムにおいて、
習熟度毎に複数の漢字を記憶してある漢字記憶手段と、複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段とを備えるコンピュータに、
前記漢字記憶手段の記憶内容に基づいて、前記単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、予め取得しておいた習熟度よりも高い習熟度の漢字であるか否かを判断するステップと、
予め取得しておいた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換ステップと、
該変換ステップで変換した各単語を解析用辞書記憶手段に記憶させるステップと、
前記解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なうステップと
を実行させるためのコンピュータプログラム。 - 前記コンピュータに、
前記テキストデータに含まれる漢字を抽出するステップと、
抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出するステップと、
検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定するステップと、
特定した習熟度を取得するステップと
を実行させるための請求項4に記載のコンピュータプログラム。 - テキストデータから合成音声を生成する音声合成装置において、
請求項1又は2に記載の形態素解析装置と、
該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成する音素列生成手段と、
該音素列生成手段が生成した音素列情報に基づいて合成音声を生成する合成音声生成手段と
を備えることを特徴とする音声合成装置。 - 予め用意された音声情報と照合対象の音声情報とを照合する音声照合装置において、
請求項1又は2に記載の形態素解析装置と、
該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成する音素列生成手段と、
該音素列生成手段が生成した音素列情報における音響パラメータを生成する音響パラメータ生成手段と、
外部から音声情報を取得する音声情報取得手段と、
該音声情報取得手段が取得した音声情報から音響パラメータを抽出する音響パラメータ抽出手段と、
前記音響パラメータ生成手段が生成した音響パラメータ及び前記音響パラメータ抽出手段が抽出した音響パラメータを照合する照合手段と
を備えることを特徴とする音声照合装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007304663A JP5088109B2 (ja) | 2007-11-26 | 2007-11-26 | 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007304663A JP5088109B2 (ja) | 2007-11-26 | 2007-11-26 | 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009129258A true JP2009129258A (ja) | 2009-06-11 |
JP5088109B2 JP5088109B2 (ja) | 2012-12-05 |
Family
ID=40820098
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007304663A Expired - Fee Related JP5088109B2 (ja) | 2007-11-26 | 2007-11-26 | 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5088109B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013218001A (ja) * | 2012-04-05 | 2013-10-24 | Nintendo Co Ltd | 情報処理プログラム、情報処理装置、情報処理方法及び情報処理システム |
JP2014089443A (ja) * | 2012-10-03 | 2014-05-15 | Tottori Univ | 文字音読指導装置および文字音読指導プログラム |
JP2014174307A (ja) * | 2013-03-08 | 2014-09-22 | Kikuichi Nishi | 話し言葉表示処理装置 |
JP2018133026A (ja) * | 2017-02-17 | 2018-08-23 | コニカミノルタ株式会社 | 文書変換装置及び文書変換プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08235197A (ja) * | 1995-02-23 | 1996-09-13 | Matsushita Electric Ind Co Ltd | 文字列管理装置及び辞書管理装置 |
JP2001034611A (ja) * | 1999-05-18 | 2001-02-09 | Fujitsu Ltd | 読み情報出力装置および記録媒体 |
-
2007
- 2007-11-26 JP JP2007304663A patent/JP5088109B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08235197A (ja) * | 1995-02-23 | 1996-09-13 | Matsushita Electric Ind Co Ltd | 文字列管理装置及び辞書管理装置 |
JP2001034611A (ja) * | 1999-05-18 | 2001-02-09 | Fujitsu Ltd | 読み情報出力装置および記録媒体 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013218001A (ja) * | 2012-04-05 | 2013-10-24 | Nintendo Co Ltd | 情報処理プログラム、情報処理装置、情報処理方法及び情報処理システム |
US10096257B2 (en) | 2012-04-05 | 2018-10-09 | Nintendo Co., Ltd. | Storage medium storing information processing program, information processing device, information processing method, and information processing system |
JP2014089443A (ja) * | 2012-10-03 | 2014-05-15 | Tottori Univ | 文字音読指導装置および文字音読指導プログラム |
JP2014174307A (ja) * | 2013-03-08 | 2014-09-22 | Kikuichi Nishi | 話し言葉表示処理装置 |
JP2018133026A (ja) * | 2017-02-17 | 2018-08-23 | コニカミノルタ株式会社 | 文書変換装置及び文書変換プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5088109B2 (ja) | 2012-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1096472B1 (en) | Audio playback of a multi-source written document | |
US7809572B2 (en) | Voice quality change portion locating apparatus | |
US7277851B1 (en) | Automated creation of phonemic variations | |
US6424935B1 (en) | Two-way speech recognition and dialect system | |
US6327566B1 (en) | Method and apparatus for correcting misinterpreted voice commands in a speech recognition system | |
US6876967B2 (en) | Speech complementing apparatus, method and recording medium | |
US20020123894A1 (en) | Processing speech recognition errors in an embedded speech recognition system | |
JP2007206317A (ja) | オーサリング方法、オーサリング装置およびプログラム | |
CN110797006A (zh) | 端到端的语音合成方法、装置及存储介质 | |
Davel et al. | Pronunciation dictionary development in resource-scarce environments | |
WO2010136821A1 (en) | Electronic reading device | |
JP5088109B2 (ja) | 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置 | |
JP2010197644A (ja) | 音声認識システム | |
JP2010117528A (ja) | 声質変化判定装置、声質変化判定方法、声質変化判定プログラム | |
JP2016045467A (ja) | 発話評価装置、発話評価方法、及びプログラム | |
JPH06282290A (ja) | 自然言語処理装置およびその方法 | |
US6772116B2 (en) | Method of decoding telegraphic speech | |
JP2003162524A (ja) | 言語処理装置 | |
JP4026512B2 (ja) | 歌唱合成用データ入力プログラムおよび歌唱合成用データ入力装置 | |
JP6340839B2 (ja) | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム | |
JP2580568B2 (ja) | 発音辞書更新装置 | |
JP5125404B2 (ja) | 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置 | |
JP7244473B2 (ja) | 学習装置、予測装置、学習方法および学習プログラム | |
JP2000003355A (ja) | 中国語入力変換処理装置、同装置に用いられる新語登録方法及び記録媒体 | |
JP2023006055A (ja) | プログラム、情報処理装置、方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120718 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120814 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120827 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150921 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |