JP5088109B2 - 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置 - Google Patents

形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置 Download PDF

Info

Publication number
JP5088109B2
JP5088109B2 JP2007304663A JP2007304663A JP5088109B2 JP 5088109 B2 JP5088109 B2 JP 5088109B2 JP 2007304663 A JP2007304663 A JP 2007304663A JP 2007304663 A JP2007304663 A JP 2007304663A JP 5088109 B2 JP5088109 B2 JP 5088109B2
Authority
JP
Japan
Prior art keywords
kanji
proficiency level
analysis
word
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007304663A
Other languages
English (en)
Other versions
JP2009129258A (ja
Inventor
伸之 片江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007304663A priority Critical patent/JP5088109B2/ja
Publication of JP2009129258A publication Critical patent/JP2009129258A/ja
Application granted granted Critical
Publication of JP5088109B2 publication Critical patent/JP5088109B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、テキストデータに形態素解析を行なう形態素解析装置、形態素解析方法、前記形態素解析装置をコンピュータによって実現するためのコンピュータプログラム、前記形態素解析装置を備えた音声合成装置、及び前記形態素解析装置を備えた音声照合装置に関する。
日本語文書のテキストデータを単語(形態素)に分割する形態素解析技術は、音声合成システム、音声照合システム、テキスト検索システム、文書作成システム等に広く利用されている。形態素解析処理は、その結果が各システムにおけるその後の処理に大きな影響を与えるため、高い精度を確保することが必要とされている。形態素解析処理は通常、各単語(形態素)の表記及び品詞情報が対応付けて登録してある単語辞書を用い、単語辞書に登録されている各単語の表記とテキストデータとを照合し、また、各単語の品詞情報を用いて日本語の文法として不都合がないような尤もらしい単語の組み合わせを選択し、テキストデータを形態素に分割する。なお、効率的に形態素解析を行なうアルゴリズムとしては、例えばViterbi(ビタビ)アルゴリズムが知られている。
ところで、解答者(児童)が自分で文字を書いて解答することによる学習効果の向上が期待されており、また、学習教材としてIT(Information Technology)を用いた様々な電子教材の導入が試行されている。例えば、タブレット型のコンピュータを用い、モニタに表示された教材に対して手書きで解答入力できるシステムが普及しており、このようなコンピュータ及び手書き文字の認識技術を用いた漢字の書き取り、算数の筆算の練習等では、一定の効果が得られることが実証されている。
また、国語教育においては、児童が学習教材となる日本語テキストの音読の練習をする場合に、音声合成技術を用いてお手本としてテキストの読み上げを行ない、また、音声照合技術を用いて児童が正しく音読できているか否かを自動評価する等、音声合成技術及び音声照合技術等を利用した学習支援システムも考えられるであろう。
ここで、例えば小学校低学年以下の児童向けの学習教材では、多くの漢字が未学習であるため仮名(特に平仮名)が多用されている場合が多く、仮名が多用されたテキストデータに対して一般的な形態素解析処理を行なった場合、解析誤りが生じ易い。このように誤りを含む形態素解析結果を音声合成システムに用いた場合、読み又はアクセントの誤り、不自然な区切り及び韻律等を有する合成音声を生成してしまう可能性が高い。また、誤りを含む形態素解析結果を音声照合システムにおける音読の自動評価に用いた場合、入力された音声と照合するための音素列又は韻律パターンに誤りが生じる可能性があり、入力された音声に対して正確な評価ができない場合がある。
仮名が多用されたテキストデータに対する形態素解析において解析誤りが生じ易い理由としては、形態素解析に用いる単語辞書には通常、各単語が一般的に使用される表記(漢字、平仮名及び片仮名を含む表記)のみが登録されており、各単語の仮名表記は登録されていないことが挙げられる。即ち、仮名で表記された単語は、単語辞書に登録されていないと判断される可能性があり、この場合、この単語は未知語(未登録語)として扱われる虞がある。
従って、このような問題を解消するために、単語辞書に各単語の仮名表記を登録することが考えられるが、単語辞書に登録される全ての単語の仮名表記を登録するとなると、同一の表記(仮名表記)であっても異なる単語が多数単語辞書に登録されてしまい、形態素解析全体の精度を低下させる虞が生じる。また、単語辞書には児童にとっては難解な漢字を用いる単語が多数登録されているが、児童向けの学習教材に、このような単語を仮名表記で用いることは少ないので、このような単語の仮名表記を単語辞書に登録することは、児童向けのテキストデータに対する形態素解析には不要である場合が多い。
また、形態素解析では、テキストデータの文字列に部分一致する全ての単語を単語辞書から検出し、検出した単語の中から文法的な制約及び表記の長い単語の優先等の所定の法則を用いて、尤もらしい単語の組み合わせを決定するという方法を採る場合が多い。従って、仮名が多用されたテキストデータに対して形態素解析を行なう際には、テキストデータ中の文字列と部分一致する単語が多くなり、結果として、誤った単語を形態素解析の結果としてしまう可能性が高くなる。例えば、「ふさがない」という平仮名のテキストデータに対して形態素解析を行なった場合、「塞がない」又は「房がない」と解析できるため、不適切な形態素結果を出力してしまう可能性がある。
特許文献1には、漢字レベルに対応した漢字情報を管理しておき、かな文字列を漢字かな混じり文字列に変換する際に、学習レベルに応じて設定された漢字レベルの漢字を用いた漢字かな混じり文字列に変換する日本語処理装置が開示されている。また、特許文献2には、かな漢字辞書に登録してある各漢字に対して、それぞれの難易度により定めた教育レベルを管理しており、ひらがなを漢字を含む文字列に変換する際に、設定された教育レベルよりも高レベルの漢字については、漢字以外の文字列への修正又はふり仮名の付加を行なう文書作成編集方法が開示されている。
特開平2−288945号公報 特開平3−85666号公報
上述した特許文献1,2では、かな文字列を漢字かな混じり文字列に変換する際に、設定された漢字レベルの漢字を用い、設定された漢字レベル以上の漢字については漢字以外の文字列を用いることにより、ユーザの学習レベル(漢字レベル)に応じた変換処理を行なうことができる。しかし、特許文献1,2は、形態素解析に用いる単語辞書には各単語が一般的に使用される表記で登録されているため、上述したように仮名が多用されているテキストデータに対する形態素解析において解析誤りが生じ易いという課題を解消するものではなかった。
本発明は斯かる事情に鑑みてなされたものであり、その目的とするところは、仮名を多用したテキストデータに対しても解析誤りを低減した高精度の形態素解析が可能な形態素解析装置、形態素解析方法、コンピュータプログラム、前記形態素解析装置を備えた音声合成装置、及び前記形態素解析装置を備えた音声照合装置を提供することにある。
本発明の他の目的は、形態素解析の処理対象のテキストデータに実際に用いられている漢字に割り当てられた習熟度に応じた解析用辞書を用いることにより、所定の習熟度以下の漢字を用いたテキストデータ、即ち、所定の習熟度よりも高い習熟度の漢字を用いないテキストデータに対して高精度の形態素解析が可能な形態素解析装置及びコンピュータプログラムを提供することにある。
本発明に係る形態素解析装置は、テキストデータに形態素解析を行なう形態素解析装置において、漢字の習熟度毎に複数の漢字を漢字記憶手段に記憶しており、複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて単語辞書記憶手段に記憶している。形態素解析装置は、例えばテキストデータおよびユーザに対応する漢字の習熟度を受け付けた場合、漢字記憶手段の記憶内容に基づいて、単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断し、受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を、単語辞書記憶手段に記憶してある仮名に変換して解析用辞書記憶手段に記憶させる。そして、形態素解析装置は、このような解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なう。よって、テキストデータに対して形態素解析を行なう際に、設定された習熟度以下の漢字のみを用いた表記で各単語が登録してある解析用辞書記憶手段の登録内容に基づいて、設定された習熟度以下の漢字を用いたテキストデータ、即ち、設定された習熟度よりも高い習熟度の漢字を用いないテキストデータに対して精度の高い形態素解析を実行することが可能となる。
本発明に係る形態素解析装置は、形態素解析の処理対象のテキストデータに含まれる漢字を抽出し、抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出し、検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定する。そして、形態素解析装置は、漢字記憶手段の記憶内容に基づいて、単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、特定された習熟度よりも高い習熟度の漢字であるか否かを判断し、特定された習熟度よりも高い習熟度の漢字であると判断された漢字を、単語辞書記憶手段に記憶してある仮名に変換して解析用辞書記憶手段に記憶させる。また、形態素解析装置は、このような解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なう。よって、テキストデータに対して形態素解析を行なう際に、テキストデータに用いられている各漢字の習熟度に基づいてテキストデータに対する習熟度を特定し、特定された習熟度以下の漢字のみを用いた表記で各単語が登録してある解析用辞書記憶手段の登録内容に基づいて、特定された習熟度以下の漢字を用いたテキストデータ、即ち、特定された習熟度よりも高い習熟度の漢字を用いないテキストデータに対して精度の高い形態素解析を実行することが可能となる。
本発明に係る形態素解析装置は、単語辞書記憶手段に、各単語に対応付けて、各単語に含まれる漢字の仮名への変換を許可又は禁止する情報を記憶してあり、単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、受け付けた習熟度よりも高い習熟度の漢字であると判断した場合、単語辞書記憶手段の記憶内容に基づいて、この漢字を含む単語が、仮名への変換が許可された単語であるか否かを判断する。形態素解析装置は、仮名への変換が許可された単語であると判断した場合、前記漢字を、単語辞書記憶手段に記憶してある仮名に変換して解析用辞書記憶手段に記憶させる。よって、形態素解析に用いる解析用辞書記憶手段に記憶される各単語の表記について、仮名に変換すべき単語と、仮名に変換すべきでない単語とを設定することが可能となる。
本発明に係るコンピュータプログラムは、コンピュータに読み取らせて実行させることにより、上述したような形態素解析装置をコンピュータによって実現することが可能となる。
本発明に係る音声合成装置は、テキストデータから合成音声を生成する音声合成装置において、上述したいずれかの形態素解析装置を備え、該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成し、生成した音素列情報に基づいて合成音声を生成する。よって、仮名を多用したテキストデータ、具体的には、所定の習熟度以下の漢字を用いたテキストデータ及び所定の習熟度よりも高い習熟度の漢字を用いないテキストデータに対して行なった精度の高い形態素解析の結果を用いて、精度の高い合成音声を生成することが可能となる。
本発明に係る音声照合装置は、予め用意された音声情報と照合対象の音声情報とを照合する音声照合装置において、上述したいずれかの形態素解析装置を備え、該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成し、生成した音素列情報における音響パラメータを生成する。また、音声照合装置は、外部から音声情報を取得し、取得した音声情報から音響パラメータを抽出し、形態素解析の結果に基づいて生成した音響パラメータと、外部から取得した音声情報から抽出した音響パラメータとを照合する。よって、仮名を多用したテキストデータ、具体的には、所定の習熟度以下の漢字を用いたテキストデータ及び所定の習熟度よりも高い習熟度の漢字を用いないテキストデータに対して行なった精度の高い形態素解析の結果を用いて、精度の高い音声照合を行なうことが可能となる。
本発明に係る音声照合装置は、照合結果を出力する手段を備えることにより、外部から取得した音声情報が適切であるか否かを外部へ通知することが可能となる。
本発明では、テキストデータに対して形態素解析を行なう際に、一般的に使用される表記で各単語が登録されている単語辞書を、例えばテキストデータ又はユーザに対応する習熟度の漢字のみを使用した表記で各単語が登録されている解析用辞書に変換する。具体的には、形態素解析装置は、単語辞書に記憶してある単語に含まれる各漢字の習熟度が、テキストデータ又はユーザに対応する習熟度よりも高い場合、この漢字を仮名に変換して解析用辞書に登録する。このような解析用辞書の登録内容に基づいてテキストデータに形態素解析を行なうことにより、所定の習熟度以下の漢字を用いたテキストデータ、即ち、所定の習熟度よりも高い習熟度の漢字を用いないテキストデータに対する解析誤りを低減することができる。
本発明では、テキストデータに対して形態素解析を行なう際に、形態素解析の処理対象のテキストデータに含まれる各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定し、特定された習熟度の漢字のみを使用した表記で各単語が登録されている解析用辞書を生成する。具体的には、形態素解析装置は、単語辞書に記憶してある単語に含まれる各漢字の習熟度が、特定された習熟度よりも高い場合、この漢字を仮名に変換して解析用辞書に登録する。これにより、各テキストデータに実際に用いられている漢字の習熟度に応じた解析用辞書を生成することができ、このような解析用辞書の登録内容に基づいてテキストデータに形態素解析を行なうことにより、各テキストデータに対する解析誤りを低減することができる。
本発明では、単語辞書に各単語の表記に含まれる漢字の仮名への変換を許可又は禁止する情報が記憶されており、各漢字を仮名に変換して解析用辞書を生成する際に、各漢字を含む単語が仮名への変換が許可された単語であるか否かを判断し、仮名への変換が許可された単語である場合にのみ、この漢字を仮名に変換して解析用辞書に登録する。例えば、対策の「策」や戸籍の「籍」などの公式な場面で多く使われる漢字は、仮名で用いる可能性が低く、また、このような漢字を仮名に変換して解析用辞書に登録した場合、同一の仮名表記によって解析誤りが増加する虞がある。従って、本発明では、形態素解析に用いる解析用辞書記憶手段に記憶される各単語の表記について、仮名に変換すべき単語と、仮名に変換すべきでない単語とを設定し、仮名で用いる可能性が低い漢字は仮名に変換しないことにより、精度の高い形態素解析の実行を可能とする。
本発明では、上述したように、仮名を多用したテキストデータ、具体的には、所定の習熟度以下の漢字を用いたテキストデータ、所定の習熟度よりも高い習熟度の漢字を用いないテキストデータに対して精度の高い形態素解析を行なって得られた情報に基づいて、適切な音素列情報を生成することができ、また、適切な音素列情報に基づいて適切な合成音声を生成することができるので、高精度及び高品質の合成音声を生成することができる。
本発明では、上述したように、仮名を多用したテキストデータ、具体的には、所定の習熟度以下の漢字を用いたテキストデータ、所定の習熟度よりも高い習熟度の漢字を用いないテキストデータに対して精度の高い形態素解析を行なって得られた情報に基づいて、適切な音素列情報を生成し、生成した音素列情報における音響パラメータを生成する。従って、音声照合装置は、適切に生成された音響パラメータと、外部から取得した音声情報から抽出した音響パラメータとを照合するので、高精度の照合結果を得ることができる。なお、照合結果を外部へ出力することにより、外部から取得した音声情報が適切であるか否かを外部へ通知することができる。
以下に、本発明に係る形態素解析装置、音声合成装置及び音声照合装置を、各実施形態を示す図面に基づいて詳述する。なお、以下の各実施形態では、本発明に係るコンピュータプログラムを公知のパーソナルコンピュータ等に読み取らせ、パーソナルコンピュータのCPU等によって実行させることによって本発明に係る形態素解析装置を実現する構成について説明する。しかし、等価な働きをするハードウェアによって本発明に係る形態素解析装置を実現してもよい。
(実施形態1)
以下に、本発明に係る形態素解析装置を、実施形態1を示す図面に基づいて詳述する。図1は本発明に係る形態素解析装置の構成例を示すブロック図である。本発明に係る形態素解析装置10は、例えば公知のパーソナルコンピュータであり、制御部1、ROM2、RAM3、HDD4、操作部5、表示部6等を備え、これらのハードウェア各部はそれぞれバス1aを介して相互に接続されている。
制御部1は、CPU(Central Processing Unit )又はMPU(Micro Processor Unit)等で構成され、ROM2又はHDD4に予め記憶してある制御プログラムを適宜RAM3に読み出して実行すると共に、上述したハードウェア各部の動作を制御する。ROM2には、形態素解析装置10を本発明の形態素解析装置として動作させるために必要な種々の制御プログラムが予め格納されている。RAM3はSRAM又はフラッシュメモリ等で構成されており、制御部1による制御プログラムの実行時に発生する種々のデータを一時的に記憶する。
HDD4は大容量の記憶装置であり、HDD(単語辞書記憶手段、漢字記憶手段)4には、形態素解析装置10を本発明の形態素解析装置として動作させるために必要な種々の制御プログラム、テキストデータ、図2に示すような基本単語辞書4a、図3に示すような習熟度別漢字リスト4b、ユーザに対して各種の情報を通知するための画面情報等が予め記憶されている。なお、基本単語辞書4a及び習熟度別漢字リスト4bの登録内容の詳細については後述する。
なお、基本単語辞書4a及び習熟度別漢字リスト4bは、HDD4に予め格納されているだけでなく、形態素解析装置10が外部メモリ(図示せず)に記憶してあるデータの読み出しが可能なドライバ(図示せず)を備える場合には、外部メモリに記憶された各種情報をドライバによって読み出してHDD4に格納させてもよい。また、形態素解析装置10がインターネットのようなネットワークとの接続が可能な通信部(図示せず)を備える場合には、ネットワークを介して外部の装置から各種情報をダウンロードしてHDD4に格納させてもよい。また、HDD4に記憶してあるテキストデータは、形態素解析装置10で作成されたテキストデータであってもよく、外部の装置で作成されて外部メモリ(図示せず)又はネットワーク(図示せず)を介して形態素解析装置10に読み取らせたテキストデータであってもよい。
操作部5及び表示部6は、デジタイザ又はタブレット等を構成する。具体的には、表示部6は、例えば液晶ディスプレイであり、制御部1からの指示に従って、形態素解析装置10の動作状態、操作部5を介して入力された情報、ユーザに対して通知すべき情報、ユーザが形態素解析装置10を操作するために必要な操作キー等を表示する。操作部5は、例えばスタイラスペン又はマウス等である。ユーザが表示部6に表示された操作キーを操作部5によって操作した場合、操作部5は操作された操作キーに対応した制御信号を制御部1へ送出し、制御部1は操作部5から取得した制御信号に対応した処理を実行する。
図2は基本単語辞書4aの登録内容を示す模式図であり、登録されている単語の一部を例示している。図2に示すように、基本単語辞書4aには、各単語について、表記、読みアクセント情報、品詞情報、表記に含まれる漢字の仮名への変換を許可又は禁止する変換可否情報、及び表記に含まれる漢字とその仮名(平仮名)とを対応させる漢字かな対応情報がそれぞれ登録されている。基本単語辞書4aの表記の欄には、各単語が一般的に使用される表記(漢字、平仮名及び片仮名を含む表記)が登録されている。
基本単語辞書4aの読みアクセント情報の欄には、各単語の読み及びアクセントの情報が登録されている。図2に示した基本単語辞書4aでは、読みの情報として各単語の片仮名表記が登録されると共に、アクセントの情報として各単語のアクセントの位置を「’」で示している。なお、図2に示した基本単語辞書4aでは、各単語の読みの情報として片仮名表記を用いているため、例えば「童話」の読みアクセント情報として「ドーワ」が登録されているが、読みアクセント情報の表記はこれに限られず、例えば「do−wa」のようにローマ字表記を用いることもできる。
また、基本単語辞書4aの品詞情報の欄には、普通名詞、サ行五段動詞語幹(サ行五段活用の動詞の語幹)、サ行五段動詞連用形(サ行五段活用の動詞の連用形)等、日本語の文法に従った品詞分類が登録されている。なお、品詞分類は形態素解析装置によって若干の違いがあり、形態素解析装置10に合わせた品詞分類を登録すればよい。基本単語辞書4aの変換可否情報の欄には、各単語の表記に含まれる漢字の仮名への変換を許可する場合には「可」が登録され、許可しない(禁止する)場合には「否」が登録されている。
図2に示した基本単語辞書4aでは、「童話」、「電話」、「話」のように比較的容易で平仮名表記でも用いられる単語については「可」が登録されており、「閑話」、「話術」のように比較的難解で平仮名表記で用いられる可能性の低い単語については「否」が登録されている。基本単語辞書4aの漢字かな対応情報の欄には、変換可否情報として「可」が登録された各単語について、表記に含まれる各漢字と、各漢字の仮名(ここでは平仮名)とが対応付けて登録されている。
図3は習熟度別漢字リスト4bの登録内容を示す模式図である。図3に示すように、習熟度別漢字リスト4bには、習熟度毎に複数の漢字が登録されている。例えば、習熟度2には「話」、「電」、「読」等の漢字が登録されており、習熟度3には「童」、「鉄」、「習」等の漢字が登録されている。なお、習熟度は、予め設定された漢字の難易度の基準において、どのレベルの漢字を習熟しているかを示す情報であり、例えば小学校及び中学校における各学年に対応する数値を用いることができる。従って、例えば小学校1年生の習熟度を習熟度1とした場合、習熟度1に対応する漢字として、小学校1年生で学習する漢字を登録しておけばよい。
以下に、上述した構成の形態素解析装置10において、制御部1がROM2又はHDD4に記憶してある制御プログラムを実行することによって実現される各種の機能について説明する。図4は実施形態1の形態素解析装置10の機能構成例を示す機能ブロック図である。本実施形態1の形態素解析装置10において、制御部1は、ROM2又はHDD4に記憶してある制御プログラムを実行することによって、漢字習熟度受付部11、辞書変換部12、テキスト読込部13、形態素解析部14、形態素解析結果出力部15等の各機能を実現する。
本実施形態1の形態素解析装置10では、ユーザは、形態素解析装置10によってテキストデータに対して形態素解析を行なう場合、各テキストデータに相当する漢字の習熟度を操作部5を介して入力する。漢字習熟度受付部(習熟度受付手段)11は、操作部5を介してユーザが入力した漢字の習熟度を受け付け、受け付けた習熟度を辞書変換部12へ送出する。なお、ユーザが入力する漢字の習熟度は、習熟度別漢字リスト4bにおける習熟度であり、例えば小学校及び中学校における各学年自体であってもよく、各学年に相当する何らかの数値又は情報であってもよい。
辞書変換部12は、基本単語辞書4aに登録されている単語のうちで仮名への変換が許可された単語について、漢字習熟度受付部11を介してユーザが入力した習熟度よりも高い習熟度の漢字が表記に含まれている場合に、その漢字を平仮名に変換し、解析用辞書4cに登録する。なお、辞書変換部12は、平仮名への変換が禁止された単語については、解析用辞書4cへの登録を行なわず、基本単語辞書4aに登録されている単語のうちで漢字を含まない単語については、そのまま解析用辞書4cに登録する。
このように平仮名への変換が禁止された単語を解析用辞書4cへ登録しない構成であっても、このような単語は、該単語に含まれる漢字の習熟度よりも低い習熟度に相当するテキストデータにおいて平仮名表記で用いられる可能性が低いため、問題が生じる可能性は低い。
具体的には、辞書変換部12は、基本単語辞書4aに登録されている単語を1つずつ読み出し、各単語が漢字を含むか否かを判断する。漢字を含まない場合、辞書変換部12は、この単語の表記、読みアクセント情報及び品詞情報を基本単語辞書4aから読み出し、そのまま解析用辞書4cに登録する。漢字を含む場合、辞書変換部(判断手段)12は、習熟度別漢字リスト4bの登録内容を参照し、この漢字が、漢字習熟度受付部11を介して受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断する。
受け付けた習熟度よりも高い習熟度の漢字でない場合、辞書変換部12は、この漢字を含む単語の表記、読みアクセント情報及び品詞情報を基本単語辞書4aから読み出し、そのまま解析用辞書4cに登録する。受け付けた習熟度よりも高い習熟度の漢字である場合、辞書変換部12は、基本単語辞書4aの変換可否情報の欄に登録してある情報に基づいて、この漢字を含む単語が平仮名への変換が許可された単語であるか否かを判断する。
平仮名への変換が許可された単語でない場合、即ち、平仮名への変換が禁止されている単語である場合、辞書変換部12は、この単語の解析用辞書4cへの登録を行なわない。平仮名への変換が許可された単語である場合、辞書変換部(変換手段)12は、前記漢字、即ち、漢字習熟度受付部11を介して受け付けた習熟度よりも高い習熟度であるとされた漢字を、基本単語辞書4aの漢字かな対応情報の欄に登録してある平仮名に変換する。そして、辞書変換部12は、この単語の読みアクセント情報及び品詞情報を基本単語辞書4aから読み出し、対応する漢字を平仮名に変換して得られた単語の表記、基本単語辞書4aから読み出した読みアクセント情報及び品詞情報を対応付けて解析用辞書4cに登録する。
上述したような処理を行なうことにより、辞書変換部12は、図5に示すような解析用辞書4c、即ち、漢字習熟度受付部11を介して受け付けた習熟度以下の習熟度の漢字のみを用いた表記で各単語が登録してある解析用辞書4cを生成することができる。なお、生成された解析用辞書4cはHDD(解析用辞書記憶手段)4に記憶される。
図5は解析用辞書4cの登録内容を示す模式図である。なお、図5(a)には、漢字習熟度受付部11を介して習熟度1を受け付けた場合に辞書変換部12が生成する解析用辞書4cを示しており、図5(b)には、漢字習熟度受付部11を介して習熟度2を受け付けた場合に辞書変換部12が生成する解析用辞書4cを示している。
漢字習熟度受付部11を介して習熟度1を受け付けた場合、辞書変換部12は、基本単語辞書4aに登録されている単語の表記に含まれる各漢字に対して、習熟度1以下の漢字であれば平仮名への変換を行なわずに、習熟度1よりも高い習熟度の漢字であれば、この漢字を含む単語が平仮名への変換が許可されていれば平仮名への変換を行ない、解析用辞書4cに登録する。なお、辞書変換部12は、平仮名への変換が許可されていない単語については解析用辞書4cへの登録を行なわず、また、基本単語辞書4aに登録されている単語のうちで漢字を含まない単語については、各単語の表記、読みアクセント情報及び品詞情報を基本単語辞書4aから読み出してそのまま解析用辞書4cに登録する。
従って、図2に示した基本単語辞書4aにおいては、図2に例示してある漢字は全て習熟度2以上の漢字であり、「閑話」、「話術」以外の単語は平仮名への変換が許可されているため、漢字習熟度受付部11を介して習熟度1を受け付けた場合、図5(a)に示すように、「閑話」、「話術」以外の単語に対して、各漢字が平仮名に変換された表記、読みアクセント情報及び品詞情報がそれぞれ対応付けて登録された解析用辞書4cが生成される。
漢字習熟度受付部11を介して習熟度2を受け付けた場合、辞書変換部12は、基本単語辞書4aに登録されている単語の表記に含まれる各漢字に対して、習熟度2以下の漢字であれば平仮名への変換を行なわずに、習熟度2よりも高い習熟度の漢字であれば、この漢字を含む単語が平仮名への変換が許可されていれば平仮名への変換を行ない、解析用辞書4cに登録する。なお、辞書変換部12は、平仮名への変換が許可されていない単語については解析用辞書4cへの登録を行なわず、また、基本単語辞書4aに登録されている単語のうちで漢字を含まない単語については、各単語の表記、読みアクセント情報及び品詞情報を基本単語辞書4aから読み出してそのまま解析用辞書4cに登録する。
従って、図2に示した基本単語辞書4aにおいて、図2に例示した単語に含まれる「童」、「閑」、「術」は習熟度3以上の漢字であり、「閑話」、「話術」以外の単語は平仮名への変換が許可されているため、漢字習熟度受付部11を介して習熟度2を受け付けた場合、図5(b)に示すように、「閑話」、「話術」以外の単語、即ち「童話」に対して、「童」が平仮名に変換された表記、読みアクセント情報及び品詞情報がそれぞれ対応付けて登録された解析用辞書4cが生成される。なお、「童話」以外の単語は、習熟度3以上の漢字を含んでいないため、基本単語辞書4aに登録された表記がそのまま解析用辞書4cに登録される。
テキスト読込部13は、HDD4に記憶してあるテキストデータをHDD4から読み出してRAM3に読み込む。
形態素解析部14は、テキスト読込部13によってRAM3に読み込まれたテキストデータに対して、辞書変換部12によって生成された解析用辞書4cの登録内容に基づく形態素解析を行なう。
具体的には、形態素解析部14は、RAM3に読み込まれたテキストデータと、解析用辞書4cに登録された各単語の表記とを照合し、また、各単語の品詞情報に基づいて日本語の文法として不都合がないように尤もらしい単語の組み合わせを選択し、テキストデータを解析用辞書4cに登録された各単語に分解する。また、形態素解析部14は、分解した各単語の読みアクセント情報を解析用辞書4cから読み出し、解析結果として形態素解析結果出力部15へ送出する。形態素解析結果出力部15は、ここでは、形態素解析部14による形態素解析の解析結果をRAM3に格納する。
上述したように、本実施形態1の形態素解析装置10では、テキストデータに対して形態素解析を行なう際に、このテキストデータに対応して入力(設定)された漢字の習熟度に応じた解析用辞書4cを生成することができ、このような解析用辞書4cに基づく形態素解析を行なうので、従来の形態素解析においては解析誤りの低減が困難であったテキストデータ、例えば小学生以下の児童向けの平仮名を多用したテキストデータに対しても解析誤りの少ない形態素解析を行なうことが可能となる。
以下に、本実施形態1の形態素解析装置10による形態素解析処理についてフローチャートに基づいて詳述する。図6は形態素解析処理の手順を示すフローチャートである。なお、以下の処理は、形態素解析装置10のROM2又はHDD4に記憶してある制御プログラムに従って制御部1によって実行される。
形態素解析装置10のユーザは、操作部5を操作することによって1つのテキストデータに対する形態素解析の実行を指示する場合、このテキストデータに対応する漢字の習熟度を操作部5を介して入力する。従って、制御部1(漢字習熟度受付部11)は、操作部5を介してユーザが入力した漢字の習熟度を取得し(S1)、取得した習熟度に基づいて、基本単語辞書4aから解析用辞書4cを生成する辞書変換処理を実行する(S2)。なお、辞書変換処理の詳細については図7に基づいて後述する。
次に、制御部1(テキスト読込部13)は、ユーザによって形態素解析の実行を指示されたテキストデータをHDD4から読み出してRAM3に読み込む(S3)。制御部1(形態素解析部14)は、RAM3に読み込まれたテキストデータに対して、ステップS2で実行した辞書変換処理によって生成された解析用辞書4cの登録内容に基づく形態素解析を実行し(S4)、テキストデータを解析用辞書4cに登録された各単語に分解すると共に、分解した各単語の読みアクセント情報を解析用辞書4cから読み出す。そして、制御部1(形態素解析結果出力部15)は、解析用辞書4cから読み出した各単語の読みアクセント情報を形態素解析結果としてRAM3に記憶させる(S5)。
以下に、上述した形態素解析処理における辞書変換処理(図6中のステップS2)についてフローチャートに基づいて説明する。図7は辞書変換処理の手順を示すフローチャートである。なお、以下の処理は、形態素解析装置10のROM2又はHDD4に記憶してある制御プログラムに従って制御部1(辞書変換部12)によって実行される。
制御部1は、基本単語辞書4aに登録されている単語から1つを読み出し(S11)、読み出した単語が漢字を含むか否かを判断する(S12)。漢字を含まないと判断した場合(S12:NO)、制御部1は、この単語の表記、読みアクセント情報及び品詞情報を基本単語辞書4aから読み出し、解析用辞書4cに登録する(S18)。読み出した単語が漢字を含むと判断した場合(S12:YES)、制御部1は、この単語に含まれる漢字を1つ抽出する(S13)。制御部1は、習熟度別漢字リスト4bの登録内容に基づいて、抽出した漢字が、ステップS1で取得した習熟度よりも高い習熟度の漢字であるか否かを判断する(S14)。
抽出した漢字が、ステップS1で取得した習熟度よりも高い習熟度の漢字でないと判断した場合(S14:NO)、制御部1は、この漢字に対しては平仮名への変換を行なわず、ステップS11で読み出した単語に含まれる全ての漢字を抽出したか否かを判断する(S17)。全ての漢字を抽出していないと判断した場合(S17:NO)、制御部1は、ステップS13へ処理を戻し、ステップS11で読み出した単語に含まれる異なる漢字を1つ抽出する(S13)。
抽出した漢字が、ステップS1で取得した習熟度よりも高い習熟度の漢字であると判断した場合(S14:YES)、制御部1は、基本単語辞書4aの変換可否情報の欄に登録してある情報に基づいて、この漢字を含む単語、即ち、ステップS11で読み出した単語が平仮名への変換が許可された単語であるか否かを判断する(S15)。平仮名への変換が許可された単語でないと判断した場合(S15:NO)、制御部1は、ステップS11へ処理を戻し、この単語を解析用辞書4cへ登録せず、基本単語辞書4aから異なる単語を1つ読み出し(S11)、読み出した単語に対してステップS11〜S18の処理を繰り返す。
平仮名への変換が許可された単語であると判断した場合(S15:YES)、制御部1は、ステップS13で抽出した漢字に対する平仮名を基本単語辞書4aから読み出し、読み出した平仮名に変換する(S16)。制御部1は、ステップS11で読み出した単語に含まれる全ての漢字を抽出したか否かを判断し(S17)、全ての漢字を抽出していないと判断した場合(S17:NO)、ステップS13へ処理を戻す。一方、制御部1は、全ての漢字を抽出したと判断した場合(S17:YES)、ステップS11で読み出した単語の読みアクセント情報及び品詞情報を基本単語辞書4aから読み出し、この単語の、ステップS16で対応する漢字が平仮名に変換された表記、基本単語辞書4aから読み出した読みアクセント情報及び品詞情報を解析用辞書4cに登録する(S18)。
制御部1は、基本単語辞書4aに登録されている全ての単語の読み出しを終了したか否かを判断し(S19)、終了していないと判断した場合(S19:NO)、ステップS11へ処理を戻し、基本単語辞書4aから異なる単語を1つ読み出し(S11)、読み出した単語に対してステップS11〜S18の処理を繰り返す。基本単語辞書4aに登録されている全ての単語の読み出しを終了したと判断した場合(S19:YES)、制御部1は、上述した辞書変換処理を終了し、図6に示した形態素解析処理へ処理を戻す。
上述したように、本実施形態1の形態素解析装置10では、テキストデータに対して形態素解析を行なう場合、このテキストデータに対して設定された漢字の習熟度に応じた解析用辞書4cを生成することにより、この解析用辞書4cに基づいて高精度の形態素解析を実行することができる。
上述した実施形態1の形態素解析装置10では、制御部1(漢字習熟度受付部11)が、操作部5を介してユーザが入力した漢字の習熟度を受け付けるように構成されていた。しかし、例えば、各テキストデータ毎に予め習熟度を設定しておき、ユーザによって形態素解析の処理対象に1つのテキストデータが指定された場合、制御部1は、このテキストデータに対して設定された習熟度を受け付けるように構成することもできる。この場合、テキストデータ(学習教材)の作成者が意図した習熟度を設定することができ、この習熟度に対応した解析用辞書4cに基づく形態素解析の実行が可能となり、より高精度の形態素解析を行なうことができる。
(実施形態2)
以下に、本発明に係る形態素解析装置を、実施形態2を示す図面に基づいて詳述する。なお、本実施形態2の形態素解析装置は、上述した実施形態1の形態素解析装置10と同様の構成によって実現することができるので、同様の構成については同一の符号を付して説明を省略する。
上述した実施形態1の形態素解析装置10において、制御部1(漢字習熟度受付部11)は、ユーザが操作部5を介して入力した漢字の習熟度を取得するように構成されていた。
本実施形態2の形態素解析装置10では、制御部1は、テキスト読込部13によってRAM3に読み込まれたテキストデータに含まれる各漢字の習熟度に基づいて、このテキストデータに対する漢字の習熟度を検出するように構成されている。
図8は実施形態2の形態素解析装置10の機能構成例を示す機能ブロック図である。本実施形態2の形態素解析装置10において、制御部1は、ROM2又はHDD4に記憶してある制御プログラムを実行することにより、上述した実施形態1の形態素解析装置10と同様に、漢字習熟度受付部11、辞書変換部12、テキスト読込部13、形態素解析部14、形態素解析結果出力部15等の各機能を実現するほか、漢字習熟度検出部16の機能を実現する。
なお、本実施形態2の形態素解析装置10では、ユーザは、形態素解析装置10によってテキストデータに対して形態素解析を行なう場合、各テキストデータに相当する漢字の習熟度を入力する必要はない。
漢字習熟度検出部16は、テキスト読込部13によってRAM3に読み込まれたテキストデータに含まれる各漢字の習熟度を、習熟度別漢字リスト4bの登録内容に基づいて検出し、検出した習熟度のうちで最高の習熟度を、このテキストデータに対応する習熟度として特定する。漢字習熟度受付部11は、漢字習熟度検出部16によって特定されたテキストデータに対応する習熟度を辞書変換部12へ送出する。そして、辞書変換部12は、漢字習熟度受付部11を介して取得した習熟度に対応する解析用辞書4cを生成する。
なお、辞書変換部12が、基本単語辞書4aの登録内容を、漢字習熟度受付部11から取得した習熟度に基づいて変換して解析用辞書4cを生成する処理は、上述の実施形態1で説明した処理と同様であるので説明を省略する。
上述したように、本実施形態2の形態素解析装置10では、テキストデータに対して形態素解析を行なう際に、このテキストデータに含まれる漢字の習熟度に基づいて、このテキストデータに対応する習熟度を特定し、特定された習熟度に応じた解析用辞書4cを生成するので、各テキストデータにおいて実際に用いられている漢字に対応した解析用辞書4cを生成することができる。また、このような解析用辞書4cに基づく形態素解析を行なうので、従来の形態素解析においては解析誤りの低減が困難であったテキストデータ、例えば小学生以下の児童向けの平仮名を多用したテキストデータに対しても解析誤りの少ない形態素解析を行なうことが可能となる。
以下に、本実施形態2の形態素解析装置10による形態素解析処理についてフローチャートに基づいて詳述する。図9は形態素解析処理の手順を示すフローチャートである。なお、以下の処理は、形態素解析装置10のROM2又はHDD4に記憶してある制御プログラムに従って制御部1によって実行される。
形態素解析装置10のユーザが操作部5を操作することによって1つのテキストデータに対する形態素解析の実行を指示した場合、制御部1(テキスト読込部13)は、ユーザによって形態素解析の実行を指示されたテキストデータをHDD4から読み出してRAM3に読み込む(S21)。制御部1は、習熟度別漢字リスト4bに登録された習熟度のうちで最低の習熟度をRAM3に一旦記憶させる(S22)。
制御部1(漢字習熟度検出部16)は、RAM3に読み込まれたテキストデータに含まれる漢字を1つ抽出し(S23)、習熟度別漢字リスト4bの登録内容に基づいて、抽出した漢字の習熟度を検出する(S24)。制御部1は、検出した習熟度が、RAM3に記憶させた習熟度よりも高い習熟度であるか否かを判断し(S25)、高い習熟度であると判断した場合(S25:YES)、RAM3に記憶させた習熟度を、検出した習熟度に更新する(S26)。検出した習熟度が、RAM3に記憶させた習熟度よりも高い習熟度でないと判断した場合(S25:NO)、制御部1は、ステップS26の処理をスキップし、ステップS27へ処理を移行する。
制御部1は、ステップS21でRAM3に読み込まれたテキストデータに含まれる全ての漢字を抽出したか否かを判断しており(S27)、全ての漢字を抽出していないと判断した場合(S27:NO)、ステップS23へ処理を戻し、RAM3に読み込まれたテキストデータに含まれる異なる漢字を1つ抽出し(S23)、抽出した漢字に対してステップS24〜S26の処理を繰り返す。
ステップS21でRAM3に読み込まれたテキストデータに含まれる全ての漢字を抽出したと判断した場合(S27:YES)、制御部1は、この時点でRAM3に記憶してある習熟度を、ステップS21で読み出したテキストデータに対応する習熟度に特定する(S28)。制御部1は、特定した習熟度に基づいて、基本単語辞書4aから解析用辞書4cを生成する辞書変換処理を実行する(S29)。なお、本実施形態2の辞書変換処理は、実施形態1において図7に基づいて説明した処理と同様である。
制御部1(形態素解析部14)は、ステップS21でRAM3に読み込まれたテキストデータに対して、ステップS29で実行した辞書変換処理によって生成された解析用辞書4cの登録内容に基づく形態素解析を実行し(S30)、テキストデータを解析用辞書4cに登録された各単語に分解すると共に、分解した各単語の読みアクセント情報を解析用辞書4cから読み出す。そして、制御部1(形態素解析結果出力部15)は、解析用辞書4cから読み出した各単語の読みアクセント情報を形態素解析結果としてRAM3に記憶させる(S31)。
上述したように、本実施形態2の形態素解析装置10では、テキストデータに対して形態素解析を行なう場合、このテキストデータに含まれる漢字の習熟度に基づいて特定された習熟度に応じた解析用辞書4cを生成することにより、各テキストデータにおいて実際に用いられている漢字に対応した解析用辞書4cに基づいて高精度の形態素解析を実行することができる。
(実施形態3)
以下に、本発明に係る形態素解析装置を備えた本発明に係る音声合成装置及び音声照合装置を、実施形態3である音読練習支援装置を示す図面に基づいて詳述する。なお、本実施形態3の音読練習支援装置は、上述した実施形態1の形態素解析装置10の構成を備えており、同様の構成については同一の符号を付して説明を省略する。
図10は実施形態3に係る音読練習支援装置の構成例を示すブロック図である。本実施形態3に係る音読練習支援装置100は、図1に示した制御部1、ROM2、RAM3、HDD4、操作部5、表示部6のほかに、音声入力部7及び音声出力部8を備えており、これらのハードウェア各部はそれぞれバス1aを介して相互に接続されている。
また、本実施形態3の音読練習支援装置100において、HDD4には、テキストデータ、図2に示すような基本単語辞書4a、図3に示すような習熟度別漢字リスト4b、ユーザに対して各種の情報を通知するための画面情報のほかに、音読練習支援装置100を本発明の音声合成装置及び音声照合装置として動作させるために必要な種々の制御プログラム、音素列生成ルール4d、音素長テーブル4e、韻律生成ルール4f、波形辞書4g等が予め記憶されている。
音声入力部7は、マイクロフォン及びA/D(アナログ/デジタル)変換器等を備えており、例えばユーザが発した音声をマイクロフォンによって集音し、得られたアナログの音声信号をA/D変換器によってデジタルの音声信号に変換する。音声入力部7は、取得した音声信号を例えばRAM3に記憶させる。
音声出力部8は、音声増幅回路及びスピーカ等を備えており、例えばRAM3又はHDD4に記憶されている音声信号(音声波形)に基づく音声を出力する。
音素列生成ルール4d、音素長テーブル4e、韻律生成ルール4f、波形辞書4gの詳細については図示しないが、音素列生成ルール4dには、例えば、各単語(形態素)の読みに対応する音素の情報、具体的には、読み「ド」:音素「do」、読み「ワ」:音素「wa」といった情報、各単語(形態素)を連結した場合にアクセントの位置がどのように移動するかを示す情報等が登録されている。
音素長テーブル4eには、各音素の長さが定義されており、例えば、音素「k」:音素長「10msec」といった情報が登録されている。また、韻律生成ルール4fには、音素列情報から韻律データを生成する際のルールが登録されており、波形辞書4gには、各音素に対応する音声波形が登録されている。
以下に、上述した構成の音読練習支援装置100において、制御部1がROM2又はHDD4に記憶してある制御プログラムを実行することによって実現される各種の機能について説明する。図11は実施形態3の音読練習支援装置100の機能構成例を示す機能ブロック図である。本実施形態3の音読練習支援装置100において、制御部1は、ROM2又はHDD4に記憶してある制御プログラムを実行することによって、上述した実施形態1の形態素解析装置10、音素列生成部21、音声合成部22、音響モデル格納部23、音声照合部24、指摘事項作成部25、ユーザインタフェース部26等の各機能と、これらの各機能の動作を制御する主制御部20の機能とを実現する。
ユーザインタフェース部(音声情報取得手段)26は、操作部5を介したユーザによるキー操作の入力を受け付け、ユーザが発した音声の音声入力部7を介した入力を受け付ける。また、ユーザインタフェース部26は、RAM3又はHDD4に記憶された音声信号に基づく音声の音声出力部8を介した出力、各種の情報を通知するための画面の表示部6への表示等を行なう。
音素列生成部(音素列生成手段)21は、形態素解析装置10によって実行された形態素解析の解析結果を取得し、取得した解析結果に対応する音素列情報、即ち、形態素解析装置10によって形態素解析が施されたテキストデータに対応する音素列情報を、音素列生成ルール4dに従って生成する。
ここで、本実施形態3の音読練習支援装置100が、「くまさんはもりにいきました」というテキストデータに対して処理を行なったとした場合、形態素解析装置10によって「クマ’(普通名詞) サン(接尾語) ハ(助詞) モリ(普通名詞) ニ(助詞) イ(カ行五段動詞語幹) キ’(カ行五段動詞連用形) マ’シ(助動詞連用形) タ(助詞)」という解析結果が得られる。
音素列生成部21は、音素列生成ルール4dに基づいて、形態素解析装置10によって得られた解析結果から、「kuma’sanwa_morini_ikima’shita」という音素列情報を生成する。なお、音素列生成部21が生成した音素列情報はRAM3に一旦格納される。また、音素列情報中の「’」はアクセントの位置を、「_」はアクセント句の境界をそれぞれ示している。
音声合成部(合成音声生成手段)22は、音素長テーブル4e、韻律生成ルール4f及び波形辞書4gに基づいて、音素列生成部21によって生成された音素列情報に対応する音声波形(合成音声)を生成する。具体的には、音声合成部22は、まず、音素長テーブル4eの登録内容に基づいて、音素列生成部21によって生成された音素列情報中の各音素に対応する音素長を特定する。次に、音声合成部22は、韻律生成ルール4fに基づいて、音素列生成部21によって生成された音素列情報に対応するピッチパターンを生成する。
そして、音声合成部22は、音素列生成部21によって生成された音素列情報中の各音素に対応する音声波形を波形辞書4gから抽出し、抽出した音声波形を、特定した各音素の音素長と、音素列情報に対応するピッチパターンとに適合するように調整し、合成音声を生成する。なお、音声合成部22が生成した合成音声は一旦RAM3に格納され、主制御部20からの指示に従ったタイミングで音声出力部8へ送出され、音声出力部8から音声出力される。
上述したような各処理を行なうことにより、本実施形態3の音読練習支援装置100は、テキストデータに基づく合成音声を生成する音声合成装置として機能することができる。また、本実施形態3の音読練習支援装置100は、上述した実施形態1の形態素解析装置10を備えているため、テキストデータに対して予め設定された漢字の習熟度に応じた解析用辞書4cに基づいて、例えば小学生以下の児童向けの平仮名を多用したテキストデータに対しても解析誤りの少ない形態素解析を行なうことができるので、解析誤りの少ない形態素解析結果に基づいて、高品質の合成音声を生成することができる。
音響モデル格納部23は、不揮発性のメモリであり、日本語の音素毎に各音素の特徴を表す音響パラメータを音響モデルとして格納している。なお、音響パラメータは、例えば、MFCC(Mel Frequency Cepstrum Coefficient:メル周波数ケプストラム係数)パラメータ等、音声認識の分野で通常用いられるパラメータを利用すればよい。
音声照合部(音響パラメータ抽出手段)24は、ユーザインタフェース部26が音声入力部7を介して取得した音声情報から特徴パラメータ(音響パラメータ)を抽出する。また、音声照合部(音響パラメータ生成手段)24は、ユーザが朗読したテキストデータに対して形態素解析装置10及び音素列生成部21が所定の処理を行なうことによって得られた音素列情報と、音響モデル格納部23に格納されている音響モデルとに基づいて、正解となる音響パラメータを生成する。そして、音声照合部(照合手段)24は、生成した音響パラメータと、取得した音声情報から抽出した音響パラメータとを照合(比較)し、相違点を検出する。
指摘事項作成部25は、予め各種のメッセージが格納されたメモリ(図示せず)を備えており、音声照合部24の照合結果に応じて適切なメッセージをメモリから選択し、選択したメッセージに基づいてユーザに指摘すべきメッセージを作成する。例えば音声照合部24の照合結果、ユーザが「くまさんは」の「は」を「wa」ではなく「ha」と発声したと判断された場合、「これは『わ』と読みます。」というメッセージを作成する。また、音声照合部24の照合結果、ユーザが「いきました」の「いき」と「ました」の間に少しポーズ(間)を空けて発声したと判断された場合、「ここで切ってはいけません。」というメッセージを作成する。
また、音声照合部24の照合結果、ユーザが正しく発声したと判断された場合、「正しく読めました。」というメッセージを作成する。なお、指摘事項作成部25が作成したメッセージは、ユーザインタフェース部26を介して表示部6に表示され、又はユーザインタフェース部26を介して音声出力部8から音声出力されるので、照合結果をユーザに通知することができる。
上述した構成により、本実施形態3の音読練習支援装置100は、形態素解析装置10、音素列生成部21及び音声合成部22によって、テキストデータから合成音声を生成し、生成した合成音声を音声出力部8から出力することができる。また、本実施形態3の音読練習支援装置100は、テキストデータに基づいて生成された正解となる音響パラメータに基づいて、ユーザがテキストデータを朗読した音声が正しいか否かを判断することができ、また、その判定結果をユーザに通知することができる。
以下に、上述した構成の音読練習支援装置100による音読練習支援処理について説明する。まず、本実施形態3の音読練習支援装置100において、ユーザが音読の練習を行なう場合、制御部1(主制御部20)は、図12に示すような初期画面(問題選択画面)を表示部6に表示させる。
図12は問題選択画面の構成例を示す模式図である。図12に示すように、問題選択画面には、漢字の習熟度(レベル)別にテキストデータ(問題)が表示されており、ユーザが各テキストデータを操作部5を介して選択することにより、音読練習支援装置100は、選択されたテキストデータに基づく音読練習支援処理を開始する。また、問題選択画面には、この問題選択画面において次のページへ進むための「つぎへ」ボタンと、1つ前のページへ戻るための「まえへ」ボタンとが表示されている。なお、次のページがない場合又は1つ前のページがない場合、問題選択画面における「つぎへ」ボタン又は「まえへ」ボタンは選択できないように表示される。
ユーザが操作部5を介して問題選択画面中の「つぎへ」ボタン又は「まえへ」ボタンを操作した場合、主制御部20は、HDD4に予め格納されている各種の情報に基づいて、次のページ又は1つ前のページを表示部6に表示させる。また、ユーザが操作部5を介して問題選択画面中のテキストデータを選択した場合、主制御部20は、図13(a)に示すような問題表示画面を表示部6に表示させると共に、選択されたテキストデータと、このテキストデータに割り当てられた漢字の習熟度とを形態素解析装置10へ入力する。
図13は問題表示画面の構成例を示す模式図である。図13(a)に示す問題表示画面には、問題選択画面を介して選択されたテキストデータと、このテキストデータに対してお手本となる音声を出力するための「せんせいのよみかたをきく」ボタンと、このテキストデータをユーザが朗読し、正しく読めているか否かを判定するための「じぶんでよんでみる」ボタンと、図12に示した問題選択画面への表示に戻すための「もんだいをえらぶ」ボタンとが表示されている。
一方、形態素解析装置10は、上述したように問題選択画面を介して選択されたテキストデータ及びこのテキストデータに割り当てられた漢字の習熟度が入力された場合、実施形態1で説明した形態素解析処理を実行する。また、主制御部20は、形態素解析装置10によって形態素解析が実行された場合、形態素解析装置10による形態素解析結果を音素列生成部21へ入力し、形態素解析結果に基づく音素列情報を生成させる。主制御部20は、音素列生成部21によって生成された音素列情報をRAM3に記憶させておく。
図13(a)に示す問題表示画面において、ユーザが操作部5を介して「せんせいのよみかたをきく」ボタンを操作した場合、主制御部20は、音素列生成部21によって生成されてRAM3に記憶してある音素列情報を音声合成部22へ入力し、音素列情報に基づく合成音声を生成させる。そして、主制御部20は、生成された合成音声を音声出力部8から出力することにより、このテキストデータに対してお手本となる音声を出力させることができる。
また、図13(a)に示す問題表示画面において、ユーザが操作部5を介して「じぶんでよんでみる」ボタンを操作した場合、主制御部20は、音声入力部7を介してユーザが発した音声に基づく音声情報を取得し、取得した音声情報を音声照合部24へ入力すると共に、音素列生成部21によって生成されてRAM3に記憶してある音素列情報を音声照合部24に入力する。音声照合部24は、入力された音声情報から音響パラメータを抽出すると共に、入力された音素列情報と音響モデル格納部23に格納してある音響モデルとに基づいて、お手本となる音響パラメータを生成する。
そして、音声照合部24は、生成した音響パラメータと、取得した音声情報から抽出した音響パラメータとを照合する。主制御部20は、音声照合部24による照合結果を指摘事項作成部25に入力し、照合結果に応じたメッセージを作成させる。主制御部20は、指摘事項作成部25が作成したメッセージを、図13(a)に示した問題表示画面上に重ねて表示させ、図13(b)に示すような問題表示画面を表示させる。図13(b)に示す問題表示画面においては、ユーザが「くまさんは」の「は」を「wa」ではなく「ha」と発声したので、「これは『わ』とよみます。」というメッセージが表示され、ユーザが「いきました」の「いき」と「ました」の間に少しポーズを空けて発声したので、「ここできってはいけません。」というメッセージが表示されている。
なお、照合結果に基づくメッセージは、図13(b)に示すように表示部6に表示された問題表示画面上への表示だけでなく、例えば音声出力によってユーザに通知するようにしてもよい。これにより、ユーザは、図13に示した問題表示画面中の「せんせいのよみかたをきく」ボタンを操作することにより、お手本の読み方を聞くことができ、「じぶんでよんでみる」ボタンを操作することにより、自身の朗読が正しいか否かを知ることができる。
以下に、本実施形態3の音読練習支援装置100による音読練習支援処理についてフローチャートに基づいて詳述する。図14乃至図16は音読練習支援処理の手順を示すフローチャートである。なお、以下の処理は、音読練習支援装置100のROM2又はHDD4に記憶してある制御プログラムに従って制御部1によって実行される。
音読練習支援装置100の制御部1は、ユーザが音読の練習を開始する場合、図12に示すような問題選択画面を表示部6に表示させる(S41)。制御部1は、問題選択画面を介して任意の問題(テキストデータ)が選択されたか否かを判断しており(S42)、選択されていないと判断した場合(S42:NO)、問題選択画面において「まえへ」ボタンが操作されたか否かを判断する(S43)。「まえへ」ボタンが操作されたと判断した場合(S43:YES)、制御部1は、問題選択画面における1つ前の画面を表示部6に表示させ(S44)、ステップS42へ処理を戻す。
「まえへ」ボタンが操作されていないと判断した場合(S43:NO)、制御部1は、問題選択画面において「つぎへ」ボタンが操作されたか否かを判断し(S45)、「つぎへ」ボタンが操作されたと判断した場合(S45:YES)、問題選択画面における次の画面を表示部6に表示させ(S46)、ステップS42へ処理を戻す。なお、「つぎへ」ボタンが操作されていないと判断した場合(S45:NO)、制御部1は、ステップS46の処理をスキップしてステップS42へ処理を戻す。
問題が選択されたと判断した場合(S42:YES)、制御部1は、選択されたテキストデータ(問題)に割り当てられた漢字の習熟度を取得し(S47)、取得した習熟度に基づいて、基本単語辞書4aから解析用辞書4cを生成する辞書変換処理を実行する(S48)。なお、本実施形態3の辞書変換処理は、実施形態1において図7に基づいて説明した処理と同様である。
制御部1は、問題選択画面を介して選択されたテキストデータをHDD4から読み出してRAM3に読み込み(S49)、このテキストデータに対して、ステップS48で実行した辞書変換処理によって生成された解析用辞書4cの登録内容に基づく形態素解析を実行する(S50)。制御部1は、形態素解析によって、テキストデータを解析用辞書4cに登録された各単語に分解すると共に、分解した各単語の読みアクセント情報を解析用辞書4cから読み出し、読み出した各単語の読みアクセント情報を形態素解析結果としてRAM3に記憶させる(S51)。
制御部1は、音素列生成ルール4dに基づいて、形態素解析結果に対応する音素列情報を生成してRAM3に記憶させておき(S52)、図13(a)に示すような、問題選択画面を介して選択されたテキストデータを表示する問題表示画面を表示部6に表示させる(S53)。
制御部1は、問題表示画面において「せんせいのよみかたをきく」ボタンが操作されたか否かを判断しており(S54)、操作されたと判断した場合(S54:YES)、テキストデータに基づいて生成されてRAM3に記憶してある音素列情報に基づく合成音声を生成し、音声出力部8から出力させ(S55)、ステップS54へ処理を戻す。問題表示画面において「せんせいのよみかたをきく」ボタンが操作されていないと判断した場合(S54:NO)、制御部1は、問題表示画面において「じぶんでよんでみる」ボタンが操作されたか否かを判断する(S56)。
「じぶんでよんでみる」ボタンが操作されたと判断した場合(S56:YES)、制御部1は、ユーザが発した音声に基づく音声情報を音声入力部7を介して取得し(S57)、取得した音声情報から音響パラメータを抽出する(S58)。また、制御部1は、テキストデータに基づいて生成されてRAM3に記憶してある音素列情報と、音響モデル格納部23に格納してある音響モデルとに基づいて、お手本の音響パラメータを生成し(S59)、生成した音響パラメータと、ステップS58で抽出した音響パラメータとを照合する(S60)。制御部1は、照合した結果に応じたメッセージを作成し、作成したメッセージを、図13(a)に示した問題表示画面上に重ねて表示させ(S61)、上述したステップS54へ処理を戻す。
問題表示画面において「じぶんでよんでみる」ボタンが操作されていないと判断した場合(S56:NO)、制御部1は、問題表示画面において「もんだいをえらぶ」ボタンが操作されたか否かを判断する(S62)。「もんだいをえらぶ」ボタンが操作されていないと判断した場合(S62:NO)、制御部1は、ステップS54へ処理を戻し、問題表示画面において「せんせいのよみかたをきく」ボタンが操作されたか否かを判断し(S54)、上述したステップS54〜S62の処理を繰り返す。
問題表示画面において「もんだいをえらぶ」ボタンが操作されたと判断した場合(S62:YES)、制御部1は、ステップS41へ処理を戻し、図12に示すような問題選択画面を表示部6に表示させ(S41)、問題選択画面を介して新たに選択された問題(テキストデータ)に対して、上述したステップS47〜S62の処理を繰り返す。なお、本実施形態3の音読練習支援装置100は、例えば電源ボタン(図示せず)がオフされた場合、上述した音読練習支援処理を終了する。
上述した構成の音読練習支援装置100を用いて、ユーザが、図13(b)に示した問題表示画面上に表示されたメッセージによる指摘事項がなくなるまで音読を繰り返すことにより、効率よく音読の練習を行なうことができる。また、上述した実施形態3の音読練習支援装置100では、図12に示した問題選択画面において1つの問題を選択する都度、音読の練習を行なうことができる。しかし、例えば、問題選択画面において習熟度のみを選択し、選択した習熟度の漢字を用いて記述された複数のテキストデータを順次問題として図13(a)に示す問題表示画面に表示するようにしてもよい。この場合、問題表示画面中に「次の問題へ」ボタンを表示させておき、この「次の問題へ」ボタンが操作された場合に次の問題(テキストデータ)を問題表示画面に表示させるようにすればよく、問題選択画面から任意の問題を選択するユーザの手間を省略することができる。
上述した実施形態3の音読練習支援装置100では、図12に示したように、各テキストデータには予め漢字の習熟度が割り当てられており、問題選択画面を介して任意の問題(テキストデータ)が選択された場合、選択されたテキストデータと、このテキストデータに割り当ててある漢字の習熟度とを形態素解析装置10に入力し、入力された習熟度に応じた解析用辞書4cに基づく形態素解析を形態素解析装置10が行なう構成であった。しかし、例えば、問題選択画面にはテキストデータのみを表示しておき、ユーザが、問題選択画面を介してテキストデータを選択すると共に、操作部5を介して漢字の習熟度を入力する構成とすることもできる。
また、上述した実施形態3では、本発明の音声合成装置及び音声照合装置を、上述した実施形態1の形態素解析装置10を備えた音読練習支援装置100に適用した構成を例に説明したが、本発明の音声合成装置及び音声照合装置は、上述した実施形態2の形態素解析装置10を備えた音読練習支援装置100にも適用することができる。この場合、例えば、問題選択画面にはテキストデータのみを表示しておき、ユーザが、問題選択画面を介してテキストデータを選択した場合、音読練習支援装置100が、テキストデータに含まれる各漢字の習熟度に基づいて、このテキストデータに対応する習熟度を特定し、特定した習熟度に応じた解析用辞書4cに基づく形態素解析を行なうことができる。
上述した実施形態3では、図13に示したように、問題表示画面中の「せんせいのよみかたをきく」ボタン、「じぶんでよんでみる」ボタン、「もんだいをえらぶ」ボタンのそれぞれが平仮名で表示されていた。しかし、例えば、図12に示した問題選択画面において選択されたテキストデータに対応する漢字の習熟度に応じて、各ボタンの表示を漢字及び仮名を混ぜた表示とすることもできる。具体的には、例えば各習熟度に応じた各ボタンの表示を予め用意しておき、問題選択画面を介してテキストデータが選択された場合に、選択されたテキストデータに対応する習熟度での表示を用いて各ボタンを表示させればよい。また、任意の習熟度に応じたボタンの表示を予め用意しておき、問題選択画面を介してテキストデータが選択された場合に、選択されたテキストデータに対応する習熟度での表記に変換し、得られた表記で各ボタンを表示させればよい。
(付記1)
テキストデータに形態素解析を行なう形態素解析装置において、
漢字の習熟度を受け付ける習熟度受付手段と、
習熟度毎に複数の漢字を記憶してある漢字記憶手段と、
複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段と、
前記漢字記憶手段の記憶内容に基づいて、前記単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断する判断手段と、
該判断手段によって前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換手段と、
該変換手段が変換した各単語を記憶する解析用辞書記憶手段と、
該解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なう手段と
を備えることを特徴とする形態素解析装置。
(付記2)
前記テキストデータに含まれる漢字を抽出する手段と、
抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出する手段と、
検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定する手段とを備え、
前記習熟度受付手段は、特定された習熟度を受け付けるように構成されていることを特徴とする付記1に記載の形態素解析装置。
(付記3)
前記単語辞書記憶手段は、各単語に対応付けて、各単語に含まれる漢字の仮名への変換を許可又は禁止する情報を記憶する構成としてあり、
前記単語辞書記憶手段の記憶内容に基づいて、前記判断手段によって前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を含む単語が、仮名への変換が許可された単語であるか否かを判断する手段を備え、
前記変換手段は、仮名への変換が許可された単語であると判断された場合、前記漢字を前記単語辞書記憶手段に記憶してある仮名に変換するように構成してあることを特徴とする付記1又は2に記載の形態素解析装置。
(付記4)
テキストデータに形態素解析を行なう形態素解析方法において、
漢字の習熟度を受け付ける習熟度受付ステップと、
習熟度毎に複数の漢字を記憶してある漢字記憶手段の記憶内容に基づいて、複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断するステップと、
前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換ステップと、
該変換ステップで変換した各単語を解析用辞書記憶手段に記憶させるステップと、
前記解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なうステップと
を含むことを特徴とする形態素解析方法。
(付記5)
前記テキストデータに含まれる漢字を抽出するステップと、
抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出するステップと、
検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定するステップとを含み、
前記習熟度受付ステップは、特定された習熟度を受け付けることを特徴とする付記4に記載の形態素解析方法。
(付記6)
前記単語辞書記憶手段には、各単語に対応付けて、各単語に含まれる漢字の仮名への変換を許可又は禁止する情報が記憶してあり、
前記単語辞書記憶手段の記憶内容に基づいて、前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を含む単語が、仮名への変換が許可された単語であるか否かを判断するステップを含み、
前記変換ステップは、仮名への変換が許可された単語であると判断された場合、前記漢字を前記単語辞書記憶手段に記憶してある仮名に変換することを特徴とする付記4又は5に記載の形態素解析方法。
(付記7)
コンピュータに、テキストデータに形態素解析を行なわせるためのコンピュータプログラムにおいて、
習熟度毎に複数の漢字を記憶してある漢字記憶手段と、複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段とを備えるコンピュータに、
前記漢字記憶手段の記憶内容に基づいて、前記単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、予め取得しておいた習熟度よりも高い習熟度の漢字であるか否かを判断するステップと、
予め取得しておいた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換ステップと、
該変換ステップで変換した各単語を解析用辞書記憶手段に記憶させるステップと、
前記解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なうステップと
を実行させるためのコンピュータプログラム。
(付記8)
前記コンピュータに、
前記テキストデータに含まれる漢字を抽出するステップと、
抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出するステップと、
検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定するステップと、
特定した習熟度を取得するステップと
を実行させるための付記7に記載のコンピュータプログラム。
(付記9)
前記コンピュータに、取得しておいた習熟度よりも高い習熟度の漢字であると判断された漢字を含む単語が、該単語に含まれる漢字の仮名への変換が許可された単語であるか否かを判断するステップを実行させ、
前記変換ステップは、仮名への変換が許可された単語であると判断された場合、前記漢字を前記単語辞書記憶手段に記憶してある仮名に変換することを特徴とする付記7又は8に記載のコンピュータプログラム。
(付記10)
テキストデータから合成音声を生成する音声合成装置において、
付記1乃至3のいずれかひとつに記載の形態素解析装置と、
該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成する音素列生成手段と、
該音素列生成手段が生成した音素列情報に基づいて合成音声を生成する合成音声生成手段と
を備えることを特徴とする音声合成装置。
(付記11)
予め用意された音声情報と照合対象の音声情報とを照合する音声照合装置において、
付記1乃至3のいずれかひとつに記載の形態素解析装置と、
該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成する音素列生成手段と、
該音素列生成手段が生成した音素列情報における音響パラメータを生成する音響パラメータ生成手段と、
外部から音声情報を取得する音声情報取得手段と、
該音声情報取得手段が取得した音声情報から音響パラメータを抽出する音響パラメータ抽出手段と、
前記音響パラメータ生成手段が生成した音響パラメータ及び前記音響パラメータ抽出手段が抽出した音響パラメータを照合する照合手段と
を備えることを特徴とする音声照合装置。
(付記12)
前記照合手段による照合結果を出力する手段を備えることを特徴とする付記11に記載の音声照合装置。
本発明に係る形態素解析装置の構成例を示すブロック図である。 基本単語辞書の登録内容を示す模式図である。 習熟度別漢字リストの登録内容を示す模式図である。 実施形態1の形態素解析装置の機能構成例を示す機能ブロック図である。 解析用辞書の登録内容を示す模式図である。 形態素解析処理の手順を示すフローチャートである。 辞書変換処理の手順を示すフローチャートである。 実施形態2の形態素解析装置の機能構成例を示す機能ブロック図である。 形態素解析処理の手順を示すフローチャートである。 実施形態3に係る音読練習支援装置の構成例を示すブロック図である。 実施形態3の音読練習支援装置の機能構成例を示す機能ブロック図である。 問題選択画面の構成例を示す模式図である。 問題表示画面の構成例を示す模式図である。 音読練習支援処理の手順を示すフローチャートである。 音読練習支援処理の手順を示すフローチャートである。 音読練習支援処理の手順を示すフローチャートである。
符号の説明
10 形態素解析装置
1 制御部
11 漢字習熟度受付部(習熟度受付手段)
12 辞書変換部(判断手段、変換手段)
4 HDD(単語辞書記憶手段、漢字記憶手段、解析用辞書記憶手段)
4a 基本単語辞書
4b 習熟度別漢字リスト
4c 解析用辞書
21 音素列生成部(音素列生成手段)
22 音声合成部(合成音声生成手段)
24 音声照合部(音響パラメータ抽出手段、音響パラメータ生成手段、照合手段)
26 ユーザインタフェース部(音声情報取得手段)

Claims (7)

  1. テキストデータに形態素解析を行なう形態素解析装置において、
    漢字の習熟度を受け付ける習熟度受付手段と、
    習熟度毎に複数の漢字を記憶してある漢字記憶手段と、
    複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段と、
    前記漢字記憶手段の記憶内容に基づいて、前記単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断する判断手段と、
    該判断手段によって前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換手段と、
    該変換手段が変換した各単語を記憶する解析用辞書記憶手段と、
    該解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なう手段と
    を備えることを特徴とする形態素解析装置。
  2. 前記テキストデータに含まれる漢字を抽出する手段と、
    抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出する手段と、
    検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定する手段とを備え、
    前記習熟度受付手段は、特定された習熟度を受け付けるように構成されていることを特徴とする請求項1に記載の形態素解析装置。
  3. テキストデータに形態素解析を行なう形態素解析装置による形態素解析方法において、
    前記形態素解析装置が、漢字の習熟度を受け付ける習熟度受付ステップと、
    前記形態素解析装置が、習熟度毎に複数の漢字を記憶してある漢字記憶手段の記憶内容に基づいて、複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断するステップと、
    前記形態素解析装置が、前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換ステップと、
    前記形態素解析装置が、該変換ステップで変換した各単語を解析用辞書記憶手段に記憶させるステップと、
    前記形態素解析装置が、前記解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なうステップと
    を含むことを特徴とする形態素解析方法。

  4. コンピュータに、テキストデータに形態素解析を行なわせるためのコンピュータプログラムにおいて、
    習熟度毎に複数の漢字を記憶してある漢字記憶手段と、複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段とを備えるコンピュータに、
    前記漢字記憶手段の記憶内容に基づいて、前記単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、予め取得しておいた習熟度よりも高い習熟度の漢字であるか否かを判断するステップと、
    予め取得しておいた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換ステップと、
    該変換ステップで変換した各単語を解析用辞書記憶手段に記憶させるステップと、
    前記解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なうステップと
    を実行させるためのコンピュータプログラム。
  5. 前記コンピュータに、
    前記テキストデータに含まれる漢字を抽出するステップと、
    抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出するステップと、
    検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定するステップと、
    特定した習熟度を取得するステップと
    を実行させるための請求項4に記載のコンピュータプログラム。
  6. テキストデータから合成音声を生成する音声合成装置において、
    請求項1又は2に記載の形態素解析装置と、
    該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成する音素列生成手段と、
    該音素列生成手段が生成した音素列情報に基づいて合成音声を生成する合成音声生成手段と
    を備えることを特徴とする音声合成装置。
  7. 予め用意された音声情報と照合対象の音声情報とを照合する音声照合装置において、
    請求項1又は2に記載の形態素解析装置と、
    該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成する音素列生成手段と、
    該音素列生成手段が生成した音素列情報における音響パラメータを生成する音響パラメータ生成手段と、
    外部から音声情報を取得する音声情報取得手段と、
    該音声情報取得手段が取得した音声情報から音響パラメータを抽出する音響パラメータ抽出手段と、
    前記音響パラメータ生成手段が生成した音響パラメータ及び前記音響パラメータ抽出手段が抽出した音響パラメータを照合する照合手段と
    を備えることを特徴とする音声照合装置。
JP2007304663A 2007-11-26 2007-11-26 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置 Expired - Fee Related JP5088109B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007304663A JP5088109B2 (ja) 2007-11-26 2007-11-26 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007304663A JP5088109B2 (ja) 2007-11-26 2007-11-26 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置

Publications (2)

Publication Number Publication Date
JP2009129258A JP2009129258A (ja) 2009-06-11
JP5088109B2 true JP5088109B2 (ja) 2012-12-05

Family

ID=40820098

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007304663A Expired - Fee Related JP5088109B2 (ja) 2007-11-26 2007-11-26 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置

Country Status (1)

Country Link
JP (1) JP5088109B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6045175B2 (ja) * 2012-04-05 2016-12-14 任天堂株式会社 情報処理プログラム、情報処理装置、情報処理方法及び情報処理システム
JP2014089443A (ja) * 2012-10-03 2014-05-15 Tottori Univ 文字音読指導装置および文字音読指導プログラム
JP2014174307A (ja) * 2013-03-08 2014-09-22 Kikuichi Nishi 話し言葉表示処理装置
JP2018133026A (ja) * 2017-02-17 2018-08-23 コニカミノルタ株式会社 文書変換装置及び文書変換プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2988304B2 (ja) * 1995-02-23 1999-12-13 松下電器産業株式会社 文字列管理装置
JP2001034611A (ja) * 1999-05-18 2001-02-09 Fujitsu Ltd 読み情報出力装置および記録媒体

Also Published As

Publication number Publication date
JP2009129258A (ja) 2009-06-11

Similar Documents

Publication Publication Date Title
EP1096472B1 (en) Audio playback of a multi-source written document
US7809572B2 (en) Voice quality change portion locating apparatus
US7277851B1 (en) Automated creation of phonemic variations
US6424935B1 (en) Two-way speech recognition and dialect system
US6327566B1 (en) Method and apparatus for correcting misinterpreted voice commands in a speech recognition system
US6876967B2 (en) Speech complementing apparatus, method and recording medium
US20020123894A1 (en) Processing speech recognition errors in an embedded speech recognition system
CN110797006A (zh) 端到端的语音合成方法、装置及存储介质
JP2007206317A (ja) オーサリング方法、オーサリング装置およびプログラム
Davel et al. Pronunciation dictionary development in resource-scarce environments
WO2010136821A1 (en) Electronic reading device
JP5088109B2 (ja) 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置
JP2010197644A (ja) 音声認識システム
US6772116B2 (en) Method of decoding telegraphic speech
JPH06282290A (ja) 自然言語処理装置およびその方法
JP2003162524A (ja) 言語処理装置
JP4026512B2 (ja) 歌唱合成用データ入力プログラムおよび歌唱合成用データ入力装置
JP6340839B2 (ja) 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム
JP2580568B2 (ja) 発音辞書更新装置
JP5125404B2 (ja) 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置
JP2014059330A (ja) 音調表示制御装置およびプログラム
JP7244473B2 (ja) 学習装置、予測装置、学習方法および学習プログラム
JP2007094269A (ja) 音声出力機能付き情報表示制御装置およびその制御プログラム
JP2023006055A (ja) プログラム、情報処理装置、方法
TW200532648A (en) Method and system for inputting Chinese character

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120718

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120814

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120827

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150921

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees