JP5088109B2

JP5088109B2 - 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置

Info

Publication number: JP5088109B2
Application number: JP2007304663A
Authority: JP
Inventors: 伸之片江
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2007-11-26
Filing date: 2007-11-26
Publication date: 2012-12-05
Anticipated expiration: 2027-11-26
Also published as: JP2009129258A

Description

本発明は、テキストデータに形態素解析を行なう形態素解析装置、形態素解析方法、前記形態素解析装置をコンピュータによって実現するためのコンピュータプログラム、前記形態素解析装置を備えた音声合成装置、及び前記形態素解析装置を備えた音声照合装置に関する。

日本語文書のテキストデータを単語（形態素）に分割する形態素解析技術は、音声合成システム、音声照合システム、テキスト検索システム、文書作成システム等に広く利用されている。形態素解析処理は、その結果が各システムにおけるその後の処理に大きな影響を与えるため、高い精度を確保することが必要とされている。形態素解析処理は通常、各単語（形態素）の表記及び品詞情報が対応付けて登録してある単語辞書を用い、単語辞書に登録されている各単語の表記とテキストデータとを照合し、また、各単語の品詞情報を用いて日本語の文法として不都合がないような尤もらしい単語の組み合わせを選択し、テキストデータを形態素に分割する。なお、効率的に形態素解析を行なうアルゴリズムとしては、例えばViterbi（ビタビ）アルゴリズムが知られている。

ところで、解答者（児童）が自分で文字を書いて解答することによる学習効果の向上が期待されており、また、学習教材としてＩＴ（Information Technology）を用いた様々な電子教材の導入が試行されている。例えば、タブレット型のコンピュータを用い、モニタに表示された教材に対して手書きで解答入力できるシステムが普及しており、このようなコンピュータ及び手書き文字の認識技術を用いた漢字の書き取り、算数の筆算の練習等では、一定の効果が得られることが実証されている。

また、国語教育においては、児童が学習教材となる日本語テキストの音読の練習をする場合に、音声合成技術を用いてお手本としてテキストの読み上げを行ない、また、音声照合技術を用いて児童が正しく音読できているか否かを自動評価する等、音声合成技術及び音声照合技術等を利用した学習支援システムも考えられるであろう。

ここで、例えば小学校低学年以下の児童向けの学習教材では、多くの漢字が未学習であるため仮名（特に平仮名）が多用されている場合が多く、仮名が多用されたテキストデータに対して一般的な形態素解析処理を行なった場合、解析誤りが生じ易い。このように誤りを含む形態素解析結果を音声合成システムに用いた場合、読み又はアクセントの誤り、不自然な区切り及び韻律等を有する合成音声を生成してしまう可能性が高い。また、誤りを含む形態素解析結果を音声照合システムにおける音読の自動評価に用いた場合、入力された音声と照合するための音素列又は韻律パターンに誤りが生じる可能性があり、入力された音声に対して正確な評価ができない場合がある。

仮名が多用されたテキストデータに対する形態素解析において解析誤りが生じ易い理由としては、形態素解析に用いる単語辞書には通常、各単語が一般的に使用される表記（漢字、平仮名及び片仮名を含む表記）のみが登録されており、各単語の仮名表記は登録されていないことが挙げられる。即ち、仮名で表記された単語は、単語辞書に登録されていないと判断される可能性があり、この場合、この単語は未知語（未登録語）として扱われる虞がある。

従って、このような問題を解消するために、単語辞書に各単語の仮名表記を登録することが考えられるが、単語辞書に登録される全ての単語の仮名表記を登録するとなると、同一の表記（仮名表記）であっても異なる単語が多数単語辞書に登録されてしまい、形態素解析全体の精度を低下させる虞が生じる。また、単語辞書には児童にとっては難解な漢字を用いる単語が多数登録されているが、児童向けの学習教材に、このような単語を仮名表記で用いることは少ないので、このような単語の仮名表記を単語辞書に登録することは、児童向けのテキストデータに対する形態素解析には不要である場合が多い。

また、形態素解析では、テキストデータの文字列に部分一致する全ての単語を単語辞書から検出し、検出した単語の中から文法的な制約及び表記の長い単語の優先等の所定の法則を用いて、尤もらしい単語の組み合わせを決定するという方法を採る場合が多い。従って、仮名が多用されたテキストデータに対して形態素解析を行なう際には、テキストデータ中の文字列と部分一致する単語が多くなり、結果として、誤った単語を形態素解析の結果としてしまう可能性が高くなる。例えば、「ふさがない」という平仮名のテキストデータに対して形態素解析を行なった場合、「塞がない」又は「房がない」と解析できるため、不適切な形態素結果を出力してしまう可能性がある。

特許文献１には、漢字レベルに対応した漢字情報を管理しておき、かな文字列を漢字かな混じり文字列に変換する際に、学習レベルに応じて設定された漢字レベルの漢字を用いた漢字かな混じり文字列に変換する日本語処理装置が開示されている。また、特許文献２には、かな漢字辞書に登録してある各漢字に対して、それぞれの難易度により定めた教育レベルを管理しており、ひらがなを漢字を含む文字列に変換する際に、設定された教育レベルよりも高レベルの漢字については、漢字以外の文字列への修正又はふり仮名の付加を行なう文書作成編集方法が開示されている。
特開平２−２８８９４５号公報特開平３−８５６６６号公報

上述した特許文献１，２では、かな文字列を漢字かな混じり文字列に変換する際に、設定された漢字レベルの漢字を用い、設定された漢字レベル以上の漢字については漢字以外の文字列を用いることにより、ユーザの学習レベル（漢字レベル）に応じた変換処理を行なうことができる。しかし、特許文献１，２は、形態素解析に用いる単語辞書には各単語が一般的に使用される表記で登録されているため、上述したように仮名が多用されているテキストデータに対する形態素解析において解析誤りが生じ易いという課題を解消するものではなかった。

本発明は斯かる事情に鑑みてなされたものであり、その目的とするところは、仮名を多用したテキストデータに対しても解析誤りを低減した高精度の形態素解析が可能な形態素解析装置、形態素解析方法、コンピュータプログラム、前記形態素解析装置を備えた音声合成装置、及び前記形態素解析装置を備えた音声照合装置を提供することにある。

本発明の他の目的は、形態素解析の処理対象のテキストデータに実際に用いられている漢字に割り当てられた習熟度に応じた解析用辞書を用いることにより、所定の習熟度以下の漢字を用いたテキストデータ、即ち、所定の習熟度よりも高い習熟度の漢字を用いないテキストデータに対して高精度の形態素解析が可能な形態素解析装置及びコンピュータプログラムを提供することにある。

本発明に係る形態素解析装置は、テキストデータに形態素解析を行なう形態素解析装置において、漢字の習熟度毎に複数の漢字を漢字記憶手段に記憶しており、複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて単語辞書記憶手段に記憶している。形態素解析装置は、例えばテキストデータおよびユーザに対応する漢字の習熟度を受け付けた場合、漢字記憶手段の記憶内容に基づいて、単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断し、受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を、単語辞書記憶手段に記憶してある仮名に変換して解析用辞書記憶手段に記憶させる。そして、形態素解析装置は、このような解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なう。よって、テキストデータに対して形態素解析を行なう際に、設定された習熟度以下の漢字のみを用いた表記で各単語が登録してある解析用辞書記憶手段の登録内容に基づいて、設定された習熟度以下の漢字を用いたテキストデータ、即ち、設定された習熟度よりも高い習熟度の漢字を用いないテキストデータに対して精度の高い形態素解析を実行することが可能となる。

本発明に係る形態素解析装置は、形態素解析の処理対象のテキストデータに含まれる漢字を抽出し、抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出し、検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定する。そして、形態素解析装置は、漢字記憶手段の記憶内容に基づいて、単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、特定された習熟度よりも高い習熟度の漢字であるか否かを判断し、特定された習熟度よりも高い習熟度の漢字であると判断された漢字を、単語辞書記憶手段に記憶してある仮名に変換して解析用辞書記憶手段に記憶させる。また、形態素解析装置は、このような解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なう。よって、テキストデータに対して形態素解析を行なう際に、テキストデータに用いられている各漢字の習熟度に基づいてテキストデータに対する習熟度を特定し、特定された習熟度以下の漢字のみを用いた表記で各単語が登録してある解析用辞書記憶手段の登録内容に基づいて、特定された習熟度以下の漢字を用いたテキストデータ、即ち、特定された習熟度よりも高い習熟度の漢字を用いないテキストデータに対して精度の高い形態素解析を実行することが可能となる。

本発明に係る形態素解析装置は、単語辞書記憶手段に、各単語に対応付けて、各単語に含まれる漢字の仮名への変換を許可又は禁止する情報を記憶してあり、単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、受け付けた習熟度よりも高い習熟度の漢字であると判断した場合、単語辞書記憶手段の記憶内容に基づいて、この漢字を含む単語が、仮名への変換が許可された単語であるか否かを判断する。形態素解析装置は、仮名への変換が許可された単語であると判断した場合、前記漢字を、単語辞書記憶手段に記憶してある仮名に変換して解析用辞書記憶手段に記憶させる。よって、形態素解析に用いる解析用辞書記憶手段に記憶される各単語の表記について、仮名に変換すべき単語と、仮名に変換すべきでない単語とを設定することが可能となる。

本発明に係るコンピュータプログラムは、コンピュータに読み取らせて実行させることにより、上述したような形態素解析装置をコンピュータによって実現することが可能となる。

本発明に係る音声合成装置は、テキストデータから合成音声を生成する音声合成装置において、上述したいずれかの形態素解析装置を備え、該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成し、生成した音素列情報に基づいて合成音声を生成する。よって、仮名を多用したテキストデータ、具体的には、所定の習熟度以下の漢字を用いたテキストデータ及び所定の習熟度よりも高い習熟度の漢字を用いないテキストデータに対して行なった精度の高い形態素解析の結果を用いて、精度の高い合成音声を生成することが可能となる。

本発明に係る音声照合装置は、予め用意された音声情報と照合対象の音声情報とを照合する音声照合装置において、上述したいずれかの形態素解析装置を備え、該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成し、生成した音素列情報における音響パラメータを生成する。また、音声照合装置は、外部から音声情報を取得し、取得した音声情報から音響パラメータを抽出し、形態素解析の結果に基づいて生成した音響パラメータと、外部から取得した音声情報から抽出した音響パラメータとを照合する。よって、仮名を多用したテキストデータ、具体的には、所定の習熟度以下の漢字を用いたテキストデータ及び所定の習熟度よりも高い習熟度の漢字を用いないテキストデータに対して行なった精度の高い形態素解析の結果を用いて、精度の高い音声照合を行なうことが可能となる。

本発明に係る音声照合装置は、照合結果を出力する手段を備えることにより、外部から取得した音声情報が適切であるか否かを外部へ通知することが可能となる。

本発明では、テキストデータに対して形態素解析を行なう際に、一般的に使用される表記で各単語が登録されている単語辞書を、例えばテキストデータ又はユーザに対応する習熟度の漢字のみを使用した表記で各単語が登録されている解析用辞書に変換する。具体的には、形態素解析装置は、単語辞書に記憶してある単語に含まれる各漢字の習熟度が、テキストデータ又はユーザに対応する習熟度よりも高い場合、この漢字を仮名に変換して解析用辞書に登録する。このような解析用辞書の登録内容に基づいてテキストデータに形態素解析を行なうことにより、所定の習熟度以下の漢字を用いたテキストデータ、即ち、所定の習熟度よりも高い習熟度の漢字を用いないテキストデータに対する解析誤りを低減することができる。

本発明では、テキストデータに対して形態素解析を行なう際に、形態素解析の処理対象のテキストデータに含まれる各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定し、特定された習熟度の漢字のみを使用した表記で各単語が登録されている解析用辞書を生成する。具体的には、形態素解析装置は、単語辞書に記憶してある単語に含まれる各漢字の習熟度が、特定された習熟度よりも高い場合、この漢字を仮名に変換して解析用辞書に登録する。これにより、各テキストデータに実際に用いられている漢字の習熟度に応じた解析用辞書を生成することができ、このような解析用辞書の登録内容に基づいてテキストデータに形態素解析を行なうことにより、各テキストデータに対する解析誤りを低減することができる。

本発明では、単語辞書に各単語の表記に含まれる漢字の仮名への変換を許可又は禁止する情報が記憶されており、各漢字を仮名に変換して解析用辞書を生成する際に、各漢字を含む単語が仮名への変換が許可された単語であるか否かを判断し、仮名への変換が許可された単語である場合にのみ、この漢字を仮名に変換して解析用辞書に登録する。例えば、対策の「策」や戸籍の「籍」などの公式な場面で多く使われる漢字は、仮名で用いる可能性が低く、また、このような漢字を仮名に変換して解析用辞書に登録した場合、同一の仮名表記によって解析誤りが増加する虞がある。従って、本発明では、形態素解析に用いる解析用辞書記憶手段に記憶される各単語の表記について、仮名に変換すべき単語と、仮名に変換すべきでない単語とを設定し、仮名で用いる可能性が低い漢字は仮名に変換しないことにより、精度の高い形態素解析の実行を可能とする。

本発明では、上述したように、仮名を多用したテキストデータ、具体的には、所定の習熟度以下の漢字を用いたテキストデータ、所定の習熟度よりも高い習熟度の漢字を用いないテキストデータに対して精度の高い形態素解析を行なって得られた情報に基づいて、適切な音素列情報を生成することができ、また、適切な音素列情報に基づいて適切な合成音声を生成することができるので、高精度及び高品質の合成音声を生成することができる。

本発明では、上述したように、仮名を多用したテキストデータ、具体的には、所定の習熟度以下の漢字を用いたテキストデータ、所定の習熟度よりも高い習熟度の漢字を用いないテキストデータに対して精度の高い形態素解析を行なって得られた情報に基づいて、適切な音素列情報を生成し、生成した音素列情報における音響パラメータを生成する。従って、音声照合装置は、適切に生成された音響パラメータと、外部から取得した音声情報から抽出した音響パラメータとを照合するので、高精度の照合結果を得ることができる。なお、照合結果を外部へ出力することにより、外部から取得した音声情報が適切であるか否かを外部へ通知することができる。

以下に、本発明に係る形態素解析装置、音声合成装置及び音声照合装置を、各実施形態を示す図面に基づいて詳述する。なお、以下の各実施形態では、本発明に係るコンピュータプログラムを公知のパーソナルコンピュータ等に読み取らせ、パーソナルコンピュータのＣＰＵ等によって実行させることによって本発明に係る形態素解析装置を実現する構成について説明する。しかし、等価な働きをするハードウェアによって本発明に係る形態素解析装置を実現してもよい。

（実施形態１）
以下に、本発明に係る形態素解析装置を、実施形態１を示す図面に基づいて詳述する。図１は本発明に係る形態素解析装置の構成例を示すブロック図である。本発明に係る形態素解析装置１０は、例えば公知のパーソナルコンピュータであり、制御部１、ＲＯＭ２、ＲＡＭ３、ＨＤＤ４、操作部５、表示部６等を備え、これらのハードウェア各部はそれぞれバス１ａを介して相互に接続されている。

制御部１は、ＣＰＵ（Central Processing Unit ）又はＭＰＵ（Micro Processor Unit）等で構成され、ＲＯＭ２又はＨＤＤ４に予め記憶してある制御プログラムを適宜ＲＡＭ３に読み出して実行すると共に、上述したハードウェア各部の動作を制御する。ＲＯＭ２には、形態素解析装置１０を本発明の形態素解析装置として動作させるために必要な種々の制御プログラムが予め格納されている。ＲＡＭ３はＳＲＡＭ又はフラッシュメモリ等で構成されており、制御部１による制御プログラムの実行時に発生する種々のデータを一時的に記憶する。

ＨＤＤ４は大容量の記憶装置であり、ＨＤＤ（単語辞書記憶手段、漢字記憶手段）４には、形態素解析装置１０を本発明の形態素解析装置として動作させるために必要な種々の制御プログラム、テキストデータ、図２に示すような基本単語辞書４ａ、図３に示すような習熟度別漢字リスト４ｂ、ユーザに対して各種の情報を通知するための画面情報等が予め記憶されている。なお、基本単語辞書４ａ及び習熟度別漢字リスト４ｂの登録内容の詳細については後述する。

なお、基本単語辞書４ａ及び習熟度別漢字リスト４ｂは、ＨＤＤ４に予め格納されているだけでなく、形態素解析装置１０が外部メモリ（図示せず）に記憶してあるデータの読み出しが可能なドライバ（図示せず）を備える場合には、外部メモリに記憶された各種情報をドライバによって読み出してＨＤＤ４に格納させてもよい。また、形態素解析装置１０がインターネットのようなネットワークとの接続が可能な通信部（図示せず）を備える場合には、ネットワークを介して外部の装置から各種情報をダウンロードしてＨＤＤ４に格納させてもよい。また、ＨＤＤ４に記憶してあるテキストデータは、形態素解析装置１０で作成されたテキストデータであってもよく、外部の装置で作成されて外部メモリ（図示せず）又はネットワーク（図示せず）を介して形態素解析装置１０に読み取らせたテキストデータであってもよい。

操作部５及び表示部６は、デジタイザ又はタブレット等を構成する。具体的には、表示部６は、例えば液晶ディスプレイであり、制御部１からの指示に従って、形態素解析装置１０の動作状態、操作部５を介して入力された情報、ユーザに対して通知すべき情報、ユーザが形態素解析装置１０を操作するために必要な操作キー等を表示する。操作部５は、例えばスタイラスペン又はマウス等である。ユーザが表示部６に表示された操作キーを操作部５によって操作した場合、操作部５は操作された操作キーに対応した制御信号を制御部１へ送出し、制御部１は操作部５から取得した制御信号に対応した処理を実行する。

図２は基本単語辞書４ａの登録内容を示す模式図であり、登録されている単語の一部を例示している。図２に示すように、基本単語辞書４ａには、各単語について、表記、読みアクセント情報、品詞情報、表記に含まれる漢字の仮名への変換を許可又は禁止する変換可否情報、及び表記に含まれる漢字とその仮名（平仮名）とを対応させる漢字かな対応情報がそれぞれ登録されている。基本単語辞書４ａの表記の欄には、各単語が一般的に使用される表記（漢字、平仮名及び片仮名を含む表記）が登録されている。

基本単語辞書４ａの読みアクセント情報の欄には、各単語の読み及びアクセントの情報が登録されている。図２に示した基本単語辞書４ａでは、読みの情報として各単語の片仮名表記が登録されると共に、アクセントの情報として各単語のアクセントの位置を「’」で示している。なお、図２に示した基本単語辞書４ａでは、各単語の読みの情報として片仮名表記を用いているため、例えば「童話」の読みアクセント情報として「ドーワ」が登録されているが、読みアクセント情報の表記はこれに限られず、例えば「ｄｏ−ｗａ」のようにローマ字表記を用いることもできる。

また、基本単語辞書４ａの品詞情報の欄には、普通名詞、サ行五段動詞語幹（サ行五段活用の動詞の語幹）、サ行五段動詞連用形（サ行五段活用の動詞の連用形）等、日本語の文法に従った品詞分類が登録されている。なお、品詞分類は形態素解析装置によって若干の違いがあり、形態素解析装置１０に合わせた品詞分類を登録すればよい。基本単語辞書４ａの変換可否情報の欄には、各単語の表記に含まれる漢字の仮名への変換を許可する場合には「可」が登録され、許可しない（禁止する）場合には「否」が登録されている。

図２に示した基本単語辞書４ａでは、「童話」、「電話」、「話」のように比較的容易で平仮名表記でも用いられる単語については「可」が登録されており、「閑話」、「話術」のように比較的難解で平仮名表記で用いられる可能性の低い単語については「否」が登録されている。基本単語辞書４ａの漢字かな対応情報の欄には、変換可否情報として「可」が登録された各単語について、表記に含まれる各漢字と、各漢字の仮名（ここでは平仮名）とが対応付けて登録されている。

図３は習熟度別漢字リスト４ｂの登録内容を示す模式図である。図３に示すように、習熟度別漢字リスト４ｂには、習熟度毎に複数の漢字が登録されている。例えば、習熟度２には「話」、「電」、「読」等の漢字が登録されており、習熟度３には「童」、「鉄」、「習」等の漢字が登録されている。なお、習熟度は、予め設定された漢字の難易度の基準において、どのレベルの漢字を習熟しているかを示す情報であり、例えば小学校及び中学校における各学年に対応する数値を用いることができる。従って、例えば小学校１年生の習熟度を習熟度１とした場合、習熟度１に対応する漢字として、小学校１年生で学習する漢字を登録しておけばよい。

以下に、上述した構成の形態素解析装置１０において、制御部１がＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムを実行することによって実現される各種の機能について説明する。図４は実施形態１の形態素解析装置１０の機能構成例を示す機能ブロック図である。本実施形態１の形態素解析装置１０において、制御部１は、ＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムを実行することによって、漢字習熟度受付部１１、辞書変換部１２、テキスト読込部１３、形態素解析部１４、形態素解析結果出力部１５等の各機能を実現する。

本実施形態１の形態素解析装置１０では、ユーザは、形態素解析装置１０によってテキストデータに対して形態素解析を行なう場合、各テキストデータに相当する漢字の習熟度を操作部５を介して入力する。漢字習熟度受付部（習熟度受付手段）１１は、操作部５を介してユーザが入力した漢字の習熟度を受け付け、受け付けた習熟度を辞書変換部１２へ送出する。なお、ユーザが入力する漢字の習熟度は、習熟度別漢字リスト４ｂにおける習熟度であり、例えば小学校及び中学校における各学年自体であってもよく、各学年に相当する何らかの数値又は情報であってもよい。

辞書変換部１２は、基本単語辞書４ａに登録されている単語のうちで仮名への変換が許可された単語について、漢字習熟度受付部１１を介してユーザが入力した習熟度よりも高い習熟度の漢字が表記に含まれている場合に、その漢字を平仮名に変換し、解析用辞書４ｃに登録する。なお、辞書変換部１２は、平仮名への変換が禁止された単語については、解析用辞書４ｃへの登録を行なわず、基本単語辞書４ａに登録されている単語のうちで漢字を含まない単語については、そのまま解析用辞書４ｃに登録する。

このように平仮名への変換が禁止された単語を解析用辞書４ｃへ登録しない構成であっても、このような単語は、該単語に含まれる漢字の習熟度よりも低い習熟度に相当するテキストデータにおいて平仮名表記で用いられる可能性が低いため、問題が生じる可能性は低い。

具体的には、辞書変換部１２は、基本単語辞書４ａに登録されている単語を１つずつ読み出し、各単語が漢字を含むか否かを判断する。漢字を含まない場合、辞書変換部１２は、この単語の表記、読みアクセント情報及び品詞情報を基本単語辞書４ａから読み出し、そのまま解析用辞書４ｃに登録する。漢字を含む場合、辞書変換部（判断手段）１２は、習熟度別漢字リスト４ｂの登録内容を参照し、この漢字が、漢字習熟度受付部１１を介して受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断する。

受け付けた習熟度よりも高い習熟度の漢字でない場合、辞書変換部１２は、この漢字を含む単語の表記、読みアクセント情報及び品詞情報を基本単語辞書４ａから読み出し、そのまま解析用辞書４ｃに登録する。受け付けた習熟度よりも高い習熟度の漢字である場合、辞書変換部１２は、基本単語辞書４ａの変換可否情報の欄に登録してある情報に基づいて、この漢字を含む単語が平仮名への変換が許可された単語であるか否かを判断する。

平仮名への変換が許可された単語でない場合、即ち、平仮名への変換が禁止されている単語である場合、辞書変換部１２は、この単語の解析用辞書４ｃへの登録を行なわない。平仮名への変換が許可された単語である場合、辞書変換部（変換手段）１２は、前記漢字、即ち、漢字習熟度受付部１１を介して受け付けた習熟度よりも高い習熟度であるとされた漢字を、基本単語辞書４ａの漢字かな対応情報の欄に登録してある平仮名に変換する。そして、辞書変換部１２は、この単語の読みアクセント情報及び品詞情報を基本単語辞書４ａから読み出し、対応する漢字を平仮名に変換して得られた単語の表記、基本単語辞書４ａから読み出した読みアクセント情報及び品詞情報を対応付けて解析用辞書４ｃに登録する。

上述したような処理を行なうことにより、辞書変換部１２は、図５に示すような解析用辞書４ｃ、即ち、漢字習熟度受付部１１を介して受け付けた習熟度以下の習熟度の漢字のみを用いた表記で各単語が登録してある解析用辞書４ｃを生成することができる。なお、生成された解析用辞書４ｃはＨＤＤ（解析用辞書記憶手段）４に記憶される。

図５は解析用辞書４ｃの登録内容を示す模式図である。なお、図５（ａ）には、漢字習熟度受付部１１を介して習熟度１を受け付けた場合に辞書変換部１２が生成する解析用辞書４ｃを示しており、図５（ｂ）には、漢字習熟度受付部１１を介して習熟度２を受け付けた場合に辞書変換部１２が生成する解析用辞書４ｃを示している。

漢字習熟度受付部１１を介して習熟度１を受け付けた場合、辞書変換部１２は、基本単語辞書４ａに登録されている単語の表記に含まれる各漢字に対して、習熟度１以下の漢字であれば平仮名への変換を行なわずに、習熟度１よりも高い習熟度の漢字であれば、この漢字を含む単語が平仮名への変換が許可されていれば平仮名への変換を行ない、解析用辞書４ｃに登録する。なお、辞書変換部１２は、平仮名への変換が許可されていない単語については解析用辞書４ｃへの登録を行なわず、また、基本単語辞書４ａに登録されている単語のうちで漢字を含まない単語については、各単語の表記、読みアクセント情報及び品詞情報を基本単語辞書４ａから読み出してそのまま解析用辞書４ｃに登録する。

従って、図２に示した基本単語辞書４ａにおいては、図２に例示してある漢字は全て習熟度２以上の漢字であり、「閑話」、「話術」以外の単語は平仮名への変換が許可されているため、漢字習熟度受付部１１を介して習熟度１を受け付けた場合、図５（ａ）に示すように、「閑話」、「話術」以外の単語に対して、各漢字が平仮名に変換された表記、読みアクセント情報及び品詞情報がそれぞれ対応付けて登録された解析用辞書４ｃが生成される。

漢字習熟度受付部１１を介して習熟度２を受け付けた場合、辞書変換部１２は、基本単語辞書４ａに登録されている単語の表記に含まれる各漢字に対して、習熟度２以下の漢字であれば平仮名への変換を行なわずに、習熟度２よりも高い習熟度の漢字であれば、この漢字を含む単語が平仮名への変換が許可されていれば平仮名への変換を行ない、解析用辞書４ｃに登録する。なお、辞書変換部１２は、平仮名への変換が許可されていない単語については解析用辞書４ｃへの登録を行なわず、また、基本単語辞書４ａに登録されている単語のうちで漢字を含まない単語については、各単語の表記、読みアクセント情報及び品詞情報を基本単語辞書４ａから読み出してそのまま解析用辞書４ｃに登録する。

従って、図２に示した基本単語辞書４ａにおいて、図２に例示した単語に含まれる「童」、「閑」、「術」は習熟度３以上の漢字であり、「閑話」、「話術」以外の単語は平仮名への変換が許可されているため、漢字習熟度受付部１１を介して習熟度２を受け付けた場合、図５（ｂ）に示すように、「閑話」、「話術」以外の単語、即ち「童話」に対して、「童」が平仮名に変換された表記、読みアクセント情報及び品詞情報がそれぞれ対応付けて登録された解析用辞書４ｃが生成される。なお、「童話」以外の単語は、習熟度３以上の漢字を含んでいないため、基本単語辞書４ａに登録された表記がそのまま解析用辞書４ｃに登録される。

テキスト読込部１３は、ＨＤＤ４に記憶してあるテキストデータをＨＤＤ４から読み出してＲＡＭ３に読み込む。
形態素解析部１４は、テキスト読込部１３によってＲＡＭ３に読み込まれたテキストデータに対して、辞書変換部１２によって生成された解析用辞書４ｃの登録内容に基づく形態素解析を行なう。

具体的には、形態素解析部１４は、ＲＡＭ３に読み込まれたテキストデータと、解析用辞書４ｃに登録された各単語の表記とを照合し、また、各単語の品詞情報に基づいて日本語の文法として不都合がないように尤もらしい単語の組み合わせを選択し、テキストデータを解析用辞書４ｃに登録された各単語に分解する。また、形態素解析部１４は、分解した各単語の読みアクセント情報を解析用辞書４ｃから読み出し、解析結果として形態素解析結果出力部１５へ送出する。形態素解析結果出力部１５は、ここでは、形態素解析部１４による形態素解析の解析結果をＲＡＭ３に格納する。

上述したように、本実施形態１の形態素解析装置１０では、テキストデータに対して形態素解析を行なう際に、このテキストデータに対応して入力（設定）された漢字の習熟度に応じた解析用辞書４ｃを生成することができ、このような解析用辞書４ｃに基づく形態素解析を行なうので、従来の形態素解析においては解析誤りの低減が困難であったテキストデータ、例えば小学生以下の児童向けの平仮名を多用したテキストデータに対しても解析誤りの少ない形態素解析を行なうことが可能となる。

以下に、本実施形態１の形態素解析装置１０による形態素解析処理についてフローチャートに基づいて詳述する。図６は形態素解析処理の手順を示すフローチャートである。なお、以下の処理は、形態素解析装置１０のＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムに従って制御部１によって実行される。

形態素解析装置１０のユーザは、操作部５を操作することによって１つのテキストデータに対する形態素解析の実行を指示する場合、このテキストデータに対応する漢字の習熟度を操作部５を介して入力する。従って、制御部１（漢字習熟度受付部１１）は、操作部５を介してユーザが入力した漢字の習熟度を取得し（Ｓ１）、取得した習熟度に基づいて、基本単語辞書４ａから解析用辞書４ｃを生成する辞書変換処理を実行する（Ｓ２）。なお、辞書変換処理の詳細については図７に基づいて後述する。

次に、制御部１（テキスト読込部１３）は、ユーザによって形態素解析の実行を指示されたテキストデータをＨＤＤ４から読み出してＲＡＭ３に読み込む（Ｓ３）。制御部１（形態素解析部１４）は、ＲＡＭ３に読み込まれたテキストデータに対して、ステップＳ２で実行した辞書変換処理によって生成された解析用辞書４ｃの登録内容に基づく形態素解析を実行し（Ｓ４）、テキストデータを解析用辞書４ｃに登録された各単語に分解すると共に、分解した各単語の読みアクセント情報を解析用辞書４ｃから読み出す。そして、制御部１（形態素解析結果出力部１５）は、解析用辞書４ｃから読み出した各単語の読みアクセント情報を形態素解析結果としてＲＡＭ３に記憶させる（Ｓ５）。

以下に、上述した形態素解析処理における辞書変換処理（図６中のステップＳ２）についてフローチャートに基づいて説明する。図７は辞書変換処理の手順を示すフローチャートである。なお、以下の処理は、形態素解析装置１０のＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムに従って制御部１（辞書変換部１２）によって実行される。

制御部１は、基本単語辞書４ａに登録されている単語から１つを読み出し（Ｓ１１）、読み出した単語が漢字を含むか否かを判断する（Ｓ１２）。漢字を含まないと判断した場合（Ｓ１２：ＮＯ）、制御部１は、この単語の表記、読みアクセント情報及び品詞情報を基本単語辞書４ａから読み出し、解析用辞書４ｃに登録する（Ｓ１８）。読み出した単語が漢字を含むと判断した場合（Ｓ１２：ＹＥＳ）、制御部１は、この単語に含まれる漢字を１つ抽出する（Ｓ１３）。制御部１は、習熟度別漢字リスト４ｂの登録内容に基づいて、抽出した漢字が、ステップＳ１で取得した習熟度よりも高い習熟度の漢字であるか否かを判断する（Ｓ１４）。

抽出した漢字が、ステップＳ１で取得した習熟度よりも高い習熟度の漢字でないと判断した場合（Ｓ１４：ＮＯ）、制御部１は、この漢字に対しては平仮名への変換を行なわず、ステップＳ１１で読み出した単語に含まれる全ての漢字を抽出したか否かを判断する（Ｓ１７）。全ての漢字を抽出していないと判断した場合（Ｓ１７：ＮＯ）、制御部１は、ステップＳ１３へ処理を戻し、ステップＳ１１で読み出した単語に含まれる異なる漢字を１つ抽出する（Ｓ１３）。

抽出した漢字が、ステップＳ１で取得した習熟度よりも高い習熟度の漢字であると判断した場合（Ｓ１４：ＹＥＳ）、制御部１は、基本単語辞書４ａの変換可否情報の欄に登録してある情報に基づいて、この漢字を含む単語、即ち、ステップＳ１１で読み出した単語が平仮名への変換が許可された単語であるか否かを判断する（Ｓ１５）。平仮名への変換が許可された単語でないと判断した場合（Ｓ１５：ＮＯ）、制御部１は、ステップＳ１１へ処理を戻し、この単語を解析用辞書４ｃへ登録せず、基本単語辞書４ａから異なる単語を１つ読み出し（Ｓ１１）、読み出した単語に対してステップＳ１１〜Ｓ１８の処理を繰り返す。

平仮名への変換が許可された単語であると判断した場合（Ｓ１５：ＹＥＳ）、制御部１は、ステップＳ１３で抽出した漢字に対する平仮名を基本単語辞書４ａから読み出し、読み出した平仮名に変換する（Ｓ１６）。制御部１は、ステップＳ１１で読み出した単語に含まれる全ての漢字を抽出したか否かを判断し（Ｓ１７）、全ての漢字を抽出していないと判断した場合（Ｓ１７：ＮＯ）、ステップＳ１３へ処理を戻す。一方、制御部１は、全ての漢字を抽出したと判断した場合（Ｓ１７：ＹＥＳ）、ステップＳ１１で読み出した単語の読みアクセント情報及び品詞情報を基本単語辞書４ａから読み出し、この単語の、ステップＳ１６で対応する漢字が平仮名に変換された表記、基本単語辞書４ａから読み出した読みアクセント情報及び品詞情報を解析用辞書４ｃに登録する（Ｓ１８）。

制御部１は、基本単語辞書４ａに登録されている全ての単語の読み出しを終了したか否かを判断し（Ｓ１９）、終了していないと判断した場合（Ｓ１９：ＮＯ）、ステップＳ１１へ処理を戻し、基本単語辞書４ａから異なる単語を１つ読み出し（Ｓ１１）、読み出した単語に対してステップＳ１１〜Ｓ１８の処理を繰り返す。基本単語辞書４ａに登録されている全ての単語の読み出しを終了したと判断した場合（Ｓ１９：ＹＥＳ）、制御部１は、上述した辞書変換処理を終了し、図６に示した形態素解析処理へ処理を戻す。

上述したように、本実施形態１の形態素解析装置１０では、テキストデータに対して形態素解析を行なう場合、このテキストデータに対して設定された漢字の習熟度に応じた解析用辞書４ｃを生成することにより、この解析用辞書４ｃに基づいて高精度の形態素解析を実行することができる。

上述した実施形態１の形態素解析装置１０では、制御部１（漢字習熟度受付部１１）が、操作部５を介してユーザが入力した漢字の習熟度を受け付けるように構成されていた。しかし、例えば、各テキストデータ毎に予め習熟度を設定しておき、ユーザによって形態素解析の処理対象に１つのテキストデータが指定された場合、制御部１は、このテキストデータに対して設定された習熟度を受け付けるように構成することもできる。この場合、テキストデータ（学習教材）の作成者が意図した習熟度を設定することができ、この習熟度に対応した解析用辞書４ｃに基づく形態素解析の実行が可能となり、より高精度の形態素解析を行なうことができる。

（実施形態２）
以下に、本発明に係る形態素解析装置を、実施形態２を示す図面に基づいて詳述する。なお、本実施形態２の形態素解析装置は、上述した実施形態１の形態素解析装置１０と同様の構成によって実現することができるので、同様の構成については同一の符号を付して説明を省略する。

上述した実施形態１の形態素解析装置１０において、制御部１（漢字習熟度受付部１１）は、ユーザが操作部５を介して入力した漢字の習熟度を取得するように構成されていた。
本実施形態２の形態素解析装置１０では、制御部１は、テキスト読込部１３によってＲＡＭ３に読み込まれたテキストデータに含まれる各漢字の習熟度に基づいて、このテキストデータに対する漢字の習熟度を検出するように構成されている。

図８は実施形態２の形態素解析装置１０の機能構成例を示す機能ブロック図である。本実施形態２の形態素解析装置１０において、制御部１は、ＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムを実行することにより、上述した実施形態１の形態素解析装置１０と同様に、漢字習熟度受付部１１、辞書変換部１２、テキスト読込部１３、形態素解析部１４、形態素解析結果出力部１５等の各機能を実現するほか、漢字習熟度検出部１６の機能を実現する。

なお、本実施形態２の形態素解析装置１０では、ユーザは、形態素解析装置１０によってテキストデータに対して形態素解析を行なう場合、各テキストデータに相当する漢字の習熟度を入力する必要はない。

漢字習熟度検出部１６は、テキスト読込部１３によってＲＡＭ３に読み込まれたテキストデータに含まれる各漢字の習熟度を、習熟度別漢字リスト４ｂの登録内容に基づいて検出し、検出した習熟度のうちで最高の習熟度を、このテキストデータに対応する習熟度として特定する。漢字習熟度受付部１１は、漢字習熟度検出部１６によって特定されたテキストデータに対応する習熟度を辞書変換部１２へ送出する。そして、辞書変換部１２は、漢字習熟度受付部１１を介して取得した習熟度に対応する解析用辞書４ｃを生成する。

なお、辞書変換部１２が、基本単語辞書４ａの登録内容を、漢字習熟度受付部１１から取得した習熟度に基づいて変換して解析用辞書４ｃを生成する処理は、上述の実施形態１で説明した処理と同様であるので説明を省略する。

上述したように、本実施形態２の形態素解析装置１０では、テキストデータに対して形態素解析を行なう際に、このテキストデータに含まれる漢字の習熟度に基づいて、このテキストデータに対応する習熟度を特定し、特定された習熟度に応じた解析用辞書４ｃを生成するので、各テキストデータにおいて実際に用いられている漢字に対応した解析用辞書４ｃを生成することができる。また、このような解析用辞書４ｃに基づく形態素解析を行なうので、従来の形態素解析においては解析誤りの低減が困難であったテキストデータ、例えば小学生以下の児童向けの平仮名を多用したテキストデータに対しても解析誤りの少ない形態素解析を行なうことが可能となる。

以下に、本実施形態２の形態素解析装置１０による形態素解析処理についてフローチャートに基づいて詳述する。図９は形態素解析処理の手順を示すフローチャートである。なお、以下の処理は、形態素解析装置１０のＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムに従って制御部１によって実行される。

形態素解析装置１０のユーザが操作部５を操作することによって１つのテキストデータに対する形態素解析の実行を指示した場合、制御部１（テキスト読込部１３）は、ユーザによって形態素解析の実行を指示されたテキストデータをＨＤＤ４から読み出してＲＡＭ３に読み込む（Ｓ２１）。制御部１は、習熟度別漢字リスト４ｂに登録された習熟度のうちで最低の習熟度をＲＡＭ３に一旦記憶させる（Ｓ２２）。

制御部１（漢字習熟度検出部１６）は、ＲＡＭ３に読み込まれたテキストデータに含まれる漢字を１つ抽出し（Ｓ２３）、習熟度別漢字リスト４ｂの登録内容に基づいて、抽出した漢字の習熟度を検出する（Ｓ２４）。制御部１は、検出した習熟度が、ＲＡＭ３に記憶させた習熟度よりも高い習熟度であるか否かを判断し（Ｓ２５）、高い習熟度であると判断した場合（Ｓ２５：ＹＥＳ）、ＲＡＭ３に記憶させた習熟度を、検出した習熟度に更新する（Ｓ２６）。検出した習熟度が、ＲＡＭ３に記憶させた習熟度よりも高い習熟度でないと判断した場合（Ｓ２５：ＮＯ）、制御部１は、ステップＳ２６の処理をスキップし、ステップＳ２７へ処理を移行する。

制御部１は、ステップＳ２１でＲＡＭ３に読み込まれたテキストデータに含まれる全ての漢字を抽出したか否かを判断しており（Ｓ２７）、全ての漢字を抽出していないと判断した場合（Ｓ２７：ＮＯ）、ステップＳ２３へ処理を戻し、ＲＡＭ３に読み込まれたテキストデータに含まれる異なる漢字を１つ抽出し（Ｓ２３）、抽出した漢字に対してステップＳ２４〜Ｓ２６の処理を繰り返す。

ステップＳ２１でＲＡＭ３に読み込まれたテキストデータに含まれる全ての漢字を抽出したと判断した場合（Ｓ２７：ＹＥＳ）、制御部１は、この時点でＲＡＭ３に記憶してある習熟度を、ステップＳ２１で読み出したテキストデータに対応する習熟度に特定する（Ｓ２８）。制御部１は、特定した習熟度に基づいて、基本単語辞書４ａから解析用辞書４ｃを生成する辞書変換処理を実行する（Ｓ２９）。なお、本実施形態２の辞書変換処理は、実施形態１において図７に基づいて説明した処理と同様である。

制御部１（形態素解析部１４）は、ステップＳ２１でＲＡＭ３に読み込まれたテキストデータに対して、ステップＳ２９で実行した辞書変換処理によって生成された解析用辞書４ｃの登録内容に基づく形態素解析を実行し（Ｓ３０）、テキストデータを解析用辞書４ｃに登録された各単語に分解すると共に、分解した各単語の読みアクセント情報を解析用辞書４ｃから読み出す。そして、制御部１（形態素解析結果出力部１５）は、解析用辞書４ｃから読み出した各単語の読みアクセント情報を形態素解析結果としてＲＡＭ３に記憶させる（Ｓ３１）。

上述したように、本実施形態２の形態素解析装置１０では、テキストデータに対して形態素解析を行なう場合、このテキストデータに含まれる漢字の習熟度に基づいて特定された習熟度に応じた解析用辞書４ｃを生成することにより、各テキストデータにおいて実際に用いられている漢字に対応した解析用辞書４ｃに基づいて高精度の形態素解析を実行することができる。

（実施形態３）
以下に、本発明に係る形態素解析装置を備えた本発明に係る音声合成装置及び音声照合装置を、実施形態３である音読練習支援装置を示す図面に基づいて詳述する。なお、本実施形態３の音読練習支援装置は、上述した実施形態１の形態素解析装置１０の構成を備えており、同様の構成については同一の符号を付して説明を省略する。

図１０は実施形態３に係る音読練習支援装置の構成例を示すブロック図である。本実施形態３に係る音読練習支援装置１００は、図１に示した制御部１、ＲＯＭ２、ＲＡＭ３、ＨＤＤ４、操作部５、表示部６のほかに、音声入力部７及び音声出力部８を備えており、これらのハードウェア各部はそれぞれバス１ａを介して相互に接続されている。

また、本実施形態３の音読練習支援装置１００において、ＨＤＤ４には、テキストデータ、図２に示すような基本単語辞書４ａ、図３に示すような習熟度別漢字リスト４ｂ、ユーザに対して各種の情報を通知するための画面情報のほかに、音読練習支援装置１００を本発明の音声合成装置及び音声照合装置として動作させるために必要な種々の制御プログラム、音素列生成ルール４ｄ、音素長テーブル４ｅ、韻律生成ルール４ｆ、波形辞書４ｇ等が予め記憶されている。

音声入力部７は、マイクロフォン及びＡ／Ｄ（アナログ／デジタル）変換器等を備えており、例えばユーザが発した音声をマイクロフォンによって集音し、得られたアナログの音声信号をＡ／Ｄ変換器によってデジタルの音声信号に変換する。音声入力部７は、取得した音声信号を例えばＲＡＭ３に記憶させる。
音声出力部８は、音声増幅回路及びスピーカ等を備えており、例えばＲＡＭ３又はＨＤＤ４に記憶されている音声信号（音声波形）に基づく音声を出力する。

音素列生成ルール４ｄ、音素長テーブル４ｅ、韻律生成ルール４ｆ、波形辞書４ｇの詳細については図示しないが、音素列生成ルール４ｄには、例えば、各単語（形態素）の読みに対応する音素の情報、具体的には、読み「ド」：音素「do」、読み「ワ」：音素「wa」といった情報、各単語（形態素）を連結した場合にアクセントの位置がどのように移動するかを示す情報等が登録されている。

音素長テーブル４ｅには、各音素の長さが定義されており、例えば、音素「ｋ」：音素長「10msec」といった情報が登録されている。また、韻律生成ルール４ｆには、音素列情報から韻律データを生成する際のルールが登録されており、波形辞書４ｇには、各音素に対応する音声波形が登録されている。

以下に、上述した構成の音読練習支援装置１００において、制御部１がＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムを実行することによって実現される各種の機能について説明する。図１１は実施形態３の音読練習支援装置１００の機能構成例を示す機能ブロック図である。本実施形態３の音読練習支援装置１００において、制御部１は、ＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムを実行することによって、上述した実施形態１の形態素解析装置１０、音素列生成部２１、音声合成部２２、音響モデル格納部２３、音声照合部２４、指摘事項作成部２５、ユーザインタフェース部２６等の各機能と、これらの各機能の動作を制御する主制御部２０の機能とを実現する。

ユーザインタフェース部（音声情報取得手段）２６は、操作部５を介したユーザによるキー操作の入力を受け付け、ユーザが発した音声の音声入力部７を介した入力を受け付ける。また、ユーザインタフェース部２６は、ＲＡＭ３又はＨＤＤ４に記憶された音声信号に基づく音声の音声出力部８を介した出力、各種の情報を通知するための画面の表示部６への表示等を行なう。

音素列生成部（音素列生成手段）２１は、形態素解析装置１０によって実行された形態素解析の解析結果を取得し、取得した解析結果に対応する音素列情報、即ち、形態素解析装置１０によって形態素解析が施されたテキストデータに対応する音素列情報を、音素列生成ルール４ｄに従って生成する。

ここで、本実施形態３の音読練習支援装置１００が、「くまさんはもりにいきました」というテキストデータに対して処理を行なったとした場合、形態素解析装置１０によって「クマ’（普通名詞）サン（接尾語）ハ（助詞）モリ（普通名詞）ニ（助詞）イ（カ行五段動詞語幹）キ’（カ行五段動詞連用形）マ’シ（助動詞連用形）タ（助詞）」という解析結果が得られる。

音素列生成部２１は、音素列生成ルール４ｄに基づいて、形態素解析装置１０によって得られた解析結果から、「kuma’sanwa_morini_ikima’shita」という音素列情報を生成する。なお、音素列生成部２１が生成した音素列情報はＲＡＭ３に一旦格納される。また、音素列情報中の「’」はアクセントの位置を、「_」はアクセント句の境界をそれぞれ示している。

音声合成部（合成音声生成手段）２２は、音素長テーブル４ｅ、韻律生成ルール４ｆ及び波形辞書４ｇに基づいて、音素列生成部２１によって生成された音素列情報に対応する音声波形（合成音声）を生成する。具体的には、音声合成部２２は、まず、音素長テーブル４ｅの登録内容に基づいて、音素列生成部２１によって生成された音素列情報中の各音素に対応する音素長を特定する。次に、音声合成部２２は、韻律生成ルール４ｆに基づいて、音素列生成部２１によって生成された音素列情報に対応するピッチパターンを生成する。

そして、音声合成部２２は、音素列生成部２１によって生成された音素列情報中の各音素に対応する音声波形を波形辞書４ｇから抽出し、抽出した音声波形を、特定した各音素の音素長と、音素列情報に対応するピッチパターンとに適合するように調整し、合成音声を生成する。なお、音声合成部２２が生成した合成音声は一旦ＲＡＭ３に格納され、主制御部２０からの指示に従ったタイミングで音声出力部８へ送出され、音声出力部８から音声出力される。

上述したような各処理を行なうことにより、本実施形態３の音読練習支援装置１００は、テキストデータに基づく合成音声を生成する音声合成装置として機能することができる。また、本実施形態３の音読練習支援装置１００は、上述した実施形態１の形態素解析装置１０を備えているため、テキストデータに対して予め設定された漢字の習熟度に応じた解析用辞書４ｃに基づいて、例えば小学生以下の児童向けの平仮名を多用したテキストデータに対しても解析誤りの少ない形態素解析を行なうことができるので、解析誤りの少ない形態素解析結果に基づいて、高品質の合成音声を生成することができる。

音響モデル格納部２３は、不揮発性のメモリであり、日本語の音素毎に各音素の特徴を表す音響パラメータを音響モデルとして格納している。なお、音響パラメータは、例えば、ＭＦＣＣ（Mel Frequency Cepstrum Coefficient：メル周波数ケプストラム係数）パラメータ等、音声認識の分野で通常用いられるパラメータを利用すればよい。

音声照合部（音響パラメータ抽出手段）２４は、ユーザインタフェース部２６が音声入力部７を介して取得した音声情報から特徴パラメータ（音響パラメータ）を抽出する。また、音声照合部（音響パラメータ生成手段）２４は、ユーザが朗読したテキストデータに対して形態素解析装置１０及び音素列生成部２１が所定の処理を行なうことによって得られた音素列情報と、音響モデル格納部２３に格納されている音響モデルとに基づいて、正解となる音響パラメータを生成する。そして、音声照合部（照合手段）２４は、生成した音響パラメータと、取得した音声情報から抽出した音響パラメータとを照合（比較）し、相違点を検出する。

指摘事項作成部２５は、予め各種のメッセージが格納されたメモリ（図示せず）を備えており、音声照合部２４の照合結果に応じて適切なメッセージをメモリから選択し、選択したメッセージに基づいてユーザに指摘すべきメッセージを作成する。例えば音声照合部２４の照合結果、ユーザが「くまさんは」の「は」を「ｗａ」ではなく「ｈａ」と発声したと判断された場合、「これは『わ』と読みます。」というメッセージを作成する。また、音声照合部２４の照合結果、ユーザが「いきました」の「いき」と「ました」の間に少しポーズ（間）を空けて発声したと判断された場合、「ここで切ってはいけません。」というメッセージを作成する。

また、音声照合部２４の照合結果、ユーザが正しく発声したと判断された場合、「正しく読めました。」というメッセージを作成する。なお、指摘事項作成部２５が作成したメッセージは、ユーザインタフェース部２６を介して表示部６に表示され、又はユーザインタフェース部２６を介して音声出力部８から音声出力されるので、照合結果をユーザに通知することができる。

上述した構成により、本実施形態３の音読練習支援装置１００は、形態素解析装置１０、音素列生成部２１及び音声合成部２２によって、テキストデータから合成音声を生成し、生成した合成音声を音声出力部８から出力することができる。また、本実施形態３の音読練習支援装置１００は、テキストデータに基づいて生成された正解となる音響パラメータに基づいて、ユーザがテキストデータを朗読した音声が正しいか否かを判断することができ、また、その判定結果をユーザに通知することができる。

以下に、上述した構成の音読練習支援装置１００による音読練習支援処理について説明する。まず、本実施形態３の音読練習支援装置１００において、ユーザが音読の練習を行なう場合、制御部１（主制御部２０）は、図１２に示すような初期画面（問題選択画面）を表示部６に表示させる。

図１２は問題選択画面の構成例を示す模式図である。図１２に示すように、問題選択画面には、漢字の習熟度（レベル）別にテキストデータ（問題）が表示されており、ユーザが各テキストデータを操作部５を介して選択することにより、音読練習支援装置１００は、選択されたテキストデータに基づく音読練習支援処理を開始する。また、問題選択画面には、この問題選択画面において次のページへ進むための「つぎへ」ボタンと、１つ前のページへ戻るための「まえへ」ボタンとが表示されている。なお、次のページがない場合又は１つ前のページがない場合、問題選択画面における「つぎへ」ボタン又は「まえへ」ボタンは選択できないように表示される。

ユーザが操作部５を介して問題選択画面中の「つぎへ」ボタン又は「まえへ」ボタンを操作した場合、主制御部２０は、ＨＤＤ４に予め格納されている各種の情報に基づいて、次のページ又は１つ前のページを表示部６に表示させる。また、ユーザが操作部５を介して問題選択画面中のテキストデータを選択した場合、主制御部２０は、図１３（ａ）に示すような問題表示画面を表示部６に表示させると共に、選択されたテキストデータと、このテキストデータに割り当てられた漢字の習熟度とを形態素解析装置１０へ入力する。

図１３は問題表示画面の構成例を示す模式図である。図１３（ａ）に示す問題表示画面には、問題選択画面を介して選択されたテキストデータと、このテキストデータに対してお手本となる音声を出力するための「せんせいのよみかたをきく」ボタンと、このテキストデータをユーザが朗読し、正しく読めているか否かを判定するための「じぶんでよんでみる」ボタンと、図１２に示した問題選択画面への表示に戻すための「もんだいをえらぶ」ボタンとが表示されている。

一方、形態素解析装置１０は、上述したように問題選択画面を介して選択されたテキストデータ及びこのテキストデータに割り当てられた漢字の習熟度が入力された場合、実施形態１で説明した形態素解析処理を実行する。また、主制御部２０は、形態素解析装置１０によって形態素解析が実行された場合、形態素解析装置１０による形態素解析結果を音素列生成部２１へ入力し、形態素解析結果に基づく音素列情報を生成させる。主制御部２０は、音素列生成部２１によって生成された音素列情報をＲＡＭ３に記憶させておく。

図１３（ａ）に示す問題表示画面において、ユーザが操作部５を介して「せんせいのよみかたをきく」ボタンを操作した場合、主制御部２０は、音素列生成部２１によって生成されてＲＡＭ３に記憶してある音素列情報を音声合成部２２へ入力し、音素列情報に基づく合成音声を生成させる。そして、主制御部２０は、生成された合成音声を音声出力部８から出力することにより、このテキストデータに対してお手本となる音声を出力させることができる。

また、図１３（ａ）に示す問題表示画面において、ユーザが操作部５を介して「じぶんでよんでみる」ボタンを操作した場合、主制御部２０は、音声入力部７を介してユーザが発した音声に基づく音声情報を取得し、取得した音声情報を音声照合部２４へ入力すると共に、音素列生成部２１によって生成されてＲＡＭ３に記憶してある音素列情報を音声照合部２４に入力する。音声照合部２４は、入力された音声情報から音響パラメータを抽出すると共に、入力された音素列情報と音響モデル格納部２３に格納してある音響モデルとに基づいて、お手本となる音響パラメータを生成する。

そして、音声照合部２４は、生成した音響パラメータと、取得した音声情報から抽出した音響パラメータとを照合する。主制御部２０は、音声照合部２４による照合結果を指摘事項作成部２５に入力し、照合結果に応じたメッセージを作成させる。主制御部２０は、指摘事項作成部２５が作成したメッセージを、図１３（ａ）に示した問題表示画面上に重ねて表示させ、図１３（ｂ）に示すような問題表示画面を表示させる。図１３（ｂ）に示す問題表示画面においては、ユーザが「くまさんは」の「は」を「ｗａ」ではなく「ｈａ」と発声したので、「これは『わ』とよみます。」というメッセージが表示され、ユーザが「いきました」の「いき」と「ました」の間に少しポーズを空けて発声したので、「ここできってはいけません。」というメッセージが表示されている。

なお、照合結果に基づくメッセージは、図１３（ｂ）に示すように表示部６に表示された問題表示画面上への表示だけでなく、例えば音声出力によってユーザに通知するようにしてもよい。これにより、ユーザは、図１３に示した問題表示画面中の「せんせいのよみかたをきく」ボタンを操作することにより、お手本の読み方を聞くことができ、「じぶんでよんでみる」ボタンを操作することにより、自身の朗読が正しいか否かを知ることができる。

以下に、本実施形態３の音読練習支援装置１００による音読練習支援処理についてフローチャートに基づいて詳述する。図１４乃至図１６は音読練習支援処理の手順を示すフローチャートである。なお、以下の処理は、音読練習支援装置１００のＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムに従って制御部１によって実行される。

音読練習支援装置１００の制御部１は、ユーザが音読の練習を開始する場合、図１２に示すような問題選択画面を表示部６に表示させる（Ｓ４１）。制御部１は、問題選択画面を介して任意の問題（テキストデータ）が選択されたか否かを判断しており（Ｓ４２）、選択されていないと判断した場合（Ｓ４２：ＮＯ）、問題選択画面において「まえへ」ボタンが操作されたか否かを判断する（Ｓ４３）。「まえへ」ボタンが操作されたと判断した場合（Ｓ４３：ＹＥＳ）、制御部１は、問題選択画面における１つ前の画面を表示部６に表示させ（Ｓ４４）、ステップＳ４２へ処理を戻す。

「まえへ」ボタンが操作されていないと判断した場合（Ｓ４３：ＮＯ）、制御部１は、問題選択画面において「つぎへ」ボタンが操作されたか否かを判断し（Ｓ４５）、「つぎへ」ボタンが操作されたと判断した場合（Ｓ４５：ＹＥＳ）、問題選択画面における次の画面を表示部６に表示させ（Ｓ４６）、ステップＳ４２へ処理を戻す。なお、「つぎへ」ボタンが操作されていないと判断した場合（Ｓ４５：ＮＯ）、制御部１は、ステップＳ４６の処理をスキップしてステップＳ４２へ処理を戻す。

問題が選択されたと判断した場合（Ｓ４２：ＹＥＳ）、制御部１は、選択されたテキストデータ（問題）に割り当てられた漢字の習熟度を取得し（Ｓ４７）、取得した習熟度に基づいて、基本単語辞書４ａから解析用辞書４ｃを生成する辞書変換処理を実行する（Ｓ４８）。なお、本実施形態３の辞書変換処理は、実施形態１において図７に基づいて説明した処理と同様である。

制御部１は、問題選択画面を介して選択されたテキストデータをＨＤＤ４から読み出してＲＡＭ３に読み込み（Ｓ４９）、このテキストデータに対して、ステップＳ４８で実行した辞書変換処理によって生成された解析用辞書４ｃの登録内容に基づく形態素解析を実行する（Ｓ５０）。制御部１は、形態素解析によって、テキストデータを解析用辞書４ｃに登録された各単語に分解すると共に、分解した各単語の読みアクセント情報を解析用辞書４ｃから読み出し、読み出した各単語の読みアクセント情報を形態素解析結果としてＲＡＭ３に記憶させる（Ｓ５１）。

制御部１は、音素列生成ルール４ｄに基づいて、形態素解析結果に対応する音素列情報を生成してＲＡＭ３に記憶させておき（Ｓ５２）、図１３（ａ）に示すような、問題選択画面を介して選択されたテキストデータを表示する問題表示画面を表示部６に表示させる（Ｓ５３）。

制御部１は、問題表示画面において「せんせいのよみかたをきく」ボタンが操作されたか否かを判断しており（Ｓ５４）、操作されたと判断した場合（Ｓ５４：ＹＥＳ）、テキストデータに基づいて生成されてＲＡＭ３に記憶してある音素列情報に基づく合成音声を生成し、音声出力部８から出力させ（Ｓ５５）、ステップＳ５４へ処理を戻す。問題表示画面において「せんせいのよみかたをきく」ボタンが操作されていないと判断した場合（Ｓ５４：ＮＯ）、制御部１は、問題表示画面において「じぶんでよんでみる」ボタンが操作されたか否かを判断する（Ｓ５６）。

「じぶんでよんでみる」ボタンが操作されたと判断した場合（Ｓ５６：ＹＥＳ）、制御部１は、ユーザが発した音声に基づく音声情報を音声入力部７を介して取得し（Ｓ５７）、取得した音声情報から音響パラメータを抽出する（Ｓ５８）。また、制御部１は、テキストデータに基づいて生成されてＲＡＭ３に記憶してある音素列情報と、音響モデル格納部２３に格納してある音響モデルとに基づいて、お手本の音響パラメータを生成し（Ｓ５９）、生成した音響パラメータと、ステップＳ５８で抽出した音響パラメータとを照合する（Ｓ６０）。制御部１は、照合した結果に応じたメッセージを作成し、作成したメッセージを、図１３（ａ）に示した問題表示画面上に重ねて表示させ（Ｓ６１）、上述したステップＳ５４へ処理を戻す。

問題表示画面において「じぶんでよんでみる」ボタンが操作されていないと判断した場合（Ｓ５６：ＮＯ）、制御部１は、問題表示画面において「もんだいをえらぶ」ボタンが操作されたか否かを判断する（Ｓ６２）。「もんだいをえらぶ」ボタンが操作されていないと判断した場合（Ｓ６２：ＮＯ）、制御部１は、ステップＳ５４へ処理を戻し、問題表示画面において「せんせいのよみかたをきく」ボタンが操作されたか否かを判断し（Ｓ５４）、上述したステップＳ５４〜Ｓ６２の処理を繰り返す。

問題表示画面において「もんだいをえらぶ」ボタンが操作されたと判断した場合（Ｓ６２：ＹＥＳ）、制御部１は、ステップＳ４１へ処理を戻し、図１２に示すような問題選択画面を表示部６に表示させ（Ｓ４１）、問題選択画面を介して新たに選択された問題（テキストデータ）に対して、上述したステップＳ４７〜Ｓ６２の処理を繰り返す。なお、本実施形態３の音読練習支援装置１００は、例えば電源ボタン（図示せず）がオフされた場合、上述した音読練習支援処理を終了する。

上述した構成の音読練習支援装置１００を用いて、ユーザが、図１３（ｂ）に示した問題表示画面上に表示されたメッセージによる指摘事項がなくなるまで音読を繰り返すことにより、効率よく音読の練習を行なうことができる。また、上述した実施形態３の音読練習支援装置１００では、図１２に示した問題選択画面において１つの問題を選択する都度、音読の練習を行なうことができる。しかし、例えば、問題選択画面において習熟度のみを選択し、選択した習熟度の漢字を用いて記述された複数のテキストデータを順次問題として図１３（ａ）に示す問題表示画面に表示するようにしてもよい。この場合、問題表示画面中に「次の問題へ」ボタンを表示させておき、この「次の問題へ」ボタンが操作された場合に次の問題（テキストデータ）を問題表示画面に表示させるようにすればよく、問題選択画面から任意の問題を選択するユーザの手間を省略することができる。

上述した実施形態３の音読練習支援装置１００では、図１２に示したように、各テキストデータには予め漢字の習熟度が割り当てられており、問題選択画面を介して任意の問題（テキストデータ）が選択された場合、選択されたテキストデータと、このテキストデータに割り当ててある漢字の習熟度とを形態素解析装置１０に入力し、入力された習熟度に応じた解析用辞書４ｃに基づく形態素解析を形態素解析装置１０が行なう構成であった。しかし、例えば、問題選択画面にはテキストデータのみを表示しておき、ユーザが、問題選択画面を介してテキストデータを選択すると共に、操作部５を介して漢字の習熟度を入力する構成とすることもできる。

また、上述した実施形態３では、本発明の音声合成装置及び音声照合装置を、上述した実施形態１の形態素解析装置１０を備えた音読練習支援装置１００に適用した構成を例に説明したが、本発明の音声合成装置及び音声照合装置は、上述した実施形態２の形態素解析装置１０を備えた音読練習支援装置１００にも適用することができる。この場合、例えば、問題選択画面にはテキストデータのみを表示しておき、ユーザが、問題選択画面を介してテキストデータを選択した場合、音読練習支援装置１００が、テキストデータに含まれる各漢字の習熟度に基づいて、このテキストデータに対応する習熟度を特定し、特定した習熟度に応じた解析用辞書４ｃに基づく形態素解析を行なうことができる。

上述した実施形態３では、図１３に示したように、問題表示画面中の「せんせいのよみかたをきく」ボタン、「じぶんでよんでみる」ボタン、「もんだいをえらぶ」ボタンのそれぞれが平仮名で表示されていた。しかし、例えば、図１２に示した問題選択画面において選択されたテキストデータに対応する漢字の習熟度に応じて、各ボタンの表示を漢字及び仮名を混ぜた表示とすることもできる。具体的には、例えば各習熟度に応じた各ボタンの表示を予め用意しておき、問題選択画面を介してテキストデータが選択された場合に、選択されたテキストデータに対応する習熟度での表示を用いて各ボタンを表示させればよい。また、任意の習熟度に応じたボタンの表示を予め用意しておき、問題選択画面を介してテキストデータが選択された場合に、選択されたテキストデータに対応する習熟度での表記に変換し、得られた表記で各ボタンを表示させればよい。

（付記１）
テキストデータに形態素解析を行なう形態素解析装置において、
漢字の習熟度を受け付ける習熟度受付手段と、
習熟度毎に複数の漢字を記憶してある漢字記憶手段と、
複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段と、
前記漢字記憶手段の記憶内容に基づいて、前記単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断する判断手段と、
該判断手段によって前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換手段と、
該変換手段が変換した各単語を記憶する解析用辞書記憶手段と、
該解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なう手段と
を備えることを特徴とする形態素解析装置。

（付記２）
前記テキストデータに含まれる漢字を抽出する手段と、
抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出する手段と、
検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定する手段とを備え、
前記習熟度受付手段は、特定された習熟度を受け付けるように構成されていることを特徴とする付記１に記載の形態素解析装置。

（付記３）
前記単語辞書記憶手段は、各単語に対応付けて、各単語に含まれる漢字の仮名への変換を許可又は禁止する情報を記憶する構成としてあり、
前記単語辞書記憶手段の記憶内容に基づいて、前記判断手段によって前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を含む単語が、仮名への変換が許可された単語であるか否かを判断する手段を備え、
前記変換手段は、仮名への変換が許可された単語であると判断された場合、前記漢字を前記単語辞書記憶手段に記憶してある仮名に変換するように構成してあることを特徴とする付記１又は２に記載の形態素解析装置。

（付記４）
テキストデータに形態素解析を行なう形態素解析方法において、
漢字の習熟度を受け付ける習熟度受付ステップと、
習熟度毎に複数の漢字を記憶してある漢字記憶手段の記憶内容に基づいて、複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断するステップと、
前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換ステップと、
該変換ステップで変換した各単語を解析用辞書記憶手段に記憶させるステップと、
前記解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なうステップと
を含むことを特徴とする形態素解析方法。

（付記５）
前記テキストデータに含まれる漢字を抽出するステップと、
抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出するステップと、
検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定するステップとを含み、
前記習熟度受付ステップは、特定された習熟度を受け付けることを特徴とする付記４に記載の形態素解析方法。

（付記６）
前記単語辞書記憶手段には、各単語に対応付けて、各単語に含まれる漢字の仮名への変換を許可又は禁止する情報が記憶してあり、
前記単語辞書記憶手段の記憶内容に基づいて、前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を含む単語が、仮名への変換が許可された単語であるか否かを判断するステップを含み、
前記変換ステップは、仮名への変換が許可された単語であると判断された場合、前記漢字を前記単語辞書記憶手段に記憶してある仮名に変換することを特徴とする付記４又は５に記載の形態素解析方法。

（付記７）
コンピュータに、テキストデータに形態素解析を行なわせるためのコンピュータプログラムにおいて、
習熟度毎に複数の漢字を記憶してある漢字記憶手段と、複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段とを備えるコンピュータに、
前記漢字記憶手段の記憶内容に基づいて、前記単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、予め取得しておいた習熟度よりも高い習熟度の漢字であるか否かを判断するステップと、
予め取得しておいた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換ステップと、
該変換ステップで変換した各単語を解析用辞書記憶手段に記憶させるステップと、
前記解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なうステップと
を実行させるためのコンピュータプログラム。

（付記８）
前記コンピュータに、
前記テキストデータに含まれる漢字を抽出するステップと、
抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出するステップと、
検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定するステップと、
特定した習熟度を取得するステップと
を実行させるための付記７に記載のコンピュータプログラム。

（付記９）
前記コンピュータに、取得しておいた習熟度よりも高い習熟度の漢字であると判断された漢字を含む単語が、該単語に含まれる漢字の仮名への変換が許可された単語であるか否かを判断するステップを実行させ、
前記変換ステップは、仮名への変換が許可された単語であると判断された場合、前記漢字を前記単語辞書記憶手段に記憶してある仮名に変換することを特徴とする付記７又は８に記載のコンピュータプログラム。

（付記１０）
テキストデータから合成音声を生成する音声合成装置において、
付記１乃至３のいずれかひとつに記載の形態素解析装置と、
該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成する音素列生成手段と、
該音素列生成手段が生成した音素列情報に基づいて合成音声を生成する合成音声生成手段と
を備えることを特徴とする音声合成装置。

（付記１１）
予め用意された音声情報と照合対象の音声情報とを照合する音声照合装置において、
付記１乃至３のいずれかひとつに記載の形態素解析装置と、
該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成する音素列生成手段と、
該音素列生成手段が生成した音素列情報における音響パラメータを生成する音響パラメータ生成手段と、
外部から音声情報を取得する音声情報取得手段と、
該音声情報取得手段が取得した音声情報から音響パラメータを抽出する音響パラメータ抽出手段と、
前記音響パラメータ生成手段が生成した音響パラメータ及び前記音響パラメータ抽出手段が抽出した音響パラメータを照合する照合手段と
を備えることを特徴とする音声照合装置。

（付記１２）
前記照合手段による照合結果を出力する手段を備えることを特徴とする付記１１に記載の音声照合装置。

本発明に係る形態素解析装置の構成例を示すブロック図である。基本単語辞書の登録内容を示す模式図である。習熟度別漢字リストの登録内容を示す模式図である。実施形態１の形態素解析装置の機能構成例を示す機能ブロック図である。解析用辞書の登録内容を示す模式図である。形態素解析処理の手順を示すフローチャートである。辞書変換処理の手順を示すフローチャートである。実施形態２の形態素解析装置の機能構成例を示す機能ブロック図である。形態素解析処理の手順を示すフローチャートである。実施形態３に係る音読練習支援装置の構成例を示すブロック図である。実施形態３の音読練習支援装置の機能構成例を示す機能ブロック図である。問題選択画面の構成例を示す模式図である。問題表示画面の構成例を示す模式図である。音読練習支援処理の手順を示すフローチャートである。音読練習支援処理の手順を示すフローチャートである。音読練習支援処理の手順を示すフローチャートである。

符号の説明

１０形態素解析装置
１制御部
１１漢字習熟度受付部（習熟度受付手段）
１２辞書変換部（判断手段、変換手段）
４ＨＤＤ（単語辞書記憶手段、漢字記憶手段、解析用辞書記憶手段）
４ａ基本単語辞書
４ｂ習熟度別漢字リスト
４ｃ解析用辞書
２１音素列生成部（音素列生成手段）
２２音声合成部（合成音声生成手段）
２４音声照合部（音響パラメータ抽出手段、音響パラメータ生成手段、照合手段）
２６ユーザインタフェース部（音声情報取得手段）

Claims

テキストデータに形態素解析を行なう形態素解析装置において、
漢字の習熟度を受け付ける習熟度受付手段と、
習熟度毎に複数の漢字を記憶してある漢字記憶手段と、
複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段と、
前記漢字記憶手段の記憶内容に基づいて、前記単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断する判断手段と、
該判断手段によって前記習熟度受付手段が受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換手段と、
該変換手段が変換した各単語を記憶する解析用辞書記憶手段と、
該解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なう手段と
を備えることを特徴とする形態素解析装置。
前記テキストデータに含まれる漢字を抽出する手段と、
抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出する手段と、
検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定する手段とを備え、
前記習熟度受付手段は、特定された習熟度を受け付けるように構成されていることを特徴とする請求項１に記載の形態素解析装置。
テキストデータに形態素解析を行なう形態素解析装置による形態素解析方法において、
前記形態素解析装置が、漢字の習熟度を受け付ける習熟度受付ステップと、
前記形態素解析装置が、習熟度毎に複数の漢字を記憶してある漢字記憶手段の記憶内容に基づいて、複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であるか否かを判断するステップと、
前記形態素解析装置が、前記習熟度受付ステップで受け付けた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換ステップと、
前記形態素解析装置が、該変換ステップで変換した各単語を解析用辞書記憶手段に記憶させるステップと、
前記形態素解析装置が、前記解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なうステップと
を含むことを特徴とする形態素解析方法。
コンピュータに、テキストデータに形態素解析を行なわせるためのコンピュータプログラムにおいて、
習熟度毎に複数の漢字を記憶してある漢字記憶手段と、複数の単語の表記及び各表記に含まれる漢字の仮名を対応付けて記憶してある単語辞書記憶手段とを備えるコンピュータに、
前記漢字記憶手段の記憶内容に基づいて、前記単語辞書記憶手段に記憶してある単語に含まれる漢字のそれぞれが、予め取得しておいた習熟度よりも高い習熟度の漢字であるか否かを判断するステップと、
予め取得しておいた習熟度よりも高い習熟度の漢字であると判断された漢字を、前記単語辞書記憶手段に記憶してある仮名に変換する変換ステップと、
該変換ステップで変換した各単語を解析用辞書記憶手段に記憶させるステップと、
前記解析用辞書記憶手段の記憶内容に基づいてテキストデータに形態素解析を行なうステップと
を実行させるためのコンピュータプログラム。
前記コンピュータに、
前記テキストデータに含まれる漢字を抽出するステップと、
抽出した漢字に対する習熟度を前記漢字記憶手段の記憶内容に基づいて検出するステップと、
検出した各漢字の習熟度に基づいて、前記テキストデータに対応する習熟度を特定するステップと、
特定した習熟度を取得するステップと
を実行させるための請求項４に記載のコンピュータプログラム。
テキストデータから合成音声を生成する音声合成装置において、
請求項１又は２に記載の形態素解析装置と、
該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成する音素列生成手段と、
該音素列生成手段が生成した音素列情報に基づいて合成音声を生成する合成音声生成手段と
を備えることを特徴とする音声合成装置。
予め用意された音声情報と照合対象の音声情報とを照合する音声照合装置において、
請求項１又は２に記載の形態素解析装置と、
該形態素解析装置が形態素解析を行なって得られた情報に基づいて音素列情報を生成する音素列生成手段と、
該音素列生成手段が生成した音素列情報における音響パラメータを生成する音響パラメータ生成手段と、
外部から音声情報を取得する音声情報取得手段と、
該音声情報取得手段が取得した音声情報から音響パラメータを抽出する音響パラメータ抽出手段と、
前記音響パラメータ生成手段が生成した音響パラメータ及び前記音響パラメータ抽出手段が抽出した音響パラメータを照合する照合手段と
を備えることを特徴とする音声照合装置。