JP5125404B2 - 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置 - Google Patents
省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置 Download PDFInfo
- Publication number
- JP5125404B2 JP5125404B2 JP2007275651A JP2007275651A JP5125404B2 JP 5125404 B2 JP5125404 B2 JP 5125404B2 JP 2007275651 A JP2007275651 A JP 2007275651A JP 2007275651 A JP2007275651 A JP 2007275651A JP 5125404 B2 JP5125404 B2 JP 5125404B2
- Authority
- JP
- Japan
- Prior art keywords
- abbreviation
- text data
- data
- text
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Description
以下に、本発明に係る省略語判定装置を備えた本発明に係るテキスト解析装置を、実施形態1を示す図面に基づいて詳述する。図1は実施形態1に係るテキスト解析装置の構成例を示すブロック図である。本実施形態1に係るテキスト解析装置10は、制御部1、ROM2、RAM3、HDD4、操作部5、表示部6等を備え、これらのハードウェア各部はそれぞれバス1aを介して相互に接続されている。
表示部6は、液晶ディスプレイ又はCRTディスプレイ等であり、制御部1からの指示に従って、テキスト解析装置10の動作状態、操作部5を介して入力された情報、ユーザに対して通知すべき情報等を表示する。
以下に、本発明に係る省略語判定装置を備えた本発明に係るテキスト解析装置を、実施形態2を示す図面に基づいて詳述する。なお、本実施形態2のテキスト解析装置は、上述した実施形態1のテキスト解析装置10と同様の構成によって実現することができるので、同様の構成については同一の符号を付して説明を省略する。
本実施形態2の形態素解析部11は、上述した実施形態1の形態素解析部11と同様に、HDD4に記憶してあるテキストデータ(文書データ)をHDD4からRAM3に読み出し、言語辞書(テキスト記憶手段)4aの登録内容に基づいて、RAM3に読み出したテキストデータ(文書データ)を形態素(テキストデータ)に分割すると共に、分割した形態素のそれぞれにアクセント型を付与する。具体的には、形態素解析部11は、実施形態1で説明したように、「マツケン(未知語)・ガ(1モーラ0型)・サンバ(3モーラ1型)・オ(1モーラ0型)・オドッタ(4モーラ0型)」の表音文字列を生成して省略語判定部12へ送出する。
以下に、本発明に係る省略語判定装置を備えた本発明に係るテキスト解析装置を、実施形態3を示す図面に基づいて詳述する。なお、本実施形態3のテキスト解析装置は、上述した実施形態1のテキスト解析装置10と同様の構成によって実現することができるので、同様の構成については同一の符号を付して説明を省略する。
本実施形態3の形態素解析部11は、上述した実施形態1の形態素解析部11と同様に、HDD4に記憶してあるテキストデータをHDD4からRAM3に読み出し、言語辞書4aの登録内容に基づいて、RAM3に読み出したテキストデータを形態素に分割すると共に、分割した形態素のそれぞれにアクセント型を付与する。ここでは、形態素解析部11は、「ナカショー(未知語)・ガ(1モーラ0型)・コスプレ(未知語)・オ(1モーラ0型)・シタ(2モーラ0型)」の表音文字列を生成する。
以下に、本発明に係る音声合成装置を、実施形態4を示す図面に基づいて詳述する。なお、本実施形態4の音声合成装置は、上述した実施形態1のテキスト解析装置10の構成を備えており、同様の構成については同一の符号を付して説明を省略する。図18は実施形態4に係る音声合成装置の構成例を示すブロック図である。本実施形態4に係る音声合成装置100は、図1に示した制御部1、ROM2、RAM3、HDD4、操作部5、表示部6のほかに、音声出力部7を備えており、これらのハードウェア各部はそれぞれバス1aを介して相互に接続されている。
HDD4には、テキストデータ、図2に示すような言語辞書4a、図3に示すような人名辞書4b、図4に示すような複合語辞書4c、ユーザに対して各種の情報を通知するための画面情報のほかに、音声合成装置100を本発明の音声合成装置として動作させるために必要な種々の制御プログラム、韻律生成ルール辞書4f、波形辞書4g等が予め記憶されている。
テキストデータが省略語であるか否かを判定する省略語判定装置において、
人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段と、
前記テキストデータから先頭の所定数の文字データを抽出する第1抽出手段と、
該第1抽出手段が抽出した文字データを先頭に有する姓が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第1抽出手段が抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出する第2抽出手段と、
該第2抽出手段が抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定する判定手段と
を備えることを特徴とする省略語判定装置。
テキストデータが省略語であるか否かを判定する省略語判定装置において、
複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段と、
前記テキストデータから先頭の所定数の文字データを抽出する第1抽出手段と、
該第1抽出手段が抽出した文字データを先頭に有する構成語を含む複合語が前記複合語記憶手段に記憶してあるか否かを判断する判断手段と、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第1抽出手段が抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出する第2抽出手段と、
該第2抽出手段が抽出した文字データを先頭に有する構成語が、前記判断手段が前記複合語記憶手段に記憶してあると判断した複合語の構成語に含まれているか否かを判断する手段と、
前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定する判定手段と
を備えることを特徴とする省略語判定装置。
前記第1抽出手段は、前記テキストデータの先頭から、2音節に相当する数の文字データを抽出するように構成されており、
前記第2抽出手段は、前記第1抽出手段が抽出した文字データを除いた前記テキストデータの先頭から、2音節に相当する数の文字データを抽出するように構成されていることを特徴とする付記1又は2に記載の省略語判定装置。
前記第1抽出手段は、前記テキストデータの先頭から、1音節に相当する数の文字データを抽出するように構成されており、
前記第2抽出手段は、前記第1抽出手段が抽出した文字データを除いた前記テキストデータの先頭から、2音節に相当する数の文字データを抽出するように構成されていることを特徴とする付記1又は2に記載の省略語判定装置。
複数のテキストデータを含む文書データをテキストデータに分割する分割手段を備え、
前記第1抽出手段は、分割されたテキストデータのそれぞれから先頭の所定数の文字データを抽出するように構成されており、
前記第2抽出手段は、前記第1抽出手段が抽出した文字データを除いた前記分割されたテキストデータのそれぞれから、先頭の所定数の文字データを抽出するように構成されており、
前記判定手段は、前記分割されたテキストデータのそれぞれが省略語の候補であるか否かを判定するように構成されており、
複数のテキストデータ及び各テキストデータと共起される共起データを対応付けて記憶する共起データ記憶手段と、
前記判定手段が省略語の候補であると判定したテキストデータに対応する共起データを前記共起データ記憶手段から取得する手段と、
前記文書データ中のテキストデータに、前記共起データ記憶手段から取得された共起データが含まれているか否かを判断する手段と、
前記共起データが含まれていると判断した場合、前記判定手段が省略語の候補であると判定したテキストデータを省略語であると確定する手段と
を備えることを特徴とする付記1乃至4のいずれかひとつに記載の省略語判定装置。
テキストデータが省略語であるか否かを判定する省略語判定方法において、
前記テキストデータから先頭の所定数の文字データを抽出する第1抽出ステップと、
該第1抽出ステップで抽出した文字データを先頭に有する姓が、人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段に記憶してあるか否かを判断するステップと、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第1抽出ステップで抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出する第2抽出ステップと、
該第2抽出ステップで抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断するステップと、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定するステップと
を含むことを特徴とする省略語判定方法。
テキストデータが省略語であるか否かを判定する省略語判定方法において、
前記テキストデータから先頭の所定数の文字データを抽出する第1抽出ステップと、
該第1抽出ステップで抽出した文字データを先頭に有する構成語を含む複合語が、複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段に記憶してあるか否かを判断する判断ステップと、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第1抽出ステップで抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出する第2抽出ステップと、
該第2抽出ステップで抽出した文字データを先頭に有する構成語が、前記判断ステップで前記複合語記憶手段に記憶してあると判断された複合語の構成語に含まれているか否かを判断するステップと、
前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定するステップと
を含むことを特徴とする省略語判定方法。
コンピュータに、テキストデータが省略語であるか否かを判定させるためのコンピュータプログラムにおいて、
人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段を備えたコンピュータに、
前記テキストデータから先頭の所定数の文字データを抽出する第1抽出ステップと、
該第1抽出ステップで抽出した文字データを先頭に有する姓が前記人名記憶手段に記憶してあるか否かを判断するステップと、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第1抽出ステップで抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出する第2抽出ステップと、
該第2抽出ステップで抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断するステップと、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定するステップと
を実行させるためのコンピュータプログラム。
コンピュータに、テキストデータが省略語であるか否かを判定させるためのコンピュータプログラムにおいて、
複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段を備えたコンピュータに、
前記テキストデータから先頭の所定数の文字データを抽出する第1抽出ステップと、
該第1抽出ステップで抽出した文字データを先頭に有する構成語を含む複合語が前記複合語記憶手段に記憶してあるか否かを判断する判断ステップと、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第1抽出ステップで抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出する第2抽出ステップと、
該第2抽出ステップで抽出した文字データを先頭に有する構成語が、前記判断ステップで前記複合語記憶手段に記憶してあると判断された複合語の構成語に含まれているか否かを判断するステップと、
前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定するステップと
を実行させるためのコンピュータプログラム。
テキストデータを解析するテキスト解析装置において、
付記1乃至4のいずれかひとつに記載の省略語判定装置と、
形態素及びアクセント型を対応付けて記憶する形態素記憶手段と、
該形態素記憶手段の記憶内容に基づいて、テキストデータを形態素に分割する形態素分割手段と、
前記形態素記憶手段の記憶内容に基づいて、前記形態素分割手段が分割した形態素のそれぞれにアクセント型を付与する手段とを備え、
前記省略語判定装置は、前記形態素記憶手段に記憶されていない形態素が省略語であるか否かを判定するように構成されており、
前記省略語判定装置によって省略語であると判定された形態素に所定のアクセント型を付与するアクセント付与手段を備えることを特徴とするテキスト解析装置。
省略語及びアクセント型を対応付けて記憶する省略語記憶手段を備え、
前記アクセント付与手段は、
前記省略語記憶手段の記憶内容に基づいて、前記省略語判定装置によって省略語であると判定された形態素のそれぞれにアクセント型を付与する手段と、
前記省略語記憶手段に記憶されていない形態素に所定のアクセント型を付与する手段とを備えることを特徴とする付記10に記載のテキスト解析装置。
テキストデータを解析するテキスト解析装置において、
付記5に記載の省略語判定装置と、
テキストデータ及びアクセント型を対応付けて記憶するテキスト記憶手段とを備え、
前記省略語判定装置の分割手段は、前記テキスト記憶手段の記憶内容に基づいて、文書データをテキストデータに分割するように構成されており、
前記テキスト記憶手段の記憶内容に基づいて、前記分割手段が分割したテキストデータのそれぞれにアクセント型を付与する手段を備え、
前記省略語判定装置は、前記テキスト記憶手段に記憶されていないテキストデータが省略語であるか否かを判定するように構成されており、
前記省略語判定装置によって省略語であると判定されたテキストデータに所定のアクセント型を付与する手段を備えることを特徴とするテキスト解析装置。
省略語及びアクセント型を対応付けて記憶する省略語記憶手段を備え、
前記アクセント付与手段は、
前記省略語記憶手段の記憶内容に基づいて、前記省略語判定装置によって省略語であると判定されたテキストデータのそれぞれにアクセント型を付与する手段と、
前記省略語記憶手段に記憶されていないテキストデータに所定のアクセント型を付与する手段とを備えることを特徴とする付記12に記載のテキスト解析装置。
テキストデータから合成音声を生成する音声合成装置において、
付記10又は11に記載のテキスト解析装置と、
該テキスト解析装置の形態素分割手段が分割した形態素及び各形態素に付与されたアクセント型に基づいて、各形態素に対応する韻律を生成する韻律生成手段と、
該韻律生成手段が生成した韻律に基づいて合成音声を生成する波形生成手段と
を備えることを特徴とする音声合成装置。
テキストデータから合成音声を生成する音声合成装置において、
付記12又は13に記載のテキスト解析装置と、
前記省略語判定装置の分割手段が分割したテキストデータ及び前記テキスト解析装置が各テキストデータに付与したアクセント型に基づいて、各テキストデータに対応する韻律を生成する韻律生成手段と、
該韻律生成手段が生成した韻律に基づいて合成音声を生成する波形生成手段と
を備えることを特徴とする音声合成装置。
1 制御部
11 形態素解析部(形態素分割手段)
12 省略語判定部(第1抽出手段、第2抽出手段、判定手段、判断手段)
13 省略語アクセント付与部(アクセント付与手段)
4a 言語辞書(形態素記憶手段)
4b 人名辞書(人名記憶手段)
4c 複合語辞書(複合語記憶手段)
4d 共起辞書(共起データ記憶手段)
4e 例外省略語辞書(省略語記憶手段)
20 韻律生成部(韻律生成手段)
30 波形生成部(波形生成手段)
Claims (15)
- テキストデータを解析するテキスト解析装置において、
人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段と、
複数のテキストデータ及び各テキストデータと共起される共起データを対応付けて記憶する共起データ記憶手段と、
テキストデータ及びアクセント型を対応付けて記憶するテキスト記憶手段と、
該テキスト記憶手段の記憶内容に基づいて、複数のテキストデータを含む文書データをテキストデータに分割する分割手段と、
前記テキスト記憶手段の記憶内容に基づいて、前記分割手段が分割したテキストデータのそれぞれにアクセント型を付与する手段と、
前記分割手段にて分割されたテキストデータのうちで、前記テキスト記憶手段に記憶されていないテキストデータのそれぞれから先頭の所定数の文字データを抽出する第1抽出手段と、
該第1抽出手段が抽出した文字データを先頭に有する姓が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第1抽出手段が抽出した文字データを除いた前記テキストデータのそれぞれから、先頭の所定数の文字データを抽出する第2抽出手段と、
該第2抽出手段が抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータのそれぞれが省略語の候補であると判定する判定手段と、
該判定手段が省略語の候補であると判定したテキストデータに対応する共起データを前記共起データ記憶手段から取得する手段と、
前記文書データ中のテキストデータに、前記共起データ記憶手段から取得された共起データが含まれているか否かを判断する手段と、
前記共起データが含まれていると判断した場合、前記判定手段が省略語の候補であると判定したテキストデータを省略語であると確定する手段と、
省略語であると確定されたテキストデータに所定のアクセント型を付与する手段と
を備えることを特徴とするテキスト解析装置。 - テキストデータを解析するテキスト解析装置において、
複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段と、
複数のテキストデータ及び各テキストデータと共起される共起データを対応付けて記憶する共起データ記憶手段と、
テキストデータ及びアクセント型を対応付けて記憶するテキスト記憶手段と、
該テキスト記憶手段の記憶内容に基づいて、複数のテキストデータを含む文書データをテキストデータに分割する分割手段と、
前記テキスト記憶手段の記憶内容に基づいて、前記分割手段が分割したテキストデータのそれぞれにアクセント型を付与する手段と、
前記分割手段にて分割されたテキストデータのうちで、前記テキスト記憶手段に記憶されていないテキストデータのそれぞれから先頭の所定数の文字データを抽出する第1抽出手段と、
該第1抽出手段が抽出した文字データを先頭に有する構成語を含む複合語が前記複合語記憶手段に記憶してあるか否かを判断する判断手段と、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第1抽出手段が抽出した文字データを除いた前記テキストデータのそれぞれから、先頭の所定数の文字データを抽出する第2抽出手段と、
該第2抽出手段が抽出した文字データを先頭に有する構成語が、前記判断手段が前記複合語記憶手段に記憶してあると判断した複合語の構成語に含まれているか否かを判断する手段と、
前記構成語が含まれていると判断した場合、前記テキストデータのそれぞれが省略語の候補であると判定する判定手段と、
該判定手段が省略語の候補であると判定したテキストデータに対応する共起データを前記共起データ記憶手段から取得する手段と、
前記文書データ中のテキストデータに、前記共起データ記憶手段から取得された共起データが含まれているか否かを判断する手段と、
前記共起データが含まれていると判断した場合、前記判定手段が省略語の候補であると判定したテキストデータを省略語であると確定する手段と、
省略語であると確定されたテキストデータに所定のアクセント型を付与する手段と
を備えることを特徴とするテキスト解析装置。 - テキストデータから合成音声を生成する音声合成装置において、
請求項1又は2に記載のテキスト解析装置と、
該テキスト解析装置の分割手段が分割したテキストデータ及び各テキストデータに付与されたアクセント型に基づいて、各テキストデータに対応する韻律を生成する韻律生成手段と、
該韻律生成手段が生成した韻律に基づいて合成音声を生成する波形生成手段と
を備えることを特徴とする音声合成装置。 - テキストデータが省略語であるか否かを判定する省略語判定装置において、
人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段と、
前記テキストデータの先頭から、2音節に相当する数の文字データを抽出する第1抽出手段と、
該第1抽出手段が抽出した文字データを先頭に有する姓が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第1抽出手段が抽出した文字データを除いた前記テキストデータの先頭から、2音節に相当する数の文字データを抽出する第2抽出手段と、
該第2抽出手段が抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定する判定手段と
を備えることを特徴とする省略語判定装置。 - テキストデータが省略語であるか否かを判定する省略語判定装置において、
人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段と、
前記テキストデータの先頭から、1音節に相当する数の文字データを抽出する第1抽出手段と、
該第1抽出手段が抽出した文字データを先頭に有する姓が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第1抽出手段が抽出した文字データを除いた前記テキストデータの先頭から、2音節に相当する数の文字データを抽出する第2抽出手段と、
該第2抽出手段が抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定する判定手段と
を備えることを特徴とする省略語判定装置。 - テキストデータが省略語であるか否かを判定する省略語判定装置において、
複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段と、
前記テキストデータの先頭から、2音節に相当する数の文字データを抽出する第1抽出手段と、
該第1抽出手段が抽出した文字データを先頭に有する構成語を含む複合語が前記複合語記憶手段に記憶してあるか否かを判断する判断手段と、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第1抽出手段が抽出した文字データを除いた前記テキストデータの先頭から、2音節に相当する数の文字データを抽出する第2抽出手段と、
該第2抽出手段が抽出した文字データを先頭に有する構成語が、前記判断手段が前記複合語記憶手段に記憶してあると判断した複合語の構成語に含まれているか否かを判断する手段と、
前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定する判定手段と
を備えることを特徴とする省略語判定装置。 - テキストデータが省略語であるか否かを判定する省略語判定装置において、
複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段と、
前記テキストデータの先頭から、1音節に相当する数の文字データを抽出する第1抽出手段と、
該第1抽出手段が抽出した文字データを先頭に有する構成語を含む複合語が前記複合語記憶手段に記憶してあるか否かを判断する判断手段と、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第1抽出手段が抽出した文字データを除いた前記テキストデータの先頭から、2音節に相当する数の文字データを抽出する第2抽出手段と、
該第2抽出手段が抽出した文字データを先頭に有する構成語が、前記判断手段が前記複合語記憶手段に記憶してあると判断した複合語の構成語に含まれているか否かを判断する手段と、
前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定する判定手段と
を備えることを特徴とする省略語判定装置。 - 複数のテキストデータを含む文書データをテキストデータに分割する分割手段を備え、
前記第1抽出手段は、分割されたテキストデータのそれぞれから先頭の所定数の文字データを抽出するように構成されており、
前記第2抽出手段は、前記第1抽出手段が抽出した文字データを除いた前記分割されたテキストデータのそれぞれから、先頭の所定数の文字データを抽出するように構成されており、
前記判定手段は、前記分割されたテキストデータのそれぞれが省略語の候補であるか否かを判定するように構成されており、
複数のテキストデータ及び各テキストデータと共起される共起データを対応付けて記憶する共起データ記憶手段と、
前記判定手段が省略語の候補であると判定したテキストデータに対応する共起データを前記共起データ記憶手段から取得する手段と、
前記文書データ中のテキストデータに、前記共起データ記憶手段から取得された共起データが含まれているか否かを判断する手段と、
前記共起データが含まれていると判断した場合、前記判定手段が省略語の候補であると判定したテキストデータを省略語であると確定する手段と
を備えることを特徴とする請求項4から7までのいずれかひとつに記載の省略語判定装置。 - コンピュータに、テキストデータが省略語であるか否かを判定させるためのコンピュータプログラムにおいて、
人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段を備えたコンピュータに、
前記テキストデータの先頭から、2音節に相当する数の文字データを抽出する第1抽出ステップと、
該第1抽出ステップで抽出した文字データを先頭に有する姓が前記人名記憶手段に記憶してあるか否かを判断するステップと、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第1抽出ステップで抽出した文字データを除いた前記テキストデータの先頭から、2音節に相当する数の文字データを抽出する第2抽出ステップと、
該第2抽出ステップで抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断するステップと、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定するステップと
を実行させるためのコンピュータプログラム。 - コンピュータに、テキストデータが省略語であるか否かを判定させるためのコンピュータプログラムにおいて、
人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段を備えたコンピュータに、
前記テキストデータの先頭から、1音節に相当する数の文字データを抽出する第1抽出ステップと、
該第1抽出ステップで抽出した文字データを先頭に有する姓が前記人名記憶手段に記憶してあるか否かを判断するステップと、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第1抽出ステップで抽出した文字データを除いた前記テキストデータの先頭から、2音節に相当する数の文字データを抽出する第2抽出ステップと、
該第2抽出ステップで抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断するステップと、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定するステップと
を実行させるためのコンピュータプログラム。 - コンピュータに、テキストデータが省略語であるか否かを判定させるためのコンピュータプログラムにおいて、
複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段を備えたコンピュータに、
前記テキストデータの先頭から、2音節に相当する数の文字データを抽出する第1抽出ステップと、
該第1抽出ステップで抽出した文字データを先頭に有する構成語を含む複合語が前記複合語記憶手段に記憶してあるか否かを判断する判断ステップと、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第1抽出ステップで抽出した文字データを除いた前記テキストデータの先頭から、2音節に相当する数の文字データを抽出する第2抽出ステップと、
該第2抽出ステップで抽出した文字データを先頭に有する構成語が、前記判断ステップで前記複合語記憶手段に記憶してあると判断された複合語の構成語に含まれているか否かを判断するステップと、
前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定するステップと
を実行させるためのコンピュータプログラム。 - コンピュータに、テキストデータが省略語であるか否かを判定させるためのコンピュータプログラムにおいて、
複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段を備えたコンピュータに、
前記テキストデータの先頭から、1音節に相当する数の文字データを抽出する第1抽出ステップと、
該第1抽出ステップで抽出した文字データを先頭に有する構成語を含む複合語が前記複合語記憶手段に記憶してあるか否かを判断する判断ステップと、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第1抽出ステップで抽出した文字データを除いた前記テキストデータの先頭から、2音節に相当する数の文字データを抽出する第2抽出ステップと、
該第2抽出ステップで抽出した文字データを先頭に有する構成語が、前記判断ステップで前記複合語記憶手段に記憶してあると判断された複合語の構成語に含まれているか否かを判断するステップと、
前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定するステップと
を実行させるためのコンピュータプログラム。 - テキストデータを解析するテキスト解析装置において、
請求項4から7までのいずれかひとつに記載の省略語判定装置と、
形態素及びアクセント型を対応付けて記憶する形態素記憶手段と、
該形態素記憶手段の記憶内容に基づいて、テキストデータを形態素に分割する形態素分割手段と、
前記形態素記憶手段の記憶内容に基づいて、前記形態素分割手段が分割した形態素のそれぞれにアクセント型を付与する手段とを備え、
前記省略語判定装置は、前記形態素記憶手段に記憶されていない形態素が省略語であるか否かを判定するように構成されており、
前記省略語判定装置によって省略語であると判定された形態素に所定のアクセント型を付与するアクセント付与手段を備えることを特徴とするテキスト解析装置。 - テキストデータを解析するテキスト解析装置において、
請求項8に記載の省略語判定装置と、
テキストデータ及びアクセント型を対応付けて記憶するテキスト記憶手段とを備え、
前記省略語判定装置の分割手段は、前記テキスト記憶手段の記憶内容に基づいて、文書データをテキストデータに分割するように構成されており、
前記テキスト記憶手段の記憶内容に基づいて、前記分割手段が分割したテキストデータのそれぞれにアクセント型を付与する手段を備え、
前記省略語判定装置は、前記テキスト記憶手段に記憶されていないテキストデータが省略語であるか否かを判定するように構成されており、
前記省略語判定装置によって省略語であると判定されたテキストデータに所定のアクセント型を付与する手段を備えることを特徴とするテキスト解析装置。 - テキストデータから合成音声を生成する音声合成装置において、
請求項13に記載のテキスト解析装置と、
該テキスト解析装置の形態素分割手段が分割した形態素及び各形態素に付与されたアクセント型に基づいて、各形態素に対応する韻律を生成する韻律生成手段と、
該韻律生成手段が生成した韻律に基づいて合成音声を生成する波形生成手段と
を備えることを特徴とする音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007275651A JP5125404B2 (ja) | 2007-10-23 | 2007-10-23 | 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007275651A JP5125404B2 (ja) | 2007-10-23 | 2007-10-23 | 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009103921A JP2009103921A (ja) | 2009-05-14 |
JP5125404B2 true JP5125404B2 (ja) | 2013-01-23 |
Family
ID=40705661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007275651A Expired - Fee Related JP5125404B2 (ja) | 2007-10-23 | 2007-10-23 | 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5125404B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112012006308B4 (de) * | 2012-05-02 | 2016-02-04 | Mitsubishi Electric Corporation | Sprachsynthesevorrichtung |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2792147B2 (ja) * | 1989-10-18 | 1998-08-27 | 松下電器産業株式会社 | 文字処理方法およびその装置 |
JPH09237277A (ja) * | 1996-02-29 | 1997-09-09 | Hitachi Ltd | 複合名詞解析方法 |
JPH11109991A (ja) * | 1997-10-08 | 1999-04-23 | Mitsubishi Electric Corp | マンマシンインターフェースシステム |
JP3317904B2 (ja) * | 1998-09-02 | 2002-08-26 | 日本電気株式会社 | 省略名称抽出装置、方法および記録媒体 |
JP2000251017A (ja) * | 1999-02-25 | 2000-09-14 | Toshiba Corp | 単語辞書作成装置および単語認識装置 |
JP2003333161A (ja) * | 2002-05-09 | 2003-11-21 | Nec Corp | 通信端末およびメモリダイヤル検索方法 |
JP2004326367A (ja) * | 2003-04-23 | 2004-11-18 | Sharp Corp | テキスト解析装置及びテキスト解析方法、ならびにテキスト音声合成装置 |
JP3998668B2 (ja) * | 2004-07-14 | 2007-10-31 | 沖電気工業株式会社 | 形態素解析装置、方法及びプログラム |
-
2007
- 2007-10-23 JP JP2007275651A patent/JP5125404B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009103921A (ja) | 2009-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Schultz et al. | Multilingual speech processing | |
US6879957B1 (en) | Method for producing a speech rendition of text from diphone sounds | |
US20070255567A1 (en) | System and method for generating a pronunciation dictionary | |
JP5198046B2 (ja) | 音声処理装置及びそのプログラム | |
JP4811557B2 (ja) | 音声再生装置及び発話支援装置 | |
KR20170057623A (ko) | 언어장애인을 위한 다언어 어휘의 발음 합성 및 문자화 장치 | |
JP5088109B2 (ja) | 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置 | |
JP5125404B2 (ja) | 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置 | |
JPH06282290A (ja) | 自然言語処理装置およびその方法 | |
JP6998017B2 (ja) | 音声合成用データ生成装置、音声合成用データ生成方法及び音声合成システム | |
Nandutu et al. | Luganda text-to-speech machine | |
JP2007086404A (ja) | 音声合成装置 | |
JP6197523B2 (ja) | 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム | |
Ekpenyong et al. | Towards an unrestricted domain TTS system for African tone languages | |
JP2003202886A (ja) | テキスト入力処理装置及び方法並びにプログラム | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
JP2002123281A (ja) | 音声合成装置 | |
JPH09258763A (ja) | 音声合成装置 | |
JP4208819B2 (ja) | 音声合成辞書登録方法および装置 | |
JP2004258561A (ja) | 歌唱合成用データ入力プログラムおよび歌唱合成用データ入力装置 | |
JP2008250090A (ja) | 発音学習支援装置及び発音学習支援プログラム | |
JPH03245192A (ja) | 外国語単語の発音決定方法 | |
JP2023006055A (ja) | プログラム、情報処理装置、方法 | |
JP2006098552A (ja) | 音声情報生成装置、音声情報生成プログラム及び音声情報生成方法 | |
Das et al. | Twee: A Novel Text-To-Speech Engine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100616 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120706 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121002 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121015 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151109 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |