JP5125404B2

JP5125404B2 - 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置

Info

Publication number: JP5125404B2
Application number: JP2007275651A
Authority: JP
Inventors: 英樹小島
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2007-10-23
Filing date: 2007-10-23
Publication date: 2013-01-23
Anticipated expiration: 2027-10-23
Also published as: JP2009103921A

Description

本発明は、テキストデータが省略語であるか否かを判定する省略語判定装置、該省略語判定装置をコンピュータによって実現するためのコンピュータプログラム、前記省略語判定装置を備えたテキスト解析装置、及び該テキスト解析装置を備えた音声合成装置に関する。

テキストデータから音声を合成するテキスト音声合成技術は、例えば、ＩＶＲ（自動音声応答：Interactive Voice Response）システム、車載情報端末及び携帯電話等における操作方法の音声ガイダンス、電子メールの読み上げ、視覚障害者・発話障害者の支援システム等に適用されている。

従来のテキスト音声合成装置は、形態素及び各形態素のアクセント型を対応付けて記憶する言語辞書が予め用意されており、入力されたテキストデータを言語辞書の登録内容に基づいて形態素に分割し、分割したそれぞれの形態素に対してアクセント型を付与する。また、従来のテキスト音声合成装置は、分割した形態素及び各形態素に付与されたアクセント型に基づいて、各形態素に対応する韻律を所定の韻律生成ルールに従って生成し、生成した韻律を音声波形に変換して合成音声を取得する。

このような従来のテキスト音声合成装置において、言語辞書に登録されていない形態素がテキストデータに含まれる場合、形態素に分割する際に誤った位置で分割されてしまう虞があり、形態素にアクセント型を付与する際に誤ったアクセント型が付与されてしまう虞がある。このように、誤った位置で形態素に分割された場合、又は誤ったアクセント型が付与された場合、正しい合成音声を生成することが困難であった。

また、従来のテキスト音声合成装置では、テキストデータを形態素に分割する際に、言語辞書に登録されていない形態素を抽出した場合、この形態素を未知語として分割し、各形態素（未知語）に、例えば後ろから３モーラ目にアクセント核を有するアクセント型を付与するように構成されている場合が多い。これは、「オーストラリア」、「チェルノブイリ」のような外来語は、後ろから３モーラ目にアクセント核を有するものが多いからである。

従来より、マツケン（登録商標）（松平健）、キムタク（木村拓也）、コスプレ（コスチュームプレイ）、地デジ（地上デジタル放送）、連ドラ（連続ドラマ）等の省略語が多用されている。このような省略語は言語辞書に登録されていないため、従来のテキスト音声合成装置では、未知語として扱う場合が多く、上述したように例えば後ろから３モーラ目にアクセント核を有するアクセント型を付与していた。しかし、このような省略語は、平板型（ゼロ型）のアクセント型である場合が多く、後ろから３モーラ目にアクセント核を有するアクセント型を付与した場合、正しい合成音声を生成することはできず、訛ったような読み方の合成音声を生成する可能性があった。

特許文献１には、省略語に対する正式名称を登録した正式名称辞書と、正式名称から予測される省略語を登録した省略語辞書とを予め用意しておき、テキスト文書中に省略語辞書に登録された省略語を検出した場合に、この省略語を、対応する正式名称に変換する装置が開示されている。このような装置を用いた場合、正式名称辞書に登録されていない省略語がテキスト文書中に含まれる場合であっても、未知語として扱わずに、省略語として適切に扱うことができる。
特開２００４−３２６３６７号公報

上述した特許文献１のように省略語辞書を用いることにより、省略語辞書に登録されている省略語については、テキスト文書を形態素に分割する際に正しい形態素に分割することができると共に、正しいアクセント型を付与することができるので、正しい合成音声を生成することができる。しかし、省略語は日々新しい言葉が出てくるので、新しい省略語を省略語辞書に逐次登録することは不可能である。よって、省略語辞書を用いて省略語の判定を行う構成では、省略語辞書を逐次更新する必要があり、新しい省略語が登録されていない古い省略語辞書を用いた場合には適切に省略語を判定できないという問題を有する。

本発明は斯かる事情に鑑みてなされたものであり、その目的とするところは、テキストデータが人名を省略して生成された省略語であるか否かを容易に判定することが可能な省略語判定装置、該省略語判定装置をコンピュータによって実現するためのコンピュータプログラム、前記省略語判定装置を備えたテキスト解析装置及び該テキスト解析装置を備えた音声合成装置を提供することにある。

本発明の他の目的は、テキストデータが複合語を省略して生成された省略語であるか否かを容易に判定することが可能な省略語判定装置、該省略語判定装置をコンピュータによって実現するためのコンピュータプログラム、前記省略語判定装置を備えたテキスト解析装置及び該テキスト解析装置を備えた音声合成装置を提供することにある。

本発明に係る省略語判定装置は、テキストデータが省略語であるか否かを判定する省略語判定装置において、人名に用いられる姓及び名をそれぞれ人名記憶手段に記憶しており、テキストデータから先頭の所定数の文字データを抽出し、抽出した文字データを先頭に有する姓が人名記憶手段に記憶してあるか否かを判断する。また、省略語判定装置は、前記姓が人名記憶手段に記憶してあると判断した場合、前記抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出し、抽出した文字データを先頭に有する名が人名記憶手段に記憶してあるか否かを判断する。前記名が人名記憶手段に記憶してあると判断した場合、省略語判定装置は、前記テキストデータが省略語であると判定する。よって、テキストデータが、人名の姓及び名のそれぞれの先頭から所定数の文字を抽出して生成された省略語であるか否かを容易に判定することが可能となる。

本発明に係る省略語判定装置は、テキストデータが省略語であるか否かを判定する省略語判定装置において、複数の複合語及び各複合語を構成する構成語を対応付けて複合語記憶手段に記憶しており、テキストデータから先頭の所定数の文字データを抽出し、抽出した文字データを先頭に有する構成語を含む複合語が複合語記憶手段に記憶してあるか否かを判断する。また、省略語判定装置は、前記複合語が複合語記憶手段に記憶してあると判断した場合、前記抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出し、抽出した文字データを先頭に有する構成語が、複合語記憶手段に記憶してあると判断した複合語の構成語に含まれているか否かを判断する。前記構成語が含まれていると判断した場合、省略語判定装置は、前記テキストデータが省略語であると判定する。よって、テキストデータが、複合語を構成する２つの構成語のそれぞれの先頭から所定数の文字を抽出して生成された省略語であるか否かを容易に判定することが可能となる。

本発明に係る省略語判定装置は、テキストデータの先頭から２音節に相当する数の文字データを抽出し、抽出した文字データを先頭に有する姓が人名記憶手段に記憶してあるか否か、又は抽出した文字データを先頭に有する構成語を含む複合語が複合語記憶手段に記憶してあるか否かを判断する。また、省略語判定装置は、前記抽出した文字データを除いた前記テキストデータの先頭から、２音節に相当する数の文字データを抽出し、抽出した文字データを先頭に有する名が人名記憶手段に記憶してあるか否か、又は抽出した文字データを先頭に有する構成語が、複合語記憶手段に記憶してあると判断した複合語の構成語に含まれているか否かを判断する。よって、テキストデータが、人名の姓及び名のそれぞれの先頭から２音節に相当する数の文字を抽出して生成された省略語であるか否か、又は複合語を構成する２つの構成語のそれぞれの先頭から２音節に相当する数の文字を抽出して生成された省略語であるか否かを容易に判定することが可能となる。

本発明に係る省略語判定装置は、テキストデータの先頭から１音節に相当する数の文字データを抽出し、抽出した文字データを先頭に有する姓が人名記憶手段に記憶してあるか否か、又は抽出した文字データを先頭に有する構成語を含む複合語が複合語記憶手段に記憶してあるか否かを判断する。また、省略語判定装置は、前記抽出した文字データを除いた前記テキストデータの先頭から、２音節に相当する数の文字データを抽出し、抽出した文字データを先頭に有する名が人名記憶手段に記憶してあるか否か、又は抽出した文字データを先頭に有する構成語が、複合語記憶手段に記憶してあると判断した複合語の構成語に含まれているか否かを判断する。よって、テキストデータが、人名の姓の先頭から１音節に相当する数の文字を抽出し、名の先頭から２音節に相当する数の文字を抽出して生成された省略語であるか否か、又は複合語を構成する構成語の先頭から１音節に相当する数の文字を抽出し、他の構成語の先頭から２音節に相当する数の文字を抽出して生成された省略語であるか否かを容易に判定することが可能となる。

本発明に係る省略語判定装置は、複数のテキストデータを含む文書データをテキストデータに分割し、分割されたテキストデータから先頭の所定数の文字データを抽出し、抽出した文字データを先頭に有する姓が人名記憶手段に記憶してあるか否か、又は抽出した文字データを先頭に有する構成語を含む複合語が複合語記憶手段に記憶してあるか否かを判断する。また、省略語判定装置は、前記抽出した文字データを除いた前記テキストデータから先頭の所定数の文字データを抽出し、抽出した文字データを先頭に有する名が人名記憶手段に記憶してあるか否か、又は抽出した文字データを先頭に有する構成語が、複合語記憶手段に記憶してあると判断した複合語の構成語に含まれているか否かを判断する。前記名が人名記憶手段に記憶してあると判断した場合、又は前記構成語が含まれていると判断した場合、省略語判定装置は、前記テキストデータが省略語の候補であると判定する。また、省略語判定装置は、複数のテキストデータ及び各テキストデータと共起される共起データを対応付けて共起データ記憶手段に記憶しており、省略語の候補であると判定したテキストデータに対応する共起データを共起データ記憶手段から取得し、取得された共起データが前記文書データ中のテキストデータに含まれているか否かを判断し、含まれていると判断した場合、省略語の候補であると判定したテキストデータを省略語であると確定する。よって、テキストデータが、人名の姓及び名のそれぞれの先頭から所定数の文字を抽出して生成された省略語、又は複合語を構成する２つの構成語のそれぞれの先頭から所定数の文字を抽出して生成された省略語であるか否かを、当該テキストデータと共起されるデータが共起データであるか否かに基づいて確実に判定することが可能となる。

本発明に係る省略語判定方法は、テキストデータが省略語であるか否かを判定する省略語判定方法において、テキストデータから先頭の所定数の文字データを抽出し、抽出した文字データを先頭に有する姓が、人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段に記憶してあるか否かを判断し、前記姓が人名記憶手段に記憶してあると判断した場合、前記抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出し、抽出した文字データを先頭に有する名が人名記憶手段に記憶してあるか否かを判断し、前記名が人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定する。

本発明に係る省略語判定方法は、テキストデータが省略語であるか否かを判定する省略語判定方法において、テキストデータから先頭の所定数の文字データを抽出し、抽出した文字データを先頭に有する構成語を含む複合語が、複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段に記憶してあるか否かを判断し、前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出し、抽出した文字データを先頭に有する構成語が、複合語記憶手段に記憶してあると判断された複合語の構成語に含まれているか否かを判断し、前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定する。

本発明に係るコンピュータプログラムは、コンピュータに読み取らせて実行させることにより、上述したような省略語判定装置をコンピュータによって実現することが可能となる。

本発明に係るテキスト解析装置は、テキストデータを解析するテキスト解析装置において、上述したいずれかの省略語判定装置を備え、形態素及びアクセント型を対応付けて形態素記憶手段に記憶しており、形態素記憶手段の記憶内容に基づいて、テキストデータを形態素に分割し、分割した形態素のそれぞれにアクセント型を付与する。前記省略語判定装置は、形態素記憶手段に記憶されていない形態素が省略語であるか否かを判定しており、テキスト解析装置は、省略語判定装置によって省略語であると判定された形態素に所定のアクセント型を付与する。よって、形態素記憶手段に記憶されていない形態素において、省略語であると判定された形態素と、他の形態素とにおいて異なるアクセント型を付与するので、省略語に適したアクセント型を付与することが可能となる。

本発明に係るテキスト解析装置は、省略語及びアクセント型を対応付けて省略語記憶手段に記憶しており、省略語記憶手段の記憶内容に基づいて、省略語判定装置によって省略語であると判定された形態素のそれぞれにアクセント型を付与すると共に、省略語記憶手段に記憶されていない形態素に所定のアクセント型を付与する。よって、予め省略語記憶手段に記憶してある省略語に対しては、それぞれ対応するアクセント型を付与し、省略語記憶手段に記憶されていない省略語に対しては、所定のアクセント型を付与するので、省略語に適したアクセント型を付与することが可能となる。

本発明に係るテキスト解析装置は、テキストデータを解析するテキスト解析装置において、上述した共起データ記憶手段を有する省略語判定装置を備え、テキストデータ及びアクセント型を対応付けてテキスト記憶手段に記憶している。前記省略語判定装置は、テキスト記憶手段の記憶内容に基づいて、文書データをテキストデータに分割し、分割したテキストデータのそれぞれにアクセント型を付与する。また、省略語判定装置は、テキスト記憶手段に記憶されていないテキストデータが省略語であるか否かを判定しており、テキスト解析装置は、省略語判定装置によって省略語であると判定されたテキストデータに所定のアクセント型を付与する。よって、テキスト記憶手段に記憶されていないテキストデータにおいて、省略語であると判定されたテキストデータと、他のテキストデータとにおいて異なるアクセント型を付与するので、省略語に適したアクセント型を付与することが可能となる。

本発明に係るテキスト解析装置は、省略語及びアクセント型を対応付けて省略語記憶手段に記憶しており、省略語記憶手段の記憶内容に基づいて、省略語判定装置によって省略語であると判定されたテキストデータのそれぞれにアクセント型を付与すると共に、省略語記憶手段に記憶されていないテキストデータに所定のアクセント型を付与する。よって、予め省略語記憶手段に記憶してある省略語に対しては、それぞれ対応するアクセント型を付与し、省略語記憶手段に記憶されていない省略語に対しては、所定のアクセント型を付与するので、省略語に適したアクセント型を付与することが可能となる。

本発明に係る音声合成装置は、テキストデータから合成音声を生成する音声合成装置において、上述したいずれかのテキスト解析装置を備え、テキスト解析装置の形態素分割手段が分割した形態素及び各形態素に付与されたアクセント型に基づいて、各形態素に対応する韻律を生成し、生成した韻律に基づいて合成音声を生成する。

本発明に係る音声合成装置は、テキストデータから合成音声を生成する音声合成装置において、上述した共起データ記憶手段を有する省略語判定装置を備えたテキスト解析装置を備え、省略語判定装置の分割手段が分割したテキストデータ及びテキスト解析装置が各テキストデータに付与したアクセント型に基づいて、各テキストデータに対応する韻律を生成し、生成した韻律に基づいて合成音声を生成する。

本発明では、テキストデータが、人名の姓に用いられる文字の先頭の所定数の文字と、人名の名に用いられる文字の先頭の所定数の文字とを組み合わせて構成される場合に、前記テキストデータを、人名を省略して生成された省略語であると判定する。なお、近年の省略語は、人名における姓の先頭の２音節と名の先頭の２音節とを組み合わせたものが多い。従って、例えば、人名の姓に用いられる文字の先頭の２文字と人名の名に用いられる文字の先頭の２文字とを組み合わせて構成されるテキストデータを省略語であると判定する場合、テキストデータが、例えば、マツケン（松平健）、キムタク（木村拓也）、ナカショー（中川翔子）等の省略語であるか否かを容易に判定することができる。

本発明では、テキストデータが、複合語を構成する２つの構成語のそれぞれの先頭の所定数の文字を組み合わせて構成される場合に、前記テキストデータを、複合語を省略して生成された省略語であると判定する。なお、近年の省略語は、複合語における正式名称を構成する最初の単語（構成語）の先頭の２音節と２番目の単語（構成語）の先頭の２音節とを組み合わせたものが多い。従って、例えば、最初の構成語の先頭の２文字と２番目の構成語の先頭の２文字とを組み合わせて構成されるテキストデータを省略語であると判定する場合、テキストデータが、例えば、コスプレ（コスチュームプレイ）、連ドラ（連続ドラマ）、筋トレ（筋肉トレーニング）等の省略語であるか否かを容易に判定することができる。また、最初の構成語の先頭の１文字と２番目の構成語の先頭の２文字とを組み合わせて構成されるテキストデータを省略語であると判定する場合、テキストデータが、例えば、地デジ（地上デジタル放送）等の省略語であるか否かを容易に判定することができる。

本発明では、文書データをテキストデータに分割し、分割されたテキストデータが省略語の候補であると判定された場合、このテキストデータと共起される共起データが、このテキストデータを含む文書データに含まれているか否かを判断し、含まれている場合、このテキストデータを省略語であると確定する。よって、省略語の候補と判定されたテキストデータが、本来の省略語であれば共起される可能性の高い共起データと共起されている場合にのみ、このテキストデータを省略語に確定するので、省略語の誤判定を防止することができる。具体的には、例えば、「マツケン」に対する共起データに「サンバ」が登録されており、「マツケンがサンバを踊った」という文書データ中のテキストデータ「マツケン」が省略語の候補であると判定された場合、「マツケン」の共起データである「サンバ」が文書データ中に含まれているので、この「マツケン」を省略語に特定することができる。

本発明では、形態素及びアクセント型を対応付けて記憶してある形態素記憶手段の記憶内容に基づいて、テキストデータを形態素に分割し、分割した形態素のそれぞれにアクセント型を付与する。また、形態素記憶手段に記憶されていない形態素が省略語判定装置によって省略語であると判定された場合、この形態素に所定のアクセント型を付与する。このように、形態素記憶手段に記憶されていない形態素において、省略語であると判定された形態素と、他の形態素とにおいて異なるアクセント型を付与するので、省略語に適したアクセント型を付与することができる。従って、このように各形態素に適切に付与されたアクセント型に基づいて、各形態素に対応する韻律を生成し、生成した韻律に基づいて合成音声を生成した場合、適切な韻律を生成することができ、また、適切な韻律に基づいて適切な合成音声を生成することができるので、形態素記憶手段に記憶されていない形態素（未知語）に対しても正しいアクセントで合成音声を出力することができる。

本発明では、省略語及びアクセント型を対応付けて記憶してある省略語記憶手段の記憶内容に基づいて、省略語判定装置によって省略語であると判定された形態素のそれぞれにアクセント型を付与すると共に、省略語記憶手段に記憶されていない形態素に所定のアクセント型を付与する。このように、省略語記憶手段に記憶してある省略語に対してはそれぞれ対応するアクセント型を付与するので、より適切なアクセント型を付与することができる。従って、このように各形態素に適切に付与されたアクセント型に基づいて、各形態素に対応する韻律を生成し、生成した韻律に基づいて合成音声を生成した場合、適切な韻律を生成することができ、また、適切な韻律に基づいて適切な合成音声を生成することができる。

本発明では、テキストデータ及びアクセント型を対応付けて記憶してあるテキスト記憶手段の記憶内容に基づいて、文書データをテキストデータに分割し、分割したテキストデータのそれぞれにアクセント型を付与する。また、テキスト記憶手段に記憶されていないテキストデータが省略語判定装置によって省略語であると判定された場合、このテキストデータに所定のアクセント型を付与する。このように、テキスト記憶手段に記憶されていないテキストデータにおいて、省略語であると判定されたテキストデータと、他のテキストデータとにおいて異なるアクセント型を付与するので、省略語に適したアクセント型を付与することができる。従って、このように各テキストデータに適切に付与されたアクセント型に基づいて、各テキストデータに対応する韻律を生成し、生成した韻律に基づいて合成音声を生成した場合、適切な韻律を生成することができ、また、適切な韻律に基づいて適切な合成音声を生成することができるので、テキスト記憶手段に記憶されていない形態素（未知語）に対しても正しいアクセントで合成音声を出力することができる。

本発明では、省略語及びアクセント型を対応付けて記憶してある省略語記憶手段の記憶内容に基づいて、省略語判定装置によって省略語であると判定されたテキストデータのそれぞれにアクセント型を付与すると共に、省略語記憶手段に記憶されていないテキストデータに所定のアクセント型を付与する。このように、省略語記憶手段に記憶してある省略語に対してはそれぞれ対応するアクセント型を付与するので、より適切なアクセント型を付与することができる。従って、このように各テキストデータに適切に付与されたアクセント型に基づいて、各テキストデータに対応する韻律を生成し、生成した韻律に基づいて合成音声を生成した場合、適切な韻律を生成することができ、また、適切な韻律に基づいて適切な合成音声を生成することができる。

以下に、本発明に係る省略語判定装置、テキスト解析装置及び音声合成装置を、各実施形態を示す図面に基づいて詳述する。なお、以下の各実施形態では、本発明に係るコンピュータプログラムを公知のパーソナルコンピュータ等に読み取らせ、パーソナルコンピュータのＣＰＵ等によって実行させることによって本発明に係る省略語判定装置、テキスト解析装置及び音声合成装置を実現する構成について説明する。しかし、等価な働きをするハードウェアによって本発明に係る省略語判定装置、テキスト解析装置及び音声合成装置を実現してもよい。

（実施形態１）
以下に、本発明に係る省略語判定装置を備えた本発明に係るテキスト解析装置を、実施形態１を示す図面に基づいて詳述する。図１は実施形態１に係るテキスト解析装置の構成例を示すブロック図である。本実施形態１に係るテキスト解析装置１０は、制御部１、ＲＯＭ２、ＲＡＭ３、ＨＤＤ４、操作部５、表示部６等を備え、これらのハードウェア各部はそれぞれバス１ａを介して相互に接続されている。

制御部１は、ＣＰＵ（Central Processing Unit ）又はＭＰＵ（Micro Processor Unit）等で構成され、ＲＯＭ２又はＨＤＤ４に予め記憶してある制御プログラムを適宜ＲＡＭ３に読み出して実行すると共に、上述したハードウェア各部の動作を制御する。ＲＯＭ２には、テキスト解析装置１０を本発明の省略語判定装置及びテキスト解析装置として動作させるために必要な種々の制御プログラムが予め格納されている。ＲＡＭ３はＳＲＡＭ又はフラッシュメモリ等で構成されており、制御部１による制御プログラムの実行時に発生する種々のデータを一時的に記憶する。

操作部５は、キーボード及びマウス等であり、ユーザがテキスト解析装置１０を操作するために必要な各種の操作キーを備えている。ユーザにより各操作キーが操作された場合、操作部５は操作された操作キーに対応した制御信号を制御部１へ送出し、制御部１は操作部５から取得した制御信号に対応した処理を実行する。
表示部６は、液晶ディスプレイ又はＣＲＴディスプレイ等であり、制御部１からの指示に従って、テキスト解析装置１０の動作状態、操作部５を介して入力された情報、ユーザに対して通知すべき情報等を表示する。

ＨＤＤ４は大容量の記憶装置であり、ＨＤＤ４には、テキスト解析装置１０を本発明の省略語判定装置及びテキスト解析装置として動作させるために必要な種々の制御プログラム、テキストデータ、図２に示すような言語辞書４ａ、図３に示すような人名辞書４ｂ、図４に示すような複合語辞書４ｃ、ユーザに対して各種の情報を通知するための画面情報等が予め記憶されている。

なお、言語辞書４ａ、人名辞書４ｂ及び複合語辞書４ｃは、ＨＤＤ４に予め格納されているだけでなく、テキスト解析装置１０が外部メモリ（図示せず）に記憶してあるデータの読み出しが可能なドライバ（図示せず）を備える場合には、外部メモリに記憶された各種辞書をドライバによって読み出してＨＤＤ４に格納させてもよい。また、テキスト解析装置１０がインターネットのようなネットワークとの接続が可能な通信部（図示せず）を備える場合には、ネットワークを介して外部の装置から各種辞書をダウンロードしてＨＤＤ４に格納させてもよい。また、ＨＤＤ４に記憶してあるテキストデータは、テキスト解析装置１０で作成されたテキストデータであってもよく、外部の装置で作成されて外部メモリ（図示せず）又はネットワーク（図示せず）を介してテキスト解析装置１０に読み取らせたテキストデータであってもよい。

図２は言語辞書４ａの登録内容を示す模式図である。図２に示すように、言語辞書（形態素記憶手段）４ａには、単語（形態素）の表記、読み及びアクセント型がそれぞれ対応付けて登録されている。なお、言語辞書４ａに各形態素の品詞が登録されていてもよい。

図３は人名辞書４ｂの登録内容を示す模式図である。人名辞書（人名記憶手段）４ｂは、人名に用いられる姓及び名をそれぞれ記憶しており、図３（ａ）に示すような姓のリストと、図３（ｂ）に示すような名のリストとを有する。

図４は複合語辞書４ｃの登録内容を示す模式図である。図４に示すように、複合語辞書（複合語記憶手段）４ｃには、複合語、複合語を構成する構成語及び各構成語の読みがそれぞれ対応付けて登録されている。なお、本実施形態１では、複合語辞書４ｃの構成語の欄に登録される各構成語が、複合語を構成する順に登録されている例で説明するが、登録順序はこれに限られない。ただし、構成語の欄に順次登録される各構成語と、読みの欄に順次登録される各構成語の読みとは対応付けて登録されることが望ましい。

以下に、上述した構成のテキスト解析装置１０において、制御部１がＲＯＭ２及びＨＤＤ４に記憶してある制御プログラムを実行することによって実現される各種の機能について説明する。図５はテキスト解析装置１０の機能構成例を示す機能ブロック図である。本実施形態１のテキスト解析装置１０において、制御部１は、ＲＯＭ２及びＨＤＤ４に記憶してある制御プログラムを実行することによって、形態素解析部１１、省略語判定部（本発明に係る省略語判定装置）１２、省略語アクセント付与部１３等の各機能を実現する。なお、以下では、テキスト解析装置１０が「マツケンが、サンバを踊った。」のテキストデータを解析する処理を例に説明する。

形態素解析部（形態素分割手段）１１は、ＨＤＤ４に記憶してあるテキストデータをＨＤＤ４からＲＡＭ３に読み出し、言語辞書４ａの登録内容に基づいて、ＲＡＭ３に読み出したテキストデータを形態素に分割すると共に、分割した形態素のそれぞれにアクセント型を付与する。形態素解析部１１は、分割した各形態素と、それぞれに付与したアクセント型とを対応付けて省略語判定部１２へ送出する。なお、形態素解析部１１は、言語辞書４ａの登録内容に基づいてアクセント型を付与できなかった形態素（未知語）については、各形態素と、アクセント型が不明であること（未知語であること）を示す情報とを対応付けて省略語判定部１２へ送出する。

本実施形態１の言語辞書４ａには、「マツケン」は登録されていないため、「マツケン」は未知語として扱われる。従って、形態素解析部１１は、テキストデータ「マツケンが、サンバを踊った。」を、「マツケン（未知語）・ガ（１モーラ０型）・サンバ（３モーラ１型）・オ（１モーラ０型）・オドッタ（４モーラ０型）」のように形態素に分割し、この表音文字列を省略語判定部１２へ送出する。

なお、表音文字列の（）内には、各形態素のアクセント型、又は各形態素が未知語である場合には未知語であることを示す情報が付与される。また、「踊った」は、厳密に言うと形態素ではなく、文節又はアクセント句と呼ばれるものだが、本発明の本質とは関係ないのでここでは１形態素として扱っている。

省略語判定部１２は、人名辞書４ｂ及び複合語辞書４ｃの登録内容に基づいて、形態素解析部１１によって未知語であるとされた形態素が省略語であるか否かを判定する。ここでは、省略語判定部１２は、「マツケン」が省略語であるか否かを判定する。なお、省略語判定部１２による省略語の判定処理の詳細については後述する。

省略語判定部１２は、形態素解析部１１によって未知語であるとされた形態素が省略語であると判定した場合、省略語であると判定された形態素に、省略語であることを示す情報を対応付けて省略語アクセント付与部１３へ送出する。具体的には、「マツケン」が省略語であると判定した場合、省略語判定部１２は、「マツケン（省略語）・ガ（１モーラ０型）・サンバ（３モーラ１型）・オ（１モーラ０型）・オドッタ（４モーラ０型）」の表音文字列を省略語アクセント付与部１３へ送出する。

一方、省略語判定部１２は、形態素解析部１１によって未知語であるとされた形態素が省略語でないと判定した場合、省略語でないと判定された形態素に、形態素解析部１１から送出されてきた未知語であることを示す情報をそのまま対応付けて省略語アクセント付与部１３へ送出する。具体的には、「マツケン」が省略語でないと判定した場合、省略語判定部１２は、「マツケン（未知語）・ガ（１モーラ０型）・サンバ（３モーラ１型）・オ（１モーラ０型）・オドッタ（４モーラ０型）」の表音文字列を省略語アクセント付与部１３へ送出する。

省略語アクセント付与部（アクセント付与手段）１３は、省略語判定部１２によって省略語であると判定された形態素に対して平板型（０型）のアクセント型（所定のアクセント型）を付与する。具体的には、省略語判定部１２によって「マツケン」が省略語であると判定されていた場合、省略語アクセント付与部１３は、省略語「マツケン」に対して４モーラ０型のアクセント型を付与し、省略語判定部１２から送出されてきた表音文字列中の「マツケン」のアクセント型に「４モーラ０型」を割り当てる。

これにより、省略語アクセント付与部１３は、「マツケン（４モーラ０型）・ガ（１モーラ０型）・サンバ（３モーラ１型）・オ（１モーラ０型）・オドッタ（４モーラ０型）」の表音文字列を出力する。なお、省略語判定部１２によって「マツケン」が省略語でないと判定されていた場合、省略語アクセント付与部１３は、省略語判定部１２から送出されてきた表音文字列をそのまま出力する。

以下に、省略語判定部１２による省略語の判定処理について説明する。なお、本実施形態１では、省略語判定部１２は、形態素解析部１１によって未知語であるとされた形態素が、人名を省略した省略語であるか否か、又は複合語を省略した省略語であるか否かを判定する。なお、近年の省略語は、人名における姓の先頭の２音節（２文字）と名の先頭の２音節（２文字）とを組み合わせたもの、複合語における正式名称を構成する最初の単語（構成語）の先頭の２音節（２文字）と２番目の単語（構成語）の先頭の２音節（２文字）とを組み合わせたもの、複合語における正式名称を構成する最初の単語（構成語）の先頭の１音節（１文字）と２番目の単語（構成語）の先頭の２音節（２文字）とを組み合わせたものが多い。従って、本実施形態１では、形態素解析部１１によって未知語であるとされた形態素が、これらの省略語であるか否かを判定する。

本実施形態１の省略語判定部１２は、まず、形態素解析部１１から送出されてきた表音文字列から、形態素解析部１１によって未知語とされた形態素を抽出し、抽出した未知語（形態素）が３音節であるか４音節であるかを判断する。なお、未知語が３音節である場合、例えば、人名における姓の先頭の１文字と名の先頭の２文字とを組み合わせた省略語、又は複合語を構成する最初の構成語の先頭の１文字と２番目の構成語の先頭の２文字とを組み合わせた省略語である可能性が高い。また、未知語が４音節である場合、例えば、人名における姓の先頭の２文字と名の先頭の２文字とを組み合わせた省略語、又は複合語を構成する最初の構成語の先頭の２文字と２番目の構成語の先頭の２文字とを組み合わせた省略語である可能性が高い。

従って、抽出した未知語が３音節である場合、省略語判定部（第１抽出手段）１２は、３音節の未知語（テキストデータ）から先頭の１音節を抽出する。そして、省略語判定部１２は、抽出した１音節が、人名辞書４ｂの姓のリストに登録されているいずれかの姓の先頭の１文字に一致するか否かを判断する。即ち、３音節の未知語の先頭の１音節を先頭に有する姓が姓のリストに登録されているか否かを判断する。抽出した１音節が姓のリストに登録されているいずれかの姓の先頭の１文字に一致すると判断した場合、省略語判定部（第２抽出手段）１２は、抽出した１音節を除いた前記３音節の未知語から先頭の２音節を抽出する。即ち、３音節の未知語の後方の２音節を抽出する。

省略語判定部１２は、抽出した２音節が、人名辞書４ｂの名のリストに登録されているいずれかの名の先頭の２文字に一致するか否かを判断する。即ち、３音節の未知語の後方の２音節を先頭に有する名が名のリストに登録されているか否かを判断する。抽出した２音節が名のリストに登録されているいずれかの名の先頭の２文字に一致すると判断した場合、省略語判定部（判定手段）１２は、この未知語が人名を省略した省略語であると判定する。

なお、３音節の未知語の先頭の１音節が姓のリストに登録されているいずれの姓の先頭の１文字とも一致しない場合、即ち、３音節の未知語の先頭の１音節を先頭に有する姓が人名辞書４ｂの姓のリストに登録されていない場合、又は、３音節の未知語の後方の２音節が名のリストに登録されているいずれの名の先頭の２文字とも一致しない場合、即ち、３音節の未知語の後方の２音節を先頭に有する名が人名辞書４ｂの名のリストに登録されていない場合、省略語判定部１２は、同様の処理を複合語辞書４ｃに基づいて行なう。

具体的には、省略語判定部（判断手段）１２は、３音節の未知語（テキストデータ）から先頭の１音節を抽出し、抽出した１音節が、複合語辞書４ｃの構成語の欄に最初の構成語として登録されているいずれかの構成語の先頭の１文字に一致するか否かを判断する。即ち、３音節の未知語の先頭の１音節を先頭に有する構成語が、複合語辞書４ｃの構成語の欄に最初の構成語として登録されているか否かを判断する。抽出した１音節が最初の構成語として登録されているいずれかの構成語の先頭の１文字に一致すると判断した場合、省略語判定部１２は、この構成語を含む複合語の２番目の構成語を複合語辞書４ｃから読み出すと共に、抽出した１音節を除いた前記３音節の未知語から先頭の２音節、即ち、３音節の未知語の後方の２音節を抽出する。

省略語判定部１２は、抽出した２音節が、複合語辞書４ｃから読み出した２番目の構成語の先頭の２文字に一致するか否かを判断する。即ち、３音節の未知語の後方の２音節を先頭に有する構成語が、当該３音節の未知語の先頭の１音節を先頭に有する構成語が構成する複合語の２番目の構成語であるか否かを判断する。抽出した２音節が２番目の構成語の先頭の２文字に一致すると判断した場合、省略語判定部（判定手段）１２は、この未知語が複合語を省略した省略語であると判定する。

なお、３音節の未知語の先頭の１音節が最初の構成語として登録されているいずれの構成語の先頭の１文字とも一致しない場合、即ち、３音節の未知語の先頭の１音節を先頭に有する構成語が複合語辞書４ｃに登録されていない場合、又は、３音節の未知語の後方の２音節が２番目の構成語の先頭の２文字に一致しない場合、省略語判定部１２は、この未知語を省略語でないと判定する。

同様に、形態素解析部１１によって未知語とされた形態素が４音節である場合、省略語判定部１２は、４音節の未知語から先頭の２音節を抽出する。そして、省略語判定部１２は、抽出した２音節が、人名辞書４ｂの姓のリストに登録されているいずれかの姓の先頭の２文字に一致するか否かを判断する。即ち、４音節の未知語の先頭の２音節を先頭に有する姓が姓のリストに登録されているか否かを判断する。抽出した２音節が姓のリストに登録されているいずれかの姓の先頭の２文字に一致すると判断した場合、省略語判定部１２は、抽出した２音節を除いた前記４音節の未知語から先頭の２音節を抽出する。即ち、４音節の未知語の後方の２音節を抽出する。

省略語判定部１２は、抽出した２音節が、人名辞書４ｂの名のリストに登録されているいずれかの名の先頭の２文字に一致するか否かを判断する。即ち、４音節の未知語の後方の２音節を先頭に有する名が名のリストに登録されているか否かを判断する。抽出した２音節が名のリストに登録されているいずれかの名の先頭の２文字に一致すると判断した場合、省略語判定部１２は、この未知語が人名を省略した省略語であると判定する。

なお、４音節の未知語の先頭の２音節が姓のリストに登録されているいずれの姓の先頭の２文字とも一致しない場合、又は、４音節の未知語の後方の２音節が名のリストに登録されているいずれの名の先頭の２文字とも一致しない場合、省略語判定部１２は、同様の処理を複合語辞書４ｃに基づいて行なう。

具体的には、省略語判定部１２は、４音節の未知語から先頭の２音節を抽出し、抽出した２音節が、複合語辞書４ｃの構成語の欄に最初の構成語として登録されているいずれかの構成語の先頭の２文字に一致するか否かを判断する。即ち、４音節の未知語の先頭の２音節を先頭に有する構成語が、複合語辞書４ｃの構成語の欄に最初の構成語として登録されているか否かを判断する。抽出した２音節が最初の構成語として登録されているいずれかの構成語の先頭の２文字に一致すると判断した場合、省略語判定部１２は、この構成語を含む複合語の２番目の構成語を複合語辞書４ｃから読み出すと共に、抽出した２音節を除いた前記３音節の未知語から先頭の２音節、即ち、４音節の未知語の後方の２音節を抽出する。

省略語判定部１２は、抽出した２音節が、複合語辞書４ｃから読み出した２番目の構成語の先頭の２文字に一致するか否かを判断する。即ち、４音節の未知語の後方の２音節を先頭に有する構成語が、当該４音節の未知語の先頭の２音節を先頭に有する構成語が構成する複合語の２番目の構成語であるか否かを判断する。抽出した２音節が２番目の構成語の先頭の２文字に一致すると判断した場合、省略語判定部（判定手段）１２は、この未知語が複合語を省略した省略語であると判定する。

なお、４音節の未知語の先頭の２音節が最初の構成語として登録されているいずれの構成語の先頭の２文字とも一致しない場合、又は４音節の未知語の後方の２音節が２番目の構成語の先頭の２文字に一致しない場合、省略語判定部１２は、この未知語を省略語でないと判定する。

省略語判定部１２は、上述した処理を、形態素解析部１１から送出されてきた表音文字列中の全ての未知語に対して実行し、省略語であると判定された形態素（未知語）には、省略語であることを示す情報を対応付け、省略語でないと判定された形態素には、未知語であることを示す情報をそのまま対応付けて省略語アクセント付与部１３へ送出する。

以下に、本実施形態１のテキスト解析装置１０によるテキスト解析処理についてフローチャートに基づいて詳述する。図６はテキスト解析処理の手順を示すフローチャートである。なお、以下の処理は、テキスト解析装置１０のＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムに従って制御部１によって実行される。

テキスト解析装置１０のユーザが操作部５を操作することによって１つのテキストデータに基づくテキスト解析の実行を指示した場合、制御部１は、ＨＤＤ４に記憶してあるテキストデータをＲＡＭ３に読み込む（Ｓ１）。制御部１（形態素解析部１１）は、ＲＡＭ３に読み込んだテキストデータを、言語辞書４ａの登録内容に基づいて形態素に分割し、分割した形態素のそれぞれにアクセント型を付与し（Ｓ２）、各形態素にアクセント型を対応付けた表音文字列を生成する。

制御部１は、人名辞書４ｂ及び複合語辞書４ｃの登録内容に基づいて省略語判定処理を実行し（Ｓ３）、ステップＳ２でアクセント型を付与できなかった形態素（未知語）が省略語であるか否かを判定する。なお、省略語判定処理の詳細については図７乃至図１１に基づいて後述する。制御部１（省略語アクセント付与部１３）は、ステップＳ３で省略語であると判定された形態素に対して平板型（０型）のアクセント型を付与し（Ｓ４）、テキスト解析処理を終了する。

以下に、上述したテキスト解析処理における省略語判定処理（図６中のステップＳ３）について説明する。図７乃至図１１は省略語判定処理の手順を示すフローチャートである。なお、以下の処理は、テキスト解析装置１０のＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムに従って制御部１（省略語判定部１２）によって実行される。

制御部１は、図６中のステップＳ２で各形態素にアクセント型を対応付けた表音文字列を生成した場合、生成した表音文字列から未知語（形態素）を抽出し（Ｓ１１）、抽出した未知語が３音節であるか否かを判断する（Ｓ１２）。３音節であると判断した場合（Ｓ１２：ＹＥＳ）、制御部１は、この未知語から先頭の１音節を抽出し（Ｓ１３）、人名辞書４ｂの姓のリストから１単語を読み出す（Ｓ１４）。制御部１は、ステップＳ１３で抽出した１音節が、姓のリストから読み出した単語（姓）の先頭の１文字に一致するか否かを判断し（Ｓ１５）、一致しないと判断した場合（Ｓ１５：ＮＯ）、姓のリストから全ての単語の読み出しが終了したか否かを判断する（Ｓ１６）。

姓のリストから全ての単語の読み出しが終了していないと判断した場合（Ｓ１６：ＮＯ）、制御部１は、ステップＳ１４へ処理を戻し、人名辞書４ｂの姓のリストから１単語を読み出し（Ｓ１４）、ステップＳ１３で抽出した１音節が姓のリストから読み出した単語の先頭の１文字に一致するか否かの判断を繰り返す。なお、姓のリストから全ての単語の読み出しが終了したと判断した場合（Ｓ１６：ＹＥＳ）、即ち、ステップＳ１３で抽出した１音節を先頭に有する姓が人名辞書４ｂの姓のリストに登録されていない場合、制御部１は、ステップＳ２３へ処理を移行する。ステップＳ１３で抽出した１音節が姓のリストから読み出した単語の先頭の１文字に一致すると判断した場合（Ｓ１５：ＹＥＳ）、即ち、ステップＳ１３で抽出した１音節を先頭に有する姓が人名辞書４ｂの姓のリストに登録されている場合、制御部１は、ステップＳ１１で抽出した未知語の後方の２音節を抽出する（Ｓ１７）。

制御部１は、人名辞書４ｂの名のリストから１単語を読み出し（Ｓ１８）、ステップＳ１７で抽出した２音節が、名のリストから読み出した単語（名）の先頭の２文字に一致するか否かを判断する（Ｓ１９）。抽出した２音節が名のリストから読み出した単語の先頭の２文字に一致すると判断した場合（Ｓ１９：ＹＥＳ）、即ち、ステップＳ１７で抽出した２音節を先頭に有する名が人名辞書４ｂの名のリストに登録されている場合、制御部１は、ステップＳ１１で抽出した未知語は省略語であると判定し（Ｓ２０）、図６中のステップＳ２で各形態素にアクセント型を対応付けた表音文字列中の全ての未知語に対して上述した処理を終了したか否かを判断する（Ｓ２１）。制御部１は、全ての未知語に対する処理を終了したと判断した場合（Ｓ２１：ＹＥＳ）、省略語判定処理を終了し、終了していないと判断した場合（Ｓ２１：ＮＯ）、ステップＳ１１へ処理を戻し、表音文字列中の全ての未知語に対して上述した処理を繰り返す。

ステップＳ１７で抽出した２音節が名のリストから読み出した単語の先頭の２文字に一致しないと判断した場合（Ｓ１９：ＮＯ）、制御部１は、名のリストから全ての単語の読み出しが終了したか否かを判断し（Ｓ２２）、全ての単語の読み出しが終了していないと判断した場合（Ｓ２２：ＮＯ）、ステップＳ１８へ処理を戻し、人名辞書４ｂの名のリストから１単語を読み出し（Ｓ１８）、ステップＳ１７で抽出した２音節が名のリストから読み出した単語の先頭の２文字に一致するか否かの判断を繰り返す。なお、名のリストから全ての単語の読み出しが終了したと判断した場合（Ｓ２２：ＹＥＳ）、即ち、ステップＳ１７で抽出した２音節を先頭に有する名が人名辞書４ｂの名のリストに登録されていない場合、制御部１は、ステップＳ２３へ処理を移行する。

制御部１は、ステップＳ１１で抽出した未知語から先頭の１音節を抽出し（Ｓ２３）、複合語辞書４ｃの構成語の欄に最初の構成語として登録されている構成語を１つ読み出す（Ｓ２４）。制御部１は、ステップＳ２３で抽出した１音節が、複合語辞書４ｃから読み出した構成語の先頭の１文字に一致するか否かを判断し（Ｓ２５）、一致しないと判断した場合（Ｓ２５：ＮＯ）、複合語辞書４ｃから最初の構成語の全ての読み出しが終了したか否かを判断する（Ｓ２６）。

複合語辞書４ｃから最初の構成語の全ての読み出しが終了していないと判断した場合（Ｓ２６：ＮＯ）、制御部１は、ステップＳ２４へ処理を戻し、複合語辞書４ｃの構成語の欄に最初の構成語として登録されている構成語を１つ読み出し（Ｓ２４）、ステップＳ２３で抽出した１音節が複合語辞書４ｃから読み出した構成語の先頭の１文字に一致するか否かの判断を繰り返す。なお、複合語辞書４ｃから最初の構成語の全ての読み出しが終了したと判断した場合（Ｓ２６：ＹＥＳ）、即ち、ステップＳ２３で抽出した１音節を先頭に有する最初の構成語が複合語辞書４ｃに登録されていない場合、制御部１は、ステップＳ１１で抽出した未知語は省略語でないと判定し（Ｓ３１）、ステップＳ２１へ処理を移行する。

ステップＳ２３で抽出した１音節が複合語辞書４ｃから読み出した構成語の先頭の１文字に一致すると判断した場合（Ｓ２５：ＹＥＳ）、即ち、ステップＳ２３で抽出した１音節を先頭に有する最初の構成語が複合語辞書４ｃに登録されている場合、制御部１は、ステップＳ１１で抽出した未知語の後方の２音節を抽出する（Ｓ２７）。制御部１は、ステップＳ２４で読み出した最初の構成語を含む複合語の２番目の構成語を複合語辞書４ｃから読み出し（Ｓ２８）、ステップＳ２７で抽出した２音節が、複合語辞書４ｃから読み出した２番目の構成語の先頭の２文字に一致するか否かを判断する（Ｓ２９）。

制御部１は、抽出した２音節が複合語辞書４ｃから読み出した２番目の構成語の先頭の２文字に一致すると判断した場合（Ｓ２９：ＹＥＳ）、ステップＳ１１で抽出した未知語は省略語であると判定し（Ｓ３０）、ステップＳ２１へ処理を移行する。また、制御部１は、抽出した２音節が複合語辞書４ｃから読み出した２番目の構成語の先頭の２文字に一致しないと判断した場合（Ｓ２９：ＮＯ）、ステップＳ１１で抽出した未知語は省略語でないと判定し（Ｓ３１）、ステップＳ２１へ処理を移行する。

一方、ステップＳ１１で抽出した未知語が３音節でないと判断した場合（Ｓ１２：ＮＯ）、制御部１は、この未知語が４音節であるか否かを判断し（Ｓ３２）、４音節でないと判断した場合（Ｓ３２：ＮＯ）、ステップＳ２１へ処理を移行する。制御部１は、この未知語が４音節であると判断した場合（Ｓ３２：ＹＥＳ）、この未知語から先頭の２音節を抽出し（Ｓ３３）、人名辞書４ｂの姓のリストから１単語を読み出す（Ｓ３４）。

制御部１は、ステップＳ３３で抽出した２音節が、姓のリストから読み出した単語（姓）の先頭の２文字に一致するか否かを判断し（Ｓ３５）、一致しないと判断した場合（Ｓ３５：ＮＯ）、姓のリストから全ての単語の読み出しが終了したか否かを判断する（Ｓ３６）。姓のリストから全ての単語の読み出しが終了していないと判断した場合（Ｓ３６：ＮＯ）、制御部１は、ステップＳ３４へ処理を戻し、人名辞書４ｂの姓のリストから１単語を読み出し（Ｓ３４）、ステップＳ３３で抽出した２音節が姓のリストから読み出した単語の先頭の２文字に一致するか否かの判断を繰り返す。なお、姓のリストから全ての単語の読み出しが終了したと判断した場合（Ｓ３６：ＹＥＳ）、即ち、ステップＳ３３で抽出した２音節を先頭に有する姓が人名辞書４ｂの姓のリストに登録されていない場合、制御部１は、ステップＳ４２へ処理を移行する。

ステップＳ３３で抽出した２音節が姓のリストから読み出した単語の先頭の２文字に一致すると判断した場合（Ｓ３５：ＹＥＳ）、即ち、ステップＳ３３で抽出した２音節を先頭に有する姓が人名辞書４ｂの姓のリストに登録されている場合、制御部１は、ステップＳ１１で抽出した未知語の後方の２音節を抽出する（Ｓ３７）。

制御部１は、人名辞書４ｂの名のリストから１単語を読み出し（Ｓ３８）、ステップＳ３７で抽出した２音節が、名のリストから読み出した単語（名）の先頭の２文字に一致するか否かを判断する（Ｓ３９）。抽出した２音節が名のリストから読み出した単語の先頭の２文字に一致すると判断した場合（Ｓ３９：ＹＥＳ）、即ち、ステップＳ３７で抽出した２音節を先頭に有する名が人名辞書４ｂの名のリストに登録されている場合、制御部１は、ステップＳ１１で抽出した未知語は省略語であると判定し（Ｓ４０）、ステップＳ２１へ処理を移行する。

ステップＳ３７で抽出した２音節が名のリストから読み出した単語の先頭の２文字に一致しないと判断した場合（Ｓ３９：ＮＯ）、制御部１は、名のリストから全ての単語の読み出しが終了したか否かを判断し（Ｓ４１）、全ての単語の読み出しが終了していないと判断した場合（Ｓ４１：ＮＯ）、ステップＳ３８へ処理を戻し、人名辞書４ｂの名のリストから１単語を読み出し（Ｓ３８）、ステップＳ３７で抽出した２音節が名のリストから読み出した単語の先頭の２文字に一致するか否かの判断を繰り返す。なお、名のリストから全ての単語の読み出しが終了したと判断した場合（Ｓ４１：ＹＥＳ）、即ち、ステップＳ３７で抽出した２音節を先頭に有する名が人名辞書４ｂの名のリストに登録されていない場合、制御部１は、ステップＳ４２へ処理を移行する。

制御部１は、ステップＳ１１で抽出した未知語から先頭の２音節を抽出し（Ｓ４２）、複合語辞書４ｃの構成語の欄に最初の構成語として登録されている構成語を１つ読み出す（Ｓ４３）。制御部１は、ステップＳ４２で抽出した２音節が、複合語辞書４ｃから読み出した構成語の先頭の２文字に一致するか否かを判断し（Ｓ４４）、一致しないと判断した場合（Ｓ４４：ＮＯ）、複合語辞書４ｃから最初の構成語の全ての読み出しが終了したか否かを判断する（Ｓ４５）。

複合語辞書４ｃから最初の構成語の全ての読み出しが終了していないと判断した場合（Ｓ４５：ＮＯ）、制御部１は、ステップＳ４３へ処理を戻し、複合語辞書４ｃの構成語の欄に最初の構成語として登録されている構成語を１つ読み出し（Ｓ４３）、ステップＳ４２で抽出した２音節が複合語辞書４ｃから読み出した構成語の先頭の２文字に一致するか否かの判断を繰り返す。なお、複合語辞書４ｃから最初の構成語の全ての読み出しが終了したと判断した場合（Ｓ４５：ＹＥＳ）、即ち、ステップＳ４２で抽出した２音節を先頭に有する最初の構成語が複合語辞書４ｃに登録されていない場合、制御部１は、ステップＳ１１で抽出した未知語は省略語でないと判定し（Ｓ５０）、ステップＳ２１へ処理を移行する。

ステップＳ４２で抽出した２音節が複合語辞書４ｃから読み出した構成語の先頭の２文字に一致すると判断した場合（Ｓ４４：ＹＥＳ）、即ち、ステップＳ４２で抽出した２音節を先頭に有する最初の構成語が複合語辞書４ｃに登録されている場合、制御部１は、ステップＳ１１で抽出した未知語の後方の２音節を抽出する（Ｓ４６）。制御部１は、ステップＳ４３で読み出した最初の構成語を含む複合語の２番目の構成語を複合語辞書４ｃから読み出し（Ｓ４７）、ステップＳ４６で抽出した２音節が、複合語辞書４ｃから読み出した２番目の構成語の先頭の２文字に一致するか否かを判断する（Ｓ４８）。

制御部１は、抽出した２音節が複合語辞書４ｃから読み出した２番目の構成語の先頭の２文字に一致すると判断した場合（Ｓ４８：ＹＥＳ）、ステップＳ１１で抽出した未知語は省略語であると判定し（Ｓ４９）、ステップＳ２１へ処理を移行する。また、制御部１は、抽出した２音節が複合語辞書４ｃから読み出した２番目の構成語の先頭の２文字に一致しないと判断した場合（Ｓ４８：ＮＯ）、ステップＳ１１で抽出した未知語は省略語でないと判定し（Ｓ５０）、ステップＳ２１へ処理を移行する。

上述したように、本実施形態１のテキスト解析装置１０では、言語辞書４ａに基づいてアクセント型を付与できなかった形態素（未知語）に対して省略語判定処理を行なうことにより、人名を省略した省略語であるか複合語を省略した省略語であるかを判定することができる。また、省略語であると判定された未知語には所定のアクセント型（平板型のアクセント型）を付与し、省略語であると判定されなかった未知語には、例えば後ろから３モーラ目にアクセント核を有するアクセント型を付与することにより、省略語であると判定された未知語と、省略語でないと判定された未知語とにそれぞれ異なるアクセント型を付与することができるので、それぞれに適したアクセント型を付与することができる。

上述した実施形態１では、各未知語が、人名における姓の先頭の１音節と名の先頭の２音節とを組み合わせた省略語、人名における姓の先頭の２音節と名の先頭の２音節とを組み合わせた省略語、複合語を構成する最初の構成語の先頭の１音節と２番目の構成語の先頭の２音節とを組み合わせた省略語、複合語を構成する最初の構成語の先頭の２音節と２番目の構成語の先頭の２音節とを組み合わせた省略語のいずれかであるか否かを判定する構成であった。しかし、省略語を構成する文字数はこれらに限られず、また、操作部５を介してユーザからの設定によって、任意の文字数に変更可能とすることもできる。

上述した構成により、本実施形態１のテキスト解析装置１０では、マツケン（松平健）、キムタク（木村拓也）、ナカショー（中川翔子）、コスプレ（コスチュームプレイ）、連ドラ（連続ドラマ）、筋トレ（筋肉トレーニング）、地デジ（地上デジタル放送）等の省略語がテキストデータに含まれている場合に、各単語を省略語であると適切に判定することができる。

（実施形態２）
以下に、本発明に係る省略語判定装置を備えた本発明に係るテキスト解析装置を、実施形態２を示す図面に基づいて詳述する。なお、本実施形態２のテキスト解析装置は、上述した実施形態１のテキスト解析装置１０と同様の構成によって実現することができるので、同様の構成については同一の符号を付して説明を省略する。

図１２は実施形態２のテキスト解析装置１０の機能構成例を示す機能ブロック図である。本実施形態２のテキスト解析装置１０において、制御部１は、ＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムを実行することにより、上述した実施形態１のテキスト解析装置１０と同様に、形態素解析部１１、省略語判定部１２及び省略語アクセント付与部１３等の各機能を実現する。

なお、本実施形態２のテキスト解析装置１０のＨＤＤ４には、図１３に示すような共起辞書４ｄが格納されている。図１３は共起辞書４ｄの登録内容を示す模式図である。図１３に示すように、共起辞書（共起データ記憶手段）４ｄには、単語（テキストデータ）の読み及び各単語と共起される共起単語（共起データ）がそれぞれ対応付けて登録されている。

以下に、上述した構成の本実施形態２のテキスト解析装置１０によるテキスト解析処理について説明する。以下では、テキスト解析装置１０が「マツケンが、サンバを踊った。」のテキストデータを解析する処理を例に説明する。
本実施形態２の形態素解析部１１は、上述した実施形態１の形態素解析部１１と同様に、ＨＤＤ４に記憶してあるテキストデータ（文書データ）をＨＤＤ４からＲＡＭ３に読み出し、言語辞書（テキスト記憶手段）４ａの登録内容に基づいて、ＲＡＭ３に読み出したテキストデータ（文書データ）を形態素（テキストデータ）に分割すると共に、分割した形態素のそれぞれにアクセント型を付与する。具体的には、形態素解析部１１は、実施形態１で説明したように、「マツケン（未知語）・ガ（１モーラ０型）・サンバ（３モーラ１型）・オ（１モーラ０型）・オドッタ（４モーラ０型）」の表音文字列を生成して省略語判定部１２へ送出する。

本実施形態２の省略語判定部１２は、まず、上述した実施形態１の省略語判定部１２と同様の処理を行ない、人名辞書４ｂ又は複合語辞書４ｃの登録内容に基づいて、形態素解析部１１から送出されてきた表音文字列中の未知語（形態素）が、人名又は複合語を省略した省略語の候補であるか否かを判定する。ここでは、実施形態１で説明した通り、未知語「マツケン」が省略語の候補であると判定される。なお、本実施形態２の省略語判定部１２は、各未知語が省略語の候補であると判定した場合、この省略語に対する正式名称を、人名辞書４ｂ又は複合語辞書４ｃの登録内容に基づいて取得しておく。

具体的には、省略語判定部１２は、未知語の先頭の１音節（又は２音節）が、人名辞書４ｂの姓のリストに登録されているいずれかの姓の先頭の１文字（又は２文字）に一致する場合、若しくは、複合語辞書４ｃに登録されている最初の構成語のいずれかの先頭の１文字（又は２文字）に一致する場合、それぞれ一致する姓又は構成語を読み出してＲＡＭ３に記憶しておく。また、省略語判定部１２は、未知語の後方の２音節が、人名辞書４ｂの名のリストに登録されているいずれかの名の先頭の２文字に一致する場合、若しくは、複合語辞書４ｃに登録されている２番目の構成語の先頭の２文字に一致する場合、それぞれ一致する名又は構成語を読み出してＲＡＭ３に記憶しておく。これにより、省略語判定部１２は、省略語の候補であると判定した未知語に対する正式名称を取得することができる。なお、ここでは、省略語の候補「マツケン」の正式名称「マツダイラケン」が取得される。

次に、省略語判定部１２は、省略語の候補であると判定した未知語の正式名称に基づいて、この省略語に対する共起単語を共起辞書４ｄから取得する。ここでは、正式名称「マツダイラケン」に対する共起単語「サンバ」及び「暴れん坊将軍」が取得される。省略語判定部１２は、形態素解析部１１から送出されてきた表音文字列中に、共起辞書４ｄから取得した共起単語が含まれているか否かを判断し、含まれると判断した場合、省略語の候補であると判定していた未知語を省略語であると確定する。そして、省略語判定部１２は、「マツケン（省略語）・ガ（１モーラ０型）・サンバ（３モーラ１型）・オ（１モーラ０型）・オドッタ（４モーラ０型）」の表音文字列を省略語アクセント付与部１３へ送出する。

一方、形態素解析部１１から送出されてきた表音文字列中に、共起辞書４ｄから取得した共起単語が含まれていないと判断した場合、省略語判定部１２は、省略語の候補であると判定した未知語を省略語でないと確定し、例えば、「マツケン（未知語）・ガ（１モーラ０型）・サンバ（３モーラ１型）・オ（１モーラ０型）・オドッタ（４モーラ０型）」の表音文字列を省略語アクセント付与部１３へ送出する。

省略語アクセント付与部１３は、上述した実施形態１の省略語アクセント付与部１３と同様に、省略語判定部１２によって省略語であると判定された形態素に対して平板型（０型）のアクセント型を付与する。

上述したように、人名辞書４ｂ及び複合語辞書４ｃの登録内容に基づいて、省略語の候補であると判定された未知語について、当該未知語を含むテキストデータ（文書データ）中に、当該未知語と共起される共起単語が含まれない場合は、この未知語が、当該省略語ではない可能性が高いため、当該省略語ではないと確定する。これにより、省略語の誤判定を防止することができ、真に省略語に対してのみ所定のアクセント型を付与することができる。

以下に、本実施形態２のテキスト解析装置１０によるテキスト解析処理についてフローチャートに基づいて詳述する。図１４はテキスト解析処理の手順を示すフローチャートである。なお、以下の処理は、テキスト解析装置１０のＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムに従って制御部１によって実行される。

テキスト解析装置１０のユーザが操作部５を操作することによって１つのテキストデータに基づくテキスト解析の実行を指示した場合、制御部１は、ＨＤＤ４に記憶してあるテキストデータをＲＡＭ３に読み込む（Ｓ６１）。制御部１（形態素解析部１１）は、ＲＡＭ３に読み込んだテキストデータを、言語辞書４ａの登録内容に基づいて形態素に分割し、分割した形態素のそれぞれにアクセント型を付与し（Ｓ６２）、各形態素にアクセント型を対応付けた表音文字列を生成する。

制御部１（省略語判定部１２）は、人名辞書４ｂ及び複合語辞書４ｃの登録内容に基づいて省略語判定処理を実行し（Ｓ６３）、ステップＳ６２でアクセント型を付与できなかった形態素（未知語）が省略語の候補であるか否かを判定する。なお、本実施形態２の省略語判定処理は、実施形態１において図７乃至図１１に基づいて説明した処理と同様であるが、本実施形態２の制御部１（省略語判定部１２）は、各未知語が省略語の候補であると判定した場合、この省略語に対する正式名称を、人名辞書４ｂ又は複合語辞書４ｃの登録内容に基づいて取得する（Ｓ６４）。

制御部１は、ステップＳ６４で取得した正式名称に基づいて、この省略語に対する共起単語を共起辞書４ｄから取得し（Ｓ６５）、ステップＳ６２で生成した表音文字列中に、共起辞書４ｄから取得した共起単語が含まれるか否かを判断する（Ｓ６６）。共起単語が含まれると判断した場合（Ｓ６６：ＹＥＳ）、制御部１は、ステップＳ６３で省略語の候補であると判定した未知語を省略語であると確定する（Ｓ６７）。また、制御部１（省略語アクセント付与部１３）は、ステップＳ６７で省略語であると確定された形態素に対して平板型（０型）のアクセント型を付与し（Ｓ６８）、テキスト解析処理を終了する。

一方、ステップＳ６２で生成した表音文字列中に共起単語が含まれないと判断した場合（Ｓ６６：ＮＯ）、制御部１は、ステップＳ６３で省略語の候補であると判定した未知語を省略語でないと確定し（Ｓ６９）、テキスト解析処理を終了する。

上述したように、本実施形態２のテキスト解析装置１０では、人名辞書４ｂ及び複合語辞書４ｃの登録内容に基づいて省略語の候補であると判定された未知語を含むテキストデータ（文書データ）中に、当該省略語と共起される共起単語が含まれない場合は、この未知語が当該省略語ではない可能性が高いため、当該省略語ではないと確定する。従って、省略語の候補であると判定された未知語が、当該省略語であれば共起される可能性の高い共起単語と共に用いられていれば、この未知語を省略語であると確定し、共起単語と共に用いられていなければ、この未知語を省略語でないと確定する。

これにより、省略語の誤判定を防止することができ、真の省略語に対してのみ省略語であると判定することができる。よって、省略語であると確定された未知語には所定のアクセント型を付与し、省略語でないと確定され未知語には、例えば後ろから３モーラ目にアクセント核を有するアクセント型を付与することにより、真の省略語と、省略語でない未知語とにそれぞれ異なるアクセント型を付与することができるので、それぞれに適したアクセント型を付与することができる。

（実施形態３）
以下に、本発明に係る省略語判定装置を備えた本発明に係るテキスト解析装置を、実施形態３を示す図面に基づいて詳述する。なお、本実施形態３のテキスト解析装置は、上述した実施形態１のテキスト解析装置１０と同様の構成によって実現することができるので、同様の構成については同一の符号を付して説明を省略する。

上述した実施形態１のテキスト解析装置１０において、制御部１（省略語アクセント付与部１３）は、人名辞書４ｂ及び複合語辞書４ｃの登録内容に基づいて省略語であると判定した未知語に対して平板型のアクセント型を付与するように構成されていた。

本実施形態３のテキスト解析装置１０では、各省略語に対するアクセント型を登録してある例外省略語辞書４ｅがＨＤＤ４に予め格納されており、制御部１（省略語アクセント付与部１３）は、人名辞書４ｂ及び複合語辞書４ｃの登録内容に基づいて省略語であると判定した未知語（省略語）において、例外省略語辞書４ｅに登録されている省略語には例外省略語辞書４ｅに登録されているアクセント型を付与し、例外省略語辞書４ｅに登録されていない省略語には平板型のアクセント型を付与するように構成されている。

図１５は実施形態３のテキスト解析装置１０の機能構成例を示す機能ブロック図である。本実施形態３のテキスト解析装置１０において、制御部１は、ＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムを実行することにより、上述した実施形態１のテキスト解析装置１０と同様に、形態素解析部１１、省略語判定部１２及び省略語アクセント付与部１３等の各機能を実現する。

なお、本実施形態３のテキスト解析装置１０のＨＤＤ４には、図１６に示すような例外省略語辞書４ｅが格納されている。図１６は例外省略語辞書４ｅの登録内容を示す模式図である。図１６に示すように、例外省略語辞書（省略語記憶手段）４ｅには、省略語及び各省略語のアクセント型がそれぞれ対応付けて登録されている。

以下に、上述した構成の本実施形態３のテキスト解析装置１０によるテキスト解析処理について説明する。以下では、テキスト解析装置１０が「ナカショーが、コスプレをした。」のテキストデータを解析する処理を例に説明する。
本実施形態３の形態素解析部１１は、上述した実施形態１の形態素解析部１１と同様に、ＨＤＤ４に記憶してあるテキストデータをＨＤＤ４からＲＡＭ３に読み出し、言語辞書４ａの登録内容に基づいて、ＲＡＭ３に読み出したテキストデータを形態素に分割すると共に、分割した形態素のそれぞれにアクセント型を付与する。ここでは、形態素解析部１１は、「ナカショー（未知語）・ガ（１モーラ０型）・コスプレ（未知語）・オ（１モーラ０型）・シタ（２モーラ０型）」の表音文字列を生成する。

本実施形態３の省略語判定部１２は、上述した実施形態１の省略語判定部１２と同様に、人名辞書４ｂ及び複合語辞書４ｃの登録内容に基づいて、形態素解析部１１によって生成された表音文字列中の未知語が省略語であるか否かを判定する。省略語判定部１２は、省略語であると判定した未知語に対しては省略語であることを示す情報を対応付け、省略語でないと判定した未知語に対しては未知語であることを示す情報を対応付けた表音文字列を生成する。ここでは、省略語判定部１２は、「ナカショー（省略語）・ガ（１モーラ０型）・コスプレ（省略語）・オ（１モーラ０型）・シタ（２モーラ０型）」の表音文字列を生成する。

本実施形態３の省略語アクセント付与部１３は、省略語判定部１２によって生成された表音文字列中の省略語を抽出し、抽出した省略語が例外省略語辞書４ｅに登録されているか否かを判断する。抽出した省略語が例外省略語辞書４ｅに登録されている場合、省略語アクセント付与部１３は、抽出した省略語に対応するアクセント型を例外省略語辞書４ｅから読み出し、抽出した省略語に対して付与する。一方、抽出した省略語が例外省略語辞書４ｅに登録されていない場合、省略語アクセント付与部１３は、抽出した省略語に対して平板型（０型）のアクセント型を付与する。

ここでは、省略語「ナカショー」は例外省略語辞書４ｅに登録されているので、省略語「ナカショー」には、そのアクセント型「４モーラ２型」を付与し、省略語「コスプレ」は例外省略語辞書４ｅに登録されていないので、省略語「コスプレ」には平板型のアクセント型を付与する。即ち、ここでは、省略語アクセント付与部１３は、「ナカショー（４モーラ２型）・ガ（１モーラ０型）・コスプレ（４モーラ０型）・オ（１モーラ０型）・シタ（２モーラ０型）」の表音文字列を生成する。

なお、省略語アクセント付与部１３は、上述した処理を、省略語判定部１２によって生成された表音文字列中の全ての省略語に対して実行することにより、例外省略語辞書４ｅに登録されている省略語に対しては予め登録しておいたアクセント型を付与することができる。これにより、省略語「ナカショー」のように平板型のアクセント型でない省略語に対してはより適切なアクセント型を付与することができる。

以下に、本実施形態３のテキスト解析装置１０によるテキスト解析処理についてフローチャートに基づいて詳述する。図１７はテキスト解析処理の手順を示すフローチャートである。なお、以下の処理は、テキスト解析装置１０のＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムに従って制御部１によって実行される。

テキスト解析装置１０のユーザが操作部５を操作することによって１つのテキストデータに基づくテキスト解析の実行を指示した場合、制御部１は、ＨＤＤ４に記憶してあるテキストデータをＲＡＭ３に読み込む（Ｓ７１）。制御部１（形態素解析部１１）は、ＲＡＭ３に読み込んだテキストデータを、言語辞書４ａの登録内容に基づいて形態素に分割し、分割した形態素のそれぞれにアクセント型を付与し（Ｓ７２）、各形態素にアクセント型を対応付けた表音文字列を生成する。

制御部１（省略語判定部１２）は、人名辞書４ｂ及び複合語辞書４ｃの登録内容に基づいて省略語判定処理を実行し（Ｓ７３）、ステップＳ７２でアクセント型を付与できなかった形態素（未知語）が省略語の候補であるか否かを判定する。なお、本実施形態３の省略語判定処理は、実施形態１において図７乃至図１１に基づいて説明した処理と同様である。

制御部１（省略語アクセント付与部１３）は、ステップＳ７３で生成した表音文字列から省略語を抽出し（Ｓ７４）、抽出した省略語が例外省略語辞書４ｅに登録されているか否かを判断する（Ｓ７５）。抽出した省略語が例外省略語辞書４ｅに登録されていると判断した場合（Ｓ７５：ＹＥＳ）、制御部１は、抽出した省略語に対応するアクセント型を例外省略語辞書４ｅから読み出し、抽出した省略語に対して付与する（Ｓ７６）。

抽出した省略語が例外省略語辞書４ｅに登録されていないと判断した場合（Ｓ７５：ＮＯ）、制御部１は、抽出した省略語に対して平板型（０型）のアクセント型を付与する（Ｓ７７）。制御部１は、ステップＳ７３で生成した表音文字列中の全ての省略語に対して上述した処理が終了したか否かを判断しており（Ｓ７８）、終了していないと判断した場合（Ｓ７８：ＮＯ）、ステップＳ７４へ処理を戻し、表音文字列から省略語を抽出し（Ｓ７４）、抽出した省略語が例外省略語辞書４ｅに登録されているか否かの判断を繰り返す。表音文字列中の全ての省略語に対する処理が終了したと判断した場合（Ｓ７８：ＹＥＳ）、制御部１は、上述したテキスト解析処理を終了する。

上述したように、本実施形態３のテキスト解析装置１０では、人名辞書４ｂ及び複合語辞書４ｃの登録内容に基づいて省略語であると判定された未知語に対するアクセント型が例外省略語辞書４ｅに登録されている場合、このアクセント型を省略語に付与することにより、平板型でないアクセント型の省略語に対して適切なアクセント型を付与することができる。また、人名辞書４ｂ及び複合語辞書４ｃの登録内容に基づいて省略語であると判定された未知語に対するアクセント型が例外省略語辞書４ｅに登録されていない場合であっても、この省略語に平板型のアクセント型を付与することにより、省略語ではない未知語とは異なるアクセント型を付与することができる。従って、各省略語により適切に付与されたアクセント型に基づいて、各省略語に対応する韻律を生成し、生成した韻律に基づいて合成音声を生成した場合、適切な韻律を生成することができ、また、適切な韻律に基づいて適切な合成音声を生成することができる。

上述した本実施形態３は、実施形態１のテキスト解析装置１０において、制御部１（省略語アクセント付与部１３）が、例外省略語辞書４ｅに登録されている省略語に対しては、対応するアクセント型を付与し、例外省略語辞書４ｅに登録されていない省略語に対しては、平板型のアクセント型を付与する構成であり、実施形態１の変形例として説明した。しかし、実施形態２のテキスト解析装置１０においても同様の変形例を適用することができる。即ち、本実施形態３の構成を実施形態２のテキスト解析装置１０に適用した場合、人名辞書４ｂ及び複合語辞書４ｃだけでなく、共起辞書４ｄに基づいて省略語であると特定された各単語に対して適切なアクセント型を付与することができる。

（実施形態４）
以下に、本発明に係る音声合成装置を、実施形態４を示す図面に基づいて詳述する。なお、本実施形態４の音声合成装置は、上述した実施形態１のテキスト解析装置１０の構成を備えており、同様の構成については同一の符号を付して説明を省略する。図１８は実施形態４に係る音声合成装置の構成例を示すブロック図である。本実施形態４に係る音声合成装置１００は、図１に示した制御部１、ＲＯＭ２、ＲＡＭ３、ＨＤＤ４、操作部５、表示部６のほかに、音声出力部７を備えており、これらのハードウェア各部はそれぞれバス１ａを介して相互に接続されている。

音声出力部７は、音声増幅回路及びスピーカ等を備えており、例えばＨＤＤ４に記憶された音声情報（音声波形）に基づく音声を出力する。
ＨＤＤ４には、テキストデータ、図２に示すような言語辞書４ａ、図３に示すような人名辞書４ｂ、図４に示すような複合語辞書４ｃ、ユーザに対して各種の情報を通知するための画面情報のほかに、音声合成装置１００を本発明の音声合成装置として動作させるために必要な種々の制御プログラム、韻律生成ルール辞書４ｆ、波形辞書４ｇ等が予め記憶されている。

なお、韻律生成ルール辞書４ｆ及び波形辞書４ｇの詳細については図示しないが、韻律生成ルール辞書４ｆには、各形態素の読み及びアクセント型に基づいて韻律データを生成する際のルールが登録されており、波形辞書４ｇには、複数の音素（音素列）からなる文章に対応して各音声の波形群が登録されている。

以下に、上述した構成の音声合成装置１００において、制御部１がＲＯＭ２及びＨＤＤ４に記憶してある制御プログラムを実行することによって実現される各種の機能について説明する。図１９は実施形態４の音声合成装置１００の機能構成例を示す機能ブロック図である。本実施形態４の音声合成装置１００において、制御部１は、ＲＯＭ２及びＨＤＤ４に記憶してある制御プログラムを実行することによって、上述した実施形態１のテキスト解析装置１０、韻律生成部２０、波形生成部３０等の各機能を実現する。

韻律生成部２０は、テキスト解析装置１０によって生成された表音文字列に対応する韻律データを、韻律生成ルール辞書４ｆの登録内容に従って生成する。具体的には、韻律生成部２０は、テキスト解析装置１０から送出されてきた表音文字列において、各形態素の読み及びアクセント型に対応する韻律データを生成する。

波形生成部３０は、韻律生成部２０によって生成された韻律データを、波形辞書４ｇの登録内容に基づいて音声波形に変換して合成音声を生成する。具体的には、波形生成部３０は、韻律生成部２０から送出されてきた韻律データにおける各形態素に対応する音声波形を波形辞書４ｇから抽出し、抽出した音声波形と韻律データとに基づいて合成音声を生成する。なお、波形生成部３０が生成した合成音声は、一旦ＲＡＭ３又はＨＤＤ４に記憶された後、制御部１による制御に従った所定のタイミングで音声出力部７へ送出され、音声出力部７から音声出力される。

上述した構成により、本実施形態４の音声合成装置１００は、テキスト解析装置１０によってテキストデータを解析して表音文字列を生成し、生成した表音文字列に応じた合成音声を生成することができる。従って、上述した実施形態１のテキスト解析装置１０のように、言語辞書４ａに基づいて各形態素に適切なアクセント型を付与し、また、言語辞書４ａに登録されていない未知語については、省略語である場合には省略語に適したアクセント型（平板型のアクセント型）を付与することにより、各形態素のそれぞれに適切なアクセント型を付与した場合、このようなアクセント型に基づいて適切な合成音声を生成することができる。

以下に、本実施形態４の音声合成装置１００による合成音声の生成処理についてフローチャートに基づいて詳述する。図２０は合成音声の生成処理の手順を示すフローチャートである。なお、以下の処理は、音声合成装置１００のＲＯＭ２又はＨＤＤ４に記憶してある制御プログラムに従って制御部１によって実行される。

音声合成装置１００のユーザが操作部５を操作することによって１つのテキストデータに基づく合成音声の生成処理の実行を指示した場合、制御部１は、ＨＤＤ４に記憶してあるテキストデータをＲＡＭ３に読み込む（Ｓ８１）。制御部１（形態素解析部１１）は、ＲＡＭ３に読み込んだテキストデータを、言語辞書４ａの登録内容に基づいて形態素に分割し、分割した形態素のそれぞれにアクセント型を付与し（Ｓ８２）、各形態素にアクセント型を対応付けた表音文字列を生成する。

制御部１（省略語判定部１２）は、人名辞書４ｂ及び複合語辞書４ｃの登録内容に基づいて省略語判定処理を実行し（Ｓ８３）、ステップＳ８２でアクセント型を付与できなかった形態素（未知語）が省略語であるか否かを判定する。なお、本実施形態４の省略語判定処理は、実施形態１において図７乃至図１１に基づいて説明した処理と同様である。

制御部１（省略語アクセント付与部１３）は、ステップＳ８３で省略語であると判定された形態素に対して平板型（０型）のアクセント型を付与する（Ｓ８４）。制御部１（韻律生成部２０）は、得られた表音文字列に対応する韻律データを、韻律生成ルール辞書４ｆの登録内容に基づいて生成する（Ｓ８５）。制御部１(波形生成部３０)は、生成した韻律データを、波形辞書４ｇの登録内容に基づいて音声波形を生成し（Ｓ８６）、合成音声（音声波形）の生成処理を終了する。

上述したように、本実施形態４の音声合成装置１００では、実施形態１で説明したように、言語辞書４ａに基づいてアクセント型を付与できなかった形態素（未知語）が省略語であるか否かを判定し、省略語であるか否かに応じて適切なアクセント型を各未知語に付与することにより、適切に付与されたアクセント型に基づいて適切な韻律を生成することができ、また、適切な韻律に基づいて適切な合成音声を生成することができる。従って、言語辞書４ａに登録されていない未知語に対しても正しいアクセント、イントネーションでの合成音声を生成することができる。

上述した本実施形態４では、実施形態１のテキスト解析装置１０を備えた音声合成装置１００を例に本発明を説明したが、本発明の音声合成装置は、上述した実施形態２，３のテキスト解析装置１０を備えた構成とすることもできる。なお、上述した実施形態３のテキスト解析装置１０を備えた構成とした場合、音声合成装置１００は、省略語判定処理によって省略語であると判定された未知語で、例外省略語辞書４ｅに登録されている省略語には予め登録しておいたアクセント型を付与することができるので、平板型のアクセント型でない省略語に対してより適切なアクセント型を付与することができ、このようなアクセント型に基づいてより適切な合成音声を生成することができる。

上述したように、本発明に係る省略語判定装置は、言語辞書４ａに登録されていない形態素（未知語）が、人名を省略した省略語である場合、又は複合語を省略した省略語である場合、このような省略語には平板型のアクセント型を付与し、それ以外の未知語には従来から行なっているように、例えば後ろから３モーラ目にアクセント核を有するアクセント型を付与することにより、省略語と、省略語ではない未知語とにおいてそれぞれ異なるアクセント型を付与することができる。

なお、人名を省略した省略語及び複合語を省略した省略語は、平板型のアクセント型を有する場合が多いので、このような省略語には平板型のアクセント型を付与することにより、このような省略語を含む文書であっても、適切なアクセントでの合成音声を生成することができ、このような合成音声に基づいて、より自然な音声の出力が可能となる。また、本発明は、日々出現する新しい省略語を辞書に登録しておく構成ではなく、人名辞書４ｂ及び複合語辞書４ｃの登録内容に基づいて省略語であるか否かを判断する構成であるので、省略語を辞書に登録する作業を行なうことなく、文書中の省略語を適切に判定し、省略語に対して適切なアクセント型を付与することができる。

（付記１）
テキストデータが省略語であるか否かを判定する省略語判定装置において、
人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段と、
前記テキストデータから先頭の所定数の文字データを抽出する第１抽出手段と、
該第１抽出手段が抽出した文字データを先頭に有する姓が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第１抽出手段が抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出する第２抽出手段と、
該第２抽出手段が抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定する判定手段と
を備えることを特徴とする省略語判定装置。

（付記２）
テキストデータが省略語であるか否かを判定する省略語判定装置において、
複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段と、
前記テキストデータから先頭の所定数の文字データを抽出する第１抽出手段と、
該第１抽出手段が抽出した文字データを先頭に有する構成語を含む複合語が前記複合語記憶手段に記憶してあるか否かを判断する判断手段と、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第１抽出手段が抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出する第２抽出手段と、
該第２抽出手段が抽出した文字データを先頭に有する構成語が、前記判断手段が前記複合語記憶手段に記憶してあると判断した複合語の構成語に含まれているか否かを判断する手段と、
前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定する判定手段と
を備えることを特徴とする省略語判定装置。

（付記３）
前記第１抽出手段は、前記テキストデータの先頭から、２音節に相当する数の文字データを抽出するように構成されており、
前記第２抽出手段は、前記第１抽出手段が抽出した文字データを除いた前記テキストデータの先頭から、２音節に相当する数の文字データを抽出するように構成されていることを特徴とする付記１又は２に記載の省略語判定装置。

（付記４）
前記第１抽出手段は、前記テキストデータの先頭から、１音節に相当する数の文字データを抽出するように構成されており、
前記第２抽出手段は、前記第１抽出手段が抽出した文字データを除いた前記テキストデータの先頭から、２音節に相当する数の文字データを抽出するように構成されていることを特徴とする付記１又は２に記載の省略語判定装置。

（付記５）
複数のテキストデータを含む文書データをテキストデータに分割する分割手段を備え、
前記第１抽出手段は、分割されたテキストデータのそれぞれから先頭の所定数の文字データを抽出するように構成されており、
前記第２抽出手段は、前記第１抽出手段が抽出した文字データを除いた前記分割されたテキストデータのそれぞれから、先頭の所定数の文字データを抽出するように構成されており、
前記判定手段は、前記分割されたテキストデータのそれぞれが省略語の候補であるか否かを判定するように構成されており、
複数のテキストデータ及び各テキストデータと共起される共起データを対応付けて記憶する共起データ記憶手段と、
前記判定手段が省略語の候補であると判定したテキストデータに対応する共起データを前記共起データ記憶手段から取得する手段と、
前記文書データ中のテキストデータに、前記共起データ記憶手段から取得された共起データが含まれているか否かを判断する手段と、
前記共起データが含まれていると判断した場合、前記判定手段が省略語の候補であると判定したテキストデータを省略語であると確定する手段と
を備えることを特徴とする付記１乃至４のいずれかひとつに記載の省略語判定装置。

（付記６）
テキストデータが省略語であるか否かを判定する省略語判定方法において、
前記テキストデータから先頭の所定数の文字データを抽出する第１抽出ステップと、
該第１抽出ステップで抽出した文字データを先頭に有する姓が、人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段に記憶してあるか否かを判断するステップと、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第１抽出ステップで抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出する第２抽出ステップと、
該第２抽出ステップで抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断するステップと、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定するステップと
を含むことを特徴とする省略語判定方法。

（付記７）
テキストデータが省略語であるか否かを判定する省略語判定方法において、
前記テキストデータから先頭の所定数の文字データを抽出する第１抽出ステップと、
該第１抽出ステップで抽出した文字データを先頭に有する構成語を含む複合語が、複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段に記憶してあるか否かを判断する判断ステップと、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第１抽出ステップで抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出する第２抽出ステップと、
該第２抽出ステップで抽出した文字データを先頭に有する構成語が、前記判断ステップで前記複合語記憶手段に記憶してあると判断された複合語の構成語に含まれているか否かを判断するステップと、
前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定するステップと
を含むことを特徴とする省略語判定方法。

（付記８）
コンピュータに、テキストデータが省略語であるか否かを判定させるためのコンピュータプログラムにおいて、
人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段を備えたコンピュータに、
前記テキストデータから先頭の所定数の文字データを抽出する第１抽出ステップと、
該第１抽出ステップで抽出した文字データを先頭に有する姓が前記人名記憶手段に記憶してあるか否かを判断するステップと、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第１抽出ステップで抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出する第２抽出ステップと、
該第２抽出ステップで抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断するステップと、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定するステップと
を実行させるためのコンピュータプログラム。

（付記９）
コンピュータに、テキストデータが省略語であるか否かを判定させるためのコンピュータプログラムにおいて、
複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段を備えたコンピュータに、
前記テキストデータから先頭の所定数の文字データを抽出する第１抽出ステップと、
該第１抽出ステップで抽出した文字データを先頭に有する構成語を含む複合語が前記複合語記憶手段に記憶してあるか否かを判断する判断ステップと、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第１抽出ステップで抽出した文字データを除いた前記テキストデータから、先頭の所定数の文字データを抽出する第２抽出ステップと、
該第２抽出ステップで抽出した文字データを先頭に有する構成語が、前記判断ステップで前記複合語記憶手段に記憶してあると判断された複合語の構成語に含まれているか否かを判断するステップと、
前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定するステップと
を実行させるためのコンピュータプログラム。

（付記１０）
テキストデータを解析するテキスト解析装置において、
付記１乃至４のいずれかひとつに記載の省略語判定装置と、
形態素及びアクセント型を対応付けて記憶する形態素記憶手段と、
該形態素記憶手段の記憶内容に基づいて、テキストデータを形態素に分割する形態素分割手段と、
前記形態素記憶手段の記憶内容に基づいて、前記形態素分割手段が分割した形態素のそれぞれにアクセント型を付与する手段とを備え、
前記省略語判定装置は、前記形態素記憶手段に記憶されていない形態素が省略語であるか否かを判定するように構成されており、
前記省略語判定装置によって省略語であると判定された形態素に所定のアクセント型を付与するアクセント付与手段を備えることを特徴とするテキスト解析装置。

（付記１１）
省略語及びアクセント型を対応付けて記憶する省略語記憶手段を備え、
前記アクセント付与手段は、
前記省略語記憶手段の記憶内容に基づいて、前記省略語判定装置によって省略語であると判定された形態素のそれぞれにアクセント型を付与する手段と、
前記省略語記憶手段に記憶されていない形態素に所定のアクセント型を付与する手段とを備えることを特徴とする付記１０に記載のテキスト解析装置。

（付記１２）
テキストデータを解析するテキスト解析装置において、
付記５に記載の省略語判定装置と、
テキストデータ及びアクセント型を対応付けて記憶するテキスト記憶手段とを備え、
前記省略語判定装置の分割手段は、前記テキスト記憶手段の記憶内容に基づいて、文書データをテキストデータに分割するように構成されており、
前記テキスト記憶手段の記憶内容に基づいて、前記分割手段が分割したテキストデータのそれぞれにアクセント型を付与する手段を備え、
前記省略語判定装置は、前記テキスト記憶手段に記憶されていないテキストデータが省略語であるか否かを判定するように構成されており、
前記省略語判定装置によって省略語であると判定されたテキストデータに所定のアクセント型を付与する手段を備えることを特徴とするテキスト解析装置。

（付記１３）
省略語及びアクセント型を対応付けて記憶する省略語記憶手段を備え、
前記アクセント付与手段は、
前記省略語記憶手段の記憶内容に基づいて、前記省略語判定装置によって省略語であると判定されたテキストデータのそれぞれにアクセント型を付与する手段と、
前記省略語記憶手段に記憶されていないテキストデータに所定のアクセント型を付与する手段とを備えることを特徴とする付記１２に記載のテキスト解析装置。

（付記１４）
テキストデータから合成音声を生成する音声合成装置において、
付記１０又は１１に記載のテキスト解析装置と、
該テキスト解析装置の形態素分割手段が分割した形態素及び各形態素に付与されたアクセント型に基づいて、各形態素に対応する韻律を生成する韻律生成手段と、
該韻律生成手段が生成した韻律に基づいて合成音声を生成する波形生成手段と
を備えることを特徴とする音声合成装置。

（付記１５）
テキストデータから合成音声を生成する音声合成装置において、
付記１２又は１３に記載のテキスト解析装置と、
前記省略語判定装置の分割手段が分割したテキストデータ及び前記テキスト解析装置が各テキストデータに付与したアクセント型に基づいて、各テキストデータに対応する韻律を生成する韻律生成手段と、
該韻律生成手段が生成した韻律に基づいて合成音声を生成する波形生成手段と
を備えることを特徴とする音声合成装置。

実施形態１に係るテキスト解析装置の構成例を示すブロック図である。言語辞書の登録内容を示す模式図である。人名辞書の登録内容を示す模式図である。複合語辞書の登録内容を示す模式図である。テキスト解析装置の機能構成例を示す機能ブロック図である。テキスト解析処理の手順を示すフローチャートである。省略語判定処理の手順を示すフローチャートである。省略語判定処理の手順を示すフローチャートである。省略語判定処理の手順を示すフローチャートである。省略語判定処理の手順を示すフローチャートである。省略語判定処理の手順を示すフローチャートである。実施形態２のテキスト解析装置の機能構成例を示す機能ブロック図である。共起辞書の登録内容を示す模式図である。テキスト解析処理の手順を示すフローチャートである。実施形態３のテキスト解析装置の機能構成例を示す機能ブロック図である。例外省略語辞書の登録内容を示す模式図である。テキスト解析処理の手順を示すフローチャートである。実施形態４に係る音声合成装置の構成例を示すブロック図である。実施形態４の音声合成装置の機能構成例を示す機能ブロック図である。合成音声の生成処理の手順を示すフローチャートである。

符号の説明

１０テキスト解析装置
１制御部
１１形態素解析部（形態素分割手段）
１２省略語判定部（第１抽出手段、第２抽出手段、判定手段、判断手段）
１３省略語アクセント付与部（アクセント付与手段）
４ａ言語辞書（形態素記憶手段）
４ｂ人名辞書（人名記憶手段）
４ｃ複合語辞書（複合語記憶手段）
４ｄ共起辞書（共起データ記憶手段）
４ｅ例外省略語辞書（省略語記憶手段）
２０韻律生成部（韻律生成手段）
３０波形生成部（波形生成手段）

Claims

テキストデータを解析するテキスト解析装置において、
人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段と、
複数のテキストデータ及び各テキストデータと共起される共起データを対応付けて記憶する共起データ記憶手段と、
テキストデータ及びアクセント型を対応付けて記憶するテキスト記憶手段と、
該テキスト記憶手段の記憶内容に基づいて、複数のテキストデータを含む文書データをテキストデータに分割する分割手段と、
前記テキスト記憶手段の記憶内容に基づいて、前記分割手段が分割したテキストデータのそれぞれにアクセント型を付与する手段と、
前記分割手段にて分割されたテキストデータのうちで、前記テキスト記憶手段に記憶されていないテキストデータのそれぞれから先頭の所定数の文字データを抽出する第１抽出手段と、
該第１抽出手段が抽出した文字データを先頭に有する姓が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第１抽出手段が抽出した文字データを除いた前記テキストデータのそれぞれから、先頭の所定数の文字データを抽出する第２抽出手段と、
該第２抽出手段が抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータのそれぞれが省略語の候補であると判定する判定手段と、
該判定手段が省略語の候補であると判定したテキストデータに対応する共起データを前記共起データ記憶手段から取得する手段と、
前記文書データ中のテキストデータに、前記共起データ記憶手段から取得された共起データが含まれているか否かを判断する手段と、
前記共起データが含まれていると判断した場合、前記判定手段が省略語の候補であると判定したテキストデータを省略語であると確定する手段と、
省略語であると確定されたテキストデータに所定のアクセント型を付与する手段と
を備えることを特徴とするテキスト解析装置。
テキストデータを解析するテキスト解析装置において、
複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段と、
複数のテキストデータ及び各テキストデータと共起される共起データを対応付けて記憶する共起データ記憶手段と、
テキストデータ及びアクセント型を対応付けて記憶するテキスト記憶手段と、
該テキスト記憶手段の記憶内容に基づいて、複数のテキストデータを含む文書データをテキストデータに分割する分割手段と、
前記テキスト記憶手段の記憶内容に基づいて、前記分割手段が分割したテキストデータのそれぞれにアクセント型を付与する手段と、
前記分割手段にて分割されたテキストデータのうちで、前記テキスト記憶手段に記憶されていないテキストデータのそれぞれから先頭の所定数の文字データを抽出する第１抽出手段と、
該第１抽出手段が抽出した文字データを先頭に有する構成語を含む複合語が前記複合語記憶手段に記憶してあるか否かを判断する判断手段と、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第１抽出手段が抽出した文字データを除いた前記テキストデータのそれぞれから、先頭の所定数の文字データを抽出する第２抽出手段と、
該第２抽出手段が抽出した文字データを先頭に有する構成語が、前記判断手段が前記複合語記憶手段に記憶してあると判断した複合語の構成語に含まれているか否かを判断する手段と、
前記構成語が含まれていると判断した場合、前記テキストデータのそれぞれが省略語の候補であると判定する判定手段と、
該判定手段が省略語の候補であると判定したテキストデータに対応する共起データを前記共起データ記憶手段から取得する手段と、
前記文書データ中のテキストデータに、前記共起データ記憶手段から取得された共起データが含まれているか否かを判断する手段と、
前記共起データが含まれていると判断した場合、前記判定手段が省略語の候補であると判定したテキストデータを省略語であると確定する手段と、
省略語であると確定されたテキストデータに所定のアクセント型を付与する手段と
を備えることを特徴とするテキスト解析装置。
テキストデータから合成音声を生成する音声合成装置において、
請求項１又は２に記載のテキスト解析装置と、
該テキスト解析装置の分割手段が分割したテキストデータ及び各テキストデータに付与されたアクセント型に基づいて、各テキストデータに対応する韻律を生成する韻律生成手段と、
該韻律生成手段が生成した韻律に基づいて合成音声を生成する波形生成手段と
を備えることを特徴とする音声合成装置。
テキストデータが省略語であるか否かを判定する省略語判定装置において、
人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段と、
前記テキストデータの先頭から、２音節に相当する数の文字データを抽出する第１抽出手段と、
該第１抽出手段が抽出した文字データを先頭に有する姓が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第１抽出手段が抽出した文字データを除いた前記テキストデータの先頭から、２音節に相当する数の文字データを抽出する第２抽出手段と、
該第２抽出手段が抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定する判定手段と
を備えることを特徴とする省略語判定装置。
テキストデータが省略語であるか否かを判定する省略語判定装置において、
人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段と、
前記テキストデータの先頭から、１音節に相当する数の文字データを抽出する第１抽出手段と、
該第１抽出手段が抽出した文字データを先頭に有する姓が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第１抽出手段が抽出した文字データを除いた前記テキストデータの先頭から、２音節に相当する数の文字データを抽出する第２抽出手段と、
該第２抽出手段が抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断する手段と、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定する判定手段と
を備えることを特徴とする省略語判定装置。
テキストデータが省略語であるか否かを判定する省略語判定装置において、
複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段と、
前記テキストデータの先頭から、２音節に相当する数の文字データを抽出する第１抽出手段と、
該第１抽出手段が抽出した文字データを先頭に有する構成語を含む複合語が前記複合語記憶手段に記憶してあるか否かを判断する判断手段と、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第１抽出手段が抽出した文字データを除いた前記テキストデータの先頭から、２音節に相当する数の文字データを抽出する第２抽出手段と、
該第２抽出手段が抽出した文字データを先頭に有する構成語が、前記判断手段が前記複合語記憶手段に記憶してあると判断した複合語の構成語に含まれているか否かを判断する手段と、
前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定する判定手段と
を備えることを特徴とする省略語判定装置。
テキストデータが省略語であるか否かを判定する省略語判定装置において、
複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段と、
前記テキストデータの先頭から、１音節に相当する数の文字データを抽出する第１抽出手段と、
該第１抽出手段が抽出した文字データを先頭に有する構成語を含む複合語が前記複合語記憶手段に記憶してあるか否かを判断する判断手段と、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第１抽出手段が抽出した文字データを除いた前記テキストデータの先頭から、２音節に相当する数の文字データを抽出する第２抽出手段と、
該第２抽出手段が抽出した文字データを先頭に有する構成語が、前記判断手段が前記複合語記憶手段に記憶してあると判断した複合語の構成語に含まれているか否かを判断する手段と、
前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定する判定手段と
を備えることを特徴とする省略語判定装置。
複数のテキストデータを含む文書データをテキストデータに分割する分割手段を備え、
前記第１抽出手段は、分割されたテキストデータのそれぞれから先頭の所定数の文字データを抽出するように構成されており、
前記第２抽出手段は、前記第１抽出手段が抽出した文字データを除いた前記分割されたテキストデータのそれぞれから、先頭の所定数の文字データを抽出するように構成されており、
前記判定手段は、前記分割されたテキストデータのそれぞれが省略語の候補であるか否かを判定するように構成されており、
複数のテキストデータ及び各テキストデータと共起される共起データを対応付けて記憶する共起データ記憶手段と、
前記判定手段が省略語の候補であると判定したテキストデータに対応する共起データを前記共起データ記憶手段から取得する手段と、
前記文書データ中のテキストデータに、前記共起データ記憶手段から取得された共起データが含まれているか否かを判断する手段と、
前記共起データが含まれていると判断した場合、前記判定手段が省略語の候補であると判定したテキストデータを省略語であると確定する手段と
を備えることを特徴とする請求項４から７までのいずれかひとつに記載の省略語判定装置。
コンピュータに、テキストデータが省略語であるか否かを判定させるためのコンピュータプログラムにおいて、
人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段を備えたコンピュータに、
前記テキストデータの先頭から、２音節に相当する数の文字データを抽出する第１抽出ステップと、
該第１抽出ステップで抽出した文字データを先頭に有する姓が前記人名記憶手段に記憶してあるか否かを判断するステップと、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第１抽出ステップで抽出した文字データを除いた前記テキストデータの先頭から、２音節に相当する数の文字データを抽出する第２抽出ステップと、
該第２抽出ステップで抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断するステップと、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定するステップと
を実行させるためのコンピュータプログラム。
コンピュータに、テキストデータが省略語であるか否かを判定させるためのコンピュータプログラムにおいて、
人名に用いられる姓及び名をそれぞれ記憶する人名記憶手段を備えたコンピュータに、
前記テキストデータの先頭から、１音節に相当する数の文字データを抽出する第１抽出ステップと、
該第１抽出ステップで抽出した文字データを先頭に有する姓が前記人名記憶手段に記憶してあるか否かを判断するステップと、
前記姓が前記人名記憶手段に記憶してあると判断した場合、前記第１抽出ステップで抽出した文字データを除いた前記テキストデータの先頭から、２音節に相当する数の文字データを抽出する第２抽出ステップと、
該第２抽出ステップで抽出した文字データを先頭に有する名が前記人名記憶手段に記憶してあるか否かを判断するステップと、
前記名が前記人名記憶手段に記憶してあると判断した場合、前記テキストデータが省略語であると判定するステップと
を実行させるためのコンピュータプログラム。
コンピュータに、テキストデータが省略語であるか否かを判定させるためのコンピュータプログラムにおいて、
複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段を備えたコンピュータに、
前記テキストデータの先頭から、２音節に相当する数の文字データを抽出する第１抽出ステップと、
該第１抽出ステップで抽出した文字データを先頭に有する構成語を含む複合語が前記複合語記憶手段に記憶してあるか否かを判断する判断ステップと、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第１抽出ステップで抽出した文字データを除いた前記テキストデータの先頭から、２音節に相当する数の文字データを抽出する第２抽出ステップと、
該第２抽出ステップで抽出した文字データを先頭に有する構成語が、前記判断ステップで前記複合語記憶手段に記憶してあると判断された複合語の構成語に含まれているか否かを判断するステップと、
前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定するステップと
を実行させるためのコンピュータプログラム。
コンピュータに、テキストデータが省略語であるか否かを判定させるためのコンピュータプログラムにおいて、
複数の複合語及び各複合語を構成する構成語を対応付けて記憶する複合語記憶手段を備えたコンピュータに、
前記テキストデータの先頭から、１音節に相当する数の文字データを抽出する第１抽出ステップと、
該第１抽出ステップで抽出した文字データを先頭に有する構成語を含む複合語が前記複合語記憶手段に記憶してあるか否かを判断する判断ステップと、
前記複合語が前記複合語記憶手段に記憶してあると判断した場合、前記第１抽出ステップで抽出した文字データを除いた前記テキストデータの先頭から、２音節に相当する数の文字データを抽出する第２抽出ステップと、
該第２抽出ステップで抽出した文字データを先頭に有する構成語が、前記判断ステップで前記複合語記憶手段に記憶してあると判断された複合語の構成語に含まれているか否かを判断するステップと、
前記構成語が含まれていると判断した場合、前記テキストデータが省略語であると判定するステップと
を実行させるためのコンピュータプログラム。
テキストデータを解析するテキスト解析装置において、
請求項４から７までのいずれかひとつに記載の省略語判定装置と、
形態素及びアクセント型を対応付けて記憶する形態素記憶手段と、
該形態素記憶手段の記憶内容に基づいて、テキストデータを形態素に分割する形態素分割手段と、
前記形態素記憶手段の記憶内容に基づいて、前記形態素分割手段が分割した形態素のそれぞれにアクセント型を付与する手段とを備え、
前記省略語判定装置は、前記形態素記憶手段に記憶されていない形態素が省略語であるか否かを判定するように構成されており、
前記省略語判定装置によって省略語であると判定された形態素に所定のアクセント型を付与するアクセント付与手段を備えることを特徴とするテキスト解析装置。
テキストデータを解析するテキスト解析装置において、
請求項８に記載の省略語判定装置と、
テキストデータ及びアクセント型を対応付けて記憶するテキスト記憶手段とを備え、
前記省略語判定装置の分割手段は、前記テキスト記憶手段の記憶内容に基づいて、文書データをテキストデータに分割するように構成されており、
前記テキスト記憶手段の記憶内容に基づいて、前記分割手段が分割したテキストデータのそれぞれにアクセント型を付与する手段を備え、
前記省略語判定装置は、前記テキスト記憶手段に記憶されていないテキストデータが省略語であるか否かを判定するように構成されており、
前記省略語判定装置によって省略語であると判定されたテキストデータに所定のアクセント型を付与する手段を備えることを特徴とするテキスト解析装置。
テキストデータから合成音声を生成する音声合成装置において、
請求項１３に記載のテキスト解析装置と、
該テキスト解析装置の形態素分割手段が分割した形態素及び各形態素に付与されたアクセント型に基づいて、各形態素に対応する韻律を生成する韻律生成手段と、
該韻律生成手段が生成した韻律に基づいて合成音声を生成する波形生成手段と
を備えることを特徴とする音声合成装置。