JPH08123459A - 自然言語処理方法および音声合成装置 - Google Patents

自然言語処理方法および音声合成装置

Info

Publication number
JPH08123459A
JPH08123459A JP6260809A JP26080994A JPH08123459A JP H08123459 A JPH08123459 A JP H08123459A JP 6260809 A JP6260809 A JP 6260809A JP 26080994 A JP26080994 A JP 26080994A JP H08123459 A JPH08123459 A JP H08123459A
Authority
JP
Japan
Prior art keywords
rule
morpheme
morphemes
pose
clause
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6260809A
Other languages
English (en)
Other versions
JP3446342B2 (ja
Inventor
Tetsuya Kagami
徹也 加賀美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP26080994A priority Critical patent/JP3446342B2/ja
Publication of JPH08123459A publication Critical patent/JPH08123459A/ja
Application granted granted Critical
Publication of JP3446342B2 publication Critical patent/JP3446342B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 入力されたテキストから生成される合成音に
対し、適切なポーズを設定することができるようにす
る。 【構成】 形態素解析部4において、入力文が形態素解
析され、結合処理部5において、その形態素解析結果か
ら、結合規則に基づいて複合語、文節、連文節が同定さ
れる。そして、ポーズ設定処理部6において、その同定
結果に対し、ポーズ設定規則が適用され、ポーズの位置
が設定される。結合規則は、形態素どうしを結合させる
結合条件と、その結合条件を満足する形態素どうしを結
合して得られる複合語、文節、または連文節に付加する
付加情報とを含み、ポーズ設定規則および結合条件は、
必要に応じて、付加情報を用いて記述されている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば日本語のテキス
トなどを自然言語処理し、その結果得られる情報に基づ
いて音声合成を行う場合などに用いて好適な自然言語処
理方法、並びに音声合成装置に関する。
【0002】
【従来の技術】従来の音声合成装置においては、例えば
漢字仮名混じり文を自然言語処理することにより、音韻
情報および韻律情報を求め、その音韻情報および韻律情
報に基づいて、入力された漢字仮名混じり文に対応する
音声の合成を行うようになされている。この場合、合成
音を人間の発話に近づけるために、通常は、韻律情報の
一つとして、漢字仮名混じり文に挿入するポーズを求め
るようになされている。
【0003】従来の音声合成装置では、ポーズは、例え
ば漢字仮名混じり文中の句読点の位置に設定されるよう
になされている。
【0004】
【発明が解決しようとする課題】従って、従来において
は、ポーズの挿入位置は、文法的な規則を充分考慮せず
に設定されていたため、得られる合成音が不自然なもの
になる課題があった。
【0005】そこで例えば、"日本語文章音声の合成の
ための韻律規則"(河井、広瀬、藤崎:日本音響学会誌,
Vol.50,No.6,pp.433-442,1994年)に記載されているよ
うに、係り受け関係に基づくポーズ設定方法も提案され
ている。しかしながら、この方法は、主として意味的な
情報を必要とし、このような意味的情報を自然言語処理
する汎用的技術は確立されていないため、限定されたテ
キストのみが自然言語処理が対象となり、限定のない汎
用的なテキストに対する自然言語処理を行うことが困難
であった。即ち、この方法では、合成音が自然に聴こえ
るように、全ての入力文にポーズ挿入位置を設定するこ
とが難しかった。
【0006】また、従来においては、挿入したポーズ間
の拍(仮名文字単位に相当するもの)の数(拍数)(モ
ーラ数)(仮名表記にほぼ相当する発音単位数)が多過
ぎる場合、文法的な情報を加味せずに拍の合計数の半分
の位置にポーズを再設定するなどの方法をとっていたた
め、ポーズ設定の位置が不自然になることがあった。
【0007】よって、従来では、合成音が聴きとりにく
くなったり、あるいはその内容を理解するのが困難にな
ったりする課題があった。
【0008】本発明は、このような状況に鑑みてなされ
たものであり、文中の適切な位置にポーズが設定できる
ようにし、これにより、例えば自然な合成音を得ること
ができるようにするものである。
【0009】
【課題を解決するための手段】本発明の自然言語処理方
法は、日本語でなる入力文を形態素解析し、入力文の形
態素解析結果から、複合語を構成する形態素間の文法的
な関係を規定する複合語規則に基づいて複合語を同定
し、複合語の同定結果から、文節を構成する形態素間の
文法的な関係を規定する文節規則に基づいて文節を同定
し、文節の同定結果から、連文節を構成する形態素間の
文法的な関係を規定する連文節規則に基づいて連文節を
同定し、その結果得られる入力文を構成する、1以上の
形態素からなる連文節に対し、統計的に求められた、文
中に挿入されるポーズの位置を規定するポーズ設定規則
を適用し、連文節間に挿入するポーズの位置を設定する
自然言語処理方法であって、複合語規則、文節規則、ま
たは連文節規則は、形態素どうしを結合させる結合条件
と、その結合条件を満足する形態素どうしを結合して得
られる複合語、文節、または連文節に付加する付加情報
とを含み、ポーズ設定規則および結合条件は、必要に応
じて、付加情報を用いて記述されていることを特徴とす
る。
【0010】この自然言語処理方法においては、連文節
規則が、連用修飾連文節を構成する形態素間の関係を規
定する連用修飾規則と、連体修飾連文節を構成する形態
素間の関係を規定する連体修飾規則とを含む場合、文節
の同定結果から、連用修飾規則または連体修飾規則に基
づいて、連用修飾連文節または連体修飾連文節をそれぞ
れ同定することができる。
【0011】また、形態素解析結果が、形態素文字列お
よび品詞情報を少なくとも含む場合、複合語規則、文節
規則、連文節規則、またはポーズ設定規則は、形態素解
析結果を用いて記述することができる。品詞情報には、
品詞の他、品詞を統合した上位分類、および品詞を細分
化した下位分類を含ませることができる。また、下位分
類には、活用形を少なくとも含ませることができる。
【0012】付加情報は、形態素の品詞を統合した上位
分類、または形態素の品詞を細分化した下位分類とする
ことができる。
【0013】複合語規則、文節規則、または連文節規則
に、結合した2つの形態素どうしを分離させる分離条件
が、さらに記述されている場合、分離条件にしたがっ
て、結合した形態素を分離することができる。
【0014】複数の形態素からなる複合語と、それと隣
接する形態素である隣接形態素との間に、複合語規則が
適用される場合、複合語を構成する複数の形態素のう
ち、隣接形態素と隣接する形態素と、隣接形態素との間
に、複合語規則を適用することができる。また、複数の
形態素からなる文節と、それと隣接する形態素である隣
接形態素との間に、文節規則が適用される場合、文節を
構成する複数の形態素のうち、隣接形態素と隣接する形
態素と、隣接形態素との間に、文節規則を適用すること
ができる。さらに、複数の形態素からなる連文節と、そ
れと隣接する形態素である隣接形態素との間に、連文節
規則またはポーズ設定規則が適用される場合、連文節を
構成する複数の形態素のうち、隣接形態素と隣接する形
態素と、隣接形態素との間に、連文節規則またはポーズ
設定規則を適用することができる。
【0015】また、ポーズ設定規則は、隣接する2つの
連文節における先の連文節を構成する形態素のうちの末
尾の形態素と、後の連文節を構成する形態素のうちの先
頭の形態素との間にポーズが挿入される頻度を、実際の
文章の朗読結果から統計的に求めて作成することができ
る。さらに、ポーズ設定規則が、末尾の形態素と先頭の
形態素との間にポーズを設定する設定条件が、その間に
ポーズを設定する優先順位を表す優先度が付されて記述
された優先度規則と、ポーズの設定位置を絞り込むため
の絞り込み条件が記述された絞り込み規則とを含む場
合、優先度規則に基づいて、ポーズを設定する位置の候
補を決定し、その候補の中から、絞り込み規則に基づい
て、ポーズを設定する最終的な位置を決定することがで
きる。
【0016】本発明の音声合成装置は、日本語でなる入
力文を自然言語処理することにより、その入力文に対応
する音韻情報および韻律情報を求める生成手段(例え
ば、図1に示す言語処理部1および韻律処理部8など)
と、音韻情報および韻律情報に基づいて、入力文に対応
する音声を合成する合成手段(例えば、図1に示す音響
処理部11など)とを備え、韻律情報は、入力文に挿入
されるポーズの位置を含み、生成手段は、ポーズの位置
を、請求項1乃至12のいずれかに記載の自然言語処理
方法により求めることを特徴とする。
【0017】
【作用】本発明の自然言語処理方法においては、入力文
が形態素解析され、その形態素解析結果から、形態素間
の文法的な関係を規定する複合語規則、文節規則、およ
び連文節規則に基づいて、複合語、文節、および連文節
が同定される。そして、その同定結果に対し、統計的に
求められたポーズ設定規則が順次適用されることによ
り、連文節間に挿入するポーズの位置が設定される。複
合語規則、文節規則、または連文節規則は、形態素どう
しを結合させる結合条件と、その結合条件を満足する形
態素どうしを結合して得られる複合語、文節、または連
文節に付加する付加情報とを含み、ポーズ設定規則およ
び結合条件は、必要に応じて、付加情報を用いて記述さ
れている。従って、形態素を結合することにより、その
結合した形態素全体に対し、付加情報を与えることがで
き、さらにその付加情報を用いてポーズ設定規則および
結合条件が記述されているので、結合する形態素の組み
合わせに応じて、ポーズを設定することが可能となる。
即ち、入力文を特に制限することなく、その文中の適切
な位置にポーズを挿入することが可能となる。
【0018】本発明の音声合成装置においては、日本語
でなる入力文を自然言語処理することにより、その入力
文に対応する音韻情報および韻律情報が求められ、その
音韻情報および韻律情報に基づいて、入力文に対応する
音声が合成される。この場合に、韻律情報の一つであ
る、入力文に挿入されるポーズの位置が、請求項1乃至
12のいずれかに記載の自然言語処理方法により求めら
れる。従って、入力文を特に制限することなく、自然で
理解のし易い合成音を得ることができる。
【0019】
【実施例】図1は、本発明を適用した音声合成装置の一
実施例の構成を示すブロック図である。この音声合成装
置においては、日本語の、例えば漢字仮名混じり文(例
えば、テキストデータでなるもの)など(以下、単に入
力文という)から、それに対応する合成音を生成するよ
うになされている。
【0020】この音声合成装置は、大きく分けて、演算
装置1とメモリ装置2とから構成されている。演算装置
1は、言語処理部3、韻律処理部8、および音響処理部
11の3つの基本的処理部から構成されており、メモリ
装置2は、演算装置1で用いられる辞書(漢字辞書その
他)、規則(形態素解析規則、結合規則、ポーズ設定規
則、パラメータ生成規則)、データ類(韻律制御モデ
ル、音素片データ)を記憶している。
【0021】言語処理部3は、形態素解析部4、結合処
理部5、ポーズ設定処理部6、および発音記号生成部7
から構成され、入力文を自然言語処理し、合成する音声
(合成音)の音韻情報(入力文の読み(発音))、およ
び韻律情報(例えば、韻律句や、アクセント句(アクセ
ント型)、ポーズの位置、その長さ、その他の情報)を
生成(抽出)するようになされている。
【0022】韻律処理部8は、韻律制御モデル用パラメ
ータ生成部9および韻律データ生成部10から構成さ
れ、韻律制御モデル用パラメータ生成部(以下、パラメ
ータ生成部という)9は、言語処理部3で生成された音
韻情報および韻律情報に基づいて、合成音の韻律的特徴
を制御するモデルを駆動するためのパラメータ(モデル
制御パラメータ)を、メモリ装置2に記憶されているパ
ラメータ生成規則にしたがって生成するようになされて
いる。
【0023】韻律データ生成部10は、メモリ装置2に
記憶されている、合成音の韻律的特徴を制御する種々の
モデル(韻律制御モデル)を、パラメータ生成部9で生
成されたパラメータを用いて駆動し、これにより合成音
の韻律的特徴を表す具体的な数値(モデルから算出され
る数値)、即ち韻律データを生成するようになされてい
る。
【0024】音響処理部11は、言語処理部3または韻
律データ生成部10でそれぞれ生成された音韻情報また
は韻律データに基づいて音声合成を行い、その結果得ら
れた合成音を、図示せぬ合成音声部に送り、その内蔵す
る例えばスピーカなどから出力させるようになされてい
る。
【0025】なお、言語処理部3で生成された情報(後
述する音韻韻律情報)は、その後段のパラメータ生成部
9の他、パラメータ生成部9を介して韻律データ生成部
10および音響処理部11にも供給されるようになされ
ている。これは、韻律データ生成部10および音響処理
部11の処理で、音韻韻律情報に含まれる音韻情報が用
いられるためである。
【0026】次に、その動作について説明する。言語処
理部3では、そこに入力文が入力されると、その入力文
に対し自然言語処理が施される。
【0027】即ち、まず形態素解析部4で、辞書と形態
素解析規則を用いて、入力文が形態素解析されて、形態
素に分解され、さらにその発音(読み)、品詞情報およ
び拍数などが判定される。
【0028】さらに、形態素解析部4では、形態素解析
された各形態素に対し、アクセント(単語が、それ一つ
だけで発声される場合のアクセント(以下、適宜、基本
的なアクセントという))が付加され、必要に応じて、
母音の長音化、母音の無声化などの処理が施される。そ
して、その処理結果は、結合処理部5に供給される。
【0029】結合処理部5では、入力文を構成する各形
態素が、結合規則に基づいて結合され、さらに必要に応
じてその結合結果が分離され、これにより入力文の連文
節(句)(1個以上の文節からなる単位(従って、1個
以上の形態素からなる単位でもある))が同定されると
同時に、連文節間にポーズを設定する位置が同定され
る。
【0030】その後、ポーズ設定処理部6において、ポ
ーズ設定規則に基づいて、同定された連文節間にポーズ
が設定される。なお、ポーズ設定処理部6では、ポーズ
の設定とともに、そのポーズに対する優先度(後述す
る)の設定も行われ、その後、ポーズ間の拍数を加味し
て最終的なポーズの位置(以下、適宜、ポーズ情報とい
う)が設定される。
【0031】ポーズ情報の設定後、その設定結果から、
発音記号生成部7において、入力文の構造が求められ、
この文の構造に基づいて、韻律句その他の情報が求めら
れる。さらに、発音記号生成部7では、そして、ポーズ
設定処理部6の処理結果、および形態素解析結果から、
音韻情報と韻律情報とを記号や文字で表現した情報(こ
の情報は、音韻情報と韻律情報を含むので、以下、音韻
韻律情報という)が生成される。
【0032】なお、形態素(単語)どうしが接続されて
文となると、その文中で形態素が発話される場合と、そ
の形態素が独立で発話される場合とで、形態素のアクセ
ントの位置が変化することがあるので、発音記号生成部
7は、音韻韻律情報の生成時に、例えば所定のアクセン
ト移動規則などに基づいて、フレーズ中のアクセントの
位置、即ちアクセント句も決定するようになされてい
る。
【0033】以上のようにして、言語処理部3は、入力
文の読み(音韻情報)、およびその入力文に対応する合
成音の韻律的特徴を制御するために必要な韻律句、アク
セント句、その他の韻律に関する情報を含む韻律情報で
なる音韻韻律情報を生成し、パラメータ生成部9に出力
する。
【0034】パラメータ生成部9では、言語処理部3か
らの音韻韻律情報およびメモリ装置2に記憶されたパラ
メータ生成規則に基づいて、例えば合成音の基本周波数
(ピッチ周波数)、音韻の継続時間長、およびパワー
(例えば、音素単位のパワー)などの韻律的特徴を制御
する、メモリ装置2に記憶されている韻律制御モデルを
駆動するためのパラメータが生成される。
【0035】即ち、メモリ装置2に、基本周波数を求め
るための韻律制御モデルとして、例えばいわゆる藤崎モ
デルが記憶されているとともに、継続時間長およびパワ
ーを求めるための韻律制御モデルとして、例えばいわゆ
る数量化1類によるモデルが記憶されている場合、パラ
メータ生成部9は、藤崎モデルを駆動するパラメータと
して、例えばフレーズ指令やアクセント指令の大きさお
よびその位置(フレーズ指令やアクセント指令をする時
点)などを設定し、数量化1類によるモデルを駆動する
パラメータとして、要因(例えば、音声合成しようとし
ている音素や、その前後の音素など)のカテゴリを設定
する。ここで、ポーズ設定処理部6により設定されたポ
ーズ情報は、パラメータ生成部9におけるフレーズ指令
の位置を決定するのに利用される。
【0036】なお、韻律制御モデルは、上述したものの
他、従来から知られているその他のものなどを用いるよ
うにすることができる、ただし、パラメータ生成部9で
は、メモリ装置2に記憶された韻律制御モデルに対応す
るパラメータを生成するようにする必要がある。
【0037】韻律データ生成部10では、メモリ装置2
に記憶されている韻律制御モデルとしての、例えば藤崎
モデルや数量化1類によるモデルなどが、パラメータ生
成部9で生成(設定)されたパラメータにより駆動さ
れ、これにより韻律データが出力される。即ち、藤崎モ
デルが駆動されることにより、韻律データとしての基本
周波数などが出力され、また数量化1類によるモデルが
駆動されることにより、韻律データとしてのパワーおよ
び継続時間長などが出力される。
【0038】具体的には、韻律データとして、合成音の
フレーズごとの基本周波数値、音素ごとの継続時間を示
すフレーム数、および音節ごとのパワーの値を示すフレ
ーム数などが、音響処理部11に出力される。
【0039】音響処理部11は、例えば従来と同様の手
法で音声合成を行う合成器、即ち例えば波形素片接続に
よる音声合成器や、いわゆるフォルマント合成器などで
構成されている。音響処理部11が、例えば波形素片接
続による音声合成器でなり、メモリ装置2に、例えばC
VやCVC/VCVなどの単位で、規則音声合成に必要
な音声素片データ(例えば、ディジタル化された波形デ
ータ)が記憶されている場合、音響処理部11は、言語
処理部3で生成された音韻韻律情報のうちの音韻情報、
および韻律データ生成部10より出力された韻律データ
(基本周波数、継続時間、およびパワーの時間の具体的
数値など)に基づいて、必要な音声素片データ(音素片
データ)を連続した音声波形となるように接続する。さ
らに、音響処理部11は、言語処理部3で生成された音
韻韻律情報のうちのポーズ情報に基づき、音声波形にポ
ーズを挿入する。そして、合成音声部において、この音
声波形に対し、例えばD/A変換処理などの必要な処理
が施され、その内蔵するスピーカから出力される。
【0040】以上のようにして、入力文に対応する合成
音が出力される。
【0041】次に、言語処理部3を構成する形態素解析
部4における処理の詳細について説明する。
【0042】形態素解析部4では、上述したように、辞
書、形態素解析規則に基づいて、入力文が単語に相当す
る形態素に分解され、さらに、その発音(読み)、アク
セント、品詞情報、および拍数などが判定される。これ
らのうちの品詞情報は、形態素解析規則に含まれる、例
えば図2乃至図4に示すような品詞情報(活用形を含
む)を参照して、各形態素に付与される。
【0043】なお、図2乃至図4に示す品詞情報(活用
形を含む)は、結合規則およびポーズ設定規則にも含ま
れている。また、ここにいう品詞情報(活用形を含む)
には、いわゆる品詞の他、例えば「数字」や「アルファ
ベット」、その他記号なども含まれている(以下、これ
らも品詞として取り扱う)。さらに、この品詞情報(活
用形も含む)には、品詞を統合した上位分類、および品
詞を細分化した下位分類が含まれており、さらに活用形
も含まれている。ここで、以下では、図2乃至図4に示
した品詞情報(活用形)を、形態素に付与される品詞情
報と区別するために、品詞情報辞書という。
【0044】品詞情報辞書には、品詞情報が、「全品
詞」を最上位の階層(最上位分類)として、階層構造に
分類されて登録されている。
【0045】即ち、例えば、図2の下位分類「カ行五段
動詞」は「動詞」という上位階層の品詞に含まれ、「動
詞」という品詞は、「用言」という上位分類に含まれ
る。さらに、「用言」は、その上位の「自立語」という
上位分類に含まれ、「自立語」は、最上位分類の「全品
詞」に含まれる。
【0046】また、例えば図2の「固有名詞」は「名
詞」という上位の品詞(この場合、「名詞」は、「固有
名詞」の上位分類となる)に含まれ、「名詞」は、その
上位の「自立語」という上位分類に含まれる。「自立
語」は、上述したように最上位分類の「全品詞」に含ま
れる。
【0047】また、形態素解析部4から、形態素解析結
果として出力される品詞情報には、必要に応じて活用形
が含められるようになされている。即ち、形態素解析結
果は、例えば「助動詞/連用形」などように出力される
ようになされている。活用形は、図4に示すように、品
詞情報辞書の最後に、階層構造とは別に規定されてい
る。
【0048】なお、活用形は、品詞(但し、動詞や助動
詞などの活用がある品詞)の活用を表すから、活用形に
よって品詞を細分化することができる。従って、活用形
は、下位分類として取り扱う。
【0049】また、図2乃至図4には図示していない
が、必要に応じて、各品詞の最下位分類として、形態素
そのものを記述しておくことが可能である。即ち、例え
ば「名詞」の下位分類である「数詞」のさらに下位分類
として、具体的な数値を記述しておくことが可能であ
る。
【0050】品詞情報を、このような階層構造にしてお
くことにより、各種規則を記述する際に、効率的な記述
をすることができる。即ち、例えば、図3に示す「数
字」、「アルファベット」、「ひらがな」、「かたか
な」、「ギリシャ文字」、「ロシア文字」、および「単
漢字」のすべてを対象とする規則を記述する場合、これ
らのすべてを記述するのではなく、これらの上位の品詞
である「単漢字」を記述するだけで済むことになる。
【0051】また、上述したように、最下位分類とし
て、形態素そのものである、例えば具体的な数値を記述
しておくことにより、その具体的数値を除く「数詞」に
対しては、ある原則的な規則を適用するとともに、その
具体的数値にのみ、例外的な規則を適用することを、容
易に行うことができる。この場合、規則を、いわば細か
に記述することが可能となるので、処理の精度を向上さ
せることができる(実際の発話に対応したポーズの設定
を行うことができる)。
【0052】次に、図5は、例えば入力文「昨夜男は店
員に押えられ、丸の内警察に窃盗の疑いで逮捕され
た。」が入力された場合における形態素解析部4の形態
素解析結果を示している。なお、形態素解析部4では、
入力文が形態素に分析され、図2乃至図4に示した品詞
情報辞書その他(例えば、形態素解析規則など)を参照
して、各形態素に対し、品詞情報その他が付与される
が、図5では、本願発明に関係する項目だけを示してあ
る。
【0053】即ち、図5においては、入力文「昨夜男は
店員に押えられ、丸の内警察に窃盗の疑いで逮捕され
た。」に含まれる形態素、その発音、アクセントの型、
品詞情報、拍数を、その左端の欄から右に順次示してあ
る。
【0054】ここで、形態素の発音(読み)は、原則と
してひらがなで示してあるが、長音は「ー」で、鼻濁音
は「゜」で、それぞれ示してある。また、アクセント
は、アクセント核(日本語は、アクセントのある拍の直
後、発話のレベルが高レベルから低レベルに落下する
が、この落下する部分がアクセント核)が、形態素の先
頭から何拍目にあるかを示すアクセント型によって示し
てある。但し、アクセント核のないものは、0型として
ある。また、付属語類(例えば助詞や句読点など)に
は、アクセントが付与されず、そのアクセントの欄に
は、「*」印を示してある。
【0055】さらに、図5における品詞情報は、図2乃
至図4に示した品詞情報辞書に記述されている品詞情報
である。なお、図5における品詞情報のうち、()内、
/以降、および・以降は、下位分類を示している。即
ち、品詞情報の、例えば1行目における「名詞(副詞用
法)」というのは、その形態素の品詞は「名詞」であ
り、その用法が副詞的であることを示している。但し、
形態素「昨夜」の品詞情報は、実際には、図2から「名
詞・普通名詞(副詞用法)」となるが、図5において
は、記述が煩雑になるので、「名詞(副詞用法)」とし
てある。
【0056】さらに、品詞情報の、例えば18行目にお
ける「助動詞/連用形」というのは、その形態その品詞
が「助動詞」であり、その活用が「連用形」であること
を示しいている。
【0057】また、各形態素の拍数は、原則として数字
で示してあるが、句読点の拍数はないものとして、*印
で示してある。
【0058】次に、以上のような形態素解析結果を処理
する結合処理部5の詳細、およびその後段のポーズ設定
処理部6の詳細について説明する。
【0059】図6および図7は、結合処理部5で用いら
れる結合規則の例を示している。
【0060】この結合規則は、例えば(1)乃至(9)
の9個の項目を1単位として記述されている。なお、ポ
ーズ設定処理部6で参照するポーズ設定規則は、(1)
乃至(9)のうちの(9)を除く8個の項目でなる条件
を1単位として記述されている(ポーズ設定規則につい
ては後述する)。
【0061】即ち、結合規則には、左端から右へ順番
に、(1)条件の番号、(2)前の形態素の見出し、
(3)前の形態素の品詞、(4)前の形態素の下位分
類、(5)前の形態素の活用、(6)後の形態素の見出
し、(7)後の形態素の品詞、(8)後の形態素の下位
分類、および(9)フラグ情報の9個の項目が1単位と
して記述されている。なお、9個の項目のすべてを記述
する必要は必ずしもなく、そのうちの必要な項目のみを
記述しておくようにすればよい。図6および図7(後述
する図8のポーズ設定規則においても同様)では、ドン
トケア(Don't Care)の項目は、NULLとしてある。
【0062】以上の9項目のうち、(2)乃至(8)
は、入力文中の隣接する2つの形態素が、複合語、文
節、連文節、(連用修飾連文節および連体修飾連文節)
を構成すると文法的に認められるときに満たすべき条件
(結合条件)とされている(あるいは、入力文中の隣接
する2つの形態素が、複合語、文節、連文節、(連用修
飾連文節および連体修飾連文節)を構成すると文法的に
認められないときに満たすべき条件(分割条件)とされ
ている)。
【0063】また、以上のような条件の集合である結合
規則(ポーズ設定規則も同様)は、図5で説明した形態
素解析結果(形態素を表す文字列(形態素文字列)、ア
クセント、品詞情報(活用形を含む)、拍数など)を用
いて記述される。なお、図6および図7に示した結合規
則(図8に示すポーズ設定規則(ポーズ優先度規則)も
同様)では、形態素解析結果のうちの形態素文字列、品
詞情報(活用形を含む)が用いられている。また、結合
規則の1単位を構成する9項目のうちの(2)乃至
(8)(ポーズ設定規則も同様)は、必要に応じて、
(9)のフラグ情報も用いて記述されている。
【0064】(1)の条件の番号には、例えば、重複す
ることのない(ユニークな)数字が昇順に記述される。
なお、この条件の番号は、必ず記述する必要がある。ま
た、数字は、連続している必要はなく、不連続であって
も良い。
【0065】(2)の前の形態素の見出しには、隣接す
る2つの形態素のうち、前(先)の形態素を表す形態素
文字列が記述され、(6)の後の形態素の見出しには、
後の形態素を表す文字列が記述される。即ち、(2)お
よび(6)には、図5に示した形態素解析結果のうちの
左端の欄に示した形態素が記述される。従って、例え
ば、(2)は「丸の内」、(6)は「警察」のように、
それぞれ記述される。
【0066】(3)の前の形態素の品詞には、隣接する
2つの形態素のうち、前の形態素の品詞が記述され、
(7)の後の形態素の品詞には、後の形態素の品詞が記
述される。ここでいう形態素の品詞とは、図5に示した
形態素解析結果における品詞情報欄のうちの下位分類、
即ち丸括弧でくくられた、例えば「(副詞用法)」とい
う用法と、/以降の、例えば「未然形」などの活用形
(活用)を除く部分(品詞と・以降の下位分類)が記述
される。従って、例えば、(3)は「名詞・サ変」、
(7)は「一段動詞」のように、それぞれ記述される。
【0067】(4)の前の形態素の下位分類には、隣接
する2つの形態素のうち、前の形態素の下位分類のうち
の用法(図5の品詞情報のうちの丸括弧でくくられた部
分)が記述され、(8)の後の形態素の下位分類には、
後の形態素の下位分類のうちの用法が記述される。な
お、名詞は、図2に示した「(副詞用法)」の他に、例
えば「(独立用法)」、「(形式名詞用法)」などの多
くの下位分類(用法)を有するが、図2ではその図示を
省略してある。従って、例えば、(4)は「(副詞用
法)」、(8)は「(独立用法)」のようにそれぞれ記
述される。
【0068】(5)の前の形態素の活用には、隣接する
2つの形態素のうち、前の形態素の下位分類のうちの活
用(活用形)が記述される。ここでいう形態素の活用と
は、図5に示した形態素解析結果における品詞情報のう
ち、/以降の、例えば「未然形」などのように「〜形」
とされている部分を意味する。従って、例えば、(5)
は「未然形」などのように記述される。
【0069】(9)のフラグ情報には、(2)乃至
(8)の条件を満足する形態素どうしを結合して得られ
る複合語、文節、または連文節に付加する情報(付加情
報)が記述される(詳細は後述する)。
【0070】図6および図7に示した結合規則は、複合
語を構成する形態素間の文法的な関係を規定する複合語
規則(複合語を構成する2つの形態素が文法的に満足す
べき条件)、文節を構成する形態素間の文法的な関係を
規定する文節規則(文節を構成する2つの形態素が文法
的に満足すべき条件)、連用修飾連文節を構成する形態
素間の文法的な関係を規定する連用修飾連文節規則(連
用修飾連文節を構成する2つの形態素が文法的に満足す
べき条件)、および連体修飾連文節を構成する形態素間
の文法的な関係を規定する連体修飾連文節規則(連体修
飾連文節を構成する2つの形態素が文法的に満足すべき
条件)を含んでいる。
【0071】結合処理部5では、隣接する2つの形態素
が、複合語規則、文節規則、連用修飾連文節規則、また
は連体修飾連文節規則に合致するか否かが判定され、そ
れぞれの規則に合致すると判定された場合、それらの2
つの形態素が複合語、文節、連用修飾連文節、または連
体修飾連文節を構成するものとして結合される。
【0072】ここで、上述のように2つの形態素を結合
規則に基づいて結合したものが、例外的に、複合語、文
節、連用修飾連文節、または連体修飾連文節を構成しな
い場合がある。そこで、このような例外的な場合に対処
すべく、複合語規則、文節規則、連用修飾連文節規則、
または連体修飾連文節規則は、結合した2つの形態素を
分割(分離)させるための分割規則(分割条件)を含ん
でいる。
【0073】ここで、以下、適宜、複合語、文節、連用
修飾連文節、または連体修飾連文節として形態素を結合
させるための規則を、複合語結合規則、文節結合規則、
連用修飾結合規則、または連体修飾結合規則とそれぞれ
いう。また、複合語、文節、連用修飾連文節、または連
体修飾連文節として結合した形態素を分割させるための
規則を複合語分割規則、文節分割規則、連用修飾分割規
則、または連体修飾分割規則とそれぞれいう。
【0074】従って、複合語規則、文節規則、連用修飾
連文節規則、または連体修飾連文節規則は、複合語結合
規則および複合語分割規則、文節結合規則および文節分
割規則、連用修飾結合規則および連用修飾分割規則、ま
たは連体修飾結合規則および連体修飾分割規則から、そ
れぞれ構成されているということができる。
【0075】図6および図7に示した条件(規則)のう
ち、(1)の条件の番号が、1000,2000,3000,4000,500
0,6000,7000,8000番台のものは、それぞれ複合語結合規
則、複合語分割規則、文節結合規則、文節分割規則、連
用修飾結合規則、連用修飾分割規則、連体修飾結合規
則、または連体修飾分割規則に相当する。なお、図6お
よび図7において、4000および6000番台の条件(規
則)、即ち文節分割規則および連用修飾分割規則の図示
は省略してある。
【0076】結合処理部5は、実際にはプログラムでな
るが、上述のように各規則をまとめておくことにより、
各規則にしたがって処理を行うプログラムのモジュール
それぞれに対し、用いる規則を簡単に指定することがで
きる。即ち、各モジュールに対しては、使用する規則
を、(1)の条件の番号(例えば1000番台や2000番台な
どのように)によって指定することができる。
【0077】次に、図8は、ポーズ設定処理部6で用い
られるポーズ設定規則の例を示している。ポーズ設定規
則には、多くのサンプルの文章(例えば、新聞に記載さ
れた文章など)中に含まれる連文節間(従って形態素間
でもある)にポーズが挿入される場合の統計(頻度の統
計)をとり(これは、文章を、例えば実際のアナウンサ
などに朗読してもらうことにより行う)、その統計結果
から求めた、形態素間にポーズが挿入されるときに、そ
の形態素が満たす文法的な条件(ポーズの設定条件)が
記述されている。
【0078】なお、ポーズ設定規則は、形態素間にポー
ズを設定する設定条件が、その間にポーズを設定する優
先順位を表す優先度が付されて記述されたポーズ優先度
規則と、ポーズの設定位置を絞り込むための絞り込み条
件が記述されたポーズ絞り込み規則とを含んでいる。ポ
ーズ優先度規則にしたがって、ポーズを設定する位置の
候補を決定し、その候補の中から、ポーズ絞り込み規則
に基づいて、ポーズを設定する最終的な位置が決定され
る。
【0079】図8に示したものは、ポーズ設定規則を構
成するポーズ優先度規則であり、それは、上述したよう
に結合規則(図6および図7)を構成する(1)乃至
(9)の項目のうち、(9)を除いた項目を1単位とし
て記述されている。
【0080】このポーズ優先度規則においては、ある設
定条件を満たす形態素間にポーズが挿入される頻度が高
い場合、その設定条件には高い優先度が付され、またポ
ーズが挿入される頻度が低ければ、低い優先度が付され
ている。
【0081】このように、設定条件に優先度を付してお
くことにより、高い優先度の設定条件を満たす形態素間
に対して、優先的にポーズを設定するようにすることが
できる。従って、優先度は、ポーズを設定する優先順位
ということができる。
【0082】ここで、優先度は、例えば1が最も高く、
以下、数字が大きくなるごとに低くなっていくものとす
る。
【0083】図8においては、優先度1乃至6の設定条
件が、(1)の条件の番号が11000,12000,13000,140
00,15000,16000番台の部分に、それぞれまとめて記述
されている。
【0084】従って、ポーズ設定処理部6でどの優先度
の設定条件を用いるかも、上述した結合処理部5におけ
る場合と同様に、(1)の条件の番号によって、簡単に
指定することができる。
【0085】なお、ポーズ設定規則を構成するポーズ絞
り込み条件については後述する。
【0086】次に、図9は、形態素解析結果(図5)を
結合処理部5で、結合規則に基づいて結合処理し、さら
にその処理結果をポーズ設定処理部6で、ポーズ優先度
規則に基づいてポーズ優先度処理した結果を示してい
る。なお、ポーズ設定処理部6では、ポーズ優先度処理
の他、後述するようにポーズ絞り込み規則に基づいてポ
ーズ絞り込み処理も行われる。また、図10は、結合処
理部5およびポーズ設定処理部6の動作を説明するフロ
ーチャートを示している。結合処理部5では、ステップ
S1乃至S9の処理が行われ、ポーズ設定処理部6で
は、ステップS10およびS11の処理が行われる。
【0087】即ち、結合処理部5では、ステップS1に
おいて、基準拍数が設定される。ここで、基準拍数と
は、ポーズ設定処理部6の処理で基準として用いられる
2つのポーズ間の拍数(但し、句読点は拍数には含めな
い)を意味する。ここでは、例えば基準拍数は、AとB
の2種類設定されるものとする。また、基準拍数Aは、
例えば11拍(モーラ)以上26拍(モーラ)未満の範
囲とされ(この場合、基準拍数Aは範囲を表すので、以
下、基準拍数範囲Aという)、基準拍数Bは、例えば4
5拍(モーラ)とされるものとする。
【0088】その後、ステップS2に進み、複合語結合
規則に基づいて、形態素解析結果(図5)から複合語が
同定される(複合語結合処理が行われる)。
【0089】ここで、複合語と同定された形態素のう
ち、先頭の形態素または末尾の形態素は、それぞれ
「頭」または「尾」と表される。また、複合語として他
の形態素に結合されずに残された形態素は「孤」と表さ
れる。なお、句読点はそのままとされる。
【0090】即ち、ステップS2では、図6および図7
の結合規則のうちの条件の番号1001からの1000番台の条
件(規則)を、図5の形態素解析結果における隣接する
2つの形態素間に適用し、いずれかの条件を満足するか
否かが判定される。そして、2つの形態素がいずれかの
条件を満足する場合は、前の形態素が「頭」、後の形態
素が「尾」とされる。
【0091】具体的には、図5において、例えば形態素
「昨夜」と「男」、および「丸の内」と「警察」は、い
ずれも図6に示した(1)条件の番号の1001の前の形態
素の品詞が「名詞」で、後の形態素の品詞が「名詞」と
いう条件を満足する。従って、この場合、「昨夜」=
頭、「男」=尾(以下、適宜、(「昨夜」「男」)のよ
うに表す)、「丸の内」=頭、「警察」=尾((「丸の
内」「警察」))とされる。
【0092】なお、3個以上の形態素が連続して条件を
満足する場合には、先頭の形態素が「頭」、末尾の形態
素が「尾」とされ、それらの中間に挟まれた形態素は全
て「胴」とされる。例えば、品詞が「名詞」である形態
素「丸の内」、「中央」および「警察」からなる複合語
「丸の内中央警察」は、形態素「丸の内」と「中央」、
および「中央」と「警察」が、1001の条件を満足するか
ら、それぞれ「丸の内」=頭、「中央」=胴、「警察」
=尾とされる(この場合、まず「丸の内」と「中央」が
結合されることにより、(「丸の内」「中央」)とさ
れ、その後、「中央」と「警察」が結合されることによ
り、((「丸の内」「中央」)「警察」)とされる)。
【0093】以上の複合語結合処理の後、ステップS3
に進み、複合語分割規則に基づいて、複合語分割処理が
行なわれる。即ち、ステップS3では、図6および図7
の結合規則のうちの条件の番号2001からの2000番台の条
件を、上述の複合語結合処理結果における、隣接する2
つの形態素(但し、複合語を構成するとして結合された
もの)間に適用し、いずれかの条件を満足するか否かが
判定される。そして、2つの形態素がいずれかの条件を
満足する場合は、「頭」とされた前の形態素が「孤」
に、「尾」とされた後の形態素が「孤」に変更される。
この複合語分割処理は、複合語として結合した形態素の
組合せの中で、例外的に複合語と同定するのが好ましく
ないものを除外するために行われる。なお、後述するス
テップS5,S7,S9の各処理も、ステップS4,S
6,S8の各処理で結合された形態素を例外的に除外
(分割)するために行われる。
【0094】具体的には、図5において、例えば、形態
素「昨夜」と「男」は、1001の条件を満足するから、上
述したように、「昨夜」=頭、「男」=尾とされる。し
かしながら、前の形態素である「昨夜」の下位分類は
「(副詞用法)」であり(図5)、また、後の形態素で
ある「男」の品詞が「名詞」であるから、この2つの形
態素は、図6の2001の条件を満たし、従って、「昨夜」
=孤、「男」=孤と変更される。なお、分割された前後
の形態素は「孤」と「弧」になる場合の他、「尾」と
「頭」になる場合がある。即ち、例えば、「頭尾」とさ
れた2つの形態素が分割されれば「孤」と「弧」となる
が、例えば、「頭胴胴胴胴尾」とされた6つの形態素が
中央で分割されれば「頭胴尾」と「頭胴尾」とされ、分
割された前後の形態素は、「尾」と「頭」になる。
【0095】以上の複合語結合処理、複合語分割処理の
処理結果を、図9の「語」の欄に示す。
【0096】ここで、結合処理部5およびポーズ設定処
理部6で採用している基本的な処理方法について説明す
る。即ち、結合処理部5およびポーズ設定処理部6で
は、2個以上の形態素が結合した際には、その先頭また
は末尾の形態素を、結合した形態素全体を代表する形態
素とするようになされている。従って、例えば、品詞に
着目して説明すれば、複合語結合処理によって結合され
た「丸の内警察」については、「丸の内」も、末尾の形
態素「警察」もその品詞は「名詞」であるから、いずれ
かが代表となっても全体の品詞は「名詞」であるが、後
述する文節結合処理(ステップS4)の結果得られる
「丸の内警察に」については、先頭の形態素「丸の内」
の品詞は「名詞」であり、末尾の形態素「に」の品詞は
「格助詞」であるから、先頭または末尾のいずれの形態
素が代表になるかによって、結合された形態素全体の品
詞が異なることになる。
【0097】即ち、図5に示した、例えば「丸の内警察
に」と、その前にある(隣接する)形態素「られ」との
間に、結合規則またはポーズ設定規則が適用される場合
には、形態素「られ」と、「丸の内警察に」のうちの、
形態素「られ」に隣接する先頭の形態素「丸の内」との
間に結合規則またはポーズ設定規則が適用される。
【0098】また、例えば「丸の内警察に」と、その後
にある(隣接する)形態素「窃盗」との間に、結合規則
またはポーズ設定規則が適用される場合には、「丸の内
警察に」のうちの、形態素「窃盗」に隣接する末尾の形
態素「に」と、形態素「窃盗」との間に、結合規則また
はポーズ設定規則が適用される。
【0099】さらに、2個以上の形態素が結合したもの
どうしに対しては、隣接する末尾と先頭の形態素の間
に、結合規則またはポーズ設定規則が適用される。具体
的には、以下のような処理が行われる。(上述したよう
に、1つの形態素自体をカギ括弧「 」で囲み、2つ以
上の形態素が結合したものを、その外側を丸括弧( )
で囲んで表す)。
【0100】即ち、例えば、(「店員」「に」)と
(「押さえ」「られ」)とが隣接する場合、(「店員」
「に」)を代表する末尾の形態素「に」と、(「押さ
え」「られ」)を代表する先頭の形態素「押さえ」が、
形態素を結合する条件を満たせば、(「店員」「に」)
と(「押さえ」「られ」)は一つに結合され、その結
果、((「店員」「に」)(「押さえ」「られ」))と
なる。
【0101】従って、結合規則またはポーズ設定規則が
適用される形態素は、「頭」、「尾」、「孤」とされた
ものだけであり、「胴」とされたものには適用されな
い。
【0102】次に、ステップS3の処理後、ステップS
4に進み、文節結合処理が文節結合規則に基づいて行わ
れ、これにより複合語の同定結果から文節が同定され
る。即ち、複合語分割処理の結果に対し、図6に示した
3001から始まる3000番台の文節結合規則が適用される。
これにより、図9の「語」の欄に示した、例えば(「丸
の内」「警察」)と、それに続く「に」は、「尾」とさ
れた形態素「警察」と「孤」とされた形態素「に」が、
図5に示した形態素解析結果から、図6に示した3004の
条件を満足するので結合され、((「丸の内」「警
察」)「に」)とされる。即ち、形態素「丸の内」、
「警察」、「に」は、それぞれ「頭」、「胴」、「尾」
とされる。
【0103】以上の文節結合処理後、ステップS5に進
み、文節分割規則に基づいて、文節分割処理が行われ
る。即ち、文節を構成するとして結合された形態素間
に、文節分割規則が適用され、文節とは認められない結
合が解除される。
【0104】具体的には、図5および図6には図示して
いないが、文節分割規則として、例えば 4001,”警察”,名詞,NULL,NULL,NULL,格助詞,NULL,NULL が記述されていた場合には、文節として同定された
((「丸の内」「警察」)「に」)を構成する形態素
「警察」と「に」は、この4001番の条件を満たすので、
(「丸の内」「警察」)と「に」に分割されることにな
る。
【0105】文節結合処理および文節分割処理により得
られた結果を、図9の「文節」の欄に示す。なお、図9
は、結合規則に、上述の4001番の条件が記述されていな
い場合の処理結果を示している。
【0106】以下、ステップS6乃至S9に順次進み、
連用修飾結合規則、連用修飾分割規則、連体修飾結合規
則、または連体修飾分割規則に基づいて、連用修飾結合
処理、連用修飾分割処理、連体修飾結合処理、または連
体修飾分割処理がそれぞれ行われる。
【0107】即ち、文節の同定結果から、連用修飾連文
節と連体修飾連文節とが同定される。なお、ステップS
6およびS7の処理は、ステップS8およびS9の処理
の前ではなく、その後に行うようにしても良い。但し、
ステップS6およびS7の処理を、ステップS8および
S9の処理の前に行う方が、より自然な合成音が得られ
ることが、シミュレーションによりわかっている。
【0108】具体的には、連用修飾結合処理では、図9
の「文節」の欄に示すように処理された、例えば(「店
員」「に」)と(「押さえ」「られ」)は、(「店員」
「に」)を代表する末尾の「に」と、(「押さえ」「ら
れ」)を代表する「押さえ」が、図5の形態素解析結果
から、図7の5004番の条件を満たすので、((「店員」
「に」)(「押さえ」「られ」))のように結合され、
図9の句1の欄に示すように、「店員」、「に」、「押
さえ」、「られ」はそれぞれ「頭」、「胴」、「胴」、
「尾」とされる。
【0109】次に、連用修飾分割処理では、図5および
図6には図示していないが、連用修飾分割規則として、
例えば 6001,NULL,格助詞,NULL,NULL,”押さえ”,一般動詞,NUL
L,NULL が記述されていた場合には、連用修飾連文節として同定
された((「店員」「に」)(「押さえ」「られ」))
を構成する形態素「に」と「押さえ」は、この6001番の
条件を満たすので、(「店員」「に」)と(「押さえ」
「られ」)に分割されることになる。
【0110】連用修飾結合処理および連用修飾分割処理
により得られた結果を、図9の「句1」の欄に示す。な
お、図9は、結合規則に、上述の6001番の条件が記述さ
れていない場合の処理結果を示している。
【0111】連体修飾結合処理または連体修飾分割処理
においても、連用修飾結合処理または連用修飾分割処理
とそれぞれ同様の処理が、連体修飾結合規則または連体
修飾分割規則を参照して行われ、これにより図9の「句
2」の欄に示すような処理結果が得られる。
【0112】ここで、形態素解析の結果出力される品詞
情報は、上述した図2乃至図4に示した品詞情報辞書に
記述されているものだけである。即ち、例えば品詞を細
分化した下位分類を記述しておけば、品詞情報としてそ
の下位分類を得ることができる。具体的には、図2に示
したように、例えば「普通名詞」の下位分類として、
「(副詞用法)」(副詞用法の普通名詞)を記述してお
けば、形態素がそれに該当する場合、その品詞情報とし
て「(副詞用法)」という下位分類が得られる。上位分
類についても同様で、図2に示したように、例えば「名
詞」の上位分類として、「自立語」を記述しておくこと
により、形態素が、その下位分類である、例えば「(副
詞用法)」に該当する場合、その品詞情報として「自立
語」という上位分類も得られる。
【0113】このように品詞情報辞書に品詞情報を、直
接記述しておくことにより、形態素を分類する方法を、
以下、静的分類方法という。
【0114】ところで、例えば「逮捕」という名詞は、
「逮捕を」のように名詞としても用いられるし、「逮捕
する」のようにサ変化動詞としても用いられる。従っ
て、「逮捕」のみに注目すれば、その品詞は「名詞」と
いうことになるが、より自然な位置にポーズを挿入する
ためには、「逮捕」の後に、例えば「を」などの助詞が
続くか、あるいは例えば「する」などの活用語尾(サ変
活用語尾)が続くかによって、「逮捕」という形態素を
区別して分類する必要がある。
【0115】そこで、静的分類方法により、その区別を
行う場合には、図2に示したように、上述したような
「逮捕」が、名詞であることを意味する品詞情報「名詞
・サ変」の他に、動詞であることを意味する品詞情報
「名詞・サ変[サ変化]」を、品詞情報辞書に記述して
おくようにすれば良い([サ変化]は、「逮捕」をサ変
化動詞として認定したことを意味する)。
【0116】このようにした場合には、形態素解析部4
に、形態素「逮捕」の他、それに続く形態素に着目させ
ることにより、「サ変活用語尾」の形態素が続いている
ときに、その品詞情報として、「名詞」またはサ変化し
た「動詞」のうち、サ変化した「動詞」であることを意
味する品詞情報「名詞・サ変[サ変化]」を出力させる
ようにする。これにより、以降の処理では、「逮捕」
は、「名詞・サ変[サ変化]」の形態素として取り扱わ
れることになる。
【0117】次に、上述したような「逮捕」という形態
素の分類するには、それに続く形態素にも注目する必要
があることから、以下のようにして行うことも可能であ
る。即ち、形態素解析では、「逮捕」の品詞情報として
「名詞・サ変」が出力されるようにしておく(従って、
品詞情報辞書には、「名詞・サ変」は記述しておくが、
「名詞・サ変[サ変化]」は記述しておかないようにす
る)とともに、単独では「名詞」の「逮捕」の後に、
「サ変活用語尾」の形態素が続いていた場合には、それ
らを結合するように、結合規則を記述しておく。
【0118】そして、品詞情報「名詞・サ変」の形態素
「逮捕」と、それに続く「サ変活用語尾」の形態素と
が、結合規則(図6および図7)に基づいて結合された
ときに、「逮捕」という形態素が、サ変化する動詞であ
ることを示す付加情報([サ変化]という付加情報)
を、結合結果(この場合は、結合結果を構成する「逮
捕」)に付加するようにする。
【0119】その後は、形態素解析の結果得られた品詞
情報である「名詞・サ変」と、上述したように付加され
た付加情報である[サ変化]とを加味し、「逮捕」の品
詞情報を、「名詞・サ変[サ変化]」として取り扱うよ
うにする。
【0120】一方、品詞情報「名詞・サ変」の形態素
「逮捕」に続く形態素が、「サ変活用語尾」以外のもの
である場合には、たとえそれらが結合されても、特に付
加情報を付加しなければ、「逮捕」は、そのまま「名詞
・サ変」の形態素として取り扱われることになる。
【0121】この場合、「逮捕」は、それに後続する形
態素に対応して、付加情報が付加されたり、またはされ
なかったりすることにより、「名詞・サ変[サ変化]」
または「名詞・サ変」として取り扱われる。即ち、結合
する形態素の組み合わせにより、その結合結果の分類
は、動的に変化する。従って、以上の方法により形態素
を分類する方法は、上述の静的分類方法に対して、いわ
ば動的分類方法ということができる。
【0122】動的分類方法においては、最初は、名詞を
意味する「名詞・サ変」という分類は存在するが、動詞
を意味する「名詞・サ変[サ変化]」という分類は存在
せず、結合処理において[サ変化]という付加情報が付
加されることによって初めて、「名詞・サ変[サ変
化]」という分類が現れることになる。
【0123】図6および図7に示した結合規則の1単位
を構成する(9)のフラグ情報は、上述の付加情報に相
当し、例えば図9の「文節」の欄に示した、1つの文節
を構成するとして結合された形態素「逮捕」、「さ」、
「れ」、および「た」のうちの「逮捕」は、動的分類方
法により「名詞・サ変[サ変化]」に分類されている。
【0124】即ち、まず、図5の形態素解析結果から、
「逮捕」または「さ」の品詞はそれぞれ、「名詞・サ
変」または「サ変活用語尾」であり、従って図6の3001
番の文節結合規則の条件を満たすので、文節を構成する
として(「逮捕」「さ」)とされる。即ち、「逮捕」=
頭、「さ」=尾とされる。
【0125】この場合、3001番の(9)のフラグ情報
は、「頭[サ変化]」と記述されている。この「頭[サ
変化]」というのは、その条件(3001番の条件)を満足
する形態素どうしを結合して得られる文節のうちの、先
頭の形態素(「頭」とされる形態素)に、[サ変化]と
いう情報を付加することを意味する。なお、フラグ情報
が、「尾[サ変化]」と記述されていた場合、この「尾
[サ変化]」というのは、その条件を満足する形態素ど
うしの結合結果のうちの、末尾の形態素(「尾」とされ
る形態素)に、[サ変化]という情報を付加することを
意味する。
【0126】従って、この場合、結合結果である(「逮
捕」「さ」)の先頭の形態素「逮捕」の品詞情報は、
「名詞・サ変化」から「名詞・サ変[サ変化]」に変更
される。
【0127】なお、以下では、(「逮補」「さ」))を
代表する末尾の「さ」と隣接する「れ」が、図6の3006
番の条件を満たすので、((「逮捕」「さ」)「れ」)
とされ、さらに((「逮捕」「さ」)「れ」)を代表す
る末尾の「れ」とそれに隣接する「た」が、図6の3010
番の条件を満たすので(((「逮捕」「さ」)「れ」)
「た」)と結合される。即ち、「逮捕」、「さ」、
「れ」、「た」は、それぞれ「頭」、「胴」、「胴」、
「尾」とされる。
【0128】ポーズ設定規則および結合規則は、必要に
応じて、フラグ情報を用いて記述されており、形態素
「逮捕」に付加されたフラグ情報は、その後、「逮捕」
に対し、ポーズ設定規則および結合規則を適用するにあ
たって加味される。即ち、文節を構成するとして同定さ
れた形態素「逮捕」の前に隣接する形態素が、例えば
「で」などの「助詞」である場合、形態素「で」または
「逮捕」の品詞は、それぞれ「助詞」または「名詞・サ
変[サ変化]」であるから、図7に示した5001番の連用
修飾結合条件を満足し、従って、これらは連用修飾連文
節を構成するとして結合される。
【0129】なお、形態素「逮捕」に、[サ変化]とい
うフラグ情報が付加されていない場合には、形態素「逮
捕」の品詞は、「名詞・サ変」であるから、図7に示し
た5001番の連用修飾結合条件を満足せず、従って、これ
らは結合されないこととなる。
【0130】フラグ情報は、形態素に対し、[サ変化]
という品詞情報を追加する場合だけでなく、その他の品
詞情報(あるいは、品詞情報以外の情報)を追加する場
合にも利用することができる。
【0131】即ち、例えば図11(a)に示すような入
力文「決して逮捕されないような」からは、同図(b)
に示すような形態素解析結果が得られる。なお、図11
(b)(後述する図12(b)も同様)における品詞情
報の()内は、図2乃至図4には図示していないが、そ
の下位分類を示している。
【0132】まず、「副詞(叙述副詞)」である「決し
て」と、「名詞・サ変」である「逮捕」とは、図6およ
び図7に示した結合条件のいずれも満たさず、結合され
ない。次に、形態素「逮捕」と「さ」は、上述したよう
に(「逮捕」「さ」)と結合され、「逮捕」には、[サ
変化]というフラグ情報が付加される。即ち、この段階
で、「逮捕」は、「名詞・サ変[サ変化]」とされる。
そして、(「逮捕」「さ」)と「れ」も、上述したよう
に結合され、((「逮捕」「さ」)「れ」)とされる。
【0133】次に、((「逮捕」「さ」)「れ」)を代
表する「れ」と、それに続く「ない」は、図11(b)
の形態素解析結果から、図6の3009番の条件を満たし、
従って(((「逮捕」「さ」)「れ」)「ない」)とさ
れる。さらに、この場合、3009番の(9)のフラグ情報
には、「頭[ない]」が記述されているので、結合結果
(((「逮捕」「さ」)「れ」)「ない」)の先頭の形
態素「逮捕」には、[ない]というフラグ情報が付加さ
れる。
【0134】なお、フラグ情報は、結合結果の先頭(ま
たは末尾)の形態素が確定した後に、形態素を結合して
いく各段階で順次付加するようにしても良いし、また、
例えば次のようにして付加することも可能である。即
ち、結合結果の先頭(または末尾)の形態素が確定した
後、フラグ情報を、例えばスタックなどに記憶しておい
て、最終的な結合結果が得られた後に、記憶しておいた
フラグ情報をまとめて付加するようにしても良い。
【0135】従って、(((「逮捕」「さ」)「れ」)
「ない」)を構成する「逮捕」の品詞情報は、「名詞・
サ変[サ変化][ない]」となる。
【0136】次に、(((「逮捕」「さ」)「れ」)
「ない」)を代表する「ない」と、それに続く「よう
な」は、図11(b)の形態素解析結果から、図6の30
10番の条件を満たし、従って((((「逮捕」「さ」)
「れ」)「ない」)「ような」)とされる。
【0137】図11(a)に示した入力文は、以上のよ
うにして文節「決して」と、((((「逮捕」「さ」)
「れ」)「ない」)「ような」)とに同定される。そし
て、この文節(形態素)「決して」と、((((「逮
捕」「さ」)「れ」)「ない」)「ような」)を代表す
る(形態素)「逮捕」とは、「逮捕」の品詞情報が「名
詞・サ変[サ変化][ない]」とされているから、図7
の5003番の連用修飾結合規則を満し、従って、この段階
で連用修飾連文節を構成するとして結合され、図11
(c)に示すように、(「決して」((((「逮捕」
「さ」)「れ」)「ない」)「ような」))とされる。
【0138】入力文「決して逮捕されないような」にお
いて、「決して」と係り受け関係にあるのは、否定を表
す「ない」であり、この「ない」の文法的性質が、[な
い]というフラグ情報によって、「逮捕」に反映される
ことにより、以上のように、「決して」と、
((((「逮捕」「さ」)「れ」)「ない」)「よう
な」)とが連用修飾連文節を構成するとして結合される
ことになる。
【0139】次に、例えば図12(a)に示すような入
力文「3キロメートル先の箱崎インターを」からは、同
図(b)に示すような形態素解析結果が得られる。この
形態素解析結果から、「3」と「キロメール」は、図6
の1002番の複合語結合規則を満たし、(「3」「キロメ
ートル」)とされる。そして、(「3」「キロメート
ル」)を代表する「キロメートル」と、それに隣接する
「先」は、図6の1003番の複合語結合規則を満たし、
((「3」「キロメートル」)「先」)とされる。さら
に、この場合、1003番の複合語結合規則のフラグ情報
は、「尾[距離方向]」とされているから、結合の結果
得られた複合語((「3」「キロメートル」)「先」)
の末尾の形態素「先」に[距離方向]というフラグ情報
が付加される。
【0140】その結果、((「3」「キロメートル」)
「先」)を代表する「先」と、それに続く「の」は、図
6の3003番の文節結合規則を満たし、従って文節を構成
するとして結合され、(((「3」「キロメートル」)
「先」)「の」)とされる。さらに、この場合、3003番
の文節結合規則のフラグ情報は、「尾[距離方向]」と
されているから、結合の結果得られた文節(((「3」
「キロメートル」)「先」)「の」)の末尾の形態素
「の」に[距離方向]というフラグ情報が付加される。
即ち、この場合、形態素「先」に付加されたフラグ情報
が、形態素「の」に、いわば継承付加され、「の」の品
詞情報は、「格助詞[距離方向]」となる。
【0141】一方、「箱崎インター」と「を」は、図1
2(b)の形態素解析結果から、図6の3004番の文節結
合規則を満たし、従って文節を構成するとして結合さ
れ、(「箱崎インター」「を」)とされる。
【0142】文節(((「3」「キロメートル」)
「先」)「の」)と、(「箱崎インター」「を」)との
関係を考えた場合、(((「3」「キロメートル」)
「先」)「の」)または(「箱崎インター」「を」)を
代表する形態素「の」または「箱崎インター」の品詞情
報は、それぞれ「格助詞[距離方向]」または「固有名
詞(地名)」であるから、これらは、図7の7003番の連
体修飾結合規則を満たす。その結果、(((「3」「キ
ロメートル」)「先」)「の」)と、(「箱崎インタ
ー」「を」)とは、連体修飾連文節を構成するとして結
合され、((((「3」「キロメートル」)「先」)
「の」)(「箱崎インター」「を」))とされる。
【0143】しかしながら、形態素「の」と「箱崎イン
ター」は、図7の8001番の連体修飾分割規則も満たすか
ら、連体修飾連文節を構成するとして結合された
((((「3」「キロメートル」)「先」)「の」)
(「箱崎インター」「を」))は、元の文節
(((「3」「キロメートル」)「先」)「の」)と、
(「箱崎インター」「を」)とに分割される。
【0144】従って、その結合処理結果は、図12
(c)に示すようになる。
【0145】即ち、この場合、形態素「の」には、[距
離方向]というフラグ情報が付加されているため、通常
の格助詞と名詞の関係とは異なり、(((「3」「キロ
メートル」)「先」)「の」)と、(「箱崎インター」
「を」)とは連体修飾連文節を構成するとして結合され
ない。このように、フラグ情報を設けておくことによ
り、特定の形態素の前または後には、その他の特定の形
態素を結合しないという、いわば例外処理が可能とな
る。
【0146】後述するように、連体修飾連文節を構成す
るとして結合されなかった(((「3」「キロメート
ル」)「先」)「の」)と、(「箱崎インター」
「を」)との間、即ち連体修飾連文節間は、ポーズを設
定する候補とされる。即ち、「3キロメートル先の」
と、「箱崎インターを」との間にはポーズが挿入される
可能性が高くなる。
【0147】従って、本発明を、例えばカーナビゲーシ
ョンシステムにおける目的地案内のための音声合成処理
に適用した場合には、「3キロメートル先の」などのよ
うな距離を表す文節と、「箱崎インターを」などのよう
な目的地に対応する地名を表す文節との間に、ポーズが
挿入され易くなる。本願発明者が行った実験によれば、
距離を表す文節と、目的地に対応する地名を表す文節と
の間にポーズが挿入される場合には、その合成音が聞き
取り易いものになることがわかっている。
【0148】結合処理部5における処理、即ち図10の
ステップS1乃至S9の処理が終了し、これにより入力
文の連文節の同定がなされた後、ステップS10に進
み、ポーズ設定処理部6において、まずポーズ優先度処
理が行われる。
【0149】即ち、ポーズ設定処理部6では、図9の
「句2」の欄が「孤」または「尾」とされた形態素と、
それに続く(その次の)形態素との間(連体修飾連文節
間)、および形態素が「の」で、図9の「句1」の欄が
「尾」とされたものと、その直後の形態素との間に、図
8に示したポーズ優先度規則が適用される。
【0150】なお、ポーズ優先度規則の適用対象は、図
9の「句2」の欄が「孤」または「尾」とされた形態素
と、それに続く(その次の)形態素との間(連体修飾連
文節間)だけでも良いが、特に入力文中の1文の拍数が
多い場合には、形態素が「の」で、図9の「句1」の欄
が「尾」とされたものと、その直後の形態素との間に
も、ポーズ優先度規則を適用した方が、より自然で聞き
取り易い合成音が得られることが、シミュレーションに
よりわかっている。
【0151】ポーズ優先度規則の適用の結果、例えば、
「孤」とされた形態素「昨夜」と、その次の「頭」とさ
れた形態素「男」は、図5の形態素解析結果から、図8
の12001番の優先度2の条件を満たすので、ポーズを挿
入する位置の候補であることを示す優先度2のフラグが
「昨夜」にたてられる。
【0152】また、例えば「尾」とされた形態素「は」
と、その次の「頭」とされた形態素「店員」は、図5の
形態素解析結果から、図8の優先度3の13001番の条件
を満たすので、優先度3のフラグが「は」にたてられ
る。以下同様にして、図9の「間」の欄に示すようにフ
ラグ(優先度フラグ)がたてられる。なお、図9の
「間」の欄には、フラグがたてられた位置に、優先度を
示す数字を示してある。
【0153】さらに、ポーズ優先度処理では、優先度フ
ラグが立てられた位置の間の拍数の小計が求められる。
但し、入力文中の最初と最後の優先度フラグについて
は、入力文の先頭から最初の優先度フラグまでの拍数の
小計が、また最後の優先度フラグから入力文の最後まで
の拍数の小計が、それぞれ求められる。
【0154】図9の右端の「拍」の欄の数字は、この小
計値を表している。例えば、「昨夜」(3拍)について
は、その拍数である3拍となり、例えば「は」(1拍)
については、「男」(3拍)との小計で4拍となり、ま
た、例えば「られ」(2拍)については、「店員」(4
拍)からの小計で10拍となる。
【0155】ポーズ優先度処理の後、ステップS11に
進み、ポーズ絞り込み規則にしたがってポーズ絞り込み
処理が行われ、優先度フラグがたてられた、ポーズを挿
入する位置(フラグがたてられた形態素と、その次の形
態素との間)の候補の中から、最終的なポーズの設定位
置が決定される。
【0156】ここで、ポーズ絞り込み規則は、実際に、
アナウンサに新聞を朗読させたときに、そのアナウンサ
が、文中の意味の切れ目にポーズをおく朗読方法をモデ
ル化したものである。なお、このポーズ絞り込み規則
も、図8に示したポーズ優先度規則と同様に、いわばテ
ーブル形式で記述されている。
【0157】図13および図14は、ポーズ絞り込み処
理の詳細を説明するフローチャートを示している。な
お、このフローチャートは、ポーズ絞り込み規則を反映
したものとしてある。即ち、このフローチャートには、
ポーズ絞り込み規則が含まれている(但し、実際には、
上述したように、テーブル形式で記述された条件が用意
されており、その条件を満たすか否かがポーズ絞り込み
処理(ステップS11)において判断される)。
【0158】ポーズ絞り込み処理では、まず最初に、図
13のステップS21において、例えば優先度1および
2の優先度フラグがたてられた形態素の直後にポーズが
設定される。なお、優先度1または2の優先度フラグが
たてられた形態素(の直後)は、節境界または句境界
に、それぞれ相当する。また、節境界に設定されたポー
ズの長さは、比較的長くされ、句境界に設定されたポー
ズの長さは、節境界の場合よりも幾分短くされる。
【0159】その後、ステップS22に進み、所定の判
定処理が行われる。即ち、ステップS22では、その判
定処理の対象とされていない(未判定の)、例えば優先
度3または4の優先度フラグがたてられた形態素が存在
するか否かが判定される。ステップS22において、未
判定の優先度3または4の優先度フラグがたてられた形
態素が存在すると判定された場合、ステップS23に進
み、その形態素(以下、適宜、注目形態素という)の位
置(その形態素の直後)にポーズを設定した結果、ポー
ズ間の拍数が、基準拍数範囲A内に収まるか否かが判定
される。ステップS23において、ポーズ間の拍数が、
基準拍数範囲A内に収まらないと判定された場合、ステ
ップS24をスキップして、ステップS22に戻る。即
ち、この場合、ポーズの設定(追加設定)は行われな
い。
【0160】一方、ステップS23において、ポーズ間
の拍数が、基準拍数範囲A内に収まると判定された場
合、ステップS24に進み、注目形態素の位置にポーズ
が設定され、ステップS22に戻る。
【0161】なお、ステップS22乃至S24の処理
は、まず、入力文の文頭から文末方向へ、優先度3の優
先度フラグがたてられた形態素を対象として行われ、そ
の後、再び入力文の文頭から文末方向へ、優先度4の優
先度フラグがたてられた形態素を対象として行われる。
【0162】ここで、図9に示した場合においては、ま
ず「昨夜」、「られ」、および「た」の直後にポーズが
設定される(ステップS21)。次に、「は」にたてら
れた優先度フラグの優先度が3であるから、そこにポー
ズを設定した場合に、ポーズ間の拍数が、基準拍数範囲
A内に収まるか否かが判定される。「は」の位置にポー
ズを設定した場合、図9の「拍」の欄から、既にポーズ
が設定されている「昨夜」の直後から「は」までの拍数
は4拍であり、また、「は」の直後から、既にポーズが
設定されている「られ」までの拍数は10拍であるか
ら、いずれも基準拍数範囲A(上述したように、11拍
以上26拍未満)に収まらず、従って「は」の位置には
ポーズは設定されない。
【0163】なお、仮に、「は」の位置にポーズを設定
した結果、その前後のポーズ間の拍数が、基準拍数範囲
A内に収まる場合には、その位置にポーズが設定される
(ステップS24)。また、このようにしてポーズが追
加設定された場合、次のポーズを設定するかどうかは
(ステップS22乃至S24の処理は)、その追加設定
されたポーズを加味して行われる。
【0164】さらに、ポーズ間の拍数が基準拍数範囲A
内に収まるかどうかでポーズの設定を行うようにしてい
るのは、アナウンサの朗読時におけるポーズ間の拍数
が、極端に少なかったり、また多くなったりしないこと
に対応する。また、本実施例では、新聞等の比較的長文
の文章を、アナウンサに朗読させて得たモデル(朗読モ
デル)を規則化(ポーズ絞り込み規則化)したため、基
準拍数範囲Aを上述したように11拍以上26拍未満と
したが、入力文とする文章が短文である場合には、基準
拍数範囲A(基準拍数Bも同様)を、例えば3モーラ以
上11モーラ未満などと小さな範囲に設定することが可
能である。さらに、入力文における1文の拍数に対応し
て、基準拍数範囲A(基準拍数Bも同様)を変更(動的
に変更)するようにすることも可能である。
【0165】一方、ステップS22において、未判定の
優先度3または4の優先度フラグがたてられた形態素が
存在しないと判定された場合、図14のステップS31
に進み、現時点で設定済みのポーズ間における拍数が、
基準拍数B(上述したように、46拍)以上である部分
が存在するか否かが判定される。
【0166】ここで、基準拍数Bは、アナウンサが一回
の呼吸で(一呼吸で)朗読可能で、かつ聞き手が聴きと
りにくくない限界と想定される拍数に対応する。ステッ
プS31以下では、基準拍数Bを超える拍数のポーズ間
が存在する場合は、アナウンサの朗読結果を統計処理し
て得られた結果(ポーズ絞り込み規則)に基づいて、原
則的には、より優先度の高い優先度フラグがたてられた
位置からポーズを設定(追加設定)し、ポーズ間の拍数
が基準拍数B以上となっている部分が存在しなくなった
時点で、ポーズの設定(追加設定)(再設定)を終了す
る。
【0167】基準拍数範囲Aおよび基準拍数Bは、いず
れも、アナウンサが、聴き手に対し朗読を不自然と感じ
させないための基準である点で共通している。しかしな
がら、基準拍数範囲Aは、アナウンサが、可能ならば
(意味的に不自然でなければ)、ポーズをおくことが望
ましいとする、ポーズのおかれる優先順位の高い範囲で
あるのに対し、基準拍数Bは、アナウンサが一呼吸で朗
読するのが困難で(アナウンサの身体的制約により拘束
され)、また聴き手が聞き取りにくくなるという理由か
ら決まる拍数である点で相違する。従って、ポーズ間の
拍数が基準拍数B以上である部分は、可能ならば(アナ
ウンサが一呼吸で朗読することができ、かつ聴き手が聞
き取りにくくなければ)ポーズをおかない方が望ましい
部分、即ちポーズのおかれる優先順位としては低い部分
である。
【0168】ステップS31において、現時点で設定済
みのポーズ間における拍数が、基準拍数B以上である部
分が存在しないと判定された場合、処理を終了する。
【0169】ここで、図9に示した場合においては、ス
テップS31の処理前までにポーズが設定された位置
は、「昨夜」、「られ」、および「た」の直後である。
文頭から「昨夜」まで、「昨夜」から「られ」まで、
「られ」から「た」まで、または「た」から文末までの
拍数は、それぞれ3、14、25、または0拍であるか
ら、基準拍数B以上である部分は存在せず、処理を終了
する。従って、図9に示した場合には、「昨夜」、「ら
れ」、および「た」の直後が最終的なポーズの設定位置
となる。
【0170】一方、ステップS31において、現時点で
設定済みのポーズ間における拍数が基準拍数B以上であ
る部分が存在すると判定された場合、ステップS32に
進み、そのポーズ間(以下、適宜、注目ポーズ間とい
う)に、優先度3のフラグがたてられた係助詞「は」で
あって、それに続く形態素の品詞情報が「用言」以外の
「自立語」(非用言自立語)であるものが存在するか否
かが判定される。
【0171】ステップS32において、注目ポーズ間
に、優先度3のフラグがたてられた係助詞「は」であっ
て、それに続く形態素の品詞情報が非用言自立語である
ものが存在すると判定された場合、ステップS33に進
み、その係助詞「は」(の直後)にポーズが設定され、
ステップS31に戻る。
【0172】ここで、図9に示した場合において、仮
に、「昨夜」の直後から「られ」の直後までの拍数が基
準拍数B以上であれば、優先度3のフラグがたてられた
係助詞「は」(この「は」とそれに続く「店員」は、図
8の13001番の条件を満たすものである)は、ステップ
S32の条件を満たすので、ステップS33において、
その位置にポーズが設定されることになる。
【0173】一方、注目ポーズ間に、優先度3のフラグ
がたてられた係助詞「は」であって、それに続く形態素
の品詞情報が非用言自立語であるものが存在しないと判
定された場合、ステップS34に進み、注目ポーズ間
に、優先度5の優先度フラグたてられた形態素が存在す
るか否かが判定される。ステップS34において、注目
ポーズ間に、優先度5の優先度フラグたてられた形態素
が存在すると判定された場合、ステップS35に進み、
その形態素の直後にポーズが設定され、ステップS31
に戻る。なお、注目ポーズ間に、優先度5の優先度フラ
グたてられた形態素が複数存在する場合には、そのうち
の、注目ポーズ間の中心(真ん中)に最も近い形態素の
位置にポーズが設定される。
【0174】また、ステップS35において、注目ポー
ズ間に、優先度5の優先度フラグたてられた形態素が存
在しないと判定された場合、ステップS36に進み、注
目ポーズ間に、優先度6の優先度フラグたてられた形態
素が存在するか否かが判定される。ステップS36にお
いて、注目ポーズ間に、優先度6の優先度フラグたてら
れた形態素が存在すると判定された場合、ステップS3
7に進み、その形態素の直後にポーズが設定され、ステ
ップS31に戻る。なお、注目ポーズ間に、優先度6の
優先度フラグたてられた形態素が複数存在する場合に
は、上述したステップS35における場合と同様に、そ
のうちの、注目ポーズ間の中心(真ん中)に最も近い形
態素の位置にポーズが設定される。
【0175】一方、ステップS36において、注目ポー
ズ間に、優先度6の優先度フラグたてられた形態素が存
在しないと判定された場合、処理を終了する。
【0176】なお、ステップS36で、注目ポーズ間
に、優先度6の優先度フラグたてられた形態素が存在し
ないと判定されて処理を終了する場合というのは、意味
の切れ目として不自然でない位置が存在せず、どうして
も一呼吸で朗読すべき場合に対応する。
【0177】また、図14においては、優先度4の優先
度フラグがたてられた形態素についての判定処理が抜け
ているが、これは、図8に示したポーズ優先度規則を用
いてシミュレーションを行ったところ、優先度4の優先
度フラグがたてられた形態素の判定処理を行っても、最
終的なポーズの設定位置にほとんど影響がなかったこと
による。従って、優先度4の優先度フラグがたてられた
形態素についての判定処理は、特に行わない方が良いと
いうことではない。
【0178】こうして設定されたポーズ(ポーズ情報)
をもとに、図1の発音記号生成部7において音韻韻律情
報が生成され、さらに韻律処理部8と音響処理部11を
経て、ポーズの挿入された合成音声が出力される。
【0179】以上のように、複合語規則、文節規則、ま
たは連文節規則は、形態素どうしを結合させる結合条件
と、その結合条件を満足する形態素どうしを結合して得
られる複合語、文節、または連文節に付加するフラグ情
報とを含み、ポーズ設定規則は、必要に応じて、フラグ
情報を用いて記述されているので、形態素を結合するこ
とにより、その結合した形態素全体に対し、フラグ情報
を与えることができ、さらにそのフラグ情報を用いてポ
ーズ設定規則および結合条件が記述されているので、結
合する形態素の組み合わせに応じて、ポーズを設定する
ことが可能となる。即ち、入力文を特に制限することな
く、その文中の適切な位置にポーズを挿入することが可
能となる。
【0180】また、入力文が形態素解析され、その形態
素解析結果から、複合語、文節、連用修飾連文節、連体
修飾連文節が同定されるので、処理の各段階で形成され
る単位(同定結果)を利用して、ポーズ設定処理と併せ
て、その他の様々な処理も行うことが可能となる。即
ち、例えば同定された複合語単位で、アクセントを付与
する処理を行ったり、また同定された文節単位でアクセ
ントやピッチなどを付与する処理を行うことが可能とな
る。
【0181】また、形態素解析の結果出力される品詞情
報は、いわゆる品詞だけでなく、それを統合した上位分
類や、あるいは細分化した下位分類を含むので、結合規
則およびポーズ設定規則の記述が容易になるとともに、
例えば形態素の品詞のみに基づいてポーズの設定を行う
場合に比較して、例外的な場合にも対処可能な精度の高
いポーズの設定を行う(より自然な位置にポーズの設定
を行う)ことが可能となる。
【0182】さらに、結合規則およびポーズ設定規則
を、形態素解析の結果得られる形態素文字列、品詞情報
などを用いて記述するようにしたので、それ以外の情報
の付与や入力が不要であり、従って簡単に処理系を構成
するモジュールを構築することができ、また汎用的な日
本語テキストを処理対象とすることができる。
【0183】また、連文節間に、ポーズが出現する頻度
を統計的に求めて作成したポーズ優先度規則と、実際の
人間の朗読結果から作成したポーズ絞り込み規則とに基
づいて、最終的なポーズの設定位置を決定するようにし
たので、自然な位置にポーズを設定することができる。
【0184】また、結合規則およびポーズ設定規則は、
各処理を行うモジュールにプログラムとして記述するの
ではなく、いわばテーブル形式で、プログラムとは別に
用意するようにしたので、その適用順序や増補改訂を容
易に行うことができる。
【0185】さらに、上述したように基準拍数範囲Aお
よび基準拍数Bは変更可能となされているので、処理対
象となる入力文に応じた自然で理解のしやすい合成音を
得ることが可能となる。
【0186】以上、本発明を音声合成装置に適用した場
合について説明したが、本発明は、音声合成装置の他、
例えば日本語の入力文を、他の言語に翻訳し、または逆
に他の言語を日本語に翻訳して音声で出力する音声翻訳
装置などに適用することが可能である。日本語のポーズ
の挿入される位置は日本語構文の意味的な切れ目と一致
するので、構文解析精度が向上し、他の言語への変換精
度を向上させることが可能となり、あるいはまた、日本
語に翻訳して音声で出力する際に、自然で聴きとりやす
い音声(合成音)を出力することが可能となる。
【0187】また、本発明は、例えば音声認識装置や、
音声入力が可能なワードプロセッサ、文書作成装置など
に適用することができる。音声認識装置に適用した場合
には、ポーズが挿入される前後の発話を認識対象をして
絞り込むことができ、またポーズ前後の形態素の組合せ
パターンは規則化されている(ポーズ設定規則に記述さ
れている)ので、認識精度を向上させることができる。
【0188】また、ワードプロセッサや文書作成装置に
適用した場合には、音声で入力された文章などの「仮名
漢字変換」を行うにあたって、ポーズにまたがる部分の
漢字変換処理を行なわないようにすることができるの
で、変換効率を向上させることができる。
【0189】さらに、本実施例では、結合規則に、結合
した形態素を分割する規則(分割規則)(複合語分割規
則、文節分割規則、連用修飾分割規則、連体修飾分割規
則)を含めるようにしたが、この分割規則は、必ずしも
結合規則に記述しておく必要はない。
【0190】また、本実施例においては、結合規則およ
びポーズ設定規則を、形態素解析結果のうちの形態素文
字列および品詞情報を用いて記述するようにしたが、そ
の他、例えばアクセントや拍数、発音などの形態素解析
結果を用いて記述するようにすることも可能である。
【0191】さらに、本実施例では、文法的な情報のみ
を、結合規則およびポーズ設定規則(ポーズ優先度規
則)に記述するようにしたが、意味的な情報も併せて記
述するようにしても良い。
【0192】また、本実施例においては、句読点を、結
合規則およびポーズ設定規則の適用対象とせず無視する
ようにしたが、結合規則およびポーズ設定規則の適用対
象とすることも可能である。即ち、本実施例では、例え
ば図5に示したような形態素解析結果が得られた場合に
おいて、例えば「丸の内」の前にある句点「、」を無視
し、「られ」と「丸の内」との間に、結合規則(ポーズ
設定規則)を適用するようにしたが、「、」と「丸の
内」との間にも、結合規則(ポーズ設定規則)を適用す
るようにすることが可能である。
【0193】
【発明の効果】以上の如く、本発明の自然言語処理方法
によれば、形態素を結合することにより、その結合した
形態素全体に対し、付加情報を与えることができ、さら
にその付加情報を用いてポーズ設定規則および結合条件
が記述されているので、結合する形態素の組み合わせに
応じて、ポーズを設定することが可能となる。即ち、入
力文を特に制限することなく、その文中の適切な位置に
ポーズを挿入することが可能となる。
【0194】また、本発明の音声合成装置によれば、入
力文を特に制限することなく、自然で理解のし易い合成
音を得ることができる。
【図面の簡単な説明】
【図1】本発明を適用した音声合成装置の一実施例の構
成を示すブロック図である。
【図2】品詞情報辞書を示す図である。
【図3】品詞情報辞書を示す図(図2に続く図)であ
る。
【図4】品詞情報辞書を示す図(図3に続く図)であ
る。
【図5】形態素解析結果を示す図である。
【図6】結合規則を示す図である。
【図7】結合規則を示す図(図6に続く図)である。
【図8】ポーズ優先度規則を示す図である。
【図9】結合処理およびポーズ優先度処理結果を示す図
である。
【図10】図1の結合処理部5およびポーズ設定処理部
6の動作を説明するフローチャートである。
【図11】動的分類方法を説明するための図である。
【図12】動的分類方法を説明するための図である。
【図13】図10のステップS11の処理のより詳細を
説明するフローチャートである。
【図14】図10のステップS11の処理のより詳細を
説明するフローチャート(図13のフローチャートに続
くフローチャート)である。
【符号の説明】
1 演算装置 2 メモリ装置 3 言語処理部 4 形態素解析部 5 結合処理部 6 ポーズ設定処理部 7 発音記号生成部 8 韻律処理部 9 韻律制御モデル用パラメータ生成部 10 韻律データ生成部 11 音響処理部

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 日本語でなる入力文を形態素解析し、 前記入力文の形態素解析結果から、複合語を構成する形
    態素間の文法的な関係を規定する複合語規則に基づいて
    複合語を同定し、 前記複合語の同定結果から、文節を構成する形態素間の
    文法的な関係を規定する文節規則に基づいて文節を同定
    し、 前記文節の同定結果から、連文節を構成する形態素間の
    文法的な関係を規定する連文節規則に基づいて連文節を
    同定し、 その結果得られる前記入力文を構成する、1以上の形態
    素からなる前記連文節に対し、統計的に求められた、文
    中に挿入されるポーズの位置を規定するポーズ設定規則
    を適用し、前記連文節間に挿入するポーズの位置を設定
    する自然言語処理方法であって、 前記複合語規則、文節規則、または連文節規則は、形態
    素どうしを結合させる結合条件と、その結合条件を満足
    する形態素どうしを結合して得られる複合語、文節、ま
    たは連文節に付加する付加情報とを含み、 前記ポーズ設定規則および結合条件は、必要に応じて、
    前記付加情報を用いて記述されていることを特徴とする
    自然言語処理方法。
  2. 【請求項2】 前記連文節規則は、連用修飾連文節を構
    成する形態素間の関係を規定する連用修飾規則と、連体
    修飾連文節を構成する形態素間の関係を規定する連体修
    飾規則とを含み、 前記文節の同定結果から、前記連用修飾規則または連体
    修飾規則に基づいて、連用修飾連文節または連体修飾連
    文節をそれぞれ同定することを特徴とする請求項1に記
    載の自然言語処理方法。
  3. 【請求項3】 前記形態素解析結果は、形態素文字列お
    よび品詞情報を少なくとも含み、 前記複合語規則、文節規則、連文節規則、またはポーズ
    設定規則は、前記形態素解析結果を用いて記述されてい
    ることを特徴とする請求項1または2に記載の自然言語
    処理方法。
  4. 【請求項4】 前記品詞情報は、品詞の他、前記品詞を
    統合した上位分類、および前記品詞を細分化した下位分
    類を含むことを特徴とする請求項3に記載の自然言語処
    理方法。
  5. 【請求項5】 前記下位分類は、活用形を少なくとも含
    むことを特徴とする請求項4に記載の自然言語処理方
    法。
  6. 【請求項6】 前記付加情報は、形態素の品詞を統合し
    た上位分類、または形態素の品詞を細分化した下位分類
    であることを特徴とする請求項1乃至5のいずれかに記
    載の自然言語処理方法。
  7. 【請求項7】 前記複合語規則、文節規則、または連文
    節規則には、結合した2つの形態素どうしを分離させる
    分離条件が、さらに記述されており、 前記分離条件にしたがって、結合した形態素を分離する
    ことを特徴とする請求項1乃至6のいずれかに記載の自
    然言語処理方法。
  8. 【請求項8】 複数の前記形態素からなる前記複合語
    と、それと隣接する形態素である隣接形態素との間に、
    前記複合語規則が適用される場合、前記複合語を構成す
    る複数の前記形態素のうち、前記隣接形態素と隣接する
    形態素と、前記隣接形態素との間に、前記複合語規則が
    適用されることを特徴とする請求項1乃至7のいずれか
    に記載の自然言語処理方法。
  9. 【請求項9】 複数の前記形態素からなる前記文節と、
    それと隣接する形態素である隣接形態素との間に、前記
    文節規則が適用される場合、前記文節を構成する複数の
    前記形態素のうち、前記隣接形態素と隣接する形態素
    と、前記隣接形態素との間に、前記文節規則が適用され
    ることを特徴とする請求項1乃至7のいずれかに記載の
    自然言語処理方法。
  10. 【請求項10】 複数の前記形態素からなる前記連文節
    と、それと隣接する形態素である隣接形態素との間に、
    前記連文節規則またはポーズ設定規則が適用される場
    合、前記連文節を構成する複数の前記形態素のうち、前
    記隣接形態素と隣接する形態素と、前記隣接形態素との
    間に、前記連文節規則またはポーズ設定規則が適用され
    ることを特徴とする請求項1乃至7のいずれかに記載の
    自然言語処理方法。
  11. 【請求項11】 前記ポーズ設定規則は、隣接する2つ
    の連文節における先の連文節を構成する形態素のうちの
    末尾の形態素と、後の連文節を構成する形態素のうちの
    先頭の形態素との間にポーズが挿入される頻度を、実際
    の文章の朗読結果から統計的に求めて作成されたもので
    あることを特徴とする請求項1乃至10のいずれかに記
    載の自然言語処理方法。
  12. 【請求項12】 前記ポーズ設定規則は、前記末尾の形
    態素と先頭の形態素との間にポーズを設定する設定条件
    が、その間にポーズを設定する優先順位を表す優先度が
    付されて記述された優先度規則と、ポーズの設定位置を
    絞り込むための絞り込み条件が記述された絞り込み規則
    とを含み、 前記優先度規則に基づいて、ポーズを設定する位置の候
    補を決定し、 その候補の中から、前記絞り込み規則に基づいて、ポー
    ズを設定する最終的な位置を決定することを特徴とする
    請求項11に記載の自然言語処理方法。
  13. 【請求項13】 日本語でなる入力文を自然言語処理す
    ることにより、その入力文に対応する音韻情報および韻
    律情報を求める生成手段と、 前記音韻情報および韻律情報に基づいて、前記入力文に
    対応する音声を合成する合成手段とを備え、 前記韻律情報は、前記入力文に挿入されるポーズの位置
    を含み、 前記生成手段は、前記ポーズの位置を、請求項1乃至1
    2のいずれかに記載の自然言語処理方法により求めるこ
    とを特徴とする音声合成装置。
JP26080994A 1994-10-26 1994-10-26 自然言語処理方法および音声合成装置 Expired - Fee Related JP3446342B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26080994A JP3446342B2 (ja) 1994-10-26 1994-10-26 自然言語処理方法および音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26080994A JP3446342B2 (ja) 1994-10-26 1994-10-26 自然言語処理方法および音声合成装置

Publications (2)

Publication Number Publication Date
JPH08123459A true JPH08123459A (ja) 1996-05-17
JP3446342B2 JP3446342B2 (ja) 2003-09-16

Family

ID=17353060

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26080994A Expired - Fee Related JP3446342B2 (ja) 1994-10-26 1994-10-26 自然言語処理方法および音声合成装置

Country Status (1)

Country Link
JP (1) JP3446342B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172289A (ja) * 1998-12-02 2000-06-23 Matsushita Electric Ind Co Ltd 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
JP2014098802A (ja) * 2012-11-14 2014-05-29 Yamaha Corp 音声合成装置
WO2021106069A1 (ja) * 2019-11-26 2021-06-03 日本電信電話株式会社 ポーズ推定モデル学習装置、ポーズ推定装置、それらの方法、およびプログラム
US11443732B2 (en) * 2019-02-15 2022-09-13 Lg Electronics Inc. Speech synthesizer using artificial intelligence, method of operating speech synthesizer and computer-readable recording medium

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172289A (ja) * 1998-12-02 2000-06-23 Matsushita Electric Ind Co Ltd 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
JP2014098802A (ja) * 2012-11-14 2014-05-29 Yamaha Corp 音声合成装置
US11443732B2 (en) * 2019-02-15 2022-09-13 Lg Electronics Inc. Speech synthesizer using artificial intelligence, method of operating speech synthesizer and computer-readable recording medium
WO2021106069A1 (ja) * 2019-11-26 2021-06-03 日本電信電話株式会社 ポーズ推定モデル学習装置、ポーズ推定装置、それらの方法、およびプログラム
JPWO2021106069A1 (ja) * 2019-11-26 2021-06-03

Also Published As

Publication number Publication date
JP3446342B2 (ja) 2003-09-16

Similar Documents

Publication Publication Date Title
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
KR20080045413A (ko) 정적 특성과 동적 특성이 반영된 끊어읽기 예측 방법 및이를 기반으로 하는 음성합성 방법 및 시스템
JP2007264284A (ja) 感情付加装置、感情付加方法及び感情付加プログラム
JP2003271194A (ja) 音声対話装置及びその制御方法
JP3446342B2 (ja) 自然言語処理方法および音声合成装置
JP3518898B2 (ja) 音声合成装置
JP4964695B2 (ja) 音声合成装置及び音声合成方法並びにプログラム
KR100806287B1 (ko) 문말 억양 예측 방법 및 이를 기반으로 하는 음성합성 방법및 시스템
JPH08335096A (ja) テキスト音声合成装置
JP3446341B2 (ja) 自然言語処理方法および音声合成装置
Koutny et al. Prosody prediction from text in Hungarian and its realization in TTS conversion
JP3589972B2 (ja) 音声合成装置
JP4751230B2 (ja) 韻律素片辞書作成方法、並びに音声合成装置及びプログラム
JP2005181840A (ja) 音声合成装置及び音声合成プログラム
Khamdamov et al. Syllable-Based Reading Model for Uzbek Language Speech Synthesizers
JPH0962286A (ja) 音声合成装置および音声合成方法
JPH0887289A (ja) 音声規則合成装置
JPH05134691A (ja) 音声合成方法および装置
JPH11296193A (ja) 音声合成装置
JP2003005776A (ja) 音声合成装置
JP2001350490A (ja) テキスト音声変換装置及び方法
JP2667553B2 (ja) 音声合成装置
JPH06176023A (ja) 音声合成システム
JP2721018B2 (ja) 音声規則合成装置
JP2002175094A (ja) 音声による情報提供装置、及び音声による情報提供方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030603

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080704

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080704

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090704

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees