JPH08123456A - 自然言語処理方法および音声合成装置 - Google Patents

自然言語処理方法および音声合成装置

Info

Publication number
JPH08123456A
JPH08123456A JP6254889A JP25488994A JPH08123456A JP H08123456 A JPH08123456 A JP H08123456A JP 6254889 A JP6254889 A JP 6254889A JP 25488994 A JP25488994 A JP 25488994A JP H08123456 A JPH08123456 A JP H08123456A
Authority
JP
Japan
Prior art keywords
morpheme
rule
morphemes
setting
pose
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6254889A
Other languages
English (en)
Other versions
JP3446341B2 (ja
Inventor
Tetsuya Kagami
徹也 加賀美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP25488994A priority Critical patent/JP3446341B2/ja
Publication of JPH08123456A publication Critical patent/JPH08123456A/ja
Application granted granted Critical
Publication of JP3446341B2 publication Critical patent/JP3446341B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G02OPTICS
    • G02FOPTICAL DEVICES OR ARRANGEMENTS FOR THE CONTROL OF LIGHT BY MODIFICATION OF THE OPTICAL PROPERTIES OF THE MEDIA OF THE ELEMENTS INVOLVED THEREIN; NON-LINEAR OPTICS; FREQUENCY-CHANGING OF LIGHT; OPTICAL LOGIC ELEMENTS; OPTICAL ANALOGUE/DIGITAL CONVERTERS
    • G02F1/00Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics
    • G02F1/01Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics for the control of the intensity, phase, polarisation or colour 
    • G02F1/03Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics for the control of the intensity, phase, polarisation or colour  based on ceramics or electro-optical crystals, e.g. exhibiting Pockels effect or Kerr effect

Landscapes

  • Physics & Mathematics (AREA)
  • Nonlinear Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Ceramic Engineering (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Optics & Photonics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 入力されたテキストから生成される合成音に
対し、適切なポーズを設定することができるようにす
る。 【構成】 形態素解析部4において、入力文が形態素解
析され、結合処理部5において、その形態素解析結果か
ら、複合語、文節、連用修飾連文節、連体修飾連文節が
同定される。そして、ポーズ優先度処理部6において、
その同定結果に対し、統計的に求められた、日本語の文
中に挿入されるポーズの位置を規定するポーズ設定規則
が適用され、挿入すべきポーズの位置が設定される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば日本語のテキス
トなどを自然言語処理し、その結果得られる情報に基づ
いて音声合成を行う場合などに用いて好適な自然言語処
理方法、並びに音声合成装置に関する。
【0002】
【従来の技術】従来の音声合成装置においては、例えば
漢字仮名混じり文を自然言語処理することにより、音韻
情報および韻律情報を求め、その音韻情報および韻律情
報に基づいて、入力された漢字仮名混じり文に対応する
音声の合成を行なうようになされている。この場合、合
成音を人間の発話に近づけるために、通常は、韻律情報
の一つとして、漢字仮名混じり文に挿入するポーズを求
めるようになされている。
【0003】従来の音声合成装置では、ポーズは、例え
ば漢字仮名混じり文中の句読点の位置に設定されるよう
になされている。
【0004】
【発明が解決しようとする課題】従って、従来において
は、ポーズの挿入位置は、文法的な規則を充分考慮せず
に設定されていたため、得られる合成音が不自然なもの
になる課題があった。
【0005】そこで例えば、"日本語文章音声の合成の
ための韻律規則"(河井、広瀬、藤崎:日本音響学会誌,
Vol.50,No.6,pp.433-442,1994年)に記載されているよ
うに、係り受け関係に基づくポーズ設定方法も提案され
ている。しかしながら、この方法は、主として意味的な
情報を必要とし、このような意味的情報を自然言語処理
する汎用的技術は確立されていないため、限定されたテ
キストのみが自然言語処理が対象となり、限定のない汎
用的なテキストに対する自然言語処理を行なうことが困
難であった。即ち、この方法では、合成音が自然に聴こ
えるように、全ての入力文にポーズ挿入位置を設定する
ことが難しかった。
【0006】また、従来においては、挿入したポーズ間
の拍(仮名文字単位に相当するもの)の数(拍数)(モ
ーラ数)(仮名表記にほぼ相当する発音単位数)が多過
ぎる場合、文法的な情報を加味せずに拍の合計数の半分
の位置にポーズを再設定するなどの方法をとっていたた
め、ポーズ設定の位置が不自然になることがあった。
【0007】よって従来では、合成音が聴きとりにくく
なったり、あるいはその内容を理解するのが困難になっ
たりする課題があった。
【0008】本発明は、このような状況に鑑みてなされ
たものであり、文中の適切な位置にポーズが設定できる
ようにし、これにより、例えば自然な合成音を得ること
ができるようにするものである。
【0009】
【課題を解決するための手段】本発明の自然言語処理方
法は、日本語でなる入力文を自然言語処理し、その入力
文に挿入するポーズの位置を設定する自然言語処理方法
であって、入力文を形態素解析し、入力文の形態素解析
結果から、複合語を構成する形態素間の文法的な関係を
規定する複合語規則に基づいて複合語を同定し、複合語
の同定結果から、文節を構成する形態素間の文法的な関
係を規定する文節規則に基づいて文節を同定し、文節の
同定結果から、連文節を構成する形態素間の文法的な関
係を規定する連文節規則に基づいて連文節を同定し、そ
の結果得られる入力文を構成する、1以上の形態素から
なる連文節に対し、統計的に求められた、文中に挿入さ
れるポーズの位置を規定するポーズ設定規則を適用し、
連文節間に挿入するポーズの位置を設定することを特徴
とする。
【0010】この自然言語処理方法においては、連文節
規則が、連用修飾連文節を構成する形態素間の関係を規
定する連用修飾規則と、連体修飾連文節を構成する形態
素間の関係を規定する連体修飾規則とを含む場合、文節
の同定結果から、連用修飾規則または連体修飾規則に基
づいて、連用修飾連文節または連体修飾連文節をそれぞ
れ同定することができる。また、形態素解析結果が、形
態素文字列および品詞情報を少なくとも含む場合、複合
語規則、文節規則、連文節規則、またはポーズ設定規則
を、形態素解析結果を用いて記述することができる。
【0011】品詞情報には、品詞の他、品詞を統合した
上位分類、および品詞を細分化した下位分類を含ませる
ことができる。また、下位分類には、活用形を少なくと
も含ませることができる。
【0012】さらに、複合語規則、文節規則、または連
文節規則には、2つの形態素どうしを結合させる結合条
件が記述されており、結合条件にしたがって形態素を結
合することにより、複合語、文節、または連文節を同定
することができる。また、複合語規則、文節規則、また
は連文節規則には、結合した2つの形態素どうしを分離
させる分離条件が、さらに記述されており、分離条件に
したがって、結合した形態素を分離することができる。
【0013】複数の形態素からなる複合語と、それと隣
接する形態素である隣接形態素との間に、複合語規則が
適用される場合、複合語を構成する複数の形態素のう
ち、隣接形態素と隣接する形態素と、隣接形態素との間
に、複合語規則を適用することができる。また、複数の
形態素からなる文節と、それと隣接する形態素である隣
接形態素との間に、文節規則が適用される場合、文節を
構成する複数の形態素のうち、隣接形態素と隣接する形
態素と、隣接形態素との間に、文節規則を適用すること
ができる。さらに、複数の形態素からなる連文節と、そ
れと隣接する形態素である隣接形態素との間に、連文節
規則またはポーズ設定規則が適用される場合、連文節を
構成する複数の形態素のうち、隣接形態素と隣接する形
態素と、隣接形態素との間に、連文節規則またはポーズ
設定規則を適用することができる。
【0014】ポーズ設定規則は、隣接する2つの連文節
における先の連文節を構成する形態素のうちの末尾の形
態素と、後の連文節を構成する形態素のうちの先頭の形
態素との間にポーズが挿入される頻度を統計的に求めて
作成することができる。また、ポーズ設定規則に、末尾
の形態素と先頭の形態素との間にポーズを設定する設定
条件が、その間にポーズを設定する優先順位を表す優先
度が付されて記述されている場合、入力文を構成する、
隣接する2つの連文節における末尾の形態素と先頭の形
態素との間のうち、所定の優先度より高い優先度の設定
条件を満足する末尾の形態素と先頭の形態素との間にポ
ーズを設定し、ポーズ間の拍数が所定の基準拍数より大
きい場合は、そのポーズ間における末尾の形態素と先頭
の形態素との間のうち、所定の優先度より低い優先度の
設定条件を満足する末尾の形態素と先頭の形態素との間
にポーズを設定することを繰り返すことができる。
【0015】また、ポーズ間の拍数が、所定の基準拍数
より大きい場合は、そのポーズ間における末尾の形態素
と先頭の形態素との間のうち、所定の優先度より低い優
先度の設定条件を満足する末尾の形態素と先頭の形態素
との間にポーズを設定することを、ポーズ間の拍数が所
定の基準拍数より小さくなるまで繰り返すことができ
る。さらに、拍数が所定の基準拍数より大きいポーズ間
に、所定の優先度より低い優先度の設定条件を満足する
末尾の形態素と先頭の形態素が存在しない場合には、ポ
ーズの設定を終了することができる。
【0016】本発明の音声合成装置は、日本語でなる入
力文を自然言語処理することにより、その入力文に対応
する音韻情報および韻律情報を求める生成手段(例え
ば、図1に示す言語処理部1および韻律処理部8など)
と、音韻情報および韻律情報に基づいて、入力文に対応
する音声を合成する合成手段(例えば、図1に示す音響
処理部11など)とを備え、韻律情報は、入力文に挿入
されるポーズの位置を含み、生成手段は、ポーズの位置
を、請求項1乃至14のいずれかに記載の自然言語処理
方法により求めることを特徴とする。
【0017】
【作用】本発明の自然言語処理方法においては、入力文
が形態素解析され、その形態素解析結果から、形態素間
の文法的な関係を規定する複合語規則、文節規則、およ
び連文節規則に基づいて、複合語、文節、および連文節
が同定される。そして、その同定結果に対し、統計的に
求められたポーズ設定規則が順次適用されることによ
り、連文節間に挿入するポーズの位置が設定される。従
って、文法的な規則に基づいて同定された連文節単位
で、統計的に求められたポーズ設定規則にしたがってポ
ーズが設定されるので、入力文中の適切な位置にポーズ
を挿入することができる。
【0018】本発明の音声合成装置においては、日本語
でなる入力文を自然言語処理することにより、その入力
文に対応する音韻情報および韻律情報が求められ、その
音韻情報および韻律情報に基づいて、入力文に対応する
音声が合成される。この場合に、韻律情報の一つであ
る、入力文に挿入されるポーズの位置が、請求項1乃至
14のいずれかに記載の自然言語処理方法により求めら
れる。従って、自然で理解のし易い合成音を得ることが
できる。
【0019】
【実施例】図1は、本発明を適用した音声合成装置の一
実施例の構成を示すブロック図である。この音声合成装
置においては、日本語の、例えば漢字仮名混じり文(例
えば、テキストデータでなるもの)など(以下、単に入
力文という)から、それに対応する合成音を生成するよ
うになされている。
【0020】この音声合成装置は、大きく分けて、演算
装置1とメモリ装置2とから構成されている。演算装置
1は、言語処理部3、韻律処理部8、および音響処理部
11の3つの基本的処理部から構成されており、メモリ
装置2は、演算装置1で用いられる辞書(漢字辞書その
他)、規則(形態素解析規則、結合規則、ポーズ設定規
則、パラメータ生成規則)、データ類(韻律制御モデ
ル、音素片データ)を記憶している。
【0021】言語処理部3は、形態素解析部4、結合処
理部5、ポーズ優先度処理部6、および発音記号生成部
7から構成され、入力文を自然言語処理し、合成する音
声(合成音)の音韻情報(入力文の読み(発音))、お
よび韻律情報(例えば、韻律句や、アクセント句(アク
セント型)、ポーズの位置、その長さ、その他の情報)
を生成(抽出)するようになされている。
【0022】韻律処理部8は、韻律制御モデル用パラメ
ータ生成部9および韻律データ生成部10から構成さ
れ、韻律制御モデル用パラメータ生成部(以下、パラメ
ータ生成部という)9は、言語処理部3で生成された音
韻情報および韻律情報に基づいて、合成音の韻律的特徴
を制御するモデルを駆動するためのパラメータ(モデル
制御パラメータ)を、メモリ装置2に記憶されているパ
ラメータ生成規則にしたがって生成するようになされて
いる。
【0023】韻律データ生成部10は、メモリ装置2に
記憶されている、合成音の韻律的特徴を制御する種々の
モデル(韻律制御モデル)を、パラメータ生成部9で生
成されたパラメータを用いて駆動し、これにより合成音
の韻律的特徴を表す具体的な数値(モデルから算出され
る数値)、即ち韻律データを生成するようになされてい
る。
【0024】音響処理部11は、言語処理部3または韻
律データ生成部10でそれぞれ生成された音韻情報また
は韻律データに基づいて音声合成を行い、その結果得ら
れた合成音を、図示せぬ合成音声部に送り、その内蔵す
る例えばスピーカなどから出力させるようになされてい
る。
【0025】なお、言語処理部3で生成された情報(後
述する音韻韻律情報)は、その後段のパラメータ生成部
9の他、パラメータ生成部9を介して韻律データ生成部
10および音響処理部11にも供給されるようになされ
ている。これは、韻律データ生成部10および音響処理
部11の処理で、音韻韻律情報に含まれる音韻情報が用
いられるためである。
【0026】次に、その動作について説明する。言語処
理部3では、そこに入力文が入力されると、その入力文
に対し自然言語処理が施される。
【0027】即ち、まず形態素解析部4で、辞書と形態
素解析規則を用いて、入力文が形態素解析されて、形態
素に分解され、さらにその発音(読み)、品詞情報およ
び拍数などが判定される。
【0028】さらに、形態素解析部4では、形態素解析
された各形態素に対し、アクセント(単語が、それ一つ
だけで発声される場合のアクセント(以下、適宜、基本
的なアクセントという))が付加され、必要に応じて、
母音の長音化、母音の無声化などの処理が施される。そ
して、その処理結果は、結合処理部5に供給される。
【0029】結合処理部5では、入力文を構成する各形
態素が、結合規則に基づいて結合され、さらに必要に応
じてその結合結果が分離され、これにより入力文の連文
節(1個以上の文節からなる単位(従って、1個以上の
形態素からなる単位でもある))が同定されると同時
に、連文節間にポーズを設定する位置が同定される。
【0030】その後、ポーズ優先度処理部6において、
ポーズ設定規則に基づいて、同定された連文節間にポー
ズが設定される。なお、ポーズ優先度処理部6ではポー
ズの設定とともに、そのポーズに対する優先度(後述す
る)の設定も行われ、その後、ポーズ間の拍数を加味し
て最終的なポーズの位置(以下、適宜、ポーズ情報とい
う)が設定される。
【0031】ポーズ情報の設定後、その設定結果から、
発音記号生成部7において、入力文の構造が求められ、
この文の構造に基づいて、韻律句その他の情報が求めら
れる。さらに、発音記号生成部7では、そして、ポーズ
優先度処理部6の処理結果、および形態素解析結果か
ら、音韻情報と韻律情報とを記号や文字で表現した情報
(この情報は、音韻情報と韻律情報を含むので、以下、
音韻韻律情報という)が生成される。
【0032】なお、形態素(単語)どうしが接続されて
文となると、その文中で形態素が発話される場合と、そ
の形態素が独立で発話される場合とで、形態素のアクセ
ントの位置が変化することがあるので、発音記号生成部
7は、音韻韻律情報の生成時に、例えば所定のアクセン
ト移動規則などに基づいて、フレーズ中のアクセントの
位置、即ちアクセント句も決定するようになされてい
る。
【0033】以上のようにして、言語処理部3は、入力
文の読み(音韻情報)、およびその入力文に対応する合
成音の韻律的特徴を制御するために必要な韻律句、アク
セント句、その他の韻律に関する情報を含む韻律情報で
なる音韻韻律情報を生成し、パラメータ生成部9に出力
する。
【0034】パラメータ生成部9では、言語処理部3か
らの音韻韻律情報およびメモリ装置2に記憶されたパラ
メータ生成規則に基づいて、例えば合成音の基本周波数
(ピッチ周波数)、音韻の継続時間長、およびパワー
(例えば、音素単位のパワー)などの韻律的特徴を制御
する、メモリ装置2に記憶されている韻律制御モデルを
駆動するためのパラメータが生成される。
【0035】即ち、メモリ装置2に、基本周波数を求め
るための韻律制御モデルとして、例えばいわゆる藤崎モ
デルが記憶されているとともに、継続時間長およびパワ
ーを求めるための韻律制御モデルとして、例えばいわゆ
る数量化1類によるモデルが記憶されている場合、パラ
メータ生成部9は、藤崎モデルを駆動するパラメータと
して、例えばフレーズ指令やアクセント指令の大きさお
よびその位置(フレーズ指令やアクセント指令をする時
点)などを設定し、数量化1類によるモデルを駆動する
パラメータとして、要因(例えば、音声合成しようとし
ている音素や、その前後の音素など)のカテゴリを設定
する。ここで、ポーズ優先度処理部6により設定された
ポーズ情報は、パラメータ生成部9におけるフレーズ指
令の位置を決定するのに利用される。
【0036】なお、韻律制御モデルは、上述したものの
他、従来から知られているその他のものなどを用いるよ
うにすることができる、ただし、パラメータ生成部9で
は、メモリ装置2に記憶された韻律制御モデルに対応す
るパラメータを生成するようにする必要がある。
【0037】韻律データ生成部10は、メモリ装置2に
記憶されている韻律制御モデルとしての、例えば藤崎モ
デルや数量化1類によるモデルなどが、パラメータ生成
部9で生成(設定)されたパラメータにより駆動され、
これにより韻律データが出力される。即ち、藤崎モデル
が駆動されることにより、韻律データとしての基本周波
数などが出力され、また数量化1類によるモデルが駆動
されることにより、韻律データとしてのパワーおよび継
続時間長などが出力される。
【0038】具体的には、韻律データとして、合成音の
フレーズごとの基本周波数値、音素ごとの継続時間を示
すフレーム数、および音節ごとのパワーの値を示すフレ
ーム数などが、音響処理部11に出力される。
【0039】音響処理部11は、例えば従来と同様の手
法で音声合成を行なう合成器、即ち例えば波形素片接続
による音声合成器や、いわゆるフォルマント合成器など
で構成されている。音響処理部11が、例えば波形素片
接続による音声合成器でなり、メモリ装置2に、例えば
CVやCVC/VCVなどの単位で、規則音声合成に必
要な音声素片データ(例えば、ディジタル化された波形
データ)が記憶されている場合、音響処理部11は、言
語処理部3で生成された音韻韻律情報のうちの音韻情
報、および韻律データ生成部10より出力された韻律デ
ータ(基本周波数、継続時間、およびパワーの時間の具
体的数値など)に基づいて、必要な音声素片データ(音
素片データ)を連続した音声波形となるように接続す
る。さらに、音響処理部11は、言語処理部3で生成さ
れた音韻韻律情報のうちのポーズ情報に基づき、音声波
形にポーズを挿入する。そして、合成音声部において、
この音声波形に対し、例えばD/A変換処理などの必要
な処理が施され、その内蔵するスピーカから出力され
る。
【0040】以上のようにして、入力文に対応する合成
音が出力される。
【0041】次に、言語処理部3を構成する形態素解析
部4における処理の詳細について説明する。
【0042】形態素解析部4では、上述したように、辞
書、形態素解析規則に基づいて、入力文が単語に相当す
る形態素に分解され、さらに、その発音(読み)、アク
セント、品詞情報、および拍数などが判定される。これ
らのうちの品詞情報は、形態素解析規則に含まれる、例
えば図2乃至図4に示すような品詞情報(活用形を含
む)を参照して、各形態素に付与される。
【0043】なお、図2乃至図4に示す品詞情報(活用
形を含む)は、結合規則およびポーズ設定規則にも含ま
れている。また、ここにいう品詞情報(活用形を含む)
には、いわゆる品詞の他、例えば「数字」や「アルファ
ベット」、その他記号なども含まれている(以下、これ
らも品詞として取り扱う)。さらに、この品詞情報(活
用形も含む)には、品詞を統合した上位分類、および品
詞を細分化した下位分類が含まれており、さらに活用形
も含まれている。ここで、以下では、図2乃至図4に示
した品詞情報(活用形)を、形態素に付与される品詞情
報と区別するために、品詞情報辞書という。
【0044】品詞情報辞書には、品詞情報が、「全品
詞」を最上位の階層(最上位分類)として、階層構造に
分類されて登録されている。
【0045】即ち、例えば、図2の下位分類「カ行五段
動詞」は「動詞」という上位階層の品詞に含まれ、「動
詞」という品詞は、「用言」という上位分類に含まれ
る。さらに、「用言」は、その上位の「自立語」という
上位分類に含まれ、「自立語」は、最上位分類の「全品
詞」に含まれる。
【0046】また、例えば図2の「固有名詞」は「名
詞」という上位の品詞(この場合、「名詞」は、「固有
名詞」の上位分類となる)に含まれ、「名詞」は、その
上位の「自立語」という上位分類に含まれる。「自立
語」は、上述したように最上位分類の「全品詞」に含ま
れる。
【0047】また、形態素解析部4から、形態素解析結
果として出力される品詞情報には、必要に応じて活用形
が含められるようになされている。即ち、形態素解析結
果は、例えば「助動詞/連用形」などように出力される
ようになされている。活用形は、図4に示すように、品
詞情報辞書の最後に、階層構造とは別に規定されてい
る。
【0048】なお、活用形は、品詞(但し、動詞や助動
詞などの活用がある品詞)の活用を表すから、活用形に
よって品詞を細分化することができる。従って、活用形
は、下位分類として取り扱う。
【0049】また、図2乃至図4には図示していない
が、必要に応じて、各品詞の最下位分類として、形態素
そのものを記述しておくことが可能である。即ち、例え
ば「名詞」の下位分類である「数詞」のさらに下位分類
として、具体的な数値を記述しておくことが可能であ
る。
【0050】品詞情報を、このような階層構造にしてお
くことにより、各種規則を記述する際に、効率的な記述
をすることができる。即ち、例えば、図3に示す「数
字」、「アルファベット」、「ひらがな」、「かたか
な」、「ギリシャ文字」、「ロシア文字」、および「単
漢字」のすべてを対象とする規則を記述する場合、これ
らのすべてを記述するのではなく、これらの上位の品詞
である「単漢字」を記述するだけで済むことになる。
【0051】また、上述したように、最下位分類とし
て、形態素そのものである、例えば具体的な数値を記述
しておくことにより、その具体的数値を除く「数詞」に
対しては、ある原則的な規定を適用するとともに、その
具体的数値にのみ、例外的な規定を適用することを、容
易に行うことができる。
【0052】次に、図5は、例えば入力文「昨夜男は店
員に押えられ、丸の内警察に窃盗の疑いで逮捕され
た。」が入力された場合における形態素解析部4の形態
素解析結果を示している。なお、形態素解析部4では、
入力文が形態素に分析され、図2乃至図4に示した品詞
情報辞書その他を参照して、各形態素に対し、品詞情報
その他が付与されるが、図5では、本願発明に関係する
項目だけを示してある。
【0053】即ち、図5においては、入力文「昨夜男は
店員に押えられ、丸の内警察に窃盗の疑いで逮捕され
た。」に含まれる形態素、その発音、アクセントの型、
品詞情報、拍数を、その左端の欄から右に順次示してあ
る。
【0054】ここで、形態素の発音(読み)は、原則と
してひらがなで示してあるが、長音は「ー」で、鼻濁音
は「゜」で、それぞれ示してある。また、アクセント
は、アクセント核(日本語は、アクセントのある拍の直
後、発話のレベルが高レベルから低レベルに落下する
が、この落下する部分がアクセント核)が、形態素の先
頭から何拍目にあるかを示すアクセント型によって示し
てある。但し、アクセント核のないものは、0型として
ある。また、付属語類(例えば助詞や句読点など)に
は、アクセントが付与されず、そのアクセントの欄に
は、「*」印を示してある。
【0055】さらに、図5における品詞情報は、図2乃
至図4に示した品詞情報辞書に記述されている品詞情報
である。なお、図5における品詞情報のうち、()内、
/以降、および・以降は、下位分類を示している。即
ち、品詞情報の、例えば1行目における「名詞(副詞用
法)」というのは、その形態素の品詞は「名詞」であ
り、その用法が副詞的であることを示している。但し、
形態素「昨夜」の品詞情報は、実際には、図2から「名
詞・普通名詞(副詞用法)」となるが、図5において
は、記述が煩雑になるので、「名詞(副詞用法)」とし
てある。
【0056】また、品詞情報の、例えば16行目におけ
る「名詞・サ変[サ変化]」とは、その形態素単独では
「名詞」であるが、その後に「サ変活用語尾」の形態素
が続いており、この場合には、その品詞を、「名詞」ま
たはサ変化した「動詞」のうち、サ変化した「動詞」と
して認定したことを意味している。
【0057】さらに、品詞情報の、例えば18行目にお
ける「助動詞/連用形」というのは、その形態その品詞
が「助動詞」であり、その活用が「連用形」であること
を示しいている。
【0058】また、各形態素の拍数は、原則として数字
で示してあるが、句読点の拍数はないものとして、*印
で示してある。
【0059】次に、以上のような形態素解析結果を処理
する結合処理部5の詳細、およびその後段のポーズ優先
度処理部6の詳細について説明する。
【0060】図6および図7は、結合処理部5で用いら
れる結合規則の例を示している。
【0061】この結合規則では、例えば8つの項目でな
る条件が記述されている。なお、ポーズ優先度処理部6
で参照するポーズ設定規則も同一の記述方法で記述され
ている(ポーズ設定規則については後述する)。
【0062】即ち、結合規則には、左端から右へ順番
に、(1)条件の番号、(2)前の形態素の見出し、
(3)前の形態素の品詞、(4)前の形態素の下位分
類、(5)前の形態素の活用、(6)後の形態素の見出
し、(7)後の形態素の品詞、(8)後の形態素の下位
分類の8つの項目でなる条件が記述されている。なお、
8つの項目のすべてを記述する必要は必ずしもなく、そ
のうちの必要な項目のみを記述しておくようにすればよ
い。図6および図7(後述する図8のポーズ設定規則に
おいても同様)では、ドントケア(Don't Care)の項目
は、NULLとしてある。
【0063】以上の8項目でなる条件は、入力文中の隣
接する2つの形態素が、複合語、文節、連文節、(連用
修飾連文節および連体修飾連文節)を構成すると文法的
に認められるときに満たすものである。
【0064】また、以上のような条件の集合である結合
規則(ポーズ設定規則も同様)は、図5で説明した形態
素解析結果(形態素を表す文字列(形態素文字列)、ア
クセント、品詞情報(活用形を含む)、拍数など)を用
いて記述される。なお、図6および図7に示した結合規
則(図8に示すポーズ設定規則も同様)では、形態素解
析結果のうちの形態素文字列、品詞情報(活用形を含
む)が用いられている。
【0065】(1)の条件の番号には、例えば、重複す
ることのない(ユニークな)数字が昇順に記述される。
なお、この条件の番号は、必ず記述する必要がある。ま
た、数字は、連続している必要はなく、不連続であって
も良い。
【0066】(2)の前の形態素の見出しには、隣接す
る2つの形態素のうち、前の形態素を表す形態素文字列
が記述され、(6)の後の形態素の見出しには、後の形
態素を表す文字列が記述される。即ち、(2)および
(6)には、図5に示した形態素解析結果のうちの左端
の欄に示した形態素が記述される。従って、例えば、
(2)は「丸の内」、(6)は「警察」のように、それ
ぞれ記述される。
【0067】(3)の前の形態素の品詞には、隣接する
2つの形態素のうち、前の形態素の品詞が記述され、
(7)の後の形態素の品詞には、後の形態素の品詞が記
述される。ここでいう形態素の品詞とは、図5に示した
形態素解析結果における品詞情報欄のうちの下位分類、
即ち丸括弧でくくられた、例えば「(副詞用法)」とい
う用法と、/以降の、例えば「未然形」などの活用形
(活用)を除く部分(品詞と・以降の下位分類)が記述
される。従って、例えば、(3)は「名詞」、(7)は
「一段動詞」のように、それぞれ記述される。
【0068】(4)の前の形態素の下位分類には、隣接
する2つの形態素のうち、前の形態素の下位分類のうち
の用法(図5の品詞情報のうちの丸括弧でくくられた部
分)が記述され、(8)の後の形態素の下位分類には、
後の形態素の下位分類のうちの用法が記述される。な
お、名詞は、その他に、例えば「(独立用法)」、
「(形式名詞用法)」などの多くの下位分類を有するが
図2ではその図示を省略してある。従って、例えば、
(4)は「(副詞用法)」、(8)は「(独立用法)」
のようにそれぞれ記述される。
【0069】(5)の前の形態素の活用には、隣接する
2つの形態素のうち、前の形態素の下位分類のうちの活
用(活用形)が記述される。ここでいう形態素の活用と
は、図5に示した形態素解析結果における品詞情報のう
ち、/以降の、例えば「未然形」などのように「〜形」
とされている部分を意味する。従って、例えば、(5)
は「未然形」などのように記述される。
【0070】図6および図7に示した結合規則は、複合
語を構成する形態素間の文法的な関係を規定する複合語
規則(複合語を構成する2つの形態素が文法的に満足す
べき条件)、文節を構成する形態素間の文法的な関係を
規定する文節規則(文節を構成する2つの形態素が文法
的に満足すべき条件)、連用修飾連文節を構成する形態
素間の文法的な関係を規定する連用修飾連文節規則(連
用修飾連文節を構成する2つの形態素が文法的に満足す
べき条件)、および連体修飾連文節を構成する形態素間
の文法的な関係を規定する連体修飾連文節規則(連体修
飾連文節を構成する2つの形態素が文法的に満足すべき
条件)を含んでいる。
【0071】結合処理部5では、隣接する2つの形態素
が、複合語規則、文節規則、連用修飾連文節規則、また
は連体修飾連文節規則に合致するか否かが判定され、そ
れぞれの規則に合致すると判定された場合、それらの2
つの形態素が複合語、文節、連用修飾連文節、または連
体修飾連文節を構成するものとして結合される。
【0072】ここで、上述のように2つの形態素を結合
規則に基づいて結合したものが、例外的に、複合語、文
節、連用修飾連文節、または連体修飾連文節を構成しな
い場合がある。そこで、このような例外的な場合に対処
すべく、複合語規則、文節規則、連用修飾連文節規則、
または連体修飾連文節規則は、結合した2つの形態素を
分割(分離)させるための規則(条件)を含んでいる。
【0073】ここで、以下、適宜、複合語、文節、連用
修飾連文節、または連体修飾連文節として形態素を結合
させるための規則を、複合語結合規則、文節結合規則、
連用修飾結合規則、または連体修飾結合規則とそれぞれ
いう。また、複合語、文節、連用修飾連文節、または連
体修飾連文節として結合した形態素を分割させるための
規則を複合語分割規則、文節分割規則、連用修飾分割規
則、または連体修飾分割規則とそれぞれいう。
【0074】従って、複合語規則、文節規則、連用修飾
連文節規則、または連体修飾連文節規則は、複合語結合
規則および複合語分割規則、文節結合規則および文節分
割規則、連用修飾結合規則および連用修飾分割規則、ま
たは連体修飾結合規則および連体修飾分割規則から、そ
れぞれ構成されているということができる。
【0075】図6および図7に示した条件(規則)のう
ち、(1)の条件の番号が、1000,2000,3000,4000,500
0,6000,7000,8000番台のものは、それぞれ複合語結合規
則、複合語分割規則、文節結合規則、文節分割規則、連
用修飾結合規則、連用修飾分割規則、連体修飾結合規
則、または連体修飾分割規則に相当する。
【0076】結合処理部5は、実際にはプログラムでな
るが、上述のように各規則をまとめておくことにより、
各規則にしたがって処理を行うプログラムのモジュール
それぞれに対し、用いる規則を簡単に指定することがで
きる。即ち、各モジュールに対しては、使用する規則
を、(1)の条件の番号(例えば1000番台や2000番台な
どのように)によって指定することができる。
【0077】次に、図8は、ポーズ優先度処理部6で用
いられるポーズ設定規則の例を示している。ポーズ設定
規則には、多くのサンプルの文章(例えば、新聞に記載
された文章)中に含まれる連文節間にポーズが挿入され
る場合の統計(頻度の統計)をとり(これは、文章を実
際に読んでもらうことにより行う)、その統計結果から
求めた、形態素間にポーズが挿入されるときに、その形
態素が満たす文法的な条件(ポーズの設定条件)が記述
されている。
【0078】なお、ポーズ設定規則は、上述したように
結合規則(図6および図7)と同様の記述方法によって
記述されている。
【0079】また、ポーズ設定規則に記述された設定条
件には、優先度が付されている。即ち、例えば、ある設
定条件を満たす形態素間にポーズが挿入される頻度が高
い場合、その設定条件には高い優先度が付され、またポ
ーズが挿入される頻度が低ければ、低い優先度が付され
ている。
【0080】このように、設定条件に優先度を付してお
くことにより、高い優先度の設定条件を満たす形態素間
に対して、優先的にポーズを設定するようにすることが
できる。従って、優先度は、ポーズを設定する優先順位
ということができる。
【0081】ここで、優先度は、例えば1が最も高く、
以下、数字が大きくなるごとに低くなっていくものとす
る。
【0082】図8においては、優先度1乃至5の設定条
件が、(1)の条件の番号が、11000,12000,13000,1
4000,15000番台の部分に、それぞれまとめて記述され
ている。
【0083】従って、ポーズ優先度処理部6でどの優先
度の設定条件を用いるかも、上述した結合処理部5にお
ける場合と同様に、(1)の条件の番号によって、簡単
に指定することができる。
【0084】次に、図9は、形態素解析結果(図5)を
結合処理部5で結合処理し、さらにその処理結果をポー
ズ優先度処理部6でポーズ優先度処理した結果を示して
いる。また、図10は、結合処理部5およびポーズ優先
度処理部6の動作を説明するフローチャートを示してい
る。
【0085】なお、結合処理部5では、ステップS1乃
至S9の処理が行われ、ポーズ優先度処理部6では、ス
テップS10乃至S13の処理が行われる。
【0086】まず、結合処理部5では、ステップS1に
おいて、基準拍数が設定される。ここで、基準拍数と
は、ポーズ設定後のポーズ間の最大拍数(例えば、ポー
ズがおかれた後、その拍数以内で次のポーズがおかれた
方が合成音が聴き易くなる場合の、その拍数)(ただ
し、句読点は拍数には含めない)を意味する。ここでは
基準拍数を、例えば20とする。
【0087】その後、ステップS2に進み、複合語結合
規則に基づいて、形態素解析結果(図5)から複合語が
同定される(複合語結合処理が行われる)。
【0088】ここで、複合語と同定された形態素のう
ち、先頭の形態素または末尾の形態素は、それぞれ
「頭」または「尾」と表される。また、複合語として他
の形態素に結合されずに残された形態素は「孤」と表さ
れる。なお、句読点はそのままとされる。
【0089】即ち、ステップS2では、図6および図7
の結合規則のうちの条件の番号1001からの1000番台の条
件(規則)を、図5の形態素解析結果における隣接する
2つの形態素間に適用し、いずれかの条件を満足するか
否かが判定される。そして、2つの形態素がいずれかの
条件を満足する場合は、前の形態素が「頭」、後の形態
素が「尾」とされる。
【0090】具体的には、図5において、例えば形態素
「昨夜」と「男」、および「丸の内」と「警察」は、い
ずれも図6に示した(1)条件の番号の1001の前の形態
素の品詞が「名詞」で、後の形態素の品詞が「名詞」と
いう条件を満足する。従って、この場合、「昨夜」=
頭、「男」=尾、「丸の内」=頭、「警察」=尾とされ
る。
【0091】なお、3個以上の形態素が連続して条件を
満足する場合には、先頭の形態素が「頭」、末尾の形態
素が「尾」とされ、それらの中間に挟まれた形態素は全
て「胴」とされる。例えば、品詞が「名詞」である形態
素「丸の内」、「中央」および「警察」からなる複合語
「丸の内中央警察」は、「丸の内」と「中央」、および
「中央」と「警察」が、1001の条件を満足するから、そ
れぞれ「丸の内」=頭、「中央」=胴、「警察」=尾と
される。
【0092】以上の複合語結合処理の後、ステップS3
に進み、複合語分割規則に基づいて、複合語分割処理が
行なわれる。即ち、ステップS3では、図6および図7
の結合規則のうちの条件の番号2001からの2000番台の条
件を、上述の複合語結合処理結果における、隣接する2
つの形態素間に適用し、いずれかの条件を満足するか否
かが判定される。そして、2つの形態系がいずれかの条
件を満足させる場合は、前の形態素が「頭」から「孤」
に、後の形態素が「尾」から「孤」に変更される。この
複合語分割処理は、複合語として結合した形態素の組合
せの中で、例外的に複合語と同定するのが好ましくない
ものを除外するために行われる。なお、後述するステッ
プS5,S7,S9の各処理も、ステップS4,S6,
S8の各処理で結合された形態素を例外的に除外(分
割)するために行なわれる。
【0093】具体的には、図5において、例えば、形態
素「昨夜」と「男」は、1001の条件を満足するから、上
述したように、「昨夜」=頭、「男」=尾とされる。し
かしながら、前の形態素である「昨夜」の下位分類は
「(副詞用法)」であり(図5)、また、後の形態素で
ある「男」の品詞が「名詞」であるから、この2つの形
態素は、図6の2001の条件を満たし、従って、「昨夜」
=孤、「男」=孤、と変更される。なお、分割された前
後の形態素は「孤」と「弧」になる場合の他、「尾」と
「頭」になる場合がある。即ち、例えば、「頭尾」とさ
れた2つの形態素が分割されれば「孤」と「弧」となる
が、例えば、「頭胴胴胴胴尾」とされた6つの形態素が
中央で分割されれば「頭胴尾」「頭胴尾」とされ、分割
された前後の形態素は、「尾」と「頭」になる。
【0094】以上の複合語結合処理、複合語分割処理の
処理結果を、図9の「語」の欄に示す。
【0095】ここで、結合処理部5およびポーズ優先度
処理部6で採用している基本的な処理方法について説明
する。即ち、結合処理部5およびポーズ優先度処理部6
では、2個以上の形態素が結合した際には、その先頭ま
たは末尾の形態素を、結合した形態素全体を代表する形
態素とするようになされている。従って、例えば、品詞
に着目して説明すれば、複合語結合処理によって結合さ
れた「丸の内警察」については、「丸の内」も、末尾の
形態素「警察」もその品詞は「名詞」であるから、いず
れかが代表となっても全体の品詞は名詞であるが、後述
する文節結合処理(ステップS4)の結果得られる「丸
の内警察に」については、先頭の形態素「丸の内」の品
詞は「名詞」であり、末尾の形態素「に」の品詞は「格
助詞」であるから、先頭または末尾のいずれの形態素が
代表になるかによって、結合された形態素全体の品詞が
異なることになる。
【0096】従って、図5に示した、例えば「丸の内警
察に」と、その前にある(隣接する)形態素「られ」と
の間に、結合規則またはポーズ設定規則が適用される場
合には、形態素「られ」と、「丸の内警察に」のうち
の、形態素「られ」に隣接する先頭の形態素「丸の内」
との間に結合規則またはポーズ設定規則が適用される。
【0097】また、例えば「丸の内警察に」と、その後
にある(隣接する)形態素「窃盗」との間に、結合規則
またはポーズ設定規則が適用される場合には、「丸の内
警察に」のうちの、形態素「窃盗」に隣接する末尾の形
態素「に」と、形態素「窃盗」との間に、結合規則また
はポーズ設定規則が適用される。
【0098】さらに、2個以上の形態素が結合したもの
どうしに対しては、隣接する末尾と先頭の形態素の間
に、結合規則またはポーズ設定規則が適用される。具体
的には、以下のような処理が行われる。(ここでは、1
つの形態素自体をカギ括弧「」で囲み、2つ以上の形態
素が結合したものを、その外側を丸括弧( )で囲んで
表すこととする)。
【0099】即ち、例えば、(「店員」「に」)と
(「押さえ」「られ」)とが隣接する場合、(「店員」
「に」)を代表する末尾の形態素「に」と、(「押さ
え」「られ」)を代表する先頭の形態素「押さえ」が、
形態素を結合する条件を満たせば、(「店員」「に」)
と(「押さえ」「られ」)は一つに結合され、その結
果、((「店員」「に」)(「押さえ」「られ」))と
なる。
【0100】従って、結合規則またはポーズ設定規則が
適用される形態素は、「頭」、「尾」、「孤」とされた
ものだけであり、「胴」とされたものには適用されな
い。
【0101】次に、ステップS3の処理後、ステップS
4に進み、文節結合処理が文節結合規則に基づいて行な
われ、これにより複合語の同定結果から文節が同定され
る。即ち、複合語分割処理の結果に対し、図6に示した
3001から始まる3000番台の文節結合規則が適用される。
これにより、図8の「語」の欄に示した、例えば(「丸
の内」「警察」)と、それに続く「に」は、「尾」とさ
れた形態素「警察」と「孤」とされた形態素「に」が、
図5に示した形態素解析結果から、図6に示した3003の
条件を満足するので結合され、((「丸の内」「警
察」)「に」)とされる。即ち、形態素「丸の内」、
「警察」、「に」は、それぞれ「頭」、「胴」、「尾」
とされる。同様に、例えば、「逮捕」、「さ」、
「れ」、「た」については、まず、図6の3001番の条件
を、「逮捕」と「さ」が満たすので、(「逮捕」
「さ」)とされる。次に、(「逮補」「さ」))を代表
する末尾の「さ」と隣接する「れ」が、図6の3004番の
条件を満たすので((「逮捕」「さ」「れ」)とされ
る。次に((「逮捕」「さ」)「れ」)を代表する末尾
の「れ」とそれに隣接する「た」が、図6の3006番の条
件を満たすので(((「逮捕」「さ」)「れ」)
「た」)と結合される。即ち、「逮捕」、「さ」、
「れ」、「た」は、それぞれ「頭」、「胴」、「胴」、
「尾」とされる。
【0102】以上の文節結合処理後、ステップS5に進
み、文節分割規則に基づいて、文節分割処置が行われ
る。即ち、文節を構成するとして結合された形態素間
に、文節分割規則が適用され、文節とは認められない結
合が解除される。
【0103】具体的には、文節として同定された
((「丸の内」「警察」)「に」)を構成する形態素
「警察」と「に」は、図6の4001番の条件を満たすの
で、(「丸の内」「警察」)と「に」に分割される。
【0104】文節結合処理および文節分割処理により得
られた結果を、図9の「文節」の欄に示す。なお、図9
は、結合規則に4001番の条件が記述されていない場合の
処理結果を示している。
【0105】以下、ステップS6乃至S9に順次進み、
連用修飾結合規則、連用修飾分割規則、連体修飾結合規
則、または連体修飾分割規則に基づいて、連用修飾結合
処理、連用修飾分割処理、連体修飾結合処理、または連
体修飾分割処理がそれぞれ行われる。
【0106】即ち、文節の同定結果から、連用修飾連文
節と連体修飾連文節とが同定される。なお、ステップS
6およびS7の処理は、ステップS8およびS9の処理
の前ではなく、その後に行うようにしても良い。但し、
ステップS6およびS7の処理を、ステップS8および
S9の処理の前に行う方が、より自然な合成音が得られ
ることが、シミュレーションによりわかっている。
【0107】具体的には、連用修飾結合処理では、図9
の「文節」の欄に示すように処理された、例えば(「店
員」「に」)と(「押さえ」「られ」)は、(「店員」
「に」)を代表する末尾の「に」と、(「押さえ」「ら
れ」)を代表する「押さえ」が、図5の形態素解析結果
から、図7の5002番の条件を満たすので、((「店員」
「に」)(「押さえ」「られ」))のように結合され、
図9の句1の欄に示すように、「店員」、「に」、「押
さえ」、「られ」はそれぞれ「頭」、「胴」、「胴」、
「尾」とされる。
【0108】次に、連用修飾分割処理では、連用修飾連
文節として同定された((「店員」「に」)(「押さ
え」「られ」)は、(「店員」「に」)の末尾の「に」
と、(「押さえ」「られ」)の先頭の「押さえ」が、図
7の6001番の条件を満たすので、結合を解除され、
(「店員「「に」)と(「押さえ」「られ」)に分割さ
れる。
【0109】連用修飾結合処理および連用修飾分割処理
により得られた結果を、図9の「句1」の欄に示す。な
お、図9は、結合規則に6001番の条件が記述されていな
い場合の処理結果を示している。
【0110】連体修飾結合処理または連体修飾分割処理
においても、連用修飾結合処理または連用修飾分割処理
とそれぞれ同様の処理が、連体修飾結合規則または連体
修飾分割規則を参照して行われ、これにより図9の「句
2」の欄に示すような処理結果が得られる。なお、図9
は、結合規則に8001番の条件が記述されていない場合の
処理結果を示している。
【0111】以上のステップS2乃至S9の処理により
入力文の連文節の同定がなされた後、ステップS10に
進み、ポーズ設定優先度付与処理が行われる。
【0112】即ち、ポーズ優先度処理部6では、図9の
「句2」の欄が「孤」または「尾」とされた形態素と、
それに続く(その次の)形態素との間のみに、図8に示
したポーズ設定規則が適用される。
【0113】そして、例えば、「孤」とされた形態素
「昨夜」と、その次の「頭」とされた形態素「男」は、
図5の形態素解析結果から、図8の13001番の優先度3
の条件を満たすので、ポーズを挿入する位置の候補であ
ることを示す優先度3のフラグが「昨夜」にたてられ
る。
【0114】また、例えば「尾」とされた形態素「は」
と、その次の「頭」とされた形態素「店員」は、図5の
形態素解析結果から、図8の優先度4の14001番の条件
を満たすので、優先度4のフラグが「は」にたてられ
る。以下同様にして、図9の「間」の欄に示すようにフ
ラグ(優先度フラグ)がたてられる。なお、図9の
「間」の欄には、フラグがたてられた位置に、優先度を
示す数字を示してある。
【0115】さらに、ポーズ設定優先度付与処理では、
優先度フラグが立てられた位置の間の拍数の小計が求め
られる。但し、入力文中の最初と最後の優先度フラグに
ついては、入力文の先頭から最初の優先度フラグまでの
拍数の小計が、また最後の優先度フラグから入力文の最
後までの拍数の小計が、それぞれ求められる。
【0116】図9の右端の「拍」の欄の数字は、この小
計値を表している。例えば、「昨夜」(3拍)について
は、その拍数である3拍となり、例えば「は」(1拍)
については、「男」(3拍)との小計で4拍となり、ま
た、例えば「られ」(2拍)については、「店員」(4
拍)からの小計で10拍となる。
【0117】ポーズ設定優先度付与処理の後、ステップ
S11に進み、所定の優先度以上のフラグがたてられた
位置(フラグがたてられた形態素と、その次の形態素と
の間)にポーズが設定される。
【0118】即ち、所定の優先度を、例えば3とした場
合には、ステップS11において、優先度が3より高い
形態素「昨夜」、「られ」、および「た」の直後にポー
ズが設定される。
【0119】そして、ステップS12に進み、既にポー
ズが設定された位置(ポーズ設定位置)の間の拍数が、
基準拍数を越えているか否かが判定される。ステップS
12において、ポーズ設定位置間の拍数が、基準拍数を
越えていると判定された場合、ステップS13に進み、
そのポーズ設定位置間において、最も優先度が高いフラ
グがたてられている位置に、ポーズが設定(追加設定)
され、ステップS12に戻る。
【0120】以下、ステップS12において、ポーズ設
定位置間の拍数が、基準拍数を越えていないと判定され
るまで、ステップS12およびS13の処理が繰り返さ
れる。
【0121】一方、ステップS12において、ポーズ設
定位置間の拍数が、基準拍数を越えていないと判定され
た場合、処理を終了し、その処理結果が、ポーズ優先度
処理部6から発音記号生成部7に出力される。
【0122】図9に示した場合では、ステップS11に
おいて、優先度1乃至3のフラグがたてられた位置に、
ポーズが設定される。この場合、その後に、優先度4ま
たは5のフラグがそれぞれたてられた「は」または
「に」の位置(直後)にポーズを設定することができ
る。しかしながら、既にポーズが設定された「昨夜」
(優先度3)から「られ」(優先度2)までの拍数(ポ
ーズ設定位置間の拍数)は(4拍+10拍で)14拍な
ので、基準拍数20を越えていないから、優先度4のフ
ラグがたてられた「は」の直後にはポーズは設定されな
い。一方、既にポーズが設定された「られ」(優先度
2)から「た」(優先度1)までの拍数の小計は(10
拍+15拍で)25拍なので、基準拍数20を越えてお
り、従って優先度5のフラグがたてられた「に」の直後
にポーズが設定される。
【0123】即ち、図9に示した場合においては、
「は」を除く、優先度フラグがたてられた形態素の直後
すべてにポーズが設定される。なお、仮に、「られ」
(優先度2)から「た」(優先度1)までの間に、優先
度5のフラグがたてられた「に」の他に、それよりも優
先度の高い(例えば優先度4の)フラグがたてられた形
態素が存在すれば、その形態素の直後にポーズが設定さ
れることになる。また、仮に、「られ」(優先度2)か
ら「た」(優先度1)までの間に、フラグがたてられた
形態素が存在しなければ、処理を終了する。
【0124】こうして、設定されたポーズ(ポーズ情
報)をもとに、図1の発音記号生成部7において音韻韻
律情報が生成され、さらに韻律処理部8と音響処理部1
1を経て、ポーズの挿入された合成音声が出力される。
【0125】以上のように、文法的な規則である結合規
則に基づいて同定された連文節単位で、統計的に求めら
れたポーズ設定規則にしたがってポーズを設定するよう
にしたので、入力文中の適切な位置にポーズを挿入する
ことができる。
【0126】また、結合規則およびポーズ設定規則を、
形態素解析の結果得られる形態素文字列、品詞情報など
を用いて記述するようにしたので、それ以外の情報の付
与や入力が不要であり、従って簡単に処理系を構成する
モジュールを構築することができ、また汎用的な日本語
テキストを処理対象とすることができる。
【0127】さらに、結合規則およびポーズ設定規則
を、形態素解析の結果得られる形態素間の結合の、いわ
ば可否関係を判定するための条件によって記述するよう
にしたので、規則の記述を容易に行うことができ、さら
に処理系を構成するモジュールのメンテナンス(モジュ
ールの変更、追加、削除など)を容易に行うことがで
き、その結果、多様なポーズ設定を行うことが可能とな
る。
【0128】また、結合した形態素の、いわば文法的性
質を、その先頭の形態素または末尾形態素の文法的性質
に代表させて処理するようにしたので、処理に必要な関
数(モジュールを構成する関数)を単純化することが可
能となる。その結果、例えば連用修飾連文節を同定する
処理と連体修飾連文節を同定する処理の順序を逆にした
り、また処理関数を追加するなどの改良、メンテナンス
を容易に行うことができる。
【0129】さらに、ポーズ設定規則は、隣接する連文
節の末尾と先頭の形態素間にポーズが出現する頻度を統
計的に求めたものに基づいて記述されているので、入力
文に違和感のないポーズの挿入を行うことができる。
【0130】また、基準拍数を予め設定し、ポーズ設定
位置間に含まれる形態素の拍数の合計が多くなり過ぎた
場合に、文法的に妥当性の高い順(優先度順)にポーズ
の再設定を行うようにしたので、入力文の長さに対応し
た適切な数のポーズを、より妥当性の高い位置に設定す
ることができる。
【0131】以上、本発明を音声合成装置に適用した場
合について説明したが、本発明は、音声合成装置の他、
例えば日本語の入力文を、他の言語に翻訳し、または逆
に他の言語を日本語に翻訳して音声で出力する音声翻訳
装置などに適用することが可能である。日本語のポーズ
の挿入される位置は日本語構文の意味的な切れ目と一致
するので、構文解析精度が向上し、他の言語への変換精
度を向上させることが可能となり、あるいはまた、日本
語に翻訳して音声で出力する際に、自然で聴きとりやす
い音声(合成音)を出力することが可能となる。
【0132】また、本発明は、例えば音声認識装置や、
音声入力が可能なワードプロセッサ、文書作成装置など
に適用することができる。音声認識装置に適用した場合
には、ポーズが挿入される前後の発話を認識対象をして
絞り込むことができ、またポーズ前後の形態素の組合せ
パターンは規則化されている(ポーズ設定規則に記述さ
れている)ので、認識精度を向上させることができる。
【0133】また、ワードプロセッサや文書作成装置に
適用した場合には、音声で入力された文章などの「仮名
漢字変換」を行うにあたって、ポーズにまたがる部分の
漢字変換処理を行なわないようにすることができるの
で、変換効率を向上させることができる。
【0134】なお、ポーズの設定は、図10(図10の
ステップS11乃至S13)で説明したようにして行う
他、例えば次のようにして行うことが可能である。即
ち、優先度フラグがたてられた位置すべてにポーズを設
定したり、あるいは優先度が所定の優先度以上のフラグ
がたてられた位置にのみポーズを設定する(例えば、優
先度1から3までなど)ようにすることが可能である。
【0135】また、図10のステップS1で設定された
基準拍数より、図9の「拍」の欄の拍数が大きい部分に
のみ、優先度に関係なくポーズを設定するようにするこ
とも可能である。例えば、基準拍数を8とした場合に
は、「られ」(10拍)、「に」(10拍)、および
「た」(15拍)の直後にのみ、ポーズが設定されるこ
とになる。さらに、以上の方法を組み合わせてポーズを
設定するようにすることも可能である。
【0136】また、本実施例では、結合規則に、結合し
た形態素を分割する規則(分割規則)(複合語分割規
則、文節分割規則、連用修飾分割規則、連体修飾分割規
則)を含めるようにしたが、この分割規則は、必ずしも
結合規則に記述しておく必要はない。但し、分割規則
は、例えば次のような場合に、特に有用である。
【0137】即ち、例えば図8のポーズ設定規則に、13
025,"の",格助詞,NULL,NULL,"疑い",名詞,NULL,という
条件を記述し、優先度3より高い優先度のフラグがたて
られた位置に、無条件にポーズを設定するようにすると
ともに、結合規則に、図7に示した8001番の条件を含む
連体修飾分割規則を記述しておくようにした場合、
「の」と「疑い」は、8001番の条件を満たすから、連体
修飾連文節を構成するとして結合された後に、連体修飾
分割処理で分割される。従って、「の」についての「句
2」の欄は、「尾」とされ、フラグをたてる対象となる
から、上述の13025番の条件によって、「の」に対して
は、優先度3のフラグがたてられる。
【0138】よって、「の」と「疑い」との間には、必
ずポーズが設定されることになる。
【0139】以上のように、連体修飾分割規則(8001番
の条件)を記述しておくことにより、特定の形態素間に
必ずポーズを設定することができる。従って、分割規則
は、例えば特定の数字や、固有名詞などの前または後に
ポーズを挿入し、その部分を注目させようとする場合
に、特に有用である(上述の場合は、「疑い」の前の形
態素が「の」であれば、その間に、ポーズが必ず設定さ
れる)。
【0140】また、本実施例においては、結合規則およ
びポーズ設定規則を、形態素結果のうちの形態素文字列
および品詞情報を用いて記述するようにしたが、その
他、例えばアクセントや拍数、発音などの形態素結果を
用いて記述するようにすることも可能である。
【0141】さらに、本実施例では、文法的な情報のみ
を、結合規則およびポーズ設定規則に記述するようにし
たが、意味的な情報も併せて記述するようにしても良
い。
【0142】また、本実施例では、基準拍数を一定値に
するようにしたが、入力文中の1文の拍数に対応して、
文単位で変更するようにすることが可能である。即ち、
例えば1文の拍数が多い場合には、基準拍数を大きな値
とし、また1文の拍数が少ない場合には、基準拍数を小
さくするようにすることが可能である。
【0143】具体的には、例えば1文の拍数が50拍で
ある場合に、基準拍数を20としたときには、例えば拍
数が100拍の1文に対する基準拍数を40(=20×
100/50)としたり、また、例えば拍数が10拍の
1文に対する基準拍数を8(=20×10/50)とす
ることが可能である。このように、1文の拍数に対応し
て基準拍数を変更するようにした場合には、短い拍数の
文が入力されても、その文中にポーズが設定されること
になる。
【0144】
【発明の効果】以上の如く、本発明の自然言語処理方法
によれば、入力文中の適切な位置にポーズを挿入するこ
とができる。
【0145】また、本発明の音声合成装置によれば、自
然で理解のし易い合成音を得ることができる。
【図面の簡単な説明】
【図1】本発明を適用した音声合成装置の一実施例の構
成を示すブロック図である。
【図2】品詞情報辞書を示す図である。
【図3】品詞情報辞書を示す図(図2に続く図)であ
る。
【図4】品詞情報辞書を示す図(図3に続く図)であ
る。
【図5】形態素解析結果を示す図である。
【図6】結合規則を示す図である。
【図7】結合規則を示す図(図6に続く図)である。
【図8】ポーズ設定度規則を示す図である。
【図9】図1の結合処理部5およびポーズ優先度処理部
6の処理結果例を示す図である。
【図10】図1の結合処理部5およびポーズ優先度処理
部6の処理を説明するフローチャートである。
【符号の説明】
1 演算装置 2 メモリ装置 3 言語処理部 4 形態素解析部 5 結合処理部 6 ポーズ優先度処理部 7 発音記号生成部 8 韻律処理部 9 韻律制御モデル用パラメータ生成部 10 韻律データ生成部 11 音響処理部

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 日本語でなる入力文を自然言語処理し、
    その入力文に挿入するポーズの位置を設定する自然言語
    処理方法であって、 前記入力文を形態素解析し、 前記入力文の形態素解析結果から、複合語を構成する形
    態素間の文法的な関係を規定する複合語規則に基づいて
    複合語を同定し、 前記複合語の同定結果から、文節を構成する形態素間の
    文法的な関係を規定する文節規則に基づいて文節を同定
    し、 前記文節の同定結果から、連文節を構成する形態素間の
    文法的な関係を規定する連文節規則に基づいて連文節を
    同定し、 その結果得られる前記入力文を構成する、1以上の形態
    素からなる前記連文節に対し、統計的に求められた、文
    中に挿入されるポーズの位置を規定するポーズ設定規則
    を適用し、前記連文節間に挿入するポーズの位置を設定
    することを特徴とする自然言語処理方法。
  2. 【請求項2】 前記連文節規則は、連用修飾連文節を構
    成する形態素間の関係を規定する連用修飾規則と、連体
    修飾連文節を構成する形態素間の関係を規定する連体修
    飾規則とを含み、 前記文節の同定結果から、前記連用修飾規則または連体
    修飾規則に基づいて、連用修飾連文節または連体修飾連
    文節をそれぞれ同定することを特徴とする請求項1に記
    載の自然言語処理方法。
  3. 【請求項3】 前記形態素解析結果は、形態素文字列お
    よび品詞情報を少なくとも含み、 前記複合語規則、文節規則、連文節規則、またはポーズ
    設定規則は、前記形態素解析結果を用いて記述されてい
    ることを特徴とする請求項1または2に記載の自然言語
    処理方法。
  4. 【請求項4】 前記品詞情報は、品詞の他、前記品詞を
    統合した上位分類、および前記品詞を細分化した下位分
    類を含むことを特徴とする請求項3に記載の自然言語処
    理方法。
  5. 【請求項5】 前記下位分類は、活用形を少なくとも含
    むことを特徴とする請求項4に記載の自然言語処理方
    法。
  6. 【請求項6】 前記複合語規則、文節規則、または連文
    節規則には、2つの形態素どうしを結合させる結合条件
    が記述されており、 前記結合条件にしたがって形態素を結合することによ
    り、前記複合語、文節、または連文節を同定することを
    特徴とする請求項1乃至5のいずれかに記載の自然言語
    処理方法。
  7. 【請求項7】 前記複合語規則、文節規則、または連文
    節規則には、結合した2つの形態素どうしを分離させる
    分離条件が、さらに記述されており、 前記分離条件にしたがって、結合した形態素を分離する
    ことを特徴とする請求項6に記載の自然言語処理方法。
  8. 【請求項8】 複数の前記形態素からなる前記複合語
    と、それと隣接する形態素である隣接形態素との間に、
    前記複合語規則が適用される場合、前記複合語を構成す
    る複数の前記形態素のうち、前記隣接形態素と隣接する
    形態素と、前記隣接形態素との間に、前記複合語規則が
    適用されることを特徴とする請求項1乃至7のいずれか
    に記載の自然言語処理方法。
  9. 【請求項9】 複数の前記形態素からなる前記文節と、
    それと隣接する形態素である隣接形態素との間に、前記
    文節規則が適用される場合、前記文節を構成する複数の
    前記形態素のうち、前記隣接形態素と隣接する形態素
    と、前記隣接形態素との間に、前記文節規則が適用され
    ることを特徴とする請求項1乃至7のいずれかに記載の
    自然言語処理方法。
  10. 【請求項10】 複数の前記形態素からなる前記連文節
    と、それと隣接する形態素である隣接形態素との間に、
    前記連文節規則またはポーズ設定規則が適用される場
    合、前記連文節を構成する複数の前記形態素のうち、前
    記隣接形態素と隣接する形態素と、前記隣接形態素との
    間に、前記連文節規則またはポーズ設定規則が適用され
    ることを特徴とする請求項1乃至7のいずれかに記載の
    自然言語処理方法。
  11. 【請求項11】 前記ポーズ設定規則は、隣接する2つ
    の連文節における先の連文節を構成する形態素のうちの
    末尾の形態素と、後の連文節を構成する形態素のうちの
    先頭の形態素との間にポーズが挿入される頻度を統計的
    に求めて作成されたものであることを特徴とする請求項
    1乃至10のいずれかに記載の自然言語処理方法。
  12. 【請求項12】 前記ポーズ設定規則には、前記末尾の
    形態素と先頭の形態素との間にポーズを設定する設定条
    件が、その間にポーズを設定する優先順位を表す優先度
    が付されて記述されており、 前記入力文を構成する、隣接する2つの連文節における
    前記末尾の形態素と先頭の形態素との間のうち、所定の
    優先度より高い優先度の前記設定条件を満足する前記末
    尾の形態素と先頭の形態素との間にポーズを設定し、 ポーズ間の拍数が所定の基準拍数より大きい場合は、そ
    のポーズ間における前記末尾の形態素と先頭の形態素と
    の間のうち、前記所定の優先度より低い優先度の前記設
    定条件を満足する前記末尾の形態素と先頭の形態素との
    間にポーズを設定することを繰り返すことを特徴とする
    請求項11に記載の自然言語処理方法。
  13. 【請求項13】 前記ポーズ間の拍数が、所定の基準拍
    数より大きい場合は、そのポーズ間における前記末尾の
    形態素と先頭の形態素との間のうち、前記所定の優先度
    より低い優先度の前記設定条件を満足する前記末尾の形
    態素と先頭の形態素との間にポーズを設定することを、
    前記ポーズ間の拍数が前記所定の基準拍数より小さくな
    るまで繰り返すことを特徴とする請求項12に記載の自
    然言語処理方法。
  14. 【請求項14】 拍数が前記所定の基準拍数より大きい
    前記ポーズ間に、前記所定の優先度より低い優先度の前
    記設定条件を満足する前記末尾の形態素と先頭の形態素
    が存在しない場合には、ポーズの設定を終了することを
    特徴とする請求項12または13に記載の自然言語処理
    方法。
  15. 【請求項15】 日本語でなる入力文を自然言語処理す
    ることにより、その入力文に対応する音韻情報および韻
    律情報を求める生成手段と、 前記音韻情報および韻律情報に基づいて、前記入力文に
    対応する音声を合成する合成手段とを備え、 前記韻律情報は、前記入力文に挿入されるポーズの位置
    を含み、 前記生成手段は、前記ポーズの位置を、請求項1乃至1
    4のいずれかに記載の自然言語処理方法により求めるこ
    とを特徴とする音声合成装置。
JP25488994A 1994-10-20 1994-10-20 自然言語処理方法および音声合成装置 Expired - Fee Related JP3446341B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25488994A JP3446341B2 (ja) 1994-10-20 1994-10-20 自然言語処理方法および音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25488994A JP3446341B2 (ja) 1994-10-20 1994-10-20 自然言語処理方法および音声合成装置

Publications (2)

Publication Number Publication Date
JPH08123456A true JPH08123456A (ja) 1996-05-17
JP3446341B2 JP3446341B2 (ja) 2003-09-16

Family

ID=17271253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25488994A Expired - Fee Related JP3446341B2 (ja) 1994-10-20 1994-10-20 自然言語処理方法および音声合成装置

Country Status (1)

Country Link
JP (1) JP3446341B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2837969A1 (en) 2003-09-29 2015-02-18 Nikon Corporation Exposure apparatus, exposure method, and method for producing device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2837969A1 (en) 2003-09-29 2015-02-18 Nikon Corporation Exposure apparatus, exposure method, and method for producing device

Also Published As

Publication number Publication date
JP3446341B2 (ja) 2003-09-16

Similar Documents

Publication Publication Date Title
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
JP2001034283A (ja) 音声合成方法、音声合成装置及び音声合成プログラムを記録したコンピュータ読み取り可能な媒体
O'Malley Text-to-speech conversion technology
JPH11249677A (ja) 音声合成装置の韻律制御方法
Maia et al. Towards the development of a brazilian portuguese text-to-speech system based on HMM.
JP3706758B2 (ja) 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
JP3446342B2 (ja) 自然言語処理方法および音声合成装置
JP3446341B2 (ja) 自然言語処理方法および音声合成装置
JP3006240B2 (ja) 音声合成方法および装置
Koutny et al. Prosody prediction from text in Hungarian and its realization in TTS conversion
Khamdamov et al. Syllable-Based Reading Model for Uzbek Language Speech Synthesizers
JP2002123281A (ja) 音声合成装置
Dessai et al. Development of Konkani TTS system using concatenative synthesis
JP3031691B2 (ja) 音声規則合成装置
JPH11296193A (ja) 音声合成装置
JP2667553B2 (ja) 音声合成装置
JP2003005776A (ja) 音声合成装置
Evans et al. Connected speech processes in intonation
JPH0229797A (ja) テキスト音声変換装置
JPH08160983A (ja) 音声合成装置
Kayte et al. Artificially Generatedof Concatenative Syllable based Text to Speech Synthesis System for Marathi
JPH06176023A (ja) 音声合成システム
JP2002258884A (ja) 音声合成方法および装置並びにプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2721018B2 (ja) 音声規則合成装置
JP2888847B2 (ja) 文章読み上げ装置とその方法及び言語処理装置とその方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030603

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080704

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080704

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090704

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees