JP2764343B2

JP2764343B2 - 節／句境界抽出方式

Info

Publication number: JP2764343B2
Application number: JP2238562A
Authority: JP
Inventors: 由紀子山口
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1990-09-07
Filing date: 1990-09-07
Publication date: 1998-06-11
Anticipated expiration: 2013-06-11
Also published as: US5479563A; JPH04117560A

Description

【発明の詳細な説明】〔概要〕文章の意味の切れ目を抽出する節／句境界抽出方式に
関し、言語学的な知識による文法規則を必要とせずに節／句
の境界を抽出する節／句境界抽出方式を提供することを
目的とし、入力する文章情報を構成する単語をカテゴライズする
入力手段と、該入力手段によってカテゴライズされた複
数の単語が順次加わり、予め節／句の境界位置情報に対
応する教師パターンを学習してあるニューラルネットに
よって節／句の境界位置情報を出力するニューラルネッ
ト手段とからなるように構成する。

〔産業上の利用分野〕

本発明は自然言語処理方式に係り、さらに詳しくは文
章の意味の切れ目を抽出する節／句境界抽出方式に関す
る。

〔従来の技術〕

近年、音声合成技術の発展によって、読み上げシステ
ム、音声応答システムが可能となった。しかしながら、
従来の読み上げシステムや音声応答システムより発生す
る音声は機械的なものであり、自然な音声による読み上
げや応答が望まれている。

前述の自然な音声を発生するためには、出力する文章
の意味の切れ目に合わせたイントネーションパターンを
生成する必要がある。

この文章の意味の切れ目である境界の抽出には言語の
文法規則を記述し、構文解析を行って生成した構文木か
ら抽出する方式がある。この方式は文章全体を構文木と
しているため音声合成の分野においては多く用いられて
おらず、句レベルの構文解析すなわち文章を部分的に解
析して句境界を抽出する方式が多く用いられている。

〔発明が解決しようとする課題〕

前述した文章を部分的に解析して句境界を抽出する方
式では、言語学的な知識を用いて作成した文法規則に従
って入力文の解析を行うため、大量の文法規則を作成す
る必要があり、また文法規則で扱えない文章が入力され
た場合に出力が保証できないという問題を有していた。
また、言語学の研究があまり進んでいない言語について
は文法規則を体系的に作成することが困難であるため、
節／句の境界を抽出することができないという問題を有
していた。

本発明は言語学的な知識による文法規則を必要とせず
に節／句の境界を抽出する節／句境界抽出方式を提供す
ることを目的とする。

〔課題を解決するための手段〕

第１図は本発明の原理ブロック図である。

入力手段１は入力する文章情報を構成する単語をカテ
ゴライズする。例えばこのカテゴライズは文章情報を構
成する単語の品詞に対応して予め決定した品詞番号によ
る。

ニューラルネット手段２は前記入力手段１によってカ
テゴライズされた複数の単語が順次加わり、予め境界位
置情報に対応した教師パターンになるように学習してあ
るニューラルネットによって境界位置情報を出力する。
入力手段１によってカテゴライズされた複数の単語は例
えば前あるいは後が境界であるかを判断すべき目的の単
語と、その単語の前ｎ個，後ｍ個の単語とより成り、ｎ
は１、ｍは２等である。例えば、３連続あるいは４連続
の単語を用いて境界位置情報を学習してあるニューラル
ネットから出力する。

境界判定手段３は前記ニューラルネット手段２により
出力される境界位置情報をもとに閾値を用いて節／句の
境界を求める。

〔作用〕

入力手段１によって文章を構成する単語をカテゴライ
ズし、例えば品詞に対応した品詞番号等の分類分けを行
って、文章を構成する複数の単語単位で順次入力する。
この入力する複数の単語は前あるいは後が境界であるか
を判断すべき目的の単語とその前の１個の単語さらに２
個の単語であり、それぞれの単語が品詞や番号に分類さ
れて、すなわち品詞番号がつけられてニューラルネット
手段２に加わる。ニューラルネット手段２は前記カテゴ
ライズされた複数の単語から前あるいは後が境界である
かを判断すべき目的の単語における節／句の境界位置情
報を出力する。ニューラルネット手段２においては予め
境界位置情報に基づく教師パターンを例えば、節境界、
名詞句、動詞句、前置詞句、不定詞句に対応した出力ニ
ューロンがアクティブになるように学習してあり、その
教師パターンに対応して前記ニューラルネット手段２は
境界位置情報を出力する。そして、境界判定手段３はニ
ューラルネット手段２により出力される境界位置情報を
もとに節や句の開始位置に対応する節／句の境界を求め
る。この境界位置情報は予想されるべき境界を表わす曖
昧性を含んだアナログ情報であって、学習した時の完全
なパターンすなわち教師パターンとしての確定した境界
を表わす情報ではない。境界判定手段３はこの曖昧性を
含んだ境界情報から予め閾値バッファ等に記憶してある
閾値と比較し、閾値以上の量子化された値が節／句の境
界、すなわち最も確からしい節／句の開始位置すなわち
教師パターンまたはその重ね合わせであると判断し、境
界が存在するものとして出力する。

入力手段１においては特定のカテゴリ、例えば品詞番
号等を分類し単語に付加するだけであるので、入力手段
１が有する品詞等の情報は小さく、また言語的な知識に
よる文法規則を作成することなく節／句境界を抽出する
ことができる。

〔実施例〕

以下、図面を用いて本発明を詳細に説明する。

第２図（ａ），（ｂ）は本発明の第１の実施例の構成
図である。

品詞選択部21には入力テキストが加わり、この品詞選
択部21は単語辞書22を検索して入力テキストである入力
文の各単語について品詞情報を付加し、入力パターン生
成部23に出力する。入力パターン生成部23は品詞選択部
21より加わる品詞情報が付加された入力文の先頭の単語
から順次前後１単語を合わせた３単語分の品詞セット単
位でニューラルネット24の入力層へ与えるデータすなわ
ち品詞番号を作成する。すなわち、品詞番号に対応した
位置にあるユニットが１となり、それ以外のユニットを
０として、入力層の各ユニットに入力する。ニューラル
ネット24は該入力データに対する境界情報を生成する。

第３図（ａ），（ｂ），（ｃ）は第２図（ａ），
（ｂ）のニューラルネット24の詳細な構成図である。こ
のニューラルネット24は入力層、中間層、出力層により
構成される。本実施例で中間層は１層であるが、複数の
中間層を持つネットワークを使用することも可能であ
る。第３図（ａ），（ｂ），（ｃ）の第１の実施例によ
る節／句境界抽出は入力文の各単語の直前の各種境界の
有無を判定することにより各種境界の位置を抽出する。
ニューラルネット24の入力として、各種境界の有無を判
定する単語及び該単語の前後各１単語計３単語の品詞を
与えるため、入力層は第３図（ａ）に示すように、（品
詞のカテゴリ数×３）個のユニットで構成されている。
出力層は抽出する各種境界の各々に、すなわち節または
句に１個のユニットすなわち出力端子を対応させてい
る。従ってニューラルネット24は節境界，名詞句，動詞
句，前置詞句及び不定詞句を抽出する。

第３図（ｂ），（ｃ）において、『is』を目的の単語
（中心の単語）として『This is a』を入力する時には
各入力グループ単位の入力であるユニット〜が存在
するので、その品詞に対応したユニットに１を加えてい
る。すなわち第１番目のグループ（第１番目の単語に対
応）のユニット、第２番目のグループのユニット、
第３番目のグループのユニットに１を加え、他のユニ
ットに０を加えている。この入力によって、学習してあ
るニューラルネットは動詞句に対応した端子であるユニ
ットに１を出力する。また『ａ』を目的の単語（中心単
語）として『is a book』を入力する時には第１番目の
グループのユニット、第２番目のグループのユニット
、第３番目のグループのユニットに１を加え、他の
ユニットに０を加える。この入力によってニューラルネ
ットは名詞句に対応したユニットに１を出力する。ニュ
ーラルネット24は前述の入力データに対する出力を生成
し、比較部26は、出力層の各値を閾値バッファ25に予め
与えられた閾値と比較し、閾値以上の値となったユニッ
トの番号を抽出する。この時２つ以上のユニットが閾値
を越えている場合、該入力データに対して複数種類の境
界が存在するものと判断する。

第２図（ｂ）において、境界記号変換部38は、比較部
26から受け取ったユニットの番号に対応する境界記号を
出力制御部39へ加える。出力制御部39は、境界記号変換
部38から受け取った境界記号、入力制御部23Bから受け
取った単語の順に出力する。この一連の処理を入力テキ
ストの全ての単語について実施することにより出力結果
（第６図（ｄ））が得られる。尚、本実施例におけるニ
ューラルネットの学習は、予め意味の切れ目となってい
る各種境界を抽出した文章（第６図（ｄ）に相当）に対
して、節／句境界抽出時と同様に入力データを作成し、
各入力データに対応する単語の直前に存在する境界に対
応するユニットが１、その他のユニットが０になるよう
に教師パターンを作成する。尚、直前に境界が存在しな
い単語に対する教師パターンは全てのユニットが０とし
ている。このように作成した学習パターンに対してバッ
ク・プロパゲーションによる学習を行い、ニューラルネ
ットの各結合の重みを決定する。

第２図（ａ）に戻って説明する。比較部26は出力層の
値と閾値バッファ25に予め記憶された閾値とを比較し、
閾値以上の値となったユニットに境界が存在すると判断
する。さらに、１文中に２つ以上のユニットが閾値を越
えている場合には該入力データに対して複数種類の境界
が存在するものと判断する。第２図（ｂ）は、第２図
（ａ）に境界記号変換部38を付加したものであって、境
界記号変換部38は、比較部26から受け取ったユニットの
番号に対応する境界記号を出力制御部39へ渡す。出力制
御部39は、入力制御部23Bから受け取った単語，境界記
号変換部38から受け取った境界記号の順に出力する。な
お、３単語連鎖作成部23A,入力制御部23Bは入力パター
ン生成部23に対応する。また、３単語連鎖の中心の単語
を入力制御部23Bから出力制御部39に送る。

本発明の第１の実施例におけるニューラルネットの学
習は、予め意味の切れ目となっている各種境界を抽出し
た文章に対して、節／句境界抽出時と同様に入力データ
を作成し、各入力する目的（中心）の単語の直前に存在
する境界に対応するユニットが１、その他のユニットが
０になるよう教師パターンを作成する。直前に境界が存
在しない単語に対する教師パターンは全てのユニットが
０となる。このように作成した学習パターンに対してバ
ックプロパゲーションによる学習を行い、ニューラルネ
ットの各結合の重みを決定する。

前述した本発明の第１の実施例における動作を具体的
な例を用いて説明する。品詞選択部21に接続される単語
辞書22は単語に対応した品詞番号を記憶している。第４
図は品詞分類図表である。品詞番号０は副詞、１はNO
T、２は副詞小辞、３は限定詞、４は名詞、５は代名
詞、６は人称代名詞、７は数詞、８は形容詞、９は動
詞、10は助動詞、11はBE動詞、12はDO、13はHAVE、14は
前置詞、15は不定詞を導くTO、16は接続詞、17は間投
詞、18は記号、19は文頭・文尾をそれぞれ表わしてい
る。

学習においては第５図（ａ）に示す学習データ作成例
図の如く、This is a book.It was lucky you left whe
n you did.He seemed to be surprised at the news.の
英文テキスト（第５図（ａ））に対し、各単語の前に節
境界，名詞句，動詞句，前置詞句，不定詞句等の記号を
付加した英文テキスト（第５図（ｂ），（ｃ））を作成
し、節境界16,名詞句8,動詞句4,前置詞句2,不定詞句１
の各10進情報を５ビットの２進情報に変換して教師信号
とし、これを境界情報とする。尚、ここで名詞句は主
語，目的語などを構成する名詞群（名詞、代名詞、人称
代名詞）を含む句、動詞句は始めが動詞，助動詞さらに
それらを修飾している副詞を含む句、前置詞句は始めが
前置詞である句、不定詞句は始めがNOTあるいはTOの品
詞を持つ単語である句を意味する。また、本発明の実施
例では動詞句，前置詞句，不定詞句の終了点は抽出して
いない（終了を抽出することも可能）。実際には入力の
品詞番号は入力ニューロンの位置に対応したコード、教
師信号は２進数で与えられるが、以下では、入力に与え
られる品詞番号、及び教師信号は10進数で表現する。す
なわち、Thisに対応して19 ５ 11を同時入力して８を
教師信号として、及びisに対応して５ 11 ３を同時に
入力し、４を教師信号として各３単語単位での品詞連鎖
（セット）と境界情報（第５図（ｄ））をニューラルネ
ットに加え学習させる。ここで、教師信号８は２進表現
では01000だから第３図（ａ）の出力層の名詞句に対応
するニューロンを発火させるように教える信号である。
また、教師信号４は00100であるから、第３図（ｂ）の
出力層の動詞句のニューロンを活性化するように教える
信号である。

第５図（ｂ）の英文テキストにおいて、Thisの前が名
詞句（％）isの前が動詞句（＃）、ａの前が名詞句
（％）、また、whenの前は節境界（／）、youの前は節
境界かつ名詞句（/,％）である。したがって、第５図
（ｄ）のyouに対応する教師信号は24で、これはコード
にすると11000であり、これは第３図（ａ）の出力層に
おいて、節境界と名詞句のニューロンが発火する教師信
号となる。

なお、第３図（ｃ）は、this is a bookという英文テ
キストに対して、第５図（ｃ）において、第３行目11,
3,4を同時に入力して、教師信号８を得た状態を示す。

次に、学習したものとは異なる第６図（ａ）に示すよ
うな英文テキストを入れた場合に、節／句境界が求めら
れることを説明する。

そして、このように学習したニューラルネットに対し
３単語連鎖を第６図（ｃ）に表わす順に英文テキスト
（第６図（ａ））に対応する３単語で入力する。

入力テキストが例えば『This is a book.He seemed t
o be surprised at the news.It is strange he should
have said that.I will ask when the train leave
s.』（第６図（ａ））の如く英文テキストが入力した
時、品詞選択部21は順次その前後するその品詞番号を求
める。Thisに対しては5,isは11,aは3,bookは4,・・・と
第６図（ｂ）に示す品詞選択結果を入力パターン生成部
23に出力する。入力パターン生成部23はこれらの単語か
ら３単語連鎖を求める。すなわち、Thisに対してはその
前が文頭であるので19、Thisは人称代名詞であるので
５、続く単語isはBE動詞であるので11となり、19 ５
11をコード化して入力パターン生成部から出力する。続
いてisを中心としてその前後の単語の品詞すなわち５
11 ３に対応するコードをニューラルネット24に出力す
る（第３図（ｂ））。さらに、ａを中心として、その前
後の単語の品11,3,4に対応するコードをニューラルネッ
ト24に出力する（第３図（ｃ））。

かくすると、ニューラルネットよりそれぞれの節或い
は句に対応するニューロン発火状態の出力パターンが生
じる。それを英文テキスト上に表わせば、第６図（ｄ）
の如くなる。

より具体的に言えば、単語Thisに対応して、３単語連
鎖情報０５ 11に対応するコードを第３図（ａ）のニ
ューラルネットワークの入力層に入力した場合には、Ｙ
の出力層からは、01000が出力される。これは名詞句で
あるから英文テキストのThisの前には％を付して表示す
る。また、単語isに対応して、３単語連鎖情報５ 11
３に対応するコードを第３図（ｂ）のニューラルネット
ワークの入力層に入力した場合には、Ｙの出力層から
は、00100が出力される。これは動詞句であるから英文
テキストのisの前には＃を付して表示する。

以上述べた２つの例、Thisとisは学習した英文テキス
ト“This is a book"という文章と同じ文章の単語であ
るから教えた通りの情報が出力される。しかし、ニュー
ラルネットでは教えていない文章を入力しても同様に節
／句の抽出ができなくてはならない。すなわち汎化能力
があるように動作するべきである。例えば第６図（ａ）
の入力英文テキストにおいて、it is strange he shoul
d have said that.という文は、第５図（ａ）の学習英
文テキストにはない文章である。しかし、第６図（ｃ）
の18行目においてheという単語に対応する３単語連鎖８
６ 10を入力すると、第３図（ａ）のニューラルネッ
トワークの出力層の状態は11000に近いアナログ情報、
例えば0.9,0.8,0.2,0.1,0.1が出力され、閾値を0.5とす
れば11000となる。すなわち、これは節境界のニューロ
ンと名詞句を表わすニューロンが発火していることを意
味し、第６図（ｄ）ではheの前の／％に対応する。

第２図（ａ），（ｂ）の比較部26は閾値バッファ25に
よって特定の値、例えば前記の0.5以上を節や句の境界
とし、出力する。

前述した本発明の第１の実施例によれば、通常の自然
言語のような大語彙の単語セットで構成される文章にお
ける意味の切れ目となる各種境界が抽出できる。

第７図（ａ），（ｂ）は本発明の第２の実施例の構成
図である。また、第９図は本実施例による節／句境界抽
出例を示すものである。第９図（ａ）は語彙セット（第
７図（ａ），（ｂ）の単語辞書52内に記憶されてい
る）、（ｂ）は入力英文テキスト、（ｃ）は照合部の出
力、（ｄ）は４単語連鎖作成部の出力、（ｅ）は本実施
例による出力結果、（ｆ）はニューラルネットへの入力
と出力の関係図である。

第７図（ａ），（ｂ）を第９図の抽出例を用いてその
動作を説明する。照合部51は入力英文テキスト（第９図
（ｂ））の各単語を単語辞書52と照合（第９図（ａ））
し各単語の単語番号を抽出する（第９図（ｃ））。その
照合結果と入力英文テキストは４単語連鎖作成部53Aに
加わり、４単語連鎖作成部53Aは入力文の末尾の単語か
ら順次前１単語，後２単語を合わせた４単語分の単語番
号セットを作成する（第９図（ｄ））。この作成した単
語番号セットと入力英文テキストが加わると入力制御部
53Bは４単語連鎖を順次ニューラルネット54に与え、そ
の４単語の２番目の単語を出力制御部58に送る。ニュー
ラルネット54の入力層へは、４単語の各単語の単語番号
に対応するユニットを１、それ以外のユニットを０とす
る値が入力層の各ユニットに入力される。第８図
（ａ），（ｂ）はニューラルネットの構成図であり、例
えば第８図（ｂ）に示す如く第９図（ｆ）の５番目の入
力の時には文頭＃に対応して、第１番目のユニットの
、thisの単語番号１に対応して第２番目のユニットの
、isの単語番号３に対応して第３番目のユニットの
、ａの単語番号４に対応して第４番目のユニットの
にそれぞれ１を、他のユニットに０を加える。すなわ
ち、ニューラルネット54は予め第９図（ｆ）に示す如く
入力と出力の関係を学習している。ここで出力層の発火
番号１と０は、第８図（ａ），（ｂ）の出力層の主語，
述語に対応するニューロンの発火の有無に対応する。し
たがって、ニューラルネット54への入力の第５番目（Th
isに対する入力）で出力の発火ユニット番号が変化して
おり、これを学習することにより結果としてThisの直後
の境界（主語と述語の境界）を抽出する。ニューラルネ
ット54はその入力データに対する出力を生成し、出力制
御部54に加える。そして、出力制御部58はニューラルネ
ット54の出力の変化を検出し、その変化に対応する単語
の前や後に境界があるとして、入力制御部53Bより加わ
る単語単位での入力文に境界記号を付加して出力する
（第９図（ｅ））。

第９図は文章を末尾から入力する例を示したが、第10
図には文章を文頭から入力する例を説明する。

第10図（ａ）は、各文章の単語番号と単語の関係を示
すものである。ここで０は文の初め（＃）をあらわすも
のである。

第10図（ａ）は、ニューラルネットワークの学習時に
与えられる入力パターンと教師信号を10進で表現したも
のである。Thisは文章のはじめであるから、０につづく
単語番号１、次がisとａであるから、isに対応する単語
番号３、ａに対応する単語番号５が入力され、This is
a bookという文の主語はThisであるから、教師番号とし
ては、ニューラルネットワークの出力層の主語を表すニ
ューロンが１、述語をあらわすニューロンが０となる様
に学習する。この10を10進であらわせば２となり、これ
が第10図（ｂ）の0,1,3,5という入力パターンに対する
教師信号表現である。同様に、isは４連鎖信号は1,3,5,
6であり、教師信号は２進数で表現すれば01で、述語ニ
ューラルが発火する際に教える。ａやbookに対する教師
信号は、主語でもなければ述語でもないから０である。

以上、本発明を実施例を用いて詳細に説明した。本発
明の第1,第２の実施例においては英語における品詞番号
や単語番号を用いて分類しているが、言語が異なっても
その言語特有の品詞やそれに対応するものを用いること
により、簡単に句，節の境界を求めることができる。ま
た、前述した動詞，前置詞，不定詞等においてはそれぞ
れ動詞を含む句，前置詞が導く句，不定詞を含む句をも
意味しているが、英語の文法に限るものではなく、品詞
分類句等においては単なる文法的ではなく工学的見地に
よって分類してもよい。また、３単語連鎖や４単語連鎖
を使用しているが、これに限らず節境界の抽出のために
は５単語連鎖等を行うことにより更に性能を向上するこ
とができる。

〔発明の効果〕

以上述べた如く本発明によれば、簡単な品詞等の辞書
を作成するだけで節／句等の境界を抽出することができ
る。また、複数の文章等の句／節を分類する時には、前
述した品詞等を用いずに単語番号で分類することができ
る。よって本発明によれば、通常の自然言語のような大
語彙の単語セットで構成される文章における意味の切れ
目となる各種境界を抽出することもできる。更には、小
語彙の単語セットで構成される文章の意味の切れ目とな
る各種境界を抽出することができる。また、これにより
合成音声応答装置等において自然な合成音声を出力する
こともできる。

また、言語学的な知識による文法規則を必要とせずに
節や句境界を抽出できるとともに、文法規則を記憶する
必要がなく、システムを小型化することができる。

【図面の簡単な説明】

第１図は本発明の原理ブロック図、第２図（ａ），（ｂ）は本発明の第１の実施例の構成
図、第３図（ａ）〜（ｃ）は本発明の第１の実施例における
ニューラルネットの構成図、第４図は品詞分類図表、第５図は学習データ作成例図、第６図は実施例１による節／句境界抽出例図、第７図（ａ），（ｂ）は本発明の第２の実施例の構成
図、第８図（ａ），（ｂ）は本発明の第２の実施例における
ニューラルネットの構成図、第９図は本発明の第２の実施例による節／句境界抽出の
例を示す図、第10図（ａ），（ｂ）は本発明の第２の実施例の変形例
を説明する図である。１……入力手段、２……ニューラルネット手段、３……境界判定手段．

フロントページの続き (56)参考文献特開平２−93499（ＪＰ，Ａ) 特開平２−5097（ＪＰ，Ａ) 特開昭64−38875（ＪＰ，Ａ) ＦＩＴＺＰＡＴＲＩＣＫＥ，ＢＡＣＨＥＮＫＯＪ．”ＰａｒｓｉｎｇｆｏｒＰｒｏｓｏｄｙ：ＷｈａｔａＴｅｘｔ−ｔｏ−ＳｐｅｅｃｈＳｙｓｔｅｍＮｅｅｄｓｆｒｏｍＳｙｎｔａｘ”，ＩＥＥＥＰｒｏｃｅｅｄｉｎｇｓｏｆ 1989 ＡｎｎｕａｌＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅＳｙｓｔｅｍｓＩｎＧｏｖｅｒｍｅｎｔＣｏｎｆｅｒｅｎｃｅ．ｐ．188−ｐ．194（1989) (58)調査した分野(Int.Cl.⁶，ＤＢ名) G06F 17/20 - 17/28 G10L 3/00 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】入力する文章情報を構成する単語をカテゴ
ライズする入力手段（１）と、該入力手段（１）によっ
てカテゴライズされた複数の単語が順次加わり、予め節
／句の境界位置情報に対応する教師パターンを学習して
あるニューラルネットによって節／句の境界位置情報を
出力するニューラルネット手段（２）とからなることを
特徴とする節／句境界抽出方式。
【請求項２】前記ニューラルネット手段（２）より出力
される境界位置情報をもとに節／句の境界を求める境界
判定手段（３）とより成ることを特徴とする請求項１記
載の節／句境界抽出方式。
【請求項３】前記入力手段（１）が出力する複数の単語
は、前あるいは後が境界であるかを判断すべき目的の単
語と、該単語の前ｎ個と後ｍ個の単語とからなる単語連
鎖より成ることを特徴とする請求項１記載の節／句境界
抽出方式。
【請求項４】前記入力手段（１）によるカテゴライズは
前記文章情報を構成する単語の品詞によることを特徴と
する請求項１記載の節／句境界抽出方式。
【請求項５】前記入力手段（１）によるカテゴライズは
前記文書情報を構成する単語が予め決められた単語番号
によることを特徴とする請求項１記載の節／句境界抽出
方式。
【請求項６】前記入力手段（１）は入力テキストの文頭
あるいは文尾のいずれから入力してもよいことを特徴と
する請求項１記載の節／句境界抽出方式。