JPH09231217A

JPH09231217A - 言語解析システムおよび方法

Info

Publication number: JPH09231217A
Application number: JP8036793A
Authority: JP
Inventors: Subuetoraana Shiebuenko; スヴェトラーナシェヴェンコ
Original assignee: Individual
Current assignee: Individual
Priority date: 1996-02-23
Filing date: 1996-02-23
Publication date: 1997-09-05
Anticipated expiration: 2016-02-23
Also published as: JP2902343B2

Abstract

(57)【要約】（修正有）【課題】文を構成する各トークンの役割を正確に解析
することのできるシステム。【解決手段】第１トークン抽出手段５２は品詞・属性
解析手段３０の出力を受けて、品詞が「名前」であるト
ークンと品詞が「不変化詞”は”または、”が”」であ
るトークンとが連続する場合を第１のトークンとして抽
出する。第２トークン抽出手段５４は次に述語を伴わな
い述語を抽出する。さらに第３トークン抽出手段５６
は、次に述語を伴わない述語と品詞が「名前」であるト
ークンが連続し、さらに「不変化詞”は”または”
が”」が連続する場合を抽出する。主役割決定手段５８
は第１、第２、第３のトークンの文章中における出現順
序、出現回数に基づいて、これらの役割を決定する。副
役割決定手段６２は未決定トークンの直後の決定済トー
クンの役割と、未決定トークンの品詞とに基づいて、未
決定トークンの役割を決定する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、機械翻訳等に用
いることのできる言語解析システムおよび方法に関する
ものである。より詳細には、文章を構成する各トークン
の、文章中における役割を決定する技術に関する。

【０００２】

【従来の技術および課題】従来より、自然言語をコンピ
ュータにより翻訳する機械翻訳が研究され、一部実用化
されてきた。機械翻訳を行う際には、翻訳しようとする
元の言語の解析を行った後、他の言語に翻訳することが
行われている。したがって、言語解析は機械翻訳を行う
ための重要なステップであり、言語解析の正確さが翻訳
の正確さを決定する大きな要因となっている。また、言
語解析は機械翻訳だけでなく、その他の言語処理一般に
用いることができる。

【０００３】言語解析において、まず、言語をトークン
に分割し、各トークンの品詞や属性を決定する必要があ
る。このような品詞の決定、属性の解析について、出願
人はすでに、新たな解析手法を提案した（特願平７−２
７９４６５号、特願平７−３０７８３２号）。この解析
手法によれば、各トークンの品詞を正確に決定でき、そ
の属性を解析することができる。

【０００４】ところで、言語解析においては、各トーク
ンが固有に有する品詞や属性を解析するだけでなく、文
章の構造に起因して各トークンに与えられた役割を解析
することも重要である。従来より、トークンとトークン
の関係を解析するシステム等が提案されているが、体系
的にトークンの役割を詳細に解析するシステムはなかっ
た。

【０００５】この発明は、上記のような問題点に鑑み
て、文章中における各トークンの役割を詳細に解析する
技術を提供することを目的とする。

【０００６】

【課題を解決するための手段】請求項１の言語解析シス
テムは、トークンに分割された言語を受けて、品詞が
「名前」であるトークンと品詞が「不変化詞”は”」で
あるトークンが連続する場合、および品詞が「名前」で
あるトークンと品詞が「不変化詞”が”」であるトーク
ンが連続する場合を第１のトークンとして抽出する第１
トークン抽出手段、前記言語を受けて、次に述語を伴わ
ない述語を第２のトークンとして抽出する第２トークン
抽出手段、前記第１のトークン、前記第２のトークンの
出現順序、出現回数に基づいて第１、第２のトークンの
役割を決定する主役割決定手段、を備えたことを特徴と
している。

【０００７】請求項２の言語解析システムは、第１トー
クン抽出手段が、次に述語を伴わない動詞と「不変化
詞”は”」が連続する場合、および次に述語を伴わない
動詞と質問する不変化詞”か”と「不変化詞”は”」が
連続する場合も、第１のトークンとして抽出するもので
あることを特徴としている。

【０００８】請求項３の言語解析システムは、以下のa)
〜d)の場合を第３のトークンとして抽出する第３トーク
ン抽出手段を備え、前記主関係決定手段は、前記第１の
トークン、前記第２のトークン、前記第３のトークンの
出現順序、出現回数に基づいて第１、第２、第３のトー
クンの役割を決定するものであることを特徴としてい
る。

【０００９】a)次に述語を伴わない述語のトークンと品
詞が「名前」である１以上のトークンが連続し、さらに
「不変化詞”は”」が連続する場合、 b)上記a)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合、 c)次に述語を伴わない述語と品詞が「名前」であるトー
クンが連続し、さらに「不変化詞”が”」が連続する場
合、 d)上記c)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合。

【００１０】請求項４の言語解析システムは、言語の最
後のトークンから最初のトークンへ向かって、未決定ト
ークンを検索する未決定トークン検索手段、未決定トー
クン検索手段によって検索された未決定トークンの直後
の決定済トークンの役割と当該未決定トークンの品詞と
に基づいて、当該未決定トークンの役割を決定する副役
割決定手段、を備えたことを特徴としている。

【００１１】請求項５の言語解析システムは、副役割決
定手段が、前記決定済トークンの役割ごとに、前記未決
定トークンの品詞に応じた役割を予測テーブルとして保
持しており、当該予測テーブルに基づいて前記未決定ト
ークンの役割決定を行うものであることを特徴としてい
る。

【００１２】請求項６の言語解析システムは、予測テー
ブルに当該未決定トークンの品詞が存在しない場合に
は、前記決定済トークンの直後の決定済みトークンに関
する予測テーブルに基づいて、当該未決定トークンの役
割決定を行うものであることを特徴としている。

【００１３】請求項７の言語解析システムは、与えられ
る言語が、下記の手段によって予め一部のトークンにつ
いて役割が決定されているものであることを特徴として
いる。

【００１４】トークンに分割された言語を受けて、品詞
が「名前」であるトークンと品詞が「不変化詞”は”」
であるトークンが連続する場合、および品詞が「名前」
であるトークンと品詞が「不変化詞”が”」であるトー
クンが連続する場合を第１のトークンとして抽出する第
１トークン抽出手段、前記言語を受けて、次に述語を伴
わない述語を第２のトークンとして抽出する第２トーク
ン抽出手段、前記第１のトークン、前記第２のトークン
の出現順序、出現回数に基づいて第１、第２のトークン
の役割を決定する主役割決定手段。

【００１５】請求項８の言語解析システムは、以下のa)
〜d)の場合を第３のトークンとして抽出する第３トーク
ン抽出手段を備え、前記主関係決定手段は、前記第１の
トークン、前記第２のトークン、前記第３のトークンの
出現順序、出現回数に基づいて第１、第２、第３のトー
クンの役割を決定するものであることを特徴としてい
る。

【００１６】a)次に述語を伴わない述語のトークンと品
詞が「名前」である１以上のトークンが連続し、さらに
「不変化詞”は”」が連続する場合、 b)上記a)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合、 c)次に述語を伴わない述語と品詞が「名前」であるトー
クンが連続し、さらに「不変化詞”が”」が連続する場
合、 d)上記c)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合。

【００１７】請求項９の言語解析システムは、トークン
に分割された言語を受けて、品詞が「名前」であるトー
クンと品詞が「不変化詞”は”」であるトークンが連続
する場合、および品詞が「名前」であるトークンと品詞
が「不変化詞”が”」であるトークンが連続する場合を
第１のトークンとして抽出し、前記言語を受けて、次に
述語を伴わない述語を第２のトークンとして抽出し、前
記第１のトークンと前記第２のトークンの出現順序、出
現回数に基づいて第１、第２のトークンの役割を決定す
ることを特徴としている。

【００１８】請求項１０の言語解析方法は、言語を受け
て、以下のa)〜d)の場合を第３のトークンとして抽出す
るとともに、前記第１のトークン、前記第２のトーク
ン、前記第３のトークンの出現順序、出現回数に基づい
て第１、第２、第３のトークンの役割を決定するもので
あることを特徴としている。

【００１９】a)次に述語を伴わない述語のトークンと品
詞が「名前」である１以上のトークンが連続し、さらに
「不変化詞”は”」が連続する場合、 b)上記a)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合、 c)次に述語を伴わない述語と品詞が「名前」であるトー
クンが連続し、さらに「不変化詞”が”」が連続する場
合、 d)上記c)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合。

【００２０】請求項１１の言語解析方法は、トークンに
分割された言語を受けて、トークンの役割を決定する言
語解析システムであって、既に役割が決定されている決
定済トークンの役割および役割が決定されていない未決
定トークンの品詞に基づいて、当該未決定トークンの役
割を決定することを特徴としている。

【００２１】請求項１２の言語解析方法は、トークンに
分割された言語を受けて、品詞が「名前」であるトーク
ンと品詞が「不変化詞”は”」であるトークンが連続す
る場合、および品詞が「名前」であるトークンと品詞が
「不変化詞”が”」であるトークンが連続する場合を第
１のトークンとして抽出し、前記言語を受けて、次に述
語を伴わない述語を第２のトークンとして抽出し、前記
言語を受けて、以下のa)〜d)の場合を第３のトークンと
して抽出するとともに、前記第１のトークン、前記第２
のトークン、前記第３のトークンの出現順序、出現回数
に基づいて第１、第２、第３のトークンの役割を決定す
るとともに、上記処理において役割が決定されていない
未決定トークンの役割を決定する際に、既に役割が決定
されている決定済トークンの役割および未決定トークン
の品詞に基づいて、当該未決定トークンの役割を決定す
ることを特徴としている。

【００２２】a)次に述語を伴わない述語のトークンと品
詞が「名前」である１以上のトークンが連続し、さらに
「不変化詞”は”」が連続する場合、 b)上記a)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合、 c)次に述語を伴わない述語と品詞が「名前」であるトー
クンが連続し、さらに「不変化詞”が”」が連続する場
合、 d)上記c)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合。

【００２３】以下、この発明を説明するために用いた用
語の概念を説明する。

【００２４】「言語」：文書やテキスト等の書き言葉、
話し言葉等の自然言語をいう概念である。文字コード形
式、イメージ形式、音声形式等、何れの形式で与えられ
てもよい。

【００２５】「コンピュータにより実行可能なプログラ
ム」：当該プログラムが直接実行可能な場合だけでな
く、一旦変換した後（圧縮の解凍など）に実行可能とな
る場合や、他のモジュールと組み合わせて実行可能とな
る場合等も含む概念である。

【００２６】

【発明の効果】請求項１、請求項２の言語解析システム
および請求項８の言語解析方法は、トークンに分割され
た言語を受けて、品詞が「名前」であるトークンと品詞
が「不変化詞”は”」であるトークンが連続する場合、
および品詞が「名前」であるトークンと品詞が「不変化
詞”が”」であるトークンが連続する場合を第１のトー
クンとして抽出し、前記言語を受けて、次に述語を伴わ
ない述語を第２のトークンとして抽出し、前記第１のト
ークンと前記第２のトークンの出現順序、出現回数に基
づいて第１、第２のトークンの役割を決定することを特
徴としている。したがって、文章の構造に基づいて、第
１、第２のトークンの役割を決定することができ、正確
な解析を行うことができる。

【００２７】請求項３の言語解析システムは、第３トー
クン抽出手段を備えるとともに、主関係決定手段が、第
１のトークン、第２のトークン、第３のトークンの出現
順序、出現回数に基づいて第１、第２、第３のトークン
の役割を決定するものであることを特徴としている。し
たがって、より複雑な構造を持つ文章についても、正確
な解析を行うことができる。

【００２８】請求項４の言語解析システムは、言語の最
後のトークンから最初のトークンへ向かって、未決定ト
ークンを検索する未決定トークン検索手段と、未決定ト
ークン検索手段によって検索された未決定トークンの直
後の決定済トークンの役割と当該未決定トークンの品詞
とに基づいて、当該未決定トークンの役割を決定する副
役割決定手段とを備えている。したがって、役割の決定
されていないトークンについて、正確にその文章上の役
割を決定することができる。

【００２９】請求項５、請求項６の言語解析システム
は、副役割決定手段が、前記決定済トークンの役割ごと
に、前記未決定トークンの品詞に応じた役割を予測テー
ブルとして保持しており、当該予測テーブルに基づいて
前記未決定トークンの役割決定を行うものであることを
特徴としている。したがって、処理を迅速化することが
できる。

【００３０】請求項１１の言語解析方法は、トークンに
分割された言語を受けて、トークンの役割を決定する言
語解析システムであって、既に役割が決定されている決
定済トークンの役割および役割が決定されていない未決
定トークンの品詞に基づいて、当該未決定トークンの役
割を決定することを特徴としている。したがって、役割
の決定されていないトークンについて、正確にその文章
上の役割を決定することができる。

【００３１】

【発明の実施の形態】

−目次− 言語解析システムの全体構成ハードウエア構成品詞の分類品詞の決定および属性の解析役割の解析。

【００３２】−言語解析システムの全体構成− この発明による言語解析システムの一実施形態を、図１
に全体構成として示す。品詞・属性解析手段３０は、与
えられた文書データをトークンに分解し、各トークンの
品詞を決定して属性を解析する。

【００３３】図２に、品詞・属性解析手段３０の詳細を
示す。分割・品詞取得手段５は、多くのトークンを予め
記憶している辞書手段８を参照して、入力された文章デ
ータをトークンに分割するとともに品詞を取得する。こ
の実施形態では、動詞の接尾語および述語形容詞の接尾
語以外の品詞については、品詞辞書８ａを用いて分割お
よび品詞取得を行い、動詞の接尾語および述語形容詞の
接尾語については、テーブル８ｂ、８ｄを用いて分割お
よび品詞取得を行っている。属性解析手段９は、分割・
品詞取得手段５の行う分割・品詞取得処理に連動して、
動詞の接尾語および述語形容詞の接尾語に基づいて、動
詞および述語形容詞の文法的属性を決定する。この際、
属性解析手段９は、テーブル８ｂ、８ｄを用いて属性の
決定を行っている。品詞選択手段６は、ルールテーブル
７を参照して、各トークンについて取得した品詞が複数
存在する場合には、前または後（または双方）のトーク
ンの品詞に基づいて、当該トークンの品詞を１つに決定
する。なお、品詞を１つに決定できない場合には、絞り
込みにとどめてもよい。なお、図２の実施例では、分割
・品詞取得手段５が辞書手段８を参照して分割を行うよ
うにしている。しかし、辞書手段８を参照せず、トーク
ンへの分割を行うようにしてもよい。

【００３４】図１に戻って、第１トークン抽出手段５２
は、品詞・属性解析手段３０の出力を受けて、品詞が
「名前」であるトークンと品詞が「不変化詞”は”」で
あるトークンが連続する場合、および品詞が「名前」で
あるトークンと品詞が「不変化詞”が”」であるトーク
ンが連続する場合を第１のトークンとして抽出する。第
２トークン抽出手段５４は、同様に、次に述語を伴わな
い述語を第２のトークンとして抽出する。さらに、第３
トークン抽出手段５６は、次に述語を伴わない述語と品
詞が「名前」であるトークンが連続し、さらに「不変化
詞”は”」または「不変化詞”が”」が連続する場合を
第３のトークンとして抽出する。

【００３５】主役割決定手段５８は、第１、第２、第３
のトークンの文章中における出現順序、出現回数に基づ
いて、これらトークンの役割を決定する。未決定トーク
ン検索手段６０は、役割の与えられていない未決定トー
クンを当該文章中から検索する。

【００３６】副役割決定手段６２は、未決定トークンの
直後の決定済トークンの役割と、当該未決定トークンの
品詞とに基づいて、当該未決定トークンの役割を決定す
る。この決定には、予測テーブル６４を用いる。以上の
ようにして、全てのトークンについて役割が決定され、
品詞や属性とともに解析データとして出力される。

【００３７】−ハードウエア構成− 図３に、図１の言語解析装置をＣＰＵを用いて実現した
場合のハードウエア構成を示す。バスライン１０には、
ＣＰＵ１２、ハードディスク１４、ＣＲＴ１６、メモリ
１８、フロッピイディスクドライブ（ＦＤＤ）２０、キ
ーボード２２が接続されている。ハードディスク１４に
は、トークンの役割を決定するための予測テーブル６４
が格納されている。さらに、トークンと品詞を対応づけ
た品詞辞書８ａ、動詞の接尾語のためのテーブル８ｂ
（複合動詞のためのテーブル８ｃを結合しており、慣用
語のテーブルを一体化している）、述語形容詞の接尾語
のためのテーブル８ｄが格納されている。つまり、この
実施例では、品詞辞書８ａ、動詞の接尾語のためのテー
ブル８ｂ、述語形容詞の接尾語のためのテーブル８ｄに
よって辞書手段が構成されている。また、品詞を確定す
るためのルールテーブル７も記憶されている。さらに、
ハードディスク１４には、言語解析を行うためのプログ
ラム６６が記憶されている。このプログラムは、ＦＤＤ
２０を介して、フロッピイディスク２４から取り込まれ
たものである。もちろん、ＣＤ−ＲＯＭ等のその他の記
憶装置から取り込んだものであってもよい。また、通信
回線を介してダウンロードしたものであってもよい。

【００３８】解析対象であるテキスト文章は、フロッピ
イディスク２６に格納されて、ＦＤＤ２０を介して読み
込まれる。もちろん、これもＣＤ−ＲＯＭ等の媒体に格
納されているものを読み込むようにしてもよいし、通信
によってテキスト文章を受け取るようにしてもよい。ま
た、キーボード２２から入力されたテキスト文章を解析
対象としてもよい。

【００３９】取り込まれたテキスト文章は、ハードディ
スク１４に記憶されたプログラムに従って、解析され
る。解析結果は、ハードディスク１４に解析ファイル６
８として記憶され、必要に応じてＣＲＴ１６、フロッピ
イディスクやプリンタ（図示せず）に出力される。場合
によっては、通信回線を介して転送してもよい。

【００４０】−品詞の分類− この実施例による品詞辞書は、図４のように分類して各
トークンについての品詞を記憶している。図４の分類
は、さらに、細かく分類されている。例えば、名前グル
ープＡは、さらに、一般名詞、一般名詞ではない名詞、
リストＡの名詞、代名詞・・・・等に細分類されてい
る。表１に、図４の分類の細分類を示す。

【００４１】品詞辞書には、個々のトークンにつき、こ
の細分化された品詞が記憶されている。なお、ハードデ
ィスク１４には、図４の分類階層および後述の表１の分
類階層を記憶している。したがって、細分化された品詞
が分かれば、その上位の分類も容易に取得できる。たと
えば、「一般名詞」が、「名前グループＡ」に属すると
いうことを容易に取得できる。なお、細分化した品詞と
ともに上位の分類も併せて記憶するようにしてもよい。

【００４２】図４（および表１）においては、動詞を、
動詞の語根と動詞の接尾語とに分けて、それぞれ１つの
品詞としている。また、同様に、述語形容詞を述語形容
詞の語根と述語形容詞の接尾語とに分けて、それぞれ１
つの品詞としている。これにより、辞書のトークンが固
定されたことによって明確になり、他言語への翻訳が簡
単、明確となり、より正しい翻訳を得られるようにな
る。さらに、動詞の語根および述語形容詞の語根のグル
ープと、それ以外のグループとに大別して品詞を付与し
ている。これにより、上記の接尾語を伴うもの（動詞の
語根と述語形容詞の語根）と接尾語を伴わないものとの
処理を分けることができる。

【００４３】また、この実施例においては、動詞の接尾
語および述語形容詞の接尾語については、品詞辞書に記
憶していない。これは、これらの接尾語に関しては、後
述のように、テーブルによって確定した方が、辞書容量
の点からも、解析上からも好ましいからである。なお、
動詞の接尾語および述語の接尾語以外にも接尾語が存在
する（数字の接尾語等）。以下では、特に断らない限
り、接尾語という場合には、動詞の接尾語および述語形
容詞の接尾語を指すものとする。

【００４４】品詞辞書においては、検索の効率を考慮す
れば、文字コード順にトークンを記憶しておくことが好
ましい。また、トークンの使用頻度に応じた順序で記憶
するようにしてもよい。

【００４５】表１（コンピュータ品詞）１．名前グループＡ 1.1 一般名詞：木、車・・・ 1.2 一般名詞ではない名詞：十分、必要・・・ 1.3 リストＡの名詞：現在、今・・・ 1.4 代名詞：これ、どれ・・・ 1.5 性質を表す名詞：みんな、たくさん・・・ 1.6 特定の語：程度、くらい・・・ 1.7 ”など”：など・・・ 1.8 基本の数字：一、二・・・ 1.9 テキストのシンボルでないもの：３、H₂SO₄・・・２．名前グループＢ 2.1 名詞化した語：こと、もの・・・３．名前グループＣ 3.1 数を数える語：枚、冊・・・４．名前ではないもの 4.1 述語形容詞でないもの：大きな、あの・・・５．後置詞 5.1 真の後置詞：内、中・・・ 5.2 動詞の後置詞：による、における・・・ 5.3 中間の後置詞：によって・・・６．副詞 6.1 形容詞的な副詞：比較的に・・・ 6.2 単純化された副詞：比較的・・・ 6.3 程度を示す副詞：少し、ほとんど・・・ 6.4 リスト１からの副詞：さらに、むしろ・・・ 6.5 リストＣからの副詞：約、ほぼ・・・ 6.6 マナーの副詞：下手に、上手に・・・７．接続詞 7.1 同等の接続詞：と、かつ・・・ 7.2 従属節の接続詞：とき、には・・・ 7.3 接続詞”から”：から 7.4 接続詞”からではなく”：からではなく 7.5 接続詞”もし”と”たとえ”：もし、たとえ 7.6 同格を紹介する接続詞：例えば、すなわち・・・８．不変化詞 8.1 主格の不変化詞 8.1.1 不変化詞”は”：は 8.1.2 不変化詞”が”：が・・ 8.2 間接目的語として使われる不変化詞 8.1.1 不変化詞”に”：に 8.1.2 不変化詞”へ”：へ・・ 8.3 直接目的語として使われる不変化詞：を 8.4 強調したり、制限したり、質問する不変化詞 8.4.1 土台となる不変化詞：は・・ 8.5 強調する不変化詞：は、なら、ならば、でも・・
・９．限定詞：のような、のごとき、と同様な・・・１０．接辞 10.1 数字の接辞：第、目・・・ 10.2 動詞や述語形容詞の接尾語： 10.3 述語形容詞ではない接尾語：的、的な・・・ 10.4 名詞の準接辞：不、可・・・１１．分割詞 11.1 句点：。

【００４６】11.2 コンマ：、 11.3 コロン：： 11.4 特別の分割詞１２．一般動詞の語根 12.1 一般動詞の語根：読、書・・・ 12.2 一般動詞でない動詞の語根１３．連結詞の語根：であ・・・１４．助動詞の語根：にな・・・１５．述語形容詞の語根：おもしろ、よ・・・ −品詞の決定、属性の解析− 図５に、ハードディスク１４に記憶された言語解析のプ
ログラムをフローチャートで示す。このフローチャート
は、トークンの役割を決定する前に行う品詞の決定、属
性の解析を中心に記述したものである。トークンの役割
決定の詳細については後述することとし、まず、品詞の
決定、属性の解析について述べる。

【００４７】まず、フロッピイディスク２６に記憶され
たテキスト文章を読み込む（ステップＳ１）。次に、Ｃ
ＰＵ１２は、読み込んだテキスト文章の１つの文を対象
として、トークンに分割するとともに品詞を取得する
（ステップＳ２）。この際、ＣＰＵ１２は、ハードディ
スク１４に記憶された品詞辞書に基づいて文をトークン
に分解して、品詞を取得する。

【００４８】たとえば、「僕は学校へ行きます。」とい
う文を例として、トークンへの分割処理、品詞の取得処
理および文法的属性の決定処理について説明する。ま
ず、ＣＰＵ１２は、最初の文字「僕」について、品詞辞
書の検索を行う。図６に品詞辞書の一部を示す。図から
も明らかなように、「僕」は、一般名詞という品詞であ
ることが分かる。

【００４９】さらに、ＣＰＵ１２は、「僕は」という文
字につき同じようにして品詞辞書の検索を行う。品詞辞
書には「僕は」が記憶されておらず、かつ「は」が漢字
でないことから、ＣＰＵ１２は「僕」が１つのトークン
であると判断する。とともに、トークン「僕」の品詞を
名前グループＡの一般名詞として解析ファイルに記憶す
る（図７参照）。

【００５０】次に、取得した品詞が、動詞、述語形容詞
の何れかであるか否かを判断する（ステップＳ３）。こ
こでは、一般名詞であるから、ステップＳ５に進む。ス
テップＳ５においては、当該文の全てのトークンについ
て品詞を取得したか否かを判断する。ここでは、まだ、
未取得のトークンがあるので、ステップＳ６に進み、次
のトークンについて処理を行う。

【００５１】次に、「は」について品詞辞書の検索を行
う。品詞辞書には、「は」の品詞は記憶されておらず、
ルールテーブルの番号が記憶されている。これにより、
「は」は、２以上の品詞を有することが分かる。さら
に、「は学」という文字につき同じようにして品詞辞書
の検索を行う。品詞辞書には「は学」が記憶されていな
いことから、ＣＰＵ１２は「は」が１つのトークンであ
ると判断する。とともに、トークン「は」の品詞が２以
上存在して不確定であることから、品詞辞書に記憶され
ているルールテーブルの番号Ｂ(45)を記憶する（図７参
照）。なお、上記実施例では、２以上の品詞が存在する
場合に、ルールテーブルの番号のみを品詞辞書に記憶す
るようにしているが、これら品詞も併せて記憶するよう
にしてもよい。

【００５２】以下同じようにして、「学校」「へ」をそ
れぞれトークンとして認識し、図７に示すようにそれぞ
れの品詞を記憶する。次に、「行」をトークンとして認
識し、その品詞として一般動詞の語根を記憶する。ここ
では、取得した品詞が一般動詞の語根であるから、ステ
ップＳ３により、ステップＳ４に分岐する。ステップＳ
４においては、接尾語のトークンを確定するとともに、
その属性の解析を併せて行う。以下に述べるように、テ
ーブルを使用することにより、トークンの確定と属性の
解析とを同時に行うことを可能としている。このような
利点を追求しないのであれば、品詞辞書の中に、接尾語
を記憶しておいて処理することも可能である。

【００５３】この実施例では、次の表２、表３に示すよ
うな動詞の基本的属性および述語形容詞の基本的属性に
ついての解析を行うことを基本としている。

【００５４】表２動詞の接尾語の基本的属性１．使役：結果として影響を与えたり作ったりするこ
と（例）”子供に本を読ませる” ２．受け身：受け身の形態（例）”説明させられる” ３．過去：一般的な過去形、または間接的な過去形（例）”本を読み、ラジオを聞いた”の”読み”（間接
的な過去）（例）”本を読み、ラジオを聞いた”の”聞いた”（一
般的な過去）４．結果：未来が完全に過去（例）”入れておきました” ５．方向：今につながっている方向性や未来につなが
っている方向性（例）”製造してきました”（今につながる方向性）（例）”車はますます発展していく”（未来につながる
方向性）６．断続：性質の違う動きを示す（例）”機械が右の方へ回ったり、左の方へ回ったりし
た” ７．継続：継続した動きを示す（例）”本を読んでいます” ８．完全：完全を示す（例）”本を読んでいました” ９．否定：肯定または否定（例）”来る”（肯定）（例）”来ない”（否定）１０．次に述語を伴うもの：これより後、句点までの間
に、述語を伴うもの。

【００５５】（例）”本を読み、ラジオを聞いた”
（「読み」は「聞いた」を伴う）１１．他の意味の存在：一つの意味だけではなく、他の
意味があること（例）”読ませ始める” １２．様相：何らかの状態を示していること（例）製造することができる１３．敬語：敬語かそうでないか（例）：”来る”（中立）（例）：”来ます”（敬語）表３述語形容詞の接尾語の基本的属性１．過去：（例）”美しかった” ２．次に述語を伴うもの：（例）”花が美しく咲きます”（「美しく」は「咲きま
す」を伴う）３．助動詞の存在：当該接尾語中に助動詞を含む（例）”美しくなる” ４．否定：（例）”美しくもない” ５．敬語：（例）”美しいでしょう” 以下、図１６および図１７のフローチャートを参照しつ
つ、一般動詞の接尾語のためのテーブルを用いて接尾語
の解析を行う処理を説明する。この実施例では、図１８
に示す”一般動詞の語根の次に来る接尾語のためのテー
ブル”（以下テーブルＤと呼ぶ）、およびこのテーブル
によって指示されるテーブル等によって、動詞の接尾語
のためのテーブルが構成されている。

【００５６】前述のように「行」の品詞が一般動詞の語
根であると判明すると、ＣＰＵ１２は、図６の品詞辞書
の「行」の欄から、テーブルＤのカラム記号「ｋ」を取
得する。ＣＰＵ１２は、このカラム記号「ｋ」にしたが
って、テーブルＤから、接尾語を検索する（ステップＳ
２０）。

【００５７】テーブルＤを、図１８に示す。このテーブ
ルは、ｒ、ｔ、ｍ、ｂ、ｎ、ｋ、ｋ’、ｇ、ｓ、ｗのカ
ラムを有している。今、指定されたカラム記号は「ｋ」
であるから、「ｋ」のカラムが参照される。ここで、Ｃ
ＰＵ１２は、次の文字「き」を読み込み、カラム「ｋ」
において該当する文字を検索する。ここでは、２行目に
「き」が存在するので、当該行の情報を用いて解析を行
う。つまり、「き」が「同時」という属性を持っている
ことを得て、これを属性バッファに記憶する（ステップ
Ｓ２３）。次に、ステップＳ２５、Ｓ２８、Ｓ２９に掲
げられた指示が、当該接尾語に関してテーブル中にある
か否かを判断する。ここでは、これらの指示がないの
で、ステップＳ３０を実行する。

【００５８】ステップＳ３０においては、「き」より後
の文字「ま」「す」が、テーブルＤで指示された、次の
テーブルＣ(2)、Ｓ(v)に存在するか否かを検索する（図
１９、図２１参照）。ここでは、テーブルＣ(2)に「ま
す」が存在する。つまり、「き」の後に、接尾語が続く
ので、ステップＳ３１に進む。なお、「ます」について
の検索結果は、後のステップＳ２０以下の処理において
用いるために記憶しておく。

【００５９】ステップＳ３１においては、現在参照中の
テーブル（ステップＳ２３〜Ｓ２９等で参照したテーブ
ル）がＤであるか否かが判断される。ここでは、テーブ
ルＤを参照していたので、ステップＳ３５において、属
性バッファの内容を全て消去する。これは、テーブルＤ
に掲げられた属性「同時」「過程が明確」「過去でな
い」「命令」は、それ以降に接尾語が続かない場合にの
み適用されるものだからである。その後、接尾語を
「き」だけで確定する（図７Ａに示す解析ファイル参
照）。なお、この場合、「き」に対する属性はないので
解析ファイルにはその属性を記憶しない（ステップＳ３
６）。

【００６０】上記のようにして、ステップＳ３６の処理
を終えると、再びステップＳ２０以下を実行する。ステ
ップＳ２０においては、テーブルＤの「き」において指
示された次のテーブルＣ(2)、Ｓ(v)を用いて、「き」の
後の接尾語を検索する。検索は、テーブルＣ(2)、Ｓ(v)
の順に行う。

【００６１】テーブルＣ(2)を、図１９に示す。ＣＰＵ
１２は、次の文字「ま」を取得し、このテーブルに
「ま」が存在するか否かを判断する。さらに、次の文字
を含めて「ます」がテーブルに存在するか否かを判断す
る。このようにして、ＣＰＵ１２は、最も長い文字列と
して合致するものをテーブルＣ(2)から探し出す。ここ
では、No.22の「ます」が選択される。仮に、テーブル
Ｃ(2)から探し出せなかった場合には、テーブルＳ(v)に
ついて同じように検索する。なお、ステップＳ３０にお
いて、すでに検索済みの場合には、記憶しておいた検索
結果を利用すればよい。

【００６２】なお、ステップＳ２０、Ｓ２１の検索にお
いては、「き」より後の文字について、１文字（つまり
「ま」）、２文字（つまり「ます」）・・・という順で
文字数を増やしてテーブルに該当する接尾語があるか否
かの検索を行う。２以上の文字が検索された場合には、
最も長い接尾語を選択する。

【００６３】また、上記の処理において、最も長い接尾
語として、同じ接尾語が２以上選択される場合もある
（図１９のNO.15、NO.16の「たくな」参照）。この場合
に、何れの「たくな」を選択するのかは、それぞれの
「たくな」の次テーブル（ＣとＤ）の何れに、次の接尾
語が存在するか否かによって決定する。

【００６４】ところで、テーブルＤにおいて指示された
テーブルの何れにおいても接尾語を発見できなかった場
合には、与えられたテキスト文が誤っている可能性があ
るので、この旨をＣＲＴ１６に表示する（ステップＳ２
１、Ｓ２２）。誤りを訂正する入力があれば、ステップ
Ｓ２１に戻る。

【００６５】ここでは上記のように、テーブルＣ(2)か
ら「ます」が選択される（図１９参照）。テーブルＣ
(2)は、各接尾語に対して、「次テーブル」「新しい文
節のはじまり」「定形／非定形」「様相」「次に述語を
伴うもの」「属性」の欄を有している。

【００６６】「次テーブル」の欄は、接尾語が続く場合
に参照すべきテーブルを示している。

【００６７】「新しい文節のはじまり」の欄は、当該接
尾語によって、トークンが属性を持った１かたまりとし
て完結するか否かを表している。「はじまる」であれ
ば、当該接尾語によってトークンが完結することを表し
ている。この欄が、空白の場合には、当該接尾語によっ
てトークンが完結しないことを表している。

【００６８】「定形／非定形」の欄は、この接尾語に接
尾語が続くか否かを表している。「定形」であれば、必
ず接尾語が続かないことを表し、「非定形」であれば、
必ず接尾語が続くことを表している。空白であれば、何
れの可能性もあることを示している。この「定形」は、
文型の分析において重要な役割を果たす。

【００６９】「様相」は、前述の基本的な属性の１つで
ある。この欄に何らかの記述があれば、様相があること
を示しており、空白であれば、様相がないことを示して
いる。

【００７０】「次に述語を伴うもの」は、前述の基本的
な属性の１つである。この欄に「過程が明確」「過程が
明確であろう」等の「明確」を含む表示があれば、当該
述語が「次に述語を伴うもの」でないこと、つまり、後
に述語を伴わないことを示している。それ以外の場合に
は、「次に述語を伴うもの」となりうること、つまり、
後に述語を伴う可能性があることを示している。なお、
この欄においては、次に述語を伴うか否かだけでなく、
「同時」「もし・・・だけれども」等の属性も示してい
る。

【００７１】「属性」の欄は、当該接尾語を有する述語
の持つ基本的な属性を示している。この実施例では、こ
の欄に１１種類の文法的属性を記述するようにしてい
る。この１１種類の属性は、上記の「次に述語を伴うも
の」「様相」とともに、動詞の１３種類の基本的属性を
形成する（表２参照）。

【００７２】今ここでは、テーブルＣ(2)の「ます」が
検索されている。したがって、「次に述語を伴うもの」
の欄で「過程が明確」を得て、「属性」の欄で「過去で
はない」「敬語」を得る。ＣＰＵ１２は、これらの属性
を、図２５Ａに示すように、属性バッファに記憶する
（ステップＳ２３）。属性バッファには、動詞の基本的
属性を保持するための１３の領域と、これら以外の属性
や、これらを補足する属性を記憶するための領域が設け
られている。テーブルには、「過去ではない」と記述さ
れているので、「過去」の領域を「−」にする。また、
「過程が明確」と記述されているので、「次に述語を伴
うもの」の領域を「−」にする。とともに、「過程が明
確」という属性を、記憶する。また、「敬語」と記述さ
れているので、「敬語」を「＋」にする。

【００７３】このように、属性バッファには、テーブル
に明示された属性のみを記憶し、他の属性は空白のまま
にしておく。ただし、テーブＤ以外のテーブルにおいて
は、「次に述語を伴うもの」については、「過程が明
確」「過程が明確であろう」等の「明確」を有する属性
が記載されていれば「−」を記憶し、「明確」を有する
属性が記載されていなければ「＋」を記憶する。テーブ
ルＤにおいては、「明確」を有する属性が記載されてい
る場合のみ「−」を記憶し、「明確」を有する属性が記
憶されていない場合には、属性は空白としておく。

【００７４】上記のように属性バッファへの記憶が終了
すると、次に、「ます」によって、１つのトークンが完
結するか否かを判断する。つまり、「ます」の「新しい
文節のはじまり」の欄が「はじまる」となっているか否
かを判断する（ステップＳ２５）。仮に、「はじまる」
であれば１つのトークンが完結したことになる。したが
って、この時点において接尾語を確定し、属性バッファ
の内容を当該接尾語に対する文法的属性として、解析フ
ァイルに記憶する（ステップＳ２６）。ここでの記憶処
理の詳細についても、後で述べる。次に、ステップＳ２
７において、属性記憶フラグを「１」にする。その後、
ステップＳ２８に進む。

【００７５】なお、ここでは「ます」の「新しい文節の
はじまり」の欄は空白であるから、ステップＳ２５か
ら、ステップＳ２６、Ｓ２７を経ることなく、ステップ
Ｓ２８に進む。

【００７６】ステップＳ２８、Ｓ２９においては、「ま
す」の「定形／非定形」の欄が「非定形」となっている
か否かを判断する。「非定形」であれば、この後に必ず
接尾語が続くので、ステップＳ３１、Ｓ３２を経て、次
の接尾語の処理に進む。「定形」であれば、この後には
接尾語が続かないので、ステップＳ３８以下の終了処理
を行う。「ます」の「定形／非定形」の欄は空白である
から、ステップＳ２８、Ｓ２９を経て、ステップＳ３０
へ進む。

【００７７】ステップＳ３０においては、指示された次
のテーブルを参照して、次のトークンが当該テーブルに
存在するか否かを判断する。つまり、次に、接尾語が続
くか否かを判断する。ここでは、次のトークンが「。」
であり、指示されたテーブルＣには存在しないので、次
に接尾語が続かないものとして、ステップＳ３８へ進
む。なお、この段階において、次テーブルの指示がない
場合（たとえば「ません」の場合）にも、次に接尾語が
続かないと判断する。なお、接尾語が続くか否かの判断
は、次のトークンが品詞辞書に存在するか否かによって
判断しても良い。すなわち、品詞辞書に存在すれば、次
のトークンが接尾語でないと判断できる。

【００７８】ステップＳ３８においては、属性記憶フラ
グが「１」であるか否かを判断する。ここでは、属性記
憶フラグは「０」であるから、ステップＳ３９に進み、
属性バッファの内容を当該接尾語に対する文法的属性と
して、解析ファイルに記憶する。なお、この際、属性バ
ッファの空白の属性に関しては、デフォルトである
「−」を解析ファイルに記憶する。このように、一般的
によく用いられる属性を、デフォルトで「−」として設
定することにより、テーブルに記憶する属性の数をでき
るだけ減らすことができる。以上のように、図７の解析
ファイルの「ます」に関連づけて、図２５Ｂに示すよう
に、文法的属性が記憶される。つまり、「ます」は、
「使役でない」「受け身でない」「過去でない」・・
「次に述語を伴わない」・・「様相がない」「敬語であ
る」「過程が明確である」という属性を有することが記
憶される。ステップＳ２６における解析ファイルへの記
憶処理においても、上記と同様に、空白の属性に関して
デフォルト「−」が与えられる。

【００７９】なお、ステップＳ２６において、属性バッ
ファの内容を解析ファイルに記憶していた場合には、ス
テップＳ３９は行う必要がないのでスキップする（ステ
ップＳ３８）。

【００８０】また、上記実施例では、テーブルＤに掲げ
る接尾語に対して接尾語が続く場合には、テーブルＤの
接尾語の属性は記憶しないようにしている。しかし、各
属性（「次に述語を伴うもの」を除く）に、デフォルト
「−」を与えて記憶するようにしてもよい。

【００８１】上記のようにして、「ます」を１つのトー
クンとして確定し、その品詞を一般動詞の接尾語と確定
し、さらにその文法的属性を解析することができる。

【００８２】なお、上記の例では、一般動詞の接尾語に
ついて説明したが、連結詞の接尾語や助動詞の接尾語に
ついても同じように接尾語のためのテーブルを用いて接
尾語の確定および属性解析を行う。ただし、連結詞の接
尾語や助動詞の接尾語については、一般動詞のようなテ
ーブルＤはなく、直接、テーブルＣを参照する。

【００８３】また、述語形容詞の接尾語についても同じ
ように接尾語のためのテーブル８ｄを用いて、接尾語の
確定および属性解析を行う。そのフローチャートは、動
詞の接尾語の場合と同じように、図１６、図１７に示す
ものとなる。述語形容詞の接尾語のためのテーブル８ｄ
の一部を図２２に示す。述語形容詞の接尾語において
は、一般動詞の接尾語のようなテーブルＤはなく、図２
２に示すようなテーブルＦを持っている。なお、図２２
のテーブルＦ（述語形容詞の接尾語のためのもの）がテ
ーブルＣ（動詞の接尾語のためのもの）やテーブルＤを
参照する場合もある。また、逆に、図１９のテーブルＣ
(2)（動詞の接尾語のためのもの）がテーブルＤやテー
ブルＦ（述語形容詞の接尾語のためのもの）を参照する
場合もある。これは、動詞の接尾語と述語形容詞の接尾
語の何れにもなりうるものが存在するためである。

【００８４】上記のように、この実施例では、接尾語を
分類して、テーブル化している。これにより、品詞辞書
に個々の動詞や述語形容詞に接尾語を振り当てて登録す
る場合に比べて、辞書容量を大幅に減らすことができ
る。加えて、接尾語の確定を行う際に迅速な処理を行う
ことができ、同時にその属性を解析することができる。
また、ありえない接尾語のつながりを見い出して、文章
の誤りを見つけることもできる。

【００８５】なお、この実施形態における接尾語のテー
ブルでは、原則として、接尾語を５０音順に並べて、５
０音順に検索するようにしている。しかし、使用頻度を
記憶しておいて、使用頻度順に検索するようにしてもよ
い。さらに、当該使用頻度を学習によって更新するよう
にしても良い。また、接尾語を使用頻度順に並べておい
ても良い。

【００８６】さらに、検索速度を向上させるため、複数
のテーブルに重複して接尾語を記載するようにしても良
い。

【００８７】また、上記実施例では、次テーブルがＣの
場合、テーブルＣ(0)、Ｃ(1)、Ｃ(2)・・・の順に接尾
語の検索を行うようにしている。しかし、各テーブルご
とに予め使用頻度を記憶しておき、使用頻度順に検索す
るようにしてもよい。さらに、当該使用頻度を学習によ
って更新するようにしてもよい。

【００８８】図１６、図１７の接尾語の解析処理を終了
すると、図５のステップＳ５に進む。ここでは、「。」
についての処理が残っているので、ステップＳ５、Ｓ６
を経て、ステップＳ２おいて、品詞を取得する。「。」
について品詞「句点」を取得すると、全てのトークンに
ついて品詞を取得したことになる。

【００８９】次に、ＣＰＵ１２は、品詞の不明なトーク
ンについて品詞の決定を行う（ステップＳ７）。図８
に、品詞決定の詳細なフローチャートを示す。まず、ス
テップＳ１０において、「僕」に対して２以上の品詞が
取得されているか否かを判断する。ここでは、「僕」の
品詞はすでに一般名詞として確定されているので、その
まま一般名詞とする。

【００９０】次に、ステップＳ１３、Ｓ１４を経て、次
のトークン「は」について同様の処理を行う。ここで、
「は」に対しては２以上の品詞が取得されているので
（つまりＢ(45)が記憶されているので）、ステップＳ１
１に進む。ステップＳ１１においては、記憶されている
ルールテーブルＢ(45)を参照する。

【００９１】ルールテーブルＢ(45)は、ハードディスク
１４に記憶されている。その詳細を、図９に示す。この
ルールテーブルには、複数のルール（NO.1〜NO.3）が記
憶されている。まず、NO.1のルールが読み出される。N
O.1のルールは、左側（１つ前）のトークンが主格の不
変化詞、間接目的語として使われる場合の不変化詞、後
置詞、副詞のいずれかである場合、トークン「は」は、
土台となる不変化詞であることを示している。ここで、
ＣＰＵ１２は、ステップＳ２で記憶した左側のトークン
「僕」の品詞を読み出す（図７Ａ参照）。「僕」の品詞
は一般名詞であって、上記品詞の何れでもないから、N
O.1のルールは成立しない。

【００９２】同様にして、ＣＰＵ１２はNO.2、NO.3のル
ールを検討し、適合するルールを見い出す。ここでは、
NO.3のルールが成立し、「は」の品詞は、主格の不変化
詞”は”であると確定できる。

【００９３】ＣＰＵ１２は、このようにして確定した品
詞をハードディスク１４に記憶する（ステップＳ１
２）。つまり、図７Ｂに示すように、主格の不変化詞”
は”が記憶される。さらに、ＣＰＵ１２は、適用したル
ールNO.3のウエイトの項目より、「１」を取得してこれ
も併せて記憶する（図７Ｂ参照）。ここで、ウエイトと
は、品詞決定の確実性の程度を数値化したものである。
この実施例では、情報不足を「０」、正確を「１」、少
し正確を「２」、不正確を「３」としている。このよう
なウエイト付けをしておくことにより、解析後の種々の
処理（たとえば他言語への翻訳等）の際に、ウエイトに
基づいて処理結果に正確性を付与することができる。

【００９４】以上と同様にして、全てのトークンについ
て処理を行う（ステップＳ１３、Ｓ１４）。ここで挙げ
た例では、２以上の品詞を持つのは、トークン「は」だ
けであるので、最終的な記憶内容は図７Ｂのようにな
る。

【００９５】以上のようにして、「僕は学校へ行きま
す。」という文を、各トークンに分割して、品詞を付与
することができる。以後、このトークンへの分割と品詞
の付与および属性の解析を基本として、トークンの役割
の解析（文型分析等）等が行われていく（ステップＳ
９）。これら品詞の情報、属性の情報は、特に、他言語
への翻訳を行う場合に、その正確性を向上させるために
重要な情報となる。

【００９６】たとえば、これらの情報をもとに、英語へ
の翻訳を行う場合に、動詞の語根「行」を「go」に対応
付けることができる。さらに、図２５Ｂに示す接尾語
「ます」について解析した属性（「使役でない」「受け
身でない」・・・「敬語である」「過程が明確」）に基
づいて、訳語を決定することができる。つまり、この場
合には、「過去でない」「敬語である」「過程が明確」
という属性を持っているので、「go」という訳語を選択
することができる。

【００９７】たとえば、「行った」に対しては、接尾語
の解析により「過去である」という属性が得られ、「we
nt」という訳語を得ることができる。また、「行ってい
ます」に対しては、解析により「継続している」という
属性が得られ「be going」という訳語を得ることができ
る。このように、述語を述語の語根と接尾語とに分割
し、接尾語によって述語の属性を解析することにより、
英語への翻訳を正確に行うことができる。

【００９８】また、各述語についての属性解析を行って
いるので、この解析結果に基づき、英語以外の言語への
翻訳も同様に行うことができる。つまり、上記実施例に
おいて解析した結果は、各言語へ翻訳する際の共通的情
報となるものであり、いわゆるピボット方式による他国
語への翻訳を正確に行うことを可能とする。

【００９９】もちろん、解析結果を翻訳システムに用い
るのはその一例であり、その他、言語教育システム等に
も用いることができる。

【０１００】上記で例示したルールテーブルでは、左側
のトークンのみを参照して品詞を決定している。しか
し、他のルールテーブルでは、右側（１つ後ろ）のトー
クンも参照する場合もあるし、右側のトークンだけを参
照する場合もある。いずれにしても、当該トークンの品
詞を決定するために必要な程度、前後（１以上離れたト
ークンを含んでいてもよい）のトークンを参照すること
が好ましい。

【０１０１】次に、「麓に近いこの村は景色が美しかっ
た。」という文を例にして、上記の解析を説明する。ま
ず、図５のステップＳ２、Ｓ５、Ｓ６を繰り返し実行し
（動詞や述語形容詞についてはＳ３、Ｓ４）、図１０Ａ
に示すように、トークンに分解して品詞を取得する。な
お、この際に、述語形容詞の接尾語である「い」「かっ
た」は、上述の動詞の接尾語と同じように、テーブルを
用いて確定され、その属性が解析される。なお、図１０
Ａの解析ファイルにおいて、「い」「かった」に関し、
属性解析の結果がリンクされているが、図示は省略して
いる。

【０１０２】図１６、図１７のフローチャートを参照し
て、述語形容詞の解析処理を説明する。まず、述語形容
詞の語根「近」を取得した後、接尾語の分析を行う（図
５のステップＳ３、Ｓ４）。この実施例においては、述
語形容詞の接尾語のテーブルを、１つのテーブルＦ（そ
の一部が図２２に示されている）にまとめている。した
がって、述語形容詞の接尾語を解析する際には、テーブ
ルＦを検索する（ステップＳ２０）。テーブルＦから、
「い」が検索される。属性バッファには、図２２のテー
ブルＦを参照して、「過去」を「−」、「次に述語を伴
うもの」を「−」として記憶される。また、「過程が明
確」という属性も属性バッファに記憶される（ステップ
Ｓ２３）。

【０１０３】「はじまる」「定形」「非定形」の指示が
ないので、ステップＳ２５、Ｓ２８、Ｓ２９を経て、ス
テップＳ３０に進む。ステップＳ３０では、次のトーク
ンが指示された接尾語のテーブルＣ（Ｃ(1)、Ｃ(2)・・
・・・）にあるか否かを判断する。ここでは、次のトー
クン「こ」「この」「この村」・・・が、テーブルＣに
ないので、ステップＳ３８、Ｓ３９に進む。

【０１０４】ステップＳ３９においては、属性バッファ
の内容を解析ファイルに記憶する。なお、この際、属性
バッファに指示のない属性について、デフォルトの属性
「−」を記憶する点は動詞の接尾語の場合と同じであ
る。ただし、述語形容詞の接尾語に関しては、前記表３
にあったように、基本的属性は５つのみが設定されてい
る。このようにして記憶された「い」の属性を図２６Ａ
に示す。以上のようにして、接尾語「い」が確定され、
その属性が解析される。

【０１０５】上記と同様にして、「かった」が接尾語と
して確定され、その属性が図２６Ｂのように解析ファイ
ルに記憶される。

【０１０６】ここで、述語形容詞の接尾語の属性につ
き、他の言葉「楽しくなります」を例として説明する。
「楽し」は、品詞辞書により、述語形容詞の語根である
と判断する。次に、図２２のテーブルＦを見て、接尾語
「くな」を検索する。「くな」は「新しい文節のはじま
り」の欄が「はじまる」となっている。したがって、接
尾語として確定し、図２７Ａに示すように属性を記憶す
る。

【０１０７】また、「くな」は「非定形」であるから
（図１７、ステップＳ２８）、次のトークンについて次
のテーブルＤのｒ欄を検索する。これにより、テーブル
Ｄから「り」を見い出す。「り」に関し、属性バッファ
には、一旦「同時」が記憶される（ステップＳ２３）。
しかし、ステップＳ３５においてその内容が消去され、
解析ファイルには「り」に関して、属性は記憶されない
（ステップＳ３６）。

【０１０８】さらに、次のテーブルＣ(2)、Ｓ(v)を検索
して、「ます」を見い出す（ステップＳ２１参照、ただ
し、すでに、ステップＳ３０において検索済みであるか
らその結果を利用する）。このようにして、図２７Ｂに
示すように属性を記憶する。

【０１０９】なお、「くな」は述語形容詞の接尾語のテ
ーブルにあるので基本的属性を５つとして解析し、「ま
す」は動詞の接尾語のテーブルにあるので基本的属性を
１３として解析する。

【０１１０】なお、上記の実施例では、「り」と「ま
す」をそれぞれ１つの接尾語として解析ファイルに記憶
し、属性があれば、それぞれの属性を記憶するようにし
た。しかし、１つの接尾語「ります」として解析ファイ
ルに記憶し、属性を記憶するようにしてもよい。この場
合には、「り」に関する属性バッファの内容と、「ま
す」に関する属性バッファの内容とを加え、これを、
「ります」に関する属性バッファとする。この例では、
「り」には属性がないので、「ます」の属性が、「りま
す」の属性となる。

【０１１１】なお、２以上の接尾語がそれぞれ属性を有
する場合には、何れか１つの接尾語の属性バッファに記
憶された属性を、全体の属性として属性バッファに記憶
する。ただし、「次に述語を伴うもの」の属性は、最後
の接尾語の属性を、全体の属性とする。

【０１１２】上記のようにして得た「ります」の属性バ
ッファの内容を、解析ファイルに記憶する。このさい、
空白の属性に対しては、デフォルト「−」を与えて記憶
する。

【０１１３】さらに、「くな」「り」「ます」を１つの
接尾語「くなります」として、解析ファイルに記憶し、
属性を記憶してもよい。この場合、「くな」は５つの基
本的属性を持ち、「ます」は１３の基本的属性を持って
いるので、１８の属性を持つものとして記憶する。

【０１１４】ここで、「麓に近いこの村は景色が美しか
った。」という例に戻って、説明を進める。以上のよう
に接尾語を含めて、全てのトークンに付き図１０Ａのよ
うに品詞を取得すると、次に、図５のステップＳ７にお
いて、品詞の不明なトークンについて品詞の確定を行
う。

【０１１５】まず、トークン「に」について、ルールテ
ーブルＢ(43)を参照する。ルールテーブルＢ(43)の詳細
を図１１に示す。まず、ルール１についての検討が行わ
れる。ルール１は、左のトークンが「次に述語を伴わな
い動詞」となっている。ここでは、動詞の語根＋動詞の
接尾語を「動詞」と呼んでいる。これは、「動詞の語
根」＋「動詞の接尾語」という２つのトークン（このよ
うなかたまりをクワジワードと呼ぶ）を判断の基準に使
うということを示している。つまり、判断の基準に用い
られるトークンはこの場合のように複数となる場合もあ
る。また、ルール１に示すように、品詞以外の要素であ
る「述語を伴わない」という要素も加味して、ルールを
構成する場合もある。

【０１１６】いずれにしても、ここでは、左のトークン
が一般名詞であるので、ルール１は該当しない。その結
果、ルール１に該当しない場合の全ての場合に適用され
るルール２が適用される。すなわち、品詞は、間接目的
語として使われる不変化詞”に”であると決定される。
また、そのウエイトは、２として記憶される。

【０１１７】以下同様にして、「は」については、図９
のルールテーブルＢ(45)を参照して、主格の不変化詞”
は”であると決定される。また、「が」については、図
１２のルールテーブルＢ(44)を参照して、主格の不変化
詞”が”であると決定される。

【０１１８】以上のようにして、「麓に近いこの村は景
色が美しかった。」という文が解析される。つまり、図
１０Ｂに示すように、トークンへの分割と、各トークン
の品詞が、解析ファイルとしてハードディスク１４に記
憶される。

【０１１９】なお、同じ品詞が連続する場合などは、前
後のトークンの品詞によって当該トークンの品詞を決定
することが不適切となる場合もある。たとえば、「車は
常に迅速、確実かつ安全に運転しよう。」という文につ
いて、品詞辞書から品詞を取得した結果は、図１５Ａの
ようになる。ここで、「は」については、上記と同様に
して、ルールテーブルＢ(45)を参照して品詞を決定す
る。

【０１２０】次に、「迅速」の品詞を確定するため、ル
ールテーブルＢ(6)を読み出す（図２３参照）。しか
し、このルールテーブルに従って、右側のトークン「確
実」の品詞に基づいて品詞を確定してはならない（な
お、ここでの「、」はトークンとトークンを分割してい
るだけであり無視する）。もっとも、例示したケースの
場合には、「確実」の品詞が定まっていないため、確定
すらできない。しかし、たとえ確定できたとしても、
「確実」の品詞に基づいて確定すると誤った結果とな
る。

【０１２１】図２４を参照しつつその説明をする。同じ
品詞のトークンα、βが連続した場合、これらは１つの
トークンとして、これら同じ品詞の連続トークンα、β
以外のトークンγと関係していると見られる。つまり、
図に示すように、それぞれのトークンα、βが、それぞ
れトークンγに関係していると見られるのである。した
がって、トークンαについて、図２３のテーブルＢ(6)
を適用する際に、右のトークンは、γとしなければなら
ないのである。

【０１２２】このように、同じ品詞のトークン（同じル
ールテーブルを参照するトークンはそうであると推定す
る）が連続した場合（コンマや同等の接続詞が入ってい
る場合も連続とみなす）には、同じルールテーブルを参
照しない最も近いトークン（ただし、コンマや同等の接
続詞は無視する）の品詞を用いてルールテーブルにあて
はめる。上記の例でいうと、「迅速」についての品詞を
決定する場合には、「確実」や「安全」の品詞でなく、
「に」の品詞で決定するようにしている。

【０１２３】なお、「に」の品詞は確定しておらずテー
ブルＢ(43)によって決定されるようになっているが、テ
ーブルＢ(6)とＢ(43)においてとりうる品詞の組み合わ
せによって、品詞が確定可能である。

【０１２４】同様に、「確実」も、「に」の品詞によっ
てその品詞が決定される。このようにして、得られた品
詞を、図１５Ｂに示す。なお、図１５Ｂのように品詞を
定めた後、所定のルールを用いて（たとえば、連続する
一般名詞と不変化詞を１つのトークンとする等のルール
を用いて）「車は」を１つののトークンとしてまとめて
扱ってもよい。同様に、「運転」「しよ」を１つのトー
クンとしてまとめて動詞として扱っても良い。このよう
な処理は、これに続く解析の内容によって、適宜選択す
ることができる。

【０１２５】図１３および図１４に、品詞確定のための
テーブルの他の一部を示す。これらのテーブルＢ(1)、
Ｂ(2)は、いわゆる体言止めの文章について、句点の直
前の「名前」を述語として扱うための判断を行うテーブ
ルである。

【０１２６】以上述べたように、この実施例では、動詞
を、動詞の語根と動詞の接尾語とに分けて、それぞれ１
つの品詞としている。また、同様に、述語形容詞を述語
形容詞の語根と述語形容詞の接尾語とに分けて、それぞ
れ１つの品詞としている。これにより、接尾語は、品詞
辞書に登録せず、前記のようにテーブルによって特定す
るという処理を可能にしている。

【０１２７】なお、「行くかもしれない」等の慣用的な
言葉は、動詞の語根「行」と接尾語「く」と慣用語「か
もしれない」に分割し、慣用語「かもしれない」を接尾
語のように扱って動詞の接尾語ためのテーブル中に盛り
込んでおいてもよい。これは、慣用語が動詞の接尾語と
同じ機能を持っているからである。このようにして慣用
語を盛り込んだ接尾語のテーブルの例を、図２０に示
す。このようにしておけば、動詞の語根やその接尾語に
続く慣用語の解析が容易となる。なお、このテーブルに
おいて、記号”、”はORの意味であり、記号”＊”はAN
Dの意味である。ただし、”＊”の右側の文字は使わな
い場合もある。たとえば、（Ａ、Ｂ）＊（Ｃ）と表記さ
れている場合、とりうる言葉は、ＡＣ，ＢＣ，Ａ，Ｂの
４つであることを示している。

【０１２８】なお、上記のように慣用語を接尾語のよう
に扱うテーブルを、動詞の接尾語のテーブルと一体にし
てもよいが、これと分離して設けてもよい。

【０１２９】また、複合動詞について、動詞（”い”行
で終わる動詞）の語根の次の接尾語に続く動詞を接尾語
として扱う、複合動詞のテーブルを設けてもよい。この
実施例では、この複合動詞のテーブルを、一般動詞の語
根に続く接尾語のテーブルによって指示されるテーブル
Ｓ(V)として設けている（図２１参照）。つまり、動詞
の接尾語のテーブル中に設けられている。しかし、これ
とは分離して、設けてもよい。

【０１３０】動詞（動詞の語根の次の接尾語が”い”行
で終わる動詞）に動詞が続くと、図２１の複合動詞のテ
ーブルＳ(V)が呼び出される。これにより、処理の高速
化が図られる。

【０１３１】ところで、「する」や「来る」等の動詞
は、語根が変化してしまう。つまり、本発明の考え方を
適用すれば、語根がないということになってしまう。こ
のような動詞に対しては、例外的に、変化するそれぞれ
の語根を品詞辞書に登録するとともに、次に続くテーブ
ルの番号を記憶するようにしている（図６の「来」「来
る」「来い」「来よ」参照）。

【０１３２】なお、上記実施例では、述語形容詞の接尾
語のテーブル中に、助動詞を含む接尾語を記載している
（そして、属性として「助動詞の存在」を与えてい
る）。これにより、検索の迅速性を得ている。しかし、
このような助動詞をテーブルに記載せず、品詞辞書に記
憶するようにしてもよい。

【０１３３】また、上記各実施例では、文章データを受
けてとって、これをトークンに分割し、品詞の決定、属
性の解析を行うようにしているが、予めトークンに分割
された文を受け取って、品詞の決定、属性の解析を行う
ようにしてもよい。

【０１３４】−役割の解析（文型の分析）− 上記のようにして品詞の決定および属性の解析を終える
と、次に、各トークンの役割の決定を行う。そのフロー
チャートを、図２８、図２９に示す。

【０１３５】前述の品詞の決定において、「僕は学校へ
行きます。」という文に対しては、図７Ｂに示すような
結果が得られる。ＣＰＵ１２は、これを、図３０Ａに示
すようなツリー形式に記憶する。なお、「Ｔインターバ
ル」とは、句点や？や！等の文の最後に来るものをい
う。

【０１３６】まず、ステップＳ４０において、各トーク
ンの品詞に基づいて、「名前」と「主格の不変化詞”
は”」が連続する場合、「次に述語を伴わない述語（質
問する不変化詞”か”をともなってもよい）」と「主格
の不変化詞”は”」が連続する場合を検索する。ここで
は、最初のトークン「僕」と２番目のトークン「は」
が、「名前」と「主格の不変化詞”は”」が連続する場
合に該当する。このように、該当するトークンを見いだ
すと、これらに対して、「主格は」というマークを付す
（図３０Ｂ参照）。なお、ここで、次に述語を伴わない
述語とは、当該述語の最後の接尾語が「明確」という属
性（過程が明確、過程が明確であろう等）を有する述語
をいう。

【０１３７】同様に、「名前」と「主格の不変化詞”
が”」が連続する場合を検索する（ステップＳ４１）。
見い出すと、これらに対して、「主格が」というマーク
を付す。

【０１３８】上記のように、この実施形態においては、
ステップＳ４０、Ｓ４１が第１トークン抽出手段に対応
している。

【０１３９】次に、以下に示すような場合を抽出する
（ステップＳ４２）。

【０１４０】a)次に述語を伴わない述語のトークンと品
詞が「名前」である１以上のトークンが連続し、さらに
「不変化詞”は”」が連続する場合、 b)上記a)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合、 c)次に述語を伴わない述語と品詞が「名前」であるトー
クンが連続し、さらに「不変化詞”が”」が連続する場
合、 d)上記c)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合。

【０１４１】上記の何れかに該当する場合には、これら
を一つにして抽出する（ステップＳ４２）。これらを見
出すと、それぞれ、「述語＋主格は」「述語＋主格が」
のマークを付与する。つまり、この実施形態において
は、ステップＳ４２が第３トークン抽出手段に対応して
いる。なお、「次に述語を伴わない述語」「名前」「主
格の不変化詞”は”」が連続する場合や、「次に述語を
伴わない述語」「名前」「主格の不変化詞”が”」が連
続する場合であっても、これらより前に、「主格は」や
「主格が」が存在しない場合には、抽出を行わない。

【０１４２】以上を終えると、ステップＳ４０、Ｓ４１
において、「主格は」「主格が」のマークを付すことが
できたか否かを判断する（ステップＳ４３）。これがな
い場合には、主語、トピックのない文章であり、文型分
析を行う必要はなく、直ちに、ステップＳ５５の部分的
文章構成法的分析に行く（ステップＳ５５）。

【０１４３】「主格は」「主格が」がある場合には、ス
テップＳ４４において、Ｔインターバルがあるか否かを
判断する。Ｔインターバルがない場合は、通常の文では
なく表題であると考えられるので、表題のための処理ス
テップＳ４８、Ｓ４９、Ｓ５０を実行する。Ｔインター
バルがある場合には、通常の文であると考えられるの
で、ステップＳ４５以下を実行する。

【０１４４】まず、ステップＳ４５において、Ｔインタ
ーバルに最も近い位置にある「次に述語を伴わない述
語」を検索する。なお、ここでは、ステップＳ４０や、
Ｓ４２においてすでに「次に述語を伴わない述語＋は」
や「述語＋主格は」「述語＋主格が」として検索済みの
述語は、既に抽出されているので、検索対象とならな
い。「次に述語を伴わない述語」を見出すと、これに
「述語」のマークを付す（図３０Ｂ参照）。この述語
は、Ｔインターバルの直前の述語、すなわち文型の述語
であり、述語の中で最も大切な役割を果たす。文型のあ
る文章では、「主格は」「主格が」と伝達的関係を持
つ。

【０１４５】なお、Ｔインターバルの直前のトークンの
品詞が「名前」である場合には、これにも「述語」のマ
ークを付す（ステップＳ４６）。これは、いわゆる体言
止めの場合の「名前」を述語として扱うためである。も
っとも、前述の品詞の確定の段階で、このような体言止
め全てを「述語」として判断できるようにしておけば、
このステップは不要である。この実施形態では、ステッ
プＳ４５、Ｓ４６が第２トークン抽出手段に対応してい
る。

【０１４６】以上のようにして、「主格は」「主格が」
「述語＋主格は」「述語＋主格が」「述語」のマークを
付けた後、これらのマークに基づいて文型を決定する
（ステップＳ４７）。文型は、図３２、図３３に示すよ
うに、ハードディスク１４に予め記憶されている。ＣＰ
Ｕ１２は、これらの文型の中から、合致する文型を選択
する。ここでは、「主格は」「述語」に対応する、文型
１が選択される。

【０１４７】次に、この文型１が曖昧であるか否かを判
断する（ステップＳ５１）。文型１は、(a)(b)２つの形
式を有するので、曖昧であると判断される。よって、ス
テップＳ５２に進み、ディフォルトの文型（ここでは、
(a)）を選択する。なお、文型７のように形式が１つで
あり曖昧でない文型の場合には、当該１つの形式を用い
る。

【０１４８】以上のようにして文型を選択すると、当該
文型に応じて、予め記憶されている各トークンの伝達的
役割を付与する（ステップＳ５３）。文型１の(a)は、
文章構成法的役割として、「主格は」が主語としての役
割を有し、「述語」が述語としての役割を有することを
示している。また、伝達的役割は、「述語」から「主格
は」へ向かう矢印によって示され、「述語」と「主格
は」が伝達的関係にあることを示している。したがっ
て、ここでは、図３１Ａに示すように、「主格は」に対
して「主語」が与えられ、「述語」に対して「述語」が
与えられる。さらに、「述語」（行きます）が、「主
語」（僕は）と伝達的に関係していることが記憶される
（図３１Ａにおいては、「述語」から「主語」に向かう
矢印によって表している）。以上のようにして、トーク
ンの伝達的・文章構成法的役割を決定する。

【０１４９】次に、役割の決定されていないトークンが
存在するか否かを判断する（ステップＳ５４）。全ての
トークンについての役割が決定されていれば、処理を終
了する。役割の決定されていないトークンが存在すれ
ば、続いて、部分的文章構成法的分析を行う（ステップ
Ｓ５５）。

【０１５０】なお、上記においては、Ｔインターバルの
ある文についての処理を説明した。Ｔインターバルのな
い文は、ステップＳ４８以下によって処理する。まず、
次に述語を伴わない述語の内、一番最後に位置する述語
を抽出し、これをＴインターバルに最も近い述語として
扱う（ステップＳ４８）。また、ステップＳ４８におい
て、述語が見いだせない場合には、最後のトークンが
「名前」であるか否かを判断する（ステップＳ４９）。
最後のトークンが「名前」でなければ、誤った文である
としてエラーを表示する。「名前」である場合には、
「述語」のマークを付す（ステップＳ５０）。以上のよ
うにして、Ｔインターバルのない文について「述語」を
決定する。以後の処理は、Ｔインターバルがある場合と
同じである。

【０１５１】なお、上記実施形態においては、文型が曖
昧な場合には、デフォルトの文型を選択するようにした
が、２以上の文型を候補として出力するようにしてもよ
い。また、頻度に応じて、１つの文型を選択するように
してもよい。

【０１５２】この実施形態において、文型分析によって
付与する役割は、以下のとおりりである。

【０１５３】「主語」：文章における最も中心的な役割
を果たし、文章の全ての要素は、主語を説明するために
ある。主語は、述語との間に伝達的関係を持つ。また、
主語は述語の主体である。

【０１５４】「トピック」：文章における話題を提供す
るという役割である。また、トピックは、主語を説明す
る役割を持つ。

【０１５５】「述語」：文章中の品詞「述語」を持つト
ークンの内、最も大切な役割を持つ。述語は、主語、ト
ピックと伝達的関係を持つ。

【０１５６】「従属節の主語」：主語、トピックに従属
する文章の主語のことである。

【０１５７】「従属節のトピック」：主語、トピックに
従属する文章のトピックのことである。

【０１５８】「従属節の述語」：主語、トピックに従属
する文章の述語のことである。

【０１５９】図３４に、いくつかの文型の解析例を示
す。

【０１６０】−役割の解析（部分的文章構成法的分析）
− 上記の文型分析によって役割を与えられていないトーク
ンが存在する場合には、以下の部分的文章構成法的分析
を行う（ステップＳ５４、Ｓ５５）。部分的文章構成法
的分析のフローチャートを、図３５、図３６に示す。

【０１６１】まず、ステップＳ６１において、最後のト
ークンを得る。ここでは、最後のトークンとして、Ｔイ
ンターバルが得られる。次に、この最後のトークンにつ
いて、既に役割が付与されているか否かを判断する（ス
テップＳ６２）。なお、Ｔインターバルは、全ての文章
において同じ役割を持つので、既に役割が付与されてい
るものとして扱う。ここでは、最後のトークンが役割を
有するので、ステップＳ６３以下に進む。

【０１６２】ステップＳ６３では、役割の与えられてい
ないトークンがあるか否かを判断する。ここでは、「学
校」「へ」についてその役割が与えられていない。した
がって、ステップＳ６４に進む。ステップＳ６４におい
ては、文の最後から先頭に向かって検索を行って、役割
の与えられていないトークンを得る。ここでは、「へ」
が得られる。さらに、そのトークン「へ」の直後のトー
クンを得る。ここでは、直後のトークンとして「行きま
す」が得られる。

【０１６３】次に、直後のトークン「行きます」につい
て、その品詞が、Ｔインターバル直前の「名前」である
か、またはテーブルＢ(1)Ｂ(2)を用いて決定されたか否
かを判断する（ステップＳ６５）。つまり、いわゆる体
言止めの文章において、Ｔインターバルの直前のトーク
ンにつき、その品詞を「述語」として決定したものであ
るか否かを判断する。

【０１６４】そうでない場合、つまり体言止めでない場
合には、ステップＳ６６に進む。ステップＳ６６におい
ては、まず、上記の直後のトークン「行きます」に付与
された役割を得る。ここでは、「述語」が得られる。こ
の直後のトークンの役割「述語」と、役割の与えられて
いないトークン「へ」の品詞とに基づいて、当該未決定
トークン「へ」の役割を決定する。この実施形態では、
直後のトークンの役割に対応づけて、役割決定のための
テーブル（予測テーブル６４）をハードディスク１４に
予め記憶している。

【０１６５】ここでは、直後のトークンの役割が「述
語」であるから、図４０に示すテーブルＩ(3)を用い
る。テーブルＩ(3)において、未決定トークン「へ」の
品詞「間接目的語として使われる不変化詞”へ”」が、
「形態学的特徴のつながり」の欄に存在するか否かを検
索する（ステップＳ６７）。ここでは、マッチするもの
が見出されないので、次に、未決定トークン「学校」
「へ」の品詞「一般名詞」「間接目的語として使われる
不変化詞”へ”」の組み合わせによって検索を行う（ス
テップＳ６７）。これにより、第２４番目においてマッ
チすることが判明する。なお、一般名詞は名前グループ
Ａに含まれる（表１参照）。このようにしてマッチした
行の「予測される文章構成法的役割」の欄に記述された
役割「一般的な間接目的語」を、未決定トークン「学
校」「へ」の役割として記憶する（図３１参照）。ま
た、「行きます」と「学校へ」の伝達的関係を明らかに
するため、「行きます」から「学校へ」に向かって矢印
が付与される。

【０１６６】次に、全てのトークンについて役割が得ら
れたか否かを判断する（ステップＳ６９）。全トークン
について役割が得られていなければ、再び、ステップＳ
６４以下を実行し、役割を決定する。また、全トークン
について役割が得られていれば、処理を終了する。

【０１６７】以上のようにして、「僕は学校へ行きま
す。」という文が、図３１Ｂに示すように解析される
（図２５に示す属性の表示は省略した）。このような解
析により、各トークンの品詞、属性、伝達的・文章構成
法的役割を明瞭にすることができる。よって、他言語へ
の翻訳等を、正確に行うことができる。

【０１６８】なお、ステップＳ６７において、未決定ト
ークンの数を増やして検索しても、最終的にマッチング
が得られない場合がある。この場合には、直後のトーク
ンのさらに直後のトークンの役割に基づいて、用いる予
測テーブルを決定し、未決定トークンの役割を決定する
（ステップＳ７０）。

【０１６９】また、ステップＳ６５において、直後のト
ークンについて、その品詞が、Ｔインターバル直前の
「名前」であるか、またはテーブルＢ(1)Ｂ(2)を用いて
決定されていた場合には、ステップＳ７１以下の体言止
めに対する処理を行う。

【０１７０】ステップＳ７１においては、未決定トーク
ンの直後のトークンの役割が、主語またはトピックであ
るものとして、主格の予測テーブルを選択する。これ
は、体言止めにおけるＴインターバル直前のトークン
（品詞「名前」を持つ）の後ろには、「述語」が省略さ
れており、当該Ｔインターバル直前のトークンは主格と
しての役割を有していると考えられるからである。次
に、この予測テーブルＩ(2)に基づいて、未決定トーク
ンの役割を得る（ステップＳ７２）。マッチングが得ら
れた場合、ステップＳ６９に進んで、全てのトークンに
ついて役割が得られた否かを判断する。全トークンにつ
いて役割が得られていなければ、再び、ステップＳ６４
以下を実行し、役割を決定する。また、全トークンにつ
いて役割が得られていれば、処理を終了する。

【０１７１】ステップＳ７２において、マッチングが得
られなかった場合には、未決定トークンの直後のトーク
ンの役割が「述語」であるものとして、予測テーブルを
選択する。この予測テーブルＩ(3)に基づいて、未決定
トークンの役割を得る（ステップＳ７５）。マッチング
が得られた場合、その役割を記憶するとともに、ステッ
プＳ６９に進んで、全てのトークンについて役割が得ら
れた否かを判断する。全トークンについて役割が得られ
ていなければ、再び、ステップＳ６４以下を実行し、役
割を決定する。また、全トークンについて役割が得られ
ていれば、処理を終了する。

【０１７２】なお、ステップＳ７５においてマッチング
が得られなかった場合には、与えられた文章に誤りがあ
るとしてエラーを表示する。以上のようにして、体言止
めの文章についても解析を行うことができる。

【０１７３】また、ステップＳ６２において、最後のト
ークンに役割が与えられていない場合（たとえば、Ｔイ
ンターバルがない表題の場合）には、図３６のステップ
Ｓ７７以下に進み、最後のトークンに役割を付与する。
図３６の処理によって、最後のトークンに役割を付与し
た後、図３５に戻り、上記のステップＳ６３以下の処理
を行う。

【０１７４】図３６のステップＳ７７においては、最後
のトークンの品詞が「名前」であるか否かを判断する。
次に、当該最後のトークン以外に、役割が与えられてい
ないトークン（未決定トークン）があるか否かを、後ろ
から順に検索する（ステップＳ７８）。未決定トークン
がない場合には、処理を終了する。未決定トークンがあ
る場合には、当該未決定トークンを得る（ステップＳ７
９）。次に、未決定トークンの直後のトークンの役割が
「主格」であるものとして、予測テーブルを選択する。
つまり、予測テーブルＩ(2)を参照して、未決定トーク
ンのマッチングを行う（ステップＳ８０）。

【０１７５】マッチングが得られた場合、その役割を記
憶するとともに、図３５に戻ってステップＳ６３以下を
実行する。

【０１７６】マッチングが得られない場合、未決定トー
クンの直後のトークンの役割が「述語」であるものとし
て、予測テーブルを選択する（ステップＳ８２）。この
予測テーブルＩ(3)に基づいて、未決定トークンの役割
を得る（ステップＳ８３）。ここで、マッチングが得ら
れた場合、その役割を記憶するとともに、図３５に戻っ
てステップＳ６３以下を実行する。

【０１７７】なお、ステップＳ８４においてマッチング
が得られなかった場合には、与えられた文章に誤りがあ
るとしてエラーを表示する。上記のようにして、Ｔイン
ターバルのない表題のうち、最後が「名前」で終わるも
のについての解析を行うことができる。

【０１７８】図３６のステップＳ７７において、最後の
トークンが「名前」でない場合には、ステップＳ８５に
進み、最後のトークンの品詞が「後置詞」であるか否か
を判断する。「後置詞」（たとえば、・・・について）
であれば、当該「後置詞」の役割を「クワジの副詞修飾
語句」とする。さらに、次に用いるべき予測テーブル
を、クワジの副詞修飾語の予測テーブルI(13)、追加の
予測テーブルI(8)とする（ステップＳ８６）。以下ステ
ップＳ６３に戻って、通常の繰り返し処理を実行する。

【０１７９】なお、上記ステップＳ８５において、最後
のトークンが「後置詞」でない場合には、ステップＳ８
８に進む。ステップＳ８８にいおては、全ての予測テー
ブルの「形態学的特徴のつながり」の欄を用いて、当該
最後のトークンを未決定トークンとしてマッチングを行
う（ステップＳ８８）。マッチングが得られない場合に
は、エラーを表示する。マッチングが得られれば、当該
マッチングによって役割を付与し、次テーブルの欄にし
たがって、次に用いる予測テーブルを決定する（ステッ
プＳ９０）。その後、図３５に戻ってステップＳ６３以
下を実行する。以上のようにして、表題についても解析
を行うことができる。

【０１８０】なお、この実施形態において、部分的文章
構成法的分析において付与する役割を大きく分類する
と、下記のとおりである。

【０１８１】「連結詞や助動詞と結びつく関係」：連結
詞「である」や助動詞「になる」は、その前に名前や次
に述語を伴う述語形容詞を伴って、初めて意味をなす。
このような関係をいう。また、連結詞や助動詞は、単独
では意味をなさない。例えば、連結詞「である」は、
「先生である」「近くである」のように、名前や次に述
語を伴う述語形容詞を伴って役割を果たす。

【０１８２】「属性関係」：前のトークンが後のトーク
ンの属性となるような伝達関係をいう。例えば、「おも
しろい本」における、「おもしろい」と「本」との関係
が該当する。

【０１８３】「行為関係」：前のトークンが後ろのトー
クンの行為の内容を規定する関係である。例えば、「公
園へ行く」の「公園へ」は「行く」の行為の内容を示し
ている。

【０１８４】「修飾関係」：前のトークンが後のトーク
ンを修飾する（説明する）関係であって、従属節の前に
位置する接続詞と従属節の接続詞との間の関係をいう。
例えば、「もし雨が降るならば」における「もし」と
「ならば」との関係である。

【０１８５】「副詞修飾関係」：前のトークンが後のト
ークンを修飾する（説明する）関係であって、副詞と一
般動詞との間の関係をいう。例えば、「早く走る」にお
ける「早く」と「走る」との関係である。

【０１８６】「述語修飾関係」：前のトークンが後のト
ークンを修飾する（説明する）関係であって、従属節の
前に位置する接続詞と定型の属性を持った動詞との間の
関係をいう。例えば、「もし雨が降れば」における「も
し」と「降れば」との関係である。

【０１８７】「同等関係」：述語と述語が同一関係にあ
ることをいう。例えば、「私は、本を読み、ラジオを聞
く」における「読み」と「聞く」との関係である。

【０１８８】−役割の解析（他の例）− 次に、「麓に近いこの村は景色が美しかった。」という
文について、役割の解析を説明する。前述の品詞の決定
において、この文に対しては、図１０Ｂに示すような結
果が得られる。ＣＰＵ１２は、これを、図４１Ａに示す
ようなツリー形式に記憶する。

【０１８９】まず、図２８、図２９の文型分析を行う。
「村」「は」を「名前は」として抽出し、「景色」
「が」を「名前が」として抽出し、「美しかった」を
「述語」として抽出する。つまり、「名前は」「名前
が」「述語」を抽出する。これに基づいて、図３２、図
３３のテーブルから文型４(a)を選択する（ステップＳ
４７）。最初に、この文型４(a)にしたがって、文章構
成法的役割を決定する（ステップＳ５３）。つまり、図
４１Ｂに示すように、「村は」に「トピック」の役割
を、「景色が」に主語の役割を、「美しかった」に「述
語」の役割を与える。

【０１９０】ここで、役割の与えられていないトークン
「麓」「に」「近い」「この」が存在するので、図３
５、図３６に示す部分的文章構成法的分析を行う。最後
のトークンから最初のトークンに向かって検索を行い、
役割の決定されていない未決定トークンを探し出す。ま
ず、「この」が見出される（ステップＳ６４）。

【０１９１】探し出した未決定トークン「この」の直後
のトークン「村は」の役割を得る。ここでは、「トピッ
ク」が得られる。よって、「トピック」についての予測
テーブルＩ(2)を用いる（ステップＳ６６）。この予測
テーブルＩ(2)中に、当該未決定トークン「この」の品
詞「述語形容詞でない形容詞」があるか否かを検索す
る。これにより、第２番がマッチングし、「この」の役
割が「属性２」であることが決定できる（ステップＳ６
８）。また、「村は」から「この」に向かって矢印が付
けられ、伝達的関係が記憶される。

【０１９２】次に、再び、未決定トークンを検索する。
ここでは、「近い」が見出される。この「近い」に対し
て用いるべき予測テーブルは、「この」においてマッチ
ングした第２番の「次テーブル」の欄に表示している。
したがって、ここでは、予測テーブルＩ(9)、Ｉ(0)を用
いて、検索を行う。その結果、「近い」の品詞「述語形
容詞」は、マッチングしない。さらに、その直前の
「に」の品詞と組み合わせてもマッチングしない。さら
にまた、「麓」の品詞と組み合わせてもマッチングしな
い。このような場合には、「この」の直後のトークンの
役割に基づいて、予測テーブルを決定する。つまり、
「村は」の役割「トピック」に関する予測テーブルＩ
(2)を用いる。これにより、第１５番がマッチングし、
「近い」の役割を「属性を示す従属節の最後の述語（タ
イプ３）」であると決定できる。また、「村は」から
「近い」に向かって矢印が付けられ、伝達的関係が記憶
される。これにより、「近い」は「この」に係っている
のではなく、「村は」に係っていることが明確にされ
る。

【０１９３】次に、未決定トークン「に」について、近
いの次テーブルＩ(3)、Ｉ(10)を用いて、役割の決定を
行う。マッチングするものがないので、次に、「麓に」
について、予測テーブルＩ(3)、Ｉ(10)を用いて、役割
の決定を行う。これにより、テーブルＩ(3)の第２４番
がマッチングする。よって、「麓に」の役割を、「一般
的な間接目的語」であると決定できる。また、「近い」
から「麓に」に向かって矢印が記憶される。以上のよう
にして、図４２に示すような解析結果が記憶される。

【０１９４】上記実施態様における部分的文章構成法的
解析においては、後のトークンの役割に基づいて未決定
トークンの役割を決定しているが、前のトークンに基づ
いて決定してもよい。また、検索の方向も、後ろから前
ではなく、前から後としてもよい。

【０１９５】なお、上記各実施例においては、図１、図
２の各機能をＣＰＵを用いて実現しているが、その一部
または全部をハードウエアロジックによって構成しても
よい。

【図面の簡単な説明】

【図１】この発明の一実施例による言語解析システムの
全体構成を示す図である。

【図２】図１の品詞・属性解析手段３０の全体構成を示
す図である。

【図３】図１、図２の言語解析システムをＣＰＵを用い
て実現した場合のハードウエア構成を示す図である。

【図４】品詞の分類を示す図である。

【図５】トークンへの分割、品詞の取得および属性の分
析の処理プログラムのフローチャートである。

【図６】品詞辞書の例を示す図である。

【図７】解析ファイルの内容を示す図である。

【図８】品詞の選択処理のプログラムを示すフローチャ
ートである。

【図９】ルールテーブルＢ(45)を示す図である。

【図１０】解析ファイルの内容を示す図である。

【図１１】ルールテーブルＢ(43)を示す図である。

【図１２】ルールテーブルＢ(44)を示す図である。

【図１３】ルールテーブルＢ(1)を示す図である。

【図１４】ルールテーブルＢ(2)を示す図である。

【図１５】解析ファイルの内容を示す図である。

【図１６】接尾語の解析処理を示すフローチャートであ
る。

【図１７】接尾語の解析処理を示すフローチャートであ
る。

【図１８】動詞の語根の次に来る接尾語のためのテーブ
ル（テーブルＤ）を示す図である。

【図１９】動詞の接尾語のためのテーブルを示す図であ
る。

【図２０】慣用語を動詞の接尾語として扱う部分を含
む、接尾語のためののテーブルを示す図である。

【図２１】複合動詞のテーブルを示す図である。

【図２２】述語形容詞の接尾語のためのテーブルを示す
図である。

【図２３】ルールテーブルＢ(6)を示す図である。

【図２４】同じ品詞が続いた場合の処理を説明するため
の図である。

【図２５】図２５Ａは属性バッファの保持内容例を示す
図であり、図２５Ｂは属性バッファの保持内容に基づい
て解析ファイルに記憶された「ます」の属性である。

【図２６】解析ファイルに記憶された「い」「かった」
の属性を示す図である。

【図２７】解析ファイルに記憶された「くな」「ます」
の属性を示す図である。

【図２８】文型分析処理のフローチャートである。

【図２９】文型分析処理のフローチャートである。

【図３０】役割解析の過程を示す図である。

【図３１】役割解析の過程を示す図である。

【図３２】文型の例を示す図である。

【図３３】文型の例を示す図である。

【図３４】文型の解析例を示す図である。

【図３５】部分的文章構成法的分析のフローチャートで
ある。

【図３６】部分的文章構成法的分析のフローチャートで
ある。

【図３７】予測テーブルＩ(0)を示す図である。

【図３８】予測テーブルＩ(2)を示す図である。

【図３９】予測テーブルＩ(2)を示す図である。

【図４０】予測テーブルＩ(3)を示す図である。

【図４１】役割解析の過程を示す図である。

【図４２】役割解析の過程を示す図である。

【符号の説明】

３０・・・品詞属性解析手段５２・・・第１トークン抽出手段５４・・・第２トークン抽出手段５６・・・第３トークン抽出手段５８・・・主役割決定手段６０・・・未決定トークン検索手段６２・・・副役割決定手段

Claims

【特許請求の範囲】

【請求項１】トークンに分割された言語を受けて、品詞
が「名前」であるトークンと品詞が「不変化詞”は”」
であるトークンが連続する場合、および品詞が「名前」
であるトークンと品詞が「不変化詞”が”」であるトー
クンが連続する場合を第１のトークンとして抽出する第
１トークン抽出手段、前記言語を受けて、次に述語を伴わない述語を第２のト
ークンとして抽出する第２トークン抽出手段、前記第１のトークン、前記第２のトークンの出現順序、
出現回数に基づいて第１、第２のトークンの役割を決定
する主役割決定手段、を備えたことを特徴とする言語解析システム。
【請求項２】請求項１の言語解析システムにおいて、前記第１トークン抽出手段は、次に述語を伴わない動詞
と「不変化詞”は”」が連続する場合、および次に述語
を伴わない動詞と質問する不変化詞”か”と「不変化
詞”は”」が連続する場合も、第１のトークンとして抽
出するものであることを特徴とするもの。
【請求項３】請求項１または請求項２の言語解析システ
ムにおいて、以下のa)〜d)の場合を第３のトークンとして抽出する第
３トークン抽出手段を備え、前記主関係決定手段は、前記第１のトークン、前記第２
のトークン、前記第３のトークンの出現順序、出現回数
に基づいて第１、第２、第３のトークンの役割を決定す
るものであること、を特徴とするもの。 a)次に述語を伴わない述語のトークンと品詞が「名前」
である１以上のトークンが連続し、さらに「不変化詞”
は”」が連続する場合、 b)上記a)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合、 c)次に述語を伴わない述語と品詞が「名前」であるトー
クンが連続し、さらに「不変化詞”が”」が連続する場
合、 d)上記c)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合。
【請求項４】トークンに分割された言語を受けて、各ト
ークンの役割を決定する言語解析システムであって、言語の最後のトークンから最初のトークンへ向かって、
未決定トークンを検索する未決定トークン検索手段、未決定トークン検索手段によって検索された未決定トー
クンの直後の決定済トークンの役割と当該未決定トーク
ンの品詞とに基づいて、当該未決定トークンの役割を決
定する副役割決定手段、を備えたことを特徴とする言語解析システム。
【請求項５】請求項４の言語解析システムにおいて、前記副役割決定手段は、前記決定済トークンの役割ごと
に、前記未決定トークンの品詞に応じた役割を予測テー
ブルとして保持しており、当該予測テーブルに基づいて
前記未決定トークンの役割決定を行うものであることを
特徴とするもの。
【請求項６】請求項５の言語解析システムにおいて、前記予測テーブルに当該未決定トークンの品詞が存在し
ない場合には、前記決定済トークンの直後の決定済みト
ークンに関する予測テーブルに基づいて、当該未決定ト
ークンの役割決定を行うものであることを特徴とするも
の。
【請求項７】請求項４ないし請求項６の何れかの言語解
析システムにおいて、与えられる言語は、下記の手段によって予め一部のトー
クンについて役割が決定されているものであることを特
徴とするもの。トークンに分割された言語を受けて、品
詞が「名前」であるトークンと品詞が「不変化詞”
は”」であるトークンが連続する場合、および品詞が
「名前」であるトークンと品詞が「不変化詞”が”」で
あるトークンが連続する場合を第１のトークンとして抽
出する第１トークン抽出手段、前記言語を受けて、次に述語を伴わない述語を第２のト
ークンとして抽出する第２トークン抽出手段、前記第１のトークン、前記第２のトークンの出現順序、
出現回数に基づいて第１、第２のトークンの役割を決定
する主役割決定手段。
【請求項８】請求項７の言語解析システムにおいて、以下のa)〜d)の場合を第３のトークンとして抽出する第
３トークン抽出手段を備え、前記主関係決定手段は、前記第１のトークン、前記第２
のトークン、前記第３のトークンの出現順序、出現回数
に基づいて第１、第２、第３のトークンの役割を決定す
るものであること、を特徴とするもの。 a)次に述語を伴わない述語のトークンと品詞が「名前」
である１以上のトークンが連続し、さらに「不変化詞”
は”」が連続する場合、 b)上記a)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合、 c)次に述語を伴わない述語と品詞が「名前」であるトー
クンが連続し、さらに「不変化詞”が”」が連続する場
合、 d)上記c)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合。
【請求項９】トークンに分割された言語を受けて、品詞
が「名前」であるトークンと品詞が「不変化詞”は”」
であるトークンが連続する場合、および品詞が「名前」
であるトークンと品詞が「不変化詞”が”」であるトー
クンが連続する場合を第１のトークンとして抽出し、前記言語を受けて、次に述語を伴わない述語を第２のト
ークンとして抽出し、前記第１のトークンと前記第２のトークンの出現順序、
出現回数に基づいて第１、第２のトークンの役割を決定
することを特徴とする言語解析方法。
【請求項１０】請求項９の言語解析方法において、前記言語を受けて、以下のa)〜d)の場合を第３のトーク
ンとして抽出するとともに、前記第１のトークン、前記第２のトークン、前記第３の
トークンの出現順序、出現回数に基づいて第１、第２、
第３のトークンの役割を決定するものであること、を特徴とするもの。 a)次に述語を伴わない述語のトークンと品詞が「名前」
である１以上のトークンが連続し、さらに「不変化詞”
は”」が連続する場合、 b)上記a)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合、 c)次に述語を伴わない述語と品詞が「名前」であるトー
クンが連続し、さらに「不変化詞”が”」が連続する場
合、 d)上記c)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合。
【請求項１１】トークンに分割された言語を受けて、ト
ークンの役割を決定する言語解析システムであって、既
に役割が決定されている決定済トークンの役割および役
割が決定されていない未決定トークンの品詞に基づい
て、当該未決定トークンの役割を決定することを特徴と
する言語解析方法。
【請求項１２】トークンに分割された言語を受けて、品
詞が「名前」であるトークンと品詞が「不変化詞”
は”」であるトークンが連続する場合、および品詞が
「名前」であるトークンと品詞が「不変化詞”が”」で
あるトークンが連続する場合を第１のトークンとして抽
出し、前記言語を受けて、次に述語を伴わない述語を第２のト
ークンとして抽出し、前記言語を受けて、以下のa)〜d)の場合を第３のトーク
ンとして抽出するとともに、前記第１のトークン、前記第２のトークン、前記第３の
トークンの出現順序、出現回数に基づいて第１、第２、
第３のトークンの役割を決定するとともに、上記処理において役割が決定されていない未決定トーク
ンの役割を決定する際に、既に役割が決定されている決
定済トークンの役割および未決定トークンの品詞に基づ
いて、当該未決定トークンの役割を決定することを特徴
とする言語解析方法。 a)次に述語を伴わない述語のトークンと品詞が「名前」
である１以上のトークンが連続し、さらに「不変化詞”
は”」が連続する場合、 b)上記a)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合、 c)次に述語を伴わない述語と品詞が「名前」であるトー
クンが連続し、さらに「不変化詞”が”」が連続する場
合、 d)上記c)の場合において、さらに、次に述語を伴わない
述語のトークンと、品詞が「名前」であるトークンとの
間に、品詞が「述語形容詞でない形容詞」である１以上
のトークンが存在する場合。
【請求項１３】コンピュータが実行可能なプログラムを
記憶したコンピュータ可読の記憶媒体であって、前記プ
ログラムは、請求項１ないし請求項１２のいずれかのシ
ステムまたは方法を実現するためのものであることを特
徴とするもの。