JPH08212216A

JPH08212216A - 自然言語処理装置および自然言語処理方法

Info

Publication number: JPH08212216A
Application number: JP7020220A
Authority: JP
Inventors: Etsuo Ito; 悦雄伊藤
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1995-02-08
Filing date: 1995-02-08
Publication date: 1996-08-20

Abstract

(57)【要約】【目的】一方の自然言語処理の学習内容を別の自然言
語処理に適切、かつ、有効に反映させることにある。【構成】異なる自然言語処理を行って得られる学習デ
ータを記憶する２つの自然言語処理部（１〜６）、（１
〜４，７，８）と、ある１つの自然言語処理部の自然言
語処理時に他の自然言語処理部に記憶される学習データ
が前記ある１つの自然言語処理部の自然言語処理に不十
分な場合でも、利用可能な学習データのみを取り出し、
前記ある１つの自然言語処理部の自然言語処理に対して
学習を可能とする学習反映部９とを設けた自然言語処理
装置である。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、機械翻訳システム、文
書作成システム，文書校正システム、文書要約システム
等々の種々の文書処理システムに適用可能な自然言語処
理装置および自然言語処理方法に係わり、特に複数の自
然言語処理機能を有する自然言語処理装置および自然言
語処理方法に関する。

【０００２】

【従来の技術】最近のコンピュータ技術の進歩にはめざ
ましいものがあり、文書データの編集や翻訳などの文書
処理を行う文書処理システムに対するコンピュータ化も
盛んに進められている。例えばコンピュータを利用して
第１言語を第２言語に翻訳する機械翻訳システムが注目
されているが、この機械翻訳システムの場合には、翻訳
機能の他、編集用のかな漢字編集機能を含んでいること
が多い。

【０００３】また、紙面に書かれた文字を読取って電子
化するＯＣＲ装置においては、文字認識機能の他、編集
用のかな漢字編集機能が含まれており、さらにＯＣＲと
機械翻訳処理を統合化したシステムやかな漢字変換機能
をもつ文書要約システムなど、いわゆる単独で１つの自
然言語処理機能を有するシステムでなく、複数の自然言
語処理機能をもったシステムの開発、提案が増加の傾向
にある。

【０００４】ところで、以上のような複数の自然言語処
理機能をもつ文書処理システムでは、知識の学習および
学習データの相互利用について考える必要がある。先
ず、前者の知識の学習に関しては、従来、例えばかな漢
字変換における同音異義語の学習が挙げられる。この学
習方法は、かな漢字変換時にユーザが誤りを発見したと
き、その発見の都度誤りを修正し、その修正内容を次回
以降に生かすことにより、学習の機能を高めることが行
われている。

【０００５】一方、後者の学習データの利用について
は、１つの文書処理システムに複数の自然言語処理機能
を設けただけであって、各自然言語処理の機能としては
それぞれ完全に独立しており、それぞれ別々の知識辞書
を用いて自然言語処理を行うにすぎない。

【０００６】

【発明が解決しようとする課題】従って、以上のような
知識の学習は、かな漢字変換時の同音異義語の誤りを修
正しながら学習する場合には有効であるが、例えば機械
翻訳とかな漢字変換とを組み合わせた複数の自然言語処
理の場合には、それぞれの自然言語処理によって得られ
る学習の効果および学習の内容が異なり、また学習に必
要な情報がそれぞれ異なることから、各自然言語処理時
に得られた学習内容が互いに他の自然言語処理に有効に
反映させることができない。

【０００７】また、各自然言語処理の学習内容が互いに
他の自然言語処理に反映できないが、同一文書中に同じ
言葉を使用するといった傾向が強いことから、オペレー
タが各自然言語処理時の段階で学習データを与えながら
学習作業を行う必要が不可欠であり、その結果、オペレ
ータの処理作業が増加するだけでなく、システムの処理
能力の低下を招く原因にもなっている。

【０００８】次に、後者の学習データの利用は、１つの
文書処理システムに複数の自然言語処理機能を設けただ
けであるので、一方の自然言語処理時にユーザが新知識
を登録しても、その知識が他方の自然言語処理に全く反
映させることができない。その結果、例えばかな漢字変
換機能を有する日英機械翻訳システムにおいては、かな
漢字変換と翻訳との間で知識辞書に差異が生じるので、
かな漢字変換で出力される語彙を翻訳に利用することが
できないなどの不都合が生ずる。この他にも、日英機械
翻訳システムによって訳出される語につき、同一システ
ムを用いてかな漢字変換で入力できないとか、或いは日
英相互翻訳システムにおいて英日翻訳の結果を日英翻訳
できないなどの問題がある。さらに、音声入力機能付き
翻訳システムにおいては、音声認識された結果を翻訳で
きない等の問題がある。

【０００９】そこで、以上のような問題を解決するため
に、複数の自然言語処理に用いる知識辞書を共通化する
とか、或いは全部の自然言語処理に用いる知識辞書に対
して同一時期に同時に登録することが考えられる。しか
し、このような手段は、例えば音声入力機能付きの機械
翻訳システムのごとき場合には翻訳中に新語を登録する
と同時に音声信号パターンまで登録しなければならな
い。つまり、登録時に常に多量の情報を登録しなければ
ならず、非常に煩わしい問題がある。

【００１０】従って、複数の自然言語処理機能を有する
文書処理システムにおいては、各自然言語処理機能で使
用する知識辞書に差が生じる結果、システム全体の自然
言語処理に不統一な問題が生ずる。

【００１１】請求項１ないし請求項５の発明は上記実情
に鑑みてなされたもので、一方の自然言語処理によって
得られる学習内容を別の自然言語処理に適切、かつ、有
効に反映させる自然言語処理装置を提供することを目的
とする。

【００１２】次に、請求項６の発明の目的は、２つの自
然言語処理部の自然言語処理によって得られる学習デー
タに共通情報を登録し、この共通情報をてがかりに相互
に各自然言語処理部の学習データを有効に利用可能とす
る自然言語処理方法を提供することにある。

【００１３】さらに、請求項７，８，１０の発明の目的
は、各自然言語処理時に用いる知識辞書の差分を提示
し、各知識辞書の差を縮小するような支援処理を行う自
然言語処理装置および方法を提供することにある。

【００１４】さらに、請求項９の発明の目的は、各自然
言語処理時に用いる知識辞書の間に差があるとき、ある
自然言語処理結果の出力を抑制する自然言語処理装置を
提供することにある。

【００１５】

【課題を解決するための手段】上記課題を解決するため
に、請求項１ないし請求項３に対応する発明は、それぞ
れ異なる例えば翻訳部やかな漢字変換部等の自然言語処
理によって得られる個別の学習データをそれぞれ対応す
る例えば翻訳用学習データ記録部やかな漢字用学習デー
タ記録部に記憶するが、このとき各自然言語処理によっ
て得られる学習データごとに共通情報を挿入して記憶す
る少なくとも２つの自然言語処理部と、ある１つの自然
言語処理部の自然言語処理時に他の自然言語処理部に記
憶される学習データが前記ある１つの自然言語処理部の
自然言語処理に不十分な場合でも、利用可能な学習デー
タのみを取り出し、前記ある１つの自然言語処理部の自
然言語処理に対して学習を可能としたり、或いはある１
つの自然言語処理部による自然言語処理の語句候補と他
の自然言語処理部の学習データの中の共通情報とを比較
しながら学習状態を判断し、その判断結果を前記ある１
つの自然言語処理部に伝達する学習反映部とを設けた自
然言語処理装置である。

【００１６】請求項４および請求項５に対応する発明
は、例えば翻訳部やかな漢字変換部等の自然言語処理に
よって得られる個別の学習データをそれぞれ対応する例
えば翻訳用学習データ記録部やかな漢字用学習データ記
録部に記憶する少なくとも２つの自然言語処理部と、各
自然言語処理部の自然言語処理に用いる学習データの有
無の確認要請に基づいて他の自然言語処理部に学習デー
タの存在有無を確認する学習反映部と、確認要請元の前
記自然言語処理部において当該確認要請元自然言語処理
部に学習データが存在し、かつ、前記学習反映部の確認
結果から前記他の自然言語処理部にも学習データが存在
するとき、学習時期の新しい学習データを学習に反映さ
せる手段または確認要請元の前記自然言語処理部におい
て当該確認要請元自然言語処理部に学習データが存在
し、かつ、前記学習反映部の確認結果から前記他の自然
言語処理部にも学習データが存在するとき、両者の学習
データを組み合わせて学習に反映させる手段とを設けた
自然言語処理装置である。

【００１７】さらに、請求項６に対応する発明は、予め
各自然言語処理部の自然言語処理によって得られる学習
データに共通情報を含ませて記憶し、一方の自然言語処
理部の自然言語処理時に前記共通情報を介して他の自然
言語処理部に利用可能な学習データが存在するか否かを
判断し、利用可能な学習データが存在すれば前記一方の
自然言語処理部の自然言語処理に利用する自然言語処理
方法である。

【００１８】さらに、請求項７ないし請求項９は、それ
ぞれ異なる知識辞書を用いて自然言語処理を行う少なく
とも２つの自然言語処理部と、各々の自然言語処理部に
おいて用いられる知識辞書の辞書内容の差を抽出して提
示または登録する差分抽出手段と、この差分抽出手段に
よって得られた辞書内容の差を編集し統一化する辞書編
集手段とが設けられ、或いは少なくとも２つの自然言語
処理部のうち、一方の自然言語処理部で得られる処理結
果データが他の自然言語処理部において用いられる知識
辞書に含まれない場合、前記一方の自然言語処理部で得
られる処理結果データの出力を抑制する手段を設けた自
然言語処理装置である。

【００１９】さらに、請求項１０に対応する発明は、そ
れぞれ知識辞書を有する各自然言語処理部の自然言語処
理の度に、または任意の時期に前記複数の自然言語処理
部の知識辞書の差を抽出して登録した後、前記自然言語
処理の度に、または所要とする時期に知識辞書の差を統
一化するための編集処理を行う自然言語処理方法であ
る。

【００２０】

【作用】従って、請求項１ないし請求項３に対応する発
明は、以上のような手段を講じたことにより、各自然言
語処理部を構成する例えば翻訳部やかな漢字変換部で知
識辞書や学習データ記録部の学習データを用いて自然言
語処理を行い、その処理結果を対応する学習データ記憶
部に記憶する。

【００２１】ここで、ある１つの自然言語処理部の自然
言語処理に際し、該当知識辞書や学習データ記録部の学
習データに適切な処理言語が存在しない場合、学習反映
部を介して他の自然言語処理部の学習データに利用可能
な学習データが存在するか否かを調べる。

【００２２】この学習反映部は、他の自然言語処理部に
記憶される学習データの中から利用可能な学習データを
探し出し、ある１つの自然言語処理部の自然言語処理に
用いる。

【００２３】また、学習反映部は、各自然言語処理部を
構成する学習データ記録部の学習データに共通情報が挿
入されている場合、前記ある１つの自然言語処理部の語
句候補の自然言語処理に際し、この語句候補と他の自然
言語処理部の学習データとを前記共通情報を手掛かりに
適切な学習データを見つけ出し、前記ある１つの自然言
語処理部の語句候補の自然言語処理に用い、かつ、その
処理結果を学習するので、各自然言語処理によって得ら
れる学習内容を別の自然言語処理に適切、かつ、有効に
反映させることができる。

【００２４】次に、請求項４および請求項５に対応する
発明は、各自然言語処理部を構成する例えば翻訳部やか
な漢字変換部で知識辞書や学習データ記録部の学習デー
タを用いて自然言語処理を行い、その処理結果を対応す
る学習データ記憶部に記憶する。

【００２５】ところで、ある１つの自然言語処理部の自
然言語処理に際し、他の自然言語処理部の学習データに
利用可能な学習データが存在するか否かを学習反映部に
要請する。ここで、学習反映部は、学習データの有無確
認要請に基づいて他の自然言語処理部に学習データの存
在有無を確認する。

【００２６】しかる後、ある１つの自然言語処理部で
は、自然言語処理に際し、自身の学習データ記録部に学
習データが存在し、かつ、学習反映部による確認結果か
ら他の自然言語処理部の学習データ記録部にも学習デー
タが存在するとき、学習時期の新しい学習データを学習
に反映させるようにしたので、常に最新の適切な学習デ
ータを用いて、自然言語処理を行うことができる。

【００２７】また、請求項６に対応する発明において
は、共通情報を仲立ちに各自然言語処理部の利用可能な
学習データの存在を判断し、適切な学習データを利用す
るので、相互に各自然言語処理部の学習データを有効に
利用することができる。

【００２８】さらに、請求項７ないし請求項９に対応す
る発明は、差分抽出手段にて少なくとも２つの自然言語
処理部の知識辞書の辞書内容の差を抽出して提示または
登録し、しかる後、辞書編集手段で辞書内容の差を編集
して統一化することにより、各知識辞書の差が縮小して
均一かつ適切な知識辞書を作成できる。

【００２９】また、一方の自然言語処理部で得られる処
理結果データが他の自然言語処理部において用いられる
知識辞書に含まれない場合、一方の自然言語処理部で得
られる処理結果データの出力を抑制することから、誤っ
た処理結果を出力することがない。

【００３０】

【実施例】以下、本発明の実施例について図面を参照し
て説明する。（実施例１）請求項１〜３に係わる発明の一実施例を説
明する。

【００３１】先ず、自然言語処理装置として、例えば機
械翻訳機能とかな漢字変換機能とを有する機械翻訳シス
テムを例に上げて説明する。従来の機械翻訳システムで
は、かな漢字変換の学習内容と翻訳の学習内容とが異な
るために、互いに各機能の学習内容を反映し合うことが
できない。

【００３２】具体的に述べると、かな漢字変換の学習
は、基本的には「読み情報と、その読みに対する第一優
先となる漢字との関係」から得られ、一方、機械翻訳の
場合には「第一言語の単語と、その単語に対する第一訳
語となるべき第二言語の単語との関係」から得られる。
例えば英日機械翻訳システムでは、“ｆｅｅｌｉｎｇ”
の訳語候補として「触覚，感覚，知覚」等が上げられる
が、このときオペレータが前記訳語候補の中から「感
覚」を選択・学習したと考える。ところが、この時、シ
ステムに含まれるかな漢字変換機能をもつ日本語ワード
プロセッサには、その学習結果が反映されない。それ
は、“ｆｅｅｌｉｎｇ”が日本語ワードプロセッサの読
み情報でないためである。

【００３３】しかし、同一文書の場合には、同じ用語を
用いることが非常に多く、かかる学習結果を日本語ワー
ドプロセッサにも優先利用するようにすれば、装置の処
理作業効率が格段に向上する。

【００３４】そこで、本発明に係わる自然言語処理装置
では、学習データのうち、共通情報である「日本語表層
文字列」（かな漢字変換では変換結果、英日翻訳では訳
語）をキーとし、両者を比較することにより、翻訳結果
の訳語学習をかな漢字変換にも反映させることにある。

【００３５】図１は本発明装置を適用してなる機械翻訳
システムの一実施例を示すブロック構成図である。この
機械翻訳システムは、通常，キーボード，マウスなどの
ポインティングデバイス、ＯＣＲなどが用いられ、文章
などのデータやコマンド列データなどを入力する入力部
１と、通常，ＣＲＴ、ビットマップディスプレイなどが
用いられ、入力部１から入力されるデータや種々の処理
結果のデータを表示する表示部２と、本装置の構成部分
を統括制御する制御部３と、入力部１から入力されるデ
ータや後記する翻訳部，かな漢字変換部に必要な知識辞
書データなどを記憶する例えば磁気記憶媒体，光学記憶
媒体等の記録部４と、入力部１から入力されるデータや
記録部４に記憶されている第一言語のデータを第二言語
のデータに翻訳する翻訳部５と、この翻訳部５で処理さ
れた学習データを記憶する例えば磁気記憶媒体，光学記
憶媒体等の翻訳用学習データ記憶部６とが設けられてい
る。これら構成部分１〜６は第１の自然言語処理部を構
成する。

【００３６】また、本装置には、第２の自然言語処理部
が設けられている。この第２の自然言語処理部は、入力
部１，表示部２，制御部３，記録部４等を含み、さらに
入力部１から入力されるデータや記録部４に記憶されて
いるひらがな文字列データをかな漢字混交文データに変
換するかな漢字変換部７およびこのかな漢字変換部７に
よって学習されたデータを記録するかな漢字用学習デー
タ記憶部８等によって構成されている。このかな漢字用
学習データ記憶部８は、通常，磁気記憶媒体や光学記憶
媒体等が用いられている。

【００３７】さらに、本装置には、学習反映部９が設け
られている。この学習反映部９は、翻訳用学習データ記
憶部６に記憶されている翻訳部５の学習データのうち、
かな漢字変換部７で利用可能な学習データを識別してか
な漢字変換部７に転送したり、それとは逆にかな漢字用
学習データ記憶部８に記憶されているかな漢字変換部７
の学習データのうち、翻訳部５で利用可能なデータを識
別して翻訳部５に転送したりする機能をもっている。

【００３８】なお、表示部２には、ＣＲＴやビットマッ
プディスプレイなどが用いられるが、その他に例えば壁
掛け用スクリーンなどが用いられる。次に、図２は前記
学習反映部９の構成を説明する機能ブロック図である。

【００３９】この学習反映部９は、翻訳部５またはかな
漢字変換部７の何れから自然言語処理するある語句候補
について学習有無の確認要請があったかを判定する学習
有無要請元判定手段９Ａと、この判定手段９Ａの判定結
果に基づいて要請元側と反対側の学習データ記録部８ま
たは６から語句候補に関係する共通情報を取り出す共通
情報取得手段９Ｂと、この共通情報取得手段９Ｂによっ
て取得された共通情報の中に語句候補に関係する共通情
報が存在するか否かを判断する語句候補認識手段９Ｃ
と、この語句候補認識手段９Ｃの認識結果に基づいて学
習有無を前記要請元である翻訳部５またはかな漢字変換
部７に返答する学習有無返答手段９Ｄとによって構成さ
れている。

【００４０】次に、以上のように構成された装置の一般
的な動作を説明した後、本発明装置の中核をなす学習反
映部９およびその関連する部分の動作を説明する。先
ず、入力部１から第一言語である英文字列データが入力
されると、制御部３ではその英文字列データを表示部２
に表示するとともに記録部４に記憶し、さらに翻訳部５
に送出する。ここで、翻訳部５は、制御部３から受け取
った英文字列データに基づいて記録部４の知識辞書デー
タを用いて第二言語である日本語に翻訳するが、このと
き訳語候補が多い場合には翻訳用学習データ記録部６の
学習データを参照しながら第二言語である日本語に翻訳
する。このとき、翻訳結果が学習データとして存在しな
い場合には新たな学習データとして翻訳用学習データ記
録部６に記憶する。

【００４１】一方、入力部１からひらがな文字列データ
が入力されると、制御部３ではそのひらがな文字列デー
タを表示部２に表示するとともに記録部４に記憶し、さ
らにかな漢字変換部７に送出する。ここで、かな漢字変
換部７は、制御部３から受け取ったひらがな文字列デー
タに基づいて前記記録部４の知識辞書データを用いてか
な漢字混交文データに変換するが、このとき変換候補が
多い場合にはかな漢字用学習データ記録部８の学習デー
タを参照しながら変換する。このとき、変換結果が学習
データとして存在しない場合には新たな学習データとし
てかな漢字用学習データ記録部８に記憶する。

【００４２】次に、学習反映部９を含む関連動作につい
て図３を参照して説明する。今、翻訳部５またはかな漢
字変換部７において記録部４の知識辞書データなどを用
い、かつ、翻訳用学習データ記録部６またはかな漢字用
学習データ記録部８の学習データを用いても例えば翻訳
不可またはかな漢字混交変換不可の場合、自然言語処理
する語句候補を送出し、他の自然言語処理部のかな漢字
用学習データ記録部８または翻訳用学習データ記録部６
に学習データが存在するか否かの判断を要請する。

【００４３】なお、学習反映部９に対する学習データ有
無を要請は、翻訳またはかな漢字混交変換不可の有無に
係わらず、プログラムにより、或いはオペレータの指示
によって任意に行ってもよい。

【００４４】この学習反映部９は、自然言語処理すべき
語句候補による学習の有無判断の要請を受けたとき動作
を開始する（ＳＴ１）。ここで、学習反映部９は、語句
候補に対する学習データ有無の確認要請元がかな漢字変
換部７であるか、翻訳部５であるかを判定する（ＳＴ
２）。確認要求元がかな漢字変換部７である場合には、
翻訳用学習データ記憶部６から学習データを読み取り、
これを例えばデータＡとする（ＳＴ３）。そして、これ
らのデータのうち、共通情報となる日本語文字列部，つ
まり英日翻訳学習データの中の訳語学習文字列を抽出
し、これをＢとする（ＳＴ４）。そこで、ステップＳＴ
１において受信した語句候補がデータＢに含まれている
か否かを判断する（ＳＴ５）。ここで、語句候補がデー
タＢに含まれているとき、「その語句候補が機械翻訳で
学習されている」と判断し、その旨および含まれている
学習データをかな漢字変換部７に送出し（ＳＴ６）、学
習有無判断の処理を終了する。

【００４５】ステップＳＴ５において語句候補がデータ
Ｂに含まれていない場合には、「その語句候補が機械翻
訳で学習されていない」と判断し、その旨をかな漢字変
換部７に送出し（ＳＴ７）、学習有無判断の処理を終了
する。

【００４６】一方、ステップＳＴ２において語句候補に
対する学習データ有無の確認要請元が翻訳部５である場
合には、かな漢字用学習データ記録部８から学習データ
を読み取り、これを例えばデータＣとする（ＳＴ８）。
ここで、これらのデータのうち、共通情報となる日本語
文字列であるかな漢字混交データ部，つまり同音異義語
学習文字列を抽出し、これをデータＤとする（ＳＴ
９）。しかる後、翻訳部５から送られてきた語句候補が
データＤに含まれているか否かを判断する（ＳＴ１
０）。ここで、語句候補がデータＤに含まれていると
き、「その語句候補がかな漢字変換で学習されている」
と判断し、その旨および含まれている学習データを翻訳
部５に送出し（ＳＴ１１）、学習有無判断の処理を終了
する。

【００４７】ステップＳＴ１０において語句候補がデー
タＤに含まれていない場合には、「その語句候補がかな
漢字変換で学習されていない」と判断し、その旨を翻訳
部５に送出し（ＳＴ１２）、学習有無判断の処理を終了
する。

【００４８】図４は、実施例１に係わる機械翻訳システ
ムの具体例について、表示部２の表示状態をもって説明
する。なお、この表示例は、英日翻訳を例に上げ、図示
左側に原文（英語）、図示右側に翻訳結果（日本語）が
表示されている。

【００４９】先ず、図４（ａ）は、機械翻訳によって直
接翻訳した例である。つまり、入力部１から「His feel
ing is……」なる文章を入力したとき、翻訳部５では記
録部４の知識辞書データに基づいて「彼の触感は、…
…」と翻訳し、表示部２に表示したことを意味する。つ
まり、ここでは、feeling の訳語として、「触感」を訳
出したことが分かる。

【００５０】しかし、オペレータとしては、feeling の
訳語には「触感」が不十分であると判断し、「feeling
」の訳語として例えば訳語候補の中から「感覚」を選
択し、或いは直接日本語の文字を入力するなどして翻訳
し、図４（ｂ）に示すように表示部２に表示するととも
に、その翻訳結果に基づいて翻訳部５が学習処理を行
い、翻訳用学習データ記録部６に学習記憶する。このと
きの学習内容は、例えば「feeling （名詞）：感覚（名
詞）」から構成され、いわゆる原文の単語およびその品
詞と、学習された訳語およびその品詞が記録される。こ
の学習内容のうち「感覚（名詞）」は、かな漢字用学習
データ記録部８の学習データの間における共通情報とし
ての役割をもっている。

【００５１】次に、この翻訳結果とは別に、オペレータ
が入力部１から「かんかく」なる文章を入力すると、か
な漢字変換部７では、入力される「かんかく」の文字に
基づいてかな漢字変換を実行する（図４（ｃ）参照）。
かな漢字変換を行うと、「かんかく」の漢字として「間
隔」「感覚」などが出てくる。つまり、このとき共通情
報は、「間隔」「感覚」などである。

【００５２】しかし、かな漢字変換処理用として学習デ
ータ記録部８に学習されていない場合、表示部２にはど
のような漢字が表示されるか分からない。そこで、学習
反映部９では、一方の自然言語処理部の一部を構成する
かな漢字変換部７から「間隔」「感覚」等の語句候補が
他方の自然言語処理部の一部を構成して翻訳用学習デー
タ記録部６に学習されているか否かの要請に基づいて学
習データの有無を調べる。つまり、学習反映部９は、、
翻訳用学習データ記録部６の「feeling （名詞）：感覚
（名詞）」なる学習データの中の共通情報の中に「感
覚」があれば、学習されていると判断し、その「感覚」
を第１候補としてかな漢字変換部７に送出する。ここ
で、かな漢字変換部７は、図４（ｄ）に示すように表示
部２に表示する一方、必要に応じてオペレータの指示に
より、或いは自動的にかな漢字変換結果をかな漢字用学
習データ記録部８に学習記憶する。（実施例２）次に、請求項４に係わる発明の一実施例を
説明する。

【００５３】この実施例の構成は、図１および図２とほ
ぼ同様な機能構成を有しているが、そのうち特に異なる
ところは、一方の自然言語処理部の一部を構成する翻訳
部５と，他方の自然言語処理部の一部を構成するかな漢
字変換部７とに新たな手段を設けたことにある。

【００５４】すなわち、翻訳部５およびかな漢字変換部
７としては、翻訳結果またはかな漢字変換結果を学習記
憶するとき、この学習データに学習日時データを付けて
翻訳用学習データ記録部６，かな漢字用学習記録部９に
記憶する学習記憶手段と、自然言語処理対象となる語句
候補について自身の学習データ記録部側の学習データの
存在および前記学習反映部９を通して得られる他方の学
習データ記録部側の学習データの存在を確認するデータ
存在確認手段と、両方の自然言語処理部の学習データ記
録部６，８に学習データが存在するとき、各学習データ
に不可されている学習日時データから時間的に新しい学
習データを学習に反映させるデータ反映手段とが設けら
れている。

【００５５】次に、以上のような構成の翻訳部５および
かな漢字変換部７を有する装置の動作について図５を参
照して説明する。今、第一言語である英文字列データを
第二言語である日本語に翻訳する例について述べる。翻
訳部５は、英文字列データである語句候補の翻訳に際
し、かな漢字変換側に学習データが存在するか否かの要
請を学習反映部９に送出する。この学習反映部９では実
施例１で述べたように学習データの存在有無を確認し翻
訳部５に返送する。

【００５６】そこで、翻訳部５においては、図５に示す
ように学習反映部９から他方の自然言語処理部側での学
習データ有りの報告か否かを判断し（ＳＴ２１）、学習
データ有りの場合には翻訳部側の翻訳用学習データ記録
部６にも語句候補の学習データが有るか否かを判断する
（ＳＴ２２）。ここで、学習データ有りと判断したと
き、この学習データの共通情報が学習反映部９から送ら
れてくる学習データの共通情報と同じ内容であるか判断
する（ＳＴ２３）。ここで、同じ内容の場合には、自身
側の翻訳用学習データ記録部６の学習結果を優先する
（ＳＴ２４）。

【００５７】ステップＳＴ２３において学習データの共
通情報が学習反映部９から送られてくる学習データの共
通情報と同じでない場合には、学習データに付されてい
る日時データから何れの学習データが新しいか否かを判
断し（ＳＴ２５）、学習反映部９からの学習データが新
しい場合には学習反映部９の学習データを反映し、それ
と逆の場合にはステップＳＴ２４に移行し、自身側の翻
訳用学習データ記録部６の学習結果を優先するものであ
る。

【００５８】従って、以上のような実施例の構成によれ
ば、ある１つの自然言語処理部の自然言語処理対象とな
る語句候補を訳語または漢字混交変換するとき、当該語
句候補の訳語または漢字混交文字が２つの自然言語処理
部に係わる学習データ記録部６，８の学習データに存在
するかを確認し、両方に存在する場合には何れか新しい
学習データを用いて反映するようにしたので、適切な訳
語または漢字混交文字に変換できる。

【００５９】次に、請求項５に係わる発明の一実施例を
説明する。この実施例は、請求項４に係わる発明と同様
に翻訳部５およびかな漢字変換部７を改良したことにあ
る。

【００６０】つまり、この実施例は、例えばかな漢字変
換機能と英日翻訳機能とをもつ英日機械翻訳システムに
おいて、かな漢字変換処理で学習された語彙と翻訳処理
で学習された訳語とが食い違う場合の改善例である。

【００６１】例えばかな漢字変換部７のかな漢字変換側
では、「かんかく：感覚（名詞）」と学習され、一方、
翻訳部５の翻訳側では、「feeling （名詞）：触覚（名
詞）」と学習されたとする。

【００６２】この場合、従来の日英機械翻訳システムで
は、feeling の訳語として「触覚」と訳出する。しか
し、この翻訳部５の学習データ「feeling （名詞）：触
覚（名詞）」は他の文書の翻訳時に学習されたものであ
り、一方、かな漢字変換処理による学習データ「かんか
く：感覚（名詞）」は今回の文書の編集中に学習された
ものであるとすると、同一文書では同じ語彙を使用する
傾向が非常に高い。そこで、このような場合には「感
覚」と訳出し、必要に応じて翻訳結果である「feeling
（名詞）：感覚（名詞）」を学習データとして記憶す
る。

【００６３】この場合の具体例としては、翻訳部５によ
る翻訳結果またはかな漢字変換部７の漢字変換結果を学
習するとき、文書全文または文書の部分領域ごとに学習
データに識別データ（ＩＤ）を付加する。そして、図５
に示す処理手順に従って語句候補に関する訳語や漢字混
交文字が学習データ記録部６，８に存在するか否かを判
断し、両方に学習データが存在する場合には前記識別デ
ータを見ながら学習データを反映させたり、或いは反映
させなかったりする。つまり、両者の学習データを組み
合わせて反映させることにある。

【００６４】また、かな漢字変換と翻訳では、文字列が
同じでも品詞など語句の使用情報が異なる場合がある。
例えば「ｔａｋｅ」が名詞で使用されたとき、「取得」
と訳出されるように学習され、一方、かな漢字変換の場
合には「とる：取る（動詞）」と学習されているとき、
従来の日英機械翻訳システムでは、「ｔａｋｅ」が動詞
として用いられる場合の訳語は学習されていないことに
なるか、或いは他の品詞として学習された学習データを
流用して「取得する」と訳出することになる。

【００６５】そこで、本装置においては、学習データに
識別データを付与して文書の区別性を判断すれば、かな
漢字変換における学習結果であれば、用法が同じである
「取る」を学習データとして用いることができる。

【００６６】その他、各処理の学習データに重みを付加
し、その重みの大きさにより、或いは各処理段階で学習
データを使用する度に重み付けを加算し、その累計値に
よって学習効果を働かせるかを判断することもできる。
また、予めオペレータが３つ以上の処理段階の学習デー
タを利用した順番に有効とする指定することも可能であ
る。（実施例３）次に、上記実施例１，実施例２の他の実施
例を説明する。この実施例は、機械翻訳システムではな
く、２つの自然言語処理部例えば英日翻訳機能とかな漢
字変換語機能とをもった例えば光学式文字読取り装置
（ＯＣＲ）に適用した例である。

【００６７】このＯＣＲにおいては、予め認識テーブル
上に記号，図形を含む文字の特徴量に対応付けられた標
準文字候補群を格納し、ＯＣＲ読取り部で読み取った文
字等のパターンと標準文字候補群とのパターン・マッチ
ングを行い、そのパターン・マッチング状態に応じて得
点を付加し、その得点の大小によって文字を決定するこ
とが行われている。しかし、「間」と「問」などのよう
に類似する文字の場合、特に原稿が汚れている場合など
には、これらの得点差が小さくなり、誤りの発生する可
能性が非常に高くなる。

【００６８】そこで、本装置においては、以上のような
誤りを回避するために、文字が隣接して出現する可能性
（連接文字頻度）や認識結果の解析を行って正解率を高
めるものである。つまり、本実施例装置は、例えばＯＣ
Ｒ読取り部で認識された連接文字をかな漢字変換すると
き、かな漢字変換部７にて同一文書の中に出現する連接
文字の頻度を計数し、連接文字の学習データに頻度値を
付加し、その頻度値の大小に応じてかな漢字変換を行う
構成である。例えばある文書において「特」と「長」が
隣接して出現する頻度が例えばＥ、「特」と「徴」との
頻度がＦであり、Ｅ＞Ｆであれば、その文書中では、
「とくちょう」のかな漢字変換結果として「特徴」が
「特長」よりも適切であると判断できるので、「とくち
ょう」のかな漢字変換時には「特徴」と変換することに
より、かな漢字の変換率を上げることができる。

【００６９】しかし、同じ連接文字の場合でも、「合
う」と「会う」などのように用法が近い場合には効果が
低い。従って、この場合には同一文書においてかな漢字
変換部７の変換結果から「会う」が学習されている場
合、この学習効果を使用し、「会う」を認識第１候補と
し、かな漢字変換を行うものである。

【００７０】さらに、上記実施例１，実施例２の他の実
施例を説明する。この実施例は、機械翻訳システムでは
なく、音声変換機能とかな漢字変換語機能とをもった文
書処理システムに適用した例である。

【００７１】このシステムは、具体的には図６に示すよ
うに、通常，キーボード、マウスなどのポインティング
デバィス、或いはＯＣＲその他の入力装置などが用いら
れ、文章などのデータやコマンド列データを入力するデ
ータ入力部１１と、オペレータなどの音声信号を入力す
るマイクロホン等の音声入力部１２と、通常，ＣＲＴ、
ビットマップディスプレイ等が用いられ、データ入力部
１１や音声入力部１２から入力されるデータ，音声信号
（音声周波数信号）や種々の処理結果のデータを表示す
る表示部１３と、本装置全体を制御する制御部１４と、
入力部１１，１２から入力されるデータ，音声周波数信
号のディジタル変換データや種々の処理結果のデータを
記憶する磁気記憶媒体，光学記憶媒体等のデータ記録部
１５とが設けられ、さらに第１および第２の自然言語処
理部１６，１７および学習反映部１８が設けられてい
る。

【００７２】この第１の自然言語処理部１６は、構成部
分１１〜１５を含み、さらに知識辞書として機能する多
数の音声単語標準パターンを記憶する音声周波数パター
ン記録部１９と、音声入力部１２から入力される音声周
波数信号のディジタル変換データの特徴量を分析し、こ
の連続データの特徴量について前記音声単語標準パター
ンを照合しながら音声を認識し、文字データに変換し表
示部１３に表示する音声認識部２０と、この音声認識部
２０によって音声認識された音声単語標準パターンと認
識文字とを学習データとして記憶する音声用学習データ
記録部２１とが設けられている。この学習データの場合
には認識文字が共通情報となる。

【００７３】一方、第２の自然言語処理部１６は、構成
部分１１，１３〜１５を含み、さらに上記実施例と同様
にかな漢字変換部７とかな漢字用学習データ記録部８と
が設けられている。

【００７４】従って、この実施例装置においては、かな
漢字変換部７がデータ記録部１５の知識辞書およびかな
漢字用学習データ記録部８の学習データに基づいてかな
漢字混交文字を特定するのが難しいとき、或いは音声認
識部２０がカナ文字変換後にかな漢字混交の文字データ
に変換するのが難しいとき、学習反映部１８に学習デー
タの有無確認を要請し、学習データがあれば、その学習
データを利用してかな漢字混交文字に変換し、学習デー
タとして記憶させる。（実施例４）図７は請求項７〜１０に係わる自然言語処
理装置および自然言語処理方法の実施例として、例えば
日英機械翻訳システムに適用した機能ブロック図であ
る。

【００７５】この装置は、通常，キーボード、マウスな
どのポインティングデバィス、或いはＯＣＲその他の入
力装置などが用いられ、文章などのデータやコマンド列
データを入力する入力部３１と、通常，ＣＲＴ、ビット
マップディスプレイ等が用いられ、入力部３１から入力
されるデータや種々の処理結果のデータを表示する表示
部３２と、本装置全体を制御する制御部３３と、入力部
３１から入力されるデータや種々の処理結果のデータを
記憶する磁気記憶媒体，光学記憶媒体等の記録部３４と
が設けられ、さらに第１および第２の自然言語処理部３
５，３６、差分取得部３７および辞書編集部３８が設け
られている。

【００７６】前記第１の自然言語処理部３５は、入力部
等３１〜３４を含み、さらに入力部３１から入力される
データや記録部３４に記憶されているデータを翻訳する
翻訳部３９と、この翻訳部３９より参照され、翻訳に用
いられる知識が記憶されている翻訳用辞書４０とによっ
て構成されている。この翻訳用辞書４０は、通常，電子
的・磁気的或いは光学的な記録媒体が用いられ、例えば
日英翻訳の場合には「原語（日本語）、原語の品詞や用
法、訳語（英語）、訳語の品詞や用法」が記憶される。

【００７７】前記第２の自然言語処理部３６は、第１の
自然言語処理部３５と同様に入力部等３１〜３４を含
み、さらに翻訳する原文等を入力する機能を有し、入力
部３１や記録部３４より転送されてくる日本語読みデー
タを漢字混交文に変換するかな漢字変換部４１と、この
かな漢字変換部４１より参照され、かな漢字変換に用い
る知識が記憶されているかな漢字変換用辞書４２とによ
って構成されている。このかな漢字変換用辞書４２は、
通常，電子的・磁気的或いは光学的な記録媒体が用いら
れ、一般的には「読み文字列，漢字，漢字の品詞や用
法」が記憶されている。

【００７８】前記差分抽出部３７は、本発明装置の中核
をなす構成部分であって、次の理由から設けられたもの
である。すなわち、日英機械翻訳システムにおいては、
翻訳用辞書４０の原語とかな漢字変換の漢字との間に差
があると、かな漢字変換によって入力された分が適切に
翻訳できないという問題がある。

【００７９】そこで、この差分抽出部３７は、２つの自
然言語処理部３５，３６の一部を構成する翻訳用辞書４
０とかな漢字変換用辞書４２との差分，つまり共通情報
である翻訳用辞書４０の原語とかな漢字変換用辞書４２
の漢字とを比較して差分をとり、これら原語，漢字およ
び差分データ等を表示部３２に表示してオペレータに提
示したり、或いは記録部３４に登録し、適宜な時期にオ
ペレータの指示に従って表示部３２に表示し、後記する
辞書編集部３８にて編集可能にしたり、印字出力したり
する。

【００８０】前記辞書編集部３８は、翻訳用辞書４０お
よびかな漢字変換用辞書４２の編集を行ったり、差分抽
出部３７の出力である原語，漢字および差分データ等ま
たは前記記録部３４に登録された原語，漢字および差分
データ等に基づいて、当該差分をなくするように各辞書
４０，４２の内容を編集する機能をもっている。つま
り、辞書編集部３８は、差分取得部３７によって得られ
る２つの辞書４０，４２の差分データに基づき、かな漢
字変換で出力される語彙は翻訳できるように編集し登録
する。

【００８１】また、翻訳用辞書４０の原語に含まれない
語句の場合にはかな漢字変換では出力しないとか、優先
度を下げるとか、出力時に警告を発する等の抑制処理を
行うものである。

【００８２】図８は差分抽出部３７の動作の一例を示す
フローチャートである。この差分抽出部３７において
は、第１の知識辞書である翻訳用辞書４０の内容を読み
込んで、これら辞書内容をＡとする（ＳＴ３１）。次
に、第２の知識辞書であるかな漢字変換用辞書４２の内
容を読み込んで、これら辞書内容をＢとする（ＳＴ３
２）。このとき、辞書内容Ｂは、前述したように「読み
文字列，漢字，漢字の品詞や用法」という情報の集合で
あるので、これらＢ中のｉ番目のデータの漢字部分を抽
出し、これをＣとする（ＳＴ３３，ＳＴ３４）。

【００８３】一方、辞書内容Ａは、前述したように「原
語，原語の品詞や用法，訳語，訳語の用法」であって、
そのうち原語部分が日本語の単語（共通情報）であると
いう点でＣとは共通点をもっている。そこで、ステップ
ＳＴ３５では、ＣがＡの原語部分に含まれているか否か
を判断し、含まれていない場合にはＣとその用法を差分
リスト（図示せず）に登録する。そして、この登録後お
よびＣがＡの原語部分に含まれている場合、それぞれＢ
の次の（ｉ＋１）番目のデータに進み、Ｂの最後のデー
タまで繰り返す（ＳＴ３７，ＳＴ３８）。最終データに
至ったら、これを差分リストとして記録部３４に記憶し
（ＳＴ３９）、表示部３２に表示してユーザに提示した
り、或いは辞書編集部３８の編集の用に供する。

【００８４】次に、図９および図１０は、翻訳用辞書４
０，かな漢字変換用辞書４２の具体的差分例およびその
差分に対する修正編集状態を説明する図である。今、オ
ペレータが原文として日本語文を入力するに当たり、
「美的な」という語がかな漢字変換できないことに気付
き（図９（ａ））、かな漢字変換用辞書４２に新語登録
を行うときの画面例を示している（図９（ｂ））。つま
り、図９（ａ）はかな漢字変換用辞書４２に「美的な」
という新語が未だ登録されていないので、当該「美的
な」に関する読み文字列、漢字、品詞等を入力して漢字
変換用辞書４２に登録すれば、画面には同図（ｂ）に示
すように表示される。

【００８５】この際、オペレータは原文入力専門であ
り、英語の知識を全く有しなくてもよい。別途翻訳辞書
管理者が差分リストを作成し、入力できないか、翻訳で
きない語かを調べる。

【００８６】ここでは、図１０（ａ）に示すように、
「美的だ」が、翻訳用辞書４０に登録されていないが、
かな漢字変換用辞書４２にはすでに「美的だ」は形容動
詞として登録されているので、システムでは言語に対す
る品詞情報を提示している。これに対し、同図（ｂ）に
示すような情報を翻訳用辞書４０に追加登録する。

【００８７】以上の場合は、日英機械翻訳システムの例
であるが、他のシステムにも同様に適用できる。英日機
械翻訳システムでは、翻訳用辞書４０には、「原語（英
語），原語の用法，訳語（日本語），訳語の用法」とい
ったデータが登録され、かな漢字変換用辞書４２には
「読み，漢字，漢字の用法」が記憶されている。ここで
は、「訳語」と「漢字」が共通情報となっており、これ
に差があると、訳文を編集する際、訳出された語を新た
めて入力しなおす際に変換できない。従って、以上のよ
うなして差分を取り出し、別途登録するとよい。

【００８８】また、「ｇｉｒｌ」の訳語に「乙女」，
「少女」，「娘」が登録されているが、かな漢字変換用
辞書４２には「乙女」が登録されていなかった場合、
“ｇｉｒｌ”の翻訳結果として訳出する際に「乙女」の
優先度を下げ、他の語が第一訳語として出力されたり、
「乙女」を訳出候補から削除したりすることにより、上
記の問題を解決したり、オペレータが訳語として「乙
女」を選択した際には警告を発することもできる。

【００８９】従って、以上のような実施例の構成の装置
および方法によれば、自然言語処理ごと、または適宜な
時期に複数の自然言語処理部の知識辞書の差を抽出し、
その差分を編集処理によって統一化するようにしたの
で、自然言語処理の迅速化およびオペレータの労力を軽
減化できる。また、一方の自然言語処理部による自然言
語処理結果のデータが他方の自然言語処理部で用いる知
識辞書の中に含まれていない場合、一方の自然言語処理
部による自然言語処理結果のデータの出力を抑制するの
で、誤った自然言語処理結果のデータを得ることが低減
化できる。

【００９０】その他、本発明は、種々の自然言語処理を
行う少なくとも２つの自然言語処理部を有する種々の自
然言語処理装置および種々の自然言語処理方法に適用で
きることは言うまでもない。

【００９１】

【発明の効果】以上説明したように本発明によれば、次
のような種々の効果を奏する。請求項１ないし請求項５
の発明においては、一方の自然言語処理によって得られ
る学習内容を別の自然言語処理に適切、かつ、有効に反
映させることができる。

【００９２】次に、請求項６の発明は、２つの自然言語
処理部の自然言語処理によって得られる学習データに共
通情報を登録し、この共通情報をてがかりに相互に各自
然言語処理部の学習データを有効に利用することができ
る。

【００９３】さらに、請求項７，８，１０の発明は、各
自然言語処理時に用いる知識辞書の差分を提示し、各知
識辞書の差を縮小するような支援処理を行うので、自然
言語処理の迅速化およびオペレータの労力を軽減化でき
る。

【００９４】さらに、請求項９の発明は、各自然言語処
理時に用いる知識辞書の間に差があるとき、ある自然言
語処理結果の出力を抑制するので、誤った自然言語処理
を低減化できる。

【図面の簡単な説明】

【図１】本発明に係わる自然言語処理装置の一実施例を
示すブロック構成図。

【図２】図１に示す学習反映部の機能構成を示す図。

【図３】他の自然言語処理部に必要な学習データが存在
するか否かを判断する動作手順を説明する図。

【図４】機械翻訳システムの画面表示例を示す図。

【図５】２つの自然言語処理部に学習データが存在する
場合の選択手順を説明する図。

【図６】自然言語処理装置の他の実施例を示すブロック
構成図。

【図７】自然言語処理装置のさらに他の実施例を示すブ
ロック構成図。

【図８】両自然言語処理装置の知識辞書の差分を抽出す
る一連の動作を説明する図。

【図９】両自然言語処理装置の知識辞書の差分リストの
用法を説明する図。

【図１０】同じく両自然言語処理装置の知識辞書の差分
リストの用法を説明する図。

【符号の説明】

１，１１，３１…入力部、２，１３，３２…表示部、
４，１５，３４…記録部、５，３９…翻訳部、６…翻訳
用学習データ記録部、７，４１…かな漢字変換部、８…
かな漢字用学習データ記録部、９…学習反映部、１２…
音声入力部、１６，３５…第１の自然言語処理部、１
７，３６…第２の自然言語処理部，４２…かな漢字変換
用辞書、３７…差分抽出部、３８…辞書編集部。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁶ 識別記号庁内整理番号ＦＩ技術表示箇所 8420−5Ｌ 15/38 Ｔ

Claims

【特許請求の範囲】

【請求項１】それぞれ自然言語処理によって得られる
学習データを記憶する少なくとも２つの自然言語処理部
と、ある１つの自然言語処理部の自然言語処理時に他の
自然言語処理部に記憶される学習データが前記ある１つ
の自然言語処理部の自然言語処理に不十分な場合でも、
利用可能な学習データのみを取り出し、前記ある１つの
自然言語処理部の自然言語処理に対して学習を可能とす
る学習反映部とを有することを特徴とする自然言語処理
装置。
【請求項２】それぞれ自然言語処理によって得られる
学習データに所定の共通情報を挿入して記憶する少なく
とも２つの自然言語処理部と、ある１つの自然言語処理
部による自然言語処理の語句候補と他の自然言語処理部
の学習データの中の共通情報とを比較しながら学習状態
を判断し、その判断結果を前記ある１つの自然言語処理
部に伝達する学習反映部とを有することを特徴とする自
然言語処理装置。
【請求項３】学習反映部は、ある１つの自然言語処理
部における自然言語処理に用いる学習データが存在しな
いとき、他の自然言語処理部の学習データを反映させる
ことを特徴とする請求項１または請求項２に記載の自然
言語処理装置。
【請求項４】それぞれ自然言語処理によって得られる
学習データを記憶する少なくとも２つの自然言語処理部
と、各自然言語処理部の自然言語処理に用いる学習デー
タの有無の確認要請に基づいて他の自然言語処理部に学
習データの存在有無を確認する学習反映部と、確認要請
元の前記自然言語処理部において当該確認要請元自然言
語処理部に学習データが存在し、かつ、前記学習反映部
の確認結果から前記他の自然言語処理部にも学習データ
が存在するとき、学習時期の新しい学習データを学習に
反映させる手段とを備えたことを特徴とする自然言語処
理装置。
【請求項５】それぞれ自然言語処理によって得られる
学習データを記憶する少なくとも２つの自然言語処理部
と、各自然言語処理部の自然言語処理に用いる学習デー
タの有無の確認要請に基づいて他の自然言語処理部に学
習データの存在有無を確認する学習反映部と、確認要請
元の前記自然言語処理部において当該確認要請元自然言
語処理部に学習データが存在し、かつ、前記学習反映部
の確認結果から前記他の自然言語処理部にも学習データ
が存在するとき、両者の学習データを組み合わせて学習
に反映させる手段とを備えたことを特徴とする自然言語
処理装置。
【請求項６】予め各自然言語処理部の自然言語処理に
よって得られる学習データに共通情報を含ませて記憶
し、一方の自然言語処理部の自然言語処理時に前記共通
情報を介して他の自然言語処理部に利用可能な学習デー
タが存在するか否かを判断し、利用可能な学習データが
存在すれば前記一方の自然言語処理部の自然言語処理に
利用することを特徴とする自然言語処理方法。
【請求項７】それぞれ知識辞書を用いて自然言語処理
を行う少なくとも２つの自然言語処理部と、各々の自然
言語処理部において用いられる知識辞書の辞書内容の差
を抽出して提示または登録する差分抽出手段とを備えた
ことを特徴とする自然言語処理装置。
【請求項８】それぞれ知識辞書を用いて自然言語処理
を行う少なくとも２つの自然言語処理部と、各々の自然
言語処理部において用いられる知識辞書の辞書内容の差
を抽出して提示または登録する差分抽出手段と、この差
分抽出手段によって得られた辞書内容の差を編集し統一
化する辞書編集手段とを備えたことを特徴とする自然言
語処理装置。
【請求項９】それぞれ知識辞書を用いて自然言語処理
を行う少なくとも２つの自然言語処理部と、一方の自然
言語処理部で得られる処理結果データが他の自然言語処
理部において用いられる知識辞書に含まれない場合、前
記一方の自然言語処理部で得られる処理結果データの出
力を抑制する手段とを備えたことを特徴とする自然言語
処理装置。
【請求項１０】それぞれ知識辞書を有する各自然言語
処理部の自然言語処理の度に、または任意の時期に前記
複数の自然言語処理部の知識辞書の差を抽出して登録し
た後、前記自然言語処理の度に、または所要とする時期
に知識辞書の差を統一化するための編集処理を行うこと
を特徴とする自然言語処理方法。