JPH08212216A - 自然言語処理装置および自然言語処理方法 - Google Patents

自然言語処理装置および自然言語処理方法

Info

Publication number
JPH08212216A
JPH08212216A JP7020220A JP2022095A JPH08212216A JP H08212216 A JPH08212216 A JP H08212216A JP 7020220 A JP7020220 A JP 7020220A JP 2022095 A JP2022095 A JP 2022095A JP H08212216 A JPH08212216 A JP H08212216A
Authority
JP
Japan
Prior art keywords
natural language
language processing
unit
learning
learning data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7020220A
Other languages
English (en)
Inventor
Etsuo Ito
悦雄 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7020220A priority Critical patent/JPH08212216A/ja
Publication of JPH08212216A publication Critical patent/JPH08212216A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 一方の自然言語処理の学習内容を別の自然言
語処理に適切、かつ、有効に反映させることにある。 【構成】 異なる自然言語処理を行って得られる学習デ
ータを記憶する2つの自然言語処理部(1〜6)、(1
〜4,7,8)と、ある1つの自然言語処理部の自然言
語処理時に他の自然言語処理部に記憶される学習データ
が前記ある1つの自然言語処理部の自然言語処理に不十
分な場合でも、利用可能な学習データのみを取り出し、
前記ある1つの自然言語処理部の自然言語処理に対して
学習を可能とする学習反映部9とを設けた自然言語処理
装置である。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳システム、文
書作成システム,文書校正システム、文書要約システム
等々の種々の文書処理システムに適用可能な自然言語処
理装置および自然言語処理方法に係わり、特に複数の自
然言語処理機能を有する自然言語処理装置および自然言
語処理方法に関する。
【0002】
【従来の技術】最近のコンピュータ技術の進歩にはめざ
ましいものがあり、文書データの編集や翻訳などの文書
処理を行う文書処理システムに対するコンピュータ化も
盛んに進められている。例えばコンピュータを利用して
第1言語を第2言語に翻訳する機械翻訳システムが注目
されているが、この機械翻訳システムの場合には、翻訳
機能の他、編集用のかな漢字編集機能を含んでいること
が多い。
【0003】また、紙面に書かれた文字を読取って電子
化するOCR装置においては、文字認識機能の他、編集
用のかな漢字編集機能が含まれており、さらにOCRと
機械翻訳処理を統合化したシステムやかな漢字変換機能
をもつ文書要約システムなど、いわゆる単独で1つの自
然言語処理機能を有するシステムでなく、複数の自然言
語処理機能をもったシステムの開発、提案が増加の傾向
にある。
【0004】ところで、以上のような複数の自然言語処
理機能をもつ文書処理システムでは、知識の学習および
学習データの相互利用について考える必要がある。先
ず、前者の知識の学習に関しては、従来、例えばかな漢
字変換における同音異義語の学習が挙げられる。この学
習方法は、かな漢字変換時にユーザが誤りを発見したと
き、その発見の都度誤りを修正し、その修正内容を次回
以降に生かすことにより、学習の機能を高めることが行
われている。
【0005】一方、後者の学習データの利用について
は、1つの文書処理システムに複数の自然言語処理機能
を設けただけであって、各自然言語処理の機能としては
それぞれ完全に独立しており、それぞれ別々の知識辞書
を用いて自然言語処理を行うにすぎない。
【0006】
【発明が解決しようとする課題】従って、以上のような
知識の学習は、かな漢字変換時の同音異義語の誤りを修
正しながら学習する場合には有効であるが、例えば機械
翻訳とかな漢字変換とを組み合わせた複数の自然言語処
理の場合には、それぞれの自然言語処理によって得られ
る学習の効果および学習の内容が異なり、また学習に必
要な情報がそれぞれ異なることから、各自然言語処理時
に得られた学習内容が互いに他の自然言語処理に有効に
反映させることができない。
【0007】また、各自然言語処理の学習内容が互いに
他の自然言語処理に反映できないが、同一文書中に同じ
言葉を使用するといった傾向が強いことから、オペレー
タが各自然言語処理時の段階で学習データを与えながら
学習作業を行う必要が不可欠であり、その結果、オペレ
ータの処理作業が増加するだけでなく、システムの処理
能力の低下を招く原因にもなっている。
【0008】次に、後者の学習データの利用は、1つの
文書処理システムに複数の自然言語処理機能を設けただ
けであるので、一方の自然言語処理時にユーザが新知識
を登録しても、その知識が他方の自然言語処理に全く反
映させることができない。その結果、例えばかな漢字変
換機能を有する日英機械翻訳システムにおいては、かな
漢字変換と翻訳との間で知識辞書に差異が生じるので、
かな漢字変換で出力される語彙を翻訳に利用することが
できないなどの不都合が生ずる。この他にも、日英機械
翻訳システムによって訳出される語につき、同一システ
ムを用いてかな漢字変換で入力できないとか、或いは日
英相互翻訳システムにおいて英日翻訳の結果を日英翻訳
できないなどの問題がある。さらに、音声入力機能付き
翻訳システムにおいては、音声認識された結果を翻訳で
きない等の問題がある。
【0009】そこで、以上のような問題を解決するため
に、複数の自然言語処理に用いる知識辞書を共通化する
とか、或いは全部の自然言語処理に用いる知識辞書に対
して同一時期に同時に登録することが考えられる。しか
し、このような手段は、例えば音声入力機能付きの機械
翻訳システムのごとき場合には翻訳中に新語を登録する
と同時に音声信号パターンまで登録しなければならな
い。つまり、登録時に常に多量の情報を登録しなければ
ならず、非常に煩わしい問題がある。
【0010】従って、複数の自然言語処理機能を有する
文書処理システムにおいては、各自然言語処理機能で使
用する知識辞書に差が生じる結果、システム全体の自然
言語処理に不統一な問題が生ずる。
【0011】請求項1ないし請求項5の発明は上記実情
に鑑みてなされたもので、一方の自然言語処理によって
得られる学習内容を別の自然言語処理に適切、かつ、有
効に反映させる自然言語処理装置を提供することを目的
とする。
【0012】次に、請求項6の発明の目的は、2つの自
然言語処理部の自然言語処理によって得られる学習デー
タに共通情報を登録し、この共通情報をてがかりに相互
に各自然言語処理部の学習データを有効に利用可能とす
る自然言語処理方法を提供することにある。
【0013】さらに、請求項7,8,10の発明の目的
は、各自然言語処理時に用いる知識辞書の差分を提示
し、各知識辞書の差を縮小するような支援処理を行う自
然言語処理装置および方法を提供することにある。
【0014】さらに、請求項9の発明の目的は、各自然
言語処理時に用いる知識辞書の間に差があるとき、ある
自然言語処理結果の出力を抑制する自然言語処理装置を
提供することにある。
【0015】
【課題を解決するための手段】上記課題を解決するため
に、請求項1ないし請求項3に対応する発明は、それぞ
れ異なる例えば翻訳部やかな漢字変換部等の自然言語処
理によって得られる個別の学習データをそれぞれ対応す
る例えば翻訳用学習データ記録部やかな漢字用学習デー
タ記録部に記憶するが、このとき各自然言語処理によっ
て得られる学習データごとに共通情報を挿入して記憶す
る少なくとも2つの自然言語処理部と、ある1つの自然
言語処理部の自然言語処理時に他の自然言語処理部に記
憶される学習データが前記ある1つの自然言語処理部の
自然言語処理に不十分な場合でも、利用可能な学習デー
タのみを取り出し、前記ある1つの自然言語処理部の自
然言語処理に対して学習を可能としたり、或いはある1
つの自然言語処理部による自然言語処理の語句候補と他
の自然言語処理部の学習データの中の共通情報とを比較
しながら学習状態を判断し、その判断結果を前記ある1
つの自然言語処理部に伝達する学習反映部とを設けた自
然言語処理装置である。
【0016】請求項4および請求項5に対応する発明
は、例えば翻訳部やかな漢字変換部等の自然言語処理に
よって得られる個別の学習データをそれぞれ対応する例
えば翻訳用学習データ記録部やかな漢字用学習データ記
録部に記憶する少なくとも2つの自然言語処理部と、各
自然言語処理部の自然言語処理に用いる学習データの有
無の確認要請に基づいて他の自然言語処理部に学習デー
タの存在有無を確認する学習反映部と、確認要請元の前
記自然言語処理部において当該確認要請元自然言語処理
部に学習データが存在し、かつ、前記学習反映部の確認
結果から前記他の自然言語処理部にも学習データが存在
するとき、学習時期の新しい学習データを学習に反映さ
せる手段または確認要請元の前記自然言語処理部におい
て当該確認要請元自然言語処理部に学習データが存在
し、かつ、前記学習反映部の確認結果から前記他の自然
言語処理部にも学習データが存在するとき、両者の学習
データを組み合わせて学習に反映させる手段とを設けた
自然言語処理装置である。
【0017】さらに、請求項6に対応する発明は、予め
各自然言語処理部の自然言語処理によって得られる学習
データに共通情報を含ませて記憶し、一方の自然言語処
理部の自然言語処理時に前記共通情報を介して他の自然
言語処理部に利用可能な学習データが存在するか否かを
判断し、利用可能な学習データが存在すれば前記一方の
自然言語処理部の自然言語処理に利用する自然言語処理
方法である。
【0018】さらに、請求項7ないし請求項9は、それ
ぞれ異なる知識辞書を用いて自然言語処理を行う少なく
とも2つの自然言語処理部と、各々の自然言語処理部に
おいて用いられる知識辞書の辞書内容の差を抽出して提
示または登録する差分抽出手段と、この差分抽出手段に
よって得られた辞書内容の差を編集し統一化する辞書編
集手段とが設けられ、或いは少なくとも2つの自然言語
処理部のうち、一方の自然言語処理部で得られる処理結
果データが他の自然言語処理部において用いられる知識
辞書に含まれない場合、前記一方の自然言語処理部で得
られる処理結果データの出力を抑制する手段を設けた自
然言語処理装置である。
【0019】さらに、請求項10に対応する発明は、そ
れぞれ知識辞書を有する各自然言語処理部の自然言語処
理の度に、または任意の時期に前記複数の自然言語処理
部の知識辞書の差を抽出して登録した後、前記自然言語
処理の度に、または所要とする時期に知識辞書の差を統
一化するための編集処理を行う自然言語処理方法であ
る。
【0020】
【作用】従って、請求項1ないし請求項3に対応する発
明は、以上のような手段を講じたことにより、各自然言
語処理部を構成する例えば翻訳部やかな漢字変換部で知
識辞書や学習データ記録部の学習データを用いて自然言
語処理を行い、その処理結果を対応する学習データ記憶
部に記憶する。
【0021】ここで、ある1つの自然言語処理部の自然
言語処理に際し、該当知識辞書や学習データ記録部の学
習データに適切な処理言語が存在しない場合、学習反映
部を介して他の自然言語処理部の学習データに利用可能
な学習データが存在するか否かを調べる。
【0022】この学習反映部は、他の自然言語処理部に
記憶される学習データの中から利用可能な学習データを
探し出し、ある1つの自然言語処理部の自然言語処理に
用いる。
【0023】また、学習反映部は、各自然言語処理部を
構成する学習データ記録部の学習データに共通情報が挿
入されている場合、前記ある1つの自然言語処理部の語
句候補の自然言語処理に際し、この語句候補と他の自然
言語処理部の学習データとを前記共通情報を手掛かりに
適切な学習データを見つけ出し、前記ある1つの自然言
語処理部の語句候補の自然言語処理に用い、かつ、その
処理結果を学習するので、各自然言語処理によって得ら
れる学習内容を別の自然言語処理に適切、かつ、有効に
反映させることができる。
【0024】次に、請求項4および請求項5に対応する
発明は、各自然言語処理部を構成する例えば翻訳部やか
な漢字変換部で知識辞書や学習データ記録部の学習デー
タを用いて自然言語処理を行い、その処理結果を対応す
る学習データ記憶部に記憶する。
【0025】ところで、ある1つの自然言語処理部の自
然言語処理に際し、他の自然言語処理部の学習データに
利用可能な学習データが存在するか否かを学習反映部に
要請する。ここで、学習反映部は、学習データの有無確
認要請に基づいて他の自然言語処理部に学習データの存
在有無を確認する。
【0026】しかる後、ある1つの自然言語処理部で
は、自然言語処理に際し、自身の学習データ記録部に学
習データが存在し、かつ、学習反映部による確認結果か
ら他の自然言語処理部の学習データ記録部にも学習デー
タが存在するとき、学習時期の新しい学習データを学習
に反映させるようにしたので、常に最新の適切な学習デ
ータを用いて、自然言語処理を行うことができる。
【0027】また、請求項6に対応する発明において
は、共通情報を仲立ちに各自然言語処理部の利用可能な
学習データの存在を判断し、適切な学習データを利用す
るので、相互に各自然言語処理部の学習データを有効に
利用することができる。
【0028】さらに、請求項7ないし請求項9に対応す
る発明は、差分抽出手段にて少なくとも2つの自然言語
処理部の知識辞書の辞書内容の差を抽出して提示または
登録し、しかる後、辞書編集手段で辞書内容の差を編集
して統一化することにより、各知識辞書の差が縮小して
均一かつ適切な知識辞書を作成できる。
【0029】また、一方の自然言語処理部で得られる処
理結果データが他の自然言語処理部において用いられる
知識辞書に含まれない場合、一方の自然言語処理部で得
られる処理結果データの出力を抑制することから、誤っ
た処理結果を出力することがない。
【0030】
【実施例】以下、本発明の実施例について図面を参照し
て説明する。 (実施例1)請求項1〜3に係わる発明の一実施例を説
明する。
【0031】先ず、自然言語処理装置として、例えば機
械翻訳機能とかな漢字変換機能とを有する機械翻訳シス
テムを例に上げて説明する。従来の機械翻訳システムで
は、かな漢字変換の学習内容と翻訳の学習内容とが異な
るために、互いに各機能の学習内容を反映し合うことが
できない。
【0032】具体的に述べると、かな漢字変換の学習
は、基本的には「読み情報と、その読みに対する第一優
先となる漢字との関係」から得られ、一方、機械翻訳の
場合には「第一言語の単語と、その単語に対する第一訳
語となるべき第二言語の単語との関係」から得られる。
例えば英日機械翻訳システムでは、“feeling”
の訳語候補として「触覚,感覚,知覚」等が上げられる
が、このときオペレータが前記訳語候補の中から「感
覚」を選択・学習したと考える。ところが、この時、シ
ステムに含まれるかな漢字変換機能をもつ日本語ワード
プロセッサには、その学習結果が反映されない。それ
は、“feeling”が日本語ワードプロセッサの読
み情報でないためである。
【0033】しかし、同一文書の場合には、同じ用語を
用いることが非常に多く、かかる学習結果を日本語ワー
ドプロセッサにも優先利用するようにすれば、装置の処
理作業効率が格段に向上する。
【0034】そこで、本発明に係わる自然言語処理装置
では、学習データのうち、共通情報である「日本語表層
文字列」(かな漢字変換では変換結果、英日翻訳では訳
語)をキーとし、両者を比較することにより、翻訳結果
の訳語学習をかな漢字変換にも反映させることにある。
【0035】図1は本発明装置を適用してなる機械翻訳
システムの一実施例を示すブロック構成図である。この
機械翻訳システムは、通常,キーボード,マウスなどの
ポインティングデバイス、OCRなどが用いられ、文章
などのデータやコマンド列データなどを入力する入力部
1と、通常,CRT、ビットマップディスプレイなどが
用いられ、入力部1から入力されるデータや種々の処理
結果のデータを表示する表示部2と、本装置の構成部分
を統括制御する制御部3と、入力部1から入力されるデ
ータや後記する翻訳部,かな漢字変換部に必要な知識辞
書データなどを記憶する例えば磁気記憶媒体,光学記憶
媒体等の記録部4と、入力部1から入力されるデータや
記録部4に記憶されている第一言語のデータを第二言語
のデータに翻訳する翻訳部5と、この翻訳部5で処理さ
れた学習データを記憶する例えば磁気記憶媒体,光学記
憶媒体等の翻訳用学習データ記憶部6とが設けられてい
る。これら構成部分1〜6は第1の自然言語処理部を構
成する。
【0036】また、本装置には、第2の自然言語処理部
が設けられている。この第2の自然言語処理部は、入力
部1,表示部2,制御部3,記録部4等を含み、さらに
入力部1から入力されるデータや記録部4に記憶されて
いるひらがな文字列データをかな漢字混交文データに変
換するかな漢字変換部7およびこのかな漢字変換部7に
よって学習されたデータを記録するかな漢字用学習デー
タ記憶部8等によって構成されている。このかな漢字用
学習データ記憶部8は、通常,磁気記憶媒体や光学記憶
媒体等が用いられている。
【0037】さらに、本装置には、学習反映部9が設け
られている。この学習反映部9は、翻訳用学習データ記
憶部6に記憶されている翻訳部5の学習データのうち、
かな漢字変換部7で利用可能な学習データを識別してか
な漢字変換部7に転送したり、それとは逆にかな漢字用
学習データ記憶部8に記憶されているかな漢字変換部7
の学習データのうち、翻訳部5で利用可能なデータを識
別して翻訳部5に転送したりする機能をもっている。
【0038】なお、表示部2には、CRTやビットマッ
プディスプレイなどが用いられるが、その他に例えば壁
掛け用スクリーンなどが用いられる。次に、図2は前記
学習反映部9の構成を説明する機能ブロック図である。
【0039】この学習反映部9は、翻訳部5またはかな
漢字変換部7の何れから自然言語処理するある語句候補
について学習有無の確認要請があったかを判定する学習
有無要請元判定手段9Aと、この判定手段9Aの判定結
果に基づいて要請元側と反対側の学習データ記録部8ま
たは6から語句候補に関係する共通情報を取り出す共通
情報取得手段9Bと、この共通情報取得手段9Bによっ
て取得された共通情報の中に語句候補に関係する共通情
報が存在するか否かを判断する語句候補認識手段9C
と、この語句候補認識手段9Cの認識結果に基づいて学
習有無を前記要請元である翻訳部5またはかな漢字変換
部7に返答する学習有無返答手段9Dとによって構成さ
れている。
【0040】次に、以上のように構成された装置の一般
的な動作を説明した後、本発明装置の中核をなす学習反
映部9およびその関連する部分の動作を説明する。先
ず、入力部1から第一言語である英文字列データが入力
されると、制御部3ではその英文字列データを表示部2
に表示するとともに記録部4に記憶し、さらに翻訳部5
に送出する。ここで、翻訳部5は、制御部3から受け取
った英文字列データに基づいて記録部4の知識辞書デー
タを用いて第二言語である日本語に翻訳するが、このと
き訳語候補が多い場合には翻訳用学習データ記録部6の
学習データを参照しながら第二言語である日本語に翻訳
する。このとき、翻訳結果が学習データとして存在しな
い場合には新たな学習データとして翻訳用学習データ記
録部6に記憶する。
【0041】一方、入力部1からひらがな文字列データ
が入力されると、制御部3ではそのひらがな文字列デー
タを表示部2に表示するとともに記録部4に記憶し、さ
らにかな漢字変換部7に送出する。ここで、かな漢字変
換部7は、制御部3から受け取ったひらがな文字列デー
タに基づいて前記記録部4の知識辞書データを用いてか
な漢字混交文データに変換するが、このとき変換候補が
多い場合にはかな漢字用学習データ記録部8の学習デー
タを参照しながら変換する。このとき、変換結果が学習
データとして存在しない場合には新たな学習データとし
てかな漢字用学習データ記録部8に記憶する。
【0042】次に、学習反映部9を含む関連動作につい
て図3を参照して説明する。今、翻訳部5またはかな漢
字変換部7において記録部4の知識辞書データなどを用
い、かつ、翻訳用学習データ記録部6またはかな漢字用
学習データ記録部8の学習データを用いても例えば翻訳
不可またはかな漢字混交変換不可の場合、自然言語処理
する語句候補を送出し、他の自然言語処理部のかな漢字
用学習データ記録部8または翻訳用学習データ記録部6
に学習データが存在するか否かの判断を要請する。
【0043】なお、学習反映部9に対する学習データ有
無を要請は、翻訳またはかな漢字混交変換不可の有無に
係わらず、プログラムにより、或いはオペレータの指示
によって任意に行ってもよい。
【0044】この学習反映部9は、自然言語処理すべき
語句候補による学習の有無判断の要請を受けたとき動作
を開始する(ST1)。ここで、学習反映部9は、語句
候補に対する学習データ有無の確認要請元がかな漢字変
換部7であるか、翻訳部5であるかを判定する(ST
2)。確認要求元がかな漢字変換部7である場合には、
翻訳用学習データ記憶部6から学習データを読み取り、
これを例えばデータAとする(ST3)。そして、これ
らのデータのうち、共通情報となる日本語文字列部,つ
まり英日翻訳学習データの中の訳語学習文字列を抽出
し、これをBとする(ST4)。そこで、ステップST
1において受信した語句候補がデータBに含まれている
か否かを判断する(ST5)。ここで、語句候補がデー
タBに含まれているとき、「その語句候補が機械翻訳で
学習されている」と判断し、その旨および含まれている
学習データをかな漢字変換部7に送出し(ST6)、学
習有無判断の処理を終了する。
【0045】ステップST5において語句候補がデータ
Bに含まれていない場合には、「その語句候補が機械翻
訳で学習されていない」と判断し、その旨をかな漢字変
換部7に送出し(ST7)、学習有無判断の処理を終了
する。
【0046】一方、ステップST2において語句候補に
対する学習データ有無の確認要請元が翻訳部5である場
合には、かな漢字用学習データ記録部8から学習データ
を読み取り、これを例えばデータCとする(ST8)。
ここで、これらのデータのうち、共通情報となる日本語
文字列であるかな漢字混交データ部,つまり同音異義語
学習文字列を抽出し、これをデータDとする(ST
9)。しかる後、翻訳部5から送られてきた語句候補が
データDに含まれているか否かを判断する(ST1
0)。ここで、語句候補がデータDに含まれていると
き、「その語句候補がかな漢字変換で学習されている」
と判断し、その旨および含まれている学習データを翻訳
部5に送出し(ST11)、学習有無判断の処理を終了
する。
【0047】ステップST10において語句候補がデー
タDに含まれていない場合には、「その語句候補がかな
漢字変換で学習されていない」と判断し、その旨を翻訳
部5に送出し(ST12)、学習有無判断の処理を終了
する。
【0048】図4は、実施例1に係わる機械翻訳システ
ムの具体例について、表示部2の表示状態をもって説明
する。なお、この表示例は、英日翻訳を例に上げ、図示
左側に原文(英語)、図示右側に翻訳結果(日本語)が
表示されている。
【0049】先ず、図4(a)は、機械翻訳によって直
接翻訳した例である。つまり、入力部1から「His feel
ing is……」なる文章を入力したとき、翻訳部5では記
録部4の知識辞書データに基づいて「彼の触感は、…
…」と翻訳し、表示部2に表示したことを意味する。つ
まり、ここでは、feeling の訳語として、「触感」を訳
出したことが分かる。
【0050】しかし、オペレータとしては、feeling の
訳語には「触感」が不十分であると判断し、「feeling
」の訳語として例えば訳語候補の中から「感覚」を選
択し、或いは直接日本語の文字を入力するなどして翻訳
し、図4(b)に示すように表示部2に表示するととも
に、その翻訳結果に基づいて翻訳部5が学習処理を行
い、翻訳用学習データ記録部6に学習記憶する。このと
きの学習内容は、例えば「feeling (名詞):感覚(名
詞)」から構成され、いわゆる原文の単語およびその品
詞と、学習された訳語およびその品詞が記録される。こ
の学習内容のうち「感覚(名詞)」は、かな漢字用学習
データ記録部8の学習データの間における共通情報とし
ての役割をもっている。
【0051】次に、この翻訳結果とは別に、オペレータ
が入力部1から「かんかく」なる文章を入力すると、か
な漢字変換部7では、入力される「かんかく」の文字に
基づいてかな漢字変換を実行する(図4(c)参照)。
かな漢字変換を行うと、「かんかく」の漢字として「間
隔」「感覚」などが出てくる。つまり、このとき共通情
報は、「間隔」「感覚」などである。
【0052】しかし、かな漢字変換処理用として学習デ
ータ記録部8に学習されていない場合、表示部2にはど
のような漢字が表示されるか分からない。そこで、学習
反映部9では、一方の自然言語処理部の一部を構成する
かな漢字変換部7から「間隔」「感覚」等の語句候補が
他方の自然言語処理部の一部を構成して翻訳用学習デー
タ記録部6に学習されているか否かの要請に基づいて学
習データの有無を調べる。つまり、学習反映部9は、、
翻訳用学習データ記録部6の「feeling (名詞):感覚
(名詞)」なる学習データの中の共通情報の中に「感
覚」があれば、学習されていると判断し、その「感覚」
を第1候補としてかな漢字変換部7に送出する。ここ
で、かな漢字変換部7は、図4(d)に示すように表示
部2に表示する一方、必要に応じてオペレータの指示に
より、或いは自動的にかな漢字変換結果をかな漢字用学
習データ記録部8に学習記憶する。 (実施例2)次に、請求項4に係わる発明の一実施例を
説明する。
【0053】この実施例の構成は、図1および図2とほ
ぼ同様な機能構成を有しているが、そのうち特に異なる
ところは、一方の自然言語処理部の一部を構成する翻訳
部5と,他方の自然言語処理部の一部を構成するかな漢
字変換部7とに新たな手段を設けたことにある。
【0054】すなわち、翻訳部5およびかな漢字変換部
7としては、翻訳結果またはかな漢字変換結果を学習記
憶するとき、この学習データに学習日時データを付けて
翻訳用学習データ記録部6,かな漢字用学習記録部9に
記憶する学習記憶手段と、自然言語処理対象となる語句
候補について自身の学習データ記録部側の学習データの
存在および前記学習反映部9を通して得られる他方の学
習データ記録部側の学習データの存在を確認するデータ
存在確認手段と、両方の自然言語処理部の学習データ記
録部6,8に学習データが存在するとき、各学習データ
に不可されている学習日時データから時間的に新しい学
習データを学習に反映させるデータ反映手段とが設けら
れている。
【0055】次に、以上のような構成の翻訳部5および
かな漢字変換部7を有する装置の動作について図5を参
照して説明する。今、第一言語である英文字列データを
第二言語である日本語に翻訳する例について述べる。翻
訳部5は、英文字列データである語句候補の翻訳に際
し、かな漢字変換側に学習データが存在するか否かの要
請を学習反映部9に送出する。この学習反映部9では実
施例1で述べたように学習データの存在有無を確認し翻
訳部5に返送する。
【0056】そこで、翻訳部5においては、図5に示す
ように学習反映部9から他方の自然言語処理部側での学
習データ有りの報告か否かを判断し(ST21)、学習
データ有りの場合には翻訳部側の翻訳用学習データ記録
部6にも語句候補の学習データが有るか否かを判断する
(ST22)。ここで、学習データ有りと判断したと
き、この学習データの共通情報が学習反映部9から送ら
れてくる学習データの共通情報と同じ内容であるか判断
する(ST23)。ここで、同じ内容の場合には、自身
側の翻訳用学習データ記録部6の学習結果を優先する
(ST24)。
【0057】ステップST23において学習データの共
通情報が学習反映部9から送られてくる学習データの共
通情報と同じでない場合には、学習データに付されてい
る日時データから何れの学習データが新しいか否かを判
断し(ST25)、学習反映部9からの学習データが新
しい場合には学習反映部9の学習データを反映し、それ
と逆の場合にはステップST24に移行し、自身側の翻
訳用学習データ記録部6の学習結果を優先するものであ
る。
【0058】従って、以上のような実施例の構成によれ
ば、ある1つの自然言語処理部の自然言語処理対象とな
る語句候補を訳語または漢字混交変換するとき、当該語
句候補の訳語または漢字混交文字が2つの自然言語処理
部に係わる学習データ記録部6,8の学習データに存在
するかを確認し、両方に存在する場合には何れか新しい
学習データを用いて反映するようにしたので、適切な訳
語または漢字混交文字に変換できる。
【0059】次に、請求項5に係わる発明の一実施例を
説明する。この実施例は、請求項4に係わる発明と同様
に翻訳部5およびかな漢字変換部7を改良したことにあ
る。
【0060】つまり、この実施例は、例えばかな漢字変
換機能と英日翻訳機能とをもつ英日機械翻訳システムに
おいて、かな漢字変換処理で学習された語彙と翻訳処理
で学習された訳語とが食い違う場合の改善例である。
【0061】例えばかな漢字変換部7のかな漢字変換側
では、「かんかく:感覚(名詞)」と学習され、一方、
翻訳部5の翻訳側では、「feeling (名詞):触覚(名
詞)」と学習されたとする。
【0062】この場合、従来の日英機械翻訳システムで
は、feeling の訳語として「触覚」と訳出する。しか
し、この翻訳部5の学習データ「feeling (名詞):触
覚(名詞)」は他の文書の翻訳時に学習されたものであ
り、一方、かな漢字変換処理による学習データ「かんか
く:感覚(名詞)」は今回の文書の編集中に学習された
ものであるとすると、同一文書では同じ語彙を使用する
傾向が非常に高い。そこで、このような場合には「感
覚」と訳出し、必要に応じて翻訳結果である「feeling
(名詞):感覚(名詞)」を学習データとして記憶す
る。
【0063】この場合の具体例としては、翻訳部5によ
る翻訳結果またはかな漢字変換部7の漢字変換結果を学
習するとき、文書全文または文書の部分領域ごとに学習
データに識別データ(ID)を付加する。そして、図5
に示す処理手順に従って語句候補に関する訳語や漢字混
交文字が学習データ記録部6,8に存在するか否かを判
断し、両方に学習データが存在する場合には前記識別デ
ータを見ながら学習データを反映させたり、或いは反映
させなかったりする。つまり、両者の学習データを組み
合わせて反映させることにある。
【0064】また、かな漢字変換と翻訳では、文字列が
同じでも品詞など語句の使用情報が異なる場合がある。
例えば「take」が名詞で使用されたとき、「取得」
と訳出されるように学習され、一方、かな漢字変換の場
合には「とる:取る(動詞)」と学習されているとき、
従来の日英機械翻訳システムでは、「take」が動詞
として用いられる場合の訳語は学習されていないことに
なるか、或いは他の品詞として学習された学習データを
流用して「取得する」と訳出することになる。
【0065】そこで、本装置においては、学習データに
識別データを付与して文書の区別性を判断すれば、かな
漢字変換における学習結果であれば、用法が同じである
「取る」を学習データとして用いることができる。
【0066】その他、各処理の学習データに重みを付加
し、その重みの大きさにより、或いは各処理段階で学習
データを使用する度に重み付けを加算し、その累計値に
よって学習効果を働かせるかを判断することもできる。
また、予めオペレータが3つ以上の処理段階の学習デー
タを利用した順番に有効とする指定することも可能であ
る。 (実施例3)次に、上記実施例1,実施例2の他の実施
例を説明する。この実施例は、機械翻訳システムではな
く、2つの自然言語処理部例えば英日翻訳機能とかな漢
字変換語機能とをもった例えば光学式文字読取り装置
(OCR)に適用した例である。
【0067】このOCRにおいては、予め認識テーブル
上に記号,図形を含む文字の特徴量に対応付けられた標
準文字候補群を格納し、OCR読取り部で読み取った文
字等のパターンと標準文字候補群とのパターン・マッチ
ングを行い、そのパターン・マッチング状態に応じて得
点を付加し、その得点の大小によって文字を決定するこ
とが行われている。しかし、「間」と「問」などのよう
に類似する文字の場合、特に原稿が汚れている場合など
には、これらの得点差が小さくなり、誤りの発生する可
能性が非常に高くなる。
【0068】そこで、本装置においては、以上のような
誤りを回避するために、文字が隣接して出現する可能性
(連接文字頻度)や認識結果の解析を行って正解率を高
めるものである。つまり、本実施例装置は、例えばOC
R読取り部で認識された連接文字をかな漢字変換すると
き、かな漢字変換部7にて同一文書の中に出現する連接
文字の頻度を計数し、連接文字の学習データに頻度値を
付加し、その頻度値の大小に応じてかな漢字変換を行う
構成である。例えばある文書において「特」と「長」が
隣接して出現する頻度が例えばE、「特」と「徴」との
頻度がFであり、E>Fであれば、その文書中では、
「とくちょう」のかな漢字変換結果として「特徴」が
「特長」よりも適切であると判断できるので、「とくち
ょう」のかな漢字変換時には「特徴」と変換することに
より、かな漢字の変換率を上げることができる。
【0069】しかし、同じ連接文字の場合でも、「合
う」と「会う」などのように用法が近い場合には効果が
低い。従って、この場合には同一文書においてかな漢字
変換部7の変換結果から「会う」が学習されている場
合、この学習効果を使用し、「会う」を認識第1候補と
し、かな漢字変換を行うものである。
【0070】さらに、上記実施例1,実施例2の他の実
施例を説明する。この実施例は、機械翻訳システムでは
なく、音声変換機能とかな漢字変換語機能とをもった文
書処理システムに適用した例である。
【0071】このシステムは、具体的には図6に示すよ
うに、通常,キーボード、マウスなどのポインティング
デバィス、或いはOCRその他の入力装置などが用いら
れ、文章などのデータやコマンド列データを入力するデ
ータ入力部11と、オペレータなどの音声信号を入力す
るマイクロホン等の音声入力部12と、通常,CRT、
ビットマップディスプレイ等が用いられ、データ入力部
11や音声入力部12から入力されるデータ,音声信号
(音声周波数信号)や種々の処理結果のデータを表示す
る表示部13と、本装置全体を制御する制御部14と、
入力部11,12から入力されるデータ,音声周波数信
号のディジタル変換データや種々の処理結果のデータを
記憶する磁気記憶媒体,光学記憶媒体等のデータ記録部
15とが設けられ、さらに第1および第2の自然言語処
理部16,17および学習反映部18が設けられてい
る。
【0072】この第1の自然言語処理部16は、構成部
分11〜15を含み、さらに知識辞書として機能する多
数の音声単語標準パターンを記憶する音声周波数パター
ン記録部19と、音声入力部12から入力される音声周
波数信号のディジタル変換データの特徴量を分析し、こ
の連続データの特徴量について前記音声単語標準パター
ンを照合しながら音声を認識し、文字データに変換し表
示部13に表示する音声認識部20と、この音声認識部
20によって音声認識された音声単語標準パターンと認
識文字とを学習データとして記憶する音声用学習データ
記録部21とが設けられている。この学習データの場合
には認識文字が共通情報となる。
【0073】一方、第2の自然言語処理部16は、構成
部分11,13〜15を含み、さらに上記実施例と同様
にかな漢字変換部7とかな漢字用学習データ記録部8と
が設けられている。
【0074】従って、この実施例装置においては、かな
漢字変換部7がデータ記録部15の知識辞書およびかな
漢字用学習データ記録部8の学習データに基づいてかな
漢字混交文字を特定するのが難しいとき、或いは音声認
識部20がカナ文字変換後にかな漢字混交の文字データ
に変換するのが難しいとき、学習反映部18に学習デー
タの有無確認を要請し、学習データがあれば、その学習
データを利用してかな漢字混交文字に変換し、学習デー
タとして記憶させる。 (実施例4)図7は請求項7〜10に係わる自然言語処
理装置および自然言語処理方法の実施例として、例えば
日英機械翻訳システムに適用した機能ブロック図であ
る。
【0075】この装置は、通常,キーボード、マウスな
どのポインティングデバィス、或いはOCRその他の入
力装置などが用いられ、文章などのデータやコマンド列
データを入力する入力部31と、通常,CRT、ビット
マップディスプレイ等が用いられ、入力部31から入力
されるデータや種々の処理結果のデータを表示する表示
部32と、本装置全体を制御する制御部33と、入力部
31から入力されるデータや種々の処理結果のデータを
記憶する磁気記憶媒体,光学記憶媒体等の記録部34と
が設けられ、さらに第1および第2の自然言語処理部3
5,36、差分取得部37および辞書編集部38が設け
られている。
【0076】前記第1の自然言語処理部35は、入力部
等31〜34を含み、さらに入力部31から入力される
データや記録部34に記憶されているデータを翻訳する
翻訳部39と、この翻訳部39より参照され、翻訳に用
いられる知識が記憶されている翻訳用辞書40とによっ
て構成されている。この翻訳用辞書40は、通常,電子
的・磁気的或いは光学的な記録媒体が用いられ、例えば
日英翻訳の場合には「原語(日本語)、原語の品詞や用
法、訳語(英語)、訳語の品詞や用法」が記憶される。
【0077】前記第2の自然言語処理部36は、第1の
自然言語処理部35と同様に入力部等31〜34を含
み、さらに翻訳する原文等を入力する機能を有し、入力
部31や記録部34より転送されてくる日本語読みデー
タを漢字混交文に変換するかな漢字変換部41と、この
かな漢字変換部41より参照され、かな漢字変換に用い
る知識が記憶されているかな漢字変換用辞書42とによ
って構成されている。このかな漢字変換用辞書42は、
通常,電子的・磁気的或いは光学的な記録媒体が用いら
れ、一般的には「読み文字列,漢字,漢字の品詞や用
法」が記憶されている。
【0078】前記差分抽出部37は、本発明装置の中核
をなす構成部分であって、次の理由から設けられたもの
である。すなわち、日英機械翻訳システムにおいては、
翻訳用辞書40の原語とかな漢字変換の漢字との間に差
があると、かな漢字変換によって入力された分が適切に
翻訳できないという問題がある。
【0079】そこで、この差分抽出部37は、2つの自
然言語処理部35,36の一部を構成する翻訳用辞書4
0とかな漢字変換用辞書42との差分,つまり共通情報
である翻訳用辞書40の原語とかな漢字変換用辞書42
の漢字とを比較して差分をとり、これら原語,漢字およ
び差分データ等を表示部32に表示してオペレータに提
示したり、或いは記録部34に登録し、適宜な時期にオ
ペレータの指示に従って表示部32に表示し、後記する
辞書編集部38にて編集可能にしたり、印字出力したり
する。
【0080】前記辞書編集部38は、翻訳用辞書40お
よびかな漢字変換用辞書42の編集を行ったり、差分抽
出部37の出力である原語,漢字および差分データ等ま
たは前記記録部34に登録された原語,漢字および差分
データ等に基づいて、当該差分をなくするように各辞書
40,42の内容を編集する機能をもっている。つま
り、辞書編集部38は、差分取得部37によって得られ
る2つの辞書40,42の差分データに基づき、かな漢
字変換で出力される語彙は翻訳できるように編集し登録
する。
【0081】また、翻訳用辞書40の原語に含まれない
語句の場合にはかな漢字変換では出力しないとか、優先
度を下げるとか、出力時に警告を発する等の抑制処理を
行うものである。
【0082】図8は差分抽出部37の動作の一例を示す
フローチャートである。この差分抽出部37において
は、第1の知識辞書である翻訳用辞書40の内容を読み
込んで、これら辞書内容をAとする(ST31)。次
に、第2の知識辞書であるかな漢字変換用辞書42の内
容を読み込んで、これら辞書内容をBとする(ST3
2)。このとき、辞書内容Bは、前述したように「読み
文字列,漢字,漢字の品詞や用法」という情報の集合で
あるので、これらB中のi番目のデータの漢字部分を抽
出し、これをCとする(ST33,ST34)。
【0083】一方、辞書内容Aは、前述したように「原
語,原語の品詞や用法,訳語,訳語の用法」であって、
そのうち原語部分が日本語の単語(共通情報)であると
いう点でCとは共通点をもっている。そこで、ステップ
ST35では、CがAの原語部分に含まれているか否か
を判断し、含まれていない場合にはCとその用法を差分
リスト(図示せず)に登録する。そして、この登録後お
よびCがAの原語部分に含まれている場合、それぞれB
の次の(i+1)番目のデータに進み、Bの最後のデー
タまで繰り返す(ST37,ST38)。最終データに
至ったら、これを差分リストとして記録部34に記憶し
(ST39)、表示部32に表示してユーザに提示した
り、或いは辞書編集部38の編集の用に供する。
【0084】次に、図9および図10は、翻訳用辞書4
0,かな漢字変換用辞書42の具体的差分例およびその
差分に対する修正編集状態を説明する図である。今、オ
ペレータが原文として日本語文を入力するに当たり、
「美的な」という語がかな漢字変換できないことに気付
き(図9(a))、かな漢字変換用辞書42に新語登録
を行うときの画面例を示している(図9(b))。つま
り、図9(a)はかな漢字変換用辞書42に「美的な」
という新語が未だ登録されていないので、当該「美的
な」に関する読み文字列、漢字、品詞等を入力して漢字
変換用辞書42に登録すれば、画面には同図(b)に示
すように表示される。
【0085】この際、オペレータは原文入力専門であ
り、英語の知識を全く有しなくてもよい。別途翻訳辞書
管理者が差分リストを作成し、入力できないか、翻訳で
きない語かを調べる。
【0086】ここでは、図10(a)に示すように、
「美的だ」が、翻訳用辞書40に登録されていないが、
かな漢字変換用辞書42にはすでに「美的だ」は形容動
詞として登録されているので、システムでは言語に対す
る品詞情報を提示している。これに対し、同図(b)に
示すような情報を翻訳用辞書40に追加登録する。
【0087】以上の場合は、日英機械翻訳システムの例
であるが、他のシステムにも同様に適用できる。英日機
械翻訳システムでは、翻訳用辞書40には、「原語(英
語),原語の用法,訳語(日本語),訳語の用法」とい
ったデータが登録され、かな漢字変換用辞書42には
「読み,漢字,漢字の用法」が記憶されている。ここで
は、「訳語」と「漢字」が共通情報となっており、これ
に差があると、訳文を編集する際、訳出された語を新た
めて入力しなおす際に変換できない。従って、以上のよ
うなして差分を取り出し、別途登録するとよい。
【0088】また、「girl」の訳語に「乙女」,
「少女」,「娘」が登録されているが、かな漢字変換用
辞書42には「乙女」が登録されていなかった場合、
“girl”の翻訳結果として訳出する際に「乙女」の
優先度を下げ、他の語が第一訳語として出力されたり、
「乙女」を訳出候補から削除したりすることにより、上
記の問題を解決したり、オペレータが訳語として「乙
女」を選択した際には警告を発することもできる。
【0089】従って、以上のような実施例の構成の装置
および方法によれば、自然言語処理ごと、または適宜な
時期に複数の自然言語処理部の知識辞書の差を抽出し、
その差分を編集処理によって統一化するようにしたの
で、自然言語処理の迅速化およびオペレータの労力を軽
減化できる。また、一方の自然言語処理部による自然言
語処理結果のデータが他方の自然言語処理部で用いる知
識辞書の中に含まれていない場合、一方の自然言語処理
部による自然言語処理結果のデータの出力を抑制するの
で、誤った自然言語処理結果のデータを得ることが低減
化できる。
【0090】その他、本発明は、種々の自然言語処理を
行う少なくとも2つの自然言語処理部を有する種々の自
然言語処理装置および種々の自然言語処理方法に適用で
きることは言うまでもない。
【0091】
【発明の効果】以上説明したように本発明によれば、次
のような種々の効果を奏する。請求項1ないし請求項5
の発明においては、一方の自然言語処理によって得られ
る学習内容を別の自然言語処理に適切、かつ、有効に反
映させることができる。
【0092】次に、請求項6の発明は、2つの自然言語
処理部の自然言語処理によって得られる学習データに共
通情報を登録し、この共通情報をてがかりに相互に各自
然言語処理部の学習データを有効に利用することができ
る。
【0093】さらに、請求項7,8,10の発明は、各
自然言語処理時に用いる知識辞書の差分を提示し、各知
識辞書の差を縮小するような支援処理を行うので、自然
言語処理の迅速化およびオペレータの労力を軽減化でき
る。
【0094】さらに、請求項9の発明は、各自然言語処
理時に用いる知識辞書の間に差があるとき、ある自然言
語処理結果の出力を抑制するので、誤った自然言語処理
を低減化できる。
【図面の簡単な説明】
【図1】本発明に係わる自然言語処理装置の一実施例を
示すブロック構成図。
【図2】図1に示す学習反映部の機能構成を示す図。
【図3】他の自然言語処理部に必要な学習データが存在
するか否かを判断する動作手順を説明する図。
【図4】機械翻訳システムの画面表示例を示す図。
【図5】2つの自然言語処理部に学習データが存在する
場合の選択手順を説明する図。
【図6】自然言語処理装置の他の実施例を示すブロック
構成図。
【図7】自然言語処理装置のさらに他の実施例を示すブ
ロック構成図。
【図8】両自然言語処理装置の知識辞書の差分を抽出す
る一連の動作を説明する図。
【図9】両自然言語処理装置の知識辞書の差分リストの
用法を説明する図。
【図10】同じく両自然言語処理装置の知識辞書の差分
リストの用法を説明する図。
【符号の説明】
1,11,31…入力部、2,13,32…表示部、
4,15,34…記録部、5,39…翻訳部、6…翻訳
用学習データ記録部、7,41…かな漢字変換部、8…
かな漢字用学習データ記録部、9…学習反映部、12…
音声入力部、16,35…第1の自然言語処理部、1
7,36…第2の自然言語処理部,42…かな漢字変換
用辞書、37…差分抽出部、38…辞書編集部。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 8420−5L 15/38 T

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 それぞれ自然言語処理によって得られる
    学習データを記憶する少なくとも2つの自然言語処理部
    と、ある1つの自然言語処理部の自然言語処理時に他の
    自然言語処理部に記憶される学習データが前記ある1つ
    の自然言語処理部の自然言語処理に不十分な場合でも、
    利用可能な学習データのみを取り出し、前記ある1つの
    自然言語処理部の自然言語処理に対して学習を可能とす
    る学習反映部とを有することを特徴とする自然言語処理
    装置。
  2. 【請求項2】 それぞれ自然言語処理によって得られる
    学習データに所定の共通情報を挿入して記憶する少なく
    とも2つの自然言語処理部と、ある1つの自然言語処理
    部による自然言語処理の語句候補と他の自然言語処理部
    の学習データの中の共通情報とを比較しながら学習状態
    を判断し、その判断結果を前記ある1つの自然言語処理
    部に伝達する学習反映部とを有することを特徴とする自
    然言語処理装置。
  3. 【請求項3】 学習反映部は、ある1つの自然言語処理
    部における自然言語処理に用いる学習データが存在しな
    いとき、他の自然言語処理部の学習データを反映させる
    ことを特徴とする請求項1または請求項2に記載の自然
    言語処理装置。
  4. 【請求項4】 それぞれ自然言語処理によって得られる
    学習データを記憶する少なくとも2つの自然言語処理部
    と、各自然言語処理部の自然言語処理に用いる学習デー
    タの有無の確認要請に基づいて他の自然言語処理部に学
    習データの存在有無を確認する学習反映部と、確認要請
    元の前記自然言語処理部において当該確認要請元自然言
    語処理部に学習データが存在し、かつ、前記学習反映部
    の確認結果から前記他の自然言語処理部にも学習データ
    が存在するとき、学習時期の新しい学習データを学習に
    反映させる手段とを備えたことを特徴とする自然言語処
    理装置。
  5. 【請求項5】 それぞれ自然言語処理によって得られる
    学習データを記憶する少なくとも2つの自然言語処理部
    と、各自然言語処理部の自然言語処理に用いる学習デー
    タの有無の確認要請に基づいて他の自然言語処理部に学
    習データの存在有無を確認する学習反映部と、確認要請
    元の前記自然言語処理部において当該確認要請元自然言
    語処理部に学習データが存在し、かつ、前記学習反映部
    の確認結果から前記他の自然言語処理部にも学習データ
    が存在するとき、両者の学習データを組み合わせて学習
    に反映させる手段とを備えたことを特徴とする自然言語
    処理装置。
  6. 【請求項6】 予め各自然言語処理部の自然言語処理に
    よって得られる学習データに共通情報を含ませて記憶
    し、一方の自然言語処理部の自然言語処理時に前記共通
    情報を介して他の自然言語処理部に利用可能な学習デー
    タが存在するか否かを判断し、利用可能な学習データが
    存在すれば前記一方の自然言語処理部の自然言語処理に
    利用することを特徴とする自然言語処理方法。
  7. 【請求項7】 それぞれ知識辞書を用いて自然言語処理
    を行う少なくとも2つの自然言語処理部と、各々の自然
    言語処理部において用いられる知識辞書の辞書内容の差
    を抽出して提示または登録する差分抽出手段とを備えた
    ことを特徴とする自然言語処理装置。
  8. 【請求項8】 それぞれ知識辞書を用いて自然言語処理
    を行う少なくとも2つの自然言語処理部と、各々の自然
    言語処理部において用いられる知識辞書の辞書内容の差
    を抽出して提示または登録する差分抽出手段と、この差
    分抽出手段によって得られた辞書内容の差を編集し統一
    化する辞書編集手段とを備えたことを特徴とする自然言
    語処理装置。
  9. 【請求項9】 それぞれ知識辞書を用いて自然言語処理
    を行う少なくとも2つの自然言語処理部と、一方の自然
    言語処理部で得られる処理結果データが他の自然言語処
    理部において用いられる知識辞書に含まれない場合、前
    記一方の自然言語処理部で得られる処理結果データの出
    力を抑制する手段とを備えたことを特徴とする自然言語
    処理装置。
  10. 【請求項10】 それぞれ知識辞書を有する各自然言語
    処理部の自然言語処理の度に、または任意の時期に前記
    複数の自然言語処理部の知識辞書の差を抽出して登録し
    た後、前記自然言語処理の度に、または所要とする時期
    に知識辞書の差を統一化するための編集処理を行うこと
    を特徴とする自然言語処理方法。
JP7020220A 1995-02-08 1995-02-08 自然言語処理装置および自然言語処理方法 Pending JPH08212216A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7020220A JPH08212216A (ja) 1995-02-08 1995-02-08 自然言語処理装置および自然言語処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7020220A JPH08212216A (ja) 1995-02-08 1995-02-08 自然言語処理装置および自然言語処理方法

Publications (1)

Publication Number Publication Date
JPH08212216A true JPH08212216A (ja) 1996-08-20

Family

ID=12021092

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7020220A Pending JPH08212216A (ja) 1995-02-08 1995-02-08 自然言語処理装置および自然言語処理方法

Country Status (1)

Country Link
JP (1) JPH08212216A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232863A (ja) * 1996-12-19 1998-09-02 Omron Corp かな漢字変換装置および方法、並びに記録媒体
US6345245B1 (en) 1997-03-06 2002-02-05 Kabushiki Kaisha Toshiba Method and system for managing a common dictionary and updating dictionary data selectively according to a type of local processing system
JP2011524991A (ja) * 2008-04-15 2011-09-08 モバイル テクノロジーズ,エルエルシー 現場にて音声−音声翻訳をメンテナンスするシステム及び方法
US8972268B2 (en) 2008-04-15 2015-03-03 Facebook, Inc. Enhanced speech-to-speech translation system and methods for adding a new word
US9070363B2 (en) 2007-10-26 2015-06-30 Facebook, Inc. Speech translation with back-channeling cues
US9128926B2 (en) 2006-10-26 2015-09-08 Facebook, Inc. Simultaneous translation of open domain lectures and speeches
US11972227B2 (en) 2021-12-07 2024-04-30 Meta Platforms, Inc. Lexicon development via shared translation database

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232863A (ja) * 1996-12-19 1998-09-02 Omron Corp かな漢字変換装置および方法、並びに記録媒体
US6345245B1 (en) 1997-03-06 2002-02-05 Kabushiki Kaisha Toshiba Method and system for managing a common dictionary and updating dictionary data selectively according to a type of local processing system
US9128926B2 (en) 2006-10-26 2015-09-08 Facebook, Inc. Simultaneous translation of open domain lectures and speeches
US9830318B2 (en) 2006-10-26 2017-11-28 Facebook, Inc. Simultaneous translation of open domain lectures and speeches
US9070363B2 (en) 2007-10-26 2015-06-30 Facebook, Inc. Speech translation with back-channeling cues
JP2011524991A (ja) * 2008-04-15 2011-09-08 モバイル テクノロジーズ,エルエルシー 現場にて音声−音声翻訳をメンテナンスするシステム及び方法
KR101445904B1 (ko) * 2008-04-15 2014-09-29 페이스북, 인크. 현장 음성 번역 유지 시스템 및 방법
US8972268B2 (en) 2008-04-15 2015-03-03 Facebook, Inc. Enhanced speech-to-speech translation system and methods for adding a new word
US11972227B2 (en) 2021-12-07 2024-04-30 Meta Platforms, Inc. Lexicon development via shared translation database

Similar Documents

Publication Publication Date Title
EP0244871B1 (en) Machine translation system
EP0370774B1 (en) Machine translation system
US4831529A (en) Machine translation system
EP0310049B1 (en) Document generator and correction support device
JPH05120324A (ja) 言語処理方式
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JP2848729B2 (ja) 翻訳方法および翻訳装置
JPH0442704B2 (ja)
JP4350566B2 (ja) 機械翻訳システム
JPH0883280A (ja) 文書処理装置
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JPS62203274A (ja) 機械翻訳システム
JP2000029882A (ja) 要約文作成装置
JP3826071B2 (ja) 文章作成支援装置及び方法並びにプログラム
JP3253311B2 (ja) 言語処理装置および言語処理方法
JP2856736B2 (ja) 辞書参照装置及び辞書参照方法
JPH08241315A (ja) 文書処理装置の単語登録機構
JPS62203265A (ja) 機械翻訳システム
JP2001005814A (ja) 辞書作成装置、辞書作成方法、辞書作成プログラムを記録したコンピュータで読取可能な記録媒体および翻訳装置
JP2000242643A (ja) 英文作成支援装置及び方法並びに記憶媒体
JPH0816910B2 (ja) 言語解析装置
JPS62200462A (ja) 機械翻訳システム
JPH10105552A (ja) 機械翻訳システム
JPH11316758A (ja) 形態素解析装置、形態素解析装置を備えた機械翻訳装置、形態素解析処理プログラムを記録したコンピュータ読み取り可能な記録媒体、及び形態素解析処理プログラムを備えた機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005018350A (ja) 翻訳処理システム、翻訳処理方法及びプログラム