JP2796140B2 - 自然言語処理用データ編集支援装置 - Google Patents

自然言語処理用データ編集支援装置

Info

Publication number
JP2796140B2
JP2796140B2 JP1267649A JP26764989A JP2796140B2 JP 2796140 B2 JP2796140 B2 JP 2796140B2 JP 1267649 A JP1267649 A JP 1267649A JP 26764989 A JP26764989 A JP 26764989A JP 2796140 B2 JP2796140 B2 JP 2796140B2
Authority
JP
Japan
Prior art keywords
language processing
result
unit
processing result
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1267649A
Other languages
English (en)
Other versions
JPH03127257A (ja
Inventor
尚美 杉本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1267649A priority Critical patent/JP2796140B2/ja
Publication of JPH03127257A publication Critical patent/JPH03127257A/ja
Application granted granted Critical
Publication of JP2796140B2 publication Critical patent/JP2796140B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 〔概 要〕 自然言語処理を行う際に必要な自然言語処理用データ
の編集を支援するようにした自然言語処理用データ編集
支援装置に関し、 言語処理用データ編集の際の処理結果の比較に要する
手間の低減を目的とし、 言語処理に必要な言語処理用データを格納する処理用
データ格納手段と、自然言語で表現された文章が入力さ
れ、処理用データに基づいて言語処理を施す言語処理手
段と、言語手段処理の処理結果を入力文章に対応させて
格納する言語処理結果格納手段と、言語処理結果から入
力された処理結果を出力すると共に、この処理結果の処
理対象である入力文章に対応した過去の処理結果が言語
処理結果格納部に格納されているときにこの過去の処理
結果を読み出して出力する言語処理結果認定手段と、言
語処理結果認定手段からの同一の分章に対する複数の出
力を対比する比較手段と、比較手段の対比結果を出力す
る出力手段と、処理用データ格納手段に格納された処理
用データを編集する編集手段とを備えるように構成す
る。
〔産業上の利用分野〕
本発明は、自然言語処理を行う際に必要な自然言語処
理用データの編集を支援するようにした自然言語処理用
データ編集支援装置に関するものである。
近年のコンピュータの普及に伴い、自然言語によるコ
ンピュータとの対話の要求が増えつつある。このような
自然言語処理システムの開発には自然言語処理用データ
の開発が不可欠であり、この自然言語処理用データ開発
を支援するシステムが要求されている。自然言語処理用
データの開発は、例文により検証していくことが必要で
あるが、自然言語の複雑なしくみのために、言語処理用
データを編集した場合に、言語処理結果にどのような影
響ざ及ぼされるかは予想できにくい。従って、言語処理
用データの編集による言語処理結果の相違が容易に認識
できる自然言語処理用データ編集支援装置が望まれてい
る。
〔従来の技術〕
第8図に、自然言語処理用データ開発を支援する従来
の自然言語処理用データ編集支援装置の構成を示す。
811は文章入力部を、821は言語処理部を、831は言語
処理用データ格納部を、841は言語処理結果記憶部を、8
51は結果表示部を、861は言語処理用データ編集部をそ
れぞれ示している。
処理対象となる文章を文章入力部811によって入力す
ると、言語処理部821は言語処理用データ格納部831に格
納された言語処理用データに基づいて入力文章に対する
言語処理を行う。この結果は入力文章と共に言語処理結
果記憶部841に一旦格納された後、結果表示部851に表示
される。また、表示された処理結果に応じて言語処理用
データに追加,訂正を加える場合には、言語処理用デー
タ編集部861によって言語処理用データ格納部831の格納
データを編集する。
〔発明が解決しようとする課題〕
ところで、言語処理用データの編集は、編集前の言語
処理用データの基づいて行った言語処置結果がどのよう
な影響を受けるのかを確認しながら行う必要がある。と
ころが、上述した従来方式にあっては、入力とそれに対
する言語処理結果を出力するのみであったため、言語処
理用データの編集の際に編集前の言語処理結果を書き留
める、あるいはプリンタに出力するなどして編集前後の
言語処理結果を比較する必要があり、手間がかかるとい
う問題点があった。
本発明は、このような点にかんがみて創作されたもの
であり、言語処理用データ編集の際の処理結果の比較に
要する手間を低減するようにした自然言語処理用データ
編集支援装置を提供することを目的としている。
〔課題を解決するための手段〕
第1図は、本発明の自然言語処理用データ編集支援装
置の原理ブロック図である。
図において、処理用データ格納手段111は、言語処理
に必要な言語処理用データを格納する。
言語処理手段121は、自然言語で表現された文章が入
力され、処理用データに基づいて言語処理を施す。
言語処理結果格納手段131は、言語処理手段121の処理
結果を入力文章に対応させて格納する。
言語処理結果認定手段141は、言語処理結果121から入
力された処理結果を出力すると共に、この処理結果の処
理対象である入力文章に対応した過去の処理結果が言語
処理結果格納部131に格納されているときにこの過去の
処理結果を読み出して出力する。
比較手段151は、言語処理結果認定手段141からの同一
の文章に対する複数の出力を対比する。
出力手段161は、比較手段151の対比結果を出力する。
編集手段171は、処理用データ格納手段111に格納され
た処理用データを編集する。
従って、全体として、編集前後の言語処理用データに
基づいて言語処理を行ったときに、各言語処理用データ
に基づいた言語処理結果を対比して表示するように構成
されている。
〔作 用〕
言語処理手段121は言語処理用データに基づいて入力
文章に対する言語処理を行い、言語処理結果認定手段14
1は、この言語処理結果と共に、同一の入力文章に対す
る過去の言語処理結果を言語処理結果格納手段131から
読み出して出力する。言語処理結果認定手段141から入
力文章に対する現在及び過去の言語処理結果が出力され
ると、比較手段151はこれらの対比を行い、対比結果が
出力手段161から出力される。
本発明にあっては、入力された文章に対する言語処理
結果と、格納しておいたこの同一の文章に対する過去の
言語処理結果とを対比した結果を出力することにより、
編集手段171で言語処理用データを編集した後に再度言
語処理を行う場合に編集前後の言語処理用データに基づ
いた言語処理結果を容易に比較することが可能になり、
言語処理用データ編集の際の処理結果の比較に要する手
間が低減される。
〔実施例〕
以下、図面に基づいて本発明の実施例について詳細に
説明する。
第2図は、本発明の一実施例における自然言語処理用
データ編集支援装置の構成を示す。
ここで、本発明の実施例と第1図との対応関係を示し
ておく。
処理用データ格納手段111は、言語処理用データ格納
部211に相当する。
言語処理手段121は、言語処理部221,言語処理結果記
憶部223に相当する。
言語処理結果格納手段131は、過去の言語処理結果格
納部231に相当する。
言語処理結果認定手段141は、言語処理結果蓄積認定
部241,過去の言語処理結果読出し部243に相当する。
比較手段151は、言語処理結果比較部251に相当する。
出力手段161は、結果表示部261に相当する。
編集手段171は、言語処理用データ編集部271に相当す
る。
以上のような対応関係があるものとして、以下本発明
の実施例について説明する。
第2図において、211は言語処理用データ格納部を、2
19は文章入力部を、221は言語処理部を、223は言語処理
結果記憶部を、231は過去の言語処理結果格納部を、241
は言語処理結果蓄積認定部を、243は過去の言語処理結
果読出し部を、251は言語処理結果比較部を、261は結果
表示部を、271は言語処理用データ編集部をそれぞれ示
している。
文章入力部219は文章を取り込むためのものである。
入力文章の形式としては手書きあるいはコード化された
漢字仮名混じりの文章や、音声による文章などが考えら
れ、言語処理システムごとに最適な形式が選択される。
文章入力部219で取り込まれた文章はコード化されて言
語処理部221に送られる。
言語処理部221は、言語処理用データ格納部211に格納
された言語処理用データに基づいて言語処理を行う。言
語処理の一例としては、例えば入力文章の意味を理解し
て英訳する和文英訳処理や、入力文章を解釈して構成単
語ごとに分解する形態素解析処理等がある。また、言語
処理用データは認識用辞書や文法規則等で構成されてい
る。
言語処理用データ編集部271は、言語処理用データ格
納部211に格納されている言語処理用データに対して訂
正,削除,追加等の編集を行うものである。例えば言語
処理部221による言語処理結果の誤りに気付いたときに
言語処理用データ編集部271によって言語処理用データ
の編集を行うようにすることで、逐次言語処理用データ
を汎用性のある完全なものに近づけることが可能にな
る。
言語処理結果記憶部223は、言語処理部221による処理
結果を一旦保持するためのものであり、その後この保持
された処理結果は言語処理結果比較部251に送られる。
言語処理結果蓄積認定部241は、同一の文章が過去に
言語処理されているか否かを判定するものである。言語
処理部221からは言語処理結果と共に入力文章を符号化
した圧縮情報が入力され、この圧縮情報に基づいて上述
した判定処理が行われる。
過去の言語処理結果格納部231は、言語処理部221によ
る言語処理結果を履歴として格納しておくものであり、
言語処理部221から言語処理結果蓄積認定部241に送られ
てきた言語処理結果はその都度入力文章の圧縮情報に対
応づけられて過去の言語処理結果格納部231に格納され
る。
過去の言語処理結果読出し部243は、過去の言語処理
結果格納部231に格納されている言語処理結果を読み出
すものである。言語処理結果蓄積認定部は、同一文章に
対応した過去の言語処理結果が過去の言語処理結果格納
部231に格納されていると判断すると、過去の言語処理
結果読出し部243に読出し指示を送って該当する言語処
理結果を読み出す。読み出した言語処理結果は言語処理
結果比較部251に送られる。
言語処理結果比較部251は、言語処理結果記憶部223と
過去の言語処理結果読出し部243のそれぞれから入力さ
れた言語処理結果を比較し、各言語処理結果と共にそれ
らの差異情報を出力する。この出力は結果表示部261に
よって表示される。
第3図は、実施例の動作手順の説明図である。
文章入力部219に文章が入力されると(ステップ31
1)、言語処理部221はこの入力文章に対して言語処理を
行う(ステップ312)。
言語処理結果蓄積認定部241は、入力文章と同一の文
章を過去の言語処理結果格納部231から検索し(ステッ
プ313)、同一文章が蓄積されているか否かを判定する
(ステップ314)。蓄積されている場合は肯定判断し、
過去の言語処理結果読出し部243によって該当する言語
処理結果を読み出して、言語処理結果比較部251に送る
(ステップ315)。
言語処理結果比較部251では、入力された複数の言語
処理結果を比較して(ステップ316)、各言語処理結果
をその違いを強調する形で表示する(ステップ317)。
このように、過去の言語処理結果を格納しておいて、
過去に入力された文章と同一の文章が入力されたとき
に、現時点での言語処理用データに基づいた言語処理結
果と共に、対応する過去の言語処理結果を並行してしか
もその違いを強調する形で表示する。
従って、例えば言語処理結果の誤りに気付いて言語処
理用データを編集し、再度同一の文章に対して言語処理
を行った場合には、編集前後の言語処理結果を容易に比
較することが可能になり、この比較に要していた手間を
低減することができる。
第4図,第6図及び第7図に結果表示部261による結
果表示の一例を示す。
第4図は、和文英訳の言語処理を行った場合の結果表
示例であり、過去に同一の文章に対する言語処理が行わ
れていない場合を示している。この場合には、言語処理
結果比較部251において比較対象となる言語処理結果が
存在しないことを認識し、「処理回数 1」及び「過去
の処理結果なし」等が結果表示部261に表示される。
例えば言語処理システムの開発者がこの表示をみてそ
の誤りに気付づくと、言語処理用データ編集部271に指
示を与えて言語処理用データを編集する。第5図に言語
処理用データの編集例を示す。開発者が、第4図に示し
た言語処理結果の誤りは単語「電車」に対応した属性を
「乗物」としたことによるものであると判断し、ある一
定の物理空間を占有する意味の属性「空間」を追加した
場合を示している。
第6図は、言語処理用データを編集した後に同一の文
章に対して言語処理結果を行った場合の結果表示例であ
り、言語処理用データを編集したことにより言語処理結
果内の前置詞「by」が「in」に変更されたものである。
言語処理結果比較部251ではこの前置詞の違い認識し、
この部分を強調した形の表示が行われる。
第7図は、他の言語処理を行った場合の結果表示例を
示している。言語処理としては、単語毎に文章を区切る
形態素解析処理を行うものとし、言語処理用データを2
回編集した場合すなわち3回の言語処理結果がで同時に
表示されている。例えば、1回目の言語処理を見て単語
「山本」を言語処理用データに追加して2回目の言語処
理を行い、更にこの言語処理結果を見て単語「論理」を
言語処理用データに追加したような場合を示している。
なお、本発明の実施例にあっては、和文英訳処理及び
形態素解析処理の表示例を示したが、言語処理用データ
を例文によって逐一編集していくような場合であれば、
言語処理を問わずに適用することができる。
また、実施例では結果表示部261に結果を表示する場
合を考えたが、結果を確認することができる出力手段で
あれば例えばプリンタによって記録紙に出力するように
してもよい。
〔発明の結果〕 上述したように、本発明によれば、入力された文章に
対する言語処理結果と、格納しておいたこの同一の文章
に対する過去の言語処理結果とを対比した結果を出力す
ることにより、編集手段で言語処理用データを編集した
後に再度言語処理を行う場合に編集前後の言語処理用デ
ータに基づいた言語処理結果を容易に比較することが可
能になり、言語処理用データ編集の際の処理結果の比較
に要する手間を低減することができるので、実用的には
極めて有用である。
【図面の簡単な説明】
第1図は本発明の自然言語処理用データ編集支援装置の
原理ブロック図、 第2図は本発明の一実施例による自然言語処理用データ
編集支援装置の構成図、 第3図は一実施例の動作説明図、 第4図,第6図及び第7図は出力結果の表示説明図、 第5図は言語処理用データ編集の説明図、 第8図は従来例の構成図である。 図において、 111は処理用データ格納手段、 121は言語処理手段、 131は言語処理結果格納手段、 141は言語処理結果認定手段、 151は比較手段、 161は出力手段、 171は編集結果、 211は言語処理用データ格納部、 219は文章入力部、 221は言語処理部、 223は言語処理結果記憶部、 231は過去の言語処理結果格納部、 241は言語処理結果蓄積認定部、 243は過去の言語処理結果読出し部、 251は言語処理結果比較部、 261は結果表示部、 271は言語処理用データ編集部である。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】言語処理に必要な言語処理用データを格納
    する処理用データ格納手段(111)と、 自然言語で表現された文章が入力され、前記処理用デー
    タに基づいて言語処理を施す言語処理手段(121)と、 前記言語処理手段(121)の処理結果を入力文章に対応
    させて格納する言語処理結果格納手段(131)と、 前記言語処理結果(121)から入力された処理結果を出
    力すると共に、この処理結果の処理対象である入力文章
    に対応した過去の処理結果が前記言語処理結果格納部
    (131)に格納されているときにこの過去の処理結果を
    読み出して出力する言語処理結果認定手段(141)と、 前記言語処理結果認定手段(141)からの同一の文章に
    対する複数の出力を対比する比較手段(151)と、 前記比較手段(151)の対比結果を出力する出力手段(1
    61)と、 前記処理用データ格納手段(111)に格納された処理用
    データを編集する編集手段(171)と、 を備えるように構成したことを特徴とする自然言語処理
    用データ編集支援装置。
JP1267649A 1989-10-13 1989-10-13 自然言語処理用データ編集支援装置 Expired - Fee Related JP2796140B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1267649A JP2796140B2 (ja) 1989-10-13 1989-10-13 自然言語処理用データ編集支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1267649A JP2796140B2 (ja) 1989-10-13 1989-10-13 自然言語処理用データ編集支援装置

Publications (2)

Publication Number Publication Date
JPH03127257A JPH03127257A (ja) 1991-05-30
JP2796140B2 true JP2796140B2 (ja) 1998-09-10

Family

ID=17447614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1267649A Expired - Fee Related JP2796140B2 (ja) 1989-10-13 1989-10-13 自然言語処理用データ編集支援装置

Country Status (1)

Country Link
JP (1) JP2796140B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100174527A1 (en) * 2007-05-23 2010-07-08 Nec Corporation Dictionary registering system, dictionary registering method, and dictionary registering program

Also Published As

Publication number Publication date
JPH03127257A (ja) 1991-05-30

Similar Documents

Publication Publication Date Title
EP0440197B1 (en) Method and apparatus for inputting text
US5587902A (en) Translating system for processing text with markup signs
US6523000B1 (en) Translation supporting apparatus and method and computer-readable recording medium, wherein a translation example useful for the translation task is searched out from within a translation example database
US4685060A (en) Method of translation between languages with information of original language incorporated with translated language text
JP2796140B2 (ja) 自然言語処理用データ編集支援装置
JP3300142B2 (ja) 自然言語処理装置
JP3131432B2 (ja) 機械翻訳方法及び機械翻訳装置
CN117573870B (zh) 一种多模态数据的文本标签提取方法、装置、设备及介质
JPS60157659A (ja) 日本語解析方式
JPH06290209A (ja) 文切り装置
JPS6154569A (ja) 文書画像処理方式
JP3747957B2 (ja) 接続テーブル編集装置
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JP3305343B2 (ja) 辞書編集装置
JP2004158038A (ja) 言語処理システム及びプログラム
JPH05108703A (ja) 機械翻訳機
JPH11203400A (ja) 文字入力装置および文字入力方法,並びに文字入力方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体
JPH06243163A (ja) 文書解析装置
JPH07200546A (ja) 文書確認方法
JPH10134150A (ja) 文字認識結果の後処理方法
JPS6366665A (ja) 文書解析整形装置
JPH05324647A (ja) 文章作成装置
JPH05108715A (ja) 機械翻訳機
JPH0619880A (ja) かな漢字変換装置
JP2004178615A (ja) 言語処理システム及びプログラム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees