JP2002140338A - Device and method for supporting construction of dictionary - Google Patents

Device and method for supporting construction of dictionary

Info

Publication number
JP2002140338A
JP2002140338A JP2000332069A JP2000332069A JP2002140338A JP 2002140338 A JP2002140338 A JP 2002140338A JP 2000332069 A JP2000332069 A JP 2000332069A JP 2000332069 A JP2000332069 A JP 2000332069A JP 2002140338 A JP2002140338 A JP 2002140338A
Authority
JP
Japan
Prior art keywords
dictionary
expressions
expression
concept
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000332069A
Other languages
Japanese (ja)
Inventor
Yumi Ichimura
由美 市村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2000332069A priority Critical patent/JP2002140338A/en
Publication of JP2002140338A publication Critical patent/JP2002140338A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a support environment wherein a user generates and verifies a dictionary for information extraction. SOLUTION: The contents of the dictionary 109 for information extraction wherein multiple expressions and concepts as expressions of higher order common to those expressions are made to correspond to each other and expressions extracted from document data are displayed at the same time. When the user specifies an expression and a concept among the display contents, the specified expression is additionally registered in the dictionary 109 for information extraction while being made to correspond to the specified concept.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文書データを自動
的に分類する文書分類システムにおいて利用される電子
辞書をユーザによって構築可能とするための辞書構築支
援装置および、方法に関する。
[0001] 1. Field of the Invention [0002] The present invention relates to a dictionary construction support apparatus and method for enabling a user to construct an electronic dictionary used in a document classification system for automatically classifying document data.

【0002】[0002]

【従来の技術】さまざまな場所で日々多様な電子データ
が利用されているが、それらデータの8割以上が文書デ
ータであると言われている。文書データは、用途に応じ
て、種々の電子辞書が利用される。例えば、日本語の文
書データの作成時においては、かな漢字変換辞書が用い
られ、また、日本語の文書データの形態素解析を行う場
合には形態素解析辞書が、文書データの構文解析を行う
際には構文解析辞書が用いられる。このような電子辞書
においては、基本的には明確に定義された不変的な規則
が存在しているため、予め製品メーカ側で作成されて供
給されるものであり、ユーザはこのような電子辞書の内
容を特に意識することなく利用している。
2. Description of the Related Art Various types of electronic data are used every day in various places, and it is said that 80% or more of the data is document data. Various electronic dictionaries are used for the document data depending on the application. For example, a kana-kanji conversion dictionary is used when creating Japanese document data, a morphological analysis dictionary is used when performing morphological analysis on Japanese document data, and a morphological analysis dictionary is used when performing syntax analysis on document data. A parsing dictionary is used. In such electronic dictionaries, there are basically invariable rules that are clearly defined. Therefore, the electronic dictionaries are created and supplied in advance by the product maker, and the user needs such electronic dictionaries. Is used without any particular awareness.

【0003】ところで、多種多様な文書データのうち、
特に自由な形式で記述された文書データからユーザにと
って必要な情報を抽出する技術として、テキストマイニ
ング技術が近年注目されてきている。
By the way, among various kinds of document data,
In particular, a text mining technique has recently attracted attention as a technique for extracting information necessary for a user from document data described in a free format.

【0004】当社は、特願平11−332114号「業
務支援システム」において、テキストマイニング技術の
一方法を提案している。これには、抽出したい概念と該
概念を表す一つ以上の様々な表現とを対応づけて保持さ
れる情報抽出用辞書を利用して、対象となる文書データ
中に含まれる重要な情報を抽出する文書データの解析方
法が提案されている。なお、ここで言う表現とは、例え
ば、単語や、句や、共起関係にある単語の組、等のこと
を言い、また、ここで言う概念とは、このような表現そ
れぞれに共通した上位の意味に相当する。例えば、「オ
ーナー」、「トレーナー」、「バイヤー」等が個々の
「表現」であり、「人」は、これら「オーナー」、「ト
レーナー」、「バイヤー」等の上位の意味を持つ「概
念」である。
Our company has proposed a method of text mining technology in Japanese Patent Application No. 11-332114, “Business Support System”. This involves extracting important information contained in the target document data by using an information extraction dictionary that holds the concept to be extracted and one or more various expressions representing the concept in association with each other. A method of analyzing document data has been proposed. The expression referred to here refers to, for example, a word, a phrase, a set of words having a co-occurrence relationship, and the like, and the concept referred to herein refers to a higher level common to each of such expressions. Corresponds to the meaning of For example, “owner”, “trainer”, “buyer”, etc. are individual “expressions”, and “person” is a “concept” having a higher meaning of these “owner”, “trainer”, “buyer”, etc. It is.

【0005】このような情報抽出用辞書における概念と
表現との対応付けは、明確に定義された不変的な規則が
存在しているものではなく、分析対象とする文書データ
の分野や分析の視点に依存するものである。
[0005] The correspondence between concepts and expressions in such an information extraction dictionary does not have a clearly defined invariant rule. It depends on.

【0006】これら情報抽出用辞書においても、先に示
した電子辞書と同様、製品メーカ側が、テキストマイニ
ング技術を導入するユーザの利用形態を調査し、それに
併せて情報抽出用辞書を作成して提供し、また、利用後
の結果を検証してその情報抽出用辞書に登録、削除、修
正などのメンテナンスを行っているのが現状であった。
[0006] In these information extraction dictionaries, similarly to the electronic dictionary described above, the product maker investigates the usage of the user who introduces the text mining technology, and creates and provides the information extraction dictionaries accordingly. In addition, at present, the results after use are verified, and maintenance such as registration, deletion, and correction in the information extraction dictionary is performed.

【0007】[0007]

【発明が解決しようとする課題】上記従来の技術で説明
してきたように、テキストマイニング技術に用いられる
従来の情報抽出用辞書は、その良し悪しにより、抽出精
度に大きな影響を与えるにもかかわらず、利用者ではな
いメーカ側によって予め用意されているものであり、ユ
ーザがその辞書を作成したり、作成した辞書を検証しな
がら編集する手段は提供されていなかった。なお、エデ
ィタなどを用いて、情報抽出用辞書を編集することは可
能であったが、辞書の構造などを十分に把握し、プログ
ラムレベルで編集する必要があり、通常のユーザにとっ
て容易に編集できるものではなかった。
As described in the above prior art, the conventional information extraction dictionary used in the text mining technique has a great influence on the extraction accuracy due to its quality. This is prepared in advance by a manufacturer other than the user, and no means has been provided for the user to create the dictionary or to edit the dictionary while verifying the created dictionary. Although it was possible to edit the dictionary for information extraction using an editor or the like, it was necessary to fully understand the structure of the dictionary and to edit at the program level, and it could be easily edited by ordinary users. It was not something.

【0008】また、これら情報抽出用辞書のメンテナン
スにおいても、製品メーカ側が、利用後のユーザの不具
合等を調査して、解決されると思われる箇所を経験など
から判断し、情報抽出用辞書への追加、削除、修正など
を行ってテキストマイニングの精度を向上するしかなか
った。
In maintenance of these information extraction dictionaries, the product maker investigates user's troubles after use, judges from the experience, etc., what is considered to be solved, and transfers them to the information extraction dictionaries. The only way to improve the accuracy of text mining was to add, delete, and modify text.

【0009】本発明は、このような点に鑑みなされたも
のであり、ユーザが情報抽出用の辞書を作成・検証する
ための支援環境を提供することを目的とする。
The present invention has been made in view of the above points, and has as its object to provide a support environment for a user to create and verify a dictionary for information extraction.

【0010】[0010]

【課題を解決するための手段】そこで、本発明の辞書構
築支援装置は、複数の表現とそれら表現に共通する上位
の表現である概念とを対応付けて格納される電子辞書を
記憶する辞書記憶手段と、文書データから抽出された表
現を記憶する表現記憶手段と、前記辞書記憶手段にて記
憶される該電子辞書から少なくとも一部の概念と、前記
表現記憶手段にて記憶される少なくとも一部の該抽出さ
れた表現とを同時に表示する表示手段と、前記表示手段
によって表示された表現から一つ以上の表現の指定と、
前記表示手段によって表示された概念から一つの概念の
指定とを受けると、指定された表現を指定された概念に
対応付けて前記電子辞書に追加登録する登録手段とを備
えた。
SUMMARY OF THE INVENTION Accordingly, a dictionary construction supporting apparatus according to the present invention is a dictionary storage for storing an electronic dictionary in which a plurality of expressions are stored in association with a concept which is a higher-level expression common to the expressions. Means, an expression storage means for storing an expression extracted from document data, at least some concepts from the electronic dictionary stored in the dictionary storage means, and at least a part stored in the expression storage means Display means for simultaneously displaying the extracted expressions of, and designation of one or more expressions from the expressions displayed by the display means,
A registration unit that, when receiving a designation of one concept from the concepts displayed by the display unit, additionally registers the designated expression in the electronic dictionary in association with the designated concept.

【0011】これにより、文書データから抽出された表
現を、簡単な操作で電子辞書内の所望の概念へ登録する
ことができるようになった。
Thus, the expression extracted from the document data can be registered to a desired concept in the electronic dictionary by a simple operation.

【0012】また、本発明の辞書構築支援装置は、複数
の表現とそれら表現に共通する上位の表現である概念と
を対応付けて格納される電子辞書を記憶する辞書記憶手
段と、文書データから前記電子辞書を用いて表現を抽出
し、この抽出結果を記憶する表現記憶手段と、前記辞書
記憶手段にて記憶される該電子辞書から少なくとも一部
の概念と、前記表現記憶手段にて記憶される少なくとも
一部の該抽出結果とを同時に表示する表示手段とを備
え、前記表示手段によって表示された概念のうち一つの
概念の指定を受けると、その概念に対応する各表現を前
記表示された表現結果上で明示するようにした。
Further, the dictionary construction support apparatus of the present invention comprises: a dictionary storage means for storing an electronic dictionary in which a plurality of expressions and a concept which is a higher-level expression common to these expressions are stored in association with each other; An expression is extracted using the electronic dictionary, an expression storage unit that stores the extraction result, at least some concepts from the electronic dictionary stored in the dictionary storage unit, and an expression stored in the expression storage unit. Display means for simultaneously displaying at least a part of the extracted result, and when one of the concepts displayed by the display means is designated, each expression corresponding to the concept is displayed. Made explicit on the expression result.

【0013】これにより、階層化された電子辞書内の概
念を、簡単な操作で指定でき、指定された概念に含まれ
る表現を電子辞書で抽出された抽出結果の中から容易に
抽出して明示するようにしたから、ユーザは、電子辞書
の良し悪しを容易に検証することができるようになっ
た。
[0013] Thereby, the concept in the hierarchical electronic dictionary can be designated by a simple operation, and the expression included in the designated concept can be easily extracted and specified from the extraction result extracted by the electronic dictionary. Thus, the user can easily verify the quality of the electronic dictionary.

【0014】また、本発明の辞書構築支援装置は、複数
の表現とそれら表現に共通する上位の表現である概念と
を対応付けて格納される第1の電子辞書と、複数の表現
とそれら表現に共通する上位の表現である概念とを対応
付けて格納される第2の電子辞書と、を記憶する辞書記
憶手段と、辞書記憶手段に記憶される前記第1の電子辞
書と、前記第2の電子辞書とを読み出して、前記第1の
電子辞書に格納される表現と、前記第2の電子辞書に格
納される表現とを比較し、差分を検出する辞書差分検出
手段と、前記辞書差分検出手段により検出された差分を
概念の単位で纏めて表示する表示手段とを備えた。
The dictionary construction support apparatus according to the present invention further comprises a first electronic dictionary storing a plurality of expressions and a concept which is a higher-level expression common to the expressions, a plurality of expressions, and a plurality of expressions and the expressions. A second electronic dictionary stored in association with a concept which is a higher-level expression common to the first electronic dictionary; the first electronic dictionary stored in the dictionary storage means; The dictionary stored in the first electronic dictionary is compared with the expression stored in the second electronic dictionary, and a dictionary difference detecting means for detecting a difference; Display means for displaying the differences detected by the detection means in units of concepts.

【0015】これにより、2つの電子辞書を容易に指定
可能となり、それら電子辞書間の差分を検出し、概念の
単位でユーザへ提示可能となった。
This makes it possible to easily designate two electronic dictionaries, detect the difference between the two electronic dictionaries, and present the difference to the user in units of concepts.

【0016】また、本発明の辞書構築支援装置は、文書
を指定する文書指定手段と、電子辞書を指定する辞書指
定手段と、文書指定手段により指定された文書から表現
を抽出する表現抽出手段と、前記表現抽出手段により抽
出された表現を、前記辞書指定手段により指定された電
子辞書に登録する表現登録手段と、前記辞書指定手段に
より指定された電子辞書を編集する辞書編集手段と、前
記電子辞書を用いて文書指定手段により指定された文書
に対して所定の処理を行って、その処理結果を表示する
辞書検証手段とを具備した。
Further, the dictionary construction supporting apparatus of the present invention comprises a document designating means for designating a document, a dictionary designating means for designating an electronic dictionary, and an expression extracting means for extracting an expression from a document designated by the document designating means. An expression registration unit that registers the expression extracted by the expression extraction unit in an electronic dictionary specified by the dictionary specification unit; a dictionary editing unit that edits the electronic dictionary specified by the dictionary specification unit; A dictionary verification unit for performing a predetermined process on the document specified by the document specifying unit using the dictionary and displaying a result of the process;

【0017】これにより、文書から抽出した重要な表現
を参照しながら、必要な表現を選択して情報処理用の辞
書に登録することができ、また、情報処理結果を見て辞
書の性能を検証しながら辞書を編集することができる。
[0017] Thus, it is possible to select a necessary expression and register it in a dictionary for information processing while referring to important expressions extracted from the document, and verify the performance of the dictionary by viewing the result of information processing. While editing the dictionary.

【0018】[0018]

【発明の実施の形態】以下、図面を参照して本発明に係
る実施形態を説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0019】図1は、本発明の実施形態に係る辞書構築
支援装置の構成を示した図である。本実施形態における
辞書構築支援装置は、記憶装置50に格納された辞書構
築支援プログラム100をメモリ40上へ読み込み、前
記プログラム100が、全体の制御を司るCPU10に
よって実行され、動作制御される、例えばパーソナルコ
ンピュータ等のコンピュータによって実現される。
FIG. 1 is a diagram showing a configuration of a dictionary construction support device according to an embodiment of the present invention. The dictionary construction support apparatus according to the present embodiment reads the dictionary construction support program 100 stored in the storage device 50 into the memory 40, and the program 100 is executed by the CPU 10 that controls the entire control and operation is controlled. It is realized by a computer such as a personal computer.

【0020】入力部20は、マウスやキーボードあるい
は音声入力装置等から、文字列の挿入や削除などの編集
指示、機能を選択するための操作指示、処理対象となる
文書や辞書の指定などのコマンド入力等を受けるもので
ある。出力部30は、例えばディスプレイ等の表示装置
へ表示情報を供給するためのものである。
The input unit 20 is operated by a mouse, a keyboard, a voice input device, or the like to issue editing instructions such as insertion or deletion of a character string, operation instructions for selecting functions, and commands for designating a document or a dictionary to be processed. It receives input and the like. The output unit 30 is for supplying display information to a display device such as a display.

【0021】メモリ40は、高速で揮発性の、例えばD
RAM等から構成され、前記したとおりCPU10で実
行される前記プログラム100等を記憶したり、該プロ
グラム100が実行される際に一時的に保持される内部
データ保持部110として利用される。
The memory 40 is fast and volatile, for example, D
It is composed of a RAM and the like, and stores the program 100 and the like executed by the CPU 10 as described above, and is used as an internal data holding unit 110 that is temporarily held when the program 100 is executed.

【0022】この内部データ保持部110には、テキス
トバッファ110a、表現リストバッファ110b、処
理結果バッファ110c、辞書バッファ110d、差分
バッファ110eが設けられている。
The internal data holding unit 110 includes a text buffer 110a, an expression list buffer 110b, a processing result buffer 110c, a dictionary buffer 110d, and a difference buffer 110e.

【0023】記憶装置50は、不揮発性の大容量記憶装
置であり、例えば、HDD、CD−ROM、DVD−R
OM等によって実現可能である。記憶装置50には、制
御部101、表現抽出部102aを備えた表現登録部1
02、辞書編集部103、辞書検証部104及び差分検
出部105からなる辞書構築支援プログラム100と、
このプログラムによって構築される情報抽出用辞書10
9が格納されている。
The storage device 50 is a non-volatile large-capacity storage device such as an HDD, a CD-ROM, and a DVD-R.
It can be realized by OM or the like. The storage device 50 includes an expression registration unit 1 including a control unit 101 and an expression extraction unit 102a.
02, a dictionary construction support program 100 including a dictionary editing unit 103, a dictionary verification unit 104, and a difference detection unit 105;
Information extraction dictionary 10 constructed by this program
9 is stored.

【0024】制御部101は、本プログラム100の起
動時に最初に実行されるメインプログラムである。
The control unit 101 is a main program that is executed first when the program 100 is started.

【0025】表現登録部102は、表現を情報抽出用辞
書109へ登録するプログラムであり、制御部102か
らの所定の指示により起動され、後述する「表現」を情
報抽出用辞書109へ登録する処理を行う。
The expression registration unit 102 is a program for registering expressions in the information extraction dictionary 109. The expression registration unit 102 is activated by a predetermined instruction from the control unit 102, and registers "expressions" described later in the information extraction dictionary 109. I do.

【0026】表現抽出部102aは、表現登録部102
から、文書データの表現の抽出処理が必要になった際に
起動されるプログラムである。表現抽出部102aは、
テキストバッファ110aに記憶される内容を構文解析
等を行って、文書中で使用される単語や句、あるいは共
起関係等(以下、これらを表現と称す)をリスト化し、
表現リストバッファ110bへ記憶する。なお、このリ
スト化されたものを、総称して表現リストと呼ぶ。この
表現リストの作成方法については、たとえば、特開昭6
2−99865や特開平2−42572で公開されてお
り、説明を省略する。
The expression extracting unit 102a includes an expression registering unit 102
This is a program that is started when the process of extracting the expression of the document data becomes necessary. The expression extraction unit 102a
The contents stored in the text buffer 110a are subjected to syntax analysis and the like, and words or phrases used in the document, co-occurrence relations and the like (hereinafter, referred to as expressions) are listed,
The data is stored in the expression list buffer 110b. The list is generally referred to as an expression list. For a method of creating this expression list, see, for example,
2-99865 and JP-A-2-42572, and the description is omitted.

【0027】表現登録部102は、作成された表現リス
ト中からユーザによって指定された表現を、辞書バッフ
ァ110dへ登録する。
The expression registration unit 102 registers an expression designated by the user from the created expression list in the dictionary buffer 110d.

【0028】辞書編集部103は、情報抽出用辞書10
9を編集するプログラムである。この辞書編集部103
は、表現登録部102や辞書検証部104からも起動で
きる。
The dictionary editing unit 103 includes a dictionary 10 for extracting information.
9 is a program for editing. This dictionary editor 103
Can also be activated from the expression registration unit 102 and the dictionary verification unit 104.

【0029】辞書検証部104は、情報抽出用辞書10
9から読み出され格納した、辞書バッファ110dを用
いて、ユーザによって指定された抽出処理を行い、抽出
処理結果を処理結果バッファ110cに記憶する。ま
た、ユーザの指示に基づき、処理結果バッファ110c
に記憶される情報を表示する。
The dictionary verifying unit 104 is used for the dictionary 10 for extracting information.
The extraction processing designated by the user is performed using the dictionary buffer 110d read and stored from the storage unit 9, and the extraction processing result is stored in the processing result buffer 110c. Also, based on the user's instruction, the processing result buffer 110c
Displays the information stored in.

【0030】差分検出部105は、2つの情報抽出用辞
書109、109の差分を検出する。
The difference detection unit 105 detects a difference between the two information extraction dictionaries 109, 109.

【0031】情報抽出用辞書109は、本プログラムで
構築される電子辞書である。この情報抽出用辞書109
の構成の一例を図2に示す。この情報抽出用辞書109
は、3階層にて構成されており、最上位の階層をクラ
ス、中位の階層を概念、下位の階層を表現と呼んでい
る。なお、クラス、概念、表現の階層を特に意識するこ
となく、これらの一つを指す場合には、以下では単にノ
ードと呼ぶこととする。
The information extraction dictionary 109 is an electronic dictionary constructed by this program. This information extraction dictionary 109
An example of the configuration is shown in FIG. This information extraction dictionary 109
Is composed of three layers, the highest layer is called a class, the middle layer is called a concept, and the lower layers are called expressions. In the case where one of these is referred to without any particular awareness of the class, the concept, and the hierarchy of the expression, it is simply referred to as a node hereinafter.

【0032】クラステーブル121は、クラスを示して
おり、ここには、「業界」、「宇宙」等を格納する。概
念テーブル122は、クラスと概念を対応付けて格納し
ている。
The class table 121 indicates a class, and stores "industry", "space", and the like. The concept table 122 stores classes and concepts in association with each other.

【0033】表現テーブル123は、クラス、概念、表
現とを対応付けて格納をしている。
The expression table 123 stores classes, concepts, and expressions in association with each other.

【0034】以上が本実施形態の辞書構築支援装置の構
成である。
The configuration of the dictionary construction support apparatus of the present embodiment has been described above.

【0035】次に本実施形態の辞書構築支援装置の動作
について情報抽出を例として、フローチャートを用いて
説明する。
Next, the operation of the dictionary construction support apparatus of the present embodiment will be described with reference to a flowchart, taking information extraction as an example.

【0036】図3は、辞書構築プログラム100のう
ち、制御部101のフローチャートを示している。
FIG. 3 shows a flowchart of the control unit 101 in the dictionary construction program 100.

【0037】ユーザが、辞書構築プログラム100の起
動を要求すると、制御部101が起動される。
When the user requests the dictionary construction program 100 to be activated, the control unit 101 is activated.

【0038】制御部101は、自プログラム起動後、ユ
ーザからのキー入力を待つ(S201)。キー入力を受
けると、まず、ユーザの入力が終了指示であるか否か判
定する(S202)。ここで終了指示と判定した場合に
は自プログラムを終了する。
After starting the program, the control unit 101 waits for a key input from the user (S201). When a key input is received, first, it is determined whether or not the user input is an end instruction (S202). If it is determined that the instruction is an end instruction, the own program is ended.

【0039】一方、ステップS202において、終了指
示でないと判定した場合には、次に、ユーザの入力が文
書指定であるか否か判定する(S204)。ここで文書
指定である場合には、指定された文書データを、指定先
の、例えばメモリや磁気ディスク、光ディスクなどから
読み出して、メモリ40の内部データ保持部110内の
テキストバッファ110aに記憶する(S204)。こ
の処理が終了すると、ステップS201に戻り、ユーザ
からの次の入力を待つ。
On the other hand, if it is determined in step S202 that the input is not an end instruction, it is next determined whether or not the user input is a document designation (S204). If the document is designated here, the designated document data is read from the designated destination, such as a memory, a magnetic disk, or an optical disk, and stored in the text buffer 110a in the internal data holding unit 110 of the memory 40 ( S204). When this process ends, the process returns to the step S201 and waits for the next input from the user.

【0040】一方、ステップS203において、文書指
定でないと判定した場合には、次に、ユーザの入力が辞
書指定であるか否か判定する(S205)。ここで辞書
指定である場合には、指定された辞書を、指定先の、例
えばメモリや磁気ディスク、光ディスクなどから読み出
して、メモリ40の内部データ保持部110内の辞書バ
ッファ110dに記憶する(S206)。この処理が終
了すると、ステップS201に戻り、ユーザからの次の
入力を待つ。
On the other hand, if it is determined in step S203 that the input is not a document specification, it is next determined whether or not the user input is a dictionary specification (S205). If the dictionary is specified, the specified dictionary is read from the specified destination, such as a memory, a magnetic disk, or an optical disk, and stored in the dictionary buffer 110d in the internal data holding unit 110 of the memory 40 (S206). ). When this process ends, the process returns to the step S201 and waits for the next input from the user.

【0041】一方、ステップS205において、辞書指
定でないと判定した場合には、次に、ユーザの入力が表
現登録指示であるか否か判定する(S207)。ここで
表現登録指示であると判断した場合には、表現登録部1
02を起動する(S208)。表現登録部102の動作
については後述する。なお、表現登録部102の動作が
終了すると、ステップS201に戻り、ユーザからの次
の入力を待つ。
On the other hand, if it is determined in step S205 that the dictionary is not specified, it is determined whether or not the user input is an expression registration instruction (S207). If it is determined that the instruction is an expression registration instruction, the expression registration unit 1
02 is started (S208). The operation of the expression registration unit 102 will be described later. When the operation of the expression registration unit 102 ends, the process returns to step S201 and waits for the next input from the user.

【0042】一方、ステップS207において、表現登
録指示でないと判断した場合には、次に、ユーザの入力
が辞書検証指示であるか否か判定する(S209)。こ
こで辞書検証指示であると判定した場合には、辞書検証
部104を起動する(S210)。辞書検証部104の
動作については後述する。なお、辞書検証部104の動
作が終了するとステップS201に戻り、ユーザからの
次の入力を待つ。
On the other hand, if it is determined in step S207 that the input is not an expression registration instruction, it is next determined whether or not the user input is a dictionary verification instruction (S209). If it is determined that the instruction is a dictionary verification instruction, the dictionary verification unit 104 is activated (S210). The operation of the dictionary verification unit 104 will be described later. When the operation of the dictionary verification unit 104 ends, the process returns to step S201, and waits for the next input from the user.

【0043】一方、ステップS209において、辞書検
証指示でないと判断した場合には、次に、ユーザの入力
が辞書編集指示であるか否か判定する(S211)。こ
こで辞書編集指示である場合には、辞書編集部103を
起動する(S212)。辞書編集部103の動作につい
ては後述する。なお、辞書編集部103の動作が終了す
るとステップS201に戻り、ユーザからの次の入力を
待つ。
On the other hand, if it is determined in step S209 that the input is not a dictionary verification instruction, it is next determined whether or not the user input is a dictionary edit instruction (S211). If the input is a dictionary editing instruction, the dictionary editing unit 103 is activated (S212). The operation of the dictionary editing unit 103 will be described later. When the operation of the dictionary editing unit 103 ends, the process returns to step S201, and waits for the next input from the user.

【0044】一方、ステップS211において、辞書編
集指示でないと判断した場合には、次に、ユーザの入力
が差分検出指示であるか否か判定する(S213)。こ
こで、差分検出指示である場合には、差分検出部105
を起動する(S214)。差分検出部105の動作につ
いては後述する。なお、差分検出部105の動作が終了
するとステップS201に戻り、ユーザからの次の入力
を待つ。
On the other hand, if it is determined in step S211 that the input is not a dictionary editing instruction, it is next determined whether or not the user input is a difference detection instruction (S213). If the instruction is a difference detection instruction, the difference detection unit 105
Is started (S214). The operation of the difference detection unit 105 will be described later. When the operation of the difference detection unit 105 ends, the process returns to step S201, and waits for the next input from the user.

【0045】一方、ステップS213において、差分検
出指示でないと判断した場合には、指定された他の処
理、例えば環境設定処理等のユーザの入力指示に対応す
る処理を行って(S215)、ステップS201に戻
り、ユーザからの次の入力を待つ。
On the other hand, if it is determined in step S213 that the received instruction is not a difference detection instruction, other designated processing, for example, processing corresponding to a user's input instruction such as environment setting processing is performed (S215), and step S201 is performed. And waits for the next input from the user.

【0046】以上のように、制御部101は、ユーザの
入力を解析して各種処理部を起動するとともに、ユーザ
の指示に基づき、処理対象の文書および辞書を内部デー
タ保持部110に記憶する。
As described above, the control unit 101 analyzes the input of the user, activates various processing units, and stores the document to be processed and the dictionary in the internal data holding unit 110 based on the user's instruction.

【0047】図4は、制御部101が起動した直後の画
面表示例を示している。上部には、登録、検証、編集、
差分表示、環境設定、終了の各ボタンがあり、ユーザ
は、これらのボタンを押すことによって、次に行う処理
を選択する。例えば、終了ボタンがクリックされると、
ステップS202にて、ユーザの入力が終了指示である
ことを判定して、終了処理が行われる。また、例えば、
登録ボタンがクリックされると、ステップS207に
て、ユーザの入力が表現登録指示であることを判定し、
表現登録部102が起動される処理が行われる。
FIG. 4 shows a screen display example immediately after the control unit 101 is started. At the top, sign up, verify, edit,
There are buttons for displaying a difference, setting an environment, and terminating. The user selects these processes by pressing these buttons. For example, when the end button is clicked,
In step S202, it is determined that the user input is a termination instruction, and termination processing is performed. Also, for example,
When the registration button is clicked, it is determined in step S207 that the user input is an expression registration instruction,
Processing for activating the expression registration unit 102 is performed.

【0048】これらボタンの下部には、左に辞書名を入
力する領域が、右に文書名を入力する領域が設けられて
おり、ユーザは、これら領域に辞書名、文書名を入力
し、実行することにより、該当する辞書あるいは文書を
記憶装置50から読み出す。例えば、文書名を入力する
領域にユーザが文書名を入力して実行すると、ステップ
S203にて、ユーザの入力が文書指定であると判定
し、続くステップS204で、入力された文書名に基づ
いて、該当する文書を記憶装置50などから読み出し
て、テキストバッファ110aに記憶する。
Below these buttons, an area for inputting a dictionary name is provided on the left and an area for inputting a document name is provided on the right. The user inputs a dictionary name and a document name in these areas, and executes By doing so, the corresponding dictionary or document is read from the storage device 50. For example, when the user inputs a document name in an area for inputting a document name and executes the process, in step S203, it is determined that the user input is a document designation, and in subsequent step S204, based on the input document name, The corresponding document is read from the storage device 50 or the like and stored in the text buffer 110a.

【0049】次に、表現登録部102の処理動作につい
て説明する。図5は、表現登録部102の処理動作を示
すフローチャートである。
Next, the processing operation of the expression registration unit 102 will be described. FIG. 5 is a flowchart showing the processing operation of the expression registration unit 102.

【0050】制御部101の動作中、ステップ207に
おいて表現登録指示であると判断した場合には、表現登
録部102が起動される。起動された表現登録部102
は、まず、表現抽出部102aを起動する。起動された
表現抽出部102aは、テキストバッファ110aに記
憶される文書データを所定の解析方法にて解析し、表現
リストを作成する(S301)。この作成された表現リ
ストを表現リストバッファ110bに保持する(S30
2)。なお、所定の解析方法は、例えば、単語の表現リ
ストを作成する際には、文書データを形態素解析や、構
文解析し、単語を抽出し、抽出した単語を羅列すればよ
く、またこの解析方法にとらわれることなく既知の様々
な方法で作成すれば良い。抽出後、表現抽出部102a
は、終了する。
During the operation of the control unit 101, if it is determined in step 207 that the instruction is an expression registration instruction, the expression registration unit 102 is activated. The activated expression registration unit 102
Starts the expression extraction unit 102a. The activated expression extracting unit 102a analyzes the document data stored in the text buffer 110a by a predetermined analysis method, and creates an expression list (S301). The created expression list is stored in the expression list buffer 110b (S30).
2). The predetermined analysis method may be, for example, when creating an expression list of words, morphological analysis or syntax analysis of document data, extract words, and list the extracted words. The method may be created by various known methods without being limited to the above. After extraction, the expression extraction unit 102a
Ends.

【0051】次に、辞書バッファ110dに記憶される
辞書データと、表現リストバッファ110bに記憶され
る表現リストとを読み出して、同時に表示する(S30
3)。
Next, the dictionary data stored in the dictionary buffer 110d and the expression list stored in the expression list buffer 110b are read out and displayed simultaneously (S30).
3).

【0052】次に、ユーザの入力が辞書登録指示である
か否か判定する(S304)。ここで、辞書登録指示で
ある場合には、次に、ユーザは、表示された表現リスト
の中から辞書に登録したい表現を指定する(S30
5)。これにより、表現登録部102は、ユーザによっ
て指定された表現を得る。また、ユーザは、表示された
辞書の概念の中から、得られた表現を登録したい概念を
指定する(S306)。これにより、表現登録部102
は、表現が登録される概念を得る。そして、これら得た
表現、及び概念を合成し、表現の辞書情報(下位のテー
ブル)として登録する(S307)。この登録は、辞書
バッファ110dに追加される。
Next, it is determined whether or not the user input is a dictionary registration instruction (S304). If the instruction is a dictionary registration instruction, the user next specifies an expression to be registered in the dictionary from the displayed expression list (S30).
5). Thereby, the expression registration unit 102 obtains the expression specified by the user. In addition, the user designates a concept for which the obtained expression is to be registered from the displayed dictionary concepts (S306). Thereby, the expression registration unit 102
Get the concept in which the expression is registered. Then, the obtained expression and concept are synthesized and registered as dictionary information (lower-order table) of the expression (S307). This registration is added to the dictionary buffer 110d.

【0053】一方、ステップS304において、辞書登
録指示でない場合には、ユーザの入力が辞書編集指示で
あるか否か判定する(S308)。ここで、辞書編集指
示である場合には、後述の辞書編集部103を起動し、
辞書の編集を行う(S309)。辞書編集部103の処
理が終了すると、ステップS304に戻る。
On the other hand, if it is not a dictionary registration instruction in step S304, it is determined whether or not the user input is a dictionary editing instruction (S308). Here, in the case of a dictionary editing instruction, a dictionary editing unit 103 described later is started, and
The dictionary is edited (S309). When the processing of the dictionary editing unit 103 ends, the process returns to step S304.

【0054】一方、ステップS308において、辞書編
集指示でない場合には、辞書バッファ110dに記憶さ
れる情報を磁気ディスク等に保存し(S310)、処理
を終了する。
On the other hand, if it is not a dictionary editing instruction in step S308, the information stored in the dictionary buffer 110d is stored on a magnetic disk or the like (S310), and the process ends.

【0055】このようにして、表現登録部102は、表
現抽出部102aを起動して表現リストを作成し、表現
リストから辞書109への辞書登録を行う。
As described above, the expression registration unit 102 activates the expression extraction unit 102a to create an expression list, and registers a dictionary in the dictionary 109 from the expression list.

【0056】図6は、表現登録部102の処理時の画面
表示例を示している。辞書名を入力する領域の下部に
は、登録ボタンがあり、このボタンをクリックすること
によって辞書登録処理(S305〜S307)が可能に
なる。この登録ボタンの下部には、辞書の内容を表示し
ている。この例においては、辞書名「XXXXXXX」
の辞書の内容の一部が表示されている。この表示では、
クラス、概念、表現の3階層の形式で表示されている。
また、各語の前部にはチェックボックスが設けられてお
り、ユーザにてチェックボックスをクリックすることに
より指定可能になる。
FIG. 6 shows an example of a screen display at the time of processing by the expression registration unit 102. A registration button is provided below the area for inputting the dictionary name. By clicking this button, dictionary registration processing (S305 to S307) becomes possible. The contents of the dictionary are displayed below the registration button. In this example, the dictionary name “XXXXXXXXX”
A part of the contents of the dictionary is displayed. In this display,
It is displayed in the form of three layers: class, concept, and expression.
Also, a check box is provided at the front of each word, and the user can specify the check box by clicking the check box.

【0057】一方、文書名を入力する領域の下部には、
単語、共起、句の各ボタンがあり、これらボタンを押す
ことによって、表現リストの表示内容を選択できる。こ
れらボタンの下部は、表現リストを表示する領域であ
り、この例においては、文書名「++++++」の単語
の表現リストを表示している。この表現リストの各語
(この場合は単語)の前部にはチェックボックスが設け
られており、ユーザにてチェックボックスをクリックす
ることにより指定可能になっている。
On the other hand, below the area for inputting the document name,
There are buttons for words, co-occurrences, and phrases. By pressing these buttons, the display contents of the expression list can be selected. The lower part of these buttons is an area for displaying an expression list. In this example, an expression list of a word having a document name “++++++” is displayed. A check box is provided in front of each word (word in this case) in this expression list, and can be specified by the user by clicking the check box.

【0058】このように、この表現登録部102の処理
時の画面は、辞書と表現リストが同時に表示可能となっ
ており、また、辞書のクラス、概念、表現、および表現
リストの各語は、簡単に指定可能になっており、ユーザ
にとって、簡単に辞書への登録が可能である。
As described above, on the screen during the processing of the expression registration unit 102, the dictionary and the expression list can be displayed at the same time, and the words of the dictionary class, concept, expression, and expression list are It can be easily specified, and the user can easily register in the dictionary.

【0059】図7は、表現の登録処理を模式的に示した
図である。この例では、表現リストから「社員」を選択
し、「人」の概念の一つの表現として追加する際の内部
データの処理について示している。
FIG. 7 is a diagram schematically showing the expression registration process. This example shows processing of internal data when "employee" is selected from the expression list and added as one expression of the concept of "person".

【0060】表示された表現リストから「社員」が選択
されると表現リストバッファ110bから「社員」を取
得し、また、表示された辞書から概念「人」が選択され
ると辞書バッファ110dに記憶される概念テーブル1
22から「業界・人」を取得する。そして、これら取得
した「業界、人」、「社員」を合成し、「業界・人・社
員」を得て、これを辞書バッファ110dの表現テーブ
ル123に登録する。その結果、表現テーブルは12
3’のようになる。
When "employee" is selected from the displayed expression list, "employee" is obtained from the expression list buffer 110b, and when the concept "person" is selected from the displayed dictionary, it is stored in the dictionary buffer 110d. Concept table 1
Acquire "industry / person" from 22. Then, the acquired "industry, person" and "employee" are combined to obtain "industry / person / employee", which is registered in the expression table 123 of the dictionary buffer 110d. As a result, the expression table becomes 12
It looks like 3 '.

【0061】これにより、文書データから抽出された表
現を、簡単な操作で電子辞書内の所望の概念へ登録する
ことができるようになった。
As a result, the expression extracted from the document data can be registered in a desired concept in the electronic dictionary by a simple operation.

【0062】次に、辞書検証部104の処理動作につい
て説明する。図8は辞書検証部104の処理動作を示す
フローチャートである。
Next, the processing operation of the dictionary verification unit 104 will be described. FIG. 8 is a flowchart showing the processing operation of the dictionary verification unit 104.

【0063】制御部101の動作中、ステップ209に
おいて辞書検証指示であると判断した場合には、辞書検
証部104が起動される。起動された辞書検証部104
は、辞書バッファ110dに記憶される辞書データを表
示する(S401)。
If it is determined in step 209 that the instruction is a dictionary verification instruction while the control unit 101 is operating, the dictionary verification unit 104 is activated. The activated dictionary verification unit 104
Displays the dictionary data stored in the dictionary buffer 110d (S401).

【0064】次に、辞書109を用いて情報抽出を行
い、結果を処理結果バッファ110cに記憶する(S4
02)。そして、処理結果バッファ110dに記憶した
情報を表示する(S403)。
Next, information is extracted using the dictionary 109, and the result is stored in the processing result buffer 110c (S4).
02). Then, the information stored in the processing result buffer 110d is displayed (S403).

【0065】次に、ユーザの入力が情報抽出結果の検証
指示であるか否か判定する(S404)。
Next, it is determined whether or not the user input is a verification instruction of the information extraction result (S404).

【0066】ここで、情報抽出結果の検証指示であると
判定した場合には、検証したいノードを辞書中で指定す
る(S405)。そして、指定されたノードに対応する
情報抽出結果を表示する(S406)。なお、この処理
後、ステップS404に戻る。
If it is determined that the instruction is a verification instruction of the information extraction result, the node to be verified is specified in the dictionary (S405). Then, the information extraction result corresponding to the designated node is displayed (S406). After this processing, the process returns to step S404.

【0067】一方、ステップS404において、情報抽
出結果の検証指示でないと判定した場合には、次に、ユ
ーザの入力が辞書編集指示であるか否か判定する(S4
07)。ここで、辞書編集指示であると判定した場合に
は、辞書編集部103を起動し、辞書編集を行う。辞書
編集部103が終了すると、ステップS404に戻る。
On the other hand, if it is determined in step S404 that the instruction is not a verification instruction of the information extraction result, it is next determined whether or not the user input is a dictionary editing instruction (S4).
07). Here, if it is determined that the instruction is a dictionary editing instruction, the dictionary editing unit 103 is activated to perform dictionary editing. When the dictionary editing unit 103 ends, the process returns to step S404.

【0068】一方、ステップS407において、辞書編
集指示でないと判定した場合には、辞書バッファ110
dに記憶される情報を磁気ディスク等に保存する(S4
09)。また、処理結果バッファ110cに記憶される
情報を磁気ディスク等に保存し(S410)、辞書検証
部104の処理を終了する。
On the other hand, if it is determined in step S407 that the instruction is not a dictionary editing instruction, the dictionary buffer 110
d is stored in a magnetic disk or the like (S4).
09). Further, the information stored in the processing result buffer 110c is stored on a magnetic disk or the like (S410), and the processing of the dictionary verification unit 104 ends.

【0069】このようにして、辞書検証部104は、辞
書109による情報抽出結果を表示しながら辞書の検証
を行う。
As described above, the dictionary verification unit 104 verifies the dictionary while displaying the information extraction result by the dictionary 109.

【0070】図9は、辞書検証部104の処理時の画面
表示例を示している。
FIG. 9 shows an example of a screen display at the time of processing by the dictionary verification unit 104.

【0071】表示上、左半分の表示内容は、図6の表現
登録部102の左半分の表示内容と比較して、登録ボタ
ンに代えて検証ボタンがあるのみで、その他は同じであ
る。この検証ボタンを押すことによって結果検証処理
(S405〜S406)が可能になる。
The display content of the left half of the display is the same as the display content of the left half of the expression registration unit 102 in FIG. 6 except that a registration button is provided instead of a registration button. By pressing this verification button, the result verification processing (S405 to S406) becomes possible.

【0072】一方、図9の右半分の表示内容は、文書名
の下部には、辞書109で処理された抽出結果が表示さ
れる。そして、図のように抽出結果の検証後にあたっ
て、抽出結果上、指定された概念が持つ表現がある箇所
には、ユーザへ明示可能なように、ここでは下線で明示
している。なお、下線以外に例えば、色などの十分識別
ができる方法であれば良い。
On the other hand, in the display content in the right half of FIG. 9, the extraction result processed by the dictionary 109 is displayed below the document name. Then, as shown in the drawing, after verification of the extraction result, a portion where the expression of the designated concept is present in the extraction result is underlined here so that it can be clearly indicated to the user. It should be noted that any method other than underlining, for example, a method that can sufficiently identify colors and the like may be used.

【0073】これにより、階層化された電子辞書内の概
念を、簡単な操作で指定でき、指定された概念に含まれ
る表現を電子辞書で抽出された抽出結果の中から容易に
抽出して明示するようにしたので、ユーザは、電子辞書
の良し悪しを容易に検証することができるようになっ
た。
Thus, the concept in the hierarchized electronic dictionary can be specified by a simple operation, and the expression included in the specified concept can be easily extracted and specified from the extraction result extracted by the electronic dictionary. As a result, the user can easily verify the quality of the electronic dictionary.

【0074】次に、辞書編集部103の処理動作につい
て説明する。図10は、辞書編集部103の処理動作を
示すフローチャートである。
Next, the processing operation of the dictionary editing unit 103 will be described. FIG. 10 is a flowchart illustrating the processing operation of the dictionary editing unit 103.

【0075】制御部101の動作中、ステップS211
において辞書編集指示であると判断した場合、表現登録
部102の動作中、ステップS308において辞書編集
指示であると判断した場合、および辞書検証部104の
動作中、ステップS407において辞書編集指示である
と判断した場合に、辞書編集部103が起動される。
During the operation of the control unit 101, step S211
Is determined to be a dictionary editing instruction, when the expression registration unit 102 is operating, when it is determined to be a dictionary editing instruction in step S308, and when the dictionary verification unit 104 is operating, it is determined that the dictionary editing instruction is in step S407. When it is determined, the dictionary editing unit 103 is activated.

【0076】起動された辞書編集部103は、辞書バッ
ファ110dに記憶される辞書データを表示する(S5
01)。
The activated dictionary editing unit 103 displays the dictionary data stored in the dictionary buffer 110d (S5).
01).

【0077】次に、ユーザの入力がノードの追加指示で
あるか否か判定する(S502)。ここで、追加指示で
ある場合には、追加ノードを指定する(S503)。そ
して、指定されたノードに子ノードを追加する(S50
4)。追加の内容は、ユーザが直接入力する。そして、
ステップS502に戻る。
Next, it is determined whether or not the user input is a node addition instruction (S502). If the instruction is an addition instruction, an additional node is designated (S503). Then, a child node is added to the designated node (S50)
4). Additional content is entered directly by the user. And
It returns to step S502.

【0078】一方、ステップS502において追加指示
でない場合には、次にユーザの入力がノードの削除指示
であるか否か判定する(S505)。ここで、削除指示
である場合には、削除ノードを指定する(S506)。
そして、指定されたノードとそのノードの子ノードを全
て削除する(S507)。そして、ステップS502に
戻る。
On the other hand, if it is not an addition instruction in step S502, it is next determined whether or not the user input is a node deletion instruction (S505). If the instruction is a deletion instruction, a deletion node is designated (S506).
Then, the designated node and all child nodes of the node are deleted (S507). Then, the process returns to step S502.

【0079】一方、ステップS505において削除指示
でない場合には、次にユーザの入力がノードの変更指示
であるか否か判定する(S508)。ここで、変更指示
である場合には、変更ノードを指定する(S509)。
そして、指定されたノードの文字列や値などを変更する
(S510)。そして、ステップS502に戻る。
On the other hand, if it is not a deletion instruction in step S505, it is next determined whether or not the user input is a node change instruction (S508). Here, in the case of a change instruction, a change node is designated (S509).
Then, the character string and value of the designated node are changed (S510). Then, the process returns to step S502.

【0080】一方、ステップS508において変更指示
でない場合には、次にユーザの入力がノードの複写指示
であるか否か判定する(S511)。ここで、複写指示
である場合には、複写元ノードを指定する(S51
2)。そして、複写先ノードを指定する(S513)。
そして、指定された複写元ノードとその子ノード全てを
複写先ノードの子ノードに追加する(S514)。そし
て、ステップS502に戻る。
On the other hand, if it is not a change instruction in step S508, it is next determined whether or not the user input is a node copy instruction (S511). If the instruction is a copy instruction, a copy source node is designated (S51).
2). Then, a copy destination node is designated (S513).
Then, the designated copy source node and all of its child nodes are added to the child nodes of the copy destination node (S514). Then, the process returns to step S502.

【0081】一方、ステップS511において、複写指
示でない場合には、ユーザの入力がノードの移動指示で
あるか否か判定する(S515)。ここで、移動指示で
ある場合には、移動元ノードを指定する(S516)。
そして、移動先ノードを指定する(S517)。そし
て、指定された移動元ノードとその子ノード全てを移動
先ノードの子ノードに移動する(S518)。そして、
ステップS502に戻る。
On the other hand, if it is determined in step S511 that the instruction is not a copy instruction, it is determined whether or not the user input is an instruction to move a node (S515). Here, in the case of a move instruction, a move source node is designated (S516).
Then, the destination node is specified (S517). Then, the designated source node and all of its child nodes are moved to child nodes of the destination node (S518). And
It returns to step S502.

【0082】一方、ステップS515において、移動指
示でない場合には、辞書バッファ110dに記憶される
情報を磁気ディスク等に保存し(S519)、処理を終
了する(S515)。
On the other hand, if it is not a move instruction in step S515, the information stored in the dictionary buffer 110d is stored on a magnetic disk or the like (S519), and the process ends (S515).

【0083】このようにして、辞書編集部108は、辞
書109のノードに対して、追加、削除、変更、複写、
移動などを行い、辞書編集を行う。
As described above, the dictionary editing unit 108 adds, deletes, changes, copies,
Move and perform dictionary editing.

【0084】図11は、辞書編集部103の処理時の画
面表示例を示している。
FIG. 11 shows an example of a screen display at the time of processing by the dictionary editing unit 103.

【0085】この例では、図6の表現登録部102の左
半分の表示内容と比較して、登録ボタンに変えて、追
加、削除、変更、移動、複写の各ボタンが配置されてい
る点が異なり、他は同じである。各ボタンをクリックす
ることにより、上記したようなクリックされたボタンの
各種編集機能が実施される。
In this example, as compared with the display content in the left half of the expression registration unit 102 in FIG. 6, the point that the addition, deletion, change, move, and copy buttons are arranged instead of the registration button. Different, the others are the same. By clicking each button, various editing functions of the clicked button are performed as described above.

【0086】以上のように、電子辞書の編集を扱いやす
いユーザインターフェースにしたので、ユーザにとって
辞書の編集が容易に実現できる。
As described above, since the editing of the electronic dictionary is made easy to handle, the user can easily edit the dictionary.

【0087】次に、差分検出部105の処理動作につい
て説明する。図12は差分検証部105の処理動作を示
すフローチャートである。
Next, the processing operation of the difference detection unit 105 will be described. FIG. 12 is a flowchart showing the processing operation of the difference verification unit 105.

【0088】制御部101の動作中、ステップS213
において差分検出指示であると判断した場合に、差分検
出部105が起動される。
During the operation of the control unit 101, step S213
When it is determined that the instruction is a difference detection instruction, the difference detection unit 105 is activated.

【0089】起動された差分検出部105は、ユーザの
入力によって、比較したい辞書を2つ指定する(S60
1)。そして、指定された辞書の差分を作成して差分バ
ッファ110eに記憶する(S602)。
The activated difference detection unit 105 specifies two dictionaries to be compared according to the user's input (S60).
1). Then, a difference of the designated dictionary is created and stored in the difference buffer 110e (S602).

【0090】次に、差分バッファ110eに記憶される
差分を表示する(S603)。差分バッファ110eに
記憶される差分を磁気ディスク等に保存し(S60
4)、処理を終了する。
Next, the differences stored in the difference buffer 110e are displayed (S603). The difference stored in the difference buffer 110e is stored on a magnetic disk or the like (S60).
4), end the process.

【0091】このようにして、差分検出部105は、辞
書109同士を比較して、差分を作成・表示する。
In this way, the difference detecting unit 105 creates and displays a difference by comparing the dictionaries 109 with each other.

【0092】図13は、差分検出部105の処理時の画
面表示例を示している。
FIG. 13 shows an example of a screen display at the time of processing by the difference detection unit 105.

【0093】この例では、上部には、比較したい辞書を
入力する2つの領域を備える。この領域の下部には、比
較結果を表示する領域であり、ここでは、概念毎の比較
結果を表示している。
In this example, two areas for inputting dictionaries to be compared are provided at the upper part. The lower part of this area is an area for displaying a comparison result. Here, the comparison result for each concept is displayed.

【0094】これにより、2つの電子辞書を容易に指定
可能となり、それら電子辞書間の差分を検出し、概念の
単位でユーザへ提示可能となった。
As a result, two electronic dictionaries can be easily specified, and a difference between the two electronic dictionaries can be detected and presented to the user in units of concepts.

【0095】以上説明した本実施形態においては、文書
データから抽出された表現を、簡単な操作で電子辞書内
の所望の概念へ登録することができるようになった。
In the present embodiment described above, the expression extracted from the document data can be registered to a desired concept in the electronic dictionary by a simple operation.

【0096】また、階層化された電子辞書内の概念を、
簡単な操作で指定でき、指定された概念に含まれる表現
を電子辞書で抽出された抽出結果の中から容易に抽出し
て明示するようにしたので、ユーザは、電子辞書の良し
悪しを容易に検証することができるようになった。
The concept in the hierarchical electronic dictionary is as follows:
The user can easily specify the expression included in the specified concept by extracting it from the extraction result extracted by the electronic dictionary and specify it with simple operations. You can now verify.

【0097】また、2つの電子辞書を容易に指定可能と
なり、それら電子辞書間の差分を検出し、概念の単位で
ユーザへ提示可能となった。
Further, it is possible to easily designate two electronic dictionaries, detect a difference between the electronic dictionaries, and present the difference to the user in units of concepts.

【0098】また、文書から抽出した重要な表現を参照
しながら、必要な表現を選択して情報抽出用の辞書に登
録することができ、また、情報抽出結果を見て辞書の性
能を検証しながら辞書を編集することができるようにな
った。
Further, while referring to important expressions extracted from the document, necessary expressions can be selected and registered in a dictionary for information extraction, and the performance of the dictionary can be verified by seeing the result of information extraction. You can now edit the dictionary.

【0099】[0099]

【発明の効果】以上説明したように本発明によれば、文
書から抽出した重要な表現を参照しながら、必要な表現
を選択して情報抽出用の辞書に登録することができ、ま
た、情報抽出結果を見て辞書の性能を検証しながら辞書
を編集することができるようになった。
As described above, according to the present invention, a required expression can be selected and registered in an information extraction dictionary while referring to an important expression extracted from a document. You can now edit the dictionary while verifying the performance of the dictionary by looking at the extraction results.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施形態に係る辞書構築支援装置の構
成を示す図。
FIG. 1 is a diagram showing a configuration of a dictionary construction support device according to an embodiment of the present invention.

【図2】同実施形態における情報抽出用辞書109の構
成の一例。
FIG. 2 is an example of a configuration of an information extraction dictionary 109 according to the embodiment.

【図3】同実施形態における制御部101の処理動作を
示すフローチャート。
FIG. 3 is a flowchart showing a processing operation of a control unit 101 in the embodiment.

【図4】同実施形態における制御部101が起動した直
後の画面表示例。
FIG. 4 is a screen display example immediately after the control unit 101 according to the embodiment is started.

【図5】同実施形態における表現登録部102の処理動
作を示すフローチャート。
FIG. 5 is an exemplary flowchart showing the processing operation of the expression registration unit 102 in the embodiment.

【図6】同実施形態における表現登録部102の処理時
の画面表示例。
FIG. 6 is a screen display example during processing of the expression registration unit 102 in the embodiment.

【図7】同実施形態における表現の登録処理を模式的に
示した図。
FIG. 7 is an exemplary view schematically showing registration processing of the expression in the embodiment.

【図8】同実施形態における辞書検証部104の処理動
作を示すフローチャート。
FIG. 8 is a flowchart showing a processing operation of the dictionary verification unit 104 according to the embodiment.

【図9】同実施形態における辞書検証部104の処理時
の画面表示例。
FIG. 9 is an example of a screen display at the time of processing by the dictionary verification unit 104 according to the embodiment.

【図10】同実施形態における辞書編集部103の処理
動作を示すフローチャート。
FIG. 10 is an exemplary flowchart illustrating the processing operation of the dictionary editing unit 103 according to the embodiment.

【図11】同実施形態における辞書編集部103の処理
時の画面表示例。
FIG. 11 is a screen display example during processing of the dictionary editing unit 103 according to the embodiment.

【図12】同実施形態における差分検出部105の処理
動作を示すフローチャート。
FIG. 12 is a flowchart showing a processing operation of a difference detection unit 105 in the embodiment.

【図13】同実施形態における差分検出部105の処理
時の画面表示例。
FIG. 13 is a screen display example during processing of the difference detection unit 105 in the embodiment.

【符号の説明】[Explanation of symbols]

10 CPU 20 入力部 30 出力部 40 メモリ 50 記憶装置 100 辞書構築プログラム 101 制御部 102 表現登録部 102a 表現抽出部 103 辞書編集部 104 辞書検証部 105 差分検出部 109 辞書抽出用辞書 110 内部データ保持部 110a テキストバッファ 110b 表現リストバッファ 110c 処理結果バッファ 110d 辞書バッファ 110e 差分バッファ 121 クラステーブル 122 概念テーブル 123 表現テーブル Reference Signs List 10 CPU 20 input unit 30 output unit 40 memory 50 storage device 100 dictionary construction program 101 control unit 102 expression registration unit 102a expression extraction unit 103 dictionary editing unit 104 dictionary verification unit 105 difference detection unit 109 dictionary extraction dictionary 110 internal data holding unit 110a text buffer 110b expression list buffer 110c processing result buffer 110d dictionary buffer 110e difference buffer 121 class table 122 concept table 123 expression table

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 複数の表現とそれら表現に共通する上位
の表現である概念とを対応付けて格納される電子辞書を
記憶する辞書記憶手段と、 文書データから抽出された表現を記憶する表現記憶手段
と、 前記辞書記憶手段にて記憶される該電子辞書から少なく
とも一部の概念と、前記表現記憶手段にて記憶される少
なくとも一部の該抽出された表現とを同時に表示する表
示手段と、 前記表示手段によって表示された表現から一つ以上の表
現の指定と、前記表示手段によって表示された概念から
一つの概念の指定とを受けると、指定された表現を指定
された概念に対応付けて前記電子辞書に追加登録する登
録手段とを備えたことを特徴とする辞書構築支援装置。
1. A dictionary storage means for storing an electronic dictionary that stores a plurality of expressions and a concept that is a higher-level expression common to the expressions, and an expression storage for storing expressions extracted from document data. Means, display means for simultaneously displaying at least some of the concepts from the electronic dictionary stored in the dictionary storage means, and at least some of the extracted expressions stored in the expression storage means, Upon receiving designation of one or more expressions from the expressions displayed by the display means and designation of one concept from the concepts displayed by the display means, the specified expression is associated with the specified concept. A dictionary construction support device comprising: a registration unit for additionally registering the electronic dictionary.
【請求項2】 複数の表現とそれら表現に共通する上位
の表現である概念とを対応付けて格納される電子辞書を
記憶する辞書記憶手段と、 文書データから前記電子辞書を用いて表現を抽出し、こ
の抽出結果を記憶する表現記憶手段と、 前記辞書記憶手段にて記憶される該電子辞書から少なく
とも一部の概念と、前記表現記憶手段にて記憶される少
なくとも一部の該抽出結果とを同時に表示する表示手段
とを備え、 前記表示手段によって表示された概念のうち一つの概念
の指定を受けると、その概念に対応する各表現を前記表
示された表現結果上で明示するようにしたことを特徴と
する辞書構築支援装置。
2. A dictionary storage means for storing an electronic dictionary which stores a plurality of expressions and a concept which is a higher-level expression common to those expressions, and extracts the expressions from document data using the electronic dictionary. And an expression storage unit for storing the extraction result, at least a part of the concept from the electronic dictionary stored in the dictionary storage unit, and at least a part of the extraction result stored in the expression storage unit. And a display unit for simultaneously displaying, when receiving a designation of one of the concepts displayed by the display unit, each expression corresponding to the concept is explicitly indicated on the displayed expression result. A dictionary construction support device, characterized in that:
【請求項3】 複数の表現とそれら表現に共通する上位
の表現である概念とを対応付けて格納される第1の電子
辞書と、複数の表現とそれら表現に共通する上位の表現
である概念とを対応付けて格納される第2の電子辞書
と、を記憶する辞書記憶手段と、 辞書記憶手段に記憶される前記第1の電子辞書と、前記
第2の電子辞書とを読み出して、前記第1の電子辞書に
格納される表現と、前記第2の電子辞書に格納される表
現とを比較し、差分を検出する辞書差分検出手段と、 前記辞書差分検出手段により検出された差分を概念の単
位で纏めて表示する表示手段とを備えたことを特徴とす
る辞書構築支援装置。
3. A first electronic dictionary that stores a plurality of expressions and a concept that is a higher-level expression common to the expressions, and a plurality of expressions and a concept that is a higher-level expression common to the expressions. A second electronic dictionary stored in association with the first electronic dictionary, and the first electronic dictionary and the second electronic dictionary stored in the dictionary storage are read out, and A dictionary difference detecting unit that compares the expression stored in the first electronic dictionary with the expression stored in the second electronic dictionary to detect a difference; And a display means for displaying the data in a unit.
【請求項4】 文書を指定する文書指定手段と、 電子辞書を指定する辞書指定手段と、 文書指定手段により指定された文書から表現を抽出する
表現抽出手段と、 前記表現抽出手段により抽出された表現を、前記辞書指
定手段により指定された電子辞書に登録する表現登録手
段と、 前記辞書指定手段により指定された電子辞書を編集する
辞書編集手段と、 前記電子辞書を用いて文書指定手段により指定された文
書に対して所定の処理を行って、その処理結果を表示す
る辞書検証手段とを具備することを特徴とする辞書構築
支援装置。
4. A document designation unit for designating a document, a dictionary designation unit for designating an electronic dictionary, an expression extraction unit for extracting an expression from a document designated by the document designation unit, and an expression extracted by the expression extraction unit. An expression registration unit that registers an expression in an electronic dictionary specified by the dictionary specification unit; a dictionary editing unit that edits an electronic dictionary specified by the dictionary specification unit; and a specification by a document specification unit using the electronic dictionary. A dictionary construction support device, comprising: a dictionary verification unit that performs a predetermined process on the processed document and displays a result of the process.
【請求項5】 複数の表現とそれら表現に共通する上位
概念を示す概念とを対応付けて格納される電子辞書の少
なくとも一部の概念と、文書データから予め抽出された
表現のうち少なくとも一部の該抽出された表現とを同時
に表示し、 その表示された表現から一つ以上の表現の指定と、前記
表示手段によって表示された一つの概念の指定とを受け
ると、指定された表現を指定された概念に対応付けて前
記電子辞書に追加登録するようにすることを特徴とする
辞書構築支援方法。
5. A concept of at least a part of an electronic dictionary stored in association with a plurality of expressions and a concept indicating a superordinate concept common to the expressions, and at least a part of expressions previously extracted from document data. Simultaneously displaying the extracted expressions of the above, and receiving designation of one or more expressions from the displayed expressions and designation of one concept displayed by the display means, designates the designated expressions A dictionary construction support method, wherein the additional concept is registered in the electronic dictionary in association with the concept.
【請求項6】 複数の表現とそれら表現に共通する上位
の表現である概念とを対応付けて格納される電子辞書を
記憶し、 文書データから前記電子辞書を用いて表現を抽出し、こ
の抽出結果を記憶し、 記憶された該電子辞書から少なくとも一部の概念と、記
憶された少なくとも一部の該抽出結果とを同時に表示
し、 この表示された概念のうち一つの概念の指定を受ける
と、その概念に対応する各表現を前記表示された表現結
果上で明示するようにしたことを特徴とする辞書構築支
援方法。
6. An electronic dictionary in which a plurality of expressions and a concept which is a higher-level expression common to the expressions are stored in association with each other, and expressions are extracted from document data using the electronic dictionary. When the result is stored, at least some of the concepts from the stored electronic dictionary and at least some of the stored extraction results are simultaneously displayed, and when one of the displayed concepts is designated, A dictionary construction support method, wherein each expression corresponding to the concept is explicitly indicated on the displayed expression result.
【請求項7】 複数の表現とそれら表現に共通する上位
の表現である概念とを対応付けて格納される電子辞書を
取り出して一時保持させる機能と、 文書データから抽出された表現を一時保持させる機能
と、 一時保持された該電子辞書から少なくとも一部の概念
と、一時保持された該表現から少なくとも一部の該抽出
された表現とを同時に表示させる機能と、 表示された表現から一つ以上の表現の指定と、表示され
た概念から一つの概念の指定とを受けると、指定された
表現を指定された概念に対応付けて前記電子辞書に追加
登録させる機能とを含む、コンピュータで読み取り可能
で、実行可能なプログラムを記憶する記憶媒体。
7. A function for extracting and temporarily storing an electronic dictionary stored in association with a plurality of expressions and a concept which is a higher-level expression common to the expressions, and temporarily storing expressions extracted from document data. A function to simultaneously display at least some of the concepts from the temporarily held electronic dictionary and at least some of the extracted expressions from the temporarily held expressions; and one or more of the displayed expressions. Receiving the designation of the expression and the designation of one concept from the displayed concepts, including a function of additionally registering the designated expression in the electronic dictionary in association with the designated concept, and And a storage medium for storing an executable program.
【請求項8】 コンピュータに、複数の表現とそれら表
現に共通する上位の表現である概念とを対応付けて格納
される電子辞書を取り出して一時保持させる機能と、 文書データから抽出された表現を一時保持させる機能
と、 前記記憶された該電子辞書から少なくとも一部の概念
と、前記記憶された少なくとも一部の該抽出された表現
とを同時に表示させる機能と、 この表示された表現から一つ以上の表現の指定と、表示
された概念から一つの概念の指定とを受けると、指定さ
れた表現を指定された概念に対応付けて前記電子辞書に
追加登録させる機能とを実現させるコンピュータプログ
ラム製品。
8. A function for causing a computer to retrieve an electronic dictionary stored in association with a plurality of expressions and a concept which is a higher-level expression common to those expressions and temporarily hold the electronic dictionary, and to store the expressions extracted from the document data. A function of temporarily storing, a function of simultaneously displaying at least some of the concepts from the stored electronic dictionary, and a function of simultaneously displaying the stored at least some of the extracted expressions, and one of the displayed expressions. A computer program product for realizing a function of receiving the designation of the above expression and the designation of one concept from the displayed concepts and additionally registering the designated expression in the electronic dictionary in association with the designated concept .
JP2000332069A 2000-10-31 2000-10-31 Device and method for supporting construction of dictionary Pending JP2002140338A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000332069A JP2002140338A (en) 2000-10-31 2000-10-31 Device and method for supporting construction of dictionary

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000332069A JP2002140338A (en) 2000-10-31 2000-10-31 Device and method for supporting construction of dictionary

Publications (1)

Publication Number Publication Date
JP2002140338A true JP2002140338A (en) 2002-05-17

Family

ID=18808323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000332069A Pending JP2002140338A (en) 2000-10-31 2000-10-31 Device and method for supporting construction of dictionary

Country Status (1)

Country Link
JP (1) JP2002140338A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004185306A (en) * 2002-12-03 2004-07-02 Toshiba Corp Dictionary construction supporting device and method
US7753530B2 (en) 2001-02-27 2010-07-13 Dolby Laboratories Licensing Corporation HDR displays and control systems therefor
US7777945B2 (en) 2002-03-13 2010-08-17 Dolby Laboratories Licensing Corporation HDR displays having light estimating controllers
US8471807B2 (en) 2007-02-01 2013-06-25 Dolby Laboratories Licensing Corporation Calibration of displays having spatially-variable backlight
US8482698B2 (en) 2008-06-25 2013-07-09 Dolby Laboratories Licensing Corporation High dynamic range display using LED backlighting, stacked optical films, and LCD drive signals based on a low resolution light field simulation
US9099046B2 (en) 2009-02-24 2015-08-04 Dolby Laboratories Licensing Corporation Apparatus for providing light source modulation in dual modulator displays

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62229438A (en) * 1986-03-31 1987-10-08 Canon Inc Document processor
JPH1145268A (en) * 1997-07-28 1999-02-16 Just Syst Corp Document retrieval device and computer-readable recording medium where eprogram making computer funtion as same device is recorded

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62229438A (en) * 1986-03-31 1987-10-08 Canon Inc Document processor
JPH1145268A (en) * 1997-07-28 1999-02-16 Just Syst Corp Document retrieval device and computer-readable recording medium where eprogram making computer funtion as same device is recorded

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7753530B2 (en) 2001-02-27 2010-07-13 Dolby Laboratories Licensing Corporation HDR displays and control systems therefor
US7801426B2 (en) 2001-02-27 2010-09-21 Dolby Laboratories Licensing Corporation High dynamic range display devices having color light sources
US7777945B2 (en) 2002-03-13 2010-08-17 Dolby Laboratories Licensing Corporation HDR displays having light estimating controllers
US7800822B2 (en) 2002-03-13 2010-09-21 Dolby Laboratories Licensing Corporation HDR displays with individually-controllable color backlights
US8059110B2 (en) 2002-03-13 2011-11-15 Dolby Laboratories Licensing Corporation Motion-blur compensation in backlit displays
US8125425B2 (en) 2002-03-13 2012-02-28 Dolby Laboratories Licensing Corporation HDR displays with dual modulators having different resolutions
US8199401B2 (en) 2002-03-13 2012-06-12 Dolby Laboratories Licensing Corporation N-modulation displays and related methods
JP2004185306A (en) * 2002-12-03 2004-07-02 Toshiba Corp Dictionary construction supporting device and method
US8471807B2 (en) 2007-02-01 2013-06-25 Dolby Laboratories Licensing Corporation Calibration of displays having spatially-variable backlight
US8482698B2 (en) 2008-06-25 2013-07-09 Dolby Laboratories Licensing Corporation High dynamic range display using LED backlighting, stacked optical films, and LCD drive signals based on a low resolution light field simulation
US9711111B2 (en) 2008-06-25 2017-07-18 Dolby Laboratories Licensing Corporation High dynamic range display using LED backlighting, stacked optical films, and LCD drive signals based on a low resolution light field simulation
US10607569B2 (en) 2008-06-25 2020-03-31 Dolby Laboratories Licensing Corporation High dynamic range display using LED backlighting, stacked optical films, and LCD drive signals based on a low resolution light field simulation
US9099046B2 (en) 2009-02-24 2015-08-04 Dolby Laboratories Licensing Corporation Apparatus for providing light source modulation in dual modulator displays
US9478182B2 (en) 2009-02-24 2016-10-25 Dolby Laboratories Licensing Corporation Locally dimmed quantum dots (nano-crystal) based display
US9911389B2 (en) 2009-02-24 2018-03-06 Dolby Laboratories Licensing Corporation Locally dimmed quantum dot display
US10373574B2 (en) 2009-02-24 2019-08-06 Dolby Laboratories Licensing Corporation Locally dimmed quantum dot display

Similar Documents

Publication Publication Date Title
JP2783558B2 (en) Summary generation method and summary generation device
JPH11175527A (en) Output controller and output control method
WO2006046523A1 (en) Document analysis system and document adaptation system
JPH05225181A (en) Editing device
JP2002140338A (en) Device and method for supporting construction of dictionary
JP2008181218A (en) Input support method and device
JP2005173999A (en) Device, system and method for searching electronic file, program, and recording media
JP3774431B2 (en) Dictionary construction support device and dictionary construction support method
JP2006276912A (en) Device, method, and program for editing document
JP2019121164A (en) Document creating apparatus, document creating method, database construction apparatus, database construction method, and program
JPH117452A (en) Method and device for collecting information through network and recording medium recording program for executing the method
JPH07134720A (en) Method and device for presenting relative information in sentence preparing system
JP2005011301A (en) Document processor and document processing program
JP2004157965A (en) Search support device and method, program and recording medium
JP2003173338A (en) Dictionary construction support device, dictionary construction support method, and dictionary construction support program
JP3712320B2 (en) Variable document creation system, variable document output device and variable document creation device
JPH1145249A (en) Information retrieval device and computer-readable recording medium where program for making computer function as same device is recorded
JP3425329B2 (en) Discrete expression dictionary device
JP3537260B2 (en) Linked document search and display system
JPH0981581A (en) Data base generation method
JP2006172029A (en) Method for presenting retrieval result
JP2008059453A (en) Memo page information display system, and server device and program
JPH10312387A (en) Processor and method for information processing and recording medium where information processing program is recorded
JPH08185401A (en) Document retrieving device
JPH10124523A (en) Method and device for retrieving guidance of multimedia data

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050414

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050624

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050823

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051025