JPH038070A

JPH038070A - キーワード抽出方式

Info

Publication number: JPH038070A
Application number: JP1100064A
Authority: JP
Inventors: Kunihiro Yanagi; 柳　邦宏; Nobutake Sato; 信丈佐藤; Tetsuo Kanefusa; 金房　徹郎
Original assignee: Hitachi Software Engineering Co Ltd; Hitachi Ltd
Current assignee: Hitachi Software Engineering Co Ltd; Hitachi Ltd
Priority date: 1989-04-21
Filing date: 1989-04-21
Publication date: 1991-01-16

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は文書編集方式に係わり、特に作成済み文書の検
索に用いるキーワードを１文書作成時に文字列中から抽
出する処理方式に関する。

〔従来の技術〕

従来の文書キーワード入力は、特開昭６２−１７１０２
８　（従来例１）に示すように、文書作成時に。

キーワード登録機能を持ち、作成者が、文字列入力とと
もに、キーワード登録機能を用いて登録する方法がある
。また、特開昭６２−１７１０２９　（従来例２）に示
すように、仮名漢字変換辞書の中にキーワード情報を持
つことによって、仮名漢字変換と同時に、キーワード登
録を行う方法が知られている。

〔発明が解決しようとする課題〕

上記従来技術には、以下の問題点があった。

従来例１の場合、文書作成者はキーワード登録のための
特別な機能を用いるため、新たな操作方法を覚える必要
があるとともに、文書作成中にキーワードにすべき文字
列を考えながら文書作成を進めるか、または文書作成後
、文書を見直してキーワードをつける必要があり、作成
者にキーワードのための繁雑な作業を強いるものであっ
た。

従来例２の場合、作成者はキーワード付けを意識する必
要はないが、仮名漢字変換辞書にキーワードに関する情
報を持つため、仮名漢字変換の度にキーワードに関する
処理がおこなわれ、仮名漢字変換の性能に影響を与える
。また、キーワードに関する情報を更新（追加、削除等
）しようとすると、仮名漢字辞書の更新を行う必要があ
り、作成者が自由にキーワード情報の更新を行うことが
できない。

従来例１．従来例２に共通の問題として、いったんキー
ワードとして文書に登録されると１文書編集によって、
登録されたキーワードが文書内から削除されても、キー
ワードのみが残ってしまい。

文書内容とキーワードとの整合性がとれなくなるという
問題がある。

本発明、の目的は、キーワード登録に関する特殊な機能
を持たずにキーワードが登録でき、かつ文書編集と同期
してキーワードの整合性を保証し。

キーワード候補の文字列を作成者が自由に変更できるキ
ーワード抽出方式を提供することにある。

〔課題を解決するための手段〕

上記目的は１文字列を強調する場合、その文字列は文書
の特徴を現す場合が多いことに着目し、文字列強調（ア
ンダーライン、網掛け、書体変更等）機能に、キーワー
ド抽出機能を含めることによって実現する。抽出された
キーワードは、抽出キーワードテーブルに格納され、そ
の出現回数を管理する。また、キーワードの整合性を保
証するため１文字列強調解除機能及び文字列削除機能に
も、キーワード抽出機能を持たせ、抽出キーワードテー
ブルを更新することによって、１！１合性を保証する。

〔作用〕

上述したキーワード抽出機能は、強調を指示さ懸た文字
列を解析し自立語を認識する自立語解析処理と、認識さ
れた自立語をあらかじめキーワード候補の単語を登録し
であるキーワード辞書と比較することによって、キーワ
ードとしての適合性をチエツクし、抽出キーワードテー
ブルに登録、または既登録語ならば、出現回数の更新を
行う。

また１強調解除、削除機能の場合、上記自立語解析の後
、抽出キーワードテーブルの対応するキーワードの出現
回数を更新する。このとき、出現回数が０ならば、当該
キーワードを抽出キーワードテーブルから削除する１文
書格納時には、抽出キーワードテーブルも、文書内容と
共に文書ファイルへ格納し１次回の文！編集時には、文
書ファイルに格納された抽出キーワードテーブルを用い
て編集作業を再開する。また１文書検索時には１文書フ
ァイル内の抽出キーワードテーブルの項目を検索する。

上記キーワード辞書は、例えばＪＩＣ３Ｔのシソーラス
集から構成されており１文書作成者が１本辞書の更新を
行うことによってキーワード候補を変更することができ
る。

Ｃ実施例〕以下、本発明の実施例を図面に基づいて説明する。

第１図は、本発明の処理の流れを示す流れ図、第２図は
、本発明を適用する情報処理端末装置の全体構成を示す
ブロック図である。

キーボード１００から入力されたデータやコマンドは、
インタフェース回路１１０を介してレジスタ１２０に入
力され、ＣＰＵ１３０に読み取られる。ＣＰＵ１３０は
、入力コマンドに応じて、メモリ１４０に格納されてい
る制御プログラムを実行する。メモリ１４１は、後述す
る抽出キーワードテーブルを、メモリ１４２は１文書デ
ータを格納するメモリである。メモリ１４１，１４２の
内容は、「文書呼出し」コマンドによって、文書ファイ
ル１５０からそれぞれのメモリに展開され。

「文書格納」コマンドによってそれぞ九のメモリから文
書ファイル１５０に格納される。キーワード辞＄１５１
は、後述するキーワード抽出機能で用いる。

文書編集機能によって、メモリ１４２の文書データが更
新されると、ＣＰＵ１３０は、編集形式の文書データを
表示データに変換し、ビット・マツプ・プロセッサ（Ｂ
ＭＰ）１６０に順次転送する。ＢＭＰ１６０は１表示デ
ータをフレームメモリ１７０上に展開し、ＣＲＴコント
ローラ１８０が上記フレームメモリ１７０の内容を順次
読み出して、Ｃ：ＲＴ１９０上へ展開する。

第３図は、（：ＲＴ１９０の画面例、第４図は。

メモリ１４１に格納される抽出キーワードテーブルの構
成、第５図は、キーワード辞書１５１の構成例を示す図
である。以下、第１図に示す、キーワード抽出処理の流
れを第３．４．５ｒ１！Ｉを用いて説明する。

文書作成者は、ＣＲＴ１９０上で、カーソル移動キーを
用いて、編集対象の文字列を指定する（ステップ１０）
、第３図の、文字３１０．および文字３２０の位置を指
定することによって、「コンビニ・・・管理」の文字列
が選択される。次に、外り作成者は、Ｗ＊機能を入力す
る。入力された機能にしたがって、対応する編集処理へ
分岐する（ステップ２０）。

編集処理が「強調指定」の場合、編集対象の文字列に対
して自立語解析を行う（ステップ３ｏ）。

自立語解析は、対象文字列から構成する自立語を摘出す
る処理であり、本実施例では、「コンピュータ」と「メ
モリ管理」の２つの自立語が抽出される。抽出した自立
語は、キーワード辞書１５１に登録されている用語と比
較される（キーワード適合性チエツク：ステップ４０）
。

キーワード辞Ｉ！１５１は、第５図に示すように用語の
集合で構成されている６本実施例では。

「コンピュータ」、「メモリ管理」ともキーワード辞１
１１５１内の５１０，５２０に存在するためキーワード
とする。自立語解析で認識された自立語に一致する用語
がキーワード＃１１Ｆ１５１にない場合は、その自立語
は、キーワードとしない。

ステップ４０（キーワード適合性チエツク）でキーワー
ドとすることが決定された用語は、メモトチ−プル４０
０に登録あるいは更新する（ステップ５０）、抽出キー
ワードテーブル４００は、キーワード文字列部４１０と
出現回数部４２０がら構成されている。第４図（ａ）の
場合、「コンピュータＪという文字列が２回現れたこと
を示している。この状態で、「コンピュータ」と「メモ
リ管理Ｊについて、抽出キーワードテーブル４００を更
新する場合、「コンピュータ」は、すでに登録されてい
るため、出ｌｔ回数に１加えられ、第４図（ｂ）の４３
０となる。「メモリ管理」は、抽出キーワードテーブル
４００に存在しないため、新しく登録され、出現回数１
となり、第４図（ｂ）の４４０となる。

ステップ５０終了後１編集対象文字列に対する指定機能
の処理（この場合、強ｍ＞　を行う（ステップ６０）。

ステップ２０で、「強調解除機能」の場合、自立語解析
処理（ステップ３０）を行う０本実施例では、第３図の
文字３１ｏ２文字３２０の範囲が指定された場合を述べ
る。ステップ３ｏの結果「コンピュータＪと「メモリ管
理Ｊが抽出された。

次に、メモリ４１に格納されている抽出キーワードテー
ブル４００を更新する（ステップ７０）。

第４図（ｂ）の状態では、［コンピュータ」の出現回数
を１減じ第４図（８）の４５０の状態となる。「メモリ
管理」は、出現回数が０となるため。

抽出キーワードテーブル４００から削除される。

したがって、第４１イ（ａ）の状態となる。ステップ７
０終了後、編集対象文字列に対する指定機能の処理（こ
の場合、強調解除）を行う（ステップ６０）。

ステップ２０で、「削除」の場合、削除指定文字列の中
に強調されている文字列の存在有無をチエツクする（ス
テップ８０）、存在しなければ、編集対象文字列に対す
る指定機能の処理（この場合、削除）を行う（ステップ
６０）、存在した場合、強調されている文字列を対象と
して、ステップ３０とステップ７０を行い、抽出キーワ
ードテーブル４００の整合性を保証する。第３図で１文
字３１０２文字３３０の範囲が指定された場合、ステツ
、プ８０で強調されている文字列が文字３１０と文字３
２０の間と特定される。その後の処理は、強調解除処理
で述べたものと同じとなる。

ステップ２０で、上記以外の機能の場合、編集対象文字
列に対して指定機能の処理を行う（ステップ６０）。

また、キーワード辞書１５１自身の更新は。

ＣＲＴ１９０上に、第５図に示すようなキーワード−覧
を表示し、キーワード変更者が、キーワード用語を追加
、削除することによって行われる。

また、文書検索時には、検索対象となるキーワードを文
書ファイル１５０内に格納された抽出キーワードテーブ
ル４００のキーワード文字列部４１０の用語と比較し、
一致すれば当該文書を検索に合致した文書とみなす。

以上１本実施例では、キーワードを文字列強調機能と同
期して抽出することによって求める方法を述べた。

〔発明の効果〕

以上説明したように、本発明によれば、（１）文書作成
者が、キーワードに関する特別な知識を持っていなくて
も、キーワード辞書に登録されたキーワードから自動的
に適切なキーワードを文書に付加することができる。

（２）文書作成者は、キーワード付けに関する特殊な機
能を覚える必要がなく、従来の強調機能を使用するだけ
で、キーワード付けを行うことができる。

（３）文ＩＦ編集によって１文書内容とキーワードが矛
盾することがない。

（４）キーワード候補の文字列の追加、削除が、キーワ
ード辞書の更新のみで容易に実現できる。

（５）文書のキーワードは、キーワード辞書から選ばれ
るため、汎用的キーワード付けができ１文書間の統一的
検索が容易となる。

【図面の簡単な説明】

第１図は、本発明の一実施例の処理を示す流れ図、第２
図は１本発明を適用する端末装置の全体構成を示すブロ
ック図、第３図は、端末装置の画面表示例を示す図、第
４図は、抽出キーワードテーブルの構成を示す図、第５
図は、キーワード辞書の構成を示す図である６１００−・・キーボード、１３Ｏ−ＣＰＵ、１５０−・
・文書ファイル、１５１・・・キーワード辞書、１６０
・・・ビットマツプ・プロセッサ、１７０・・・フレー
ムメモリ、１９０・・・ＣＲＴ、４００・・・抽出キー
ワードテーブル。妬Ｉ図老 λ

Claims

【特許請求の範囲】１、文字列及びコマンドの入力装置と文書を構成する頁
の表示装置を持つ文書編集装置において、キーワード候
補の用語をあらかじめ登録しておくキーワード辞書と、
文書のキーワードの当該文書内での出現回数を管理する
抽出キーワードテーブルを持ち、文字列強調機能指定時
に編集対象文字列から自立語を抽出する手段と、抽出さ
れた自立語を該キーワード辞書と比較してキーワードと
なり得るかを判断する手段と、キーワードとなり得る自
立語を該抽出キーワードテーブルに登録、出現回数更新
を行う手段と、文書内容と共に該抽出キーワードテーブ
ルを格納する手段を有することによつて、キーワードの
自動抽出を可能としたことを特徴とするキーワード抽出
方式。２、文字列及びコマンドの入力装置と文書を構成する頁
の表示装置を持つ文書編集装置において、文字列強調解
除機能及び文字列削除機能指定時に、編集対象文字列か
ら自立語を抽出する手段と、抽出した自立語を特許請求
範囲第１項に記載した抽出キーワードテーブルに格納さ
れているキーワードと比較し、その出現回数を更新する
手段を有することにより、文書内容とキーワードとの整
合性を保証することを特徴とするキーワード抽出方式。３、文字列及びコマンドの入力装置と文書を構成する頁
の表示装置を持つ文書編集装置において、特許請求範囲
第１項に記載したキーワード辞書の更新手段を有するこ
とにより、キーワード候補の用語の変更を可能としたこ
とを特徴とするキーワード抽出装置。４、文字列及びコマンドの入力装置と文書を構成する頁
の表示装置を持つ文書編集装置において、文書検索時に
、文書と共に格納されている特許請求範囲第１項に記載
した抽出キーワードテーブルの内容を対象として検索を
行う手段を有することを特徴とするキーワード抽出方式
。