JPH038070A - キーワード抽出方式 - Google Patents

キーワード抽出方式

Info

Publication number
JPH038070A
JPH038070A JP1100064A JP10006489A JPH038070A JP H038070 A JPH038070 A JP H038070A JP 1100064 A JP1100064 A JP 1100064A JP 10006489 A JP10006489 A JP 10006489A JP H038070 A JPH038070 A JP H038070A
Authority
JP
Japan
Prior art keywords
keyword
document
character string
extracted
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1100064A
Other languages
English (en)
Inventor
Kunihiro Yanagi
柳 邦宏
Nobutake Sato
信丈 佐藤
Tetsuo Kanefusa
金房 徹郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Hitachi Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd, Hitachi Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP1100064A priority Critical patent/JPH038070A/ja
Publication of JPH038070A publication Critical patent/JPH038070A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文書編集方式に係わり、特に作成済み文書の検
索に用いるキーワードを1文書作成時に文字列中から抽
出する処理方式に関する。
〔従来の技術〕
従来の文書キーワード入力は、特開昭62−17102
8 (従来例1)に示すように、文書作成時に。
キーワード登録機能を持ち、作成者が、文字列入力とと
もに、キーワード登録機能を用いて登録する方法がある
。また、特開昭62−171029 (従来例2)に示
すように、仮名漢字変換辞書の中にキーワード情報を持
つことによって、仮名漢字変換と同時に、キーワード登
録を行う方法が知られている。
〔発明が解決しようとする課題〕
上記従来技術には、以下の問題点があった。
従来例1の場合、文書作成者はキーワード登録のための
特別な機能を用いるため、新たな操作方法を覚える必要
があるとともに、文書作成中にキーワードにすべき文字
列を考えながら文書作成を進めるか、または文書作成後
、文書を見直してキーワードをつける必要があり、作成
者にキーワードのための繁雑な作業を強いるものであっ
た。
従来例2の場合、作成者はキーワード付けを意識する必
要はないが、仮名漢字変換辞書にキーワードに関する情
報を持つため、仮名漢字変換の度にキーワードに関する
処理がおこなわれ、仮名漢字変換の性能に影響を与える
。また、キーワードに関する情報を更新(追加、削除等
)しようとすると、仮名漢字辞書の更新を行う必要があ
り、作成者が自由にキーワード情報の更新を行うことが
できない。
従来例1.従来例2に共通の問題として、いったんキー
ワードとして文書に登録されると1文書編集によって、
登録されたキーワードが文書内から削除されても、キー
ワードのみが残ってしまい。
文書内容とキーワードとの整合性がとれなくなるという
問題がある。
本発明、の目的は、キーワード登録に関する特殊な機能
を持たずにキーワードが登録でき、かつ文書編集と同期
してキーワードの整合性を保証し。
キーワード候補の文字列を作成者が自由に変更できるキ
ーワード抽出方式を提供することにある。
〔課題を解決するための手段〕
上記目的は1文字列を強調する場合、その文字列は文書
の特徴を現す場合が多いことに着目し、文字列強調(ア
ンダーライン、網掛け、書体変更等)機能に、キーワー
ド抽出機能を含めることによって実現する。抽出された
キーワードは、抽出キーワードテーブルに格納され、そ
の出現回数を管理する。また、キーワードの整合性を保
証するため1文字列強調解除機能及び文字列削除機能に
も、キーワード抽出機能を持たせ、抽出キーワードテー
ブルを更新することによって、1!1合性を保証する。
〔作用〕
上述したキーワード抽出機能は、強調を指示さ懸た文字
列を解析し自立語を認識する自立語解析処理と、認識さ
れた自立語をあらかじめキーワード候補の単語を登録し
であるキーワード辞書と比較することによって、キーワ
ードとしての適合性をチエツクし、抽出キーワードテー
ブルに登録、または既登録語ならば、出現回数の更新を
行う。
また1強調解除、削除機能の場合、上記自立語解析の後
、抽出キーワードテーブルの対応するキーワードの出現
回数を更新する。このとき、出現回数が0ならば、当該
キーワードを抽出キーワードテーブルから削除する1文
書格納時には、抽出キーワードテーブルも、文書内容と
共に文書ファイルへ格納し1次回の文!編集時には、文
書ファイルに格納された抽出キーワードテーブルを用い
て編集作業を再開する。また1文書検索時には1文書フ
ァイル内の抽出キーワードテーブルの項目を検索する。
上記キーワード辞書は、例えばJIC3Tのシソーラス
集から構成されており1文書作成者が1本辞書の更新を
行うことによってキーワード候補を変更することができ
る。
C実施例〕 以下、本発明の実施例を図面に基づいて説明する。
第1図は、本発明の処理の流れを示す流れ図、第2図は
、本発明を適用する情報処理端末装置の全体構成を示す
ブロック図である。
キーボード100から入力されたデータやコマンドは、
インタフェース回路110を介してレジスタ120に入
力され、CPU130に読み取られる。CPU130は
、入力コマンドに応じて、メモリ140に格納されてい
る制御プログラムを実行する。メモリ141は、後述す
る抽出キーワードテーブルを、メモリ142は1文書デ
ータを格納するメモリである。メモリ141,142の
内容は、「文書呼出し」コマンドによって、文書ファイ
ル150からそれぞれのメモリに展開され。
「文書格納」コマンドによってそれぞ九のメモリから文
書ファイル150に格納される。キーワード辞$151
は、後述するキーワード抽出機能で用いる。
文書編集機能によって、メモリ142の文書データが更
新されると、CPU130は、編集形式の文書データを
表示データに変換し、ビット・マツプ・プロセッサ(B
MP)160に順次転送する。BMP160は1表示デ
ータをフレームメモリ170上に展開し、CRTコント
ローラ180が上記フレームメモリ170の内容を順次
読み出して、C:RT190上へ展開する。
第3図は、(:RT190の画面例、第4図は。
メモリ141に格納される抽出キーワードテーブルの構
成、第5図は、キーワード辞書151の構成例を示す図
である。以下、第1図に示す、キーワード抽出処理の流
れを第3.4.5r1!Iを用いて説明する。
文書作成者は、CRT190上で、カーソル移動キーを
用いて、編集対象の文字列を指定する(ステップ10)
、第3図の、文字310.および文字320の位置を指
定することによって、「コンビニ・・・管理」の文字列
が選択される。次に、外り作成者は、W*機能を入力す
る。入力された機能にしたがって、対応する編集処理へ
分岐する(ステップ20)。
編集処理が「強調指定」の場合、編集対象の文字列に対
して自立語解析を行う(ステップ3o)。
自立語解析は、対象文字列から構成する自立語を摘出す
る処理であり、本実施例では、「コンピュータ」と「メ
モリ管理」の2つの自立語が抽出される。抽出した自立
語は、キーワード辞書151に登録されている用語と比
較される(キーワード適合性チエツク:ステップ40)
キーワード辞I!151は、第5図に示すように用語の
集合で構成されている6本実施例では。
「コンピュータ」、「メモリ管理」ともキーワード辞1
1151内の510,520に存在するためキーワード
とする。自立語解析で認識された自立語に一致する用語
がキーワード#11F151にない場合は、その自立語
は、キーワードとしない。
ステップ40(キーワード適合性チエツク)でキーワー
ドとすることが決定された用語は、メモトチ−プル40
0に登録あるいは更新する(ステップ50)、抽出キー
ワードテーブル400は、キーワード文字列部410と
出現回数部420がら構成されている。第4図(a)の
場合、「コンピュータJという文字列が2回現れたこと
を示している。この状態で、「コンピュータ」と「メモ
リ管理Jについて、抽出キーワードテーブル400を更
新する場合、「コンピュータ」は、すでに登録されてい
るため、出lt回数に1加えられ、第4図(b)の43
0となる。「メモリ管理」は、抽出キーワードテーブル
400に存在しないため、新しく登録され、出現回数1
となり、第4図(b)の440となる。
ステップ50終了後1編集対象文字列に対する指定機能
の処理(この場合、強m> を行う(ステップ60)。
ステップ20で、「強調解除機能」の場合、自立語解析
処理(ステップ30)を行う0本実施例では、第3図の
文字31o2文字320の範囲が指定された場合を述べ
る。ステップ3oの結果「コンピュータJと「メモリ管
理Jが抽出された。
次に、メモリ41に格納されている抽出キーワードテー
ブル400を更新する(ステップ70)。
第4図(b)の状態では、[コンピュータ」の出現回数
を1減じ第4図(8)の450の状態となる。「メモリ
管理」は、出現回数が0となるため。
抽出キーワードテーブル400から削除される。
したがって、第41イ(a)の状態となる。ステップ7
0終了後、編集対象文字列に対する指定機能の処理(こ
の場合、強調解除)を行う(ステップ60)。
ステップ20で、「削除」の場合、削除指定文字列の中
に強調されている文字列の存在有無をチエツクする(ス
テップ80)、存在しなければ、編集対象文字列に対す
る指定機能の処理(この場合、削除)を行う(ステップ
60)、存在した場合、強調されている文字列を対象と
して、ステップ30とステップ70を行い、抽出キーワ
ードテーブル400の整合性を保証する。第3図で1文
字3102文字330の範囲が指定された場合、ステツ
、プ80で強調されている文字列が文字310と文字3
20の間と特定される。その後の処理は、強調解除処理
で述べたものと同じとなる。
ステップ20で、上記以外の機能の場合、編集対象文字
列に対して指定機能の処理を行う(ステップ60)。
また、キーワード辞書151自身の更新は。
CRT190上に、第5図に示すようなキーワード−覧
を表示し、キーワード変更者が、キーワード用語を追加
、削除することによって行われる。
また、文書検索時には、検索対象となるキーワードを文
書ファイル150内に格納された抽出キーワードテーブ
ル400のキーワード文字列部410の用語と比較し、
一致すれば当該文書を検索に合致した文書とみなす。
以上1本実施例では、キーワードを文字列強調機能と同
期して抽出することによって求める方法を述べた。
〔発明の効果〕
以上説明したように、本発明によれば、(1)文書作成
者が、キーワードに関する特別な知識を持っていなくて
も、キーワード辞書に登録されたキーワードから自動的
に適切なキーワードを文書に付加することができる。
(2)文書作成者は、キーワード付けに関する特殊な機
能を覚える必要がなく、従来の強調機能を使用するだけ
で、キーワード付けを行うことができる。
(3)文IF編集によって1文書内容とキーワードが矛
盾することがない。
(4)キーワード候補の文字列の追加、削除が、キーワ
ード辞書の更新のみで容易に実現できる。
(5)文書のキーワードは、キーワード辞書から選ばれ
るため、汎用的キーワード付けができ1文書間の統一的
検索が容易となる。
【図面の簡単な説明】
第1図は、本発明の一実施例の処理を示す流れ図、第2
図は1本発明を適用する端末装置の全体構成を示すブロ
ック図、第3図は、端末装置の画面表示例を示す図、第
4図は、抽出キーワードテーブルの構成を示す図、第5
図は、キーワード辞書の構成を示す図である6 100−・・キーボード、13O−CPU、150−・
・文書ファイル、151・・・キーワード辞書、160
・・・ビットマツプ・プロセッサ、170・・・フレー
ムメモリ、190・・・CRT、400・・・抽出キー
ワードテーブル。 妬 I 図 老 λ

Claims (1)

  1. 【特許請求の範囲】 1、文字列及びコマンドの入力装置と文書を構成する頁
    の表示装置を持つ文書編集装置において、キーワード候
    補の用語をあらかじめ登録しておくキーワード辞書と、
    文書のキーワードの当該文書内での出現回数を管理する
    抽出キーワードテーブルを持ち、文字列強調機能指定時
    に編集対象文字列から自立語を抽出する手段と、抽出さ
    れた自立語を該キーワード辞書と比較してキーワードと
    なり得るかを判断する手段と、キーワードとなり得る自
    立語を該抽出キーワードテーブルに登録、出現回数更新
    を行う手段と、文書内容と共に該抽出キーワードテーブ
    ルを格納する手段を有することによつて、キーワードの
    自動抽出を可能としたことを特徴とするキーワード抽出
    方式。 2、文字列及びコマンドの入力装置と文書を構成する頁
    の表示装置を持つ文書編集装置において、文字列強調解
    除機能及び文字列削除機能指定時に、編集対象文字列か
    ら自立語を抽出する手段と、抽出した自立語を特許請求
    範囲第1項に記載した抽出キーワードテーブルに格納さ
    れているキーワードと比較し、その出現回数を更新する
    手段を有することにより、文書内容とキーワードとの整
    合性を保証することを特徴とするキーワード抽出方式。 3、文字列及びコマンドの入力装置と文書を構成する頁
    の表示装置を持つ文書編集装置において、特許請求範囲
    第1項に記載したキーワード辞書の更新手段を有するこ
    とにより、キーワード候補の用語の変更を可能としたこ
    とを特徴とするキーワード抽出装置。 4、文字列及びコマンドの入力装置と文書を構成する頁
    の表示装置を持つ文書編集装置において、文書検索時に
    、文書と共に格納されている特許請求範囲第1項に記載
    した抽出キーワードテーブルの内容を対象として検索を
    行う手段を有することを特徴とするキーワード抽出方式
JP1100064A 1989-04-21 1989-04-21 キーワード抽出方式 Pending JPH038070A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1100064A JPH038070A (ja) 1989-04-21 1989-04-21 キーワード抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1100064A JPH038070A (ja) 1989-04-21 1989-04-21 キーワード抽出方式

Publications (1)

Publication Number Publication Date
JPH038070A true JPH038070A (ja) 1991-01-16

Family

ID=14264038

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1100064A Pending JPH038070A (ja) 1989-04-21 1989-04-21 キーワード抽出方式

Country Status (1)

Country Link
JP (1) JPH038070A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0785101A (ja) * 1993-09-20 1995-03-31 Fujitsu F I P Kk キーワード抽出処理装置
US6595005B1 (en) 2000-09-29 2003-07-22 Infocus Corporation Method and apparatus for measuring cooling efficacy of a fluid medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0785101A (ja) * 1993-09-20 1995-03-31 Fujitsu F I P Kk キーワード抽出処理装置
US6595005B1 (en) 2000-09-29 2003-07-22 Infocus Corporation Method and apparatus for measuring cooling efficacy of a fluid medium

Similar Documents

Publication Publication Date Title
JP3178475B2 (ja) データ処理装置
JPH0630066B2 (ja) テーブル型言語翻訳方法
JPH04229364A (ja) 強調特性変更方法及びシステム
JPH0567144A (ja) 前編集支援方法およびその装置
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
JPH038070A (ja) キーワード抽出方式
JP2991142B2 (ja) 動的部品化機能付き構造化文書データベースシステム
JPH0561758A (ja) 情報リンク装置
JP3329476B2 (ja) かな漢字変換装置
JPH01136270A (ja) ワードプロセッサ装置
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JP2990314B2 (ja) データ管理装置
JP2831837B2 (ja) 文書検索装置
JP3537260B2 (ja) リンク付文書検索表示システム
JP4109439B2 (ja) 処理装置、記録媒体及びプログラム
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JPH04148370A (ja) 文書処理装置
JPH0675958A (ja) 文書処理装置
JP2720770B2 (ja) 自動事後処理方式
JPS6367215B2 (ja)
JPH04139579A (ja) 単語検索装置
JPH05307541A (ja) かな漢字変換システム
JPH0546599A (ja) 文書作成装置
JPS6325765A (ja) 文書編集装置
JPH0351958A (ja) 電子辞書