JPS6349929A - キ−ワ−ド抽出装置 - Google Patents
キ−ワ−ド抽出装置Info
- Publication number
- JPS6349929A JPS6349929A JP61194305A JP19430586A JPS6349929A JP S6349929 A JPS6349929 A JP S6349929A JP 61194305 A JP61194305 A JP 61194305A JP 19430586 A JP19430586 A JP 19430586A JP S6349929 A JPS6349929 A JP S6349929A
- Authority
- JP
- Japan
- Prior art keywords
- word
- text
- keyword
- kana
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 28
- 235000016496 Panda oleosa Nutrition 0.000 claims abstract description 12
- 240000000220 Panda oleosa Species 0.000 claims abstract description 12
- 238000000605 extraction Methods 0.000 claims description 36
- 239000000284 extract Substances 0.000 abstract description 9
- 238000000034 method Methods 0.000 description 11
- 238000012937 correction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 235000013305 food Nutrition 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
文書ファイリング装置等において、登録する文書に対し
て次回の検索を効率的に行うために各文書に対してキー
ワードを設定することが一般に行われている。本発明は
前記キーワードを文書テキストから半自動的に抽出する
キーワード抽出装置に関するものである。
て次回の検索を効率的に行うために各文書に対してキー
ワードを設定することが一般に行われている。本発明は
前記キーワードを文書テキストから半自動的に抽出する
キーワード抽出装置に関するものである。
従来の技術
近年光ディスクのような大容量の記憶装置を用いた文書
ファイリング装置の需要が特に0人(オフィスオートメ
ーシぢン)の分野で高まっている。
ファイリング装置の需要が特に0人(オフィスオートメ
ーシぢン)の分野で高まっている。
これらの文書ファイリング装置等では、記憶装置に格納
する文書情報に対し、後の検索処理を迅速かつ効率的に
行うため、文書登録時に検索キー情報として文書キーワ
ードを加えることが一般に行われている。この際、オペ
レータが自ら登録文書の文意を解釈してキーワードを設
定するものに加えて、現在では文書テキストから半自動
的にキーワード候補を抽出するものがあり、キーワード
登録処理作業を効率的に行えるようにしている。
する文書情報に対し、後の検索処理を迅速かつ効率的に
行うため、文書登録時に検索キー情報として文書キーワ
ードを加えることが一般に行われている。この際、オペ
レータが自ら登録文書の文意を解釈してキーワードを設
定するものに加えて、現在では文書テキストから半自動
的にキーワード候補を抽出するものがあり、キーワード
登録処理作業を効率的に行えるようにしている。
第5図は従来のキーワード抽出装置の構成を表すブロッ
ク図である。
ク図である。
1はキー入力部であり、日本語の読みに対応したJ工9
配列のキーを持つキーボード装置で構成されている。こ
れにより、オペレータが入力を意図した日本語漢字かな
混じり文の読みをコード列として入力する。また、以降
で説明する「かな漢字変換処理」に必要とされる変換キ
ー、同音語選択のための番号指示キーを持ち、各々に対
応したコードを出力する。2は文字表示部であり、日本
語の漢字もしくは仮名よりなる日本語文字表記(以降テ
キストとも称する)をCRT画面上に出力表示する。3
はかな漢字変換部であり、前記キー入力部1から入力さ
れた文節単位の日本語の読みコード列を漢字仮名混じり
の文字表記列に変換する。同時に、文節内の自立語区切
り情報を出力漢字かな混じり列に対応づけて出力する。
配列のキーを持つキーボード装置で構成されている。こ
れにより、オペレータが入力を意図した日本語漢字かな
混じり文の読みをコード列として入力する。また、以降
で説明する「かな漢字変換処理」に必要とされる変換キ
ー、同音語選択のための番号指示キーを持ち、各々に対
応したコードを出力する。2は文字表示部であり、日本
語の漢字もしくは仮名よりなる日本語文字表記(以降テ
キストとも称する)をCRT画面上に出力表示する。3
はかな漢字変換部であり、前記キー入力部1から入力さ
れた文節単位の日本語の読みコード列を漢字仮名混じり
の文字表記列に変換する。同時に、文節内の自立語区切
り情報を出力漢字かな混じり列に対応づけて出力する。
本従来例では、文節単位の読み入力に対しこれを漢字か
な混じり文字表記に変換するいわゆる文節分かち書き入
力方式のかな漢字変換を実施しており、オペレータは文
節の区切シ毎に変換キーを押下し、変換指示コードをキ
ー入力部1から入力する。この変換キーの打鍵のタイミ
ングでこのかな漢字変換部3は起動されるっ4はテキス
ト入力部でるり、前記キー入力部1から入力された日本
語読みコード列を一時記憶した後変換指示コードが入力
されるタイミングでこれを前記かな漢字変換部3に出力
し、対応する漢字かな混じり表記列を得る。同時に1前
記かな漢字変換部3から出力される文節内単語表記情報
を同時に得る。これらのうち、漢字かな混じり表記列を
前記文字表示部2に出力しオペレータに対して表示する
。5はテキスト記憶部であり、前記テキスト入力部4か
ら得られた漢字かな混じり列、いわゆるテキスト情報を
格納する。6はテキスト分割部であり、前記テキスト記
憶部已に格納されたテキスト情報を内部に保持している
テキスト分割辞書と漢字表記をキーとする単語辞書を参
照することで単語(自立語)および付属語列に分割する
。分割されたテキストは後述するキーワード抽出部に出
力される。7はキーワード抽出部であり、前記テキスト
分割部6で付加された単語表記情報をもとに、前記テキ
スト記憶部6に格納されたテキストの中の単語表記のみ
を抽出し、不要語と認定される単語を除いた上で出現頻
度が高いものから順に出力する。8は抽出指示装置であ
り、オペレータからのキーワード抽出指示キー押下の操
作により前記テキスト分割部6、キーワード抽出部子を
順に起動する。9はキーワード−時記憶部であり、前記
キーワード抽出部7から抽出されたキーワード候補をテ
キスト中で頻度が高い順に格納する。10はキーワード
出力部であり、前記キーワード−時記憶部9に格納され
たキーワードを各々に番号を対応づけて出力表示する。
な混じり文字表記に変換するいわゆる文節分かち書き入
力方式のかな漢字変換を実施しており、オペレータは文
節の区切シ毎に変換キーを押下し、変換指示コードをキ
ー入力部1から入力する。この変換キーの打鍵のタイミ
ングでこのかな漢字変換部3は起動されるっ4はテキス
ト入力部でるり、前記キー入力部1から入力された日本
語読みコード列を一時記憶した後変換指示コードが入力
されるタイミングでこれを前記かな漢字変換部3に出力
し、対応する漢字かな混じり表記列を得る。同時に1前
記かな漢字変換部3から出力される文節内単語表記情報
を同時に得る。これらのうち、漢字かな混じり表記列を
前記文字表示部2に出力しオペレータに対して表示する
。5はテキスト記憶部であり、前記テキスト入力部4か
ら得られた漢字かな混じり列、いわゆるテキスト情報を
格納する。6はテキスト分割部であり、前記テキスト記
憶部已に格納されたテキスト情報を内部に保持している
テキスト分割辞書と漢字表記をキーとする単語辞書を参
照することで単語(自立語)および付属語列に分割する
。分割されたテキストは後述するキーワード抽出部に出
力される。7はキーワード抽出部であり、前記テキスト
分割部6で付加された単語表記情報をもとに、前記テキ
スト記憶部6に格納されたテキストの中の単語表記のみ
を抽出し、不要語と認定される単語を除いた上で出現頻
度が高いものから順に出力する。8は抽出指示装置であ
り、オペレータからのキーワード抽出指示キー押下の操
作により前記テキスト分割部6、キーワード抽出部子を
順に起動する。9はキーワード−時記憶部であり、前記
キーワード抽出部7から抽出されたキーワード候補をテ
キスト中で頻度が高い順に格納する。10はキーワード
出力部であり、前記キーワード−時記憶部9に格納され
たキーワードを各々に番号を対応づけて出力表示する。
11はキーワード修正部であり、前記キーワード抽出部
7から出力されたキーワード候補群のうちオペレータが
意図しなかったものを削除し、また新たに追加したいも
のを前記テキスト入力部4を起動して追加する。
7から出力されたキーワード候補群のうちオペレータが
意図しなかったものを削除し、また新たに追加したいも
のを前記テキスト入力部4を起動して追加する。
以上のように構成された従来のキーワード抽出装置にお
いては、テキスト入力部4を用いて入力された文書タイ
トノペ抄録、文書全体等、特定の単位のテキスト情報を
テキスト記憶部6に一時記憶した後、テキスト分割部6
およびキーワード抽出部7を起動しキーワード抽出処理
を行いその結果をキーワード−時記憶部9に出力し、そ
の後キーワード出力部1oに表示させていた。その後出
力されたキーワード全オペレータがキーワード修正部1
1の機能を用いて、マニュアルで修正、追加、削除を行
い最終的なキーワードを決定していた。
いては、テキスト入力部4を用いて入力された文書タイ
トノペ抄録、文書全体等、特定の単位のテキスト情報を
テキスト記憶部6に一時記憶した後、テキスト分割部6
およびキーワード抽出部7を起動しキーワード抽出処理
を行いその結果をキーワード−時記憶部9に出力し、そ
の後キーワード出力部1oに表示させていた。その後出
力されたキーワード全オペレータがキーワード修正部1
1の機能を用いて、マニュアルで修正、追加、削除を行
い最終的なキーワードを決定していた。
発明が解決しようとする問題点
しかしながら、以上のように構成された従来のキーワー
ド抽出装置においては、オペレータはキーワード抽出の
対象となる原テキストをテキスト情報のみで記憶してい
たので、いったん入力されたテキストを分割しそのなか
から単語を抽出しなければならなかった。このために通
常、テキスト分割を行うだめの区切り辞書と単語を得る
だめの単語辞書を維持していなければならなかった。従
来例でいうと、テキスト分割部6がこの辞書を維持して
いることになる。
ド抽出装置においては、オペレータはキーワード抽出の
対象となる原テキストをテキスト情報のみで記憶してい
たので、いったん入力されたテキストを分割しそのなか
から単語を抽出しなければならなかった。このために通
常、テキスト分割を行うだめの区切り辞書と単語を得る
だめの単語辞書を維持していなければならなかった。従
来例でいうと、テキスト分割部6がこの辞書を維持して
いることになる。
これを以下もう少し具体的に説明する。キーワ−ド抽出
装置の実現上の課題だと考えられているもののうちの一
つとして、与えられたテキスト列からテキストに含まれ
ている単語を抽出することが挙げられる。このために、
従来のシステムではテキスト分割のための区切り辞書、
区切られたテキスト列から単語を抽出するための単語辞
書を保持している。後者の辞書は単語の漢字表記をキー
に検索できるものである。一般に前者は比較的サイズが
小さくあまり問題にならなかったが、後者はかな漢字変
換用の辞書に匹敵するサイズが必要とされ、システム実
施上では大きな間層とされていた。
装置の実現上の課題だと考えられているもののうちの一
つとして、与えられたテキスト列からテキストに含まれ
ている単語を抽出することが挙げられる。このために、
従来のシステムではテキスト分割のための区切り辞書、
区切られたテキスト列から単語を抽出するための単語辞
書を保持している。後者の辞書は単語の漢字表記をキー
に検索できるものである。一般に前者は比較的サイズが
小さくあまり問題にならなかったが、後者はかな漢字変
換用の辞書に匹敵するサイズが必要とされ、システム実
施上では大きな間層とされていた。
本発明は、前記従来のキーワード抽出装置の問題に鑑み
、オペレータが自らかな漢字変換手段によって入力した
テキストについては、かな漢字変換を行った時点におい
て判明した単語の情報を記憶しておくことにより、単語
ための大規模な単語辞書を保持することなく、また既に
判っている単語表記の情報を有効に活用することで、目
的のキーワード抽出を高速に実施するキーワード抽出装
置を提供することを目的としている。
、オペレータが自らかな漢字変換手段によって入力した
テキストについては、かな漢字変換を行った時点におい
て判明した単語の情報を記憶しておくことにより、単語
ための大規模な単語辞書を保持することなく、また既に
判っている単語表記の情報を有効に活用することで、目
的のキーワード抽出を高速に実施するキーワード抽出装
置を提供することを目的としている。
問題点を解決するだめの手段
本発明は、日本語の読みをコードで入力するキー入力部
と、前記キー入力部から入力された読みコード列を漢字
かな混じり列に変換し出力するとともに、少なくとも認
定された単語の表記情報を出力するかな漢字変換部と、
前記かな漢字変換部から出力された漢字かな混じり表記
を出力表示する文字表示装置と、前記かな漢字変換部か
ら出力された単語情報を記憶する単語情報記憶部と、前
記単語情報記憶部に格納された単語情報をもとにキーワ
ード候補を認定してこれを出力するキーワード抽出部と
、前記キーワード抽出部から出力されたキーワード候補
を出力するキーワード出力部とを有することを特徴とす
るキーワード抽出装置である。
と、前記キー入力部から入力された読みコード列を漢字
かな混じり列に変換し出力するとともに、少なくとも認
定された単語の表記情報を出力するかな漢字変換部と、
前記かな漢字変換部から出力された漢字かな混じり表記
を出力表示する文字表示装置と、前記かな漢字変換部か
ら出力された単語情報を記憶する単語情報記憶部と、前
記単語情報記憶部に格納された単語情報をもとにキーワ
ード候補を認定してこれを出力するキーワード抽出部と
、前記キーワード抽出部から出力されたキーワード候補
を出力するキーワード出力部とを有することを特徴とす
るキーワード抽出装置である。
作用
本発明は前記した構成により、オペレータがかな漢字変
換手段で日本語テキストを入力する際に得られる単語表
記情報を記憶し、これを再利用することで安価にそして
効率的にキーワードを抽出することができる。
換手段で日本語テキストを入力する際に得られる単語表
記情報を記憶し、これを再利用することで安価にそして
効率的にキーワードを抽出することができる。
実施例
第1図は本発明の一実施例におけるキーワード抽出装置
の構成をあられすブロック図である。本構成図のうち1
.2,3.4,6,6.了、8゜9.10.11は第6
図の従来例の同一番号の構成要素と同一である。12は
単語情報記憶部であり、前記テキスト入力部4から得ら
れた、単語表記情報をテキスト記憶部6のなかに格納さ
れるテキストと対応付けて格納する。この関係について
は第3図、第4図に示している。第3図は入力テキスト
の例であり、第4図は第3図に示したテキストを単語情
報記憶部12とテキスト記憶部6に分割して記憶してい
る様子を表す説明図である。
の構成をあられすブロック図である。本構成図のうち1
.2,3.4,6,6.了、8゜9.10.11は第6
図の従来例の同一番号の構成要素と同一である。12は
単語情報記憶部であり、前記テキスト入力部4から得ら
れた、単語表記情報をテキスト記憶部6のなかに格納さ
れるテキストと対応付けて格納する。この関係について
は第3図、第4図に示している。第3図は入力テキスト
の例であり、第4図は第3図に示したテキストを単語情
報記憶部12とテキスト記憶部6に分割して記憶してい
る様子を表す説明図である。
以上のように構成された本実施例のキーワード抽出装置
について、以下その動作を〔文節情報記憶〕〔キーワー
ド抽出〕〔キーワード修正〕に分けて第2図のフローチ
ャートを用いて説明する。
について、以下その動作を〔文節情報記憶〕〔キーワー
ド抽出〕〔キーワード修正〕に分けて第2図のフローチ
ャートを用いて説明する。
1o1:オペレータは入力すべきテキストを文節単位に
分けてその読みをキー入力部1から入力する。
分けてその読みをキー入力部1から入力する。
1o2:次に、所定の読みの入力を終えた時点で、オペ
レータは所望する漢字表記を得る為に変換キーをキー入
力部1において押下すると、かな漢字変換部3は内臓す
るかな漢字辞書および付属語テーブルを参照することで
、最長一致する単語から順に番号とともに変換候補を順
次出力する。
レータは所望する漢字表記を得る為に変換キーをキー入
力部1において押下すると、かな漢字変換部3は内臓す
るかな漢字辞書および付属語テーブルを参照することで
、最長一致する単語から順に番号とともに変換候補を順
次出力する。
このきい、同時に文節中の自立語表記長さ情報を出力す
る。これは、かな漢字変換処理を実施する際に、辞書検
索をしだ時点で通常得られる情報である。これらの情報
のうち漢字かな混じり表記列は文字表示部2に出力表示
されオペレータが確認できる。
る。これは、かな漢字変換処理を実施する際に、辞書検
索をしだ時点で通常得られる情報である。これらの情報
のうち漢字かな混じり表記列は文字表示部2に出力表示
されオペレータが確認できる。
103:オペレータは表示された候補のうち、自分の所
望する漢字表記を選択する。選択は番号指示キーの押下
によりそれを行う。
望する漢字表記を選択する。選択は番号指示キーの押下
によりそれを行う。
104:テキスト入力部4は入力された文節単位の読み
に対応する漢字かな混じり列のうちの単語表記情報を得
ると、その結果をテキストと対応付けて単語情報記憶部
12に出力する。
に対応する漢字かな混じり列のうちの単語表記情報を得
ると、その結果をテキストと対応付けて単語情報記憶部
12に出力する。
106:単語情報記憶部12は次登録情報格納番地情報
Hadを保持しており、このMadの番地に対して、入
力された単語の表記情報を逐次格納する。格納が済むと
、前記Nadを格納情報データのサイズ分だけインクリ
メントする。
Hadを保持しており、このMadの番地に対して、入
力された単語の表記情報を逐次格納する。格納が済むと
、前記Nadを格納情報データのサイズ分だけインクリ
メントする。
201:キーワード抽出部7はまず、単語情報記憶部1
2中の単語表記情報から、単語表記をデコードしてそれ
を抽出する。
2中の単語表記情報から、単語表記をデコードしてそれ
を抽出する。
2o2:次にキーワード抽出部7は抽出された単語デー
タを出現頻度順に並べかえるこの際の、頻度順は無論出
現頻度が高いものを先頭におく降順の並びである。
タを出現頻度順に並べかえるこの際の、頻度順は無論出
現頻度が高いものを先頭におく降順の並びである。
203:キーワード抽出部7は202の処理が終了する
と同時に、並べ変えられた単語列中の単語表記を、キー
ワード抽出部γ中に維持している不要語テーブルに参照
し、重要でないと解釈できる単語をテキスト中から削除
する。不要語の例としては、いわゆる形式名詞のこと、
連体詞のそのそれ等がある。
と同時に、並べ変えられた単語列中の単語表記を、キー
ワード抽出部γ中に維持している不要語テーブルに参照
し、重要でないと解釈できる単語をテキスト中から削除
する。不要語の例としては、いわゆる形式名詞のこと、
連体詞のそのそれ等がある。
204:キーワード抽出部7から抽出てれたキーワード
群はキーワード−時記憶部9に出力されその結果はキー
ワード出力部1゜にキーワード番号とともに出力表示さ
れる。そののち、システムは再び入力待ち状態に戻る。
群はキーワード−時記憶部9に出力されその結果はキー
ワード出力部1゜にキーワード番号とともに出力表示さ
れる。そののち、システムは再び入力待ち状態に戻る。
〔キーワード修正〕
3o1:オペレータがキーワードの修正を意図する時は
、キーワード修正部11の追加、削除キーを押下すると
ともにキーワード番号を入力する。
、キーワード修正部11の追加、削除キーを押下すると
ともにキーワード番号を入力する。
3o2:キーワード修正部11は押下されたキーを判定
し、それが削除キーの場合は303、追加キーの場合3
04に制御を移す。
し、それが削除キーの場合は303、追加キーの場合3
04に制御を移す。
303:削除キーが押下されると、キーワード修正部1
1は指定の番号のキーワード候補をキーワード−時記憶
部9から削除しその結果をキーワード出力部10に表示
する。その後再び入力待ち状態に戻る。
1は指定の番号のキーワード候補をキーワード−時記憶
部9から削除しその結果をキーワード出力部10に表示
する。その後再び入力待ち状態に戻る。
3Q4:追加キーが押下されると、キーワード修正部1
1はテキスト入力部4を起動し、テキスト入力と同じ手
段を用いて、新たにキーワードをかな漢字変換手段を用
いて入力する。入力されたキーワードは指定された番号
でキーワードとしてキーワード−時記憶部9に登録され
る。その後再び入力待ち状態に戻る。
1はテキスト入力部4を起動し、テキスト入力と同じ手
段を用いて、新たにキーワードをかな漢字変換手段を用
いて入力する。入力されたキーワードは指定された番号
でキーワードとしてキーワード−時記憶部9に登録され
る。その後再び入力待ち状態に戻る。
以上のように本実施例によれば、キーワードの優先順位
をテキスト中の頻度を用いて判定し、その項に表示して
いるのでオペレータの抽出キーワード確認作業の負荷を
軽減している。また、単語表記情報として、テキスト記
憶部内のテキスト情報と対応づけだ単語表記アドレスと
その長さの情報を持つことで、単語情報の必要とする記
憶容量を小さくしている。
をテキスト中の頻度を用いて判定し、その項に表示して
いるのでオペレータの抽出キーワード確認作業の負荷を
軽減している。また、単語表記情報として、テキスト記
憶部内のテキスト情報と対応づけだ単語表記アドレスと
その長さの情報を持つことで、単語情報の必要とする記
憶容量を小さくしている。
なお、本実施例においてはキーワード抽出処理として単
語単位に区切られたテキストから不要語を取り除く方式
を用いているがキーワード抽出処理方式を特にこれに限
定するものではなく、統計情報を利用したり、かかり解
析その他の構文、意味解析手法を用いたものであっても
よい。
語単位に区切られたテキストから不要語を取り除く方式
を用いているがキーワード抽出処理方式を特にこれに限
定するものではなく、統計情報を利用したり、かかり解
析その他の構文、意味解析手法を用いたものであっても
よい。
また、本実施例においては、かな漢字変換方式として「
文節分かち書き入力」方式を採用しているが、これが他
の変換方式であっても購わない。
文節分かち書き入力」方式を採用しているが、これが他
の変換方式であっても購わない。
また、本実施例においては、単語表記情報としてテキス
ト記憶部内へのポインタ情報と単語表記長さ情報にて記
憶していたが、単語表記データそのもので記憶するもの
であってもよい。
ト記憶部内へのポインタ情報と単語表記長さ情報にて記
憶していたが、単語表記データそのもので記憶するもの
であってもよい。
また、かな漢字変換結果の確定方法は本実施例で行って
いる番号指定による方法に限るものではない。
いる番号指定による方法に限るものではない。
また、本実施例においては単語表記情報を格納する単語
情報記憶部がテキスト記憶部と別になっているが、これ
をテキスト情報記憶部と兼ねるものにしても構わない。
情報記憶部がテキスト記憶部と別になっているが、これ
をテキスト情報記憶部と兼ねるものにしても構わない。
また、本実施例ではキーワードとして単語表記全抽出し
ているが、単語読みを抽出するものであってもよい。
ているが、単語読みを抽出するものであってもよい。
発明の詳細
な説明したように、本発明によればキーワード抽出処理
を安価に実現し、しかも高速に処理することができる。
を安価に実現し、しかも高速に処理することができる。
を表すフローチャート、第3図および第4図は単語情報
記憶部とテキスト記憶部の対応を示す説明図、第6図は
従来のキーフード抽出装置のブロック図である。 1・・・・・・キー入力部、2・・・・・・文字表示部
、3・・・・・・かな漢字変換部、4・・・・・・テキ
スト入力部、5・・・・・・テキスト記憶部、7・・・
・・・キーワード抽出部、8・・・・・・抽出指示装置
、9・・・・・・キーワード−時記憶部、1o・・・・
・・キーフード出力部、11・・・・・キーフード修正
部、12・・・・・・単語情報記憶部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第 3 因 第 4 図 j着V−硫己i匝 テキスH稈Iと常艶第
5図
記憶部とテキスト記憶部の対応を示す説明図、第6図は
従来のキーフード抽出装置のブロック図である。 1・・・・・・キー入力部、2・・・・・・文字表示部
、3・・・・・・かな漢字変換部、4・・・・・・テキ
スト入力部、5・・・・・・テキスト記憶部、7・・・
・・・キーワード抽出部、8・・・・・・抽出指示装置
、9・・・・・・キーワード−時記憶部、1o・・・・
・・キーフード出力部、11・・・・・キーフード修正
部、12・・・・・・単語情報記憶部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第 3 因 第 4 図 j着V−硫己i匝 テキスH稈Iと常艶第
5図
Claims (1)
- 日本語の読みをコードで入力するキー入力部と、前記キ
ー入力部から入力された読みコード列を漢字かな混じり
列に変換し出力するとともに、少なくとも認定された単
語の表記情報を出力するかな漢字変換部と、前記かな漢
字変換部から出力された漢字かな混じり表記を出力表示
する文字表示装置と、前記かな漢字変換部から出力され
た単語情報を記憶する単語情報記憶部と、前記単語情報
記憶部に格納された単語情報をもとにキーワード候補を
認定してこれを出力するキーワード抽出部と、前記キー
ワード抽出部から出力されたキーワード候補を出力する
キーワード出力部とを有することを特徴とするキーワー
ド抽出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61194305A JPS6349929A (ja) | 1986-08-20 | 1986-08-20 | キ−ワ−ド抽出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61194305A JPS6349929A (ja) | 1986-08-20 | 1986-08-20 | キ−ワ−ド抽出装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6349929A true JPS6349929A (ja) | 1988-03-02 |
Family
ID=16322390
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61194305A Pending JPS6349929A (ja) | 1986-08-20 | 1986-08-20 | キ−ワ−ド抽出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6349929A (ja) |
-
1986
- 1986-08-20 JP JP61194305A patent/JPS6349929A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2633824B2 (ja) | 仮名漢字変換装置 | |
JPS58114225A (ja) | 仮名漢字変換入力方式 | |
JPS61248160A (ja) | 文書情報登録方式 | |
JPS6349929A (ja) | キ−ワ−ド抽出装置 | |
JPH08147289A (ja) | かな漢字変換システム及びかな漢字変換方法 | |
JPS6349928A (ja) | キ−ワ−ド抽出装置 | |
JPS6057422A (ja) | 文書目次索引作成装置 | |
JPS6175952A (ja) | 文書入力処理方式 | |
JPS62163174A (ja) | 機械翻訳装置 | |
JPS60129874A (ja) | 日本語文字入力装置 | |
JP2766084B2 (ja) | 仮名漢字変換方法 | |
JPH0836395A (ja) | 音声データの生成方法及び文書読上装置 | |
JPS58159133A (ja) | カナ漢字変換処理方式 | |
JPS6349930A (ja) | キ−ワ−ド抽出装置 | |
JPH08272780A (ja) | 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法 | |
JPH0683807A (ja) | 文書作成装置 | |
JPH0414168A (ja) | 文書作成装置 | |
JP2634596B2 (ja) | かな漢字変換装置 | |
JP3048793B2 (ja) | 文字変換装置 | |
JPH0442350A (ja) | 文字処理装置 | |
JPS5998236A (ja) | 日本文入力装置 | |
JPS61223977A (ja) | 翻訳処理装置 | |
JPS61169961A (ja) | ユ−ザ辞書を備えた文字処理装置 | |
JPH0498449A (ja) | 単漢字変換装置 | |
JPH0683806A (ja) | 文書作成装置 |