JPH067385B2 - キ−ワ−ド自動抽出方式 - Google Patents

キ−ワ−ド自動抽出方式

Info

Publication number
JPH067385B2
JPH067385B2 JP58141038A JP14103883A JPH067385B2 JP H067385 B2 JPH067385 B2 JP H067385B2 JP 58141038 A JP58141038 A JP 58141038A JP 14103883 A JP14103883 A JP 14103883A JP H067385 B2 JPH067385 B2 JP H067385B2
Authority
JP
Japan
Prior art keywords
keyword
character string
character
buffer
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58141038A
Other languages
English (en)
Other versions
JPS6033665A (ja
Inventor
和明 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP58141038A priority Critical patent/JPH067385B2/ja
Publication of JPS6033665A publication Critical patent/JPS6033665A/ja
Publication of JPH067385B2 publication Critical patent/JPH067385B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9017Indexing; Data structures therefor; Storage structures using directory or table look-up

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、漢字仮名混り文日本文字英文字混り文等の複
数種の文字からなる文章から、検索において利用される
キーワードを自動抽出する方式に関するものである。
〔発明の背景〕
従来のキーワード自動抽出方式には、キーワードとなる
言葉があらかじめキーワード辞書としてコンピュータに
登録されていることを前提とする方式と、キーワード辞
書を用いない方式とがある。
以下複数種文字の例として漢字仮名混り文の場合を中心
に説明する。
本発明は、前者に属する従来抽出処理は、先ず日本語文
中から、付属語、接続詞、接辞などを削除し、残った文
字列を自立語として認定することが一般に行われてい
る。次に、自立語の先頭から、キーワード辞書登録語と
の比較を行い、一致すれば、自立語から、その文字列を
切りはなしてキーワードとする。切りはなされた残りの
文字列についても、先頭から、キーワード辞書登録語と
の比較を行う。一致しない場合には、一字ずつずらし
て、比較処理を繰返し、自立語中のキーワードを見つけ
ている。このような従来方式では、前方部分からキーワ
ードを見つけていくため、自立語の後部にキーワードと
すべき重要な語がある場合、その一部が、前方部分の文
字列と組み合わされてキーワードとなると、より重要な
キーワードが抽出できないことがあった。例えば、「中
央制御装置」,「端末制御装置」,「車上制御装置」に
おいて、「中央制御」,「端末制御」,「車上制御」が
キーワードとなると、「制御装置」がキーワードとなら
なかった。又、この例で、「中央制御」がキーワードと
して登録されていないと、この場合だけ、「制御装置」
がキーワードとなるといった、一貫性に欠けたキーワー
ド自動抽出であった。
〔発明の目的〕
本発明の目的は、漢字仮名混り文複数国文字混り文等か
らのキーワード自動抽出方式として、文中の熟語の後方
部分に存在するキーワード文字列を、キーワード辞書を
参照して、抽出するキーワード自動抽出装置を提供する
ことにある。
〔発明の概要〕
本文では複数種文字混り文として漢字仮名混り文の実施
例を中心に説明しているので以下漢字仮名混り文で代表
して説明する。
日本語熟語の語構成は、その後方部分に、キーワードと
なるような重要な言葉があり、その前方部分に、キーワ
ードを修飾するような言葉があることが多い。
本発明は、漢字仮名混り文中の熟語の後方部分に存在す
るキーワード文字列を抽出するため、熟語の後方部分か
ら、前方方向に、キーワード辞書に登録されているキー
ワードとの比較を行い、一致すれば、キーワードとして
抽出する方式である。
キーワード辞書として、キーワードと、その文字列の先
頭から、最初に字種(漢字,片仮名,平仮名,数字,英
字,特殊文字など)の変化点までの文字列の文字の並び
順を逆転させた文字列を見出し語とする辞書を用いてい
る。
以下に処理概要を示す。
(1)キーワード抽出の対象となる漢字仮名混り文の先頭
から、字種の変化点を調べる。
(2)字種の変化点より前方の文字列の文字の並びを逆順
にして、キーワード候補とする。
(3)キーワード辞書の見出し語のうち、キーワード候補
の先頭からの文字列と一致しているもののキーワード文
字列を取り出す。
ここで、見出し語とキーワード候補との文字列比較は、
見出し語の文字数分行う。
(4)取り出されたキーワード文字列の中で、その全文字
列が、漢字仮名混り文中に含まれており、かつ、文字数
が最も多いものをキーワードとする。
(5)上記(3)で、キーワード候補と一致するキーワード辞
書の見出し語がない場合、キーワード候補の先頭が接辞
であれば、それを削除して、再度、上記(3),(4)を行
う。
(6)抽出対象の漢字仮名混りデータ中の字種の変化点に
ついて、上記(1)〜(5)を実行する。
上記処理において、キーワード文字列の抽出方法とし
て、次の2つのいずれかを、パラメータで指定できる。
(a)上記(4)で選ばれたキーワード文字列を、そのままキ
ーワードとする。
(b)抽出対象の漢字仮名混り文中で、上記(4)で選ばれた
キーワード文字列の先頭文字と同じ字種のそれ以前の文
字列を合わせて、キーワードとする。たとえば、「今日
の日本語情報処理を解説する。」において、キーワード
辞書に、「情報処理」という文字列が登録されている
と、「情」と同じ字種の「日本語」を合わせ「日本語情
報処理」をキーワードとする。
〔発明の実施例〕
以下、本発明を実施例を参照して詳細に説明する。本発
明の一実施例のハードウエア構成を第1図に示す。第1
図における1はプロセッサ、2は磁気テープや磁気ディ
スク等のキーワード自動抽出の対象となる漢字仮名混り
文の格納メモリ、3は自動抽出されたキーワードの格納
メモリ、4はプログラムの格納メモリ、5はワークエリ
ア、6はキーワード辞書メモリ、7は接辞テーブル格納
メモリ、8はパラメータ格納メモリを表わす。
キーワード辞書メモリ6には、第2図に示す様な形式の
辞書が格納されている。つまり、各キーワードについ
て、キーワード文字列が、1種類の字種の場合には、全
文字を逆順に並べた文字列、2種類以上の字種で構成さ
れている場合には、キーワード文字列先頭から最初の字
種の変化点より前方部分のみを逆順に並べた文字列の見
出し語KAと、キーワード文字列KBとが格納されてい
る。
接辞テーブル格納メモリ7には、第3図に示す様な形式
の辞書が格納されている。つまり、各接辞について、接
辞の文字数SAと接辞文字SBとが格納されている。
パラメータ格納メモリ8には、第4図に示す様な形式の
パラメータが格納されている。キーワードとして、キー
ワード辞書に登録されているキーワード文字列と同じ文
字列を抽出する場合には、パラメータとして、1を格納
する。キーワードとして、キーワード辞書に登録されて
いるキーワード文字列を、後方の一部分とする文字列を
抽出する場合には、パラメータとして、2を格納する。
プログラムは、第5図のようなモジュール構成をとる。
後方一致キーワード抽出メイン・モジュール100で
は、接辞テーブルを、接辞テーブル格納メモリ7から、
プロセッサの主記憶装置の記憶領域SETSUJIへロードす
る処理,キーワードの抽出方法を指定するパラメータ
を、パラメータ格納メモリ8から読込み、バッファTY
PEへ格納する処理,キーワード抽出の対象となるデー
タを漢字仮名混りデータ格納メモリ2から取出し、バッ
ファAに格納する処理,抽出処理モジュールを参照し、
1キーワードを抽出する処理,抽出されたキーワード
を、抽出キーワード格納メモリ3へ出力する処理、およ
び上記抽出処理の繰返しの制御を行う。
抽出処理モジュール200では、漢字仮名混りデータか
ら、キーワード候補を切出す処理、接辞処理モジュール
を参照して、接辞を除く処理,キーワード比較処理モジ
ュールを参照して、キーワードを取出す処理を行う。
キーワード比較処理モジュール300では、キーワード
辞書を参照し、キーワード候補の先頭からの文字列の一
部を見出し語とするキーワード文字列を取出す処理と、
キーワード文字列の全ての文字が漢字仮名混り文中にあ
るもののうち、文字数が最も多いキーワード文字列を選
ぶ処理と、キーワード抽出方法を指定するパラメータに
基づきキーワードとなる文字列をキーワードして抽出す
る処理を行う。
接辞処理モジュール400は、接辞テーブルを参照し、
キーワード候補中の接辞を取り除く処理を行う。
次に、後方一致キーワード抽出処理について、「技術資
料情報検索等システムの建設」という漢字仮名混りデー
タから、「情報検索システム」というキーワードを抽出
する場合を例にとって説明する。
初めに、後方一致キーワード抽出メイン・モジュール1
00の処理内容について、第6図のフローチャートに基
づき説明する。
後方一致キーワード抽出メイン・モジュールは、起動さ
れると、接辞テーブル(第3図)を接辞テーブル格納メ
モリ7から、プロセッサ1上にローディングし、バッフ
ァSETSUJIに格納する(101)。
パラメータ(第4図)をパラメータ格納メモリ8から読
込み、バッファTYPEに格納する(102)。
次に、漢字仮名混りデータ格納メモリ2から、キーワー
ド抽出の対象となるデータ「技術資料情報検索等システ
ムの建設」を読込み、バッファAに格納する(10
3)。もし対象となるデータが漢字仮名混りデータ格納
メモリ2にないと、後方一致キーワード抽出処理メイン
モジュールの処理を終了する。読込まれたデータの文字
数をカウントし、バッファLAに格納する(104)。
例では、16を格納される。バッファKEYWに0を格
納する(105)。抽出処理モジュールを参照してキー
ワードの抽出を行う(106)。キーワードがあればバ
ッファBにキーワードが格納され、バッファKEYWに
0が格納される。キーワードがなければバッファKEY
Wに1が格納される。例では、バッファBに「情報検索
システム」が格納され、バッファKEYWに0が格納さ
れる。バッファKEYWが1ならば(107)、102
以降の処理を繰返し、1でなければ、バッファB内のキ
ーワードを、抽出キーワード格納メモリに書込む(10
8)。バッファAに、キーワード抽出の対象となる文字
列が残っていれば、104以降の処理を繰返し、残って
いなければ、103以降の処理を繰返す(109)。
例では、「の建設」という文字列について、104以降
の処理が行われる。
次に、抽出処理モジュール200の処理内容について、
第7図のフローチャートを使用して説明する。
抽出処理モジュールは、起動されると、バッファLに1
を格納する(201)。バッファLの値と、抽出対象文
字列の文字数を示すバッファLAの値を比較し(20
2)、Lが小さければ、203以降の処理を行い、等し
いか大きければ、バッファKEYWに1を格納し(21
6)、抽出処理モジュールの処理を終了する。
203では、バッファA中の漢字仮名混りデータの先頭
からL文字目以降の文字列について、漢字,片仮名,平
仮名,数字,英字,句読点などの字種の変化点を求め、
バッファAの先頭から変化点までの文字数をバッファM
に格納する。変化点がなければ、バッファA中の全文字
数をMに格納する。バッファA中の変化点より前方部分
の文字列をバッファCに格納する。例では、漢字から片
仮名への変化点を認定し、バッファMに9が格納される
と共に、バッファCに「技術資料情報検索等」が格納さ
れる。
次に、バッファCの文字列を逆順に並べ換えてバッファ
Dに格納する(204)。例では、バッファDに「等索
検報情料資術技」が格納される。
次に、バッファF1に、0を格納する(205)。
キーワード比較処理モジュールを参照して、バッファD
の文字列をキーとし、キーワード辞書を調べ、キーワー
ドがあれば、キーワード文字列をバッファBに格納する
とともに、バッファF1に1を格納し、キーワードがな
ければ、バッファF1に0を格納する(206)。例で
は、バッファF1に0が格納される。
バッファF1が1ならば、215以降の処理を行い、1
でなければ、208以降の処理を行う(207)。20
8では、バッファF2に0を格納する。次に、接辞処理
モジュールを参照して、バッファDの先頭が接辞なら
ば、バッファAおよびD中の接辞を削除するとともに、
バッファF2に1を格納し、接辞でなければ、バッファ
F2に0を格納する(209)。例では、「等」が接辞
と認定され、バッファAに、「技術資料情報検索システ
ムの建設」が格納され、バッファDに、「索検報情料資
術技」が格納され、バッファF2に1が格納される。
バッファF2が0かを判定し(210)、0ならば、2
14以降の処理を行い、0でなければ211以降の処理
を行う。211では、バッファF1に0を格納する。次
に、キーワード比較処理モジュールを参照する(21
2)。例えば、バッファBに「情報検索システム」が格
納されるとともに、バッファF1に1が格納される。
バッファF1が1かを判定し(213)、1ならば、バ
ッファAの(M+1+LD−LB)文字目以降の文字列
をバッファAの先頭から格納(215)後、抽出処理モ
ジュールの処理を終了する。バッファF1が1でなけれ
ば、バッファLに、M+1を格納し(214)、202
以降の処理を繰返す。
例では、バッファAに「の建設」が格納されて当処理モ
ジュールの処理を終了する。
次に、キーワード比較処理モジュール300の処理内容
について、第8図のフローチャートに基づき説明する。
例として、バッファDには「索検報情料資術技」が格納
されており、キーワード辞書には、キーワードとして
「日本語情報検索」,「情報検索システム」が登録され
ているものとする。
キーワード比較処理モジュールは、起動されると、バッ
ファNUMに0を格納する(301)。
キーワード辞書の見出し語の中で、バッファDの先頭か
らの文字列と一致するものの見出し語をバッファMD
に、キーワード文字列をバッファKWに、キーワードの
個数をバッファNUMに格納する(302)。例では、
バッファMDには、「索検報情語本日」と「索検報情」
とが格納され、バッファKWには、「日本語情報検索」
と「情報検索システム」とが格納され、バッファNUM
には、2が格納される。
次に、キーワード数NUMが0かを判定して、0ならば
キーワード比較処理モジュールの処理を終了し、0でな
ければ、304以降の処理を行う(304)。
304では、バッファKW中のキーワード文字列のう
ち、文字数の最も多いのをバッファBに格納する。同文
字数のキーワードが2個以上ある場合、最初にあったも
のを選ぶ。例では、バッファBに「情報検索システム」
が格納される。
次に、バッファBのキーワードの見出し語の文字数をバ
ッファLDに、キーワードの文字数をLBに格納する
(305)。例えば、バッファLDに4が、バッファL
Bに8が格納される。
次に、バッファBの文字列が、バッファAの(M+1−
LD)文字目以降,LB文字の文字列と一致するかを調
べる(306)。一致すれば、310以降の処理を行
い、一致しなければ、308以降の処理を行う(30
7)。
308では、バッファKWから、バッファBの文字列を
削除する。バッファNUMの値を1減らした(309)
後、303以降の処理を繰返す。
310では、バッファTYPEの値が1かを判定し、一
致すれば、312以降の処理ない、一致しなければ、バ
ッファAの(M+1−LD)文字目よりも先頭に近い所
で、(M+1−LD)文字目の字種と変化していれば変
化点以降、(M−LD+LB)文字目までの文字列,字
種が変化していなければ、バッファAの先頭から、(M
−LD+LB)文字目までの文字列をバッファBに格納
する(311)。例では、TYPE=1ならば、バッフ
ァBに、「情報検索システム」が格納され、TYPE≠
1ならば、バッファBに、「技術資料情報検索システ
ム」が格納される。
次に、バッファF1に、1を格納し(312)、キーワ
ード比較処理モジュールの処理を終了する。
次に、接辞処理モジュール400の処理内容について、
第9図のフローチャートに基づき説明する。例として、
バッファAには、「技術資料情報検索システムの建
設」、バッファDには「等索検報情料資術技」が格納さ
れており、接辞テーブルには、接辞として「等」が登録
されているものとする。
接辞処理モジュールは、起動されると、バッファDの先
頭からの文字列が、接辞テーブルに登録されているかを
調べる(401)。登録されているかを判定し、登録さ
れていなければ、接辞処理モジュールの処理を終了し、
登録されていれば、403以降の処理を行う(40
2)。403では、バッファDから、接辞文字列を削除
するとともに、バッファD中の文字列の文字数が格納さ
れているバッファLDから、接辞文字列の文字数を引き
算する(403)。例では、接辞「等」が、接辞テーブ
ルに登録されていることから、バッファD中の「等」が
削除され、「索検報情料資術技」が格納されるととも
に、LDは、1は引かれて、8が格納される。
次に、バッファAから、接辞文字列を削除するともに、
バッファA中の文字列の文字数が格納されているバッフ
ァLAから、接辞文字列の文字数を引き算する(40
4)。例では、バッファA中の「等」が削除され、「技
術資料情報検索システムの建設」が格納されるととも
に、バッファLAに15が格納される。
次に、バッファF2に、1を格納し(405)、接辞処
理モジュールの処理を終了する。
〔発明の効果〕
複数種字種混り文特に漢字仮名混り文中の熟語の語構成
は、その後部に基本的な概念を示す言葉があり、前部に
それを修飾する言葉があることが多い。
本発明によれば、漢字仮名混り文等からのキーワード自
動抽出方式として、文中の熟語の語部にあるキーワード
辞書に登録されている言葉を抽出することができるの
で、熟語中の基本的な概念を示す用語の抽出の際の高効
率化の効果がある。
【図面の簡単な説明】
第1図は、本発明の一実施例のハードウエア構成図、第
2図は、本発明キーワード辞書のキーワード毎の論理的
構成図、第3図は、本発明接辞テーブルの接辞毎の論理
的構成図、第4図は、本発明パラメータの論理的構成
図、第5図は、本発明実施例のソフトウエア・モジュー
ル構成を例示するブロック図、第6図は、本発明後方一
致キーワード抽出メイン・モジュールの処理手順を示す
フロー図、第7図は、本発明抽出処理モジュールの処理
手順を示すフロー図、第8図は、本発明キーワード比較
処理モジュールの処理手順を示すフロー図、第9図は、
接辞処理モジュールの処理手順を示すフロー図、第10
図は、本発明のバッファA〜Nの構成を例示した説明
図、第11図(A)は、本発明バッファSETSUJIの構成を例
示した説明図、第11図(B)は、本発明バッファTYP
Eの構成を例示した説明図である。 1…プロセッサ、2…漢字仮名混りデータ格納メモリ、
3…抽出キーワード格納メモリ、4…プログラム格納メ
モリ、5…バッファメモリ、6…キーワード辞書メモ
リ、7…接辞テーブルメモリ、8…パラメータメモリ。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】複合語からなる文章から、キーワードを抽
    出するキーワード自動抽出方式において、キーワードと
    すべき文字列を逆順に並べた文字列を登録したキーワー
    ド辞書を設けておき、前記文書を文字種の変化点で分割
    してキーワード候補となる複合語を抽出し、該複合語を
    逆順に並べた文字列と前記キーワード辞書に登録された
    文字列とを比較し、該比較の結果、前記複合語を逆順に
    並べた文字列に含まれる文字列が前記キーワード辞書に
    格納されている文字列と一致したならば、前記複合語を
    キーワードとして抽出することを特徴とするキーワード
    自動抽出方式。
  2. 【請求項2】特許請求の範囲第1項記載のキーワード自
    動抽出方式において、前記複合語を逆順に並べた文字列
    に含まれる文字列と一致する文字列が前記キーワード辞
    書に格納されていないならば、前記複合語の文字列の後
    部から接辞を抽出し、該接辞を除いたもので前記複合語
    を置換して前記比較を繰返すことを特徴とするキーワー
    ド自動抽出方式。
  3. 【請求項3】特許請求の範囲第2項記載のキーワード自
    動抽出方式において、前記置換した文字列に含まれる文
    字列が前記キーワード辞書に格納されている文字列と一
    致したならば、前記複合語の中の前記一致した文字列を
    最後部とし、前記複合語の最前部文字を最前部とした文
    字列をキーワードとして抽出するようにしたことを特徴
    とするキーワード自動抽出方式。
  4. 【請求項4】複数種の文字混じり文から、キーワードを
    抽出するキーワード自動抽出方式において、キーワード
    とすべき第1の文字列と該第1の文字列に引き続く第2
    の文字列とを登録したキーワード辞書を予め設け、前記
    複数種混じり文の字種の変化点より前方部分の文字列を
    キーワード候補として抽出し、該キーワード候補を前記
    キーワード辞書に登録されている第1の文字列とを比較
    し、該比較の結果一致が検出されたとき、一致が検出さ
    れた第1の文字列に引き続く第2の文字列が前記キーワ
    ード辞書に登録されているか否かを調べ、登録されてい
    れば、前記キーワード候補の後方に前記第2の文字列と
    一致する文字列が有るか否かを調べ、前記第2の文字列
    と一致する文字列が有れば前記第1の文字列と前記第2
    の文字列に一致する文字列とからなる連続文字列をキー
    ワードとして抽出することを特徴とするキーワード自動
    抽出方式。
  5. 【請求項5】特許請求の範囲第4項記載のキーワード自
    動抽出方式において、キーワードとなる文字列が同一字
    種である場合には該文字列の文字の並びを逆順にした文
    字列を前記第1の文字列とし、キーワードとなる文字列
    が複数字種からなる場合には該文字列の先頭から最初の
    字種の変化点までの文字の並びを逆順にした文字列を前
    記第1の文字列、前記変化転以降の文字列を前記第2の
    文字列として前記キーワード辞書に登録されることを特
    徴とするキーワード自動抽出方式。
JP58141038A 1983-08-03 1983-08-03 キ−ワ−ド自動抽出方式 Expired - Lifetime JPH067385B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58141038A JPH067385B2 (ja) 1983-08-03 1983-08-03 キ−ワ−ド自動抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58141038A JPH067385B2 (ja) 1983-08-03 1983-08-03 キ−ワ−ド自動抽出方式

Publications (2)

Publication Number Publication Date
JPS6033665A JPS6033665A (ja) 1985-02-21
JPH067385B2 true JPH067385B2 (ja) 1994-01-26

Family

ID=15282786

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58141038A Expired - Lifetime JPH067385B2 (ja) 1983-08-03 1983-08-03 キ−ワ−ド自動抽出方式

Country Status (1)

Country Link
JP (1) JPH067385B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0786890B2 (ja) * 1985-02-28 1995-09-20 有限会社日本社会医療研究所 治験例記憶装置
JPS61243531A (ja) * 1985-04-22 1986-10-29 Nec Corp 情報検索方式
JPH069055B2 (ja) * 1986-06-20 1994-02-02 三洋電機株式会社 情報フアイル装置
JPS6327000A (ja) * 1986-07-18 1988-02-04 柏木パイル織物株式会社 帯電除去具の製造方法
JPS6326999A (ja) * 1986-07-18 1988-02-04 柏木パイル織物株式会社 帯電除去具
JPH0750487B2 (ja) * 1986-11-26 1995-05-31 松下電器産業株式会社 情報抽出装置
US4913952A (en) * 1988-11-14 1990-04-03 Milliken Research Corporation Carpet composites, having improved static electricity characteristics
JPH03105000U (ja) * 1990-02-14 1991-10-30
NL9101285A (nl) * 1991-07-23 1993-02-16 Oce Nederland Bv Inrichting en werkwijze voor het bepalen van gegevens van samengestelde woorden.
JP3464055B2 (ja) * 1994-09-29 2003-11-05 株式会社リコー キーワード抽出装置
KR101254362B1 (ko) * 2007-05-18 2013-04-12 엔에이치엔(주) 공통 접사를 이용한 키워드 순위를 제공하는 방법 및시스템

Also Published As

Publication number Publication date
JPS6033665A (ja) 1985-02-21

Similar Documents

Publication Publication Date Title
JPH0724055B2 (ja) 単語分割処理方法
US5745745A (en) Text search method and apparatus for structured documents
EP0378848A2 (en) Method for use of morphological information to cross reference keywords used for information retrieval
WO2000004459A1 (en) Proper name identification in chinese
JPH1153384A (ja) キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
JPH067385B2 (ja) キ−ワ−ド自動抽出方式
JP3022539B1 (ja) 文書検索装置
JPS6359660A (ja) 情報処理装置
JP2693914B2 (ja) 検索システム
CN114297143A (zh) 一种搜索文件的方法、显示文件的方法、装置及移动终端
JP3497243B2 (ja) 文書検索方法及び装置
CN110347804B (zh) 一种线性时间复杂度的敏感信息检测方法
JP4682627B2 (ja) 文書検索装置および方法
JP3398729B2 (ja) キーワード自動抽出装置およびキーワード自動抽出方法
JPS61248160A (ja) 文書情報登録方式
JP2002132789A (ja) 文書検索方法
JPS58201140A (ja) 文書作成装置
JPH0668159A (ja) 検索装置
JPH09212523A (ja) 全文検索方法
JPH07296005A (ja) 日本語テキスト登録・検索装置
JP2751681B2 (ja) 文書検索装置
JPH06309368A (ja) 文書検索装置
JPH0816600A (ja) 構造化文書検索方法
JP2924295B2 (ja) 検索装置
JPH08221443A (ja) 漢字を含むテキストの検索方法及び装置