JPH04364578A - 電子式ファイル検索方式 - Google Patents

電子式ファイル検索方式

Info

Publication number
JPH04364578A
JPH04364578A JP3139388A JP13938891A JPH04364578A JP H04364578 A JPH04364578 A JP H04364578A JP 3139388 A JP3139388 A JP 3139388A JP 13938891 A JP13938891 A JP 13938891A JP H04364578 A JPH04364578 A JP H04364578A
Authority
JP
Japan
Prior art keywords
search
data
file
synonym
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3139388A
Other languages
English (en)
Inventor
Kaoru Fukuda
福田 かおる
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3139388A priority Critical patent/JPH04364578A/ja
Publication of JPH04364578A publication Critical patent/JPH04364578A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は電子式ファイル検索方式
に関し、特に電子式ファイリング装置等を使用し社内文
書等の比較的小規模なデータファイルを構成する場合の
検索方式に関する。
【0002】
【従来の技術】通常、電子式ファイリング装置は、文書
等のデータを格納する光ディスク部とこのデータの登録
、検索及び出力等を行なう入出力部とのハードウエアお
よびソフトウエアから構成されている。この種の電子式
ファイリング装置の検索方式は、一般的には自然言語に
よる比較的簡単なものであり、例えば次のような方法で
ある。即ち、データ登録時にこのデータを特徴ずけるい
くつかの検索言語(検索キーワード)を選んで登録して
おき、検索時はオペレータが入力した検索キーワードに
より登録されている検索キーワードと完全一致(すべて
の文字列が一致)、前方一致(前方の文字列だけが一致
)、後方一致(後方の文字列だけが一致)及び部分一致
などからデータファイルを検索している。又、一文字違
い(キーワード中の一文字が違っていても対象とする)
により検索する場合もある。
【0003】一方、電子式ファイリング装置以外の少し
規模の大きなデータベースでは、検索キーワードに付随
した類義語(意味の似よったことば)を類義語辞書ファ
イルに登録しておき、検索時は入力した検索キーワード
によりこの類義語辞書ファイルに登録されている類義語
を抽出し、検索キーワードとこの類義語とでデータファ
イルを検索している。
【0004】
【発明が解決しようとする課題】以上説明した従来例で
は、不確定な検索キーワードによる検索をある程度可能
にする面はあるが、オペレータの判断により選択した検
索キーワードだけによる検索なので、検索範囲が狭かっ
たり、検索が適切でなかったりして検索精度が不充分で
あった。又、類義語による検索方式を導入しても類義語
が多いと検索スピードが落ちたり、検索出力にノイズ(
無駄なデータ)が多かっりする問題がある。
【0005】
【課題を解決するための手段】本発明の電子式ファイル
検索方式は、検索時に入力される検索言語によりデータ
ファイルを検索する電子式ファイル検索方式において、
あらかじめ前記検索言語に付随した類義語と、前記類義
語と前記検索言語との関係の強さを示すレベル区分とを
登録しておき、検索時に前記検索言語と前記レベル区分
とを入力して検索出力を得る。
【0006】又、、本発明の電子式ファイル検索方式は
、文書のデータを格納するデータファイルと、前記デー
タファイルの検索言語に付随した類義語と前記検索言語
と前記類義語との関係の強さを示す前記類義語に付され
たレベル区分とを格納する類義語辞書ファイルと、オペ
レータからの入力を受付け前記データファイルと前記類
義語辞書ファイルへの登録或いは検索の実行を命令する
手段とを備え、あらかじめ前記データの登録時に登録デ
ータの前記検索言語と前記類義語と前記レベル区分とを
前記オペレータより入力し、検索時には前記検索言語と
前記レベル区分とを入力し、前記検索言語と前記レベル
区分の付された前記類義語とによる検索出力を得る。
【0007】
【実施例】次に本発明の実施例につき図を参照して説明
する。
【0008】図1は一実施例の構成を示すブロック図で
ある。ここに示すのは電子ファイリング装置の例で、デ
ータファイル5は光ディスク等の記憶媒体を用いて文書
等のデータを格納するファイルである。類義語辞書ファ
イル3はデータファイル5を検索するための検索キーワ
ードと、これに付随した類義語と、検索キーワードと類
義語との関係の強さを示す類義語に付されたレベル区分
とを格納するファイルである。データファイル管理シス
テム4は、データファイル5へのデータの登録、検索及
び読出しを実行するプログラムで構成される。類義語辞
書アクセス機構2は、類義語辞書ファイル3への検索キ
ーワードと、これに付随した類義語と、レベル区分の登
録および検索、読出しを実行するためのプログラムで構
成される。アプリケーションプログラム1は、オペレー
タからの入力を受付けデータファイル管理システム4及
び類義語辞書ファイル機構2へ必要な命令を伝え装置全
体を制御するプログラムである。
【0009】データを登録する時にオペレータは、その
データ中から抽出された検索キーワードと、この検索キ
ーワードに付随した類義語と、レベル区分とを入力する
が、これ等は類義語辞書アクセス機構2を介して類義語
辞書ファイル3に図2に示したような概念で格納される
。図2は本実施例の類義語辞書ファイルの格納形式を概
念的に示す図である。図2において、上段は社名の例を
示し、レベル1に自社名の英文略語「NEC」(全角文
字)と「NEC 」(半角文字)とを設定し、レベル2
に自社名の和文略語「日本電気」と「日電」とを、レベ
ル3には自社の子会社名の和文略語「日本電気ソフトウ
エア」と「宮城日本電気」とを設定してそれぞれ格納し
た例である。この場合レベル1は検索キーワード自体で
ありレベル2、3が類義語である。尚、下段はディスプ
レイの例である。
【0010】次にデータを検索する時であるが、オペレ
ーターが上記例の「NEC」とレベル区分としてレベル
1、2を入力したとすると、類義語辞書アクセス機構2
を介して類義語辞書ファイル3から「NEC」、「NE
C 」、「日本電気」、「日電」が抽出されて、これ等
をキーワードとしてデータファイル管理システム4を介
してデータファイル5に格納された文書が検索され、こ
れ等キーワードの何れか1つでも持った文書があれば検
索出力される。
【0011】
【発明の効果】以上説明したように本発明は、検索言語
(検索キーワード)にこの検索言語と、これに付随した
レベル区分された類義語とを用いるので、このレベル区
分の指定により検索の範囲を限定することができる。従
って必要とする適当なレベル区分の指定をすれば、検索
範囲が狭過ぎたり広過ぎたりすることのない検索精度の
高い効率的な検索ができる効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図であ
る。
【図2】本実施例における類義語辞書ファイルの格納形
式を概念的に示す図である。
【符号の説明】
1    アプリケーションプログラム2    類義
語辞書アクセス機構 3    類義語辞書ファイル 4    データファイル管理システム5    デー
タファイル

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】検索時に入力される検索言語によりデータ
    ファイルを検索する電子式ファイル検索方式において、
    あらかじめ前記検索言語に付随した類義語と、前記類義
    語と前記検索言語との関係の強さを示すレベル区分とを
    登録しておき、検索時に前記検索言語と前記レベル区分
    とを入力して検索出力を得ることを特徴とする電子式フ
    ァイル検索方式。
  2. 【請求項2】  文書のデータを格納するデータファイ
    ルと、前記データファイルの検索言語に付随した類義語
    と前記検索言語と前記類義語との関係の強さを示す前記
    類義語に付されたレベル区分とを格納する類義語辞書フ
    ァイルと、オペレータからの入力を受付け前記データフ
    ァイルと前記類義語辞書ファイルへの登録或いは検索の
    実行を命令する手段とを備え、あらかじめ前記データの
    登録時に登録データの前記検索言語と前記類義語と前記
    レベル区分とを前記オペレータより入力し、検索時には
    前記検索言語と前記レベル区分とを入力し、前記検索言
    語と前記レベル区分の付された前記類義語とによる検索
    出力を得ることを特徴とする電子式ファイル検索方式。
JP3139388A 1991-06-12 1991-06-12 電子式ファイル検索方式 Pending JPH04364578A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3139388A JPH04364578A (ja) 1991-06-12 1991-06-12 電子式ファイル検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3139388A JPH04364578A (ja) 1991-06-12 1991-06-12 電子式ファイル検索方式

Publications (1)

Publication Number Publication Date
JPH04364578A true JPH04364578A (ja) 1992-12-16

Family

ID=15244147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3139388A Pending JPH04364578A (ja) 1991-06-12 1991-06-12 電子式ファイル検索方式

Country Status (1)

Country Link
JP (1) JPH04364578A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132555A (ja) * 1998-10-22 2000-05-12 Fujitsu Ltd キーワード検索方法及び装置並びにキーワード検索プログラムを記録した記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132555A (ja) * 1998-10-22 2000-05-12 Fujitsu Ltd キーワード検索方法及び装置並びにキーワード検索プログラムを記録した記録媒体

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
JP4467184B2 (ja) 知識創造可能性を有するドキュメントの意味論的分析及び選択
Al‐Sughaiyer et al. Arabic morphological analysis techniques: A comprehensive survey
JP4544674B2 (ja) 選択文字列に関連する情報を提供するシステム
US20060031207A1 (en) Content search in complex language, such as Japanese
JPH03172966A (ja) 類似文書検索装置
JP2005025525A (ja) 情報検索システム、情報検索方法及び情報検索プログラム
KR100795930B1 (ko) 검색용 색인 기반 질의어 추천 방법 및 그 시스템
JP4361299B2 (ja) 評価表現抽出装置、プログラム、及び記憶媒体
JPH04364578A (ja) 電子式ファイル検索方式
JPH10149370A (ja) 文脈情報を用いた文書検索方法および装置
EP1605371A1 (en) Content search in complex language, such as japanese
KR102338949B1 (ko) 기술문서 번역 지원 시스템
KR20020059555A (ko) 자연어 질의 응답 검색 엔진 및 검색 방법
JP3804609B2 (ja) 検索チューニング方法および情報検索システム
JP2001034630A (ja) 文書ベース検索システム、およびその方法
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
KR100371135B1 (ko) 용언 굴절사전을 이용한 용언 형태소 분석장치 및 방법
JPH07296005A (ja) 日本語テキスト登録・検索装置
JPS6389976A (ja) 言語解析装置
JPH0262668A (ja) 文章情報解析技法を用いた文章情報検索方式
JPH08249341A (ja) 文書データベースの文書格納・検索装置
JPH0320866A (ja) テキストベース検索方式
JPH0225973A (ja) 機械翻訳装置
JP2003228577A (ja) 情報検索方法及び情報検索装置及び情報検索装置の制御プログラム