JPH05151253A - 文書検索装置 - Google Patents

文書検索装置

Info

Publication number
JPH05151253A
JPH05151253A JP3315786A JP31578691A JPH05151253A JP H05151253 A JPH05151253 A JP H05151253A JP 3315786 A JP3315786 A JP 3315786A JP 31578691 A JP31578691 A JP 31578691A JP H05151253 A JPH05151253 A JP H05151253A
Authority
JP
Japan
Prior art keywords
search
document
word
retrieving
search word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3315786A
Other languages
English (en)
Inventor
Takanari Ueda
隆也 上田
Shiro Ito
史朗 伊藤
Minoru Fujita
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP3315786A priority Critical patent/JPH05151253A/ja
Publication of JPH05151253A publication Critical patent/JPH05151253A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 入力された検索語とは異なる種類の言語によ
る文書の検索をも可能とし、使い勝手の良い文書検索装
置を提供する。 【構成】 検索語入力部101より入力された検索語を
検索語保持部102にて保持する。訳語展開部107で
は、この入力された検索語により、対訳辞書106を検
索して、入力された検索語に対応する各種言語による訳
語を検索語として検索語保持部102に追加する。検索
処理部104は検索語保持部102に保持された検索語
を含む文書を文書保持部103に保持されている文書の
中から検索し、この検索の結果抽出された文書を検索結
果保持部105に保持する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、計算機によって文書の
検索を行う文書検索装置に関する。
【0002】
【従来の技術】文書データベースの普及と、計算機処理
能力の向上により、大量の文書データベースから文書を
検索する文書検索装置が広く用いられるようになってき
た。
【0003】特に最近では、検索の際の柔軟性を向上さ
せるために、予め文書にキーワードを与えず、ユーザが
自由にキーワード(以下、検索語と称する)を指定でき
るようにした全文検索の方式が用いられるようになって
きている。
【0004】
【発明が解決しようとする課題】ところで、文書データ
ベースに保存される文書は一種類の言語に限るものでは
ない。例えば、日本語、英語、フランス語、ドイツ語等
の言語によって記述されている文書が文書データベース
内に混在している。このような場合、予め文書にキーワ
ードを与えておき、このキーワードにて検索するキーワ
ード方式のシステムでは、キーワードを一つの言語に統
一すれば良い。しかしながら全文検索の方式による従来
の文書検索装置では検索語として与えた言語以外の言語
の文書は検索できない。例えば、検索語を日本語で与え
れば日本語の文書しか検索できない。そして、他の言語
による文書を検索したい場合は、それぞれの言語による
検索語を別々に入力しなければならないので検索に手間
がかかるという問題があった。
【0005】本発明は上記の問題点に鑑みてなされたも
のであり、全文検索方式においても、キーワード方式に
おいても、入力された検索語とは異なる種類の言語によ
る文書の検索をも可能とし、使い勝手の良い文書検索装
置を提供することを目的とする。
【0006】
【課題を解決するための手段】上記の目的を達成するた
めに本発明による文書検索装置は以下の構成を備える。
即ち、検索語を入力して、前記検索語に基づいて文書保
持部に保持されている文書を検索する文書検索装置であ
って、各種言語間の対訳を登録してある対訳辞書と、入
力された検索語の各種言語における訳語を前記対訳辞書
から検索する訳語検索手段と、前記入力された検索語と
前記訳語検索手段により検索された訳語とを検索語とし
て文書を検索する文書検索手段とを備える。
【0007】尚、特許請求の範囲で言う「文書検索手
段」による文書検索の方式は、全文検索方式、キーワー
ド方式のいずれであっても良い。
【0008】
【作用】上記の構成により、使用者がある言語により検
索語を入力し文書の検索を実行すると、検索語に対する
各種言語への翻訳が実施され、入力された検索語とこれ
に対する各種言語に翻訳された検索語とを用いて各種言
語の文書の検索を実行する。
【0009】
【実施例】以下に添付の図面を参照して本発明の好適な
実施例について詳細に説明する。
【0010】<実施例1>実施例1では検索語が日本語
で入力される場合を例にとって説明する。
【0011】図1は、実施例1による装置の構成を示す
ブロック図である。同図において、101は検索する語
を入力する検索語入力部である。102は検索語保持部
であり検索語入力部101から入力された検索語を保持
する。103は文書保持部であり検索の対象となる複数
の文書が保存されている。104は検索処理部であり検
索語保持部102に保持された検索語を含む文書を文書
保持部103に保存されている文書の中から検索する。
105は検索結果保持部であり検索処理部104で検索
した結果、抽出された文書を保持する。
【0012】106は対訳辞書であり、それぞれの単語
に対する訳語を保持している辞書である。これは例えば
対訳辞書1は日本語から英語への対訳辞書、対訳辞書2
は日本語からドイツ語への対訳辞書というように、各言
語ごとに用意されている。107は訳語展開部であり検
索語保持部102に保持された検索語に対する訳語を求
める。
【0013】図2は図1に示した装置における動作の処
理手順を示すフローチャートである。本図を参照しなが
ら実施例1の動作を説明する。
【0014】まず、ステップS1では検索語入力部10
1で検索語の入力を行う。入力された検索語は検索語保
持部102に保持される。次にステップS2に移り、訳
語展開部107において、検索語保持部102に保持さ
れた検索語の訳語を検索する。この検索は対訳辞書10
6中のすべての辞書(対訳辞書1から対訳辞書n)につ
いて実施する。
【0015】次にステップS3において、検索語の訳語
があったかどうかを調べる。検索語の訳語がある場合
は、ステップS4に移り、得られた全ての訳語を検索語
保持部102に保持されている検索語に加える。このと
き上述の訳語は「入力された検索語もしくは訳語(を含
む文書)」というOR条件の形で追加される。検索語の
訳語が1つもない場合はステップS4をとばしステップ
S5に移り、検索語保持部102に保持される検索語は
「入力された検索語のみ」ということになる。
【0016】次にステップS5に進み、検索処理部10
4において、検索保持部102に保持された検索語を含
む文書を文書保持部103から検索する検索処理を行
う。ここでの検索処理は、例えば複数の文字列を同時に
検索するAC法を用いることにより実施される。検索処
理の結果得られた文書は検索結果保持部105に保持す
る。
【0017】次に検索語入力部101において、検索語
「コンピュータ」が入力された場合を例にとり、各部の
説明を行う。なお、この例では文書保持部103には日
本語文書と英語文書だけが保持されているものとする。
【0018】検索語「コンピュータ」を訳語展開部10
7で展開した結果、訳語として英語の”compute
r”がえられる。そこでこれを検索語保持部102にO
Rの形で追加して、”コンピュータ”もしくは”com
puter”を含む文書を検索する。これによって日本
語文書で”コンピュータ”を含む文書だけでなく、英語
文書で”computer”を含む文書も検索できる。
なお、フランス語やドイツ語等の文書が文書保持部10
3に保持されている場合もそれぞれの対訳辞書を備える
ことにより上記の例と同様にして検索すればよい。
【0019】<実施例2>上記実施例1では検索語とし
て1つの単語を用いたが、検索語が複数の単語であって
も、個々の単語に対して訳語展開の処理をすれば、実施
例1と同様な方法で対応できる。この際、入力された検
索語間の条件を、訳語展開後の検索語群の間でも保存す
るようにする。例えば、”ワークステーション”AN
D”パソコン”という形で検索後が入力された場合は、
検索語間のAND関係を保存して、(”ワークステーシ
ョン”OR”work station”)AND(”
パソコン”OR”personal computer
”)とし、文書検索を実施すれば良い。
【0020】<実施例3>上記実施例では、訳語を全て
検索語に加えて検索に用いたが、文書ごとにその言語に
よって検索語を変えてもよい。すなわち、常に”com
puter”OR”コンピュータ”を検索するのでな
く、英語の文書の場合は英語の”computer”を
検索語とし、日本語の文書の場合は日本語の”コンピュ
ータ”を検索語とする。これは、各文書の言語を判定す
る手段と、検索語ごとにその言語の種類を保持する手段
を設ければ実現できる。
【0021】各文書の言語を判定する手段の1例として
は、文書から単語等を抽出し、その単語を見出し語とし
て有する対訳辞書を検索することで言語の判定が可能と
なる。また、各文書毎にあらかじめ使用言語情報をもた
せておいても良い。
【0022】入力された検索語の言語の種類についても
上述の文書の言語の判定方法によって判定が可能であ
る。さらに、対訳辞書により翻訳された検索語について
は、それぞれ使用した対訳辞書を検索語に対応させて記
憶しておけばよい。
【0023】図3に実施例3による文書検索のフローチ
ャートを示す。ステップS11にて検索語が検索語入力
部101より入力される。次にステップS12において
入力された検索語の種類を上述の方法により判定する。
ステップS13にて、検索語に対する訳語を対訳辞書1
06より検索し、続くステップS14において、各検索
語をそれぞれの言語の種類と対応させて検索語保持部1
02に保持する。
【0024】ステップS15では上述の方法により対象
文書の言語を判定する。次にステップS16において、
検索語保持部102よりその対象文書にて使用されてい
る言語と同じ言語による検索語を抽出して、文書内にそ
の検索語が存在するかどうかをAC法等により調べる。
【0025】そして、ステップS17にて対象文書に検
索語が存在すればステップS18へ進み、検索結果とし
て対象文書を検索結果保持部105に保持する。また、
ステップS19において、未チェックの対象文書が存在
するかどうかをチェックし、存在するのであればステッ
プS15へ戻り、次の対象文書について上述の処理を繰
り返す。また、未チェックの対象文書が存在しないので
あれば、本処理を終了する。
【0026】尚、上記実施例1及び2では、検索語が日
本語で入力される場合を例にしたが、他の言語であって
も、それに対応する対訳辞書を用意することによって、
同様に実施できることは言うまでもない。検索語がどの
言語で入力されるかわからないような場合も、各種の言
語間の対訳辞書を用意し、上述の実施例3で説明したよ
うな「入力された検索語の言語の種類を判定する手段」
を追加すれば、同様に実施できる。つまり、入力された
検索語の言語に対応する対訳辞書により入力された検索
語に対する翻訳語を抽出し、検索語保持部102にOR
条件で追加し、AC法等により文書検索を実行すればよ
い。
【0027】更に、上記の各実施例では、検索の際にA
C法を用いたが、その他のパタンマッチング・アルゴリ
ズムを用いてもかまわない。
【0028】更に、上述の各実施例では全文検索方式の
場合について説明したが、文書にあらかじめキーワード
が与えられているキーワード方式の場合についても上記
各実施例と同様にして実施が可能である。
【0029】以上説明したように、上記の各実施例によ
れば、ユーザが指定した検索語の言語と異なる文書も検
索できるので、利用しやすい文書検索装置がえられると
いう利点がある。
【0030】尚、本発明は、複数の機器から構成される
システムに適用しても1つの機器からなる装置に適用し
ても良い。また、本発明はシステム或いは装置に本発明
により規定される処理を実行させるプログラムを供給す
ることによって達成される場合にも適用できることはい
うまでもない。
【0031】
【発明の効果】以上説明したように、本発明によれば、
1種類の言語による検索語の入力から複数の種類の言語
による文書の検索を可能とし、使い勝手の良い文書検索
装置を提供することができる。
【0032】
【図面の簡単な説明】
【図1】本実施例による装置の構成を示すブロック図で
ある。
【図2】実施例1による文書検索処理手順を示すフロー
チャートである。
【図3】実施例3による文書検索処理手順を示すフロー
チャートである。
【符号の説明】
101 検索語入力部 102 検索語保持部 103 文書保持部 104 検索処理部 105 検索結果保持部 106 対訳辞書 107 訳語展開部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 検索語を入力して、前記検索語に基づい
    て文書保持部に保持されている文書を検索する文書検索
    装置であって、 各種言語間の対訳を登録してある対訳辞書と、 入力された検索語の各種言語における訳語を前記対訳辞
    書から検索する訳語検索手段と、 前記入力された検索語と前記訳語検索手段により検索さ
    れた訳語とを検索語として文書を検索する文書検索手段
    とを備えることを特徴とする文書検索装置。
JP3315786A 1991-11-29 1991-11-29 文書検索装置 Withdrawn JPH05151253A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3315786A JPH05151253A (ja) 1991-11-29 1991-11-29 文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3315786A JPH05151253A (ja) 1991-11-29 1991-11-29 文書検索装置

Publications (1)

Publication Number Publication Date
JPH05151253A true JPH05151253A (ja) 1993-06-18

Family

ID=18069542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3315786A Withdrawn JPH05151253A (ja) 1991-11-29 1991-11-29 文書検索装置

Country Status (1)

Country Link
JP (1) JPH05151253A (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0844771A (ja) * 1994-05-25 1996-02-16 Fuji Xerox Co Ltd 情報検索装置
JPH08212229A (ja) * 1995-02-01 1996-08-20 Fuji Xerox Co Ltd 情報検索装置
JPH09101991A (ja) * 1995-07-31 1997-04-15 Toshiba Corp 情報フィルタリング装置
JPH1063689A (ja) * 1996-06-12 1998-03-06 Nippon Steel Corp 情報検索システム、データ変換装置及び情報検索用記憶媒体
US7240051B2 (en) 2003-03-13 2007-07-03 Hitachi, Ltd. Document search system using a meaning relation network
JP2007323238A (ja) * 2006-05-31 2007-12-13 National Institute Of Information & Communication Technology 強調表示装置及びプログラム
JP2009093429A (ja) * 2007-10-09 2009-04-30 Kodansha Ltd 検索システム及び検索方法
WO2010109594A1 (ja) * 2009-03-24 2010-09-30 三菱電機インフォメーションシステムズ株式会社 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法
JP2012074087A (ja) * 2012-01-17 2012-04-12 Mitsubishi Electric Information Systems Corp 文書検索システム、文書検索プログラム、および文書検索方法
JP2014517428A (ja) * 2011-06-24 2014-07-17 グーグル・インコーポレーテッド 検索クエリのソース言語を検出すること
JP2016133861A (ja) * 2015-01-16 2016-07-25 株式会社ぐるなび 情報多言語変換システム
US10991056B2 (en) 2014-09-30 2021-04-27 Gurunavi, Inc. Menu generation system
US11386275B2 (en) 2014-09-30 2022-07-12 Gurunavi, Inc. Menu generation system

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0844771A (ja) * 1994-05-25 1996-02-16 Fuji Xerox Co Ltd 情報検索装置
JPH08212229A (ja) * 1995-02-01 1996-08-20 Fuji Xerox Co Ltd 情報検索装置
JPH09101991A (ja) * 1995-07-31 1997-04-15 Toshiba Corp 情報フィルタリング装置
JPH1063689A (ja) * 1996-06-12 1998-03-06 Nippon Steel Corp 情報検索システム、データ変換装置及び情報検索用記憶媒体
US7240051B2 (en) 2003-03-13 2007-07-03 Hitachi, Ltd. Document search system using a meaning relation network
JP2007323238A (ja) * 2006-05-31 2007-12-13 National Institute Of Information & Communication Technology 強調表示装置及びプログラム
JP2009093429A (ja) * 2007-10-09 2009-04-30 Kodansha Ltd 検索システム及び検索方法
WO2010109594A1 (ja) * 2009-03-24 2010-09-30 三菱電機インフォメーションシステムズ株式会社 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法
JPWO2010109594A1 (ja) * 2009-03-24 2012-09-20 三菱電機インフォメーションシステムズ株式会社 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法
JP2014517428A (ja) * 2011-06-24 2014-07-17 グーグル・インコーポレーテッド 検索クエリのソース言語を検出すること
JP2012074087A (ja) * 2012-01-17 2012-04-12 Mitsubishi Electric Information Systems Corp 文書検索システム、文書検索プログラム、および文書検索方法
US10991056B2 (en) 2014-09-30 2021-04-27 Gurunavi, Inc. Menu generation system
US11386275B2 (en) 2014-09-30 2022-07-12 Gurunavi, Inc. Menu generation system
JP2016133861A (ja) * 2015-01-16 2016-07-25 株式会社ぐるなび 情報多言語変換システム

Similar Documents

Publication Publication Date Title
US6904429B2 (en) Information retrieval apparatus and information retrieval method
US7440947B2 (en) System and method for identifying query-relevant keywords in documents with latent semantic analysis
US6055528A (en) Method for cross-linguistic document retrieval
US20080235202A1 (en) Method and system for translation of cross-language query request and cross-language information retrieval
US20050097080A1 (en) System and method for automatically locating searched text in an image file
EP1072982A2 (en) Method and system for similar word extraction and document retrieval
JP2004118740A (ja) 質問応答システム、質問応答方法、質問応答プログラム
JPH05151253A (ja) 文書検索装置
JP3281639B2 (ja) 文書検索システム
JPH0773197A (ja) 異表記語辞書作成支援装置
JP3380034B2 (ja) 辞書編集装置
JP3007375B2 (ja) 文書情報検索装置
JPH0581326A (ja) データベース検索装置
JPS6325774A (ja) 情報登録検索装置
JPH05165889A (ja) 文書検索装置
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
JPH0584938B2 (ja)
JPH10334109A (ja) 検索利用者支援装置
JP2002117043A (ja) 文書検索装置、文書検索方法およびその方法を実施するためのプログラムを記録した記録媒体
JPH0584937B2 (ja)
JPH05151273A (ja) シソーラス検索システム
JPH05204978A (ja) 情報検索装置
JPH08305695A (ja) 文書処理装置
JPH05233696A (ja) データベース検索方法
JPH0498461A (ja) キーワード抽出装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990204