JP2002108887A - 文書検索装置、その装置へのキーワード追加方法、文書検索方法及びコンピュータ読み取り可能な記憶媒体 - Google Patents

文書検索装置、その装置へのキーワード追加方法、文書検索方法及びコンピュータ読み取り可能な記憶媒体

Info

Publication number
JP2002108887A
JP2002108887A JP2000299971A JP2000299971A JP2002108887A JP 2002108887 A JP2002108887 A JP 2002108887A JP 2000299971 A JP2000299971 A JP 2000299971A JP 2000299971 A JP2000299971 A JP 2000299971A JP 2002108887 A JP2002108887 A JP 2002108887A
Authority
JP
Japan
Prior art keywords
keyword
document
word
dictionary
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000299971A
Other languages
English (en)
Inventor
Haruki Nakakoshi
治樹 中越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000299971A priority Critical patent/JP2002108887A/ja
Publication of JP2002108887A publication Critical patent/JP2002108887A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 未知のキーワードに対しても効率的な文書検
索を行う。 【解決手段】 設定したキーワードに基づいて、検索対
象の文書の中から、そのキーワードを含む文字列を検索
するに際して、設定されたキーワードに基づいて、関連
付け辞書を参照することにより、当該キーワードに関連
付けされている単語を他のキーワードとして追加設定
し、それら複数のキーワードに従って、検索対象の文書
の中から、それらキーワードのうち少なくとも1つを含
む文字列を検索する(S11-S15)。ここで、関連付け辞書
は、入力文書から抽出した単語が、予め記憶されている
キーワード辞書に登録されていない未知語である場合
に、その入力文書における当該未知語の前方または後方
に位置する単語とを関連付けした辞書であり、S11-S15
に先立って作成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、検索対象として入
力されたキーワードに基づいて、そのキーワードを含む
または関係する文書を効率良く出力する文書検索装置に
関する。
【0002】
【従来の技術】従来より、コンピュータを用いて、オペ
レータによって入力されたキーワードを含む文書を、予
め記憶されている複数の文書の中から検索する技術が提
案されている。
【0003】また、近年においては、あるキーワードに
対して関連付けされた他の単語が予め登録されている辞
書(以下、キーワード辞書)を用意しておき、オペレー
タによって入力されたキーワードに関連性のある単語を
当該キーワード辞書から取得し、文書の検索に際して
は、入力されたキーワードに加え、当該キーワード辞書
から取得した単語を他のキーワードとして併せて利用す
る技術も提案されている。
【0004】
【発明が解決しようとする課題】上記のキーワード辞書
を利用する文書検索処理によれば、そのキーワード辞書
にオペレータによって入力されたキーワードが含まれる
場合、検索対象の文書に当該キーワードが含まれていな
くても、実際には関連性がある文書をもヒットすること
ができ、文書検索を効率的に行うことができる。
【0005】しかしながら、入力されたキーワードがキ
ーワード辞書に登録されていない未知の単語(以下、未
知語)である場合には、そのキーワードを直接的に含む
文書しかヒットすることはできない。このため、キーワ
ードとして新語や未知語が入力された場合には、効率的
な文書検索を行うことができない。
【0006】そこで本発明は、未知のキーワードに対し
ても効率的な文書検索を行う文書検索装置及びその装置
へのキーワード追加方法、文書検索方法及びコンピュー
タ読み取り可能な記憶媒体の提供を目的とする。
【0007】
【課題を解決するための手段】上記の目的を達成するた
め、本発明に係る文書検索装置は、以下の構成を特徴と
する。
【0008】即ち、設定されたキーワードに基づいて、
検索対象の文書の中から、そのキーワードを含む文字列
を検索する文書検索装置であって、入力文書から単語を
抽出し、抽出した単語が第1の辞書(キーワード辞書)
に登録されていない未知語か否かを判断する未知語検出
手段と、前記未知語検出手段によって未知語であると判
断された単語と、前記入力文書における該単語の前方ま
たは後方に位置する単語とが関連付けされた第2の辞書
を作成する関連付け手段と、設定されたキーワードに基
づいて前記第2の辞書(関連付け辞書)を参照すること
により、該キーワードに関連付けされている単語を新た
なキーワードとして追加設定するキーワード追加手段
と、前記キーワード追加手段によって展開された複数の
キーワードに従って、前記検索対象の文書の中から、そ
れらキーワードのうち少なくとも1つを含む文字列を検
索する検索手段とを備えることを特徴とする。
【0009】好適な実施形態において、前記未知語検出
手段及び前記関連付け手段は、前記キーワード追加手段
及び前記検索手段の実行タイミングとは別個に、前記検
索対象の文書に対して定期または不定期に実行される。
【0010】また、上記の同目的を達成するため、本発
明に係る文書検索装置へのキーワード追加方法は、以下
の構成を特徴とする。
【0011】即ち、設定したキーワードに基づいて、検
索対象の文書の中から、そのキーワードを含む文字列を
検索する文書検索方法であって、入力文書から単語を抽
出し、抽出した単語が第1の辞書(キーワード辞書)に
登録されていない未知語か否かを判断する未知語検出工
程と、前記未知語検出工程にて未知語であると判断した
単語と、前記入力文書における該単語の前方または後方
に位置する単語とが関連付けされた第2の辞書(関連付
け辞書)を作成する関連付け工程と、設定されたキーワ
ードに基づいて前記第2の辞書を参照することにより、
該キーワードに関連付けされている単語を新たなキーワ
ードとして追加設定するキーワード追加工程を有するこ
とを特徴とする。
【0012】また、文書検索方法であって、上記のキー
ワード追加方法によって展開した複数のキーワードに従
って、前記検索対象の文書の中から、それらキーワード
のうち少なくとも1つを含む文字列を検索することを特
徴とする。
【0013】更に、上記の文書検索装置、その装置への
キーワード追加方法、並びに文書検索方法を、コンピュ
ータによって実現するプログラムコードが格納されてい
る、コンピュータ読み取り可能な記憶媒体を特徴とす
る。
【0014】
【発明の実施の形態】以下、本発明の一実施形態を図面
を参照して説明する。はじめに、本発明に係る文書検索
装置を実現可能なコンピュータの構成を図13を参照し
て説明する。
【0015】図13は、本発明を適用可能なコンピュー
タのブロック構成図である。
【0016】図中、22は、CRT等のディスプレイ、
23は検索用のキーワードや文書等の入力手段であるキ
ーボードである。24は、ブートプログラム等を記憶し
ているROMである。25は、各種処理結果を一時記憶
するRAMである。26は、検索対象となる複数の文書
(文書データ)からなるデータベースや、後述する文書
検索処理を実現するプログラム等を記憶するハードディ
スクドライブ(HDD)等の記憶装置である。27は、
外部装置から文書データ等を受信可能な通信インタフェ
ースである。そして28は、処理結果等を印刷するプリ
ンタである。これらの各構成は、内部バス29を介して
接続されており、CPU(中央演算処理装置)21は記
憶装置26に記憶したプログラムに従って、文書検索装
置としてのコンピュータの全体を制御する。
【0017】尚、複数の文書(文書データ)からなるデ
ータベース(D/B)は、外部装置に記憶されており、
その外部装置に通信インタフェース27を介してアクセ
スする構成であっても良い。
【0018】次に、図13に示すコンピュータによって
実現される文書検索の処理手順について説明する。本実
施形態に係る文書検索処理は、大別して、以下に説明す
る単語インデックス作成処理(図1)と、キーワード追
加(展開)工程を含む文書検索処理とからなる。
【0019】ここで、単語インデックス作成処理は、後
述する関連付け辞書を更新すべく、例えばオペレータの
指示に応じて、記憶装置26に記憶されたD/B内の文
書群を対象として、定期または不定期に実行されるメン
テナンスとしての位置付けである。一方、文書検索処理
は、オペレータによってキーワードが入力されたとき
に、当該単語インデックス作成処理によって既に作成
(更新)されている関連付け辞書を参照しながら、入力
されたキーワードを含む及び/または関連性のある文書
(文字列)を記憶装置26に記憶されたD/B内の文書
群の中から実際に抽出する処理である。
【0020】尚、本実施形態では、説明を容易にすべ
く、上記の単語インデックス作成処理(図1)におい
て、関連付け辞書に登録されていない単語として「トル
シオ」を例に挙げ、以下に説明する文書検索処理(図
2)においても、入力されるキーワードを「トルシオ」
としたため、単語インデックス作成処理において注目し
た図3の文書1乃至3における注目箇所(実際に文字列
が示された部分)と、文書検索処理の検索結果を例示す
る図12の文書1乃至3における注目箇所とが同じであ
るが、説明の都合からであり、実際には、入力されるキ
ーワードに応じて、検索対象のD/B内から好ましい文
書が選択される。
【0021】<単語インデックス作成処理>図1は、本
実施形態における単語インデックス作成処理を示すフロ
ーチャートである。
【0022】同図において、ステップS1の単語抽出処
理では、図3に例示するような文書群(文書1乃至3)
を抽出対象として、それら文書の文字列から、その文字
列を構成する単語を抽出する。本ステップにおいて単語
を抽出する際には、予め記憶されている図6に例示する
ようなキーワード辞書を参照することにより、そのキー
ワード辞書に既に登録されている単語が、単語抽出対象
の各文字列に含まれているか否かを検索する。
【0023】このとき、単語抽出対象の文字列の中に、
当該キーワード辞書に登録されていない単語が含まれて
いた場合には、その単語の前方または後方に連続する文
字種などを判断して当該単語を抽出する。より具体的に
は、図3に示す文書1を例にすると、キーワード辞書を
参照することにより、図6には不図示の「監督」、「指
導方法」、「頭脳的」などの単語が抽出され、当該キー
ワード辞書に登録されていない単語「トルシオ」は、カ
タカナが連続する単語として判断されて、文書1の文字
列の中から抽出される。
【0024】ステップS2の未知語検出処理では、ステ
ップS1で抽出した各単語の中に、キーワード辞書に登
録されていない未知語が存在するかどうかを判断し、こ
の判断でYES(未知語有り)のとき(上記の例の場合
は、単語「トルシオ」が未知語)にはステップS3に進
み、NO(未知語無し)のときにはステップS5に進
む。
【0025】ステップS3の関連付け作成処理では、ス
テップS2で検出された未知語と、その未知語が抽出さ
れた文字列における当該未知語の前方または後方に存在
する単語とを関連付けする。上記の例の場合、図3に示
す文書1において、未知語として検出された「トルシ
オ」に、その単語に後続する「監督」が関連付けされ
る。本ステップにて関連付けが作成できたときにはステ
ップS4に進み、作成できないときにはステップS5に
進む。
【0026】ステップS4の関連付け保存処理では、ス
テップS3で作成した関連付けを、関連付け辞書とし
て、RAM25や記憶装置26に保存する。このような
関連付けが単語抽出対象の各文字列を対象にして行われ
ることにより、図3に例示する3つの文書の場合には、
関連付け辞書に、図9に示すように未知語「トルシオ」
に「監督」と「ジャパン」とが関連付けされた状態で新
たに保存される。
【0027】ステップS5の単語インデックス作成処理
では、ステップS1で抽出された各単語(未知語を含
む)を文書毎にまとめることにより、単語インデックス
が作成される。上記の例の場合には、図3に示す文書1
乃至3から抽出された各単語により、図5に示す3つの
単語インデックスが作成される。これらの単語インデッ
クスは、その単語インデックスの作成の元となった文書
データとD/B内で関連付けされた状態で保存され、後
述する文書検索処理(図2)のステップS15において
参照される。
【0028】<文書検索処理>図2は、本実施形態にお
ける文書検索処理を示すフローチャートである。
【0029】同図において、ステップS11の検索キー
ワード取得処理では、オペレータによってキーボード2
3等から入力されるキーワードを取得する。ここでは、
図4に示すように、キーワードとして「トルシオ」が取
得されるものとする。
【0030】ステップS12の関連付け単語検索処理で
は、ステップS11で入力されたキーワードが、関連付
け辞書に現時点で既に登録されているか否かを検索し、
この検索の結果、既に登録されているときにはステップ
S13に進み、未登録のときには、検索対象の文書の中
にステップS11にて取得したキーワードを直接含む文
書を検索すべくステップS15に進む。上記の例の場合
は、図1を参照して上述した単語インデックス作成処理
により、図9に示す関連付け辞書には、キーワード「ト
ルシオ」が既に登録されている。
【0031】ステップS13の関連付け対応単語の取得
処理では、ステップS12で検索された単語に関連付け
されている単語(以下、対応単語)を取得する。上記の
場合は、ステップS12において、キーワード「トルシ
オ」を、関連付け辞書の中からヒットすることができて
いるので、当該関連付け辞書から「トルシオ」に関連付
けされている「監督」及び「ジャパン」の2つの単語が
対応単語として取得される。
【0032】ステップS14の検索キーワード追加処理
では、ステップS13で取得した対応単語を、ステップ
S11にて入力されたキーワードに関連性を有する他の
キーワードとして追加する。上記の場合は、ステップS
11にてオペレータによって設定された図4のキーワー
ド「トルシオ」に加えて、図10に示すように、「監
督」及び「ジャパン」の2語が新たに検索用のキーワー
ドとして追加されている。即ち、本実施形態では、元の
検索キーワードであった「トルシオ」に加え、そのキー
ワードに関連性のある複数のキーワードに展開されたこ
とになる。
【0033】ステップS15:本ステップでは、上記の
ステップまでに用意された少なくとも1つのキーワード
に従って、図1のステップS5にて記憶した単語インデ
ックスを参照することにより、D/B内で当該単語イン
デックスに関連付けされている文書群を検索する。
【0034】即ち、ステップS11にて入力されたキー
ワードが関連付け辞書に登録されてなかった場合には、
そのキーワードを直接含む文書(単語インデックス)を
検索する一般的な検索処理を行う。この場合、入力され
たキーワードが「トルシオ」であれば、検索結果とし
て、図12に示す文書1及び2が得られる。
【0035】一方、ステップS14までの各ステップに
より、ステップS11にて入力されたキーワードに加
え、他のキーワードが追加された場合には、それらのキ
ーワードが「トルシオ」、「監督」及び「ジャパン」で
あれば、それらのキーワードが含まれる単語インデック
スにより、検索結果として、図12に示す文書1乃至3
が得られる。
【0036】このように、本実施形態によれば、オペレ
ータによって入力された検索キーワードを、図1の単語
インデックス処理によって作成された関連付け辞書を利
用して展開することにより、効率的な文書検索処理を行
うことができ、オペレータによって入力されたキーワー
ドを直接的には含まないものの、実施には関連性がある
文書をもヒットすることができ、文書検索を効率的に行
うことができる。
【0037】尚、ステップS15では、D/Bを検索す
るのに先立って、予め記憶されているキーワード辞書
(例えば図6)と不図示の辞書とを参照することによ
り、キーワード展開辞書(図7の右側の例参照)を作成
し、そのキーワード展開辞書を参照しながら、従来より
知られているキーワード展開処理を行うことにより、上
述したステップS14にて展開済みのキーワード(図1
1)を、図11に示すように、更に多くのキーワードに
展開することができる。従って、これら複数のキーワー
ドを用いて文書検索を行えば、入力されたキーワードを
直接的には含まないものの、実際には関連性がある文書
を、より高い確立でヒットすることができ、操作性が向
上する。
【0038】
【他の実施形態】尚、本発明は、複数の機器(例えばホ
ストコンピュータ、インタフェイス機器、リーダ、プリ
ンタなど)から構成されるシステムに適用しても、一つ
の機器からなる装置(例えば、複写機、ファクシミリ装
置など)に適用してもよい。
【0039】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納された
プログラムコードを読み出し実行することによっても、
達成される。この場合、記憶媒体から読み出されたプロ
グラムコード自体が前述した実施形態の機能を実現する
ことになり、そのプログラムコードを記憶した記憶媒体
は本発明を構成することになる。また、コンピュータが
読み出したプログラムコードを実行することにより、前
述した実施形態の機能が実現されるだけでなく、そのプ
ログラムコードの指示に基づき、コンピュータ上で稼働
しているオペレーティングシステム(OS)などが実際
の処理の一部または全部を行い、その処理によって前述
した実施形態の機能が実現される場合も含まれる。
【0040】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれる。
【0041】
【発明の効果】以上説明した本発明によれば、未知のキ
ーワードに対しても効率的な文書検索を行う文書検索装
置及びその装置へのキーワード追加方法、文書検索方法
及びコンピュータ読み取り可能な記憶媒体の提供が実現
する。
【図面の簡単な説明】
【図1】本実施形態における単語インデックス作成処理
を示すフローチャートである。
【図2】本実施形態における文書検索処理を示すフロー
チャートである。
【図3】関連付け辞書の作成のために参照する文書群を
例示する図である。
【図4】関連付け辞書を例示する図である。
【図5】単語インデックスの作成例を示す図である。
【図6】キーワード辞書の例を示す図である。
【図7】キーワード展開辞書を例示する図である。
【図8】検索結果を例示する図である。
【図9】関連付け辞書の作成例を示す図である。
【図10】キーワードの展開例を示す図である。
【図11】図10に示すキーワードの展開例を、キーワ
ード展開辞書(図7)を参照して更に展開した場合を例
示する図である。
【図12】検索結果である文書群を例示する図である。
【図13】本発明を実現可能なコンピュータのブロック
構成図である。

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 設定されたキーワードに基づいて、検索
    対象の文書の中から、そのキーワードを含む文字列を検
    索する文書検索装置であって、 入力文書から単語を抽出し、抽出した単語が第1の辞書
    に登録されていない未知語か否かを判断する未知語検出
    手段と、 前記未知語検出手段によって未知語であると判断された
    単語と、前記入力文書における該単語の前方または後方
    に位置する単語とが関連付けされた第2の辞書を作成す
    る関連付け手段と、 設定されたキーワードに基づいて前記第2の辞書を参照
    することにより、該キーワードに関連付けされている単
    語を新たなキーワードとして追加設定するキーワード追
    加手段と、を備えることを特徴とする文書検索装置。
  2. 【請求項2】 更に、前記キーワード追加手段によって
    展開された複数のキーワードに従って、前記検索対象の
    文書の中から、それらキーワードのうち少なくとも1つ
    を含む文字列を検索する検索手段を備えることを特徴と
    する請求項1記載の文書検索装置。
  3. 【請求項3】 前記検索手段は、前記未知語検出手段に
    よって未知語が検出されないときに、前記検索対象の文
    書の中から、前記設定されたキーワードを含む文字列だ
    けを検索することを特徴とする請求項2記載の文書検索
    装置。
  4. 【請求項4】 前記未知語検出手段及び前記関連付け手
    段は、前記キーワード追加手段及び前記検索手段の実行
    タイミングとは別個に、前記検索対象の文書に対して定
    期または不定期に実行されることを特徴とする請求項1
    または請求項2記載の文書検索装置。
  5. 【請求項5】 前記キーワード追加手段は、前記設定さ
    れたキーワード、前記第2の辞書を参照することによっ
    て追加されたキーワード、並びに前記第1の辞書に基づ
    いて、それらキーワードを更に追加設定する手段を含む
    ことを特徴とする請求項1記載の文書検索装置。
  6. 【請求項6】 設定したキーワードに基づいて、検索対
    象の文書の中から、そのキーワードを含む文字列を検索
    する文書検索装置へのキーワード追加方法であって、 入力文書から単語を抽出し、抽出した単語が第1の辞書
    に登録されていない未知語か否かを判断する未知語検出
    工程と、 前記未知語検出工程にて未知語であると判断した単語
    と、前記入力文書における該単語の前方または後方に位
    置する単語とが関連付けされた第2の辞書を作成する関
    連付け工程と、 設定されたキーワードに基づいて前記第2の辞書を参照
    することにより、該キーワードに関連付けされている単
    語を新たなキーワードとして追加設定するキーワード追
    加工程と、を有することを特徴とするキーワード追加方
    法。
  7. 【請求項7】 請求項6記載のキーワード追加方法によ
    って展開した複数のキーワードに従って、前記検索対象
    の文書の中から、それらキーワードのうち少なくとも1
    つを含む文字列を検索することを特徴とする文書検索方
    法。
  8. 【請求項8】 前記検索工程では、前記未知語検出工程
    にて未知語を検出しなかったときに、前記検索対象の文
    書の中から、前記設定されたキーワードを含む文字列だ
    けを検索することを特徴とする請求項7記載の文書検索
    方法。
  9. 【請求項9】 請求項1乃至請求項5の何れかに記載の
    文書検索装置としてコンピュータを動作させるプログラ
    ムコードが格納されていることを特徴とするコンピュー
    タ読み取り可能な記憶媒体。
  10. 【請求項10】 請求項6記載のキーワード追加方法を
    コンピュータによって実現可能なプログラムコードが格
    納されていることを特徴とするコンピュータ読み取り可
    能な記憶媒体。
  11. 【請求項11】 請求項7または請求項8記載の文書検
    索方法をコンピュータによって実現可能なプログラムコ
    ードが格納されていることを特徴とするコンピュータ読
    み取り可能な記憶媒体。
JP2000299971A 2000-09-29 2000-09-29 文書検索装置、その装置へのキーワード追加方法、文書検索方法及びコンピュータ読み取り可能な記憶媒体 Withdrawn JP2002108887A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000299971A JP2002108887A (ja) 2000-09-29 2000-09-29 文書検索装置、その装置へのキーワード追加方法、文書検索方法及びコンピュータ読み取り可能な記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000299971A JP2002108887A (ja) 2000-09-29 2000-09-29 文書検索装置、その装置へのキーワード追加方法、文書検索方法及びコンピュータ読み取り可能な記憶媒体

Publications (1)

Publication Number Publication Date
JP2002108887A true JP2002108887A (ja) 2002-04-12

Family

ID=18781706

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000299971A Withdrawn JP2002108887A (ja) 2000-09-29 2000-09-29 文書検索装置、その装置へのキーワード追加方法、文書検索方法及びコンピュータ読み取り可能な記憶媒体

Country Status (1)

Country Link
JP (1) JP2002108887A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004004323A1 (ja) * 2002-06-26 2004-01-08 Sony Corporation 情報処理装置および方法、並びにプログラム
WO2007108529A1 (ja) * 2006-03-23 2007-09-27 Nec Corporation 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム
JP2007272872A (ja) * 2006-03-08 2007-10-18 Ricoh Co Ltd 情報検索方法、情報検索装置、情報検索システム、及び情報検索プログラム
JP2012083929A (ja) * 2010-10-12 2012-04-26 Hitachi Solutions Ltd ファイル検索装置およびファイル検索プログラム
US9767186B2 (en) 2013-06-11 2017-09-19 International Business Machines Corporation Retrieving a specific sentence from a document

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004004323A1 (ja) * 2002-06-26 2004-01-08 Sony Corporation 情報処理装置および方法、並びにプログラム
US8332891B2 (en) 2002-06-26 2012-12-11 Sony Corporation Information processing apparatus and method, and program
JP2007272872A (ja) * 2006-03-08 2007-10-18 Ricoh Co Ltd 情報検索方法、情報検索装置、情報検索システム、及び情報検索プログラム
WO2007108529A1 (ja) * 2006-03-23 2007-09-27 Nec Corporation 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム
JP5083669B2 (ja) * 2006-03-23 2012-11-28 日本電気株式会社 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム
US8886661B2 (en) 2006-03-23 2014-11-11 Nec Corporation Information extraction system, information extraction method, information extraction program, and information service system
JP2012083929A (ja) * 2010-10-12 2012-04-26 Hitachi Solutions Ltd ファイル検索装置およびファイル検索プログラム
US9767186B2 (en) 2013-06-11 2017-09-19 International Business Machines Corporation Retrieving a specific sentence from a document

Similar Documents

Publication Publication Date Title
JP5437557B2 (ja) 検索処理方法及び検索システム
US9195738B2 (en) Tokenization platform
US7844139B2 (en) Information management apparatus, information management method, and computer program product
JP3897494B2 (ja) 画像管理検索装置、画像管理検索方法及び記憶媒体
US20090292693A1 (en) Text searching method and device and text processor
US20050097080A1 (en) System and method for automatically locating searched text in an image file
CN111324607B (zh) Sql语句复用方法和装置
JP4237813B2 (ja) 構造化文書管理システム
JPH11224258A (ja) 画像検索装置及びその方法、コンピュータ可読メモリ
JP2000357115A (ja) ファイル検索装置及びファイル検索方法
JP3331692B2 (ja) 異表記語辞書作成支援装置
JP2002108887A (ja) 文書検索装置、その装置へのキーワード追加方法、文書検索方法及びコンピュータ読み取り可能な記憶媒体
JP2011133928A (ja) 記憶装置に記憶してある文書ファイルを検索する検索装置、検索システム、検索方法及びコンピュータプログラム
JPH10289241A (ja) 画像処理装置及びその制御方法
JPH07146880A (ja) 文書検索装置及び方法
JP4091586B2 (ja) 構造化文書管理システム、索引構築方法及びプログラム
JP3787384B2 (ja) 文書検索装置及びその方法
JP4304226B2 (ja) 構造化文書管理システム、構造化文書管理方法及びプログラム
JP2008203997A (ja) 文書検索装置及びプログラム
JP4160627B2 (ja) 構造化文書管理システム及びプログラム
JP2000076254A (ja) キーワード抽出装置、このキーワード抽出装置を用いた類似文献検索装置、キーワード抽出方法及び記録媒体
JP2001084271A (ja) 情報検索装置及びそのアルゴリズム更新方法及びコンピュータ読み取り可能な記憶媒体
JP2005267036A (ja) トレース出力制御方法およびトレースシステム
JPH0991305A (ja) 情報処理方法及び装置
JPH09265472A (ja) 画像データベースシステム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20071204