JP5247336B2 - 検索方法及び検索装置 - Google Patents
検索方法及び検索装置 Download PDFInfo
- Publication number
- JP5247336B2 JP5247336B2 JP2008255501A JP2008255501A JP5247336B2 JP 5247336 B2 JP5247336 B2 JP 5247336B2 JP 2008255501 A JP2008255501 A JP 2008255501A JP 2008255501 A JP2008255501 A JP 2008255501A JP 5247336 B2 JP5247336 B2 JP 5247336B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- formula
- search expression
- expression
- search formula
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Description
ところが、PC等のテキスト情報機器においては検索クエリを入力するためのUI環境が充実しているので検索の遂行が比較的容易であるのに対し、複合機等の一般的機器においては、テキスト入力の環境が整備されているとはいえない。よって、検索クエリの指示を与えることが困難である。
例えば特許文献1においては、データ集合を指定すると、それと同程度の内容の文書を検索できるように検索式を自動生成する手法が開示されている。
そのため、自分で検索式を考案・入力していく必要があったため、複合機のような一般的機器において検索指示を出しづらく、著しく使い勝手が良くなかった。
図1は、検索装置の構成を示すブロック図である。
図示の構成において、CPUはマイクロプロセッサであり、画像処理、検索式セット提示処理、次候補処理、カーソル移動処理、検索処理、文書登録処理、表示処理等のための演算、論理判断等を行い、バスを介してバスに接続された各構成要素を制御する。
BUSはバスであり、CPUの制御対象である各構成要素を指示するアドレス信号、コントロール信号を転送する。また、BUSは各構成要素間のデータ転送を行う。
ROMは読出専用の不揮発性メモリである。ROMはCPUによるブートプログラム及び各種処理で使用する初期データ等を記憶する。ブートプログラムはシステム起動時に初期データをRAMにロードし、CPUに制御プログラムを実行させる。制御プログラムについては、後のフローチャートを参照して詳述する。
表示装置は液晶ディスプレイ等である。
RAMは読み書き可能なランダムアクセスメモリであって、各構成要素からの各種データの一次記憶に用いる。RAMには処理に必要な文書データを記憶するバッファ、表示に必要な表示データを一時記憶するバッファ、検索式セット候補テーブル等の処理中に値変更が行われる各種データが格納される。
通信装置はネットワークコントローラである。通信装置は通信回線を介して外部とのデータ交換を行う装置である。
HDはハードディスクであり、CPUにより実行される制御プログラム等が格納される。制御プログラムは必要に応じてRAMに示す主記憶にロードされ参照される。また、HDには本検索装置で管理する文書データベース、重要語を記憶する重要語テーブル等が格納される。
ユーザが、次候補を指示すると2−2の画面になり、次の選択式セットが表示される。ここで、更に次候補を指示すると2−3の画面が表示される。このように、検索装置は、後述する提示順位スコア順に(つまり、2−1、2−2、2−3等の順に)検索式セットを表示装置等に表示することでユーザに提示する。
もし、ユーザが2−2で「カメラ」を選択すると「製品=カメラ」の検索が行われ、画面2−4となり、条件を充たす文書群が検索結果として一覧表示される。
3−1は文書IDフィールドであり、その文書を特定するIDが格納される。3−2は作成者フィールドであり、その文書の作成者が格納される。3−3は作成日フィールドであり、その文書の作成日が格納される。3−4は組織体フィールドであり、その文書に関係する組織体が格納される。3−5は製品フィールドであり、その文書がどの製品に関係するかが格納される。3−2から3−5まではメタデータと言われるのであり、その文書の付加すべき情報が格納される。3−6は全文キーワードフィールドである。文書の付加情報でありメタデータではあるが、3−5までの情報とは異なり、文書内容から自動抽出された情報が格納される。3−7は文書内容であり、各レコードにぶら下がるように文書の本体が格納される。これらの情報は所謂リレーショナルデータベースに格納され、索引化されているので、検索装置は、属性に基づいてヒット件数を調べるだけであれば速やかに行うことができる。
検索式セット候補テーブルは、いくつかの検索式セット5−1の連なりからなる。各検索式は属性5−2、一連の検索式5−3及びスコア5−6からなる。属性5−2はその検索式セットの観点を示し、文書データベースのメタデータとして管理されるフィールド名が使用され、指定文書集合内で実際に出現する属性が使用される。各検索式は値5−4と文書集合内ヒット率5−5とからなる。値5−4は指定文書集合内で属性5−2の値として実際に出現するものが使用される。文書集合内ヒット率5−5は、その文書集合内で「属性=値」を充たす文書の割合を格納する。最後のスコア5−6は、提示順位スコアのことであり、検索式セットを提示すべき順位の根拠として使用される。提示順位スコアは、各文書集合内ヒット率から後述する換算式で求められる。
ある検索式セット内の各検索式による文書集合内ヒット率に対して、その二乗平均を提示順位スコアとしている。これは統計学でいう分散を示すものである。分散は、一般に二乗平均から平均の二乗を減じて算出されるが、ここの検索式セットの比較においては平均が概ね等しいと見なして、二乗平均を指標として用いている。この値が大きいほど統計データ、即ち、ヒット率が分散していることを示し、ヒット率のばらつきが多きことを意味している。逆にこの値が小さいほどヒット率が均等化していることを意味している。
なお、ここで算出の根拠とするヒット率は必ずしも百分率のような比のみに限定するわけではない。何件ヒットするかというヒット数の一例である絶対件数を使用しても、全体集合の枠内で計算しているので、本質的に同様の処理となる。本実施形態では絶対件数の両方を包含する概念として単にヒット率と呼んで発明を説明している。
図7は、検索装置の動作、より具体的にはCPUの処理手順を示すフローチャートである。ステップS7−1は、システムの初期化処理であり、各種パラメータの初期化や初期画面の表示等を行う処理である。ステップS7−2は、ボタン押下等の入力装置から何らかのイベントが発生するのをCPUにおいて待つ処理である。イベントが発生すると、ステップS7−3において、CPUがこのイベントを判別し、イベントの種類に応じて各種の処理に分岐する。各種イベントに対応した分岐先の複数の処理をステップS7−4という形でまとめて表現している。後述する図8で詳述する検索式セット提示処理、後述する図10で詳述する次候補処理、後述する図11で詳述するカーソル移動処理、後述する図12で詳述する検索実行処理、後述する図13で詳述する文書登録処理がこの分岐先の一部となる。他の処理としては、詳細は記述していないが、文書データベース管理処理、文書編集処理等の処理がある。ステップS7−5は、上記の各処理の処理結果や処理終了を通知し、画面を各処理の指示に従って表示する処理である。エラーがあった場合のエラー表示、正常な処理が行われた場合に設定されている表示データの画面表示への反映等、通常広く行われる処理である。
実施形態1においては、全文キーワードは文書テキストから抽出された重要語を区別無く文書データベースに登録していたが、ある程度分類して登録することも可能である。例えば、製品名、人名、地名、電話番号、企業名、等の区分けを重要語テーブルに持っておき、別々のメタデータとして保持することも出来る。このようにすると細分化して検索指定ができるので、ユーザの操作性が一段と向上する。
また、本発明の目的は、以下のようにすることによって達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(又は記録媒体)を、システム或いは装置に供給する。そして、そのシステム或いは装置の中央演算処理手段(CPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行する。この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することになり、そのプログラムコードを記録した記憶媒体は本発明を構成することになる。
Claims (9)
- 検索対象のデータ集合を検索する検索装置における検索方法であって、
複数の検索式を組み合わせて検索式セットを生成する検索式セット生成工程と、
前記検索式セット生成工程で生成された前記検索式セットに含まれる各検索式の前記データ集合内でのヒット率又はヒット数に基づいて、前記ヒット率又はヒット数が均等に近い検索式セットが優先的に提示されるよう提示順位スコアを算出する検索式セットスコア算出工程と、
前記検索式セット生成工程で生成された検索式セットを前記検索式セットスコア算出工程で算出された提示順位スコア順に提示する検索式セット提示工程と、
前記検索式セット提示工程で提示された検索式セットからユーザに選択された検索式に基づいて前記データ集合に対して検索を実行する検索式実行工程と、
を含むことを特徴とする検索方法。 - 前記検索式セット提示工程では、前記検索式セット生成工程で生成された検索式セットとともに、検索式セットに含まれる各検索式に対応する前記ヒット率又はヒット数を前記検索式セットスコア算出工程で算出された提示順位スコア順に提示することを特徴とする請求項1に記載の検索方法。
- 検索対象のデータ集合を検索する検索装置における検索方法であって、
複数の検索式を組み合わせて検索式セットを生成する検索式セット生成工程と、
前記検索式セット生成工程で生成された前記検索式セットに含まれる各検索式の前記データ集合内でのヒット率又はヒット数に基づいて、前記データ集合内での重複度が少ない検索式セットが優先的に提示されるよう提示順位スコアを算出する検索式セットスコア算出工程と、
前記検索式セット生成工程で生成された検索式セットを前記検索式セットスコア算出工程で算出された提示順位スコア順に提示する検索式セット提示工程と、
前記検索式セット提示工程で提示された検索式セットからユーザに選択された検索式に基づいて前記データ集合に対して検索を実行する検索式実行工程と、
を含むことを特徴とする検索方法。 - 検索対象のデータ集合を検索する検索装置であって、
複数の検索式を組み合わせて検索式セットを生成する検索式セット生成手段と、
前記検索式セット生成手段で生成された前記検索式セットに含まれる各検索式の前記データ集合内でのヒット率又はヒット数に基づいて、前記ヒット率が均等に近い検索式セットが優先的に提示されるよう提示順位スコアを算出する検索式セットスコア算出手段と、
前記検索式セット生成手段で生成された検索式セットを前記検索式セットスコア算出手段で算出された提示順位スコア順に提示する検索式セット提示手段と、
前記検索式セット提示手段で提示された検索式セットからユーザに選択された検索式に基づいて前記データ集合に対して検索を実行する検索式実行手段と、
を含むことを特徴とする検索装置。 - 前記検索式セット提示手段は、前記検索式セット生成手段で生成された検索式セットとともに、検索式セットに含まれる各検索式に対応する前記ヒット率又はヒット数を前記検索式セットスコア算出手段で算出された提示順位スコア順に提示することを特徴とする請求項4に記載の検索装置。
- 検索対象のデータ集合を検索する検索装置であって、
複数の検索式を組み合わせて検索式セットを生成する検索式セット生成手段と、
前記検索式セット生成手段で生成された前記検索式セットに含まれる各検索式の前記データ集合内でのヒット率又はヒット数に基づいて、前記データ集合内での重複度が少ない検索式セットが優先的に提示されるよう提示順位スコアを算出する検索式セットスコア算出手段と、
前記検索式セット生成手段で生成された検索式セットを前記検索式セットスコア算出手段で算出された提示順位スコア順に提示する検索式セット提示手段と、
前記検索式セット提示手段で提示された検索式セットからユーザに選択された検索式に基づいて前記データ集合に対して検索を実行する検索式実行手段と、
を含むことを特徴とする検索装置。 - 検索対象のデータ集合を検索するコンピュータを、
複数の検索式を組み合わせて検索式セットを生成する検索式セット生成手段と、
前記検索式セット生成手段で生成された前記検索式セットに含まれる各検索式の前記データ集合内でのヒット率又はヒット数に基づいて、前記ヒット率が均等に近い検索式セットが優先的に提示されるよう提示順位スコアを算出する検索式セットスコア算出手段と、
前記検索式セット生成手段で生成された検索式セットを前記検索式セットスコア算出手段で算出された提示順位スコア順に提示する検索式セット提示手段と、
前記検索式セット提示手段で提示された検索式セットからユーザに選択された検索式に基づいて前記データ集合に対して検索を実行する検索式実行手段と、
して機能させることを特徴とするプログラム。 - 検索対象のデータ集合を検索するコンピュータを、
複数の検索式を組み合わせて検索式セットを生成する検索式セット生成手段と、
前記検索式セット生成手段で生成された前記検索式セットに含まれる各検索式の前記データ集合内でのヒット率又はヒット数に基づいて、前記データ集合内での重複度が少ない検索式セットが優先的に提示されるよう提示順位スコアを算出する検索式セットスコア算出手段と、
前記検索式セット生成手段で生成された検索式セットを前記検索式セットスコア算出手段で算出された提示順位スコア順に提示する検索式セット提示手段と、
前記検索式セット提示手段で提示された検索式セットからユーザに選択された検索式に基づいて前記データ集合に対して検索を実行する検索式実行手段と、
して機能させることを特徴とするプログラム。 - 請求項7又は8に記載のプログラムを記憶したコンピュータにより読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008255501A JP5247336B2 (ja) | 2008-09-30 | 2008-09-30 | 検索方法及び検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008255501A JP5247336B2 (ja) | 2008-09-30 | 2008-09-30 | 検索方法及び検索装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2010086332A JP2010086332A (ja) | 2010-04-15 |
JP2010086332A5 JP2010086332A5 (ja) | 2011-09-22 |
JP5247336B2 true JP5247336B2 (ja) | 2013-07-24 |
Family
ID=42250221
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008255501A Active JP5247336B2 (ja) | 2008-09-30 | 2008-09-30 | 検索方法及び検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5247336B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5552448B2 (ja) * | 2011-01-28 | 2014-07-16 | 株式会社日立製作所 | 検索式生成装置、検索システム、検索式生成方法 |
CN111599417B (zh) * | 2020-07-08 | 2023-10-20 | 腾讯科技(深圳)有限公司 | 溶解度预测模型的训练数据获取方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3219840B2 (ja) * | 1992-05-13 | 2001-10-15 | 富士通株式会社 | 情報検索装置 |
JPH11161658A (ja) * | 1997-11-27 | 1999-06-18 | Nippon Telegr & Teleph Corp <Ntt> | 追加検索語の優先度計算方法及び装置及び追加検索語の優先度計算プログラムを格納した記憶媒体 |
JP2003067226A (ja) * | 2001-08-29 | 2003-03-07 | Cybozu Inc | ファイル管理システム及びプログラム |
JP4707476B2 (ja) * | 2005-06-20 | 2011-06-22 | フォルシア株式会社 | 情報検索システム |
-
2008
- 2008-09-30 JP JP2008255501A patent/JP5247336B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010086332A (ja) | 2010-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8583664B2 (en) | Exposing metadata relationships through filter interplay | |
JP4701124B2 (ja) | 情報処理装置、情報処理方法 | |
US8667419B2 (en) | Method and apparatus for displaying a menu for accessing hierarchical content data including caching multiple menu states | |
US7987160B2 (en) | Status tool to expose metadata read and write queues | |
US7509321B2 (en) | Selection bins for browsing, annotating, sorting, clustering, and filtering media objects | |
US8245148B2 (en) | History display apparatus, history display system, history display method, and program | |
US20060161867A1 (en) | Media frame object visualization system | |
US20140180717A1 (en) | Non-transitory computer readable medium, medical care record display apparatus, and medical care record display method | |
JPH096791A (ja) | データ検索方法及びその装置 | |
JP2002049907A (ja) | デジタルアルバム作成装置およびデジタルアルバム作成方法 | |
CN108369606A (zh) | 文档的修订历史的可配置访问 | |
US20100057770A1 (en) | System and method of file management, and recording medium storing file management program | |
JP2005004489A (ja) | 部品カタログ作成装置および部品カタログ作成プログラム | |
JPS6115276A (ja) | 文書フアイル装置 | |
CN109977318B (zh) | 书籍搜索方法、电子设备及计算机存储介质 | |
JP5247336B2 (ja) | 検索方法及び検索装置 | |
JP2010102593A (ja) | 情報処理装置およびその方法、プログラム、記録媒体 | |
JP2018537737A (ja) | 累積検索処理方法および装置、端末並びに記憶媒体 | |
JP5060591B2 (ja) | 文書分析装置およびプログラム | |
US20130204890A1 (en) | Document management system and method thereof | |
JP7512596B2 (ja) | 情報処理装置及びプログラム | |
JP4336813B2 (ja) | 画像記述システムおよび方法 | |
JP7284371B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP7576669B1 (ja) | コンテンツ管理システム、コンテンツ管理プログラム | |
JP7146392B2 (ja) | 情報処理装置およびその制御方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110804 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110804 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130409 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160419 Year of fee payment: 3 |