JP4439497B2 - 検索処理装置及びプログラム - Google Patents
検索処理装置及びプログラム Download PDFInfo
- Publication number
- JP4439497B2 JP4439497B2 JP2006195774A JP2006195774A JP4439497B2 JP 4439497 B2 JP4439497 B2 JP 4439497B2 JP 2006195774 A JP2006195774 A JP 2006195774A JP 2006195774 A JP2006195774 A JP 2006195774A JP 4439497 B2 JP4439497 B2 JP 4439497B2
- Authority
- JP
- Japan
- Prior art keywords
- index
- search
- vocabulary
- node
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は本発明の一実施形態に係る検索処理装置を含むクライアント−サーバシステムのハードウェア構成を示すブロック図である。クライアント−サーバシステムは、主として、データベースサーバ(データベースサーバコンピュータ)10と、複数のクライアント端末とから構成される。複数のクライアント端末はクライアント端末20を含む。クライアント端末20上では、データベースサーバ10を利用するクライアントソフトウェアが動作する。クライアントソフトウェアは例えばブラウザである。クライアント端末20を含む複数のクライアント端末は、ローカルエリアネットワーク(LAN)のようなネットワーク30を介してデータベースサーバ10と接続されている。なお、図1にはクライアント端末20以外のクライアント端末は省略されている。
今、ユーザの操作により、クライアント端末20から検索処理装置50に対し、構造化文書問い合わせがネットワーク30を介して与えられたものとする。検索処理装置50の検索条件入力IF513は、このクライアント端末20からの構造化文書問い合わせを受け付けると、当該問い合わせを解析部54に渡す。解析部54は、この問い合わせで使用される検索式(ユーザ指定の検索式)を解析する。ここでは、文字列による検索が指定されているものとする。この場合、解析部54は検索式で指定されている文字列(指定文字列)を語彙(N−グラム)に分解する。つまり解析部54は、検索式から指定文字列を構成する全ての語彙を抽出する。解析部54は抽出された語彙を検索部55に渡して、当該検索部55を起動する。
次に、上記実施形態の変形例について説明する。この変形例の特徴は、重み付き語彙索引生成部52に代えて、スキーマを利用して重み付けを行う重み付き語彙索引生成部520(図11参照)を用いることにある。したがって、必要ならば、図2において、重み付き語彙索引生成部52を重み付き語彙索引生成部520に置き換えられたい。
Claims (6)
- 複数の構造化文書が登録された文書データベースから、検索条件に合致する構造化文書を索引データベースに登録されている索引を用いて検索する検索処理装置において、
前記文書データベースに登録されるべき構造化文書の各ノードの情報から前記索引データベースに登録されるべき索引を生成する索引生成手段であって、生成される索引に対応するノードの階層位置に基づいて当該索引に、最下位階層位置を基準に、上位の階層に対応する索引ほど低い重みを付ける索引生成手段と、
ユーザによって指定された検索式の示す検索条件に合致する構造化文書を、前記索引データベースに登録されている索引のうち、一定レベルより高い重みの索引を用いて前記文書データベースから検索して検索結果を取得する検索手段と、
前記検索手段によって取得された検索結果を前記ユーザに提示する結果出力インタフェースと
を具備することを特徴とする検索処理装置。 - 前記検索手段は、前記索引データベースに登録されている索引を、前記一定レベルより高い重みの索引が属する最も重みの高い索引グループを含む複数の索引グループに重みに応じて分類し、前記最も重みの高い索引グループから順に、グループ単位で索引を利用して検索を行うことにより、グループ単位で検索結果を取得し、
前記結果出力インタフェースは、前記検索手段によってグループ単位で検索結果が取得される毎に、当該検索結果を前記ユーザに提示する
ことを特徴とする請求項1記載の検索処理装置。 - ユーザによって指定された重み付け条件を入力する重み付け条件入力インタフェースを更に具備し、
前記索引生成手段は、前記生成された索引に対する重み付けを前記重み付け条件入力インタフェースによって入力される重み付け条件に従って行う
ことを特徴とする請求項1記載の検索処理装置。 - 前記重み付け条件は、重み付けの対象となる、最下位階層位置を含む階層範囲を指定することにより、当該指定の階層範囲のノードに対応する索引に対する重み付けを指定しており、
前記索引生成手段は、前記重み付け条件によって指定される階層範囲内の階層位置のノードに対応する索引に、最下位階層位置を基準に、上位の階層に対応する索引ほど低い、予め定められた重みを付けることを特徴とする請求項3記載の検索処理装置。 - 前記重み付け条件は、重み付けの対象となる、最下位階層位置を含む階層範囲と重みとを指定することにより、当該指定の階層範囲のノードに対応する索引に対する重み付けを指定しており、
前記索引生成手段は、前記重み付け条件によって指定される階層範囲内の階層位置のノードに対応する索引に、最下位階層位置を基準に、前記重み付け条件によって指定される、上位の階層に対応する索引ほど低い重みを付けることを特徴とする請求項3記載の検索処理装置。 - 複数の構造化文書が登録された文書データベースから、検索条件に合致する構造化文書を索引データベースに登録されている索引を用いてコンピュータが検索するのに用いられるプログラムであって、
前記コンピュータに、
前記文書データベースに登録されるべき構造化文書の各ノードの情報から前記索引データベースに登録されるべき索引を生成するステップであって、生成される索引に対応するノードの階層位置に基づいて当該索引に、最下位階層位置を基準に、上位の階層に対応する索引ほど低い重みを付けるステップと、
前記生成された索引を前記索引データベースに登録するステップと、
ユーザによって指定された検索式の示す検索条件に合致する構造化文書を、前記索引データベースに登録されている索引のうち、一定レベルより高い重みの索引を用いて前記文書データベースから検索して検索結果を取得するステップと、
前記取得された検索結果を前記ユーザに提示するステップと
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006195774A JP4439497B2 (ja) | 2006-07-18 | 2006-07-18 | 検索処理装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006195774A JP4439497B2 (ja) | 2006-07-18 | 2006-07-18 | 検索処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008026964A JP2008026964A (ja) | 2008-02-07 |
JP4439497B2 true JP4439497B2 (ja) | 2010-03-24 |
Family
ID=39117563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006195774A Expired - Fee Related JP4439497B2 (ja) | 2006-07-18 | 2006-07-18 | 検索処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4439497B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5336895B2 (ja) * | 2009-03-24 | 2013-11-06 | 株式会社日立システムズ | ドキュメント管理システムおよびドキュメント管理方法ならびにそのためのプログラム |
JP5061173B2 (ja) * | 2009-11-13 | 2012-10-31 | 株式会社日立製作所 | データベース管理方法、データベース管理装置及びデータベース管理プログラム |
JP6647713B2 (ja) | 2016-06-03 | 2020-02-14 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 請求項中のキーワードの抽出 |
JP6710007B1 (ja) * | 2019-04-26 | 2020-06-17 | Arithmer株式会社 | 対話管理サーバ、対話管理方法、及びプログラム |
-
2006
- 2006-07-18 JP JP2006195774A patent/JP4439497B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008026964A (ja) | 2008-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6889223B2 (en) | Apparatus, method, and program for retrieving structured documents | |
KR101450358B1 (ko) | 구조형 지리적 데이터 검색 | |
US7370061B2 (en) | Method for querying XML documents using a weighted navigational index | |
KR101646754B1 (ko) | 모바일 시멘틱 검색 장치 및 그 방법 | |
US20040221229A1 (en) | Data structures related to documents, and querying such data structures | |
JP5187313B2 (ja) | 文書重要度算出システム、文書重要度算出方法およびプログラム | |
US20090019015A1 (en) | Mathematical expression structured language object search system and search method | |
JP5135272B2 (ja) | 構造化文書管理装置、及び方法 | |
JP4247135B2 (ja) | 構造化文書記憶方法、構造化文書記憶装置、構造化文書検索方法 | |
JP4207438B2 (ja) | Xml文書格納/検索装置及びそれに用いるxml文書格納/検索方法並びにそのプログラム | |
JP2008171181A (ja) | 構造化データ検索装置 | |
CN103514289A (zh) | 一种兴趣本体库构建方法及装置 | |
JP4237813B2 (ja) | 構造化文書管理システム | |
JP4439497B2 (ja) | 検索処理装置及びプログラム | |
JP2005190163A (ja) | 構造化データ検索方法、構造化データ検索装置およびプログラム | |
JP3178421B2 (ja) | テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US8229970B2 (en) | Efficient storage and retrieval of posting lists | |
CN114117242A (zh) | 数据查询方法和装置、计算机设备、存储介质 | |
WO2008038416A1 (fr) | Dispositif de recherche de document et procédé de recherche de document | |
JPH11110384A (ja) | 構造化文書検索表示方法及び装置 | |
JP3617096B2 (ja) | 関係表現抽出装置および関係表現検索装置、関係表現抽出方法、関係表現検索方法 | |
JP4439496B2 (ja) | 検索処理装置及びプログラム | |
JPH0844771A (ja) | 情報検索装置 | |
JP2005242416A (ja) | 自然言語文の検索方法および検索装置 | |
KR102280028B1 (ko) | 빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090728 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091208 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100105 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130115 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140115 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |