JP2020173611A - Search processing program, search processing method, and search processing device - Google Patents
Search processing program, search processing method, and search processing device Download PDFInfo
- Publication number
- JP2020173611A JP2020173611A JP2019075082A JP2019075082A JP2020173611A JP 2020173611 A JP2020173611 A JP 2020173611A JP 2019075082 A JP2019075082 A JP 2019075082A JP 2019075082 A JP2019075082 A JP 2019075082A JP 2020173611 A JP2020173611 A JP 2020173611A
- Authority
- JP
- Japan
- Prior art keywords
- word
- attribute
- search
- words
- search target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、検索処理プログラム、検索処理方法および検索処理装置に関する。 The present invention relates to a search processing program, a search processing method, and a search processing apparatus.
近年、企業内に蓄積されているテキストや画像などの非構造のデータをナレッジ活用することが流行している。その中で、企業内に蓄積されているドキュメント(例えば、製品マニュアル、論文など)を、効率的かつ簡単に検索することができる仕組みが求められている。 In recent years, it has become popular to utilize unstructured data such as texts and images accumulated in a company for knowledge. Under such circumstances, there is a demand for a mechanism that enables efficient and easy search of documents (for example, product manuals, papers, etc.) accumulated in a company.
先行技術としては、ユーザが入力した分野キーワードに基づいて、分野・フォルダ対応情報データベースを参照して分野キーワードを属性として含むフォルダを選択し、検索インデックスを参照して選択されたフォルダを対象として検索を実行するものがある。 As a prior art, based on the field keyword entered by the user, the field / folder correspondence information database is referred to to select a folder containing the field keyword as an attribute, and the search index is referred to to search the selected folder. There is something to do.
しかしながら、従来技術では、検索対象のドキュメントの属性を考慮した検索を行うことが難しい。例えば、全文検索により検索した検索結果の集合に対して、ユーザに属性を指定させることで、検索結果を絞り込むことが考えられるが、検索キーワードの入力とは別に、属性を指定する操作が必要となり手間がかかる。 However, in the prior art, it is difficult to perform a search in consideration of the attributes of the document to be searched. For example, it is conceivable to narrow down the search results by letting the user specify attributes for the set of search results searched by full-text search, but it is necessary to specify the attributes separately from the input of the search keyword. It takes time and effort.
一つの側面では、本発明は、属性を指定しない状態でキーワードの入力を受け付けても、キーワードが属性毎に設定されている検索対象について、属性を反映した検索を実行することを目的とする。 On one aspect, it is an object of the present invention to execute a search reflecting an attribute for a search target in which a keyword is set for each attribute even if an input of a keyword is accepted without specifying an attribute.
1つの実施態様では、検索対象に対する検索のために受け付けた複数のワードの中に、予め記憶部に記憶されていた検索対象の属性毎に対応付けられた1又は複数のワードと一致又は類似する第1のワードが存在するか否かを判定し、前記第1のワードが存在すると判定した場合に、前記第1のワードと一致又は類似するワードと対応付けられている属性において前記第1のワードを含む検索対象群を抽出し、前記複数のワードに含まれる前記第1のワード以外の第2のワードと前記検索対象群それぞれのデータに含まれるワードとの比較結果に基づいて、前記検索対象群の中から前記検索対象を特定する、検索処理プログラムが提供される。 In one embodiment, among the plurality of words received for the search for the search target, one or a plurality of words associated with each attribute of the search target previously stored in the storage unit are matched or similar. When it is determined whether or not the first word exists and it is determined that the first word exists, the first word is in the attribute associated with the word that matches or is similar to the first word. A search target group including a word is extracted, and the search is performed based on a comparison result between a second word other than the first word included in the plurality of words and a word included in the data of each of the search target groups. A search processing program that identifies the search target from the target group is provided.
本発明の一側面によれば、属性を指定しない状態でキーワードの入力を受け付けても、キーワードが属性毎に設定されている検索対象について、属性を反映した検索を実行することができる。 According to one aspect of the present invention, even if the input of the keyword is accepted without specifying the attribute, the search target in which the keyword is set for each attribute can be searched by reflecting the attribute.
以下に図面を参照して、本発明にかかる検索処理プログラム、検索処理方法および検索処理装置の実施の形態を詳細に説明する。 Hereinafter, embodiments of a search processing program, a search processing method, and a search processing apparatus according to the present invention will be described in detail with reference to the drawings.
(実施の形態)
図1は、実施の形態にかかる検索処理方法の一実施例を示す説明図である。図1において、検索処理装置101は、属性を指定しない状態で入力されたキーワードに基づいて、属性を反映した検索を実行するコンピュータである。属性は、検索対象を特徴付ける情報である。
(Embodiment)
FIG. 1 is an explanatory diagram showing an embodiment of a search processing method according to an embodiment. In FIG. 1, the
検索対象は、例えば、製品マニュアルや論文などのドキュメント(文書データ)である。検索対象には、属性を示す属性情報が付与されている。例えば、検索対象が製品マニュアルの場合、属性は、製品名、エディション(版数)、OS(Operating System)、バージョン情報などである。 The search target is, for example, a document (document data) such as a product manual or a paper. Attribute information indicating the attribute is given to the search target. For example, when the search target is a product manual, the attributes are the product name, edition (version number), OS (Operating System), version information, and the like.
既存の検索手法として、検索対象のドキュメントに属性情報を付与しておき、検索時は、入力されたキーワードが、本文や属性情報に含まれるドキュメントを検索結果として出力するものがある。ただし、本文と属性情報を区別せずに、入力されたキーワードで検索を行うと、検索結果に含まれるノイズ(ユーザが意図しない情報)が多くなってしまう。 As an existing search method, attribute information is added to a document to be searched, and at the time of search, the input keyword outputs a document included in the text or attribute information as a search result. However, if the search is performed using the entered keyword without distinguishing between the text and the attribute information, the noise (information not intended by the user) included in the search result will increase.
また、検索結果に含まれるノイズを減らす手法として、例えば、本文に対して検索した検索結果の集合に対して、ユーザに属性を指定させることで、検索結果を絞り込むものがある。しかし、検索キーワードの入力とは別に、属性を指定する操作が必要となり、手間がかかるという問題がある。また、ユーザが属性の詳細を把握していないと、検索結果を絞り込むための属性を指定することができない。 Further, as a method of reducing noise included in the search result, for example, there is a method of narrowing down the search result by having the user specify an attribute for a set of search results searched for the text. However, there is a problem that it takes time and effort because an operation of specifying an attribute is required separately from inputting a search keyword. In addition, if the user does not know the details of the attribute, the attribute for narrowing down the search result cannot be specified.
そこで、本実施の形態では、属性を指定しない状態でキーワードの入力を受け付けても、キーワードが属性毎に設定されている検索対象について、属性を反映した検索を可能にする検索処理方法について説明する。以下、検索処理装置101の処理例について説明する。
Therefore, in the present embodiment, even if the input of the keyword is accepted without specifying the attribute, the search processing method that enables the search reflecting the attribute for the search target in which the keyword is set for each attribute will be described. .. Hereinafter, a processing example of the
(1)検索処理装置101は、検索対象に対する検索のために受け付けた複数のワードの中に、予め記憶部110に記憶されていた検索対象の属性毎に対応付けられた1又は複数のワードと一致又は類似する第1のワードが存在するか否かを判定する。
(1) The
ここで、複数のワードは、検索時にキーワードとして入力される2以上のワードである。検索対象の属性毎に対応付けられた1又は複数のワードは、当該属性に対応するキーワードとして予め登録された語句に含まれる1又は複数のワードである。例えば、属性「製品名」のキーワードとしては、実際に存在する製品名が設定される。 Here, the plurality of words are two or more words that are input as keywords at the time of search. The one or more words associated with each attribute to be searched are one or more words included in the words and phrases registered in advance as keywords corresponding to the attribute. For example, as a keyword of the attribute "product name", a product name that actually exists is set.
具体的には、例えば、検索処理装置101は、受け付けた複数のワードの各ワードと、検索対象の属性毎に対応付けられた各ワードとをそれぞれ比較する。そして、検索処理装置101は、比較した結果に基づいて、受け付けた複数のワードの中に、検索対象の属性毎に対応付けられたいずれかのワードと一致又は類似する第1のワードが存在するか否かを判定する。
Specifically, for example, the
図1の例では、検索対象に対する検索のために、ワード111(xxx)とワード112(aaa)とを受け付けた場合を想定する。また、記憶部110には、検索対象の属性1に対応付けられたワード「xxx」と、検索対象の属性2に対応付けられたワード「yyy」と、検索対象の属性3に対応付けられたワード「zzz」とが記憶されている場合を想定する。
In the example of FIG. 1, it is assumed that the word 111 (xxx) and the word 112 (aaa) are accepted for the search for the search target. Further, the
この場合、検索処理装置101は、ワード111,112の各ワードと、検索対象の属性1〜3毎に対応付けられた各ワードとをそれぞれ比較する。ここでは、受け付けたワード111(xxx)が、検索対象の属性1に対応付けられたワード「xxx」と一致する。このため、第1のワード「xxx」が存在すると判定される。
In this case, the
(2)検索処理装置101は、第1のワードが存在すると判定した場合に、第1のワードと一致又は類似するワードと対応付けられている属性において第1のワードを含む検索対象群を抽出する。ここで、抽出元となる複数の検索対象は、例えば、企業内に蓄積されているドキュメントである。
(2) When the
また、第1のワードと一致又は類似するワードと対応付けられている属性において第1のワードを含む検索対象とは、検索対象を特徴付ける属性のうち、第1のワードと一致又は類似するワードと対応付けられている属性の属性値に、第1のワードを含む検索対象である。 Further, in the attribute associated with the word that matches or is similar to the first word, the search target including the first word is a word that matches or is similar to the first word among the attributes that characterize the search target. The search target includes the first word in the attribute value of the associated attribute.
すなわち、検索処理装置101は、複数の検索対象の中から、第1のワードと一致又は類似するワードと対応付けられている属性の属性値に、第1のワードが含まれる検索対象群を抽出する。これにより、第1のワードと一致又は類似するワードと対応付けられている属性の属性値に、第1のワードを含む検索対象群を絞り込むことができる。
That is, the
図1の例では、検索処理装置101は、抽出元120の中から、属性1の属性値に、第1のワード「xxx」が含まれる検索対象群を抽出する。なお、抽出元120に含まれる各検索対象には、属性1〜3の属性値を示す属性情報が付与されている。ここでは、検索対象群121が抽出された場合を想定する。
In the example of FIG. 1, the
(3)検索処理装置101は、受け付けた複数のワードに含まれる第1のワード以外の第2のワードと、抽出した検索対象群それぞれのデータに含まれるワードとの比較結果に基づいて、検索対象群の中から検索対象を特定する。ここで、検索対象群それぞれのデータとは、例えば、ドキュメントの本文情報である。
(3) The
具体的には、例えば、検索処理装置101は、受け付けた複数のワードのうち第1のワード以外の第2のワードを特定する。つぎに、検索処理装置101は、特定した第2のワードと、抽出した検索対象群それぞれのデータに含まれるワードとを比較する。そして、検索処理装置101は、抽出した検索対象群の中から、第2のワードと一致するワードがデータに含まれる検索対象を特定する。
Specifically, for example, the
図1の例では、検索処理装置101は、受け付けたワード111,112のうち第1のワード「xxx」以外の第2のワード「aaa」を特定する。つぎに、検索処理装置101は、第2のワード「aaa」と、抽出した検索対象群121それぞれのデータに含まれるワードとを比較する。そして、検索処理装置101は、検索対象群121の中から、第2のワード「aaa」と一致するワードがデータに含まれる検索対象を特定する。ここでは、検索対象集合122が特定されている。
In the example of FIG. 1, the
このように、検索処理装置101によれば、属性を指定しない状態でキーワードの入力を受け付けても、キーワードが属性毎に設定されている検索対象について、属性を反映した検索を実行することができる。
As described above, according to the
図1の例では、ユーザが意識して入力しなくても、検索対象に対する検索のために受け付けたワード111,112を、絞り込み用のワード(第1のワード)と、全文検索用のワード(第2のワード)とに分類することができる。これにより、ユーザが指定したい属性情報を推定して検索対象群121を絞り込んだ上で全文検索を行うことができ、検索結果に含まれるノイズを減らして、ユーザが欲しい情報を見つけやすくすることができる。
In the example of FIG. 1, the
(検索処理システム200のシステム構成例)
つぎに、実施の形態にかかる検索処理システム200のシステム構成例について説明する。検索処理システム200は、図1に示した検索処理装置101を含むコンピュータシステムであり、例えば、企業内に蓄積されているドキュメントをナレッジ活用するためのシステムに適用される。
(System configuration example of search processing system 200)
Next, a system configuration example of the
図2は、検索処理システム200のシステム構成例を示す説明図である。図2において、検索処理システム200は、検索処理装置101と、クライアント装置201と、を含む。検索処理システム200において、検索処理装置101およびクライアント装置201は、有線又は無線のネットワーク210を介して接続される。ネットワーク210は、例えば、LAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどである。
FIG. 2 is an explanatory diagram showing a system configuration example of the
ここで、検索処理装置101は、ドキュメント管理DB(Database)220および製品属性テーブル230を有する。例えば、検索処理装置101は、サーバである。検索処理装置101は、複数のサーバにより実現されることにしてもよい。各種DB等220,230の記憶内容については、図4および図5を用いて後述する。図1に示した記憶部110は、例えば、製品属性テーブル230に相当する。
Here, the
ただし、各種DB等220,230は、検索処理装置101がアクセス可能な他のコンピュータが有することにしてもよい。この場合、検索処理装置101は、他のコンピュータにアクセスして、各種DB等220,230の記憶内容を参照することができる。
However, the
クライアント装置201は、検索処理システム200のユーザが使用するコンピュータである。ユーザは、例えば、検索処理システム200が導入された企業の従業員である。クライアント装置201は、例えば、PC(Personal Computer)、タブレットPC、スマートフォンなどである。
The
なお、図2の例では、クライアント装置201を1台のみ表示したが、検索処理システム200には複数のクライアント装置201が含まれていてもよい。
In the example of FIG. 2, only one
(検索処理装置101のハードウェア構成例)
図3は、検索処理装置101のハードウェア構成例を示すブロック図である。図3において、検索処理装置101は、CPU(Central Processing Unit)301と、メモリ302と、ディスクドライブ303と、ディスク304と、通信I/F(Interface)305と、可搬型記録媒体I/F306と、を有する。また、各構成部は、バス300によってそれぞれ接続される。
(Example of hardware configuration of search processing device 101)
FIG. 3 is a block diagram showing a hardware configuration example of the
ここで、CPU301は、検索処理装置101の全体の制御を司る。CPU301は、複数のコアを有していてもよい。メモリ302は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)およびフラッシュROMなどを有する。具体的には、例えば、フラッシュROMがOS(Operating System)のプログラムを記憶し、ROMがアプリケーションプログラムを記憶し、RAMがCPU301のワークエリアとして使用される。メモリ302に記憶されるプログラムは、CPU301にロードされることで、コーディングされている処理をCPU301に実行させる。
Here, the
ディスクドライブ303は、CPU301の制御に従ってディスク304に対するデータのリード/ライトを制御する。ディスク304は、ディスクドライブ303の制御で書き込まれたデータを記憶する。ディスク304としては、例えば、磁気ディスク、光ディスクなどが挙げられる。
The
通信I/F305は、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して外部のコンピュータ(例えば、図2に示したクライアント装置201)に接続される。そして、通信I/F305は、ネットワーク210と装置内部とのインターフェースを司り、外部のコンピュータからのデータの入出力を制御する。通信I/F305には、例えば、モデムやLANアダプタなどを採用することができる。
The communication I /
可搬型記録媒体I/F306は、CPU301の制御に従って可搬型記録媒体307に対するデータのリード/ライトを制御する。可搬型記録媒体307は、可搬型記録媒体I/F306の制御で書き込まれたデータを記憶する。可搬型記録媒体307としては、例えば、CD(Compact Disc)−ROM、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリなどが挙げられる。
The portable recording medium I /
なお、検索処理装置101は、上述した構成部のほかに、例えば、SSD(Solid State Drive)、入力装置、ディスプレイ等を有することにしてもよい。また、検索処理装置101は、上述した構成部のうち、例えば、ディスクドライブ303、ディスク304、可搬型記録媒体I/F306、可搬型記録媒体307を有していなくてもよい。
In addition to the above-mentioned components, the
また、図2に示したクライアント装置201についても、検索処理装置101と同様のハードウェア構成により実現することができる。ただし、クライアント装置201は、上述した構成部のほかに、入力装置およびディスプレイを有する。入力装置は、文字、数字、各種指示などの入力のためのキーを有し、データの入力を行う。入力装置は、キーボードやマウスなどであってもよく、また、タッチパネル式の入力パッドやテンキーなどであってもよい。ディスプレイは、カーソル、アイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する表示装置である。ディスプレイとしては、例えば、液晶ディスプレイや有機EL(Electroluminescence)ディスプレイなどを採用することができる。
Further, the
(各種DB等220,230の記憶内容)
つぎに、図4および図5を用いて、検索処理装置101が有する各種DB等220,230の記憶内容について説明する。各種DB等220,230は、例えば、図3に示した検索処理装置101のメモリ302、ディスク304などの記憶装置により実現される。
(Memory contents of 220 and 230 such as various DBs)
Next, the stored contents of various DBs and the like 220 and 230 included in the
図4は、ドキュメント管理DB220の記憶内容の一例を示す説明図である。図4において、ドキュメント管理DB220は、ドキュメントID、製品名、エディション、ファミリ製品名、OSおよび本文情報のフィールドを有する。各フィールドに情報を設定することで、ドキュメント管理情報(例えば、ドキュメント管理情報400−1,400−2)がレコードとして記憶される。
FIG. 4 is an explanatory diagram showing an example of the stored contents of the
ここで、ドキュメントIDは、検索対象のドキュメントを一意に識別する識別子である。ドキュメントは、例えば、1ページ1ファイルのHTML(HyperText Markup Language)形式のデータである。ここでは、検索対象のドキュメントが「製品マニュアル」である場合を例に挙げて説明する。 Here, the document ID is an identifier that uniquely identifies the document to be searched. The document is, for example, HTML (HyperText Markup Language) format data of one file per page. Here, a case where the document to be searched is a "product manual" will be described as an example.
製品名、エディション、ファミリ製品名およびOSは、検索対象のドキュメントを特徴付ける属性の一例である。製品名は、製品の名称である。エディションは、製品のエディションである。ファミリ製品名は、関連製品の名称である。OSは、製品が動作するOSである。 The product name, edition, family product name, and OS are examples of attributes that characterize the document to be searched. The product name is the name of the product. The edition is the edition of the product. Family product names are the names of related products. The OS is the OS on which the product operates.
本文情報は、検索対象のドキュメントの本文を示す。ただし、本文情報は、ドキュメントの格納場所を示す情報(例えば、URL:Uniform Resource Locator)であってもよい。この場合、クライアント装置201は、本文情報が示す格納場所から本文を読み出すことで、本文を参照することができる。
The text information indicates the text of the document to be searched. However, the text information may be information indicating the storage location of the document (for example, URL: Uniform Resource Locator). In this case, the
例えば、ドキュメント管理情報400−1は、ドキュメントD1の製品名「Interstage Charset Manager」、エディション「Enterprise Edition」、ファミリ製品名「xxx」、OS「Windows(登録商標)」および本文情報「・・・」を示す。 For example, the document management information 400-1 includes the product name "Interstage Charge Manager" of the document D1, the edition "Enterprise Edition", the family product name "xxx", the OS "Windows (registered trademark)", and the text information "...". Is shown.
また、ドキュメント管理情報400−2は、ドキュメントD2の製品名「Interstage Charset Manager」、エディション「Enterprise Edition」、ファミリ製品名「xxx」、OS「Linux(登録商標)」および本文情報「・・・」を示す。 In addition, the document management information 400-2 includes the product name "Interstage Charge Manager" of the document D2, the edition "Enterprise Edition", the family product name "xxx", the OS "Linux (registered trademark)", and the text information "...". Is shown.
図5は、製品属性テーブル230の記憶内容の一例を示す説明図である。図5において、製品属性テーブル230は、属性名および登録語のフィールドを有し、各フィールドに情報を設定することで、製品属性情報(例えば、製品属性情報500−1〜500−3)をレコードとして記憶する。 FIG. 5 is an explanatory diagram showing an example of the stored contents of the product attribute table 230. In FIG. 5, the product attribute table 230 has fields for attribute names and registered words, and by setting information in each field, product attribute information (for example, product attribute information 500-1 to 500-3) is recorded. Remember as.
ここで、属性名は、検索対象のドキュメントを特徴付ける属性の名称を示す。登録語は、属性名の属性に対応付けられた1又は複数のワードを含む語句である。例えば、属性名「製品名」の登録語としては、実際に存在する製品名が設定される。また、属性名「エディション」の登録語としては、実際に存在する製品のエディションが設定される。属性名「ファミリ製品名」の登録語としては、実際に存在する関連製品名が設定される。属性名「OS」の登録語としては、実際に存在するOS名が設定される。 Here, the attribute name indicates the name of the attribute that characterizes the document to be searched. A registered word is a phrase containing one or more words associated with an attribute of an attribute name. For example, as a registered word of the attribute name "product name", a product name that actually exists is set. In addition, the edition of the product that actually exists is set as the registered word of the attribute name "edition". As the registered word of the attribute name "family product name", the related product name that actually exists is set. As the registered word of the attribute name "OS", the OS name that actually exists is set.
例えば、製品属性情報500−1は、属性名「製品名」の登録語「Interstage Charset Manager」を示す。 For example, the product attribute information 500-1 indicates the registered word “Interstage Charge Manager” of the attribute name “product name”.
(検索処理装置101の機能的構成例)
図6は、検索処理装置101の機能的構成例を示すブロック図である。図6において、検索処理装置101は、受付部601と、判定部602と、抽出部603と、特定部604と、出力部605と、記憶部610と、を含む。具体的には、例えば、受付部601〜出力部605は、図3に示したメモリ302、ディスク304、可搬型記録媒体307などの記憶装置に記憶されたプログラムをCPU301に実行させることにより、または、通信I/F305により、その機能を実現する。各機能部の処理結果は、例えば、メモリ302、ディスク304などの記憶装置に記憶される。記憶部610は、例えば、メモリ302、ディスク304などの記憶装置により実現される。具体的には、例えば、記憶部610は、図4に示したドキュメント管理DB220や、図5に示した製品属性テーブル230を記憶する。
(Example of Functional Configuration of Search Processing Device 101)
FIG. 6 is a block diagram showing a functional configuration example of the
受付部601は、検索対象に対する検索のための複数のワードを受け付ける。ここで、複数のワードは、検索時にキーワードとして入力される2以上のワードである。複数のワードの入力は、例えば、図2に示したクライアント装置201において、入力装置(不図示)を用いたユーザの操作入力により行われる。
The
具体的には、例えば、受付部601は、クライアント装置201から検索依頼を受信することにより、受信した検索依頼に含まれる入力文を受け付ける。入力文は、キーワードとして入力された複数のワードを含む。検索依頼は、例えば、後述の図12に示す検索画面1200において行われる。ただし、受付部601は、自装置の入力装置(不図示)を用いたユーザの操作入力により、複数のワードを受け付けることにしてもよい。
Specifically, for example, the
判定部602は、受け付けた複数のワードの中に、記憶部610に予め記憶されていた検索対象の属性毎に対応付けられた1又は複数のワードと、一致又は類似する第1のワードが存在するか否かを判定する。ここで、検索対象の属性毎に対応付けられた1又は複数のワードは、当該属性に対応するキーワードとして予め登録された語句(登録語)に含まれる1又は複数のワードである。
Among the plurality of received words, the
以下の説明では、ワードを「単語」と表記する場合がある。 In the following description, a word may be referred to as a "word".
具体的には、例えば、判定部602は、受け付けた入力文を単語(ワード)に分割する。この際、判定部602は、例えば、入力文から分割した単語の語順も保持する。これにより、検索対象に対する検索のための複数のワードが得られる。なお、単語に分割する処理は、例えば、辞書情報や形態素解析等の技術を利用して行うことができる。
Specifically, for example, the
また、判定部602は、図5に示した製品属性テーブル230を参照して、検索対象の属性に対応付けられた登録語を単語に分割する。この際、判定部602は、例えば、登録語から分割した単語の語順も保持する。これにより、検索対象の属性に対応付けられた1又は複数のワードが得られる。
Further, the
つぎに、判定部602は、分割した単語毎に、入力文から分割した単語と、登録語から分割した単語とを比較する。属性に対応付けられた登録語は、複数の単語で構成されているものもある。このため、判定部602は、例えば、入力文に含まれる単語列と、登録語に含まれる単語列とを比較することにしてもよい。単語列は、複数の単語を語順どおりに並べたものである。
Next, the
ここで、比較した単語(あるいは、単語列)の文字列が完全一致した場合、判定部602は、単語(あるいは、単語列)が一致すると判定する。一方、比較した単語(あるいは、単語列)の文字列が完全一致しない場合には、判定部602は、単語(あるいは、単語列)が一致しないと判定する。
Here, when the character strings of the compared words (or word strings) completely match, the
ただし、入力文は自由入力のため、入力時にスペルミスが発生する場合がある。ある程度のスペルミスを許容すべく、判定部602は、数文字程度の違いであれば、単語(あるいは、単語列)が類似すると判定することにしてもよい。許容する文字数は、単語(あるいは、単語列)の文字数に応じて定めることにしてもよい。
However, since the input text is free input, spelling mistakes may occur during input. In order to allow a certain amount of spelling mistakes, the
例えば、4文字以上の単語については、許容する文字数を「2」とし、4文字未満の単語については、許容する文字数を「0」とする。この場合、判定部602は、4文字以上の単語については、比較した単語の文字列が完全一致しない場合であっても、不一致の文字数が2以下であれば、単語が類似すると判定する。また、判定部602は、4文字未満の単語については、不一致の文字数が「1」であっても、単語が類似しないと判定する。
For example, for words of 4 or more characters, the allowable number of characters is "2", and for words of less than 4 characters, the allowable number of characters is "0". In this case, the
また、比較した単語(あるいは、単語列)の文字列が完全一致しない場合、判定部602は、単語同士(あるいは、単語列同士)の編集距離を算出することにしてもよい。編集距離(レーベンシュタイン距離)は、二つの文字列がどの程度異なっているかを示す指標値である。そして、判定部602は、算出した編集距離が予め決められた閾値以下であれば、比較した単語(あるいは、単語列同士)の文字列が完全一致しない場合であっても、単語(あるいは、単語列同士)が類似すると判定することにしてもよい。
Further, when the character strings of the compared words (or word strings) do not completely match, the
また、属性名(例えば、製品名)によっては、入力文において略語で表される場合がある。このため、判定部602は、例えば、略語と正式名との対応関係を示す辞書情報を使用して、略語を正式名に変換した上で、変換後の単語(正式名)と、登録語から分割した単語とを比較することにしてもよい。
Further, depending on the attribute name (for example, the product name), it may be represented by an abbreviation in the input sentence. Therefore, the
そして、判定部602は、入力文から分割した複数の単語(あるいは、単語列)のうち、登録語から分割した少なくともいずれかの単語(あるいは、単語列)と一致又は類似する単語(あるいは、単語列)を、第1のワードとして特定する。なお、単語の比較例については、図7を用いて後述する。
Then, the
抽出部603は、第1のワードが存在すると判定された場合に、複数の検索対象の中から、第1のワードと一致又は類似するワードと対応付けられている属性において第1のワードを含む検索対象群を抽出する。ここで、複数の検索対象は、例えば、企業内に蓄積されているドキュメントである。
When it is determined that the first word exists, the
第1のワードと一致又は類似するワードと対応付けられている属性において第1のワードを含む検索対象とは、第1のワードと一致又は類似するワードと対応付けられている属性の属性値に、第1のワードを含む検索対象である。すなわち、第1のワードを、属性により検索対象を絞り込む際のキーワード(属性キーワード)として用いる。 In the attribute associated with the word matching or similar to the first word, the search target including the first word is the attribute value of the attribute associated with the word matching or similar to the first word. , Is a search target including the first word. That is, the first word is used as a keyword (attribute keyword) when narrowing down the search target by the attribute.
ただし、第1のワードには、スペルミスが含まれている場合がある。また、第1のワードは、略語で表されている場合がある。このため、抽出部603は、第1のワードと一致又は類似するワードと対応付けられている属性において、当該ワード(第1のワードと一致又は類似するワード)を含む検索対象群を抽出することにしてもよい。
However, the first word may contain misspellings. In addition, the first word may be represented by an abbreviation. Therefore, the
また、抽出部603は、第1のワードが存在すると判定された場合に、複数の検索対象の中から、第1のワードと一致又は類似するワードと対応付けられている属性において、当該属性に対応付けられた1又は複数のワードを含む検索対象群を抽出することにしてもよい。
Further, when it is determined that the first word exists, the
より具体的には、例えば、抽出部603は、図4に示したドキュメント管理DB220を参照して、第1のワードと一致又は類似するワードと対応付けられている属性において、当該属性に対応付けられた登録語を含むドキュメント群を抽出する。
More specifically, for example, the
ここで、第1のワードと一致又は類似するワードと対応付けられている属性を属性「OS」とし、当該属性「OS」に対応付けられた登録語を「Windows」とする。この場合、判定部602は、ドキュメント管理DB220を参照して、属性「製品名」の属性値に、登録語「Windows」を含むドキュメント群(例えば、ドキュメントD1)を抽出する。
Here, the attribute associated with the word that matches or is similar to the first word is defined as the attribute "OS", and the registered word associated with the attribute "OS" is defined as "Windows". In this case, the
これにより、入力文からユーザが指定したい属性(属性値)を推定して、検索対象のドキュメントを絞り込むことができる。 As a result, the attribute (attribute value) that the user wants to specify can be estimated from the input sentence, and the documents to be searched can be narrowed down.
受け付けた複数のワードの中に、第1のワードが複数存在する場合がある。この場合、抽出部603は、例えば、複数の第1のワードの少なくともいずれかのワードと一致又は類似するワードと対応付けられている属性において、当該属性に対応付けられた登録語を含む検索対象群を抽出することにしてもよい。また、抽出部603は、複数の第1のワードの各ワードと一致又は類似するワードと対応付けられている各属性において、当該各属性に対応付けられた登録語を含む検索対象群を抽出することにしてもよい。
There may be a plurality of first words among the plurality of received words. In this case, the
特定部604は、受け付けた複数のワードに含まれる第1のワード以外の第2のワードと、抽出された検索対象群それぞれのデータに含まれるワードとの比較結果に基づいて、検索対象群の中から検索対象を特定する。
The
具体的には、例えば、特定部604は、入力文のうちの第1ワード以外の単語を第2のワードとして特定する。また、特定部604は、ドキュメント管理DB220を参照して、抽出されたドキュメント群それぞれの本文情報を取得する。つぎに、特定部604は、特定した第2のワードと、ドキュメント群それぞれの本文情報に含まれるワードとを比較する。
Specifically, for example, the
そして、特定部604は、抽出されたドキュメント群の中から、第2のワードと一致するワードが本文情報に含まれるドキュメントを特定する。また、特定部604は、ドキュメント群の中から、第2のワードと類似するワードが本文情報に含まれるドキュメントを特定することにしてもよい。
Then, the
すなわち、特定部604は、入力文のうちの第1ワード以外の単語(第2のワード)を検索キーワードとして、抽出されたドキュメント群の中からドキュメントを特定する。
That is, the
また、第2のワードが複数存在する場合がある。この場合、特定部604は、ドキュメント群の中から、複数の第2のワードの少なくともいずれかのワードと一致又は類似するワードが本文情報に含まれるドキュメントを特定することにしてもよい(OR検索)。また、特定部604は、ドキュメント群の中から、複数の第2のワードの各ワードと一致又は類似するワードが本文情報に全て含まれるドキュメントを特定することにしてもよい(AND検索)。
In addition, there may be a plurality of second words. In this case, the
出力部605は、受け付けた複数のワードに対して、特定された検索対象を出力する。具体的には、例えば、出力部605は、クライアント装置201からの検索依頼に対する検索結果として、特定されたドキュメントを示す情報(例えば、タイトル、要約など)を出力する。この結果、クライアント装置201において、検索依頼に対する検索結果が、ディスプレイ(不図示)に表示される。
The
また、出力部605は、受け付けた複数のワードに対して、特定された検索対象とともに、第1のワードと一致又は類似するワードと対応付けられている属性に対応付けられた語句を出力することにしてもよい。ここで、属性に対応付けられた語句は、属性に対応付けられた1又は複数のワードからなる語句であり、例えば、属性に対応付けられた登録語(図5参照)である。
Further, the
より具体的には、例えば、出力部605は、特定されたドキュメントを示す情報とともに、第1のワードと一致又は類似するワードと対応付けられている属性に対応付けられた登録語を表示する検索画面を、クライアント装置201に表示することにしてもよい。これにより、検索依頼に対する検索結果を表示する際にどのような属性で検索結果を絞り込んだのかを特定可能な情報を提示することができる。検索画面の画面例については、図12を用いて後述する。
More specifically, for example, the
なお、上述した説明では、第1のワードが存在すると判定された場合に、抽出部603が、複数の検索対象の中から、第1のワードと一致又は類似するワードと対応付けられている属性において第1のワードを含む検索対象群を抽出することにしたが、これに限らない。
In the above description, when it is determined that the first word exists, the
例えば、第1のワードが存在すると判定された場合に、抽出部603が、受け付けた複数のワードに含まれる第1のワード以外の第2のワードと、複数の検索対象それぞれのデータに含まれるワードとの比較結果に基づいて、複数の検索対象の中から検索対象群を抽出することにしてもよい。すなわち、抽出部603は、複数のワードのうちの第1ワード以外の第2のワードを検索キーワードとして、複数の検索対象の中から検索対象群を抽出する。そして、特定部604が、抽出された検索対象群の中から、第1のワードと一致又は類似するワードと対応付けられている属性において、第1のワードを含む検索対象を特定することにしてもよい。
For example, when it is determined that the first word exists, the
(単語の比較例)
つぎに、入力文から分割した単語(ワード)と、検索対象の属性毎に対応付けられた登録語から分割した単語との比較例について説明する。
(Example of word comparison)
Next, a comparison example of a word divided from the input sentence and a word divided from the registered words associated with each attribute to be searched will be described.
図7は、単語の比較例を示す説明図である。図7において、入力文710は、クライアント装置201からの検索依頼に含まれる入力文の一例である。判定部602は、入力文710を単語に分割する。図7の例では、入力文710が、単語711(Charset)、単語712(Enterprise)、単語713(Edition)、単語714(Windows)および単語715(インストール)に分割される。
FIG. 7 is an explanatory diagram showing a comparative example of words. In FIG. 7, the
また、判定部602は、製品属性テーブル230を参照して、検索対象の属性毎に、当該属性に対応付けられた登録語それぞれを単語に分割する。ここでは、属性を「製品名」、「エディション」、「ファミリ製品名」および「OS」とする。また、属性「製品名」に対応付けられた登録語を「Interstage Charset Manager」と「Enterprise」とする。
Further, the
この場合、判定部602は、登録語「Interstage Charset Manager」を単語に分割する。ここでは、単語721(Interstage)、単語722(Charset)および単語723(Manager)に分割される。登録語「Enterprise」については、1単語のため分割されず、単語731(Enterprise)となる。
In this case, the
また、属性「エディション」に対応付けられた登録語を「Enterprise Edition」とする。この場合、判定部602は、登録語「Enterprise Edition」を単語に分割する。ここでは、単語741(Enterprise)および単語742(Edition)に分割される。
Further, the registered word associated with the attribute "edition" is defined as "Enterprise Edition". In this case, the
また、属性「ファミリ製品名」に対応付けられた登録語を「開発パッケージ for Windows」とする。この場合、判定部602は、登録語「開発パッケージ for Windows」を単語に分割する。ここでは、単語751(開発)、単語752(パッケージ)、単語753(for)および単語754(Windows)に分割される。また、属性「OS」に対応付けられた登録語を「Windows」とする。登録語「Windows」については、1単語のため分割されず、単語761(Windows)となる。
In addition, the registered word associated with the attribute "family product name" is defined as "development package for Windows". In this case, the
つぎに、判定部602は、分割した単語毎に、入力文から分割した単語711〜715と、登録語から分割した単語721〜723,731,741,742,751〜754,761とを比較する。例えば、単語711について、単語722との比較結果は「一致」であり、それ以外の単語との比較結果は「不一致かつ非類似」である。
Next, the
また、単語712について、単語731,741との比較結果は「一致」であり、それ以外の単語との比較結果は「不一致かつ非類似」である。また、単語713について、単語742との比較結果は「一致」であり、それ以外の単語との比較結果は「不一致かつ非類似」である。また、単語714について、単語754,761との比較結果は「一致」であり、それ以外の単語との比較結果は「不一致かつ非類似」である。また、単語715については、全単語との比較結果が「不一致かつ非類似」である。
Further, regarding the
比較の結果、入力文から分割した単語711〜715のうち、登録語から分割した少なくともいずれかの単語と一致又は類似すると判定された単語(第1のワード)は、例えば、図8に示すような属性候補テーブル800に記憶される。属性候補テーブル800は、例えば、メモリ302、ディスク304などの記憶装置により実現される。
As a result of comparison, among the
図8は、属性候補テーブル800の記憶内容の一例を示す説明図である。図8において、属性候補テーブル800は、属性名、属性キーワードおよび登録語のフィールドを有し、各フィールドに情報を設定することで、属性候補情報800−1〜800−5がレコードとして記憶される。 FIG. 8 is an explanatory diagram showing an example of the stored contents of the attribute candidate table 800. In FIG. 8, the attribute candidate table 800 has fields of attribute name, attribute keyword, and registered word, and by setting information in each field, attribute candidate information 800-1 to 800-5 is stored as a record. ..
ここで、属性名は、検索対象のドキュメントを特徴付ける属性の名称を示す。属性キーワードは、入力文から分割した単語のうち、属性名の属性に対応付けられた登録語から分割した少なくともいずれかの単語と一致又は類似する単語(第1のワード)を示す。属性キーワードは、属性により検索対象を絞り込む際に用いるキーワードに相当する。登録語は、属性名の属性に対応付けられた登録語を示す。 Here, the attribute name indicates the name of the attribute that characterizes the document to be searched. The attribute keyword indicates a word (first word) that matches or is similar to at least one word divided from the registered word associated with the attribute of the attribute name among the words divided from the input sentence. Attribute keywords correspond to keywords used when narrowing down the search target by attribute. The registered word indicates a registered word associated with the attribute of the attribute name.
例えば、属性候補情報800−1は、属性「製品名」の属性キーワード「Charset」および登録語「Interstage Charset Manager」を示す。属性候補テーブル800によれば、入力文(例えば、入力文710)に含まれる単語のうち、検索対象の属性に対応付けられた登録語に含まれる単語と一致又は類似する単語(第1のワード)を特定することができる。 For example, the attribute candidate information 800-1 indicates the attribute keyword “Charset” of the attribute “product name” and the registered word “Interstage Charge Manager”. According to the attribute candidate table 800, among the words included in the input sentence (for example, the input sentence 710), the words that match or are similar to the words included in the registered words associated with the attribute to be searched (first word). ) Can be specified.
(属性キーワードに対応する属性の絞り込み)
ここで、第1のワードと一致又は類似するワードと対応付けられている属性が複数存在する場合がある。すなわち、属性キーワードに対応する属性が複数存在する場合がある。この場合、複数の属性の中から、属性キーワード(第1のワード)に対応する属性を選定することにしてもよい。
(Narrowing down the attributes corresponding to the attribute keywords)
Here, there may be a plurality of attributes associated with a word that matches or is similar to the first word. That is, there may be a plurality of attributes corresponding to the attribute keywords. In this case, the attribute corresponding to the attribute keyword (first word) may be selected from the plurality of attributes.
例えば、抽出部603は、第1のワードと一致又は類似するワードと対応付けられている属性が複数存在する場合、当該複数の属性の各属性について、受け付けた複数のワードのうち、各属性に対応付けられた1又は複数のワードと一致又は類似するワードの数を算出することにしてもよい。この際、抽出部603は、各属性について、受け付けた複数のワードのうち、各属性に対応付けられた1又は複数のワードと連続して一致又は類似するワードの数を算出することにしてもよい。そして、抽出部603は、複数の属性の中から、算出したワードの数が最大の属性を特定することにしてもよい。この場合、抽出部603は、特定した属性において、第1のワード(または、当該属性に対応付けられた登録語)を含む検索対象群を抽出する。
For example, when the
より詳細に説明すると、例えば、抽出部603は、図8に示した属性候補テーブル800を参照して、属性キーワード(第1のワード)と一致又は類似するワードと対応付けられている属性が複数存在するか否かを判断する。図8の例では、属性キーワード「Enterprise」は、属性「製品名」および属性「エディション」に対応している。
More specifically, for example, the
この場合、抽出部603は、例えば、属性「製品名」および属性「エディション」の各属性について、入力文に含まれる単語のうち、各属性に対応付けられた登録語に含まれる単語と連続して一致又は類似する単語の数を算出する。ここで、図9を用いて、単語の数(単語長)の算出例について説明する。
In this case, for example, for each attribute of the attribute "product name" and the attribute "edition", the
図9は、属性キーワードに対応する属性の絞り込み例を示す説明図(その1)である。抽出部603は、例えば、属性候補情報800−2を参照して、入力文710(図7参照)に含まれる単語711〜715のうち、属性「製品名」に対応付けられた登録語「Enterprise」に含まれる単語731と連続して一致又は類似する単語の数(単語長)を算出する。ここでは、単語長「1」が算出される。
FIG. 9 is an explanatory diagram (No. 1) showing an example of narrowing down the attributes corresponding to the attribute keywords. For example, the
また、抽出部603は、例えば、属性候補情報800−3を参照して、入力文710に含まれる単語711〜715のうち、属性「エディション」に対応付けられた登録語「Enterprise Edition」に含まれる単語741,742と連続して一致又は類似する単語の数(単語長)を算出する。ここでは、単語長「2」が算出される。
Further, the
そして、抽出部603は、属性「製品名」および属性「エディション」の中から、算出した単語長が最大の属性「エディション」を特定する。この場合、抽出部603は、属性候補テーブル800から、属性候補情報800−2を削除する。これにより、属性キーワード「Enterprise」に対応する属性を一つに絞り込むことができる。
Then, the
また、属性キーワード「Windows」は、属性「ファミリ製品名」および属性「OS」に対応している。ただし、属性キーワード「Windows」については、属性「ファミリ製品名」および属性「OS」の各属性の単語長がともに「1」となり、単語長から属性を一つに絞り込むことができない。 In addition, the attribute keyword "Windows" corresponds to the attribute "family product name" and the attribute "OS". However, for the attribute keyword "Windows", the word length of each attribute of the attribute "family product name" and the attribute "OS" is "1", and the attribute cannot be narrowed down to one from the word length.
そこで、抽出部603は、第1のワードと一致又は類似するワードと対応付けられている属性が複数存在する場合、当該複数の属性の各属性について、各属性に対応付けられた1又は複数のワードのうち、受け付けた複数のワードに含まれるワードと一致又は類似するワードが占める文字列比を算出することにしてもよい。そして、抽出部603は、複数の属性の中から、算出した文字列比が最大の属性を特定することにしてもよい。この場合、抽出部603は、特定した属性において、第1のワード(または、当該属性に対応付けられた登録語)を含む検索対象群を抽出する。
Therefore, when there are a plurality of attributes associated with a word that matches or is similar to the first word, the
より詳細に説明すると、例えば、抽出部603は、属性「ファミリ製品名」および属性「OS」の各属性について、各属性に対応付けられた登録語のうち、入力文に含まれる単語と一致又は類似する単語が占める文字列比を算出する。ここで、図10を用いて、文字列比の算出例を説明する。
More specifically, for example, the
図10は、属性キーワードに対応する属性の絞り込み例を示す説明図(その2)である。抽出部603は、例えば、属性候補情報800−4を参照して、属性「ファミリ製品名」に対応付けられた登録語「開発パッケージ for Windows」のうち、入力文710(図7参照)に含まれる単語711〜715と一致又は類似する単語が占める文字列比を算出する。
FIG. 10 is an explanatory diagram (No. 2) showing an example of narrowing down the attributes corresponding to the attribute keywords. The
ここでは、登録語「開発パッケージ for Windows」のうち、単語754(Windows)が、入力文710に含まれる単語714と一致するため、文字列比「7/19」が算出される。分母の「19」は、登録語「開発パッケージ for Windows」の文字数である。分子の「7」は、「Windows」の文字数である。
Here, since the word 754 (Windows) in the registered word "development package for Windows" matches the
また、抽出部603は、例えば、属性候補情報800−5を参照して、属性「OS」に対応付けられた登録語「Windows」のうち、入力文710に含まれる単語711〜715と一致又は類似する単語が占める文字列比を算出する。ここでは、登録語「Windows」が、入力文710に含まれる単語714と一致するため、文字列比「7/7」が算出される。
Further, the
そして、抽出部603は、属性「ファミリ製品名」および属性「OS」の中から、算出した文字列比が最大の属性「OS」を特定する。この場合、抽出部603は、属性候補テーブル800から、属性候補情報800−4を削除する。これにより、属性キーワード「Windows」に対応する属性を一つに絞り込むことができる。
Then, the
なお、抽出部603は、第1のワードと一致又は類似するワードと対応付けられている属性が複数存在する場合、予め決められた属性毎の優先度に従って、複数の属性のうちの最も優先度が高い属性を特定することにしてもよい。
When there are a plurality of attributes associated with a word that matches or is similar to the first word, the
また、属性キーワードとして使用しない単語を、ストップワードとして予め登録しておくことにしてもよい。例えば、多くの登録語に含まれるような単語を、ストップワードとして予め登録しておくことにしてもよい。この場合、判定部602は、入力文の中に、属性に対応付けられた登録語に含まれる単語と一致又は類似する単語が存在しても、その単語がストップワードであれば、第1のワードとして採用しないことにしてもよい。これにより、多くの登録語がヒットして、検索結果に含まれるノイズの数が増えるのを防ぐことができる。
Further, a word that is not used as an attribute keyword may be registered in advance as a stop word. For example, a word included in many registered words may be registered in advance as a stop word. In this case, even if the input sentence contains a word that matches or is similar to the word included in the registered word associated with the attribute, if the word is a stop word, the
(ドキュメントの検索例)
つぎに、図11を用いて、検索対象のドキュメントの検索例について説明する。
(Document search example)
Next, a search example of the document to be searched will be described with reference to FIG.
図11は、ドキュメントの検索例を示す説明図である。図11において、抽出部603は、例えば、図10に示した属性候補テーブル800を参照して、入力文710に含まれる単語711〜715のうちの属性キーワードを特定する。ここでは、単語711〜714が属性キーワードとして特定される。
FIG. 11 is an explanatory diagram showing a document search example. In FIG. 11, the
つぎに、抽出部603は、属性候補テーブル800を参照して、特定した属性キーワードに対応する登録語を特定する。ここでは、属性キーワード(単語711)に対応する登録語として、属性「製品名」の登録語「Interstage Charset Manager」が特定される。また、属性キーワード(単語712,713)に対応する登録語として、属性「エディション」の登録語「Enterprise Edition」が特定される。属性キーワード(単語714)に対応する登録語として、属性「OS」の登録語「Windows」が特定される。
Next, the
そして、抽出部603は、ドキュメント管理DB220を参照して、下記(i)、(ii)および(iii)の少なくともいずれかの条件を満たすドキュメント群を抽出する。また、抽出部603は、ドキュメント管理DB220を参照して、下記(i)、(ii)および(iii)の条件を全て満たすドキュメント群を抽出することにしてもよい。
Then, the
(i)属性「製品名」の属性値に、登録語「Interstage Charset Manager」を含む。 (I) The attribute value of the attribute "product name" includes the registered word "Interstage Charge Manager".
(ii)属性「エディション」の属性値に、登録語「Enterprise Edition」を含む。 (Ii) The registered word "Enterprise Edition" is included in the attribute value of the attribute "edition".
(iii)属性「OS」の属性値に、登録語「Windows」を含む。 (Iii) The registered word "Windows" is included in the attribute value of the attribute "OS".
図11の例では、上記(i)、(ii)および(iii)の条件を全て満たすドキュメント群1110が抽出された場合を想定する。
In the example of FIG. 11, it is assumed that the
つぎに、特定部604は、入力文710に含まれる単語711〜715のうちの属性キーワード以外の単語(第2のワード)を検索キーワードとして特定する。ここでは、単語715が検索キーワードとして特定される。そして、特定部604は、特定した検索キーワードと、抽出されたドキュメント群1110それぞれの本文情報に含まれるワードとの比較結果に基づいて、ドキュメント群1110の中から、検索対象のドキュメントを特定する。
Next, the specifying
図11の例では、ドキュメント群1110の中から、本文情報に検索キーワード「インストール」を含むドキュメント集合1120が特定されている。ドキュメント集合1120は、ユーザが欲しい属性を持つドキュメント群1110を絞り込んだ上で全文検索を行った結果であり、ノイズの少ない検索結果であるといえる。
In the example of FIG. 11, a document set 1120 including the search keyword “install” in the text information is specified from the
(検索画面の画面例)
つぎに、図12を用いて、クライアント装置201に表示される検索画面の画面例について説明する。
(Screen example of search screen)
Next, a screen example of the search screen displayed on the
図12は、検索画面の画面例を示す説明図である。図12において、検索画面1200は、ボックス1201に入力された入力文を含む検索依頼に対する検索結果1210を表示する操作画面の一例である。検索結果1210は、検索対象情報1211〜1213を含む。
FIG. 12 is an explanatory diagram showing a screen example of the search screen. In FIG. 12, the
検索対象情報1211〜1213は、例えば、検索対象のドキュメントのタイトルや要約を示す。検索画面1200において、入力装置(不図示)を用いたユーザの操作入力により、検索対象情報1211〜1213のいずれかを選択すると、ドキュメントの本文情報を閲覧することができる。
The
また、検索画面1200には、属性情報1220が表示されている。属性情報1220は、入力文に含まれる属性キーワード(第1のワード)と一致又は類似するワードと対応付けられている属性に対応付けられた登録語を示す。属性情報1220によれば、ユーザは、どのような属性で検索結果が絞り込まれたのかを特定することができる。
Further, the
(検索処理装置101の検索処理手順)
つぎに、図13および図14を用いて、検索処理装置101の検索処理手順について説明する。
(Search processing procedure of the search processing device 101)
Next, the search processing procedure of the
図13および図14は、検索処理装置101の検索処理手順の一例を示すフローチャートである。図13のフローチャートにおいて、まず、検索処理装置101は、クライアント装置201から検索依頼を受信したか否かを判断する(ステップS1301)。ここで、検索処理装置101は、検索依頼を受信するのを待つ(ステップS1301:No)。
13 and 14 are flowcharts showing an example of the search processing procedure of the
そして、検索処理装置101は、検索依頼を受信した場合(ステップS1301:Yes)、受信した検索依頼に含まれる入力文を単語(ワード)に分割する(ステップS1302)。つぎに、検索処理装置101は、製品属性テーブル230に属性名が登録されている属性のうち選択されていない未選択の属性を選択する(ステップS1303)。
Then, when the
つぎに、検索処理装置101は、製品属性テーブル230を参照して、選択した属性の登録語のうち選択されていない未選択の登録語を選択する(ステップS1304)。そして、検索処理装置101は、選択した登録語を単語に分割する(ステップS1305)。つぎに、検索処理装置101は、入力文から分割した単語と、登録語から分割した単語とを比較するマッチング処理を実行する(ステップS1306)。
Next, the
なお、マッチング処理の具体的な処理手順については、図15および図16を用いて後述する。 The specific processing procedure of the matching process will be described later with reference to FIGS. 15 and 16.
そして、検索処理装置101は、選択した属性に対応する属性キーワード検出フラグを参照して、属性キーワードがあるか否かを判断する(ステップS1307)。属性キーワードは、入力文から分割した単語のうち、登録語から分割した1又は複数の単語と、一致又は類似する単語(第1のワード)である。
Then, the
属性キーワード検出フラグは、入力文中から、登録語の属性キーワードが検出されたか否かを示すフラグである。属性キーワード検出フラグは、入力文中に、登録語を構成する単語が含まれていた場合、「true」となり、登録語を構成する単語が含まれていなかった場合、「false」となる。 The attribute keyword detection flag is a flag indicating whether or not the attribute keyword of the registered word is detected in the input sentence. The attribute keyword detection flag is "true" when the input sentence contains a word constituting the registered word, and is "false" when the word constituting the registered word is not included.
ここで、属性キーワードがない場合(ステップS1307:No)、検索処理装置101は、ステップS1309に移行する。一方、属性キーワードがある場合(ステップS1307:Yes)、選択した属性の属性名と対応付けて、属性キーワードおよび当該属性キーワードと一致又は類似する単語を含む登録語を、属性候補テーブル800に登録する(ステップS1308)。なお、属性キーワードは、選択した属性に対応する属性キーワードの単語リストに登録された単語である。
Here, if there is no attribute keyword (step S1307: No), the
つぎに、検索処理装置101は、製品属性テーブル230を参照して、選択した属性の登録語のうち選択されていない未選択の登録語があるか否かを判断する(ステップS1309)。ここで、未選択の登録語がある場合(ステップS1309:Yes)、検索処理装置101は、ステップS1304に戻る。
Next, the
一方、未選択の登録語がない場合(ステップS1309:No)、検索処理装置101は、製品属性テーブル230に属性名が登録されている属性のうち選択されていない未選択の属性があるか否かを判断する(ステップS1310)。ここで、未選択の属性がある場合(ステップS1310:Yes)、検索処理装置101は、ステップS1303に戻る。
On the other hand, when there is no unselected registered word (step S1309: No), the
一方、未選択の属性がない場合(ステップS1310:No)、検索処理装置101は、図14に示すステップS1401に移行する。
On the other hand, when there is no unselected attribute (step S1310: No), the
図14のフローチャートにおいて、まず、検索処理装置101は、属性候補テーブル800を参照して、属性キーワードに対応する属性が複数存在するか否かを判断する(ステップS1401)。ここで、複数の属性が存在しない場合(ステップS1401:No)、検索処理装置101は、ステップS1403に移行する。
In the flowchart of FIG. 14, first, the
一方、属性キーワードに対応する属性が複数存在する場合(ステップS1401:Yes)、検索処理装置101は、複数の属性の中から、属性キーワードに対応する属性を特定する(ステップS1402)。属性の特定には、例えば、図9で説明した単語長や、図10で説明した文字列比が用いられる。
On the other hand, when a plurality of attributes corresponding to the attribute keywords exist (step S1401: Yes), the
つぎに、検索処理装置101は、入力文から属性キーワード以外の単語を検索キーワードとして特定する(ステップS1403)。そして、検索処理装置101は、属性キーワードに対応する属性に対応付けられた登録語と、特定した検索キーワードとに基づいて、検索条件を作成する(ステップS1404)。属性キーワードに対応する属性に対応付けられた登録語は、絞込条件となる登録語であり、属性候補テーブル800から特定される。なお、検索条件の具体例については、図19を用いて後述する。
Next, the
つぎに、検索処理装置101は、作成した検索条件に基づいて、検索対象のドキュメントを検索する検索処理を実行する(ステップS1405)。そして、検索処理装置101は、検索結果を出力して(ステップS1406)、本フローチャートによる一連の処理を終了する。検索結果は、後述する検索結果格納リストに格納されたレコードを示す情報である。
Next, the
これにより、属性を指定しない状態で入力文(検索キーワード)の入力を受け付けても、属性を反映した検索を実行することができる。 As a result, even if the input of the input sentence (search keyword) is accepted without specifying the attribute, the search reflecting the attribute can be executed.
つぎに、図15および図16を用いて、図13に示したステップS1306のマッチング処理の具体的な処理手順について説明する。 Next, a specific processing procedure of the matching process of step S1306 shown in FIG. 13 will be described with reference to FIGS. 15 and 16.
図15および図16は、マッチング処理の具体的な処理手順の一例を示すフローチャートである。図15のフローチャートにおいて、まず、検索処理装置101は、図13に示したステップS1303において選択した属性に対応する属性キーワード検出フラグを「false」に設定する(ステップS1501)。
15 and 16 are flowcharts showing an example of a specific processing procedure of the matching process. In the flowchart of FIG. 15, first, the
つぎに、検索処理装置101は、選択した属性に対応する属性キーワードの単語リストを初期化する(ステップS1502)。そして、検索処理装置101は、「i」を「i=0」で初期化し(ステップS1503)、「j」を「j=0」で初期化する(ステップS1504)。
Next, the
つぎに、検索処理装置101は、図13に示したステップS1304において選択した登録語のi番目の単語と、入力文のj番目の単語とを比較する(ステップS1505)。ただし、最初の単語を0番目の単語とする。そして、検索処理装置101は、登録語のi番目の単語と、入力文のj番目の単語とがマッチしたか否かを判断する(ステップS1506)。なお、単語がマッチするとは、単語が一致又は類似することである。
Next, the
ここで、単語がマッチしない場合(ステップS1506:No)、検索処理装置101は、図16に示すステップS1605に移行する。一方、単語がマッチする場合(ステップS1506:Yes)、検索処理装置101は、選択した属性に対応する属性キーワード検出フラグが「false」であるか否かを判断する(ステップS1507)。
Here, if the words do not match (step S1506: No), the
ここで、属性キーワード検出フラグが「true」の場合(ステップS1507:No)、検索処理装置101は、ステップS1509に移行する。一方、属性キーワード検出フラグが「false」の場合(ステップS1507:Yes)、検索処理装置101は、属性キーワード検出フラグに「true」を設定する(ステップS1508)。
Here, when the attribute keyword detection flag is "true" (step S1507: No), the
そして、検索処理装置101は、選択した属性に対応する属性キーワードの単語リストの末尾に、入力文のj番目の単語を格納して(ステップS1509)、図16に示すステップS1601に移行する。
Then, the
図16のフローチャートにおいて、まず、検索処理装置101は、「i」を「i=i+1」とし(ステップS1601)、「j」を「j=j+1」とする(ステップS1602)。そして、検索処理装置101は、「j」が入力文を構成する単語数以上となったか否かを判断する(ステップS1603)。
In the flowchart of FIG. 16, first, the
ここで、「j」が入力文を構成する単語数以上となった場合(ステップS1603:Yes)、検索処理装置101は、図15に示したステップS1504に戻る。一方、「j」が入力文を構成する単語数未満の場合(ステップS1603:No)、検索処理装置101は、「i」が登録語を構成する単語数以上となったか否かを判断する(ステップS1604)。
Here, when "j" is equal to or greater than the number of words constituting the input sentence (step S1603: Yes), the
ここで、「i」が登録語を構成する単語数未満の場合(ステップS1604:No)、検索処理装置101は、図15に示したステップS1505に戻る。一方、「i」が登録語を構成する単語数以上の場合(ステップS1604:Yes)、検索処理装置101は、マッチング処理を呼び出したステップに戻る。
Here, when "i" is less than the number of words constituting the registered word (step S1604: No), the
また、検索処理装置101は、図15に示したステップS1506から移行した場合には、「i」を「i=i+1」とする(ステップS1605)。そして、検索処理装置101は、「j」を「j=0」で初期化して(ステップS1606)、ステップS1604に移行する。
Further, when the
これにより、入力文から分割された単語と登録語から分割された単語とを比較して、マッチする単語を、属性に対応する属性キーワードの単語リストに登録することができる。 As a result, the word divided from the input sentence and the word divided from the registered word can be compared, and the matching word can be registered in the word list of the attribute keyword corresponding to the attribute.
つぎに、図17および図18を用いて、図14に示したステップS1405の検索処理の具体的な処理手順について説明する。 Next, a specific processing procedure of the search process of step S1405 shown in FIG. 14 will be described with reference to FIGS. 17 and 18.
図17および図18は、検索処理の具体的な処理手順の一例を示すフローチャートである。図17のフローチャートにおいて、まず、検索処理装置101は、絞込合致レコード格納リストを初期化する(ステップS1701)。つぎに、検索処理装置101は、ドキュメント管理DB220から選択されていない未選択のレコードを選択する(ステップS1702)。
17 and 18 are flowcharts showing an example of a specific processing procedure of the search process. In the flowchart of FIG. 17, first, the
つぎに、検索処理装置101は、検索対象のドキュメントを特徴付ける属性のうち選択されていない未選択の属性を選択する(ステップS1703)。つぎに、検索処理装置101は、図14に示したステップS1404において作成された検索条件(または、属性候補テーブル800)を参照して、選択した属性に対応する登録語のうち選択されていない未選択の登録語を、絞込条件の登録語として選択する(ステップS1704)。
Next, the
以下の説明では、ステップS1702において選択されたレコードを「対象レコード」と表記し、ステップS1703において選択された属性を「対象属性」と表記する場合がある。 In the following description, the record selected in step S1702 may be referred to as "target record", and the attribute selected in step S1703 may be referred to as "target attribute".
そして、検索処理装置101は、選択した絞込条件の登録語と、対象レコードの対象属性の属性値とが一致するか否かを判断する(ステップS1705)。ここで、絞込条件の登録語と対象レコードの属性値とが一致しない場合(ステップS1705:No)、検索処理装置101は、ステップS1707に移行する。
Then, the
一方、絞込条件の登録語と対象レコードの属性値とが一致する場合(ステップS1705:Yes)、検索処理装置101は、絞込合致レコード格納リストに対象レコードを格納する(ステップS1706)。そして、検索処理装置101は、対象属性に対応する登録語のうち選択されていない未選択の登録語があるか否かを判断する(ステップS1707)。
On the other hand, when the registered word of the narrowing down condition and the attribute value of the target record match (step S1705: Yes), the
ここで、未選択の登録語がある場合(ステップS1707:Yes)、検索処理装置101は、ステップS1704に戻る。一方、未選択の登録語がない場合(ステップS1707:No)、検索処理装置101は、検索対象のドキュメントを特徴付ける属性のうち選択されていない未選択の属性があるか否かを判断する(ステップS1708)。
Here, if there is an unselected registered word (step S1707: Yes), the
ここで、未選択の属性がある場合(ステップS1708:Yes)、検索処理装置101は、ステップS1703に戻る。一方、未選択の属性がない場合(ステップS1708:No)、検索処理装置101は、ドキュメント管理DB220から選択されていない未選択のレコードがあるか否かを判断する(ステップS1709)。
Here, if there is an unselected attribute (step S1708: Yes), the
ここで、未選択のレコードがある場合(ステップS1709:Yes)、検索処理装置101は、ステップS1702に戻る。一方、未選択のレコードがない場合には(ステップS1709:No)、検索処理装置101は、図18に示すステップS1801に移行する。
Here, if there is an unselected record (step S1709: Yes), the
図18のフローチャートにおいて、まず、検索処理装置101は、検索結果格納リストを初期化する(ステップS1801)。つぎに、検索処理装置101は、絞込合致レコード格納リストから選択されていない未選択のレコードを選択する(ステップS1802)。
In the flowchart of FIG. 18, first, the
そして、検索処理装置101は、検索条件を参照して、選択したレコードの本文情報に、検索キーワードが含まれるか否かを判断する(ステップS1803)。ここで、検索キーワードが含まれない場合(ステップS1803:No)、検索処理装置101は、ステップS1805に移行する。
Then, the
一方、検索キーワードが含まれる場合(ステップS1803:Yes)、検索処理装置101は、検索結果格納リストに、選択したレコードを格納する(ステップS1804)。そして、検索処理装置101は、絞込合致レコード格納リストから選択されていない未選択のレコードがあるか否かを判断する(ステップS1805)。
On the other hand, when the search keyword is included (step S1803: Yes), the
ここで、未選択のレコードがある場合(ステップS1805:Yes)、検索処理装置101は、ステップS1802に戻る。一方、未選択のレコードがない場合(ステップS1805:No)、検索処理装置101は、検索処理を呼び出したステップに戻る。
Here, if there is an unselected record (step S1805: Yes), the
これにより、既存の全文検索のような検索のやり方で、ユーザが欲しい属性を持つドキュメント集合に絞り込んだ検索を行うことができる。 This makes it possible to narrow down the search to a set of documents having the attributes that the user wants, using a search method similar to the existing full-text search.
なお、図17の例では、各属性に対応する登録語のORをとって、検索対象のドキュメントを絞り込むことにしたが、これに限らない。例えば、検索処理装置101は、各属性に対応する登録語のANDをとって、検索対象のドキュメントを絞り込むことにしてもよい。
In the example of FIG. 17, the OR of the registered word corresponding to each attribute is taken to narrow down the documents to be searched, but the present invention is not limited to this. For example, the
ここで、各属性に対応する登録語のANDをとって、検索対象のドキュメントを絞り込む場合の検索条件の具体例について説明する。 Here, a specific example of the search condition when narrowing down the documents to be searched by taking the AND of the registered words corresponding to each attribute will be described.
図19は、検索条件の一例を示す説明図である。図19において、検索条件1900は、絞込条件1910と、全文検索条件1920とを含む。絞込条件1910は、1つの属性内の登録語同士でORをとり、各属性の登録語同士でANDをとる条件である。全文検索条件1920は、検索キーワードで全文検索を行う条件である。
FIG. 19 is an explanatory diagram showing an example of search conditions. In FIG. 19, the
図14に示したステップS1405の検索処理を検索条件1900に基づき実行する場合、検索処理装置101は、例えば、絞込合致レコード格納リストを、属性毎に別リストで保持し、全属性の絞込合致レコード格納リストに格納されたレコードを、最終的な絞込合致レコードとする。
When the search process of step S1405 shown in FIG. 14 is executed based on the
以上説明したように、実施の形態にかかる検索処理装置101によれば、検索対象に対する検索のために受け付けた複数のワードの中に、予め記憶部610に記憶されていた検索対象の属性毎に対応付けられた1又は複数のワードと一致又は類似する第1のワードが存在するか否かを判定することができる。また、検索処理装置101によれば、第1のワードが存在すると判定した場合に、第1のワードと一致又は類似するワードと対応付けられている属性において第1のワードを含む検索対象群を抽出することができる。そして、検索処理装置101によれば、受け付けた複数のワードに含まれる第1のワード以外の第2のワードと、抽出した検索対象群それぞれのデータに含まれるワードとの比較結果に基づいて、検索対象群の中から検索対象を特定することができる。
As described above, according to the
これにより、属性を指定しない状態でキーワードの入力を受け付けても、キーワードが属性毎に設定されている検索対象について、属性を反映した検索を実行することができる。より詳細に説明すると、例えば、ユーザが意識して入力しなくても、入力文に含まれる複数の単語(ワード)を、絞り込み用のキーワード(属性キーワード)と、全文検索用のキーワード(検索キーワード)とに分類することができる。このため、ユーザが欲しい属性を持つ検索対象群を絞り込んだ上で全文検索を行うことが可能となり、検索結果に含まれるノイズ(ユーザが意図しない情報)を減らして、ユーザが欲しい情報を見つけやすくすることができる。 As a result, even if the input of the keyword is accepted without specifying the attribute, the search target in which the keyword is set for each attribute can be searched by reflecting the attribute. More specifically, for example, a keyword for narrowing down a plurality of words (words) included in an input sentence (attribute keyword) and a keyword for full-text search (search keyword) without the user having to consciously input the word (word). ) And can be classified. For this reason, it is possible to perform a full-text search after narrowing down the search target group having the attributes that the user wants, reducing noise (information not intended by the user) contained in the search results and making it easier for the user to find the information that the user wants. can do.
また、検索処理装置101によれば、第1のワードと一致又は類似するワードと対応付けられている属性において、当該属性に対応付けられた1又は複数のワードを含む検索対象群を抽出することができる。
Further, according to the
これにより、予め属性に対応付けられた登録語(キーワード)を属性値に含む検索対象群を抽出することができ、属性による絞り込みがより利くようにして、ノイズを少なくすることができる。例えば、属性「製品名」の登録語として、実際に存在する特定の製品名が設定されていれば、属性「製品名」が、特定の製品名であるドキュメント群に絞り込むことができる。 As a result, it is possible to extract a search target group that includes a registered word (keyword) associated with an attribute in advance in the attribute value, and it is possible to narrow down by attribute more effectively and reduce noise. For example, if a specific product name that actually exists is set as a registered word of the attribute "product name", the attribute "product name" can be narrowed down to a document group that is a specific product name.
また、検索処理装置101によれば、第1のワードと一致又は類似するワードと対応付けられている属性が複数存在する場合、当該複数の属性の各属性について、受け付けた複数のワードのうち、各属性に対応付けられた1又は複数のワードと一致又は類似するワードの数(単語長)を算出することができる。そして、検索処理装置101によれば、複数の属性の中から、算出したワードの数が最大の属性を特定し、特定した属性において、第1のワードを含む検索対象群を抽出することができる。
Further, according to the
これにより、複数の属性候補の中から、登録語に含まれる単語が入力文内により多く含まれる属性を、属性キーワード(第1のワード)に対応する属性として選定することができる。このため、検索対象群を絞り込む際に、属性による絞り込みがより利くようにして、ノイズを少なくすることができる。 As a result, from among the plurality of attribute candidates, the attribute in which the word included in the registered word is contained more in the input sentence can be selected as the attribute corresponding to the attribute keyword (first word). Therefore, when narrowing down the search target group, it is possible to make it easier to narrow down by attribute and reduce noise.
また、検索処理装置101によれば、第1のワードと一致又は類似するワードと対応付けられている属性が複数存在する場合、当該複数の属性の各属性について、各属性に対応付けられた1又は複数のワードのうち、受け付けた複数のワードに含まれるワードと一致又は類似するワードが占める文字列比を算出し、複数の属性の中から、算出した文字列比が最大の属性を特定することができる。
Further, according to the
これにより、複数の属性候補の中から、登録語の中で入力文に含まれる単語の文字列が占める割合(充填率)が高い属性を、属性キーワード(第1のワード)に対応する属性として選定することができる。このため、検索対象群を絞り込む際に、属性による絞り込みがより利くようにして、ノイズを少なくすることができる。 As a result, from among a plurality of attribute candidates, the attribute having a high ratio (filling rate) of the word string included in the input sentence among the registered words is set as the attribute corresponding to the attribute keyword (first word). Can be selected. Therefore, when narrowing down the search target group, it is possible to make it easier to narrow down by attribute and reduce noise.
また、検索処理装置101によれば、受け付けた複数のワードに対して、特定した検索対象を出力することができる。また、検索処理装置101によれば、特定した検索対象とともに、第1のワードと一致又は類似するワードと対応付けられている属性に対応付けられた登録語(語句)を出力することができる。
Further, according to the
これにより、ノイズの少ない検索結果を提供することができる。また、検索結果を表示する際に、どのような属性で検索結果を絞り込んだのかを特定可能な情報を提示することができる。 As a result, it is possible to provide search results with less noise. In addition, when displaying the search results, it is possible to present information that can identify the attributes used to narrow down the search results.
また、検索処理装置101によれば、第1のワードが存在すると判定した場合に、受け付けた複数のワードに含まれる第1のワード以外の第2のワードと、複数の検索対象それぞれのデータに含まれるワードとの比較結果に基づいて、複数の検索対象の中から検索対象群を抽出することができる。そして、検索処理装置101によれば、抽出した検索対象群の中から、第1のワードと一致又は類似するワードと対応付けられている属性において第1のワードを含む検索対象を特定することができる。
Further, according to the
これにより、入力文に含まれる複数の単語(ワード)を属性キーワードと検索キーワードとに分類し、検索キーワードを用いて全文検索を行った上で、属性キーワードを用いてユーザが欲しい属性を持つ検索対象群を絞り込むことができる。 As a result, multiple words included in the input sentence are classified into attribute keywords and search keywords, a full-text search is performed using the search keywords, and then a search with the attributes desired by the user is performed using the attribute keywords. The target group can be narrowed down.
これらのことから、実施の形態にかかる検索処理装置101によれば、ドキュメント検索において、ユーザが入力した入力文(検索文)から属性情報を自動抽出して、検索条件を最適化することができる。これにより、既存の全文検索のような検索のやり方で、ユーザが欲しい属性を持つドキュメント集合に絞り込んだ検索を行うことが可能となり、利便性を向上させることができる。
From these facts, according to the
なお、本実施の形態で説明した検索処理方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本検索処理プログラムは、ハードディスク、フレキシブルディスク、CD−ROM、DVD、USBメモリ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本検索処理プログラムは、インターネット等のネットワークを介して配布してもよい。 The search processing method described in the present embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This search processing program is recorded on a computer-readable recording medium such as a hard disk, flexible disk, CD-ROM, DVD, or USB memory, and is executed by being read from the recording medium by the computer. Further, the search processing program may be distributed via a network such as the Internet.
また、本実施の形態で説明した検索処理装置101は、スタンダードセルやストラクチャードASIC(Application Specific Integrated Circuit)などの特定用途向けICやFPGAなどのPLD(Programmable Logic Device)によっても実現することができる。
Further, the
上述した実施の形態に関し、さらに以下の付記を開示する。 The following additional notes are further disclosed with respect to the above-described embodiment.
(付記1)検索対象に対する検索のために受け付けた複数のワードの中に、予め記憶部に記憶されていた検索対象の属性毎に対応付けられた1又は複数のワードと一致又は類似する第1のワードが存在するか否かを判定し、
前記第1のワードが存在すると判定した場合に、前記第1のワードと一致又は類似するワードと対応付けられている属性において前記第1のワードを含む検索対象群を抽出し、
前記複数のワードに含まれる前記第1のワード以外の第2のワードと前記検索対象群それぞれのデータに含まれるワードとの比較結果に基づいて、前記検索対象群の中から前記検索対象を特定する、
処理をコンピュータに実行させることを特徴とする検索処理プログラム。
(Appendix 1) Among the plurality of words received for the search for the search target, the first word that matches or is similar to one or more words associated with each attribute of the search target stored in the storage unit in advance. Determine if the word exists and
When it is determined that the first word exists, a search target group including the first word in the attribute associated with the word matching or similar to the first word is extracted.
The search target is specified from the search target group based on the comparison result between the second word other than the first word included in the plurality of words and the word included in the data of each of the search target groups. To do
A search processing program characterized by having a computer execute processing.
(付記2)前記抽出する処理は、
前記第1のワードと一致又は類似するワードと対応付けられている属性において、当該属性に対応付けられた1又は複数のワードを含む検索対象群を抽出する、ことを特徴とする付記1に記載の検索処理プログラム。
(Appendix 2) The extraction process is
The description in
(付記3)前記抽出する処理は、
前記第1のワードと一致又は類似するワードと対応付けられている属性が複数存在する場合、当該複数の属性の各属性について、受け付けた前記複数のワードのうち、前記各属性に対応付けられた1又は複数のワードと一致又は類似するワードの数を算出し、
前記複数の属性の中から、算出した前記ワードの数が最大の属性を特定し、
特定した前記属性において、前記第1のワードを含む検索対象群を抽出する、ことを特徴とする付記1または2に記載の検索処理プログラム。
(Appendix 3) The extraction process is
When there are a plurality of attributes associated with a word that matches or is similar to the first word, each attribute of the plurality of attributes is associated with each of the received plurality of words. Calculate the number of words that match or are similar to one or more words
From the plurality of attributes, the attribute having the largest number of calculated words is specified.
The search processing program according to
(付記4)前記抽出する処理は、
前記第1のワードと一致又は類似するワードと対応付けられている属性が複数存在する場合、当該複数の属性の各属性について、前記各属性に対応付けられた1又は複数のワードのうち、受け付けた前記複数のワードに含まれるワードと一致又は類似するワードが占める文字列比を算出し、
前記複数の属性の中から、算出した前記文字列比が最大の属性を特定し、
特定した前記属性において、前記第1のワードを含む検索対象群を抽出する、ことを特徴とする付記1〜3のいずれか一つに記載の検索処理プログラム。
(Appendix 4) The extraction process is
When there are a plurality of attributes associated with words that match or are similar to the first word, each attribute of the plurality of attributes is accepted from among one or more words associated with each attribute. Calculate the character string ratio occupied by words that match or are similar to the words included in the plurality of words.
From the plurality of attributes, the attribute having the maximum calculated character string ratio is specified.
The search processing program according to any one of
(付記5)受け付けた前記複数のワードに対して、特定した前記検索対象を出力する、処理を前記コンピュータに実行させることを特徴とする付記1〜4のいずれか一つに記載の検索処理プログラム。
(Supplementary Note 5) The search processing program according to any one of
(付記6)前記属性毎に対応付けられた1又は複数のワードは、前記属性毎に対応付けられた語句から分割された1又は複数のワードであり、
前記出力する処理は、
特定した前記検索対象とともに、前記第1のワードと一致又は類似するワードと対応付けられている属性に対応付けられた語句を出力する、ことを特徴とする付記5に記載の検索処理プログラム。
(Appendix 6) The one or more words associated with each attribute are one or more words divided from the words and phrases associated with each attribute.
The output process is
The search processing program according to Appendix 5, characterized in that, together with the specified search target, words and phrases associated with attributes associated with words that match or are similar to the first word are output.
(付記7)前記第1のワードが存在すると判定した場合に、前記複数のワードに含まれる前記第1のワード以外の第2のワードと、複数の検索対象それぞれのデータに含まれるワードとの比較結果に基づいて、前記複数の検索対象の中から検索対象群を抽出し、
抽出した前記検索対象群の中から、前記第1のワードと一致又は類似するワードと対応付けられている属性において前記第1のワードを含む検索対象を特定する、
処理を前記コンピュータに実行させることを特徴とする付記1に記載の検索処理プログラム。
(Appendix 7) When it is determined that the first word exists, the second word other than the first word included in the plurality of words and the word included in the data of each of the plurality of search targets Based on the comparison result, a search target group is extracted from the plurality of search targets, and the search target group is extracted.
From the extracted search target group, a search target including the first word is specified in an attribute associated with a word that matches or is similar to the first word.
The search processing program according to
(付記8)検索対象に対する検索のために受け付けた複数のワードの中に、予め記憶部に記憶されていた検索対象の属性毎に対応付けられた1又は複数のワードと一致又は類似する第1のワードが存在するか否かを判定し、
前記第1のワードが存在すると判定した場合に、前記第1のワードと一致又は類似するワードと対応付けられている属性において前記第1のワードを含む検索対象群を抽出し、
前記複数のワードに含まれる前記第1のワード以外の第2のワードと前記検索対象群それぞれのデータに含まれるワードとの比較結果に基づいて、前記検索対象群の中から前記検索対象を特定する、
処理をコンピュータが実行することを特徴とする検索処理方法。
(Appendix 8) Among the plurality of words received for the search for the search target, the first word that matches or is similar to one or a plurality of words associated with each attribute of the search target stored in the storage unit in advance. Determine if the word exists and
When it is determined that the first word exists, a search target group including the first word in the attribute associated with the word matching or similar to the first word is extracted.
The search target is specified from the search target group based on the comparison result between the second word other than the first word included in the plurality of words and the word included in the data of each of the search target groups. To do
A search processing method characterized in that the processing is performed by a computer.
(付記9)検索対象に対する検索のために受け付けた複数のワードの中に、予め記憶部に記憶されていた検索対象の属性毎に対応付けられた1又は複数のワードと一致又は類似する第1のワードが存在するか否かを判定する判定部と、
前記判定部が前記第1のワードが存在すると判定した場合に、前記第1のワードと一致又は類似するワードと対応付けられている属性において前記第1のワードを含む検索対象群を抽出する抽出部と、
前記複数のワードに含まれる前記第1のワード以外の第2のワードと、前記抽出部が抽出した前記検索対象群それぞれのデータに含まれるワードとの比較結果に基づいて、前記検索対象群の中から前記検索対象を特定する特定部と、
を有することを特徴とする検索処理装置。
(Appendix 9) Among the plurality of words received for the search for the search target, the first word that matches or is similar to one or a plurality of words associated with each attribute of the search target stored in the storage unit in advance. Judgment unit that determines whether or not the word of
Extraction that extracts the search target group including the first word in the attribute associated with the word that matches or is similar to the first word when the determination unit determines that the first word exists. Department and
Based on the comparison result between the second word other than the first word included in the plurality of words and the word included in the data of each of the search target groups extracted by the extraction unit, the search target group A specific part that identifies the search target from among
A search processing device characterized by having.
101 検索処理装置
110,610 記憶部
200 検索処理システム
201 クライアント装置
210 ネットワーク
220 ドキュメント管理DB
230 製品属性テーブル
300 バス
301 CPU
302 メモリ
303 ディスクドライブ
304 ディスク
305 通信I/F
306 可搬型記録媒体I/F
307 可搬型記録媒体
601 受付部
602 判定部
603 抽出部
604 特定部
605 出力部
710 入力文
800 属性候補テーブル
1200 検索画面
1900 検索条件
101
230 Product attribute table 300
302
306 Portable recording medium I / F
307
Claims (7)
前記第1のワードが存在すると判定した場合に、前記第1のワードと一致又は類似するワードと対応付けられている属性において前記第1のワードを含む検索対象群を抽出し、
前記複数のワードに含まれる前記第1のワード以外の第2のワードと前記検索対象群それぞれのデータに含まれるワードとの比較結果に基づいて、前記検索対象群の中から前記検索対象を特定する、
処理をコンピュータに実行させることを特徴とする検索処理プログラム。 Among the plurality of words received for the search for the search target, there is a first word that matches or is similar to one or more words associated with each attribute of the search target stored in the storage unit in advance. Judge whether to do or not,
When it is determined that the first word exists, a search target group including the first word in the attribute associated with the word matching or similar to the first word is extracted.
The search target is specified from the search target group based on the comparison result between the second word other than the first word included in the plurality of words and the word included in the data of each of the search target groups. To do
A search processing program characterized by having a computer execute processing.
前記第1のワードと一致又は類似するワードと対応付けられている属性において、当該属性に対応付けられた1又は複数のワードを含む検索対象群を抽出する、ことを特徴とする請求項1に記載の検索処理プログラム。 The extraction process is
The first aspect of the present invention is to extract a search target group including one or a plurality of words associated with the attribute in an attribute associated with a word that matches or is similar to the first word. The search processing program described.
前記第1のワードと一致又は類似するワードと対応付けられている属性が複数存在する場合、当該複数の属性の各属性について、受け付けた前記複数のワードのうち、前記各属性に対応付けられた1又は複数のワードと一致又は類似するワードの数を算出し、
前記複数の属性の中から、算出した前記ワードの数が最大の属性を特定し、
特定した前記属性において、前記第1のワードを含む検索対象群を抽出する、ことを特徴とする請求項1または2に記載の検索処理プログラム。 The extraction process is
When there are a plurality of attributes associated with a word that matches or is similar to the first word, each attribute of the plurality of attributes is associated with each of the received plurality of words. Calculate the number of words that match or are similar to one or more words
From the plurality of attributes, the attribute having the largest number of calculated words is specified.
The search processing program according to claim 1 or 2, wherein a search target group including the first word is extracted from the specified attribute.
前記第1のワードと一致又は類似するワードと対応付けられている属性が複数存在する場合、当該複数の属性の各属性について、前記各属性に対応付けられた1又は複数のワードのうち、受け付けた前記複数のワードに含まれるワードと一致又は類似するワードが占める文字列比を算出し、
前記複数の属性の中から、算出した前記文字列比が最大の属性を特定し、
特定した前記属性において、前記第1のワードを含む検索対象群を抽出する、ことを特徴とする請求項1〜3のいずれか一つに記載の検索処理プログラム。 The extraction process is
When there are a plurality of attributes associated with words that match or are similar to the first word, each attribute of the plurality of attributes is accepted from among one or more words associated with each attribute. Calculate the character string ratio occupied by words that match or are similar to the words included in the plurality of words.
From the plurality of attributes, the attribute having the maximum calculated character string ratio is specified.
The search processing program according to any one of claims 1 to 3, wherein a search target group including the first word is extracted from the specified attribute.
前記第1のワードが存在すると判定した場合に、前記第1のワードと一致又は類似するワードと対応付けられている属性において前記第1のワードを含む検索対象群を抽出し、
前記複数のワードに含まれる前記第1のワード以外の第2のワードと前記検索対象群それぞれのデータに含まれるワードとの比較結果に基づいて、前記検索対象群の中から前記検索対象を特定する、
処理をコンピュータが実行することを特徴とする検索処理方法。 Among the plurality of words received for the search for the search target, there is a first word that matches or is similar to one or more words associated with each attribute of the search target stored in the storage unit in advance. Judge whether to do or not,
When it is determined that the first word exists, a search target group including the first word in the attribute associated with the word matching or similar to the first word is extracted.
The search target is specified from the search target group based on the comparison result between the second word other than the first word included in the plurality of words and the word included in the data of each of the search target groups. To do
A search processing method characterized in that the processing is performed by a computer.
前記判定部が前記第1のワードが存在すると判定した場合に、前記第1のワードと一致又は類似するワードと対応付けられている属性において前記第1のワードを含む検索対象群を抽出する抽出部と、
前記複数のワードに含まれる前記第1のワード以外の第2のワードと、前記抽出部が抽出した前記検索対象群それぞれのデータに含まれるワードとの比較結果に基づいて、前記検索対象群の中から前記検索対象を特定する特定部と、
を有することを特徴とする検索処理装置。 Among the plurality of words received for the search for the search target, there is a first word that matches or is similar to one or more words associated with each attribute of the search target stored in the storage unit in advance. A judgment unit that determines whether or not to do
Extraction that extracts the search target group including the first word in the attribute associated with the word that matches or is similar to the first word when the determination unit determines that the first word exists. Department and
Based on the comparison result between the second word other than the first word included in the plurality of words and the word included in the data of each of the search target groups extracted by the extraction unit, the search target group A specific part that identifies the search target from among
A search processing device characterized by having.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019075082A JP7279481B2 (en) | 2019-04-10 | 2019-04-10 | Search processing program, search processing method and search processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019075082A JP7279481B2 (en) | 2019-04-10 | 2019-04-10 | Search processing program, search processing method and search processing device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020173611A true JP2020173611A (en) | 2020-10-22 |
JP7279481B2 JP7279481B2 (en) | 2023-05-23 |
Family
ID=72831428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019075082A Active JP7279481B2 (en) | 2019-04-10 | 2019-04-10 | Search processing program, search processing method and search processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7279481B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021174339A (en) * | 2020-04-28 | 2021-11-01 | 株式会社ソケッツ | Retrieval device and method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003022271A (en) * | 2001-07-09 | 2003-01-24 | Obic Co Ltd | Data retrieving device and data retrieving method and data retrieving program |
JP2014085874A (en) * | 2012-10-24 | 2014-05-12 | Ntt Docomo Inc | Information search device, information search system, and information search method |
JP2017091565A (en) * | 2016-12-28 | 2017-05-25 | パイオニア株式会社 | Display device, display method and display program |
-
2019
- 2019-04-10 JP JP2019075082A patent/JP7279481B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003022271A (en) * | 2001-07-09 | 2003-01-24 | Obic Co Ltd | Data retrieving device and data retrieving method and data retrieving program |
JP2014085874A (en) * | 2012-10-24 | 2014-05-12 | Ntt Docomo Inc | Information search device, information search system, and information search method |
JP2017091565A (en) * | 2016-12-28 | 2017-05-25 | パイオニア株式会社 | Display device, display method and display program |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021174339A (en) * | 2020-04-28 | 2021-11-01 | 株式会社ソケッツ | Retrieval device and method |
JP7037778B2 (en) | 2020-04-28 | 2022-03-17 | 株式会社ソケッツ | Search device and method |
Also Published As
Publication number | Publication date |
---|---|
JP7279481B2 (en) | 2023-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9569506B2 (en) | Uniform search, navigation and combination of heterogeneous data | |
KR102310650B1 (en) | Coherent question answering in search results | |
US7096218B2 (en) | Search refinement graphical user interface | |
US10552467B2 (en) | System and method for language sensitive contextual searching | |
US20030004941A1 (en) | Method, terminal and computer program for keyword searching | |
US8438024B2 (en) | Indexing method for quick search of voice recognition results | |
US20100174704A1 (en) | Searching method and system | |
US20120162244A1 (en) | Image search color sketch filtering | |
JP2006073012A (en) | System and method of managing information by answering question defined beforehand of number decided beforehand | |
US10936667B2 (en) | Indication of search result | |
US8583415B2 (en) | Phonetic search using normalized string | |
JP2003281186A (en) | Example base retrieval method and retrieval system for determining similarity | |
JP7279481B2 (en) | Search processing program, search processing method and search processing device | |
US20060248037A1 (en) | Annotation of inverted list text indexes using search queries | |
JP2007025939A (en) | Multilingual document retrieval device, multilingual document retrieval method and program for retrieving multilingual document | |
US9886497B2 (en) | Indexing presentation slides | |
Roy et al. | I-REX: a lucene plugin for explainable IR | |
JP5285491B2 (en) | Information retrieval system, method and program, index creation system, method and program, | |
KR101037091B1 (en) | Ontology Based Semantic Search System and Method for Authority Heading of Various Languages via Automatic Language Translation | |
KR100964207B1 (en) | Method and apparatus for indexing and retrieving documents based on hashing | |
JP6565565B2 (en) | Information processing apparatus, name determination method, and name determination program | |
TWM529875U (en) | Patent classification searching system by disassembling data field | |
US20080228725A1 (en) | Problem/function-oriented searching method for a patent database system | |
US20230409620A1 (en) | Non-transitory computer-readable recording medium storing information processing program, information processing method, information processing device, and information processing system | |
JP7284371B2 (en) | Information processing device, information processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221024 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230411 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230424 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7279481 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |