JP2020113045A - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP2020113045A JP2020113045A JP2019003504A JP2019003504A JP2020113045A JP 2020113045 A JP2020113045 A JP 2020113045A JP 2019003504 A JP2019003504 A JP 2019003504A JP 2019003504 A JP2019003504 A JP 2019003504A JP 2020113045 A JP2020113045 A JP 2020113045A
- Authority
- JP
- Japan
- Prior art keywords
- search
- phrase
- word
- words
- phrases
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】検索条件に含まれる複数の語句に紐付けられているコンテンツ数の総和が最大となる中から絞込検索の対象とする語句を絞込対象語句として選出しない場合に比して、検索数を減らす。【解決手段】情報処理装置10は、複数の語句を意味的な関係性で関連付けることにより構造化された語句関連情報を記憶する語句関連情報記憶部17と、ユーザにより指定された検索語句に基づき検索を実行する検索実行部13と、検索の実行の結果として閾値以上のコンテンツ数が得られた場合、検索語句毎に当該検索語句に関連するコンテンツの数を集計し、その集計した数が最大となる検索語句を絞込対象語句として選出する絞込対象語句選出部14と、語句関連情報を参照して得られる検索語句の下位層に位置する語句を、当該検索語句に差し替える語句として表示させる表示制御部15と、を有する。【選択図】図1
Description
本発明は、情報処理装置及びプログラムに関する。
所望の情報(コンテンツ)を検索により取得したい場合、ユーザは、その情報と関連性が高いと考える検索キーワードを検索条件に指定して検索を実行する。もし、検索結果に所望の情報が含まれていたとしても検索結果が多すぎて見つけられない場合、検索条件に指定する検索キーワードを再考し、既設定の検索キーワードと差し替えたり、追加したりして検索を再度試みる。
本発明は、検索条件に含まれる複数の語句に紐付けられているコンテンツ数の総和が最大となる中から絞込検索の対象とする語句を絞込対象語句として選出しない場合に比して、検索数を減らすことを目的とする。
本発明に係る情報処理装置は、語句と語句との意味的な関連性により構造化され、当該語句とコンテンツとの関連情報を含む知識情報への検索条件を受け付ける受付手段と、前記受付手段が受け付けた検索条件に含まれる複数の語句の関連語句に紐付くコンテンツの検索を実行する実行手段と、前記実行手段による検索結果により、前記検索条件に含まれる複数の語句のうち、前記知識情報において下位層に位置する語句に紐付けられているコンテンツ数の総和が最大となる語句を絞込対象語句として選出する選出手段と、前記選出手段により選出された前記絞込対象語句の下位層に位置する語句を表示させるよう制御する表示制御手段と、を有することを特徴とする。
また、前記実行手段は、前記絞込対象語句を、表示された語句の中からユーザにより選択された語句で差し替えて再検索することを特徴とする。
また、前記選出手段は、前記検索条件に含まれる複数の語句それぞれの、前記知識情報において下位層に位置する語句に紐付けられているコンテンツ数の総和の差が所定値未満である場合は、前記下位層に位置する語句の数を参照して前記絞込対象語句を選出することを特徴とする。
また、前記選出手段は、検索条件に含まれる複数の語句それぞれの、前記知識情報において下位層に位置する語句に紐付けられているコンテンツ数の総和の差が所定値未満である場合は、前記知識情報において最下位層に位置する語句までの階層数を参照して前記絞込対象語句を選出することを特徴とする。
本発明に係るプログラムは、コンピュータを、語句と語句との意味的な関連性により構造化され、当該語句とコンテンツとの関連情報を含む知識情報への検索条件を受け付ける受付手段、前記受付手段が受け付けた検索条件に含まれる複数の語句の関連語句に紐付くコンテンツの検索を実行する実行手段、前記実行手段による検索結果により、前記検索条件に含まれる複数の語句のうち、前記知識情報において下位層に位置する語句に紐付けられているコンテンツ数の総和が最大となる語句を絞込対象語句として選出する選出手段、前記選出手段により選出された前記絞込対象語句の下位層に位置する語句を表示させるよう制御する表示制御手段、として機能させる。
請求項1に記載の発明によれば、検索条件に含まれる複数の語句に紐付けられているコンテンツ数の総和が最大となる中から絞込検索の対象とする語句を絞込対象語句として選出しない場合に比して、検索数を減らすことができる。
請求項2に記載の発明によれば、絞込対象語句を、絞込対象語句の下位層に位置する語句に差し替えて再検索を実行することができる。
請求項3に記載の発明によれば、下位層に位置する語句に紐付けられているコンテンツ数の総和の差が所定値未満の場合に、総和のみに基づいて絞込対象語句を選出するのに比べて、絞込みができる可能性がより高い語句を選出できる。
請求項4に記載の発明によれば、下位層に位置する語句に紐付けられているコンテンツ数の総和の差が所定値未満の場合に、総和のみに基づいて絞込対象語句を選出するのに比べて、絞込みができる可能性がより高い語句を選出できる。
請求項5に記載の発明によれば、検索条件に含まれる複数の語句に紐付けられているコンテンツ数の総和が最大となる中から絞込検索の対象とする語句を絞込対象語句として選出しない場合に比して、検索数を減らすことができる。
以下、図面に基づいて、本発明の好適な実施の形態について説明する。
実施の形態1.
本実施の形態における情報処理装置は、パーソナルコンピュータ(PC)等の従前から存在する汎用的なハードウェア構成で実現できる。すなわち、情報処理装置は、CPU、ROM、RAM、ハードディスクドライブ(HDD)等の記憶手段、ユーザインタフェースを内部バスに接続して構成される。ユーザインタフェースとしては、マウスやキーボード等の入力手段、ディスプレイ等の表示手段で構成される。もちろん、タッチパネル等入力手段と表示手段を兼用するユーザインタフェースで構成してもよい。
本実施の形態における情報処理装置は、パーソナルコンピュータ(PC)等の従前から存在する汎用的なハードウェア構成で実現できる。すなわち、情報処理装置は、CPU、ROM、RAM、ハードディスクドライブ(HDD)等の記憶手段、ユーザインタフェースを内部バスに接続して構成される。ユーザインタフェースとしては、マウスやキーボード等の入力手段、ディスプレイ等の表示手段で構成される。もちろん、タッチパネル等入力手段と表示手段を兼用するユーザインタフェースで構成してもよい。
また、記憶手段は、情報処理装置に内蔵された構成要素に限定する必要はなく、LAN(Local Area Network)やインターネット等のネットワークに接続された他の装置に設けられていてもよい。この場合、接続するネットワークに適合するネットワークインタフェースを内部バスに接続することになる。
図1は、本発明に係る情報処理装置の一実施の形態を示したブロック構成図である。本実施の形態における情報処理装置10は、入出力部11、入力解析部12、検索実行部13、絞込対象語句選出部14、表示制御部15、制御部16、語句関連情報記憶部17及び語句コンテンツ関連情報記憶部18を有している。なお、本実施の形態において説明に用いない構成要素については図から省略している。
入出力部11は、上記ユーザインタフェースを介してデータの入出力を行う。入出力部11に含まれる入力受付部111は、ユーザから入力されたデータを受け付ける。受け付けるデータは、質問文やユーザ操作等である。表示部112は、表示制御部15による制御のもと検索実行部13による検索処理の実行結果(以下、「検索結果」という)等を表示する画面や表示中の画面に情報の追加表示や表示内容の変更等の表示制御を行う。本実施の形態では、情報処理装置10に接続されるディスプレイを表示先とし、情報処理装置10に接続されるマウスやキーボード等を入力手段と想定して説明するが、外部の装置、例えばユーザ端末からインターネットを介して情報処理装置10を利用させる場合、入出力部11は、ネットワークインタフェースを介してデータを送受信することになる。
入力解析部12は、入力受付部111により受け付けられたデータを解析して、ユーザにより行われた操作やデータの内容を認識する。ユーザにより検索条件として質問文が入力された場合、入力解析部12は、その質問文から語句を抽出することによって、あるいはユーザ操作に応じて検索語句を特定する。「検索語句」というのは、検索実行部13が検索を実行する際に用いる語句のことをいう。入力解析部12は、原則、語句関連情報記憶部17に設定登録されている語句と合致する語句を、検索実行部13が用いる検索語句として特定する。なお、「語句」というのは、語や句を意味する。語句関連情報記憶部17には、単なる語(単語)のみならず句も登録されることから、検索実行部13は、句に基づき検索を実行する場合もあり得る。本実施の形態では、このような場合を考慮して「語句」と表現している。
また、「検索条件」というのは、検索実行部13に検索を実行させる際にユーザが入力指定する条件である。基本的には、検索条件には、検索語句が指定される。検索範囲や情報の種類(例えば、画像等)等の付加的な設定が可能かもしれないが、本実施の形態では、付加的な設定は特に必要ないので、説明の便宜上、語句に限定して説明する。ユーザは、検索条件として、1又は複数の検索キーワードを指定する場合もあるが、本実施の形態では、自然文で指定されることを想定している。なお、本実施の形態では、検索語句を含む検索文は、質問文と同義であり、ユーザは検索語句を自然文に含めて入力するため、自然文とも同義である。
検索実行部13は、入力解析部12により特定された検索語句に基づき検索処理を実行する。より詳細には、検索語句及び当該検索語句の関連語句に基づきコンテンツの検索を実行する。「検索語句の関連語句」については、後述する。絞込対象語句選出部14は、検索実行部13による検索結果により、検索条件に含まれる複数の検索語句のうち、語句関連情報記憶部17において下位層に位置する語句に紐付けられているコンテンツ数の総和が最大となる語句を絞込対象語句として選出する。
表示制御部15は、制御部16による制御のもと、絞込対象語句選出部14により選出された絞込対象語句の下位層に位置する語句を表示部112に表示させるよう制御する。制御部16は、後述する処理が実行されるよう各構成要素11〜15を制御する。
図2は、本実施の形態における語句関連情報記憶部17に設定登録されている語句関連情報に含まれる各語句の関係性を模式的に示す図である。語句関連情報は、オントロジーに相当する辞書であり、複数の概念を意味的な関係性で関連付けることにより構造化された知識情報である。語句は、オントロジーによって定義される概念を表す名前である。図2に示すように、各語句は、語句間の意味的な関係性によって直接又は間接的に紐付けられ、この紐付けによって示される階層関係によって階層構造(すなわち、階層上の上下関係)が示される。なお、語句関連情報には、他の語句と階層を形成しない語句が存在してもよい。語句関連情報において、階層の上位にある語句は、汎用的一般的な語句と認識され、階層の下位に位置する語句ほど専門性の高い語句や詳細な概念を表す語句と認識される。また、語句は、下位層に紐付く語句の総称、すなわち例えば下位層に位置する語句のグループ名(「クラス名」ともいう)などのように上位概念に相当する語句の場合がある。また、語句によっては、複数の直上の語句から紐付けられる場合がある。つまり、語句の中には、複数の異なる階層に組み込まれる場合がある。図2は、語句の関係性を示すための模式図であって、語句の実際の関係性や登録数、階層数はこれに限るものではない。
図3は、本実施の形態における語句コンテンツ関連情報記憶部18に記憶される語句コンテンツ関連情報のデータ構成の一例を示す図である。語句コンテンツ関連情報は、語句関連情報と共に知識情報を形成する。語句コンテンツ関連情報には、コンテンツ毎にコンテンツID、データ、語句及び関連度が設定される。コンテンツIDは、各コンテンツを識別するための識別情報である。データはコンテンツ自体である。なお、コンテンツデータの格納先情報を設定し、データの代わりに格納先情報を設定してもよい。語句は、当該コンテンツに含まれる語句であるが、語句関連情報記憶部17に設定登録されている語句である必要がある。関連度は、語句毎に設定され、当該語句と当該コンテンツとの関連性を示す指標である。関連度が高いほど、当該語句と当該コンテンツとの関連性は高くなる。
図4は、本実施の形態において利用する関連度の概念を説明するための図である。図4には、自然文で入力された検索文と、その検索文から抽出された語句に基づき検索によりたどり着くコンテンツとの関係が示されている。コンテンツは、語句コンテンツ関連情報記憶部18に格納されている。図4に示す語句とコンテンツとの関係によると、検索文からは、「消費税額」及び「特例」という2つの語句が検索語句として抽出されていることからコンテンツにたどり着くまで2経路存在する。そして、各経路においてコンテンツにたどり着くまでに語句関連情報記憶部17を経由する語句の数(以下、「ホップ数」という)を求める。まず、「消費税額」からのホップ数は、「消費税額」、「税額」及び「所得税額」の3である。一方、「特例」からのホップ数は、「特例」のみで1である。
関連度は、経路数が同じ場合、ホップ数が小さいほど関連度が高くなり、関連度が高いほど検索文とコンテンツとの関連性が高いということができる。従って、関連度の高い検索結果が得られているということは、ユーザが所望する検索結果(コンテンツ)が得られていると推測できるので、本実施の形態では、再度の検索を促さないようにしている。一方、関連度が低い検索結果しか得られていない場合、ユーザが所望する検索結果が得られていないと推測して、検索結果を絞り込めむために検索語句の再設定の便宜を図れるようにした。なお、関連度の高低は、所定の閾値との比較で判定する。すなわち、算出される関連度が閾値以上の場合には関連度が高いと判定し、算出される関連度が閾値に満たない場合には関連度が低いと判定する。
前述したように、入力解析部12は、ユーザにより入力された自然文(質問文)の中から1又は複数の語句を抽出し、その抽出した語句を検索実行部13による検索語句として特定することになるが、入力解析部12が抽出する語句は、語句関連情報に登録されている必要がある。なお、入力解析部12が抽出する語句と、語句関連情報に登録されている語句とが完全に一致していなくても、類義語等の関係で同じ語句とみなすことができるのであれば、入力解析部12が抽出する語句は語句関連情報に登録されているとみなすようにしてもよい。語句コンテンツ関連情報記憶部18に格納されているコンテンツが検索結果として選出されるためには、当該コンテンツに含まれている語句を洗い出すことによって抽出し、その抽出した語句と他の語句との関係性を定義して語句関連情報記憶部17に登録する必要がある。このように、語句関連情報に設定する語句と、語句コンテンツ関連情報記憶部18に登録されているコンテンツに含まれている語句とを関連付けるためには、語句関連情報を語句コンテンツ関連情報記憶部18に登録されているコンテンツを参照して生成するのが好ましい。
情報処理装置10における各構成要素11〜16は、情報処理装置10を形成するコンピュータと、コンピュータに搭載されたCPUで動作するプログラムとの協調動作により実現される。また、各記憶手段17,18は、情報処理装置10に搭載されたHDDにて実現される。あるいは、RAM又は外部にある記憶手段をネットワーク経由で利用してもよい。
また、本実施の形態で用いるプログラムは、通信手段により提供することはもちろん、CD−ROMやUSBメモリ等のコンピュータ読み取り可能な記録媒体に格納して提供することも可能である。通信手段や記録媒体から提供されたプログラムはコンピュータにインストールされ、コンピュータのCPUがプログラムを順次実行することで各種処理が実現される。
図5は、本実施の形態における表示制御部15が表示対象とする検索サービス画面の概略的な画面構成の一例を示す図である。検索サービス画面20には、質問文入力領域21、検索結果表示領域22及び対話表示領域23が含まれている。質問文入力領域21は、ユーザが検索を行うために検索条件を入力するための領域である。ユーザは、検索条件として検索キーワードを入力してもよいが、本実施の形態では、前述したように質問文を入力する。検索結果表示領域22は、検索実行部13による検索結果を表示するための領域である。本実施の形態では、ユーザと対話形式にて検索サービスを提供するが、対話表示領域23は、そのユーザとシステム(すなわち、情報処理装置10)との入出力部11を介した対話の内容を表示するための領域である。例えば、ユーザに質問文の入力を促すメッセージ、ユーザが質問文入力領域21から入力した質問文、検索語句に基づく検索結果数(コンテンツ数)、検索語句の追加、指定変更等を促すメッセージ等が対話形式にて表示される。
次に、本実施の形態における情報処理装置10が提供する検索処理について図6に示すフローチャートを用いて説明する。
前述したように、ユーザは、検索サービス画面20を利用することで情報処理装置10と対話形式にて検索を実行することができる。そのため、ユーザは、検索を実行したい場合、所定の画面表示操作を行う。表示制御部15は、ユーザの画面表示操作に応じて図5に示す検索サービス画面20を画面表示させる。そして、ユーザは、検索サービス画面20の質問文入力領域21に質問文を入力する。
なお、ユーザが検索を実行するというのは、情報処理装置10が提供する検索サービスを利用して検索を行うことを意味する。一方、情報処理装置10の検索実行部13が検索を実行するというのは、検索処理アプリケーションを実行することによりユーザの指定に基づく検索語句と関連性の高い情報(コンテンツ)を抽出し、その抽出したコンテンツを検索結果としてユーザに提示するという検索サービス(検索処理)を実行することを意味する。
入力受付部111は、質問文入力領域21に入力された検索文を受け付けると(ステップ101)、入力解析部12は、入力された内容を解析して情報の種類を特定する。ここでは、入力受付部111が受け付けた情報は質問文入力領域21から入力された情報であることから検索語句を含む検索文であると特定できる。検索文の場合、入力解析部12は、検索文を解析して検索語句を特定する(ステップ102)。
図7は、本実施の形態における検索処理の際に対話表示領域23に表示される内容の一例を示す図である。この表示例で示すメッセージ31によると、ユーザが質問文入力領域21に「仕入れをした際の非課税の対象」と入力したことが確認できる。そして、入力解析部12は、検索文の中から「仕入れ」及び「課税の対象」を検索語句として抽出したものとする。
入力解析部12によって検索文の中に含まれている検索語句が特定されると、検索実行部13は、その検索語句に基づき検索処理を実行する(ステップ103)。本実施の形態では、検索実行部13の検索先を語句コンテンツ関連情報記憶部18に限定する。検索実行部13は、検索を実行する際、語句関連情報記憶部17を参照して、検索語句の下位層に位置する語句を抽出する。図2に示す語句関連情報の階層関係に基づくと、「仕入れ」は、「非課税仕入れ」や「特定仕入れ」等の語句を抽出する。そして、検索実行部13は、検索語句である「仕入れ」に紐付くコンテンツに加えて、抽出した検索語句の下位層に位置する語句「非課税仕入れ」等に紐付くコンテンツも合わせて検索結果に含める。前述した「検索語句の関連語句」というのは、ここで説明した語句関連情報記憶部17において検索語句「仕入れ」の下位層に位置する語句「非課税仕入れ」等のことを指す。
続いて、検索実行部13は、検索により得た各コンテンツに関連する検索語句に対応する関連度を取得して、当該コンテンツの関連度を算出する(ステップ104)。例えば、図3に示す「コンテンツ#00001」には、検索語句である「仕入れ」及び「課税の対象」が含まれていることから、このコンテンツは検索結果に含まれることになるが、このコンテンツの関連度は、全検索語句の関連度(この例では、1.11と1.12)の総和を求めて2.23となる。
続いて、表示制御部15は、各コンテンツの関連度に基づき検索結果(すなわち、コンテンツのリスト)を検索結果表示領域22に表示させる(ステップ105)。例えば、関連度の高いコンテンツから順に検索結果表示領域22に表示させる。なお、本実施の形態では、関連度を用いて検索結果表示領域22に表示させるコンテンツの並び順を決定したが、関連度以外の指標、例えば、tf−idf(Term Frequency Inverse Document Frequency)などの指標に基づき決定してもよい。
ここで、所定の閾値以上の関連度となるコンテンツが存在する場合(ステップ106でY)、制御部16は、ユーザが所望するコンテンツが得られていると推測して再度の検索を促さないようにしている。つまり、検索処理を終了させる。この関連度と比較する所定の閾値は、ユーザが所望するコンテンツが得られていると判断するための閾値である。このため、閾値は、過去の実績等を参照にして適切な値を設定すればよい。 一方、所定の閾値以上の関連度となるコンテンツが存在しない場合(ステップ106でN)、続いて検索結果に含まれるコンテンツの数と所定の閾値とを比較する。コンテンツの数が所定の閾値に達していなければ(ステップ107でN)、制御部16は、検索処理を終了させる。このコンテンツ数と比較する所定の閾値というのは、ユーザが所望するコンテンツを検索結果(コンテンツのリスト)の中から探し出せると考えられるコンテンツ数である。従って、コンテンツの数が所定の閾値に達していない場合には、再検索により検索結果を絞り込ませる必要がないと判断して、検索処理を終了させる。
コンテンツの数が所定の閾値以上の場合(ステップ107でY)、検索結果の中からユーザが所望する情報(コンテンツ)を見つけにくい状態にあるため、本実施の形態では、検索結果数(すなわち、コンテンツ数)を絞り込むように処理する。「コンテンツを見つけにくい」というのは、検索の実行によりユーザが所望するコンテンツが得られていたとしても、換言すると検索結果に含まれていたとしても検索結果数が多くて、ユーザが所望するコンテンツが検索結果表示領域22に表示されていない場合、若しくは検索結果表示領域22に表示されていても上位に表示されない場合である。
検索結果の数を絞り込むために、絞込対象語句選出部14は、検索語句毎にコンテンツ数を集計する(ステップ108)。前述したように、検索実行部13は、検索語句及び語句関連情報において当該検索語句の下位層に位置する語句に基づく検索結果を得ているので、これらの検索結果(コンテンツ数)を合算して総和を求める。この検索語句と下位層に位置する語句と当該検索語句のコンテンツ数とを表形式にて示す図を図8に示す。
図8に示す数値例によると、検索語句「仕入れ」に関連するコンテンツ数が150と、11である検索語句「課税の対象」より多い。このように、絞込対象語句選出部14は、検索語句の中からコンテンツ数の総和が最大となる検索語句を絞込対象語句として選出する(ステップ109)。
絞込対象語句を選出すると、絞込対象語句選出部14は、語句関連情報においてその絞込対象語句の下位層に位置する語句を抽出する(ステップ110)。本実施の形態では、下位層の語句のうち絞込対象語句の直下に位置する語句のみを抽出するようにしているが、下位層の語句の数が所定数に満たない場合等所定の条件に合致する場合には2階層以上下位に位置する語句あるいは最下位層までの語句を合わせて抽出するようにしてもよい。なお、絞込対象語句選出部14が語句関連情報から抽出する語句を「下位層の語句」と称することにする。
絞込対象語句選出部14が下位層の語句を抽出すると、表示制御部15は、絞込対象語句「仕入れ」を明示すると共に絞込対象語句を下位層の語句に差し替えるための問合せメッセージ32を対話表示領域23に表示させる。そして、問合せメッセージ32に続けて、下位層の語句を選択可能に表示させる(ステップ111)。具体的には、図7に示すように、ユーザにより選択可能な表示部品(選択ボタン)33それぞれに語句の名前を割り当てて表示させる。なお、選択ボタン33にマウスカーソルを合わせると、その選択ボタン33に割り当てた語句の説明文がツールチップに表示されるようにしてもよい。
ユーザが、選択ボタン33の中から自分が意図した語句に対応する選択ボタン33を選択する操作を行うと、入力受付部111がその操作を受け付ける。入力解析部12は、入力受付部111が受け付けた操作内容を解析することでユーザが操作した選択ボタン33を特定する。
このようにして、差し替える語句(例えば「非課税仕入れ」)が特定されると、検索実行部13は、検索語句を「仕入れ」を「非課税仕入れ」に差し替え(ステップ112)、検索語句「非課税仕入れ」及び「課税の対象」に基づき検索を再実行する(ステップ103)。検索が再実行されると、表示制御部15は、検索語句を差し替えて検索を実行した旨と、その検索により得られたコンテンツの数を示すメッセージ34を対話表示領域23に表示させる。
質問当初の検索語句「仕入れ」と差し替える語句(例えば「非課税仕入れ」)は、「仕入れ」の下位層に位置する語句である。これにより、「非課税仕入れ」以外の下位層の語句(「特定仕入れ」等)のみに対応するコンテンツは検索結果に含まれなくなるので検索結果(コンテンツ数)を絞り込めることになる。検索語句を差し替えた後の検索により得られたコンテンツの数を更に絞り込みたい場合には、上記処理を繰り返し実行することで、検索語句(例えば「非課税仕入れ」)を更に下位層に位置する語句に差し替えて検索を再実行すればよい。なお、「得られたコンテンツ」とはいっても、検索結果表示領域22には、検索結果としてコンテンツ自体が表示されるわけではなく、コンテンツのリストが表示されるだけである。
ところで、検索語句の直下に位置する語句に下位層の語句が存在しない場合が想定できる。また、検索語句(例えば「仕入れ」)といったん差し替えた下位層の語句(例えば「非課税仕入れ」)を他の下位層の語句(例えば「特定仕入れ」等)に差し替えることで絞込検索を行いたい場合がある。この場合を考慮し、ユーザとの対話による操作指示に応じて、検索語句「仕入れ」を下位層の語句(例えば「非課税仕入れ」)と差し替えて検索を再実行した後でも、「非課税仕入れ」と同じ階層の他の語句(例えば「課税仕入れ」)に差し替えることができるようにしてもよい。
また、本実施の形態では、絞込対象語句選出部14が、検索結果に含まれるコンテンツ数を参照して最多となるコンテンツ数の検索語句(上記例の「仕入れ」)を絞込対象語句として選出したが、この選出した絞込対象語句をユーザとの対話による操作指示に応じて変更できるようにしてもよい。
実施の形態2.
上記実施の形態1では、検索結果を参照して検索語句の中からコンテンツ数の総和が最大となる検索語句を絞込対象語句として選出するようにした。本実施の形態では、「コンテンツ数の総和が最大となる検索語句」とは異なる判断条件にて絞込対象語句を選出するようにした。具体的には、判断条件として期待減少数を参照する。本実施の形態における検索処理は、図6を用いて説明した検索処理のステップ108,109に代えて以下に説明する処理を実行することで絞込対象語句を選出する。
上記実施の形態1では、検索結果を参照して検索語句の中からコンテンツ数の総和が最大となる検索語句を絞込対象語句として選出するようにした。本実施の形態では、「コンテンツ数の総和が最大となる検索語句」とは異なる判断条件にて絞込対象語句を選出するようにした。具体的には、判断条件として期待減少数を参照する。本実施の形態における検索処理は、図6を用いて説明した検索処理のステップ108,109に代えて以下に説明する処理を実行することで絞込対象語句を選出する。
図9は、本実施の形態において絞込対象語句を選出する際に参照する、期待減少数の数値例を表形式にて示す図である。図9には、各検索語句に対応させて、当該検索語句の下位層に位置する語句(下位層の語句)及び下位層の語句の数と、語句コンテンツ関連情報において当該検索語句の下位層の語句に紐付けられているコンテンツの数(コンテンツ数)と、当該検索語句を下位層の語句に差し替えて再検索を実行した場合に期待できるコンテンツの減少数を示す期待減少数と、が設定された例が示されている。
検索実行部13が検索を実行すると、絞込対象語句選出部14は、語句関連情報を参照して各検索語句の下位層の語句及びその総数を取得し、また検索実行部13による検索結果を参照して、コンテンツ数を取得する。そして、期待減少数は、当該検索語句のコンテンツ数を下位層の語句の総数で除算することで算出できる。
図9に示す数値例によると、検索語句「相当額」の下位層の語句の数は33、コンテンツ数は78なので、期待減少数は78/33=2.4と算出できる。つまり、検索語句「相当額」をいずれかの下位層の語句に差し替えて再検索を実行することで得られるコンテンツの数は78−2.4=75.6と推測できる。一方、検索語句「引き渡し」の下位層の語句の数は7、コンテンツ数は80なので、期待減少数は80/7=11.4と算出できる。つまり、検索語句「引き渡し」をいずれかの下位層の語句に差し替えて再検索を実行することで得られるコンテンツの数は80−11.4=68.6と推測できる。つまり、図9に示す数値例によると、検索語句「引き渡し」を絞込対象語句として選出した方が検索により得られるコンテンツの数が少なくなり、コンテンツの効果的な絞込を期待できる。
各検索語句のコンテンツ数が同程度の数の場合、実施の形態1のように「コンテンツ数の総和が最大となる検索語句」に基づき選出しても、再検索の結果(コンテンツ数)にそれほど差は生じないことが推測できる。そこで、本実施の形態では、各検索語句におけるコンテンツ数の総和の差(図9に示す例では|78−80|=2)が所定の閾値に満たない場合、下位層の語句の数を参照して絞込対象語句を選出するようにした。上記計算例では、下位層の語句の数でコンテンツ数を除算している。なお、コンテンツ数は、同程度の数なので、計算結果(期待減少数)は、下位層の語句の数に依存する。
このように、本実施の形態によれば、検索語句を下位層の語句に差し替えて再検索を実行した場合に期待できる減少数(期待減少数)を検索語句毎に算出し、期待減少数の少ない検索語句を絞込対象語句として選出するようにした。
実施の形態3.
上記実施の形態1では、検索結果を参照して検索語句の中からコンテンツ数の総和が最大となる検索語句を絞込対象語句として選出するようにした。本実施の形態では、「コンテンツ数の総和が最大となる検索語句」とは異なる判断条件にて絞込対象語句を選出するようにした。具体的には、ホップ数を参照する。本実施の形態における検索処理は、図6を用いて説明した検索処理のステップ108,109に代えて以下の説明する処理を実行することで絞込対象語句を選出する。
上記実施の形態1では、検索結果を参照して検索語句の中からコンテンツ数の総和が最大となる検索語句を絞込対象語句として選出するようにした。本実施の形態では、「コンテンツ数の総和が最大となる検索語句」とは異なる判断条件にて絞込対象語句を選出するようにした。具体的には、ホップ数を参照する。本実施の形態における検索処理は、図6を用いて説明した検索処理のステップ108,109に代えて以下の説明する処理を実行することで絞込対象語句を選出する。
図10は、本実施の形態において絞込対象語句を選出する際に参照する、最下位層からのホップ数の数値例を表形式にて示す図である。図10には、各検索語句に対応させて、当該検索語句の下位層に位置する語句(下位層の語句)及び下位層の語句の数と、語句コンテンツ関連情報において当該検索語句の下位層の語句に紐付けられているコンテンツの数(コンテンツ数)と、最下位層から検索語句までのホップ数と、が設定された例が示されている。
検索実行部13が検索を実行すると、絞込対象語句選出部14は、語句関連情報を参照して各検索語句の下位層の語句及びその総数を取得し、また検索実行部13による検索結果を参照して、コンテンツ数を取得する。そして、語句関連情報を参照し、検索語句を最上位層に位置する語句とした場合、その最上位層の語句から最下位層に位置する語句までを抽出する。そして、最下位層から最上位層までのホップ数を得る。最下位層に位置する語句から最上位層に位置する語句までのホップ数が多いということは、最上位層の語句、すなわち検索語句が抽象的な語句であると考えられる。従って、抽象的な語句を優先的に絞込対象語句として選出し、専門用語等より詳細な意味を示す語句に差し替えてから再検索することで、絞込検索を効果的にできると推測できる。
各検索語句のコンテンツ数が同程度の数の場合、実施の形態1のように「コンテンツ数の総和が最大となる検索語句」に基づき選出しても、再検索の結果(コンテンツ数)にそれほど差は生じないことが推測できる。そこで、本実施の形態では、各検索語句におけるコンテンツ数の総和の差(図9に示す例では|73−80|=7)が所定の閾値に満たない場合、最下位層に位置する語句から検索語句までのホップ数を参照して絞込対象語句を選出するようにした。
本実施の形態によれば、検索語句を下位層の語句に差し替えて再検索を実行した場合に効果的な絞込検索が期待できる。
10 情報処理装置、11 入出力部、12 入力解析部、13 検索実行部、14 絞込対象語句選出部、15 表示制御部、16 制御部、17 語句関連情報記憶部、18 語句コンテンツ関連情報記憶部、20 検索サービス画面、21 質問文入力領域、22 検索結果表示領域、23 対話表示領域、111 入力受付部、112 表示部。
Claims (5)
- 語句と語句との意味的な関連性により構造化され、当該語句とコンテンツとの関連情報を含む知識情報への検索条件を受け付ける受付手段と、
前記受付手段が受け付けた検索条件に含まれる複数の語句の関連語句に紐付くコンテンツの検索を実行する実行手段と、
前記実行手段による検索結果により、前記検索条件に含まれる複数の語句のうち、前記知識情報において下位層に位置する語句に紐付けられているコンテンツ数の総和が最大となる語句を絞込対象語句として選出する選出手段と、
前記選出手段により選出された前記絞込対象語句の下位層に位置する語句を表示させるよう制御する表示制御手段と、
を有することを特徴とする情報処理装置。 - 前記実行手段は、前記絞込対象語句を、表示された語句の中からユーザにより選択された語句で差し替えて再検索することを特徴とする請求項1に記載の情報処理装置。
- 前記選出手段は、前記検索条件に含まれる複数の語句それぞれの、前記知識情報において下位層に位置する語句に紐付けられているコンテンツ数の総和の差が所定値未満である場合は、前記下位層に位置する語句の数を参照して前記絞込対象語句を選出することを特徴とする請求項1に記載の情報処理装置。
- 前記選出手段は、検索条件に含まれる複数の語句それぞれの、前記知識情報において下位層に位置する語句に紐付けられているコンテンツ数の総和の差が所定値未満である場合は、前記知識情報において最下位層に位置する語句までの階層数を参照して前記絞込対象語句を選出することを特徴とする請求項1に記載の情報処理装置。
- コンピュータを、
語句と語句との意味的な関連性により構造化され、当該語句とコンテンツとの関連情報を含む知識情報への検索条件を受け付ける受付手段、
前記受付手段が受け付けた検索条件に含まれる複数の語句の関連語句に紐付くコンテンツの検索を実行する実行手段、
前記実行手段による検索結果により、前記検索条件に含まれる複数の語句のうち、前記知識情報において下位層に位置する語句に紐付けられているコンテンツ数の総和が最大となる語句を絞込対象語句として選出する選出手段、
前記選出手段により選出された前記絞込対象語句の下位層に位置する語句を表示させるよう制御する表示制御手段、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019003504A JP2020113045A (ja) | 2019-01-11 | 2019-01-11 | 情報処理装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019003504A JP2020113045A (ja) | 2019-01-11 | 2019-01-11 | 情報処理装置及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020113045A true JP2020113045A (ja) | 2020-07-27 |
Family
ID=71666939
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019003504A Pending JP2020113045A (ja) | 2019-01-11 | 2019-01-11 | 情報処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020113045A (ja) |
-
2019
- 2019-01-11 JP JP2019003504A patent/JP2020113045A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4368336B2 (ja) | カテゴリ設定支援方法及び装置 | |
JP4962967B2 (ja) | Webページ検索サーバ及びクエリ推薦方法 | |
WO2016000158A1 (en) | Code recommendation | |
JP2005128873A (ja) | 質問応答型文書検索システム及び質問応答型文書検索プログラム | |
JP2015511746A5 (ja) | ||
US11314930B2 (en) | Generating and provisioning of additional content for source perspective(s) of a document | |
JP2020135891A (ja) | 検索提案を提供する方法、装置、機器及び媒体 | |
JP5366632B2 (ja) | 検索サポートキーワード提示装置、方法及びプログラム | |
US20120179709A1 (en) | Apparatus, method and program product for searching document | |
JP2005135113A (ja) | 電子機器装置、関連語抽出方法及びプログラム | |
JP4935243B2 (ja) | 検索プログラム、情報検索装置及び情報検索方法 | |
US20180018389A1 (en) | Method and apparatus for keyword-based text retrieval | |
JP4699909B2 (ja) | キーワード対応関係分析装置及び分析方法 | |
JP2012043115A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP6163143B2 (ja) | 情報提供装置、情報提供方法、および情報提供プログラム | |
JP7238411B2 (ja) | 情報処理装置及びプログラム | |
JP2020113045A (ja) | 情報処理装置及びプログラム | |
JP7200683B2 (ja) | 情報処理装置及びプログラム | |
JP7243196B2 (ja) | 情報処理装置及びプログラム | |
EP2800014A1 (en) | Method for searching curriculum vitae's on a job portal website, server and computer program product therefore | |
JP2014146076A (ja) | 文字列抽出方法、文字列抽出装置、および文字列抽出プログラム | |
JP4496797B2 (ja) | 文書管理装置および方法 | |
JP2007241635A (ja) | 文書検索装置、情報処理装置、検索結果出力方法、検索結果表示方法およびプログラム | |
JP6884172B2 (ja) | 計算機システム及び文書の評価方法 | |
JP7413776B2 (ja) | 情報処理装置、及びコンピュータプログラム |