JP2009277154A - 情報検索装置及び情報検索方法 - Google Patents

情報検索装置及び情報検索方法 Download PDF

Info

Publication number
JP2009277154A
JP2009277154A JP2008130058A JP2008130058A JP2009277154A JP 2009277154 A JP2009277154 A JP 2009277154A JP 2008130058 A JP2008130058 A JP 2008130058A JP 2008130058 A JP2008130058 A JP 2008130058A JP 2009277154 A JP2009277154 A JP 2009277154A
Authority
JP
Japan
Prior art keywords
search
url
feature quantity
feature amount
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008130058A
Other languages
English (en)
Inventor
Jun Sasaki
純 佐々木
Wakei Akinaga
和計 秋永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2008130058A priority Critical patent/JP2009277154A/ja
Publication of JP2009277154A publication Critical patent/JP2009277154A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索クエリとして入力される言葉が複数の意味を持ち、検索クエリを入力するユーザの多くが特定の意味に関する情報を入手しようとしている場合において、高い精度で検索結果を提示する。
【解決手段】検索サーバ110は、予め設定するキーワード毎の内容を表現する特徴量を格納するキーワード特徴量格納部111と、ユーザの入力した検索クエリの特徴量を生成する検索クエリ特徴量算出部113と、検索対象URLに対応するコンテンツに含まれるキーワードを基にURL特徴量を生成するURL特徴量算出部114と、検索クエリ特徴量算出手段が生成したユーザの入力した検索クエリの特徴量と、前記URL特徴量算出手段が生成した検索結果候補のURLの特徴量の類似度を基にユーザに提示する検索結果を生成する検索結果生成部117と、を備える。
【選択図】図1

Description

本発明は、検索クエリに対応する検索結果をユーザに提供する情報提供装置及び情報検索方法に関する。
現在インターネットには膨大な情報が蓄積されており、ユーザは検索などの手法で所望の情報を情報提供装置に要求することで、情報にアクセスしている。従来の検索エンジンなどの情報提供装置は、ユーザが入力する検索クエリと、格納している文書群のキーワード分布などの文書情報との関係を用いて、条件に合致する情報を提供するものが一般的であった。従来のキーワードによる検索手法としては特許文献1などがある。
特開2002−149683号公報
しかしながら、検索クエリと文書のキーワード分布により合致度を算出する従来の方法では、ユーザが意図していない意味で検索クエリのキーワードが使われている場合においても、その出現頻度が大きければ検索結果の上位としてランキングされてしまうという問題がある。
例えば、商品名やwebサイト名、TV番組名、ソフトウェア名、店舗名などの固有名詞の中には、一般的な名詞がつけられる場合があり、ユーザがこうした固有名詞に関する情報を入手したくて検索クエリとして入力した場合でも、従来の検索エンジンでは、同じ言葉が一般的な名詞の意味で使われているWebページであっても、検索結果として上位に表示されてしまい、検索ユーザの意図と異なる検索結果が提供されてしまうことがある。
このように、従来の検索手法では、検索クエリとして入力される言葉が複数の意味を持ち、検索クエリを入力するユーザの多くが特定の意味に関する情報を入手しようとしている場合において、高い精度で検索結果を提示する方法が課題となっている。
そこで本発明は、上記問題点を解決し、より多くのユーザにとって精度の高い検索結果を提供可能な情報検索装置及び情報検索方法を提供することを目的とする。
前記課題を解決するために、本発明の情報検索装置は、予め設定したキーワード毎の内容を表現する特徴量を格納したキーワード特徴量格納手段と、キーワード特徴量格納手段に格納された特徴量を参照し、ユーザの入力した検索クエリの特徴量を算出する検索クエリ特徴量算出手段と、キーワード特徴量格納手段に格納された特徴量を参照し、検索対象URLに対応するコンテンツに含まれるキーワードを基に、検索対象URLのURL特徴量を算出するURL特徴量算出手段と、検索クエリ特徴量算出手段により算出された検索クエリの特徴量と、URL特徴量算出手段により算出された検索対象URLのURL特徴量と、の類似度を基に、ユーザに提示する検索結果を生成する検索結果生成手段と、を備えることを特徴としている。
これにより、検索クエリの特徴量と適合度の高いURLを検索結果として提示することが可能となる。キーワードに対する特徴量は、そのキーワードに対して多くの人が連想する意味をトピックとして表現したものである。URLに対応するページに含まれるキーワードの適合度だけでなく、コンテンツの内容を表したトピックを要素とする特徴量を用いることで、検索クエリが複数の意味を持つような場合においても、より多くのユーザが意図している意味と関連度の高いURLを上位にランキングした、精度の高い検索結果が提示できるという効果がある。
また、本発明の情報検索装置は、検索クエリと、検索対象URLと、の適合度を示す一次検索適合スコアを取得する一次検索結果取得手段を更に備え、検索結果生成手段は、検索クエリ特徴量算出手段が生成した検索クエリの特徴量と、URL特徴量算出手段が生成した検索対象URLのURL特徴量と、の類似度を算出する特徴量類似度算出手段と、特徴量類似度算出手段が算出した類似度と、一次検索結果取得手段が取得した一次検索適合スコアと、を合成して二次検索適合スコアを算出するスコア再計算手段と、スコア再計算手段が算出した二次検索適合スコアに基づいて検索対象URLを順位付け、当該順位付けられたURLを、ユーザに提示する検索結果とする最終検索結果生成手段と、を含むことが好適である。これにより、例えば外部の検索エンジンなどが算出した一次検索適合スコアを適切に反映させて、URLの順位付けができるようになる。
前記課題を解決するために、本発明の情報検索方法は、情報を検索する情報検索装置により実行される、情報検索方法であって、予め設定したキーワード毎の内容を表現する特徴量を格納するキーワード特徴量格納ステップと、格納された特徴量を参照し、ユーザの入力した検索クエリの特徴量を算出する検索クエリ特徴量算出ステップと、格納された特徴量を参照し、検索対象URLに対応するコンテンツに含まれるキーワードを基に検索対象URLのURL特徴量を算出するURL特徴量算出ステップと、検索クエリ特徴量算出ステップにおいて算出された検索クエリの特徴量と、URL特徴量算出ステップにおいて算出された検索対象URLのURL特徴量と、の類似度を基に、ユーザに提示する検索結果を生成する検索結果生成ステップと、を備えることを特徴としている。
これにより、検索クエリの特徴量と適合度の高いURLを検索結果として提示することが可能となる。キーワードに対する特徴量は、そのキーワードに対して多くの人が連想する意味をトピックとして表現される。URLに対応するページに含まれるキーワードの適合度だけでなく、コンテンツの内容を表したトピックを要素とする特徴量を用いることで、検索クエリが複数の意味を持つような場合においても、より多くのユーザが意図している意味と関連度の高いURLを上位にランキングした、精度の高い検索結果が提示できるという効果がある。
本発明によれば、検索クエリに対応する検索結果をユーザに提供することが可能となる。
以下、図面と共に本発明に係る情報検索システム及び情報検索方法の好適な実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
図1に本実施形態に係る情報検索システムの構成を示す。情報検索システムは、クライアント携帯端末100に対して情報を提供するシステムである。クライアント携帯端末100へ提供される情報は、具体的にはクライアント携帯端末100から送信される検索クエリに対する検索結果の情報である。情報検索は、上記のようにクライアント携帯端末100からの要求に応じて行われる。図1に示すように情報検索システムは、クライアント携帯端末100への情報提供のための主要機能を有する情報検索サーバ110を含んで構成される。また、情報検索システムは、検索エンジン101を含んでいてもよい。情報検索サーバ110、及び検索エンジン101は、互いに接続されており、情報を送受信することができる。
クライアント携帯端末100は、ユーザにより用いられる端末装置であり、ネットワークNへのアクセス機能を有している。具体的には、ネットワークNは、例えば、移動体通信網であり、クライアント携帯端末100は、携帯電話機等の移動通信端末である。クライアント携帯端末100は、所定の方法でネットワークN上の情報にアクセスする。具体的には、クライアント携帯端末100は、URL(Uniform Resource Locator)を含むHTTP(Hyper Text Transfer Protocol)リクエストをネットワークNに送信することで、URLに対応するWebサーバにアクセスしてコンテンツ(情報)を受信する。
クライアント携帯端末100は、ネットワークNを介して情報検索システムを構成する各装置(情報検索サーバ110及び検索エンジン101)との間で情報の送受信を行うことができる。また、クライアント携帯端末100は、検索クエリを含む検索要求を情報検索システムに送信することによって、当該検索クエリに応じた検索結果の情報を受信する。クライアント携帯端末100は、受信した検索結果の情報を表示出力等して、ユーザへの情報の提示を行う。
検索エンジン101は、クライアント携帯端末100から検索クエリを含む検索要求を受信して、当該検索クエリを用いて検索を行う装置である。ここで検索クエリは、例えば、検索に用いられるキーワードに相当する。また、検索エンジン101による検索の対象は、通常の検索エンジンと同様に、例えば、インターネット上のWebサーバのコンテンツである。
検索エンジン101は、検索結果として、検索クエリ、検索クエリに適合したURLの一覧、及びその適合度合ScoreMの一覧を取得(算出)する。適合度合ScoreMは、検索クエリに対して、どの程度、Webページが適合しているかを示す指標値である。検索エンジン101は、取得した情報を情報検索サーバ110に送信する。なお、検索エンジン101における検索自体は、既存の方法に従って行われる。
引き続いて、情報検索システムにおける、クライアント携帯端末100への情報提供のための主要機能を有する情報検索サーバ110の機能について説明する。図1に示すように、情報検索サーバ110は、キーワード特徴量格納部111と、一次検索結果取得部112と、検索クエリ特徴量算出部113と、URL特徴量算出部114と、特徴量類似度算出部115と、スコア再計算部116と、最終検索結果生成部117と、を備えて構成される。
キーワード特徴量格納部111は、予め設定されるキーワード毎の特徴量を格納する。
ここに格納されるキーワード特徴量は、手動で作成する。あるいは、インターネット上のオンライン百科事典やポータルサイトのカテゴリ分類等、カテゴリ毎にコンテンツが分類されたデータを基に作成する。後者の場合は、まずカテゴリに対応するトピックを手動で設定する(例えば「野球」「サッカー」カテゴリであれば「スポーツ」トピックと対応付ける)。次に、各カテゴリのコンテンツ群に含まれるキーワードを抽出し、キーワード毎に「各カテゴリで登場する頻度分布」を算出する。次に、同一トピックと対応するカテゴリについて頻度分布を集約(加算)することで、キーワード毎に「各トピックで登場する頻度分布」を算出する。この頻度分布を正規化したものをキーワードの特徴量Kとする。キーワードの特徴量Kは図2に示すようにK={ki1,ki2,ki3,…,kin}のベクトル形式で格納される。ここで、ベクトルの各要素のkij(iはキーワードを識別する番号、jは1からnの整数)は、トピックjに対応する重みであり、nは設定したトピックの種類を表す。
ここで、重みの値については、必要に応じて、IDF(Inverse Document Frequency)等の手段で一定の変換処理を行ってもよい。具体的には、ユーザの各トピックに対する値に対して、下記の式(1)で表されるIDF値を乗じ、さらにベクトルの絶対値(各要素の二乗和の平方根)が1となるように正規化したものを特徴量とする。
IDF=log10(N/n)+1…(1)
ここで、Nは全体の文書数(オンライン百科事典の全ページ数など)、nはトピックiに対応する文書数を示す。対応する文書数が少ないトピックについてはIDF値が大きくなり、特異なトピックに対して大きい重み付けをした特徴量が生成できる。
一次検索結果取得部112は、検索エンジン101から送信される検索結果として、検索クエリ、検索クエリに適合したURLの一覧、及びその適合度合ScoreMの一覧を受信する手段である。一次検索結果取得部112は、取得した情報を、検索クエリの特徴量算出部113、及びURL特徴量算出部114に出力する。
検索クエリ特徴量算出部113は、ユーザが入力した検索クエリの特徴量を算出する。ユーザが入力した検索クエリが一次検索結果取得部112より入力されると、検索クエリに含まれるキーワードについて、キーワード特徴量格納部111を参照し、キーワードに対応する特徴量を取得する。キーワードが複数の場合は、それぞれのキーワードについて特徴量を取得し、特徴量ベクトルの要素毎に重みを加算し、得られたベクトルの絶対値が1となるように正規化したものを検索クエリ特徴量A ={a1,a2,a3,…,an}とする。
URL特徴量算出部114は、ユーザが入力した検索クエリに対応する一次検索結果のURLの特徴量を算出する。ユーザが入力した検索クエリに対応する一次検索結果のURLリストが一次検索結果取得部112より入力されると、各URLと対応するコンテンツ内のテキスト情報に含まれる全てのキーワードについて、キーワード特徴量格納部111を参照し、キーワードに対応する特徴量を取得する。URL毎に含まれるキーワードに対応する特徴量ベクトルの要素毎に、重みとキーワードの出現頻度の積を加算し、得られたベクトルの絶対値が1となるように正規化したものをURL特徴量B ={b1,b2,b3,…,bn}とする。
特徴量類似度算出部115は、検索クエリ特徴量算出部113、及びURL特徴量算出部114で生成される検索クエリ特徴量、及びURL特徴量について類似度を計算する手段である。特徴量の類似度は、例えば、検索クエリ特徴量A ={a1,a2,a3,…,an}とURL特徴量B ={b1,b2,b3,…,bn}のコサイン距離cosθにより算出する。cosθは両ベクトルの内積(A・B)を両ベクトルの絶対値の積(|A|・|B|)で割った値であり、次の式(2)で算出される。
Figure 2009277154

ここで、両ベクトルの絶対値は、予め1となるように正規化されているので、分母の値は1となり、計算は省略できる。
cosθは0〜1の値をとり、両ベクトルの特徴量が類似していれば1に近くなり、特徴量が乖離していれば0に近くなる。cosθは、検索結果として取得した全てのURLに対して計算する。特徴量類似度算出部115は、検索クエリ、各URLのScoreM、及びcosθをスコア再計算部116に出力する。
スコア再計算部116は、特徴量類似度算出部115から入力される、検索結果URLに対して、特徴量類似度を考慮したScoreLを計算する手段である。ScoreLは検索クエリとURLの適合度ScoreMと、検索クエリとURLの特徴量類似度であるcosθを合成することで算出する。スコア再計算部116は、ScoreLを、例えば予めスコア再計算部116に記憶された以下の式(3)により算出する。
ScoreL=(1−α)*ScoreM+α*cosθ…(3)
ここで、αは(0<α<1)を満たす値であり、検索クエリとURLの特徴量の類似度を検索結果に反映させたい度合いに応じて予め設定されて、スコア再計算部116に記憶されている。なお、検索エンジン101からの出力に、ScoreMが含まれない場合は、cosθをScoreLとしてもよい。スコア再計算部116は、各URLを示す情報と、URLに対応するScoreLとを最終検索結果生成部117に出力する。
最終検索結果生成部117は、スコア再計算部116から入力された情報を基にクライアント携帯端末100に送信する情報を生成して送信する検索結果提供手段の一機能である。最終検索結果生成部117は、入力されたURLを、ScoreLの値が大きいものからソートして、最終検索結果として生成して、クライアント携帯端末100に送信して、ユーザに提示する。以上が、本実施形態に係る情報検索サーバ110の機能構成である。
引き続いて、図3のフローチャートを用いて、本実施形態に係る情報検索システムにより実行される処理(情報検索方法)について説明する。
情報検索システムでは、まず、予め設定されるキーワード毎の特徴量をキーワード特徴量格納部111に格納する(S11)。
続いて、クライアント携帯端末100から検索クエリを含む検索要求が検索エンジン101に送信(S12)されると以降の処理が行われる。検索エンジン101によって当該検索要求に係る検索が行われて、検索クエリ、及び検索結果を示す情報が検索エンジン101から情報検索サーバ110に送信される。情報検索サーバ110では、一次検索結果取得部112により検索クエリ、及び検索結果を示す情報が受信されて取得される(S13)。
続いて、特徴量類似度算出部115により、検索結果に含まれるURL毎に、検索クエリとの特徴量類似度が算出される(S14)。特徴量類似度は、検索クエリ特徴量算出部113、及びURL特徴量算出部114から、検索クエリ特徴量、及びURL特徴量を取得し、上述した方法によりコサイン距離cosθを算出することで計算される。
続いて、スコア再計算部116によって、特徴量の類似度を考慮したURL検索スコアScoreLが計算される(S15)。ScoreLは一次検索結果のスコアであるScoreMと、属性分布類似度cosθを用いて上述した方法で計算される。
続いて、最終検索結果生成部117によって、ScoreLの大きい順に検索結果のURLがソートされた、最終検索結果を示す情報が生成され、ネットワークNを介して、クライアント携帯端末100に送信される(S16)。
クライアント携帯端末100では、最終検索結果を示す情報が受信されて、表示等の出力がなされる。以上が、本実施形態に係る情報検索システムにより実行される処理である。
上述した本実施形態に係る情報検索システムでは、ユーザの各アクセス先であるWebページURLの特徴量、及び検索クエリの特徴量が抽出され、両者の特徴量の類似度が生成される。この類似度に基づいて検索結果のURLのスコアが算出され、このスコアに基づいてURLが並び替えられてユーザに検索結果として提供される。
上記のように本実施形態に係る情報検索システムでは、検索クエリとWebページの一致度合いだけでなく、検索クエリ、及びWebページの特徴量の類似度にも基づいて、ユーザに検索結果情報が提供される。キーワードが複数の意味を持つ場合でも、多くのユーザが連想する意味に関係するトピックの重みが大きくなるように特徴量が設定されていれば、内容がそのトピックとの関連性が大きいURLを検索結果の上位に提示することが可能となる。
上述した実施形態では、提供される情報であるURLを並べ替えてユーザに提供していたが、例えば、並べ替えでなく、スコアが高い情報のみをユーザに提供する等のユーザに提供される情報を判断することとしてもよい。
また、上述した実施形態では、ユーザが検索を行う度にURL特徴量を生成したが、予め検索対象となるURL群に対して特徴量を算出し、情報検索サーバ110内に記憶しておくこととしても良い。この場合、URLが示すコンテンツの更新に対応するため、一定期間、あるいはコンテンツの更新が検出される度にURL特徴量を再計算し、更新する。
この構成によれば、検索の度にURLに含まれるキーワードの抽出や、特徴量計算を行う必要がなくなるため、少ない計算量で情報検索を行うことが可能となる。
本発明の実施形態に係る情報検索システムの構成を示す図である。 情報検索システムにおいて取得されて用いられる、キーワード毎の特徴量を示すキーワード特徴量情報を示す図である。 本発明の実施形態に係る情報検索システムで実行される処理(情報検索方法)を示すフローチャートである。
符号の説明
100…クライアント携帯端末、101…検索エンジン、110…情報検索サーバ、111…キーワード特徴量格納部、112…一次検索結果取得部、113…検索クエリ特徴量算出部、114…URL特徴量算出部、115…特徴量類似度算出部、116…スコア再計算部、117…最終検索結果生成部。

Claims (3)

  1. 予め設定したキーワード毎の内容を表現する特徴量を格納したキーワード特徴量格納手段と、
    前記キーワード特徴量格納手段に格納された特徴量を参照し、ユーザの入力した検索クエリの特徴量を算出する検索クエリ特徴量算出手段と、
    前記キーワード特徴量格納手段に格納された特徴量を参照し、検索対象URLに対応するコンテンツに含まれるキーワードを基に、前記検索対象URLのURL特徴量を算出するURL特徴量算出手段と、
    前記検索クエリ特徴量算出手段により算出された前記検索クエリの特徴量と、前記URL特徴量算出手段により算出された前記検索対象URLのURL特徴量と、の類似度を基に、ユーザに提示する検索結果を生成する検索結果生成手段と、
    を備えることを特徴とする情報検索装置。
  2. 前記情報検索装置は、
    前記検索クエリと、前記検索対象URLと、の適合度を示す一次検索適合スコアを取得する一次検索結果取得手段を更に備え、
    前記検索結果生成手段は、
    前記検索クエリ特徴量算出手段が生成した前記検索クエリの特徴量と、前記URL特徴量算出手段が生成した前記検索対象URLのURL特徴量と、の類似度を算出する特徴量類似度算出手段と、
    前記特徴量類似度算出手段が算出した前記類似度と、前記一次検索結果取得手段が取得した一次検索適合スコアと、を合成して二次検索適合スコアを算出するスコア再計算手段と、
    前記スコア再計算手段が算出した二次検索適合スコアに基づいて前記検索対象URLを順位付け、当該順位付けられたURLを、前記ユーザに提示する検索結果とする最終検索結果生成手段と、
    を含むことを特徴とする、請求項1に記載の情報検索装置。
  3. 情報を検索する情報検索装置により実行される情報検索方法であって、
    予め設定したキーワード毎の内容を表現する特徴量を格納するキーワード特徴量格納ステップと、
    前記格納された特徴量を参照し、ユーザの入力した検索クエリの特徴量を算出する検索クエリ特徴量算出ステップと、
    前記格納された特徴量を参照し、検索対象URLに対応するコンテンツに含まれるキーワードを基に、前記検索対象URLのURL特徴量を算出するURL特徴量算出ステップと、
    前記検索クエリ特徴量算出ステップにおいて算出された前記検索クエリの特徴量と、前記URL特徴量算出ステップにおいて算出された前記検索対象URLのURL特徴量と、の類似度を基に、ユーザに提示する検索結果を生成する検索結果生成ステップと、
    を備えることを特徴とする情報検索方法。
JP2008130058A 2008-05-16 2008-05-16 情報検索装置及び情報検索方法 Pending JP2009277154A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008130058A JP2009277154A (ja) 2008-05-16 2008-05-16 情報検索装置及び情報検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008130058A JP2009277154A (ja) 2008-05-16 2008-05-16 情報検索装置及び情報検索方法

Publications (1)

Publication Number Publication Date
JP2009277154A true JP2009277154A (ja) 2009-11-26

Family

ID=41442497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008130058A Pending JP2009277154A (ja) 2008-05-16 2008-05-16 情報検索装置及び情報検索方法

Country Status (1)

Country Link
JP (1) JP2009277154A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017146926A (ja) * 2016-02-19 2017-08-24 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP2020009078A (ja) * 2018-07-05 2020-01-16 株式会社日立製作所 データ処理システム、及び、データ処理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000200285A (ja) * 1999-01-06 2000-07-18 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法、情報検索装置及び情報検索プログラムを記録した記録媒体
JP2001092831A (ja) * 1999-09-21 2001-04-06 Toshiba Corp 文書検索装置及び文書検索方法
JP2002318813A (ja) * 2001-02-15 2002-10-31 Canon Inc 情報検索装置、その制御方法、及び制御プログラムを提供する媒体
JP2006227914A (ja) * 2005-02-17 2006-08-31 Canon Inc 情報検索装置、情報検索方法、プログラム、記憶媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000200285A (ja) * 1999-01-06 2000-07-18 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法、情報検索装置及び情報検索プログラムを記録した記録媒体
JP2001092831A (ja) * 1999-09-21 2001-04-06 Toshiba Corp 文書検索装置及び文書検索方法
JP2002318813A (ja) * 2001-02-15 2002-10-31 Canon Inc 情報検索装置、その制御方法、及び制御プログラムを提供する媒体
JP2006227914A (ja) * 2005-02-17 2006-08-31 Canon Inc 情報検索装置、情報検索方法、プログラム、記憶媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017146926A (ja) * 2016-02-19 2017-08-24 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP2020009078A (ja) * 2018-07-05 2020-01-16 株式会社日立製作所 データ処理システム、及び、データ処理方法
JP7068079B2 (ja) 2018-07-05 2022-05-16 株式会社日立製作所 データ処理システム、及び、データ処理方法

Similar Documents

Publication Publication Date Title
KR101721338B1 (ko) 검색 엔진 및 그의 구현 방법
US9177018B2 (en) Cross language search options
KR101994987B1 (ko) 관련 엔티티들
US9411890B2 (en) Graph-based search queries using web content metadata
US8577915B2 (en) Method of and system for conducting personalized federated search and presentation of results therefrom
US9336318B2 (en) Rich content for query answers
US20170270159A1 (en) Determining query results in response to natural language queries
US8332426B2 (en) Indentifying referring expressions for concepts
US8832096B1 (en) Query-dependent image similarity
US20150161173A1 (en) Similar search queries and images
JP5444115B2 (ja) データ検索装置、データ検索方法及びプログラム
US10445367B2 (en) Search engine for textual content and non-textual content
JP2007188352A (ja) ページリランキング装置、ページリランキングプログラム
US9424353B2 (en) Related entities
US8375042B1 (en) Index-side synonym generation
KR101446154B1 (ko) 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법
JP5290041B2 (ja) 情報検索装置及び情報検索方法
US9152698B1 (en) Substitute term identification based on over-represented terms identification
US20160307000A1 (en) Index-side diacritical canonicalization
JP2012003357A (ja) 特徴情報作成装置、方法及びプログラム
JP2009277154A (ja) 情報検索装置及び情報検索方法
KR101308821B1 (ko) 검색엔진용 키워드 추출 시스템 및 추출 방법
US9116996B1 (en) Reverse question answering
JP2010282403A (ja) 文書検索方法
JP6985181B2 (ja) 情報処理装置、情報処理方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120821

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120928

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121204