JP2011209999A - 情報処理装置、データ抽出方法及びプログラム - Google Patents

情報処理装置、データ抽出方法及びプログラム Download PDF

Info

Publication number
JP2011209999A
JP2011209999A JP2010076943A JP2010076943A JP2011209999A JP 2011209999 A JP2011209999 A JP 2011209999A JP 2010076943 A JP2010076943 A JP 2010076943A JP 2010076943 A JP2010076943 A JP 2010076943A JP 2011209999 A JP2011209999 A JP 2011209999A
Authority
JP
Japan
Prior art keywords
query
similar
search
unit
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010076943A
Other languages
English (en)
Other versions
JP5165719B2 (ja
Inventor
Kazuya Kudo
和也 工藤
Miki Yoshitake
美貴 吉武
Kengo Ebihara
健吾 海老原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2010076943A priority Critical patent/JP5165719B2/ja
Publication of JP2011209999A publication Critical patent/JP2011209999A/ja
Application granted granted Critical
Publication of JP5165719B2 publication Critical patent/JP5165719B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】辞書の管理負荷を増大することなく類義語を抽出すること。
【解決手段】情報処理装置100が、クエリと、クエリに対する検索一覧と、検索一覧に含まれるサイトに対する個々の選択の履歴情報とを含むログを記憶するログ記憶部105と、ログ記憶部105に記憶された検索一覧に含まれる各サイトの個々の選択の回数の分布に基づいて、ログ記憶部105に記憶されたクエリ同士の類似度を算出する算出部111と、算出部111の算出結果に基づいて、クエリ同士を類似クエリとして抽出する類似クエリ抽出部115とを備える。
【選択図】図2

Description

本発明は、情報を検索する情報処理装置に関する。
従来、インターネット上でユーザの検索結果を表示する情報処理装置では、ユーザが入力したクエリ(キーワードやターム等)に基づいた検索結果を表示することで、ユーザの入力意図を反映した検索結果を表示する方法が用いられている。
例えば、単語同士の関連性によって単語を分類したシソーラス辞書を記憶し、シソーラス辞書から入力クエリに関連する類義語を抽出し、類義語に基づいて、検索を行う情報処理装置が知られている(例えば、特許文献1)。すなわち、情報処理装置によれば、類義語に基づいて、検索することにより、ユーザが検索を行う際の利便性を向上できる。
特開2008−192110号公報
しかしながら、上述した従来の情報処理装置には、次のような問題があった。すなわち、上述した情報処理装置は、シソーラス辞書を記憶する際、各単語同士の関連性によって、単語を分類し、体系化する必要が生じる。すなわち、類義語を取得するために要するシソーラス辞書の記憶設定が煩雑であり、設定に掛かる負荷が大きいという問題がある。
また、上述した情報処理装置では、ユーザによるクエリの入力が、正しいことが前提となっている。すなわち、ユーザの表記のゆれや、入力ミス等を伴うクエリでは、類義語を抽出できず、これらを網羅した辞書を作成することも非常に煩雑であるという問題がある。
そこで、本発明は、このような状況に鑑みてなされたものであり、辞書の管理負荷を増大することなく類義語を抽出することを目的とする。
上述した問題を解決するため、本発明は、次のような特徴を有している。まず、本発明の第1の特徴は、情報処理装置(情報処理装置100)が、クエリ(クエリ151)と、前記クエリに対する検索一覧(検索一覧160)と、前記検索一覧に含まれるサイトに対する個々の選択の履歴情報(履歴情報170)とを含むログ(ログDB106)を記憶する記憶手段(ログ記憶部105)と、前記記憶手段に記憶された検索一覧に含まれる各サイトの個々の選択の回数の分布に基づいて、前記記憶手段に記憶されたクエリ同士の類似度を算出する算出手段(算出部111)と、前記算出手段の算出結果に基づいて、前記クエリ同士を類似クエリとして抽出する類似クエリ抽出手段(類似クエリ抽出部115)と、を備えることを要旨とする。
このような情報処理装置は、記憶手段と、算出手段と、類似クエリ抽出手段とを備える。記憶手段は、クエリと、検索一覧と、検索一覧に含まれるサイトに対する個々の選択の履歴情報とを含むログを記憶する。このため、記憶手段は、事前に単語を記憶する必要がなく、ユーザの利用に伴って、記憶されるクエリ、検索一覧、履歴情報が更新される。すなわち、記憶手段によれば、管理するための負荷を増大することなく、ユーザの行動データであるログを更新できる。
また、類似クエリ抽出手段は、算出手段の算出結果に基づいて、クエリに対して、類似度の高いクエリを抽出する。すなわち、類似クエリ抽出手段によれば、ユーザの行動データであるログから、類似クエリを抽出できるため、ユーザの入力意図を反映した類似語を抽出できる。
また、検索一覧に対するユーザの選択の履歴の一致具合に基づいて類似クエリを抽出するため、ユーザの検索意図が近いクエリを類似クエリとして抽出できる。すなわち、ユーザの表記のゆれや入力ミス等を伴うクエリであっても類似クエリとして抽出できる。
従って、情報処理装置によれば、辞書の管理負荷を増大することなく類義語を抽出できる。
本発明の第2の特徴は、本発明の第1の特徴に係り、前記類似クエリとして抽出されたクエリ同士を対応させて記憶する類似クエリ記憶手段(類似クエリ記憶部117)と、ユーザに入力されたクエリに対応付けられる類似クエリを前記類似クエリ記憶部から取得し、類似クエリに基づいた検索をする検索手段(検索処理部123)とを更に備えることを要旨とする。
本発明の第3の特徴は、本発明の第1又は第2の特徴に係り、前記検索一覧に含まれるサイトに対する個々の選択の回数に基づいて、前記サイトを選択する検索結果を得るために最も多く入力されるクエリを主要クエリ(主要クエリ157a)として判定する主要クエリ判定手段(主要クエリ判定部109)を更に備え、前記算出手段は、前記主要クエリと判定されたクエリ同士間の類似度を算出することを要旨とする。
本発明の第4の特徴は、本発明の第1乃至第3の特徴に係り、ユーザに入力されたクエリの類似クエリに基づいて、前記類似クエリに関連する関連単語(関連単語167)を前記記憶手段から抽出する関連単語抽出手段(関連単語抽出部119)と、前記類似クエリと、前記関連単語とを対応させて記憶する関連単語記憶手段(関連単語記憶部121)とを更に備えることを更に備えることを要旨とする。
本発明の第5の特徴は、本発明の第1乃至第4の特徴に係り、複数の単語を含むクエリであって、前記記憶手段に記憶された他の類似クエリを含む絞込みクエリ(絞込みクエリ159)を前記類似クエリから除去する絞込みクエリ除去手段(絞込みクエリ除去部113)を更に備えることを要旨とする。
本発明の第6の特徴は、データ抽出方法が、クエリと、前記クエリに対する検索一覧と、前記検索一覧に含まれるサイトに対する個々の選択の履歴情報とを含むクリックログを所定の記憶手段に記憶するステップ(ステップS201)と、前記検索一覧に含まれる各サイトの個々の選択の回数の分布に基づいて、前記記憶手段に記憶されたクエリ同士の類似度を算出するステップ(ステップS209)と、前記類似度の算出結果に基づいて、前記クエリ同士を類似クエリとして抽出するステップ(ステップS215)と、をコンピュータが実行することを要旨とする。
本発明の第7の特徴は、本発明の第6の特徴に係るデータ抽出方法を前記情報処理装置に実行させるためのプログラムであることを要旨とする。
本発明によれば、辞書の管理負荷を増大することなく類義語を抽出できる。
本発明の実施形態に係る情報処理システム1の全体概略構成図である。 本発明の実施形態に係る情報処理装置100の機能ブロック図である。 本発明の実施形態に係る情報処理装置100に記憶される情報の一例を示す図である。 本発明の実施形態に係る情報処理装置100で処理される情報の一例を示す図である。 本発明の実施形態に係る情報処理装置100の動作を説明するための概念図である。 本発明の実施形態に係る情報処理装置100の動作を説明するための概念図である。 本発明の実施形態に係る情報処理装置100で処理される情報の一例を示す図である。 本発明の実施形態に係る情報処理装置100で処理される情報の一例を示す図である。 本発明の実施形態に係る情報処理装置100によって作成される検索ページ300の模式図である。 本発明の実施形態に係る情報処理装置100の検索処理動作の詳細を示すフローチャートである。 本発明の実施形態に係る情報処理装置100の類似クエリの抽出処理動作の詳細を示すフローチャートである。 本発明のその他の実施形態に係る情報処理装置100の動作を説明するための概念図である。
次に、図面を参照して、本発明の実施形態について説明する。
なお、以下の図面の記載において、同一または類似の部分には、同一または類似の符号を付している。また、図面は模式的なものであり、各寸法の比率などは現実のものとは異なる。
したがって、具体的な寸法などは以下の説明を参酌して判断すればよく、図面相互間においても互いの寸法の関係や比率が異なる部分が含まれている。
以下の実施形態においては、(1)情報処理システム1の全体構成、(2)情報処理装置100の詳細構成、(3)情報処理システム1の動作、(4)作用・効果、及び(5)その他の実施形態について説明する。
(1)情報処理システム1の全体構成
図1は、本実施形態に係る情報処理システム1の全体概略構成図である。
図1に示す情報処理システム1は、ユーザ端末10、ユーザ端末30、情報処理装置100を含む。本実施形態では、ユーザ端末10、ユーザ端末30、情報処理装置100が、通信ネットワーク50(インターネットなど)を介して接続され、互いにデータ通信可能となっている。情報処理システム1は、ユーザ端末10、ユーザ端末30と、情報処理装置100との間で、クエリ151や、検索ページ300の受け渡しを行う。
情報処理装置100は、ユーザ端末10でユーザに入力されたクエリ151に基づいて、検索ページ300を作成し、ユーザ端末10に送信する。以下の実施形態では、「六本木温泉リゾート」という著名な施設、それに関連するサイトが存在する場合を例示して、具体例を記載する。
ユーザ端末10及びユーザ端末30は、通信ネットワーク50を介して、情報処理装置100から検索ページ300を取得する装置である。ユーザ端末10及びユーザ端末30は、ユーザが使用するPC(Personal Computer)や携帯通信端末装置(携帯電話機やスマートフォン)、カーナビゲーションシステム等であり、無線LANや、近傍無線通信(Bluetooth(登録商標)や赤外線通信等)或いは有線通信(USB(Universal Serial Bus)ケーブル接続等)によって、通信ネットワーク50を介して情報処理装置100に接続されている。ユーザ端末10及びユーザ端末30は、情報処理装置100が有するハードウェア資源に加えて、キーボタンやタッチパネル等の入力装置、液晶ディスプレイ等の出力装置、一般的なブラウザを備える。ブラウザは、インターネットの標準プロトコルであるHTTP(Hyper Text Transfer Protocol)等に従い、HTML(Hyper Text Markup Language)等の言語で記述されたページデータの要求、取得及び表示、フォームデータの送信等を行う機能を有している。
本実施形態では、ユーザ端末10が、携帯通信端末装置であり、ユーザ端末30が、いわゆるPCである点を除き、ユーザ端末10及びユーザ端末30は、同様の機能を有しており、以下の記載においては、主にユーザ端末10について、記載する。従って、ユーザ端末30についての詳細の記載は、適宜省略する。
(2)情報処理装置100の詳細構成
図2は、本実施形態に係る情報処理装置100の機能ブロック図である。
情報処理装置100は、CPU等の制御装置、メモリやHDD等の記憶装置、通信ネットワーク50と通信する通信I/F等の通信装置といったハードウェア資源を有するコンピュータ(単一或いは複数)により構成される。情報処理装置100が備える下記の各ブロックは、前述したコンピュータの制御装置等のハードウェア資源を用いてコンピュータプログラムを実行することによって実現されるものである。なお、これらの各ブロック、手段は、単一のコンピュータ上に配置される必要はなく、必要に応じて分散される構成を採用しても良い。
情報処理装置100は、クエリ受信部101、候補サイト抽出部103、ログ記憶部105、候補クエリ抽出部107、主要クエリ判定部109、算出部111、絞込みクエリ除去部113、類似クエリ抽出部115、類似クエリ記憶部117、関連単語抽出部119、関連単語記憶部121、検索処理部123、検索結果ページ作成部125、ページ送信部127を備える。これらの機能部は、いわゆるコンピュータにより構成され、演算/制御装置としてのCPU(Central Processing Unit)、記憶媒体としてのRAM(Random Access Memory)及びROM(Read Only Memory)、通信インターフェイス等が関連することで実現される。以下、各機能部について、説明する。
(2.1)クエリ受信部101
クエリ受信部101は、ユーザ端末10から通信ネットワーク50を介して、クエリを受信する。
(2.2)候補サイト抽出部103
候補サイト抽出部103は、クエリ受信部101で受信したクエリ151に基づいて、検索を行い、サイトURL161からなる検索一覧160を抽出する。
(2.3)ログ記憶部105
図3は、情報処理装置100のログ記憶部105に記憶される情報の一例を示す図である。
図3に示すように、ログ記憶部105は、クエリ151と、クエリ151に対する検索一覧160と、検索一覧160に含まれるサイトURL161に対する個々の選択の履歴情報170とを含むログDB106を記憶する。クエリ151は、ユーザにより任意に入力された文字列であり、特に限定されない。例えば、クエリ151は、固有名詞、略称などにより構成される。クエリ151は、複数の文字列の組み合わせであってもよい。検索一覧160は、クエリ151に対応するキーワードを含むウェブページのサイトURL161により構成される。履歴情報170は、サイトURL161に対するユーザの選択率や、頻度を示す。
例えば、ログ記憶部105は、クエリ151として、「六本木温泉」が入力された場合、対象クエリ153としての「六本木温泉」と、対象クエリ153に対する検索一覧160と、履歴情報170とを記憶する。検索一覧160を構成するサイトURL161のそれぞれを候補サイトURL163a、候補サイトURL163b、・・・、候補サイトURL163nとする。
履歴情報170は、サイトURL161に対するユーザの選択率や、頻度を示すパラメータの少なくとも何れかを含んでいればよく、例えば、選択回数171、総クリック数173、CTR(ユーザの選択率)や、頻度を示すスコア等により示される。
選択回数171は、対象クエリ153による検索等の結果において、サイトURL161がユーザにより選択された回数を示す。総クリック数173は、対象のサイトURL161の全選択回数を示す。具体的には、総クリック数173は、全てのクエリに対する検索結果で表示されたサイトURL161が、ユーザにより選択された回数を示す。
(2.4)候補クエリ抽出部107
図4は、情報処理装置100の候補クエリ抽出部107で処理される情報の一例を示す図である。
候補クエリ抽出部107は、検索一覧160に含まれるサイトURL161をユーザが選択する場合に用いたクエリ151である候補クエリ155をログ記憶部105から抽出する。具体的には、候補クエリ抽出部107は、検索一覧160に含まれるサイトURL161と、候補クエリ155と、候補クエリ155に対する個々の選択の履歴情報170とを含む情報をログ記憶部105から抽出し、図4に示すような候補クエリDB108を作成する。サイトURL161に対応する候補クエリ155のそれぞれを候補クエリ155a、候補クエリ155b、・・・、候補クエリ155nとする。
例えば、候補クエリ抽出部107は、候補サイトURL163aをユーザが検索結果の中から選択する場合に、その検索結果を得るために入力された候補クエリ155として、「六本木温泉リゾート」、「六本木温泉ランド」、「六本木温泉」等をログ記憶部105のログDB106から抽出する。同様にして、候補クエリ抽出部107は、候補サイトURL163b、・・・、候補サイトURL163nをユーザが選択する場合に用いた候補クエリ155をログ記憶部105のログDB106から抽出する。
(2.5)主要クエリ判定部109
主要クエリ判定部109は、ログ記憶部105から検索一覧160に含まれるサイトURL161に対する個々の選択の回数に基づいて、サイトURL161を選択する検索結果を得るために最も多く入力されるクエリを主要クエリ157aとして判定する。
例えば、図4に示すように、主要クエリ判定部109は、ログ記憶部105から検索一覧160に含まれる候補サイトURL163a、候補サイトURL163b、・・・、候補サイトURL163nにおいて、候補サイトURL163aを選択する検索結果を得るために最も多く入力されるクエリを総クリック数173に基づいて、候補クエリ155aである「六本木温泉リゾート」を主要クエリ157aとして判定する。
また、主要クエリ判定部109は、候補クエリ抽出部107により抽出された複数の候補クエリ155において、サイトURL161を基準とせず、各候補クエリ155の中で最も多く入力されるクエリを主要クエリ157aとして判定してもよい。
例えば、図3に示すように、主要クエリ判定部109は、候補クエリ抽出部107により抽出された候補クエリ155において、サイトURL161を基準とせず、各候補クエリ155の中で最も多く入力されるクエリである「六本木温泉リゾート」を総クリック数173に基づいて、主要クエリ157aとして判定できる。
(2.6)算出部111
図5は、本発明の実施形態に係る情報処理装置100の算出部111による類似度の算出動作を説明するための概念図である。算出部111は、検索結果の一覧に含まれる各サイトに対するユーザの選択の分布の類似度をクエリ間で算出する機能部である。類似度の算出方法としては、そのクエリ毎の検索結果へのユーザの選択を特徴ベクトルによって表現し、その特徴ベクトル間の距離を算出することで求められる。
具体的には、クエリに対する検索結果に含まれる各々のサイトへの選択回数を成分として特徴ベクトルを表現する。即ち、各クエリの検索結果に対する選択の分布を、サイト数に対応した多次元のベクトル空間でマッピングすることができる。図5は、選択の分布を特徴ベクトルにて表現した場合の概念図である。
図5に示すように、多次元ベクトル空間51は、候補サイトURL163a、候補サイトURL163b、・・・、候補サイトURL163nへの選択回数を軸として表される。ベクトル153v、155av、155bv、・・・、155nvは、それぞれ対象クエリ153、候補クエリ155a、候補クエリ155b、・・・、候補クエリ155nに基づく選択の分布に対応した特徴ベクトルである。
具体的には、各ベクトルの成分は、各クエリ151の検索一覧160に含まれるサイトURL161である。また、各ベクトルの成分の数値は、サイトURL161の選択回数である。すなわち、ベクトル153v、155av、155bv、・・・、155nvは、選択されるサイトURL161と、サイトURL161の選択回数とに基づいて、大きさ、向きがきまる。
図6は、本発明の実施形態に係る情報処理装置100の算出部111による類似度の算出動作を説明するための概念図である。具体的には、図6は、ベクトル153v、155avのクエリ同士の類似度を算出するための概念図である。
図5に示すように、算出部111は、ログ記憶部105に記憶された検索一覧160に含まれる各サイトURL161の個々の選択の回数に基づいて、ログ記憶部105に記憶されたクエリ同士の類似度を算出する。算出部111は、主要クエリと判定されたクエリ同士間の類似度を算出する。また、算出部111は、対象クエリ153及び候補クエリ155の類似度を算出する。
具体的には、算出部111は、ユーザにより入力された入力クエリである対象クエリ153及び候補クエリ155(候補クエリ155a、候補クエリ155b、・・・候補クエリ155n)の類似度を算出する。
例えば、図5は、対象クエリ153である「六本木温泉」に対して、候補クエリ155aである「六本木温泉リゾート」、候補クエリ155bである「六本木温泉ランド」、「温泉リゾート」の順に類似度が高いことを示している。
例えば、図6に示すように、算出部111は、対象クエリ153及び候補クエリ155aの類似度を、ベクトル153vと、ベクトル155avとのコサイン距離により算出する。
また、算出部111は、ある条件を満たした候補クエリ155の重みを変更して、類似度を算出してもよい。例えば、算出部111は、候補クエリ155に主要クエリ157aが含まれる場合、主要クエリ157aをユーザが入力する回数(検索回数)に基づいた重みを主要クエリ157aの類似度に加えることとしてもよい。すなわち、算出部111は、主要クエリ157aの重みを類似度に加えることにより、検索回数の多い主要クエリ157aの類似度を高くすることができる。
また、算出部111は、対象クエリ153の文字列と、候補クエリ155の文字列との類似性を文字の一致度等により算出し、文字列が類似する候補クエリ155の重みを類似度に加えてもよい。また、算出部111は、対象クエリ153の属性(例えば、言葉が属する分野であり「植物」や「地名」等)と、候補クエリ155の属性との関連度を算出し、関連度が高い候補クエリ155の重みを類似度に加えてもよい。
(2.7)絞込みクエリ除去部113
図7は、情報処理装置100の絞込みクエリ除去部113で処理される情報の一例を示す図である。具体的には、図7は、算出部111による類似度の算出結果を示し、対象クエリ153に対して、類似度の高い順にソートされた候補クエリ155を示している。
絞込みクエリ除去部113は、複数の単語を含むクエリ151であって、類似クエリ記憶部117に記憶された他の類似クエリ165を含む絞込みクエリ159を類似クエリ165の候補から除去する。絞込みクエリ除去部113は、複数の単語を含むクエリ151であって、類似クエリ記憶部117に記憶された他の候補クエリ155を含む絞込みクエリ159としてもよい。この場合、絞込みクエリ除去部113は、他の候補クエリ155を含む絞込みクエリ159を類似クエリ165の候補から除去する。
具体的には、図7に示すように、絞込みクエリ除去部113は、算出部111による算出結果に記載される候補クエリ155について、複数の単語を含むクエリ151であって、算出結果に記載された他の候補クエリ155を含む絞込みクエリ159を類似クエリの候補から除去する。例えば、絞込みクエリ除去部113は、絞込みクエリ159として、「六本木温泉リゾート 混雑予想」、「六本木温泉リゾート 料金」、「六本木温泉 混雑予想」、「六本木温泉リゾート ガイド」を類似クエリ165の候補から除去する。
なお、絞込みクエリ除去部113は、算出部111により類似度を算出する前に、算出をする候補から絞込みクエリ159を除去してもよい。また、類似クエリ抽出部115により類似クエリ165として抽出された後に、絞込みクエリ159を除去してもよい。
(2.8)類似クエリ抽出部115
図8は、実施形態に係る情報処理装置100の算出部111の算出結果、及び、絞込みクエリ除去部113の絞込み結果に基づいて、対象クエリ153に対する候補クエリ155の類似度を示す表である。
図8では、対象クエリ153である「六本木温泉」に対して、候補クエリ155aである「六本木温泉リゾート」、候補クエリ155bである、「六本木温泉ランド」「温泉リゾート」の順に高い類似度が高いことを示している。
類似クエリ抽出部115は、算出部111の算出結果に基づいて、クエリ同士を類似クエリ165として抽出する。具体的には、類似クエリ抽出部115は、所定値以上の類似度を有する候補クエリ155を、対象クエリ153の類似クエリ165として抽出する。
例えば、図8に示すように、類似クエリ抽出部115は、0.98以上の類似度を示す「六本木温泉リゾート」を、対象クエリ153である「六本木温泉」の類似クエリ165として抽出する。
(2.9)類似クエリ記憶部117
類似クエリ記憶部117は、類似クエリ抽出部115により類似クエリ165として抽出されたクエリ同士を対応させて記憶する。具体的には、類似クエリ記憶部117は、対象クエリ153と、類似クエリ抽出部115により類似度が所定値以上の候補クエリ155である類似クエリ165とを対応させて記憶する。
例えば、類似クエリ記憶部117は、対象クエリ153である「六本木温泉」と、候補クエリ155aである「六本木温泉リゾート」とを対応させて記憶する。
(2.10)関連単語抽出部119
関連単語抽出部119は、ユーザに入力されたクエリ151の類似クエリ165に基づいて、類似クエリ165に関連する関連単語167をログ記憶部105から抽出する。具体的には、図7に示すように、算出部111による算出結果に記載される絞込みクエリ159において、関連単語抽出部119は、類似クエリ165以外の単語を関連単語167として抽出する。
例えば、関連単語抽出部119は、絞込みクエリ159において、「六本木温泉リゾート」以外の単語である、「混雑予想」、「料金」、「ガイド」を関連単語167として抽出する。
(2.11)関連単語記憶部121
関連単語記憶部121は、類似クエリ165と、関連単語167とを対応させて記憶する。すなわち、関連単語記憶部121は、対象クエリ153に対応する類似クエリ165と、類似クエリ165に関連する関連単語167とを対応させて記憶する。
例えば、関連単語記憶部121は、類似クエリ165である「六本木温泉リゾート」と、関連単語167である「混雑予想」、「料金」、「ガイド」等とを対応させて記憶する。
(2.12)検索処理部123
検索処理部123は、ユーザに入力されたクエリ151に対応付けられる類似クエリ165を類似クエリ記憶部117から取得し、類似クエリ165に基づいた検索をする。具体的には、検索処理部123は、クエリ151に対応する類似クエリ165に基づいて、検索を行い、複数のURLを含む検索結果情報を出力する。例えば、検索処理部123は、クローラーにより自動収集されたウェブページに関する情報を記憶する所定の記憶部から、類似クエリ165に基づく情報を検索する。
(2.13)検索結果ページ作成部125
図9は、本発明の実施形態に係る情報処理装置100によって作成される検索ページ300の模式図である。
図9に示すように、検索結果ページ作成部125は、検索結果情報等に基づいて、検索ページ300を作成する。検索ページ300は、検索結果一覧ページ200と、クエリ入力ページ250とからなる。検索結果一覧ページ200には、関連情報領域220と、検索結果情報を表示する検索結果領域230とが少なくとも表示される。
具体的には、検索結果ページ作成部125は、類似クエリ165に対応する検索結果情報を検索処理部123から取得し、類似クエリ165に関連するウェブページのタイトルや、ウェブページの一部のテキスト情報等を表示する検索結果領域230を作成する。
また、検索結果ページ作成部125は、クエリに関連するウェブページが、他のWebサーバから取得したウェブページである場合、ウェブページのタイトルにサイトURL161を対応させたハイパーリンクとして、検索結果領域230に表示する。例えば、検索結果ページ作成部125は、類似クエリ165である「六本木温泉リゾート」に基づいて、検索処理部123により出力された検索結果情報を用いて検索結果領域230を作成する。
また、検索結果ページ作成部125は、類似クエリ165である「六本木温泉リゾート」に対応する関連単語167として「混雑予想」、「料金」、「ガイド」を関連単語記憶部121から取得し、類似クエリ165と、関連単語167とを組み合わせて関連情報領域220を作成する。例えば、検索結果ページ作成部125は、「六本木温泉リゾート 混雑予想」、「六本木温泉リゾート 料金」、「六本木温泉リゾート ガイド」などが記載された関連情報領域220を作成する。
クエリ入力ページ250には、ユーザから文字・数字等が入力されるクエリ入力欄260と、クエリ入力欄260のクエリに基づいた検索を実行するための検索ボタン270とが少なくとも表示される。本実施形態では、クエリ入力欄260には、クエリ151として、「六本木温泉」が入力されている。
(2.14)ページ送信部127
ページ送信部127は、通信ネットワーク50を介して、検索結果ページ作成部125により作成された検索ページ300をユーザ端末10に送信する。
(3)情報処理システム1の動作
情報処理システム1の動作について、(3.1)全体概略動作、(3.2)情報処理装置100の検索処理動作の順に説明する。
(3.1)全体概略動作
情報処理システム1は、ユーザ端末10によって入力されたクエリ151に基づいて、情報処理装置100が、検索ページ300を作成し、ユーザ端末10に表示する。
具体的には、まず、ユーザ端末10が、ユーザからクエリを受け入れ、情報処理装置100のクエリ受信部101へ通信ネットワーク50を介して、クエリ151を送信する。
次に、情報処理装置100は、クエリ受信部101で受信したクエリ151に基づいて、検索ページ300を出力する。
次に情報処理装置100は、通信ネットワーク50を介して、検索ページ300をユーザ端末10に送信する。
最後に、ユーザ端末10は、検索ページ300を表示する。
(3.2)情報処理装置100の検索処理動作
図10は、実施形態に係る情報処理装置100の検索処理動作を示すフローチャートである。
ステップS100において、クエリ受信部101は、ユーザ端末10からクエリ151を受信する。
ステップS200において、類似クエリ抽出部115は、算出部111の算出結果に基づいて、クエリ同士を類似クエリ165として抽出する。また、関連単語抽出部119は、類似クエリ165に関連する関連単語167を関連単語記憶部121から抽出する。
ステップS300において、検索処理部123は、類似クエリ抽出部115で抽出した類似クエリ165を類似クエリ記憶部117から取得し、類似クエリ165に基づいて、検索を行い、複数のURLを含む検索結果情報を出力する。
ステップS400において、検索結果ページ作成部125は、検索結果情報等に基づいて、検索ページ300を作成する。
ステップS500において、ページ送信部127は、通信ネットワーク50を介して、検索結果ページ作成部125により作成された検索ページ300をユーザ端末10に送信する。これにより、情報処理装置100は、検索処理動作を終了する。
(3.3)情報処理装置100の類似クエリ165の抽出方法
図11は、情報処理装置100の類似クエリ165の抽出処理動作を示すフローチャートである。具体的には、図10のステップS200の情報処理装置100の類似クエリ165の抽出処理動作の詳細を示すフローチャートである。
ステップS201において、候補サイト抽出部103は、クエリ受信部101で受信したクエリ151に基づいて検索を行い、サイトURL161からなる検索一覧160を抽出する。また、クエリ151と、クエリ151に対する検索一覧160と、検索一覧160に含まれるサイトURL161に対する個々の選択の履歴情報170とを含むログDB106を記憶手段に記憶する。
ステップS203において、候補クエリ抽出部107は、検索一覧160に含まれるサイトURL161をユーザが選択する場合に用いたクエリ151である候補クエリ155をログ記憶部105から抽出する。
ステップS205において、主要クエリ判定部109は、対象クエリ153が主要クエリ157aか否かを判定する。具体的には、主要クエリ判定部109は、対象クエリ153を主要クエリ157aと判定した場合、処理をステップS209へ進める。また、主要クエリ判定部109は、対象クエリ153を主要クエリ157aではない、と判定した場合、処理をステップS207へ進める。
ステップS207において、主要クエリ判定部109は、検索一覧160に含まれるサイトURL161に対する個々の選択の回数の分布に基づいて、サイトURL161を選択する際に最も利用されるクエリを主要クエリ157aとして判定する。
ステップS209において、算出部111は、ログ記憶部105に記憶された検索一覧160に含まれる各サイトURL161の個々の選択の回数の分布に基づいて、ログ記憶部105に記憶されたクエリ同士の類似度を算出する。具体的には、算出部111は、ユーザにより入力された対象クエリ153及び候補クエリ155の類似度を算出する。
ステップS211において、絞込みクエリ除去部113は、候補クエリ155に絞込みクエリ159が含まれるか否かを判定する。具体的には、絞込みクエリ除去部113は、候補クエリ155に絞込みクエリ159が含まれる場合、処理をステップS213へ進める。また、絞込みクエリ除去部113は、候補クエリ155に絞込みクエリ159が含まれていない場合、処理をステップS215へ進める。
ステップS213において、絞込みクエリ除去部113は、候補クエリ155に含まれる絞込みクエリ159を除去する。
ステップS215において、類似クエリ抽出部115は、算出部111の算出結果に基づいて、クエリ同士を類似クエリ165として抽出する。
ステップS217において、関連単語抽出部119は、類似クエリ165に関連する関連単語167をログ記憶部105から抽出する。これにより、情報処理装置100は、類似クエリ165の抽出処理動作を終了する。
(4)作用・効果
以上説明したように、本実施形態によれば、情報処理装置100は、ログ記憶部105と、算出部111と、類似クエリ抽出部115とを備える。ログ記憶部105は、クエリ151と、検索一覧160と、検索一覧160に含まれるサイトURL161に対する個々の選択の履歴情報170とを含むログDB106を記憶する。このため、ログ記憶部105は、事前に単語を記憶する必要がなく、ユーザの利用に伴って、記憶されるクエリ151、検索一覧160、履歴情報170が更新される。すなわち、ログ記憶部105によれば、ユーザの行動データであるログDB106を更新できる。
また、類似クエリ抽出部115は、算出部111の算出結果に基づいて、対象クエリ153に対して、類似度の高いクエリ151を類似クエリ165として、抽出する。すなわち、類似クエリ抽出部115によれば、ユーザの行動データであるログDB106から、類似クエリ165を抽出できるため、ユーザの入力意図を反映した類似語を抽出できる。
また、検索結果に対する選択(クリック)の回数、分布等の検索一覧に対するユーザの選択の履歴の一致具合に基づいて類似クエリ165を抽出するため、ユーザの意図が反映されたクエリを類似クエリ165として抽出できる。すなわち、ユーザの検索意図を考慮して類似クエリを抽出できるため、同じ意図で検索されたユーザの表記のゆれや入力ミス等を伴うクエリであっても類似クエリ165として抽出できる。
従って、情報処理装置100によれば、辞書の管理をするための負荷を増大することなく、類義語を抽出できる。
実施形態では、情報処理装置100は、類似クエリ165として抽出されたクエリ同士を対応させて記憶する類似クエリ記憶部117と、対象クエリ153の類似クエリ165を類似クエリ記憶部117から取得し、類似クエリ165に基づいた検索をする検索処理部123とを更に備える。従って、検索処理部123によれば、類似クエリ165による検索結果を表示することにより、ユーザが入力したクエリを類義語に拡張して、ユーザの入力意図を反映した検索結果を表示できる。
実施形態では、情報処理装置100は、ユーザに入力された対象クエリ153の類似クエリ165に基づいて、類似クエリ165に関連する関連単語167をログ記憶部105から抽出する関連単語抽出部119と、類似クエリ165と、関連単語167とを対応させて記憶する関連単語記憶部121とを更に備える。
このため、関連単語抽出部119は、ユーザの入力意図を反映した類似クエリ165に関連する関連単語167を抽出することができる。すなわち、情報処理装置100は、ユーザの入力意図を反映する類似クエリ165に加えて、ユーザの検索支援となる関連単語167を抽出することができるため、ユーザの入力意図を更に高く反映した類似語を抽出できる。
実施形態では、情報処理装置100は、ログ記憶部105に記憶されたクエリ151について、複数の単語を含むと共に、ログ記憶部105に記憶された他のクエリを含む絞込みクエリ159を類似クエリ165の候補から除去する絞込みクエリ除去部113を更に備える。一般的に、複数の単語を含むと共に、ログ記憶部105に記憶される他のクエリ151を含む絞込みクエリ159は、該他のクエリ151について、更に条件を絞り込むためのクエリである。
絞込みクエリ除去部113によれば、絞込みクエリ159を類似クエリ165の候補から除去するため、ユーザの入力意図を反映した類似語のみを抽出できる。従って、情報処理装置100によれば、絞込みクエリ除去部113による絞込みクエリ159を除去後の検索結果を表示することにより、ユーザの入力意図を反映した類義語のみを表示でき、利便性を向上できる。
(5)その他の実施形態
上述した実施形態では、検索処理部123は、類似クエリ抽出部115で抽出した類似クエリ165に基づいて検索を行い、複数のサイトURL161を含む検索結果情報を出力する。本発明は、これに限られず、例えば、検索処理部123は、主要クエリ157aに基づいて検索を行い、複数のURLを含む検索結果情報を出力してもよい。この場合、主要クエリ判定部109が、検索一覧160に含まれるサイトURL161に対する個々の選択の回数の分布に基づいて、類似クエリ165から、サイトURL161を選択する際に最も利用される主要クエリ157aを抽出する。これにより、検索処理部123が、主要クエリ157aに基づいて、検索を行うことを可能とする。
このような情報処理装置100によれば、主要クエリ157aによる検索結果を表示することにより、ユーザの入力意図を更に反映した検索結果を表示できる。
上述した実施形態では、情報処理装置100の算出部111は、ユーザにより入力された入力クエリである対象クエリ153に対する候補クエリ155の類似度を算出する。本発明は、これに限られず、例えば、算出部111は、対象クエリ153の代わりに主要クエリ157aを用いて、主要クエリ157aに対する候補クエリ155の類似度を算出してもよい。
上述した実施形態では、関連単語抽出部119は、類似クエリ165に基づいて、主要クエリ157aに関連する関連単語167をログ記憶部105から抽出する。本発明は、これに限られず、例えば、関連単語抽出部119は、類似クエリ165の代わりに主要クエリ157aを用いて、主要クエリ157aに基づいて、主要クエリ157aに関連する関連単語167をログ記憶部105から抽出してもよい。
すなわち、情報処理装置100は、ユーザの入力意図を反映する類似クエリ165に加えて、ユーザの検索支援となる関連情報を抽出・表示することができる。
上述した実施形態では、算出部111が算出する類似度は、クエリ毎の検索結果へのユーザの選択を特徴ベクトルによって表現することで、その特徴ベクトル間の距離を算出することで求められる。本発明は、これに限られず、例えば、図12に示す波形のパターンの類似度を算出することにより、対象クエリ153に対する候補クエリ155の類似度を算出してもよい。
図12は、その他の実施形態に係る情報処理装置100の算出部111の動作を説明するための概念図である。具体的には、図12(a)は、対象クエリ153に対する選択の分布を波形401により表現した概念図であり、横軸にサイトURL161、縦軸に各サイトURL161の選択の回数を示す図である。図12(b)は、候補クエリ155に対する選択の分布を波形403により表現した概念図であり、横軸にサイトURL161、縦軸に各サイトURL161の選択の回数を示す図である。尚、軸に配列されるサイトの種類及び並び順は図12(a)と(b)とで同一である。
この場合、例えば、算出部111は、形成される波型401及び波形403のパターン(形状)の類似の度合いを相互相関関数等を用いて、対象クエリ153に対する候補クエリ155の類似度として算出できる。
このように、本発明は、ここでは記載していない様々な実施の形態などを含むことは勿論である。したがって、本発明の技術的範囲は、上述の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。
例えば、各構成図、フローチャート、概念図の図などは例示に過ぎず、各要素の有無、その順序や具体的内容などは適宜変更可能である。一例として、手動によるブロックの指定は必須ではなく、また、本発明において、各手段などの要素は、コンピュータの演算制御部に限らず、ワイヤードロジック等に基づく電子回路で実現してもよい。
1 情報処理システム
10、30 ユーザ端末
50 通信ネットワーク
51 多次元ベクトル空間
100 情報処理装置
101 クエリ受信部
103 候補サイト抽出部
105 ログ記憶部
106 ログDB
107 候補クエリ抽出部
108 候補クエリDB
109 主要クエリ判定部
111 算出部
113 絞込みクエリ除去部
115 類似クエリ抽出部
117 類似クエリ記憶部
119 関連単語抽出部
121 関連単語記憶部
123 検索処理部
125 検索結果ページ作成部
127 ページ送信部
151 クエリ
153 対象クエリ
153v ベクトル
155、155a、155b、155n 候補クエリ
157a 主要クエリ
159 絞込みクエリ
160 検索一覧
161 サイトURL
163a、163b、163n 候補サイトURL
165 類似クエリ
167 関連単語
170 履歴情報
171 選択回数
173 総クリック数
200 検索結果一覧ページ
220 関連情報領域
230 検索結果領域
250 クエリ入力ページ
260 クエリ入力欄
270 検索ボタン
300 検索ページ

Claims (7)

  1. クエリと、前記クエリに対する検索一覧と、前記検索一覧に含まれるサイトに対する個々の選択の履歴情報とを含むログを記憶する記憶手段と、
    前記記憶手段に記憶された検索一覧に含まれる各サイトの個々の選択の回数の分布に基づいて、前記記憶手段に記憶されたクエリ同士の類似度を算出する算出手段と、
    前記算出手段の算出結果に基づいて、前記クエリ同士を類似クエリとして抽出する類似クエリ抽出手段と、
    を備えることを特徴とする情報処理装置。
  2. 前記類似クエリとして抽出されたクエリ同士を対応させて記憶する類似クエリ記憶手段と、
    ユーザに入力されたクエリに対応付けられる類似クエリを前記類似クエリ記憶手段から取得し、該類似クエリに基づいた検索をする検索手段とを更に備えることを特徴とする請求項1に記載の情報処理装置。
  3. 前記検索一覧に含まれるサイトに対する個々の選択の回数に基づいて、前記サイトを選択する検索結果を得るために最も多く入力されるクエリを主要クエリとして判定する主要クエリ判定手段を更に備え、
    前記算出手段は、前記主要クエリと判定されたクエリ同士間の類似度を算出することを特徴とする請求項1又は2に記載の情報処理装置。
  4. ユーザに入力されたクエリの類似クエリに基づいて、前記類似クエリに関連する関連単語を前記記憶手段から抽出する関連単語抽出手段と、
    前記類似クエリと、前記関連単語とを対応させて記憶する関連単語記憶手段とを更に備えることを特徴とする請求項1乃至3の何れか一項に記載の情報処理装置。
  5. 複数の単語を含むクエリであって、前記類似クエリ記憶手段に記憶された他の類似クエリを含む絞込みクエリを前記類似クエリから除去する絞込みクエリ除去手段を更に備えることを特徴とする請求項1乃至4の何れか一項に記載の情報処理装置。
  6. クエリと、前記クエリに対する検索一覧と、前記検索一覧に含まれるサイトに対する個々の選択の履歴情報とを含むクリックログを所定の記憶手段に記憶するステップと、
    前記検索一覧に含まれる各サイトの個々の選択の回数の分布に基づいて、前記記憶手段に記憶されたクエリ同士の類似度を算出するステップと、
    前記類似度の算出結果に基づいて、前記クエリ同士を類似クエリとして抽出するステップと、
    をコンピュータが実行することを特徴とするデータ抽出方法。
  7. 請求項6に記載のデータ抽出方法を前記情報処理装置に実行させるためのプログラム。
JP2010076943A 2010-03-30 2010-03-30 情報処理装置、データ抽出方法及びプログラム Active JP5165719B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010076943A JP5165719B2 (ja) 2010-03-30 2010-03-30 情報処理装置、データ抽出方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010076943A JP5165719B2 (ja) 2010-03-30 2010-03-30 情報処理装置、データ抽出方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2011209999A true JP2011209999A (ja) 2011-10-20
JP5165719B2 JP5165719B2 (ja) 2013-03-21

Family

ID=44940989

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010076943A Active JP5165719B2 (ja) 2010-03-30 2010-03-30 情報処理装置、データ抽出方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5165719B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014050002A1 (ja) * 2012-09-28 2014-04-03 日本電気株式会社 クエリ類似度評価システム、評価方法、及びプログラム
JP2014106982A (ja) * 2012-11-28 2014-06-09 Estsoft Corp 自動完成質疑語提供システム、検索システム、自動完成質疑語提供方法並びに記録媒体
JP2016057954A (ja) * 2014-09-11 2016-04-21 富士通株式会社 検索プログラム、検索方法及び情報処理装置
JP2019057110A (ja) * 2017-09-21 2019-04-11 データ・サイエンティスト株式会社 検索目的推察支援装置、検索目的推察支援システム、及び検索目的推察支援方法
CN111506716A (zh) * 2020-04-15 2020-08-07 腾讯科技(深圳)有限公司 一种问答数据处理方法、装置以及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005302042A (ja) * 2004-04-15 2005-10-27 Microsoft Corp マルチセンスクエリについての関連語提案
JP2009069874A (ja) * 2007-09-10 2009-04-02 Sharp Corp コンテンツ検索装置、コンテンツ検索方法、プログラム、および記録媒体
JP2009110231A (ja) * 2007-10-30 2009-05-21 Nippon Telegr & Teleph Corp <Ntt> 文章検索サーバコンピュータ,文章検索方法,文章検索プログラム,そのプログラムを記録した記録媒体
JP2010055164A (ja) * 2008-08-26 2010-03-11 Nippon Telegr & Teleph Corp <Ntt> 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体
JP2011519103A (ja) * 2008-04-29 2011-06-30 エヌエイチエヌ ビジネス プラットフォーム コーポレーション コンテンツ間の類似度に基づいて検索結果又は広告を提供する検索結果提供システムおよび方法
JP2011526383A (ja) * 2008-07-03 2011-10-06 グーグル・インコーポレーテッド 入力文字列からのリソースロケータの提案

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005302042A (ja) * 2004-04-15 2005-10-27 Microsoft Corp マルチセンスクエリについての関連語提案
JP2009069874A (ja) * 2007-09-10 2009-04-02 Sharp Corp コンテンツ検索装置、コンテンツ検索方法、プログラム、および記録媒体
JP2009110231A (ja) * 2007-10-30 2009-05-21 Nippon Telegr & Teleph Corp <Ntt> 文章検索サーバコンピュータ,文章検索方法,文章検索プログラム,そのプログラムを記録した記録媒体
JP2011519103A (ja) * 2008-04-29 2011-06-30 エヌエイチエヌ ビジネス プラットフォーム コーポレーション コンテンツ間の類似度に基づいて検索結果又は広告を提供する検索結果提供システムおよび方法
JP2011526383A (ja) * 2008-07-03 2011-10-06 グーグル・インコーポレーテッド 入力文字列からのリソースロケータの提案
JP2010055164A (ja) * 2008-08-26 2010-03-11 Nippon Telegr & Teleph Corp <Ntt> 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNJ201010047353; 龍田 賢治 外2名: '"検索連動広告における広告選択手法の提案"' 第72回(平成22年)全国大会講演論文集(1) アーキテクチャ ソフトウェア科学・工学 データベース , 20100308, p.1-729〜1-730, 社団法人情報処理学会 *
JPN6012031285; 龍田 賢治 外2名: '"検索連動広告における広告選択手法の提案"' 第72回(平成22年)全国大会講演論文集(1) アーキテクチャ ソフトウェア科学・工学 データベース , 20100308, p.1-729〜1-730, 社団法人情報処理学会 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014050002A1 (ja) * 2012-09-28 2014-04-03 日本電気株式会社 クエリ類似度評価システム、評価方法、及びプログラム
JPWO2014050002A1 (ja) * 2012-09-28 2016-08-22 日本電気株式会社 クエリ類似度評価システム、評価方法、及びプログラム
JP2014106982A (ja) * 2012-11-28 2014-06-09 Estsoft Corp 自動完成質疑語提供システム、検索システム、自動完成質疑語提供方法並びに記録媒体
JP2016057954A (ja) * 2014-09-11 2016-04-21 富士通株式会社 検索プログラム、検索方法及び情報処理装置
JP2019057110A (ja) * 2017-09-21 2019-04-11 データ・サイエンティスト株式会社 検索目的推察支援装置、検索目的推察支援システム、及び検索目的推察支援方法
CN111506716A (zh) * 2020-04-15 2020-08-07 腾讯科技(深圳)有限公司 一种问答数据处理方法、装置以及计算机可读存储介质
CN111506716B (zh) * 2020-04-15 2023-04-25 腾讯科技(深圳)有限公司 一种问答数据处理方法、装置以及计算机可读存储介质

Also Published As

Publication number Publication date
JP5165719B2 (ja) 2013-03-21

Similar Documents

Publication Publication Date Title
US8301616B2 (en) Search equalizer
EP2210198B1 (en) System and method for searching for documents
KR101060594B1 (ko) 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법
JP5084858B2 (ja) サマリ作成装置、サマリ作成方法及びプログラム
JP4746439B2 (ja) 文書検索サーバおよび文書検索方法
JP5165719B2 (ja) 情報処理装置、データ抽出方法及びプログラム
JP2015106354A (ja) 検索サジェスト装置、検索サジェスト方法、及び、プログラム
CN111194457A (zh) 专利评估判定方法、专利评估判定装置以及专利评估判定程序
JP2013037404A (ja) 情報処理装置、情報処理方法、及びプログラム
Baker et al. A novel web ranking algorithm based on pages multi-attribute
WO2018022333A1 (en) Cross-platform computer application query categories
JP2012104051A (ja) 文書インデックス作成装置
Leung et al. Constructing concept relation network and its application to personalized web search
JP2004348607A (ja) コンテンツ検索方法、コンテンツ検索システム、コンテンツ検索用プログラムおよびコンテンツ検索用プログラムが記録された記録媒体
JP6534454B2 (ja) 情報検索方法及び情報検索装置並びに情報検索システム
JP7428250B2 (ja) 文書検索の性能を評価する方法、システム、および装置
JP5084859B2 (ja) 情報処理装置、データ抽出方法、及びプログラム
CN113641884A (zh) 基于语义的电力计量数据处理方法、装置和计算机设备
JP6596302B2 (ja) コンテンツ検索システムおよびコンテンツ検索方法ならびにコンテンツ検索プログラム
Li et al. Ranking associative entities in knowledge graph by graphical modeling of frequent patterns
JP2017049836A (ja) 検索支援装置、検索支援プログラムおよび記憶媒体
Kim et al. Developing a Meta-Suggestion Engine for Search Queries
Lobo et al. A novel method for analyzing best pages generated by query term synonym combination
JP4859891B2 (ja) コンテンツに関連する情報を提供するサーバ、システム及び方法
JP5028499B2 (ja) サーバ、方法及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120619

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20120711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121219

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151228

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5165719

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250