JP6168963B2 - 情報検索装置、情報検索方法、およびプログラム - Google Patents

情報検索装置、情報検索方法、およびプログラム Download PDF

Info

Publication number
JP6168963B2
JP6168963B2 JP2013215927A JP2013215927A JP6168963B2 JP 6168963 B2 JP6168963 B2 JP 6168963B2 JP 2013215927 A JP2013215927 A JP 2013215927A JP 2013215927 A JP2013215927 A JP 2013215927A JP 6168963 B2 JP6168963 B2 JP 6168963B2
Authority
JP
Japan
Prior art keywords
information
relevance
pieces
query
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013215927A
Other languages
English (en)
Other versions
JP2015079349A (ja
Inventor
堀田 徹
徹 堀田
幸浩 田頭
幸浩 田頭
真吾 星野
真吾 星野
田中 祐介
祐介 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2013215927A priority Critical patent/JP6168963B2/ja
Priority to US14/319,701 priority patent/US9582772B2/en
Publication of JP2015079349A publication Critical patent/JP2015079349A/ja
Application granted granted Critical
Publication of JP6168963B2 publication Critical patent/JP6168963B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0261Targeted advertisements based on user location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、コンテンツを検索する検索装置等に関するものである。
従来、ユーザ関心情報および地図ベースのロケーション情報を使用して、広告を決定する技術があった(例えば、特許文献1参照)。
特開2012−138100号公報(第1頁、第1図等)
しかしながら、従来技術においては、ユーザにとって必要な広告等のコンテンツを検索することが困難であった。
本第一の発明の情報検索装置は、1または2以上の各第一情報と1または2以上の各第二情報との関連度を示す1以上の関連度情報を格納し得る関連度情報格納手段と、コンテンツの検索に使用する1以上の情報である1以上のクエリ情報を含むクエリを受け付ける受付手段と、1以上の各クエリ情報に対応する1以上の第一情報と、1以上の関連度情報とを用いて、予め決められた条件を満たすほど、1以上の第一情報に対する関連度が大きい1以上の第二情報を取得するクエリ変換手段と、クエリ変換手段が取得した1以上の第二情報を用いて、コンテンツを検索する検索手段とを具備する情報検索装置である。
また、本第二の発明の情報検索装置は、第一の発明に対して、関連度情報格納手段は、1以上の各第一情報と1以上の各第二情報との関連度を示す関連度情報を要素として有する関連度行列である変換行列を格納しており、クエリ変換手段は、受付手段が受け付けた1以上のクエリ情報を用いたベクトルであるクエリベクトルと変換行列とを乗算し、1以上の各第二情報に対応する値を取得し、値が予め決められた条件を満たすほど大きい値に対応する1以上の第二情報を取得する情報検索装置である。
また、本第三の発明の情報検索装置は、第一または第二の発明に対して、1以上の第一情報である第一情報集合は、1以上のクエリ情報であるクエリの特徴空間であり、1以上の第二情報である第二情報集合は、検索対象の1以上のコンテンツに対応付いている情報の集合であるコンテンツ情報空間である情報検索装置である。
また、本第四の発明の情報検索装置は、第一から第三いずれかの発明に対して、1以上の第一情報である第一情報集合は、ユーザコンテキストを含む情報検索装置である。
また、本第五の発明の情報検索装置は、第二から第四いずれかの発明に対して、1以上のクエリ情報である1以上の第一情報と、選択されたコンテンツに対応付いている1以上の第二情報とを有する1以上の選択ログから、1以上の各第一情報と1以上の各第二情報と関連度情報を取得する関連度取得手段をさらに具備し、関連度取得手段が取得した1以上の関連度情報は、関連度情報格納手段に格納されている1以上の関連度情報である情報検索装置である。
また、本第六の発明の情報検索装置は、第五の発明に対して、関連度取得手段は、1以上の選択ログから、1以上の各第一情報と1以上の各第二情報と関連度情報を要素として有する変換行列を取得する情報検索装置である。
また、本第七の発明の情報検索装置は、第五または第六の発明に対して、関連度取得手段は、1以上の各第一情報ごとに、1以上の各第二情報に対応するコンテンツの選択率である第一選択率と、1以上の各第一情報および1以上の各第二情報に対応するコンテンツの選択率である第二選択率とを、選択ログから取得し、1以上の各第二情報ごとに、第一選択率と第二選択率との比を算出し、比が予め決められた条件を満たすほど大きい第一情報と第二情報との関連度情報のみを取得する情報検索装置である。
また、本第八の発明の情報検索装置は、第二から第七いずれかの発明に対して、コンテンツは、第二情報と第二情報の重みを示す重み情報との組である1以上の被検索情報と対応付けられており、検索手段は、クエリ変換手段が取得した1以上の、第二情報および値の組を用いて、コンテンツを検索する情報検索装置である。
また、本第九の発明の情報検索装置は、第一から第八いずれかの発明に対して、コンテンツは、広告である情報検索装置である。
本発明による情報検索装置によれば、ユーザにとって必要なコンテンツを検索できる。
実施の形態1における情報システムの概念図 同情報システムのブロック図 同情報検索装置がコンテンツを検索する動作について説明するフローチャート 同関連度の値の算出処理について説明するフローチャート 同情報検索装置が関連度情報を取得する動作について説明するフローチャート 同情報検索装置の動作の概念を示す図 同変換行列を示す図 同クエリ変換手段の処理の概念を示す図 同クリックログを示す図 同実験で使用した特徴量を示す図 同実験で使用したウェブサイトの情報を示す図 同実験結果を示す図 同実験結果を示す図 同コンピュータシステムの概観図 同コンピュータシステムのブロック図
以下、情報検索装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
本実施の形態において、クエリに対して変換行列を用いて、クエリ拡張を行い、コンテンツを検索する情報検索装置を有する情報システムについて説明する。
また、本実施の形態において、ユーザの性別や年齢層や位置等のユーザコンテキストを含むクエリに対応する情報検索装置を有する情報システムについて説明する。
また、本実施の形態において、変換行列の学習方法についても説明する。
図1は、本実施の形態における情報システムの概念図である。情報システムは、情報検索装置1、1または2以上の端末装置2、コンテンツ格納装置3を備える。端末装置2は、ユーザが使用する端末であり、例えば、いわゆるスマートフォン、ノートパソコンを含むパソコン、タブレット端末等である。
図2は、本実施の形態における情報システムのブロック図である。
情報システムを構成する情報検索装置1は、選択ログ格納手段10、関連度情報格納手段11、受付手段12、クエリ変換手段13、検索手段14、出力手段15、および関連度取得手段16を備える。
端末装置2は、端末受付手段21、端末送信手段22、端末受信手段23、および端末出力手段24を備える。
コンテンツ格納装置3は、コンテンツ格納手段31、およびコンテンツ送信手段32を備える。
情報検索装置1を構成する選択ログ格納手段10は、1以上の選択ログを格納している。選択ログは、例えば、コンテンツのクリックログ、コンテンツの出力のログなどである。また、コンテンツは、例えば、広告やウェブページ等である。つまり、選択ログは、例えば、広告のクリックログ、ウェブページの出力ログなどである。なお、選択ログは、クリックログと言っても良い。なお、選択ログは、通常、選択のためのクエリの情報、選択されたコンテンツの情報を含む。また、選択ログは、例えば、1以上のクエリ情報である1以上の第一情報と、選択されたコンテンツに対応付いている1以上の第二情報とを有する。なお、ここでは、選択ログ格納手段10は、情報検索装置1が保持しているが、外部装置が選択ログ格納手段10を保持していても良い。
なお、第一情報と第二情報は、通常、用語であるが、画像や音声等でも良い。用語とは、通常、単語であるが、連語、文の一部または全部等でも良い。
関連度情報格納手段11は、1以上の関連度情報を格納し得る。関連度情報とは、第一情報と第二情報との関連度を示す情報である。また、関連度とは、2つの情報の関連の度合い、関連の程度等である。関連度情報は、定量的な情報を含み、通常、当該定量的な情報は数値であるが、数値でなくても良い。また、関連度情報格納手段11は、通常、第一情報、第二情報、および関連度情報の組を1組以上格納している。但し、関連度情報格納手段11は、第一情報の識別子、第二情報の識別子、および関連度情報の組を1組以上格納していても良い。
関連度情報格納手段11は、変換行列を格納していても良い。変換行列は、関連度情報を有する関連度行列である。また、変換行列は、1以上の各第一情報と1以上の各第二情報との関連度を示す関連度情報を要素として有する行列である。また、変換行列は、例えば、一軸が第一情報に対応し、他軸が第二情報に対応する行列である。
受付手段12は、指示や情報等を受け付ける。受付手段12が受け付ける指示や情報等は、例えば、コンテンツを検索するためのクエリである。クエリは、コンテンツの検索に使用する1以上の情報である1以上のクエリ情報を含む。ここでの、情報は、通常、用語であるが、画像や音声等でも良い。用語とは、通常、単語であるが、連語、文の一部または全部等でも良い。また、クエリ情報は、例えば、ユーザが入力した情報(例えば、キーワード)またはユーザコンテキストである。ユーザコンテキストとは、ユーザに関する情報であり、例えば、ユーザの性別、年齢、年齢層、ユーザが居る位置を示す位置情報、受付手段12がクエリ等を受け付けた際の天気や季節や時刻、ユーザが使用している端末装置2の種類等である。端末装置2の種類は、例えば、スマートフォン、携帯電話、パソコン、またはタブレット端末等である。
ここで、受け付けとは、一部を受信し、一部を取得することでも良いし、すべてを受信することでも良い。例えば、クエリが、ユーザが入力した情報とユーザコンテキストとを含む場合、受付手段12は、ユーザが入力したキーワードを受信し、かつ受信した情報からユーザコンテキストを取得しても良い。ユーザコンテキストを取得するための情報は、例えば、ユーザが使用する端末装置2を識別する端末識別子である。また、端末識別子は、例えば、IPアドレスやMACアドレス等である。かかる場合、図示しない格納手段が1以上の各端末識別子に対応付けて、性別や年齢層や位置等のユーザコンテキストを格納しており、かかる格納手段から、受付手段12は、端末識別子を用いて、ユーザコンテキストを取得する。そして、受付手段12は、ユーザにより入力され、受信した1以上の第一情報と、取得したユーザコンテキストとから、使用するクエリを構成する。また、受付手段12は、図示しないサーバ装置から現在の時刻、季節、または天気(ユーザが居る位置の天気)等を取得しても良い。なお、かかる現在の時刻、季節、または天気等も、ユーザコンテキストである。
また、受付手段12は、URLを受け付け、当該URLにより識別されるウェブページから、1以上の用語を取得しても良い。かかる用語は、第一情報である。
また、受け付けとは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含み、広く解しても良い。
また、コンテンツは、第二情報と重み情報との組である1以上の被検索情報と対応付けられていても良い。重み情報とは、コンテンツに対する第二情報の重みを示す情報である。また、コンテンツは、広告であることが好適であるが、ウェブページや番組情報等、他の情報でも良い。なお、番組情報とは、EPGを構成する情報でも良いし、番組の情報そのものでも良い。
クエリ変換手段13は、受付手段12が受け付けたクエリを用いて、検索に使用する1以上の第二情報を取得する。
具体的には、クエリ変換手段13は、1以上の各クエリ情報に対応する1以上の第一情報と1以上の関連度情報とを用いて、予め決められた条件を満たすほど、1以上の第一情報に対する関連度が大きい1以上の第二情報を取得する。クエリ情報に対応する第一情報とは、通常、クエリ情報と同一の第一情報である。また、予め決められた条件とは、例えば、関連度が上位N(Nは1以上の自然す)の第二情報、関連度がXより大きい第二情報等である。クエリ変換手段13は、取得する各第二情報に対応付いた値も取得することは好適である。
クエリ変換手段13は、例えば、受付手段12が受け付けた1以上のクエリ情報を用いたベクトルであるクエリベクトルと変換行列とを乗算し、1以上の各第二情報に対応する値を取得し、値が予め決められた条件を満たすほど大きい値に対応する1以上の第二情報を取得する。クエリベクトルとは、通常、クエリ情報に対応する要素が1、クエリ情報に対応しない要素が0のベクトルである。ここでの予め決められた条件も、関連度が上位N(Nは1以上の自然す)の第二情報、関連度がXより大きい第二情報等である。
検索手段14は、クエリ変換手段13が取得した1以上の第二情報を用いて、コンテンツを検索する。検索手段14は、通常、1以上の第二情報を検索キーとして、コンテンツを検索する。ここで、コンテンツとは、例えば、広告、ウェブページ等である。また、検索手段14は、ここでは、コンテンツ格納装置3から1以上のコンテンツを取得するが、検索手段14は、情報検索装置1が保持しているコンテンツデータベースから、1以上のコンテンツを取得しても良い。なお、通常、コンテンツには、1以上の第二情報が対応付けられている。
また、検索手段14は、クエリ変換手段13が取得した1以上の、第二情報および値の組を用いて、1以上のコンテンツを検索することは好適である。例えば、検索手段14は、コンテンツデータベースの各コンテンツに対応付いている1以上の第二情報と一致する1以上の第二情報の値の合計を、コンテンツごとに取得し、当該値の合計が、予め決められた条件を満たすほど大きい1以上のコンテンツを取得する。
出力手段15は、検索手段14が取得した1以上のコンテンツを出力する。ここでの出力は、通常、端末装置2への送信である。ただし、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含むと考えても良い。
関連度取得手段16は、1以上の選択ログから、1以上の各第一情報と1以上の各第二情報と関連度情報を取得する。関連度取得手段16は、通常、第一情報と第二情報とが対応付いている選択ログが多いほど、当該第一情報と第二情報に対して、大きい値の関連度情報を取得する。
また、関連度取得手段16は、1以上の選択ログから、1以上の各第一情報と1以上の各第二情報との関連度を示す関連度情報を要素として有する変換行列を取得する。
さらに、関連度取得手段16は、1以上の各第一情報ごとに、1以上の各第二情報に対応するコンテンツの選択率である第一選択率と、1以上の各第一情報および1以上の各第二情報に対応するコンテンツの選択率である第二選択率とを、1以上の選択ログから取得することは好適である。そして、関連度取得手段16は、1以上の各第二情報ごとに、当該第一選択率と当該第二選択率との比を算出し、当該比が予め決められた条件を満たすほど大きい第一情報と第二情報との関連度情報のみを取得することは好適である。
端末装置2を構成する端末受付手段21は、ユーザからの指示や情報等を受け付ける。指示や情報等は、例えば、1以上の情報を有するクエリである。なお、1以上の情報とは、例えば、1以上の用語である。
指示や情報等の入力手段は、キーボードやマウスやタッチパネルやメニュー画面によるもの等、何でも良い。端末受付手段21は、キーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
端末送信手段22は、端末受付手段21が受け付けた指示や情報等を情報検索装置1に送信する。
端末受信手段23は、端末送信手段22の指示や情報等の送信に対応して、情報検索装置1から情報を受信する。なお、端末受信手段23が受信する情報は、例えば、検索結果の1以上のコンテンツ等である。
端末出力手段24は、端末受信手段23が受信した情報を出力する。ここでの出力は、
端末出力手段24は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。端末出力手段24は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
コンテンツ格納装置3を構成するコンテンツ格納手段31は、1以上のコンテンツを格納し得る。コンテンツは、通常、1以上の第二情報に対応付いている。
コンテンツ送信手段32は、情報検索装置1の要求に応じて、1以上のコンテンツをコンテンツ格納手段31から取得し、当該取得した1以上のコンテンツを情報検索装置1に送信する。
選択ログ格納手段10、関連度情報格納手段11、およびコンテンツ格納手段31は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。選択ログ格納手段10等に選択ログ等が記憶される過程は問わない。例えば、記録媒体を介して選択ログ等が選択ログ格納手段10等で記憶されるようになってもよく、通信回線等を介して送信された選択ログ等が選択ログ格納手段10等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された選択ログ等が選択ログ格納手段10等で記憶されるようになってもよい。
クエリ変換手段13、検索手段14、関連度取得手段16は、通常、MPUやメモリ等から実現され得る。クエリ変換手段13の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
出力手段15、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
端末送信手段22、コンテンツ送信手段32は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
端末受信手段23は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。
次に、情報システムの動作について説明する。まず、情報検索装置1がコンテンツを検索する動作について、図3のフローチャートを用いて説明する。
(ステップS301)受付手段12は、端末装置2からクエリ等を受信したか否かを判断する。クエリ等を受信すればステップS302に行き、クエリ等を受信しなければステップS301に戻る。なお、ここで、クエリ等とは、例えば、ユーザが入力した1以上のクエリ情報とユーザコンテキストを取得するための情報であり、端末装置2を識別する端末識別子である。端末識別子は、例えば、端末装置2のIPアドレスである。また、クエリ情報は、例えば、キーワードである。
(ステップS302)受付手段12は、ステップS301で受信した端末識別子を用いて、ユーザコンテキストを取得する。
(ステップS303)受付手段12は、ステップS301で受信されたクエリに含まれる1以上の第一情報または/およびクエリから取得され得る1以上の第一情報と、ステップS302で取得したユーザコンテキストとから、使用するクエリを構成する。
(ステップS304)クエリ変換手段13は、関連度情報格納手段11に格納されている1以上の関連度情報を取得する。
(ステップS305)クエリ変換手段13は、ステップS303で構成されたクエリを構成する1以上の第一情報、およびステップS304で取得した1以上の関連度情報を用いて、1以上の各第二情報に対応する関連度の値を算出する。かかる関連度の値の算出処理について、図4のフローチャートを用いて説明する。
(ステップS306)クエリ変換手段13は、ステップS305で算出した関連度の値が、予め決められた条件を満たすほど大きい値に対応する1以上の第二情報を取得する。なお、ここで、クエリ変換手段13は、第二情報と関連度情報との組を、1組以上、取得しても良い。
(ステップS307)検索手段14は、ステップS306で取得された1以上の第二情報を用いて、コンテンツを検索する。検索手段14は、ステップS306で取得された1組以上の第二情報と関連度情報との組を用いて、コンテンツを検索しても良い。検索手段14は、ここでは、コンテンツ格納装置3から1以上のコンテンツを取得する、とする。
(ステップS308)出力手段15は、ステップS307で取得された1以上のコンテンツを、端末装置2に送信する。ステップS301に戻る。
なお、図3のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
次に、ステップS305の関連度の値の算出処理について、図4のフローチャートを用いて説明する。
(ステップS401)クエリ変換手段13は、カウンタiに1を代入する。
(ステップS402)クエリ変換手段13は、i番目の第二情報が存在するか否かを判断する。i番目の第二情報が存在すればステップS403に行き、i番目の第二情報が存在しなければ上位処理にリターンする。なお、クエリ変換手段13は、例えば、関連度情報格納手段11に格納されているi番目の関連度情報に対応する第二情報が存在するか否かを判断する。
(ステップS403)クエリ変換手段13は、i番目の第二情報を取得する。なお、クエリ変換手段13は、例えば、関連度情報格納手段11からi番目の第二情報を取得しても良いし、例えば、関連度情報格納手段11に格納されているi番目の関連度情報に対応するi番目の第二情報を、例えば、図示しない外部の装置から取得しても良い。
(ステップS404)クエリ変換手段13は、ステップS403で取得したi番目の第二情報と、1以上の各第一情報との関連度を示す1以上の関連度情報を、関連度情報格納手段11から取得する。
(ステップS405)クエリ変換手段13は、ステップS404で取得した1以上の関連度情報をパラメータとする増加関数により、i番目の第二情報の関連度情報を算出する。なお、かかる増加関数は、例えば、1以上の関連度情報の合計を算出する算出式であっても良いし、1以上の関連度情報に重みを乗算した値の合計を算出する算出式であっても良いし、1以上の関連度情報の平均値を算出する算出式であっても良いし、1以上の関連度情報の重み付き平均値を算出する算出式等であっても良い。重み付き平均値における重みは、例えば、1以上の各第一情報に付加された重みである。
(ステップS406)クエリ変換手段13は、カウンタiを1、インクリメントする。ステップS402に戻る。
次に、情報検索装置1が関連度情報を取得する動作について、図5のフローチャートを用いて説明する。
(ステップS501)関連度取得手段16は、カウンタiに1を代入する。
(ステップS502)関連度取得手段16は、i番目の第一情報が存在するか否かを判断する。i番目の第一情報が存在すればステップS503に行き、i番目の第一情報が存在しなければ処理を終了する。
(ステップS503)関連度取得手段16は、i番目の第一情報を取得する。なお、関連度取得手段16は、例えば、選択ログ格納手段10から、i番目の第一情報を取得する。
(ステップS504)関連度取得手段16は、カウンタjに1を代入する。
(ステップS505)関連度取得手段16は、j番目の第二情報が存在するか否かを判断する。j番目の第二情報が存在すればステップS506に行き、j番目の第二情報が存在しなければステップS510に行く。
(ステップS506)関連度取得手段16は、j番目の第二情報を取得する。なお、関連度取得手段16は、例えば、選択ログ格納手段10から、j番目の第二情報を取得する。
(ステップS507)関連度取得手段16は、i番目の第一情報とj番目の第二情報とを用いて、選択ログ格納手段10を検索し、i番目の第一情報とj番目の第二情報とが共に出現する選択ログの数(出現数)を取得する。
(ステップS508)関連度取得手段16は、ステップS507で取得した出現数を用いて、i番目の第一情報とj番目の第二情報との関連度を示す関連度情報を算出する。関連度取得手段16は、出現頻度をパラメータとする増加関数により、i番目の第一情報とj番目の第二情報との関連度を示す関連度情報を算出する。ここで、この増加関数fは、例えば、「f(出現数)=出現数/全選択ログの数」である。なお、全選択ログの数は、選択ログ格納手段10に格納されている選択ログの数である。また、増加関数fは、例えば、「f(出現数)=出現数」等でも良い。
(ステップS509)関連度取得手段16は、カウンタjを1、インクリメントする。ステップS505に戻る。
(ステップS510)関連度取得手段16は、カウンタiを1、インクリメントする。ステップS502に戻る。
次に、端末装置2の動作について説明する。端末受付手段21は、ユーザからのクエリ等の指示や情報等を受け付ける。そして、端末送信手段22は、端末受付手段21が受け付けた指示や情報等を情報検索装置1に送信する。次に、端末受信手段23は、端末送信手段22の指示や情報等の送信に対応して、情報検索装置1から情報を受信する。そして、端末出力手段24は、端末受信手段23が受信した情報を出力する。なお、端末装置2は公知技術からなる装置で実現可能であるので、詳細な説明を省略する。
次に、コンテンツ格納装置3の動作について説明する。コンテンツ送信手段32は、情報検索装置1の要求に応じて、1以上のコンテンツをコンテンツ格納手段31から取得する。次に、コンテンツ送信手段32は、取得した1以上のコンテンツを情報検索装置1に送信する。なお、コンテンツ格納装置3は公知技術からなる装置で実現可能であるので、詳細な説明を省略する。
以下、本実施の形態における情報検索装置1の具体的な動作について説明する。本具体例において、コンテンツは広告であり、かつウェブページに挿入して表示される広告である、とする。
情報検索装置1は、例えば、図6に示すように、受付手段12が受け付けたクエリ61を変換器62により変換し、単語ベクトル63を取得する。なお、クエリ61は、ここでは、7つのクエリ情報を含む。クエリ61の「ニキビ(kwbm)」は、「ニキビ」が、ユーザが端末装置2から入力したキーワードであることを示す。「女性 (デモグラ)」は、当該ユーザのユーザコンテキストのうちの性別が「女性」であることを示す。また、「車(Fid)」は、ユーザの行動履歴から推定された興味カテゴリを示す。また、「ダイエット(page)」は、ウェブページの内容を良く表す特徴語が「ダイエット」であることを示す。また、「スマホ(device)」は、ユーザが使用する端末装置2の種類が「スマートフォン」であることを示す。また、「雨(天気)」は、ユーザが居る位置の天気が「雨」であることを示す。さらに、「夏(季節)」は、現在の季節が「夏」であることを示す。
また、変換器62は、上述した関連度情報格納手段11とクエリ変換手段13である。さらに、単語ベクトル63は、クエリ変換手段13が取得する1以上の第二情報に対応するベクトルの例である。
今、情報検索装置1の関連度情報格納手段11は、図7に示す変換行列を保持している、とする。図7に示す変換行列の縦軸は、クエリの特徴空間であり、8つの第一情報を有する第一情報集合の例である。また、図7に示す変換行列の横軸は、広告のコンテンツ情報空間であり、8つの第二情報を有する第二情報集合の例である。
かかる状況において、ユーザはキーワード「車」を端末装置2に入力した、とする。次に、端末装置2の端末受付手段21は、キーワード「車」を含むクエリを受け付ける。
次に、端末送信手段22は、キーワード「車」を含むクエリと、端末装置2のIPアドレスを情報検索装置1に送信する。
次に、情報検索装置1の受付手段12は、キーワード「車」を含むクエリと、端末装置2のIPアドレスを受信する。
次に、受付手段12は、端末装置2のIPアドレスからユーザコンテキスト「女性」「20代」「大阪」を取得する。なお、情報検索装置1の図示しない格納手段は、IPアドレスと対応付けてユーザコンテキストを保持している、とする。
そして、受付手段12は、キーワード「車」、およびユーザコンテキスト「女性」「20代」「大阪」を有するクエリベクトル(0,1,1,0,0,1,1,0)を取得する。なお、(0,1,1,0,0,1,1,0)は「(男性,女性,20代,60代,東京,大阪,車,住宅)=(0,1,1,0,0,1,1,0)」を意味する。
次に、クエリ変換手段13は、関連度情報格納手段11に格納されている変換行列(図7参照)を取得する。
次に、クエリ変換手段13は、変換行列とクエリベクトルとを乗算し、8つの各第二情報に対応する関連度の値を算出する。そして、クエリ変換手段13は、第二情報「化粧」の関連度の値は「0.7」、第二情報「Diet」の関連度の値は「0.7」、第二情報「賃貸」の関連度の値は「0」、第二情報「保険」の関連度の値は「0.5」、第二情報「羽田」の関連度の値は「0」、第二情報「銀座」の関連度の値は「0」、第二情報「梅田」の関連度の値は「0.5」、第二情報「老眼」の関連度の値は「0」として、それぞれの関連度の値を取得する。
次に、クエリ変換手段13は、算出した関連度の値が、予め決められた条件を満たすほど大きい値に対応する4つの第二情報「化粧」「Diet」「保険」「梅田」を取得する。なお、予め決められた条件は、例えば、「関連度の値が上位4つの第二情報を取得すること」である、とする。
以上のクエリ変換手段13の処理の概念を図8に示す。図8において、第二情報は、引当てキーワードと表記している。引当てキーワードとは、広告等のコンテンツを検索する際に使用するキーワードである。
次に、検索手段14は、4つの第二情報「化粧」「Diet」「保険」「梅田」を用いて、コンテンツ格納装置3に格納されている1または2以上の広告を取得する。
次に、出力手段15は、検索手段14が取得した1以上の広告を端末装置2に送信する。なお、図示しない手段により、端末装置2には、ウェブページも送信される。そして、端末装置2の端末受信手段23は、ウェブページと1以上の広告を受信する。次に、端末出力手段24は、受信されたウェブページ上に、1以上の広告を挿入し、広告を含むウェブページを出力する。
次に、情報検索装置1の関連度取得手段16が、関連度情報を取得するための具体的な動作について説明する。
今、選択ログ格納手段10は、例えば、図9に示す多数のクリックログを格納している。クリックログは、クエリ特徴空間と広告の情報空間とを有する。クエリ特徴空間は、ユーザが検索に用いた用語であるクエリ用語とユーザコンテキストとを有する。ユーザコンテキストは、ここでは、性別、年代、位置(ユーザの位置)などを有する。また、広告の情報空間は、1以上の単語を有する。
なお、クリックログは、ここでは、例えば、ユーザがウェブページに表示された広告をクリックした際に取得される情報である。クリックログの収集方法は公知技術であるので、詳細な説明は省略する。なお、クリックログは、選択ログの一例である。また、クエリ特徴空間が有するクエリ用語やユーザコンテキストは、第一情報の例である。さらに、広告の情報空間の各単語は、第二情報の例である。
また、ここでの広告は、例えば、テキスト広告であり、広告と1以上の単語とが対応付いている、とする。なお、1以上の単語は、広告の特徴を良く示す単語であり、例えば、その広告において、tf−idf値が閾値より大きい1以上の単語である。なお、tf−idf値は公知技術であるので説明は省略する。
かかる状況において、関連度取得手段16は、選択ログ格納手段10の多数のクリックログから、1以上の各第一情報と1以上の各第二情報と関連度情報を取得する。ここで、関連度取得手段16は、クエリ特徴空間を構成する情報であるクエリ特徴(q)と、広告の情報空間を構成する情報である広告単語(a)との関連度を示す関連度情報(wij)を算出する。具体的には、関連度取得手段16は、クエリ特徴(q)と広告単語(a)とが対応付いているクリックログが多いほど、大きな値となる関連度情報(wij)を算出する。
さらに具体的には、関連度取得手段16は、例えば、以下の第一の方法、または第二の方法により、関連度情報(wi,j)を算出する。
(第一の方法)
関連度取得手段16は、全クリックログの中で、クエリ特徴(q)と広告単語(a)とが対応付いている確率を、クエリ特徴(q)と広告単語(a)との組み合わせごとに取得する。そして、関連度取得手段16は、上記確率を要素とする変換行列を取得する。なお、対応付いている確率とは、クリックログの中で、クエリ特徴(q)と広告単語(a)の両方が出現する確率である。
(第二の方法)
関連度取得手段16は、クエリ特徴(q)と広告単語(a)との組み合わせごとに、以下の数式1を用いて、mi,jを算出する。mi,jは関連度情報である。
数式1のctr(q,a)は、クリックログの中で、クエリ特徴(q)と広告単語(a)の両方が出現する確率である。なお、ctr(q,a)は、上述した第二選択率である。また、第二選択率は、1以上の各第一情報および1以上の各第二情報に対応するコンテンツの選択率である。
また、数式1のctr(a)は、広告単語(a)が出現する確率である。なお、ctrは、「click-through rate」の略である。なお、ctr(a)は、上述した第一選択率である。また、第一選択率は、1以上の各第二情報に対応するコンテンツの選択率である。
そして、大きな値をとるmi,jは、「広告単語(a)を含む広告は、クエリがクエリ特徴(q)を含む場合、よりクリックされやすいこと」を示す。
そして、関連度取得手段16は、mi,jが予め決められた条件を満たすほど大きい第一情報と第二情報との関連度情報(mi,j)のみを取得する。ここで、予め決められた条件は、例えば、1以上の各クエリ特徴(q)ごとに、上位Mfilter個のmi,jのみを採用することである(数式2参照)。なお、Mfilterは、1以上の自然数である。また、Aは採用されたmi,jである。
(実験)
以下、上記の第二の方法を用いた場合の実験結果について説明する。本実験において、ウェブページに出力される広告のクリックログを用いた。つまり、コンテンツは広告である。
本実験において、6週間のクリックログを用いた。6週間のクリックログのうち、最初の4週間のクリックログを変換行列の学習のために使用した。次の1週間のクリックログを変換行列の検証のために使用した。そして、最後の1週間のクリックログをテストのために使用した。ここで検証とは、SVMのCのようなハイパーパラメータを交差検定により調整することをいう。
また、ここでのクリックログの構造は、(q(r),a(r) ,y(r) )である。ここで、「q(r)」は、リクエストrのクエリ特徴ベクトルである。また、「a(r) 」は、リクエストrのi番目の出力される広告の広告特徴ベクトルである。また、「y(r) 」は、出力値であり、ユーザが広告をクリックした場合は「1」、クリックしなかった場合は「0」を採り得る値である。
また、「q(r)」は、出力されるウェブページから抽出される単語とユーザコンテキストとを含む。ウェブページから抽出される単語は、広告が有するタイトルや記述の単語に対して、tf−idf値が大きな単語である。また、ユーザコンテキストは、性別、年代、位置を用いた。性別は、男性、女性、または不明のいずれかを採り得る。また、年代は、10年ごとにグループ化し、10代、20代、30代等の情報を採り得る。
また、本実験においてバイアス特徴(xbias)をも用いた。バイアス特徴は、広告の特徴量、広告のウェブページ上の位置、単語ベクトルコサイン値等の類似度である。広告の特徴量とは、tf−idf値が大きな単語、広告や広告主の過去のクリック率(CTR)である。なお、以上の実験で使用した特徴量を図10に示す。図10は、「特徴のタイプ」「元データ」「詳細」を有する。「元データ」は特徴ベクトルを構成する要素(特徴量)を取得するための元になるデータである。「詳細」は特徴量の詳細、具体例である。
また、実験で使用したウェブサイトの情報を図11に示す。実験では、A〜Hの8つのウェブサイトを使用した。また、図11において、|R|はクリックの回数、N(r)はクリックごとの出力される広告の平均数、#clicksはクリックリクエストごとのクリックされる平均の広告の数を示す。
以上の条件のもと、本願の手法(第二の方法)と、ベースラインモデルとの比較を行った。ベースラインモデルにおいて、バイアス特徴のみを使用している。ベースラインモデルは、バイアス項のみを特徴量とした手法である。なお、バイアス項は、例えば、広告本来のクリックされやすさや、単純な単語ベクトル同士のコサイン類似度等である。
また、広告検索システムのパフォーマンスの向上のため、クエリ特徴の単語の数(Mretrieve)に制限を設けた。そして、実験では、Mretrieveの値を変更し、評価を行った。スコアリング関数は、以下の数式3である。
数式3において、simtruncated関数は、これまで出てきたSim関数を変形したもので、各クエリ特徴の変換ワードをMretrieve個に制限したときの類似度関数を表す。また、実験において、各クエリ特徴の変換ワードを制限せず、評価時にMretrieveを変化させることにより、精度の変化を検出した。
また、本実験において、MAP(「C. D. Manning, P. Raghavan, and H. Schtze. Introduction to Information Retrieval. Cambridge University Press, 2008.」参照)を用いて、モデルのパフォーマンスを評価した。
MAPは、"mean average precision"の略であり、以下の数式4により示される。数式4において、AP(r)は、リクエストrにおいてkを増加させていき、表示された全広告で精度の平均を取ったものである。また、P (r)は、r番目のリクエストの予測スコア上位k番目までを見たときの精度を表している。また、ここで、「π(r)(k)」は、r番目のリクエストにおいて、予測スコアがk番目の広告(impression)を表している。
また、本実験において、ベースラインモデルにより、方法のスコアを正規化した(数式5参照)。
まず、Mfilterを変化させて、本願の方法を評価した。変換行列Wの中の要素に関して、Mfilterに応じて、0でない要素が変化する。つまり、Mfilterを大きくすると、モデルパフォーマンスが改善されることが期待できる。Mfilterを変化させた実験の結果を図12に示す。
図12において、本願の方法はベースラインモデルと比較して、ウェブサイトG以外では、改善されたことが分かる。また、ウェブサイトFを除いて、改善の程度は、学習時のセットのサンプル数に比例している(図11参照)。
また、ウェブサイトA,B,C,Fにおいて、Mfilterを大きくすればするほど、改善の程度が増加している。一方、ウェブサイトDにおいて、Mfilterを大きくすると、改善の程度が若干減少している。
次に、実験において、Mretrieveの値を変更した場合に、各Mfilterの値ごとに、どのようなパフォーマンスを実現できるかを検証した。上述したように、実験において、Mretrieveを変化させ、評価時には、クエリタームベクトルを切り捨て、学習時には切り捨てなかった。かかる実験結果を図13に示す。
図13において、ウェブサイトGとHの結果は省略されている。また、実験結果の傾向は、ウェブサイトにより異なる。例えば、ウェブサイトBにおいて、Mretrieveを100または80に制限する場合、Mfilterを40に設定するモデルの性能が最も高くなる。また、Mretrieveを60以下に制限する場合、Mfilterを60に設定するモデルの性能が最も高くなる。
一方、ウェブサイトのFにおいて、Mretrieveが100または80に制限されているときに、Mfilterを100に設定するモデルの性能が最も高くなる。また、Mretrieveが60以下に制限されている場合には、最高のMfilterは、各Mretrieveで異なっている。
以上の実験結果において、最適なMfilterがMretrieveとウェブサイトの両方に依存して変化することを示している。
以上より、実際の広告配信設定で、Mretrieveが最初の広告検索システムの性能によって決定され、その後Mfilterは、それぞれのウェブサイト用に調整する必要がある。
以上、本実施の形態によれば、ユーザにとって必要なコンテンツを検索できる。
なお、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における情報検索装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータがアクセス可能な記録媒体は、1または2以上の各第一情報と1または2以上の各第二情報との関連度を示す1以上の関連度情報を格納し得る関連度情報格納手段を具備し、コンピュータを、コンテンツの検索に使用する1以上の情報である1以上のクエリ情報を含むクエリを受け付ける受付手段と、前記1以上の各クエリ情報に対応する1以上の第一情報と、前記1以上の関連度情報とを用いて、予め決められた条件を満たすほど、前記1以上の第一情報に対する関連度が大きい1以上の第二情報を取得するクエリ変換手段と、前記クエリ変換手段が取得した1以上の第二情報を用いて、コンテンツを検索する検索手段とを具備する情報検索装置として機能させるためのプログラム、である。
また、前記関連度情報格納手段は、1以上の各第一情報と1以上の各第二情報との関連度を示す関連度情報を要素として有する関連度行列である変換行列を格納しており、上記プログラムにおいて、前記クエリ変換手段は、前記受付手段が受け付けた1以上のクエリ情報を用いたベクトルであるクエリベクトルと前記変換行列とを乗算し、1以上の各第二情報に対応する値を取得し、当該値が予め決められた条件を満たすほど大きい値に対応する1以上の第二情報を取得する ものとして、コンピュータを機能させるプログラムであることは好適である。
また、上記プログラムにおいて、コンピュータを1以上のクエリ情報である1以上の第一情報と、選択されたコンテンツに対応付いている1以上の第二情報とを有する1以上の選択ログから、1以上の各第一情報と1以上の各第二情報と関連度情報を取得する関連度取得手段としてさらに機能させ、前記関連度取得手段が取得した1以上の関連度情報は、前記関連度情報格納手段に格納されている1以上の関連度情報である ものとして、コンピュータを機能させるプログラムであることは好適である。
また、上記プログラムにおいて、前記関連度取得手段は、前記1以上の選択ログから、1以上の各第一情報と1以上の各第二情報と関連度情報を要素として有する変換行列を取得するものとして、コンピュータを機能させるプログラムであることは好適である。
また、上記プログラムにおいて、前記関連度取得手段は、前記1以上の各第一情報ごとに、前記1以上の各第二情報に対応するコンテンツの選択率である第一選択率と、前記1以上の各第一情報および前記1以上の各第二情報に対応するコンテンツの選択率である第二選択率とを、前記選択ログから取得し、前記1以上の各第二情報ごとに、当該第一選択率と当該第二選択率との比を算出し、当該比が予め決められた条件を満たすほど大きい第一情報と第二情報との関連度情報のみを取得するものとして、コンピュータを機能させるプログラムであることは好適である。
また、上記プログラムにおいて、前記コンテンツは、第二情報と当該第二情報の重みを示す重み情報との組である1以上の被検索情報と対応付けられており、前記検索手段は、前記クエリ変換手段が取得した1以上の、第二情報および値の組を用いて、コンテンツを検索するものとして、コンピュータを機能させるプログラムであることは好適である。
また、図14は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の情報検索装置を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図14は、このコンピュータシステム300の概観図であり、図15は、システム300のブロック図である。
図14において、コンピュータシステム300は、CD−ROMドライブを含むコンピュータ301と、キーボード302と、マウス303と、モニタ304と、マイク305と、スピーカー306とを含む。
図15において、コンピュータ301は、CD−ROMドライブ3012に加えて、MPU3013と、バス3014と、ROM3015と、RAM3016と、ハードディスク3017とを含む。なお、バス3014は、MPU3013やCD−ROMドライブ3012に接続されている。また、ROM3015には、ブートアッププログラム等のプログラムが記憶されている。また、RAM3016は、MPU3013に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのものである。また、ハードディスク3017は、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのものである。ここでは、図示しないが、コンピュータ301は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
コンピュータシステム300に、上述した実施の形態の情報検索装置の機能を実行させるプログラムは、CD−ROM3101に記憶されて、CD−ROMドライブ3012に挿入され、さらにハードディスク3017に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ301に送信され、ハードディスク3017に記憶されても良い。プログラムは実行の際にRAM3016にロードされる。プログラムは、CD−ROM3101またはネットワークから直接、ロードされても良い。
プログラムは、コンピュータ301に、上述した実施の形態の情報検索装置の機能を実行させるオペレーティングシステム、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム300がどのように動作するかは周知であり、詳細な説明は省略する。
なお、上記プログラムにおいて、情報を送信するステップや、情報を受信するステップなどでは、ハードウェアによって行われる処理、例えば、送信するステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
また、上記各実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。
また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
以上のように、本発明にかかる情報検索装置は、ユーザにとって必要なコンテンツを検索できるという効果を有し、広告配信システム等として有用である。
1 情報検索装置
2 端末装置
3 コンテンツ格納装置
10 選択ログ格納手段
11 関連度情報格納手段
12 受付手段
13 クエリ変換手段
14 検索手段
15 出力手段
16 関連度取得手段
21 端末受付手段
22 端末送信手段
23 端末受信手段
24 端末出力手段
31 コンテンツ格納手段
32 コンテンツ送信手段

Claims (8)

  1. 1または2以上の各第一情報と1または2以上の各第二情報との関連度を示す関連度情報を要素として有する関連度行列である変換行列を格納し得る関連度情報格納手段と、
    ユーザが入力した1以上のキーワードである1以上のクエリ情報とユーザコンテキストを取得するための情報とを受信し、当該ユーザコンテキストを取得するための情報を用いて、ユーザコンテキストを取得する受付手段と、
    前記ユーザが入力した1以上のキーワードと前記ユーザコンテキストとを用いたベクトルであるクエリベクトルの中で1に対応する行の要素の値を前記変換行列から取得し、当該取得した要素の値を加算し、1以上の各第二情報に対応する値を取得し、当該値が予め決められた条件を満たすほど大きい値に対応する1以上の第二情報を取得するクエリ変換手段と、
    前記クエリ変換手段が取得した1以上の第二情報を用いて、コンテンツを検索する検索手段とを具備し、
    1以上のクエリ情報である1以上の第一情報と、選択されたコンテンツに対応付いている1以上の第二情報とを有する1以上の選択ログから、前記1以上の各第一情報ごとに、前記1以上の各第二情報に対応するコンテンツの選択率である第一選択率と、前記1以上の各第一情報および前記1以上の各第二情報に対応するコンテンツの選択率である第二選択率とを取得し、
    前記1以上の各第二情報ごとに、当該第一選択率と当該第二選択率との比を算出し、
    当該比が予め決められた条件を満たすほど大きい第一情報と第二情報との関連度情報のみを取得する関連度取得手段をさらに具備し、
    前記関連度取得手段が取得した1以上の関連度情報は、前記関連度情報格納手段に格納されている1以上の関連度情報である情報検索装置。
  2. 前記関連度取得手段は、
    前記1以上の選択ログから、1以上の各第一情報と1以上の各第二情報と関連度情報を要素として有する変換行列を取得する請求項記載の情報検索装置。
  3. 前記1以上の第一情報である第一情報集合は、
    1以上のクエリ情報であるクエリの特徴空間であり、
    前記1以上の第二情報である第二情報集合は、
    検索対象の1以上のコンテンツに対応付いている情報の集合であるコンテンツ情報空間である請求項1から請求項いずれか一項に記載の情報検索装置。
  4. 前記ユーザコンテキストは、
    ユーザの性別、年齢、年齢層、ユーザが居る位置を示す位置情報、前記受付手段がクエリ情報を受信した際の天気や季節や時刻、ユーザが使用している端末装置の種類のうちのいずれか1以上の情報である請求項1から請求項いずれか一項に記載の情報検索装置。
  5. 前記コンテンツは、
    第二情報と当該第二情報の重みを示す重み情報との組である1以上の被検索情報と対応付けられており、
    前記検索手段は、
    前記クエリ変換手段が取得した1以上の、第二情報および値の組を用いて、コンテンツを検索する請求項1から請求項いずれか一項に記載の情報検索装置。
  6. 前記コンテンツは、広告である請求項1から請求項いずれか一項に記載の情報検索装置。
  7. 記録媒体は、
    1または2以上の各第一情報と1または2以上の各第二情報との関連度を示す関連度情報を要素として有する関連度行列である変換行列を格納し得る関連度情報格納手段を具備し、
    受付手段、クエリ変換手段、検索手段、および関連度取得手段により実現される情報検索方法であって、
    前記受付手段が、ユーザが入力した1以上のキーワードである1以上のクエリ情報とユーザコンテキストを取得するための情報とを受信し、当該ユーザコンテキストを取得するための情報を用いて、ユーザコンテキストを取得する受付ステップと、
    前記クエリ変換手段が、前記ユーザが入力した1以上のキーワードと前記ユーザコンテキストとを用いたベクトルであるクエリベクトルの中で1に対応する行の要素の値を前記変換行列から取得し、当該取得した要素の値を加算し、1以上の各第二情報に対応する値を取得し、当該値が予め決められた条件を満たすほど大きい値に対応する1以上の第二情報を取得するクエリ変換ステップと、
    前記検索手段が、前記クエリ変換ステップで取得された1以上の第二情報を用いてコンテンツを検索する検索ステップとを具備し、
    前記関連度取得手段が、1以上のクエリ情報である1以上の第一情報と、選択されたコンテンツに対応付いている1以上の第二情報とを有する1以上の選択ログから、前記1以上の各第一情報ごとに、前記1以上の各第二情報に対応するコンテンツの選択率である第一選択率と、前記1以上の各第一情報および前記1以上の各第二情報に対応するコンテンツの選択率である第二選択率とを取得し、
    前記1以上の各第二情報ごとに、当該第一選択率と当該第二選択率との比を算出し、
    当該比が予め決められた条件を満たすほど大きい第一情報と第二情報との関連度情報のみを取得する関連度取得ステップをさらに具備し、
    前記関連度取得ステップで取得された1以上の関連度情報は、前記関連度情報格納手段に格納されている1以上の関連度情報である情報検索方法。
  8. コンピュータがアクセス可能な記録媒体は、
    1または2以上の各第一情報と1または2以上の各第二情報との関連度を示す関連度情報を要素として有する関連度行列である変換行列を格納し得る関連度情報格納手段を具備し、
    コンピュータを、
    ユーザが入力した1以上のキーワードである1以上のクエリ情報とユーザコンテキストを取得するための情報とを受信し、当該ユーザコンテキストを取得するための情報を用いて、ユーザコンテキストを取得する受付手段と、
    前記ユーザが入力した1以上のキーワードと前記ユーザコンテキストとを用いたベクトルであるクエリベクトルの中で1に対応する行の要素の値を前記変換行列から取得し、当該取得した要素の値を加算し、1以上の各第二情報に対応する値を取得し、当該値が予め決められた条件を満たすほど大きい値に対応する1以上の第二情報を取得するクエリ変換手段と、
    前記クエリ変換手段が取得した1以上の第二情報を用いてコンテンツを検索する検索手段とを具備する情報検索装置として機能させるためのプログラムであって、
    コンピュータを、
    1以上のクエリ情報である1以上の第一情報と、選択されたコンテンツに対応付いている1以上の第二情報とを有する1以上の選択ログから、前記1以上の各第一情報ごとに、前記1以上の各第二情報に対応するコンテンツの選択率である第一選択率と、前記1以上の各第一情報および前記1以上の各第二情報に対応するコンテンツの選択率である第二選択率とを取得し、
    前記1以上の各第二情報ごとに、当該第一選択率と当該第二選択率との比を算出し、
    当該比が予め決められた条件を満たすほど大きい第一情報と第二情報との関連度情報のみを取得する関連度取得手段としてさらに機能させ、
    前記関連度取得手段が取得した1以上の関連度情報は、前記関連度情報格納手段に格納されている1以上の関連度情報であるプログラム
JP2013215927A 2013-10-17 2013-10-17 情報検索装置、情報検索方法、およびプログラム Active JP6168963B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013215927A JP6168963B2 (ja) 2013-10-17 2013-10-17 情報検索装置、情報検索方法、およびプログラム
US14/319,701 US9582772B2 (en) 2013-10-17 2014-06-30 Information retrieval device, information retrieval method, and non-transitory computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013215927A JP6168963B2 (ja) 2013-10-17 2013-10-17 情報検索装置、情報検索方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2015079349A JP2015079349A (ja) 2015-04-23
JP6168963B2 true JP6168963B2 (ja) 2017-07-26

Family

ID=52827134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013215927A Active JP6168963B2 (ja) 2013-10-17 2013-10-17 情報検索装置、情報検索方法、およびプログラム

Country Status (2)

Country Link
US (1) US9582772B2 (ja)
JP (1) JP6168963B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7354072B2 (ja) * 2020-09-16 2023-10-02 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7028024B1 (en) * 2001-07-20 2006-04-11 Vignette Corporation Information retrieval from a collection of information objects tagged with hierarchical keywords
JP4492190B2 (ja) * 2004-04-07 2010-06-30 ソニー株式会社 情報処理装置および方法、プログラム
US20080086356A1 (en) 2005-12-09 2008-04-10 Steve Glassman Determining advertisements using user interest information and map-based location information
WO2008053516A1 (fr) * 2006-10-30 2008-05-08 Cirius Technologies, Inc. Procédé, système et programme de fourniture d'informations publicitaires et base de données
JP4962967B2 (ja) * 2008-01-11 2012-06-27 ヤフー株式会社 Webページ検索サーバ及びクエリ推薦方法
WO2010085773A1 (en) * 2009-01-24 2010-07-29 Kontera Technologies, Inc. Hybrid contextual advertising and related content analysis and display techniques
JP2011090546A (ja) * 2009-10-23 2011-05-06 Ntt Docomo Inc 番組連動コンテンツ配信サーバ及び番組連動コンテンツ配信システム
US20110131205A1 (en) * 2009-11-28 2011-06-02 Yahoo! Inc. System and method to identify context-dependent term importance of queries for predicting relevant search advertisements
KR101344913B1 (ko) * 2011-07-22 2013-12-26 네이버 주식회사 지역별 자동완성 질의어 제공 시스템 및 방법

Also Published As

Publication number Publication date
JP2015079349A (ja) 2015-04-23
US20150113003A1 (en) 2015-04-23
US9582772B2 (en) 2017-02-28

Similar Documents

Publication Publication Date Title
US10380160B2 (en) Dynamic language model
JP6554685B2 (ja) 検索結果を提供するための方法及び装置
US9355168B1 (en) Topic based user profiles
JP5984917B2 (ja) 提案される語を提供するための方法および装置
US8341185B2 (en) Method and apparatus for context-indexed network resources
US20220365939A1 (en) Methods and systems for client side search ranking improvements
US20120036153A1 (en) Mobile system, search system and search result providing method for mobile search
US20120124034A1 (en) Co-selected image classification
US8635062B2 (en) Method and apparatus for context-indexed network resource sections
US20100250335A1 (en) System and method using text features for click prediction of sponsored search advertisements
CN107958042B (zh) 一种目标专题的推送方法及移动终端
US20140351267A1 (en) Overlapping Community Detection in Weighted Graphs
KR20180126577A (ko) 관련 엔티티 탐색
CN106095766A (zh) 使用选择性重新讲话来校正话音识别
US11249993B2 (en) Answer facts from structured content
JP2015008009A (ja) ユーザデータに基づいてネットワーク機能を識別する方法及び装置
WO2011111038A2 (en) Method and system of providing completion suggestion to a partial linguistic element
US10404816B2 (en) Determining browsing activities
GB2569858A (en) Constructing content based on multi-sentence compression of source content
JP2009265754A (ja) 情報提供装置、情報提供方法及び情報提供プログラム
KR20130064447A (ko) 사용자의 성향 유사도를 이용한 검색 결과 제공 서버 및 방법, 그리고 단말
JP6168963B2 (ja) 情報検索装置、情報検索方法、およびプログラム
JP2010198492A (ja) 情報選択指標推定方法、情報選択指標推定装置、情報選択指標推定プログラム、情報提供方法および情報提供システム
CN111507471B (zh) 一种模型训练方法、装置、设备及存储介质
US9116996B1 (en) Reverse question answering

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131209

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151013

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160628

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160628

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20160726

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20160902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170627

R150 Certificate of patent or registration of utility model

Ref document number: 6168963

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250