JP7144558B2 - 検索システム、および検索方法 - Google Patents

検索システム、および検索方法 Download PDF

Info

Publication number
JP7144558B2
JP7144558B2 JP2021037257A JP2021037257A JP7144558B2 JP 7144558 B2 JP7144558 B2 JP 7144558B2 JP 2021037257 A JP2021037257 A JP 2021037257A JP 2021037257 A JP2021037257 A JP 2021037257A JP 7144558 B2 JP7144558 B2 JP 7144558B2
Authority
JP
Japan
Prior art keywords
information
model
feature information
article
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021037257A
Other languages
English (en)
Other versions
JP2021096867A (ja
Inventor
俊介 中嶋
俊平 大倉
秀平 宇野
真吾 星野
祐司 佐藤
洋平 猿田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2021037257A priority Critical patent/JP7144558B2/ja
Publication of JP2021096867A publication Critical patent/JP2021096867A/ja
Application granted granted Critical
Publication of JP7144558B2 publication Critical patent/JP7144558B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、検索システム、および検索方法に関する。
従来、ベクトル化された状況データと、コンテンツデータとを集約させて、新しい集約データを作成し、新しい集約データに基づいてコンテンツ嗜好モデルを更新するコンテンツ推薦システムが知られている(特許文献1参照)。
特開2013-69266号公報
しかしながら、従来の技術では、リアルタイムで提供されるサービスに関連したスムーズな検索を実現することができない場合があった。
本発明は、このような事情を考慮してなされたものであり、スムーズな検索を実現することができる検索システム、および検索方法を提供することを目的の一つとする。
本発明の一態様は、第1情報を第1のモデルに入力することで第1特徴情報を生成し、第1の記憶部に記憶させる第1の生成部と、第2情報を、前記第1のモデルと関連性を有する第2のモデルに入力することで第2特徴情報を生成し、第2の記憶部に記憶させる第2の生成部と、前記第1特徴情報を用いて前記第2の記憶部を検索し、前記第1特徴情報に関連する第2特徴情報を取得する検索部と、を備え、前記第1の生成部と前記第2の生成部のそれぞれは、使用されるモデルの世代が異なる複数のチャネルを有し、各チャネルで並行して処理を実行し、前記複数のチャネルから現用系のチャネルを選択する管理部を更に備え、前記現用系でないチャネルで使用されている前記第1のモデルと前記第2のモデルとが、所定タイミングで新たなモデルに更新される、検索システムである。
本発明の一態様によれば、スムーズな検索を実現することができる検索システム、および検索方法を提供することができる。
検索システムの一部を構成するレコメンド管理装置30の使用環境の一例を示す図である。 ユーザ情報22の内容の一例を示す図である。 配信記事情報24の内容の一例を示す図である。 行動ログ26の内容の一例を示す図である。 検索システムの全体構成図である。 記事ベクトル生成部42の処理の内容を概念的に示す図である。 ユーザベクトル生成部62の処理の内容を概念的に示す図である。 チャネルの切り替えに関するタイムスケジュールの一例を示す図である。 レコメンド管理装置30により実行される処理の流れの一例を示すフローチャートである。
以下、図面を参照し、本発明の検索システム、および検索方法の実施形態について説明する。
[概略]
検索システムは、一以上のプロセッサにより実現される。検索システムは、例えば外部からの問い合わせに応じて、ある特徴情報(第1の特徴情報)に対応する他の特徴情報(第2の特徴情報)を検索するシステムである。
第1の特徴情報は、例えば、ユーザが閲覧した記事の履歴に基づいて、第1のモデルにより生成されるユーザベクトルである。ユーザベクトルは、そのユーザの興味の対象を示すものと考えられる。記事とは、インターネットなどのネットワークを介して提供される電子的な記事であり、テキスト情報を含むものである。記事は、ブラウザによって再生されるウェブページの一部として提供されるものであってもよいし、アプリケーションプログラムによって表示されるアプリページの一部として提供されるものであってもよい。
第2の特徴情報は、例えば、記事に基づいて生成される記事ベクトルである。記事ベクトルは、例えば、記事に含まれる単語を形態素解析等によって抽出した後、word2vec等の手法により分散表現化した単語ベクトルを第2のモデルに入力することで生成される。
ここで、第1の特徴情報であるユーザベクトルは、例えば、第2の特徴情報である記事ベクトルを利用して生成される。例えば、ユーザベクトルは、ユーザが閲覧した記事のそれぞれに対して生成されている記事ベクトルの集合を、第1のモデルに入力することで生成される。ユーザベクトルも、分散表現で表されるベクトルである。
このように、第1の特徴情報であるユーザベクトルと第2の特徴情報である記事ベクトル、並びに第1のモデルと第2のモデルは、意味的な関連性を有するものである。上記の例では、記事ベクトルの定義が変更されると、記事ベクトルからユーザベクトルを生成するモデルも変更する必要があるからである。
ユーザベクトルに対応する記事ベクトルが得られると、検索システムは、得られた記事ベクトルに対応する記事を、当該ユーザに対応するレコメンド記事として問い合わせ元に返す。これによって、ユーザが関心・興味のある内容に近い記事が、当該ユーザに提供されることになり、ウェブページないしアプリページの魅力を維持・向上することができる。
このような検索サービスを提供する中で、検索システムは、モデル更新をスムーズに行うための処理および仕組みを有している。また、モデル更新の後に古いバージョンのユーザデータを用いて検索を行うことが無いように、特徴的な処理を行っている。これらについては、以下の説明で段階的に開示する。
[構成]
図1は、検索システムの一部を構成するレコメンド管理装置30の使用環境の一例を示す図である。図示の例では、一以上のユーザ端末10が、ネットワークNWを介してサービスサーバ20に接続されている。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、プロバイダ端末、無線通信網、無線基地局、専用回線などを含む。また、レコメンド管理装置30もネットワークNWに接続されており、サービスサーバ20と通信する。なお、本実施形態に登場する構成要素は、ネットワークNWその他のネットワークに接続するための通信インターフェースを備えているものとする。通信インターフェースは、NIC(Network Interface Card)などのネットワークカード、無線通信モジュールなどを含む。
[ユーザ端末]
ユーザ端末10は、例えば、スマートフォンなどの携帯電話、タブレット端末、各種パーソナルコンピュータなどの、入力装置、表示装置、通信装置、記憶装置、および演算装置を備える端末装置である。ユーザ端末10では、ブラウザやアプリケーションプログラムなどのUA(User Agent)が起動し、ユーザの入力する内容に応じたリクエストをサービスサーバ20に送信する。また、UAは、サービスサーバから取得した情報に基づいて、各種画像を表示する。
[サービスサーバ]
サービスサーバ20は、ブラウザからのリクエストに応じてウェブページをユーザ端末10に提供するウェブサーバ、またはアプリケーションプログラムからのリクエストに応じて画像や音声を提供するユーザ端末10に提供するアプリサーバである。
サービスサーバ20の提供するサービスは、例えば、ユーザIDとパスワードを入力しログインすることで、より個別のユーザに対してカスタマイズされたサービスとして提供される。なお、サービスサーバ20がウェブサーバである場合、ログインしなくてもウェブページの提供を受けることはできるが、その場合、ユーザに対するカスタマイズがされていない汎用のウェブページが提供される。
サービスサーバ20は、ユーザによるログインがなされると、例えば、ユーザIDを指定した問い合わせをレコメンド管理装置30に送信する。レコメンド管理装置30は、ユーザIDにより示されるユーザに推薦する記事の記事IDを、サービスサーバ20に返信する。サービスサーバ20は、所定の画面(例えばウェブサイトやアプリページのトップページ)に、レコメンド管理装置30から受信した記事IDにより示される記事を掲載してユーザ端末10に送信する。
サービスサーバ20は、サーバ内あるいは外部の記憶装置(不図示)に、ユーザ情報22、配信記事情報24、および行動ログ26を記憶させている。
図2は、ユーザ情報22の内容の一例を示す図である。ユーザ情報22は、例えば、ユーザの識別情報であるユーザIDに対し、パスワード、および年齢、性別、誕生日、職業その他のデモグラ情報が対応付けられた情報である。
図3は、配信記事情報24の内容の一例を示す図である。配信記事情報24は、例えば、記事の識別情報である記事IDに対し、記事データが対応付けられた情報である。記事データは、例えば、テキストデータ、画像データ、またはこれらの組み合わせ、或いはURL(Uniform Resource Locator)などの参照情報である。
図4は、行動ログ26の内容の一例を示す図である。行動ログ26は、例えば、ユーザIDごとに、閲覧したページの識別情報である閲覧ページID、閲覧したページに含まれる記事の記事ID、閲覧時刻などが互いに対応付けられた情報である。
[検索システムの全体構成]
図5は、検索システム1の全体構成図である。検索システム1は、レコメンド管理装置30の他に、例えば、記事ベクトル生成装置40(第2の生成部の一例)と、記事ベクトル記憶部50(第2の記憶部の一例)と、ユーザベクトル生成装置60(第1の生成部の一例)と、ユーザベクトル記憶部70(第1の記憶部の一例)と、記事ベクトル検索装置80(検索部の一例)と、のうち一部または全部を備える。すなわち、検索システム1は、記事ベクトル記憶部50とユーザベクトル記憶部70とを含んでもよいし、含まなくてもよい。また、レコメンド管理装置30は、管理部の一例である。なお、これらの構成要素は、適宜、統合または分散化されてもよい。例えば、レコメンド管理装置30と記事ベクトル生成装置40とユーザベクトル生成装置60は、統合された一つのプロセッサにより実現されてもよい。
レコメンド管理装置30の構成に先立って、記事ベクトル生成装置40から順に説明する。ここで、記事ベクトル生成装置40、記事ベクトル記憶部、ユーザベクトル生成装置60、およびユーザベクトル記憶部70は、チャネル1とチャネル2の二つのチャネルを有し、それぞれが並行して処理を進めている。なお、チャネルの数は二つに限らず、三つ以上のチャネルを備えてもよい。以下の説明では、括弧内の数字がチャネルを表すものとし、チャネルを区別しない場合は括弧および括弧内の数字を省略して説明する。
記事ベクトル生成装置40は、記事ベクトル生成部42(1)と、記事ベクトル生成部42(2)とを備える。図6は、記事ベクトル生成部42の処理の内容を概念的に示す図である。記事ベクトル生成部42には、記事の内容(テキスト)が入力される。記事の内容は、例えば、配信記事情報24から取得される。
記事ベクトル生成部42は、まず、記事の内容に対して形態素解析などを行って、単語(形態素)に分割する。次に、記事ベクトル生成部42は、各単語に対してword2vecなどの手法を適用して、分散表現化された単語ベクトルを取得する。形態素解析とword2vecとのうち一方または双方は、記事ベクトル生成部42が自ら処理を行うのではなく、外部装置に処理を依頼することで実現されてもよい。
そして、記事ベクトル生成部42は、記事から取得された一以上の単語ベクトルを第2のモデルに入力することで、記事ベクトルを導出する。第2のモデルは、例えば、機械学習によって生成されるモデルである。第2のモデルは、例えば、ディープラーニングなどの手法により、既知の単語ベクトルと記事ベクトルとの関係が再現できるような、隠れ層の活性化関数のパラメータを求めることで生成される。
なお、上記の定義に拘わらず、第2のモデルとは、word2vecの特定、すなわち、どのようなコーパスをword2vecに与えるか、までを含んでもよい。
記事ベクトル生成部42は、生成した記事ベクトルを、記事IDと共に記事ベクトル記憶部50に格納する。このとき、自身がチャネル1であればチャネル1データとして記事ベクトル記憶部50に格納し、自身がチャネル2であればチャネル2データとして記事ベクトル記憶部50に格納する。
記事ベクトル記憶部50は、例えば、HDD(Hard Disk Drive)やフラッシュメモリ、RAM(Random Access Memory)などの記憶装置によって実現される。記事ベクトル記憶部50は、チャネル1データと、チャネル2データとを分けて記憶領域に格納する。チャネル1データと、チャネル2データのそれぞれは、記事IDに対して記事ベクトルが対応付けられたデータである。
ユーザベクトル生成装置60は、ユーザベクトル生成部62(1)と、ユーザベクトル生成部62(2)とを備える。図7は、ユーザベクトル生成部62の処理の内容を概念的に示す図である。ユーザベクトル生成部62には、ユーザIDと、そのユーザIDにより示されるユーザが閲覧した記事の記事IDとが入力される。ユーザが閲覧した記事の記事IDは、例えば、行動ログ26から取得される。
ユーザベクトル生成部62は、まず、ユーザが閲覧した記事の記事IDに対応する記事ベクトルを記事ベクトル記憶部50から取得する。このとき、自身がチャネル1であれば記事ベクトル記憶部50のチャネル1データから記事ベクトルを取得し、自身がチャネル2であれば記事ベクトル記憶部50のチャネル2データから記事ベクトルを取得する。
そして、ユーザベクトル生成部62は、取得された一以上の記事ベクトルを第1のモデルに入力することで、ユーザベクトルを導出する。第1のモデルは、例えば、機械学習によって生成されるモデルである。第1のモデルは、例えば、ディープラーニングなどの手法により、既知の記事ベクトルとユーザベクトルとの関係が再現できるような、隠れ層の活性化関数のパラメータを求めることで生成される。ユーザベクトル生成部62は、生成したユーザベクトルを、ユーザIDと共にユーザベクトル記憶部70に格納する。このとき、自身がチャネル1であればチャネル1データとしてユーザベクトル記憶部70に格納し、自身がチャネル2であればチャネル2データとして記事ベクトル記憶部70に格納する。なお、ユーザベクトルは、閲覧した記事の記事ベクトル以外の要素を反映させて作成されてもよい。記事ベクトル以外の要素とは、例えば、ユーザの入力したクエリ、記事を有さないウェブページの閲覧履歴、ユーザの属性(年齢、性別、職業など)のうち一部または全部である。
以下、レコメンド管理装置30について説明する。レコメンド管理装置30は、例えば、チャネル切替部32と、応答部34と、ユーザベクトル検索部36と、検索依頼部38とを備える。これらの構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
チャネル切替部32は、チャネル1、チャネル2について、現用系と待機系を切り替える。詳しくは、後述する。
応答部34は、サービスサーバ20からの問い合わせに応答し、ユーザベクトル検索部36および検索依頼部38に動作指示を出力し、検索依頼部38から返された検索結果(記事ベクトル)を、レコメンド記事としてサービスサーバ20に返す。サービスサーバ20からの問い合わせは、例えば、ユーザIDを指定して行われる。応答部34は、検索対象のユーザIDをユーザベクトル検索部36に出力して、検索を行わせる。
ユーザベクトル検索部36は、入力されたユーザIDを用いてユーザベクトル記憶部70を検索し、ユーザIDに対応するユーザベクトルを取得する。このとき、ユーザベクトル検索部36は、チャネル切替部32によって現用系に設定されている方のチャネルのデータを検索する。ユーザベクトル検索部36は、検索の結果として得られるユーザベクトルを検索依頼部38に出力する。
検索依頼部38は、入力されたユーザベクトルを用いて記事ベクトル記憶部50を検索するように、記事ベクトル検索装置80に依頼する。このとき、検索依頼部38は、チャネル切替部32によって現用系に設定されている方のチャネルのデータを検索するように記事ベクトル検索装置80に依頼する。
記事ベクトル検索装置80は、依頼に応じて記事ベクトル記憶部50を検索する。記事ベクトル検索装置80は、ユーザベクトルとのベクトル間距離が小さい記事ベクトルを探索し、例えばベクトル間距離が最も小さい順に所定数の記事ベクトルを抽出する。この際に、記事ベクトル検索装置80は、k近傍探索(k-Nearest neighbor search)に類する手法を用いて検索を行ってもよい。記事ベクトル検索装置80は、検索結果を検索依頼部38に返す。検索依頼部38は、これを応答部34に返す。これによって、一ユーザについてのレコメンド記事の提供が完了する。
[チャネルの切替]
以下、検索システム1におけるチャネルの切り替えについて説明する。図8は、チャネルの切り替えに関するタイムスケジュールの一例を示す図である。チャネル1とチャネル2では、半周期ずらしてモデル(第1のモデルおよび第2のモデル)の更新が行われる。そして、更新完了後、速やかに現用系への切り替えが行われる。モデルの更新とは、学習データを直近のものに更新し、新たにモデルの学習をし直すことをいう。この学習は、瞬時には完了しないため、モデルの更新すなわち機械学習は、現用系への切り替わりタイミングに間に合うように、切り替わりタイミングから想定所要時間に余裕時間を加算した時間を逆算したタイミングで開始される。
なお、記事ベクトルは、毎日、記事が入稿されるのに応じて新たなものが生成され、記事ベクトル記憶部50に追加される。しかしながら、word2vecの機能と、word2vecにより得られた単語ベクトルから記事ベクトルを導出する規則に関しては、第2のモデルの更新がされない限り同じものが使用される。従って、第2のモデルの更新とは、例えば、word2vecに与えるコーパスの更新と、word2vecにより得られた単語ベクトルから記事ベクトルを導出する規則の更新とを含む。これに限らず、word2vecに与えるコーパスを固定、或いは第2のモデルの更新周期Tよりも長い周期で変更し、第2のモデルの更新にはword2vecに与えるコーパスの変更が含まれないものとしてもよい。
また、ユーザベクトルは、ユーザが記事を閲覧した度に、バッチ処理などによって更新される。このとき、新たな判定用情報(後述するように、例えばタイムスタンプ)がユーザベクトルに付与される。しかしながら、記事ベクトルからユーザベクトルを導出する規則に関しては、第1のモデルの更新がされない限り同じものが使用される。従って、第1のモデルの更新とは、記事ベクトルからユーザベクトルを導出する規則の更新を意味する。
第1のモデルおよび第2のモデルは、更新周期Tごとに、更新開始日から参照期間Xまで遡った日までのデータに基づいて更新される。このとき、更新開始日から参照期間Xまで遡った日までに作成されていた記事ベクトルは、新たな第2のモデルによって作成し直される。また、更新開始日から参照期間Xまで遡った日までに作成されていたユーザベクトルも、新たな第1のモデルおよび作成し直された記事ベクトルを用いて作成し直される。但し、モデルの更新に伴ってユーザベクトルが作成し直された際に、タイムスタンプは変更されない。図8では、更新周期Tと参照期間Xが一致しているように示しているが、参照期間Xは更新周期Tよりも長い期間であってもよいし、短い期間であってもよい。
現用系の切り替えは、例えば、更新周期Tの半分の周期T/2で実行される。例えば、T/2は二週間程度の期間である。現用系の切り替え日は、予めカレンダー上で定められており、その日に間に合うようにモデルの更新が行われる。また、現用系の切り替え日は、レコメンド管理装置30の方でも把握しており、その日の例えば午前ゼロ時が到来すると、レコメンド管理装置30は、参照先のチャネルを切り替える。
このような仕組みによって、実施形態の検索システム1は、現用系と待機系とを遅滞なく切り替えることができ、スムーズにモデルの更新を実現することができる。
[タイムスタンプについて]
ユーザベクトルは、統計的に有用な情報であるため、更新周期Tよりも長い期間(例えば一か月程度)、保持される場合がある。この場合、ユーザが何も記事を閲覧しない状態が、参照期間Xよりも長い間、継続したとすると、古いバージョンの第1のモデルおよび第2のモデルによって作成されたユーザベクトルがユーザベクトル記憶部70に格納される可能性がある。この場合、前提としている記事ベクトルが異なるのであるから、記事ベクトル検索装置80による検索が有意なものとならない場合がある。
そこで、実施形態の検索システム1では、ユーザベクトル生成装置60が、ユーザベクトルを生成する度に、直近のモデルによって作成された情報であることを確認可能な判定用情報をユーザベクトルに付随させてユーザベクトル記憶部70に記憶させる。なお、以下の説明では、直近のモデルとは、チャネルごとの直近の第1のモデルおよび直近の第2のモデルを指すものとする。判定用情報とは、例えば、ユーザベクトルを生成した時刻、ユーザベクトルをユーザベクトル記憶部70に記憶させた時刻など、ユーザベクトルを生成した時刻の近傍の時刻を示すタイムスタンプである。
そして、レコメンド管理装置30は、サービスサーバ20からの問い合わせに応じてユーザベクトルをユーザベクトル記憶部70から取得する際に、判定用情報を合わせて読み出し、判定用情報に基づいて、読み出したユーザベクトルが、直近のモデルによって作成された情報であることを確認する。レコメンド管理装置30は、タイムスタンプを現在時刻と比較し、その差分の時間が参照期間Xを超える場合には、必ずしも直近のモデルによって作成された情報であることが確認できないため、ユーザベクトルを指定した検索依頼を記事ベクトル検索装置80に出力しない。この場合、レコメンド管理装置30は、例えば「レコメンド記事なし」を示す応答を、サービスサーバ20に返す。この結果、サービスサーバ20では、例えば、アクセス数やCTR(Click Through Ratio)などの指標値が良好な記事から順に、ユーザに記事を配信する。
このような仕組みによって、実施形態の検索システム1は、不適切なレコメンド記事がユーザに配信されるのを防止することができる。
また、タイムスタンプをユーザベクトルに付与しておくことで、レコメンド管理装置30は、現用系のチャネルがチャネル1とチャネル2のいずれであるかを知る必要が無くなる。レコメンド管理装置30は、更新周期Tを把握しているため、ユーザベクトル記憶部70にあるユーザベクトルに付与されたタイムスタンプと現在の時刻を比較することで、どのチャネルが現用系のチャネルであるかを判断することができる。
ここで、タイムスタンプに代えて、第1のモデルおよび第2のモデルのバージョン情報を判定用情報とすることもできる。しかしながら、この場合、ユーザベクトルにタイムスタンプが付与されていないため、レコメンド管理装置30において、現用系のチャネルの情報と、モデルのバージョン情報とを認識する必要があり、これらの情報を指定してユーザベクトル記憶部70にデータ取得要求を出力する必要がある。これによって処理負担や通信量が増大するため、タイムスタンプを判定用情報とすることが、より好ましい。
[処理フロー]
図9は、レコメンド管理装置30により実行される処理の流れの一例を示すフローチャートである。このフローチャートの処理は、レコメンド管理装置30の応答部34がサービスサーバ20から問い合わせを受けたときに開始される。
まず、レコメンド管理装置30のユーザベクトル検索部36は、ユーザベクトル記憶部70からユーザベクトルと判定用情報を取得する(S100)。
次に、レコメンド管理装置30の検索依頼部38は、判定用情報に基づいて、ユーザベクトルが直近のモデルによって作成された情報であることが確認できるか否かを判定する(S102)。
ユーザベクトルが直近のモデルによって作成された情報であることが確認される場合、検索依頼部38は、ユーザベクトルを指定して記事ベクトル検索装置80に検索依頼をする(S104)。ユーザベクトルが直近のモデルによって作成された情報であることが確認されない場合、S104の処理はスキップされる。
そして、応答部34は、記事ベクトル検索装置80から取得された記事ベクトル、或いは「レコメンド記事なし」のいずれかの応答を、サービスサーバ20に返す(S106)。これによって、フローチャートの処理が終了する。
以上説明した実施形態の検索システム、および検索方法によれば、ユーザが閲覧した記事の履歴を第1のモデルに入力することでユーザベクトルを生成し、ユーザベクトル記憶部70に記憶させるユーザベクトル生成装置60と、ネットワークを介して配信される記事を第2のモデルに入力することで記事ベクトルを生成し、記事ベクトル記憶部50に記憶させる記事ベクトル生成装置40と、ユーザベクトル記憶部70を検索して問い合わせの内容に対応するユーザベクトルを取得すると共に、ユーザベクトルを指定した検索要求を記事ベクトル検索装置80に出力するレコメンド管理装置30と、レコメンド管理装置30からの検索要求に応じて、指定されたユーザベクトルを用いて記事ベクトル記憶部50を検索し、指定されたユーザベクトルに関連する記事ベクトルを取得する記事ベクトル検索装置80と、を備え、第1のモデルは、第2のモデルと関連性を有し、ユーザベクトル生成装置60と記事ベクトル生成装置40のそれぞれは、使用されるモデルの世代が異なる複数のチャネルを有し、各チャネルで並行して処理を実行し、レコメンド管理装置30は、複数のチャネルから現用系のチャネルを選択し、現用系でないチャネルで使用されている第1のモデルと第2のモデルとが、所定タイミングで新たなモデルに更新される。これによって、実施形態の検索システム、および検索方法は、スムーズにモデルを更新することができる。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1 検索システム
10 ユーザ端末
20 サービスサーバ
30 レコメンド管理装置
32 チャネル切替部
34 応答部
36 ユーザベクトル検索部
38 検索依頼部
40 記事ベクトル生成装置
50 記事ベクトル記憶部
60 ユーザベクトル生成装置
70 ユーザベクトル記憶部
80 記事ベクトル検索装置

Claims (9)

  1. 第1情報を第1のモデルに入力することで第1特徴情報を生成し、第1の記憶部に記憶させる第1の生成部と、
    第2情報を、前記第1のモデルと関連性を有する第2のモデルに入力することで第2特徴情報を生成し、第2の記憶部に記憶させる第2の生成部と、
    前記第1特徴情報を用いて前記第2の記憶部を検索し、前記第1特徴情報に関連する第2特徴情報を取得する検索部と、を備え、
    前記第1の生成部と前記第2の生成部のそれぞれは、使用されるモデルの世代が異なる複数のチャネルを有し、各チャネルで並行して処理を実行し、
    前記複数のチャネルのうち現用系でないチャネルで使用されている前記第1のモデルと前記第2のモデルとが、所定タイミングで新たなモデルに更新される、
    検索システム。
  2. 前記複数のチャネルから現用系のチャネルを選択する管理部を更に備える、
    請求項1記載の検索システム。
  3. 前記第1特徴情報および前記第2特徴情報のそれぞれは、ベクトルデータである、
    請求項1または2記載の検索システム。
  4. 前記第1の生成部は、前記生成した第1特徴情報を、直近の前記第1のモデルおよび前記第2のモデルによって作成された情報であることを確認可能な判定用情報と共に前記第1の記憶部に記憶させ、
    前記管理部は、前記判定用情報に基づいて、前記第1の記憶部から取得した第1特徴情報が、直近の前記第1のモデルおよび前記第2のモデルによって作成された情報であることが確認される場合、前記第1特徴情報を指定した検索要求を検索部に出力する、
    請求項2記載の検索システム。
  5. 前記判定用情報は、タイムスタンプであり、
    前記管理部は、前記タイムスタンプを現在時刻と比較し、前記タイムスタンプと現在時刻との差が、前記所定タイミングにおいて前記第1のモデルおよび前記第2のモデルの更新に利用されるデータの参照期間以内である場合、前記第1特徴情報を指定した検索要求を検索部に出力する、
    請求項4記載の検索システム。
  6. 前記第1情報は、ユーザが閲覧した記事の履歴であり、
    前記第1特徴情報は、前記ユーザの特徴を示す情報であり、
    前記第1の生成部は、前記第1特徴情報をユーザIDに対応付けて前記第1の記憶部に記憶させる、
    請求項1記載の検索システム。
  7. 前記第2情報は、ネットワークを介して配信される記事であり、
    前記第2特徴情報は、前記記事の特徴を示す情報であり、
    前記第2の生成部は、前記第2特徴情報を記事IDに対応付けて前記第2の記憶部に記憶させ、
    前記第1のモデルは、前記ユーザが閲覧した記事に対応する前記第2特徴情報に基づいて前記第1特徴情報を生成する点で、前記第2のモデルと関連性を有する、
    請求項6記載の検索システム。
  8. 第1の生成部が、第1情報を第1のモデルに入力することで第1特徴情報を生成し、第1の記憶部に記憶させ、
    第2の生成部が、第2情報を、前記第1のモデルと関連性を有する第2のモデルに入力することで第2特徴情報を生成し、第2の記憶部に記憶させ、
    検索部が、前記第1特徴情報を用いて前記第2の記憶部を検索し、前記第1特徴情報に関連する第2特徴情報を取得し、
    前記第1の生成部と前記第2の生成部のそれぞれは、使用されるモデルの世代が異なる複数のチャネルを有し、各チャネルで並行して処理を実行し、
    前記複数のチャネルのうち現用系でないチャネルで使用されている前記第1のモデルと前記第2のモデルとが、所定タイミングで新たなモデルに更新される、
    検索方法。
  9. 管理部が、前記複数のチャネルから前記現用系のチャネルを選択することを更に含む、
    請求項8記載の検索方法
JP2021037257A 2017-09-19 2021-03-09 検索システム、および検索方法 Active JP7144558B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021037257A JP7144558B2 (ja) 2017-09-19 2021-03-09 検索システム、および検索方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017178633A JP6851944B2 (ja) 2017-09-19 2017-09-19 検索システム、および検索方法
JP2021037257A JP7144558B2 (ja) 2017-09-19 2021-03-09 検索システム、および検索方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017178633A Division JP6851944B2 (ja) 2017-09-19 2017-09-19 検索システム、および検索方法

Publications (2)

Publication Number Publication Date
JP2021096867A JP2021096867A (ja) 2021-06-24
JP7144558B2 true JP7144558B2 (ja) 2022-09-29

Family

ID=66014945

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2017178633A Active JP6851944B2 (ja) 2017-09-19 2017-09-19 検索システム、および検索方法
JP2021037257A Active JP7144558B2 (ja) 2017-09-19 2021-03-09 検索システム、および検索方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2017178633A Active JP6851944B2 (ja) 2017-09-19 2017-09-19 検索システム、および検索方法

Country Status (1)

Country Link
JP (2) JP6851944B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021214935A1 (ja) * 2020-04-23 2021-10-28 日本電信電話株式会社 学習装置、検索装置、学習方法、検索方法及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014203442A (ja) 2013-04-10 2014-10-27 株式会社Nttドコモ レコメンド情報生成装置及びレコメンド情報生成方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014203442A (ja) 2013-04-10 2014-10-27 株式会社Nttドコモ レコメンド情報生成装置及びレコメンド情報生成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
大倉 俊平、村尾 一真、田頭 幸浩、小野 真吾、田島 玲,大規模トラフィックを処理する記事推薦サービスへの機械学習の応用事例,情報処理学会 デジタルプラクティス Vol.7 No.4 [online],第7巻、第4号,日本,情報処理学会,2016年10月15日,p.386~393,[検索日:2022年3月3日]、Internet<URL:https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_uri&item_id=174896&file_id=1&file_no=1>

Also Published As

Publication number Publication date
JP6851944B2 (ja) 2021-03-31
JP2019053645A (ja) 2019-04-04
JP2021096867A (ja) 2021-06-24

Similar Documents

Publication Publication Date Title
KR100813333B1 (ko) 소정의 검색 질의로부터의 검색 결과에 대한 액세스를제공하는 url들로 보완된 검색 엔진
US11971884B2 (en) Interactive search experience using machine learning
JP6487201B2 (ja) 推奨ページを生成するための方法及び装置
JP5010126B2 (ja) クエリグラフ
JP6415619B2 (ja) 解析装置、解析方法、およびプログラム
US20200081896A1 (en) Computerized system and method for high-quality and high-ranking digital content discovery
US20150039622A1 (en) Webpage Form Optimization
CN105531701A (zh) 个性化趋势图像搜索建议
US20170193037A1 (en) Computerized System And Method For Augmenting Search Terms For Increased Efficiency And Effectiveness In Identifying Content
CN110209931B (zh) 媒体内容的推送方法和装置、存储介质、电子装置
US11651255B2 (en) Method and apparatus for object preference prediction, and computer readable medium
JP4939637B2 (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
JP2015106347A (ja) レコメンド装置およびレコメンド方法
JP7144558B2 (ja) 検索システム、および検索方法
JP6434954B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2010146366A (ja) 情報提供サーバ
JP2021033602A (ja) 情報処理装置、ベクトル生成方法及びプログラム
JP2010181966A (ja) レコメンド情報評価装置およびレコメンド情報評価方法
JPWO2012023541A1 (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
US10114887B1 (en) Generating a set of representative items using a dynamic selection strategy
JP2021068328A (ja) 情報提供装置、情報提供方法および情報提供プログラム
KR101730647B1 (ko) 검색 서비스 제공 장치, 방법, 및 컴퓨터 프로그램
JP2012043290A (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
JP7330726B2 (ja) モデル生成装置、モデル生成方法、およびプログラム
JP7162700B1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210315

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220516

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220915

R150 Certificate of patent or registration of utility model

Ref document number: 7144558

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350