JP2021056560A

JP2021056560A - 情報処理装置及びその方法、プログラム

Info

Publication number: JP2021056560A
Application number: JP2019176269A
Authority: JP
Inventors: 修一三瓶; Shuichi Sanpei
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2019-09-26
Filing date: 2019-09-26
Publication date: 2021-04-08

Abstract

【課題】検索情報に対する検索結果である複数のページ情報を、ユーザに適した順序で表示する。【解決手段】情報処理装置に、検索情報に対する検索結果として複数のページ情報を取得する取得手段と、前記複数のページ情報のそれぞれの分野情報を推定する推定手段と、所定の複数の分野のユーザに対する適合度を学習する前記複数のページ情報に対するユーザの閲覧状況に基づいて、所定の複数の分野について当該ユーザに対する適合度を学習する学習手段と、前記推定手段により推定された分野情報と、前記学習手段により学習された適合度とに基づいて、前記複数のページ情報に対する表示順序を決定する決定手段と、前記複数のページ情報を、前記表示順序に基づいて表示するように制御する制御手段とを備える。【選択図】図２

Description

本発明は、情報の検索結果を表示する情報処理装置及びその方法、プログラムに関するものである。

近年、インターネットを用いることで、ユーザは入力したキーワードに対して関連する情報（ページ）を検索することができる。このような検索で得られるページの量は膨大であることが多く、ユーザが目的とする情報を含むページがただちに得られるわけではない。そのため、ユーザは上位の検索結果からスクロールしながらプレビューされた部分を参照して目的のページを選択して閲覧するのが一般的である。したがって目的とするページがなるべく上位に表示されることが望ましい。

しかしながら、同じキーワードを入力しても、ユーザによって目的とする検索結果は必ずしも一致するものではない。そこで特許文献１では、ユーザが閲覧した閲覧情報から単語を抽出してユーザの嗜好を学習し、ユーザにとって興味のない検索結果が上位の検索結果において少なくなるようにすることが開示されている。

特開２０１４−２２５１３２号公報

しかしながら、同一ユーザの検索結果を大量に収集することは難しく、個々の単語の使われ方も様々である。このため、特許文献１のように、単にユーザが閲覧した情報から抽出した単語を学習しても、ユーザの嗜好を十分に反映できるとは限らない。

上記課題を解決するため、本発明の１態様によれば、情報処理装置に、検索情報に対する検索結果として複数のページ情報を取得する取得手段と、前記複数のページ情報のそれぞれの分野情報を推定する推定手段と、前記複数のページ情報に対するユーザの閲覧状況に基づいて、所定の複数の分野について当該ユーザに対する適合度を学習する学習手段と、前記推定手段により推定された分野情報と、前記学習手段により学習された適合度とに基づいて、前記複数のページ情報に対する表示順序を決定する決定手段と、前記複数のページ情報を、前記表示順序に基づいて表示するように制御する制御手段とを備える。

本発明によれば、ユーザが目的とする情報をより簡単に得ることができる。

第１の実施形態に係る検索システムの構成例を示すブロック図。ユーザ端末の機能構成を示すブロック図。検索処理手順の一例を示すフローチャート。分野推定部の処理を説明する図。分野推定部の学習手順の一例を示すフローチャート。表示順序の決定手順の一例を示すフローチャート。ユーザ適合度の学習手順の一例を示すフローチャート。ユーザ端末のハードウェア構成を示すブロック図。

以下、図面を参照しながら本発明の好適な実施形態について詳細に説明する。

（実施形態１）
以下では、本実施形態の検索システムを詳細に説明する。

図１は、本実施形態の検索システムとして用いられる情報処理システムの構成を示すブロック図である。ユーザ端末１１は、キーワードなどの検索情報を入力し、検索結果を表示する。通信ネットワーク１２は、ユーザ端末１１と検索サーバ１３との間での情報の通信に用いられる。検索サーバ１３は、ユーザ端末１１から受信した検索情報に基づいて検索を実行し、検索結果としてインターネット上のページ情報を送信する。

図２は、ユーザ端末１１の機能構成を示すブロック図である。入力部１１１は、キーワードなどの検索情報やその他の情報を入力するために用いられる。また、入力部１１１は、選択や設定を行うために用いられる。適合度学習部１１２は、検索結果のページ情報に対するユーザの閲覧状況に基づいて、情報の分野のユーザに対する適合度を学習し、学習した適合度を保持する。分野推定部１１３は、検索結果である各ページの分野を推定する。分野推定部１１３は、分野情報の推定結果として、所定の複数の分野のそれぞれに対する尤度を推定する。順序制御部１１４は、各ページの複数の分野のそれぞれに対する尤度と、複数の分野のそれぞれについてのユーザに対する適合度とに基づいて各ページのスコアを算出する。そして、順序制御部１１４は、検索結果である複数のページをスコアの高い順に表示するように表示順序を決定する。表示部１１５は、検索結果である複数のページを、順序制御部１１４により決定された順序で表示する。

図３は、検索処理手順の一例を示すフローチャートである。

ユーザ端末１１から１または複数のキーワードを入力すると（Ｓ３０１）、通信ネットワーク１２を介してキーワードを受信した検索サーバ１３が検索を実行する（Ｓ３０２）。そしてユーザ端末１１は、検索サーバ１３による検索結果である複数のページ情報を通信ネットワーク１２を介して受信し、複数のページ情報の表示順序を決定して、決定した順序で表示する。

図４は、分野推定部１１３の処理を説明する図である。

分野推定部１１３は、検索結果である各ページ（文書）の分野を推定する。分野推定部１１３は、入力された文書に対して、分野の推定結果として、所定の複数の分野（Ａ〜Ｘ）のそれぞれに対する尤度（ａ〜ｘ）を推定する。

図５は、分野推定部１１３の学習手順の一例を示すフローチャートである。

分野推定部１１３は、文書中の単語群からその文書が各分野に属する尤度を推定できるように学習する。そのために、分野が既知である文書を用いて学習を行う。分野推定部１１３は階層型ニューラルネットワークを用いて実現される。

まず、１つの学習用の文書が入力される（Ｓ５０１）。この学習用の文書としては、属する分野が既知である文書を用いる。属する分野が既知である文書は、例えば、政治や経済、科学技術などの分野に分けられた新聞記事や、特定の分野の論文や解説などから得ることができる。

次に、入力された文書から、予め定められた単語群に含まれる単語を抽出する（Ｓ５０２）。この予め定められた単語群としては、接続詞や代名詞などのような、分野によらず出現する単語は除き、特定の分野を特徴づけ、出現頻度も比較的高い単語を用いる。

そして、階層型ニューラルネットワークを用いて分野を推定する（Ｓ５０３）。ここでは、この階層型ニューラルネットワークには、上述した予め定められた単語群の各単語を要素とし、文書中におけるその単語（要素）の有無を０と１で表すベクトルを入力するものとする。また、この階層型ニューラルネットワークは、各分野に対する尤度を並べたベクトルを出力とするものとする。あるいは階層型ニューラルネットワークの入力としては、予め定められた単語群の各単語を要素とし、その単語の文書中の出現頻度を要素値としてもよい。

続いて、階層型ニューラルネットワークの入力（各分野に対する尤度）と、入力された文書が属する分野との誤差に基づいて、誤差逆伝搬法により階層型ニューラルネットワークの結合係数（重み）を修正する（Ｓ５０４）。まだ処理してない学習用の文書があれば（Ｓ５０５でＹＥＳ）、Ｓ５０１に戻って学習用文書の処理を繰り返す。

次に、検索結果である複数のページ情報の表示順序の決定手順を説明する。図６は、順序制御部１１４による表示順序の決定手順の一例を示すフローチャートである。

まず、検索結果として複数のページ情報を受信する（Ｓ６０１）。次に、それぞれのページ情報の各分野に対する尤度を分野推定部１１３で推定する（Ｓ６０２）。さらに、適合度学習部１１２により学習され、保持された、複数の分野のそれぞれについてのユーザに対する適合度を取得する（Ｓ６０３）。適合度学習部１１２による学習については後述する。

続いて、各ページ情報に対して、各分野のユーザ適合度と尤度とを用いて、そのページ情報のスコアを算出する。ここでは、各分野のユーザ適合度と尤度と積を求めて全分野について加算することでスコアを算出する。そしてスコアの大きい順となるように、複数のページ情報の表示順序を決定する（Ｓ６０４）。最後に、このようにして決定された順序で、検索結果である複数のページ情報を表示部１１５に表示する（Ｓ６０５）。

上述した例では、各分野のユーザ適合度と尤度と積を求めて全分野について加算することでスコアを算出するとした。すなわち、ユーザ端末側の情報だけでスコアを算出するとしたが、さらに検索サーバで得られたページの順位を反映させるようにしてもよい。そのためには、検索サーバで得られたページの順位を、上位ほど高くなるような評価値に変換して、上述したスコアにさらに加算すればよい。

次に、適合度学習部１１２によるユーザ適合度の学習について説明する。図７は、適合度学習部１１２によるユーザ適合度の学習手順の一例を示すフローチャートである。適合度学習部１１２は、検索結果のページ情報に対するユーザの閲覧状況に基づいて、情報の分野について、ユーザに対する適合度を継続的に学習し、学習した適合度を保持する。

まず、検索結果である複数のページ情報から特定のページ情報がユーザによって閲覧される（Ｓ７０１でＹＥＳ）と、閲覧されたページ情報の各分野に対する尤度が分野推定部１１３により推定される（Ｓ７０２）。この閲覧されたページ情報の分野がユーザに適合しているものとして、推定された分野の尤度によってユーザ適合度の学習（更新）を行う（Ｓ７０４）。この更新は、例えば、これまでに閲覧したページ情報の分野の尤度を平均すればよい。

なお、ここでは更に、閲覧時間が長いほどユーザにとって有用な情報と判断し、閲覧時間によって尤度に重み付けを行うことにする（Ｓ７０３）。ただし、閲覧時間だけでスコアが極端に大きくなるのを避けるために、閲覧時間を２〜３段階で区分し、一定時間以上は同一の重みとなるようにする。一方、閲覧時間が所定時間未満（例えば５秒未満）の場合は、ユーザにとって有用な情報ではなかったと判断し、ユーザ適合度の学習（更新）の対象から除外するものとする。あるいは、閲覧時間が一定時間未満のページ情報の分野に対するユーザ適合度が低くなるように学習しても良い。さらに、所定以上の順位の検索結果として表示されたが、実際には閲覧されなかったページ情報に関しても、そのページの分野に対するユーザ適合度が低くなるように学習しても良い。

図８は、本発明の第１の実施形態に係るユーザ端末１１のハードウェア構成を示すブロック図である。

図８において、ＣＰＵ（中央演算装置）８０１は、ＲＯＭ８０３またはＨＤＤ８０６に記憶されたプログラムに従って、処理を実行する。ＲＡＭ８０２は、ＣＰＵ８０１によるプログラムの実行時に、各種情報を一時的に記憶するためのメモリを提供している。ＲＯＭ８０３は、プログラムや各種固定データが記憶されている。

入力機器８０４は、キーボードやマウス、タッチパネルなどであり、ユーザからの入力に用いられる。表示器８０５は、検索結果などのデータをユーザに表示する。ＨＤＤ８０６はハードディスクドライブであり、各種データやパラメータなどを不揮発に保存するための記憶装置である。Ｉ／Ｆ８０７は通信インタフェースであり、通信ネットワーク１２と接続して情報の送受信を行う。バス８０８は、上記各部と接続し、情報や制御信号をやり取りするために用いられる。

このような構成のハードウェアを用いることにより、ユーザ端末１１は、本実施形態にかかる情報処理方法を実行することができる。

なお、ユーザ端末１１は、本発明にかかる情報処理方法をＣＰＵ８０１の処理によって実現することとしているが、本発明はこれに限られず、ＣＰＵ８０１における処理の一部を専用ハードウェアに置き換えて実現するようにしてもよい。

（実施形態２）
実施形態１では、検索結果の表示順序の制御を、ユーザ端末１１が実行するとしたが、適合度学習部１１２、分野推定部１１３、順序制御部１１４を検索サーバ１３に設け、検索サーバ１３で実行しても良い。その場合、ユーザが検索サーバ１３を利用する際に、ログインすることでユーザ認証を行うようにする。そして、適合度学習部１１２は、をユーザ別に行って学習結果を保持するようにし、順序制御部１１４は、そのユーザに対する学習結果（適合度）を参照するようにすればよい。

（その他の実施形態）
本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

１１ユーザ端末
１２通信ネットワーク
１１１入力部
１１２適合度学習部
１１３分野推定部
１１４順序制御部
１１５表示部

Claims

検索情報に対する検索結果として複数のページ情報を取得する取得手段と、
前記複数のページ情報のそれぞれの分野情報を推定する推定手段と、
前記複数のページ情報に対するユーザの閲覧状況に基づいて、所定の複数の分野について当該ユーザに対する適合度を学習する学習手段と、
前記推定手段により推定された分野情報と、前記学習手段により学習された適合度とに基づいて、前記複数のページ情報に対する表示順序を決定する決定手段と、
前記複数のページ情報を、前記表示順序に基づいて表示するように制御する制御手段と
を備えることを特徴とする情報処理装置。
前記推定手段は、前記分野情報として、前記所定の複数の分野のそれぞれに対する尤度を推定することを特徴とする請求項１記載の情報処理装置。
前記決定手段は、前記所定の複数の分野のそれぞれに対する前記尤度と前記適合度との積を全ての分野について加算してスコアを求め、該スコアに基づいて前記表示順序を決定することを特徴とする請求項２記載の情報処理装置。
前記学習手段は、前記検索結果である複数のページ情報のうち前記ユーザにより閲覧されたページ情報の、前記所定の複数の分野のそれぞれに対する尤度を用いて、前記適合度を学習することを特徴とする請求項３記載の情報処理装置。
前記学習手段は、前記尤度に対して閲覧時間に応じた重み付けを行うことを特徴とする請求項４記載の情報処理装置。
前記学習手段は、前記閲覧時間に応じた重み付けを一定時間以上は同一の重みとなるように行うことを特徴とする請求項５記載の情報処理装置。
前記学習手段は、前記ユーザにより閲覧されたページ情報のうち、閲覧時間が所定時間未満であるページ情報を学習の対象から除外することを特徴とする請求項４記載の情報処理装置。
前記学習手段は、前記ユーザにより閲覧されたページ情報のうち、閲覧時間が所定時間未満であるページ情報の前記適合度が低くなるように、前記適合度を学習することを特徴とする請求項４記載の情報処理装置。
前記学習手段は、前記複数のページ情報のうち、所定以上の順位であったが、前記ユーザにより閲覧されなかったページ情報の前記適合度が低くなるように、前記適合度を学習することを特徴とする請求項４記載の情報処理装置。
請求項１記載の情報処理装置と、
前記情報処理装置から受信した検索情報に基づいて検索を実行し、前記検索結果として複数のページ情報を前記情報処理装置に送信する検索手段と
を備えることを特徴とする情報処理システム。
検索情報に対する検索結果として複数のページ情報を取得する取得工程と、
前記複数のページ情報のそれぞれの分野情報を推定する推定工程と、
前記複数のページ情報に対するユーザの閲覧状況に基づいて、所定の複数の分野について当該ユーザに対する適合度を学習する学習工程と、
前記推定工程で推定された分野情報と、前記学習工程で学習された適合度とに基づいて、前記複数のページ情報に対する表示順序を決定する決定工程と、
前記複数のページ情報を、前記表示順序に基づいて表示する表示工程と
を備えることを特徴とする情報処理方法。
コンピュータを請求項１乃至９のいずれか１項に記載の情報処理装置の各手段として機能させることを特徴とするプログラム。