JP2021056560A - 情報処理装置及びその方法、プログラム - Google Patents

情報処理装置及びその方法、プログラム Download PDF

Info

Publication number
JP2021056560A
JP2021056560A JP2019176269A JP2019176269A JP2021056560A JP 2021056560 A JP2021056560 A JP 2021056560A JP 2019176269 A JP2019176269 A JP 2019176269A JP 2019176269 A JP2019176269 A JP 2019176269A JP 2021056560 A JP2021056560 A JP 2021056560A
Authority
JP
Japan
Prior art keywords
information
page information
learning
information processing
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019176269A
Other languages
English (en)
Inventor
修一 三瓶
Shuichi Sanpei
修一 三瓶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019176269A priority Critical patent/JP2021056560A/ja
Publication of JP2021056560A publication Critical patent/JP2021056560A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】 検索情報に対する検索結果である複数のページ情報を、ユーザに適した順序で表示する。【解決手段】 情報処理装置に、検索情報に対する検索結果として複数のページ情報を取得する取得手段と、前記複数のページ情報のそれぞれの分野情報を推定する推定手段と、所定の複数の分野のユーザに対する適合度を学習する前記複数のページ情報に対するユーザの閲覧状況に基づいて、所定の複数の分野について当該ユーザに対する適合度を学習する学習手段と、前記推定手段により推定された分野情報と、前記学習手段により学習された適合度とに基づいて、前記複数のページ情報に対する表示順序を決定する決定手段と、前記複数のページ情報を、前記表示順序に基づいて表示するように制御する制御手段とを備える。【選択図】 図2

Description

本発明は、情報の検索結果を表示する情報処理装置及びその方法、プログラムに関するものである。
近年、インターネットを用いることで、ユーザは入力したキーワードに対して関連する情報(ページ)を検索することができる。このような検索で得られるページの量は膨大であることが多く、ユーザが目的とする情報を含むページがただちに得られるわけではない。そのため、ユーザは上位の検索結果からスクロールしながらプレビューされた部分を参照して目的のページを選択して閲覧するのが一般的である。したがって目的とするページがなるべく上位に表示されることが望ましい。
しかしながら、同じキーワードを入力しても、ユーザによって目的とする検索結果は必ずしも一致するものではない。そこで特許文献1では、ユーザが閲覧した閲覧情報から単語を抽出してユーザの嗜好を学習し、ユーザにとって興味のない検索結果が上位の検索結果において少なくなるようにすることが開示されている。
特開2014−225132号公報
しかしながら、同一ユーザの検索結果を大量に収集することは難しく、個々の単語の使われ方も様々である。このため、特許文献1のように、単にユーザが閲覧した情報から抽出した単語を学習しても、ユーザの嗜好を十分に反映できるとは限らない。
上記課題を解決するため、本発明の1態様によれば、情報処理装置に、検索情報に対する検索結果として複数のページ情報を取得する取得手段と、前記複数のページ情報のそれぞれの分野情報を推定する推定手段と、前記複数のページ情報に対するユーザの閲覧状況に基づいて、所定の複数の分野について当該ユーザに対する適合度を学習する学習手段と、前記推定手段により推定された分野情報と、前記学習手段により学習された適合度とに基づいて、前記複数のページ情報に対する表示順序を決定する決定手段と、前記複数のページ情報を、前記表示順序に基づいて表示するように制御する制御手段とを備える。
本発明によれば、ユーザが目的とする情報をより簡単に得ることができる。
第1の実施形態に係る検索システムの構成例を示すブロック図。 ユーザ端末の機能構成を示すブロック図。 検索処理手順の一例を示すフローチャート。 分野推定部の処理を説明する図。 分野推定部の学習手順の一例を示すフローチャート。 表示順序の決定手順の一例を示すフローチャート。 ユーザ適合度の学習手順の一例を示すフローチャート。 ユーザ端末のハードウェア構成を示すブロック図。
以下、図面を参照しながら本発明の好適な実施形態について詳細に説明する。
(実施形態1)
以下では、本実施形態の検索システムを詳細に説明する。
図1は、本実施形態の検索システムとして用いられる情報処理システムの構成を示すブロック図である。ユーザ端末11は、キーワードなどの検索情報を入力し、検索結果を表示する。通信ネットワーク12は、ユーザ端末11と検索サーバ13との間での情報の通信に用いられる。検索サーバ13は、ユーザ端末11から受信した検索情報に基づいて検索を実行し、検索結果としてインターネット上のページ情報を送信する。
図2は、ユーザ端末11の機能構成を示すブロック図である。入力部111は、キーワードなどの検索情報やその他の情報を入力するために用いられる。また、入力部111は、選択や設定を行うために用いられる。適合度学習部112は、検索結果のページ情報に対するユーザの閲覧状況に基づいて、情報の分野のユーザに対する適合度を学習し、学習した適合度を保持する。分野推定部113は、検索結果である各ページの分野を推定する。分野推定部113は、分野情報の推定結果として、所定の複数の分野のそれぞれに対する尤度を推定する。順序制御部114は、各ページの複数の分野のそれぞれに対する尤度と、複数の分野のそれぞれについてのユーザに対する適合度とに基づいて各ページのスコアを算出する。そして、順序制御部114は、検索結果である複数のページをスコアの高い順に表示するように表示順序を決定する。表示部115は、検索結果である複数のページを、順序制御部114により決定された順序で表示する。
図3は、検索処理手順の一例を示すフローチャートである。
ユーザ端末11から1または複数のキーワードを入力すると(S301)、通信ネットワーク12を介してキーワードを受信した検索サーバ13が検索を実行する(S302)。そしてユーザ端末11は、検索サーバ13による検索結果である複数のページ情報を通信ネットワーク12を介して受信し、複数のページ情報の表示順序を決定して、決定した順序で表示する。
図4は、分野推定部113の処理を説明する図である。
分野推定部113は、検索結果である各ページ(文書)の分野を推定する。分野推定部113は、入力された文書に対して、分野の推定結果として、所定の複数の分野(A〜X)のそれぞれに対する尤度(a〜x)を推定する。
図5は、分野推定部113の学習手順の一例を示すフローチャートである。
分野推定部113は、文書中の単語群からその文書が各分野に属する尤度を推定できるように学習する。そのために、分野が既知である文書を用いて学習を行う。分野推定部113は階層型ニューラルネットワークを用いて実現される。
まず、1つの学習用の文書が入力される(S501)。この学習用の文書としては、属する分野が既知である文書を用いる。属する分野が既知である文書は、例えば、政治や経済、科学技術などの分野に分けられた新聞記事や、特定の分野の論文や解説などから得ることができる。
次に、入力された文書から、予め定められた単語群に含まれる単語を抽出する(S502)。この予め定められた単語群としては、接続詞や代名詞などのような、分野によらず出現する単語は除き、特定の分野を特徴づけ、出現頻度も比較的高い単語を用いる。
そして、階層型ニューラルネットワークを用いて分野を推定する(S503)。ここでは、この階層型ニューラルネットワークには、上述した予め定められた単語群の各単語を要素とし、文書中におけるその単語(要素)の有無を0と1で表すベクトルを入力するものとする。また、この階層型ニューラルネットワークは、各分野に対する尤度を並べたベクトルを出力とするものとする。あるいは階層型ニューラルネットワークの入力としては、予め定められた単語群の各単語を要素とし、その単語の文書中の出現頻度を要素値としてもよい。
続いて、階層型ニューラルネットワークの入力(各分野に対する尤度)と、入力された文書が属する分野との誤差に基づいて、誤差逆伝搬法により階層型ニューラルネットワークの結合係数(重み)を修正する(S504)。まだ処理してない学習用の文書があれば(S505でYES)、S501に戻って学習用文書の処理を繰り返す。
次に、検索結果である複数のページ情報の表示順序の決定手順を説明する。図6は、順序制御部114による表示順序の決定手順の一例を示すフローチャートである。
まず、検索結果として複数のページ情報を受信する(S601)。次に、それぞれのページ情報の各分野に対する尤度を分野推定部113で推定する(S602)。さらに、適合度学習部112により学習され、保持された、複数の分野のそれぞれについてのユーザに対する適合度を取得する(S603)。適合度学習部112による学習については後述する。
続いて、各ページ情報に対して、各分野のユーザ適合度と尤度とを用いて、そのページ情報のスコアを算出する。ここでは、各分野のユーザ適合度と尤度と積を求めて全分野について加算することでスコアを算出する。そしてスコアの大きい順となるように、複数のページ情報の表示順序を決定する(S604)。最後に、このようにして決定された順序で、検索結果である複数のページ情報を表示部115に表示する(S605)。
上述した例では、各分野のユーザ適合度と尤度と積を求めて全分野について加算することでスコアを算出するとした。すなわち、ユーザ端末側の情報だけでスコアを算出するとしたが、さらに検索サーバで得られたページの順位を反映させるようにしてもよい。そのためには、検索サーバで得られたページの順位を、上位ほど高くなるような評価値に変換して、上述したスコアにさらに加算すればよい。
次に、適合度学習部112によるユーザ適合度の学習について説明する。図7は、適合度学習部112によるユーザ適合度の学習手順の一例を示すフローチャートである。適合度学習部112は、検索結果のページ情報に対するユーザの閲覧状況に基づいて、情報の分野について、ユーザに対する適合度を継続的に学習し、学習した適合度を保持する。
まず、検索結果である複数のページ情報から特定のページ情報がユーザによって閲覧される(S701でYES)と、閲覧されたページ情報の各分野に対する尤度が分野推定部113により推定される(S702)。この閲覧されたページ情報の分野がユーザに適合しているものとして、推定された分野の尤度によってユーザ適合度の学習(更新)を行う(S704)。この更新は、例えば、これまでに閲覧したページ情報の分野の尤度を平均すればよい。
なお、ここでは更に、閲覧時間が長いほどユーザにとって有用な情報と判断し、閲覧時間によって尤度に重み付けを行うことにする(S703)。ただし、閲覧時間だけでスコアが極端に大きくなるのを避けるために、閲覧時間を2〜3段階で区分し、一定時間以上は同一の重みとなるようにする。一方、閲覧時間が所定時間未満(例えば5秒未満)の場合は、ユーザにとって有用な情報ではなかったと判断し、ユーザ適合度の学習(更新)の対象から除外するものとする。あるいは、閲覧時間が一定時間未満のページ情報の分野に対するユーザ適合度が低くなるように学習しても良い。さらに、所定以上の順位の検索結果として表示されたが、実際には閲覧されなかったページ情報に関しても、そのページの分野に対するユーザ適合度が低くなるように学習しても良い。
図8は、本発明の第1の実施形態に係るユーザ端末11のハードウェア構成を示すブロック図である。
図8において、CPU(中央演算装置)801は、ROM803またはHDD806に記憶されたプログラムに従って、処理を実行する。RAM802は、CPU801によるプログラムの実行時に、各種情報を一時的に記憶するためのメモリを提供している。ROM803は、プログラムや各種固定データが記憶されている。
入力機器804は、キーボードやマウス、タッチパネルなどであり、ユーザからの入力に用いられる。表示器805は、検索結果などのデータをユーザに表示する。HDD806はハードディスクドライブであり、各種データやパラメータなどを不揮発に保存するための記憶装置である。I/F807は通信インタフェースであり、通信ネットワーク12と接続して情報の送受信を行う。バス808は、上記各部と接続し、情報や制御信号をやり取りするために用いられる。
このような構成のハードウェアを用いることにより、ユーザ端末11は、本実施形態にかかる情報処理方法を実行することができる。
なお、ユーザ端末11は、本発明にかかる情報処理方法をCPU801の処理によって実現することとしているが、本発明はこれに限られず、CPU801における処理の一部を専用ハードウェアに置き換えて実現するようにしてもよい。
(実施形態2)
実施形態1では、検索結果の表示順序の制御を、ユーザ端末11が実行するとしたが、適合度学習部112、分野推定部113、順序制御部114を検索サーバ13に設け、検索サーバ13で実行しても良い。その場合、ユーザが検索サーバ13を利用する際に、ログインすることでユーザ認証を行うようにする。そして、適合度学習部112は、をユーザ別に行って学習結果を保持するようにし、順序制御部114は、そのユーザに対する学習結果(適合度)を参照するようにすればよい。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
11 ユーザ端末
12 通信ネットワーク
111 入力部
112 適合度学習部
113 分野推定部
114 順序制御部
115 表示部

Claims (12)

  1. 検索情報に対する検索結果として複数のページ情報を取得する取得手段と、
    前記複数のページ情報のそれぞれの分野情報を推定する推定手段と、
    前記複数のページ情報に対するユーザの閲覧状況に基づいて、所定の複数の分野について当該ユーザに対する適合度を学習する学習手段と、
    前記推定手段により推定された分野情報と、前記学習手段により学習された適合度とに基づいて、前記複数のページ情報に対する表示順序を決定する決定手段と、
    前記複数のページ情報を、前記表示順序に基づいて表示するように制御する制御手段と
    を備えることを特徴とする情報処理装置。
  2. 前記推定手段は、前記分野情報として、前記所定の複数の分野のそれぞれに対する尤度を推定することを特徴とする請求項1記載の情報処理装置。
  3. 前記決定手段は、前記所定の複数の分野のそれぞれに対する前記尤度と前記適合度との積を全ての分野について加算してスコアを求め、該スコアに基づいて前記表示順序を決定することを特徴とする請求項2記載の情報処理装置。
  4. 前記学習手段は、前記検索結果である複数のページ情報のうち前記ユーザにより閲覧されたページ情報の、前記所定の複数の分野のそれぞれに対する尤度を用いて、前記適合度を学習することを特徴とする請求項3記載の情報処理装置。
  5. 前記学習手段は、前記尤度に対して閲覧時間に応じた重み付けを行うことを特徴とする請求項4記載の情報処理装置。
  6. 前記学習手段は、前記閲覧時間に応じた重み付けを一定時間以上は同一の重みとなるように行うことを特徴とする請求項5記載の情報処理装置。
  7. 前記学習手段は、前記ユーザにより閲覧されたページ情報のうち、閲覧時間が所定時間未満であるページ情報を学習の対象から除外することを特徴とする請求項4記載の情報処理装置。
  8. 前記学習手段は、前記ユーザにより閲覧されたページ情報のうち、閲覧時間が所定時間未満であるページ情報の前記適合度が低くなるように、前記適合度を学習することを特徴とする請求項4記載の情報処理装置。
  9. 前記学習手段は、前記複数のページ情報のうち、所定以上の順位であったが、前記ユーザにより閲覧されなかったページ情報の前記適合度が低くなるように、前記適合度を学習することを特徴とする請求項4記載の情報処理装置。
  10. 請求項1記載の情報処理装置と、
    前記情報処理装置から受信した検索情報に基づいて検索を実行し、前記検索結果として複数のページ情報を前記情報処理装置に送信する検索手段と
    を備えることを特徴とする情報処理システム。
  11. 検索情報に対する検索結果として複数のページ情報を取得する取得工程と、
    前記複数のページ情報のそれぞれの分野情報を推定する推定工程と、
    前記複数のページ情報に対するユーザの閲覧状況に基づいて、所定の複数の分野について当該ユーザに対する適合度を学習する学習工程と、
    前記推定工程で推定された分野情報と、前記学習工程で学習された適合度とに基づいて、前記複数のページ情報に対する表示順序を決定する決定工程と、
    前記複数のページ情報を、前記表示順序に基づいて表示する表示工程と
    を備えることを特徴とする情報処理方法。
  12. コンピュータを請求項1乃至9のいずれか1項に記載の情報処理装置の各手段として機能させることを特徴とするプログラム。
JP2019176269A 2019-09-26 2019-09-26 情報処理装置及びその方法、プログラム Pending JP2021056560A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019176269A JP2021056560A (ja) 2019-09-26 2019-09-26 情報処理装置及びその方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019176269A JP2021056560A (ja) 2019-09-26 2019-09-26 情報処理装置及びその方法、プログラム

Publications (1)

Publication Number Publication Date
JP2021056560A true JP2021056560A (ja) 2021-04-08

Family

ID=75270719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019176269A Pending JP2021056560A (ja) 2019-09-26 2019-09-26 情報処理装置及びその方法、プログラム

Country Status (1)

Country Link
JP (1) JP2021056560A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022209333A1 (ja) 2021-03-30 2022-10-06 大王製紙株式会社 マスク、及びマスクの製造方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022209333A1 (ja) 2021-03-30 2022-10-06 大王製紙株式会社 マスク、及びマスクの製造方法

Similar Documents

Publication Publication Date Title
US8671093B2 (en) Click model for search rankings
US9355168B1 (en) Topic based user profiles
CN107451894B (zh) 数据处理方法、装置和计算机可读存储介质
US11288333B2 (en) Method and system for estimating user-item interaction data based on stored interaction data by using multiple models
US8819003B2 (en) Query refinement based on user selections
US7769771B2 (en) Searching a document using relevance feedback
JP2009528628A (ja) ラベル付きドキュメントからラベルなしドキュメントへの関連度の伝播
CN109063104B (zh) 推荐信息的刷新方法、装置、存储介质和终端设备
US10642670B2 (en) Methods and systems for selecting potentially erroneously ranked documents by a machine learning algorithm
Agarwal et al. Statistical methods for recommender systems
US10642905B2 (en) System and method for ranking search engine results
KR20160149978A (ko) 검색 엔진 및 그의 구현 방법
EP1903460A1 (en) Information processing
US11194848B2 (en) Method of and system for building search index using machine learning algorithm
EP2385473A1 (en) Determination of a desired repository
US11860962B1 (en) System and method for selecting information for display based on past user interactions
CN101627388A (zh) 动态地呈现数据集的可视化
EP2860672A2 (en) Scalable cross domain recommendation system
KR20120030389A (ko) 검색 결과 통합
JP2008176511A (ja) コンピュータネットワークにおける情報処理方法および情報処理装置
WO2013055844A1 (en) Method and system for customizing a web site
WO2010054119A2 (en) Image relevance by identifying experts
US9720914B2 (en) Navigational aid for electronic books and documents
US20100145944A1 (en) Mining broad hidden query aspects from user search sessions
JP2021056560A (ja) 情報処理装置及びその方法、プログラム