JP6925244B2 - 情報処理装置、情報処理方法、および情報処理プログラム - Google Patents

情報処理装置、情報処理方法、および情報処理プログラム Download PDF

Info

Publication number
JP6925244B2
JP6925244B2 JP2017223094A JP2017223094A JP6925244B2 JP 6925244 B2 JP6925244 B2 JP 6925244B2 JP 2017223094 A JP2017223094 A JP 2017223094A JP 2017223094 A JP2017223094 A JP 2017223094A JP 6925244 B2 JP6925244 B2 JP 6925244B2
Authority
JP
Japan
Prior art keywords
information processing
keyword
contents
question
ctr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017223094A
Other languages
English (en)
Other versions
JP2019095940A (ja
Inventor
毅司 増山
毅司 増山
一真 村尾
一真 村尾
太一 谷塚
太一 谷塚
小林 健
健 小林
拓也 大久保
拓也 大久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017223094A priority Critical patent/JP6925244B2/ja
Publication of JP2019095940A publication Critical patent/JP2019095940A/ja
Application granted granted Critical
Publication of JP6925244B2 publication Critical patent/JP6925244B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、情報処理方法、および情報処理プログラムに関する。
従来、ユーザによって入力されるキーワードに基づいてデータベースから検索した情報をユーザへ通知する情報処理装置がある。かかる情報処理装置は、例えば、ユーザによって入力されるキーワードが不適切であると、ユーザが通知を望む情報を検索することができない場合がある。
このため、キーワードから連想される連想ワードとキーワードとが対応付けられた情報を予め記憶しておき、入力されるキーワードに加え、連想ワードでも検索を行うことにより、ユーザが通知を望む情報の検索を可能にする情報処理装置がある。
特開平7−210565号公報
しかしながら、キーワードに予め対応付けられる連想ワードは、ユーザが通知を望む情報の検索に必ずしも適しているとは限らない。
本願は、上記に鑑みてなされたものであって、ユーザが通知を望む情報の検索に適したワードを選択し、選択したワードに基づく情報をユーザへ通知することができる情報処理装置、情報処理方法、および情報処理プログラムを提供することを目的とする。
本願に係る情報処理装置は、取得部と、選択部と、通知部とを備える。取得部は、ユーザ端末から質問文を取得する。選択部は、前記取得部によって取得される前記質問文からキーワードを抽出し、当該キーワードに基づいて検索されたコンテンツから前記質問文に関連する関連ワードを選択する。通知部は、前記選択部によって選択される前記関連ワードに基づく回答を前記ユーザ端末へ通知する。
実施形態の一態様によれば、ユーザが通知を望む情報の検索に適したワードを選択し、選択したワードに基づく情報をユーザへ通知することができるといった効果を奏する。
図1は、実施形態に係る情報処理装置が行う情報処理方法の概要を示す説明図である。 図2は、実施形態に係る情報処理装置の構成の一例を示す説明図である。 図3は、実施形態に係る検索ログ情報の一例を示す説明図である。 図4は、実施形態に係る情報処理装置が提供するQ&Aサービスの具体例を示す説明図である。 図5は、実施形態に係る関連ワードの他の選択方法の説明図である。 図6は、実施形態に係る関連ワードの他の選択方法の説明図である。 図7は、実施形態に係る情報処理装置の制御部が実行する処理の一例を示すフローチャートである。 図8は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る情報処理装置、情報処理方法および情報処理プログラムを実施するための形態(以下、「実施形態」と記載する)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法および情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.情報処理方法の概要〕
まず、図1を参照し、実施形態に係る情報処理装置が行う情報処理方法の概要について説明する。図1は、実施形態に係る情報処理装置が行う情報処理方法の概要を示す説明図である。
実施形態に係る情報処理装置1は、通信ネットワークを介してユーザ端末10、知識データベース(以下、「知識DB11」と記載する)、および検索エンジン12と通信可能に接続される。
ユーザ端末10は、ユーザによって利用される装置である。ユーザ端末10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。図1に示す例においては、ユーザ端末10がスマートフォンである場合を示す。
知識DB11は、例えば、百科事典に収められているような、あらゆる科目や分野にわたる知識および知識の解説文等の情報を記憶したデータベースを備えるサーバ装置である。
検索エンジン12は、例えば、入力されるワードに関連するコンテンツをインターネット上に公開されている様々なコンテンツの中から検索する機能を備えるサーバ装置である。検索エンジン12は、複数のワードが入力される場合、複数のワードの論理積に基づくAND検索や、論理和に基づくOR検索を行うことが可能である。
検索エンジン12は、例えば、ブラウザに表示されるウェブコンテンツ(ウェブページ)や、アプリケーションプログラム(アプリ)に配信されるコンテンツ(アプリコンテンツ)等、インターネット上で公開されているコンテンツを検索する。そして、検索エンジン12は、例えば、検索したコンテンツのURL(Uniform Resource Locator)の一覧を検索結果として出力する。
情報処理装置1は、ユーザによって入力される質問文をユーザ端末10から取得し、質問文に対する回答をユーザ端末10へ通知するQ&Aサービスを提供するサーバ装置である。なお、ユーザ端末10のユーザは、ブラウザやアプリケーションにより、情報処理装置1が提供するQ&Aサービスを利用することが可能である。
かかる情報処理装置1は、図1に示すように、ユーザ端末10から質問文を取得すると(ステップS1)、質問文からキーワードを抽出する(ステップS2)。続いて、情報処理装置1は、知識DB11へアクセスし、抽出したキーワードに関連する情報を知識DB11からキーワード検索する(ステップS3)。
そして、情報処理装置1は、知識DB11から質問文の回答となる情報を検索できた場合、回答となる情報を知識DB11から取得し、回答をユーザ端末10へ通知する(ステップS6)。
また、情報処理装置1は、知識DB11から質問文の回答となる情報を検索できない場合、検索エンジン12へアクセスし、例えば、質問文の回答となる情報を含むコンテンツをインターネット上に公開されているコンテンツから検索エンジン12に検索させる。
このとき、検索エンジン12は、例えば、質問文から抽出されたキーワードが適切でない場合、ユーザが通知を望む情報を含む適切なコンテンツを検索することができない場合がある。
例えば、検索エンジン12は、質問文から抽出された複数のキーワードに基づくAND検索を行う場合に、キーワードが不適切に多過ぎると、全キーワードに該当するコンテンツを検索することができないことがある。
また、検索エンジン12は、質問文から抽出された複数のキーワードの中に、ユーザが通知を望む情報の検索に適さないキーワードが含まれている場合、ユーザが通知を望む情報を含まないコンテンツを検索することがある。また、検索エンジン12は、質問文から抽出されたキーワードが不適切に少な過ぎると、不必要に膨大な数のコンテンツを検索することがある。
そこで、情報処理装置1は、質問文から抽出したキーワードで過去に検索エンジン12によって検索されたコンテンツの検索履歴を含む検索ログ情報に基づき、質問文に関連する関連ワードを選択する(ステップS4)。
例えば、情報処理装置1は、質問文から抽出したキーワードで過去に検索されたコンテンツのうち、CTR(Click Through Rate)が所定値以上のコンテンツから関連ワードを選択する。これにより、情報処理装置1は、ユーザが通知を望む情報の検索に適した関連ワードを選択することができる。なお、検索ログ情報の一例については、図3を参照して後述する。
そして、情報処理装置1は、質問文から抽出したキーワードと、選択した関連キーワードとに基づくコンテンツの検索を検索エンジン12に行わせる(ステップS5)。このとき、情報処理装置1は、例えば、質問文から抽出した複数のキーワードが不必要に多過ぎる場合、複数のキーワードのうち幾つかのキーワードを不採用とする代わりに、関連ワードを採用して検索エンジン12にコンテンツの検索を行わせる。
なお、情報処理装置1は、複数のキーワードのうちのいずれかを、関連キーワードと置き換えて検索エンジン12にコンテンツの検索を行わせることもできる。また、情報処理装置1は、質問文から抽出したキーワードが不適切に少な過ぎる場合、抽出したキーワードに関連キーワードを追加して検索エンジン12にコンテンツの検索を行わせることもできる。
これにより、情報処理装置1は、ユーザが通知を望む情報を含む適切なコンテンツを検索エンジン12に検索させることができる。その後、情報処理装置1は、検索エンジン12によって検索されたコンテンツから質問文の回答となる情報を抽出し、回答をユーザ端末10へ通知する(ステップS6)。
このように、情報処理装置1は、ユーザ端末10から取得した質問文からキーワードを抽出し、キーワードに基づいて検索されたコンテンツから質問文に関連する関連ワードを選択する。そして、情報処理装置1は、選択した関連ワードに基づく回答をユーザ端末10へ通知する。これにより、情報処理装置1は、ユーザ端末10のユーザが通知を望む情報の検索に適したワードを選択し、選択したワードに基づく情報をユーザへ通知することができる。
〔2.情報処理装置の構成〕
次に、図2を参照し、実施形態に係る情報処理装置1の構成の一例について説明する。図2は、実施形態に係る情報処理装置1の構成の一例を示す説明図である。図2に示すように、情報処理装置1は、通信部2と、記憶部3と、制御部4とを有する。
なお、情報処理装置1は、情報処理装置1の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
(通信部)
通信部2は、例えば、NIC(Network Interface Card)等によって実現される。通信部2は、例えば、インターネット等の通信ネットワークNを介して有線又は無線によってユーザ端末10、知識DB11、および検索エンジン12と通信可能に接続され、ユーザ端末10、知識DB11、および検索エンジン12との間で情報の送受信を行う。
(記憶部)
記憶部3は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。かかる記憶部3は、検索ログ情報31を記憶する。
(検索ログ情報)
ここで、図3を参照し、実施形態に係る検索ログ情報31の一例について説明する。図3は、実施形態に係る検索ログ情報31の一例を示す説明図である。検索ログ情報31は、検索エンジン12によって過去に検索されたコンテンツの検索履歴を含む。
例えば、図3に示すように、検索ログ情報31は、キーワード、スニペット、CTR、ビュー数、および公開日が対応付けられた情報である。キーワードは、検索エンジン12が過去にキーワード検索したワードである。
スニペットは、対応付けられたキーワードによって検索エンジン12が検索したコンテンツから抜粋したコンテンツの要所となる断片のテキスト情報である。なお、ここでは、キーワードにスニペットが対応付けられている場合について説明するが、検索ログ情報31は、スニペットに代えて検索エンジン12が検索したコンテンツのURLや検索したコンテンツ自体が対応付けられてもよい。
CTRは、検索エンジン12が検索したコンテンツがユーザ端末10に表示された数(インプレッション数)のうちクリックされた回数(クリック数)の割合を示す値である。ビュー数は、検索エンジン12が検索したコンテンツが閲覧された累計回数である。公開日は、検索エンジン12が検索したコンテンツがインターネット上に公開された年月日である。
情報処理装置1は、かかる検索ログ情報31を定期的に(例えば、1日に1回)検索エンジン12から取得し、記憶部3に記憶している検索ログ情報31を更新する。なお、情報処理装置1は、各コンテンツのCTRの時間経過に伴う推移を示す情報を検索ログ情報31に含めて記憶部3に記憶させることもできる。検索ログ情報31を使用して情報処理装置1が提供するQ&Aサービスの具体例については、図4を参照して後述する。
(制御部)
図2へ戻り制御部4の説明を続ける。制御部4は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、入出力ポートなどを有するマイクロコンピュータや各種の回路を含む。
制御部4は、CPUがROMに記憶された各種プログラム(実施形態に係る情報処理プログラムの一例に相当)を、RAMを作業領域として使用して実行することにより機能する取得部41、選択部42、および通知部43を備える。
なお、制御部4が備える取得部41、選択部42、および通知部43は、それぞれ一部または全部がASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等のハードウェアで構成されてもよい。
取得部41、選択部42、および通知部43は、それぞれ以下に説明する情報処理の作用を実現または実行する。なお、制御部4の内部構成は、図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
(取得部)
取得部41は、通信ネットワークNおよび通信部2を介してユーザ端末10から質問文を取得し、取得した質問文を選択部42へ出力する。また、取得部41は、通信ネットワークNおよび通信部2を介して知識DB11からキーワード検索の結果を取得する処理も行う。取得部41は、知識DB11からキーワード検索の結果を取得した場合、取得した検索結果を通知部43へ出力する。
また、取得部41は、通信ネットワークNおよび通信部2を介して検索エンジン12から検索ログ情報31を取得する処理も行う。取得部41は、検索エンジン12から検索ログ情報31を取得した場合、取得した検索ログ情報31を記憶部3に記憶させる。
また、取得部41は、通信ネットワークNおよび通信部2を介して検索エンジン12から前述したキーワードおよび関連ワードに基づくコンテンツの検索結果を取得する処理も行う。このとき、取得部41は、コンテンツの検索結果として、検索エンジン12によって検索されたコンテンツのURLの一覧を取得する。取得部41は、検索エンジン12からコンテンツの検索結果を取得した場合、取得したコンテンツの検索結果を通知部43へ出力する。
(選択部)
選択部42は、取得部41から入力される質問文からキーワードを抽出し、抽出したキーワードに基づいて過去に検索されたコンテンツから質問文に関する関連ワードを選択する処理部である。
選択部42は、検索ログ情報31を参照し、抽出したキーワードに基づいて過去に検索されたコンテンツのうち、例えば、CTRが所定値以上のコンテンツから関連ワードを選択する。つまり、選択部42は、今回抽出されたキーワードに基づいて過去に検索されたコンテンツのうち、比較的高い確率でユーザによって閲覧されたコンテンツ、換言すれば、多くのユーザが知りたいと望む情報が含まれるコンテンツから関連ワードを選択する。
このとき、選択部42は、CTRが所定値以上の各コンテンツ内に頻繁には出現しないが、CTRが所定値以上の複数のコンテンツに共通して出現するワードを関連ワードとして選択する。
つまり、選択部42は、CTRが所定値以上の各コンテンツ内において特徴的なワードであり、且つCTRが所定値以上の複数のコンテンツに出現する重要なワードを関連ワードとして選択する。
なお、選択部42は、例えば、コンテンツに含まれるワードのTF(Term Frequency)値やIDF(Inverse Document Frequency)値に基づいて、上記したような特徴的、且つ重要な関連ワードの選択を行うことができる。
その後、選択部42は、抽出したキーワードと、選択した関連ワードとを、通信部2および通信ネットワークNを介して検索エンジン12へ出力し、検索エンジン12にコンテンツの検索を行わせる。
これにより、選択部42は、抽出したキーワードに、仮に不適切なキーワードが含まれていても、検索エンジン12によって関連ワードに基づくコンテンツの検索を行わせることにより、ユーザが通知を望む情報が含まれるコンテンツを検索させることができる。
なお、選択部42は、抽出したキーワードが多過ぎる場合、複数のキーワードのうちの一部のキーワードと、関連ワードとを検索エンジン12へ出力したり、いずれかのキーワードを関連ワードに置き換えて検索エンジン12へ出力したりすることもできる。
また、選択部42は、取得部41から入力される質問文から質問のタイプを判定する処理も行う。このとき、選択部42は、品名を問うタイプの質問なのか、人名を問うタイプの質問なのか、場所を問うタイプの質問なのか、時間(年月日)を問うタイプの質問なのかといった、ユーザが回答として望む情報のタイプを判定する。そして、選択部42は、判定した質問のタイプを通知部43へ出力する。
(通知部)
通知部43は、選択部42によって選択される関連ワードに基づく回答を、通信部2および通信ネットワークNを介してユーザ端末10へ出力する処理を行う処理部である。具体的には、通知部43は、取得部41から検索エンジン12による関連ワードに基づくコンテンツの検索結果が入力される場合に、検索結果に含まれる複数のコンテンツのURLへアクセスし、各コンテンツから質問文の回答候補となる複数の固有表現を抽出する。
その後、通知部43は、抽出した複数の固有表現のうち、質問のタイプに合致し、且つ複数のコンテンツに共通して出現する出現率が最高の固有表現を質問部の回答として選択し、通信部2および通信ネットワークNを介してユーザ端末10へ通知する。このように、情報処理装置1は、ユーザ端末10のユーザが通知を望む情報の検索に適した関連ワードを選択し、選択した関連ワードに基づく情報をユーザへ通知することができる。
なお、通知部43は、取得部41から知識DB11でキーワード検索された検索結果が入力される場合、検索結果に含まれるテキスト情報から固有表現を抽出し、質問のタイプに合致する重要度が最高の固有表現を質問文の回答として選択する。
通知部43は、例えば、テキスト情報における各固有表現のTF値やIDF値に基づいて、重要度が最も高い固有表現を質問文の回答として選択することができる。通知部43は、こうして選択した回答についても、通信部2および通信ネットワークNを介してユーザ端末10へ通知する。
〔3.情報処理装置が提供するQ&Aサービスの具体例〕
次に、図4と先に説明した図3とを参照しながら、実施形態に係る情報処理装置1が提供するQ&Aサービスの具体例について説明する。図4は、実施形態に係る情報処理装置1が提供するQ&Aサービスの具体例を示す説明図である。
ここでは、ユーザ端末10のユーザが「愛媛県を代表する果物」を知りたい場合に、情報処理装置1が提供するQ&Aサービスの具体的な一例について説明する。図4に示すように、情報処理装置1は、ユーザ端末10から例えば「愛媛で果物といえば?」という質問文をユーザ端末10から取得した場合(ステップS11)、質問のタイプを判定する。
ここでは、情報処理装置1は、ユーザが回答として「果物」の通知を望んでいるため、質問のタイプを「品名」と判定する(ステップS12)。続いて、情報処理装置1は、質問文からキーワードを抽出する。ここでは、情報処理装置1は、質問文から「愛媛、果物」というキーワードを抽出する(ステップS13)。
このとき、情報処理装置1は、例えば、抽出した「愛媛、果物」というキーワードだけに基づいて検索エンジン12にコンテンツを検索させた場合、愛媛県で収穫される代表的でない果物が検索され、ユーザの所望する回答を通知することができないことがある。
そこで、情報処理装置1は、検索ログ情報31に基づき質問文に関連する関連ワードを選択する。ここで、図3に示すように、検索ログ情報31では、「愛媛、果物」というキーワードに対して、複数のコンテンツのスニペットが対応付けられている。
情報処理装置1は、これら複数のスニペットのうち、CTRが所定値(例えば、0.1)以上のスニペットから関連キーワードを選択する。ここでは、情報処理装置1は、前述した関連ワードの選択方法により、関連ワード「1位」を選択する(ステップS14)。
そして、情報処理装置1は、「愛媛&果物&1位」というワードに基づいて、検索エンジン12に該当するコンテンツのAND検索を行わせる(ステップS15)。その後、情報処理装置1は、検索エンジン12から検索結果として、コンテンツのURL一覧を取得する(ステップS16)。
続いて、情報処理装置1は、取得した一覧に含まれる各URLにアクセスし、コンテンツから固有表現を抽出し、抽出した複数の固有表現から前述した回答の選択方法により回答を選択する(ステップS17)。そして、情報処理装置1は、例えば、回答として選択した「みかん」を回答としてユーザ端末10へ通知する(ステップS18)。
このように、情報処理装置1は、キーワードと関連ワードとに基づいて検索エンジン12にコンテンツを検索させることによって、ユーザが望む「愛媛県を代表する果物」である「みかん」を回答としてユーザ端末10へ通知することができる。
なお、ここでは、情報処理装置1は、一つの関連ワードを選択し、キーワードと関連ワードとに基づいて検索エンジン12にコンテンツを検索させたが、複数の関連ワードを選択することもできる。
情報処理装置1は、複数の関連ワードを選択できた場合、複数の関連キーワードだけに基づいて検索エンジン12にコンテンツを検索させることもできる。これによっても、情報処理装置1は、ユーザが通知を望む情報の検索に適したワードを選択し、選択したワードに基づく情報をユーザへ通知することができる。
〔4.関連ワードの他の選択方法〕
なお、これまで、選択部42が検索エンジン12によって過去に検索されたコンテンツのうち、CTRが所定値以上のコンテンツから関連ワードを選択する場合について説明したが、関連ワードの選択方法は、これに限定されるものではない。
ここで、図5および図6を参照し、関連ワードの他の選択方法の一例について説明する。図5および図6は、実施形態に係る関連ワードの他の選択方法の説明図である。なお、図5および図6には、3つのコンテンツの時間経過に伴うCTRの推移を示している。
図5に示すように、検索エンジン12によって検索される複数のコンテンツの中には、時間の経過に伴ってCTRが周期的に増大するコンテンツがある。図5に示す例では、実線でCTRの推移を示すコンテンツは、毎年6月にCTRが最大となる。また、点線でCTRの推移を示すコンテンツは、毎年12月、一転鎖線でCTRの推移を示すコンテンツは、毎年1月にCTRが最大となる傾向がある。
かかる傾向は、一年のうちで決まった時期に開催されるイベントや慣習に関連するコンテンツで顕著に表れる。例えば、結婚式に関連するコンテンツは、6月にCTRが高くなる傾向があり、クリスマスに関するコンテンツは12月にCTRが高くなる傾向があり、新年会などの年始行事に関連するコンテンツのCTRは、1月に高くなる傾向がる。
そこで、選択部42は、例えば、検索ログ情報31に各コンテンツのCTRの時間経過に伴う推移を示す情報が含まれている場合、下記のようにして関連ワードの選択を行う。具体的には、選択部42は、キーワードに基づいて過去に検索された複数のコンテンツのCTRが周期的に増大する場合、複数のコンテンツのうち、質問文が取得された時期とCTRが増大する時期とが重複するコンテンツから関連ワードを選択する。
選択部42は、例えば、取得部41によって6月に質問文が取得される場合、過去に検索エンジン12によってキーワード検索されたコンテンツのうち、図5に実線でCTRの推移を示すような毎年6月にCTRが最大となるコンテンツから関連ワードを選択する。
これにより、選択部42は、取得部41によって質問文が取得された時期に多くのユーザによって頻繁に閲覧されたコンテンツから関連ワードを選択することができる。したがって、通知部43は、より的確にユーザが通知を望む回答をユーザ端末10へ通知することができる。
また、検索エンジン12によって検索されるコンテンツの中には、時間の経過に関係なくCTRが一定のコンテンツや、時間の経過に伴ってCTRが徐々に増大したり、徐々に減少したりするコンテンツがある。
例えば、図6に示すように、実線でCTRの推移を示すコンテンツは、時間の経過に関係なくCTRが常時所定の閾値を超えている。また、点線でCTRの推移を示すコンテンツは、2013年から2014年までの間にCTRが閾値を超え、その後、継続してCTRが閾値を上回っている。このことから、実線または点線によってCTRの推移を示すコンテンツは、近年、多くのユーザが興味を持っているコンテンツであることが分かる。
一方、一転鎖線でCTRの推移を示すコンテンツは、2010からCTRが徐々に減少し、2013年でCTRが閾値以下となり、その後、継続してCTRが閾値を下回っている。このことから、一転鎖線でCTRの推移を示すコンテンツは、近年、ユーザが興味を持っていないコンテンツであることが分かる。
そこで、選択部42は、取得部41によって2017に質問が取得される場合、過去に検索エンジン12によってキーワード検索されたコンテンツのうち、図6に実線または点線でCTRの推移を示すような近年(例えば、ここ3年)で多くのユーザが興味を持っているコンテンツから関連ワードを選択する。
これにより、選択部42は、質問したユーザが興味を持っている可能性の高いコンテンツから関連ワードを選択することができる。したがって、通知部43は、ユーザが通知を望む可能性の高い回答をユーザ端末10へ通知することができる。
また、選択部42は、質問文から抽出されたキーワードに基づいて検索された複数のコンテンツのうち、過去に閲覧された回数が所定回数以上のコンテンツから関連ワードを選択することもできる。
例えば、選択部42は、図3に示す検索ログ情報31が記憶部3に記憶されている場合、質問文から抽出された検索キーワードで検索されたコンテンツのうち、ビュー数が1000回以上のコンテンツから関連ワードを選択する。
これにより、選択部42は、より多くのユーザが興味を持っているコンテンツから関連ワードを選択することができる。したがって、通知部43は、ユーザが通知を望む可能性の高い回答をユーザ端末10へ通知することができる。
また、選択部42は、キーワードに基づいて検索された複数のコンテンツのうち、公開されてから所定期間(例えば、1年)以内のコンテンツから関連ワードを選択することもできる。
これにより、選択部42は、例えば、ここ1年で注目が集まって今が旬のコンテンツから関連ワードを選択することができる。したがって、通知部43は、質問のタイプが、今が旬の商品等を問うタイプの場合に、ユーザが通知を望む可能性の高い回答をユーザ端末10へ通知することができる。
また、選択部42は、質問文から質問のタイプを判定し、キーワードに基づいて検索された複数のコンテンツのうち、判定したタイプに合致するコンテンツからワードを選択することもできる。これにより、選択部42は、質問文からの関連性が少ない関連ワードを誤って選択することを防止することができる。
〔5.情報処理装置の処理〕
次に、図7を参照し、実施形態に係る情報処理装置1の制御部4が実行する処理の一例について説明する。図7は、実施形態に係る情報処理装置1の制御部4が実行する処理の一例を示すフローチャートである。
図7に示すように、制御部4は、まず、ユーザ端末10から質問文を取得したか否かを判定し(ステップS101)、質問部を取得しないと判定した場合(ステップS101,No)、質問文を取得するまでステップS101の判定処理を繰り返す。
また、制御部4は、質問文を取得したと判定した場合(ステップS101,Yes)、質問のタイプを判定する(ステップS102)。続いて、制御部4は、質問文からキーワードを抽出し(ステップS103)、キーワードに基づく知識DB11の検索を行う(ステップS104)。
そして、制御部4は、知識DB11に回答があるか否かを判定し(ステップS105)、回答があると判定した場合(ステップS105,Yes)、知識DB11から回答を取得し、回答をユーザ端末10へ通知して(ステップS111)、処理を終了する。その後、制御部4は、再度ステップS101から処理を開始する。
また、制御部4は、知識DB11に回答がないと判定した場合(ステップS105,No)、検索ログ情報31に基づき質問文に関連する関連ワードを選択する(ステップS106)。続いて、制御部4は、キーワードと関連ワードとに基づいて検索エンジン12にコンテンツの検索を行わせる(ステップS107)。
その後、制御部4は、検索エンジン12によって検索されたコンテンツから複数の固有表現を抽出する(ステップS108)。そして、制御部4は、抽出した複数の固有表現から回答となる固有表現をコンテンツにおける出現率に基づいて選択し(ステップS109)、選択した固有表現を質問文の回答としてユーザ端末10へ通知して(ステップS110)、処理を終了する。
その後、制御部4は、再度ステップS101から処理を開始する。なお、ここでは図示を省略したが、制御部4は、検索エンジン12によって検索されたコンテンツから質問文の回答を発見できなかった場合、例えば、「分かりません」というテキスト情報をユーザ端末10へ返信する。
〔6.変形例〕
上述した実施形態に係る情報処理システムは、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、情報処理システムの他の実施形態について説明する。
上述した実施形態では、情報処理装置1は、知識DB11に回答がない場合に、関連ワードに基づいて検索エンジン12にコンテンツを検索させ、検索されたコンテンツから選択した回答をユーザ端末10へ通知したが、これは一例である。
情報処理装置1は、例えば、知識DB11に回答がない場合に、検索ログ情報31に基づいて関連ワードを選択し、選択した関連ワードに基づいて再度知識DB11を検索する構成であってもよい。
これにより、情報処理装置1は、キーワード検索では知識DB11から回答を取得できなかった場合であっても、関連ワードに基づく検索によって知識DB11から回答を取得することができる可能性があり、知識DB11を有効活用することができる。
また、情報処理装置1は、選択した関連ワードを情報の検索に有効なキーワードとして、質問文を送信してきたユーザ端末10へ通知する構成であってもよい。これにより、ユーザ端末10のユーザは、例えば、検索エンジン12による検索で回答が得られない場合に、情報処理装置1が利用不可能な他の検索エンジンに関連ワードを入力してコンテンツの検索を行わせることで回答を得ることもできる。
〔7.効果〕
上述したように、実施形態に係る情報処理装置1は、取得部41と、選択部42と、通知部43とを備える。取得部41は、ユーザ端末10から質問文を取得する。選択部42は、取得部41によって取得される質問文からキーワードを抽出し、キーワードに基づいて検索されたコンテンツから質問文に関連する関連ワードを選択する。通知部43は、選択部42によって選択される関連ワードに基づく回答をユーザ端末10へ通知する。その結果、情報処理装置1は、ユーザが通知を望む情報の検索に適したワードを選択し、選択したワードに基づく情報をユーザへ通知することができる。
また、選択部42は、キーワードに基づいて検索された複数のコンテンツのうち、CTRが所定値以上のコンテンツから関連ワードを選択する。これにより、選択部42は、頻繁に閲覧されるコンテンツから関連ワードを選択することができる。その結果、情報処理装置1は、ユーザが通知を望む可能性の高い回答をユーザ端末10へ通知することができる。
また、選択部42は、キーワードに基づいて検索された複数のコンテンツのCTRが周期的に増大する場合、複数のコンテンツのうち、取得部41によって質問文が取得された時期とCTRが増大する時期とが重複するコンテンツから関連ワードを選択する。これにより、選択部42は、取得部41によって質問文が取得された時期に多くのユーザによって頻繁に閲覧されたコンテンツから関連ワードを選択することができる。したがって、情報処理装置1は、より的確にユーザが通知を望む回答をユーザ端末10へ通知することができる。
また、選択部42は、キーワードに基づいて検索された複数のコンテンツのうち、過去に閲覧された回数が所定回数以上のコンテンツから関連ワードを選択する。その結果、選択部42は、より多くのユーザが興味を持っているコンテンツから関連ワードを選択することができる。したがって、情報処理装置1は、ユーザが通知を望む可能性の高い回答をユーザ端末10へ通知することができる。
また、選択部42は、キーワードに基づいて検索された複数のコンテンツのうち、公開されてから所定期間以内のコンテンツから関連ワードを選択する。その結果、選択部42は、例えば、今が旬のコンテンツから関連ワードを選択することができる。したがって、情報処理装置1は、質問のタイプが、今が旬の商品等を問うタイプの場合に、ユーザが通知を望む可能性の高い回答をユーザ端末10へ通知することができる。
また、選択部42は、質問文から質問のタイプを判定し、キーワードに基づいて検索された複数のコンテンツのうち、判定したタイプに合致するコンテンツから関連ワードを選択する。その結果、選択部42は、質問文からの関連性が少ない関連ワードを誤って選択することを防止することができる。
また、通知部43は、関連ワードに基づいて検索される複数のコンテンツから質問文の回答候補となる複数の固有表現を抽出し、複数の固有表現のうち複数のコンテンツに共通して出現する出現率が最高の固有表現を回答としてユーザ端末10へ通知する。その結果、情報処理装置1は、複数のコンテンツの中で特徴的、且つ重要な固有表現を回答としてユーザ端末10へ通知することができる。
〔8.ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置1は、例えば図8に示すような構成のコンピュータ1000によって実現される。図8は、実施形態に係る情報処理装置1の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、通信ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを通信ネットワークNを介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る情報処理装置1として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部4の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信ネットワークNを介してこれらのプログラムを取得してもよい。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
〔9.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、取得部41、選択部42、または通知部43を情報処理装置1の外部装置としてネットワーク経由で接続するようにしてもよい。また、取得部41、選択部42、または通知部43を別の装置がそれぞれ有し、ネットワーク接続されて協働することで、上記の情報処理装置1の機能を実現するようにしてもよい。すなわち、情報処理装置1は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部41は、取得手段や取得回路に読み替えることができる。
1 情報処理装置
2 通信部
3 記憶部
4 制御部
31 検索ログ情報
41 取得部
42 選択部
43 通知部

Claims (8)

  1. ユーザ端末から質問文を取得する取得部と、
    前記取得部によって取得される前記質問文からキーワードを抽出し、当該キーワードに基づいて検索されたコンテンツから前記質問文に関連する関連ワードを選択する選択部と、
    前記選択部によって選択される前記関連ワードに基づく回答を前記ユーザ端末へ通知する通知部と
    を備え、
    前記選択部は、
    前記キーワードに基づいて検索された複数のコンテンツのCTR(Click Through Rate)が周期的に増大する場合、前記複数のコンテンツのうち、前記取得部によって前記質問文が取得された時期とCTRが増大する時期とが重複するコンテンツから前記関連ワードを選択する
    ことを特徴とする情報処理装置。
  2. 前記選択部は、
    前記キーワードに基づいて検索された複数のコンテンツのうち、CTRが所定値以上のコンテンツから前記関連ワードを選択する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記選択部は、
    前記キーワードに基づいて検索された複数のコンテンツのうち、過去に閲覧された回数が所定回数以上のコンテンツから前記関連ワードを選択する
    ことを特徴とする請求項1または請求項2に記載の情報処理装置。
  4. 前記選択部は、
    前記キーワードに基づいて検索された複数のコンテンツのうち、公開されてから所定期間以内のコンテンツから前記関連ワードを選択する
    ことを特徴とする請求項1〜3のいずれか一つに記載の情報処理装置。
  5. 前記選択部は、
    前記質問文から質問のタイプを判定し、前記キーワードに基づいて検索された複数のコンテンツのうち、判定した前記タイプに合致するコンテンツから前記関連ワードを選択する
    ことを特徴とする請求項1〜4のいずれか一つに記載の情報処理装置。
  6. 前記通知部は、
    前記関連ワードに基づいて検索される複数のコンテンツから前記質問文の回答候補となる複数の固有表現を抽出し、当該複数の固有表現のうち前記複数のコンテンツに共通して出現する出現率が最高の固有表現を前記回答として前記ユーザ端末へ通知する
    ことを特徴とする請求項1〜5のいずれか一つに記載の情報処理装置。
  7. コンピュータが実行する情報処理方法であって、
    ユーザ端末から質問文を取得する取得工程と、
    前記取得工程によって取得される前記質問文からキーワードを抽出し、当該キーワードに基づいて検索されたコンテンツから前記質問文に関連する関連ワードを選択する選択工程と、
    前記選択工程によって選択される前記関連ワードに基づく回答を前記ユーザ端末へ通知する通知工程と
    を含み、
    前記選択工程は、
    前記キーワードに基づいて検索された複数のコンテンツのCTRが周期的に増大する場合、前記複数のコンテンツのうち、前記取得工程によって前記質問文が取得された時期とCTRが増大する時期とが重複するコンテンツから前記関連ワードを選択する
    ことを特徴とする情報処理方法。
  8. コンピュータに、
    ユーザ端末から質問文を取得する取得手順と、
    前記取得手順によって取得される前記質問文からキーワードを抽出し、当該キーワードに基づいて検索されたコンテンツから前記質問文に関連する関連ワードを選択する選択手順と、
    前記選択手順によって選択される前記関連ワードに基づく回答を前記ユーザ端末へ通知する通知手順と
    を実行させ、
    前記選択手順は、
    前記キーワードに基づいて検索された複数のコンテンツのCTRが周期的に増大する場合、前記複数のコンテンツのうち、前記取得手順によって前記質問文が取得された時期とCTRが増大する時期とが重複するコンテンツから前記関連ワードを選択する
    ことを特徴とする情報処理プログラム。
JP2017223094A 2017-11-20 2017-11-20 情報処理装置、情報処理方法、および情報処理プログラム Active JP6925244B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017223094A JP6925244B2 (ja) 2017-11-20 2017-11-20 情報処理装置、情報処理方法、および情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017223094A JP6925244B2 (ja) 2017-11-20 2017-11-20 情報処理装置、情報処理方法、および情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2019095940A JP2019095940A (ja) 2019-06-20
JP6925244B2 true JP6925244B2 (ja) 2021-08-25

Family

ID=66971771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017223094A Active JP6925244B2 (ja) 2017-11-20 2017-11-20 情報処理装置、情報処理方法、および情報処理プログラム

Country Status (1)

Country Link
JP (1) JP6925244B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11841867B2 (en) 2019-08-09 2023-12-12 International Business Machines Corporation Query relaxation using external domain knowledge for query answering
JP7434916B2 (ja) * 2020-01-20 2024-02-21 富士電機株式会社 検索システム、検索方法及び検索プログラム
JP7511541B2 (ja) 2021-12-27 2024-07-05 フリー株式会社 プログラム、情報処理装置及び方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002132812A (ja) * 2000-10-19 2002-05-10 Nippon Telegr & Teleph Corp <Ntt> 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体
JP4037250B2 (ja) * 2002-12-11 2008-01-23 沖電気工業株式会社 質問応答装置、質問応答プログラムおよび該プログラムを記録した記録媒体
JP5060020B2 (ja) * 2004-10-29 2012-10-31 株式会社エヌ・ティ・ティ・ドコモ コンテンツ発見装置
JP2006163623A (ja) * 2004-12-03 2006-06-22 Nippon Hoso Kyokai <Nhk> 質問応答装置及び質問応答プログラム、並びに、テレビ受像機
JP2011022624A (ja) * 2009-07-13 2011-02-03 Nec Corp ウェブページ検索システム、ウェブページ検索方法、ウェブページ検索サーバ及びウェブページ検索プログラム
JP5084859B2 (ja) * 2010-03-17 2012-11-28 ヤフー株式会社 情報処理装置、データ抽出方法、及びプログラム
JP6179971B2 (ja) * 2012-11-29 2017-08-16 Necソリューションイノベータ株式会社 情報提供装置及び情報提供方法

Also Published As

Publication number Publication date
JP2019095940A (ja) 2019-06-20

Similar Documents

Publication Publication Date Title
US8856168B2 (en) Contextual application recommendations
WO2019205716A1 (zh) 一种搜索应用程序内信息的方法及设备
US8655906B1 (en) Method and system for displaying real time trends
US10713291B2 (en) Electronic document generation using data from disparate sources
US20040002945A1 (en) Program for changing search results rank, recording medium for recording such a program, and content search processing method
US9892096B2 (en) Contextual hyperlink insertion
US20090094210A1 (en) Intelligently sorted search results
AU2015202478A1 (en) Combining internal and external search results
JP7119124B2 (ja) 検索動作出力要素のアクションインジケータ
US10083222B1 (en) Automated categorization of web pages
JP6162664B2 (ja) 抽出装置、検索サーバ、情報処理装置、抽出システム、抽出方法及び抽出プログラム
US11604843B2 (en) Method and system for generating phrase blacklist to prevent certain content from appearing in a search result in response to search queries
US10496686B2 (en) Method and system for searching and identifying content items in response to a search query using a matched keyword whitelist
US9110901B2 (en) Identifying web pages of the world wide web having relevance to a first file by comparing responses from its multiple authors
US11423096B2 (en) Method and apparatus for outputting information
JP6925244B2 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
JP6728178B2 (ja) 検索データを処理するための方法及び装置
US20220067113A1 (en) Filtering and Scoring of Web Content
US20210109982A1 (en) Identifying and storing relevant user content in a collection accessible to user in website subscribed to service
US20160063061A1 (en) Ranking documents with topics within graph
US20150149448A1 (en) Method and system for generating dynamic themes for social data
JP2017068547A (ja) 情報提供装置、プログラム及び情報提供方法
US11341138B2 (en) Method and system for query performance prediction
CN109981712B (zh) 用于推送信息的方法和装置
KR20190109628A (ko) 개인화된 기사 컨텐츠 제공 방법 및 장치

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210803

R150 Certificate of patent or registration of utility model

Ref document number: 6925244

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250