JP2015069608A - ユーザと対話的に検索を進行させるプログラム、サーバ及び方法 - Google Patents

ユーザと対話的に検索を進行させるプログラム、サーバ及び方法 Download PDF

Info

Publication number
JP2015069608A
JP2015069608A JP2013206055A JP2013206055A JP2015069608A JP 2015069608 A JP2015069608 A JP 2015069608A JP 2013206055 A JP2013206055 A JP 2013206055A JP 2013206055 A JP2013206055 A JP 2013206055A JP 2015069608 A JP2015069608 A JP 2015069608A
Authority
JP
Japan
Prior art keywords
information gain
content
user
category
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013206055A
Other languages
English (en)
Other versions
JP6146864B2 (ja
Inventor
▲シン▼ 徐
Shin Jo
▲シン▼ 徐
加藤 恒夫
Tsuneo Kato
恒夫 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2013206055A priority Critical patent/JP6146864B2/ja
Publication of JP2015069608A publication Critical patent/JP2015069608A/ja
Application granted granted Critical
Publication of JP6146864B2 publication Critical patent/JP6146864B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】情報利得に基づいて質問文を選択し、ユーザと対話的に検索を進行させる場合、検索結果に至るまでの質問文の絞り込みをできる限り早くするプログラム等を提供する。
【解決手段】コンテンツ蓄積手段を用いて、回答文に含まれる単語を検索キーとして、コンテンツ集合Sを検索するコンテンツ検索手段と、コンテンツ集合Sに対するカテゴリa毎の情報利得IG(a)を算出する情報利得算出手段と、コンテンツ集合Sの中で、ユーザに任意に複数のコンテンツを選択させるコンテンツ選択手段と、ユーザによって選択された複数のコンテンツに対するカテゴリa毎の選択確率P(a)を算出する選択確率算出手段と、カテゴリa毎に、情報利得IG(a)に選択確率P(a)を重み付けした更新情報利得を算出する更新情報利得算出手段としてコンピュータを機能させる。そして、対話進行インタフェース手段は、更新情報利得が最も高いカテゴリに基づく質問文をユーザに明示する。
【選択図】図3

Description

本発明は、ユーザと対話的に検索を進行させるプログラムの技術に関する。
人間に対して自然な対話を実現した対話システムが、特にスマートフォンやタブレット端末を用いて一般的に普及しつつある。その中でも、対話シナリオに従ってユーザとの間で交互に対話を進行させることによって、ユーザが必要とするであろうコンテンツを検索する技術がある。
従来、回答者の心理状態に基づいて次の質問文を選択し、質問パターンの固定化を防止する対話型遊技装置の技術がある(例えば特許文献1参照)。この技術によれば、多数の複数の質問文を、その質問文の選択基準と共に記録したデータベースを有する。その上で、質問文に対する回答者の音声から、その回答者の心理状態を分析し、その心理状態と質問文の選択基準とを対照し、データベースから質問文を選択する。その質問文は、質問者にガイダンスとして提供される。即ち、この技術によれば、質問文の順番は、固定されたものではなく、ユーザの心理状態に合わせて変更される。
また、ユーザ自身が明確なクエリ(質問文)を持っていない場合であっても対話を進行させ、ユーザの目的とするであろうコンテンツを検索する技術がある(例えば非特許文献1参照)。この技術によれば、例えばレシピの検索の用途について、システムが、レシピに関する質問文をユーザへ提示し、そのユーザに「はい/いいえ」と回答させて、検索候補を絞り込んでいく。レシピデータの分類に応じて、大量の質問文がデータベースに記憶されている。そして、システムは、検索候補のレシピ集合の中で、情報利得(Information gain)が最も大きい質問文を選択する。これによって、目標とすべき検索結果に至るまでの質問文の絞り込みを早くする(質問の回数を少なくする)ことができる。
図1は、従来技術における対話検索プログラムの処理を表す説明図である。
図1によれば、ユーザとの対話によって、レシピコンテンツを検索する場合を想定している。
(S1)システムが、ユーザへ「何の材料を使いますか?」と質問したとする。
(S2)これに対し、ユーザが、「豚肉とキャベツがいい」と回答したとする。このとき、ユーザにとっては、「ヘルシー」なダイエット料理を所望していたかもしれない。
(S3)システムとしては、回答文に含まれる「豚肉」「キャベツ」を検索キーとして、データベースからレシピのコンテンツ集合Sを検索する。そのコンテンツ集合Sの中から、カテゴリaに関するコンテンツ集合Sa毎に、情報利得(information gain)が算出される。
中華料理に関するコンテンツ集合Sa :情報利得=0.60
パーティに関するコンテンツ集合Sa :情報利得=0.56
電子レンジに関するコンテンツ集合Sa :情報利得=0.53
ヘルシーな料理に関するコンテンツ集合Sa:情報利得=0.50
(S4)情報利得=0.60となる「中華料理に関するコンテンツ集合」が選択される。そこで、システムは、回答者に対して「中華料理ですか?」を質問することとなる。
この技術によれば、「情報利得」が最も高い質問文が選択される。情報利得とは、例えば決定木アルゴリズムID3(Iterative Dichotomiser 3)で特徴選択に用いられる特徴の良さの規準をいう。ID3は、汎用目的で設計された教師あり学習アルゴリズムの一種である。
特開2002−177647号公報
XU Xin、KATO Tsuneo、KDDIRD Lab.、「Interactive Recipe Search Interface usingSpoken Dialogue Agent for Tablet Devices」、電子情報通信学会技術研究報告、113号、73(HIP2013 1-31)、pp.191-193 ID3、[online]、[平成25年9月7日検索]、インターネット<URL:http://ja.wikipedia.org/wiki/ID3>
しかしながら、図1によれば、回答者は、実は「ヘルシー」なダイエット料理を所望していたにも拘わらず、中華料理であるか否かの質問を受けることとなる。ここで、回答者自身がどのようなレシピ内容に気になっているかを全く考慮しておらず、単に情報利得のみで次の質問文を判断していることが問題ではないか?と、本願の発明者らは考えた。
そこで、本発明は、情報利得に基づいて質問文を選択することによって、ユーザと対話的に検索を進行させる場合、目標とすべき検索結果に至るまでの質問文の絞り込みをできる限り早くするプログラム、サーバ及び方法を提供することを目的とする。
本発明によれば、ユーザと対話的に検索を進行させるようにコンピュータを機能させる対話検索プログラムであって、
検索対象となる多数のコンテンツを蓄積すると共に、各コンテンツに1つ以上のカテゴリを付与して記憶するコンテンツ蓄積手段と、
ユーザに対してカテゴリに基づく質問文を明示し、その回答文を取得する対話進行インタフェース手段と、
コンテンツ蓄積手段を用いて、回答文に含まれる単語を検索キーとして、コンテンツ集合Sを検索するコンテンツ検索手段と、
コンテンツ集合Sに対するカテゴリa毎の情報利得IG(a)を算出する情報利得算出手段と、
コンテンツ集合Sの中で、ユーザに任意に複数のコンテンツを選択させるコンテンツ選択手段と、
ユーザによって選択された複数のコンテンツに対するカテゴリa毎の選択確率P(a)を算出する選択確率算出手段と、
カテゴリa毎に、情報利得IG(a)に選択確率P(a)を重み付けした更新情報利得PIG(a)を算出する更新情報利得算出手段と
してコンピュータを機能させ、
対話進行インタフェース手段は、更新情報利得が最も高いカテゴリに基づく質問文をユーザに明示する
ようにコンピュータを機能させることを特徴とする。
本発明の対話検索プログラムにおける他の実施形態によれば、
更新情報利得算出手段は、以下の式によって更新情報利得を算出する
PIG(a)=IG(a)×P(a)+Δr (Δr=0〜0.001の乱数)
ようにコンピュータを機能させることも好ましい。
本発明の対話検索プログラムにおける他の実施形態によれば、
更新情報利得算出手段は、以下の式によって更新情報利得を算出する
B=b-P(a) (b:1より大きい自然数)
PIG(a)=IG(a)
ようにコンピュータを機能させることも好ましい。
本発明の対話検索プログラムにおける他の実施形態によれば、
情報利得算出手段について、情報利得IG(a)は、Iterative Dichotomiser 3に基づくものであって、以下の式によって算出される
IG(a)=H(S)−Σt∈Tp(t)H(t)
H(S)=−Σx∈Tp(x)log2p(x)
H(S):コンテンツ集合Sの平均情報量
p(x):コンテンツ集合S全てが、カテゴリxに属するコンテンツとなる割合
ようにコンピュータを機能させることも好ましい。
本発明の対話検索プログラムにおける他の実施形態によれば、
選択確率P(a)は、利用者の利用履歴から算出したカテゴリaに対する利用者の嗜好確率g(a)を事前確率とし、最大事後確率推定(MAP(Maximum a posteriori) estimation)に基づいて算出する
ようにコンピュータを機能させることも好ましい。
本発明の対話検索プログラムにおける他の実施形態によれば、
コンテンツ蓄積手段は、多数のコンテンツをカテゴリに分類するために、機械学習ライブラリを用いたオンライン学習法(Confidence-weighted linear classification)を用いる
ようにコンピュータを機能させることも好ましい。
本発明によれば、ユーザ操作に基づく端末との間で、対話的にシナリオを進行する対話検索サーバであって、
検索対象となる多数のコンテンツを蓄積すると共に、各コンテンツに1つ以上のカテゴリを付与して記憶するコンテンツ蓄積手段と、
に対してカテゴリに基づく質問文を送信し、その回答文を受信する対話進行インタフェース手段と、
コンテンツ蓄積手段を用いて、回答文に含まれる単語を検索キーとして、コンテンツ集合Sを検索するコンテンツ検索手段と、
コンテンツ集合Sに対するカテゴリa毎の情報利得IG(a)を算出する情報利得算出手段と、
コンテンツ集合Sの中で、ユーザに任意に複数のコンテンツを選択させるコンテンツ選択手段と、
ユーザによって選択された複数のコンテンツに対するカテゴリa毎の選択確率P(a)を算出する選択確率算出手段と、
カテゴリa毎に、情報利得IG(a)に選択確率P(a)を重み付けした更新情報利得を算出する更新情報利得算出手段と
を有し、
対話進行インタフェース手段は、更新情報利得が最も高いカテゴリに基づく質問文を、端末へ送信する
ことを特徴とする。
本発明によれば、装置を用いて、ユーザと対話的にシナリオを進行する対話方法であって、
装置は、検索対象となる多数のコンテンツを蓄積すると共に、各コンテンツに1つ以上のカテゴリを付与して記憶するコンテンツ蓄積部を有し、
ユーザに対してカテゴリに基づく質問文を明示し、その回答文を取得する第1のステップと、
コンテンツ蓄積部を用いて、回答文に含まれる単語を検索キーとして、コンテンツ集合Sを検索する第2のステップと、
明示されたコンテンツ集合に対するカテゴリ毎の情報利得IG(A)を算出する第3のステップと、
コンテンツ集合の中で、ユーザに任意に複数のコンテンツを選択させる第4のステップと、
ユーザによって選択された複数のコンテンツに対するカテゴリ毎の選択確率P(a)を算出する第5のステップと、
カテゴリ毎に、情報利得に選択確率を重み付けした更新情報利得を算出する第6のステップと、
更新情報利得が最も高いカテゴリに基づく質問文をユーザに明示する第7のステップと
を有することを特徴とする。
本発明のプログラム、サーバ及び方法によれば、情報利得に基づいて質問文を選択することによって、ユーザと対話的に検索を進行させる場合、目標とすべき検索結果に至るまでの質問文の絞り込みをできる限り早くすることができる。
従来技術における対話検索プログラムの処理を表す説明図である。 本発明における対話検索プログラムの機能構成図である。 本発明における対話検索プログラムの具体的な処理を表す説明図である。 端末に表示されたユーザインタフェースの画面である。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
図2は、本発明における対話検索プログラムの機能構成図である。
図2によれば、ユーザと対話的に検索を進行させる対話検索プログラム1は、端末と通信するサーバ側にインストールされて実行されている。ユーザは、スマートフォンやタブレットような端末を用いて、ネットワークを介して当該サーバへアクセスする。勿論、対話検索プログラム1が、端末自体のような単体装置内にのみにインストールされたものであってもよい。
対話検索プログラム1に対するユーザインタフェースとしての端末2は、ユーザに対する入力デバイス及び出力デバイスを有する。ユーザが回答を発声した場合、マイクで取得された音声信号は、音声認識によってテキストに変換され、そのテキストが対話検索プログラム1へ入力される。また、対話検索プログラム1から出力された質問文は、音声合成によって音声信号に変換され、その音声信号がスピーカから発声される。また、端末2は、タッチパネルディスプレイを搭載し、ユーザに複数のコンテンツを表示すると共に、それらコンテンツを選択させることができる。
図2によれば、対話検索プログラム1は、コンテンツ蓄積部10と、対話進行インタフェース部11と、コンテンツ検索部12と、情報利得算出部13と、コンテンツ選択部14と、選択確率算出部15と、更新情報利得算出部16とを有する。対話検索プログラム1を、装置に搭載されたコンピュータによって実行させることによって、サーバ及び単体装置として機能する。また、これら機能構成部の処理の流れは、対話検索方法としても理解できる。
図3は、本発明における対話検索プログラムの具体的な処理を表す説明図である。
図3によれば、図1と比較して、S3(S31〜S35)における質問文の選択方法が異なる。図3のS1及びS2は、図1と同様である。S3の処理は、コンテンツ検索部12と、情報利得算出部13と、コンテンツ選択部14と、選択確率算出部15と、更新情報利得算出部16とによって実行される。
図4は、端末に表示されたユーザインタフェースの画面である。
図4によれば、端末2のタッチパネルディスプレイが表示されている。そのディスプレイには、「キャラクタ・エージェント」が表示されており、ユーザとエージェントとの間で音声による対話を進めるものであってもよい。勿論、本発明は、音声対話に限定されるものではなく、テキスト対話であってもよい。
図1と同様に、ディスプレイに表示されたユーザエージェントが、「何の材料を使いますか?」(S1)をユーザへ質問する。ユーザは、「豚肉とキャベツがいい」(S2)と、端末2へ発声したとする。
[コンテンツ蓄積部10]
コンテンツ蓄積部10は、検索対象となる多数のコンテンツを蓄積すると共に、各コンテンツに1つ以上の「カテゴリ」を付与して記憶する。例えば、検索対象コンテンツが、レシピであるとする。この場合、以下のように、コンテンツ毎にカテゴリが付与されている。
<コンテンツ名> <カテゴリ>
「ヘルシー★ピーマンの肉詰め」 ->(ヘルシー)(肉料理)
「豪華・中華料理」 ->(中華)(パーティ)
「キャベツサラダ」 ->(サラダ)(イタリアン)
「豚肉を使った男の3分クッキング」 ->(肉料理)(電子レンジ)
「低カロおかず*わけぎとコンニャクのぬた」->(ヘルシー)(和食)
「砂糖なし!電子レンジで基本に筑前煮」->(ヘルシー)(電子レンジ)(和食)
「キャベツの入った麺料理」 ->(麺料理)(和食)
コンテンツ蓄積部10は、多数のコンテンツをカテゴリに分類するために、機械学習ライブラリを用いたオンライン学習法(Confidence-weighted linear classification)を用いることも好ましい。ベクトル特徴に、bag-of-wordsモデルを用い、特徴量に、名詞及び形容詞のTF−IDF値を用いる。前述の例によれば、個々のレシピがどのカテゴリに属するか、を分類することができる。
[対話進行インタフェース部11]
対話進行インタフェース部11は、ユーザに対してカテゴリに基づく質問文を明示し、その回答文を取得する。対話進行インタフェース部11は、動的又は静的な対話シナリオを用いて、ユーザの回答文に応じて質問文を選択し、対話を進行させる。ここで、対話進行インタフェース部11は、制御ロジックに基づいて対話シナリオを進行させるものであるが、「情報利得」が最も高いカテゴリに基づく質問文をユーザに明示する。その情報利得としては、更新情報利得算出部16から出力されたカテゴリ毎の更新情報利得を用いる。即ち、本発明の対話検索プログラムによれば、既存の対話進行インタフェース部11が、更新情報利得算出部16から出力された更新情報利得を用いることに特徴がある。
[コンテンツ検索部12]
コンテンツ検索部12は、コンテンツ蓄積部10を用いて、回答文に含まれる単語を検索キーとして、コンテンツ集合Sを検索する。尚、コンテンツ集合Sは、Confidence-weighted linear classification(CW)ベクトル特徴の特徴量を、bag-of-wordsモデルを用いて検索されるものであってもよい。特徴量としては、名詞及び形容詞のTF−IDF値を用いる。
(S31)図1のS3と同様に、単に、回答文に含まれる「豚肉」「キャベツ」を検索キーとして、コンテンツ蓄積部10からレシピのコンテンツ集合Sが検索される。そのコンテンツ集合Sの中から、カテゴリaに関するコンテンツ集合Saを導出することができる。多数のコンテンツ集合Saの中で、図3によれば、例えば以下の4つのコンテンツ集合Saが表されている。
中華料理に関するコンテンツ集合Sa
パーティに関するコンテンツ集合Sa
電子レンジに関するコンテンツ集合Sa
ヘルシーな料理に関するコンテンツ集合Sa
[情報利得算出部13]
情報利得算出部13は、コンテンツ集合Sに対するカテゴリa毎の情報利得IG(a)を算出する。情報利得算出部13について、情報利得IG(a)は、ID3に基づくものであって、以下の式によって算出される。
IG(a)=H(S)−Σt∈Tp(t)H(t)
H(S)=−Σx∈Tp(x)log2p(x)
H(S):コンテンツ集合Sの平均情報量
p(x):コンテンツ集合S全てが、カテゴリxに属するコンテンツとなる割合
図3のS31によれば、図1のS3と同様に、各コンテンツ集合Saについて以下のように情報利得IG(a)が算出されたとする。以下のように情報利得IG(a)の高い順に、上位4つのコンテンツの集合Saが表されている。
中華料理に関するコンテンツ集合Sa :情報利得=0.60
パーティに関するコンテンツ集合Sa :情報利得=0.56
電子レンジに関するコンテンツ集合Sa :情報利得=0.53
ヘルシーな料理に関するコンテンツ集合Sa:情報利得=0.50
[コンテンツ選択部14]
コンテンツ選択部14は、コンテンツ集合Saの中で、ユーザに任意に複数のコンテンツを選択させる。本発明によれば、情報利得算出部13によって得られたコンテンツ集合Sa毎の情報利得をそのまま利用することなく、一度、ユーザにコンテンツを選択させる。
(S32)図3及び図4によれば、以下のように、S31によって選択されたコンテンツ集合Sに含まれるコンテンツ名のいくつかが、端末2にリスト状に表示される。ここでは、特定のコンテンツ集合Sに偏ることなく、全てのコンテンツ集合から平均的に選択されることが好ましい。
「ヘルシー★ピーマンの肉詰め」
「豪華・中華料理」
「キャベツサラダ」
「豚肉を使った男の3分クッキング」
「低カロおかず*わけぎとコンニャクのぬた」
「砂糖なし!電子レンジで基本に筑前煮」
「キャベツの入った麺料理」
ここで、図4によれば、ユーザは、所望の複数のコンテンツを選択する。例えば以下の3つのコンテンツを選択したとする。
「ヘルシー★ピーマンの肉詰め」
「低カロおかず*わけぎとコンニャクのぬた」
「砂糖なし!電子レンジで基本に筑前煮」
[選択確率算出部15]
選択確率算出部15は、ユーザによって選択された複数のコンテンツに対するカテゴリa毎の選択確率P(a)を算出する。
(S33)選択された各コンテンツから「カテゴリ」が抽出される。図4によれば、以下のようなカテゴリが抽出される。
「ヘルシー★ピーマンの肉詰め」 ->(ヘルシー)(肉料理)
「低カロおかず*わけぎとコンニャクのぬた」->(ヘルシー)(和食)
「砂糖なし!電子レンジで基本に筑前煮」->(ヘルシー)(電子レンジ)(和食)
(S34)次に、カテゴリa毎の選択確率P(a)が算出される。選択確率P(a)は、カテゴリa毎に、その出現回数を、選択されたコンテンツ全数で除算したものである。
p(中華) =0/3=0
p(パーティ) =0/3=0
p(電子レンジ)=1/3=0.333
p(ヘルシー) =3/3=1
[更新情報利得算出部16]
更新情報利得算出部16は、カテゴリa毎に、情報利得IG(a)に選択確率P(a)を重み付けした更新情報利得PIG(a)を算出する。重み付けとしては、例えば以下の2つの算出方法がある。
(更新情報利得算出方法1)
PIG(a)=IG(a)×P(a)+Δr (Δr=0〜0.001の乱数)
(更新情報利得算出方法2)
B=b-P(a) (b:1より大きい自然数)
PIG(a)=IG(a)
(S35)図3によれば、例えば前述した更新情報利得算出方法1(Δr=0.001)によって、以下のように更新情報利得が算出される。
「中華料理ですか?」 :情報利得0.60×重み0+0.001=0.001
「パーティの料理ですか?」 :情報利得0.56×重み0+0.001=0.001
「電子レンジを使いますか?」:情報利得0.53×重み0.333+0.001=0.177
「ヘルシーな料理ですか?」 :情報利得0.50×重み1+0.001=0.5
結果的に、各カテゴリについて最も更新情報利得が高い質問文は、「ヘルシーな料理ですか?」となる。
尚、選択確率P(a)は、利用者の利用履歴(検索した、又は保存したレシピ内容)から算出したカテゴリaに対する利用者の嗜好確率g(a)を事前確率とし、最大事後確率推定(MAP(Maximum a posteriori) estimation)に基づいて算出する。MAP推定によれば、条件付分布のモデルP(X|a)(X:訓練サンプル集合)と、パラメータの事前分布g(a)とが与えられた場合、ベイズの定理によって、パラメータの事後分布は以下のように算出される。
MAP=arg max P(a)=arg maxP(X/a)・g(a)
X:ユーザが選択した各カテゴリのコンテンツの回数
P(X/a):前述した選択確率P(a)と同様の計算方法
g(a):検索されたカテゴリaの回数/検索されたレシピの回数
以上、詳細に説明したように、本発明のプログラム、サーバ及び方法によれば、情報利得に基づいて質問文を選択することによって、ユーザと対話的に検索を進行させる場合、目標とすべき検索結果に至るまでの質問文の絞り込みをできる限り早くすることができる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 対話検索プログラム
10 コンテンツ蓄積部
11 対話進行インタフェース部
12 コンテンツ検索部
13 情報利得算出部
14 コンテンツ選択部
15 選択確率算出部
16 更新情報利得算出部
2 端末

Claims (8)

  1. ユーザと対話的に検索を進行させるようにコンピュータを機能させる対話検索プログラムであって、
    検索対象となる多数のコンテンツを蓄積すると共に、各コンテンツに1つ以上のカテゴリを付与して記憶するコンテンツ蓄積手段と、
    ユーザに対して前記カテゴリに基づく質問文を明示し、その回答文を取得する対話進行インタフェース手段と、
    前記コンテンツ蓄積手段を用いて、前記回答文に含まれる単語を検索キーとして、コンテンツ集合Sを検索するコンテンツ検索手段と、
    前記コンテンツ集合Sに対する前記カテゴリa毎の情報利得IG(a)を算出する情報利得算出手段と、
    前記コンテンツ集合Sの中で、ユーザに任意に複数のコンテンツを選択させるコンテンツ選択手段と、
    ユーザによって選択された複数のコンテンツに対する前記カテゴリa毎の選択確率P(a)を算出する選択確率算出手段と、
    前記カテゴリa毎に、前記情報利得IG(a)に前記選択確率P(a)を重み付けした更新情報利得PIG(a)を算出する更新情報利得算出手段と
    してコンピュータを機能させ、
    前記対話進行インタフェース手段は、前記更新情報利得が最も高いカテゴリに基づく質問文をユーザに明示する
    ようにコンピュータを機能させることを特徴とする対話検索プログラム。
  2. 前記更新情報利得算出手段は、以下の式によって更新情報利得を算出する
    PIG(a)=IG(a)×P(a)+Δr (Δr=0〜0.001の乱数)
    ようにコンピュータを機能させることを特徴とする請求項1に記載の対話検索プログラム。
  3. 前記更新情報利得算出手段は、以下の式によって更新情報利得を算出する
    B=b-P(a) (b:1より大きい自然数)
    PIG(a)=IG(a)
    ようにコンピュータを機能させることを特徴とする請求項1に記載の対話検索プログラム。
  4. 前記情報利得算出手段について、前記情報利得IG(a)は、Iterative Dichotomiser 3に基づくものであって、以下の式によって算出される
    IG(a)=H(S)−Σt∈Tp(t)H(t)
    H(S)=−Σx∈Tp(x)log2p(x)
    H(S):コンテンツ集合Sの平均情報量
    p(x):コンテンツ集合S全てが、カテゴリxに属するコンテンツとなる割合
    ようにコンピュータを機能させることを特徴とする請求項1から3のいずれか1項に記載の対話検索プログラム。
  5. 前記選択確率P(a)は、利用者の利用履歴から算出したカテゴリaに対する利用者の嗜好確率g(a)を事前確率とし、最大事後確率推定(MAP(Maximum a posteriori) estimation)に基づいて算出する
    ようにコンピュータを機能させることを特徴とする請求項1から4のいずれか1項に記載の対話検索プログラム。
  6. 前記コンテンツ蓄積手段は、多数のコンテンツをカテゴリに分類するために、機械学習ライブラリを用いたオンライン学習法(Confidence-weighted linear classification)を用いる
    ようにコンピュータを機能させることを特徴とする請求項1から5のいずれか1項に記載の対話検索プログラム。
  7. ユーザ操作に基づく端末との間で、対話的にシナリオを進行する対話検索サーバであって、
    検索対象となる多数のコンテンツを蓄積すると共に、各コンテンツに1つ以上のカテゴリを付与して記憶するコンテンツ蓄積手段と、
    前記に対して前記カテゴリに基づく質問文を送信し、その回答文を受信する対話進行インタフェース手段と、
    前記コンテンツ蓄積手段を用いて、前記回答文に含まれる単語を検索キーとして、コンテンツ集合Sを検索するコンテンツ検索手段と、
    前記コンテンツ集合Sに対する前記カテゴリa毎の情報利得IG(a)を算出する情報利得算出手段と、
    前記コンテンツ集合Sの中で、ユーザに任意に複数のコンテンツを選択させるコンテンツ選択手段と、
    ユーザによって選択された複数のコンテンツに対する前記カテゴリa毎の選択確率P(a)を算出する選択確率算出手段と、
    前記カテゴリa毎に、前記情報利得IG(a)に前記選択確率P(a)を重み付けした更新情報利得を算出する更新情報利得算出手段と
    を有し、
    前記対話進行インタフェース手段は、前記更新情報利得が最も高いカテゴリに基づく質問文を、前記端末へ送信する
    ことを特徴とする対話検索サーバ。
  8. 装置を用いて、ユーザと対話的にシナリオを進行する対話方法であって、
    前記装置は、検索対象となる多数のコンテンツを蓄積すると共に、各コンテンツに1つ以上のカテゴリを付与して記憶するコンテンツ蓄積部を有し、
    ユーザに対して前記カテゴリに基づく質問文を明示し、その回答文を取得する第1のステップと、
    前記コンテンツ蓄積部を用いて、前記回答文に含まれる単語を検索キーとして、コンテンツ集合Sを検索する第2のステップと、
    明示された前記コンテンツ集合に対する前記カテゴリ毎の情報利得IG(A)を算出する第3のステップと、
    前記コンテンツ集合の中で、ユーザに任意に複数のコンテンツを選択させる第4のステップと、
    ユーザによって選択された複数のコンテンツに対する前記カテゴリ毎の選択確率P(a)を算出する第5のステップと、
    前記カテゴリ毎に、前記情報利得に前記選択確率を重み付けした更新情報利得を算出する第6のステップと、
    前記更新情報利得が最も高いカテゴリに基づく質問文をユーザに明示する第7のステップと
    を有することを特徴とする対話方法。
JP2013206055A 2013-10-01 2013-10-01 ユーザと対話的に検索を進行させるプログラム、サーバ及び方法 Expired - Fee Related JP6146864B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013206055A JP6146864B2 (ja) 2013-10-01 2013-10-01 ユーザと対話的に検索を進行させるプログラム、サーバ及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013206055A JP6146864B2 (ja) 2013-10-01 2013-10-01 ユーザと対話的に検索を進行させるプログラム、サーバ及び方法

Publications (2)

Publication Number Publication Date
JP2015069608A true JP2015069608A (ja) 2015-04-13
JP6146864B2 JP6146864B2 (ja) 2017-06-14

Family

ID=52836146

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013206055A Expired - Fee Related JP6146864B2 (ja) 2013-10-01 2013-10-01 ユーザと対話的に検索を進行させるプログラム、サーバ及び方法

Country Status (1)

Country Link
JP (1) JP6146864B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018005624A (ja) * 2016-07-04 2018-01-11 パナソニックIpマネジメント株式会社 決定木生成装置、決定木生成方法、決定木生成プログラム及び質問システム
JP2018045413A (ja) * 2016-09-14 2018-03-22 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2018092586A (ja) * 2016-11-25 2018-06-14 パナソニックIpマネジメント株式会社 情報処理方法、情報処理装置およびプログラム
CN110727773A (zh) * 2019-10-11 2020-01-24 沈阳民航东北凯亚有限公司 信息提供方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005228354A (ja) * 2005-03-18 2005-08-25 Matsushita Electric Ind Co Ltd 情報検索装置
JP2006338508A (ja) * 2005-06-03 2006-12-14 Nippon Telegr & Teleph Corp <Ntt> 関連コンテンツ探索装置及び方法
JP2008021216A (ja) * 2006-07-14 2008-01-31 Fujitsu Ltd 情報検索システム
JP2009193457A (ja) * 2008-02-15 2009-08-27 Oki Electric Ind Co Ltd 情報検索装置、方法及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005228354A (ja) * 2005-03-18 2005-08-25 Matsushita Electric Ind Co Ltd 情報検索装置
JP2006338508A (ja) * 2005-06-03 2006-12-14 Nippon Telegr & Teleph Corp <Ntt> 関連コンテンツ探索装置及び方法
JP2008021216A (ja) * 2006-07-14 2008-01-31 Fujitsu Ltd 情報検索システム
JP2009193457A (ja) * 2008-02-15 2009-08-27 Oki Electric Ind Co Ltd 情報検索装置、方法及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018005624A (ja) * 2016-07-04 2018-01-11 パナソニックIpマネジメント株式会社 決定木生成装置、決定木生成方法、決定木生成プログラム及び質問システム
JP2018045413A (ja) * 2016-09-14 2018-03-22 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2018092586A (ja) * 2016-11-25 2018-06-14 パナソニックIpマネジメント株式会社 情報処理方法、情報処理装置およびプログラム
CN110727773A (zh) * 2019-10-11 2020-01-24 沈阳民航东北凯亚有限公司 信息提供方法及装置
CN110727773B (zh) * 2019-10-11 2022-02-01 沈阳民航东北凯亚有限公司 信息提供方法及装置

Also Published As

Publication number Publication date
JP6146864B2 (ja) 2017-06-14

Similar Documents

Publication Publication Date Title
US11302337B2 (en) Voiceprint recognition method and apparatus
US10650804B2 (en) Sentiment-based recommendations as a function of grounding factors associated with a user
US20190340538A1 (en) Identifying entities using a deep-learning model
US10509832B2 (en) Generating snippet modules on online social networks
US20160179967A1 (en) Searching for ideograms in an online social network
CN110472251A (zh) 翻译模型训练的方法、语句翻译的方法、设备及存储介质
US10747798B2 (en) Control method, processing apparatus, and recording medium
WO2017075017A1 (en) Automatic conversation creator for news
WO2020238502A1 (zh) 物品推荐方法及装置、电子设备及存储介质
JP6146864B2 (ja) ユーザと対話的に検索を進行させるプログラム、サーバ及び方法
WO2014057486A1 (en) System and method for providing content in real-time
CN115292543B (zh) 基于语音互动小说的数据处理方法及相关产品
US9672202B2 (en) Context-aware re-formating of an input
EP3188086A1 (en) Identifying entities using a deep-learning model
JP2013232090A (ja) 情報処理装置、情報処理方法、並びにプログラム
CN110580285B (zh) 一种产品标签确定方法及装置,电子设备
JP2016177690A (ja) サービス推薦装置およびサービス推薦方法並びにサービス推薦プログラム
Delmastro et al. Social monitoring for food policy and research: Directions and implications
JP6982017B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
Fraser et al. Crime, media, culture: Asia-style
US11288457B1 (en) Dialog management using knowledge graph-driven information state in a natural language processing system
JP6676698B2 (ja) 予約語及び属性言語間の関連度を用いた情報検索方法及び装置
CN109032374B (zh) 一种用于输入法的候选展示方法、装置、介质及设备
Hernández et al. User-centric Recommendation Model for AAC based on Multi-criteria Planning
JP2019194793A (ja) 情報処理装置およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170421

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170511

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170512

R150 Certificate of patent or registration of utility model

Ref document number: 6146864

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees