JP2015228162A - 情報検索方法、装置およびプログラム - Google Patents

情報検索方法、装置およびプログラム Download PDF

Info

Publication number
JP2015228162A
JP2015228162A JP2014114000A JP2014114000A JP2015228162A JP 2015228162 A JP2015228162 A JP 2015228162A JP 2014114000 A JP2014114000 A JP 2014114000A JP 2014114000 A JP2014114000 A JP 2014114000A JP 2015228162 A JP2015228162 A JP 2015228162A
Authority
JP
Japan
Prior art keywords
search
time
date
prediction model
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014114000A
Other languages
English (en)
Other versions
JP6251637B2 (ja
Inventor
服部 元
Hajime Hattori
元 服部
滝嶋 康弘
Yasuhiro Takishima
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2014114000A priority Critical patent/JP6251637B2/ja
Publication of JP2015228162A publication Critical patent/JP2015228162A/ja
Application granted granted Critical
Publication of JP6251637B2 publication Critical patent/JP6251637B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索クエリに含まれる曖昧な時間表現からユーザが意図する日時条件を予測モデルに基づいて解釈し、これを検索条件に反映することで確度の高い情報検索を可能にし、検索結果に対するユーザの反応に基づいて予測モデルを更新することで、曖昧な時間表現に対してユーザが意図する日時条件を予測モデルに反映する。
【解決手段】予測モデルDB4には、曖昧な時間表現から定量的な時間表現を予測する予測モデルが登録されている。日時範囲予測部6は、検索クエリに含まれる曖昧な時間表現を予測モデルDB4に適用することで前記曖昧な時間表現に対応する日時範囲を予測する。Web検索機能部7は、検索クエリおよび日時範囲の予測結果を含む検索要求に基づいて情報検索を実行し、検索結果をディスプレイ3に一覧表示する。ユーザ反応検知部8は、検索結果に対するユーザの反応を検知し、予測モデル更新部9は、ユーザの反応に基づいて予測モデルを更新する。
【選択図】図1

Description

本発明は、検索クエリに含まれる「昔に」、「ちょっと前に」、「近いうちに」、「数年前に」、「以前に」などの曖昧な時間表現に基づいて、時間的な検索条件を設定あるいは適正化する情報検索方法、装置およびプログラムに係り、特に、曖昧な時間表現から定量的あるいは具体的な時間表現を予測するモデルを、検索結果に対するユーザの反応に基づいて更新する情報検索方法、装置およびプログラムに関する。
「昔に」、「ちょっと前に」、「近いうちに」、「数年前に」、「以前」などの曖昧な時間表現は、個人ごとに各表現が表わす具体的な時間表現(3日前〜5日前、6か月前〜3年前、1日後〜1か月後など)が異なることから、情報検索や会話中の意図伝達の障害となる。そこで、日常の発言に含まれる曖昧な時間表現を抽出して個人の時間感覚を獲得し、情報検索や会話中の意図共有を支援する装置が研究されている。
特許文献1には、情報検索の場面において、利用者が入力した曖昧な時間表現に対し、定量的な時間表現を割り当てる機能が開示されている。ここでは、曖昧な時間表現(昨日、5時頃、など)と定量的な時間表現(●月●日、4時〜6時、など)とをマッピングするための対応表(「夜半」は0時、など)およびルール(「頃」は時間を±1する、など)を予め用意し、これらの対応表およびルールに従って時間表現が変換される。
特許文献2には、ユーザが情報検索の際に、検索範囲として正確な日時を指定する技術が開示されている。
非特許文献1は、曖昧な時間表現を定量的な時間表現に変換する際に、「ほぼ」、「少し」などの程度を表す表現に対して、時間の単位の大きさに応じた曖昧さを表す幅を付与する方法が開示されている。例えば、「3分くらい」と「3時間くらい」とでは曖昧さの程度が違うため、その単位の大きさ(分、時間)に応じた幅が付与される。
特開平10−254891号公報 特開2000−244958号公報 特願2014−101383号
「あいまいさを含む時間概念の表現と推論」、全国大会講演論文集 第39回平成元年後期(1), 357-358, 1989-10-16
人が過去の記憶や情報を検索する際あるいは未来の約束をする際、時間情報が正確に入力できないケースがあり、曖昧な時間表現として、例えば「ちょっと前に」、「近いうちに」などを用いることがある。しかしながら、「ちょっと前に」が1時間前〜3時間前なのか、あるいは1時間前〜5時間前なのかなど、曖昧な時間表現が表わす定量的な時間表現は個人ごとに異なる。したがって、曖昧な時間表現をそのまま用いてしまうと、情報検索システムや対話相手が正しく時間情報を理解できないという問題が生じる。
特許文献1では、あらかじめ用意した対応表およびルールを用いた変換方法で解決を試みているが、時間感覚は個人ごとに異なるため、(1) 個人ごとに管理者等が手作業で作成しなければならず、手間がかかってしまう、(2) 時間の範囲を設定する定量的な時間表現だけでは、外れた際のリスクを想定する必要があるため、時間の範囲を必要以上に広く設定する必要があり、さらには(3) 範囲内のどの時間の確率が高いかについても判断できない、といった技術課題があった。このため、例えば情報検索に利用するシーンでは、過剰な情報を検索結果として取得してしまい、かつ検索結果に対する優先度付けを行うことができないため、検索結果の可読性を高めることができなかった。
特許文献2では、検索範囲として具体的な日時を指定できるが、「昔に」、「ちょっと前に」、「近いうちに」、「数年前に」、「以前」などの曖昧な時間表現で検索範囲を指定することはできなかった。非特許文献1では、表現に対して一定のルールに従い幅を付与することができるが、個人差を考慮した柔軟な設定に対応できない。
このような技術課題に対して、本発明の発明者等は、曖昧な時間表現と具体的な時間表現との対応関係を、特別な学習機会や専門の管理者を設けることなく確率分布として個人単位で学習する方法、装置、およびプログラムを発明し、特許出願(特願2014−101383号)した。
しかしながら、曖昧な時間表現と具体的な時間表現との対応関係は、ユーザの時間感覚が継時的に変化する影響を受けて変化する。また、学習環境と実用環境とが異なると、曖昧な時間表現と具体的な時間表現との対応関係に微妙なズレが生じてしまい、ユーザの意図した検索範囲と実際の検索範囲とが一致しなくなる場合もある。
本発明の目的は、上記の技術課題を解決し、検索クエリに含まれる曖昧な時間表現からユーザが意図する日時条件を予測モデルに基づいて定量的に解釈し、これを検索条件に反映することで確度の高い情報検索を可能にすると共に、検索結果に対するユーザの反応に基づいて予測モデルを更新することで、曖昧な時間表現に対してユーザが意図する日時条件を予測モデルに反映できる情報検索方法、装置およびプログラムを提供することにある。
上記の目的を達成するために、本発明は、曖昧な時間表現を含む検索クエリに対して当該時間表現に対応した検索条件による検索結果を応答する情報検索装置において、以下の構成を具備した点に特徴がある。
(1) 曖昧な時間表現ごとに定量的な日時範囲を確率的に予測する予測モデルと、検索クエリに含まれる曖昧な時間表現を前記予測モデルに適用して確率値が所定の設定範囲内の日時範囲を予測する手段と、検索クエリおよび前記日時範囲を検索条件とする検索で得られた検索結果を一覧表示する検索機能手段と、検索結果に対するユーザの反応を検知するユーザ反応検知手段と、ユーザの反応に基づいて、予測モデルの前記日時範囲の予測結果に対応した確率値を増減補正する予測モデル更新手段とを具備した。
(2) 予測モデル更新手段は、予測モデルの前記日時範囲の予測結果に対応した確率値を、前記ユーザ反応検知手段によりユーザが検索結果に満足したと推定される入力操作が検知されると増補正し、ユーザが検索結果に満足していないと推定される入力操作が検知されると減補正するようにした。
(3) 増補正または減補正された確率値の当該増減分が、時間経過と共に漸減されるようにした。
(4) 学習データ候補の中から、曖昧な時間表現および日時特定可能な事象表現を含む学習データを抽出する学習データ抽出手段と、履歴情報から、前記事象表現に関連する履歴の日時を検索して曖昧な時間表現に対応する実績値を算出する手段と、曖昧な時間表現とその実績値との対応関係に基づいて予測モデルを構築する手段とを具備した。
(5) 事象表現に関連する日時の検索結果を評価する評価手段を具備し、評価値が所定の基準値に満たない対応関係は予測モデルの構築に用いないようにした。
(6) 音声信号を検出する手段と、音声信号を文字データの時系列に変換する手段と、文字データの時系列を所定の規則で分割して学習データ候補を生成する手段とを具備した。
本発明によれば、以下のような効果が達成される。
(1) 曖昧な時間表現から定量的な日時範囲を予測するモデルが確率分布として与えられ、この日時範囲を検索条件とする検索結果に対するユーザの反応、評価に基づいて、予測モデルの当該日時範囲に対応した確率値が増減補正される。したがって、ユーザの評価を予測モデルの更新に反映させることができ、曖昧な時間表現から定量的な日時範囲を予想する際の精度ひいては検索精度に継時的な向上を期待できるようになる。
(2) 検索結果に対するユーザの反応をユーザの入力操作に基づいて検知するようにしたので、ユーザの主観を物理的に検知できるようになる。
(3) ユーザ評価を予測モデルの更新に反映させる際、より新しい検索結果に基づく増減補正を、より強く予測モデルに反映させるので、ユーザの曖昧な時間表現と定量的な日時範囲との関係に継時的な変化が生じても、この継時変化を日時範囲の予測に正確に反映させることが可能となり、ひいては正確な情報検索を実現できるようになる。
(4) 曖昧な時間表現を、これを発声したユーザの履歴情報に基づいて、当該ユーザが過去に用いた曖昧な時間表現に対応した実績値すなわち対応する実際の期間を検索して対応付けて学習するので、曖昧な時間表現から定量的な時間表現を正確に予測できる予測モデルをユーザごとに構築できるようになる。
(5) 曖昧な時間表現に対応した実績値の検索結果を、そのマッチング精度や分散に基づいて評価し、評価値の低い検索結果は予測モデルの構築に利用しないようにしたので、確度の低い検索結果や誤った検索結果に基づいて予測モデルが構築されてしまうことを防止できるようになる。
(6) ユーザが日常的に発声する音声データを検知して学習データ候補を生成するようにしたので、特別な学習機会や専門の管理者を設けることなく、個人差を考慮した学習を簡単に行えるようになる。
本発明の第1実施形態に係る情報検索装置の機能ブロック図である。 予測モデルDBに蓄積される予測モデルの一例を示した図である。 予測モデルの確率値に基づく日時範囲の予測方法を示した図である。 本発明の第1実施形態の動作を示したフローチャートである。 予測モデルの更新方法を示した図である。 本発明の第2実施形態に係る時間表現学習装置の機能ブロック図である。 学習データ候補から学習データを抽出する方法を示した図である。 本発明の第2実施形態の動作を示したフローチャートである。
以下、図面を参照して本発明の実施の形態について詳細に説明する。図1は、本発明の一実施形態に係る情報検索装置の主要部の構成を示した機能ブロック図であり、汎用のコンピュータやサーバ、あるいはスマートフォンやタブレット端末といったモバイル端末に、後述する各機能を実現するアプリケーション(プログラム)を実装することで構成できる。あるいはアプリケーションの一部がハードウェア化またはROM化された専用機や単能機としても構成できる。また、コンピュータやサーバで構成する場合には、ネットワーク上で複数人が共有するクラウドサービスにも適用できる。ここでは、スマートフォンへの適用を例にして説明するものとし、本発明の説明に不要な構成は図示を省略する。
ユーザインタフェース(I/F)1には、スマートフォンユーザ(以下、スマホユーザと表現する)の音声信号を検知するマイクロフォンMCおよびテキスト入力や各種のタッチ操作を受け付けるタッチスクリーンTSが接続されている。
検索要求受付部5は、スマホユーザによりタッチスクリーンTSからテキスト入力された検索クエリ、あるいはマイクロフォンMCから音声入力されて適宜の音声認識アルゴリズムによりテキストデータに変換された検索クエリを含む検索要求を受け付ける。
予測モデルデータベース(DB)4には、検索クエリに含まれる「昔に」、「ちょっと前に」、「近いうちに」、「数年前に」、「以前」などの曖昧な時間表現から、定量的あるいは具体的な時間表現を予測する予測モデルが予め登録されている。
図2は、前記予測モデルDB4に蓄積されている予測モデルの例を示した図であり、本実施形態では、曖昧な時間表現ごとに定量的な時間表現が確率分布として登録されている。なお、各予測モデルの確率分布は実際には離散値であるが、ここでは便宜上、連続値として示されている。
同図(a)は、曖昧な時間表現「最近」についての確率分布、同図(b)は、曖昧な時間表現「昔」についての確率分布、同図(c)は、曖昧な時間表現「数年前」についての確率分布、同図(d)は、曖昧な時間表現「もうすぐ」についての確率分布、同図(e)は、曖昧な時間表現「以前」についての確率分布を示している。
図1へ戻り、日時範囲予測部6は、前記検索クエリに含まれる曖昧な時間表現を抽出し、これを対応する予測モデルに適用することで、確率値が所定の設定条件を満足する日時範囲を前記曖昧な時間表現に対応する時間的な検索条件として予測する。
図3は、予測モデルの確率値に基づく日時範囲の予測方法を模式的に表現した図であり、確率値の設定条件として、例えば「0.8以上」が設定されていると、確率値が0.8以上の日時範囲Δt1が、前記曖昧な時間表現に対応する時間的な検索条件と予測される。同様に、確率値の条件として、例えば「0.6以上0.8未満」が設定されていると、これに対応する日時範囲Δt2が、前記曖昧な時間表現に対応する時間的な検索条件と予測される。
図1へ戻り、Web検索機能部7は、前記検索クエリおよび日時範囲を含む検索要求を、通信インタフェース2からネットワーク上の適宜の検索サーバへ送信し、応答された複数の検索結果を、そのマッチング精度に応じた順序でディスプレイ3に一覧表示してスマホユーザに提示する。
ユーザ反応検知部8は、前記一覧表示された検索結果に対するスマホユーザの反応として、多数の検索結果のいずれかの情報源にアクセスするためのタッチ操作や、検索結果の次ページを表示させるためのタッチ操作を検知し、ユーザが今回の検索結果に満足しているか否かの指標とする。予測モデル更新部9は、前記検知されたスマホユーザの反応に基づいて、前記日時範囲の予測に用いられた予測モデルの確率分布を更新する。
次いで、図4のフローチャートを参照して、本発明の一実施形態の動作について説明する。ステップS1では、検索クエリを含む検索要求が前記検索要求受付部5において受け付けられる。ステップS2では、前記検索クエリに曖昧な時間表現が含まれているか否かが判定され、含まれていなければ通常の検索処理へ移行し、含まれていればステップS3へ進む。
ステップS3では、前記曖昧な時間表現に対応する定量的な時間表現を予測するための条件として、予想モデルの確率値範囲が最上位に設定される。ここでは、確率値範囲が「0.8以上」に設定されたものとして説明を続ける。
ステップS4では、前記日時範囲予測部6により、前記曖昧な時間表現が予測モデルDB4の対応する予測モデルに適用され、当該時間表現に対応する定量的な時間表現として、確率値が0.8以上の日時範囲が抽出される。例えば、図3に示した日時範囲Δt1が抽出される。
ステップS5では、前記検索クエリと共に前記日時範囲Δt1をオプションの検索条件として含む検索要求が、前記Web検索機能部7によりネットワーク上の検索エンジンへ提供される。例えば、検索クエリが「最近見た、お笑い番組のタイトル、何だっけ?」であれば、「見た」、「お笑い番組」、「タイトル」、「何」を検索キーワードとし、曖昧な時間表現「最近」から予測された具体的な日時範囲Δt1を検索条件とする検索要求が検索エンジンへ提供される。
ステップS6では、検索エンジンが応答した多数の検索結果がディスプレイ3上に一覧表示される。ステップS7,S10では、前記検索結果に対するユーザの反応が、前記ユーザ反応検知部8により検知される。例えば、表示されている検索結果の一覧からスマホユーザが所望の検索結果を見つけられず、更なる検索結果を取得するために次ページへの遷移操作を行うと、これがステップS10で検知されてステップS11へ進む。
ステップS11では、前記曖昧な時間表現に対応する日時範囲を予測する際に設定される確率値範囲が、前記ステップS3で設定された初期値よりも低い値に更新される。本実施形態では、確率値範囲が前記「0.8以上」から、例えば「0.6以上0.8未満」に更新される。
ステップS12では、前記予測された日時範囲に対応した予測モデルの確率値が減補正により更新される。図5(a)は、前記予測モデルの確率値を減補正する方法を模式的に示した図であり、前記日時範囲Δt1に対応する確率値(度数)が一律に減補正されている。
その後、当該処理はステップS4へ戻り、確率値範囲が0.6以上0.8未満に対応した日時範囲Δt2(図4参照)を新たな検索条件として情報検索が継続される。
これに対して、表示されている検索結果の一覧からスマホユーザが所望の検索結果を見つけて当該検索結果へのアクセスを試みると、これがステップ7で検知されてステップS8へ進む。
ステップS8では、前記予測された日時範囲Δt1に対応した予測モデルの確率値が増補正により更新される。図5(b)は、前記予測モデルの確率値を増補正する方法を模式的に示した図であり、前記日時範囲Δt1に対応する確率値(度数)が一律に増補正されている。ステップS9では、前記アクセス先との間に通信セッションが確立され、検索結果の情報が取得される。
なお、前記確率値の増減補正量は、当該補正時からの時間経過と共に漸減させることが望ましい。このようにすれば、より新しい検索結果に基づく増減補正を、より強く各予測モデルに反映させることができるので、スマホユーザの曖昧な時刻表現と定量的な時間表現との関係が継時的に変化するような場合でも、正確な日時範囲予測が可能になる。
本実施形態によれば、曖昧な時間表現から定量的な日時範囲を予測するモデルが確率分布として与えられ、この日時範囲を検索条件とした検索結果に対するユーザの反応、評価に基づいて、予測モデルの当該日時範囲の確率値が増減補正される。したがって、ユーザの評価を予測モデルの更新に反映させることができ、その結果、曖昧な時間表現から定量的な日時範囲を予想する際の精度ひいては検索精度に継時的な向上を期待できるようになる。
図6は、本発明の第2実施形態の構成を示した機能ブロック図であり、前記と同一の符号は同一又は同等部分を表している。ここでも、スマートフォンへの適応を例にして説明する。
上記の第1実施形態では、予測モデルが予めデータベース4に登録されているものとして説明したが、本実施形態では、各スマホユーザに固有の予測モデルが当該スマートフォンにより構築されて前記予測モデルDB4に登録される。そのため、本実施形態では前記第1実施形態に相当する実用部に加えて、さらに予測モデルDB4を構築するための学習部および各種のデータベース10,11,12が設けられている。
音声信号認識部13は、マイクロフォンMCにより検知されたスマホユーザの音声信号に適宜の音声認識処理を適用して文字データに変換し、その時系列を出力する。学習データ候補生成部14は、前記文字データの時系列をその内容や無声部分の有無等に基づいて、例えばセンテンス単位で分解し、各センテンスを学習データ候補として出力する。
学習データ抽出部15は、多数の学習データ候補の中から学習データとして好適な学習データ候補のみを抽出し、これを学習データとして出力する。本実施形態では、曖昧な時間表現のリストが時間表現DB10に予め登録され、日時特定可能な事象表現のリストが事象表現DB11に予め登録されている。前記学習データ抽出部15は、各学習データ候補に前記曖昧な時間表現および日時特定可能な事象表現のいずれもが含まれていれば、これを学習データとして抽出する。
図7は、多数の学習データ候補の中から学習データを抽出する方法を模式的に表現した図であり、第1の学習データ候補「最近見た、●●(芸人名)が出ていたお笑い番組、面白かったね」には、曖昧な時間表現として「最近」が含まれており、かつ日時特定可能な事象表現として「見た、●●が出ていたお笑い番組」が含まれているので、学習データとして抽出される。
第2の学習データ候補「昔見に行った●●のライブにもう一度行きたいね」は、曖昧な時間表現として「昔」が含まれており、かつ日時特定可能な事象表現として「行った●●のライブ」が含まれているので、学習データとして抽出される。
第3の学習データ候補「数年前に訪問した渋谷の●●社が急成長しているな」は、曖昧な時間表現として「数年前」が含まれており、かつ日時特定可能な事象表現として「訪問した渋谷の●●社」が含まれているので、学習データとして抽出される。
第4の学習データ候補「もうすぐ開催される飲み会が楽しみだな」は、曖昧な時間表現として「もうすぐ」が含まれており、かつ日時特定可能な事象表現として「開催される飲み会」が含まれているので、学習データとして抽出される。
第5の学習データ候補「以前買った電気スタンドが壊れてしまった」は、曖昧な時間表現として「以前」が含まれており、かつ日時特定可能な事象表現として「買った電気スタンド」が含まれているので学習データとして抽出される。
これに対して、第6の学習データ候補「最近見たあのTV番組のタイトルなんだっけ」は、曖昧な時間表現として「最近」が含まれるものの、日時特定可能な事象表現が含まれないので、学習データとして抽出されない。
一方、第7の学習データ候補「なんか雨が降りそうだな」は、日時特定可能な事象表現として「雨が降りそうだな」を含むが、曖昧な時間表現を含まないので、学習データとして抽出されない。
図6へ戻り、履歴情報管理部12は、発話者のスマホユーザに固有の日時特定可能な履歴情報として、ネット購入やお財布機能を利用した購買履歴、電話での会話履歴、ユーザが登録したスケジュール履歴、GPSや無線基地局の位置情報に基づく追跡履歴、ユーザが作成した文書ファイルに関するドキュメント履歴、ブラウザを利用したWeb閲覧履歴などの履歴情報を管理する。
日時検索部16は、前記抽出された学習データに含まれる日時特定可能な事象表現を検索キーとして、前記履歴情報管理部12の配下にある全ての履歴情報を検索し、対応する履歴情報が見つかると、その日時情報から実績値を計算し、これを前記学習データ候補に含まれる曖昧な時間表現と対応付ける。
例えば、前記第1の学習データ候補「最近見た、●●(芸人名)が出ていたお笑い番組、面白かったね」であれば、「●●(芸人名)」、「お笑い番組」を検索キーとして全ての履歴情報を検索し、ワンセグ放送の視聴履歴に検索キーが登録されており、これが検索結果として応答されると、当該お笑い番組の視聴日時と現在時刻との時間差が、曖昧な時間表現「最近」の実績値として対応付けられる。
同様に、前記第2の学習データ候補「昔見に行った●●のライブにもう一度行きたいね」であれば、「●●のライブ」を検索キーとして履歴情報を検索し、例えばスケジュール帳の履歴に検索キーが登録されており、これが検索結果として応答されると、当該スケジュール帳の日時と現在時刻との時間差が、曖昧な時間表現「昔」の実績値として対応付けられる。
評価部17は、前記検索結果を評価し、所定の評価条件を満足する、曖昧な時間表現とその実績値との対応関係を抽出して予測モデルDB4へ登録する。本実施形態では、前記日時検索部16が検索結果と共にそのマッチング精度を応答するものとし、マッチング精度が所定の基準値を下回る対応関係は、予測モデルDB4への登録が見送られる。
また、一つの日時特定可能な事象表現に対して複数の検索結果が得られ、それぞれの日時に大きなバラツキがある、換言すれば、対応付けられる実績値に大きなバラツキが生じる場合には、対応する実績値を特定できないので低評価となり、前記予測モデルDB4への登録が見送られる。
図8は、本発明による予測モデルの学習手順を示したフローチャートであり、ここでは、予め蓄積されているユーザの発話データに基づいてオフラインで学習する場合を例にして説明するが、装置がリアルタイム処理に対処できる十分な能力を備えている場合にはオンラインで学習しても良い。
ステップS21では、マイクロフォンMCで検出された音声信号に対して、前記音声信号認識部13により周知の音声認識処理が実施されて文字データの時系列が出力される。ステップS22では、前記学習データ候補生成部14において、前記文字データの時系列が、その内容や無声箇所に基づいて複数のセンテンスに分解され、各センテンスが学習データ候補とされる。
ステップS23では、学習データ候補の一つに注目し、ステップS24では、前記学習データ抽出部15において、注目した学習データ候補が前記曖昧な時間表現を含むか否かが判定される。曖昧な時間表現を含んでいればステップS25へ進む。
ステップS25では、前記学習データ抽出部15において、前記学習データ候補が前記日時特定可能な事象表現を含むか否かが判定される。日時特定可能な事象表現を含めば、今回の学習データ候補が正規の学習データに採用されてステップS26へ進み、前記日時検索部16により、前記日時特定可能な事象表現を検索キーとして履歴情報管理部12が検索される。
ステップS27では、前記評価部17において全ての検索結果が評価される。本実施形態では、各検索結果のマッチング精度に基づいて、マッチング精度のより高い検索結果に対して、より高い評価値が与えられる。
さらに、一つの日時特定可能な事象表現に対して複数の検索結果(実績値)が得られている場合には、各検索結果のばらつきが、例えば分散として計算される。その結果、例えば一の検索結果の日時が1か月前であるのに対して、他の一の検索結果が1年前であるなど、検索結果に大きなばらつきがあれば低い評価値が与えられる。これに対して、例えば一の検索結果の一次が40日前、他の一の検索結果の日時が42日前であるといったように、そのばらつきが小さければ高い評価値が与えられる。
ステップS28では、各検索結果の評価値が所定の基準値と比較され、評価値が所定の基準値を超えた検索結果については、ステップS29において、実績値が前記曖昧な時間表現と対応付けられて予測モデルDB4に登録される。すなわち、対応する予測モデルの対応する実績値に度数が追加される。
なお、評価値が所定の基準値に満たなければステップS30へ進み、全ての学習データ候補に対して上記の処理が完了したか否かが判断される。完了していなければステップS23へ戻り、注目する学習データ候補を切り替えて上記の各処理を繰り返すことで、前記図2を参照して説明した予測モデルが順次に構築される。
本実施形態によれば、曖昧な時間表現を、これを発声したユーザの履歴情報に基づいて、当該ユーザが過去に用いた曖昧な時間表現に対応した実績値すなわち対応する実際の日時を検索し、対応付けて学習するので、曖昧な時間表現から定量的な時間表現を正確に予測できる予測モデルを構築できるようになる。
また、本実施形態によれば、曖昧な時間表現に対応した実績値の検索結果を、そのマッチング精度や分散に基づいて評価し、評価値の低い検索結果は予測モデルの構築に利用しないようにしたので、確度の低い検索結果や誤った検索結果に基づいて予測モデルが構築されてしまうことを防止できるようになる。
さらに、本実施形態によれば、ユーザが日常的に発声する音声データを検知して学習データ候補を生成できるので、特別な学習機会や専門の管理者を設けることなく、個人差を考慮した学習を簡単に行えるようになる。
なお、上記の各実施形態では、予測モデルがユーザごとに構築されるものとして説明したが、本発明はこれのみに限定されるものではなく、例えば、学習機能をクラウド上に設け、各ユーザが自身の端末から学習データや履歴情報をアップロードし、クラウド上で各ユーザからアップロードされた学習データおよび履歴情報をユーザ属性に基づいて分類し、ユーザ属性ごとに予測モデルを構築するようにしても良い。
1…ユーザI/F,2…通信I/F,3…ディスプレイ,4…予測モデルDB,5…検索要求受付部,6…日時範囲予測部,7…Web検索機能部,8…ユーザ反応検知部,9…予測モデル更新部,10…時間表現DB,11…事象表現DB,12…履歴情報管理部,13…音声信号認識部,14…学習データ候補生成部,15…学習データ抽出部,16…日時検索部,17…評価部

Claims (16)

  1. 曖昧な時間表現を含む検索クエリに対して当該時間表現に対応した検索条件による検索結果を応答する情報検索装置において、
    曖昧な時間表現ごとに定量的な日時範囲を確率的に予測する予測モデルと、
    検索クエリに含まれる曖昧な時間表現を前記予測モデルに適用して確率値が所定の設定範囲内の日時範囲を予測する手段と、
    前記検索クエリおよび前記日時範囲を検索条件とする検索で得られた検索結果を一覧表示する検索機能手段と、
    前記検索結果に対するユーザの反応を検知するユーザ反応検知手段と、
    前記ユーザの反応に基づいて、前記予測モデルの前記日時範囲の予測結果に対応した確率値を増補正または減補正する予測モデル更新手段とを具備したことを特徴とする情報検索装置。
  2. 前記予測モデル更新手段は、前記ユーザ反応検知手段により、ユーザが前記検索結果に満足したと推定される操作が検知されると、前記予測モデルの前記日時範囲の予測結果に対応した確率値を増補正することを特徴とする請求項1に記載の情報検索装置。
  3. 前記ユーザが検索結果に満足したと推定される操作が、前記検索結果のいずれかに対するアクセス要求であることを特徴とする請求項2に記載の情報検索装置。
  4. 前記予測モデル更新手段は、前記ユーザ反応検知手段により、ユーザが前記検索結果に満足していないと推定される操作が検知されると、前記予測モデルの前記日時範囲の予測結果に対応した確率値を減補正することを特徴とする請求項1ないし3のいずれかに記載の情報検索装置。
  5. 前記ユーザが検索結果に満足していないと推定される操作が、次の検索結果の一覧表示を要求する操作であることを特徴とする請求項4に記載の情報検索装置。
  6. 前記日時範囲を予測する手段は、前記ユーザが検索結果に満足していないと推定される操作が検知されると、前記確率値の設定範囲を下げて前記日時範囲を再予測することを特徴とする請求項4または5に記載の情報検索装置。
  7. 前記増補正または減補正された確率値の当該増減分が、時間経過と共に漸減されることを特徴とする請求項1ないし6のいずれかに記載の情報検索装置。
  8. 学習データ候補の中から、曖昧な時間表現および日時特定可能な事象表現を含む学習データを抽出する学習データ抽出手段と、
    履歴情報から、前記事象表現に関連する履歴の日時を検索して、前記曖昧な時間表現に対応する実績値を算出する手段と、
    前記曖昧な時間表現とその実績値との対応関係に基づいて前記予測モデルを構築する手段とを具備したことを特徴とする請求項1ないし7のいずれかに記載の情報検索装置。
  9. 前記事象表現に関連する日時の検索結果を評価する評価手段を具備し、
    評価値が所定の基準値に満たない対応関係は予測モデルの構築に用いないことを特徴とする請求項8に記載の情報検索装置。
  10. 前記評価手段は、前記検索結果をマッチング精度が高いほど高く評価することを特徴とする請求項9に記載の情報検索装置。
  11. 前記評価手段は、前記検索結果が複数個得られたときに、各日時の分散が大きいほど低く評価することを特徴とする請求項9または10に記載の情報検索装置。
  12. 音声信号を検出する手段と、
    前記音声信号を文字データの時系列に変換する手段と、
    前記文字データの時系列を所定の規則で分割して学習データ候補を生成する手段とを具備したことを特徴とする請求項8ないし11のいずれかに記載の情報検索装置。
  13. 多数の曖昧な時間表現を記憶する時間表現データベースと、
    多数の日時特定可能な事象表現を記憶する事象表現データベースとを具備し、
    前記学習データ抽出手段は、前記時間表現データベースに記憶されている時間表現および前記事象表現データベースに記憶されている事象表現を前記学習データ候補の中から抽出することを特徴とする請求項8ないし12のいずれかに記載の情報検索装置。
  14. 曖昧な時間表現を含む検索クエリに対して当該時間表現に対応した検索条件による検索結果を応答する情報検索装置において、
    曖昧な時間表現ごとに定量的な日時範囲を確率的に予測する予測モデルと、
    検索クエリに含まれる曖昧な時間表現を前記予測モデルに適用して確率値が所定の設定範囲内の日時範囲を予測する手段と、
    前記検索クエリおよび前記日時範囲の予測結果を検索条件とする検索結果を一覧表示する検索機能手段と、
    前記検索結果に対するユーザの反応を検知するユーザ反応検知手段と、
    前記ユーザの反応に基づいて、前記予測モデルの前記日時範囲の予測結果に対応した確率値を増補正または減補正する予測モデル更新手段とを具備したことを特徴とする情報検索装置。
  15. 曖昧な時間表現を含む検索クエリに対して当該時間表現に対応した検索条件による検索結果を応答する情報検索方法において、
    検索クエリに含まれる曖昧な時間表現を、曖昧な時間表現ごとに定量的な日時範囲を確率的に予測する予測モデルに適用して確率値が所定の設定範囲内の日時範囲を予測する手順と、
    前記検索クエリおよび前記日時範囲を検索条件とする検索で得られた検索結果を一覧表示する手順と、
    前記検索結果に対するユーザの反応を検知する手順と、
    前記ユーザの反応に基づいて、前記予測モデルの前記日時範囲の予測結果に対応した確率値を増補正または減補正する手順とを含むことを特徴とする情報検索方法。
  16. 曖昧な時間表現を含む検索クエリに対して当該時間表現に対応した検索条件による検索結果を応答する情報検索プログラムにおいて、
    検索クエリを含む検索要求をインタフェース経由で受け付ける手順と、
    前記検索クエリに含まれる曖昧な時間表現を抽出する手順と、
    曖昧な時間表現ごとに定量的な日時範囲を確率的に予測する予測モデルを記憶するデータベースの対応する予測モデルに前記曖昧な時間表現適用して確率値が所定の設定範囲内の日時範囲を予測する手順と、
    前記検索クエリおよび前記日時範囲を検索条件とする検索で得られた検索結果をディスプレイに一覧表示する手順と、
    前記検索結果に対するユーザの反応をインタフェース経由で検知する手順と、
    前記ユーザの反応に基づいて、前記予測モデルの前記日時範囲の予測結果に対応した確率値を増補正または減補正する手順とを、コンピュータに実行させる情報検索プログラム。
JP2014114000A 2014-06-02 2014-06-02 情報検索方法、装置およびプログラム Active JP6251637B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014114000A JP6251637B2 (ja) 2014-06-02 2014-06-02 情報検索方法、装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014114000A JP6251637B2 (ja) 2014-06-02 2014-06-02 情報検索方法、装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2015228162A true JP2015228162A (ja) 2015-12-17
JP6251637B2 JP6251637B2 (ja) 2017-12-20

Family

ID=54885588

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014114000A Active JP6251637B2 (ja) 2014-06-02 2014-06-02 情報検索方法、装置およびプログラム

Country Status (1)

Country Link
JP (1) JP6251637B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020126328A (ja) * 2019-02-01 2020-08-20 株式会社日立製作所 計算機、学習データの生成方法、及び計算機システム
US11218764B2 (en) 2016-10-05 2022-01-04 Samsung Electronics Co., Ltd. Display device, control method therefor, and information providing system
JP2022126427A (ja) * 2021-02-18 2022-08-30 ヤフー株式会社 情報処理装置、情報処理方法、情報処理プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7271333B2 (ja) 2019-06-25 2023-05-11 サンコール株式会社 バスバーアッセンブリ及びその製造方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10254891A (ja) * 1997-03-11 1998-09-25 Sharp Corp 情報検索装置
JP2000331002A (ja) * 1999-05-14 2000-11-30 Sony Corp 検索装置、検索方法、検索制御プログラムを記録した記録媒体
JP2001331487A (ja) * 2000-05-19 2001-11-30 Nec Shizuoka Ltd 検索システム、検索装置および検索方法、並びに記録媒体
JP2002024212A (ja) * 2000-07-12 2002-01-25 Mitsubishi Electric Corp 音声対話システム
JP2012230614A (ja) * 2011-04-27 2012-11-22 Sony Corp 情報処理装置、情報処理方法、及び、プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10254891A (ja) * 1997-03-11 1998-09-25 Sharp Corp 情報検索装置
JP2000331002A (ja) * 1999-05-14 2000-11-30 Sony Corp 検索装置、検索方法、検索制御プログラムを記録した記録媒体
JP2001331487A (ja) * 2000-05-19 2001-11-30 Nec Shizuoka Ltd 検索システム、検索装置および検索方法、並びに記録媒体
JP2002024212A (ja) * 2000-07-12 2002-01-25 Mitsubishi Electric Corp 音声対話システム
JP2012230614A (ja) * 2011-04-27 2012-11-22 Sony Corp 情報処理装置、情報処理方法、及び、プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11218764B2 (en) 2016-10-05 2022-01-04 Samsung Electronics Co., Ltd. Display device, control method therefor, and information providing system
JP2020126328A (ja) * 2019-02-01 2020-08-20 株式会社日立製作所 計算機、学習データの生成方法、及び計算機システム
JP7082073B2 (ja) 2019-02-01 2022-06-07 株式会社日立製作所 計算機、学習データの生成方法、及び計算機システム
JP2022126427A (ja) * 2021-02-18 2022-08-30 ヤフー株式会社 情報処理装置、情報処理方法、情報処理プログラム

Also Published As

Publication number Publication date
JP6251637B2 (ja) 2017-12-20

Similar Documents

Publication Publication Date Title
US11709829B2 (en) Retrieving context from previous sessions
US10853582B2 (en) Conversational agent
US20190311709A1 (en) Computerized system and method for formatted transcription of multimedia content
CN105701254B (zh) 一种信息处理方法和装置、一种用于信息处理的装置
US20190103111A1 (en) Natural Language Processing Systems and Methods
US11630955B2 (en) Contextual document recall
US20150161521A1 (en) Method for extracting salient dialog usage from live data
JP7291713B2 (ja) 向上したビジネスリスティングのための知識検索エンジンプラットフォーム
US20220365939A1 (en) Methods and systems for client side search ranking improvements
US9471666B2 (en) System and method for supporting natural language queries and requests against a user's personal data cloud
CN101999119A (zh) 用于输入识别和完成的技术
US20200074999A1 (en) Semi-supervised question answering machine
GB2470585A (en) Using a predictive text module to identify an application or service on a device holding data to be input into a message as text.
US20190355042A1 (en) Intelligent assistance for support agents
US20210382893A1 (en) Intelligently identifying the most knowledgable person based on multiple data source inputs
CN114840671A (zh) 对话生成方法、模型的训练方法、装置、设备及介质
WO2020206910A1 (zh) 产品信息推送方法、装置、计算机设备和存储介质
JP6251637B2 (ja) 情報検索方法、装置およびプログラム
CN114119123A (zh) 信息推送的方法和装置
CN117882365A (zh) 确定和视觉显示呼叫的口头菜单
JP6246658B2 (ja) 時間表現学習方法、装置およびプログラム
US11727042B2 (en) Method and server for classifying queries

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160823

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171127

R150 Certificate of patent or registration of utility model

Ref document number: 6251637

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150