JP6251637B2 - Information retrieval method, apparatus and program - Google Patents

Information retrieval method, apparatus and program Download PDF

Info

Publication number
JP6251637B2
JP6251637B2 JP2014114000A JP2014114000A JP6251637B2 JP 6251637 B2 JP6251637 B2 JP 6251637B2 JP 2014114000 A JP2014114000 A JP 2014114000A JP 2014114000 A JP2014114000 A JP 2014114000A JP 6251637 B2 JP6251637 B2 JP 6251637B2
Authority
JP
Japan
Prior art keywords
search
time
date
expression
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014114000A
Other languages
Japanese (ja)
Other versions
JP2015228162A (en
Inventor
服部 元
元 服部
滝嶋 康弘
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2014114000A priority Critical patent/JP6251637B2/en
Publication of JP2015228162A publication Critical patent/JP2015228162A/en
Application granted granted Critical
Publication of JP6251637B2 publication Critical patent/JP6251637B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、検索クエリに含まれる「昔に」、「ちょっと前に」、「近いうちに」、「数年前に」、「以前に」などの曖昧な時間表現に基づいて、時間的な検索条件を設定あるいは適正化する情報検索方法、装置およびプログラムに係り、特に、曖昧な時間表現から定量的あるいは具体的な時間表現を予測するモデルを、検索結果に対するユーザの反応に基づいて更新する情報検索方法、装置およびプログラムに関する。   The present invention is based on ambiguous time expressions such as “in the past”, “a little before”, “soon”, “several years ago”, “before”, etc. included in the search query. The present invention relates to an information search method, apparatus, and program for setting or optimizing search conditions, and in particular, a model that predicts a quantitative or specific time expression from an ambiguous time expression is updated based on a user's response to a search result. The present invention relates to an information search method, apparatus, and program.

「昔に」、「ちょっと前に」、「近いうちに」、「数年前に」、「以前」などの曖昧な時間表現は、個人ごとに各表現が表わす具体的な時間表現(3日前〜5日前、6か月前〜3年前、1日後〜1か月後など)が異なることから、情報検索や会話中の意図伝達の障害となる。そこで、日常の発言に含まれる曖昧な時間表現を抽出して個人の時間感覚を獲得し、情報検索や会話中の意図共有を支援する装置が研究されている。   Ambiguous time expressions such as “old days”, “a little before”, “soon”, “several years ago”, “previous”, etc. are specific time expressions that each expression represents (3 days ago) -5 days ago, 6 months ago-3 years ago, 1 day later-1 month later, etc.), it becomes an obstacle to information retrieval and communication of intention during conversation. Therefore, an apparatus that extracts an ambiguous time expression included in daily speech to acquire an individual's time sensation and supports information retrieval and intention sharing during conversation has been studied.

特許文献1には、情報検索の場面において、利用者が入力した曖昧な時間表現に対し、定量的な時間表現を割り当てる機能が開示されている。ここでは、曖昧な時間表現(昨日、5時頃、など)と定量的な時間表現(●月●日、4時〜6時、など)とをマッピングするための対応表(「夜半」は0時、など)およびルール(「頃」は時間を±1する、など)を予め用意し、これらの対応表およびルールに従って時間表現が変換される。   Patent Document 1 discloses a function of assigning a quantitative time expression to an ambiguous time expression input by a user in an information retrieval scene. Here, the correspondence table for mapping ambiguous time expressions (yesterday, around 5 o'clock, etc.) and quantitative time expressions (● month • day, 4 o'clock to 6 o'clock, etc.) (“midnight” is 0 Time) etc. and a rule (such as “about” is a time ± 1) is prepared in advance, and the time expression is converted according to these correspondence tables and rules.

特許文献2には、ユーザが情報検索の際に、検索範囲として正確な日時を指定する技術が開示されている。   Patent Document 2 discloses a technique in which a user designates an accurate date and time as a search range when searching for information.

非特許文献1は、曖昧な時間表現を定量的な時間表現に変換する際に、「ほぼ」、「少し」などの程度を表す表現に対して、時間の単位の大きさに応じた曖昧さを表す幅を付与する方法が開示されている。例えば、「3分くらい」と「3時間くらい」とでは曖昧さの程度が違うため、その単位の大きさ(分、時間)に応じた幅が付与される。   Non-Patent Document 1 discloses an ambiguity according to the size of a unit of time for an expression representing a degree such as “almost” or “a little” when converting an ambiguous time expression into a quantitative time expression. Is disclosed. For example, since the degree of ambiguity is different between “about 3 minutes” and “about 3 hours”, a width corresponding to the size (minute, time) of the unit is given.

特開平10−254891号公報Japanese Patent Laid-Open No. 10-254891 特開2000−244958号公報JP 2000-244958 A 特願2014−101383号Japanese Patent Application No. 2014-101383

「あいまいさを含む時間概念の表現と推論」、全国大会講演論文集 第39回平成元年後期(1), 357-358, 1989-10-16"Expression and Reasoning of Time Concept Including Ambiguity", Proceedings of the 39th Annual Conference (1), 357-358, 1989-10-16

人が過去の記憶や情報を検索する際あるいは未来の約束をする際、時間情報が正確に入力できないケースがあり、曖昧な時間表現として、例えば「ちょっと前に」、「近いうちに」などを用いることがある。しかしながら、「ちょっと前に」が1時間前〜3時間前なのか、あるいは1時間前〜5時間前なのかなど、曖昧な時間表現が表わす定量的な時間表現は個人ごとに異なる。したがって、曖昧な時間表現をそのまま用いてしまうと、情報検索システムや対話相手が正しく時間情報を理解できないという問題が生じる。   When searching for past memories or information, or when making a promise in the future, there are cases where time information cannot be input accurately, and as an ambiguous time expression, for example, "a little before" or "soon" May be used. However, the quantitative time expression expressed by the ambiguous time expression, such as whether “a little before” is 1 hour to 3 hours ago, or 1 hour to 5 hours ago, is different for each individual. Therefore, if an ambiguous time expression is used as it is, there arises a problem that the information retrieval system and the conversation partner cannot correctly understand the time information.

特許文献1では、あらかじめ用意した対応表およびルールを用いた変換方法で解決を試みているが、時間感覚は個人ごとに異なるため、(1) 個人ごとに管理者等が手作業で作成しなければならず、手間がかかってしまう、(2) 時間の範囲を設定する定量的な時間表現だけでは、外れた際のリスクを想定する必要があるため、時間の範囲を必要以上に広く設定する必要があり、さらには(3) 範囲内のどの時間の確率が高いかについても判断できない、といった技術課題があった。このため、例えば情報検索に利用するシーンでは、過剰な情報を検索結果として取得してしまい、かつ検索結果に対する優先度付けを行うことができないため、検索結果の可読性を高めることができなかった。   In Patent Document 1, an attempt is made to solve with a conversion method using correspondence tables and rules prepared in advance. However, since the time sensation varies from person to person, (1) Administrators must create it manually for each person. (2) The quantitative time expression that sets the time range only needs to assume the risk of losing, so set the time range wider than necessary. In addition, there is a technical problem that it is necessary to further determine (3) what time probability within the range is high. For this reason, for example, in a scene used for information search, excessive information is acquired as a search result, and prioritization cannot be performed on the search result, so that the readability of the search result cannot be improved.

特許文献2では、検索範囲として具体的な日時を指定できるが、「昔に」、「ちょっと前に」、「近いうちに」、「数年前に」、「以前」などの曖昧な時間表現で検索範囲を指定することはできなかった。非特許文献1では、表現に対して一定のルールに従い幅を付与することができるが、個人差を考慮した柔軟な設定に対応できない。   In Patent Document 2, a specific date and time can be specified as a search range, but ambiguous time expressions such as “old”, “a little before”, “soon”, “several years ago”, “previous”, etc. The search range could not be specified with. In Non-Patent Document 1, a range can be given to an expression according to a certain rule, but it cannot cope with a flexible setting considering individual differences.

このような技術課題に対して、本発明の発明者等は、曖昧な時間表現と具体的な時間表現との対応関係を、特別な学習機会や専門の管理者を設けることなく確率分布として個人単位で学習する方法、装置、およびプログラムを発明し、特許出願(特願2014−101383号)した。   In response to such a technical problem, the inventors of the present invention are able to identify the correspondence between the ambiguous time expression and the specific time expression as a probability distribution without providing a special learning opportunity or a specialized administrator. A method, apparatus, and program for learning in units have been invented and a patent application (Japanese Patent Application No. 2014-101383) has been filed.

しかしながら、曖昧な時間表現と具体的な時間表現との対応関係は、ユーザの時間感覚が継時的に変化する影響を受けて変化する。また、学習環境と実用環境とが異なると、曖昧な時間表現と具体的な時間表現との対応関係に微妙なズレが生じてしまい、ユーザの意図した検索範囲と実際の検索範囲とが一致しなくなる場合もある。   However, the correspondence between the ambiguous time expression and the specific time expression changes due to the influence of the user's time sensation that changes over time. Also, if the learning environment is different from the practical environment, there will be a subtle shift in the correspondence between the ambiguous time expression and the specific time expression, and the search range intended by the user will match the actual search range. It may disappear.

本発明の目的は、上記の技術課題を解決し、検索クエリに含まれる曖昧な時間表現からユーザが意図する日時条件を予測モデルに基づいて定量的に解釈し、これを検索条件に反映することで確度の高い情報検索を可能にすると共に、検索結果に対するユーザの反応に基づいて予測モデルを更新することで、曖昧な時間表現に対してユーザが意図する日時条件を予測モデルに反映できる情報検索方法、装置およびプログラムを提供することにある。   An object of the present invention is to solve the above technical problems, quantitatively interpret a date and time condition intended by a user from an ambiguous time expression included in a search query based on a prediction model, and reflect this in the search condition. Information retrieval that enables the retrieval of highly accurate information and updates the prediction model based on the user's response to the search results, so that the date and time conditions intended by the user for ambiguous time expressions can be reflected in the prediction model. To provide a method, an apparatus, and a program.

上記の目的を達成するために、本発明は、曖昧な時間表現を含む検索クエリに対して当該時間表現に対応した検索条件による検索結果を応答する情報検索装置において、以下の構成を具備した点に特徴がある。   In order to achieve the above object, the present invention has the following configuration in an information search apparatus that responds to a search query including an ambiguous time expression with a search result based on a search condition corresponding to the time expression. There is a feature.

(1) 曖昧な時間表現ごとに定量的な日時範囲を確率的に予測する予測モデルと、検索クエリに含まれる曖昧な時間表現を前記予測モデルに適用して確率値が所定の設定範囲内の日時範囲を予測する手段と、検索クエリおよび前記日時範囲を検索条件とする検索で得られた検索結果を一覧表示する検索機能手段と、検索結果に対するユーザの反応を検知するユーザ反応検知手段と、ユーザの反応に基づいて、予測モデルの前記日時範囲の予測結果に対応した確率値を増減補正する予測モデル更新手段とを具備した。   (1) A prediction model that probabilistically predicts a quantitative date and time range for each ambiguous time expression, and an ambiguous time expression included in a search query is applied to the prediction model so that the probability value is within a predetermined setting range. A means for predicting a date and time range; a search function means for displaying a search query and a search result obtained by a search using the date and time range as a search condition; and a user reaction detecting means for detecting a user reaction to the search result; And a prediction model updating unit that corrects the probability value corresponding to the prediction result of the date and time range of the prediction model based on a user's reaction.

(2) 予測モデル更新手段は、予測モデルの前記日時範囲の予測結果に対応した確率値を、前記ユーザ反応検知手段によりユーザが検索結果に満足したと推定される入力操作が検知されると増補正し、ユーザが検索結果に満足していないと推定される入力操作が検知されると減補正するようにした。   (2) The prediction model update unit increases the probability value corresponding to the prediction result of the date and time range of the prediction model when the user reaction detection unit detects an input operation that the user is estimated to be satisfied with the search result. Correction is made, and when an input operation presumed that the user is not satisfied with the search result is detected, a reduction correction is made.

(3) 増補正または減補正された確率値の当該増減分が、時間経過と共に漸減されるようにした。   (3) The increase / decrease of the increased or decreased probability value is gradually decreased with time.

(4) 学習データ候補の中から、曖昧な時間表現および日時特定可能な事象表現を含む学習データを抽出する学習データ抽出手段と、履歴情報から、前記事象表現に関連する履歴の日時を検索して曖昧な時間表現に対応する実績値を算出する手段と、曖昧な時間表現とその実績値との対応関係に基づいて予測モデルを構築する手段とを具備した。   (4) Learning data extracting means for extracting learning data including ambiguous time expressions and event expressions that can specify date and time from learning data candidates, and searching the history date and time related to the event expressions from the history information And a means for calculating the actual value corresponding to the ambiguous time expression and a means for constructing a prediction model based on the correspondence between the ambiguous time expression and the actual value.

(5) 事象表現に関連する日時の検索結果を評価する評価手段を具備し、評価値が所定の基準値に満たない対応関係は予測モデルの構築に用いないようにした。   (5) Equipped with an evaluation means that evaluates the search result of the date and time related to the event expression, so that the correspondence relationship where the evaluation value does not satisfy the predetermined reference value is not used for the construction of the prediction model.

(6) 音声信号を検出する手段と、音声信号を文字データの時系列に変換する手段と、文字データの時系列を所定の規則で分割して学習データ候補を生成する手段とを具備した。   (6) It comprises means for detecting a speech signal, means for converting the speech signal into a time series of character data, and means for generating a learning data candidate by dividing the time series of character data according to a predetermined rule.

本発明によれば、以下のような効果が達成される。
(1) 曖昧な時間表現から定量的な日時範囲を予測するモデルが確率分布として与えられ、この日時範囲を検索条件とする検索結果に対するユーザの反応、評価に基づいて、予測モデルの当該日時範囲に対応した確率値が増減補正される。したがって、ユーザの評価を予測モデルの更新に反映させることができ、曖昧な時間表現から定量的な日時範囲を予想する際の精度ひいては検索精度に継時的な向上を期待できるようになる。
According to the present invention, the following effects are achieved.
(1) A model that predicts a quantitative date and time range from an ambiguous time expression is given as a probability distribution, and the date and time range of the prediction model is based on the user's reaction and evaluation to search results that use this date and time range as a search condition. The probability value corresponding to is increased or decreased. Therefore, the user's evaluation can be reflected in the update of the prediction model, and the accuracy in predicting the quantitative date and time range from the ambiguous time expression, and hence the search accuracy can be expected to be improved over time.

(2) 検索結果に対するユーザの反応をユーザの入力操作に基づいて検知するようにしたので、ユーザの主観を物理的に検知できるようになる。   (2) Since the user's reaction to the search result is detected based on the user's input operation, the user's subjectivity can be physically detected.

(3) ユーザ評価を予測モデルの更新に反映させる際、より新しい検索結果に基づく増減補正を、より強く予測モデルに反映させるので、ユーザの曖昧な時間表現と定量的な日時範囲との関係に継時的な変化が生じても、この継時変化を日時範囲の予測に正確に反映させることが可能となり、ひいては正確な情報検索を実現できるようになる。   (3) When reflecting the user evaluation in the update of the prediction model, the increase / decrease correction based on the newer search result is more strongly reflected in the prediction model, so the relationship between the user's ambiguous time expression and the quantitative date and time range Even if a change over time occurs, it is possible to accurately reflect the change over time in the prediction of the date and time range, so that an accurate information search can be realized.

(4) 曖昧な時間表現を、これを発声したユーザの履歴情報に基づいて、当該ユーザが過去に用いた曖昧な時間表現に対応した実績値すなわち対応する実際の期間を検索して対応付けて学習するので、曖昧な時間表現から定量的な時間表現を正確に予測できる予測モデルをユーザごとに構築できるようになる。   (4) Based on the history information of the user who uttered the ambiguous time expression, the actual value corresponding to the ambiguous time expression used by the user in the past, that is, the corresponding actual period is searched and associated. Since learning is performed, a prediction model capable of accurately predicting a quantitative time expression from an ambiguous time expression can be constructed for each user.

(5) 曖昧な時間表現に対応した実績値の検索結果を、そのマッチング精度や分散に基づいて評価し、評価値の低い検索結果は予測モデルの構築に利用しないようにしたので、確度の低い検索結果や誤った検索結果に基づいて予測モデルが構築されてしまうことを防止できるようになる。   (5) The search result of the actual value corresponding to the ambiguous time expression is evaluated based on the matching accuracy and variance, and the search result with low evaluation value is not used for the construction of the prediction model, so the accuracy is low It is possible to prevent a prediction model from being built based on a search result or an incorrect search result.

(6) ユーザが日常的に発声する音声データを検知して学習データ候補を生成するようにしたので、特別な学習機会や専門の管理者を設けることなく、個人差を考慮した学習を簡単に行えるようになる。   (6) Since learning data candidates are generated by detecting voice data uttered by users on a daily basis, it is easy to learn considering individual differences without creating special learning opportunities or specialized administrators. You can do it.

本発明の第1実施形態に係る情報検索装置の機能ブロック図である。It is a functional block diagram of the information search device concerning a 1st embodiment of the present invention. 予測モデルDBに蓄積される予測モデルの一例を示した図である。It is the figure which showed an example of the prediction model accumulate | stored in prediction model DB. 予測モデルの確率値に基づく日時範囲の予測方法を示した図である。It is the figure which showed the prediction method of the date-time range based on the probability value of a prediction model. 本発明の第1実施形態の動作を示したフローチャートである。It is the flowchart which showed the operation | movement of 1st Embodiment of this invention. 予測モデルの更新方法を示した図である。It is the figure which showed the update method of a prediction model. 本発明の第2実施形態に係る時間表現学習装置の機能ブロック図である。It is a functional block diagram of the time expression learning device concerning a 2nd embodiment of the present invention. 学習データ候補から学習データを抽出する方法を示した図である。It is the figure which showed the method of extracting learning data from a learning data candidate. 本発明の第2実施形態の動作を示したフローチャートである。It is the flowchart which showed the operation | movement of 2nd Embodiment of this invention.

以下、図面を参照して本発明の実施の形態について詳細に説明する。図1は、本発明の一実施形態に係る情報検索装置の主要部の構成を示した機能ブロック図であり、汎用のコンピュータやサーバ、あるいはスマートフォンやタブレット端末といったモバイル端末に、後述する各機能を実現するアプリケーション(プログラム)を実装することで構成できる。あるいはアプリケーションの一部がハードウェア化またはROM化された専用機や単能機としても構成できる。また、コンピュータやサーバで構成する場合には、ネットワーク上で複数人が共有するクラウドサービスにも適用できる。ここでは、スマートフォンへの適用を例にして説明するものとし、本発明の説明に不要な構成は図示を省略する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 is a functional block diagram showing a configuration of a main part of an information search apparatus according to an embodiment of the present invention. Each function described later is provided to a general-purpose computer or server, or a mobile terminal such as a smartphone or tablet terminal. It can be configured by implementing an application (program) to be realized. Alternatively, it can be configured as a dedicated machine or a single-function machine in which a part of the application is hardware or ROMized. Moreover, when it comprises with a computer and a server, it is applicable also to the cloud service which several people share on a network. Here, application to a smartphone will be described as an example, and illustrations of components unnecessary for the description of the present invention are omitted.

ユーザインタフェース(I/F)1には、スマートフォンユーザ(以下、スマホユーザと表現する)の音声信号を検知するマイクロフォンMCおよびテキスト入力や各種のタッチ操作を受け付けるタッチスクリーンTSが接続されている。   The user interface (I / F) 1 is connected to a microphone MC that detects a voice signal of a smartphone user (hereinafter referred to as a smartphone user) and a touch screen TS that receives text input and various touch operations.

検索要求受付部5は、スマホユーザによりタッチスクリーンTSからテキスト入力された検索クエリ、あるいはマイクロフォンMCから音声入力されて適宜の音声認識アルゴリズムによりテキストデータに変換された検索クエリを含む検索要求を受け付ける。   The search request accepting unit 5 accepts a search request including a search query that is input from the touch screen TS by a smartphone user or a search query that is input from the microphone MC and converted into text data by an appropriate speech recognition algorithm.

予測モデルデータベース(DB)4には、検索クエリに含まれる「昔に」、「ちょっと前に」、「近いうちに」、「数年前に」、「以前」などの曖昧な時間表現から、定量的あるいは具体的な時間表現を予測する予測モデルが予め登録されている。   The prediction model database (DB) 4 includes ambiguous time expressions such as “old days”, “a little before”, “soon”, “several years ago”, “previous”, etc. A prediction model for predicting a quantitative or specific time expression is registered in advance.

図2は、前記予測モデルDB4に蓄積されている予測モデルの例を示した図であり、本実施形態では、曖昧な時間表現ごとに定量的な時間表現が確率分布として登録されている。なお、各予測モデルの確率分布は実際には離散値であるが、ここでは便宜上、連続値として示されている。   FIG. 2 is a diagram showing an example of a prediction model stored in the prediction model DB 4. In this embodiment, a quantitative time expression is registered as a probability distribution for each ambiguous time expression. The probability distribution of each prediction model is actually a discrete value, but is shown here as a continuous value for convenience.

同図(a)は、曖昧な時間表現「最近」についての確率分布、同図(b)は、曖昧な時間表現「昔」についての確率分布、同図(c)は、曖昧な時間表現「数年前」についての確率分布、同図(d)は、曖昧な時間表現「もうすぐ」についての確率分布、同図(e)は、曖昧な時間表現「以前」についての確率分布を示している。   Figure (a) shows the probability distribution for the ambiguous time expression `` Recent '', Figure (b) shows the probability distribution for the ambiguous time expression `` Old '', and Figure (c) shows the ambiguous time expression `` Probability distribution for `` several years ago '', figure (d) shows the probability distribution for the ambiguous time expression `` soon '', figure (e) shows the probability distribution for the ambiguous time expression `` previous '' .

図1へ戻り、日時範囲予測部6は、前記検索クエリに含まれる曖昧な時間表現を抽出し、これを対応する予測モデルに適用することで、確率値が所定の設定条件を満足する日時範囲を前記曖昧な時間表現に対応する時間的な検索条件として予測する。   Returning to FIG. 1, the date / time range prediction unit 6 extracts an ambiguous time expression included in the search query and applies it to the corresponding prediction model, whereby the date / time range in which the probability value satisfies a predetermined setting condition. As a temporal search condition corresponding to the ambiguous temporal expression.

図3は、予測モデルの確率値に基づく日時範囲の予測方法を模式的に表現した図であり、確率値の設定条件として、例えば「0.8以上」が設定されていると、確率値が0.8以上の日時範囲Δt1が、前記曖昧な時間表現に対応する時間的な検索条件と予測される。同様に、確率値の条件として、例えば「0.6以上0.8未満」が設定されていると、これに対応する日時範囲Δt2が、前記曖昧な時間表現に対応する時間的な検索条件と予測される。   FIG. 3 is a diagram schematically representing a date / time range prediction method based on the probability value of the prediction model. When the probability value setting condition is set to “0.8 or more”, for example, the probability value is 0.8 or more. The date range Δt1 is predicted as a temporal search condition corresponding to the ambiguous time expression. Similarly, when “0.6 or more and less than 0.8” is set as the condition of the probability value, for example, the date / time range Δt2 corresponding thereto is predicted as a temporal search condition corresponding to the ambiguous time expression.

図1へ戻り、Web検索機能部7は、前記検索クエリおよび日時範囲を含む検索要求を、通信インタフェース2からネットワーク上の適宜の検索サーバへ送信し、応答された複数の検索結果を、そのマッチング精度に応じた順序でディスプレイ3に一覧表示してスマホユーザに提示する。   Returning to FIG. 1, the Web search function unit 7 transmits a search request including the search query and the date / time range to the appropriate search server on the network from the communication interface 2, and matches a plurality of search results that are responded to the search request. A list is displayed on the display 3 in an order corresponding to the accuracy and presented to the smartphone user.

ユーザ反応検知部8は、前記一覧表示された検索結果に対するスマホユーザの反応として、多数の検索結果のいずれかの情報源にアクセスするためのタッチ操作や、検索結果の次ページを表示させるためのタッチ操作を検知し、ユーザが今回の検索結果に満足しているか否かの指標とする。予測モデル更新部9は、前記検知されたスマホユーザの反応に基づいて、前記日時範囲の予測に用いられた予測モデルの確率分布を更新する。   The user response detection unit 8 is a touch operation for accessing any of the information sources of a large number of search results or a touch for displaying the next page of the search results as a smartphone user's response to the search results displayed in the list. An operation is detected and used as an index as to whether or not the user is satisfied with the current search result. The prediction model update unit 9 updates the probability distribution of the prediction model used for the prediction of the date / time range based on the detected smartphone user reaction.

次いで、図4のフローチャートを参照して、本発明の一実施形態の動作について説明する。ステップS1では、検索クエリを含む検索要求が前記検索要求受付部5において受け付けられる。ステップS2では、前記検索クエリに曖昧な時間表現が含まれているか否かが判定され、含まれていなければ通常の検索処理へ移行し、含まれていればステップS3へ進む。   Next, the operation of the embodiment of the present invention will be described with reference to the flowchart of FIG. In step S1, a search request including a search query is received by the search request receiving unit 5. In step S2, it is determined whether or not an ambiguous time expression is included in the search query. If not included, the process proceeds to a normal search process, and if included, the process proceeds to step S3.

ステップS3では、前記曖昧な時間表現に対応する定量的な時間表現を予測するための条件として、予想モデルの確率値範囲が最上位に設定される。ここでは、確率値範囲が「0.8以上」に設定されたものとして説明を続ける。   In step S3, the probability value range of the prediction model is set to the highest level as a condition for predicting a quantitative time expression corresponding to the ambiguous time expression. Here, the description will be continued assuming that the probability value range is set to “0.8 or more”.

ステップS4では、前記日時範囲予測部6により、前記曖昧な時間表現が予測モデルDB4の対応する予測モデルに適用され、当該時間表現に対応する定量的な時間表現として、確率値が0.8以上の日時範囲が抽出される。例えば、図3に示した日時範囲Δt1が抽出される。   In step S4, the date and time range prediction unit 6 applies the ambiguous time expression to the corresponding prediction model in the prediction model DB 4, and the date and time with a probability value of 0.8 or more is obtained as a quantitative time expression corresponding to the time expression. A range is extracted. For example, the date / time range Δt1 shown in FIG. 3 is extracted.

ステップS5では、前記検索クエリと共に前記日時範囲Δt1をオプションの検索条件として含む検索要求が、前記Web検索機能部7によりネットワーク上の検索エンジンへ提供される。例えば、検索クエリが「最近見た、お笑い番組のタイトル、何だっけ?」であれば、「見た」、「お笑い番組」、「タイトル」、「何」を検索キーワードとし、曖昧な時間表現「最近」から予測された具体的な日時範囲Δt1を検索条件とする検索要求が検索エンジンへ提供される。   In step S5, a search request including the date and time range Δt1 as an optional search condition together with the search query is provided by the web search function unit 7 to a search engine on the network. For example, if the search query is "What was the title of the comedy program you saw recently?", The search keyword was "I saw", "Comedy program", "Title", "What", and ambiguous time expression A search request using a specific date range Δt1 predicted from “recent” as a search condition is provided to the search engine.

ステップS6では、検索エンジンが応答した多数の検索結果がディスプレイ3上に一覧表示される。ステップS7,S10では、前記検索結果に対するユーザの反応が、前記ユーザ反応検知部8により検知される。例えば、表示されている検索結果の一覧からスマホユーザが所望の検索結果を見つけられず、更なる検索結果を取得するために次ページへの遷移操作を行うと、これがステップS10で検知されてステップS11へ進む。   In step S6, a number of search results responded by the search engine are displayed in a list on the display 3. In steps S7 and S10, the user response to the search result is detected by the user response detection unit 8. For example, if the smartphone user cannot find a desired search result from the displayed search result list and performs a transition operation to the next page in order to obtain a further search result, this is detected in step S10 and step S11. Proceed to

ステップS11では、前記曖昧な時間表現に対応する日時範囲を予測する際に設定される確率値範囲が、前記ステップS3で設定された初期値よりも低い値に更新される。本実施形態では、確率値範囲が前記「0.8以上」から、例えば「0.6以上0.8未満」に更新される。   In step S11, the probability value range set when predicting the date / time range corresponding to the ambiguous time expression is updated to a value lower than the initial value set in step S3. In the present embodiment, the probability value range is updated from “0.8 or more” to, for example, “0.6 or more and less than 0.8”.

ステップS12では、前記予測された日時範囲に対応した予測モデルの確率値が減補正により更新される。図5(a)は、前記予測モデルの確率値を減補正する方法を模式的に示した図であり、前記日時範囲Δt1に対応する確率値(度数)が一律に減補正されている。   In step S12, the probability value of the prediction model corresponding to the predicted date / time range is updated by the reduction correction. FIG. 5A is a diagram schematically showing a method for reducing and correcting the probability value of the prediction model. The probability value (frequency) corresponding to the date / time range Δt1 is uniformly reduced and corrected.

その後、当該処理はステップS4へ戻り、確率値範囲が0.6以上0.8未満に対応した日時範囲Δt2(図4参照)を新たな検索条件として情報検索が継続される。   Thereafter, the processing returns to step S4, and the information search is continued using the date / time range Δt2 (see FIG. 4) corresponding to the probability value range of 0.6 or more and less than 0.8 as a new search condition.

これに対して、表示されている検索結果の一覧からスマホユーザが所望の検索結果を見つけて当該検索結果へのアクセスを試みると、これがステップ7で検知されてステップS8へ進む。   On the other hand, when the smartphone user finds a desired search result from the displayed search result list and tries to access the search result, this is detected in step 7 and proceeds to step S8.

ステップS8では、前記予測された日時範囲Δt1に対応した予測モデルの確率値が増補正により更新される。図5(b)は、前記予測モデルの確率値を増補正する方法を模式的に示した図であり、前記日時範囲Δt1に対応する確率値(度数)が一律に増補正されている。ステップS9では、前記アクセス先との間に通信セッションが確立され、検索結果の情報が取得される。   In step S8, the probability value of the prediction model corresponding to the predicted date / time range Δt1 is updated by increasing correction. FIG. 5 (b) is a diagram schematically showing a method of increasing and correcting the probability value of the prediction model, and the probability value (frequency) corresponding to the date / time range Δt1 is uniformly increased and corrected. In step S9, a communication session is established with the access destination, and search result information is acquired.

なお、前記確率値の増減補正量は、当該補正時からの時間経過と共に漸減させることが望ましい。このようにすれば、より新しい検索結果に基づく増減補正を、より強く各予測モデルに反映させることができるので、スマホユーザの曖昧な時刻表現と定量的な時間表現との関係が継時的に変化するような場合でも、正確な日時範囲予測が可能になる。   Note that it is desirable that the increase / decrease correction amount of the probability value be gradually decreased with the passage of time since the correction. In this way, the increase / decrease correction based on newer search results can be reflected more strongly in each prediction model, so the relationship between the vague time expression and quantitative time expression of the smartphone user changes over time. Even in such a case, accurate date / time range prediction is possible.

本実施形態によれば、曖昧な時間表現から定量的な日時範囲を予測するモデルが確率分布として与えられ、この日時範囲を検索条件とした検索結果に対するユーザの反応、評価に基づいて、予測モデルの当該日時範囲の確率値が増減補正される。したがって、ユーザの評価を予測モデルの更新に反映させることができ、その結果、曖昧な時間表現から定量的な日時範囲を予想する際の精度ひいては検索精度に継時的な向上を期待できるようになる。   According to the present embodiment, a model that predicts a quantitative date and time range from an ambiguous time expression is given as a probability distribution, and a prediction model based on a user's reaction and evaluation to a search result using the date and time range as a search condition The probability value of the date / time range is corrected for increase / decrease. Therefore, the user's evaluation can be reflected in the update of the prediction model, and as a result, the accuracy when predicting the quantitative date and time range from the ambiguous time expression and thus the search accuracy can be expected to be improved over time. Become.

図6は、本発明の第2実施形態の構成を示した機能ブロック図であり、前記と同一の符号は同一又は同等部分を表している。ここでも、スマートフォンへの適応を例にして説明する。   FIG. 6 is a functional block diagram showing the configuration of the second embodiment of the present invention. The same reference numerals as those described above represent the same or equivalent parts. Here again, an explanation will be given taking adaptation to a smartphone as an example.

上記の第1実施形態では、予測モデルが予めデータベース4に登録されているものとして説明したが、本実施形態では、各スマホユーザに固有の予測モデルが当該スマートフォンにより構築されて前記予測モデルDB4に登録される。そのため、本実施形態では前記第1実施形態に相当する実用部に加えて、さらに予測モデルDB4を構築するための学習部および各種のデータベース10,11,12が設けられている。   In the first embodiment described above, it is assumed that the prediction model is registered in the database 4 in advance. However, in this embodiment, a prediction model unique to each smartphone user is constructed by the smartphone and registered in the prediction model DB 4. Is done. Therefore, in this embodiment, in addition to the practical part corresponding to the first embodiment, a learning part and various databases 10, 11, and 12 for constructing the prediction model DB 4 are provided.

音声信号認識部13は、マイクロフォンMCにより検知されたスマホユーザの音声信号に適宜の音声認識処理を適用して文字データに変換し、その時系列を出力する。学習データ候補生成部14は、前記文字データの時系列をその内容や無声部分の有無等に基づいて、例えばセンテンス単位で分解し、各センテンスを学習データ候補として出力する。   The voice signal recognition unit 13 applies appropriate voice recognition processing to the voice signal of the smartphone user detected by the microphone MC to convert it into character data, and outputs the time series. The learning data candidate generation unit 14 decomposes the time series of the character data, for example, in units of sentences based on the contents, the presence / absence of unvoiced portions, and the like, and outputs each sentence as a learning data candidate.

学習データ抽出部15は、多数の学習データ候補の中から学習データとして好適な学習データ候補のみを抽出し、これを学習データとして出力する。本実施形態では、曖昧な時間表現のリストが時間表現DB10に予め登録され、日時特定可能な事象表現のリストが事象表現DB11に予め登録されている。前記学習データ抽出部15は、各学習データ候補に前記曖昧な時間表現および日時特定可能な事象表現のいずれもが含まれていれば、これを学習データとして抽出する。   The learning data extraction unit 15 extracts only learning data candidates suitable as learning data from among a large number of learning data candidates, and outputs this as learning data. In the present embodiment, a list of ambiguous time expressions is registered in advance in the time expression DB 10, and a list of event expressions that can specify the date and time is registered in the event expression DB 11 in advance. The learning data extraction unit 15 extracts each of the learning data candidates as learning data if both of the ambiguous time expression and the event expression capable of specifying the date and time are included.

図7は、多数の学習データ候補の中から学習データを抽出する方法を模式的に表現した図であり、第1の学習データ候補「最近見た、●●(芸人名)が出ていたお笑い番組、面白かったね」には、曖昧な時間表現として「最近」が含まれており、かつ日時特定可能な事象表現として「見た、●●が出ていたお笑い番組」が含まれているので、学習データとして抽出される。   FIG. 7 is a diagram schematically showing a method of extracting learning data from a large number of learning data candidates. The first learning data candidate “Recently seen ● ● (entertainer name) came out "The program was interesting" includes "Recent" as an ambiguous time expression and "Comedy program that I saw, ●●" as an event expression that can specify the date and time. Extracted as learning data.

第2の学習データ候補「昔見に行った●●のライブにもう一度行きたいね」は、曖昧な時間表現として「昔」が含まれており、かつ日時特定可能な事象表現として「行った●●のライブ」が含まれているので、学習データとして抽出される。   The second candidate for the learning data “I want to go to the live of ● ● once again” includes “old” as an ambiguous time expression, and “go ●” as an event expression that can specify the date and time. ● "Live" is included, so it is extracted as learning data.

第3の学習データ候補「数年前に訪問した渋谷の●●社が急成長しているな」は、曖昧な時間表現として「数年前」が含まれており、かつ日時特定可能な事象表現として「訪問した渋谷の●●社」が含まれているので、学習データとして抽出される。   The third candidate for learning data, “Shibuya's ●● company is not growing rapidly” visited several years ago, includes “several years ago” as an ambiguous time expression, and the date and time can be specified Since “Shibuya ●● company visited” is included as an expression, it is extracted as learning data.

第4の学習データ候補「もうすぐ開催される飲み会が楽しみだな」は、曖昧な時間表現として「もうすぐ」が含まれており、かつ日時特定可能な事象表現として「開催される飲み会」が含まれているので、学習データとして抽出される。   The fourth candidate for learning data “I'm looking forward to a drinking party to be held soon” includes “coming soon” as an ambiguous time expression, and “event to be held” as an event expression that can specify the date and time. Since it is included, it is extracted as learning data.

第5の学習データ候補「以前買った電気スタンドが壊れてしまった」は、曖昧な時間表現として「以前」が含まれており、かつ日時特定可能な事象表現として「買った電気スタンド」が含まれているので学習データとして抽出される。   The fifth learning data candidate “A previously purchased desk lamp has been broken” includes “Previous” as an ambiguous time expression, and includes “Bought desk lamp” as an event expression that can specify the date and time. Therefore, it is extracted as learning data.

これに対して、第6の学習データ候補「最近見たあのTV番組のタイトルなんだっけ」は、曖昧な時間表現として「最近」が含まれるものの、日時特定可能な事象表現が含まれないので、学習データとして抽出されない。   On the other hand, the sixth learning data candidate “What was the title of the TV program that I watched recently” includes “Recent” as an ambiguous time expression, but does not include an event expression that can identify the date and time. It is not extracted as learning data.

一方、第7の学習データ候補「なんか雨が降りそうだな」は、日時特定可能な事象表現として「雨が降りそうだな」を含むが、曖昧な時間表現を含まないので、学習データとして抽出されない。   On the other hand, the seventh learning data candidate “It seems to be raining” includes “It seems to rain” as an event expression that can specify the date and time, but does not include ambiguous time expression, so it is not extracted as learning data .

図6へ戻り、履歴情報管理部12は、発話者のスマホユーザに固有の日時特定可能な履歴情報として、ネット購入やお財布機能を利用した購買履歴、電話での会話履歴、ユーザが登録したスケジュール履歴、GPSや無線基地局の位置情報に基づく追跡履歴、ユーザが作成した文書ファイルに関するドキュメント履歴、ブラウザを利用したWeb閲覧履歴などの履歴情報を管理する。   Returning to FIG. 6, the history information management unit 12 uses the online purchase or the purchase history using the wallet function, the telephone conversation history, the schedule registered by the user as the history information that can identify the date and time specific to the smartphone user of the speaker. It manages history information such as history, tracking history based on GPS and wireless base station location information, document history related to user-created document files, web browsing history using browser.

日時検索部16は、前記抽出された学習データに含まれる日時特定可能な事象表現を検索キーとして、前記履歴情報管理部12の配下にある全ての履歴情報を検索し、対応する履歴情報が見つかると、その日時情報から実績値を計算し、これを前記学習データ候補に含まれる曖昧な時間表現と対応付ける。   The date search unit 16 searches all the history information under the history information management unit 12 using the event expression that can be specified as the date included in the extracted learning data as a search key, and finds corresponding history information. Then, the actual value is calculated from the date and time information, and this is associated with the ambiguous time expression included in the learning data candidate.

例えば、前記第1の学習データ候補「最近見た、●●(芸人名)が出ていたお笑い番組、面白かったね」であれば、「●●(芸人名)」、「お笑い番組」を検索キーとして全ての履歴情報を検索し、ワンセグ放送の視聴履歴に検索キーが登録されており、これが検索結果として応答されると、当該お笑い番組の視聴日時と現在時刻との時間差が、曖昧な時間表現「最近」の実績値として対応付けられる。   For example, in the case of the first learning data candidate “Recently watched ●● (entertainer name) comedy program, it was interesting”, search key “●● (entertainer name)” and “comic program” All the history information is searched, and the search key is registered in the viewing history of 1Seg broadcasting, and when this is answered as a search result, the time difference between the viewing date and time of the comedy program and the current time is ambiguous. Corresponding as a “recent” actual value.

同様に、前記第2の学習データ候補「昔見に行った●●のライブにもう一度行きたいね」であれば、「●●のライブ」を検索キーとして履歴情報を検索し、例えばスケジュール帳の履歴に検索キーが登録されており、これが検索結果として応答されると、当該スケジュール帳の日時と現在時刻との時間差が、曖昧な時間表現「昔」の実績値として対応付けられる。   Similarly, if the second candidate for the learning data is “I want to go to ●● live again in the past”, the history information is searched using “●● live” as a search key. When a search key is registered in the history and this is returned as a search result, the time difference between the date and time of the schedule book and the current time is associated with the actual value of the ambiguous time expression “old”.

評価部17は、前記検索結果を評価し、所定の評価条件を満足する、曖昧な時間表現とその実績値との対応関係を抽出して予測モデルDB4へ登録する。本実施形態では、前記日時検索部16が検索結果と共にそのマッチング精度を応答するものとし、マッチング精度が所定の基準値を下回る対応関係は、予測モデルDB4への登録が見送られる。   The evaluation unit 17 evaluates the search result, extracts a correspondence relationship between an ambiguous time expression that satisfies a predetermined evaluation condition and its actual value, and registers it in the prediction model DB 4. In the present embodiment, it is assumed that the date search unit 16 responds with the matching accuracy together with the search result, and the correspondence relationship in which the matching accuracy is lower than a predetermined reference value is not registered in the prediction model DB 4.

また、一つの日時特定可能な事象表現に対して複数の検索結果が得られ、それぞれの日時に大きなバラツキがある、換言すれば、対応付けられる実績値に大きなバラツキが生じる場合には、対応する実績値を特定できないので低評価となり、前記予測モデルDB4への登録が見送られる。   In addition, a plurality of search results are obtained for an event expression that can specify one date and time, and there is a large variation in each date and time, in other words, when there is a large variation in the associated actual value, it corresponds. Since the actual value cannot be specified, the evaluation is low, and registration in the prediction model DB 4 is postponed.

図8は、本発明による予測モデルの学習手順を示したフローチャートであり、ここでは、予め蓄積されているユーザの発話データに基づいてオフラインで学習する場合を例にして説明するが、装置がリアルタイム処理に対処できる十分な能力を備えている場合にはオンラインで学習しても良い。   FIG. 8 is a flowchart showing a learning procedure of a prediction model according to the present invention. Here, a case where offline learning is performed based on user's utterance data stored in advance will be described as an example. You may learn online if you have enough ability to handle the process.

ステップS21では、マイクロフォンMCで検出された音声信号に対して、前記音声信号認識部13により周知の音声認識処理が実施されて文字データの時系列が出力される。ステップS22では、前記学習データ候補生成部14において、前記文字データの時系列が、その内容や無声箇所に基づいて複数のセンテンスに分解され、各センテンスが学習データ候補とされる。   In step S21, a known voice recognition process is performed on the voice signal detected by the microphone MC by the voice signal recognition unit 13, and a time series of character data is output. In step S22, the learning data candidate generation unit 14 decomposes the time series of the character data into a plurality of sentences based on the contents and silent portions, and sets each sentence as a learning data candidate.

ステップS23では、学習データ候補の一つに注目し、ステップS24では、前記学習データ抽出部15において、注目した学習データ候補が前記曖昧な時間表現を含むか否かが判定される。曖昧な時間表現を含んでいればステップS25へ進む。   In step S23, attention is paid to one of the learning data candidates, and in step S24, the learning data extraction unit 15 determines whether the focused learning data candidate includes the ambiguous time expression. If an ambiguous time expression is included, the process proceeds to step S25.

ステップS25では、前記学習データ抽出部15において、前記学習データ候補が前記日時特定可能な事象表現を含むか否かが判定される。日時特定可能な事象表現を含めば、今回の学習データ候補が正規の学習データに採用されてステップS26へ進み、前記日時検索部16により、前記日時特定可能な事象表現を検索キーとして履歴情報管理部12が検索される。   In step S25, the learning data extraction unit 15 determines whether or not the learning data candidate includes the event expression that can specify the date and time. If the event expression that can specify the date and time is included, the current learning data candidate is adopted as the regular learning data, and the process proceeds to step S26. The date and time search unit 16 uses the event expression that can specify the date and time as a search key to manage history information. Part 12 is searched.

ステップS27では、前記評価部17において全ての検索結果が評価される。本実施形態では、各検索結果のマッチング精度に基づいて、マッチング精度のより高い検索結果に対して、より高い評価値が与えられる。   In step S27, the evaluation unit 17 evaluates all search results. In the present embodiment, a higher evaluation value is given to a search result with higher matching accuracy based on the matching accuracy of each search result.

さらに、一つの日時特定可能な事象表現に対して複数の検索結果(実績値)が得られている場合には、各検索結果のばらつきが、例えば分散として計算される。その結果、例えば一の検索結果の日時が1か月前であるのに対して、他の一の検索結果が1年前であるなど、検索結果に大きなばらつきがあれば低い評価値が与えられる。これに対して、例えば一の検索結果の一次が40日前、他の一の検索結果の日時が42日前であるといったように、そのばらつきが小さければ高い評価値が与えられる。   Furthermore, when a plurality of search results (actual values) are obtained for an event expression that can specify one date and time, the variation of each search result is calculated as variance, for example. As a result, a low evaluation value is given if there is a large variation in search results, for example, the date and time of one search result is one month ago while the other search result is one year ago. . On the other hand, a high evaluation value is given if the variation is small, for example, the primary of one search result is 40 days ago and the date and time of the other search result is 42 days ago.

ステップS28では、各検索結果の評価値が所定の基準値と比較され、評価値が所定の基準値を超えた検索結果については、ステップS29において、実績値が前記曖昧な時間表現と対応付けられて予測モデルDB4に登録される。すなわち、対応する予測モデルの対応する実績値に度数が追加される。   In step S28, the evaluation value of each search result is compared with a predetermined reference value. For a search result whose evaluation value exceeds the predetermined reference value, the actual value is associated with the ambiguous time expression in step S29. Are registered in the prediction model DB 4. That is, the frequency is added to the corresponding actual value of the corresponding prediction model.

なお、評価値が所定の基準値に満たなければステップS30へ進み、全ての学習データ候補に対して上記の処理が完了したか否かが判断される。完了していなければステップS23へ戻り、注目する学習データ候補を切り替えて上記の各処理を繰り返すことで、前記図2を参照して説明した予測モデルが順次に構築される。   If the evaluation value does not satisfy the predetermined reference value, the process proceeds to step S30, and it is determined whether or not the above processing has been completed for all learning data candidates. If not completed, the process returns to step S23, and the prediction model described with reference to FIG. 2 is sequentially constructed by switching the learning data candidate to be noticed and repeating the above processes.

本実施形態によれば、曖昧な時間表現を、これを発声したユーザの履歴情報に基づいて、当該ユーザが過去に用いた曖昧な時間表現に対応した実績値すなわち対応する実際の日時を検索し、対応付けて学習するので、曖昧な時間表現から定量的な時間表現を正確に予測できる予測モデルを構築できるようになる。   According to this embodiment, based on the history information of the user who spoke the ambiguous time expression, the actual value corresponding to the ambiguous time expression used by the user in the past, that is, the corresponding actual date and time is searched. Since learning is performed in association with each other, a prediction model capable of accurately predicting a quantitative time expression from an ambiguous time expression can be constructed.

また、本実施形態によれば、曖昧な時間表現に対応した実績値の検索結果を、そのマッチング精度や分散に基づいて評価し、評価値の低い検索結果は予測モデルの構築に利用しないようにしたので、確度の低い検索結果や誤った検索結果に基づいて予測モデルが構築されてしまうことを防止できるようになる。   Further, according to the present embodiment, the search result of the actual value corresponding to the ambiguous time expression is evaluated based on the matching accuracy and variance, and the search result having a low evaluation value is not used for the construction of the prediction model. Therefore, it is possible to prevent the prediction model from being constructed based on a search result with low accuracy or an incorrect search result.

さらに、本実施形態によれば、ユーザが日常的に発声する音声データを検知して学習データ候補を生成できるので、特別な学習機会や専門の管理者を設けることなく、個人差を考慮した学習を簡単に行えるようになる。   Furthermore, according to the present embodiment, learning data candidates can be generated by detecting voice data uttered by the user on a daily basis, so that learning that takes into account individual differences can be achieved without providing special learning opportunities or specialized managers. Can be done easily.

なお、上記の各実施形態では、予測モデルがユーザごとに構築されるものとして説明したが、本発明はこれのみに限定されるものではなく、例えば、学習機能をクラウド上に設け、各ユーザが自身の端末から学習データや履歴情報をアップロードし、クラウド上で各ユーザからアップロードされた学習データおよび履歴情報をユーザ属性に基づいて分類し、ユーザ属性ごとに予測モデルを構築するようにしても良い。   In each of the above embodiments, the prediction model is described as being constructed for each user. However, the present invention is not limited to this. For example, a learning function is provided on the cloud, and each user The learning data and history information may be uploaded from its own terminal, the learning data and history information uploaded from each user on the cloud may be classified based on user attributes, and a prediction model may be constructed for each user attribute. .

1…ユーザI/F,2…通信I/F,3…ディスプレイ,4…予測モデルDB,5…検索要求受付部,6…日時範囲予測部,7…Web検索機能部,8…ユーザ反応検知部,9…予測モデル更新部,10…時間表現DB,11…事象表現DB,12…履歴情報管理部,13…音声信号認識部,14…学習データ候補生成部,15…学習データ抽出部,16…日時検索部,17…評価部   DESCRIPTION OF SYMBOLS 1 ... User I / F, 2 ... Communication I / F, 3 ... Display, 4 ... Prediction model DB, 5 ... Search request reception part, 6 ... Date / time range prediction part, 7 ... Web search function part, 8 ... User reaction detection , 9 ... Prediction model update part, 10 ... Time expression DB, 11 ... Event expression DB, 12 ... History information management part, 13 ... Speech signal recognition part, 14 ... Learning data candidate generation part, 15 ... Learning data extraction part, 16 ... Date search part, 17 ... Evaluation part

Claims (16)

曖昧な時間表現を含む検索クエリに対して当該時間表現に対応した検索条件による検索結果を応答する情報検索装置において、
曖昧な時間表現ごとに定量的な日時範囲を確率的に予測する予測モデルと、
検索クエリに含まれる曖昧な時間表現を前記予測モデルに適用して確率値が所定の設定範囲内の日時範囲を予測する手段と、
前記検索クエリおよび前記日時範囲を検索条件とする検索で得られた検索結果を一覧表示する検索機能手段と、
前記検索結果に対するユーザの反応を検知するユーザ反応検知手段と、
前記ユーザの反応に基づいて、前記予測モデルの前記日時範囲の予測結果に対応した確率値を増補正または減補正する予測モデル更新手段とを具備したことを特徴とする情報検索装置。
In an information search apparatus that responds to a search query including an ambiguous time expression with a search result based on a search condition corresponding to the time expression,
A prediction model that probabilistically predicts a quantitative date and time range for each ambiguous time expression;
Means for applying an ambiguous time expression included in a search query to the prediction model to predict a date and time range within which a probability value is within a predetermined setting range;
Search function means for displaying a list of search results obtained by the search using the search query and the date and time range as search conditions;
User response detection means for detecting a user response to the search results;
An information search apparatus comprising: a prediction model update unit that increases or decreases a probability value corresponding to a prediction result of the date and time range of the prediction model based on a reaction of the user.
前記予測モデル更新手段は、前記ユーザ反応検知手段により、ユーザが前記検索結果に満足したと推定される操作が検知されると、前記予測モデルの前記日時範囲の予測結果に対応した確率値を増補正することを特徴とする請求項1に記載の情報検索装置。   The prediction model update unit increases a probability value corresponding to the prediction result of the date and time range of the prediction model when the user reaction detection unit detects an operation that the user is estimated to be satisfied with the search result. The information search apparatus according to claim 1, wherein correction is performed. 前記ユーザが検索結果に満足したと推定される操作が、前記検索結果のいずれかに対するアクセス要求であることを特徴とする請求項2に記載の情報検索装置。   The information search apparatus according to claim 2, wherein the operation that the user is estimated to be satisfied with the search result is an access request for any of the search results. 前記予測モデル更新手段は、前記ユーザ反応検知手段により、ユーザが前記検索結果に満足していないと推定される操作が検知されると、前記予測モデルの前記日時範囲の予測結果に対応した確率値を減補正することを特徴とする請求項1ないし3のいずれかに記載の情報検索装置。   The prediction model update unit is configured to detect a probability value corresponding to a prediction result of the date and time range of the prediction model when an operation that the user is estimated not to be satisfied with the search result is detected by the user reaction detection unit. 4. The information search apparatus according to claim 1, wherein the correction is performed by reducing the correction. 前記ユーザが検索結果に満足していないと推定される操作が、次の検索結果の一覧表示を要求する操作であることを特徴とする請求項4に記載の情報検索装置。   The information search apparatus according to claim 4, wherein the operation that the user is estimated not to be satisfied with the search result is an operation that requests a list display of the next search result. 前記日時範囲を予測する手段は、前記ユーザが検索結果に満足していないと推定される操作が検知されると、前記確率値の設定範囲を下げて前記日時範囲を再予測することを特徴とする請求項4または5に記載の情報検索装置。   The means for predicting the date and time range, when an operation presumed that the user is not satisfied with the search result is detected, lowers the probability value setting range and re-predicts the date and time range. The information search device according to claim 4 or 5. 前記増補正または減補正された確率値の当該増減分が、時間経過と共に漸減されることを特徴とする請求項1ないし6のいずれかに記載の情報検索装置。   7. The information search apparatus according to claim 1, wherein the increase / decrease of the probability value that has been increased or decreased is gradually decreased as time elapses. 学習データ候補の中から、曖昧な時間表現および日時特定可能な事象表現を含む学習データを抽出する学習データ抽出手段と、
履歴情報から、前記事象表現に関連する履歴の日時を検索して、前記曖昧な時間表現に対応する実績値を算出する手段と、
前記曖昧な時間表現とその実績値との対応関係に基づいて前記予測モデルを構築する手段とを具備したことを特徴とする請求項1ないし7のいずれかに記載の情報検索装置。
Learning data extraction means for extracting learning data including ambiguous time expressions and event expressions that can specify date and time from learning data candidates;
Means for searching a history date and time related to the event expression from history information, and calculating a performance value corresponding to the ambiguous time expression;
8. The information search apparatus according to claim 1, further comprising means for constructing the prediction model based on a correspondence relationship between the ambiguous time expression and the actual value.
前記事象表現に関連する日時の検索結果を評価する評価手段を具備し、
評価値が所定の基準値に満たない対応関係は予測モデルの構築に用いないことを特徴とする請求項8に記載の情報検索装置。
Comprising an evaluation means for evaluating a search result of date and time related to the event expression,
9. The information search apparatus according to claim 8, wherein a correspondence relationship whose evaluation value does not satisfy a predetermined reference value is not used for construction of a prediction model.
前記評価手段は、前記検索結果をマッチング精度が高いほど高く評価することを特徴とする請求項9に記載の情報検索装置。   The information search apparatus according to claim 9, wherein the evaluation unit evaluates the search result higher as the matching accuracy is higher. 前記評価手段は、前記検索結果が複数個得られたときに、各日時の分散が大きいほど低く評価することを特徴とする請求項9または10に記載の情報検索装置。   11. The information search apparatus according to claim 9, wherein the evaluation means evaluates the lower the greater the variance of each date and time when a plurality of the search results are obtained. 音声信号を検出する手段と、
前記音声信号を文字データの時系列に変換する手段と、
前記文字データの時系列を所定の規則で分割して学習データ候補を生成する手段とを具備したことを特徴とする請求項8ないし11のいずれかに記載の情報検索装置。
Means for detecting an audio signal;
Means for converting the voice signal into a time series of character data;
12. The information search apparatus according to claim 8, further comprising means for dividing the time series of the character data according to a predetermined rule to generate learning data candidates.
多数の曖昧な時間表現を記憶する時間表現データベースと、
多数の日時特定可能な事象表現を記憶する事象表現データベースとを具備し、
前記学習データ抽出手段は、前記時間表現データベースに記憶されている時間表現および前記事象表現データベースに記憶されている事象表現を前記学習データ候補の中から抽出することを特徴とする請求項8ないし12のいずれかに記載の情報検索装置。
A time expression database that stores a number of ambiguous time expressions;
An event expression database for storing a large number of date and time identifiable event expressions,
9. The learning data extracting unit extracts a time expression stored in the time expression database and an event expression stored in the event expression database from the learning data candidates. 12. The information search device according to any one of 12 above.
曖昧な時間表現を含む検索クエリに対して当該時間表現に対応した検索条件による検索結果を応答する情報検索装置において、
曖昧な時間表現ごとに定量的な日時範囲を確率的に予測する予測モデルと、
検索クエリに含まれる曖昧な時間表現を前記予測モデルに適用して確率値が所定の設定範囲内の日時範囲を予測する手段と、
前記検索クエリおよび前記日時範囲の予測結果を検索条件とする検索結果を一覧表示する検索機能手段と、
前記検索結果に対するユーザの反応を検知するユーザ反応検知手段と、
前記ユーザの反応に基づいて、前記予測モデルの前記日時範囲の予測結果に対応した確率値を増補正または減補正する予測モデル更新手段とを具備したことを特徴とする情報検索装置。
In an information search apparatus that responds to a search query including an ambiguous time expression with a search result based on a search condition corresponding to the time expression,
A prediction model that probabilistically predicts a quantitative date and time range for each ambiguous time expression;
Means for applying an ambiguous time expression included in a search query to the prediction model to predict a date and time range within which a probability value is within a predetermined setting range;
Search function means for displaying a list of search results using the search query and the prediction result of the date and time range as a search condition;
User response detection means for detecting a user response to the search results;
An information search apparatus comprising: a prediction model update unit that increases or decreases a probability value corresponding to a prediction result of the date and time range of the prediction model based on a reaction of the user.
曖昧な時間表現を含む検索クエリに対して当該時間表現に対応した検索条件による検索結果を応答する情報検索方法において、
検索クエリに含まれる曖昧な時間表現を、曖昧な時間表現ごとに定量的な日時範囲を確率的に予測する予測モデルに適用して確率値が所定の設定範囲内の日時範囲を予測する手順と、
前記検索クエリおよび前記日時範囲を検索条件とする検索で得られた検索結果を一覧表示する手順と、
前記検索結果に対するユーザの反応を検知する手順と、
前記ユーザの反応に基づいて、前記予測モデルの前記日時範囲の予測結果に対応した確率値を増補正または減補正する手順とを含むことを特徴とする情報検索方法。
In an information search method for responding to a search query including an ambiguous time expression with a search result based on a search condition corresponding to the time expression,
Applying ambiguous time expressions included in the search query to a prediction model that probabilistically predicts a quantitative date and time range for each ambiguous time expression and predicting a date and time range in which the probability value is within a predetermined setting range; ,
A procedure for displaying a list of search results obtained by a search using the search query and the date and time range as search conditions;
Detecting a user's response to the search results;
And a procedure for increasing or decreasing the probability value corresponding to the prediction result of the date / time range of the prediction model based on the reaction of the user.
曖昧な時間表現を含む検索クエリに対して当該時間表現に対応した検索条件による検索結果を応答する情報検索プログラムにおいて、
検索クエリを含む検索要求をインタフェース経由で受け付ける手順と、
前記検索クエリに含まれる曖昧な時間表現を抽出する手順と、
曖昧な時間表現ごとに定量的な日時範囲を確率的に予測する予測モデルを記憶するデータベースの対応する予測モデルに前記曖昧な時間表現適用して確率値が所定の設定範囲内の日時範囲を予測する手順と、
前記検索クエリおよび前記日時範囲を検索条件とする検索で得られた検索結果をディスプレイに一覧表示する手順と、
前記検索結果に対するユーザの反応をインタフェース経由で検知する手順と、
前記ユーザの反応に基づいて、前記予測モデルの前記日時範囲の予測結果に対応した確率値を増補正または減補正する手順とを、コンピュータに実行させる情報検索プログラム。
In an information search program for responding to a search query including an ambiguous time expression with a search result based on a search condition corresponding to the time expression,
A procedure for accepting a search request including a search query via an interface;
A procedure for extracting an ambiguous temporal expression included in the search query;
Predict the date and time range in which the probability value is within the predetermined setting range by applying the ambiguous time representation to the corresponding prediction model in the database that stores the prediction model that stochastically predicts the quantitative date and time range for each ambiguous time expression And the steps to
A procedure for displaying a list of search results obtained by a search using the search query and the date / time range as a search condition;
A procedure for detecting a user response to the search result via an interface;
An information search program for causing a computer to execute a procedure for increasing or decreasing a probability value corresponding to a prediction result of the date and time range of the prediction model based on a reaction of the user.
JP2014114000A 2014-06-02 2014-06-02 Information retrieval method, apparatus and program Active JP6251637B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014114000A JP6251637B2 (en) 2014-06-02 2014-06-02 Information retrieval method, apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014114000A JP6251637B2 (en) 2014-06-02 2014-06-02 Information retrieval method, apparatus and program

Publications (2)

Publication Number Publication Date
JP2015228162A JP2015228162A (en) 2015-12-17
JP6251637B2 true JP6251637B2 (en) 2017-12-20

Family

ID=54885588

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014114000A Active JP6251637B2 (en) 2014-06-02 2014-06-02 Information retrieval method, apparatus and program

Country Status (1)

Country Link
JP (1) JP6251637B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7271333B2 (en) 2019-06-25 2023-05-11 サンコール株式会社 Busbar assembly and manufacturing method thereof

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180037826A (en) 2016-10-05 2018-04-13 삼성전자주식회사 Display apparatus, method of controlling display apparatus and information providing system
JP7082073B2 (en) * 2019-02-01 2022-06-07 株式会社日立製作所 Computer, learning data generation method, and computer system
JP2022126427A (en) * 2021-02-18 2022-08-30 ヤフー株式会社 Information processing device, information processing method, and information processing program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10254891A (en) * 1997-03-11 1998-09-25 Sharp Corp Information retrieving device
JP2000331002A (en) * 1999-05-14 2000-11-30 Sony Corp Retrieval device, retrieval method, and recording medium recording retrieval control program
JP2001331487A (en) * 2000-05-19 2001-11-30 Nec Shizuoka Ltd Retrieval system, retrieval device, retrieval method and recording medium
JP3949356B2 (en) * 2000-07-12 2007-07-25 三菱電機株式会社 Spoken dialogue system
JP5834468B2 (en) * 2011-04-27 2015-12-24 ソニー株式会社 Information processing apparatus, information processing method, and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7271333B2 (en) 2019-06-25 2023-05-11 サンコール株式会社 Busbar assembly and manufacturing method thereof

Also Published As

Publication number Publication date
JP2015228162A (en) 2015-12-17

Similar Documents

Publication Publication Date Title
US11709829B2 (en) Retrieving context from previous sessions
US11315546B2 (en) Computerized system and method for formatted transcription of multimedia content
US11394667B2 (en) Chatbot skills systems and methods
US20200012721A1 (en) Conversational agent
US20190103111A1 (en) Natural Language Processing Systems and Methods
CN105701254B (en) Information processing method and device for information processing
US20190057697A1 (en) Better resolution when referencing to concepts
US20220365939A1 (en) Methods and systems for client side search ranking improvements
US11630955B2 (en) Contextual document recall
US10650818B2 (en) Semi-supervised question answering machine
US10922738B2 (en) Intelligent assistance for support agents
CN101999119A (en) Techniques for input recognition and completion
US20210382893A1 (en) Intelligently identifying the most knowledgable person based on multiple data source inputs
CN114840671A (en) Dialogue generation method, model training method, device, equipment and medium
KR101891498B1 (en) Method, computer device and computer readable recording medium for multi domain service resolving the mixture of multi-domain intents in interactive ai agent system
WO2020206910A1 (en) Product information pushing method, apparatus, computer device, and storage medium
JP6251637B2 (en) Information retrieval method, apparatus and program
CN114119123A (en) Information pushing method and device
US11314793B2 (en) Query processing
CN117882365A (en) Verbal menu for determining and visually displaying calls
JP6246658B2 (en) Time expression learning method, apparatus and program
US11727042B2 (en) Method and server for classifying queries
CN114242047A (en) Voice processing method and device, electronic equipment and storage medium

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160823

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171127

R150 Certificate of patent or registration of utility model

Ref document number: 6251637

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150