JP2008083753A - Dialogue support device and its method - Google Patents
Dialogue support device and its method Download PDFInfo
- Publication number
- JP2008083753A JP2008083753A JP2006259754A JP2006259754A JP2008083753A JP 2008083753 A JP2008083753 A JP 2008083753A JP 2006259754 A JP2006259754 A JP 2006259754A JP 2006259754 A JP2006259754 A JP 2006259754A JP 2008083753 A JP2008083753 A JP 2008083753A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- ambiguous expression
- ambiguous
- listener
- recognition range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、話し手と聞き手間のコミュニケーションにおける曖昧な表現における誤解や意識のずれを検出する対話支援装置及びその方法に関する。 The present invention relates to a dialogue support apparatus and method for detecting misunderstandings and consciousness shifts in ambiguous expressions in communication between a speaker and a listener.
近年、企業活動のスピードアップやグローバル化の要請を背景にTV会議などの遠隔コミュニケーションの重要性が増している。 In recent years, the importance of remote communication such as video conferencing has been increasing against the background of speeding up of corporate activities and globalization.
また、今後はVoIPの広がりなどから遠隔コミュニケーションの端末にPC(パーソナルコンピュータ)が使用されるようになることが見込まれる。PCが使用されるとこれまでのTV会議用の端末のように単にユーザ間の音声や画像を相互転送するだけでなく、音声認識(例えば、特許文献1参照)や画像処理などの高度な処理を実現することが可能になる。
遠隔コミュニケーションにおいて話し手と聞き手が異なる人間である以上ミスコミュニケーションは避けられない。文化、生活、育ち、バックグラウンドの違いにより、物事の感覚が異なることがよくある。しかも今後は海外とのコミュニケーションの機会が増加することが見込まれ、ミスコミュニケーションの発生する可能性は増加することが予想される。言語のニュアンスに対する感覚が異なる人間同士が会話を行うとこれまで以上に重大な意識・認識ずれが生じやすくなる可能性がある。 Miscommunication is inevitable as long as the speaker and listener are different in remote communication. The sense of things is often different due to differences in culture, life, growth and background. Moreover, it is expected that opportunities for communication with foreign countries will increase in the future, and the possibility of miscommunication is expected to increase. When people with different senses of language nuances have conversations, there is a possibility that more serious consciousness / recognition shifts may occur.
TV会議の議論において、このような誤解や意識ずれを放置したままにするとその後の業務に支障が出ることは容易に想像される。しかし、意識ずれが生じそうな曖昧な表現が会話に現れるたびに細かく確認していては遅々として会話が進まず、効率が悪く、円滑なコミュニケーションが取れない。 It is easily imagined that if such misunderstandings and misconceptions are left unattended in the discussion of the TV conference, the subsequent work will be hindered. However, if an ambiguous expression that is likely to cause consciousness dissatisfaction is confirmed every time it appears in the conversation, the conversation does not proceed slowly, and the efficiency is low and smooth communication cannot be achieved.
そこで、本発明は上記問題点に鑑み、話し手の表現に曖昧さがあっても、その曖昧さによる話し手と聞き手の差異を求めることができ対話支援装置及びその方法を提供する。 In view of the above problems, the present invention provides a dialogue support apparatus and method that can determine the difference between a speaker and a listener due to the ambiguity even if the expression of the speaker is ambiguity.
本発明は、話し手と聞き手間のコミュニケーションを仲介する対話支援装置において、前記話し手の音声を認識する音声認識部と、前記話し手と前記聞き手との間に誤解や意識のずれを発生させるような曖昧表現単語のリストを格納した曖昧表現単語リスト記憶部と、前記曖昧表現単語リストと前記音声認識結果とを比較して、前記音声認識結果から曖昧表現単語を含む曖昧表現句を検出する曖昧表現検出部と、前記曖昧表現句によって前記聞き手の解釈が曖昧となる曖昧表現対象を前記音声認識結果から検出する曖昧表現対象検出部と、前記話し手の人物情報と前記聞き手の人物情報を特定する話者特定部と、前記曖昧表現句と前記曖昧表現対象の組合せに対して、前記人物情報毎に前記曖昧な表現の認知範囲を格納する認知範囲記憶部と、前記認知範囲記憶部に格納した前記話し手の人物情報に関する前記曖昧表現句と前記曖昧表現対象に対する前記話し手の認知範囲を求め、また、前記認知範囲記憶部に格納した前記聞き手の人物情報に関する前記曖昧表現句と前記曖昧表現対象に対する前記聞き手の認知範囲を求める認知範囲推定部と、前記話し手の認知範囲と前記聞き手の認知範囲とを比較して、前記話し手と前記聞き手の認知範囲の差異を求める認知範囲相違検出部と、を具備したことを特徴とする対話支援装置である。 The present invention relates to a dialogue support apparatus that mediates communication between a speaker and a listener, and an ambiguous that causes misunderstandings and deviations of consciousness between the speaker and the listener, and a speech recognition unit that recognizes the speech of the speaker. An ambiguous expression word list storage unit that stores a list of expression words, and an ambiguous expression detection that compares the ambiguous expression word list with the speech recognition result and detects an ambiguous expression phrase including the ambiguous expression word from the speech recognition result. An ambiguous expression target detection unit that detects from the speech recognition result an ambiguous expression target whose interpretation of the listener is ambiguous by the ambiguous expression phrase, and a speaker that identifies the person information of the speaker and the person information of the listener A recognizing range storage unit that stores a recognizing range of the ambiguous expression for each person information with respect to a combination of the specifying unit and the ambiguous expression phrase and the ambiguous expression target; The ambiguous expression phrase related to the person information of the speaker stored in the recognition range storage unit and the recognition range of the speaker for the object of the ambiguous expression are obtained, and the ambiguous information about the person information of the listener stored in the recognition range storage unit A recognition range estimation unit for obtaining a recognition range of the listener with respect to an expression phrase and the ambiguous expression target is compared with a recognition range of the speaker and the listener to obtain a difference between the recognition range of the speaker and the listener. And a recognition range difference detection unit.
本発明によれば、話し手の表現に曖昧さがあっても、その曖昧さによる話し手と聞き手の差異を求めることができ、誤解、意識ずれを防止できる。 According to the present invention, even if there is ambiguity in the expression of the speaker, the difference between the speaker and the listener due to the ambiguity can be obtained, and misunderstanding and misconception can be prevented.
以下、本発明の一実施形態の音声認識装置について図面に基づいて説明する。 Hereinafter, a speech recognition apparatus according to an embodiment of the present invention will be described with reference to the drawings.
(第1の実施形態)
以下、図1で示した構成図と図3を参照しながら第1の実施形態の対話支援装置について説明する。なお、本実施形態の対話支援装置は、音声認識装置を内蔵したものである。
(First embodiment)
The dialogue support apparatus according to the first embodiment will be described below with reference to the configuration diagram shown in FIG. 1 and FIG. Note that the dialogue support apparatus of the present embodiment incorporates a voice recognition apparatus.
(1)対話支援装置の構成
対話支援装置は、図1に示すように、音声認識部102、曖昧表現検出部103、曖昧表現対象検出部104、DB(データーベース)話者特定部105、認知範囲推定部106、認知範囲相違検出部107、曖昧表現単語リスト120、話者情報DB121、認知範囲DB122を有している。これら各部102、103、104、105、106、107、108の各機能は、コンピュータに記憶されたプログラムによって実現できる。
(1) Configuration of Dialogue Support Device As shown in FIG. 1, the dialogue support device includes a
(1−1)音声認識部102
音声認識部102は、話し手100が発声した発話音声130を音声認識する。また、音声認識部102は、この認識した話し手の音声130に対する認識結果131を曖昧表現検出部103に通知する。
(1-1)
The
(1−2)曖昧表現検出部103
曖昧表現検出部103はまず認識結果131中に曖昧表現単語リスト120の単語が存在するかどうかを検査する。見つからなければ発言中に曖昧な表現がないとして何もしない。一方、曖昧表現単語が見つかった場合にはその曖昧表現単語を含む曖昧表現句132を検出する。
(1-2) Ambiguous
The ambiguous
ここで、曖昧表現単語リストは、例えば「やや、若干、もう少し、あまり、くらい」等のような程度を表す副詞や形容詞等の単語リストとして曖昧表現検出部103のDBに記憶されている。曖昧表現単語は程度を表す単語以外にも「英国人のsecond floor」と「米国人のsecond floor」のように同じ表層で異なる概念を表す語のリストでもよい。また、曖昧表現検出部103は、音声認識結果中に曖昧表現が含まれている場合にだけ曖昧表現を含む句132を曖昧表現対象検出部104へ通知する。
Here, the ambiguous expression word list is stored in the DB of the ambiguous
また、その曖昧表現単語を含む曖昧表現句は、例えば形容詞句、副詞句となる。 The ambiguous phrase including the ambiguous expression word is, for example, an adjective phrase or an adverb phrase.
(1−3)曖昧表現対象検出部104
曖昧表現対象検出部104は曖昧表現句が検出した曖昧表現を含む曖昧表現句132の対象を検出する。曖昧表現対象検出部104は、受け取った曖昧表現句132とその句の対象の組133を認知範囲推定部106へ通知する。
(1-3) Ambiguous Expression
The ambiguous expression
(1−4)DB話者特定部105
DB話者特定部105は話し手、聞き手の情報を特定する対話者特定情報134を受け取り、話者情報DB121を参照して認知範囲DB122中でのどの人間に該当するかを検索し、その話し手情報135、聞き手情報136を認知範囲推定部106へ通知する。
(1-4) DB
The DB
対話者特定情報134には人名やID番号等がある。話者情報DB121は対話者特定情報と認知範囲DB122中の人物情報との対応表を保持する。認知範囲DB122で個人レベルまで細かい人物別情報が管理されている場合は、人名などの対話者特定情報からその人物を特定する。一方、認知範囲DB122で人種や国別といった大雑把な単位で人物別情報が管理されている場合には、対話者特定情報から人種や出身国を特定する。
The conversation
(1−5)認知範囲推定部106
認知範囲推定部106では、曖昧表現対象部104が出力する曖昧表現句とその句の対象の組133及びDB話者特定部105が出力する対話者が認知範囲DB122中のどの人物かを特定する人物特定情報135、136から話し手と聞き手の曖昧表現に対するそれぞれの認知範囲137、138を計算し、認知範囲相違検出部107へ通知する。
(1-5) Recognition
In the recognition
(1−6)認知範囲相違検出部107
認知範囲相違検出部107は、話し手と聞き手の曖昧表現に対するそれぞれの認知範囲137、138を受け取り、認知範囲に差異があるか判定する。認知範囲相違検出部107で使用する比較方法は、従来の情報の比較方法のいずれで構わない。例えば認知範囲が数値で表される時にはその2つの値の差が一定の閾値以内かどうかや認知範囲が統計分布で与えられる時には平均と分散から分布の重なり度合いを計算して、相違があるかどうかという方法で差異を判定する。
(1-6) Recognition range
The recognition range
認知範囲相違検出部107で話し手と聞き手の認知範囲137、138に差異があると判定された場合には警告を発する。警告をユーザに伝える方法は従来の警告通知方法のいずれで構わない。一方、差異がないと判定された場合には何もしない。
When the recognition range
(2)対話支援装置の動作内容
以下、図3の対話例を参照しながら、曖昧表現検出部103、曖昧表現対象検出部104、認知範囲推定部106、認知範囲相違検出部107について説明する。
(2) Operation Contents of Dialogue Supporting Device Hereinafter, the ambiguous
図3は人物Aさんと人物Bさんの対話例を示している。図3中の第1カラムは対話番号、第2カラムは会話、第3カラムは曖昧表現句とその句の対象、第4カラムは第3カラムの同一行の曖昧表現、対象組に対する人物Aさんの認知範囲、第5カラムは人物Bさんの認知範囲を表す。 FIG. 3 shows an example of dialogue between the person A and the person B. The first column in FIG. 3 is the dialogue number, the second column is the conversation, the third column is the ambiguous phrase and the target of the phrase, the fourth column is the ambiguous expression of the same line in the third column, and the person A for the target set The fifth column represents the recognition range of the person B.
対話001の時、曖昧表現検出部103は、まず話し手Aさんの音声認識結果から曖昧表現単語リストの語である「若干」「少し」を検出する(ステップ601)。
At the time of the
そして、曖昧表現単語の句をそれぞれ「若干変更して」「少し遅らせ」と検出する。曖昧表現検出部103は、この曖昧表現句を曖昧表現対象検出部104へ通知する(ステップ602)。
Then, the phrase of the ambiguous expression word is detected as “slightly changed” and “slightly delayed”, respectively. The ambiguous
曖昧表現対象検出部104では曖昧表現句の対象の名詞句を検出する。対象を検出する最も一般的な方法は係り受け解析による句の係り受け先単語である。図3の対話001に対して係り受け解析を行うと「若干変更して」→「仕様」、「少し遅らせ」→「スケジュール」という係り受け関係が検出される。曖昧表現対象検出部104はこの曖昧表現句と曖昧表現対象の組133を認知範囲推定部106へ通知する(ステップ603)。
The ambiguous expression
ここで、曖昧表現対象検出部104で対象を検出する際に使用する方法と認知範囲DB122に格納される「人物、曖昧表現句、曖昧表現対象、認知範囲」における曖昧表現対象とは同じ方法で検出されたものである必要がある。すなわち、曖昧表現対象検出部104で係り受け解析を使用する場合は、認知範囲DB122における「曖昧表現対象」も係り受け解析によって検出した単語を使用する必要がある。
Here, the method used when detecting an object by the ambiguous expression
一方、DB話者特定部105は対話者特定情報134に基づいて話し手、聞き手がDB中のどの人物かを特定する。対話者を特定する情報には氏名やID番号などがある。対話者特定情報は対話者の認知範囲DB122中の人物のどれにマッチするかさえ特定できれば、どのような認証情報であっても構わない。ユーザが明示的にシステム開始時に入力してもよいし、カメラと顔認識を使用して自動的に認証してもよい。また、ここで特定するレベルは個人名まで特定してもよいし、国、出身地、所属会社等の一般化したレベルであっても構わない。認知範囲DB122中のデータにおける人物に最もマッチする人物に対応付ければよい。DB話者特定部105が話し手を特定した話し手情報135、聞き手を特定した聞き手情報136は認知範囲推定部106に通知される。
On the other hand, the DB
認知範囲推定部106は曖昧表現句と曖昧表現対象の組133と話し手情報135、聞き手情報136とを組み合わせて認知範囲DB122を検索する。図3の例ではまず「若干変更して、仕様」という組に対してはそれぞれ認知範囲は<若干変更して、仕様、A>は「10〜25%」136、<若干変更して、仕様、B>は「10〜30%」137という結果が得られる。同様に「少し遅らせ、スケジュール」に対しては<少し遅らせ、スケジュール、A>は「1〜4週」、<少し遅らせ、スケジュール、B>は「1〜2週」という結果になる。認知範囲推定部106はこの結果を認知範囲相違比較部107に通知する(ステップ604)。
The recognition
認知範囲相違比較部107では、認知範囲推定部106が推定した話し手の認知範囲137と聞き手の認知範囲138の比較を行う。例えば、「若干変更して、仕様、A−B、最大5%差」、「少し遅らせ、スケジュール、A−B、最大2週」という比較結果になる。例では比較結果を認知範囲の数値の差で表しているが、この方法に限定するものではない。例えば、認知範囲が統計情報のような形で与えられる場合には確率分布の重なり度合や平均値や分散の差の形で表現してもよい。これについては後から説明する。
The recognition range
認知範囲相違検出部107では判定された話し手、聞き手の曖昧表現に対する認知範囲の比較結果に基づいて差異がある場合に検出する(ステップ605,606)。いまここで、差異があると判定する基準として「15%以上、1週以上の期間差、10000円以上の金額の差」を想定する。この場合、図3の例の対話001−a「若干変更して、仕様、A−B、最大5%差」は「15%未満」であるため「対話者A、Bの間で誤解を生じない」と判定する。一方、対話001−b「少し遅らせ、スケジュール、A−B、最大2週」は「1週以上」であるため「対話者A、Bの間で誤解を生じる」と判定する。認知範囲相違検出部107が「誤解を生じる」可能性を検出した時に対話者に通知する警告は公知のユーザインタフェースのいずれの方法で構わない。例えば、警告メッセージの表示や警告音声の再生などユーザに注意を喚起できれば方法は問わない。
The recognition range
対話者Aさん、Bさんはそれぞれ対話支援装置が警告を表示した場合にだけ発言内容に対する双方の認知にずれがないかを確認すればよい。例えば図3の対話の時、対話支援装置は対話001−b、006−c、013−fの3箇所についてだけ警告を表示するため、図3の無駄な確認作業を削減することができ、結果として図4のような円滑な対話を行うことができる。 Each of the conversation persons A and B only needs to confirm whether or not there is a deviation in the recognition of the utterance contents only when the conversation support apparatus displays a warning. For example, during the dialogue shown in FIG. 3, the dialogue support apparatus displays warnings only for the three locations 001-b, 006-c, and 013-f, so that the wasteful confirmation work shown in FIG. 3 can be reduced. As shown in FIG. 4, a smooth dialogue can be performed.
(第2の実施形態)
以下、図2、図5を参照しながら第2の実施形態の対話支援装置について説明する。なお、本実施形態の対話支援装置は、音声翻訳装置を内蔵したものである。なお、図1と同一部分には同一符号を付して説明を省略する。
(Second Embodiment)
The dialogue support apparatus according to the second embodiment will be described below with reference to FIGS. Note that the dialogue support apparatus of the present embodiment incorporates a speech translation apparatus. Note that the same parts as those in FIG.
まず、話し手の使用している言語とシステムの曖昧表現単語リスト120,認知範囲DB122,認知範囲調整DB123で使用される言語が異なる場合、音声認識部102では話し手の音声を認識した上で聞き手の言語への翻訳処理も行う。
First, when the language used by the speaker and the language used in the system ambiguous
認知範囲調整部109は認知範囲推定部106が推定した話し手、聞き手の認知範囲137、138を比較する際に、認知範囲調整DB123を参照して、認知範囲を調整する。調整後の認知範囲情報を認知範囲相違検出部107へ通知する。
The recognition
図5を使って認知範囲調整部109の動作を説明する。
The operation of the recognition
図5は韓国人と日本人の対話例を示している。第1カラムは対話番号、第2カラムは会話、第3カラムは曖昧表現句とその句の対象、第4カラムは第3カラムの同一行の曖昧表現、対象組に対する韓国人の認知範囲、第5カラムは日本人の認知範囲を表す。 Fig. 5 shows an example of dialogue between Korean and Japanese. The first column is the conversation number, the second column is the conversation, the third column is the ambiguous phrase and the target of the phrase, the fourth column is the ambiguous expression of the same line in the third column, the Korean recognition range for the target group, the first The 5th column represents the recognition range of the Japanese.
ここで、対話006で出現する金額に関する認知範囲は認知範囲DB122において、韓国人は「ウォン(W)」、日本人は「円」という単位で管理される。これは、各国民の認知範囲を正確に表現するためである。どちらか一方の単位(例えば「円」)に統一して認知範囲DB122に格納することも考えられるが、為替レートが変わった場合に正しく追従できない不都合がある。そのため、認知範囲DB122にはそれぞれ<もう少し安い、服、韓国人、−10000W>、<もう少し安い、服、日本人、−3000円>が格納されるのが望ましい。しかし、この場合、金額の単位が異なるためそのままでは対話006の認知範囲の差異を単純に比較できない。
Here, the recognition range regarding the amount of money that appears in the
ここで、認知範囲調整DB123において「韓国人、日本人、0.12W=1円」という認知範囲の調整式が与えられると、<もう少し安い、服、韓国人、−10000W>は<もう少し安い、服、韓国人、−1200円>に変換できる。これにより、対話006の会話で韓国人、日本人の間で誤解が生じる可能性があることが正しく検出できる。
Here, in the cognitive
(変更例)
本発明は上記各実施形態に限らず、その主旨を逸脱しない限り種々に変更することができる。
(Example of change)
The present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the gist thereof.
(第1の変更例)
曖昧表現対象の検出方法は、上記実施形態の係り受け以外にも曖昧表現単語の前後のN個単語列(Nは1以上の自然数)とする方法がある。この方法は係り受け解析のような複雑な解析処理をせずに簡便に曖昧表現の対象を検出することができる利点を持つ。
(First change example)
As a method for detecting an ambiguous expression target, there is a method in which N word strings before and after an ambiguous expression word (N is a natural number of 1 or more) other than the dependency in the above embodiment. This method has an advantage that an object of ambiguous expression can be easily detected without performing complicated analysis processing such as dependency analysis.
但し、この場合は、認知範囲DB122における「曖昧表現対象」も曖昧表現単語の前後のN個単語列を使用する。
However, in this case, N word strings before and after the ambiguous expression word are also used as the “ambiguous expression object” in the
(第2の変更例)
図9に基づいて、<若干変更、スケジュール>表現に対するAさん、Bさんの認知範囲を統計的に表現した変更例を説明する。
(Second modification)
Based on FIG. 9, a description will be given of a modification example in which the recognition ranges of Mr. A and Mr. B with respect to the <slightly changed, schedule> expression are statistically expressed.
単にイメージする範囲であればAさん、Bさん両者とも1〜5週をイメージする。
If it is just the image range, both Mr. A and
そのため、認知範囲を単純な数値で表現する場合は「1〜5週」と表現され、差異がないと判定される。 Therefore, when the recognition range is expressed by a simple numerical value, it is expressed as “1 to 5 weeks”, and it is determined that there is no difference.
統計的に表現する場合は、図9に示すように、Aさん、Bさん両者が<若干変更、スケジュール>という表現に対して何回、x週をイメージするか集計し、その頻度に基づいて統計分布を作成する。そして、統計分布の差異比較は重なり面積Sで判定できる。 In the case of statistical expression, as shown in FIG. 9, A and B both count how many times x weeks are imaged for the expression <slightly changed, schedule>, and based on the frequency Create a statistical distribution. The statistical distribution difference comparison can be determined by the overlapping area S.
そのため、両者が強くイメージするx週が異なれば差異があると判定される。 Therefore, it is determined that there is a difference if the x weeks that both images strongly differ.
100 話し手ユーザ
101 聞き手ユーザ
102 音声認識部
103 曖昧表現検出部
104 曖昧表現対象検出部
105 DB話者特定部
106 認知範囲推定部
107 認知範囲相違検出部
109 認知範囲調整部
120 曖昧表現単語リスト
121 話者情報DB
122 認知範囲DB122
123 認知範囲調整DB123
DESCRIPTION OF
122 Recognition range DB122
123 Recognition range adjustment DB123
Claims (11)
前記話し手の音声を認識する音声認識部と、
前記話し手と前記聞き手との間に誤解や意識のずれを発生させるような曖昧表現単語のリストを格納した曖昧表現単語リスト記憶部と、
前記曖昧表現単語リストと前記音声認識結果とを比較して、前記音声認識結果から曖昧表現単語を含む曖昧表現句を検出する曖昧表現検出部と、
前記曖昧表現句によって前記聞き手の解釈が曖昧となる曖昧表現対象を前記音声認識結果から検出する曖昧表現対象検出部と、
前記話し手の人物情報と前記聞き手の人物情報を特定する話者特定部と、
前記曖昧表現句と前記曖昧表現対象の組合せに対して、前記人物情報毎に前記曖昧な表現の認知範囲を格納する認知範囲記憶部と、
前記認知範囲記憶部に格納した前記話し手の人物情報に関する前記曖昧表現句と前記曖昧表現対象に対する前記話し手の認知範囲を求め、また、前記認知範囲記憶部に格納した前記聞き手の人物情報に関する前記曖昧表現句と前記曖昧表現対象に対する前記聞き手の認知範囲を求める認知範囲推定部と、
前記話し手の認知範囲と前記聞き手の認知範囲とを比較して、前記話し手と前記聞き手の認知範囲の差異を求める認知範囲相違検出部と、
を具備した
ことを特徴とする対話支援装置。 In a dialogue support device that mediates communication between the speaker and the listener,
A voice recognition unit for recognizing the voice of the speaker;
An ambiguous expression word list storage unit that stores a list of ambiguous expression words that cause misunderstandings and misconceptions between the speaker and the listener;
An ambiguous expression detection unit that compares the ambiguous expression word list with the speech recognition result and detects an ambiguous expression phrase including the ambiguous expression word from the speech recognition result;
An ambiguous expression target detection unit for detecting an ambiguous expression target whose interpretation of the listener is ambiguous by the ambiguous expression phrase from the speech recognition result;
A speaker identification unit that identifies the person information of the speaker and the person information of the listener;
A recognition range storage unit that stores a recognition range of the ambiguous expression for each person information with respect to the combination of the ambiguous expression phrase and the ambiguous expression target;
The ambiguous expression phrase related to the person information of the speaker stored in the recognition range storage unit and the recognition range of the speaker with respect to the object of the ambiguous expression are obtained, and the ambiguous information about the person information of the listener stored in the recognition range storage unit A recognition range estimation unit for obtaining a recognition range of the listener for the expression phrase and the ambiguous expression target;
A recognition range difference detection unit that compares the speaker's recognition range with the listener's recognition range to determine a difference between the speaker and the listener's recognition range;
A dialogue support apparatus characterized by comprising:
ことを特徴とする請求項1に記載の対話支援装置。 The dialogue support apparatus according to claim 1, wherein the ambiguous expression phrase is an adjective phrase or an adverb phrase.
ことを特徴とする請求項1記載の対話支援装置。 The dialogue support apparatus according to claim 1, wherein the ambiguous expression target is a dependency destination.
ことを特徴とする請求項1記載の対話支援装置。 The dialogue support apparatus according to claim 1, wherein the ambiguous expression target is a noun phrase.
ことを特徴とする請求項1記載の対話支援装置。 The dialogue support apparatus according to claim 1, wherein the object of ambiguous expression is a word string before and after an ambiguous expression phrase.
ことを特徴とする請求項1記載の対話支援装置。 The dialogue support apparatus according to claim 1, wherein the recognition range is represented by a numerical value.
ことを特徴とする請求項1記載の対話支援装置。 The dialogue support apparatus according to claim 1, wherein the recognition range is represented by statistical information.
ことを特徴とする請求項1記載の対話支援装置。 The dialogue support apparatus according to claim 1, further comprising a recognition range adjustment unit that adjusts the recognition range of the speaker and the recognition range of the listener based on one of the standards.
ことを特徴とする請求項1記載の対話支援装置。 The dialogue support apparatus according to claim 1, wherein the speaker or the listener is warned when the difference in the recognition range is not less than an arbitrary standard.
前記話し手の音声を認識し、
前記話し手と前記聞き手との間に誤解や意識のずれを発生させるような曖昧表現単語のリストを格納し、
前記格納した曖昧表現単語リストと前記音声認識結果とを比較して、前記音声認識結果から曖昧表現単語を含む曖昧表現句を検出し、
前記曖昧表現句によって前記聞き手の解釈が曖昧となる曖昧表現対象を前記音声認識結果から検出し、
前記話し手の人物情報と前記聞き手の人物情報を特定し、
前記曖昧表現句と前記曖昧表現対象の組合せに対して、前記人物情報毎に前記曖昧な表現の認知範囲を格納し、
前記格納した前記話し手の人物情報に関する前記曖昧表現句と前記曖昧表現対象に対する前記話し手の認知範囲を求め、また、前記認知範囲記憶部に格納した前記聞き手の人物情報に関する前記曖昧表現句と前記曖昧表現対象に対する前記聞き手の認知範囲を求め、
前記話し手の認知範囲と前記聞き手の認知範囲とを比較して、前記話し手と前記聞き手の認知範囲の差異を求める
ことを特徴とする対話支援方法。 In a dialogue support method that mediates communication between the speaker and the listener,
Recognizing the voice of the speaker,
Storing a list of ambiguous words that cause misunderstandings and misconceptions between the speaker and the listener;
Comparing the stored ambiguous expression word list with the speech recognition result to detect an ambiguous expression phrase including the ambiguous expression word from the speech recognition result;
Detecting an ambiguous expression target in which the interpretation of the listener is ambiguous by the ambiguous expression phrase from the speech recognition result;
Identifying the person information of the speaker and the person information of the listener,
For the combination of the ambiguous expression phrase and the ambiguous expression object, store the recognition range of the ambiguous expression for each person information,
The ambiguous expression phrase related to the stored person information of the speaker and the recognition range of the speaker for the object of the ambiguous expression are obtained, and the ambiguous expression phrase related to the person information of the listener stored in the recognition range storage unit and the ambiguous expression Obtaining the listener's perception range for the expression object;
A dialogue support method, comprising: comparing a recognition range of the speaker with a recognition range of the listener to obtain a difference between the recognition range of the speaker and the listener.
前記話し手の音声を認識する音声認識機能と、
前記話し手と前記聞き手との間に誤解や意識のずれを発生させるような曖昧表現単語のリストを格納した曖昧表現単語リスト記憶機能と、
前記曖昧表現単語リストと前記音声認識結果とを比較して、前記音声認識結果から曖昧表現単語を含む曖昧表現句を検出する曖昧表現検出機能と、
前記曖昧表現句によって前記聞き手の解釈が曖昧となる曖昧表現対象を前記音声認識結果から検出する曖昧表現対象検出機能と、
前記話し手の人物情報と前記聞き手の人物情報を特定する話者特定機能と、
前記曖昧表現句と前記曖昧表現対象の組合せに対して、前記人物情報毎に前記曖昧な表現の認知範囲を格納する認知範囲記憶機能と、
前記認知範囲記憶機能に格納した前記話し手の人物情報に関する前記曖昧表現句と前記曖昧表現対象に対する前記話し手の認知範囲を求め、また、前記認知範囲記憶機能に格納した前記聞き手の人物情報に関する前記曖昧表現句と前記曖昧表現対象に対する前記聞き手の認知範囲を求める認知範囲推定機能と、
前記話し手の認知範囲と前記聞き手の認知範囲とを比較して、前記話し手と前記聞き手の認知範囲の差異を求める認知範囲相違検出機能と、
を実現する
ことを特徴とする対話支援プログラム。 In a dialogue support program that mediates communication between the speaker and the listener,
A voice recognition function for recognizing the voice of the speaker;
An ambiguous expression word list storage function that stores a list of ambiguous expression words that cause misunderstandings and misconceptions between the speaker and the listener;
An ambiguous expression detection function for comparing the ambiguous expression word list with the speech recognition result and detecting an ambiguous expression phrase including the ambiguous expression word from the speech recognition result;
An ambiguous expression object detection function for detecting an ambiguous expression object whose interpretation of the listener is ambiguous by the ambiguous expression phrase from the speech recognition result;
A speaker identification function for identifying the person information of the speaker and the person information of the listener;
A recognition range storage function for storing a recognition range of the ambiguous expression for each person information for the combination of the ambiguous expression phrase and the ambiguous expression target;
The ambiguous expression phrase related to the person information of the speaker stored in the recognition range storage function and the recognition range of the speaker for the object of the ambiguous expression are obtained, and the ambiguous information about the person information of the listener stored in the recognition range storage function A recognition range estimation function for obtaining a recognition range of the listener for the expression phrase and the ambiguous expression target;
A recognition range difference detection function for comparing the speaker's recognition range and the listener's recognition range to obtain a difference between the speaker and the listener's recognition range;
A dialogue support program characterized by
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006259754A JP2008083753A (en) | 2006-09-25 | 2006-09-25 | Dialogue support device and its method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006259754A JP2008083753A (en) | 2006-09-25 | 2006-09-25 | Dialogue support device and its method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008083753A true JP2008083753A (en) | 2008-04-10 |
Family
ID=39354617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006259754A Pending JP2008083753A (en) | 2006-09-25 | 2006-09-25 | Dialogue support device and its method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008083753A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012230614A (en) * | 2011-04-27 | 2012-11-22 | Sony Corp | Information processor, information processing method and program |
JP2013003992A (en) * | 2011-06-21 | 2013-01-07 | Nippon Telegr & Teleph Corp <Ntt> | Qualifier evaluation method, qualifier evaluation device, and its program |
JP2014038565A (en) * | 2012-08-20 | 2014-02-27 | Fuji Xerox Co Ltd | Document management device and program |
-
2006
- 2006-09-25 JP JP2006259754A patent/JP2008083753A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012230614A (en) * | 2011-04-27 | 2012-11-22 | Sony Corp | Information processor, information processing method and program |
JP2013003992A (en) * | 2011-06-21 | 2013-01-07 | Nippon Telegr & Teleph Corp <Ntt> | Qualifier evaluation method, qualifier evaluation device, and its program |
JP2014038565A (en) * | 2012-08-20 | 2014-02-27 | Fuji Xerox Co Ltd | Document management device and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11669683B2 (en) | Speech recognition and summarization | |
US10643614B2 (en) | Promoting voice actions to hotwords | |
US11966494B2 (en) | Threshold-based assembly of remote automated assistant responses | |
EP2801091B1 (en) | Method, apparatus and computer program product for joint use of speech and text-based features for sentiment detection | |
US8527263B2 (en) | Method and system for automatically generating reminders in response to detecting key terms within a communication | |
US8930187B2 (en) | Methods, apparatuses and computer program products for implementing automatic speech recognition and sentiment detection on a device | |
US7797305B2 (en) | Method for intelligent consumer earcons | |
US20220246140A1 (en) | Dynamic and/or context-specific hot words to invoke automated assistant | |
US7844460B2 (en) | Automatic creation of an interactive log based on real-time content | |
US20230033396A1 (en) | Automatic adjustment of muted response setting | |
JP2008083753A (en) | Dialogue support device and its method | |
JP2010002973A (en) | Voice data subject estimation device, and call center using the same | |
WO2019202804A1 (en) | Speech processing device and speech processing method | |
US10841411B1 (en) | Systems and methods for establishing a communications session | |
WO2022213943A1 (en) | Message sending method, message sending apparatus, electronic device, and storage medium | |
US11582174B1 (en) | Messaging content data storage | |
JP2011170622A (en) | Content providing system, content providing method, and content providing program | |
US9043204B2 (en) | Thought recollection and speech assistance device | |
JP7450748B2 (en) | Information display device and information display method | |
JP2008217370A (en) | Profile registration system, method, and program | |
CN114020872A (en) | Man-machine conversation method, device and storage medium | |
JP2024011740A (en) | Information processing device and estimation method | |
CN116842192A (en) | Data relationship graph construction method, device, equipment and storage medium | |
KR20150085900A (en) | Automatic voice guide system |