JP5623345B2 - 会話データ解析装置、方法、及びプログラム - Google Patents

会話データ解析装置、方法、及びプログラム Download PDF

Info

Publication number
JP5623345B2
JP5623345B2 JP2011135689A JP2011135689A JP5623345B2 JP 5623345 B2 JP5623345 B2 JP 5623345B2 JP 2011135689 A JP2011135689 A JP 2011135689A JP 2011135689 A JP2011135689 A JP 2011135689A JP 5623345 B2 JP5623345 B2 JP 5623345B2
Authority
JP
Japan
Prior art keywords
word
influence
speaker
degree
likelihood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011135689A
Other languages
English (en)
Other versions
JP2013003413A (ja
Inventor
具治 岩田
具治 岩田
渡部 晋治
晋治 渡部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011135689A priority Critical patent/JP5623345B2/ja
Publication of JP2013003413A publication Critical patent/JP2013003413A/ja
Application granted granted Critical
Publication of JP5623345B2 publication Critical patent/JP5623345B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • G06F17/28
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates

Description

本発明は、会話データ解析装置、方法、及びプログラムに係り、特に、誰が何時、何を話したかが記された複数人による会話データを解析する会話データ解析装置、方法、及びプログラムに関する。
従来、会話データ解析として、会話とタスク成功率との関連を調べる手法(例えば、非特許文献1参照)や、会話データから単語使用分布を推定する手法(例えば、非特許文献2参照)が提案されている。
また、会話の際、姿勢や表情、声の大きさなど、会話相手と同じ行動を取り易くなる現象が知られている。この現象は、エントレインメントと呼ばれ、話者間の影響度や信頼度、共感度を表すと言われている。
A. Nenkova and A. Gravano, J. Hirschberg, "High frequency word entrainment in spoken dialogue," ACL ’08: HLT, 169-172, 2008 G. Ji, J. Bilmes, "Multi-speaker language modeling," HLT-NAACL ’04, 133-136, 2004
しかしながら、上記非特許文献1及び2の手法では、話者間の影響度を推定していないため、会話の状態を適切に把握することや、影響力の強い人や影響を受けやすい人を特定すること、信頼、共感関係の強い話者ペアを抽出することなど、上述のエントレインメントと呼ばれる現象を考慮した適切な会話データの解析が行えない、という問題点がある。
本発明は上記問題点に鑑みてなされたものであり、話者間の影響度を適切に推定することができる会話データ解析装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明の会話データ解析装置は、複数の単語からなる単語列、及び各単語を使用した話者を示すデータを含む会話データに基づいて、前記単語列における各単語が使用された時点毎の各話者の該時点以前の単語の使用頻度を示す単語分布を推定する単語分布推定手段と、前記単語分布推定手段により推定された時点毎の各話者の単語分布に基づいて、一方の話者が使用した単語が他方の話者が使用する単語に与える影響を示す話者間の影響度を推定する影響度推定手段と、前記影響度推定手段により推定された話者間の影響度の前記会話データに対する尤もらしさを示す尤度を計算する尤度計算手段と、前記尤度計算手段により計算された尤度が収束するまで、前記影響度の推定及び前記尤度の計算を繰り返すように、前記影響度推定手段及び前記尤度計算手段を制御すると共に、前記尤度が収束したときの前記影響度を出力する制御手段と、を含んで構成されている。
本発明の会話データ解析装置によれば、単語分布推定手段が、複数の単語からなる単語列、及び各単語を使用した話者を示すデータを含む会話データに基づいて、単語列における各単語が使用された時点毎の各話者の該時点以前の単語の使用頻度を示す単語分布を推定する。そして、影響度推定手段が、単語分布推定手段により推定された時点毎の各話者の単語分布に基づいて、一方の話者が使用した単語が他方の話者が使用する単語に与える影響を示す話者間の影響度を推定する。時点毎の各話者の単語分布を用いることで、ある話者が使用した単語が他の話者に使用され易い等の話者間の影響度を推定することができる。
そして、尤度計算手段が、影響度推定手段により推定された話者間の影響度の会話データに対する尤もらしさを示す尤度を計算し、制御手段が、尤度計算手段により計算された尤度が収束するまで、影響度の推定及び尤度の計算を繰り返すように、影響度推定手段及び尤度計算手段を制御すると共に、尤度が収束したときの影響度を出力する。
このように、時点毎の各話者の単語分布を推定して、話者間の影響度を推定し、影響度の会話データに対する尤もらしさを示す尤度が収束するまで影響度の推定を繰り返すことにより、話者間の影響度を適切に推定することができる。
また、前記尤度計算手段は、前記会話データ内において、前記尤度を、前記影響度推定手段により推定された影響度の高い話者が使用した単語の使用頻度が高い場合、または前記影響度の低い話者が使用した単語の使用頻度が低い場合に高くなるように計算することができる。
また、前記影響度推定手段は、前記各話者の単語分布、及び予め設定された初期の影響度または前記影響度推定手段により前回推定された影響度に基づいて、各単語が各話者の影響に依る確率を計算し、該確率及び前記他方の話者が使用する単語に基づいて、前記影響度を推定することができる。
また、本発明の会話データ解析方法は、単語分布推定手段と、影響度推定手段と、尤度計算手段と、制御手段とを含む会話データ解析装置における会話データ解析方法であって、前記単語分布推定手段は、複数の単語からなる単語列、及び各単語を使用した話者を示すデータを含む会話データに基づいて、前記単語列における各単語が使用された時点毎の各話者の該時点以前の単語の使用頻度を示す単語分布を推定し、前記影響度推定手段は、一方の話者が使用した単語が他方の話者が使用する単語に与える影響を示す話者間の影響度を、前記単語分布推定手段により推定された時点毎の各話者の単語分布、及び予め設定された初期の影響度または前回推定した影響度に基づいて計算される各単語が各話者の影響に依る確率と、前記他方の話者が使用する単語と、前記各話者の単語分布とに基づいて推定し、前記尤度計算手段は、前記影響度推定手段により推定された話者間の影響度の前記会話データに対する尤もらしさを示す尤度を、前記影響度推定手段により推定された影響度の高い話者が使用した単語の使用頻度が高い場合、または前記影響度の低い話者が使用した単語の使用頻度が低い場合に高くなるように計算し、前記制御手段は、前記尤度計算手段により計算された尤度が収束するまで、前記影響度の推定及び前記尤度の計算を繰り返すように、前記影響度推定手段及び前記尤度計算手段を制御すると共に、前記尤度が収束したときの前記影響度を出力する方法である。
また、本発明の会話データ解析プログラムは、コンピュータを、上記の会話データ解析装置を構成する各手段として機能させるためのプログラムである。
以上説明したように、本発明の会話データ解析装置、方法、及びプログラムによれば、時点毎の各話者の単語分布を推定して、話者間の影響度を推定し、影響度の会話データに対する尤もらしさを示す尤度が収束するまで影響度の推定を繰り返すことにより、話者間の影響度を適切に推定することができる、という効果が得られる。
本実施の形態の会話データ解析装置の機能的構成を示すブロック図である。 本実施の形態の会話データ解析装置における会話データ解析処理ルーチンの内容を示すフローチャートである。 単語分布集合推定処理ルーチンの内容を示すフローチャートである。 影響度集合推定処理ルーチンの内容を示すフローチャートである。 影響度の推定結果の一例を示す図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
本実施の形態に係る会話データ解析装置10は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する会話データ解析処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図1に示すように、記憶部20、単語分布推定部30、及び影響度推定部40を含んだ構成で表すことができる。
記憶部20には、会話データ(w,s)が記憶される会話データ記憶部21、単語分布集合Pが記憶される単語分布集合記憶部22、及び影響度集合Λが記憶される影響度集合記憶部23が設けられている。
単語分布推定部30は、更に、会話データ読込部31、初期化部32、分布計算部33、及び単語分布集合書込部34を含んだ構成で表すことができ、会話データを用いて、時点毎の各話者の単語分布を推定する。
会話データ読込部31は、会話データ記憶部21に記憶された会話データ(w,s)を読み込む。会話データ(w,s)は、w={w,・・・,w,・・・,w}、s={s,・・・,s,・・・,s}で与えられる。ここで、wはt番目の単語、sはt番目の単語の話者、Tは会話データに含まれる単語数を示し、w∈{1,・・・,W}、s∈{1,・・・,M}であり、Wは会話データに含まれる語彙数、Mは会話データが示す会話に参加している話者数を表す。なお、会話データは、人手で書き起こされたものに限らず、音声認識システムにより自動的に得られたものでもよい。
初期化部32は、後述する分布計算部33で単語分布を計算する際に用いるハイパーパラメータβ、及び影響期間τを初期化する。影響期間τは、現時点からどのくらい前までの発言が、現時点で使用する単語に影響を与えるかを示す期間である。初期化する値としては、例えば、ハイパーパラメータβは、β=10−8のような十分小さな値、影響期間τは、τ=∞のような十分大きな値を設定する。
分布計算部33は、各時点t=1,・・・,Tにおける各話者m=1,・・・,Mの過去の単語分布を推定する。時点tにおける話者mの過去の単語分布は、時点t−1までの話者mの会話データを用いて計算することができる。例えば、話者mの時点tにおける過去に単語wを使用した確率を単語毎に下記(1)式により計算して、時点tにおける話者mの過去の単語分布を計算することができる。
ここで、δ(x,y)は、クロネッカーのデルタであり、もしx=yならば、δ(x,y)=1、そうでなければ0、を表す。(1)式の確率は、過去t−τの時点からt−1の時点までの期間において、話者mが単語wを使用した数に比例する。
単語分布集合書込部34は、分布計算部33により、話者毎及び時点毎に計算された単語分布の集合(単語分布集合P)を、単語分布集合記憶部22に格納する。
影響度推定部40は、更に、単語分布集合読込部41、初期化部42、確率推定部43、影響度推定部44、尤度計算部45、判定部46、及び影響度集合書込部47を含んだ構成で表すことができ、単語分布推定部30によって得られた単語分布集合P、及び会話データ(w,s)を用いて、話者間の影響度を推定する。本実施の形態では、EMアルゴリズムを用いて、話者間の影響度を推定する。
ここで、話者間の影響度を考慮した時点毎の各話者の単語分布は、自分自身も含めた話者間の影響度、各話者の過去の単語分布、及び一般的な単語分布に依存すると考える。例えば、話者nの時点tでの単語wを使用する確率は、下記(2)式で計算することができる。
ここでP(w)は会話や文書集合等における単語の使用頻度を示す一般的な単語分布、λnmは話者mの話者nへの影響度を表す。影響度推定部40では、このλnmを推定する。
単語分布集合読込部41は、単語分布推定部30により推定され、単語分布集合記憶部22に記憶された単語分布集合Pを読み出す。また、会話データ記憶部21に記憶された会話データ(w,s)を読み出す。
初期化部42は、影響度集合Λ={λn=1 、λ={λnmm=0 を、λnm≧0、 Σm=0 λnm=1を満たすようにランダムに初期化する。ここでλn0=1−Σm=1 λnmである。また、後述する影響度推定部44で影響度を計算する際に用いるハイパーパラメータαを初期化する。例えば、α=1とすることができる。
また、一般的な単語分布P(w)も初期化する。例えば、他の会話データや文書データから推定した単語分布を用いてもよいし、P(w)=1/Wのような一様分布を用いてもよい。
確率推定部43は、各時点t=1,・・・,T、及び各話者m=1,・・・,Mについて、t番目の単語が話者mの影響に依る確率を計算する。この確率は、t番目の単語w、t番目の話者sへの話者mの影響度、各話者のt−1時点までの単語分布を入力として取り、これらの値を考慮したものとすることができる。例えば、t番目の単語が話者mの影響に依る確率P(m|t)は、下記(3)式により計算することができる。
影響度推定部44は、話者各々を一方の話者n=1,・・・,Mとした場合、及び他方の話者m=0,・・・,Mとした場合において、話者nへの話者mの影響度(話者間の影響度)λnmを推定する。影響度λnmは、より具体的には、話者mが使用した単語が話者nの使用する単語へ与える影響度である。この影響度は、確率推定部43において計算したt番目の単語が話者mの影響に依る確率P(m|t)、話者nの使用単語、話者mの単語分布を入力として取り、これらの値を考慮したものとすることができる。例えば、影響度λnmは、下記(4)式により計算することができる。
尤度計算部45は、影響度推定部44で推定した影響度がどのくらい会話データを尤もらしく説明できているかを表す尤度を計算する。影響度の高い話者の単語をよく使用している場合、影響度の低い話者の単語をあまり使用していない場合、尤度は高くなる。例えば、下記(5)式を尤度として用いることができる。
ここで、P(w|wt−τ t−1,m=0)≡G(w)は、これまでの会話には依存しない一般的な単語分布を表す。
なお、尤度として、(5)式の第一項のみのものや、事後確率を用いてもよい。
判定部46は、尤度計算部45で計算された尤度が収束したか否かを判定し、収束していなければ、確率推定部43及び影響度推定部44での処理が繰り返されるように制御する。尤度が収束していれば、繰り返し処理を終了する。
尤度が収束したか否かの判定は、例えば、1つ前の影響度推定部44の推定結果に基づいて計算された尤度と、今回の影響度推定部44の推定結果に基づいて計算された尤度との差が、所定の閾値以下となった場合に、尤度が収束したと判定することができる。また、1つ前に推定された影響度と今回推定された影響度との差が、全ての影響度において所定の閾値以下になった場合に、尤度が収束したと判定するようにしてもよい。また、確率推定部43〜尤度計算部45の処理の繰り返し回数が、予め定めた閾値に到達した場合に、尤度が収束したと判定するようにしてもよい。また、計算時間が予め定めた閾値に到達した場合に、尤度が収束したと判定するようにしてもよい。
なお、尤度計算部45及び判定部46が、本発明の制御手段の一例である。
影響度集合書込部47は、判定部46において尤度が収束したと判定されたときの影響度推定部44の推定結果である影響度の集合(影響度集合Λ)を影響度集合記憶部23に格納する。
次に、図2を参照して、本実施の形態の会話データ解析装置10において実行される会話データ解析処理ルーチンについて説明する。
ステップ100で、会話データ記憶部21に記憶された会話データ(w,s)を読み込む。次に、ステップ200で、後述する単語分布集合推定処理を実行し、次に、ステップ300で、後述する影響度集合推定処理を実行する。次に、ステップ400で、推定された影響度集合Λを出力して、処理を終了する。
次に、図3を参照して、単語分布集合推定処理ルーチンについて説明する。
ステップ202で、ハイパーパラメータβ、及び影響期間τを初期化する。例えば、ハイパーパラメータβは、β=10−8のような十分小さな値、影響期間τは、τ=∞のような十分大きな値を、初期値として設定する。
次に、ステップ204で、各時点に対応する変数t、各話者に対応する変数m、及び各単語に対応する変数wに各々1をセットする。
次に、ステップ206で、話者mの時点tにおける過去に単語wを使用した確率P(w|wt−τ t−1,m)を、例えば、(1)式により計算する。
次に、ステップ208で、wがWになったか否かを判定することにより、話者mの時点tにおいて、全ての単語について確率P(w|wt−τ t−1,m)を計算したか否かを判定する。w≠Wの場合には、ステップ210へ移行して、wを1インクリメントしてステップ206へ戻り、次の単語wについての確率を計算する。w=Wの場合には、全ての単語について計算された確率P(w|wt−τ t−1,m)を、話者mの時点における単語分布として得て、ステップ212へ移行する。
ステップ212では、mがMになったか否かを判定することにより、時点tにおける全ての話者についての単語分布を計算したか否かを判定する。m≠Mの場合には、ステップ214へ移行して、wを1にセットすると共に、mを1インクリメントしてステップ206へ戻り、次の話者についての時点tにおける単語分布を計算する。m=Mの場合には、ステップ216へ移行する。
ステップ216では、tがTになったか否かを判定することにより、会話データの全ての時点について、各話者の単語分布を計算したか否かを判定する。t≠Tの場合には、ステップ218へ移行して、m及びwを1にセットすると共に、tを1インクリメントしてステップ206へ戻り、次の時点について、各話者の単語分布を計算する処理を繰り返す。t=Tの場合には、計算された各時点における各話者の単語分布集合Pを単語分布集合記憶部22へ格納して、リターンする。
次に、図4を参照して、影響度集合推定処理ルーチンについて説明する。
ステップ302で、単語分布集合記憶部22に記憶された単語分布集合P、及び会話データ記憶部21に記憶された会話データ(w,s)を読み出す。また、影響度集合Λ={λn=1 、λ={λnmm=0 を、λnm≧0、 Σm=0 λnm=1を満たすようにランダムに初期化する。また、ハイパーパラメータαを、例えば、α=1などの値で初期化する。さらに、一般的な単語分布P(w)も、例えば、他の会話データや文書データから推定した単語分布や、P(w)=1/Wのような一様分布を用いて初期化する。
次に、ステップ304で、時点(何番目の単語か)に対応する変数t、及び各話者に対応する変数mを各々1にセットする。
次に、ステップ306で、t番目の単語w、t番目の単語の話者sへの話者mの影響度、各話者のt−1時点までの単語分布を入力として取り、例えば、(3)式により、t番目の単語が話者mの影響に依る確率P(m|t)を計算する。
次に、ステップ308で、mがMになったか否かを判定することにより、t番目の単語について、全ての話者の影響による確率P(m|t)を計算したか否かを判定する。m≠Mの場合には、ステップ310へ移行して、mを1インクリメントしてステップ306へ戻り、確率P(m|t)の計算を繰り返す。m=Mの場合には、ステップ312へ移行する。
ステップ312では、tがTになったか否かを判定することにより、会話データの全ての時点(全ての単語)について、確率P(m|t)を計算したか否かを判定する。t≠Tの場合には、ステップ314へ移行して、mを1にセットすると共に、tを1インクリメントしてステップ306へ戻り、次の単語について、確率P(m|t)の計算を繰り返す。t=Tの場合には、ステップ316へ移行する。
ステップ316では、一方の話者に対応する変数nに1、他方の話者に対応する変数mに0をセットする。
次に、ステップ318で、上記ステップ306で計算したt番目の単語が話者mの影響に依る確率P(m|t)、話者nの使用単語、話者mの単語分布を用いて、例えば、(4)式により、話者nへの話者mの影響度λnm計算する。
次に、ステップ320で、mがMになったか否かを判定することにより、一方の話者nに対して、話者n自信を含む他の全ての話者を他方の話者とした場合の影響度λnmの計算が終了したか否かを判定する。m≠Mの場合には、ステップ322へ移行して、mを1インクリメントしてステップ318へ戻り、影響度λnmの計算を繰り返す。m=Mの場合には、ステップ324へ移行する。
ステップ324では、nがMになったか否かを判定することにより、全ての話者を一方の話者として、他の話者との影響度を計算したか否かを判定する。n≠Mの場合には、ステップ326へ移行して、mを0にセットすると共に、nを1インクリメントしてステップ318へ戻り、影響度λnmの計算を繰り返す。n=Mの場合には、ステップ328へ移行する。
ステップ328では、上記ステップ318で計算した影響度λnmがどのくらい会話データを尤もらしく説明できているかを表す尤度Lを、例えば、(5)式により計算する。そして、次に、ステップ330で、上記ステップ328で計算した尤度Lが収束したか否かを判定し、収束していない場合には、ステップ304へ戻り、計算された影響度λnmの集合Λを用いて、確率P(m|t)の計算、影響度λnmの計算、尤度Lの計算及び収束判定を繰り返す。尤度Lが収束した場合には、ステップ332へ移行して、直近のステップ318で計算された影響度集合Λを、影響度集合記憶部23へ格納して、リターンする。
以上説明したように、本実施の形態の会話データ解析装置によれば、各時点における各話者の単語分布を推定し、この各話者の単語分布に基づいて話者間の影響度を推定し、この推定処理を、会話データに対する尤もらしさを示す尤度が収束するまで繰り返すことにより、エントレインメントを考慮した会話データの解析に有用な情報となる話者間の影響度を適切に推定することができる。
また、このように適切に推定された話者間の影響度を用いて、例えば、(2)式に示すような各話者の単語分布を推定することにより、話者の単語使用分布(言語モデル)の予測精度を上げることができ、音声認識、自動翻訳、情報検索などの言語処理システムの性能向上に利用することができる。
なお、上記実施の形態では、単語分布推定部において、全時点t=1,・・・,Tの単語分布の推定を行った後に、影響度推定部の確率推定部の処理を行う場合について説明したが、単語分布推定部において、時点tにおける単語分布の推定を行った後に、確率推定部において、時点tにおける確率推定を行い、次に、単語分布推定部において、時点t+1における単語分布の推定を行う、というように、時点毎に単語分布推定及び確率推定を行ってもよい。
また、上記実施の形態では、EMアルゴリズムに基づいて影響度推定を行う場合について説明したが、これに限定されず、例えば、変分ベイズ法やマルコフ連鎖モンテカルロ法などを用いてもよい。
また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
また、上述の会話データ解析装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
ここで、本発明を評価するため、実会話データを用いた実験について説明する。
実会話データとして、日本語の会話データNTT、及び英語の会話データRT07を用いた。それぞれの概要を表1に示す。
セッション数は、会話データを区切り毎に分割した1単位であるセッションの数、話者数の最小及び最大は、セッション毎の話者数の最小値及び最大値、発話数の最小及び最大は、セッション毎の単語数の最小値及び最大値、語彙数は、会話データ全体に含まれる語彙の数である。
上記の会話データに対して、本発明を適用して推定された影響度を図5に示す。図5において、各円は話者を表し、矢印の太さは影響度の大きさを表す(λnm >0.1のみ表示)。一般的に、自分自身からの影響が高く、過去に自分が使用した単語と同じ単語を使用し易い傾向があることが分かる。また、話者間の影響もある。例えば、RT07のセッション7の話者1は、他者への影響度が高く、RT07のセッション6の話者2は他者からの影響を受け易い。このように、本発明を用いることにより、話者間の影響度を適切に推定することができる。
また、定量比較のため、以下の6つの手法の比較を行った。
CC: 話者共通の過去の単語分布、話者共通の影響度
OC: 話者自身のみの過去の単語分布、話者共通の影響度
IC: 話者毎の過去の単語分布、話者共通の影響度
CI: 話者共通の過去の単語分布、話者毎の影響度
OI: 話者自身のみの過去の単語分布、話者毎の影響度
II: 話者毎の単語分布、話者毎の影響度(本発明)
上記各手法による単語の予測誤差を表すパープレキシティを表2に示す。
全てのセッションにおいて、本発明(II)の予測誤差が最も低い。この結果は、本発明を適用して、話者毎の単語分布を用いて話者毎の影響度を推定することにより、より高い精度で各話者の使用単語を予測できることを示す。
10 会話データ解析装置
20 記憶部
21 会話データ記憶部
22 単語分布集合記憶部
23 影響度集合記憶部
30 単語分布推定部
31 会話データ読込部
32 単語分布推定部の初期化部
33 分布計算部
34 単語分布集合書込部
40 影響度推定部
41 単語分布集合読込部
42 影響度推定部の初期化部
43 確率推定部
44 影響度推定部
45 尤度計算部
46 判定部
47 影響度集合書込部

Claims (3)

  1. 複数の単語からなる単語列、及び各単語を使用した話者を示すデータを含む会話データに基づいて、前記単語列における各単語が使用された時点毎の各話者の該時点以前の単語の使用頻度を示す単語分布を推定する単語分布推定手段と、
    一方の話者が使用した単語が他方の話者が使用する単語に与える影響を示す話者間の影響度を、前記単語分布推定手段により推定された時点毎の各話者の単語分布、及び予め設定された初期の影響度または前回推定した影響度に基づいて計算される各単語が各話者の影響に依る確率と、前記他方の話者が使用する単語と、前記各話者の単語分布とに基づいて推定する影響度推定手段と、
    前記影響度推定手段により推定された話者間の影響度の前記会話データに対する尤もらしさを示す尤度を、前記影響度推定手段により推定された影響度の高い話者が使用した単語の使用頻度が高い場合、または前記影響度の低い話者が使用した単語の使用頻度が低い場合に高くなるように計算する尤度計算手段と、
    前記尤度計算手段により計算された尤度が収束するまで、前記影響度の推定及び前記尤度の計算を繰り返すように、前記影響度推定手段及び前記尤度計算手段を制御すると共に、前記尤度が収束したときの前記影響度を出力する制御手段と、
    を含む会話データ解析装置。
  2. 単語分布推定手段と、影響度推定手段と、尤度計算手段と、制御手段とを含む会話データ解析装置における会話データ解析方法であって、
    前記単語分布推定手段は、複数の単語からなる単語列、及び各単語を使用した話者を示すデータを含む会話データに基づいて、前記単語列における各単語が使用された時点毎の各話者の該時点以前の単語の使用頻度を示す単語分布を推定し、
    前記影響度推定手段は、一方の話者が使用した単語が他方の話者が使用する単語に与える影響を示す話者間の影響度を、前記単語分布推定手段により推定された時点毎の各話者の単語分布、及び予め設定された初期の影響度または前回推定した影響度に基づいて計算される各単語が各話者の影響に依る確率と、前記他方の話者が使用する単語と、前記各話者の単語分布とに基づいて推定し、
    前記尤度計算手段は、前記影響度推定手段により推定された話者間の影響度の前記会話データに対する尤もらしさを示す尤度を、前記影響度推定手段により推定された影響度の高い話者が使用した単語の使用頻度が高い場合、または前記影響度の低い話者が使用した単語の使用頻度が低い場合に高くなるように計算し、
    前記制御手段は、前記尤度計算手段により計算された尤度が収束するまで、前記影響度の推定及び前記尤度の計算を繰り返すように、前記影響度推定手段及び前記尤度計算手段を制御すると共に、前記尤度が収束したときの前記影響度を出力する
    会話データ解析方法。
  3. コンピュータを、請求項1または請求項2記載の会話データ解析装置を構成する各手段として機能させるための会話データ解析プログラム。
JP2011135689A 2011-06-17 2011-06-17 会話データ解析装置、方法、及びプログラム Active JP5623345B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011135689A JP5623345B2 (ja) 2011-06-17 2011-06-17 会話データ解析装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011135689A JP5623345B2 (ja) 2011-06-17 2011-06-17 会話データ解析装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2013003413A JP2013003413A (ja) 2013-01-07
JP5623345B2 true JP5623345B2 (ja) 2014-11-12

Family

ID=47672037

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011135689A Active JP5623345B2 (ja) 2011-06-17 2011-06-17 会話データ解析装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5623345B2 (ja)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000078298A (ja) * 1998-08-28 2000-03-14 Fuji Xerox Co Ltd 電子会議システム
JP4003314B2 (ja) * 1998-09-03 2007-11-07 富士ゼロックス株式会社 個人プロファイル管理装置
US7685016B2 (en) * 2003-10-07 2010-03-23 International Business Machines Corporation Method and system for analyzing relationships between persons
US7917587B2 (en) * 2004-07-30 2011-03-29 Microsoft Corporation Method and system for prioritizing communications based on interpersonal relationships
JP2006251898A (ja) * 2005-03-08 2006-09-21 Fuji Xerox Co Ltd 情報処理装置、情報処理方法およびプログラム
US20060248573A1 (en) * 2005-04-28 2006-11-02 Content Guard Holdings, Inc. System and method for developing and using trusted policy based on a social model
JP2007073024A (ja) * 2005-08-11 2007-03-22 Nec Corp マクロ情報生成システム、マクロ情報生成装置、マクロ情報生成方法及びマクロ情報生成プログラム
US7865551B2 (en) * 2006-05-05 2011-01-04 Sony Online Entertainment Llc Determining influential/popular participants in a communication network
CN103354933A (zh) * 2011-02-11 2013-10-16 惠普发展公司,有限责任合伙企业 确定社交网络中的参与者的特性

Also Published As

Publication number Publication date
JP2013003413A (ja) 2013-01-07

Similar Documents

Publication Publication Date Title
US10902845B2 (en) System and methods for adapting neural network acoustic models
JP6420306B2 (ja) スピーチエンドポインティング
JP6444530B2 (ja) 音声言語理解システム
US20200302953A1 (en) Label generation device, model learning device, emotion recognition apparatus, methods therefor, program, and recording medium
CN110085215B (zh) 一种基于生成对抗网络的语言模型数据增强方法
US9747893B2 (en) Unsupervised training method, training apparatus, and training program for an N-gram language model based upon recognition reliability
US8386254B2 (en) Multi-class constrained maximum likelihood linear regression
JP5752060B2 (ja) 情報処理装置、大語彙連続音声認識方法及びプログラム
WO2008001486A1 (fr) Dispositif et programme de traitement vocal, et procédé de traitement vocal
KR102018331B1 (ko) 음성 인식 시스템에서의 발화 검증 장치 및 그 방법
US11605377B2 (en) Dialog device, dialog method, and dialog computer program
JP2010152751A (ja) 統計モデル学習装置、統計モデル学習方法、およびプログラム
US10089977B2 (en) Method for system combination in an audio analytics application
JP6845489B2 (ja) 音声処理装置、音声処理方法、および音声処理プログラム
US20120173240A1 (en) Subspace Speech Adaptation
JP6420198B2 (ja) 閾値推定装置、音声合成装置、その方法及びプログラム
JP2020095732A (ja) 対話行為推定方法、対話行為推定装置及びプログラム
US9892726B1 (en) Class-based discriminative training of speech models
JP5623345B2 (ja) 会話データ解析装置、方法、及びプログラム
JP2010164780A (ja) 音響モデル作成装置、音響モデル作成方法、音響モデル作成プログラム
JP2006235389A (ja) 音響モデル学習方法と音声認識方法およびそれらの方法を用いた装置
JP6000153B2 (ja) フィラー遷移モデル学習装置と言語モデル学習装置とそれらの方法とプログラム
JP5860439B2 (ja) 言語モデル作成装置とその方法、そのプログラムと記録媒体
JP6645995B2 (ja) 有声休止検出装置、その方法、及びプログラム
JP7425194B2 (ja) 実世界のオーディオ訓練データの自動化されたマイニング

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130729

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140715

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140902

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140924

R150 Certificate of patent or registration of utility model

Ref document number: 5623345

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150