JP2013109635A - 単語重要度算出装置とその方法とプログラム - Google Patents

単語重要度算出装置とその方法とプログラム Download PDF

Info

Publication number
JP2013109635A
JP2013109635A JP2011255102A JP2011255102A JP2013109635A JP 2013109635 A JP2013109635 A JP 2013109635A JP 2011255102 A JP2011255102 A JP 2011255102A JP 2011255102 A JP2011255102 A JP 2011255102A JP 2013109635 A JP2013109635 A JP 2013109635A
Authority
JP
Japan
Prior art keywords
word
importance
words
speaker
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011255102A
Other languages
English (en)
Inventor
Narihisa Nomoto
済央 野本
Hirokazu Masataki
浩和 政瀧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011255102A priority Critical patent/JP2013109635A/ja
Publication of JP2013109635A publication Critical patent/JP2013109635A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】対話における重要単語の出現特性を考慮した単語重要度算出装置とその方法とプログラムを提供する。
【解決手段】この発明の単語重要度算出装置は、形態素解析部と相槌単語同定部と単語重要度算出部とを具備する。形態素解析部は、発話者と受話者の会話に基づく対話テキストを入力として、当該対話テキストを形態素解析して単語毎に分割した発話者側単語列と受話者側単語列を出力する。相槌単語同定部は、形態素解析部が出力する受話者側単語列を入力として、当該受話者側単語列内の相槌単語を同定する。単語重要度算出部は、発話者側単語列と相槌単語を入力として、相槌単語より前所定時間内の単語を抽出し、当該抽出した単語の同一単語の数を集計した値をその同一単語の単語重要度とする。
【選択図】図1

Description

この発明は、対話テキストや対話音声内の単語の重要度を算出する単語重要度算出装置とその方法とプログラムに関する。
従来から、文書中の単語の重要度を求める指標としてTF−IDF値が広く用いられている。TF−IDF値とは、文書中のある単語wが出現する数(TF)を、その単語wを含む文書の数(DF)で除算した値である。つまり、ある文書内で数多く出現していて、且つ他の文書ではあまり出現しない単語ほど重要であるとする指標である。
例えば、コールセンターの応対(通話)を書き起こした文書を対象としてTF−IDF値を簡単に説明する。ある文書D内に「電話」、「解約」という単語がそれぞれ10回、5回出現したとする。一方、「電話」、「解約」の単語を含む文書が全体で100文書、10文書あったと仮定する。
この場合、ある文書Dにおける「電話」と「解約」の重要度I電話とI解約は次式によって算出される。この値がTF−IDF値である。
この場合、ある文書Dにおいては「解約」の方が「電話」よりも重要であると判定される。このように数多く出現する単語でも、他の文書でも共通して出現するような単語の重要度は低くなり、他の文書ではあまり出現しない単語の重要度が高くなるように計算される(非特許文献1)。
Gerard Salton, Christopher Buckly,"TERM-WEIGHTING APPROACHES IN AUTOMATIC TEXT RETRIEVAL" Information Processing & Management Vol.24,No.5,pp.513-523, 1988.
従来のTF−IDF値を用いて重要度を求める方法は、次のような課題がある。対話では言い淀みや言い換えなどで同じ単語が繰り返し発言される場合があり、重要でない単語であっても対話中の出現頻度(TF)が大きくなってしまい適切な重要度が計算できない場合がある。また、対話では省略や指示語(「それ」、「これ」等)への置換が頻繁に生じるため、その対話の話題となっているような重要語であっても、対話中の出現頻度(TF)が小さい値となり適切な重要度が計算できない場合がある。また、文書の数(DF)を計算するためには、事前に大量の文書を収集しておかなければならないため、その収集に要するコストが大きい。
この発明は、このような課題に鑑みてなされたものであり、対話における重要単語の出現特性に着目して単語重要度を算出する単語重要度算出装置とその方法とプログラムを提供することを目的とする。
この発明の単語重要度算出装置は、形態素解析部と、相槌単語同定部と、単語重要度算出部と、を具備する。形態素解析部は、発話者と受話者の会話に基づく対話テキストを入力として、当該対話テキストを形態素解析して単語毎に分割した発話者側単語列と受話者側単語列を出力する。相槌単語同定部は、形態素解析部が出力する受話者側単語列を入力として、当該受話者側単語列内の相槌単語を同定する。単語重要度算出部は、発話者側単語列と相槌単語を入力として、相槌単語より前所定時間内の単語を抽出し、当該抽出した単語の同一単語の数を集計した値をその同一単語の単語重要度とする。
この発明の単語重要度算出装置は、受話者側単語列内の相槌単語より前所定時間内の同一単語を集計して、その数を同一単語の重要度とする。つまり、相槌単語の前所定時間内に数多く出現する単語の重要度を高く算出するものである。よって、言い淀みや言い換え或いは口癖などで重要でない単語であっても対話中の出現頻度(TF)が大きくなる単語の単語重要度を高く算出してしまうことがない。また、省略や指示語に置換されて見かけ上の頻度が少なくなった単語についても適切な単語重要度を算出することができる。また、事前に大量の文書を収集しておく必要がない。
この発明の単語重要度算出装置100の機能構成例を示す図。 単語重要度算出装置100の動作フローを示す図。 時間情報を元に相槌単語を同定する相槌単語同定法の概念を示す図。 コールセンターにおける対話の一例を示す図。 形態素解析部10の出力する発話者側単語列と受話者側単語列の形態素の一例を示す図。 単語重要度算出部40の動作フローを示す図。 相槌単語wからの距離(単語数D)に応じて重要度が変わる例を説明するための発話者側単語列と受話者側単語列を示す図。 この発明の単語重要度算出装置200の機能構成例を示す図。 この発明の単語重要度算出装置300の機能構成例を示す図。
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには
同じ参照符号を付し、説明は繰り返さない。
図1に、この発明の単語重要度算出装置100の機能構成例を示す。図2にその動作フローを示す。単語重要度算出装置100は、形態素解析部10と、相槌単語同定部20と、単語重要度算出部40と、制御部50と、を具備する。単語重要度算出装置100の各部の機能は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
形態素解析部10は、発話者と受話者の会話に基づく対話テキストを入力として、当該対話テキストを形態素解析して単語毎に分割し、その単語毎の開始・終了時間を付した発話者側単語列と受話者側単語列を出力する(ステップS10)。形態素解析とは文を単語単位に分割する技術である。例えば、文を「私は学校を休んだ」とした時に、その文を形態素解析した結果は、「/」で単語毎に区切られて「私/は/学校/を/休んだ」となる。
この実施例で対象としている対話テキストとは、対話の時間構造及び話者情報が保たれているテキストである。対話の時間構造とは各発話の順序関係のことである。対話の話者情報とは各発話がどの話者によって話されたかという情報である。
相槌単語同定部20は、形態素解析部10が出力する受話者側単語列を入力として、当該受話者側単語列内の相槌単語を同定する(ステップS20)。相槌単語を同定する方法としては、予め複数の相槌単語を記憶した相槌単語リスト30を参照して行う方法が考えられる。表1に、図1に破線で示した相槌単語リスト30に記憶される相槌単語の例を示す。
表1は、作表の都合で2列にしただけであり、列に意味はない。相槌単語同定部20は、表1に例示した相槌単語リスト30を参照して受話者側単語列内の相槌単語を同定する。つまり、受話者側単語列に含まれる相槌単語を明らかにする。
なお、相槌単語リスト30を用いずに相槌単語を同定する方法も考えられる。図3に、各発話の開始・終了時間が情報として付与されていた場合に、相手が話している最中に話された発話を相槌単語とする方法の概念図を示す。各発話の開始・終了時間情報を付与するには、入力が音声信号の場合は従来技術の発話区間検出技術(VAD)や音声認識技術を用いる。また、テキストの場合は人手で開始・終了時間を付与する。
図3は、顧客とオペレータの対話の音声波形を示す図である。顧客の発話時間帯CU〜CUとオペレータの発話時間帯OP〜OP15が時系列で並んでいる。ここで、一方が発話中の他方の発話を相槌単語として同定する。顧客が発話している発話区間CUにおいて、顧客が発話中にオペレータが発話を開始して終了するオペレータ側の発話区間OP〜OPが相槌単語として同定される。また、オペレータの発話区間OPにおいて、オペレータが発話中に顧客が発話を開始して終了する顧客側の発話区間CUが相槌単語として同定される。この相槌単語同定方法では、相槌単語リスト30は不要である。
単語重要度算出部40は、形態素解析部10が出力する発話者側単語列と相槌単語同定部20で相槌単語と同定された受話者側単語を入力として、その相槌単語より前所定時間内の単語を抽出し、当該抽出した単語の同一単語の数を集計した値を当該同一単語の単語重要度として出力する(ステップS40)。制御部50は、上記した各機能部間の時系列的な動作等を制御するものである。
最も情報量の少ない対話テキストは、図3の例において、顧客の発話時間帯CUの後にオペレータの発話時間帯OP、次に顧客のCU、オペレータのOP,OP,OP,OP,OP、その後に顧客のCUと続く(CU以降の順序は省略する)順序関係のみが分かっている場合である。
この場合、単語重要度算出部40は、相槌と同定された相槌単語(発話時間帯OP)より前の顧客の発話時間帯CUに含まれる全ての単語、例えば内容語を抽出し、当該抽出した単語の同一単語の数を集計した値を当該同一単語の単語重要度とする。この場合、OP,OP,OPの相槌単語より前所定時間内の単語としては、発話時間帯OPと同じで顧客の発話時間帯CUに含まれる全ての単語が対象となる。
以上説明したように単語重要度算出装置100は、受話者側の単語列から相槌単語を同定し、その相槌単語から一定時間前の同一単語の数を集計して単語重要度とする。つまり、対話を進める中でキーワードやポイントとなるような箇所で、相手話者は「はい」、「あー」、「なるほど」等の相槌を打つ傾向がある。単語重要度算出装置100は、この特性に着目して相槌単語より前所定時間内に出現する同一単語は重要度が高い単語として、その同一単語の数を集計して単語重要度とする。よって、重要でない単語であっても、言い淀みや言い換え又は口癖などで繰り返し発言される単語の高い出現頻度の影響を受けずに単語重要度を算出することができる。また、従来技術のように事前に大量の文書を収集しておく必要がない。また、一対話テキストだけでも単語重要度の算出が可能である。
単語重要度算出装置100の各部の機能を具体例を示して更に詳しく説明する。図4に、対話テキストの具体例を示す。この例は、コールセンターに掛かって来た電話の応対を記録した対話テキストの一部である。よって、発話者は顧客であり、受話者はオペレータである。対話テキストの横方向は経過時間である。顧客の「昨日/こちら/に/電話/して/固定/電話/の/新規/申し込み/を/した/ん/ですけど」の「/」で区切られた部分が、形態素解析された単語である。オペレータは、その顧客の発話に応対して「はい」、「なるほど」と発言している。
図5に、この対話テキストを形態素解析部10で形態素解析した発話者側単語列と受話者側単語列を示す。図5の左側一列目が発話者側単語列であり、発話者側単語列を構成する単語が経過時間順に並べられている。この例ではそれぞれの単語に開始・終了時間が付されている。左側から3列目が受話者側単語列であり、発話者側単語列との時間関係が明確になるように受話者側単語列の単語を同じ時間帯に位置するように表記されている。なお、受話者側単語列の単語にも開始・終了時間が付されているので、図5に示す受話者側単語列の空欄は不要である。
形態素解析部10が出力する受話者側単語列は、相槌単語同定部20に入力される。相槌単語同定部20は、例えば、「はい」、「なるほど」の単語が相槌単語リスト30(表1)に記憶されているか否かを参照して、その単語が記憶されていればその単語を相槌単語として同定する。この例の場合、「はい」、「なるほど」は相槌単語リスト30に記憶されているので、相槌単語であることを示す識別子が付されてそれぞれの開始・終了時間と共に単語重要度算出部40に出力される。この例(図4)の受話者側単語列の単語、「はい」、「なるほど」は両方とも相槌単語であるが、相槌単語以外の受話者側単語も一緒に出力される。
単語重要度算出部40は、形態素解析部10が出力する発話者側単語列と相槌単語同定部20が出力する相槌単語を入力として、相槌単語より前所定時間内の単語を抽出し、当該抽出した単語の同一単語の数を集計した値を当該同一単語の単語重要度として出力する。図6に、単語重要度算出部40の動作フローの一例を示す。図6の動作フローは、内容語のみを対象に単語重要度を算出する例である。内容語とは、事物の名称、性質、動作、状況などを表現する語のことであり、名詞、形容詞、動詞、副詞などに当たる語である。
単語重要度算出部40は動作を開始すると、先ず相槌単語の識別番号になるiをi=1にリセットする(ステップS400)。そして、受話側単語列の経過時間の早い方から単語列を構成する単語が相槌単語か否かを、その単語に付された識別子を見て判断する(ステップS401)。単語が相槌単語の場合(ステップS401のYes)、相槌単語の「はい」はwと付番され、その相槌単語wより前所定時間内の単語、この例では前3個の内容語を抽出する。この例では、相槌単語wより前1個目の内容語である「w11:電話」(ステップS402)と、前2個目の「w12:固定」(ステップS403)と、前3個目の「w13:電話」(ステップS404)の単語が抽出される。
この例における前所定時間とは、3個の内容語が抽出されるまでの時間である。なお、この前所定時間は、固定された一定時間としても良い。
そして、iがインクリメント(ステップS405)されて受話者側単語列内の全ての相槌単語に対応する単語が抽出されるまでステップS401〜ステップS406の処理が繰り返される。この例では、2個目の相槌単語wに対応する内容語である「w21:申し込み」、「w22:新規」、「w23:電話」が抽出される。
そして、抽出した単語の同一単語の数が集計されて、その同一単語の単語重要度となる。この場合、同一単語の「電話」の重要度I電話はI電話=3(w11,w13,w23)、重要度I固定はI固定=1(w12)、重要度I新規はI新規=1(w22)、重要度I申し込みはI申し込み=1(w21)となる。なお、内容語に限定せずに全ての単語を抽出対象にしても良い。
また、相槌単語wからの距離(単語数D若しくは時間D)に応じて重要度が変わるようにしても良い。相槌単語から距離が近ければ近いほど重要度が高く、距離が遠ければ重要度が低く算出されるようにする方法も考えられる。その場合、単語重要度Iを次式に示すように算出する。
図7を参照して、相槌単語wからの距離(単語数D)に応じて重要度が変わる例を説明する。相槌単語wの前に存在する内容語は、「w11:電話」、「w12:固定」、「w13:電話」、「w14:こちら」、「w15:昨日」である。相槌単語wの前に存在する内容語は、「w21:申し込み」、「w22:新規」、「w23:電話」、「w24:固定」、「w25:電話」、「w26:こちら」、「w27:昨日」である。
この場合、例えば単語重要度I電話は式(4)で計算される。
このように相槌単語wからの距離が遠いと重みは小さくなる。なお、各単語の相槌単語wからの距離の逆数の和の対数値を単語重要度Iとしているが、対数を取らない値を単語重要度として用いることも可能である。この場合も、内容語のみを対処にするのではなく機能語を含む全ての単語を対象にしてももちろん良い。
また、相槌単語の種類によって重要度の重みを変えるようにしても良い。例えば「なるほど」は、「はい」などの相槌単語と比べてより対話の重要な箇所で使われる可能性が高い。そこで、例えば表2に示すように相槌単語に応じた重みWを予め決めおき、式(5)に示すように単語重要度Iを求めても良い。
この場合、例えば単語重要度I電話は式(6)で計算される。
以上述べたように、単語重要度Iの算出方法にはいくつかの方法が考えられる。
図8に、この発明の単語重要度算出装置200の機能構成例を示す。単語重要度算出装置200は、上記した単語重要度算出装置100の形態素解析部10に代えて音声認識部210となる点のみが異なる。
音声認識部210は、発話者と受話者の会話に基づく対話音声を入力として、当該対話音声を音声認識して単語単位に分割し、単語毎に開始・終了時間と単語毎の信頼度を付した発話者単語列と受話者単語列を出力する。音声認識部210は従来技術で実現できる。
ここで単語毎の信頼度とは、音声認識処理の過程で算出される認識結果をどれだけ信頼して良いかを表す指標であり、音響的な確からしさを表す音響尤度と言語的な確からしさを表す言語尤度の双方、若しくはその一方で表される値である。
単語重要度算出装置200は、対話音声から単語の重要度を求めることができる。また、音声認識部210が出力する単語毎の信頼度を重要度の算出に用いるようにした変形例も考えられる。その変形例の単語重要度算出装置200′は、単語重要度算出装置200に対して単語重要度算出部240を具備する点で異なる。
単語重要度算出部240は、音声認識部210の出力する発話者側単語列とその単語列の単語の信頼度と、相槌単語同定部20が出力する相槌単語を入力として、相槌単語より前所定時間内の信頼度が所定値以上の単語を抽出し、当該抽出した単語の同一単語の数を集計した値を上記同一単語の単語重要度とする。信頼度が所定値以上の単語を抽出してその単語の中の同一単語の重要度を算出するので単語重要度の精度を高める効果を奏する。
図9に、この発明の単語重要度算出装置300の機能構成例を示す。単語重要度算出装置300は、従来技術で説明したTF−IDF値を算出するTF−IDF算出部360を更に備える点で、単語重要度算出装置100と異なる。また、単語重要度算出装置300の単語重要度算出部340は、TF−IDF値も加味して同一単語の単語重要度を求める点で単語重要度算出部40と異なる。
TF−IDF算出部360は、形態素解析部10が出力する発話者側単語列を入力として、発話者側単語列を構成する各単語毎に、単語出現頻度tf、文書出現頻度dfをもとにTF−IDF値を算出する。ある単語wにおけるTF−IDF値TDwは、次式によって算出される。
TF−IDF値が大きい単語wの重要度は高いと推定される。TF−IDF値を求める方法は従来技術であるのでこれ以上の説明は省略する。
単語重要度算出部340は、実施例1で説明した相槌を用いた単語重要度IをIFとしたときに、このTDも用いて各単語の単語重要度Iを次式で算出する。
ここでαは両重要度を線形結合する重みである。また、式(9)に示すようにTDの値を重みとして用いても良い。
このようにTF−IDF値も加味して同一単語の単語重要度を求めることで、単語重要度の精度を向上させる効果が期待できる。なお、単語重要度算出装置300は、単語重要度算出装置100にTF−IDF算出部360の機能構成を追加する例で説明したが、音声認識部210を用いた単語重要度算出装置200にTF−IDF算出部360の機能構成を追加する構成としても良い。
以上説明した単語重要度算出装置100,200,300は、相槌単語周辺に出現する単語は重要度が高い単語としてその単語重要度を算出する。その単語重要度算出方法によれば、言い淀みや言い換え、口癖など、対話中に話題とは関係なく多く出現する(TF値が大きい)単語の単語重要度が高いと誤判定してしまう問題を解決することができる。また、対話中に何度も出現していなくとも(TF値が大きくなくても)、単語重要度を頑健に算出することが可能となる。また、一対話テキストだけでも単語重要度の算出が可能である。また、単語重要度算出装置100,200に限って言えば、単語wを含む文書の数(DF)を算出するためのコストが不要である。また、DFを利用しなくても、対話における話題後の出現特性を利用することで、話題ではないが頻繁に出現するような単語の重要度が高くなってしまう問題を解決できる。
単語重要度算出装置100,200,300は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現される。
その場合、その処理内容を記述したプログラムは、コンピュータで読み取り可能な任意の記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリがある。より具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部、又は全部をハードウェアとして実現することとしてもよい。

Claims (8)

  1. 発話者と受話者の会話に基づく対話テキストを入力として、当該対話テキストを形態素解析して単語毎に分割した発話者側単語列と受話者側単語列を出力する形態素解析部と、
    上記形態素解析部が出力する上記受話者側単語列を入力として、当該受話者側単語列内の相槌単語を同定する相槌単語同定部と、
    上記発話者側単語列と上記相槌単語を入力として、上記相槌単語より前所定時間内の単語を抽出し、当該抽出した単語の同一単語の数を集計した値を当該同一単語の単語重要度とする単語重要度算出部と、
    を具備する単語重要度算出装置。
  2. 請求項1に記載の単語重要度算出装置において、
    上記単語重要度算出部は、
    上記同一単語の単語重要度を、内容語のみを対象として集計するものであることを特徴とする単語重要度算出装置。
  3. 請求項1又は2に記載した単語重要度算出装置において、
    上記単語重要度算出部は、
    上記発話者側単語列と上記相槌単語を入力として、上記相槌単語より前所定時間内の単語を抽出し、当該抽出した単語内の上記相槌単語からの距離情報が近い同一単語に高い重要度を付けて集計した値を当該同一単語の単語重要度とするものであることを特徴とする単語重要度算出装置。
  4. 発話者と受話者の会話に基づく対話音声を入力として、当該対話音声を音声認識して単語単位に分割し、単語毎の開始・終了時間と単語毎の信頼度を付した発話者側単語列と受話者側単語列を出力する音声認識部と、
    上記音声認識部が出力する上記受話者側単語列を入力として、当該受話者側単語列内の相槌単語を同定する相槌単語同定部と、
    上記発話者側単語列と上記相槌単語を入力として、上記相槌単語より前所定時間内の単語を抽出し、当該抽出した単語の同一単語の数を集計した値を当該同一単語の単語重要度とする単語重要度算出部と、
    を具備する単語重要度算出装置。
  5. 請求項1乃至4の何れかに記載した単語重要度算出装置において、
    更に、形態素解析部又は音声認識部が出力する発話者側単語列を入力として、発話者側単語列を構成する各単語毎に、単語出現頻度tf、文書出現頻度dfをもとにTF−IDF値を算出するTF−IDF算出部を備え、
    上記単語重要度算出部は、上記同一単語毎のTF−IDF値と上記重要度とを用いて上記同一単語毎の単語重要度を算出するものであることを特徴とする単語重要度算出装置。
  6. 請求項1乃至5の何れかに記載した単語重要度算出装置において、
    上記相槌単語同定部は、上記相槌単語に対応した重みを出力し、
    上記単語重要度算出部は、上記重みを考慮した上記同一単語毎の単語重要度を算出する、
    ことを特徴とする単語重要度算出装置。
  7. 発話者と受話者の会話に基づく対話テキストを入力として、当該対話テキストを形態素解析して単語毎に分割した発話者側単語列と受話者側単語列を出力する形態素解析過程と、
    上記形態素解析部が出力する上記受話者側単語列を入力として、当該受話者側単語列内の相槌単語を同定する相槌単語同定過程と、
    上記発話者側単語列と上記相槌単語を入力として、上記相槌単語より前所定時間内の単語を抽出し、当該抽出した単語の同一単語の数を集計した値を当該同一単語の単語重要度とする単語重要度算出過程と、
    を備える単語重要度算出方法。
  8. 請求項1乃至6の何れかに記載した単語重要度算出装置としてコンピュータを機能させるためのプログラム。
JP2011255102A 2011-11-22 2011-11-22 単語重要度算出装置とその方法とプログラム Pending JP2013109635A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011255102A JP2013109635A (ja) 2011-11-22 2011-11-22 単語重要度算出装置とその方法とプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011255102A JP2013109635A (ja) 2011-11-22 2011-11-22 単語重要度算出装置とその方法とプログラム

Publications (1)

Publication Number Publication Date
JP2013109635A true JP2013109635A (ja) 2013-06-06

Family

ID=48706312

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011255102A Pending JP2013109635A (ja) 2011-11-22 2011-11-22 単語重要度算出装置とその方法とプログラム

Country Status (1)

Country Link
JP (1) JP2013109635A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015194115A1 (ja) * 2014-06-16 2015-12-23 パナソニックIpマネジメント株式会社 接客評価装置、接客評価システム及び接客評価方法
KR101792203B1 (ko) * 2015-07-07 2017-11-20 (주)티아이스퀘어 보이스 피싱 위험 단어의 거리 계산을 통한 보이스 피싱 판단 장치 및 방법
JPWO2018173252A1 (ja) * 2017-03-24 2019-11-07 ヤマハ株式会社 重要単語抽出装置、関連会議抽出システム、及び重要単語抽出方法
JP2020042229A (ja) * 2018-09-13 2020-03-19 京セラドキュメントソリューションズ株式会社 議事録生成システムおよび議事録生成プログラム
JP2020071690A (ja) * 2018-10-31 2020-05-07 西日本電信電話株式会社 パターン認識モデル及びパターン学習装置、その生成方法、それを用いたfaqの抽出方法及びパターン認識装置、並びにプログラム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9015A (en) * 1852-06-15 Manufacture of granular fuel from brush-wood and twigs
JPH09305626A (ja) * 1996-05-20 1997-11-28 Toshiba Corp 検索文書作成装置、検索文書記憶メディア、文書検索装置及び文書検索方法
JP2002230571A (ja) * 2001-01-30 2002-08-16 Sharp Corp 画像処理方法および装置、コンピュータ読取可能な記録媒体、ならびにプログラム
JP2005222480A (ja) * 2004-02-09 2005-08-18 Oki Electric Ind Co Ltd 重要語抽出装置、重要語抽出方法、および重要語抽出プログラム
JP2007286097A (ja) * 2006-04-12 2007-11-01 Nippon Telegr & Teleph Corp <Ntt> 音声受付クレーム検出方法、装置、音声受付クレーム検出プログラム、記録媒体
WO2008126355A1 (ja) * 2007-03-29 2008-10-23 Panasonic Corporation キーワード抽出装置
JP2009238199A (ja) * 2008-03-07 2009-10-15 Yahoo Japan Corp 重要語を抽出するサーバ、システム、方法、およびプログラム
JP2011248409A (ja) * 2010-05-21 2011-12-08 Nippon Telegr & Teleph Corp <Ntt> 重要語抽出装置とその方法とプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9015A (en) * 1852-06-15 Manufacture of granular fuel from brush-wood and twigs
JPH09305626A (ja) * 1996-05-20 1997-11-28 Toshiba Corp 検索文書作成装置、検索文書記憶メディア、文書検索装置及び文書検索方法
JP2002230571A (ja) * 2001-01-30 2002-08-16 Sharp Corp 画像処理方法および装置、コンピュータ読取可能な記録媒体、ならびにプログラム
JP2005222480A (ja) * 2004-02-09 2005-08-18 Oki Electric Ind Co Ltd 重要語抽出装置、重要語抽出方法、および重要語抽出プログラム
JP2007286097A (ja) * 2006-04-12 2007-11-01 Nippon Telegr & Teleph Corp <Ntt> 音声受付クレーム検出方法、装置、音声受付クレーム検出プログラム、記録媒体
WO2008126355A1 (ja) * 2007-03-29 2008-10-23 Panasonic Corporation キーワード抽出装置
JP2009238199A (ja) * 2008-03-07 2009-10-15 Yahoo Japan Corp 重要語を抽出するサーバ、システム、方法、およびプログラム
JP2011248409A (ja) * 2010-05-21 2011-12-08 Nippon Telegr & Teleph Corp <Ntt> 重要語抽出装置とその方法とプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015194115A1 (ja) * 2014-06-16 2015-12-23 パナソニックIpマネジメント株式会社 接客評価装置、接客評価システム及び接客評価方法
JP2016021044A (ja) * 2014-06-16 2016-02-04 パナソニックIpマネジメント株式会社 接客評価装置、接客評価システム及び接客評価方法
GB2542959A (en) * 2014-06-16 2017-04-05 Panasonic Ip Man Co Ltd Customer service appraisal device, customer service appraisal system, and customer service appraisal method
KR101792203B1 (ko) * 2015-07-07 2017-11-20 (주)티아이스퀘어 보이스 피싱 위험 단어의 거리 계산을 통한 보이스 피싱 판단 장치 및 방법
JPWO2018173252A1 (ja) * 2017-03-24 2019-11-07 ヤマハ株式会社 重要単語抽出装置、関連会議抽出システム、及び重要単語抽出方法
US11355099B2 (en) 2017-03-24 2022-06-07 Yamaha Corporation Word extraction device, related conference extraction system, and word extraction method
JP2020042229A (ja) * 2018-09-13 2020-03-19 京セラドキュメントソリューションズ株式会社 議事録生成システムおよび議事録生成プログラム
JP7205684B2 (ja) 2018-09-13 2023-01-17 京セラドキュメントソリューションズ株式会社 議事録生成システムおよび議事録生成プログラム
JP2020071690A (ja) * 2018-10-31 2020-05-07 西日本電信電話株式会社 パターン認識モデル及びパターン学習装置、その生成方法、それを用いたfaqの抽出方法及びパターン認識装置、並びにプログラム

Similar Documents

Publication Publication Date Title
US9442910B2 (en) Method and system for adding punctuation to voice files
CN109686383B (zh) 一种语音分析方法、装置及存储介质
CN109087670B (zh) 情绪分析方法、系统、服务器及存储介质
US9483582B2 (en) Identification and verification of factual assertions in natural language
US10140976B2 (en) Discriminative training of automatic speech recognition models with natural language processing dictionary for spoken language processing
US11755841B2 (en) Method for updating a knowledge base of a sentiment analysis system
US9600469B2 (en) Method for detecting grammatical errors, error detection device for same and computer-readable recording medium having method recorded thereon
JP2013145429A (ja) 会話から雑談部分を抽出するための雑談抽出システム、方法、およびプログラム
JP2011242775A (ja) 音声認識エラー予測値としての文法適合度評価のための方法およびシステム
JP7230806B2 (ja) 情報処理装置、及び情報処理方法
JP5506738B2 (ja) 怒り感情推定装置、怒り感情推定方法およびそのプログラム
KR102296878B1 (ko) 외국어 학습평가장치
JP2013109635A (ja) 単語重要度算出装置とその方法とプログラム
KR20100130263A (ko) 음성 인식용 발음사전 확장 장치 및 방법
Junior et al. Coraa: a large corpus of spontaneous and prepared speech manually validated for speech recognition in brazilian portuguese
JP2015099304A (ja) 共感反感箇所検出装置、共感反感箇所検出方法及びプログラム
Tobin et al. Assessing asr model quality on disordered speech using bertscore
JP5466575B2 (ja) 重要語抽出装置とその方法とプログラム
US20220188525A1 (en) Dynamic, real-time collaboration enhancement
JP2008204274A (ja) 会話解析装置および会話解析プログラム
Kantharuban et al. Quantifying the Dialect Gap and its Correlates Across Languages
JP5546565B2 (ja) 単語追加装置、単語追加方法、およびプログラム
JP5986883B2 (ja) 言語モデル評価方法とその装置とプログラム
JP6636374B2 (ja) 登録発話分割装置、話者らしさ評価装置、話者識別装置、登録発話分割方法、話者らしさ評価方法、プログラム
JP2019124897A (ja) 音声解析装置、音声解析システム、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140603

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20141104