JP2020170310A - Conversation analysis device, conversation analysis method and conversation analysis program - Google Patents
Conversation analysis device, conversation analysis method and conversation analysis program Download PDFInfo
- Publication number
- JP2020170310A JP2020170310A JP2019070723A JP2019070723A JP2020170310A JP 2020170310 A JP2020170310 A JP 2020170310A JP 2019070723 A JP2019070723 A JP 2019070723A JP 2019070723 A JP2019070723 A JP 2019070723A JP 2020170310 A JP2020170310 A JP 2020170310A
- Authority
- JP
- Japan
- Prior art keywords
- conversation
- voice
- abstraction
- degree
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、会話分析装置等に関する。 The present invention relates to a conversation analyzer and the like.
コールセンターにおけるオペレータと顧客との会話、または、会議の参加者による会話等において、「会話対象(会話内容)」を評価することが求められている。たとえば、オペレータと顧客との会話の対象は、商品に関する問合せや、クレーム対応等となる。会議の参加者による会話の対象は、プロジェクト等となる。 It is required to evaluate the "conversation target (conversation content)" in the conversation between the operator and the customer in the call center, or in the conversation between the participants of the conference. For example, the target of conversation between the operator and the customer is inquiries about products, complaint handling, and the like. The target of conversation by the participants of the conference is the project.
会議中の会話を録音した音声データを基にして、プロジェクトを評価する技術として、以下に説明するような従来技術がある。この従来技術は、設定ワードおよび設定ワードに類似する類似ワードを予め定義する。図18は、設定ワードおよび類似ワードの一例を示す図である。たとえば、設定ワード「遅れている」に対応する類似ワードは「遅延、遅い、・・・」となる。以下の説明では、設定ワードおよび設定ワードに類似する類似ワードをまとめて「設定ワード」と表記する。 As a technique for evaluating a project based on voice data recorded from a conversation during a meeting, there is a conventional technique as described below. This prior art predefines a set word and a similar word similar to the set word. FIG. 18 is a diagram showing an example of a setting word and a similar word. For example, a similar word corresponding to the set word "delayed" is "delayed, slow, ...". In the following description, the setting word and similar words similar to the setting word are collectively referred to as "setting word".
従来技術は、音声データに対して音声認識を行い、音声データに含まれる設定ワードの出現回数をカウントする。従来技術は、設定ワードの出現回数に応じて、リスク評価値を特定し、会話の対象を評価する。たとえば、従来技術では、設定ワードの出現回数が多いほど、リスク評価値を大きくし、このリスク評価値が大きいほど、会話対象(プロジェクト)のリスクが高いと評価する。また、この従来技術では、会議時間に対する最大の発話時間の比率を算出し、比率が大きいほど、リスク評価値を大きくしている。 In the prior art, voice recognition is performed on voice data, and the number of appearances of a set word included in the voice data is counted. In the prior art, the risk evaluation value is specified and the conversation target is evaluated according to the number of occurrences of the set word. For example, in the prior art, the higher the number of occurrences of the set word, the larger the risk evaluation value, and the larger the risk evaluation value, the higher the risk of the conversation target (project). Further, in this conventional technique, the ratio of the maximum utterance time to the meeting time is calculated, and the larger the ratio, the larger the risk evaluation value.
会議の会話において、要求仕様の整理が「遅れている」、「できていない」と発話された場合のリスクと、出力メッセージの決定が「遅れている」、「できていない」と発話された場合のリスクとは、同程度のリスクではない。プロジェクト全体として「要求仕様の整理」に関する作業は数日から数週間かかるものであり、要求仕様の整理が遅れている場合には、大きなリスクである。これに対して、プロジェクト全体として「出力メッセージ」に関する作業は、1時間で解決できるものであり、出力メッセージが送れていても、リスクは小さいといえる。 In the conversation of the meeting, the risk of being told that the requirement specifications were "delayed" or "not completed" and the decision of the output message was "delayed" or "not completed" were spoken. The risk of the case is not the same risk. The work related to "organizing the required specifications" for the entire project takes days to weeks, and if the required specifications are not organized, it is a big risk. On the other hand, the work related to the "output message" can be solved in one hour for the entire project, and even if the output message is sent, the risk is small.
しかしながら、従来技術では、要求仕様の整理に関して、「遅れている」、「できていない」と発話された回数と、出力メッセージに関して、「遅れている」、「できていない」と発話された回数とが同数の場合には、各リスクは同じリスクと評価してしまう。このため、従来技術では、リスク有無を評価できても、会話の対象としてのリスクの程度を適切に評価することができていない。 However, in the prior art, the number of times that "delayed" or "not completed" was spoken regarding the arrangement of required specifications, and the number of times that "delayed" or "not completed" was spoken regarding the output message. If the numbers are the same, each risk is evaluated as the same risk. Therefore, in the prior art, even if the presence or absence of risk can be evaluated, the degree of risk as a conversation target cannot be appropriately evaluated.
1つの側面では、本発明は、会議の発話に基づいた会議の対象としてのリスク判定をおこなうことができる会話分析装置、会話分析方法および会話分析プログラムを提供することを目的とする。 In one aspect, it is an object of the present invention to provide a conversation analyzer, a conversation analysis method, and a conversation analysis program capable of making a risk determination as a subject of a conference based on the utterance of the conference.
第1の案では、会話分析装置は、第1判定部と、音声認識部と、第2判定部と、評価部とを有する。第1判定部は、会話音声を分析して、会話の状態を判定する。音声認識部は、会話音声に対して音声認識を行い、会話音声に含まれる単語を抽出する。第2判定部は、会話音声に含まれる単語を基にして、会話音声における会話内容の抽象度を判定する。評価部は、会話の状態と抽象度とを基にして、会話対象を評価する。 In the first plan, the conversation analyzer has a first determination unit, a voice recognition unit, a second determination unit, and an evaluation unit. The first determination unit analyzes the conversation voice and determines the state of the conversation. The voice recognition unit performs voice recognition on the conversational voice and extracts words included in the conversational voice. The second determination unit determines the degree of abstraction of the conversation content in the conversation voice based on the words included in the conversation voice. The evaluation unit evaluates the conversation target based on the state of conversation and the degree of abstraction.
会議の発話に基づいた会議の対象としてのリスク判定をおこなうことができる。 It is possible to make a risk judgment as a target of a meeting based on the utterance of the meeting.
以下に、本願の開示する会話分析装置、会話分析方法および会話分析プログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。 Hereinafter, examples of the conversation analyzer, the conversation analysis method, and the conversation analysis program disclosed in the present application will be described in detail with reference to the drawings. The present invention is not limited to this embodiment.
図1は、本実施例1に係る会話分析装置の処理を説明するための図である。まず、会話分析装置は、テーブル10Aを基にして、会議Aの会話対象のリスクを評価する場合について説明する。テーブル10Aは、会議Aで発声された単語と、回数との関係を示すテーブルである。 FIG. 1 is a diagram for explaining the processing of the conversation analyzer according to the first embodiment. First, the conversation analyzer will explain the case of evaluating the risk of the conversation target of the conference A based on the table 10A. Table 10A is a table showing the relationship between the words uttered in the conference A and the number of times.
会話分析装置は、テーブル10Aの各単語のうち、設定キーワードに対応する単語を特定し、特定した設定キーワードに対応する単語の出現回数を基にして、「会議の状態」の良し悪しを判定する。たとえば、会話分析装置は、設定キーワードに対応する単語の出現回数が閾値以上である場合、会議の状態が「悪い」と判定し、出現回数が閾値未満である場合、会議の状態が「良い」と判定する。 The conversation analyzer identifies the word corresponding to the set keyword from each word in the table 10A, and determines whether the "meeting state" is good or bad based on the number of occurrences of the word corresponding to the specified set keyword. .. For example, the conversation analyzer determines that the state of the conference is "bad" when the number of occurrences of the word corresponding to the set keyword is equal to or more than the threshold value, and the state of the conference is "good" when the number of occurrences is less than the threshold value. Is determined.
たとえば、設定キーワードを「遅れている」、「できていない」とし、出現回数の閾値を「10」とする。そうすると、会話分析装置は、テーブル10Aのうち、設定キーワードに対応する単語の出現回数「16」が閾値「10」以上となるため、会議Aの状態が悪いと判定する。 For example, the setting keywords are "delayed" and "not completed", and the threshold value of the number of occurrences is "10". Then, the conversation analyzer determines that the state of the conference A is bad because the number of occurrences "16" of the word corresponding to the set keyword in the table 10A becomes the threshold value "10" or more.
続いて、会話分析装置は、テーブル10Aの各単語の抽象度を基にして「会話内容の抽象度」を判定する。各単語の抽象度は、言語コーパスにおける出現頻度によって決定され、出現頻度が高いものほど、抽象度が高くなる。 Subsequently, the conversation analyzer determines the "abstraction level of the conversation content" based on the abstraction level of each word in the table 10A. The degree of abstraction of each word is determined by the frequency of occurrence in the language corpus, and the higher the frequency of occurrence, the higher the degree of abstraction.
たとえば、テーブル10Aでは、抽象度の高い「仕様書」が多く出現している。このため、会話分析装置は、会議Aの会話内容の抽象度が高いと判定する。「会話内容の抽象度が高い」ということは、会議で具体的な点が議論されておらず、抽象的な議論しかなされていないことを意味する。 For example, in Table 10A, many "specifications" with a high degree of abstraction appear. Therefore, the conversation analyzer determines that the conversation content of the conference A has a high degree of abstraction. "Highly abstract conversation content" means that no specific points have been discussed at the meeting, only abstract discussions have been made.
会話分析装置は、会話の状態の判定結果と、会話内容の抽象度の判定結果とを基にして、会議Aの会話対象のリスクを評価する。上記のように、会話の状態が悪く、かつ、会話内容の抽象度が高いため、会議Aにおける会話対象に関しては、意識合わせが求められ、解決しにくいと言える。このため、会話分析装置は、会議Aの会話対象のリスクが「大」であると評価する。 The conversation analyzer evaluates the risk of the conversation target of the conversation A based on the judgment result of the conversation state and the judgment result of the abstraction degree of the conversation content. As described above, since the state of conversation is poor and the degree of abstraction of the conversation content is high, it can be said that it is difficult to solve the conversation target in the conference A because it is required to match the consciousness. Therefore, the conversation analyzer evaluates that the risk of the conversation target of the conference A is “high”.
次に、会話分析装置は、テーブル10Bを基にして、会議Bの会話対象のリスクを評価する場合について説明する。テーブル10Bは、会議Bで発声された単語と、回数との関係を示すテーブルである。 Next, the case where the conversation analyzer evaluates the risk of the conversation target of the conference B based on the table 10B will be described. Table 10B is a table showing the relationship between the words uttered in the conference B and the number of times.
会話分析装置は、テーブル10Bの各単語のうち、設定キーワードに対応する単語を特定し、特定した設定キーワードに対応する単語の出現回数を基にして、「会議の状態」の良し悪しを判定する。たとえば、会話分析装置は、テーブル10Bのうち、設定キーワードに対応する単語の出現回数「16」が閾値「10」以上となるため、会議Bの状態が悪いと判定する。 The conversation analyzer identifies the word corresponding to the set keyword from each word in the table 10B, and determines the quality of the "meeting state" based on the number of occurrences of the word corresponding to the specified set keyword. .. For example, the conversation analyzer determines that the state of the conference B is bad because the number of occurrences "16" of the word corresponding to the set keyword in the table 10B is equal to or more than the threshold value "10".
続いて、会話分析装置は、テーブル10Bの各単語の抽象度を基にして「会話内容の抽象度」を判定する。たとえば、テーブル10Bでは、抽象度の低い「文字コード」が多く出現している。このため、会話分析装置は、会議Bの会話内容の抽象度が低いと判定する。「会話内容の抽象度が低い」ということは、会議で具体的な点が議論されていることを意味する。 Subsequently, the conversation analyzer determines the "abstraction level of the conversation content" based on the abstraction level of each word in the table 10B. For example, in Table 10B, many "character codes" having a low degree of abstraction appear. Therefore, the conversation analyzer determines that the degree of abstraction of the conversation content of the conference B is low. "Low abstraction of conversation content" means that specific points are being discussed at the meeting.
会話分析装置は、会話の状態の判定結果と、会話内容の抽象度の判定結果とを基にして、会議Bの会話対象のリスクを評価する。上記のように、会話の状態は悪いが、会話内容の抽象度が低いため、会議Bにおける会話対象に関しては、論点が明確で意思疎通しやすく解決に結びつきやすいといえる。このため、会話分析装置は、会議Bの会話対象のリスクが「小」であると評価する。 The conversation analyzer evaluates the risk of the conversation target of the conversation B based on the judgment result of the conversation state and the judgment result of the abstraction degree of the conversation content. As described above, although the state of conversation is poor, the degree of abstraction of the conversation content is low, so it can be said that the points of discussion are clear, easy to communicate, and easy to solve with respect to the conversation target in the conference B. Therefore, the conversation analyzer evaluates that the risk of the conversation target of the conference B is “small”.
上記のように、本実施例1に係る会話分析装置は、設定キーワードの出現回数に基づく会議の状態の良し悪しに加えて、会議内容の抽象度を用いて、会話対象のリスクを評価している。たとえば、設定キーワードの出現回数だけでは、会議A、会議Bともにリスクが大であると判定してしまう場合があるが、抽象度に鑑みると、会議Bは抽象度が低いため、具体的な議論が行われており、リスクは小さいと判定することができる。すなわち、会話の対象としてのリスクの程度を適切に評価することができる。 As described above, the conversation analyzer according to the first embodiment evaluates the risk of the conversation target by using the abstraction level of the meeting content in addition to the good or bad state of the meeting based on the number of occurrences of the set keyword. There is. For example, it may be judged that the risk is high in both conference A and conference B only by the number of occurrences of the set keyword. However, considering the degree of abstraction, conference B has a low degree of abstraction, so a concrete discussion It can be judged that the risk is small. That is, the degree of risk as a conversation target can be appropriately evaluated.
次に、本実施例1に係る会話分析装置の構成の一例について説明する。図2は、本実施例1に係る会話分析装置の構成を示す機能ブロック図である。図2に示すように、この会話分析装置100は、第1判定部110と、音声認識部120と、第2判定部130と、評価部140とを有する。
Next, an example of the configuration of the conversation analyzer according to the first embodiment will be described. FIG. 2 is a functional block diagram showing the configuration of the conversation analyzer according to the first embodiment. As shown in FIG. 2, the
記憶部105は、リスク評価値テーブル105aと、抽象度判定テーブル105bとを有する。記憶部105は、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子や、HDD(Hard Disk Drive)などの記憶装置に対応する。
The
図3は、本実施例1に係るリスク評価値テーブルのデータ構造の一例を示す図である。図3に示すように、このリスク評価値テーブル105aは、比率と、リスク評価値とを対応付ける。比率は、後述する第1判定部110により算出されるものである。リスク評価値は、会議の状態の悪さの程度を示す値であり、リスク評価値が大きいほど、会議の状態が悪いことを示す。
FIG. 3 is a diagram showing an example of the data structure of the risk evaluation value table according to the first embodiment. As shown in FIG. 3, the risk evaluation value table 105a associates the ratio with the risk evaluation value. The ratio is calculated by the
図4は、本実施例1に係る抽象度判定テーブルのデータ構造の一例を示す図である。図4に示すように、抽象度判定テーブル105bは、単語と、抽象度とを対応付ける。抽象度は、単語の抽象度の程度を示す値であり、抽象度が大きいほど、単語がより抽象的であることを示す。たとえば、単語の抽象度は、概念DB(Data Base)に基づいて決定される。 FIG. 4 is a diagram showing an example of the data structure of the abstraction degree determination table according to the first embodiment. As shown in FIG. 4, the abstraction degree determination table 105b associates a word with an abstraction degree. The degree of abstraction is a value indicating the degree of abstraction of a word, and the higher the degree of abstraction, the more abstract the word is. For example, the degree of abstraction of a word is determined based on a concept DB (Data Base).
図5は、概念DBの一例を示す図である。概念DB50において、各単語が概念木構造で定義され、概念階層が高いほど、抽象度が高くなる。概念階層「1」が最も高い階層であり、概念階層2、3、4、・・・、9の順に、階層は低くなる。
FIG. 5 is a diagram showing an example of the concept DB. In the
図5において、単語「事象」、「行為」の概念階層は「1」であり、抽象度は「9」となる。単語「要求仕様」の概念階層は「5」であり、抽象度は「5」となる。単語「会員」の概念階層は「6」であり、抽象度は「4」となる。単語「ID」の概念階層は「7」であり、抽象度は「3」となる。単語「ユニバーサルデザイン」の階層は「9」であり、抽象度は「1」となる。 In FIG. 5, the conceptual hierarchy of the words “event” and “action” is “1”, and the degree of abstraction is “9”. The concept hierarchy of the word "requirement specification" is "5", and the degree of abstraction is "5". The conceptual hierarchy of the word "member" is "6" and the abstraction level is "4". The conceptual hierarchy of the word "ID" is "7" and the abstraction level is "3". The hierarchy of the word "universal design" is "9" and the abstraction level is "1".
たとえば、単語「要求仕様」は、概念DB50の「要求仕様」にヒットするため、単語「要求仕様」の抽象度は「5」となる。単語「ユニバーサルデザイン」は、概念DB50の「ユニバーサルデザイン」にヒットするため、単語「ユニバーサルデザイン」の抽象度は「1」となる。
For example, since the word "requirement specification" hits the "requirement specification" of the
なお、単語が複合語の場合には、複合語に含まれる複数の単語のうち、概念階層の最も低い単語を特定し、特定した単語の概念階層に1を加算した概念階層を、複合語の概念階層とする。たとえば、単語(複合語)「会員ID」は、概念DB50の「会員」と「ID」とにヒットする。概念DBの「会員」の概念階層「6」と「ID」の概念階層「7」のうち、低い方の概念階層「7」に1を加算した概念階層「8」を、単語「会員ID」の概念階層として特定し、特定した概念階層「8」の抽象度「2」を、単語「会員ID」の抽象度として特定する。
When the word is a compound word, the word having the lowest conceptual hierarchy among the plurality of words included in the compound word is specified, and the conceptual hierarchy obtained by adding 1 to the conceptual hierarchy of the specified word is the compound word. It is a conceptual hierarchy. For example, the word (compound word) "member ID" hits "member" and "ID" in the
図2の説明に戻る。図2の各処理部110,120,130,140は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などによって実現できる。また、各処理部110〜140は、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などのハードワイヤードロジックによっても実現できる。
Returning to the description of FIG. Each of the
会話分析装置100は、会話音声データ20を図示しない外部装置から取得する。会話音声データ20は、会議の会話を録音した音声データであり、たとえば、時間と音声のパワーとを対応付ける。
The
第1判定部110は、会話音声データ20を分析して、会話の状態を判定する処理部である。たとえば、第1判定部110は、会話音声データ20の音声のパワーを走査して、音声のパワーが閾値Thp以上となる区間を、それぞれ発話区間として特定する。
The
第1判定部110は、会話音声データ20から特定する複数の発話区間のうち、最初の発話区間の開始時刻から、最後の発話区間の終了時刻までの時間を「会議時間」として算出する。
The
第1判定部110は、複数の発話区間の長さを比較して、最長の発話区間を特定する。第1判定部110は、式(1)を基にして、会議時間に対する最長の発話区間の比率を算出する。
The
比率=最長の発話区間/会議時間×100(%)・・・(1) Ratio = longest utterance section / meeting time x 100 (%) ... (1)
第1判定部110は、式(1)に基づいて算出した比率と、リスク評価値テーブル105aとを比較して、リスク評価値を判定する。リスク評価値は、会話の状態の一例である。第1判定部110は、リスク評価値の判定結果を、評価部140に出力する。
The
なお、本実施例1で説明する第1判定部110は、式(1)を基にして、リスク評価値を判定する場合について説明したが、図1で説明したように、設定キーワードの出現回数に基づいて、会話の状態を判定してもよい。たとえば、第1判定部110は、音声認識部120の音声認識結果に含まれる全単語の出現回数の総数に対する設定キーワードの出現回数の比率を算出し、算出した比率と、リスク評価値テーブル105aとを基にして、リスク評価値を判定してもよい。
The
音声認識部120は、会話音声データ20を音声解析し、発声された単語を抽出する処理部である。音声認識部120は、抽出した各単語の情報を、第2判定部130に出力する。音声認識部120は、どのような音声認識技術を利用してもよい。たとえば、会話音声データ20に含まれる声の特徴を基にして、話し言葉を文字列に変換し、単語を定義した辞書情報を基にして、単語を抽出する。
The voice recognition unit 120 is a processing unit that analyzes the
第2判定部130は、音声認識部120の音声認識結果と、抽象度判定テーブル105bとを基にして、会話内容の抽象度を判定する処理部である。第2判定部130は、判定した会話内容の抽象度の情報を、評価部140に出力する。
The
たとえば、第2判定部130は、音声認識結果に含まれる複数の単語と、抽象度判定テーブル105bとを比較して、抽象度判定テーブル105bに登録された各単語について、単語毎の出現回数をカウントする。
For example, the
図6は、本実施例1に係る第2判定部の処理を説明するための図である。図6に示す例では、単語「要求仕様」の出現回数が「6」、単語「会員ID」の出現回数が「1」、単語「出力メッセージ」の出現回数が「1」である。単語「要求仕様」の抽象度が「10」、単語「会員ID」の抽象度が「2」、単語「出力メッセージ」の抽象度が「4」であるため、抽象度の合計は「66」となる。また、各単語の抽象度の平均は「8.25」となる。第2判定部130は、この抽象度の平均を、判定結果の抽象度の情報として、評価部140に出力する。
FIG. 6 is a diagram for explaining the processing of the second determination unit according to the first embodiment. In the example shown in FIG. 6, the number of appearances of the word "requirement specification" is "6", the number of appearances of the word "member ID" is "1", and the number of appearances of the word "output message" is "1". Since the abstraction level of the word "requirement specification" is "10", the abstraction level of the word "member ID" is "2", and the abstraction level of the word "output message" is "4", the total abstraction level is "66". It becomes. The average degree of abstraction of each word is "8.25". The
評価部140は、第1判定部110から出力される会話の状態(リスク評価値)と、第2判定部130から出力される抽象度とを基にして、会話音声データ20に含まれる会話対象のリスクを評価する処理部である。
The
たとえば、評価部140は、リスク評価値と、抽象度とを乗算した値が、基準評価値以上である場合、会話対象のリスクが「リスク大」であると評価する。一方、評価部140は、リスク評価値と、抽象度とを乗算した値が、基準評価値未満である場合、会話対象のリスクが「リスク小」であると評価する。
For example, the
評価部140は、評価結果を図示しない表示装置に出力して表示させてもよいし、ネットワークを介して図示しない外部装置に評価結果を通知してもよい。
The
次に、本実施例1に係る会話分析装置100の処理手順の一例について説明する。図7は、本実施例1に係る会話分析装置の処理手順を示すフローチャートである。図7に示すように、会話分析装置100は、会話音声データ20を取得する(ステップS101)。
Next, an example of the processing procedure of the
会話分析装置100の第1判定部110は、会議時間に対する最長の発話時間の比率と、リスク評価値テーブル105aとを基にして、会話の状態(リスク評価値)を判定する(ステップS102)。
The
会話分析装置100の音声認識部120は、会話音声データ20に対して音声認識を実行し、発声された単語を抽出する(ステップS103)。会話分析装置100の第2判定部130は、発声された単語と、抽象度判定テーブル105bとを基にして、会話内容の抽象度を判定する(ステップS104)。
The voice recognition unit 120 of the
会話分析装置100の評価部140は、会話の状態(リスク評価値)および会話内容の抽象度を基にして、会話対象のリスクを総合的に評価する(ステップS105)。評価部140は、評価結果を通知する(ステップS106)。
The
次に、本実施例1に係る会話分析装置100の効果について説明する。会話分析装置100は、第1判定部110によって判定される会議の状態に加えて、会議内容の抽象度を用いて、会話対象のリスクを評価している。これによって、会話の対象としてのリスクの程度を適切に評価することができる。
Next, the effect of the
ここで、発明の効果の補足として、リスクの大小と、単語の出現頻度との関係について説明する。図8は、発明の効果を補足するための図である。たとえば、単語「中止処理」は、関連文書30a,30b,30cの様々な箇所で出現しており、出現頻度が高く、抽象度が高いと言える。抽象度が高いと、改善すべき点の範囲が広く、リスクは大きいと考えられる。抽象度が高いと、具体性にかけ、「中止処理が具体的に何の中止処理になのか」誤解のリスクもある。
Here, as a supplement to the effect of the invention, the relationship between the magnitude of risk and the frequency of occurrence of words will be described. FIG. 8 is a diagram for supplementing the effect of the invention. For example, the word "stop processing" appears in various places in the
単語「文字コード」は、関連文書30a,30b,30cのうち、特定の関連文書30cにのみ出現しており、出現頻度が低く、抽象度が低いと言える。抽象度が低いと、改善すべき点の範囲が限定的であり、リスクは小さいと考えられる。
It can be said that the word "character code" appears only in a specific related document 30c among the
図8で説明したように、リスク評価値の大きい(会話の状態が悪い)会話の内容の議論の中心が、抽象度の高い単語であれば、リスクの程度も大きいと推定できる。 As explained in FIG. 8, if the center of the discussion of the content of the conversation with a large risk evaluation value (the state of the conversation is bad) is a word with a high degree of abstraction, it can be estimated that the degree of risk is also large.
ところで、本実施例1に係る会話分析装置100の第2判定部130は、概念DB50を基に生成された抽象度判定テーブル105bを基にして、単語の抽象度を特定していたがこれに限定されるものではない。第2判定部130は、単語(あるいは複合語)と、概念DB50とを直接比較して、単語(あるいは複合語)に対応する抽象度を特定してもよい。
By the way, the
図9は、本実施例2に係る会話分析装置の構成を示す機能ブロック図である。図9に示すように、会話分析装置200は、記憶部205と、音声認識部210と、第1判定部220と、第2判定部230と、評価部240と、生成部250とを有する。
FIG. 9 is a functional block diagram showing the configuration of the conversation analyzer according to the second embodiment. As shown in FIG. 9, the
記憶部205は、設定キーワードテーブル205aと、リスク評価値テーブル205bと、抽象度判定テーブル205cとを有する。記憶部205は、RAM、ROM、フラッシュメモリなどの半導体メモリ素子や、HDDなどの記憶装置に対応する。
The
設定キーワードテーブル205aは、会話の状態を判定するための抽出対象となる設定キーワードを定義するテーブルである。図10は、本実施例2に係る設定キーワードテーブルのデータ構造の一例を示す図である。図10に示すように、この設定キーワードテーブル205aには、各種の設定キーワードが登録される。 The setting keyword table 205a is a table that defines setting keywords to be extracted for determining the state of conversation. FIG. 10 is a diagram showing an example of the data structure of the setting keyword table according to the second embodiment. As shown in FIG. 10, various setting keywords are registered in the setting keyword table 205a.
図11は、本実施例2に係るリスク評価値テーブルのデータ構造の一例を示す図である。図11に示すように、このリスク評価値テーブル205bは、出現回数と、リスク評価値とを対応付ける。出現回数は、会話音声データ20の音声認識結果に含まれる単語のうち、設定キーワードの出現回数を示すものである。リスク評価値は、会議の状態の悪さの程度を示す値であり、リスク評価値が大きいほど、会議の状態が悪いことを示す。
FIG. 11 is a diagram showing an example of the data structure of the risk evaluation value table according to the second embodiment. As shown in FIG. 11, the risk evaluation value table 205b associates the number of occurrences with the risk evaluation value. The number of occurrences indicates the number of appearances of the set keyword among the words included in the voice recognition result of the
たとえば、出現回数が「Na以上、Nb未満」の場合、リスク評価値は「0」となる。出現回数が「Nb以上、Nc未満」の場合、リスク評価値は「1」となる。出現回数が「Nc以上」の場合、リスク評価値は「2」となる。ここで、Na、Nb、Ncの値は、予め設定される値であり、大小関係をNa<Nb<Ncとする。なお、2つの閾値Na、Nbを用いて、リスク評価値を特定してもよい。たとえば、Na未満の場合に、リスク評価値を「0」とし、Na以上、Nb未満の場合に、リスク評価値を「1」とし、Nb以上の場合にリスク評価値「2」としてもよい。 For example, when the number of occurrences is "Na or more and less than Nb", the risk evaluation value is "0". When the number of appearances is "Nb or more and less than Nc", the risk evaluation value is "1". When the number of appearances is "Nc or more", the risk evaluation value is "2". Here, the values of Na, Nb, and Nc are preset values, and the magnitude relationship is Na <Nb <Nc. The risk evaluation value may be specified using the two threshold values Na and Nb. For example, if it is less than Na, the risk evaluation value may be "0", if it is Na or more and less than Nb, the risk evaluation value may be "1", and if it is Nb or more, the risk evaluation value may be "2".
抽象度判定テーブル205cは、単語と抽象度とを対応付けるテーブルである。抽象度判定テーブル205cのデータ構造は、図4で説明した抽象度判定テーブル105bのデータ構造と同様である。 The abstraction degree determination table 205c is a table that associates words with the abstraction degree. The data structure of the abstraction degree determination table 205c is the same as the data structure of the abstraction degree determination table 105b described with reference to FIG.
図9の説明に戻る。図9の各処理部210,220,230,240は、CPUやMPUなどによって実現できる。また、各処理部210〜240は、ASICやFPGAなどのハードワイヤードロジックによっても実現できる。
Returning to the description of FIG. Each of the
会話分析装置200は、会話音声データ20を図示しない外部装置から取得する。会話音声データ20は、会議の会話を録音した音声データであり、たとえば、時間と音声のパワーとを対応付ける。
The
音声認識部210は、会話音声データ20を音声解析し、発声された単語を抽出する処理部である。音声認識部210は、抽出した各単語の情報を、第1判定部220および第2判定部230に出力する。音声認識部210は、どのような音声認識技術を利用してもよい。たとえば、会話音声データ20に含まれる声の特徴を基にして、話し言葉を文字列に変換し、単語を定義した辞書情報を基にして、単語を抽出する。
The voice recognition unit 210 is a processing unit that analyzes the
第1判定部220は、会話音声データ20の音声認識結果を基にして、会話の状態を判定する処理部である。たとえば、第1判定部220は、音声認識部210の音声認識結果と、設定キーワードテーブル205aとを基にして、音声認識結果の各単語のうち、設定キーワードの出現回数をカウントする。第1判定部220は、カウントした出現回数と、リスク評価値テーブル205bとを比較して、リスク評価値(会話の状態)を判定する。第1判定部220は、判定結果となる会話の状態を、評価部240に出力する。
The
第2判定部230は、音声認識部210の音声認識結果と、抽象度判定テーブル205cとを基にして、会話内容の抽象度を判定する処理部である。第2判定部230は、判定した会話内容の抽象度の情報を、評価部240に出力する。第2判定部230が、会話内容の抽象度を判定する処理は、実施例1で説明した第2判定部130が、会話内容の抽象度を判定する処理と同様である。
The
評価部240は、第1判定部220から出力される会話の状態(リスク評価値)と、第2判定部230から出力される抽象度とを基にして、会話音声データ20に含まれる会話対象のリスクを評価する処理部である。評価部240がリスクを評価する処理は、評価部140がリスクを評価する処理と同様である。
The
生成部250は、言語コーパス25を取得し、抽象度判定テーブル205cを生成する処理部である。言語コーパス25は、会話対象に関する言語コーパスとする。たとえば、会話対象が会議に関するものであれば、言語コーパス25は、会議に関する言語コーパスとなる。
The
生成部250は、言語コーパス25を形態素解析し、各形態素(以下、単語)の出現頻度を集計する。生成部250は、単語の出現頻度を基にして、抽象度判定テーブル205cの各単語に対する抽象度を算出する。
The
図12は、本実施例2に係る生成部の処理を説明するための図である。図12のテーブル10Cは、単語と、言語コーパス25での単語の出現頻度とを対応付けるテーブルである。生成部250は、式(2)を基にして、各単語の抽象度を算出してもよいし、出現頻度が低い順の順位を抽象度として算出してもよい。
FIG. 12 is a diagram for explaining the processing of the generation unit according to the second embodiment. Table 10C of FIG. 12 is a table for associating words with the frequency of occurrence of words in the
抽象度=log(出現頻度)×2・・・(2) Abstraction = log (frequency of appearance) x 2 ... (2)
たとえば、式(2)を基にして算出した各単語の抽象度を、第1抽象度と表記する。出現頻度の順位を基にして算出した各単語の抽象度を、第2抽象度と表記する。生成部250は、第1抽象度または第2抽象度のいずれか一方の抽象度を、抽象度判定テーブル205cに登録する。
For example, the degree of abstraction of each word calculated based on the equation (2) is expressed as the first degree of abstraction. The degree of abstraction of each word calculated based on the order of appearance frequency is referred to as the second degree of abstraction. The
次に、本実施例2に係る会話分析装置200の処理手順の一例について説明する。図13は、本実施例2に係る会話分析装置の処理手順を示すフローチャートである。図13に示すように、会話分析装置200は、会話音声データ20を取得する(ステップS201)。会話分析装置200は、会話音声データ20に対して音声認識を実行し、発声された単語を抽出する(ステップS202)。
Next, an example of the processing procedure of the
会話分析装置200の第1判定部220は、発声された単語を基にして、設定キーワードの出現回数をカウントし、音声の状態(リスク評価値)を判定する(ステップS203)。
The
会話分析装置200の第2判定部230は、発声された単語と、抽象度判定テーブル205cとを基にして、会話内容の抽象度を判定する(ステップS204)。
The
会話分析装置200の評価部240は、会話の状態(リスク評価値)および会話内容の抽象度を基にして、会話対象のリスクを総合的に評価する(ステップS205)。評価部240は、評価結果を通知する(ステップS206)。
The
次に、本実施例2に係る会話分析装置200の効果について説明する。会話分析装置100は、第1判定部110によって判定される、設定キーワードの出現回数に基づく会議の状態に加えて、会議内容の抽象度を用いて、会話対象のリスクを評価している。これによって、会話の対象としてのリスクの程度を適切に評価することができる。
Next, the effect of the
図14は、本実施例3に係る会話分析装置の構成の一例を示す機能ブロック図である。図14に示すように、この会話分析装置300は、記憶部305と、第1判定部310と、抽出部320と、音声認識部330と、第2判定部340と、評価部350とを有する。
FIG. 14 is a functional block diagram showing an example of the configuration of the conversation analyzer according to the third embodiment. As shown in FIG. 14, the
記憶部305は、リスク評価値テーブル305aと、抽象度判定テーブル305bとを有する。記憶部305は、RAM、ROM、フラッシュメモリなどの半導体メモリ素子や、HDDなどの記憶装置に対応する。
The
リスク評価値テーブル305aは、比率と、リスク評価値とを対応付けるテーブルである。比率およびリスク評価値に関する説明は、実施例1のリスク評価値テーブル105aで行った説明と同様である。リスク評価値テーブル305aのデータ構造は、図3で説明したリスク評価値テーブル105aのデータ構造と同様である。 The risk evaluation value table 305a is a table that associates the ratio with the risk evaluation value. The description of the ratio and the risk evaluation value is the same as the description given in the risk evaluation value table 105a of Example 1. The data structure of the risk evaluation value table 305a is the same as the data structure of the risk evaluation value table 105a described with reference to FIG.
抽象度判定テーブル305bは、単語と、抽象度とを対応付けるテーブルである。抽象度に関する説明は、実施例1の抽象度判定テーブル105bで行った説明と同様である。抽象度判定テーブル305bのデータ構造は、図4で説明した抽象度判定テーブル305bのデータ構造と同様である。 The abstraction degree determination table 305b is a table that associates words with the abstraction degree. The description of the degree of abstraction is the same as the description given in the level of abstraction determination table 105b of the first embodiment. The data structure of the abstraction degree determination table 305b is the same as the data structure of the abstraction degree determination table 305b described with reference to FIG.
会話分析装置300は、会話音声データ20を図示しない外部装置から取得する。会話音声データ20は、会議の会話を録音した音声データであり、たとえば、時間と音声のパワーとを対応付ける。
The
第1判定部310は、会話音声データ20を分析して、会話の状態を判定する処理部である。第1判定部310は、第1判定部110と同様にして、会議時間に対する最長の発話区間の比率を算出する。第1判定部310は、算出した比率と、リスク評価値テーブル305aとを比較して、リスク評価値を判定する。第1判定部110は、リスク評価値(会話の状態)の判定結果を、評価部350に出力する。
The first determination unit 310 is a processing unit that analyzes the
また、第1判定部310は、比率を算出する場合に利用した、「最長の発話区間」の情報を、抽出部320に出力する。
Further, the first determination unit 310 outputs the information of the "longest utterance section" used when calculating the ratio to the
抽出部320は、第1判定部310による会話の状態の判定に寄与した区間を「着目区間」として抽出する処理部である。図15は、本実施例3に係る抽出部の処理を説明するための図である。たとえば、最長の発話区間を、時刻t1〜時刻t2とすると、抽出部320は、時刻t1a〜時刻t2aを着目区間として抽出する。時刻t1aは、t1よりも所定時間(たとえば、5分間)前の時刻である。時刻t2aは、t2よりも所定時間(たとえば、5分間)後の時刻である。抽出部320は、着目区間の情報を、第2判定部340に出力する。
The
音声認識部330は、会話音声データ20を音声解析し、発声された単語を抽出する処理部である。音声認識部330は、抽出した各単語の情報を、第2判定部340に出力する。音声認識部330は、どのような音声認識技術を利用してもよい。たとえば、会話音声データ20に含まれる声の特徴を基にして、話し言葉を文字列に変換し、単語を定義した辞書情報を基にして、単語を抽出する。
The
第2判定部340は、音声認識部330の音声認識結果の単語のうち、着目区間に発声された単語と、抽象度判定テーブル305bとを基にして、会話内容の抽象度を判定する処理部である。第2判定部340は、判定した会話内容の抽象度の情報を、評価部350に出力する。
The
たとえば、第2判定部340は、着目区間に含まれる複数の単語と、抽象度判定テーブル305bとを比較して、抽象度判定テーブル305bに登録された各単語について、単語毎の出現回数をカウントする。第2判定部340は、カウントした単語毎の出現回数を基にして、抽象度を判定する。カウントした単語毎の出現回数を基にして、抽象度を判定する処理は、実施例1で説明した第2判定部130の処理と同様である。
For example, the
評価部350は、第1判定部310から出力される会話の状態(リスク評価値)と、第2判定部340から出力される抽象度とを基にして、会話音声データ20に含まれる会話対象のリスクを評価する処理部である。評価部350がリスクを評価する処理は、評価部140がリスクを評価する処理と同様である。
The
次に、本実施例3に係る会話分析装置300の処理手順の一例について説明する。図16は、本実施例3に係る会話分析装置の処理手順を示すフローチャートである。図16に示すように、会話分析装置300は、会話音声データ20を取得する(ステップS301)。
Next, an example of the processing procedure of the
会話分析装置300の第1判定部110は、会議時間に対する最長の発話時間の比率と、リスク評価値テーブル305aとを基にして、会話の状態(リスク評価値)を判定する(ステップS302)。会話分析装置300の抽出部320は、会話の状態の判定に寄与した着目区間を抽出する(ステップS303)。
The
会話分析装置300の音声認識部330は、会話音声データ20に対して音声認識を実行し、発声された単語を抽出する(ステップS304)。会話分析装置300の第2判定部340は、着目区間中に発声された単語と、抽象度判定テーブル305bとを基にして、会話内容の抽象度を判定する(ステップS305)。
The
会話分析装置300の評価部350は、会話の状態(リスク評価値)および会話内容の抽象度を基にして、会話対象のリスクを総合的に評価する(ステップS306)。評価部350は、評価結果を通知する(ステップS307)。
The
次に、本実施例3に係る会話分析装置300の効果について説明する。会話分析装置300は、会議内容の抽象度を判定する場合に、会議の状態の判定に寄与した着目区間で発声された単語を用いて、抽象度を判定し、会話対象のリスク評価に用いる。これにより、会議の状態に密接に関係する区間の抽象度を用いて、リスクの大小を評価できる。
Next, the effect of the
ところで、本実施例3に係る会話分析装置300は、会話の状態の判定に寄与した着目区間を、最長の発話区間を用いて抽出していたがこれに限定されるものではない。たとえば、会話分析装置300の抽出部320は、設定キーワードが含まれる発話区間を基にして、着目区間を抽出してもよい。この場合には、第1判定部310は、音声認識部330から、音声認識結果を取得し、発話区間に設定キーワードが含まれるか否かを判定し、設定キーワードの含まれる発話区間の情報を、抽出部320に出力する。
By the way, the
次に、本実施例に示した会話分析装置100(200,300)と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。図17は、本実施例に係る会話分析装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。 Next, an example of a computer hardware configuration that realizes the same functions as the conversation analyzer 100 (200, 300) shown in this embodiment will be described. FIG. 17 is a diagram showing an example of a computer hardware configuration that realizes the same functions as the conversation analyzer according to the present embodiment.
図17に示すように、コンピュータ500は、各種演算処理を実行するCPU501と、ユーザからのデータの入力を受け付ける入力装置502と、ディスプレイ503とを有する。また、コンピュータ500は、記憶媒体からプログラム等を読み取る読み取り装置504と、有線または無線ネットワークを介して、外部装置等との間でデータの授受を行うインタフェース装置505とを有する。コンピュータ500は、各種情報を一時記憶するRAM506と、ハードディスク装置507とを有する。そして、各装置501〜507は、バス508に接続される。
As shown in FIG. 17, the
ハードディスク装置507は、音声認識プログラム507a、第1判定プログラム507b、抽出プログラム507c、第2判定プログラム507d、評価プログラム507eを有する。CPU501は、音声認識プログラム507a、第1判定プログラム507b、抽出プログラム507c、第2判定プログラム507d、評価プログラム507eを読み出してRAM506に展開する。
The
音声認識プログラム507aは、音声認識プロセス506aとして機能する。第1判定プログラム507bは、第1判定プロセス506bとして機能する。抽出プログラム507cは、抽出プロセス506cとして機能する。第2判定プログラム507dは、第2判定プロセス506dとして機能する。評価プログラム507eは、評価プロセス506eとして機能する。
The
音声認識プロセス506aの処理は、音声認識部120,210,330の処理に対応する。第1判定プロセス506bの処理は、第1判定部110,220,310の処理に対応する。抽出プロセス506cの処理は、抽出部320の処理に対応する。第2判定プロセス506dの処理は、第2判定部130,230,340の処理に対応する。評価プロセス506eの処理は、評価部140,240,350の処理に対応する。
The processing of the
なお、各プログラム507a〜507eついては、必ずしも最初からハードディスク装置507に記憶させておかなくてもよい。例えば、コンピュータ500に挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ500が各プログラム507a〜507eを読み出して実行するようにしてもよい。
It should be noted that the
以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。 The following additional notes will be further disclosed with respect to the embodiments including each of the above embodiments.
(付記1)会話音声を分析して、会話の状態を判定する第1判定部と、
前記会話音声に対して音声認識を行い、前記会話音声に含まれる単語を抽出する音声認識部と、
前記会話音声に含まれる単語を基にして、前記会話音声における会話内容の抽象度を判定する第2判定部と、
前記会話の状態と前記抽象度とを基にして、前記会話内容を評価する評価部と
を有することを特徴とする会話分析装置。
(Appendix 1) The first judgment unit that analyzes the conversation voice and judges the state of the conversation,
A voice recognition unit that performs voice recognition on the conversation voice and extracts words included in the conversation voice.
A second determination unit that determines the degree of abstraction of the conversation content in the conversation voice based on the words included in the conversation voice.
A conversation analyzer characterized by having an evaluation unit that evaluates the content of the conversation based on the state of the conversation and the degree of abstraction.
(付記2)前記第1判定部は、前記会話音声に含まれる所定の単語の出現回数、または、前記会話音声に含まれる複数の発話時間のうち、最長の発話時間を基にして、前記会話内容のリスクの程度を示す評価値を、前記会話の状態として判定することを特徴とする付記1に記載の会話分析装置。
(Appendix 2) The first determination unit is based on the number of occurrences of a predetermined word included in the conversation voice or the longest utterance time among a plurality of utterance times included in the conversation voice. The conversation analyzer according to
(付記3)前記第2判定部は、言語コーパスに含まれる単語の出現頻度を基にして前記抽象度を判定することを特徴とする付記1または2に記載の会話分析装置。
(Appendix 3) The conversation analyzer according to
(付記4)前記第2判定部は、より抽象的な単語ほど上位の層に位置する概念構造情報と、前記会話音声に含まれる単語とを基にして、前記抽象度を判定することを特徴とする付記2に記載の会話分析装置。
(Appendix 4) The second determination unit is characterized in that the abstraction degree is determined based on the conceptual structure information located in the upper layer as the more abstract words are and the words included in the conversation voice. The conversation analyzer according to
(付記5)前記会話音声の区間のうち、前記会話の状態の判定に寄与した区間を着目区間として抽出する抽出部を更に有し、前記第2判定部は、前記着目区間に含まれる単語を基にして、前記会話内容の抽象度を判定することを特徴とする付記1〜4のいずれか一つに記載の会話分析装置。
(Appendix 5) Among the conversation voice sections, the second determination unit further includes an extraction unit that extracts the section that contributed to the determination of the conversation state as the interest section, and the second determination unit extracts words included in the interest section. The conversation analyzer according to any one of
(付記6)コンピュータが実行する会話分析方法であって、
会話音声を分析して、会話の状態を判定し、
前記会話音声に対して音声認識を行い、前記会話音声に含まれる単語を抽出し、
前記会話音声に含まれる単語を基にして、前記会話音声における会話内容の抽象度を判定し、
前記会話の状態と前記抽象度とを基にして、前記会話内容を評価する
処理を実行することを特徴とする会話分析方法。
(Appendix 6) A conversation analysis method executed by a computer.
Analyze the conversation voice to determine the state of the conversation,
Voice recognition is performed on the conversation voice, and words included in the conversation voice are extracted.
Based on the words contained in the conversation voice, the degree of abstraction of the conversation content in the conversation voice is determined.
A conversation analysis method characterized by executing a process of evaluating the conversation content based on the state of the conversation and the degree of abstraction.
(付記7)前記会話の状態を判定する処理は、前記会話音声に含まれる所定の単語の出現回数、または、前記会話音声に含まれる複数の発話時間のうち、最長の発話時間を基にして、前記会話内容のリスクの程度を示す評価値を、前記会話の状態として判定することを特徴とする付記6に記載の会話分析方法。
(Appendix 7) The process of determining the state of the conversation is based on the number of occurrences of a predetermined word included in the conversation voice or the longest utterance time among a plurality of utterance times included in the conversation voice. The conversation analysis method according to
(付記8)前記抽象度を判定する処理は、言語コーパスに含まれる単語の出現頻度を基にして前記抽象度を判定することを特徴とする付記6または7に記載の会話分析方法。
(Appendix 8) The conversation analysis method according to
(付記9)前記抽象度を判定する処理は、より抽象的な単語ほど上位の層に位置する概念構造情報と、前記会話音声に含まれる単語とを基にして、前記抽象度を判定することを特徴とする付記7に記載の会話分析方法。
(Appendix 9) In the process of determining the degree of abstraction, the degree of abstraction is determined based on the conceptual structure information located in the higher layer of the more abstract words and the words included in the conversation voice. The conversation analysis method according to
(付記10)前記会話音声の区間のうち、前記会話の状態の判定に寄与した区間を着目区間として抽出する処理を更に実行し、前記抽象度を判定する処理は、前記着目区間に含まれる単語を基にして、前記会話内容の抽象度を判定することを特徴とする付記6〜9のいずれか一つに記載の会話分析方法。
(Appendix 10) Of the conversation voice sections, the process of extracting the section that contributed to the determination of the conversation state as the section of interest is further executed, and the process of determining the degree of abstraction is a word included in the section of interest. The conversation analysis method according to any one of
(付記11)コンピュータに、
会話音声を分析して、会話の状態を判定し、
前記会話音声に対して音声認識を行い、前記会話音声に含まれる単語を抽出し、
前記会話音声に含まれる単語を基にして、前記会話音声における会話内容の抽象度を判定し、
前記会話の状態と前記抽象度とを基にして、前記会話内容を評価する
処理を実行させることを特徴とする会話分析プログラム。
(Appendix 11) To the computer
Analyze the conversation voice to determine the state of the conversation,
Voice recognition is performed on the conversation voice, and words included in the conversation voice are extracted.
Based on the words contained in the conversation voice, the degree of abstraction of the conversation content in the conversation voice is determined.
A conversation analysis program characterized by executing a process of evaluating the conversation content based on the state of the conversation and the degree of abstraction.
(付記12)前記会話の状態を判定する処理は、前記会話音声に含まれる所定の単語の出現回数、または、前記会話音声に含まれる複数の発話時間のうち、最長の発話時間を基にして、前記会話内容のリスクの程度を示す評価値を、前記会話の状態として判定することを特徴とする付記11に記載の会話分析プログラム。 (Appendix 12) The process of determining the state of the conversation is based on the number of occurrences of a predetermined word included in the conversation voice or the longest utterance time among a plurality of utterance times included in the conversation voice. The conversation analysis program according to Appendix 11, wherein an evaluation value indicating the degree of risk of the conversation content is determined as the state of the conversation.
(付記13)前記抽象度を判定する処理は、言語コーパスに含まれる単語の出現頻度を基にして前記抽象度を判定することを特徴とする付記11または12に記載の会話分析プログラム。 (Appendix 13) The conversation analysis program according to Appendix 11 or 12, wherein the process of determining the degree of abstraction determines the degree of abstraction based on the frequency of appearance of words included in the language corpus.
(付記14)前記抽象度を判定する処理は、より抽象的な単語ほど上位の層に位置する概念構造情報と、前記会話音声に含まれる単語とを基にして、前記抽象度を判定することを特徴とする付記12に記載の会話分析プログラム。 (Appendix 14) In the process of determining the degree of abstraction, the degree of abstraction is determined based on the conceptual structure information located in the higher layer of the more abstract words and the words included in the conversation voice. The conversation analysis program according to Appendix 12, which comprises the above.
(付記15)前記会話音声の区間のうち、前記会話の状態の判定に寄与した区間を着目区間として抽出する処理を更にコンピュータに実行させ、前記抽象度を判定する処理は、前記着目区間に含まれる単語を基にして、前記会話内容の抽象度を判定することを特徴とする付記11〜14のいずれか一つに記載の会話分析プログラム。 (Appendix 15) Of the conversation voice sections, a process of further executing a process of extracting a section contributing to the determination of the conversation state as a section of interest and determining the degree of abstraction is included in the section of interest. The conversation analysis program according to any one of Supplementary note 11 to 14, wherein the degree of abstraction of the conversation content is determined based on the words.
100,200,300 会話分析装置
105,205,305 記憶部
105a,205b,305a リスク評価値テーブル
105b,205c,305b 抽象度判定テーブル
110,220,310 第1判定部
120,210,330 音声認識部
130,230,340 第2判定部
140,240,350 評価部
205a 設定キーワードテーブル
320 抽出部
100, 200, 300
Claims (7)
前記会話音声に対して音声認識を行い、前記会話音声に含まれる単語を抽出する音声認識部と、
前記会話音声に含まれる単語を基にして、前記会話音声における会話内容の抽象度を判定する第2判定部と、
前記会話の状態と前記抽象度とを基にして、前記会話内容を評価する評価部と
を有することを特徴とする会話分析装置。 The first judgment unit that analyzes the conversation voice and judges the state of the conversation,
A voice recognition unit that performs voice recognition on the conversation voice and extracts words included in the conversation voice.
A second determination unit that determines the degree of abstraction of the conversation content in the conversation voice based on the words included in the conversation voice.
A conversation analyzer characterized by having an evaluation unit that evaluates the content of the conversation based on the state of the conversation and the degree of abstraction.
会話音声を分析して、会話の状態を判定し、
前記会話音声に対して音声認識を行い、前記会話音声に含まれる単語を抽出し、
前記会話音声に含まれる単語を基にして、前記会話音声における会話内容の抽象度を判定し、
前記会話の状態と前記抽象度とを基にして、前記会話内容を評価する
処理を実行することを特徴とする会話分析方法。 A computer-executed conversation analysis method
Analyze the conversation voice to determine the state of the conversation,
Voice recognition is performed on the conversation voice, and words included in the conversation voice are extracted.
Based on the words contained in the conversation voice, the degree of abstraction of the conversation content in the conversation voice is determined.
A conversation analysis method characterized by executing a process of evaluating the conversation content based on the state of the conversation and the degree of abstraction.
会話音声を分析して、会話の状態を判定し、
前記会話音声に対して音声認識を行い、前記会話音声に含まれる単語を抽出し、
前記会話音声に含まれる単語を基にして、前記会話音声における会話内容の抽象度を判定し、
前記会話の状態と前記抽象度とを基にして、前記会話内容を評価する
処理を実行させることを特徴とする会話分析プログラム。 On the computer
Analyze the conversation voice to determine the state of the conversation,
Voice recognition is performed on the conversation voice, and words included in the conversation voice are extracted.
Based on the words contained in the conversation voice, the degree of abstraction of the conversation content in the conversation voice is determined.
A conversation analysis program characterized by executing a process of evaluating the conversation content based on the state of the conversation and the degree of abstraction.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019070723A JP7293816B2 (en) | 2019-04-02 | 2019-04-02 | Conversation analysis device, conversation analysis method and conversation analysis program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019070723A JP7293816B2 (en) | 2019-04-02 | 2019-04-02 | Conversation analysis device, conversation analysis method and conversation analysis program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020170310A true JP2020170310A (en) | 2020-10-15 |
JP7293816B2 JP7293816B2 (en) | 2023-06-20 |
Family
ID=72745971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019070723A Active JP7293816B2 (en) | 2019-04-02 | 2019-04-02 | Conversation analysis device, conversation analysis method and conversation analysis program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7293816B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023033033A1 (en) * | 2021-09-01 | 2023-03-09 | 株式会社リコー | Communication support system, information processing device, communication support method, and program |
WO2024089858A1 (en) * | 2022-10-27 | 2024-05-02 | 日本電信電話株式会社 | Presentation device, presentation method, and presentation program |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008210367A (en) * | 2007-01-29 | 2008-09-11 | Nec Corp | Risk detection system, risk detection method, and program therefor |
JP2018036871A (en) * | 2016-08-31 | 2018-03-08 | 沖電気工業株式会社 | Information processing server, information processing system, terminal device, and program |
-
2019
- 2019-04-02 JP JP2019070723A patent/JP7293816B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008210367A (en) * | 2007-01-29 | 2008-09-11 | Nec Corp | Risk detection system, risk detection method, and program therefor |
JP2018036871A (en) * | 2016-08-31 | 2018-03-08 | 沖電気工業株式会社 | Information processing server, information processing system, terminal device, and program |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023033033A1 (en) * | 2021-09-01 | 2023-03-09 | 株式会社リコー | Communication support system, information processing device, communication support method, and program |
WO2024089858A1 (en) * | 2022-10-27 | 2024-05-02 | 日本電信電話株式会社 | Presentation device, presentation method, and presentation program |
Also Published As
Publication number | Publication date |
---|---|
JP7293816B2 (en) | 2023-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740053B (en) | Sensitive word shielding method and device based on NLP technology | |
JP5245255B2 (en) | Specific expression extraction program, specific expression extraction method, and specific expression extraction apparatus | |
JP2001273283A (en) | Method for identifying language and controlling audio reproducing device and communication device | |
WO2021179701A1 (en) | Multilingual speech recognition method and apparatus, and electronic device | |
JP5468474B2 (en) | Talk script usage status calculation system and talk script usage status calculation program | |
US11170763B2 (en) | Voice interaction system, its processing method, and program therefor | |
JP2020170310A (en) | Conversation analysis device, conversation analysis method and conversation analysis program | |
Glasser | Automatic speech recognition services: Deaf and hard-of-hearing usability | |
KR20200084260A (en) | Electronic apparatus and controlling method thereof | |
CN113240510A (en) | Abnormal user prediction method, device, equipment and storage medium | |
KR102030551B1 (en) | Instant messenger driving apparatus and operating method thereof | |
US9875236B2 (en) | Analysis object determination device and analysis object determination method | |
CN113112992B (en) | Voice recognition method and device, storage medium and server | |
CN115374793B (en) | Voice data processing method based on service scene recognition and related device | |
CN110634480B (en) | Voice dialogue system and model creation device and method thereof | |
KR102464156B1 (en) | Call center service providing apparatus, method, and program for matching a user and an agent vasded on the user`s status and the agent`s status | |
JP2011248409A (en) | Keyword extraction device, method and program thereof | |
JP2010262147A (en) | Response creating device and program | |
JP3875357B2 (en) | Word / collocation classification processing method, collocation extraction method, word / collocation classification processing device, speech recognition device, machine translation device, collocation extraction device, and word / collocation storage medium | |
JP6733901B2 (en) | Psychological analysis device, psychological analysis method, and program | |
JP5457284B2 (en) | Discourse breakdown calculation system and discourse breakdown calculation program | |
US20220207239A1 (en) | Utterance pair acquisition apparatus, utterance pair acquisition method, and program | |
CN111970311A (en) | Session segmentation method, electronic device and computer readable medium | |
CN113051426A (en) | Audio information classification method and device, electronic equipment and storage medium | |
CN113064983A (en) | Semantic detection method and device, computer equipment and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230509 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230522 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7293816 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |