JP7164372B2 - Speech recognition system and speech recognition method - Google Patents
Speech recognition system and speech recognition method Download PDFInfo
- Publication number
- JP7164372B2 JP7164372B2 JP2018177526A JP2018177526A JP7164372B2 JP 7164372 B2 JP7164372 B2 JP 7164372B2 JP 2018177526 A JP2018177526 A JP 2018177526A JP 2018177526 A JP2018177526 A JP 2018177526A JP 7164372 B2 JP7164372 B2 JP 7164372B2
- Authority
- JP
- Japan
- Prior art keywords
- load
- customer
- speech
- operator
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、音声認識システム及び音声認識方法に関する。 The present invention relates to a speech recognition system and a speech recognition method.
コールセンタやオフィスにおいて、通話先の顧客とオペレータの通話内容を録音して、後日のトラブルに備えたり、内容をレビューしたりすることが行われている。録音データは、音声認識してテキストデータに変換することにより、コンピュータシステムで検索したり表示あるいは印刷できるようになり、業務データとしてより有効活用することができる。 In call centers and offices, it is common practice to record the contents of conversations between a customer and an operator to prepare for future troubles and to review the contents. Recorded data can be retrieved, displayed or printed by a computer system by recognizing voice and converting it into text data, and can be used more effectively as business data.
コールセンタにおける音声認識の一般的な活用は、オペレータの発話内容から取得した認識結果による応対品質改善と、顧客の発話内容から取得した認識結果によるカスタマーサービス向上が主である。 General use of speech recognition in call centers is mainly to improve response quality by recognition results obtained from operator's utterances and to improve customer service by recognition results obtained from customer's utterances.
一方で、コールセンタ業務に従事するオペレータの離職率は高い傾向にあり、オペレータの離職率を抑えることが運用コストを下げることに繋がる。オペレータの離職理由のひとつとして、オペレータが電話対応時に顧客との通話から受ける負荷が挙げられる。 On the other hand, the turnover rate of operators engaged in call center operations tends to be high, and suppressing the turnover rate of operators leads to lower operating costs. One of the reasons why operators leave their jobs is the burden that operators receive from calls with customers when answering telephone calls.
オペレータの負荷状態を把握する技術として、例えば、特許文献1がある。特許文献1では、顧客からの問い合わせに対するオペレータの対応時間とオペレータに対するヒアリング等に基づいてオペレータの負荷状態を把握している。
For example, Japanese Patent Laid-Open No. 2002-100002 discloses a technique for grasping the load state of an operator. In
特許文献1では、オペレータの負荷状態の把握は、オペレータの管理者がオペレータの対応時間に基づいてオペレータへのヒアリング等を元に行っている。この方法では、オペレータの潜在的な負荷状態の把握は困難である。その理由は、特許文献1では、顧客の発話に着目することなく、オペレータの発話に着目してオペレータの負荷状態の把握しているからである。
In Japanese Unexamined Patent Application Publication No. 2002-100000, the load state of the operator is grasped by the manager of the operator based on interviews with the operator based on the response time of the operator. With this method, it is difficult to grasp the potential load state of the operator. The reason for this is that, in
本発明の目的は、音声認識システムにおいて、顧客の発話内容に着目することによりオペレータの潜在的な負荷状態を把握することにある。 SUMMARY OF THE INVENTION It is an object of the present invention to grasp the latent load state of an operator by paying attention to the content of a customer's utterance in a voice recognition system.
本発明の一態様の音声認識システムは、顧客とオペレータと通話内容の内、前記顧客の発話内容と前記オペレータの発話内容とを別々に録音する通話録音装置と、前記通話録音装置に録音された前記顧客の発話内容と前記オペレータの発話内容に対して音声認識を行う音声認識装置と、前記音声認識装置により音声認識された前記顧客の発話内容の音声認識結果に基づいて、前記オペレータが前記顧客から受けた負荷状態を評価して評価結果を求める認識結果管理装置と、前記認識結果管理装置により求めた前記負荷状態の前記評価結果を負荷状態画面に表示する管理者端末を有することを特徴とする。 A voice recognition system according to one aspect of the present invention includes a call recording device for separately recording the customer's utterance content and the operator's utterance content among the call content between a customer and an operator, and a voice recognition device for performing voice recognition on the content of the customer's utterance and the content of the utterance of the operator; and a manager terminal for displaying the evaluation result of the load state obtained by the recognition result management device on a load state screen. do.
本発明の一態様の音声認識方法は、顧客と複数のオペレータと通話内容の内、前記顧客の発話内容と前記オペレータの発話内容とを別々に録音し、録音された前記顧客の発話内容と前記オペレータの発話内容に対して音声認識を行い、音声認識された前記顧客の発話内容の音声認識結果に基づいて、前記オペレータが前記顧客から受けた負荷状態を評価して評価結果を前記オペレータごとに求め、前記負荷状態の前記評価結果を負荷状態画面に前記オペレータごとに表示することを特徴とする。 A speech recognition method according to one aspect of the present invention includes recording separately the customer's utterance content and the operator's utterance content among the call content between a customer and a plurality of operators, and recording the customer's utterance content and the operator's utterance content separately. Speech recognition is performed on the utterance content of the operator, and based on the speech recognition result of the speech-recognized utterance content of the customer, the operator evaluates the load state received from the customer, and the evaluation result is provided for each operator. and displaying the evaluation result of the load state on the load state screen for each operator.
本発明の一態様によれば、音声認識システムにおいて、顧客の発話内容に着目することによりオペレータの潜在的な負荷状態を把握することができる。 According to one aspect of the present invention, in the speech recognition system, it is possible to grasp the potential load state of the operator by paying attention to the content of the customer's utterance.
以下、図面を参照して、実施例について説明する。 An embodiment will be described below with reference to the drawings.
最初に、図1を参照して、コールセンタシステムについて説明する。
コールセンタにおける音声認識システムでは、一般的に着番号等のCTI(Computer Telephony Integration)情報を音声認識エンジン(辞書)に紐付けて、音声認識を行う。CTI情報は、言語を特定することができる情報である。ここで、CTIとは、電話とコンピューターを連携して利用する技術の総称をいう。コールセンタなどで、顧客の電話番号から顧客情報をデータベースに照会したり、自動発信や自動転送したりする技術である。
First, a call center system will be described with reference to FIG.
A speech recognition system in a call center generally associates CTI (Computer Telephony Integration) information such as a called party number with a speech recognition engine (dictionary) to perform speech recognition. CTI information is information that can identify a language. Here, CTI is a general term for technologies that utilize telephones and computers in cooperation. This is a technology that enables call centers, etc., to look up customer information in a database from the customer's telephone number, and to perform automatic dialing and automatic transfer.
図1に示されるように、コールセンタシステムは、ネットワーク100を介して、IP-PBX(Internet Protocol-Private Branch eXchange:IP回線対応構内交換機)装置101、CTI装置102、音声通話処理システム103、オペレータ用端末104及び管理者用端末105が接続されて構成されている。
As shown in FIG. 1, the call center system includes IP-PBX (Internet Protocol-Private Branch eXchange: IP line compatible private branch exchange)
IP-PBX装置101は、顧客106の通話端末107からの呼を受けて、IP網と公衆網108のプロトコル変換、発着信の呼制御などを行う。CTI装置102は、IP-PBX装置101から通話情報(着番号等)を取得して、音声通話処理システム103に送信する。
The IP-
オペレータ用端末104は、オペレータ109がオペレータ業務に使うオペレータPC端末である。オペレータ109は、通話端末(IP電話機)110を介して顧客106の通話端末107と公衆網108を介して通話を行う。管理者用端末105は、認識結果管理装置115により求めた負荷状態の評価結果を負荷状態画面に表示する。
The
顧客106の通話端末107から公衆網108を介して接続されるIP-PBX装置101が、ネットワーク100を介して通話端末(IP電話機)110と接続して通話を行う。オペレータ109は、通話端末(IP電話機)110から電話操作をすることができ、顧客106からの着信があると、顧客106とオペレータ109は通話状態になる。
An IP-
音声通話処理システム103は、通話録音情報管理装置111、通話録音装置112、音声認識制御装置113、音声認識装置114、認識結果管理装置115を有する。
The voice
通話録音情報管理装置111は、CTI情報や録音情報を蓄積する機能を持つ。
通話録音装置112は、ミラーリングした通話音声を取得して録音する機能および通話録音情管理装置111に送信する機能を持つ。
The call recording
The
通話録音装置112は、通話端末107でやりとりされる通話のデータストリームを、IP-PBX装置101を介して録音データとして録音する装置である。通話端末107での通話は、通話録音装置112に送られて録音ファイルとして保存される。
The
具体的には、オペレータ109は、通話端末(IP電話機)110を使用し、IP-PBX装置101を介して公衆網108の顧客106と会話する。オペレータ109の音声(RTPパケット)は、通話端末(IP電話機)110から公衆網108へ送信される。顧客106の音声(RTPパケット)は、公衆網108から通話端末(IP電話機)110へ送信される。RTPパケットの送信元がIP電話機110であればオペレータ109の発話、RTPパケットの送信元が公衆網108であれば顧客106の発話と区別する。これにより、通話録音装置112は、顧客106の音声とオペレータ109の音声を別々に録音し、それぞれの音声のみの音声ファイルを作成する。具体的には、顧客106の音声は、顧客用音声ファイルに録音され、オペレータ109の音声は、オペレー用音声ファイルに録音される。
Specifically,
通話録音装置112は、ミラーリングした通話音声を取得して録音して音声認識装置114に送信する。通話録音情報管理装置111は、通話情報と録音情報を対応付けて管理するためのサーバである。音声認識装置114は、音声認識を実行する音声認識エンジンを持ち、認識結果を認識結果管理装置115に送信する。音声認識装置114は、録音データを音声認識エンジンによりテキストデータに変換する。
The
音声認識制御装置113は、音声認識装置114へ認識の実行を指示する機能を持つ。認識結果管理装置115は、音声認識装置114が出力するテキストデータをデータベースに格納し音声認識結果を蓄積して、その認識結果を出力する。
The voice
認識結果管理装置115は、負荷状態を数値化するための評価値を定義した負荷評価値テーブル(T-1)(図2参照)と、オペレータ109の負荷となる単語を規定した負荷単語テーブル(T-2)(図3参照)、言語情報と非言語情報からオペレータの負荷状態を評価した評価結果を格納する負荷状態テーブル(T-3)(図4参照)を有する。
The recognition
負荷評価値テーブル(T-1)及び負荷単語テーブル(T-2)は、管理者が評価値を設定する。具体的には、認識結果管理装置115は、管理者に対して、管理者用端末105に評価値設定用画面を提供して表示する。管理者は、評価値設定用画面を介して評価値を設定する。
An administrator sets evaluation values in the load evaluation value table (T-1) and the load word table (T-2). Specifically, the recognition
図2を参照して、負荷評価値テーブル(T-1)の構成について説明する。
図2に示すように、「負荷評価値テーブル」(T-1)には、顧客の発話内容から抽出した「音量」「話速」「単語」の負荷算出における基準値(評価値)をオペレータごと設定する。
The configuration of the load evaluation value table (T-1) will be described with reference to FIG.
As shown in FIG. 2, in the "load evaluation value table" (T-1), reference values (evaluation values) for load calculation of "volume", "speed of speech", and "words" extracted from the customer's utterance set each.
例えば、図2に示すように、オペレータAに対しては、「音量」:40、「話速」:“d”、「単語」:10が設定される。オペレータBに対しては、「音量」:50、「話速」:“50”、「単語」:“d”が設定される。オペレータCに対しては、「音量」:“d”、「話速」:“20”、「単語」:“d”が設定される。また、“default”として、「音量」:30、「話速」:“40”、「単語」:“5”が設定される。ここで、“d”は、“default”の設定値を使用することを意味する。例えば、オペレータCに着目すると、「音量」として“d”が設定されているので、“default”の「音量」:30が提供され「音量」:30が設定される。 For example, as shown in FIG. 2, for operator A, "volume": 40, "speech rate": "d", and "word": 10 are set. For operator B, "volume": 50, "speech rate": "50", and "word": "d" are set. For operator C, "volume": "d", "speech rate": "20", and "word": "d" are set. Also, as "default", "volume": 30, "speech rate": "40", and "word": "5" are set. Here, "d" means to use the "default" setting. For example, focusing on operator C, since "d" is set as "volume", "default" "volume": 30 is provided and "volume": 30 is set.
ここで、図5を参照して、「負荷評価値テーブル」(T-1)で定義された「音量」、「話速」、「単語」の基準値(評価値)の仕様について説明する。
図5に示すように、音量は、顧客の声の大きさを意味し、単位は「dB」である。話速は、顧客の1秒間に含まれる音節の件数を意味し、単位は「word/sec」である。単語は、負荷単語が顧客の発話内容に含まれる件数を意味し、単位は「件」である。「負荷評価観点」は、音量に関しては大きい程、負荷は増える。話速に関しては大きい程、負荷は増える。単語に関しては、大きい程、負荷は増える。
Here, with reference to FIG. 5, the specifications of the reference values (evaluation values) of "volume", "speech speed", and "word" defined in the "load evaluation value table" (T-1) will be described.
As shown in FIG. 5, the volume means the loudness of the customer's voice, and the unit is "dB". The speech rate means the number of syllables included in one second of the customer, and the unit is "word/sec". A word means the number of times a load word is included in the customer's utterance content, and the unit is "case". In terms of "load evaluation", the greater the sound volume, the greater the load. As the speech speed increases, the load increases. As for words, the larger the word, the greater the load.
図6を参照して、オペレータ109に単語、音量、話速の評価値それぞれ設定した例について説明する。
図6に示すように、オペレータAに対しては、「音量」:40、「話速」:2、「単語」:10が設定される。オペレータBに対しては、「音量」:“d”、「話速」:“d”、「単語」:“5”が設定される。オペレータCに対しては、「音量」:“d”、「話速」:“20”、「単語」:“d”が設定される。また、オペレータ“default”に対しては、「音量」:30、「話速」:“10”、「単語」:“2”が設定される。
An example in which the
As shown in FIG. 6, for operator A, "volume": 40, "speech rate": 2, and "word": 10 are set. For operator B, "volume": "d", "speech rate": "d", and "word": "5" are set. For operator C, "volume": "d", "speech rate": "20", and "word": "d" are set. For the operator "default", "volume": 30, "speech rate": "10", and "word": "2" are set.
図6の各パラメータについて、”d”を設定している項目については、オペレータ“default”に設定した値を用いる。例えば、オペレータBの音量は”d”が設定されているので、“default”から値を取得して30を評価値とする。また、オペレータBの話速は”d”が設定されているので、“default”から値を取得して10を評価値とする。 For each parameter in FIG. 6, the value set in the operator "default" is used for the item for which "d" is set. For example, since "d" is set for the volume of operator B, the value is acquired from "default" and 30 is set as the evaluation value. Also, since "d" is set for the speech rate of operator B, the value is obtained from "default" and 10 is set as the evaluation value.
図3を参照して、「負荷単語テーブル」(T-2)の構成について説明する。
図3に示すように、「負荷単語テーブル」(T-2)には、オペレータにとって負荷となる負荷単語を設定する。例えば、負荷単語として、“AAAA”、“BBBB”、“ZZZZ“が設定される。
The configuration of the "load word table" (T-2) will be described with reference to FIG.
As shown in FIG. 3, in the "load word table" (T-2), load words that are burdensome to the operator are set. For example, "AAAA", "BBBB", and "ZZZZ" are set as load words.
図7を参照して、負荷単語の設定例について説明する。
図7に示すように、負荷単語の設定例は、例えば、「上司を呼んでくれ」(No.1)、「他の人に代わって」(No.2)等である。
A setting example of load words will be described with reference to FIG.
As shown in FIG. 7, setting examples of load words are, for example, "Please call my boss" (No. 1), "On behalf of another person" (No. 2), and the like.
図4を参照して、負荷状態テーブル(T-3)の構成について説明する。
図4に示すように、負荷状態テーブル(T-3)では、オペレータA、B、Cごとに通話ID、外線発信番号、通話終了時間、評価結果が定義されている。ここで、評価結果として、音量、話速、単語を定義する。音量、話速、単語の評価結果は、“負荷”と“平常”で表す。
The configuration of the load state table (T-3) will be described with reference to FIG.
As shown in FIG. 4, the load status table (T-3) defines call IDs, outside line calling numbers, call end times, and evaluation results for each of operators A, B, and C. FIG. Here, volume, speaking speed, and words are defined as evaluation results. The volume, speaking speed, and word evaluation results are represented by "load" and "normal."
例えば、オペレータAの通話ID“0x3001”に対しては、「音量」の評価結果は「負荷」であり、「話速」の評価結果は「負荷」であり、「単語」の評価結果は「負荷」である。オペレータBの通話ID“0x3007”に対しては、「音量」の評価結果は「平常」であり、「話速」の評価結果は「平常」であり、「単語」の評価結果は「平常」である。オペレータCの通話ID“0x3010”に対しては、「音量」の評価結果は「負荷」であり、「話速」の評価結果は「負荷」であり、「単語」の評価結果は「平常」である。 For example, for the call ID "0x3001" of operator A, the evaluation result of "volume" is "load", the evaluation result of "speech speed" is "load", and the evaluation result of "word" is " load”. For the call ID "0x3007" of operator B, the evaluation result of "volume" is "normal", the evaluation result of "speech speed" is "normal", and the evaluation result of "word" is "normal". is. For the call ID "0x3010" of operator C, the evaluation result of "volume" is "load", the evaluation result of "speech speed" is "load", and the evaluation result of "word" is "normal". is.
次に、オペレータの負荷状態を求めて管理者用端末105に提供する方法について説明する。 Next, a method of obtaining the operator's load state and providing it to the administrator's terminal 105 will be described.
まず、管理者は、負荷評価値テーブル(T-1)の各項目と、負荷単語テーブル(T-2)に値を設定しておく。音声認識認装置114は、顧客107とオペレータ109の通話完了時に音声認識を行う。
First, the administrator sets values in each item of the load evaluation value table (T-1) and the load word table (T-2). A
認識結果管理装置115は、音声認識装置114から取得した顧客107の認識結果と、負荷評価値テーブル(T-1)及び負荷単語テーブル(T-2)の内容からオペレータの負荷状態を評価して、評価結果を負荷状態テーブル(T-3)に格納する。ここで、音声認識装置114は、通話録音装置112に格納された顧客用音声ファイルに基づいて顧客107の音声を認識する。
The recognition
ここで、図8にオペレータAにおける2通話分の負荷状態の算出例を示す。
図8に示すように、オペレータAの通話ID“0x3001”に対しては、「通話時間」は300秒であり、「音量」の評価結果は「負荷」であり、「話速」の評価結果は「負荷」であり、「単語」の評価結果は「正常」である。また、オペレータAの通話ID“0x3002”に対しては、「通話時間」は120秒であり、「音量」の評価結果は「負荷」であり、「話速」の評価結果は「負荷」であり、「単語」の評価結果は「負荷」である。
Here, FIG. 8 shows an example of calculation of the load state of operator A for two calls.
As shown in FIG. 8, for the call ID "0x3001" of operator A, the "call time" is 300 seconds, the evaluation result of "volume" is "load", and the evaluation result of "speed" is is "load" and the evaluation result of "word" is "normal". For operator A's call ID "0x3002", the "call time" is 120 seconds, the evaluation result of "volume" is "load", and the evaluation result of "speech speed" is "load". and the evaluation result of "word" is "load".
認識結果管理装置115は、オペレータ及び通話顧客ごとに通話開始時刻にそって集計結果を求め、管理者用端末105に提供して負荷状態参照画面(管理者PC画面)に表示させる。管理者は、負荷状態参照画面を介して、認識結果管理装置115が評価した内容からオペレータ109の負荷状態を判断する。
The recognition
このように、実施例では、通話の顧客側の発話内容に着目し、顧客側の発話内容の音声認識結果から、オペレータ109への負荷を算出することで管理者に対してオペレータ109の負荷状態を提供する。
As described above, in the embodiment, attention is focused on the content of the customer's utterance in a call, and the load on the
従来の音声認識システムでは、オペレータの発話内容に着目してオペレータの対応改善を行っていた。これに対して、実施例では顧客側の発話内容に着眼点を変更したうえで、音声認識結果の判定条件をオペレータの対応改善ではなく、音声認識と分析によりオペレータに負荷を与える要素の評価とする。実施例の音声認識システムでは、顧客の発話内容に着目することによりオペレータの潜在的な負荷状態を把握する。 In the conventional speech recognition system, attention was focused on the content of the operator's utterances to improve the response of the operator. On the other hand, in the embodiment, the point of view is changed to the content of the customer's utterance, and the judgment condition of the speech recognition result is not the improvement of the operator's response, but the evaluation of the factors that give the operator a load through speech recognition and analysis. do. In the voice recognition system of the embodiment, the operator's potential load state is grasped by paying attention to the content of the customer's utterance.
負荷を与える認識結果の要素は、「言語情報」中に含まれる単語、「非言語情報」中に含まれる発話の音量及び話速を対象とする。単語評価として、顧客の発話内容中にオペレータの負荷となる単語の出現数を評価する。音量評価として、顧客の発話時の音量を評価する。話速評価として顧客の発話時の通話速度を評価する。評価項目について評価値を設定した上で、発話内容からの取得情報と評価値の大小関係から負荷状態を判断する。そして、評価したオペレータの負荷状態を管理者に対して集計結果として提供する。 The elements of the recognition results that give the load are the words included in the "linguistic information" and the volume and speed of speech included in the "non-linguistic information". As the word evaluation, the number of occurrences of words that burden the operator in the contents of the customer's utterance is evaluated. As the volume evaluation, the volume when the customer speaks is evaluated. As speech speed evaluation, the speech speed at the time of customer's speech is evaluated. After setting the evaluation value for the evaluation item, the load state is determined from the magnitude relationship between the information obtained from the utterance content and the evaluation value. Then, the evaluated load state of the operator is provided to the administrator as a total result.
次に、管理者用端末105に表示される負荷状態参照画面(管理者PC画面)について説明する。管理者は、オペレータ109の負荷状態を管理者PC画面から判断する。
図9に示すように、負荷状態画面には、オペレータの通話に対する負荷分析結果を表示する。負荷状態画面は、管理者に対して、「負荷状態テーブル」(T-3)の内容から、1通話ごとの負荷状況を表示する。
Next, a load condition reference screen (administrator PC screen) displayed on the
As shown in FIG. 9, the load state screen displays the load analysis result for the operator's call. The load status screen displays the load status for each call to the administrator from the contents of the "load status table" (T-3).
また、図10に示すように、負荷状態画面には、オペレータの通話に対する負荷分析結果を表示する。負荷状態画面は、管理者に対して、「負荷状態テーブル」(T-3)から週を指定し指定週について、日毎の(負荷となる通話件数/オペレータの全体通話件数)をパーセント表記で表示する。 Further, as shown in FIG. 10, the load status screen displays the result of load analysis for the operator's call. The load status screen indicates to the administrator the week specified from the "load status table" (T-3), and the daily number of calls (loaded calls/total number of calls of the operator) for the specified week in percent notation. do.
また、図11に示すように、負荷状態画面には、オペレータの通話に対する負荷分析結果を表示する。負荷状態画面は、管理者に対して、「負荷状態テーブル」(T-3)から月を指定し指定月について、週毎の(負荷となる通話件数/オペレータの全体通話件数)をパーセント表記で表示する。 Further, as shown in FIG. 11, the load status screen displays the result of load analysis for the operator's call. On the load status screen, the administrator can specify the month from the "load status table" (T-3), and for the specified month, the weekly number of calls (the number of calls that are the load / the total number of calls of the operator) will be displayed in percentage notation. indicate.
次に、図12のシステム構成図及び図13のフローチャートを参照して、コールセンタにおける音声認識システムの動作(着信から負荷算出までの動作)について説明する。 Next, with reference to the system configuration diagram of FIG. 12 and the flow chart of FIG. 13, the operation of the speech recognition system in the call center (the operation from receiving a call to calculating the load) will be described.
例として、オペレータ109と顧客106との間の通話終了後に音声認識を実施((1)~(4))後、オペレータ109が顧客106の発話から受ける負荷を算出する(5)場合を説明する。
As an example, a case will be described in which the
(1)通話録音情報管理装置111は、CTI情報を受信する。
(2)通話録音装置112が、録音情報を通話録音情報管理装置111に送信する。
(3)通話録音情報管理装置111から音声認識制御装置113へCTI情報と録音情報を送信する。
(4)音声認識制御装置113は、音声認識装置112にCTI情報と録音情報を送信して音声認識装置112に音声認識の実行を依頼する。音声認識装置112は音声認識を行い、認識結果を音声認識制御装置113に送信する。音声認識制御装置113は、認識結果を認識結果管理装置115に送信する。
(5)認識結果管理装置115は、音声認識制御装置113から受信した認識結果と、「負荷価値テーブル」(T-1)及び「負荷単語テーブル」(T-2)とからオペレータが顧客から受けた負荷を分析し、分析結果を評価結果として「負荷状態テーブル」(T-3)に蓄積する。負荷分析は、後述のように、評価値の選定(5-1)、負荷の分析(5-2)、分析結果の保存(5-3)の順に行う。認識結果管理装置115は、管理者用端末105に認識結果を表示させ、管理者は認識結果を閲覧する。
(1) The call recording
(2) The
(3) Sending the CTI information and the recording information from the call recording
(4) The speech
(5) The recognition
次に、図14を参照して、評価値の選定方法(5-1)について説明する。
最初に、「負荷価値テーブル」(T-1)の評価値を取得する(S141)。
次に、通話情報のオペレータ名が「負荷価値テーブル」(T-1)上に存在するかを判定する(S142)。
Next, the evaluation value selection method (5-1) will be described with reference to FIG.
First, the evaluation value of the "load value table" (T-1) is obtained (S141).
Next, it is determined whether the operator name of the call information exists on the "load value table" (T-1) (S142).
存在する場合には、「負荷価値テーブル」(T-1)のオペレータに対応するレコードの“音量”、“話速”、“単語”の値を取得する(S143)。 If it exists, the values of "volume", "speech speed" and "word" of the record corresponding to the operator in the "load value table" (T-1) are obtained (S143).
存在しない場合には、「負荷価値テーブル」(T-1)のオペレータ名:defaultのレコード上の値を評価値とする(S144)。 If it does not exist, the value on the record of operator name: default in the "load value table" (T-1) is used as the evaluation value (S144).
次に、「負荷価値テーブル」(T-1)のオペレータのレコード項目について値が“d”のものが存在するか判定する(S145)。
存在する場合には、値が0の項目は「負荷価値テーブル」(T-1)のオペレータ名:defaultのレコード上の値を評価値とする(S146)。
存在しない場合には、「負荷価値テーブル」(T-1)の値を評価値とする(S147)。
Next, it is determined whether or not there is an operator record item of the "load value table" (T-1) with a value of "d" (S145).
If it exists, the value on the record of operator name: default in the "load value table" (T-1) is used as the evaluation value for items with a value of 0 (S146).
If it does not exist, the value of the "load value table" (T-1) is used as the evaluation value (S147).
次に、図15~図17を参照して、負荷の分析方法(5-2)について説明する。オペレータ109が顧客106の発話内容から受けた負荷の分析を「音量」、「話速」、「単語」について実施する。
Next, the load analysis method (5-2) will be described with reference to FIGS. 15 to 17. FIG. The
図15を参照して、項目「音量」に関する負荷の分析方法について説明する。
まず、認識結果から顧客106の発話内容に関する非言語情報を取得する(S151)。
次に、非言語情報の中から、音量を抽出する(S152)。
次に、顧客106の発話音量と音量評価値を比較する(S153)。
比較の結果、顧客106の発話音量が音量評価値よりも大きいかを判定する(S154)。
判定の結果、顧客106の発話音量が音量評価値よりも大きい場合には、通話から項目「音量」について評価結果を“負荷”とする(S155)。
判定の結果、顧客106の発話音量が音量評価値よりも大きくない場合には、通話から項目「音量」について評価結果を“平常”とする(S156)。
A load analysis method for the item "volume" will be described with reference to FIG.
First, non-verbal information about the content of the speech of the
Next, volume is extracted from the non-verbal information (S152).
Next, the speech volume of the
As a result of the comparison, it is determined whether the speech volume of the
As a result of the determination, if the speech volume of the
As a result of the determination, if the speech volume of the
次に、図16を参照して、項目「話速」に関する負荷の分析方法について説明する。
まず、認識結果から顧客106の発話内容に関する非言語情報を取得する(S161)。
次に、非言語情報の中から、話速を抽出する(S162)。
次に、顧客106の発話話速と話速評価値を比較する(S163)。
比較の結果、顧客106の話速音量が話速評価値よりも大きいかを判定する(S164)。
判定の結果、顧客106の話速音量が音量評価値よりも大きい場合には、通話から項目「話速」について評価結果を“負荷”とする(S165)。
判定の結果、顧客106の話速音量が話速評価値よりも大きくない場合には、通話から項目「話速」について評価結果を“平常”とする(S166)。
Next, referring to FIG. 16, a load analysis method for the item "speech speed" will be described.
First, non-verbal information about the content of the speech of the
Next, speech speed is extracted from the non-verbal information (S162).
Next, the speech speed of the
As a result of the comparison, it is determined whether the speaking speed volume of the
As a result of the determination, if the speech rate volume of the
As a result of the determination, if the speech rate volume of the
次に、図17を参照して、項目「単語」に関する負荷の分析方法について説明する。
まず、認識結果から顧客106の発話内容に関する言語情報を取得する(S171)。
次に、非言語情報の中から、単語情報を抽出する(S172)。
次に、単語情報の中に「負荷単語テーブル」(T-2)に登録した単語が存在するかを判定する(S173)。
Next, referring to FIG. 17, a load analysis method for the item "word" will be described.
First, linguistic information about the content of the
Next, word information is extracted from the non-verbal information (S172).
Next, it is determined whether or not the words registered in the "load word table" (T-2) exist in the word information (S173).
存在する場合には、単語情報中に存在する「負荷単語テーブル」(T-2)に登録した単語の数をカウントする。カウントで算出した値を発話負荷単語数とする(S174)。
存在しない場合には、発話負荷単語数を0とする(S175)。
If it exists, the number of words registered in the "load word table" (T-2) that exists in the word information is counted. The value calculated by counting is set as the number of utterance load words (S174).
If it does not exist, the number of utterance load words is set to 0 (S175).
次に、顧客106の発話負荷単語数と単語数評価値を比較する(S176)。
次に、比較の結果、顧客106の発話負荷単語数が単語数評価値よりも大きいかを判定する(S177)。
判定の結果、顧客106の発話負荷単語数が単語数評価値よりも大きい場合には、通話から項目「単語」について評価結果を“負荷”とする(S178)。
判定の結果、顧客106の発話負荷単語数が単語数評価値よりも大きくない場合には、通話から項目「単語」について評価結果を“平常”とする(S179)。
Next, the number of utterance load words of the
Next, as a result of the comparison, it is determined whether the number of utterance load words of the
As a result of the determination, if the number of uttered load words of the
As a result of the determination, if the number of utterance load words of the
最後に、分析結果の保存方法(5-3)について説明する。
分析した「単語」、「音量」、「話速」の負荷結果を「負荷状態テーブル」(T-3)に保存する。保存時には、負荷結果に加えて、通話に紐づく「オペレータ名」、「通話ID」、「外線発信番号」、「通話開始時刻」及び「通話時間」を音声認識制御装置113より取得してレコードとして記録する。
Finally, a method (5-3) for saving analysis results will be described.
The load results of the analyzed "words", "volume" and "speech rate" are stored in the "load state table" (T-3). At the time of saving, in addition to the load result, the “operator name”, “call ID”, “outline number”, “call start time” and “call duration” associated with the call are acquired from the voice
実施例によれば、管理者はオペレータが顧客との通話から受ける負荷とオペレータの状態を把握することができる。さらに、管理者がオペレータの負荷傾向を早期に把握することで、電話対応における負荷の増大を事前に緩和することができる。 According to the embodiment, the manager can grasp the load that the operator receives from the call with the customer and the state of the operator. Furthermore, the administrator can grasp the operator's load tendency at an early stage, so that an increase in the load due to telephone correspondence can be alleviated in advance.
尚、実施例では、顧客用音声ファイルに基づいてオペレータの負荷を求めているが、本発明はこれに限定されず、オペレー用音声ファイルをも併用してオペレータの負荷を求めても良い。 In the embodiment, the operator's load is determined based on the customer voice file, but the present invention is not limited to this, and the operator's voice file may also be used to determine the operator's load.
100 ネットワーク
101 IP-PBX装置
102 CTI装置
103 音声通話処理システム
104 オペレータ用端末
105 管理者用端末
106 顧客
107 通話端末
108 公衆網
109 オペレータ
110 通話端末(IP電話機)
111 通話録音情報管理装置
112 通話録音装置
113 音声認識制御装置
114 音声認識装置
115 認識結果管理装置
100
111 call recording
Claims (8)
前記通話録音装置に録音された前記顧客の発話内容に対して音声認識を行う音声認識装置と、
前記音声認識装置により音声認識された前記顧客の発話内容の音声認識結果に基づいて、オペレータが前記顧客から受けた負荷状態を評価して評価結果を求める認識結果管理装置と、
前記認識結果管理装置により求めた前記負荷状態の前記評価結果を負荷状態画面に表示する管理者端末と、
を有し、
前記認識結果管理装置は、
前記負荷状態を評価するための評価値を規定した負荷評価値テーブルと、
前記オペレータの負荷となる負荷単語を規定した負荷単語テーブルと、
前記オペレータが前記顧客から受けた前記負荷状態を評価した前記評価結果を格納する負荷状態テーブルと、を有し、
前記認識結果管理装置は、
前記音声認識装置から取得した前記顧客の発話内容の前記音声認識結果と、前記負荷評価値テーブル及び前記負荷単語テーブルとを参照して、前記オペレータが前記顧客から受けた前記負荷状態を前記オペレータごとに評価して、前記評価結果を前記オペレータごとに前記負荷状態テーブルに蓄積し、
前記管理者端末は、
前記負荷状態テーブルに蓄積された前記評価結果を前記オペレータごと前記負荷状態画面に表示し、
前記認識結果管理装置は、
前記負荷評価値テーブルにおいて、前記評価値として、前記顧客の発話内容の非言語情報中に含まれる前記顧客の発話内容の音量と話速及び前記顧客の発話内容の言語情報中に含まれる前記負荷単語の件数を規定することを特徴とする音声認識システム。 a call recording device for recording the customer's utterances ;
a speech recognition device that performs speech recognition on the content of the customer's speech recorded in the call recording device;
a recognition result management device for obtaining an evaluation result by evaluating the load state received by an operator from the customer based on the speech recognition result of the customer's utterance content recognized by the speech recognition device;
an administrator terminal that displays the evaluation result of the load state obtained by the recognition result management device on a load state screen;
has
The recognition result management device
a load evaluation value table defining evaluation values for evaluating the load state;
a load word table that defines load words that act as a load on the operator;
a load status table for storing the evaluation results of the operator evaluating the load status received from the customer;
The recognition result management device
By referring to the speech recognition result of the customer's utterance content obtained from the speech recognition device, the load evaluation value table and the load word table, the load state received by the operator from the customer is determined for each operator. and accumulate the evaluation result in the load state table for each operator,
The administrator terminal
displaying the evaluation results accumulated in the load state table on the load state screen for each operator;
The recognition result management device
In the load evaluation value table, as the evaluation values, the volume and speech rate of the content of the customer's utterance included in the non-verbal information of the content of the customer's utterance, and the load included in the linguistic information of the content of the customer's utterance. A speech recognition system characterized by defining the number of words .
前記音声認識装置から取得した前記顧客の発話内容の認識結果と、前記負荷評価値テーブルで規定された前記評価値と比較することにより、前記顧客の発話内容が前記オペレータに対して負荷となるか否かを評価し、前記評価結果を負荷又は平常として前記負荷状態テーブルに蓄積することを特徴とする請求項1に記載の音声認識システム。 The recognition result management device
By comparing the recognition result of the customer's utterance content acquired from the speech recognition device with the evaluation value defined in the load evaluation value table , whether the customer's utterance content causes a load on the operator. 2. The speech recognition system according to claim 1, wherein the evaluation result is accumulated in the load state table as a load or a normal state.
前記顧客の発話内容の前記音声認識結果から、前記顧客の発話内容の前記非言語情報を取得し、
前記非言語情報の中から発話音量を抽出し、
前記発話音量と前記音量の評価値を比較して、前記発話音量が前記音量の前記評価値よりも大きいかを判定し、
前記発話音量が前記音量の評価値よりも大きい場合には、前記音量の評価結果を前記負荷と規定し、
前記発話音量が前記音量の評価値よりも大きくない場合には、前記音量の評価結果を前記平常と規定することを特徴とする請求項2に記載の音声認識システム。 The recognition result management device
acquiring the non-verbal information of the customer's utterance content from the speech recognition result of the customer's utterance content;
extracting speech volume from the non-verbal information;
comparing the speech volume and the volume evaluation value to determine whether the speech volume is greater than the volume evaluation value;
If the speech volume is greater than the volume evaluation value, defining the volume evaluation result as the load,
3. The speech recognition system according to claim 2 , wherein when said speech volume is not greater than said volume evaluation value, said volume evaluation result is defined as said normal.
前記顧客の発話内容の前記音声認識結果から、前記顧客の発話内容の前記非言語情報を取得し、
前記非言語情報の中から発話話速を抽出し、
前記発話話速と前記話速の評価値を比較して、前記発話話速が前記話速の前記評価値よりも大きいかを判定し、
前記発話話速が前記話速の評価値よりも大きい場合には、前記話速の評価結果を前記負荷と規定し、
前記発話話速が前記話速の評価値よりも大きくない場合には、前記話速の評価結果を前記平常と規定することを特徴とする請求項2に記載の音声認識システム。 The recognition result management device
acquiring the non-verbal information of the customer's utterance content from the speech recognition result of the customer's utterance content;
extracting speech speed from the non-verbal information;
comparing the speech speed and the evaluation value of the speech speed to determine whether the speech speed is greater than the evaluation value of the speech speed;
if the speech speed is greater than the speech speed evaluation value, defining the speech speed evaluation result as the load;
3. The speech recognition system according to claim 2 , wherein when said speech speed is not greater than said speech speed evaluation value, said speech speed evaluation result is defined as said normal.
前記顧客の発話内容の前記音声認識結果から、前記顧客の発話内容の前記言語情報を取得し、
前記言語情報の中から単語情報を抽出し、
前記単語情報の中に、前記負荷単語テーブルに規定された前記負荷単語が存在するかを判定し、
前記負荷単語が存在する場合には、前記単語情報中の前記負荷単語の発話単語件数を算出し、
前記発話単語件数と前記負荷単語の評価値を比較して、前記発話単語件数が前記負荷単語の評価値よりも大きいかを判定し、
前記発話単語件数が前記負荷単語の評価値よりも大きい場合には、前記負荷単語の評価結果を前記負荷と規定し、
前記発話単語件数が前記負荷単語の評価値よりも大きくない場合には、前記負荷単語の評価結果を前記平常と規定することを特徴とする請求項2に記載の音声認識システム。 The recognition result management device
acquiring the language information of the customer's utterance content from the speech recognition result of the customer's utterance content;
extracting word information from the language information;
determining whether the load word defined in the load word table exists in the word information;
if the load word exists, calculating the number of uttered words of the load word in the word information;
comparing the number of spoken words with the evaluation value of the load word to determine whether the number of spoken words is greater than the evaluation value of the load word;
if the number of uttered words is greater than the evaluation value of the load word, defining the evaluation result of the load word as the load;
3. The speech recognition system according to claim 2 , wherein when the number of uttered words is not greater than the evaluation value of the load word, the evaluation result of the load word is defined as normal.
前記認識結果管理装置は、
前記設定用画面を介して、前記負荷評価値テーブルに前記評価値を設定し、前記負荷単語テーブルに前記負荷単語を設定することを特徴とする請求項1に記載の音声認識システム。 The administrator terminal displays a setting screen,
The recognition result management device
2. The speech recognition system according to claim 1 , wherein the evaluation values are set in the load evaluation value table and the load words are set in the load word table via the setting screen .
前記通話録音装置に録音された前記顧客の発話内容に対して音声認識を行う音声認識装置と、
前記音声認識装置により音声認識された前記顧客の発話内容の音声認識結果に基づいて、オペレータが前記顧客から受けた負荷状態を評価して評価結果を求める認識結果管理装置と、
前記認識結果管理装置により求めた前記負荷状態の前記評価結果を負荷状態画面に表示する管理者端末と、
を有し、
前記管理者端末は、
前記評価結果を集計した集計結果を、前記オペレータ及び前記顧客ごとに、通話開始時刻にそって前記負荷状態画面に表示することを特徴とする音声認識システム。 a call recording device for recording the customer's utterances ;
a speech recognition device that performs speech recognition on the content of the customer's speech recorded in the call recording device;
a recognition result management device for obtaining an evaluation result by evaluating the load state received by an operator from the customer based on the speech recognition result of the customer's utterance content recognized by the speech recognition device;
an administrator terminal that displays the evaluation result of the load state obtained by the recognition result management device on a load state screen;
has
The administrator terminal
A speech recognition system , wherein the aggregated results of the evaluation results are displayed on the load state screen for each of the operator and the customer in accordance with call start time .
前記通話録音装置に録音された前記顧客の発話内容に対して音声認識を行う音声認識装置と、
前記音声認識装置により音声認識された前記顧客の発話内容の音声認識結果に基づいて、オペレータが前記顧客から受けた負荷状態を評価して評価結果を求める認識結果管理装置と、
前記認識結果管理装置により求めた前記負荷状態の前記評価結果を負荷状態画面に表示する管理者端末と、
を有し、
前記管理者端末は、
前記評価結果を集計した集計結果を、日毎又は週毎に、前記オペレータに負荷となる通話件数を前記オペレータの全体の通話件数で割ったパーセント表記で表示することを特徴とする音声認識システム。 a call recording device for recording the customer's utterances ;
a speech recognition device that performs speech recognition on the content of the customer's speech recorded in the call recording device;
a recognition result management device for obtaining an evaluation result by evaluating the load state received by an operator from the customer based on the speech recognition result of the customer's utterance content recognized by the speech recognition device;
an administrator terminal that displays the evaluation result of the load state obtained by the recognition result management device on a load state screen;
has
The administrator terminal
A speech recognition system characterized in that the totalized result obtained by totaling the evaluation results is displayed in percentage notation obtained by dividing the number of calls that impose a load on the operator by the total number of calls of the operator on a daily or weekly basis .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018177526A JP7164372B2 (en) | 2018-09-21 | 2018-09-21 | Speech recognition system and speech recognition method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018177526A JP7164372B2 (en) | 2018-09-21 | 2018-09-21 | Speech recognition system and speech recognition method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020046634A JP2020046634A (en) | 2020-03-26 |
JP7164372B2 true JP7164372B2 (en) | 2022-11-01 |
Family
ID=69901409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018177526A Active JP7164372B2 (en) | 2018-09-21 | 2018-09-21 | Speech recognition system and speech recognition method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7164372B2 (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004252668A (en) | 2003-02-19 | 2004-09-09 | Fujitsu Ltd | Contact center managing and controlling program, device and method |
JP2009159558A (en) | 2007-12-28 | 2009-07-16 | Fujitsu Fsas Inc | Operator reception monitoring and switching system |
JP2011151497A (en) | 2010-01-19 | 2011-08-04 | Nec Corp | Telephone response result prediction device, method, and program thereof |
WO2014069076A1 (en) | 2012-10-31 | 2014-05-08 | 日本電気株式会社 | Conversation analysis device and conversation analysis method |
JP2017085411A (en) | 2015-10-29 | 2017-05-18 | オー・エイ・エス株式会社 | Mental condition management device and program |
JP2017135642A (en) | 2016-01-29 | 2017-08-03 | 株式会社日立システムズ | Telephone voice monitoring evaluation system |
-
2018
- 2018-09-21 JP JP2018177526A patent/JP7164372B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004252668A (en) | 2003-02-19 | 2004-09-09 | Fujitsu Ltd | Contact center managing and controlling program, device and method |
JP2009159558A (en) | 2007-12-28 | 2009-07-16 | Fujitsu Fsas Inc | Operator reception monitoring and switching system |
JP2011151497A (en) | 2010-01-19 | 2011-08-04 | Nec Corp | Telephone response result prediction device, method, and program thereof |
WO2014069076A1 (en) | 2012-10-31 | 2014-05-08 | 日本電気株式会社 | Conversation analysis device and conversation analysis method |
JP2017085411A (en) | 2015-10-29 | 2017-05-18 | オー・エイ・エス株式会社 | Mental condition management device and program |
JP2017135642A (en) | 2016-01-29 | 2017-08-03 | 株式会社日立システムズ | Telephone voice monitoring evaluation system |
Also Published As
Publication number | Publication date |
---|---|
JP2020046634A (en) | 2020-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10194029B2 (en) | System and methods for analyzing online forum language | |
US9699307B2 (en) | Method and system for automatically routing a telephonic communication | |
KR101361724B1 (en) | Recursive adaptive interaction management system | |
US7869586B2 (en) | Method and system for aggregating and analyzing data relating to a plurality of interactions between a customer and a contact center and generating business process analytics | |
US11425252B1 (en) | Unified communications call routing and decision based on integrated analytics-driven database and aggregated data | |
US11843719B1 (en) | Analysis of customer interaction metrics from digital voice data in a data-communication server system | |
EP2124427B1 (en) | Treatment processing of a plurality of streaming voice signals for determination of responsive action thereto | |
JP2017112614A (en) | Method and system for learning call analysis | |
EP2124425B1 (en) | System for handling a plurality of streaming voice signals for determination of responsive action thereto | |
US10924611B2 (en) | Voice recognition system and call evaluation setting method | |
JP7164372B2 (en) | Speech recognition system and speech recognition method | |
EP2124426B1 (en) | Recognition processing of a plurality of streaming voice signals for determination of responsive action thereto | |
WO2022256028A1 (en) | Communications apparatus using channel-communications management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210907 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220621 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220711 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221011 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221020 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7164372 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |