JP2010081529A - Display control apparatus, display control method, and display control program - Google Patents

Display control apparatus, display control method, and display control program Download PDF

Info

Publication number
JP2010081529A
JP2010081529A JP2008250422A JP2008250422A JP2010081529A JP 2010081529 A JP2010081529 A JP 2010081529A JP 2008250422 A JP2008250422 A JP 2008250422A JP 2008250422 A JP2008250422 A JP 2008250422A JP 2010081529 A JP2010081529 A JP 2010081529A
Authority
JP
Japan
Prior art keywords
reading
script
display control
information
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008250422A
Other languages
Japanese (ja)
Other versions
JP5187102B2 (en
Inventor
Yuji Nishiyama
裕司 西山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008250422A priority Critical patent/JP5187102B2/en
Publication of JP2010081529A publication Critical patent/JP2010081529A/en
Application granted granted Critical
Publication of JP5187102B2 publication Critical patent/JP5187102B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a display control apparatus and the like for calculating and displaying accurate information on an interaction time during a voice interaction on the basis of a voice reading speed or an interaction progress condition. <P>SOLUTION: The invention relates to a display control apparatus for displaying information on an interaction time, including: an input section 210 for inputting a script sentence in which information indicating an interaction flow is described; script information 250 for storing the inputted script sentence; a conversion section 220 for reading the script sentence from the script information 250 and converting the overall the sentence into Japanese syllabary (HIRAKANA or KATAKANA); a voice reading time calculation section 230 for calculating the total number of voices when reading the script sentence in voice on the basis of a converted result, and calculating a voice reading time required for completing the script sentence on the basis of the total number of voices, the number of actual voices actually uttered for reading the script sentence in voice, and an actual interaction time required for the interaction; and a display control section 240 for displaying, on a screen, information on the calculated voice reading time, the actual interaction time and/or the script sentence as voice reading information. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、音声対話を行う際の対話時間に関する情報を表示する表示制御装置に関する。   The present invention relates to a display control apparatus that displays information related to a dialogue time when performing a voice dialogue.

発信業務型のコールセンターにおいて、電話連絡を多数の相手に対して行う場合は、一般的に、スクリプトフロー(会話の流れを手引きする紙ベースの流れ図)に沿って、話が横道にそれないように進める指導や、机にフローを記した資料を用意してそれ見てメモを取りながら話を進め方法が多い。近年では、コンピュータでスクリプト画面を表示し、相手から得た内容を画面から入力するようなソフトウエアもある。
また、音声対話機能を有し、複数の音声入出力の競合を防止する技術として、特許文献1に示す技術が開示されている。
特開2008−26621号公報
When calling a large number of other parties in a call center of the outgoing call business type, in general, follow the script flow (paper-based flow chart that guides the flow of conversation) so that the story does not deviate sideways. There are many ways to proceed with the instruction, and to prepare a document that describes the flow on the desk and take notes while looking at it. In recent years, there is software that displays a script screen on a computer and inputs contents obtained from the other party from the screen.
Further, a technique disclosed in Patent Document 1 is disclosed as a technique having a voice interaction function and preventing a plurality of voice input / output conflicts.
JP 2008-26621 A

しかしながら、上記のような、スクリプトフローに沿ってメモを取りながら話を進め方法や、コンピュータでスクリプト画面を表示し、相手から得た内容を画面から入力する方法のいずれの場合においても、着信者の答え方や、着信者の答えそのもの量や質(例:短い住所の場合は、復唱確認時間が短いが、長い住所や、読み方が難しい住所の場合は、入力や復唱確認が長いといった事)の違いにより、着信者から「あとどれくらい時間が必要なのか?」といった問いに対して、大まかな時間を答えられない。また、発信者側も、残り時間の把握ができないことで、気構えができないという課題を有する。   However, in either case, such as the method of proceeding while taking notes along the script flow, or the method of displaying the script screen on the computer and inputting the content obtained from the other party from the screen, the called party How to answer the call, and the amount and quality of the callee's answer itself (eg, if the address is short, the repeat confirmation time is short, but if the address is long or difficult to read, the input or repeat confirmation is long) Due to the difference, it is not possible to answer a rough time when the callee asks "How much time do you need?" Also, the caller has a problem that he cannot be prepared because he cannot grasp the remaining time.

特に、不慣れなテレホンオペレータの場合は、残予測時間がわからず、ストレスを感じるケースが多い。また、ベテランテレホンオペレータにおいても、慣れすぎていることで逆に会話の進行を必要以上に早めている場合(早口になっていたり、せっかちに会話を進めていたりすること)があり、気づかないところで相手に不快感を与えているケースもある。   In particular, inexperienced telephone operators often do not know the remaining prediction time and feel stress. In addition, even veteran telephone operators may be unfamiliar because they are too accustomed to conversely progress more than necessary (because they are speaking quickly, or they are conversing quickly). There are also cases where the other party feels uncomfortable.

また、特許文献1に示す技術は、複数の音声入出力の間の競合を防止することができ、ユーザに対して複数の音声入出力をそれぞれ適正なタイミングで円滑に行うことが可能であるが、文字情報の読み上げに要する時間を算出する場合には、機械による読み上げを行うことが前提となっており、発信業務型のコールセンターにおける対話の場合のように、個性を持った人間が、未知の異なる内容の文字情報を読み上げるときには、対応することができないという課題を有する。   Moreover, although the technique shown in patent document 1 can prevent the competition between several audio | voice input / outputs, it can perform a several audio | voice input / output smoothly with respect to a user at an appropriate timing, respectively. When calculating the time required to read text information, it is assumed that the text is read out by a machine. There is a problem that it is not possible to read out text information of different contents.

そこで、本発明は上記課題を解決するためになされたものであり、音声対話における対話時間に関する正確な情報を、読み上げ速度や対話の進捗具合に基づいて算出して表示する表示制御装置、表示制御方法、及び表示制御プログラムを提供することを目的とする。   Accordingly, the present invention has been made to solve the above problems, and a display control device and display control for calculating and displaying accurate information related to the dialogue time in the voice dialogue based on the reading speed and the progress of the dialogue. It is an object to provide a method and a display control program.

(1.表示制御装置)
本願に開示する表示制御装置は、音声対話を行う場合に、対話時間に関する情報を表示する表示制御装置であって、対話の流れを示す情報が記載されたスクリプト文を入力するスクリプト入力手段と、前記スクリプト入力手段が入力したスクリプト文を格納するスクリプト格納手段と、前記スクリプト格納手段が格納するスクリプト文を読み込んで、全文を平仮名、又はカタカナに変換する変換手段と、前記変換手段が変換した結果に基づいて、当該スクリプト文を読み上げる場合の全発声数を算出する発声数算出手段と、前記発声数算出手段が算出した全発声数、当該スクリプト文を読み上げるために実際に発声した実発声数、及び対話に要した実対話時間に基づいて、当該スクリプト文を完結するのに必要な読上時間を算出する読上時間算出手段と、前記読上時間算出手段が算出した読上時間に関する情報、前記実対話時間、及び/又は前記スクリプト文を読上情報として画面上に表示する表示制御手段とを備えるものである。
(1. Display control device)
The display control device disclosed in the present application is a display control device that displays information related to a dialogue time when a voice dialogue is performed, and a script input unit that inputs a script sentence in which information indicating a flow of the dialogue is described; Script storage means for storing the script sentence input by the script input means, conversion means for reading the script sentence stored by the script storage means and converting the entire sentence into hiragana or katakana, and the result of conversion by the conversion means Based on the number of utterances for calculating the total number of utterances when reading the script sentence, the total number of utterances calculated by the utterance number calculating means, the actual number of utterances actually spoken to read the script sentence, Reading time for calculating the reading time required to complete the script sentence based on the actual dialogue time required for the dialogue Means out, the a reading time calculating means information on a reading time calculated is the one in which provided real dialogue time, and / or a display control means for displaying the script text on the screen as a reading information.

このように、本願に開示する表示制御装置においては、対話の流れを示す情報が記載されたスクリプト文を読み込んで、全文を平仮名、又はカタカナに変換し、変換した結果に基づいて、当該スクリプト文を読み上げる場合の全発声数を算出し、算出した全発声数、当該スクリプト文を読み上げるために実際に発声した実発声数、及び当該実発声数を発声するのに要した実発声時間に基づいて、当該スクリプト文を完結するのに必要な読上時間を算出し、当該読上時間に関する情報、前記実発声時間、及び/又は前記スクリプト文を読上情報として画面上に表示するため、スクリプト文を完結させるのに要する残余時間や、対話の進捗具合を動的に確認しながら対話を行うことができ、発信者が、残り時間の把握ができないことで、気構えができないということがなくなるという効果を奏する。   As described above, in the display control device disclosed in the present application, the script sentence in which the information indicating the flow of the dialogue is read, the whole sentence is converted into hiragana or katakana, and the script sentence is based on the converted result. The total number of utterances is calculated when the number of utterances is read out, based on the calculated total number of utterances, the actual number of utterances actually spoken to read out the script sentence, and the actual utterance time required to utter the number of actual utterances. A script sentence for calculating a reading time required to complete the script sentence and displaying the information related to the reading time, the actual utterance time, and / or the script sentence on the screen as reading information. The conversation can be conducted while dynamically checking the remaining time required to complete the conversation and the progress of the conversation, and the caller is not ready to grasp the remaining time. That it does not come an effect that is eliminated.

また、不慣れなテレホンオペレータが、残予測時間がわからないことで、ストレスを感じてしまうこともなく、ベテランテレホンオペレータにおいても、慣れすぎていることで逆に会話の進行を必要以上に早めて、相手に不快感を与えているケースを減少させることができるという効果を奏する。   Also, unfamiliar telephone operators do not feel the stress because they do not know the estimated remaining time, and veteran telephone operators are too accustomed to conversely advance conversation more than necessary. It is possible to reduce the number of cases in which the user feels uncomfortable.

さらに、スクリプト文を完結するのに必要な読上時間を算出する場合に、着信者の発声時間を実対話時間として含めているため、着信者の応答時間に従って、対話時間に関する情報(読上時間、実対話時間、残余時間等)を動的に表示することで、着信者の個性や、未知の対話内容の場合であっても、正確な対話時間に関する情報を表示して、業務を効率よく遂行することができるという効果を奏する。   In addition, when calculating the reading time required to complete the script sentence, since the caller's utterance time is included as the actual dialog time, information on the dialog time (reading time) according to the response time of the callee , Actual conversation time, remaining time, etc.) dynamically, even if the content of the recipient is unknown or the content of the conversation is unknown, information about the exact conversation time is displayed, making work more efficient There is an effect that it can be accomplished.

(2.文字の表示態様)
本願に開示する表示制御装置は、前記表示制御手段が読上情報として表示するスクリプト文について、実際に発声された言葉と当該スクリプト文に記載された文字が一致する場合に、当該表示されたスクリプト文における実際に発声された文字の表示態様を変更するものである。
(2. Character display mode)
The display control device disclosed in the present application is directed to a script sentence displayed by the display control unit as read-out information when the actually spoken word matches the character described in the script sentence. The display mode of the characters actually spoken in the sentence is changed.

(3.標準読上情報の表示)
本願に開示する表示制御装置は、前記スクリプト文を完結した場合の読上情報を、読上実績情報として当該スクリプト文ごとに記録する実績情報記録手段を備え、前記表示制御手段が前記読上情報を表示すると共に、当該読上情報として表示されるスクリプト文と同一のスクリプト文についての、前記実績情報記録手段が記録する読上実績情報の平均値を、標準読上情報として表示するものである。
(3. Display of standard reading information)
The display control device disclosed in the present application includes performance information recording means for recording the reading information when the script sentence is completed as reading performance information for each script sentence, and the display control means includes the reading information. And the average value of the reading result information recorded by the result information recording means for the same script sentence as the script sentence displayed as the reading information is displayed as the standard reading information. .

(4.スクリプト文の分割)
本願に開示する表示制御装置は、前記スクリプト文を任意の項目に応じて複数のブロックに分割する分割手段と、前記分割手段により複数に分割されたスクリプト文のブロックごとにユニークなキーワードを抽出する抽出手段とを備え、前記読上時間算出手段が、前記抽出手段にて抽出された任意の一のキーワードが発声された場合に、当該任意の一のキーワードを含むブロックが読み上げられた判断して読上時間を算出するものである。
(4. Splitting script sentences)
A display control device disclosed in the present application extracts a unique keyword for each block of a script sentence divided into a plurality of blocks by the dividing means, and a dividing unit that divides the script sentence into a plurality of blocks according to an arbitrary item. And when the arbitrary reading keyword extracted by the extracting means is uttered, the reading time calculating means determines that a block including the arbitrary one keyword has been read out. The reading time is calculated.

これまで、本発明を装置として示したが、所謂当業者であれば明らかであるように本発明を方法、及び、プログラムとして捉えることもできる。これら前記の発明の概要は、本発明に必須となる特徴を列挙したものではなく、これら複数の特徴のサブコンビネーションも発明となり得る。   Although the present invention has been shown as an apparatus so far, as will be apparent to those skilled in the art, the present invention can also be understood as a method and a program. These outlines of the invention do not enumerate the features essential to the present invention, and a sub-combination of these features can also be an invention.

すなわち、本願に開示する表示制御装置の構成要素または構成要素の任意の組合せを、方法、装置、回路、システム、コンピュータプログラム、記録媒体、データ構造などに適用したものも、他の態様として有効である。   That is, a configuration in which a display control device disclosed in the present application or any combination of components is applied to a method, a device, a circuit, a system, a computer program, a recording medium, a data structure, etc. is also effective as another mode. is there.

以下、本発明の実施の形態を説明する。本発明は多くの異なる形態で実施可能である。従って、本実施形態の記載内容のみで本発明を解釈すべきではない。また、本実施形態の全体を通して同じ要素には同じ符号を付けている。   Embodiments of the present invention will be described below. The present invention can be implemented in many different forms. Therefore, the present invention should not be construed based only on the description of the present embodiment. Also, the same reference numerals are given to the same elements throughout the present embodiment.

以下の実施の形態では、主に装置について説明するが、所謂当業者であれば明らかな通り、本発明は方法、及び、コンピュータを動作させるためのプログラムとしても実施できる。また、本発明はハードウェア、ソフトウェア、または、ハードウェア及びソフトウェアの実施形態で実施可能である。プログラムは、ハードディスク、CD−ROM、DVD−ROM、光記憶装置、または、磁気記憶装置等の任意のコンピュータ可読媒体に記録できる。さらに、プログラムはネットワークを介した他のコンピュータに記録することができる。   In the following embodiments, the apparatus will be mainly described. However, as is apparent to those skilled in the art, the present invention can also be implemented as a method and a program for operating a computer. In addition, the present invention can be implemented in hardware, software, or hardware and software embodiments. The program can be recorded on any computer-readable medium such as a hard disk, CD-ROM, DVD-ROM, optical storage device, or magnetic storage device. Furthermore, the program can be recorded on another computer via a network.

(本発明の第1の実施形態)
本実施形態に係る表示制御装置について、図1ないし図6を用いて説明する。図1は、本実施形態に係る表示制御装置のハードウェア構成図、図2は、本実施形態に係る表示制御装置の機能ブロック図、図3は、本実施形態に係る表示制御装置のテーブル構成の一例を示す図、図4は、本実施形態に係る表示制御装置の準備段階の動作を示すフローチャート、図5は、本実施形態に係る表示制御装置の業務段階の動作を示すフローチャート、図6は、本実施形態に係る表示制御装置の表示画面の一例を示す図である。
(First embodiment of the present invention)
A display control apparatus according to the present embodiment will be described with reference to FIGS. 1 is a hardware configuration diagram of a display control apparatus according to the present embodiment, FIG. 2 is a functional block diagram of the display control apparatus according to the present embodiment, and FIG. 3 is a table configuration of the display control apparatus according to the present embodiment. FIG. 4 is a flowchart illustrating an operation in a preparation stage of the display control apparatus according to the present embodiment. FIG. 5 is a flowchart illustrating an operation in a business stage of the display control apparatus according to the present embodiment. These are figures which show an example of the display screen of the display control apparatus which concerns on this embodiment.

(1.構成)
以下、本実施形態に係る表示制御装置の構成について説明する。図1において、コンピュータ1は、CPU(Central Processing Unit)101、RAM(Random Access Memory)102、ROM(Read Only Memory)103、フラッシュメモリ(Flash Memory)104、外部記憶装置であるHD(Hard Disk)105、LAN(Local Area Network)カード106、マウス107、キーボード108、ビデオカード109、このビデオカード109と電気的に接続する表示装置であるディスプレイ109a、サウンドカード110、このサウンドカード110と電気的に接続する音出力装置であるスピーカ/マイク110a及びフレキシブルディスク、CD−ROM、DVD−ROM等の記憶媒体を読み書きするドライブ111からなる。
なお、上記ハードウェア構成はあくまで一例を示したものであり、構成要素の変更をすることができるのは当然である。
(1. Configuration)
Hereinafter, the configuration of the display control apparatus according to the present embodiment will be described. In FIG. 1, a computer 1 includes a CPU (Central Processing Unit) 101, a RAM (Random Access Memory) 102, a ROM (Read Only Memory) 103, a flash memory (Flash Memory) 104, and an external storage device HD (Hard Disk). 105, a LAN (Local Area Network) card 106, a mouse 107, a keyboard 108, a video card 109, a display 109 a that is a display device electrically connected to the video card 109, a sound card 110, and the sound card 110 electrically Read / write from / to speaker / microphone 110a, which is a sound output device to be connected, and storage media such as a flexible disk, CD-ROM, and DVD-ROM It consists of a drive 111.
Note that the above hardware configuration is merely an example, and it is natural that the components can be changed.

図2において、表示制御装置200は、入力部210と変換部220と読上時間算出部230と表示制御部240とスクリプト情報250と変換情報260とを備える。
入力部210は、入力情報205の入力を受け付ける処理を行う。入力情報がスクリプト文の場合は、スクリプト情報250に情報を格納し、音声情報や経過時間情報の場合は読上時間算出部230、及び表示制御部240に情報を渡す。
変換部220は、スクリプト情報250の情報に格納されているスクリプト文を平仮名、又は片仮名に変換し、変換情報260に格納する処理を行う。
2, the display control apparatus 200 includes an input unit 210, a conversion unit 220, a reading time calculation unit 230, a display control unit 240, script information 250, and conversion information 260.
The input unit 210 performs processing for receiving input of the input information 205. If the input information is a script sentence, the information is stored in the script information 250. If the input information is voice information or elapsed time information, the information is passed to the reading time calculation unit 230 and the display control unit 240.
The conversion unit 220 converts the script text stored in the information of the script information 250 into hiragana or katakana and stores it in the conversion information 260.

読上時間算出部230は、スクリプト文の全発声数、当該スクリプト文を読み上げるために実際に発声した実発生数、及び対話に要した実対話時間に基づいて、スクリプト文を完結するのに必要な読上時間を算出する処理を行う。つまり、実発声数と実対話時間から読上速度を算出し、全発声数を読上速度で割ると全発声数に対する読上時間を算出することができる。   The reading time calculation unit 230 is necessary to complete the script sentence based on the total number of utterances of the script sentence, the actual number of utterances actually spoken to read the script sentence, and the actual conversation time required for the conversation. To calculate the reading time. That is, it is possible to calculate the reading time for the total number of utterances by calculating the reading speed from the actual number of utterances and the actual dialogue time and dividing the total number of utterances by the reading speed.

なお、読上時間算出部230が、読上時間を算出する場合に、予め設定されている質問の種別(2択形式の質問、語群選択の質問、内容形式の質問等)に応じて対話相手の回答時間を推定する推定手段を備え、推定された回答時間に基づいて読上時間を算出するようにしてもよい。例えば、2択形式の質問の場合は、「はい」か「いいえ」の回答しかないため、対話相手の回答時間を短く(例えば、3〜5秒程度)設定し、内容形式の質問の場合は、細かい内容を話すため、対話相手の回答時間を長く(例えば、30秒〜1分)設定して読上時間を算出するようにしてもよい。   In addition, when the reading time calculation unit 230 calculates the reading time, a dialogue is made according to a preset question type (two-choice question, word group selection question, content question, etc.). An estimation unit for estimating the answer time of the other party may be provided, and the reading time may be calculated based on the estimated answer time. For example, in the case of a two-choice question, since there are only “yes” or “no” answers, the answer time of the conversation partner is set short (for example, about 3 to 5 seconds). In order to speak detailed contents, the answering time of the conversation partner may be set long (for example, 30 seconds to 1 minute) to calculate the reading time.

表示制御部240は、読上時間算出部230が算出した読上時間、入力部210が入力した実対話時間、及び/又はスクリプト情報250に格納されるスクリプト文を読上情報としてディスプレイ109aに表示する処理を行う。   The display control unit 240 displays the reading time calculated by the reading time calculation unit 230, the actual conversation time input by the input unit 210, and / or the script text stored in the script information 250 on the display 109a as reading information. Perform the process.

スクリプト情報250は、入力部210が入力を受け付けたスクリプト文の情報を格納するデータ部である。
変換情報260は、変換部220により、平仮名又は片仮名に変換されたスクリプト文を格納するデータ部である。
The script information 250 is a data part that stores information on a script sentence that the input unit 210 has accepted.
The conversion information 260 is a data part for storing a script sentence converted into hiragana or katakana by the conversion unit 220.

ここで、スクリプト情報250と変換情報250の構成について詳細に説明する。図3(a)は、スクリプト情報テーブルのテーブル構成例、図3(b)は、変換情報テーブルのテーブル構成例である。図3(a)において、入力されたスクリプト文が文章ごとに区切られて格納されている。ここで格納されている情報は、変換元の情報として利用すると共に、画面に表示するための情報としても利用される。   Here, the configuration of the script information 250 and the conversion information 250 will be described in detail. FIG. 3A is a table configuration example of the script information table, and FIG. 3B is a table configuration example of the conversion information table. In FIG. 3A, the input script sentence is stored by being divided into sentences. The information stored here is used as information for conversion and also used as information for display on the screen.

図3(b)において、表示文、表示開始位置、表示の長さ、読み上げ方、及び読み上げ文字数がそれぞれ格納されている。表示文、表示開始位置、及び表示の長さは、読み上げた文字の表示態様を変更する際に利用する情報である。例えば、「わたくし」が音声情報で入力されると、1行目の1文字目から2文字分の表示態様が変更される。読み上げ方は、表示文を平仮名に変更した情報であり、読み上げ文字数は、読み上げに必要な発声数の情報である。つまり、読み上げ文字数を合計したものが、スクリプト文全文を読み上げるための全発声数となる。
以上が、本実施形態に係る表示制御装置の構成についての説明である。
In FIG. 3B, a display sentence, a display start position, a display length, a reading method, and a reading character number are stored. The display sentence, the display start position, and the display length are information used when changing the display mode of the read character. For example, when “Watakushi” is input as voice information, the display mode for two characters from the first character in the first line is changed. The reading method is information obtained by changing the display sentence to hiragana, and the number of characters to be read is information on the number of utterances necessary for reading. That is, the total number of utterances for reading out the entire script sentence is the sum of the number of characters read out.
The above is the description of the configuration of the display control apparatus according to the present embodiment.

(2.動作)
以下に、本実施形態に係る表示制御装置の動作について説明する。図4において、まず、準備段階の処理として、ケース別のスクリプト文が入力部210に入力され、スクリプト情報250に格納される(ステップS41)。ケース別というのは、対話の流れが場面により変化するため、その変化に対応できるように、様々なケースを想定してスクリプト文が入力される。スクリプト情報250に格納されたスクリプト文を全文平仮名、又は片仮名に変換されて、変換情報260に格納される(ステップS42)。
以上が準備段階の処理についての説明である。
(2. Operation)
The operation of the display control apparatus according to this embodiment will be described below. In FIG. 4, first, as a preparation stage process, a case-specific script sentence is input to the input unit 210 and stored in the script information 250 (step S <b> 41). By case, since the flow of dialogue changes depending on the scene, script sentences are input assuming various cases so that the change can be dealt with. The script text stored in the script information 250 is converted into a full text hiragana or katakana and stored in the conversion information 260 (step S42).
This completes the description of the preparation stage processing.

次に、業務段階における表示制御装置の動作について説明する。まず、これから実施する業務で利用するケースに該当するスクリプト文に対応する変換情報を変換情報260から読み込む(ステップS51)。スクリプト情報250の表示文を表示し、読上時間の初期計算を行う(ステップS52)。読上時間の初期計算の際には、読み上げた実績や経過時間の情報がないため、日本人の平均朗読速度である400文字=1分を用いて読上時間を計算する。つまり、スクリプト文の全文字数(全発声数)が400文字であった場合は、残り時間が60秒で表示される。このとき、スクリプト文の全文を平仮名、又は片仮名に変換し、発声数に基づいて計算される。
なお、初期計算の際には、上述のように日本人の平均朗読速度に基づいて計算してもよいし、発信者の過去の実績情報から、平均の読上速度を抽出して計算してもよい。
Next, the operation of the display control apparatus in the business stage will be described. First, the conversion information corresponding to the script sentence corresponding to the case to be used in the business to be implemented is read from the conversion information 260 (step S51). The display text of the script information 250 is displayed, and the initial reading time is calculated (step S52). In the initial calculation of the reading time, there is no information on the actual reading or the elapsed time, so the reading time is calculated using 400 characters = 1 minute which is the average reading speed of Japanese. That is, when the total number of characters (total number of utterances) in the script sentence is 400 characters, the remaining time is displayed in 60 seconds. At this time, the entire sentence of the script sentence is converted into hiragana or katakana and calculated based on the number of utterances.
In the initial calculation, it may be calculated based on the average reading speed of the Japanese as described above, or the average reading speed is extracted and calculated from the past performance information of the caller. Also good.

次に、発信者によりスクリプト文の読み上げが開始され(ステップS53)、読み上げ(対話)に要した経過時間が随時メモリに格納される。読み上げた音声を取得し、音声データを平仮名、又は片仮名に変換する(ステップS54)。音声データと変換情報260(図3における変換情報テーブル)の文字列を比較し(ステップS55)、変換情報テーブルが全て読み上げられていれば業務段階の処理を終了する。音声データと変換情報テーブルの文字列が一致していなければステップS54に戻る。音声データと変換情報テーブルの文字列が一致していれば、表示されているスクリプト文の該当する文字の表示態様を変化させて表示し(ステップS56)、対話の経過時間と読上文字数から読上速度を算出し、残りの読み上げに必要な時間を算出し、対話の経過時間とともにディスプレイ109aに表示する(ステップS57)。例えば、スクリプト文の全文字数(全発声数)が400文字で、52文字を読み上げるのに10秒掛かったとすると、残り時間は、残りの文字数÷今までの読上速度=(400文字−52文字)÷(52文字÷10秒)≒67(秒)となる。ステップS54からステップS57までの処理は、変換情報テーブルが全て読み上げられるか、対話が終了(通話が切断)されるまで繰り返して行われる。   Next, the caller starts reading the script sentence (step S53), and the elapsed time required for reading (dialogue) is stored in the memory as needed. The read voice is acquired, and the voice data is converted into hiragana or katakana (step S54). The voice data and the character string of the conversion information 260 (conversion information table in FIG. 3) are compared (step S55), and if all the conversion information table is read out, the process in the business stage is terminated. If the voice data does not match the character string of the conversion information table, the process returns to step S54. If the voice data matches the character string in the conversion information table, the display mode of the corresponding character in the displayed script sentence is changed and displayed (step S56), and the reading is performed from the elapsed time of the dialogue and the number of reading characters. The upper speed is calculated, the time required for the remaining reading is calculated, and displayed on the display 109a together with the elapsed time of the dialogue (step S57). For example, if the total number of characters (total number of utterances) in a script sentence is 400 characters and it takes 10 seconds to read 52 characters, the remaining time is the number of remaining characters / reading reading speed = (400 characters−52 characters) ) ÷ (52 characters ÷ 10 seconds) ≈67 (seconds). The processing from step S54 to step S57 is repeatedly performed until the entire conversion information table is read out or the dialogue is ended (call is disconnected).

上記処理における表示画面の一例を図6に示す。会話進捗状況グラフには、経過時間と残り時間が表示されており、現在の進捗率を視覚により直感的に把握することができる。この会話進捗状況グラフは、対話が進行するに従って常時更新されており、発信者は対話の状況をリアルタイムに把握することができる。例えば、発信者の質問に対する着信者の回答が長い場合には、読上速度が遅くなる(スクリプト文の読み上げは行われないが、経過時間は加算される)ため、常時更新処理が行われることで、リアルタイムに進捗率や残り時間を表示することができる。   An example of the display screen in the above processing is shown in FIG. In the conversation progress graph, the elapsed time and the remaining time are displayed, and the current progress rate can be intuitively grasped visually. This conversation progress status graph is constantly updated as the dialog progresses, and the caller can grasp the status of the dialog in real time. For example, if the caller's answer to the caller's question is long, the reading speed will be slow (the script will not be read out, but the elapsed time will be added), so it will always be updated. The progress rate and remaining time can be displayed in real time.

また、「あー、」や「えー、」等のスクリプト文に関係ない音声や、会話の流れで発生する挨拶等の音声が入力された場合も、スクリプト文の読み上げは行われないが、経過時間は加算されるため、読上速度が遅くなり、常時更新処理が行われることで、進捗率や残り時間をリアルタイムに表示することができる。   In addition, when a voice that is not related to a script sentence such as “Ah,” or “Eh,” or a voice such as a greeting that occurs in the flow of conversation is input, the script sentence is not read out, but the elapsed time Is added, the reading speed is slowed down, and the update rate is always performed, so that the progress rate and remaining time can be displayed in real time.

さらに、スクリプト文は様々なケースに応じて用意されているため、対話の進行パターンの変更に応じてスクリプト文も変更され、スクリプト文の全文字数にも変更が発生する。このような場合であっても、読上情報が常時更新処理されることで、リアルタイムに進捗率や残り時間を表示することができる。   Furthermore, since the script sentence is prepared according to various cases, the script sentence is also changed according to the change of the dialogue progress pattern, and the total number of characters of the script sentence is also changed. Even in such a case, the reading information is constantly updated, so that the progress rate and the remaining time can be displayed in real time.

スクリプト領域には、スクリプト文が表示されており、発信者はここに表示されたスクリプト文を読み上げて対話を進める。そして、表示されたスクリプト文の文字列と実際の音声データが一致する場合には、一致する文字列の表示態様が変化する。例えば、「わたくし、ふじつうぎんこう」まで読み上げると、表示されているスクリプト文の文字列と、実際の音声データが一致するため、図6に示すように「私、富士通銀行」までの表示態様が変化する。この変化の表示は、音声データと図3(b)の変換情報テーブルとを対応付けることで、容易に制御することができる。つまり、変換情報テーブルの表示開始位置と表示の長さから、音声データと一致するスクリプト文の文字列が、スクリプト領域に表示されているスクリプト文の何文字目から何文字分かを抽出することができるため、該当する文字列の表示態様を変化させればよい。仮に、「おいそがしいところおそれいります、わたくしふじつうぎんこう」と発声した場合は、「おいそがしいところおそれいります」までは表示態様に変化がなく、「わたくしふじつうぎんこう」を発声すると表示態様が変化する。   The script text is displayed in the script area, and the caller reads out the script text displayed here and proceeds with the dialogue. When the displayed character string of the script sentence matches the actual voice data, the display mode of the matching character string changes. For example, if you read “Wakakushi, Fujitsuin Ginko”, the character string of the displayed script sentence matches the actual voice data, so the display mode up to “I, Fujitsu Bank” as shown in FIG. Changes. The display of this change can be easily controlled by associating the audio data with the conversion information table shown in FIG. In other words, from the display start position and display length of the conversion information table, extract the character string of the script sentence that matches the voice data from what number of characters of the script sentence displayed in the script area. Therefore, the display mode of the corresponding character string may be changed. If you say `` I am afraid of a place where I am afraid, I am afraid of where I am, '' the display mode does not change until `` I am afraid of a place where I am afraid ''. Change.

なお、表示態様の変化は、色、フォント、太さ、大きさ、下線、塗りつぶし、点滅、又はそれらの組み合わせ等、発信者が視認できる変化であればよい。
「電話を掛ける」、及び「電話を切る」ボタンは、それぞれ電話を掛けたり電話を切る際にマウスで押下して操作する。
Note that the display mode may be changed as long as the caller can visually recognize, such as color, font, thickness, size, underline, fill, blink, or a combination thereof.
“Make a call” and “Hang up” buttons are operated by pressing the mouse to make or hang up the phone, respectively.

なお、上述したように、スクリプト文における<相手の返答>の箇所については、その質問種別から、予め回答時間を推定し、推定した値で会話進捗状況グラフの計算を行ってもよい。例えば、「田中様のお宅でしょうか?」は2択形式の質問であるため、回答時間は短く設定される。また、仮に「○○商品の使い心地はいかがでしたか?」といった質問がある場合は、内容形式の質問であるため、回答時間は長く設定される。
以上が、本実施形態に係る表示制御装置の動作についての説明である。
Note that, as described above, the answering time may be estimated in advance from the question type and the conversation progress status graph may be calculated using the estimated value for the portion of <partner response> in the script sentence. For example, “Is it your home?” Is a two-choice question, so the answer time is set short. In addition, if there is a question such as “How was the XX product comfortable to use?”, Since it is a question of the content format, the answer time is set long.
The above is the description of the operation of the display control apparatus according to the present embodiment.

このように、本実施形態に係る表示制御装置によれば、対話の流れを示す情報が記載されたスクリプト文を読み込んで、全文を平仮名、又はカタカナに変換し、変換した結果に基づいて、当該スクリプト文を読み上げる場合の全発声数を算出し、算出した全発声数、当該スクリプト文を読み上げるために実際に発声した実発声数、及び当該実発声数を発声するのに要した実発声時間に基づいて、当該スクリプト文を完結するのに必要な読上時間を算出し、当該読上時間、前記実発声時間、及び/又は前記スクリプト文を読上情報として画面上に表示するため、スクリプト文を完結させるのに要する残余時間や、対話の進捗具合を動的に確認しながら対話を行うことができ、発信者が、残り時間の把握ができないことで、気構えができないということがなくなる。   As described above, according to the display control apparatus according to the present embodiment, the script sentence in which the information indicating the flow of the dialogue is read, the whole sentence is converted into hiragana or katakana, and based on the converted result, Calculate the total number of utterances when reading a script sentence, and calculate the total number of utterances, the actual number of utterances actually spoken to read the script sentence, and the actual utterance time required to utter the actual number of utterances. In order to calculate the reading time required to complete the script sentence based on the script and display the reading time, the actual utterance time, and / or the script sentence as reading information on the screen, the script sentence The conversation can be conducted while dynamically confirming the remaining time required to complete the conversation and the progress of the conversation, and the caller cannot be prepared because the remaining time cannot be grasped. It is eliminated.

また、不慣れなテレホンオペレータが、残予測時間がわからないことで、ストレスを感じてしまうこともなく、ベテランテレホンオペレータにおいても、慣れすぎていることで逆に会話の進行を必要以上に早めて、相手に不快感を与えているケースを減少させることができる。   Also, unfamiliar telephone operators do not feel the stress because they do not know the remaining prediction time, and veteran telephone operators are too accustomed to conversely accelerate conversations more than necessary. The number of cases that are uncomfortable can be reduced.

さらに、スクリプト文を完結するのに必要な読上時間を算出する場合に、着信者の発声時間を実対話時間として含めているため、着信者の応答時間に従って、対話時間に関する情報(読上時間、実対話時間、残余時間等)を動的に表示することで、着信者の個性や、未知の対話内容の場合であっても、正確な対話時間に関する情報を表示して、業務を効率よく遂行することができる。   In addition, when calculating the reading time required to complete the script sentence, since the caller's utterance time is included as the actual dialog time, information on the dialog time (reading time) according to the response time of the callee , Actual conversation time, remaining time, etc.) dynamically, even if the content of the recipient is unknown or the content of the conversation is unknown, information about the exact conversation time is displayed, making work more efficient Can be carried out.

さらにまた、実際に発声された言葉とスクリプト文に記載された文字が一致する場合に、当該表示されたスクリプト文における実際に発声された文字の表示態様を変更するため、発信者が同じ行を重複して読み上げてしまったり、行を読み飛ばしてしまうといったことを防止することができる。   Furthermore, when the actually spoken word matches the character written in the script sentence, the caller changes the display mode of the actually spoken character in the displayed script sentence, It is possible to prevent reading aloud twice or skipping lines.

さらにまた、スクリプト文における質問の種別を特定し、特定された質問種別に応じて、対話相手の回答時間を推定し、推定された対話相手の回答時間に基づいて読上時間を算出するため、2択形式(例えば、はい/いいえ)の質問、語群選択(例えば、ア〜エから1つを選択)の質問、内容形式(例えば、感想を問う)の質問等に応じた正確な読上時間を算出することができ、より正確な対話時間に関する情報を表示することができる。   Furthermore, in order to identify the type of question in the script sentence, estimate the response time of the conversation partner according to the identified question type, and calculate the reading time based on the estimated response time of the conversation partner, Accurate reading according to two-choice (for example, yes / no) questions, word group selection (for example, select one from A to D) questions, content-type (for example, questions about impressions), etc. Time can be calculated, and more accurate information about the interaction time can be displayed.

(本発明の第2の実施形態)
本実施形態に係る表示制御装置について、図7及び図8を用いて説明する。図7は、本実施形態に係る表示制御装置の機能ブロック図、図8は、本実施形態に係る表示制御装置の表示画面の一例を示す図である。
(Second embodiment of the present invention)
The display control apparatus according to the present embodiment will be described with reference to FIGS. FIG. 7 is a functional block diagram of the display control apparatus according to the present embodiment, and FIG. 8 is a diagram illustrating an example of a display screen of the display control apparatus according to the present embodiment.

図7において、第1の実施形態に係る表示制御装置の機能ブロック図(図2)と比較して、実績情報710を新たに構成要素として備えている。
実績情報710は、一又は複数のオペレータが行った業務の実績情報が格納されているデータ部である。実績情報には、一又は複数のオペレータが過去に行ったスクリプト文ごとの実績情報が含まれており、具体的には対話に要した時間、読上速度、進捗情報等が含まれる。これらの情報は、入力部210、及び読上時間算出部230から入力され、表示制御部240に出力されてディスプレイ109aに表示される。なお、表示する際に、複数のオペレータの実績情報が格納されている場合には、その平均値を表示してもよい。
In FIG. 7, performance information 710 is newly provided as a component as compared with the functional block diagram (FIG. 2) of the display control apparatus according to the first embodiment.
The track record information 710 is a data part in which track record information of work performed by one or more operators is stored. The record information includes record information for each script sentence performed by one or more operators in the past, and specifically includes the time required for dialogue, reading speed, progress information, and the like. These pieces of information are input from the input unit 210 and the reading time calculation unit 230, output to the display control unit 240, and displayed on the display 109a. In addition, when displaying the performance information of a plurality of operators, the average value may be displayed.

実績情報が表示される場合の表示画面の一例について説明する。図8において、図6の場合と比較して、基準グラフが新たに表示されている。この基準グラフが実績情報710に基づいて表示される情報である。つまり、過去の実績の平均のグラフを基準グラフとして表示することで、進捗の程度や目標とする読上速度を常に確認することができ、対話の目安にすることができる。   An example of a display screen when the record information is displayed will be described. In FIG. 8, a reference graph is newly displayed as compared with the case of FIG. This reference graph is information displayed based on the result information 710. In other words, by displaying an average graph of past results as a reference graph, the degree of progress and the target reading speed can always be confirmed, which can be used as a guideline for dialogue.

図8の場合、基準グラフのほうが、会話進捗グラフに比べて進捗が進んでいる。つまり、過去の実績情報と比較して、現在の進捗が遅れていることが直感的にわかる。発信者は、進捗が遅れていることを認識することで、以降の対話をなるべく早く進めるように勤めることができる。   In the case of FIG. 8, the progress of the reference graph is progressing compared to the conversation progress graph. That is, it can be intuitively understood that the current progress is delayed as compared with the past performance information. By recognizing that the progress is delayed, the caller can work to advance the subsequent dialogue as soon as possible.

なお、ここでは、同じ時間における読み上げの進み具合を進捗情報として基準グラフにより示しているが、同じスクリプト文の同じ文字数を発声するのに、過去の実績情報ではどれくらいの時間を要したかを表示してもよい。   Here, the progress of reading at the same time is shown as a progress graph using the reference graph, but it shows how much time was spent in past performance information to say the same number of characters in the same script sentence. May be.

また、実績情報の平均値等をそのまま表示してもよいし、実績情報に基づく目標値(目安となる値)を算出して表示してもよい。特に、目標値を表示することは、1日のノルマ件数があるような場合に有効である。例えば、1日に50件のノルマがあるような場合には、1件を5分程度でおわらせる必要があるため、基準となる目標時間を設けることで、対話の速度を調整して業務を効率よく遂行することができる。   Moreover, the average value etc. of performance information may be displayed as it is, and the target value (value used as a standard) based on performance information may be calculated and displayed. In particular, displaying the target value is effective when there is a normal number of cases per day. For example, if there are 50 quotas per day, it is necessary to transfer one case in about 5 minutes. It can be carried out efficiently.

さらに、本実施形態に係る表示制御装置の動作は、第1の実施形態と同様であり、読上情報を表示すると共に、過去の実績情報に基づいた読上情報(基準グラフや対話に要した時間)を表示する点が異なる。
さらにまた、どの程度の進捗の遅れや進みが発生しているかを算出して表示してもよい。
Furthermore, the operation of the display control apparatus according to the present embodiment is the same as that of the first embodiment, and displays reading information and reading information based on past performance information (required for reference graphs and dialogues). (Time) is different.
Furthermore, how much progress delay or advance has occurred may be calculated and displayed.

(本発明の第3の実施形態)
本実施形態に係る表示制御装置について、図9ないし図12を用いて説明する。図9は、本実施形態に係る表示制御装置の機能ブロック図、図10は、本実施形態に係る表示制御装置の準備段階の動作を示すフローチャート、図11は、本実施形態に係る表示制御装置の業務段階の動作を示すフローチャート、図12は、本実施形態に係る表示制御装置の表示画面の一例を示す図である。
(Third embodiment of the present invention)
The display control apparatus according to the present embodiment will be described with reference to FIGS. FIG. 9 is a functional block diagram of the display control apparatus according to the present embodiment, FIG. 10 is a flowchart showing an operation in a preparation stage of the display control apparatus according to the present embodiment, and FIG. 11 is a display control apparatus according to the present embodiment. FIG. 12 is a diagram illustrating an example of a display screen of the display control apparatus according to the present embodiment.

本実施形態においては、スクリプト文を任意の項目に応じて複数のブロックに分割し、ブロックごとにユニークなキーワードを抽出する。それらの情報を用いて、より正確な読上情報を表示するものである。発信者が業務を進める上で、スクリプト文に記載された順番で対話が進めばよいが、会話の流れ上、スクリプト文の順番通りに対話が進まないこともある。例えば、スクリプト文においては、最後の方にある質問を、会話の流れ上、最初の方でしてしまうことがある。このような場合に、実際はスクリプト文を読み上げているにも関わらず、進捗に反映されないと、残り時間の算出が実際の値とずれを生じてしまう可能性がある。本実施形態においては、スクリプト文の順番に関わらず、読み上げられたスクリプト文のブロックについては、進捗に反映する。   In this embodiment, a script sentence is divided into a plurality of blocks according to arbitrary items, and a unique keyword is extracted for each block. Using such information, more accurate reading information is displayed. In order for the caller to proceed with the work, the dialogue should proceed in the order described in the script sentence. However, the conversation may not proceed in the order of the script sentence due to the flow of the conversation. For example, in a script sentence, a question at the end may be asked at the beginning of the conversation flow. In such a case, there is a possibility that the calculation of the remaining time may deviate from the actual value if it is not reflected in the progress even though the script sentence is actually read out. In the present embodiment, regardless of the order of the script sentences, the block of the read script sentence is reflected in the progress.

(1.構成)
図9において、第2の実施形態に係る表示制御装置の機能ブロック図(図7)と比較して、分割部910とキーワード抽出部920を新たに構成要素として備えている。
分割部910は、スクリプト情報250に格納されているスクリプト文を、任意の項目(例えば、質問ごと)に応じて、複数のブロックに分割する処理を行う。分割された情報は、キーワード抽出部920に渡されると共に、スクリプト情報250に格納される。
(1. Configuration)
In FIG. 9, compared with the functional block diagram (FIG. 7) of the display control apparatus according to the second embodiment, a dividing unit 910 and a keyword extracting unit 920 are newly provided as constituent elements.
The dividing unit 910 performs a process of dividing the script sentence stored in the script information 250 into a plurality of blocks according to arbitrary items (for example, for each question). The divided information is passed to the keyword extraction unit 920 and stored in the script information 250.

キーワード抽出部920は、分割部910で分割されたブロックごとにユニークなキーワードを抽出する処理を行う。抽出されたキーワードは、分割された情報と共にスクリプト情報250に格納される。   The keyword extraction unit 920 performs processing for extracting a unique keyword for each block divided by the division unit 910. The extracted keyword is stored in the script information 250 together with the divided information.

読上時間算出部230は、入力された音声データに、キーワード抽出部920で抽出されたキーワードが含まれているかどうかを判断し、含まれていなければ、スクリプト文が読み上げられていない(話が横道に逸れている)として、進捗を進めず(文字数をカウントせず)、含まれていれば、そのキーワードを含むスクリプト文が読み上げられているとして、進捗を進めて(文字数をカウントして)、読上時間の算出を行う。   The reading time calculation unit 230 determines whether or not the keyword extracted by the keyword extraction unit 920 is included in the input voice data. If the keyword is not included, the script sentence is not read out (the story is not read). If it is included, the script sentence containing the keyword is read out, and the progress is advanced (counting the number of characters). The reading time is calculated.

スクリプト情報250は、入力部210が入力を受け付けたスクリプト文の情報を格納すると共に、分割部910で複数に分割された情報、及びキーワード抽出部920で抽出されたキーワードを格納する。   The script information 250 stores information on a script sentence that the input unit 210 has accepted, and stores information divided into a plurality of pieces by the dividing unit 910 and keywords extracted by the keyword extracting unit 920.

変換情報260は、変換部220により、平仮名又は片仮名に変換されたスクリプト文を格納すると共に、分割部910で複数に分割された情報、及びキーワード抽出部920で抽出されたキーワードを格納する。このとき、キーワードは平仮名又は片仮名に変換されている。
入力部210、変換部220、表示制御部240、及び実績情報710の機能は、第1又は第2の実施形態と同様であるため説明は省略する。
The conversion information 260 stores the script sentence converted into hiragana or katakana by the conversion unit 220, and stores information divided into a plurality of pieces by the division unit 910 and the keywords extracted by the keyword extraction unit 920. At this time, the keyword is converted into hiragana or katakana.
Since the functions of the input unit 210, the conversion unit 220, the display control unit 240, and the record information 710 are the same as those in the first or second embodiment, description thereof will be omitted.

(2.動作)
図10において、まず、準備段階の処理として、ケース別のスクリプト文が入力部210に入力され、スクリプト情報250に格納される(ステップS1001)。スクリプト情報250に格納されたスクリプト文を分割部910が任意の項目に応じて複数のブロックに分割し、ブロックごとにユニークなキーワードを抽出する(ステップS1002)。変換部220により、スクリプト文がブロックごとに全文平仮名、又は片仮名に変換されて、変換情報260に格納される(ステップS1003)。このとき、キーワードも平仮名、又は片仮名に変換されて、変換情報260に格納される。
(2. Operation)
In FIG. 10, first, as a preparation stage process, a script sentence for each case is input to the input unit 210 and stored in the script information 250 (step S1001). The dividing unit 910 divides the script sentence stored in the script information 250 into a plurality of blocks according to an arbitrary item, and extracts a unique keyword for each block (step S1002). The script is converted into a full text hiragana or katakana for each block by the conversion unit 220 and stored in the conversion information 260 (step S1003). At this time, the keyword is also converted into hiragana or katakana and stored in the conversion information 260.

なお、ユニークなキーワードの抽出ができない場合もあり得るため、スクリプト文を作成する際にユニークなキーワードを予めスクリプト文に随所に挿入しておくことで対応するようにしてもよい。   Since there may be cases where unique keywords cannot be extracted, unique keywords may be inserted into the script sentence in advance when creating the script sentence.

また、各ブロックの先頭にユニークなキーワードが挿入されるようにすることで、音声データとキーワードの対応付けを、ブロックの冒頭が読上げられた段階で行うことができ、よりリアルな対話時間を表示することができる。従って、ブロックの先頭文字列(例えば、会話の切り出し方等)が、ブロックごとにユニークになるようにスクリプト文を作成しておくことが望ましい。
以上が準備段階の処理についての説明である。
In addition, by inserting a unique keyword at the beginning of each block, voice data and keywords can be associated with each other when the beginning of the block is read out, and a more realistic dialogue time is displayed. can do. Therefore, it is desirable to create a script sentence so that the first character string of the block (for example, how to cut out conversations) is unique for each block.
This completes the description of the preparation stage processing.

次に、業務段階における表示制御装置の動作について説明する。まず、これから実施する業務で利用するケースに該当するスクリプト文に対応する変換情報を変換情報260から読み込む(ステップS1101)。スクリプト情報250の表示文を表示し、読上時間の初期計算を行う(ステップS1102)。読上時間の初期計算方法は、上記第1の実施形態に場合と同じである。次に、発信者によりスクリプト文の読み上げが開始され(ステップS1103)、読み上げ(対話)に要した経過時間が随時メモリに格納される。読み上げた音声を取得し、音声データを平仮名、又は片仮名に変換する(ステップS1104)。変換した音声データの文字列に、キーワード抽出部920が抽出したキーワードが含まれるかどうかを判定し(ステップS1105)、含まれていなければステップS1104に戻る。含まれていれば、キーワードを含むブロックのスクリプト文を変換情報260(図3の変換情報テーブル)から抽出し(ステップS1106)、読み上げた音声データと抽出したスクリプト文とを比較する(ステップS1107)。   Next, the operation of the display control apparatus in the business stage will be described. First, conversion information corresponding to a script sentence corresponding to a case to be used in a business to be implemented is read from the conversion information 260 (step S1101). The display text of the script information 250 is displayed, and the initial reading time is calculated (step S1102). The initial calculation method of the reading time is the same as in the first embodiment. Next, reading of the script sentence is started by the caller (step S1103), and the elapsed time required for reading (dialog) is stored in the memory as needed. The read voice is acquired, and the voice data is converted into hiragana or katakana (step S1104). It is determined whether or not the keyword extracted by the keyword extraction unit 920 is included in the converted character string of the voice data (step S1105), and if not included, the process returns to step S1104. If included, the script sentence of the block including the keyword is extracted from the conversion information 260 (conversion information table in FIG. 3) (step S1106), and the read voice data is compared with the extracted script sentence (step S1107). .

変換情報テーブルが全て読み上げられていれば業務段階の処理を終了する。音声データと変換情報テーブルの文字列が一致していなければステップS1104に戻る。音声データと変換情報テーブルの文字列が一致していれば、表示されているスクリプト文の該当する文字の表示態様を変化させて表示し(ステップS1108)、対話の経過時間と読上文字数から読上速度を算出し、残りの読み上げに必要な時間を算出し、対話の経過時間とともにディスプレイ109aに表示する(ステップS1109)。ステップS1104からステップS1109までの処理は、変換情報テーブルが全て読み上げられるか、対話が終了(通話が切断)されるまで繰り返して行われる。   If all the conversion information tables have been read out, the processing in the business stage is terminated. If the voice data does not match the character string in the conversion information table, the process returns to step S1104. If the voice data matches the character string of the conversion information table, the display mode of the corresponding character of the displayed script sentence is changed (step S1108), and the reading is performed from the elapsed time of the dialogue and the number of characters read. The upper speed is calculated, the time required for the remaining reading is calculated, and displayed on the display 109a together with the elapsed time of the dialogue (step S1109). The processing from step S1104 to step S1109 is repeatedly performed until the entire conversion information table is read out or the dialogue is terminated (call is disconnected).

上記処理における表示画面の一例を図12に示す。ここでは、スクリプト領域が質問ごとに複数のブロック(領域1〜領域3)に分割されて表示されている。また、領域1のキーワードが「この度」、領域2のキーワードが「兄弟」、領域3のキーワードが「家族」であり、ユニークなキーワードとして抽出されているとする。   An example of the display screen in the above processing is shown in FIG. Here, the script area is displayed divided into a plurality of blocks (area 1 to area 3) for each question. In addition, it is assumed that the keyword of the region 1 is “this time”, the keyword of the region 2 is “siblings”, the keyword of the region 3 is “family”, and is extracted as a unique keyword.

対話の中で、「このたび」という音声データが入力されると、抽出されたキーワードと比較して、領域1の「この度」と一致すると判断されると、領域1のブロックが読み上げられていると判断して、読上時間の算出を行う。他の領域についても同様に、「きょうだい」という音声データが入力されると、領域2のブロックが読み上げられていると判断し、「かぞく」という音声データが入力されると、領域3のブロックが読み上げられていると判断される。   When voice data “this time” is input in the dialogue, the block of region 1 is read out when it is determined that it matches with “this time” of region 1 as compared with the extracted keyword. And reading time is calculated. Similarly, when the voice data “sibling” is input for the other areas, it is determined that the block in area 2 is read out, and when the voice data “kazoku” is input, area 3 Is determined to be read out.

図12においては、領域1の背景と領域3の背景色が変更されている。これは、読み上げられたブロックについては背景色を変更しているためである。つまり、図12においては、話の流れ上、領域1と領域3については先に読み上げが完了し、本来であれば領域1のブロックの後で、領域3のブロックの前に完了すべき領域2については読み上げが完了していないことを示す。このように、読み上げ済みのブロックと読み上げが未完のブロックを明確に表示することで、再び同じ質問を行ってしまったり、不要な質問を行うことを防止することが可能となる。   In FIG. 12, the background of region 1 and the background color of region 3 are changed. This is because the background color is changed for the read block. That is, in FIG. 12, the reading of the regions 1 and 3 is completed first in the flow of the story, and the region 2 to be completed after the block of the region 1 and before the block of the region 3 Indicates that reading is not complete. Thus, by clearly displaying the blocks that have been read out and the blocks that have not been read out, it is possible to prevent the same question from being asked again or an unnecessary question to be asked.

このように、本実施形態に係る表示制御装置によれば、スクリプト文を任意の項目に応じて複数のブロックに分割し、ブロックごとにユニークなキーワードを抽出し、抽出された任意の一のキーワードが発声された場合に、当該任意の一のキーワードを含む、ブロックが読み上げられたと判断して読上時間を算出するため、対話の流れ上スクリプト文の順番通りに対話が進まず、例えばスクリプト文の最後の質問を対話の最初の方で行ったような場合であっても、消化されたスクリプト文については、確実に読上時間として計上され、対話時間に関する情報を正確に表示することができる。   As described above, according to the display control apparatus according to the present embodiment, the script sentence is divided into a plurality of blocks according to an arbitrary item, a unique keyword is extracted for each block, and the extracted arbitrary one keyword In order to calculate the reading time by determining that the block containing the arbitrary keyword is read out and calculating the reading time, the dialogue does not proceed in the order of the script statement. Even if the last question was asked at the beginning of the dialogue, digested script sentences are reliably counted as reading time, and information about the dialogue time can be accurately displayed. .

また、読上時間算出手段にて読み上げられたと判断されたブロックについて、当該ブロックの読み上げが完結した場合には、当該ブロックの表示態様を変更して表示するため、読み上げ済みのブロックと読み上げが未完のブロックとを明確に区別して表示することができ、再び同じ質問を行ってしまったり、不要な質問を行うことを防止することすることができると共に、スクリプト文に記載された順番で対話が進まないような場合であっても、発信者が対話全体の流れを質問単位で把握することができるため、発信者の気持ちを安定させて、効率的な業務を遂行することができるという効果を奏する。   In addition, regarding the block that is determined to be read out by the reading time calculation means, when the reading of the block is completed, the display mode of the block is changed and displayed. Can be clearly distinguished from the previous block, and it is possible to prevent the same question from being asked again or unnecessary questions, and the dialogue proceeds in the order described in the script text. Even if there is no such situation, the caller can grasp the flow of the entire dialogue in units of questions, so that it is possible to stabilize the caller's feelings and perform efficient work. .

なお、上記実施形態に示すように、読み上げた文字列の表示態様を変更することで、読み上げた文字と読み上げていない文字を区別することが可能であるが、ブロックの背景色等も併せて変更することで、読み上げ済みかどうかの把握をより明確で確実に行うことができる。   In addition, as shown in the above embodiment, it is possible to distinguish the character that has been read out from the character that has not been read out by changing the display mode of the read character string, but the background color of the block is also changed. By doing so, it is possible to more clearly and reliably grasp whether or not it has been read out.

(その他の実施形態)
(1.属性の表示)
本実施形態に係る表示制御装置について、図13を用いて説明する。図13は、本実施形態に係る表示制御装置の表示画面の一例を示す図である。
図13において、画面上に本人属性と相手属性が表示されている。この属性は、実対話時間、当該実対話時間で発声した発声数、及び/又は当該実対話時間に対するスクリプト文の読上時間の割合等から決定される。
(Other embodiments)
(1. Display of attributes)
A display control apparatus according to the present embodiment will be described with reference to FIG. FIG. 13 is a diagram illustrating an example of a display screen of the display control apparatus according to the present embodiment.
In FIG. 13, the principal attribute and the partner attribute are displayed on the screen. This attribute is determined from the actual conversation time, the number of utterances uttered during the actual conversation time, and / or the ratio of the reading time of the script sentence with respect to the actual conversation time.

例えば、実対話時間が長い場合は、対話相手が、対話に対して好感を持っており、実対話時間が短い場合は、対話に対して嫌悪感を持っていると判断することができる。また、実対話時間で発声した発声数により、対話が早口で行われているかゆっくりとした口調で行われているかを判断することができる。これは、発信者側も着信者側も同様に判断することができる。対話が早口である場合には、せっかち型の人であると判断され、対話がゆっくりとした口調である場合には、おっとり型の人であると判断される(図13に例示)。   For example, when the actual dialogue time is long, it can be determined that the conversation partner has a good feeling for the dialogue, and when the real dialogue time is short, the dialogue partner has a sense of disgust. In addition, it is possible to determine whether the conversation is performed quickly or slowly based on the number of utterances uttered during the actual conversation time. This can be determined similarly on both the caller side and the callee side. When the dialogue is a quick mouth, it is determined that it is an impatient type person, and when the dialogue is a slow tone, it is judged that it is a moist type person (illustrated in FIG. 13).

さらに、実対話時間に対するスクリプト文の読上時間の割合により、割合が高ければ、横道に逸れず本題を中心に対話が行われ、割合が低ければ、横道に逸れた話題が多く行われたことになる。横道に逸れた話題が多く行われた場合には、その対話相手が話し好きな性格であると判断することができる(図13の相手属性に例示)。   Furthermore, depending on the ratio of the reading time of the script sentence to the actual conversation time, if the ratio was high, the conversation was centered on the main subject without going to the sideways, and if the percentage was low, many topics that were turned to the sideways were conducted. become. When a lot of topics deviating from the sideways are performed, it can be determined that the conversation partner has a personality that he / she likes to talk (illustrated in the partner attribute of FIG. 13).

これらの判断結果を対話者の属性として画面に表示する。場合によっては、例えば、「話し好き」で且つ「せっかち」という属性が表示される場合もある。つまり、上記の判断により複数の属性が決定される場合もある(図13に例示)。発信者側は、これらの属性を参考にしながら、対話のペースを調整したり、相手の性格に合わせた対話を行うことができる。
なお、この属性の表示は、対話の状況に応じてリアルタイムに変更してもよいし、対話が開始されてから、現時点までの平均データから属性を決定して表示してもよい。
These determination results are displayed on the screen as attributes of the interlocutor. In some cases, for example, the attribute “I like talking” and “Imperial” may be displayed. That is, a plurality of attributes may be determined by the above determination (illustrated in FIG. 13). The caller side can adjust the pace of the dialogue while referring to these attributes, and can carry out the dialogue according to the personality of the other party.
The display of the attribute may be changed in real time according to the state of the dialog, or the attribute may be determined from the average data up to the present time after the dialog is started and displayed.

このように、本実施形態に係る表示制御装置によれば、実対話時間、当該実対話時間で発声した発声数、及び/又は当該実対話時間に対するスクリプト文の読上時間の割合に基づいて、対話者の属性を設定して表示するため、発信者、及び着信者の対話属性(おっとり型、せっかち型等)に応じて対話を進めることができ、業務が効率良く遂行できる。   Thus, according to the display control apparatus according to the present embodiment, based on the actual conversation time, the number of utterances uttered during the actual conversation time, and / or the ratio of the reading time of the script sentence with respect to the actual conversation time, Since the attributes of the conversation person are set and displayed, the conversation can be proceeded according to the conversation attributes of the caller and the callee (such as a decoy type or an impregnation type), and work can be efficiently performed.

以上の前記各実施形態により本発明を説明したが、本発明の技術的範囲は実施形態に記載の範囲には限定されず、これら各実施形態に多様な変更又は改良を加えることが可能である。そして、かような変更又は改良を加えた実施の形態も本発明の技術的範囲に含まれる。このことは、特許請求の範囲及び課題を解決する手段からも明らかなことである。   Although the present invention has been described with the above embodiments, the technical scope of the present invention is not limited to the scope described in the embodiments, and various modifications or improvements can be added to these embodiments. . And embodiment which added such a change or improvement is also contained in the technical scope of the present invention. This is apparent from the claims and the means for solving the problems.

(2.付記)
前記各実施形態に関して次の付記を示す。
(付記1)音声対話を行う場合に、対話時間に関する情報を表示する表示制御装置であって、対話の流れを示す情報が記載されたスクリプト文を入力するスクリプト入力手段と、前記スクリプト入力手段が入力したスクリプト文を格納するスクリプト格納手段と、前記スクリプト格納手段が格納するスクリプト文を読み込んで、全文を平仮名、又はカタカナに変換する変換手段と、前記変換手段が変換した結果に基づいて、当該スクリプト文を読み上げる場合の全発声数を算出する発声数算出手段と、前記発声数算出手段が算出した全発声数、当該スクリプト文を読み上げるために実際に発声した実発声数、及び対話に要した実対話時間に基づいて、当該スクリプト文を完結するのに必要な読上時間を算出する読上時間算出手段と、前記読上時間算出手段が算出した読上時間に関する情報、前記実対話時間、及び/又は前記スクリプト文を読上情報として画面上に表示する表示制御手段とを備える表示制御装置。
(2. Appendix)
The following additional notes will be given with respect to the above embodiments.
(Supplementary note 1) A display control apparatus for displaying information related to a dialogue time when a voice dialogue is performed, a script input unit for inputting a script sentence in which information indicating a flow of the dialogue is described, and the script input unit includes: Based on the script storage means for storing the input script sentence, the conversion means for reading the script sentence stored by the script storage means and converting the whole sentence into hiragana or katakana, and the result of conversion by the conversion means, The number of utterances for calculating the total number of utterances when reading the script sentence, the total number of utterances calculated by the utterance number calculating means, the actual number of utterances actually spoken to read the script sentence, and the dialogue Reading time calculation means for calculating a reading time required to complete the script sentence based on the actual dialogue time; Information about between calculation means a reading time calculated is the actual interaction time, and / or display control apparatus and display control means for displaying on the screen the script text as a reading information.

(付記2)付記1に記載の表示制御装置において、前記表示制御手段が読上情報として表示するスクリプト文について、実際に発声された言葉と当該スクリプト文に記載された文字が一致する場合に、当該表示されたスクリプト文における実際に発声された文字の表示態様を変更する表示制御装置。   (Supplementary note 2) In the display control device according to supplementary note 1, when a script sentence displayed as reading information by the display control unit is matched with a word actually spoken and a character described in the script sentence, A display control device that changes a display mode of characters actually spoken in the displayed script sentence.

(付記3)付記1又は2に記載の表示制御装置において、前記スクリプト文を完結した場合の読上情報を、読上実績情報として当該スクリプト文ごとに記録する実績情報記録手段を備え、前記表示制御手段が前記読上情報を表示すると共に、当該読上情報として表示されるスクリプト文と同一のスクリプト文についての、前記実績情報記録手段が記録する読上実績情報の平均値を、標準読上情報として表示する表示制御装置。   (Supplementary note 3) In the display control device according to Supplementary note 1 or 2, the display control device includes achievement information recording means for recording the reading information when the script sentence is completed as reading achievement information for each script sentence. While the control means displays the reading information, the average value of the reading result information recorded by the result information recording means for the same script sentence as the script sentence displayed as the reading information is a standard reading A display control device that displays information.

(付記4)付記1ないし3のいずれかに記載の表示制御装置において、前記スクリプト文を任意の項目に応じて複数のブロックに分割する分割手段と、前記分割手段により複数に分割されたスクリプト文のブロックごとにユニークなキーワードを抽出する抽出手段とを備え、前記読上時間算出手段が、前記抽出手段にて抽出された任意の一のキーワードが発声された場合に、当該任意の一のキーワードを含むブロックが読み上げられたと判断して読上時間を算出する表示制御装置。   (Supplementary note 4) In the display control device according to any one of supplementary notes 1 to 3, a dividing unit that divides the script sentence into a plurality of blocks according to an arbitrary item, and a script sentence divided into a plurality of pieces by the dividing unit Extracting means for extracting a unique keyword for each block, and when the reading time calculating means utters any one keyword extracted by the extracting means, the one arbitrary keyword A display control device for calculating a reading time by determining that a block including the character is read out.

(付記5)付記4に記載の表示制御装置において、前記表示制御手段が、前記読上時間算出手段にて読み上げられたと判断されたブロックについて、当該ブロックの読み上げが完結した場合には、当該ブロックの表示態様を変更して表示する表示制御装置。   (Supplementary note 5) In the display control device according to supplementary note 4, when the display control unit completes reading the block for the block determined to be read by the reading time calculation unit, the block The display control apparatus which changes and displays the display mode.

(付記6)付記1ないし5のいずれかに記載の表示制御装置において、前記スクリプト文における質問の種別を特定する質問種別特定手段と、前記質問種別特定手段が特定する質問種別に応じて、対話相手の回答時間を推定する推定手段とを備え、前記読上時間算出手段が、前記推定手段が推定した対話相手の回答時間に基づいて読上時間を算出する表示制御装置。   (Supplementary note 6) In the display control device according to any one of supplementary notes 1 to 5, a question type specifying unit for specifying a question type in the script sentence, and a dialogue according to a question type specified by the question type specifying unit A display control apparatus comprising: an estimation unit configured to estimate a response time of the partner, wherein the reading time calculation unit calculates the reading time based on the response time of the conversation partner estimated by the estimation unit.

(付記7)付記1ないし6のいずれかに記載の表示制御装置において、前記実対話時間、当該実対話時間で発声した発声数、及び/又は当該実対話時間に対するスクリプト文の読上時間の割合に基づいて、対話者の属性を設定して表示する表示制御装置。   (Supplementary note 7) In the display control device according to any one of supplementary notes 1 to 6, the actual conversation time, the number of utterances uttered during the actual conversation time, and / or the ratio of the reading time of the script sentence to the actual conversation time Display control device that sets and displays the attributes of the interlocutor based on the above.

(付記8)音声対話を行う場合に、対話時間に関する情報を表示する表示制御方法であって、対話の流れを示す情報が記載されたスクリプト文を入力するスクリプト入力ステップと、前記スクリプト入力ステップで入力されたスクリプト文を格納し、当該格納されたスクリプト文を読み込んで、全文を平仮名、又はカタカナに変換する変換ステップと、前記変換ステップで変換された結果に基づいて、当該スクリプト文を読み上げる場合の全発声数を算出する発声数算出ステップと、前記発声数算出ステップで算出された全発声数、当該スクリプト文を読み上げるために実際に発声した実発声数、及び当該実発声数を発声するのに要した実発声時間に基づいて、当該スクリプト文を完結するのに必要な読上時間を算出する読上時間算出ステップと、前記読上時間算出ステップで算出された読上時間に関する情報、前記実発声時間、及び/又は前記スクリプト文を読上情報として画面上に表示する表示制御ステップとを含む表示制御方法。   (Supplementary Note 8) A display control method for displaying information related to a dialogue time when performing voice dialogue, a script input step for inputting a script sentence in which information indicating a flow of the dialogue is described, and the script input step When the input script sentence is stored, the stored script sentence is read, the whole sentence is converted into hiragana or katakana, and the script sentence is read out based on the result converted in the conversion step Utterance number calculating step for calculating the total number of utterances, the total utterance number calculated in the utterance number calculating step, the actual utterance number actually spoken to read out the script sentence, and the actual utterance number The reading time calculation step for calculating the reading time required to complete the script sentence based on the actual utterance time required for When the a reading time calculation information regarding a reading time calculated in step, the actual utterance time, and / or display control method and a display control step of displaying the script text on the screen as a reading information.

(付記9)付記8に記載の表示制御方法において、前記表示制御ステップで読上情報として表示されるスクリプト文について、実際に発声された言葉と当該スクリプト文に記載された文字が一致する場合に、当該表示されたスクリプト文における実際に発声された文字の表示態様を変更する表示制御方法。   (Supplementary note 9) In the display control method according to supplementary note 8, with respect to the script sentence displayed as the reading information in the display control step, when the actually spoken word matches the character described in the script sentence A display control method for changing a display mode of characters actually spoken in the displayed script sentence.

(付記10)付記8又は9に記載の表示制御方法において、前記スクリプト文を完結した場合の読上情報を、読上実績情報として当該スクリプト文ごとに記録し、前記表示制御ステップで前記読上情報が表示されると共に、当該読上情報として表示されるスクリプト文と同一のスクリプト文についての、前記記録された読上実績情報の平均値を、標準読上情報として表示する表示制御方法。   (Supplementary note 10) In the display control method according to supplementary note 8 or 9, reading information when the script sentence is completed is recorded for each script sentence as reading result information, and the reading control step performs the reading control step. A display control method for displaying, as standard reading information, an average value of the recorded reading result information for a script sentence that is the same as the script sentence displayed as the reading information as well as displaying information.

(付記11)付記8ないし10のいずれかに記載の表示制御方法において、前記スクリプト文を任意の項目に応じて複数のブロックに分割する分割ステップと、前記分割ステップで複数に分割されたスクリプト文のブロックごとにユニークなキーワードを抽出する抽出ステップとを含み、前記読上時間算出ステップで、前記抽出ステップにて抽出された任意の一のキーワードが発声された場合に、当該任意の一のキーワードを含むブロックが読み上げられたと判断して読上時間が算出される表示制御方法。   (Supplementary note 11) In the display control method according to any one of supplementary notes 8 to 10, a division step of dividing the script sentence into a plurality of blocks according to an arbitrary item, and a script sentence divided into a plurality of pieces in the division step An extraction step of extracting a unique keyword for each block, and when the arbitrary reading keyword extracted in the extraction step is uttered in the reading time calculation step, the arbitrary one keyword A display control method in which a reading time is calculated by determining that a block including a symbol has been read out.

(付記12)付記11に記載の表示制御方法において、前記表示制御ステップが、前記読上時間算出ステップにて読み上げられたと判断されたブロックについて、当該ブロックの読み上げが完結した場合には、当該ブロックの表示態様を変更して表示する表示制御方法。   (Supplementary note 12) In the display control method according to supplementary note 11, when the display control step has been read out for the block determined to have been read out in the reading time calculation step, the block Display control method for changing and displaying the display mode.

(付記13)付記8ないし12のいずれかに記載の表示制御方法において、前記スクリプト文における質問の種別を特定する質問種別特定ステップと、前記質問種別特定ステップで特定された質問種別に応じて、対話相手の回答時間を推定する推定ステップとを含み、前記読上時間算出ステップで、前記推定ステップにて推定された対話相手の回答時間に基づいて読上時間が算出される表示制御方法。   (Supplementary note 13) In the display control method according to any one of supplementary notes 8 to 12, according to a question type specifying step for specifying a question type in the script sentence, and a question type specified in the question type specifying step, A display control method in which the reading time is calculated based on the answer time of the conversation partner estimated in the estimation step in the reading time calculation step.

(付記14)付記8ないし13のいずれかに記載の表示制御方法において、前記実対話時間、当該実対話時間で発声した発声数、及び/又は当該実対話時間に対するスクリプト文の読上時間の割合に基づいて、対話者の属性を設定して表示する表示制御方法。   (Supplementary Note 14) In the display control method according to any one of Supplementary Notes 8 to 13, in the actual conversation time, the number of utterances uttered during the actual conversation time, and / or the ratio of the reading time of the script sentence to the actual conversation time Display control method to set and display the attributes of the interlocutor based on the.

(付記15)音声対話を行う場合に、対話時間に関する情報を表示するようにコンピュータを機能させる表示制御プログラムであって、対話の流れを示す情報が記載されたスクリプト文を入力するスクリプト入力手段、前記スクリプト入力手段が入力したスクリプト文を格納するスクリプト格納手段、前記スクリプト格納手段が格納するスクリプト文を読み込んで、全文を平仮名、又はカタカナに変換する変換手段、前記変換手段が変換した結果に基づいて、当該スクリプト文を読み上げる場合の全発声数を算出する発声数算出手段、前記発声数算出手段が算出した全発声数、当該スクリプト文を読み上げるために実際に発声した実発声数、及び当該実発声数を発声するのに要した実発声時間に基づいて、当該スクリプト文を完結するのに必要な読上時間を算出する読上時間算出手段、前記読上時間算出手段が算出した読上時間に関する情報、前記実発声時間、及び/又は前記スクリプト文を読上情報として画面上に表示する表示制御手段としてコンピュータを機能させる表示制御プログラム。   (Supplementary note 15) A display control program for causing a computer to function to display information related to a dialogue time when a voice dialogue is performed, script input means for inputting a script sentence in which information indicating a flow of dialogue is described, Script storage means for storing the script sentence input by the script input means, conversion means for reading the script sentence stored by the script storage means and converting the whole sentence into hiragana or katakana, based on the result of conversion by the conversion means Utterance number calculating means for calculating the total number of utterances when reading the script sentence, the total utterance number calculated by the utterance number calculating means, the actual utterance number actually uttered to read the script sentence, and the actual utterance number Necessary to complete the script sentence based on the actual utterance time required to utter the number of utterances. Reading time calculation means for calculating a reading time, a display for displaying information on the reading time calculated by the reading time calculation means, the actual speech time, and / or the script sentence on the screen as reading information A display control program for causing a computer to function as control means.

(付記16)付記15に記載の表示制御プログラムにおいて、前記表示制御手段が読上情報として表示するスクリプト文について、実際に発声された言葉と当該スクリプト文に記載された文字が一致する場合に、当該表示されたスクリプト文における実際に発声された文字の表示態様を変更する表示制御プログラム。   (Supplementary note 16) In the display control program according to supplementary note 15, when a script sentence displayed as read-out information by the display control means matches a word actually spoken and a character described in the script sentence, A display control program for changing a display mode of characters actually spoken in the displayed script sentence.

(付記17)付記15又は16に記載の表示制御プログラムにおいて、前記スクリプト文を完結した場合の読上情報を、読上実績情報として当該スクリプト文ごとに記録する実績情報記録手段としてコンピュータを機能させ、前記表示制御手段が前記読上情報を表示すると共に、当該読上情報として表示されるスクリプト文と同一のスクリプト文についての、前記実績情報記録手段が記録する読上実績情報の平均値を、標準読上情報として表示する表示制御プログラム。   (Supplementary note 17) In the display control program according to supplementary note 15 or 16, the computer is caused to function as record information recording means for recording the read information when the script sentence is completed as the read record information for each script sentence. The display control means displays the reading information, and the average value of the reading achievement information recorded by the achievement information recording means for the same script sentence as the script sentence displayed as the reading information, Display control program to display as standard reading information.

(付記18)付記15ないし17のいずれかに記載の表示制御プログラムにおいて、前記スクリプト文を任意の項目に応じて複数のブロックに分割する分割手段、前記分割手段により複数に分割されたスクリプト文のブロックごとにユニークなキーワードを抽出する抽出手段としてコンピュータを機能させ、前記読上時間算出手段が、前記抽出手段にて抽出された任意の一のキーワードが発声された場合に、当該任意の一のキーワードを含むブロックが読み上げられたと判断して読上時間を算出する表示制御プログラム。   (Supplementary note 18) In the display control program according to any one of Supplementary notes 15 to 17, a dividing unit that divides the script sentence into a plurality of blocks according to an arbitrary item, and a script sentence divided into a plurality of pieces by the dividing unit When the computer functions as an extraction unit that extracts a unique keyword for each block, and the reading time calculation unit utters any one keyword extracted by the extraction unit, the arbitrary one A display control program for calculating a reading time by determining that a block including a keyword has been read out.

(付記19)付記18に記載の表示制御プログラムにおいて、前記表示制御手段が、前記読上時間算出手段にて読み上げられたと判断されたブロックについて、当該ブロックの読み上げが完結した場合には、当該ブロックの表示態様を変更して表示する表示制御プログラム。   (Supplementary note 19) In the display control program according to supplementary note 18, when the block of the block determined to be read by the reading time calculation unit is completed by the display control unit, Display control program for changing and displaying the display mode.

(付記20)付記15ないし19のいずれかに記載の表示制御プログラムにおいて、前記スクリプト文における質問の種別を特定する質問種別特定手段、前記質問種別特定手段が特定する質問種別に応じて、対話相手の回答時間を推定する推定手段としてコンピュータを機能させ、前記読上時間算出手段が、前記推定手段が推定した対話相手の回答時間に基づいて読上時間を算出する表示制御プログラム。   (Supplementary note 20) In the display control program according to any one of Supplementary notes 15 to 19, in accordance with the question type specified by the question type specifying means for specifying the question type in the script sentence, and the question type specified by the question type specifying means, the conversation partner A display control program for causing a computer to function as an estimating means for estimating the answering time of the user, and for the reading time calculating means to calculate the reading time based on the answering time of the conversation partner estimated by the estimating means.

(付記21)付記15ないし20のいずれかに記載の表示制御プログラムにおいて、前記実対話時間、当該実対話時間で発声した発声数、及び/又は当該実対話時間に対するスクリプト文の読上時間の割合に基づいて、対話者の属性を設定して表示する表示制御プログラム。   (Supplementary note 21) In the display control program according to any one of Supplementary notes 15 to 20, the actual conversation time, the number of utterances uttered during the actual conversation time, and / or the ratio of the reading time of the script sentence to the actual conversation time A display control program that sets and displays the attributes of the interlocutor based on.

第1の実施形態に係る表示制御装置のハードウェア構成図である。It is a hardware block diagram of the display control apparatus which concerns on 1st Embodiment. 第1の実施形態に係る表示制御装置の機能ブロック図である。It is a functional block diagram of a display control device concerning a 1st embodiment. 第1の実施形態に係る表示制御装置のテーブル構成の一例を示す図である。It is a figure which shows an example of the table structure of the display control apparatus which concerns on 1st Embodiment. 第1の実施形態に係る表示制御装置の準備段階の動作を示すフローチャートである。It is a flowchart which shows the operation | movement of the preparation stage of the display control apparatus which concerns on 1st Embodiment. 第1の実施形態に係る表示制御装置の業務段階の動作を示すフローチャートである。It is a flowchart which shows the operation | movement of the work stage of the display control apparatus which concerns on 1st Embodiment. 第1の実施形態に係る表示制御装置の表示画面の一例を示す図である。It is a figure which shows an example of the display screen of the display control apparatus which concerns on 1st Embodiment. 第2の実施形態に係る表示制御装置の機能ブロック図である。It is a functional block diagram of the display control apparatus which concerns on 2nd Embodiment. 第2の実施形態に係る表示制御装置の表示画面の一例を示す図である。It is a figure which shows an example of the display screen of the display control apparatus which concerns on 2nd Embodiment. 第3の実施形態に係る表示制御装置の機能ブロック図である。It is a functional block diagram of the display control apparatus which concerns on 3rd Embodiment. 第3の実施形態に係る表示制御装置の準備段階の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the preparation stage of the display control apparatus which concerns on 3rd Embodiment. 第3の実施形態に係る表示制御装置の業務段階の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the work stage of the display control apparatus which concerns on 3rd Embodiment. 第3の実施形態に係る表示制御装置の表示画面の一例を示す図である。It is a figure which shows an example of the display screen of the display control apparatus which concerns on 3rd Embodiment. その他の実施形態に係る表示制御装置の表示画面の一例を示す図である。It is a figure which shows an example of the display screen of the display control apparatus which concerns on other embodiment.

符号の説明Explanation of symbols

1 コンピュータ
101 CPU
102 RAM
103 ROM
104 フラッシュメモリ
105 HD
106 LANカード
107 マウス
108 キーボード
109 ビデオカード
109a ディスプレイ
110 サウンドカード
110a スピーカ/マイク
111 ドライブ
200 表示制御装置
205 入力情報
210 入力部
220 変換部
230 読上時間算出部
240 表示制御部
250 スクリプト情報
260 変換情報
710 実績情報
910 分割部
920 キーワード抽出部
1 Computer 101 CPU
102 RAM
103 ROM
104 Flash memory 105 HD
106 LAN card 107 Mouse 108 Keyboard 109 Video card 109a Display 110 Sound card 110a Speaker / microphone 111 Drive 200 Display control device 205 Input information 210 Input unit 220 Conversion unit 230 Reading time calculation unit 240 Display control unit 250 Script information 260 Conversion information 710 Result information 910 Division unit 920 Keyword extraction unit

Claims (8)

音声対話を行う場合に、対話時間に関する情報を表示する表示制御装置であって、
対話の流れを示す情報が記載されたスクリプト文を入力するスクリプト入力手段と、
前記スクリプト入力手段が入力したスクリプト文を格納するスクリプト格納手段と、
前記スクリプト格納手段が格納するスクリプト文を読み込んで、全文を平仮名、又はカタカナに変換する変換手段と、
前記変換手段が変換した結果に基づいて、当該スクリプト文を読み上げる場合の全発声数を算出する発声数算出手段と、
前記発声数算出手段が算出した全発声数、当該スクリプト文を読み上げるために実際に発声した実発声数、及び対話に要した実対話時間に基づいて、当該スクリプト文を完結するのに必要な読上時間を算出する読上時間算出手段と、
前記読上時間算出手段が算出した読上時間に関する情報、前記実対話時間、及び/又は前記スクリプト文を読上情報として画面上に表示する表示制御手段とを備える表示制御装置。
A display control device that displays information about dialogue time when performing voice dialogue,
Script input means for inputting a script sentence in which information indicating a flow of dialogue is described;
Script storage means for storing a script sentence input by the script input means;
Conversion means for reading a script sentence stored by the script storage means and converting the whole sentence into hiragana or katakana;
Based on the result of conversion by the conversion means, the number of utterances calculating means for calculating the total number of utterances when reading the script sentence;
Based on the total number of utterances calculated by the utterance number calculating means, the actual number of utterances actually spoken to read the script sentence, and the actual conversation time required for the conversation, the reading necessary to complete the script sentence is required. Reading time calculation means for calculating an upper time;
A display control apparatus comprising: display control means for displaying information on the reading time calculated by the reading time calculation means, the actual dialogue time, and / or the script sentence on the screen as reading information.
請求項1に記載の表示制御装置において、
前記表示制御手段が読上情報として表示するスクリプト文について、実際に発声された言葉と当該スクリプト文に記載された文字が一致する場合に、当該表示されたスクリプト文における実際に発声された文字の表示態様を変更する表示制御装置。
The display control device according to claim 1,
Regarding the script sentence displayed as the reading information by the display control means, when the actually spoken word matches the character described in the script sentence, the character of the actually spoken letter in the displayed script sentence A display control device for changing a display mode.
請求項1又は2に記載の表示制御装置において、
前記スクリプト文を完結した場合の読上情報を、読上実績情報として当該スクリプト文ごとに記録する実績情報記録手段を備え、
前記表示制御手段が前記読上情報を表示すると共に、当該読上情報として表示されるスクリプト文と同一のスクリプト文についての、前記実績情報記録手段が記録する読上実績情報の平均値を、標準読上情報として表示する表示制御装置。
In the display control device according to claim 1 or 2,
A performance information recording means for recording the reading information when the script sentence is completed as the reading performance information for each script sentence,
The display control means displays the reading information, and the average value of the reading achievement information recorded by the achievement information recording means for the same script sentence as the script sentence displayed as the reading information is standard. Display control device that displays as reading information.
請求項1ないし3のいずれかに記載の表示制御装置において、
前記スクリプト文を任意の項目に応じて複数のブロックに分割する分割手段と、
前記分割手段により複数に分割されたスクリプト文のブロックごとにユニークなキーワードを抽出する抽出手段とを備え、
前記読上時間算出手段が、前記抽出手段にて抽出された任意の一のキーワードが発声された場合に、当該任意の一のキーワードを含むブロックが読み上げられたと判断して読上時間を算出する表示制御装置。
The display control device according to any one of claims 1 to 3,
Dividing means for dividing the script sentence into a plurality of blocks according to arbitrary items;
An extraction means for extracting a unique keyword for each block of the script sentence divided into a plurality by the dividing means,
When the reading time calculation unit utters any one keyword extracted by the extraction unit, the reading time calculation unit determines that a block including the one keyword is read and calculates reading time Display control device.
音声対話を行う場合に、対話時間に関する情報を表示する表示制御方法であって、
対話の流れを示す情報が記載されたスクリプト文を入力するスクリプト入力ステップと、
前記スクリプト入力ステップで入力されたスクリプト文を格納し、当該格納されたスクリプト文を読み込んで、全文を平仮名、又はカタカナに変換する変換ステップと、
前記変換ステップで変換された結果に基づいて、当該スクリプト文を読み上げる場合の全発声数を算出する発声数算出ステップと、
前記発声数算出ステップで算出された全発声数、当該スクリプト文を読み上げるために実際に発声した実発声数、及び当該実発声数を発声するのに要した実発声時間に基づいて、当該スクリプト文を完結するのに必要な読上時間を算出する読上時間算出ステップと、
前記読上時間算出ステップで算出された読上時間に関する情報、前記実発声時間、及び/又は前記スクリプト文を読上情報として画面上に表示する表示制御ステップとを含む表示制御方法。
A display control method for displaying information about a dialogue time when performing a voice dialogue,
A script input step for inputting a script sentence in which information indicating a flow of dialogue is described;
Storing the script sentence input in the script input step, reading the stored script sentence, and converting the entire sentence into hiragana or katakana;
Based on the result converted in the conversion step, the number of utterances calculating step for calculating the total number of utterances when reading the script sentence;
Based on the total number of utterances calculated in the utterance number calculating step, the actual number of utterances actually spoken to read out the script sentence, and the actual utterance time required to utter the actual utterance number, A reading time calculating step for calculating a reading time necessary for completing
A display control method comprising: a display control step of displaying information on the reading time calculated in the reading time calculating step, the actual utterance time, and / or the script sentence as reading information on a screen.
請求項5に記載の表示制御方法において、
前記表示制御ステップで読上情報として表示されるスクリプト文について、実際に発声された言葉と当該スクリプト文に記載された文字が一致する場合に、当該表示されたスクリプト文における実際に発声された文字の表示態様を変更する表示制御方法。
The display control method according to claim 5,
Regarding the script sentence displayed as reading information in the display control step, when the actually spoken word matches the character described in the script sentence, the actually spoken character in the displayed script sentence A display control method for changing the display mode.
音声対話を行う場合に、対話時間に関する情報を表示するようにコンピュータを機能させる表示制御プログラムであって、
対話の流れを示す情報が記載されたスクリプト文を入力するスクリプト入力手段、
前記スクリプト入力手段が入力したスクリプト文を格納するスクリプト格納手段、
前記スクリプト格納手段が格納するスクリプト文を読み込んで、全文を平仮名、又はカタカナに変換する変換手段、
前記変換手段が変換した結果に基づいて、当該スクリプト文を読み上げる場合の全発声数を算出する発声数算出手段、
前記発声数算出手段が算出した全発声数、当該スクリプト文を読み上げるために実際に発声した実発声数、及び当該実発声数を発声するのに要した実発声時間に基づいて、当該スクリプト文を完結するのに必要な読上時間を算出する読上時間算出手段、
前記読上時間算出手段が算出した読上時間に関する情報、前記実発声時間、及び/又は前記スクリプト文を読上情報として画面上に表示する表示制御手段としてコンピュータを機能させる表示制御プログラム。
A display control program for causing a computer to function to display information about a dialogue time when performing a voice dialogue,
Script input means for inputting a script sentence in which information indicating a flow of dialogue is described;
Script storage means for storing a script sentence input by the script input means;
Conversion means for reading a script sentence stored by the script storage means and converting the whole sentence into hiragana or katakana;
Based on the result converted by the conversion means, the number of utterances calculating means for calculating the total number of utterances when reading the script sentence;
Based on the total number of utterances calculated by the utterance number calculating means, the actual number of utterances actually spoken to read the script sentence, and the actual utterance time required to utter the actual utterance number, Reading time calculation means for calculating the reading time required for completion,
A display control program for causing a computer to function as display control means for displaying information related to reading time calculated by the reading time calculation means, the actual utterance time, and / or the script sentence on the screen as reading information.
請求項7に記載の表示制御プログラムにおいて、
前記表示制御手段が読上情報として表示するスクリプト文について、実際に発声された言葉と当該スクリプト文に記載された文字が一致する場合に、当該表示されたスクリプト文における実際に発声された文字の表示態様を変更する表示制御プログラム。
In the display control program according to claim 7,
Regarding the script sentence displayed as the reading information by the display control means, when the actually spoken word matches the character described in the script sentence, the character of the actually spoken letter in the displayed script sentence A display control program for changing the display mode.
JP2008250422A 2008-09-29 2008-09-29 Display control apparatus, display control method, and display control program Expired - Fee Related JP5187102B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008250422A JP5187102B2 (en) 2008-09-29 2008-09-29 Display control apparatus, display control method, and display control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008250422A JP5187102B2 (en) 2008-09-29 2008-09-29 Display control apparatus, display control method, and display control program

Publications (2)

Publication Number Publication Date
JP2010081529A true JP2010081529A (en) 2010-04-08
JP5187102B2 JP5187102B2 (en) 2013-04-24

Family

ID=42211409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008250422A Expired - Fee Related JP5187102B2 (en) 2008-09-29 2008-09-29 Display control apparatus, display control method, and display control program

Country Status (1)

Country Link
JP (1) JP5187102B2 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0580726A (en) * 1991-09-20 1993-04-02 Nec Corp Speech table
JPH07110807A (en) * 1993-10-13 1995-04-25 Hitachi Ltd Document reader
JPH10290717A (en) * 1997-04-18 1998-11-04 Fujitsu General Ltd Platform system
JP2002169588A (en) * 2000-11-16 2002-06-14 Internatl Business Mach Corp <Ibm> Text display device, text display control method, storage medium, program transmission device, and reception supporting method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0580726A (en) * 1991-09-20 1993-04-02 Nec Corp Speech table
JPH07110807A (en) * 1993-10-13 1995-04-25 Hitachi Ltd Document reader
JPH10290717A (en) * 1997-04-18 1998-11-04 Fujitsu General Ltd Platform system
JP2002169588A (en) * 2000-11-16 2002-06-14 Internatl Business Mach Corp <Ibm> Text display device, text display control method, storage medium, program transmission device, and reception supporting method

Also Published As

Publication number Publication date
JP5187102B2 (en) 2013-04-24

Similar Documents

Publication Publication Date Title
KR101143034B1 (en) Centralized method and system for clarifying voice commands
US6567503B2 (en) Real-time transcription correction system
JP4757599B2 (en) Speech recognition system, speech recognition method and program
AU2004201992A1 (en) Semantic object synchronous understanding implemented with speech application language tags
US11574633B1 (en) Enhanced graphical user interface for voice communications
TW201214413A (en) Modification of speech quality in conversations over voice channels
US20210193148A1 (en) Transcript correction through programmatic comparison of independently generated transcripts
CN111653265A (en) Speech synthesis method, speech synthesis device, storage medium and electronic equipment
WO2018043138A1 (en) Information processing device, information processing method, and program
JP2003066991A (en) Method and apparatus for outputting voice recognition result and recording medium with program for outputting and processing voice recognition result recorded thereon
JP4354299B2 (en) Case search program, case search method, and case search device
JP2022043263A (en) Response history creation support device, support method, program, and display device for response history creation
JP6254504B2 (en) Search server and search method
KR100898104B1 (en) Learning system and method by interactive conversation
US6658386B2 (en) Dynamically adjusting speech menu presentation style
JPH1138863A (en) Language information apparatus
JP2022025665A (en) Summary sentence generation device, summary sentence generation method, and program
JP3936351B2 (en) Voice response service equipment
JP2018181018A (en) Conversation providing device, conversation providing method, and program
JP5187102B2 (en) Display control apparatus, display control method, and display control program
JP4042435B2 (en) Voice automatic question answering system
JP2005024815A (en) System, device, method, and program for language learning, and recording medium for recording the program
Tsuji The case study of high pitch register in English and in Japanese: Does high pitch register relate to politeness
US11902466B2 (en) Captioned telephone service system having text-to-speech and answer assistance functions
JP6551852B1 (en) Information providing apparatus, information providing method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110708

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130107

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160201

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5187102

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees