JPH04167749A - Audio response equipment - Google Patents

Audio response equipment

Info

Publication number
JPH04167749A
JPH04167749A JP2292147A JP29214790A JPH04167749A JP H04167749 A JPH04167749 A JP H04167749A JP 2292147 A JP2292147 A JP 2292147A JP 29214790 A JP29214790 A JP 29214790A JP H04167749 A JPH04167749 A JP H04167749A
Authority
JP
Japan
Prior art keywords
response
voice
audio
section
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2292147A
Other languages
Japanese (ja)
Inventor
Yoshiyuki Hara
義幸 原
Masaki Egawa
雅樹 江川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP2292147A priority Critical patent/JPH04167749A/en
Publication of JPH04167749A publication Critical patent/JPH04167749A/en
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems

Abstract

PURPOSE:To output an audio message with high quality easily listened to as a response by obtaining an audio by means of the rule synthesis system from only a part of a response message from which the audio is not obtained by a recording edit system. CONSTITUTION:This equipment consists of a telephone set 1, a communication line 2, a line control section 3, a PB signal reception transmission section 4, an audio recognition section 5, a host computer 6, a customer code conversion table 7, a response section (1st audio response section by recording edit system) 8, an audio rule synthesis section (2nd audio response section by rule synthesis system) 9 and an accept dictionary 10. When the information with respect to the recognition result of the entered information is outputted in audio as a response, the audio outputted basically as a response is generated by the recording edit system and the audio not generated by the recording edit system is generated and outputted by the rule synthesis system. Thus, the audio outputted as a response is brought into the audio with high quality easily listened to.

Description

【発明の詳細な説明】 [発明の目的コ (産業上の利用分野) 本発明は入力情報に対する応答情報を、聞き取り易い音
声にて応答出力することのできる音声応答装置に関する
DETAILED DESCRIPTION OF THE INVENTION [Purpose of the Invention (Field of Industrial Application) The present invention relates to a voice response device capable of outputting response information to input information in an easily audible voice.

(従来の技術) 近時、銀行業務等におけるテレホンサービスや、デパー
ト等における催し物案内サービスにおいて、電話を介し
て音声やブツシュホン信号として入力される問い合わせ
情報を認識し、その認識結果に対する回答情報を音声に
より通知する音声応答装置が注目されている。
(Prior art) Recently, in telephone services in banking, etc., and event information services in department stores, etc., inquiry information input via the telephone as a voice or a phone signal is recognized, and response information in response to the recognition result is provided by voice. Voice response devices that provide notifications are attracting attention.

この種の音声応答装置では、例えば予め応答内容が定ま
っている r毎度ご利用戴きましてありがとうごさいます。」「お
問い合わせの**についてお知らせします。」等の定型
文と、問い合わせ内容に応じて種々変化する応答情報を
含む非定型文とに分け、上記定型文を録音編集方式によ
り生成し、多種多様に変化する非定型文については規則
合成方式により生成□ することが試みられている。
With this type of voice response device, for example, the response content is predetermined.Thank you for using the device. ”, “We would like to inform you about your inquiry.”, and non-standard sentences that include response information that changes in various ways depending on the content of the inquiry.The above-mentioned standard sentences are generated using a recording editing method, and various types of sentences are generated. Attempts have been made to generate □ non-standard sentences that change in a variety of ways using a rule composition method.

尚、録音編集方式は、予め録音収集した各種の音声メツ
セージを組み合わせ編集して応答出力すべき音声を得る
ものてあり、PCMやADPCM等の技術の導入により
、高品質な応答音声を得ることができると云う特徴を持
つ。然し乍ら、予め録音収集し、音声ファイルとして保
存しておく音声メツセージの数に限りかある。これ故、
多種多様に変化する応答情報の全てに対処してその音声
を生成することが困難である。また音声データを追加登
録することも困難であり、応答出力しようとする定型文
に応して種々の音声データを編集する作業自体も非割に
困難であると云う問題かある。
Note that the recording editing method combines and edits various voice messages that have been recorded and collected in advance to obtain the voice to be output as a response, and by introducing technologies such as PCM and ADPCM, it is possible to obtain high-quality response voices. It has the characteristic that it can be done. However, there is a limit to the number of voice messages that can be recorded in advance and stored as voice files. Therefore,
It is difficult to generate voice by dealing with all of the response information that changes in a wide variety of ways. Further, it is difficult to additionally register voice data, and the task of editing various voice data in accordance with the fixed phrase to be output as a response is also extremely difficult.

この点、規則合成方式は、単語に対する品詞。In this respect, the rule composition method uses parts of speech for words.

読み、アクセント型等の情報を格納したアクセント辞書
を備え、文字列として与えられる応答情報を上記アクセ
ント辞書を参照して音声を規則合成するので、多種多様
に変化する文字列が与えられた場合であっても、アクセ
ントが付された音声を比較的容易に生成することかでき
る。
It is equipped with an accent dictionary that stores information such as pronunciations and accent types, and uses response information given as character strings to synthesize speech in a regular manner by referring to the accent dictionary. However, it is relatively easy to generate accented speech.

しかしこの録音編集方式にあっては、アクセント辞書に
登録されていない文字列(非定型文)が与えられた場合
、規則合成する音声にアクセントをイ」与することかで
きないので、この場合にはアクセントのない平板型の音
声しか生成することができない。しかも前記録音編集方
式により生成される音声と比較した場合、その音声品質
か劣ることか否めず、規則合成された音声に馴染みのな
い者にとっては聞き取り難いと云う問題もある。
However, with this recording/editing method, if a character string (non-standard sentence) that is not registered in the accent dictionary is given, it is not possible to add an accent to the voice that is synthesized according to the rules. It is only possible to generate flat, unaccented voices. Moreover, when compared with the audio generated by the recording/editing method, the quality of the audio is undeniably inferior, and there is also the problem that it is difficult for those who are not familiar with the rule-synthesized audio to hear it.

(発明か解決しようとする課題) このように従来にあっては、応答出力すべき情報内容を
定型文と非定型文とに分け、定型文について録音編集方
式にて音声を生成し、非定型文については規則合成方式
により音声を生成しているので、応答内容としてはさほ
ど重要でない定型文だけか高品質に音声出力され、応答
出力すべき重要な内容については規則合成により生成さ
れた聞き取り難い音声として出力されると云う不具合が
あった。
(Problem to be solved by the invention) In this way, in the past, the information content to be output as a response is divided into fixed sentences and non-fixed sentences, and audio is generated for the fixed sentences using a recording/editing method. As for sentences, speech is generated using rule synthesis, so only fixed sentences that are not very important for the response content are output in high quality, while important content that should be output as a response is generated by rule synthesis and is difficult to hear. There was a problem with the output being output as audio.

本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、応答出力すべき音声を聞き取り
易い高品質なものとすることのできる実用性の高い音声
応答装置を提供することにある。
The present invention has been made in consideration of the above circumstances, and its purpose is to provide a highly practical voice response device that can output a voice of high quality that is easy to hear. There is a particular thing.

〔発明の構成] (課題を解決するための手段) 本発明に係る音声応答装置は、入力された情報を認識処
理し、その認識結果に対する情報を音声により応答出力
する際、基本的には応答出力する音声を録音編集方式に
より生成し、この録音編集方式にて生成できない音声、
つまり録音編集方式の音声応答部に生成出力すべき音声
が登録されていないときに、その音声を規則合成方式に
より生成して出力するようにしたことを特徴とするもの
である。
[Structure of the Invention] (Means for Solving the Problems) When the voice response device according to the present invention recognizes input information and outputs information in response to the recognition result by voice, the voice response device basically responds by The audio to be output is generated using the recording/editing method, and the audio that cannot be generated using this recording/editing method is
In other words, when the voice to be generated and output is not registered in the voice response section of the recording/editing method, the voice is generated and output by the rule synthesis method.

つまり応答出力すべき情報内容を定型文と非定型文とに
分けるのではなく、非定型文であっても使用頻度の高い
ものについてはその音声データを登録しておいて録音編
集方式1どより音声を生成し、この録音編集方式の音声
応答部に登録されていない音声についてのみ、規則合成
方式によりその音声を生成して出力するようにしたこと
を特徴としている。
In other words, instead of dividing the information content to be output in response into fixed and non-fixed sentences, even if it is a non-fixed text, the audio data of frequently used sentences is registered and the recording/editing method 1 is used. The system is characterized in that a voice is generated and only those voices that are not registered in the voice response section of this recording/editing method are generated and output using a rule synthesis method.

(作 用) このように構成された本発明によれば、例えば主要な顧
客名等の使用頻度の高い非定型文については録音編集方
式による高品質な音声にて応答出力することか可能とな
り、登録されていない特殊な情報内容からなる非定型文
を応答出力する場合にのみ、その音声を規則合成方式に
て生成出力することになる。この結果、多少は規則合成
により生成された品質の悪い音声が出力されるものの、
全体的には録音編集方式により生成された高品質な音声
を多く出力することが可能となり、全体的な応答出力音
声の品質を高めて聞き取り易いものとすることか可能と
なる。
(Function) According to the present invention configured as described above, it is possible to output responses to frequently used non-standard sentences, such as names of major customers, using high-quality audio using a recording and editing method. Only when a non-standard sentence consisting of unregistered special information content is to be output as a response, the speech will be generated and output using the rule synthesis method. As a result, although some low quality audio generated by rule synthesis is output,
Overall, it becomes possible to output a large amount of high-quality voice generated by the recording/editing method, and it becomes possible to improve the quality of the overall response output voice and make it easier to hear.

(実施例) 以下、図面を参照して本発明の一実施例に係る音声応答
装置について説明する。
(Embodiment) Hereinafter, a voice response device according to an embodiment of the present invention will be described with reference to the drawings.

第1図は実施例装置の概略構成図で、■は通信回線2を
介して実施例装置に接続される電話機である。本装置の
利用者は、電話機1を介して音声やPB倍信号ブツシュ
ホン信号)を用いて問い合わせ情報を入力し、その回答
情報を音声メツセージとして、そのサービスを受けるこ
とになる。
FIG. 1 is a schematic configuration diagram of the embodiment device, where ◯ indicates a telephone connected to the embodiment device via the communication line 2. In FIG. A user of this device inputs inquiry information via the telephone 1 using voice or a PB double signal (buzz phone signal), and receives the service by receiving the response information as a voice message.

尚、電話機1に変えて専用の端末機器が用いられるよう
な場合には、コード情報として問い合わせの情報か入力
される場合もある。
Note that if a dedicated terminal device is used instead of the telephone 1, inquiry information may be input as the code information.

しかして回線制御部3は前記通信回線2を介して接続さ
れる電話機1との間での回線接続を制御し、通信回線2
を通して音声やPB倍信号コード情報等を送受信する。
Therefore, the line control unit 3 controls the line connection with the telephone 1 connected via the communication line 2, and
Send and receive audio, PB double signal code information, etc.

PB信号受信送信部4は、前記通信回線2から回線制御
部3を介して入力されるPB倍信号識別し、その識別コ
ード情報をホスト計算機6に与えると共に、電話機1の
自動呼び出しの為のPB倍信号前記ホスト計算機6の制
御の下で生成し、これを前記回線制御部3から通信回線
2に送出して自動発呼する。また音声認識部5は前記通
信回線2から回線制御部3を介して入力される音声を認
識し、その認識結果をホスト計算機6に与えるものであ
る。
The PB signal reception/transmission unit 4 identifies the PB signal input from the communication line 2 via the line control unit 3, provides the identification code information to the host computer 6, and also identifies the PB signal for automatic calling of the telephone 1. A double signal is generated under the control of the host computer 6, and sent from the line control section 3 to the communication line 2 for automatic calling. The voice recognition unit 5 recognizes the voice input from the communication line 2 via the line control unit 3 and provides the recognition result to the host computer 6.

電話機1から音声やPB倍信号用いて入力される問い合
わせの情報は、このような音声認識部5やPB信号受信
送信部4にて認識・識別処理され、ホスト計算機6に与
えられてその情報内容が解釈される。そしてホスト計算
機6では、その解釈結果(問い合わせ情報)に応じて、
例えば図示していないデータベースを検索する等して、
文字列等からなる回答情報を求める。そしてその回答情
報に応じて、録音編集方式により上記回答情報を示す音
声メツセージを生成する第1の音声応答部である応答部
8、または規則合成方式により上記回答情報を示す音声
メツセージを生成する第2の音声応答部である音声規則
合成部9を起動し、応答出力すべき音声を生成する。こ
れらの応答部8および音声規則合成部9にて生成され−
た音声が前記回線制御部3を介して通信回線2に出力さ
れ、電話機1に対して応答出力される。
Inquiry information input from the telephone 1 using voice or PB multiplied signals is recognized and identified by the voice recognition section 5 and PB signal reception/transmission section 4, and then given to the host computer 6 to read the information content. is interpreted. Then, in the host computer 6, according to the interpretation result (inquiry information),
For example, by searching a database not shown,
Requests answer information consisting of character strings, etc. Then, depending on the answer information, a response unit 8, which is a first voice response unit, generates a voice message indicating the above response information by a recording/editing method, or a second voice response unit, which generates a voice message indicating the above response information by a rule synthesis method. The voice rule synthesis unit 9, which is the voice response unit No. 2, is activated to generate the voice to be output as a response. These responses are generated by the response unit 8 and the speech rule synthesis unit 9.
The voice is output to the communication line 2 via the line control section 3, and is output as a response to the telephone set 1.

尚、音声規則合成部9は、例えば第2図に示すような情
報内容を蓄えたアクセント辞書10を参照し、入力され
た文字列により示される音声を、適宜アク、セントを付
加して生成するものである。この音声の規則合成につい
ては、従来より種々提唱されている音声の規則合成のア
ルゴリズムを適宜利用して行われる。
Note that the speech rule synthesis unit 9 refers to an accent dictionary 10 that stores information contents as shown in FIG. 2, for example, and generates the speech indicated by the input character string by adding accents and cents as appropriate. It is something. This rule-based synthesis of speech is performed by appropriately utilizing various algorithms for rule-based synthesis of speech that have been proposed in the past.

さてこの実施例装置か特徴としているところは、例えば
第3図に示すように構成された顧客コード変換テーブル
7を備え、ホスト計算機6が音声応答するべき回答情報
を求めたとき、この顧客コード変換テーブル7を参照し
て上記音声応答すべき回答情報の音声データが前記応答
部8に登録されているか否かを調べる機能を持っている
点にある。
Now, the feature of this embodiment device is that it is equipped with a customer code conversion table 7 configured as shown in FIG. It has a function of referring to table 7 and checking whether the voice data of the answer information to which the voice response is to be made is registered in the response section 8 or not.

そしてホスト計算機6では、音声応答すべき回答情報の
音声データが前記応答部8に登録されている場合には、
この応答部8を起動して録音編集方式により音声を生成
して応答出力させ、登録されていない場合にのみ前記音
声規則合成部10を起動して規則合成方式により音声を
合成するように制御することを特徴としている。
Then, in the host computer 6, if the voice data of the answer information to which a voice response is to be made is registered in the response section 8,
The response unit 8 is activated to generate a voice using the recording/editing method and output as a response, and only when the voice rule synthesis unit 10 is not registered, the voice rule synthesis unit 10 is activated to synthesize voice using the rule synthesis method. It is characterized by

即ち、顧客コード変換テーブル7には、例えば顧客名が
その使用頻度の高い順序で、前記応答部8に登録されて
いる音声データのフレーズ番号に対応付けて記憶されて
いる。ホスト計算機6は、回答情報が求められたとき、
その回答情報を表す文字列を構成する単語や句毎に前記
顧客コード変換テーブル7を検索し、その単語や句が登
録されているか否かを調べる。そして顧客コード変換テ
一ブルアに該当する単語や句(この例では顧客名)が登
録されている場合、その単語や句に対応付けられている
フレーズ番号を求め、これを前記応答部8に出力して該
当する音声データを読み出し、その音声を生成出力させ
る。
That is, in the customer code conversion table 7, for example, customer names are stored in order of frequency of use in association with phrase numbers of voice data registered in the response section 8. When the host computer 6 is asked for answer information,
The customer code conversion table 7 is searched for each word or phrase constituting the character string representing the answer information, and it is checked whether the word or phrase is registered. If a corresponding word or phrase (in this example, customer name) is registered in the customer code conversion table, the phrase number associated with the word or phrase is obtained and output to the response section 8. The corresponding audio data is read out, and the audio is generated and output.

また顧客コード変換テーブル7に該当する単語や句が登
録されていない場合には、ホスト計算機6は、その単語
や句を示す文字列を前記音声規則合成部9に与え、アク
セント辞書10を参照した音声の規則合成を行なわせる
ことになる。
Further, if the corresponding word or phrase is not registered in the customer code conversion table 7, the host computer 6 provides the character string indicating the word or phrase to the speech rule synthesis section 9, and refers to the accent dictionary 10. This will cause the speech to be synthesized according to rules.

このように構成された本装庫は、具体的には次のように
動作する。
Specifically, this storage configured as described above operates as follows.

電話機1からの呼び出しがあると、回線制御部3はこれ
を検出してホスト計算機6を起動し、例えば暗唱番号1
口座番号、振込み紹介が否がの問い合わせを行う為の初
期動作を行わせる。これを受けてホスト計算機Bは、 「こちらはO○銀行てす。」 「サービスコードをどうぞ。」 「口座番号と暗唱番号を入力して下さい。」等の一連の
メツセージを応答出力するべく、応答部8に対してこれ
らの応答内容を特定するフレーズ番号を与える。
When there is a call from the telephone 1, the line control unit 3 detects this and starts the host computer 6, for example, the code number 1.
An initial operation is performed to inquire about the account number and transfer introduction. In response to this, host computer B responds by outputting a series of messages such as ``This is O○ Bank.'' ``Please enter your service code.'' ``Please enter your account number and PIN number.'' Phrase numbers specifying these response contents are given to the response unit 8.

これを受けて応答部8は、応答メモリから上記フレーズ
番号により指定される前記音声メツセージに対応したデ
ータを読み出し、これを音声波形に変換して音声信号を
生成して前記電話機1に対して応答出力する。
In response to this, the response unit 8 reads data corresponding to the voice message specified by the phrase number from the response memory, converts it into a voice waveform, generates a voice signal, and responds to the telephone 1. Output.

電話機1の使用者は、この応答メツセージに従って、例
えばダイヤルバット操作によりPB倍信号して前記メツ
セージにて入力か促された口座番号や暗唱番号を入力す
る。これらの情報を音声により人力しても良いことは云
うまでもない。
In accordance with this response message, the user of the telephone 1 inputs the PB double signal by, for example, a dial bat operation, and inputs the account number or password number prompted by the message. Needless to say, this information may be manually inputted by voice.

すると本装置では、前記PB信号受信送信部4にてその
入力PB倍信号識別し、その識別情報をホスト計算機6
に与える。入力か音声である場合には、その入力音声が
音声認識部5にて認識処理され、その認識結果(例えば
数字コード)かホスト計算機6に与えられる。このよう
にして入力処理された情報を解析することにより、ホス
ト計算機6は電話機1の利用者か何を要求しているか(
問い合わせているか)を知ることになり、その要求に応
じた応答情報を求める。
Then, in this device, the PB signal reception and transmission section 4 identifies the input PB multiplied signal, and the identification information is transmitted to the host computer 6.
give to If the input is a voice, the input voice is recognized by the voice recognition section 5, and the recognition result (for example, a numeric code) is provided to the host computer 6. By analyzing the information input and processed in this way, the host computer 6 can determine whether the user of the telephone 1 is requesting information (
It will then know whether the user is making an inquiry) and will request response information in response to the request.

この応答情報は、例えば 「振込み3件」 「振込みかありました。」 等として求められる。この応答メツセージの中の下線を
付して示した部分か非定型部分である。
This response information is obtained as, for example, "3 transfers", "There was a transfer", etc. This is the underlined part or atypical part of this response message.

しかしてホスト計算機6ては、これらの文字列で示され
る単語について順次顧客コード変換テーブル7を参照し
て、その音声データか登録されているか否かを調べ、そ
の結果に従って前記合成部8にて音声を生成するか、或
いは音声規則合成部9にて音声を生成するかを決定する
。尚、ここでは上記非定型部分である下線部分の文字列
(顧客名)について説明すると、ホスト計算機6は下線
を付して示した文字列部分(顧客名)を録音東方式によ
り音声出力可能であるか否かを調べる。
The host computer 6 sequentially refers to the customer code conversion table 7 for the words indicated by these character strings to check whether the voice data is registered or not, and according to the results, the synthesis unit 8 converts the words to the customer code conversion table 7. It is determined whether to generate the voice or to have the voice rule synthesis unit 9 generate the voice. Here, we will explain the underlined character string (customer name), which is the non-standard part. The host computer 6 can output the underlined character string part (customer name) as a voice using the Recording East method. Check whether it exists or not.

するとこの場合、「カワザキキギョウ」については顧客
コート変換テーブル7に登録されていないことから、そ
の文字列情報を音声規則合成部9に与え、アクセント辞
書10を参照した規則合成方式により上記文字列か示す
音声を合成出力させる。
In this case, since "Kawazaki Kikyo" is not registered in the customer coat conversion table 7, the character string information is given to the voice rule synthesis unit 9, and the above character string is generated by the rule synthesis method referring to the accent dictionary 10. Synthesize and output the voice that indicates.

マタ「ヨコハマコーギョー」については顧客コード変換
テーブル7に登録されているから、そのフレーズ番号[
201]を求め、これを応答部8に与えて録音編集方式
により上記文字列か示す音声を合成出力させる。そして
次の「カワサキコウギョウ」については顧客コード変換
テーブル7に登録されていないことから、その文字列情
報を音声規則合成部9に与え、同様にしてアクセント辞
書10を参照した規則合成方式により上記文字列が示す
音声を合成出力させる。
Mata "Yokohama Kogyo" is registered in the customer code conversion table 7, so the phrase number [
201] is given to the response section 8, which synthesizes and outputs the voice representing the above character string using the recording/editing method. Since the next "Kawasaki Kogyo" is not registered in the customer code conversion table 7, the character string information is given to the voice rule synthesis section 9, and the above character string is similarly synthesized by the rule synthesis method referring to the accent dictionary 10. Synthesize and output the audio indicated by the column.

尚、この規則合成においては、第2図に示すように「カ
ワサキ」についてのアクセント型が「0]として、また
「キギョウ」 「コウギョウ」についてアクセント型が
[1]としてそれぞれ指定されているので、[′]をア
クセント位置として「カワサキキーギョー」 「カワサキコーーギョー」 のように音声を規則合成する。
In addition, in this rule composition, as shown in Figure 2, the accent type for "Kawasaki" is specified as "0", and the accent type for "Kigyou" and "Kougyo" is specified as [1], so Using [′] as the accent position, the speech is synthesized in a regular manner, such as ``Kawasaki kigyo'' and ``Kawasaki kogyo''.

このように本実施例装置によれば、応答出力する音声メ
ツセージ中の、例えば使用頻度が高い等の理由により登
録されている非定型部分の音声データ(顧客名)か示す
音声を録音編集方式により生成して出力するので、自然
性の高い高品質な音声メツセージとすることかできる。
As described above, according to the device of this embodiment, the audio data indicating the audio data (customer name) of the non-standard part registered due to high frequency of use, etc. in the voice message to be output as a response is recorded and edited. Since it is generated and output, it is possible to create a highly natural and high-quality voice message.

そして登録されていない非定型部分の音声データ(顧客
名)についてたけ、その音声を規則合成方式により生成
出力するので、全体的に録音編集方式により生成される
音声を多くし、高品質で聞き取り易いものとすることが
できる。この結果、違和感の少ない音声メツセージ応答
を効率的に行うことか可能となる等の実用上多大なる効
果が奏せられる。
Then, the voice data (customer name) of the unregistered atypical part is tracked and the voice is generated and output using the rule synthesis method, which increases the overall amount of voice generated using the recording and editing method, making it high quality and easy to hear. can be taken as a thing. As a result, great practical effects can be achieved, such as making it possible to efficiently respond to voice messages with less discomfort.

尚、本発明は上述した実施例に限定されるものではない
。例えばアクセント辞書10の構成や、テーブル7に登
録しておく顧客名の情報は、上述した例に限られるもの
ではない。つまり録音編集方式により生成する音声を顧
客名に限らす、他の使用頻度の高い単語や句とすること
も勿論可能である。またアクセント辞書10と文字列と
の照合をホスト計算機にて行い、音声規則合成部9に韻
律情報と音韻系列とを与えて規則合成処理を実行させる
ようにしても良い。その他、本発明はその要旨を逸脱し
ない範囲で種々変形して実施することができる。
Note that the present invention is not limited to the embodiments described above. For example, the configuration of the accent dictionary 10 and the information on customer names registered in the table 7 are not limited to the examples described above. In other words, it is of course possible to limit the voice generated by the recording/editing method to the customer's name or to use other frequently used words or phrases. Alternatively, the accent dictionary 10 and the character string may be checked in the host computer, and the phonetic rule synthesis section 9 may be provided with the prosody information and the phoneme sequence to execute the rule synthesis process. In addition, the present invention can be implemented with various modifications without departing from the gist thereof.

[発明の効果] 以上説明したように本発明によれば、音声メツセージを
定型文と非定型文とに分けてそれぞれ別個に音声を生成
するのではなく、録音編集方式により音声を求めること
のできない応答メツセージの部分だけを規則合成方式に
よりその音声を求めるので、使用頻度の高い単語や句に
ついての音声データを予め登録しておくことで、全体的
に録音編集方式により生成された音声部分を多くし、聞
き取り易い高品質な音声メツセージを応答出力すること
が可能となる等の実用上多大なる効果が奏せられる。
[Effects of the Invention] As explained above, according to the present invention, instead of dividing a voice message into regular sentences and non-standard sentences and generating voices separately for each, it is not possible to obtain the voices by using a recording editing method. Since the voice of only the response message is obtained using the rule synthesis method, by registering voice data for frequently used words and phrases in advance, it is possible to increase the overall voice generated by the recording/editing method. However, great practical effects can be achieved, such as making it possible to output a high-quality voice message that is easy to hear.

【図面の簡単な説明】[Brief explanation of the drawing]

図は本発明の一実施例に係る音声応答装置について示す
もので、 パ″1第1図は実施例装置の概略構成を示す図、第2図
は実施例装置におけるアクセント辞書の内容を示す図、
第3図は実施例における顧客コード変換テーブルの内容
を示す図である。 3・・・回線制御部、4・・・PB信号受信送信部、5
・・・音声認識部、6・・・ホスト計算機、7・・・顧
客コード変換テーブル、訃・・応答部(録音編集方式に
よる第1の音声応答部)、9・・・音声規則合成部(規
則合成方式による第2の音声応答部)、10・・・アク
セント辞書。 出願人代理人 弁理士 鈴江武彦
The figures show a voice response device according to an embodiment of the present invention, and FIG. ,
FIG. 3 is a diagram showing the contents of the customer code conversion table in the embodiment. 3... Line control unit, 4... PB signal reception and transmission unit, 5
. . . speech recognition unit, 6 . . . host computer, 7 . . . customer code conversion table, deceased . second voice response unit based on rule synthesis method), 10...accent dictionary. Applicant's agent Patent attorney Takehiko Suzue

Claims (1)

【特許請求の範囲】 入力された情報を認識処理し、その認識結果に対する情
報を音声により応答出力する音声応答装置において、 応答出力する音声を録音編集方式により生成する第1の
音声応答部と、応答出力すべき音声が上記音声応答部に
登録されていないときに、その音声を規則合成方式によ
り生成する第2の音声応答部とを具備したことを特徴と
する音声応答装置。
[Scope of Claims] A voice response device that recognizes input information and outputs information in response to the recognition result as a voice response, comprising: a first voice response unit that generates voice to be output in response using a recording and editing method; A voice response device comprising: a second voice response unit that generates a voice to be output as a response by a rule synthesis method when the voice to be outputted is not registered in the voice response unit.
JP2292147A 1990-10-31 1990-10-31 Audio response equipment Pending JPH04167749A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2292147A JPH04167749A (en) 1990-10-31 1990-10-31 Audio response equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2292147A JPH04167749A (en) 1990-10-31 1990-10-31 Audio response equipment

Publications (1)

Publication Number Publication Date
JPH04167749A true JPH04167749A (en) 1992-06-15

Family

ID=17778152

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2292147A Pending JPH04167749A (en) 1990-10-31 1990-10-31 Audio response equipment

Country Status (1)

Country Link
JP (1) JPH04167749A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001272993A (en) * 2000-03-24 2001-10-05 Fujitsu General Ltd Speech synthesis system and emergency information system
JP2002156987A (en) * 2000-11-20 2002-05-31 Fujitsu General Ltd Voice synthesis system
WO2004097792A1 (en) * 2003-04-28 2004-11-11 Fujitsu Limited Speech synthesizing system
JP2006145691A (en) * 2004-11-17 2006-06-08 Kenwood Corp Speech synthesizer, speech segment storage device, apparatus for manufacturing speech segment storage device, method for speech synthesis, method for manufacturing speech segment storage device, and program
JP2006301059A (en) * 2005-04-18 2006-11-02 Denso Corp Voice output system

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001272993A (en) * 2000-03-24 2001-10-05 Fujitsu General Ltd Speech synthesis system and emergency information system
JP2002156987A (en) * 2000-11-20 2002-05-31 Fujitsu General Ltd Voice synthesis system
WO2004097792A1 (en) * 2003-04-28 2004-11-11 Fujitsu Limited Speech synthesizing system
US7143038B2 (en) 2003-04-28 2006-11-28 Fujitsu Limited Speech synthesis system
JP2006145691A (en) * 2004-11-17 2006-06-08 Kenwood Corp Speech synthesizer, speech segment storage device, apparatus for manufacturing speech segment storage device, method for speech synthesis, method for manufacturing speech segment storage device, and program
JP4574333B2 (en) * 2004-11-17 2010-11-04 株式会社ケンウッド Speech synthesis apparatus, speech synthesis method and program
JP2006301059A (en) * 2005-04-18 2006-11-02 Denso Corp Voice output system
JP4655268B2 (en) * 2005-04-18 2011-03-23 株式会社デンソー Audio output system

Similar Documents

Publication Publication Date Title
JP3561076B2 (en) Automatic call recognition method for arbitrarily spoken words
KR100329894B1 (en) Editing system and method for use with telephone messaging transcription
US8457966B2 (en) Method and system for providing speech recognition
JP3340585B2 (en) Voice response device
CA2043667C (en) Written language parser system
US6148285A (en) Allophonic text-to-speech generator
JP2002366186A (en) Method for synthesizing voice and its device for performing it
JPH02204827A (en) Report generation apparatus and method
Gibbon et al. Spoken language system and corpus design
JPH1079785A (en) Telephone terminal equipment
JPH04167749A (en) Audio response equipment
JPS6161400B2 (en)
JP2000003189A (en) Voice data editing device and voice database
US20080243498A1 (en) Method and system for providing interactive speech recognition using speaker data
US20080046230A1 (en) Reception support system and program therefor
Silverman On customizing prosody in speech synthesis: Names and addresses as a case in point
JPS6223888B2 (en)
JP3147897B2 (en) Voice response system
Yarrington et al. A system for creating personalized synthetic voices
JPH09258785A (en) Information processing method and information processor
JPH03174596A (en) Audio response device
JPH09244679A (en) Method and device for synthesizing speech
Hirschberg et al. Voice response systems: Technologies and applications
JPH09258764A (en) Communication device, communication method and information processor
JP2001325191A (en) Electronic mail terminal device