JPH0538700U - Voice response device - Google Patents

Voice response device

Info

Publication number
JPH0538700U
JPH0538700U JP023927U JP2392791U JPH0538700U JP H0538700 U JPH0538700 U JP H0538700U JP 023927 U JP023927 U JP 023927U JP 2392791 U JP2392791 U JP 2392791U JP H0538700 U JPH0538700 U JP H0538700U
Authority
JP
Japan
Prior art keywords
voice
speaker
response message
male
female
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP023927U
Other languages
Japanese (ja)
Inventor
傑 易
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP023927U priority Critical patent/JPH0538700U/en
Publication of JPH0538700U publication Critical patent/JPH0538700U/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 話者の性別に応じた柔軟かつ親切なサービス
を話者に提供できる具体的な音声応答装置を提供するこ
とである。。 【構成】 入力音声信号に対して、ピッチ抽出部103
でピッチパラメータが求められる。比較演算部105は
このピッチパラメータの平均化を行い所定のしきい値よ
りも大きいか小さいかを判定し、大きいと判定すると入
力音声の話者が女性であると判定し、小さいと判定され
ると話者が男性であると判定する。この結果に基づい
て、規則音声合成部106で、応答メッセージ記憶部1
04から供給される応答メッセージを男性音又は女性音
によって合成して出力する。つまり話者が男性の場合
は、女性音で応答し、話者が女性の場合は、男性音で出
力する。
(57) [Summary] [Purpose] To provide a concrete voice response device capable of providing a speaker with a flexible and kind service according to the gender of the speaker. .. [Configuration] Pitch extraction unit 103 for input voice signal
The pitch parameter is calculated with. The comparison calculation unit 105 averages this pitch parameter and determines whether it is larger or smaller than a predetermined threshold value. If it is larger, it is determined that the speaker of the input voice is a female, and is smaller. It is determined that the speaker is male. Based on this result, the rule speech synthesizer 106 causes the response message storage 1
The response message supplied from 04 is combined with a male sound or a female sound and output. In other words, when the speaker is male, it responds with a female sound, and when the speaker is female, it outputs with a male sound.

Description

【考案の詳細な説明】[Detailed description of the device]

【0001】[0001]

【産業上の利用分野】[Industrial applications]

この考案は、音声応答装置に係り、詳しくは話者から発せられる音声を入力し 、この音声認識結果に応じて応答メッセージを合成して出力する音声応答装置に 関するに関する。 The present invention relates to a voice response device, and more particularly, to a voice response device that inputs a voice uttered by a speaker, synthesizes a response message according to the voice recognition result, and outputs the response message.

【0002】[0002]

【従来の技術】[Prior Art]

従来、この種の音声応答装置として、第1に特開昭58−24199号公報、 第2に特開昭59−153238号公報、第3に特開昭59−216242号公 報、第4に特開昭60−159933号公報、及び第5に特開昭62−1453 22号公報などに開示されているものがある。 Conventionally, as a voice response device of this type, firstly, Japanese Patent Laid-Open No. 58-24199, second, Japanese Laid-Open Patent Publication No. 59-153238, third, Japanese Laid-Open Patent Publication No. 59-216242, and fourthly. There are those disclosed in JP-A-60-159933 and, fifthly, JP-A-62-145322.

【0003】 上記第1の音声応答装置は、話者からの入力音声レベルに応じて応答出力レベ ルを調整しており、上記第2の音声応答装置は、音声入力信号又はキー入力信号 に応じて応答出力レベルを制御している。また上記第3及び第5の音声応答装置 は、音声入力信号のスピードに合わせて合成音のスピードを制御しており、更に 上記第4の音声応答装置は、入力音声の発話速度に応じて応答出力レベルを制御 している。The first voice response device adjusts the response output level according to the input voice level from the speaker, and the second voice response device responds to the voice input signal or the key input signal. To control the response output level. Further, the third and fifth voice response devices control the speed of the synthesized voice in accordance with the speed of the voice input signal, and the fourth voice response device responds according to the utterance speed of the input voice. The output level is controlled.

【0004】 上記のように従来、入力音声に応じて応答出力音声を制御する音声応答装置が 種々提案されている。As described above, various types of voice response devices have heretofore been proposed that control response output voices according to input voices.

【0005】[0005]

【考案が解決しようとする課題】[Problems to be solved by the device]

しかしながら、従来においては、話者の性別に応じた柔軟かつ親切なサービス を該話者に提供できるような音声応答装置は提案されるに至っていない。 However, conventionally, no voice response device has been proposed that can provide a flexible and kind service according to the gender of the speaker to the speaker.

【0006】 この考案は、以上の課題に鑑み為されたものであり、その目的とするところは 、話者の性別に応じた柔軟かつ親切なサービスを話者に提供できる具体的な音声 応答装置を提供することである。The present invention has been made in view of the above problems, and its purpose is to provide a concrete voice response device capable of providing a speaker with a flexible and kind service according to the gender of the speaker. Is to provide.

【0007】[0007]

【課題を解決するための手段】[Means for Solving the Problems]

この考案は、以上の目的を達成するために、話者から発せられる音声を入力し 、この音声の認識結果に応じて応答メッセージを合成して出力する音声応答装置 において、以下のような手段を備える。 In order to achieve the above object, the present invention provides the following means in a voice response device that inputs a voice uttered by a speaker and synthesizes and outputs a response message according to the recognition result of the voice. Prepare

【0008】 つまり入力される音声を分析して話者の性別を判別する性別判定手段と、性別 判定手段が話者を男性であると判定した時に、第1の種類の音声によって応答メ ッセージを合成して出力する第1の音声合成手段と、性別判定手段が話者を女性 であると判定した時に、第2の種類の音声によって応答メッセージを合成して出 力する第2の音声合成手段とを有することを特徴とする。That is, the sex determination unit that analyzes the input voice to determine the gender of the speaker, and when the gender determination unit determines that the speaker is male, the response message is displayed by the first type of voice. A first voice synthesizing means for synthesizing and outputting, and a second voice synthesizing means for synthesizing and outputting a response message by a second type of voice when the gender determining means determines that the speaker is a female. And having.

【0009】[0009]

【作用】[Action]

この考案によれば、性別判定手段が話者を男性であると判定すると、話者に第 1の種類の音声での応答メッセージが出力され、性別判定手段が話者を女性であ ると判定すると、話者に対して第2の種類の音声での応答メッセージが出力され る。 According to this invention, when the sex determining means determines that the speaker is male, the speaker outputs a response message in the first type of voice, and the sex determining means determines that the speaker is female. Then, the response message with the second type of voice is output to the speaker.

【0010】 例えば、第1の種類の音声が女性音に、第2の種類の音声が男性音にそれぞれ 定められた場合、男性の話者に対しては女性音での応答メッセージが出力され、 女性の話者に対しては男性音での応答メッセージが出力される。For example, when the first type of voice is defined as a female sound and the second type of voice is defined as a male sound, a response message in a female sound is output to a male speaker, A response message with a male sound is output to the female speaker.

【0011】 また性別判定手段は、例えば入力音声から抽出される基本周波数(ピッチ)に 基づいて話者の性別を判定することができる。Further, the gender determining means can determine the gender of the speaker based on, for example, the fundamental frequency (pitch) extracted from the input voice.

【0012】[0012]

【実施例】【Example】

次にこの考案に係る音声応答装置の好適な一実施例を図面を用いて説明する。 図1はこの考案に係る音声応答装置の一実施例を示す機能ブロック図である。 図1において、この音声応答装置は、話者の音声信号をマイクロホン等を使用 して取り込み、この取込んだ音声信号に対して所定の前処理を行う音声入力部1 01と、入力された音声信号から基本周波数(ピッチ)を抽出するピッチ抽出部 103と、男性音と女性音との判別を行うための判別基準ピッチとピッチ抽出部 103において抽出されたピッチ情報を比較して話者の性別を判定する比較演算 部105とを有している。更に音声応答装置は、入力音声を認識するための単語 認識部102と、応答メッセージが予め格納されている応答メッセージ記憶部1 04と、応答メッセージ記憶部104から読み出された応答メッセージを男性音 辞書又は女性音辞書を用いて合成する規則音声合成部106と、規則音声合成部 106において合成された音声を出力するスピーカ107と、上述した各部を制 御する制御部108とを有している。尚上記ピッチ抽出部103と比較演算部1 05で構成される部分を、性別判定部109と呼ぶ。 Next, a preferred embodiment of the voice response device according to the present invention will be described with reference to the drawings. FIG. 1 is a functional block diagram showing an embodiment of a voice response device according to the present invention. In FIG. 1, the voice response device captures a voice signal of a speaker using a microphone or the like, and performs a predetermined pre-processing on the captured voice signal, and an input voice signal. The pitch extraction unit 103 that extracts the fundamental frequency (pitch) from the signal, the discrimination reference pitch for discriminating between male and female sounds, and the pitch information extracted by the pitch extraction unit 103 are compared to determine the gender of the speaker. And a comparison calculation unit 105 for determining. Further, the voice response device recognizes the input voice, the word recognition unit 102, the response message storage unit 104 in which the response message is stored in advance, and the response message read from the response message storage unit 104 as a male voice. It has a regular voice synthesizing unit 106 that synthesizes using a dictionary or a female sound dictionary, a speaker 107 that outputs the voice synthesized by the regular voice synthesizing unit 106, and a control unit 108 that controls the above-mentioned units. .. The portion composed of the pitch extraction unit 103 and the comparison calculation unit 105 is referred to as a sex determination unit 109.

【0013】 次にこの音声応答装置の動作を図2に示す動作フローチャートに従って説明す る。Next, the operation of the voice response device will be described with reference to the operation flowchart shown in FIG.

【0014】 話者が音声応答装置に対して音声を発し、所定の操作によって応答を請求する と、処理が開始され(ステップ201)、音声入力部101がマイクロホン等か らの音声信号をA/D変換し(ステップ202)、所定の前処理を行う(ステッ プ203)。この前処理は、ピッチ抽出のために必要な低域濾波の処理を含む。 次に単語認識部102が前処理を終えた音声データに対して、認識処理を行う (ステップ204)。この単語認識部102での認識処理として、例えば特願平 1−224956の願書に添付されている明細書及び図面に開示されている処理 が用いることができる。When the speaker utters a voice to the voice response device and requests a response by a predetermined operation, the process is started (step 201), and the voice input unit 101 converts the voice signal from the microphone or the like into A / D conversion is performed (step 202) and predetermined preprocessing is performed (step 203). This pre-processing includes the processing of low-pass filtering necessary for pitch extraction. Next, the word recognition unit 102 performs recognition processing on the voice data that has undergone the preprocessing (step 204). As the recognition processing by the word recognition unit 102, for example, the processing disclosed in the specification and the drawings attached to the application of Japanese Patent Application No. 1-224956 can be used.

【0015】 音声データの認識処理が終了すると、この認識結果に基づいて、制御部108 が対応する応答メッセージを応答メッセージ記憶部104内の応答メッセージか ら選択する(ステップ205)。When the voice data recognition process is completed, the control unit 108 selects the corresponding response message from the response messages in the response message storage unit 104 based on the recognition result (step 205).

【0016】 一方、前記ステップ203の前処理において得られた音声データは、ピッチ抽 出部103に供給される。そしてここで入力音声データからピッチパラメータを 抽出する(ステップ209)。次に抽出されたピッチパラメータを平均化し(ス テップ210)、この平均値と予め定められたしきい値を比較する(ステップ2 10)。一般に女性音の平均ピッチが男性音の平均ピッチの約2倍(例えば男性 成人は100〜125Hz、女性成人は250〜300Hz)であることを考慮 して、上記しきい値は男性音と女性音を判別するものとして適切に定められる。 そして平均ピッチが上記しきい値より大きい場合に女性音であると判定され、平 均ピッチが上記しきい値以下の場合に男性音であると判定される(ステップ21 1)。この判定で入力音声が女性音であると判定されると、男性音を生成するた めの男性音辞書が選択される(ステップ212)。またステップ211の判定で 入力音声が男性音であると判定されると、女性音を生成するための女性音辞書を 選択する(ステップ213)。On the other hand, the voice data obtained in the pre-processing of step 203 is supplied to the pitch extraction unit 103. Then, here, the pitch parameter is extracted from the input voice data (step 209). Next, the extracted pitch parameters are averaged (step 210), and this average value is compared with a predetermined threshold value (step 210). Considering that the average pitch of female tones is about twice the average pitch of male tones (for example, 100 to 125 Hz for male adults and 250 to 300 Hz for female adults), the above threshold values are set for male and female sounds. It is properly determined as what distinguishes. If the average pitch is larger than the threshold value, it is determined to be a female sound, and if the average pitch is less than or equal to the threshold value, it is determined to be a male sound (step 211). If it is determined in this determination that the input voice is a female sound, a male sound dictionary for generating a male sound is selected (step 212). If it is determined in step 211 that the input voice is a male sound, a female sound dictionary for generating a female sound is selected (step 213).

【0017】 上記によって、男性音辞書又は女性音辞書のいずれかが選択されると、規則音 声合成部106は、前記において選択された辞書を用いて前記ステップ205に おいて選択された応答メッセージの合成音を生成する(ステップ206)。そし てこの規則音声合成部106において生成された応答メッセージの合成音信号が スピーカ107に供給され、合成音が出力される(ステップ207)。応答メッ セージの出力が終了すると全体の処理が終了する(ステップ208)。When either the male sound dictionary or the female sound dictionary is selected as described above, the regular voice synthesizing unit 106 uses the dictionary selected in the above to select the response message selected in step 205. The synthesized sound of is generated (step 206). Then, the synthesized voice signal of the response message generated by the rule voice synthesis unit 106 is supplied to the speaker 107, and the synthesized voice is output (step 207). When the output of the response message ends, the entire process ends (step 208).

【0018】 前記規則音声合成部106での処理として、例えば特願平2−14199の願 書に添付されている明細書及び図面に開示されている処理を用いて実現すること ができる。The processing in the rule speech synthesizing unit 106 can be realized using, for example, the processing disclosed in the specification and drawings attached to the application of Japanese Patent Application No. 2-14199.

【0019】 上述したように、この実施例によれば、話者からの入力音声が男性音であると 判定された場合に、女性音によって応答メッセージが出力される。一方話者から の入力音声が女性音であると判定された場合には、男性音での応答メッセージが 出力される。即ち話者は異性の音声による応答メッセージを受けることになる。 従って話者の性別に応じた柔軟かつ親切なサービスを話者に提供できる。As described above, according to this embodiment, when the input voice from the speaker is determined to be the male sound, the response message is output by the female sound. On the other hand, when the input voice from the speaker is determined to be a female sound, a response message with a male sound is output. That is, the speaker receives the response message with the voice of the opposite sex. Therefore, it is possible to provide the speaker with a flexible and kind service according to the gender of the speaker.

【0020】 尚、上記実施例においては、異性の音声での応答メッセージを提供するように したが、この考案はこのような態様に限定されず、話者の性別に応じて、例えば 応答メッセージのトーンや音色等を種々の態様にて変えることも可能である。In the above embodiment, the response message is provided by voice of the opposite sex, but the present invention is not limited to such a mode, and for example, the response message of the response message may be changed according to the gender of the speaker. It is also possible to change the tone, tone color, etc. in various ways.

【0021】[0021]

【考案の効果】[Effect of the device]

以上述べたようにこの考案によれば、話者の性別を判定し、この結果に応じて 応答メッセージの音声の種類を変えられるようにしたため、話者の性別に応じた 応答サービスが可能となり、より付加価値の高い音声応答装置を実現することが できる。 As described above, according to the present invention, the gender of the speaker is determined, and the type of the voice of the response message can be changed according to the result, which enables the response service according to the gender of the speaker. It is possible to realize a voice response device with higher added value.

【図面の簡単な説明】[Brief description of drawings]

【図1】この実施例に係る音声応答装置の機能ブロック
図である。
FIG. 1 is a functional block diagram of a voice response device according to this embodiment.

【図2】図1に係る音声応答装置の動作フローチャート
である。
FIG. 2 is an operational flowchart of the voice response device according to FIG.

【符号の説明】[Explanation of symbols]

101…音声入力部、102…単語認識部、103…ピ
ッチ抽出部、104…応答メッセージ記憶部、105…
比較演算部、106…規則音声合成部、107…スピー
カ、108…制御部。
101 ... Voice input section, 102 ... Word recognition section, 103 ... Pitch extraction section, 104 ... Response message storage section, 105 ...
Comparing calculation unit 106 ... Regular voice synthesis unit 107 ... Speaker 108 ... Control unit.

Claims (1)

【実用新案登録請求の範囲】[Scope of utility model registration request] 【請求項1】 話者から発せられる音声を入力し、この
音声の認識結果に応じて応答メッセージを合成して出力
する音声応答装置において、 入力される音声を分析して話者の性別を判別する性別判
定手段と、 前記性別判定手段が話者を男性であると判定した時に、
第1の種類の音声によって応答メッセージを合成して出
力する第1の音声合成手段と、 前記性別判定手段が話者を女性であると判定した時に、
第2の種類の音声によって応答メッセージを合成して出
力する第2の音声合成手段とを有することを特徴とする
音声応答装置。
1. A voice response device for inputting a voice uttered by a speaker, synthesizing a response message according to the recognition result of the voice, and outputting the result, by analyzing the input voice to determine the gender of the speaker. And a gender determining means to do, when the gender determining means determines that the speaker is male,
A first voice synthesizing unit for synthesizing and outputting a response message with a first type of voice; and when the gender determining unit determines that the speaker is a female,
And a second voice synthesizing means for synthesizing and outputting a response message with a second type of voice.
JP023927U 1991-04-11 1991-04-11 Voice response device Pending JPH0538700U (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP023927U JPH0538700U (en) 1991-04-11 1991-04-11 Voice response device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP023927U JPH0538700U (en) 1991-04-11 1991-04-11 Voice response device

Publications (1)

Publication Number Publication Date
JPH0538700U true JPH0538700U (en) 1993-05-25

Family

ID=12124163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP023927U Pending JPH0538700U (en) 1991-04-11 1991-04-11 Voice response device

Country Status (1)

Country Link
JP (1) JPH0538700U (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005266020A (en) * 2004-03-17 2005-09-29 Advanced Telecommunication Research Institute International Voice recognition device
JP2015069138A (en) * 2013-09-30 2015-04-13 ヤマハ株式会社 Voice synthesizer and program
CN110100276A (en) * 2016-12-22 2019-08-06 大众汽车有限公司 The voice output sound of voice operating system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005266020A (en) * 2004-03-17 2005-09-29 Advanced Telecommunication Research Institute International Voice recognition device
JP2015069138A (en) * 2013-09-30 2015-04-13 ヤマハ株式会社 Voice synthesizer and program
CN110100276A (en) * 2016-12-22 2019-08-06 大众汽车有限公司 The voice output sound of voice operating system

Similar Documents

Publication Publication Date Title
JP3968133B2 (en) Speech recognition dialogue processing method and speech recognition dialogue apparatus
US8898055B2 (en) Voice quality conversion device and voice quality conversion method for converting voice quality of an input speech using target vocal tract information and received vocal tract information corresponding to the input speech
JP3674990B2 (en) Speech recognition dialogue apparatus and speech recognition dialogue processing method
US7272561B2 (en) Speech recognition device and speech recognition method
JP4391701B2 (en) System and method for segmentation and recognition of speech signals
JP2019040123A (en) Learning method of conversion model and learning device of conversion model
JP2005070430A (en) Speech output device and method
JPH0538700U (en) Voice response device
JP3555490B2 (en) Voice conversion system
JP4839970B2 (en) Prosody identification apparatus and method, and speech recognition apparatus and method
JP3199972B2 (en) Dialogue device with response
JP2008040431A (en) Voice or speech machining device
JP2002297199A (en) Method and device for discriminating synthesized voice and voice synthesizer
JPH06337876A (en) Sentence reader
JP3513030B2 (en) Data playback device
JP2001255887A (en) Speech recognition device, speech recognition method and medium recorded with the method
JPS6367197B2 (en)
JP2004252085A (en) System and program for voice conversion
JPH04324499A (en) Speech recognition device
JP2004341340A (en) Speaker recognition device
JP6759370B2 (en) Ring tone recognition device and ring tone recognition method
JP2001042889A (en) Device for normalizing interval of inputted voice for voice recognition
JP3846500B2 (en) Speech recognition dialogue apparatus and speech recognition dialogue processing method
KR0169592B1 (en) Performance enhancing method for voice recognition device using adaption of voice characteristics
JP2003099094A (en) Voice processing device