JP2002354111A - Voice signal synthesizing device, method, program and recording medium for recording the program - Google Patents

Voice signal synthesizing device, method, program and recording medium for recording the program

Info

Publication number
JP2002354111A
JP2002354111A JP2001162035A JP2001162035A JP2002354111A JP 2002354111 A JP2002354111 A JP 2002354111A JP 2001162035 A JP2001162035 A JP 2001162035A JP 2001162035 A JP2001162035 A JP 2001162035A JP 2002354111 A JP2002354111 A JP 2002354111A
Authority
JP
Japan
Prior art keywords
audio signal
recording
synthesized
bgm
synthesizing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001162035A
Other languages
Japanese (ja)
Inventor
Yasuyoshi Kuwazoe
泰嘉 桑添
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2001162035A priority Critical patent/JP2002354111A/en
Publication of JP2002354111A publication Critical patent/JP2002354111A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a voice signal synthesizing device that synthesizes voice signals with high quality in the case of synthesizing the voice signals. SOLUTION: A microphone 12 transduces a voice (OGM: a response message by an automatic telephone message recorder) into a 1st voice signal and a BGM reproduction section 24 allows a BGM recording section 22 to output a BGM (2nd voice signal). A voice signal synthesizing section 30 synthesizes the 1st and 2nd voice signals. Since the BGM (2nd voice signal) is not sounded from a speaker 52 and deterioration in the case of converting the BGM into voice can be prevented, the quality of the synthesized voice signal can be enhanced.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、通信端末装置にお
ける音声の合成に関する。
The present invention relates to speech synthesis in a communication terminal device.

【0002】[0002]

【従来の技術】従来より、携帯電話等の通信端末装置に
おいて留守番電話機能を備えた機種がある。留守番電話
機能とは、着信があった場合、不在であることを通知す
るための留守番電話応答メッセージ(OGM)を相手方
に送信し、その後に相手方から送信されてきたメッセー
ジを録音する機能である。
2. Description of the Related Art Conventionally, there is a type of communication terminal device such as a portable telephone having an answering machine function. The answering machine function is a function that, when an incoming call is received, sends an answering machine answer message (OGM) for notifying that the user is not present to the other party, and then records a message transmitted from the other party.

【0003】近年普及しつつある音声録音機能を備えた
携帯電話機においては、携帯電話機に備えられたマイク
を通して録音した音声をOGMとして利用できる。これ
によりユーザ独自のOGMを作成できる。
[0003] In a mobile phone having a voice recording function, which has become popular in recent years, voice recorded through a microphone provided in the mobile phone can be used as OGM. Thus, a user-specific OGM can be created.

【0004】さらに、ユーザ独自のOGMに音楽等のB
GM(Back Ground Music)を付加することも考えられ
る。この場合、BGMは携帯電話機に記録されており、
携帯電話機のスピーカから再生できる。そこで、OGM
にBGMを付加する場合は、ユーザ独自のOGMである
音声と、携帯電話機のスピーカから再生されたBGMと
を同時にマイクを通して録音する。
[0004] In addition, a user's own OGM stores B
It is also conceivable to add GM (Back Ground Music). In this case, the BGM is recorded on the mobile phone,
It can be reproduced from the speaker of the mobile phone. So, OGM
When the BGM is added to the sound, the voice, which is the OGM unique to the user, and the BGM reproduced from the speaker of the mobile phone are simultaneously recorded through the microphone.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、スピー
カとマイクとが近すぎれば、録音されるBGMが相対的
に大きくなりすぎ、スピーカとマイクとが遠すぎれば、
録音されるBGMが相対的に小さくなりすぎるといった
問題が生ずる。また、BGMは携帯電話機のスピーカか
ら再生され、再生された音声をマイクを通して録音する
ので、品質の劣化が避けられない。
However, if the speaker and the microphone are too close, the BGM to be recorded is relatively too large, and if the speaker and the microphone are too far apart,
There is a problem that the recorded BGM becomes relatively too small. In addition, BGM is reproduced from a speaker of a mobile phone, and the reproduced sound is recorded through a microphone, so that quality degradation is inevitable.

【0006】そこで、本発明は、OGMにBGMを付加
するような音声合成において、高品質な合成を行なえる
音声信号合成装置等を提供することを課題とする。
SUMMARY OF THE INVENTION It is an object of the present invention to provide an audio signal synthesizing apparatus or the like which can perform high-quality synthesis in audio synthesis in which BGM is added to OGM.

【0007】[0007]

【課題を解決するための手段】本発明は、音声信号合成
装置に関する。本発明にかかる音声信号合成装置は、音
声信号変換手段、音声信号記録手段、音声信号合成手段
を備える。音声信号変換手段は、音声を第一音声信号に
変換する。音声信号記録手段は、第二音声信号を記録す
る。音声信号合成手段は、第一音声信号と第二音声信号
とを合成して合成音声信号を出力する。
SUMMARY OF THE INVENTION The present invention relates to an audio signal synthesizer. An audio signal synthesizing device according to the present invention includes an audio signal converting unit, an audio signal recording unit, and an audio signal synthesizing unit. The audio signal conversion means converts the audio to a first audio signal. The audio signal recording means records the second audio signal. The audio signal synthesizing unit synthesizes the first audio signal and the second audio signal and outputs a synthesized audio signal.

【0008】なお、ここでいう音声信号とは音声をアナ
ログまたはデジタルなどの信号に変換したものをいう。
[0008] The audio signal referred to here is a signal obtained by converting audio into an analog or digital signal.

【0009】上記のように構成された発明によれば、第
二音声信号は音声信号のまま第一音声信号と合成され
る。よって、第二音声信号を音声に変換する際の劣化を
防止できるので、合成音声信号の品質を高品質にでき
る。
According to the present invention, the second audio signal is synthesized with the first audio signal as it is. Therefore, it is possible to prevent deterioration when converting the second audio signal into audio, so that the quality of the synthesized audio signal can be improved.

【0010】[0010]

【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0011】第一の実施形態 図1は、本発明の第一の実施形態にかかる携帯電話1の
構成を示すブロック図である。携帯電話1は、マイク
(音声信号変換手段)12、A/D変換部14、BGM
記録部(音声信号記録手段)22、BGM再生部24、
音声信号合成部30、音声CODEC部42、合成音声信号
記録部44、合成音声信号出力部46、通信回路制御部
48、スピーカ52を備える。
FIG. 1 is a block diagram showing a configuration of a mobile phone 1 according to a first embodiment of the present invention. The mobile phone 1 includes a microphone (sound signal conversion means) 12, an A / D converter 14, a BGM
Recording unit (audio signal recording unit) 22, BGM reproducing unit 24,
It includes an audio signal synthesizing unit 30, an audio CODEC unit 42, a synthesized audio signal recording unit 44, a synthesized audio signal output unit 46, a communication circuit control unit 48, and a speaker 52.

【0012】マイク(音声信号変換手段)12は、音声
をアナログ信号である第一音声信号に変換して出力す
る。音声は、例えば、ユーザが話す“ただいま留守にし
ております”などといった留守番電話応答メッセージ
(OGM)である。A/D変換部14は、音声信号合成
部30の出力したアナログ信号の入力を受けデジタル信
号に変換して出力する。
A microphone (sound signal conversion means) 12 converts a sound into a first sound signal which is an analog signal and outputs the first sound signal. The voice is, for example, an answering machine answering message (OGM) such as “I am out of the office now” spoken by the user. The A / D converter 14 receives the input of the analog signal output from the audio signal synthesizer 30, converts it into a digital signal, and outputs the digital signal.

【0013】BGM記録部(音声信号記録手段)22
は、OGMに付加するBGM(Back Ground Music)を
記録する。なお、BGM記録部(音声信号記録手段)2
2は、BGMの他に、着信音(電話の着信をユーザに知
らせる音)、保留音(通話を保留している際に通話の相
手方に送信する音)を記録する。BGMが第二音声信号
に相当する。BGM再生部24は、第二音声信号をBG
M記録部(音声信号記録手段)22から読み出して、音
声信号合成部30に出力する。ここで、BGM再生部2
4は、第二音声信号をアナログ信号として出力する。ま
た、BGM再生部24は、スピーカ52に第二音声信号
をアナログ信号として出力する。
BGM recording section (audio signal recording means) 22
Records BGM (Back Ground Music) added to OGM. The BGM recording unit (audio signal recording means) 2
Reference numeral 2 records, in addition to the BGM, a ring tone (sound for notifying the user of an incoming call) and a hold tone (sound transmitted to the other party of the call when the call is on hold). BGM corresponds to the second audio signal. The BGM reproducing unit 24 converts the second audio signal into a BG
It is read from the M recording unit (audio signal recording unit) 22 and output to the audio signal synthesis unit 30. Here, the BGM playback unit 2
4 outputs the second audio signal as an analog signal. Further, the BGM reproducing unit 24 outputs the second audio signal to the speaker 52 as an analog signal.

【0014】音声信号合成部30は、OGMが変換され
た第一音声信号と、BGMである第二音声信号とを合成
してBGM付きOGM(合成音声信号)を出力する。た
だし、第一音声信号の入力を断つときは、第二音声信号
を出力することになる。第二音声信号の入力を断つとき
は、第一音声信号を出力することになる。
The audio signal synthesizing section 30 synthesizes the OGM-converted first audio signal and the BGM second audio signal and outputs an OGM with BGM (synthesized audio signal). However, when the input of the first audio signal is cut off, the second audio signal is output. When the input of the second audio signal is cut off, the first audio signal is output.

【0015】音声CODEC部42は、A/D変換部14が
出力するデジタル信号化された合成音声信号を符号化し
て出力する。合成音声信号記録部44は、音声CODEC部
42が出力した合成音声信号を記録する。合成音声信号
出力部46は、通信回路制御部48からBGM付きOG
M(合成音声信号)出力の要求があれば、音声信号記録
部44からBGM付きOGM(合成音声信号)を読み出
して通信回路制御部48に出力する。通信回路制御部4
8は、携帯電話1と通信回路とのデータのやりとりを制
御する。なお、通信回路制御部48は、BGM付きOG
M(合成音声信号)出力の要求および保留音出力の要求
を行なう。
The audio CODEC 42 encodes and outputs a digital audio signal synthesized by the A / D converter 14. The synthesized voice signal recording unit 44 records the synthesized voice signal output by the voice CODEC unit 42. The synthesized voice signal output unit 46 receives an OG with BGM from the communication circuit control unit 48.
When there is a request for M (synthesized voice signal) output, OGM with BGM (synthesized voice signal) is read from the voice signal recording unit 44 and output to the communication circuit control unit 48. Communication circuit controller 4
Reference numeral 8 controls data exchange between the mobile phone 1 and the communication circuit. Note that the communication circuit control unit 48 has an OG with BGM.
A request for M (synthesized voice signal) output and a request for holding sound output are made.

【0016】スピーカ52は、BGM再生部24が再生
したBGMを音声として出力する。
The speaker 52 outputs the BGM reproduced by the BGM reproducing section 24 as sound.

【0017】また、本発明の第一の実施形態にかかる携
帯電話1の構成を変形した例を図2に示す。A/D変換
部14が、図1の例と比較して、音声信号合成部30の
前に配置されていることが異なる。
FIG. 2 shows a modified example of the configuration of the mobile phone 1 according to the first embodiment of the present invention. The difference is that the A / D converter 14 is arranged before the audio signal synthesizer 30 as compared with the example of FIG.

【0018】A/D変換部14は、マイク(音声信号変
換手段)12が出力したアナログ信号をデジタル信号に
変換して出力する。この出力結果が、第一音声信号とな
る。ここで、A/D変換部14もマイク12とともに音
声信号変換手段を構成する。
The A / D converter 14 converts an analog signal output from the microphone (audio signal converter) 12 into a digital signal and outputs the digital signal. This output result is the first audio signal. Here, the A / D converter 14 also constitutes an audio signal converter together with the microphone 12.

【0019】BGM再生部24は、第二音声信号をデジ
タル信号として出力する。音声信号合成部30は、A/
D変換部14から出力された第一音声信号と、BGMで
ある第二音声信号とを合成してBGM付きOGM(合成
音声信号)を出力する。BGM付きOGM(合成音声信
号)はPCM出力となる。
The BGM reproducing section 24 outputs the second audio signal as a digital signal. The audio signal synthesizing unit 30 outputs A /
The first audio signal output from the D conversion unit 14 and the second audio signal that is BGM are combined to output an OGM with BGM (synthesized audio signal). OGM with BGM (synthesized audio signal) is a PCM output.

【0020】次に、第一の実施形態の動作を説明する。Next, the operation of the first embodiment will be described.

【0021】まず、携帯電話1にOGMを録音する。O
GMの録音の動作を図3のフローチャートを参照して説
明する。まず、携帯電話1のユーザがOGMにBGMを
付加するか否かを選択する(S10)。
First, an OGM is recorded on the mobile phone 1. O
The operation of GM recording will be described with reference to the flowchart of FIG. First, the user of the mobile phone 1 selects whether or not to add BGM to OGM (S10).

【0022】BGMを付加するならば(S10、Ye
s)、BGM再生部24の出力は、第二音声信号のみと
し、スピーカ52には出力を行なわない(S20)。そ
して、録音ボタンを押すなどして録音を開始する(S2
2)。すると、マイク12(あるいはA/D変換部1
4)から第一音声信号が(S24a)、BGM再生部2
4から第二音声信号が(S24b)、音声信号合成部3
0に出力される。第一音声信号および第二音声信号は音
声信号合成部30により合成されBGM付きOGM(合
成音声信号)となる(S26)。BGM付きOGM(合
成音声信号)はA/D変換部14および音声CODEC部4
2(あるいは音声CODEC部42のみ)を介して合成音声
信号記録部44に出力され記録される(S28)。そし
て、録音終了が指示されたか否かを判定し、終了してい
ない、すなわち録音をまだ続けるならば(S30、N
o)、第一音声信号および第二音声信号の出力(S24
a、S24b)に戻る。録音終了ボタンが押されるなど
して録音終了が指示されたならば(S30、Yes)、
処理を終了する。
If BGM is added (S10, Ye
s) The output of the BGM reproducing unit 24 is only the second audio signal, and is not output to the speaker 52 (S20). Then, recording is started by pressing a recording button (S2).
2). Then, the microphone 12 (or the A / D converter 1)
4), the first audio signal is obtained (S24a),
4 to the second audio signal (S24b), the audio signal synthesis unit 3
Output to 0. The first audio signal and the second audio signal are synthesized by the audio signal synthesizing unit 30 to be an OGM with BGM (synthesized audio signal) (S26). The OGM with BGM (synthesized audio signal) is converted by the A / D converter 14 and the audio CODEC 4
2 (or only the audio CODEC unit 42) and is output to the synthesized audio signal recording unit 44 and recorded (S28). Then, it is determined whether or not the end of the recording is instructed. If it is not ended, that is, if the recording is still continued (S30, N
o), output of the first audio signal and the second audio signal (S24)
a, Return to S24b). If the recording end is instructed by pressing the recording end button or the like (S30, Yes),
The process ends.

【0023】BGMを付加しないならば(S10、N
o)、音声信号合成部30の入力は、第一音声信号のみ
とする(S40)。そして、録音ボタンを押すなどして
録音を開始する(S42)。すると、マイク12(ある
いはA/D変換部14)から第一音声信号が(S44)
が、音声信号合成部30に出力される。音声信号合成部
30は第一音声信号をそのまま出力する。第一音声信号
はA/D変換部14および音声CODEC部42(あるいは
音声CODEC部42のみ)を介して合成音声信号記録部4
4に出力され記録される(S48)。そして、録音終了
が指示されたか否かを判定し、終了していない、すなわ
ち録音をまだ続けるならば(S50、No)、第一音声
信号の出力(S44)に戻る。録音終了ボタンが押され
るなどして録音終了が指示されたならば(S50、Ye
s)、処理を終了する。
If BGM is not added (S10, N
o), the input of the audio signal synthesis unit 30 is only the first audio signal (S40). Then, recording is started by pressing a recording button or the like (S42). Then, the first audio signal is output from the microphone 12 (or the A / D converter 14) (S44).
Is output to the audio signal synthesis unit 30. The audio signal synthesizer 30 outputs the first audio signal as it is. The first audio signal is supplied to the synthesized audio signal recording unit 4 via the A / D converter 14 and the audio CODEC 42 (or only the audio CODEC 42).
4 and recorded (S48). Then, it is determined whether or not the end of the recording is instructed. If the end is not completed, that is, if the recording is still continued (S50, No), the process returns to the output of the first audio signal (S44). If the end of recording is instructed by pressing the end recording button or the like (S50, Ye
s), end the process.

【0024】携帯電話1にOGMを録音した後に、携帯
電話1に着信があれば、録音されたOGMを利用する。
このような着信の動作を図4のフローチャートを参照し
て説明する。
After recording the OGM on the portable telephone 1, if there is an incoming call on the portable telephone 1, the recorded OGM is used.
The operation of such an incoming call will be described with reference to the flowchart of FIG.

【0025】まず、携帯電話1に着信があった場合、着
信音を出力する設定の場合は(S100、Yes)、B
GM再生部24の出力をスピーカ52にのみ供給する
(S102)。そして、BGM再生部24はBGMまた
は着信音を再生して(S104)、スピーカから出力す
る。着信音を出力しない設定の場合は(S100、N
o)、バイブレータを振動させる(S106)。なお、
携帯電話に備えられたバイブレータは周知であるため説
明を省略する。上記のようにしてユーザに電話の着信を
知らせる。
First, when there is an incoming call to the mobile phone 1, if the ring tone is set to be output (S100, Yes), B
The output of the GM reproducing unit 24 is supplied only to the speaker 52 (S102). Then, the BGM reproducing unit 24 reproduces the BGM or the ringtone (S104) and outputs it from the speaker. In the case of setting not to output a ringtone (S100, N
o), the vibrator is vibrated (S106). In addition,
The description of the vibrator provided in the mobile phone is omitted because it is well known. The user is notified of the incoming call as described above.

【0026】携帯電話1は、ビジートーンが設定回数に
達したか否かを判定する(S110)。達していれば
(S110、Yes)、ユーザは携帯電話1に出られな
い状況であるので、留守番電話の機能を果たすこととす
る。すなわち、通信回路制御部48は、BGM付きOG
M(合成音声信号)の出力を合成音声信号出力部46に
要求する(S112)。合成音声信号出力部46は音声
信号記録部44からBGM付きOGM(合成音声信号)
を読み出す(S114)。そして、合成音声信号出力部
46はBGM付きOGM(合成音声信号)を、通信回路
制御部48を介して、通信回路に出力する(S11
6)。
The mobile phone 1 determines whether or not the busy tone has reached the set number of times (S110). If it has reached (S110, Yes), the user is unable to answer the mobile phone 1, and thus fulfills the function of answering machine. That is, the communication circuit control unit 48
The output of M (synthesized speech signal) is requested to the synthesized speech signal output unit 46 (S112). The synthesized voice signal output unit 46 outputs an OGM with BGM (synthesized voice signal) from the voice signal recording unit 44.
Is read (S114). Then, the synthesized voice signal output unit 46 outputs the OGM with BGM (synthesized voice signal) to the communication circuit via the communication circuit control unit 48 (S11).
6).

【0027】ビジートーンが設定回数に達していなけれ
ば(S110、No)、オフフックした否かを判定する
(S120)。オフフックしていなければ(S120、
No)、ビジートーンの回数判定(S110)に戻る。
オフフックしていれば(S120、Yes)、通話ある
いは保留し(S122)、適宜終了する。
If the busy tone has not reached the set number of times (S110, No), it is determined whether or not an off-hook has been performed (S120). If not off-hook (S120,
No), the process returns to the determination of the number of busy tones (S110).
If the user is off-hook (S120, Yes), the call or call is put on hold (S122), and the process is terminated as appropriate.

【0028】保留(S122)の際には、保留音を発生
するが、その手順を図5のフローチャートを参照して説
明する。まず、保留した場合に、BGMを出力すること
が設定されているか否かが判定される(S124)。B
GMを出力するならば(S124、Yes)、音声信号
合成部30の入力を第二音声信号のみとする(S12
6)。そして、BGM再生部24がBGMを再生する
(S128)。すると、A/D変換部14、音声CODEC
部42(あるいは音声CODEC部42のみ)を介して通信
回路制御部48にBGMが出力され、BGMが通信回線
を介して相手方に送信される。BGMを出力しないなら
ば(S124、No)、BGM再生部24が保留音を再
生する(S130)。すると、A/D変換部14、音声
CODEC部42(あるいは音声CODEC部42のみ)を介して
通信回路制御部48に保留音が出力され、保留音が通信
回線を介して相手方に送信される。そして、保留が解除
されなければ(S132、No)、出力の設定の判定
(S124)に戻り、保留が解除されれば(S132、
Yes)、保留処理を終了する。
At the time of holding (S122), a holding sound is generated. The procedure will be described with reference to the flowchart of FIG. First, it is determined whether or not the output of BGM is set when suspended (S124). B
If the GM is output (S124, Yes), the input of the audio signal synthesizing unit 30 is set to only the second audio signal (S12).
6). Then, the BGM reproducing unit 24 reproduces the BGM (S128). Then, the A / D converter 14 and the audio CODEC
The BGM is output to the communication circuit control unit 48 via the unit 42 (or only the audio CODEC unit 42), and the BGM is transmitted to the other party via the communication line. If the BGM is not output (S124, No), the BGM reproducing unit 24 reproduces the hold sound (S130). Then, the A / D converter 14, the audio
The hold sound is output to the communication circuit control unit 48 via the CODEC unit 42 (or only the voice CODEC unit 42), and the hold sound is transmitted to the other party via the communication line. If the hold is not released (S132, No), the process returns to the output setting determination (S124), and if the hold is released (S132,
Yes), ends the suspension processing.

【0029】第一の実施形態によれば、第二音声信号
(BGM)は音声信号のまま第一音声信号(OGM)と
合成される。よって、第二音声信号(BGM)を音声に
変換する際の劣化を防止できるので、合成音声信号(B
GM付きOGM)の品質を高品質にできる。
According to the first embodiment, the second audio signal (BGM) is synthesized with the first audio signal (OGM) as it is. Accordingly, it is possible to prevent deterioration when the second audio signal (BGM) is converted into audio, so that the synthesized audio signal (BGM)
OGM with GM) can be made high quality.

【0030】また、合成音声信号(BGM付きOGM)
を合成音声信号記録部44に記録しておくため、必要に
応じて合成音声信号(BGM付きOGM)を送信でき
る。
Also, a synthesized speech signal (OGM with BGM)
Is recorded in the synthesized voice signal recording unit 44, so that a synthesized voice signal (OGM with BGM) can be transmitted as necessary.

【0031】第二の実施形態 第二の実施形態にかかる携帯電話1は、音声信号合成部
30が合成音声信号出力部46の要求があった時に、音
声信号の合成を行なう点で第一の実施形態と異なる。以
下、第一の実施形態と同様な部分は同じ番号を付して説
明を省略する。
Second Embodiment A portable telephone 1 according to a second embodiment is different from the first embodiment in that the audio signal synthesizing unit 30 synthesizes an audio signal when a request from the synthesized audio signal output unit 46 is made. Different from the embodiment. Hereinafter, the same parts as those in the first embodiment are denoted by the same reference numerals, and description thereof will be omitted.

【0032】図6は、本発明の第二の実施形態にかかる
携帯電話1の構成を示すブロック図である。携帯電話1
は、マイク(音声信号変換手段)12、A/D変換部1
4、OGM記録部16、BGM記録部(音声信号記録手
段)22、BGM再生部24、音声信号合成部30、音
声CODEC部42、合成音声信号記録部44、合成音声信
号出力部46、通信回路制御部48、スピーカ52を備
える。
FIG. 6 is a block diagram showing the configuration of the mobile phone 1 according to the second embodiment of the present invention. Mobile phone 1
Is a microphone (audio signal conversion means) 12, an A / D conversion unit 1
4, OGM recording unit 16, BGM recording unit (audio signal recording unit) 22, BGM reproducing unit 24, audio signal synthesizing unit 30, audio CODEC unit 42, synthesized audio signal recording unit 44, synthesized audio signal output unit 46, communication circuit The control unit 48 includes a speaker 52.

【0033】マイク(音声信号変換手段)12、A/D
変換部14は、第一の実施形態と同様である。OGM記
録部16は、マイク(音声信号変換手段)12の出力を
記録する。
Microphone (audio signal conversion means) 12, A / D
The conversion unit 14 is the same as in the first embodiment. The OGM recording unit 16 records the output of the microphone (audio signal conversion unit) 12.

【0034】BGM記録部(音声信号記録手段)22、
BGM再生部24は、第一の実施形態と同様である。
BGM recording section (audio signal recording means) 22,
The BGM reproducing unit 24 is the same as in the first embodiment.

【0035】音声信号合成部30は、OGM記録部16
に記録された第一音声信号と、BGMである第二音声信
号とを合成してBGM付きOGM(合成音声信号)を出
力する。ただし、第一音声信号の入力を断つときは、第
二音声信号を出力することになる。第二音声信号の入力
を断つときは、第一音声信号を出力することになる。
The audio signal synthesizing section 30 is provided with the OGM recording section 16.
And the second audio signal, which is BGM, is synthesized to output an OGM with BGM (synthesized audio signal). However, when the input of the first audio signal is cut off, the second audio signal is output. When the input of the second audio signal is cut off, the first audio signal is output.

【0036】音声CODEC部42は、第一実施形態と同様
である。合成音声信号出力部46は、通信回路制御部4
8からBGM付きOGM(合成音声信号)出力の要求が
あれば、音声信号合成部30に音声信号の合成を要求
し、音声信号合成部30が合成するBGM付きOGM
(合成音声信号)を読み出して通信回路制御部48に出
力する。通信回路制御部48は、第一実施形態と同様で
ある。
The voice CODEC 42 is the same as in the first embodiment. The synthesized voice signal output unit 46 includes the communication circuit control unit 4
8, if there is a request for an OGM with BGM (synthesized audio signal) output, the audio signal synthesizing unit 30 requests the audio signal synthesizing unit 30 to synthesize an audio signal,
(Synthesized voice signal) is read and output to the communication circuit control unit 48. The communication circuit control unit 48 is the same as in the first embodiment.

【0037】スピーカ52は、第一実施形態と同様であ
る。
The speaker 52 is the same as in the first embodiment.

【0038】また、本発明の第二の実施形態にかかる携
帯電話1の構成を変形した例を図7に示す。A/D変換
部14が、図6の例と比較して、OGM記録部16の前
に配置されていることが異なる。
FIG. 7 shows a modified example of the configuration of the mobile phone 1 according to the second embodiment of the present invention. The difference is that the A / D conversion unit 14 is arranged before the OGM recording unit 16 as compared with the example of FIG.

【0039】A/D変換部14は、マイク(音声信号変
換手段)12が出力したアナログ信号をデジタル信号に
変換して出力する。この出力結果が、第一音声信号とな
る。ここで、A/D変換部14もマイク12とともに音
声信号変換手段を構成する。第一音声信号は、OGM記
録部16に記録される。
The A / D converter 14 converts an analog signal output by the microphone (sound signal converter) 12 into a digital signal and outputs the digital signal. This output result is the first audio signal. Here, the A / D converter 14 also constitutes an audio signal converter together with the microphone 12. The first audio signal is recorded in the OGM recording unit 16.

【0040】BGM再生部24は、第二音声信号をデジ
タル信号として出力する。音声信号合成部30は、OG
M記録部16に記録れた第一音声信号と、BGMである
第二音声信号とを合成してBGM付きOGM(合成音声
信号)を出力する。BGM付きOGM(合成音声信号)
はPCM出力となる。
The BGM reproducing section 24 outputs the second audio signal as a digital signal. The audio signal synthesis unit 30
The first audio signal recorded in the M recording unit 16 and the second audio signal, which is BGM, are synthesized to output an OGM with BGM (synthesized audio signal). OGM with BGM (synthesized voice signal)
Is a PCM output.

【0041】次に、第二の実施形態の動作を説明する。Next, the operation of the second embodiment will be described.

【0042】まず、携帯電話1にOGMを録音する。O
GMの録音の動作を図8のフローチャートを参照して説
明する。
First, the OGM is recorded on the mobile phone 1. O
The GM recording operation will be described with reference to the flowchart of FIG.

【0043】まず、録音ボタンを押すなどして録音を開
始する(S42)。すると、マイク12(あるいはA/
D変換部14)から第一音声信号が出力される(S4
4)。そして、第一音声信号がOGM記録部16に記録
される(S48)。そして、録音終了が指示されたか否
かを判定し、終了していない、すなわち録音をまだ続け
るならば(S50、No)、第一音声信号の出力(S4
4)に戻る。録音終了ボタンが押されるなどして録音終
了が指示されたならば(S50、Yes)、処理を終了
する。
First, recording is started by pressing a recording button or the like (S42). Then, the microphone 12 (or A /
The first audio signal is output from the D conversion unit 14) (S4).
4). Then, the first audio signal is recorded in the OGM recording unit 16 (S48). Then, it is determined whether or not the end of the recording has been instructed. If the recording has not been completed, that is, if the recording is still continued (S50, No), the output of the first audio signal (S4).
Return to 4). If the recording end is instructed by pressing the recording end button or the like (S50, Yes), the process ends.

【0044】携帯電話1にOGMを録音した後に、携帯
電話1に着信があれば、録音されたOGMを利用する。
このような着信の動作を図9のフローチャートを参照し
て説明する。
After recording the OGM on the mobile phone 1, if there is an incoming call on the mobile phone 1, the recorded OGM is used.
Such an incoming call operation will be described with reference to the flowchart of FIG.

【0045】まず、携帯電話1に着信があった場合、着
信音を出力する設定の場合は(S100、Yes)、B
GM再生部24の出力をスピーカ52にのみ供給する
(S102)。そして、BGM再生部24はBGMまた
は着信音を再生して(S104)、スピーカから出力す
る。着信音を出力しない設定の場合は(S100、N
o)、バイブレータを振動させる(S106)。なお、
携帯電話に備えられたバイブレータは周知であるため説
明を省略する。上記のようにしてユーザに電話の着信を
知らせる。
First, when there is an incoming call to the mobile phone 1, if the setting is to output a ringtone (S100, Yes), B
The output of the GM reproducing unit 24 is supplied only to the speaker 52 (S102). Then, the BGM reproducing unit 24 reproduces the BGM or the ringtone (S104) and outputs it from the speaker. In the case of setting not to output a ringtone (S100, N
o), the vibrator is vibrated (S106). In addition,
The description of the vibrator provided in the mobile phone is omitted since it is well known. The user is notified of the incoming call as described above.

【0046】携帯電話1は、ビジートーンが設定回数に
達したか否かを判定する(S110)。達していれば
(S110、Yes)、ユーザは携帯電話1に出られな
い状況であるので、留守番電話の機能を果たすこととす
る。すなわち、通信回路制御部48は、BGM付きOG
M(合成音声信号)の出力を合成音声信号出力部46に
要求する(S112)。合成音声信号出力部46は、音
声信号合成部30に音声信号の合成を要求する(S14
2)。音声信号合成部30はかかる要求を受け、第一音
声信号と第二音声信号とを合成して合成音声信号を生成
する(S144)。合成音声信号は、A/D変換部14
および音声CODEC部42(あるいは音声CODEC部42の
み)を介して合成音声信号出力部46に出力される。そ
して、合成音声信号出力部46はBGM付きOGM(合
成音声信号)を、通信回路制御部48を介して、通信回
路に出力する(S116)。
The mobile phone 1 determines whether or not the busy tone has reached the set number of times (S110). If it has reached (S110, Yes), the user is unable to answer the mobile phone 1, and thus fulfills the function of answering machine. That is, the communication circuit control unit 48
The output of M (synthesized speech signal) is requested to the synthesized speech signal output unit 46 (S112). The synthesized voice signal output unit 46 requests the voice signal synthesis unit 30 to synthesize a voice signal (S14).
2). Upon receiving the request, the audio signal synthesis unit 30 synthesizes the first audio signal and the second audio signal to generate a synthesized audio signal (S144). The synthesized voice signal is supplied to the A / D converter 14
The voice signal is output to the synthesized voice signal output unit 46 via the voice CODEC unit 42 (or only the voice CODEC unit 42). Then, the synthesized voice signal output unit 46 outputs the OGM with BGM (synthesized voice signal) to the communication circuit via the communication circuit control unit 48 (S116).

【0047】ビジートーンが設定回数に達していなけれ
ば(S110、No)、オフフックした否かを判定する
(S120)。オフフックしていなければ(S120、
No)、ビジートーンの回数判定(S110)に戻る。
オフフックしていれば(S120、Yes)、通話ある
いは保留し(S122)、適宜終了する。
If the busy tone has not reached the set number of times (S110, No), it is determined whether or not an off-hook has been performed (S120). If not off-hook (S120,
No), the process returns to the determination of the number of busy tones (S110).
If the user is off-hook (S120, Yes), the call or call is put on hold (S122), and the process is terminated as appropriate.

【0048】保留(S122)の際には、保留音を発生
するが、その手順は第一の実施形態と同様であり説明を
省略する(図5参照)。
At the time of holding (S122), a holding sound is generated. The procedure is the same as that of the first embodiment, and the description is omitted (see FIG. 5).

【0049】第二の実施形態によれば、第二音声信号
(BGM)は音声信号のまま第一音声信号(OGM)と
合成される。よって、第二音声信号(BGM)を音声に
変換する際の劣化を防止できるので、合成音声信号(B
GM付きOGM)の品質を高品質にできる。
According to the second embodiment, the second audio signal (BGM) is synthesized as the audio signal with the first audio signal (OGM). Accordingly, it is possible to prevent deterioration when the second audio signal (BGM) is converted into audio, so that the synthesized audio signal (BGM)
OGM with GM) can be made high quality.

【0050】また、合成音声信号(BGM付きOGM)
の出力が要求されてから、合成音声信号を生成するた
め、必要に応じて合成音声信号(BGM付きOGM)を
送信できる。
Also, a synthesized voice signal (OGM with BGM)
After the output of is requested, a synthesized speech signal (OGM with BGM) can be transmitted as needed to generate a synthesized speech signal.

【0051】また、上記の実施形態は、以下のようにし
て実現できる。CPU、ハードディスク、フラッシュメ
モリ、メディア(フロッピー(登録商標)ディスク、C
D−ROM、メモリスティックなど)読み取り装置を備
えたコンピュータのメディア読み取り装置に、上記の各
部分を実現するプログラムを記録したメディアを読み取
らせて、ハードディスク、フラッシュメモリなどにイン
ストールする。このような方法でも、上記の機能を実現
できる。
The above embodiment can be realized as follows. CPU, hard disk, flash memory, media (floppy (registered trademark) disk, C
(A D-ROM, a memory stick, etc.) A media reading device of a computer having a reading device is made to read a medium recording a program for realizing the above-described respective portions, and is installed on a hard disk, a flash memory, or the like. Even with such a method, the above function can be realized.

【0052】[0052]

【発明の効果】本発明によれば、第二音声信号は音声信
号のまま第一音声信号と合成される。よって、第二音声
信号を音声に変換する際の劣化を防止できるので、合成
音声信号の品質を高品質にできる。
According to the present invention, the second audio signal is synthesized as it is with the first audio signal. Therefore, it is possible to prevent deterioration when converting the second audio signal into audio, so that the quality of the synthesized audio signal can be improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第一の実施形態にかかる携帯電話1の
構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a mobile phone 1 according to a first embodiment of the present invention.

【図2】本発明の第一の実施形態の変形例にかかる携帯
電話1の構成を示すブロック図である。
FIG. 2 is a block diagram showing a configuration of a mobile phone 1 according to a modification of the first embodiment of the present invention.

【図3】OGMの録音の動作を示すフローチャートであ
る。
FIG. 3 is a flowchart illustrating an operation of recording an OGM.

【図4】着信の動作を示すフローチャートである。FIG. 4 is a flowchart showing an incoming call operation.

【図5】保留音の発生手順を示すフローチャートであ
る。
FIG. 5 is a flowchart illustrating a procedure for generating a hold sound;

【図6】本発明の第二の実施形態にかかる携帯電話1の
構成を示すブロック図である。
FIG. 6 is a block diagram illustrating a configuration of a mobile phone 1 according to a second embodiment of the present invention.

【図7】本発明の第二の実施形態の変形例にかかる携帯
電話1の構成を示すブロック図である。
FIG. 7 is a block diagram showing a configuration of a mobile phone 1 according to a modification of the second embodiment of the present invention.

【図8】OGMの録音の動作を示すフローチャートであ
る。
FIG. 8 is a flowchart showing an operation of recording an OGM.

【図9】着信の動作を示すフローチャートである。FIG. 9 is a flowchart showing an incoming call operation.

【符号の説明】[Explanation of symbols]

1 携帯電話 12 マイク(音声信号変換手段) 14 A/D変換部 22 BGM記録部(音声信号記録手段) 24 BGM再生部 30 音声信号合成部 42 音声CODEC部 44 合成音声信号記録部 46 合成音声信号出力部 48 通信回路制御部 52 スピーカ Reference Signs List 1 mobile phone 12 microphone (audio signal conversion means) 14 A / D conversion section 22 BGM recording section (audio signal recording means) 24 BGM reproduction section 30 audio signal synthesis section 42 audio CODEC section 44 synthesized audio signal recording section 46 synthesized audio signal Output unit 48 Communication circuit control unit 52 Speaker

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】音声を第一音声信号に変換する音声信号変
換手段と、 第二音声信号を記録する音声信号記録手段と、 前記第一音声信号と前記第二音声信号とを合成して合成
音声信号を出力する音声信号合成手段と、 を備えた音声信号合成装置。
1. An audio signal converting means for converting audio into a first audio signal, an audio signal recording means for recording a second audio signal, and synthesizing and synthesizing the first audio signal and the second audio signal. An audio signal synthesizing unit that outputs an audio signal.
【請求項2】請求項1に記載の音声信号合成装置であっ
て、 前記合成音声信号を記録する合成音声信号記録手段と、 合成音声信号の出力が要求された場合に、前記合成音声
信号記録手段から前記合成音声信号を読み出して出力す
る合成音声信号出力手段と、 を備えた音声信号合成装置。
2. The audio signal synthesizing device according to claim 1, wherein said synthesized audio signal recording means for recording said synthesized audio signal, and said synthetic audio signal recording when an output of said synthesized audio signal is requested. And a synthesized voice signal output means for reading and outputting the synthesized voice signal from the means.
【請求項3】請求項1に記載の音声信号合成装置であっ
て、 合成音声信号の出力が要求された場合に、前記音声信号
合成手段に前記第一音声信号と前記第二音声信号との合
成を要求して前記合成音声信号を出力する合成音声信号
出力手段を備えた音声信号合成装置。
3. The audio signal synthesizing device according to claim 1, wherein when an output of a synthesized audio signal is requested, the audio signal synthesizing means outputs the first audio signal and the second audio signal to each other. An audio signal synthesizer comprising a synthesized audio signal output unit for requesting synthesis and outputting the synthesized audio signal.
【請求項4】請求項1ないし3のいずれか一項に記載の
音声信号合成装置であって、 前記音声信号変換手段は、前記第一音声信号をアナログ
信号とする音声信号合成装置。
4. The audio signal synthesizing device according to claim 1, wherein said audio signal converting means converts said first audio signal into an analog signal.
【請求項5】請求項1ないし3のいずれか一項に記載の
音声信号合成装置であって、 前記音声信号変換手段は、前記第一音声信号をデジタル
信号とする音声信号合成装置。
5. The audio signal synthesizing device according to claim 1, wherein said audio signal converting means converts said first audio signal into a digital signal.
【請求項6】音声を第一音声信号に変換する音声信号変
換手段と、第二音声信号を記録する音声信号記録手段と
を備えた音声信号合成装置における音声信号合成方法で
あって、 前記第一音声信号と前記第二音声信号とを合成して合成
音声信号を出力する音声信号合成工程を備えた音声信号
合成方法。
6. An audio signal synthesizing method in an audio signal synthesizing apparatus comprising: audio signal converting means for converting audio into a first audio signal; and audio signal recording means for recording a second audio signal. An audio signal synthesizing method comprising an audio signal synthesizing step of synthesizing one audio signal and the second audio signal and outputting a synthesized audio signal.
【請求項7】音声を第一音声信号に変換する音声信号変
換手段と、第二音声信号を記録する音声信号記録手段と
を備えた音声信号合成装置における音声信号合成処理を
コンピュータに実行させるためのプログラムであって、 前記第一音声信号と前記第二音声信号とを合成して合成
音声信号を出力する音声信号合成処理をコンピュータに
実行させるためのプログラム。
7. A computer for executing an audio signal synthesizing process in an audio signal synthesizing device comprising an audio signal converting means for converting audio into a first audio signal and an audio signal recording means for recording a second audio signal. A program for causing a computer to execute an audio signal synthesizing process of synthesizing the first audio signal and the second audio signal and outputting a synthesized audio signal.
【請求項8】音声を第一音声信号に変換する音声信号変
換手段と、第二音声信号を記録する音声信号記録手段と
を備えた音声信号合成装置における音声信号合成処理を
コンピュータに実行させるためのプログラムを記録した
コンピュータによって読み取り可能な記録媒体であっ
て、 前記第一音声信号と前記第二音声信号とを合成して合成
音声信号を出力する音声信号合成処理をコンピュータに
実行させるためのプログラムを記録したコンピュータに
よって読み取り可能な記録媒体。
8. A computer for executing an audio signal synthesizing process in an audio signal synthesizing device comprising an audio signal converting means for converting audio into a first audio signal and an audio signal recording means for recording a second audio signal. A computer-readable recording medium having recorded thereon a program for causing a computer to execute an audio signal synthesizing process of synthesizing the first audio signal and the second audio signal and outputting a synthesized audio signal. A recording medium readable by a computer on which is recorded.
JP2001162035A 2001-05-30 2001-05-30 Voice signal synthesizing device, method, program and recording medium for recording the program Withdrawn JP2002354111A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001162035A JP2002354111A (en) 2001-05-30 2001-05-30 Voice signal synthesizing device, method, program and recording medium for recording the program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001162035A JP2002354111A (en) 2001-05-30 2001-05-30 Voice signal synthesizing device, method, program and recording medium for recording the program

Publications (1)

Publication Number Publication Date
JP2002354111A true JP2002354111A (en) 2002-12-06

Family

ID=19005221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001162035A Withdrawn JP2002354111A (en) 2001-05-30 2001-05-30 Voice signal synthesizing device, method, program and recording medium for recording the program

Country Status (1)

Country Link
JP (1) JP2002354111A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2112650A1 (en) 2008-04-23 2009-10-28 Sony Ericsson Mobile Communications Japan, Inc. Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2112650A1 (en) 2008-04-23 2009-10-28 Sony Ericsson Mobile Communications Japan, Inc. Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system
EP3086318A1 (en) 2008-04-23 2016-10-26 Sony Mobile Communications Japan, Inc. Speech synthesis apparatus, speech synthesis method, speech synthesis program, and portable information terminal
US9812120B2 (en) 2008-04-23 2017-11-07 Sony Mobile Communications Inc. Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system
US10720145B2 (en) 2008-04-23 2020-07-21 Sony Corporation Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system

Similar Documents

Publication Publication Date Title
KR100536965B1 (en) Telephone terminal apparatus and communication method
JP4473260B2 (en) Telephone communication device
JP2002064626A (en) Portable telephone
JP2000224269A (en) Telephone set and telephone system
US7515702B2 (en) Method and system for downloading audio samples for personalized telephone ring tones
JP3994341B2 (en) Hands-free call system and method for setting ringtone in hands-free call system
KR100587425B1 (en) Handset for reinforcing multimedia function
JP2001209378A (en) Mobile phone
JP2002354111A (en) Voice signal synthesizing device, method, program and recording medium for recording the program
JP2002125011A (en) Information terminal device
KR20010095712A (en) Method for playing music in phone
JP2005012398A (en) Mobile communication terminal
KR100587147B1 (en) Mobile handset with ring back tone providing function and method of controlling the same
JP2005217614A (en) Telephone terminal and method for reproducing melody
JP4314298B2 (en) Voice mail device and method for controlling voice mail device
JP5082809B2 (en) Hands-free device
JP2001175300A (en) Speech synthesizer for telephone terminal device
JP4306944B2 (en) Music playback device
JP3240000B1 (en) Communication terminal device, ring tone playing method and information storage medium
JPH1155379A (en) Telephone terminal equipment
JP2002164969A (en) Device with ringer melody transfer function to mobile phone and transfer method
JP4651294B2 (en) Mobile terminal device
KR0168799B1 (en) Recording/playback system for handsfree kit
JP2006033683A (en) Ip telephone set and ip telephone set system using same
JPH1013499A (en) Original calling sound device

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080805