CN101138152B

CN101138152B - 语音输出控制设备以及方法

Info

Publication number: CN101138152B
Application number: CN200680007254XA
Authority: CN
Inventors: 鸟山康治
Original assignee: Casio Computer Co Ltd
Current assignee: Casio Computer Co Ltd
Priority date: 2005-04-28
Filing date: 2006-04-25
Publication date: 2011-07-27
Anticipated expiration: 2026-04-25
Also published as: CN101138152A; TW200705803A; JP4876434B2; TWI335726B; US20060247920A1; US7720215B2; JP2006311382A; WO2006118292A1

Abstract

当增加外部放大器(18a)的放大因子以提高最小音量电平时，把待输出的文本数据的合成语音生成为PCM数据。当对于每个帧(63ms)输出该PCM数据时，对电池电源(B)的电压进行检测，并且根据对应于所检测的电源电压(V)的阈值(Level1～4)来设置不同的ATT值(衰减比)。电源电压(V)越低，衰减比越高。通过这种衰减比来衰减PCM数据，以降低电池电源(B)的负载。尽管电池电源(B)耗尽到了一定程度，不会发生由于电源负载的瞬间增大而掉电，结果以使得其低电平部分容易听见的足够的音量电平来输出一系列语音数据项的高电平部分。

Description

语音输出控制设备以及方法

技术领域

本发明涉及用于具有语音输出功能并且由电池驱动的电子装置的语音输出控制设备，以及记录有语音输出控制程序的记录介质。

背景技术

通常，具有语音输出功能的电子装置，例如音频设备，包括输出音量控制设备，其根据电子装置的各种使用环境来对输出语音的音量和音调进行优化。

例如，车载音频设备包括输出音量控制设备。输出音量控制设备根据其环境噪声水平来改变输出语音的音量和音调。当噪声水平升高到干扰输出语音时，输出音量控制设备控制音量以使得听众可以容易地收听输出语音。

个人计算机的语音输出设备包括音量控制设备。该输出音量控制设备对输出音量进行控制，并且每当语音输出设备接收了具有不同记录电平的语音信号时，把输出音量设定在固定的电平。当设备对与上一个语音信号具有相同音量电平的不同语音信号进行输出时，其对输出语音信号的音量进行控制，并且防止其被干扰。

考虑到外部影响，例如周围的噪声水平以及音量的输出增益，为了防止输出语音发生扭曲，以上现有技术的输出音量控制设备在动态范围上压缩输入语音信号。

有一种小型电子设备，例如具有语音输出功能的电子词典，其对诸如词语或句子的文本读音进行输出。根据朗读的节奏、重音、语调，极大地扩大了输出读音的动态范围。

这种小型电子设备是用电池驱动的。因此有必要控制文本语音的音量，并且限制最大输出音量，以防止在电池几乎耗尽的情况下由于暂时的电压降低而导致文本语音的最大部分掉电。然而，如果对最大输出音量进行了限制，用户几乎听不到或不能听到文本语音的低电平部分。

当对记录的真实语音的文本语音数据进行输出时，可以预先将记录的语音的低电平部分提高到可听的电平。然而，当合成的不是记录的语音而是朗读的文本语音，并且实时地输出该合成的语音时，不能预先控制(改变)音量电平。

发明内容

根据本发明的一方面，提供了用于对一系列语音数据项的输出进行控制的语音输出控制设备，其包括：用于输出语音的语音输出装置，用于提供电源电压以从语音输出装置输出语音的电源装置，用于从一系列语音数据项获得一个单元的语音数据的语音数据获得装置，用于在当对由语音数据获得装置所获得的一个输出单元的语音数据进行输出时，对从电源装置所提供的电源电压进行检测的电压检测装置，用于根据由电压检测装置所检测的电源电压，来对由语音数据获得装置所获得的一个输出单元的语音数据的音量电平进行调整的音量电平调整装置，以及用于使得语音输出装置对由语音音量调整装置来调整了音量电平的语音数据进行输出的语音输出控制装置。

在该语音输出控制设备中，该音量电平调整装置包括衰减值设置装置，用于对随由电压检测装置所检测的电源电压的减少而增加的衰减值进行设置，并且该音量电平调整装置根据由该衰减值设置装置所设置的音量衰减值，对由语音数据获得装置所获得的一个输出单元的语音数据的音量电平进行衰减和调整。

根据本发明，即使电池电源耗尽到了一定程度，也能在足够的音量电平上输出一系列语音数据项的高电平部分，使得其低电平部分容易听见。

附图说明

图1是示出了包括根据本发明的第一实施例的语音输出控制设备的便携式设备(电子词典)的电路结构的框图；

图2是示出了该便携式设备的电路中所包括的语音输出控制设备的主体的结构的框图；

图3是存储在便携式设备的程序ROM、数据库ROM和RAM中的数据的内容的图；

图4A是待发送为语音的文本语音信号的波形图，以描述当对于每个帧得到了信号峰值时，用于提取信号的过程；

图4B是一帧中的文本语音信号的采样的波形图；

图4C是在一帧的十个部分中的每一个中的文本语音信号的放大的波形图；

图5是用于设置对应于待输出为语音的PCM数据的峰值的衰减比(ATT值)的ATT值设置表；

图6A是为了说明根据第一实施例的语音输出控制设备的功能和优势的，当仅对输入的语音信号进行线性放大，并且在放大极限内进行输出时，现有技术的输入/输出特性的图；

图6B是当通过对对应于语音信号的PCM峰值的衰减比(ATT值)进行设置来对输入的语音信号进行输出时，而获得的输入/输出特性的图；

图6C是从第一实施例所获得的输入/输出特性的图，在第一实施例中，通过设置对应于PCM峰值的衰减比(ATT值)来将放大因子增加到放大极限，从而提高最小音量电平；

图6D是对应于现有技术的输入/输出特性的文本语音数据的输出信号波形的图；

图6E是对应于第一实施例的输入/输出特性的文本语音数据的输出信号波形的图；

图7是将要由便携式设备10所执行的词典搜索语音输出过程的流程图；

图8A是根据便携式设备的词典搜索语音输出过程来执行的搜索到的信息显示屏的显示操作的说明；

图8B是根据便携式设备的词典搜索语音输出过程来执行的搜索到的信息显示屏的另一个显示操作的说明；

图8C是根据便携式设备的词典搜索语音输出过程来执行的搜索到的信息显示屏的另一个显示操作的说明；

图8D是根据便携式设备的词典搜索语音输出过程来执行的搜索到的信息显示屏的另一个显示操作的说明；

图9是示出了根据便携式设备中所包括的第一实施例的语音输出控制设备的语音输出控制过程的流程图；

图10A是第一ATT值设置表，用于通过执行滞后过程A来设置对应于待输出为语音的PCM数据的峰值的衰减比(ATT值)；

图10B是第二ATT值设置表，用于通过执行滞后过程A来设置对应于待输出为语音的PCM数据的峰值的衰减比(ATT值)；

图11是用于根据PCM峰值中的变化方向来选择性地使用第一和第二ATT值设置表的滞后过程A的流程图；

图12是示出了在伴随着滞后过程A的语音输出控制过程中所设置的ATT值的变化的图；

图13是示出了用于根据待输出为语音的PCM数据的峰值，通过滞后过程B来对两个衰减比(ATT值)进行选择性地设置的衰减比特性X和Y中的变化的图；

图14是示出了用于根据PCM峰值中的变化方向来选择性地使用具有特性X的ATT值设置表和具有特性Y的ATT值设置表的滞后过程B的流程图；

图15A是根据本发明的第一实施例的语音输出控制设备的语音输出控制过程中的合成语音的PCM数据的第一衰减(ATT)过程的图；

图15B是根据本发明的第一实施例的语音输出控制设备的语音输出控制过程中的合成语音的PCM数据的第二衰减(ATT)过程的图；

图15C是根据本发明的第一实施例的语音输出控制设备的语音输出控制过程中的合成语音的PCM数据的第三衰减(ATT)过程的图；

图16是示出了当从包括在便携式设备中(电子词典)的、根据本发明的第二实施例的语音输出控制设备中输出语音时，ATT值(衰减比)设置特性和检测的电源电压之间的关系的图；

图17是示出了根据本发明的第二实施例的语音输出控制设备的语音输出控制过程的流程图；

图18A是用于通过滞后过程A来对对应于当把PCM数据输出为语音时所检测到的电源电压的衰减比(ATT值)进行设置的第一电源电压电平/ATT值设置表；

图18B是用于通过滞后过程A来对对应于当把PCM数据输出为语音时所检测到的电源电压的衰减比(ATT值)进行设置的第二电源电压电平/ATT值设置表；

图19是用于根据所检测的电源电压来选择性地使用第一和第二电源电压电平/ATT值设置表的滞后过程A的流程图；

图20是示出了在伴随着滞后过程A的语音输出控制过程中所设置的ATT值的变化的图；

图21是示出了用于根据当把PCM数据输出为语音时所检测的电源电压，通过滞后过程B来对两个衰减比(ATT值)进行选择性地设置的衰减比特性X和Y中的变化的图；

图22是示出了用于根据所检测的电源电压的变化方向来选择性地使用具有特性X的电源电压电平/ATT值设置表和具有特性Y的电源电压电平/ATT值设置表的滞后过程B的流程图；

图23A是示出了当从包括在便携式设备中(电子词典)的、根据本发明的第三实施例的语音输出控制设备中输出语音时所检测的电源电压，与根据电源电压来选择性地使用的四个ATT值(衰减比)设置特性A到D之间的关系的图；

图23B是示出了输出语音与ATT值设置特性A到D之间的关系的图；

图24是示出了根据本发明的第三实施例的语音输出控制设备的第一语音输出控制过程的流程图；以及

图25是示出了根据本发明的第三实施例的语音输出控制设备的第二语音输出控制过程的流程图。

具体实施方式

将参考附图来描述本发明的实施例

(第一实施例)

图1是示出了包括根据本发明的第一实施例的语音输出控制设备的便携式设备(电子词典)的电路结构的框图。

将便携式设备10配置为个人数字助理(PDA)、个人计算机(PC)、手机以及电子书，每个都具有电子词典的功能，或者仅用来做电子词典(后述)。便携式设备10包括用于从各种存储介质接收程序并且根据所接受的程序来操作的计算机。该计算机包括具有中央处理器(CPU)11的电子电路。

CPU 11根据预先存储在程序ROM 12a中的设备控制程序来对该电路的各个单元的操作进行控制，从诸如存储卡13的外部存储介质来把设备控制程序加载到程序ROM 12a中，或者通过通信设备从因特网N(未示出)网络服务器(程序服务器)来把设备控制程序加载到程序ROM 12a中。响应于来自诸如键盘14和触摸板15的输入单元16的用户输入信号，或者用于与诸如外部连接的EEPROM、RAM和ROM的存储卡(存储介质)连接的通信信号，启动存储在程序ROM12a中的设备控制程序。

将数据库ROM 12b和RAM 12c以及程序ROM 12a连接到CPU11。此外，将存储卡13、键盘14和触摸板15以及LCD显示单元17连接到CPU 11。还经由语音输出放大器18a连接了扬声器18。

通过由电池电源B所操作的电源电路19所应用的电压来驱动便携式设备10的电子电路。

图2是示出了该便携式设备10的电路中所包括的语音输出控制设备的主体的结构的框图。

作为语音输出控制设备的主体，CPU 11包括语音合成引擎21、衰减(ATT)值计算单元22，以及具有ATT设置单元23的软件处理单元20。

语音合成引擎21生成待输出为语音的、对应于诸如词语和例句的文本数据的合成的语音信号，并且还生成该合成的语音信号的脉冲编码调制(PCM)数据。

ATT值计算单元22从每个帧(63ms)的PCM数据提取一千个采样，并且计算该一千个采样中的每一百个采样(6.3ms)的平均值。然后单元22获得最大平均值来作为一帧中的PCM峰值，并且计算衰减比(ATT值)，其根据该PCM峰值(见图4A到6C)来防止一帧中的PCM数据的语音输出电平超过掉电极限。

ATT设置单元23在数字衰减器24中设置衰减比(ATT值)，以从RAM 12c中读取一帧的PCM数据，并且将其通过数字衰减器24和数字/模拟转换器(DAC)25来输出为语音。

RAM 12c包括两个缓冲器BUF1和BUF2，其交替地并且暂时地对PCM数据的ATT值和由ATT值计算单元22为每帧所提取的PCM数据进行存储。CUP 11包括DMA控制器/BUS控制器26。DMA控制器/BUS控制器26执行：把PCM数据从ATT值计算单元22写入到BUF1/BUF2的操作(PCM数据写入)，从BUF1/BUF2读出PCM数据的操作(PCM数据读取)，把PCM数据输出到数字衰减器24的操作，从BUF1/BUF2读出ATT值的操作(ATT值读取)，把ATT值输出到ATT设置单元23的操作，以及把从BUF1/BUF2输出PCM数据的完成通知给语音合成引擎21的操作。

更具体地，DMA控制器/BUS控制器26执行以下控制操作：

(1)控制器26把一帧(1000个采样)的PCM数据写入到BUF1，该PCM数据是由语音合成引擎21创建并且由ATT值计算单元22提取的。

(2)控制器26把下一帧(1000个采样)的PCM数据写入到BUF2，该PCM数据同样是由语音合成引擎21创建并且由ATT值计算单元22提取的。

(3)控制器26把ATT值从BUF1读出到ATT设置单元23，并且随后在衰减器24中对其进行设置。

(4)当把两帧的PCM数据写入到BUF1/BUF2时，控制器26指定BUF1为传送缓冲器，并且开始把PCM数据DMA传送到衰减器24，以输出文本语音信号。

(5)当完成了来自BUF1的PCM数据的DMA发送时，控制器26把ATT值从BUF2读出到ATT设置单元23，并且随后在衰减器24 中对其进行设置。

(6)控制器26将BUF2指定为传送缓冲器，并且开始将PCM数据DMA传送到衰减器24，以输出文本语音信号。

(7)控制器26把从BUF2输出PCM数据的完成通知给语音合成引擎21，并且开始创建下一帧的PCM数据。

此后，重复上述控制操作，直到完全输出了所有待输出为语音的文本数据。

图3是存储在便携式设备10的程序ROM 12a、数据库ROM 12b和RAM 12c中的数据的内容的图。

作为存储在程序ROM 12a中的设备控制程序，有：词典搜索程序12a1，用于通过输入字符及其解释来显示从词典数据12b1所搜索的关键字；合成语音输出程序12a2，用于对显示的文本数据进行输出，作为读语音；语音合成程序12a3，用于根据文本数据的字符串与文本数据的音符的组合，来对音素的语音数据(12b2)进行合成，以便生成读语音的PCM数据；语音输出控制程序12a4，用于计算衰减比(ATT值)，以防止PCM数据的语音输出电平超过基于该PCM数据的峰值的掉电极限，并且用于控制PCM数据的语音输出等等。

数据库ROM 12b对诸如英一日词典、英语词典、日一英词典、日语词典以及用日语来解释的汉语符号词典的不同词典的词典数据12b1，对应于语音合成处理中所用的音素的语音数据12b2，以及用于对对应于待输出为语音的PCM数据的峰值的衰减比(ATT值)进行设置的ATT值设置数据12b3(图5)进行存储。

类似于数据库ROM 12b中所存储的词典数据12b1，存储在存储卡13中的其它词典数据是外部接收的并且可用的。

RAM 12c包括：输入字符存储器12c1，用于对从输入单元16(14、15)所输入的字符数据进行存储；搜索关键字存储器12c2，用于对通过词典搜索(12a1)及其解释信息来搜索的关键字进行存储；关键字信息指定位置存储器12c3，用于对由用户在搜索和显示的关键字及其解释信息中所指定的词语和例句的位置数据进行存储；PCM计算值存储器12c4，用于对由ATT值计算单元22(图2)根据语音输出控制 (12a4)来计算的每帧的PCM数据的峰值进行存储；电源电压存储器12c5，用于对从电源电路19所提供的电源电压的检测的电压V进行存储；以及缓冲存储器(图2中所示的BUF1/BUF2)12c6，用于对作为每帧的待输出语音的PCM数据进行存储。

如上所述，便携式设备(电子词典)10执行以下语音输出控制。当用户在通过词典搜索来显示的关键字及其解释信息中指定了待输出为读音的诸如词语或句子的文本数据时，将该文本数据语音合成，以生成PCM数据，并且设置对应于每帧的PCM数据的峰值的衰减比(ATT值)。将该PCM数据输出为语音，以至于使得其语音输出电平几乎达到掉电极限。

当把指定的文本数据输出为读音时，防止由于PCM数据的语音输出而导致合成的文本数据的PCM数据的峰值超过掉电极限，并且因此将放大器18a的放大因子增大，以提高最小音量电平。因此，可用将动态范围非常大的文本语音数据的低音量电平部分和高音量电平部分在容易听见数据的最佳音量电平上进行输出。

将描述根据第一实施例的语音输出控制设备中的语音输出控制的原理。

图4A-4C是用于描述当获得了每帧的文本语音信号的峰值时，对待发送为语音的文本语音信号进行提取的过程的图。在这些图中，图4A是待输出的文本语音信号的波形图，图4B是一帧的文本语音信号的采样的波形图，图4C是在一帧的十个部分中的每一个中的文本语音信号的放大的波形图。

当提供了如图4A所示的待输出为语音的语音信号时，从图4B所示的每个63ms的帧的信号中提取一千个采样。把每帧的一千个采样分割成十个部分，每个部分具有一百个如图4C所示的采样(6.3ms)。从PCM数据获得十个部分中的每一个的一百个采样的平均值，并且把十个部分的平均值中的最大的一个设置为每帧中的PCM数据的峰值。

图5是用于设置对应于待输出为语音的PCM数据的峰值的衰减比(ATT比例)的ATT值设置表。

图6A-6E是用于说明根据第一实施例的语音输出控制设备的功能和优势的图。在这些图中，图6A是当仅对输入的语音信号进行线性放大，并且在放大极限内进行输出时，所获得的现有技术的输入/输出特性的图，图6B是当通过对对应于语音信号的PCM峰值的衰减比(ATT值)进行设置来对输入的语音信号进行输出时，所获得的输入/输出特性的图，图6C是从第一实施例所获得的输入/输出特性的图，其中，通过设置对应于PCM峰值的衰减比(ATT值)来将放大因子增加到放大极限，从而提高最小音量电平，图6D是对应于现有技术的输入/输出特性的文本语音数据的输出信号波形的图，以及图6E是对应于第一实施例的输入/输出特性的文本语音数据的输出信号波形的图。

当根据如图6A所示的现有技术的音量控制装置的输入/输出特性来输出语音信号时，将其统一地从最小输入电平线性放大到最大输入电平。因此，如果为了避免由于电源负载的瞬间增加而导致掉电，而将信号的最大输出电平设置为不超过放大极限，则最小输出电平低于最小输入电平，结果尤其在发长音的输出文本读音中将导致难以听见的语音部分。

如果通过设置对应于输入语音信号的PCM峰值PCM 1到PCM10的衰减比(ATT值)ATT 1到ATT 10，来对具有更高输入电平的PCM数据进行衰减，那么该衰减在PCM数据的电平和放大极限之间生成了差额。如果通过如图6C所示的差额来增加放大器18a的放大因子，仅可以通过增加如箭头X所示的放大因子来增加最小输出电平，而最大输出电平不超过放大极限。

因此，根据放大极限，对应于图6D所示的现有技术的输入/输出特性的文本语音数据的输出信号的最大值PH与对应于图6E所示的第一实施例的输入/输出特性的文本语音数据的输出信号的最大值PH相同。然而，可以将输出信号的最小电平增加到PL’，其幅度大小是现有技术的最小电平PL的两倍或更多倍。此外，可以将容易听见的文本语音数据的发更长音的语音部分在使得该部分容易听见的音量电平上输出，而将不易听见的文本语音数据的发更短音的语音部分在使得该部分容易听见的音量电平上输出。

将描述便携式设备10的词典搜索功能和根据第一实施例的语音输出控制设备的语音输出控制功能。

图7是将要由便携式设备10所执行的词典搜索语音输出过程的流程图。

图8A到8D是根据便携式设备10的词典搜索语音输出过程来执行的、搜索到的信息显示屏G1的显示操作和语音产生操作的说明。

当启动了程序ROM 12a中所存储的词典搜索程序12a1时，根据用户的键盘14操作来输入将要搜索的字符，并将其存储到RAM 12c中的输入字符存储器12c1(步骤S1)。在数据库ROM 12b中的所存储的词典数据12b1中对对应于输入字符的关键字进行搜索，并且将该关键字显示在显示单元17关键字列表屏(未示出)(步骤S2)。

在关键字列表屏中，用户通过操作键盘14来移动光标以及按执行(enter)建，从而选择想要的关键字(步骤S3)。将选择的关键字及其解释信息从词典数据12b1读出。将其存储到搜索关键字存储器12c2中，并且显示在显示单元17上，作为如图8A所示的搜索信息显示屏G1(步骤S4)。

然后设备等待按键输入信号(步骤S5)。如果根据键盘14的“语音”键16a的按下来输入按键输入信号(步骤S6)，通过如图8B中所示的H来凸显在搜索信息显示屏G1上所显示的关键字“education”，并且将其凸显显示位置信息存储到关键字信息指定位置存储器12c3(步骤S7)。

参考图8C和8D，当通过下箭头光标键“↓”16c来输入按键输入信号时，指定了一行，并且对包括该指定的行的句子进行凸显。每当输入按键输入信号，指定的行就沿光标键“↓”的箭头方向转移，并且对存储器12c3中所存储的凸显显示位置信息进行更新(步骤S8和S9)。

如果当搜索信息显示屏G1上凸显的关键字及其解释信息的指定位置转移到了用户想要的位置时，根据键盘14的“enter”键16的按下来输入按键输入信号(步骤S10)，那么设备前进到合成语音输出过程，用于输出该凸显的关键字及其解释的例句的文本数据的读音。因此，开始合成语音输出程序12a2，并且根据图9所示的语音输出控制过程，从扬声器18输出由语音合成引擎所按顺序产生的合成语音的文本语音数据项(图9)。

图9是示出了根据便携式设备中所包括的第一实施例的语音输出控制设备的语音输出控制过程的流程图。

首先，对图2所示的语音输出控制设备进行初始化，以将ATT值计算单元22、ATT设置单元23、RAM 12c中的缓冲存储器(BUF1/BUF2)12c6等清零(步骤A1)。

将PCM峰值设置为0，并且将块数设置为1(步骤A2)。ATT值计算单元22从由语音合成引擎21所合成的语音的文本语音数据中提取一块(1/10帧：100个采样)PCM数据项(步骤A3)(见图4C)。

然后，ATT值计算单元22计算提取的PCM数据项的平均值(步骤A4)，并且确定该平均值是否大于一帧中的PCM峰值(初始值＝0)(步骤A5)。

如果该计算的平均值大于当前从一帧所检测的PCM峰值，将其写入为新的PCM峰值(步骤A6)。

如果当前提取的PCM数据的块位于第十块之前，或者其未到达一帧中的最后一块(步骤A7)，那么将一帧中的块数加一(步骤A8)。在增加的块中重复上述比较和重写过程(步骤A3和A6)。

如果当前提取的PCM数据的块是第十块(步骤A7)，从由语音合成引擎21所合成的PCM数据项的一帧获得PCM峰值，基于存储在数据库ROM 12b中的ATT值设置表(12b3)(图5)，将该PCM峰值与阈值PCM1到PCM10进行比较，以确定哪个阈值包括该PCM峰值(步骤A9到A12)。

如果上述PCM峰值小于如ATT值设置表(12b3)(图5)中所示的PCM1，将该ATT值设置为0(没有衰减)(步骤A9→步骤A13)。将一帧(10块：1000个抽样)的PCM数据与ATT值一起设置到RAM 12c中的缓冲存储器(BUF1/BUF2)12c6中(步骤A18)。

如果上述PCM峰值不小于PCM1并且小于PCM2，如ATT值设置表(12b3)(图5)中所示，将ATT值设置为一(最小衰减比)(步骤A9→步骤A10→步骤A14)。如果上述PCM峰值不小于PCM2并且小于PCM3，将ATT值设置为二(步骤A10→步骤A11→步骤A15)。将一帧(10块：1000个抽样)的PCM数据与ATT值一起设置到RAM 12c中的缓冲存储器(BUF1/BUF2)12c6中(步骤A18)。

如果上述PCM峰值不小于PCM10，将ATT值设置为十(最大衰减比)(步骤A12→步骤A17)。将一帧(10块：1000个抽样)的PCM数据与ATT值一起设置到RAM 12c中的缓冲存储器(BUF1/BUF2)12c6中(步骤A18)。

通过ATT设置单元23，在数字衰减器24中对缓冲存储器(BUF1/BUF2)12c6中所设置的PCM数据项的PCM峰值进行设置。将一帧的PCM数据项DMA传送到数字衰减器24，并且通过与PCM数据的峰值相关联而设置的ATT值来对该数据项进行衰减。此后，通过DAC25将PCM数据转换成模拟语音信号。通过放大器18a来放大该模拟语音信号，并且将其从扬声器18输出为语音。

重复上述ATT值计算和设置过程以及PCM数据衰减过程，直到合成语音产生和输出过程完成为止(步骤A19→步骤A1到A18)。

如图6C所示，输出为合成语音的文本语音信号的最大输出电平可以在放大极限之内，而可以以通过用对应于最大输出电平的衰减比的值来提高最小输出电平而获得的放大因子来放大文本语音信号，并且以使得该语音容易听见的音量电平来对其进行输出。

根据如第一实施例的语音输出控制设备，将待输出为语音的文本数据的合成语音生成为PCM数据。计算一帧(63ms)PCM数据的峰值。基于用于对对应于PCM峰值的阈值PCM1到PCM10的不同ATT值(衰减比)进行设置的ATT值设置表(12b3)，来设置一帧PCM数据的ATT值(衰减比)。PCM峰值越大，PCM数据就被越大的衰减比衰减，导致输出电平落入放大极限之内，并且提高了最小输出电平。不仅可以输出文本语音，使其在足够的音量电平上容易听见，而不会对文本语音的长音部分进行扭曲，或者由于电源负载瞬间增加而导致掉电，而且可以将其更少音调的部分放大到使其容易听见的高音量电平。

在如图5所示的根据第一实施例的语音输出控制设备中，根据ATT值设置表(12b3)中所述的一系列阈值PCM1到PCM10中哪一个包括了PCM数据的PCM峰值，来设置一帧PCM数据的ATT值(衰减比)。在此设备中，当PCM峰值在特定的阈值附近重复变化时，该阈值的范围就变化了，并且ATT值也变化了，从而使得输出语音不稳定。为了避免这种不稳定，可以执行以下过程。如图10A和10B所示，准备第一ATT值设置表12b31和第二ATT值设置表12b32。第一ATT值设置表12b31与图5所示ATT值设置表(12b3)相同，并且第二ATT值设置表12b32描述了通过固定的宽度ΔP来改变第一ATT值设置表12b31的阈值PCM1到PCM10所获得的阈值PCM1’到PCM10’。根据当前帧中的PCM峰值是不小于(峰值增加)还是小于(峰值减少)前一帧的PCM峰值，来执行用于选择性地使用第一和第二ATT值设置表12b31和12b32的滞后过程A。

图10A和10B是第一和第二ATT值设置表12b31和12b32，用于通过执行滞后过程A来设置对应于待输出为语音的PCM数据的峰值的衰减比(ATT值)。

图11是用于根据PCM峰值中的变化方向来选择性地使用第一和第二ATT值设置表12b31和12b32的滞后过程A的流程图。

在图9所示的用于获得当前一帧PCM数据的PCM峰值的步骤A1到A8之后，并且在用于对对应于该PCM峰值的ATT值进行设置的步骤A9到A18的之前的步骤AH中，执行图11所示的滞后过程A。

如果在由ATT值计算单元22所提取的PCM数据的当前帧的PCM峰值不小于前一帧的PCM峰值，并且合成语音的输入电平增加了，那么根据图10A所示的标准音量阈值(PCM1到PCM10)，使用第一ATT值设置表12b31(步骤AH11到AH12)。

如果在由ATT值计算单元22所提取的PCM数据的当前帧的PCM峰值小于前一帧的PCM峰值，并且合成语音的输入电平减少了，根据将标准音量阈值(PCM1到PCM10)分别减少图10B所示的固定宽度ΔP1到ΔP10所得到的音量阈值(PCM1’(＝PCM1-ΔP1)到 PCM10’(＝PCM10-ΔP10))，使用第二ATT值设置表12b32(步骤AH11到AH13)。

图12是示出了在伴随着滞后过程A的语音输出控制过程中所设置的ATT值的变化的图。

在图12所示的定时T1，当前输入的合成语音的PCM峰值从之前的合成语音开始增加，并且变得不小于第一ATT值设置表12b31的音量阈值PCM5，并且因此，ATT值从ATT4变到ATT5。即使紧接在该变化之后PCM峰值变得略微小于音量阈值PCM5，使用第二ATT值设置表12b32，并且其音量阈值保持为PCM5’或更大。即使PCM峰值在PCM5附近略微变化，ATT值不会逐渐改变，或者不会使得输出语音不稳定。

在图12所示的定时T2，当前输入的合成语音的PCM峰值从之前的合成语音开始增加，并且变得小于第二ATT值设置表12b32的音量阈值PCM5’，并且因此，ATT值从ATT5变到ATT4。即使紧接在该变化之后PCM峰值变得略微大于音量阈值PCM5’，使用第一ATT值设置表12b31，并且其音量阈值保持为小于PCM5’。ATT值不会改变而仍然是ATT4。即使PCM峰值在PCM5’附近略微变化，ATT值不会逐渐改变，或者不会使得输出语音不稳定。

在以上滞后过程A中，根据PCM峰值的变化方向来选择性地使用第一和第二ATT值设置表12b31和12b32，以便从而防止ATT值在音量阈值PCMn(PCMn’)附近逐渐变化，并且使得输出语音变得稳定。然而如图13所示，可以使用以下方法。准备具有大量衰减的特性X的ATT值设置表和具有少量衰减的特性Y的ATT值设置表。根据当前帧中的PCM峰值是不小于(峰值增加)还是小于(峰值减少)前一帧的PCM峰值，来执行用于选择性地使用这些ATT值设置表的滞后过程B。因此，当PCM峰值增大或减小时，可以更有效并稳定地设置ATT值。

图13是示出了用于根据待输出为语音的PCM数据的峰值，通过滞后过程B来对两个衰减比(ATT值)进行选择性地设置的衰减比特性X和Y中的变化的图。

图14是示出了用于根据PCM峰值中的变化方向，来选择性地使用具有特性X的ATT值设置表和具有特性Y的ATT值设置表的滞后过程B的流程图。

类似于图11所示的滞后过程A，在图9所示的用于获得当前一帧PCM数据的PCM峰值的步骤A1到A8之后，并且在用于对对应于该PCM峰值的ATT值进行设置的步骤A9到A18的之前的步骤AH中，执行图14所示的滞后过程B。

如果在由ATT值计算单元22所提取的PCM数据的当前帧的PCM峰值不小于前一帧的PCM峰值，并且合成语音的输入电平增加了，使用如图13所示的具有特性X的ATT值设置表(步骤AH21到AH22)。

如果在由ATT值计算单元22所提取的PCM数据的当前帧的PCM峰值小于前一帧的PCM峰值，并且合成语音的输入电平减少了，使用如图13所示的具有特性Y的ATT值设置表(步骤AH21到AH23)。

如上所述，在当前合成语音的PCM峰值从之前的合成语音开始增加时，选择具有特性X的ATT值设置表，当该PCM峰值从其减少时，选择具有特性Y的ATT值设置表。当语音电平将要提高并且电池电源的负载增加时，可以增加衰减数量，以防止缩短电池电源的寿命并且排除掉电顾虑。此外，当语音电平将要降低并且电池电源的负载减少时，可以减少衰减数量，以保持足够的音量电平。

在根据第一实施例的语音输出控制设备中，ATT值计算单元22对每帧的PCM数据的ATT值进行计算，并且ATT设置单元23对数字衰减器24中的ATT值进行设置。因此，将被DMA传送到数字衰减器24的PCM数据调整到了对应于该ATT值的音量电平。参考图9和图15A到15C所示的流程图中的步骤A18a，当将一帧PCM数据和对应于PCM数据的峰值的ATT值，从ATT值计算单元22传送到RAM 12c中的缓冲存储器(BUF1/BUF2)12c6时，PCM数据本身的音量从之前一帧PCM数据的ATT值增加或减少到了当前一帧PCM数据的ATT值。在此情况下，不需要数字衰减器24和ATT设置单元23。

图15A到15C是根据本发明的第一实施例的语音输出控制设备的语音输出控制过程中的合成语音的PCM数据的衰减(ATT)过程的图。

假设之前的帧的PCM数据的ATT值是“-50”，并且当前帧的PCM数据的ATT值是“-120”。当将当前帧的PCM数据传递到到RAM 12c中的缓冲存储器(BUF1/BUF2)12c时，对于每一个采样数据项PCM1到PCMn，该数据是从对应于PCM1的“-51”1dB接着1dB地逐渐减少到对应于PCMn的“-120”，如图15A和15B所示(步骤A18a)。

如图15B和15C所示，在当前帧的PCM数据的ATT值是“-70”时，对于每一个采样数据项PCM1到PCMn，该数据是从对应于PCM1的“-119”1dB接着1dB地逐渐增加到对应于PCMn的“-70”(步骤A18a)。

如上所述，由于不需要数字衰减器24和ATT设置单元23，可以将衰减的并且传送到缓冲存储器(BUF1/BUF2)12c6的一帧PCM数据直接传送到DAC 25并且输出为语音。可以用放大极限之内低的最大音量电平来提高最小音量电平，从而使得文本数据的合成读音容易听见。此外，可以对当将一帧PCM数据输出为语音时所执行的ATT过程的ATT值进行持续的增加或减少，以自然地而不是非连续地输出文本语音。

在根据第一实施例的语音输出控制设备中，根据每帧的PCM峰值，来对合成语音的一帧PCM数据的ATT值(衰减比)进行设置，并且当将最大音量电平抑制在放大极限之内时，将最小音量电平提高，以免导致电池电源掉电。

(第二实施例)

图16是示出了当从包括在便携式设备中(电子词典)10的、根据本发明的第二实施例的语音输出控制设备中，输出语音时，ATT值(衰减比)设置特性和检测的电源电压之间的关系的图。

在根据第二实施例的语音输出控制设备中，当电池电源B的检测的电压V降低到Level1或更低时，根据该电压的下降程度来逐渐地设置合成的读音的ATT值(衰减比)，其中当生成了并且输出了文本数据的合成的读音时，把该检测到的电压从电源电路19输出到CPU11。

当检测的电压落入以下范围：Level1≥V＞Level2时，将ATT值设置为ATTv1(-2dB)；当检测的电压落入以下范围：Level2≥V＞Level3时，将ATT值设置为ATTv2(-4dB)；当检测的电压落入以下范围：Level3≥V＞Level4时，将ATT值设置为ATTv3(-6dB)。当检测的电压落入以下范围：Level4≥V时，其变得不高于CPU 11的最低操作电压，并且因此语音输出操作本身就停止了。

图17是示出了根据本发明的第二实施例的语音输出控制设备的语音输出控制过程的流程图。

在第二实施例中，首先，对如图2所示的语音输出控制设备进行初始化，以将ATT值计算单元22、ATT设置单元23、RAM 12c中的缓冲存储器(BUF1/BUF2)12c6等清零(步骤B1)。

将检测到的电压的最小电平设置为3V(初始值：最大)并且将块数设置为1(步骤B2)。ATT值计算单元22从由语音合成引擎21所合成的语音的文本数据中，提取一个块(1/10帧：100个采样)的PCM数据(步骤B3)(见图4C)。

将电池电源B的电压从电源电路19输出，并且对其电平V进行检测并且将其存储在检测电压记录表(未示出)中(步骤B4)。确定当前记录的检测电源电压是否低于之前检测的电压的最小电平(3V＝初始电平)(步骤B5)。

当确定了当前检测电源电压低于之前检测的电压的最小电平(3V＝初始电平)时，将当前检测的电源电压重新写入未最小检测电压(步骤B6)。

如果当前提取的PCM数据的块位于第十块之前，或者其未到达一帧中的最后一块(步骤B7)，将一帧中的块数加一(步骤B8)。对于增加的块重复上述电源电压检测过程以及比较和重写过程(步骤B3和B6)。

如果当前提取的PCM数据的块是第十块(步骤B7)，就获得了当对由语音合成引擎21所合成的语音的一帧PCM数据进行输出时，所检测的电源电压的最小电平。将该PCM峰值与阈值Level1到Level4进行比较，从而确定哪个阈值包括该最小电平(步骤B9到B12)。

如果以上最小电平(最小电压)高于由ATT值设置特性(12b3)所表示的最大电压电平(3V)(见图16)，则ATT值等于0(没有衰减)(步骤B9→步骤B13)。将当前帧(10块：1000个抽样)的PCM数据与ATT值一起设置到RAM 12c中的缓冲存储器(BUF1/BUF2)12c6中(步骤B17)。

如果上述最小电平不高于Level1并且高于Level2，如ATT值设置特性表(12b3)(见图16)中所示，将ATT值设置为ATTv1(最小衰减比)(步骤B9→步骤B10→步骤B14)。如果上述最小电平高于Level3，将ATT值设置为ATTv2(步骤B10→步骤B11→步骤B15)。将当前帧(10块：1000个抽样)的PCM数据与ATT值一起设置到RAM 12c中的缓冲存储器(BUF1/BUF2)12c6中(步骤B17)。

如果上述最小电平不高于Level3并且高于Level4，将ATT值设置为ATTv3(最大衰减比)(步骤B12→步骤B16)。将当前帧(10块：1000个抽样)的PCM数据与ATT值一起设置到RAM 12c中的缓冲存储器(BUF1/BUF2)12c6中(步骤B17)。

通过ATT设置单元23来在数字衰减器24中设置缓冲存储器(BUF1/BUF2)12c6中所设置的PCM数据的ATT值。将PCM数据DMA传送到数字衰减器24，并且通过根据当前检测的电源电压所设置的ATT值来对其进行衰减。此后，通过DAC 25将PCM数据转换成模拟语音信号。通过放大器18a来放大该模拟语音信号，并且将其从扬声器18输出为语音。

对应于为每帧检测的电源电压的、计算和设置ATT值的过程，以及根据ATT值，衰减帧的PCM数据的过程被按顺序地重复，直到完成了对待输出的文本数据的合成语音进行产生和输出的过程(步骤B18→步骤B1到B17)。

将输出为合成语音的文本语音信号放大到能够在最小输出电平上听见该语音的音量电平。如果担心电池电源B的检测电压将会下降直至耗尽，并且电池电源突然掉电，就有效地阻止语音的输出电平衰减。因此，可以保护持续操作以及电源。

根据如第二实施例的语音输出控制设备，通过增加放大器1 8a的放大因子来提高最小音量电平，并且生成待输出为语音的文本数据的合成语音，作为PCM数据。当对于每帧(63ms)，将PCM数据输出为语音时，检测电池电源B的电压。根据对应于检测的电源电压的阈值Level1到Level4来设置不同的ATT值(衰减比)。随着电源电压更剧烈地减少，通过更大的衰减比来衰减PCM数据，以降低电池电源B的负载。不仅可以输出文本语音，使得在足够的音量电平容易听见该语音，而不会由于在该文本语音发长音部分的电源负载瞬间增加而导致掉电，还可以把发更短音的部分放大到容易听见的高音量电平。

在根据第二实施例的语音输出控制设备中，当对合成语音的一帧PCM数据进行输出时，对电源电压的最小电平进行检测(步骤B4到B6)，并且根据检测的最小电平来设置不同的ATT(步骤B9到步骤B16)。然而，可以不根据电源电压的最小电平而是根据检测的电源电压的最小和最大电平的平均值(步骤B4a)，来设置不同的ATT值。

然而可以获得当输出一帧PCM数据时所检测的电源电压的所有电平的平均值(步骤B4b)，并且可以对对应于该平均值的不同ATT值进行设置。

此外，可以获得除了最小和最大电平之外的检测的电源电压的所有电平的平均值(步骤B4c)，并且可以对对应于该平均值的不同ATT值进行设置。

如图16所示，在根据第二实施例的语音输出控制设备中，根据一系列电压阈值电平，即在对应于检测的电源电压的ATT值设置特性(12b3)中所述的Level1到Level4，来设置一帧PCM数据的ATT值(衰减比)。在此设备中，当对于每帧所分别检测的电源电压在特定的电压阈值电平Leveln附件变化时，电压阈值电平Leveln的范围会变化，所设置的ATT值也会变化，从而使得输出语音不稳定。为了避免这种不稳定，可以执行一些过程。如图18A和18B所示，准备了第一电源电压电平/ATT值设置表12b33和第二电源电压电平/ATT值设置表12b34。第一个表12b33对应于图16中所示的ATT值设置特性(12b3)，并且第二个表12b34描述了通过分别将第一个表12b33的电压阈值电平Level1到Level4变化ΔV1到ΔV4所获得的电压阈值电平。根据当输出当前一帧数据时所检测的电源电压是大于(电压下降)还是不小于(电压上升)当输出前一帧数据时所检测的电源电压，来执行用于选择性地使用第一个表12b33和第二个表12b34的滞后过程A。

图18A和18B是用于通过滞后过程A来对对应于当把PCM数据输出为语音时所检测到的电源电压的衰减比(ATT值)进行设置的第一和第二电源电压电平/ATT值设置表。

图19是用于根据所检测的电源电压来选择性地使用第一和第二电源电压电平/ATT值设置表的滞后过程A的流程图。

在图17所示的用于当输出当前一帧PCM数据时对最小电源电压电平进行检测的步骤B1到B8之后，并且在用于对对应于最小电源电压电平的ATT值进行设置的步骤B9到B17的之前的步骤BH中，执行图19所示的滞后过程A。

如果当输出当前一帧PCM数据时所检测的电源电压低于当输出之前一帧PCM数据时所检测的电源电压，其中通过ATT值计算单元22来提取该PCM数据，并且电源的负载增加了，那么根据如图18A中所示的标准音量阈值电平(Level1到Level4)，选择第一电源电压电平/ATT值设置表12b33(步骤BH11到BH12)。

如果当输出当前一帧PCM数据时所检测的电源电压不低于当输出之前一帧PCM数据时所检测的电源电压，其中通过ATT值计算单元22来提取该PCM数据，并且电源的负载减少了，那么根据如图18B中所示的、通过将标准音量阈值电平(Level1到Level4)的宽度分别增加ΔV1到ΔV4所获得的电压阈值电平(Level1’(＝Level1+ΔV1)到Level4’(＝Level4+ΔV4))，选择第二电源电压电平/ATT值设置表12b34(步骤BH13到BH14)。

图20是示出了在伴随着滞后过程A的语音输出控制过程中所设置的ATT值的变化的图。

在图20所示的定时T1，在输出当前一帧PCM数据时所检测的电源电压，从在输出之前一帧PCM数据时所检测的电压开始减少，并且变得低于第一电源电压电平/ATT值设置表12b33的电压阈值电平Level3，并且因此ATT值从ATT2变化到ATT3。即使紧接在该变化之后检测的电源电压变得略微高于第一电源电压电平/ATT值设置表12b33的电压阈值电平Level3，使用第二电源电压电平/ATT值设置表12b34，并且将其电压阈值电平保持为低于电压Level3’。ATT值不变化，而是保持为ATT3。即使检测的电源电压在Level3附件略微变化，ATT值也不会逐渐变化，或者不会使得输出语音不稳定。

在图20所示的定时T2，在输出当前一帧PCM数据时所检测的电源电压，从在输出之前一帧PCM数据时所检测的电压开始提高，并且变得不低于第二电源电压电平/ATT值设置表12b34的电压阈值电平Level3’，并且因此ATT值从ATT3变化到ATT2。即使紧接在该变化之后检测的电源电压变得略微低于第二电源电压电平/ATT值设置表12b34的电压阈值电平Level3’，使用第一电源电压电平/ATT值设置表12b33，并且将其电压阈值电平保持为电压3或更高。ATT值不变化，而是保持为ATT2。即使检测的电源电压在Level3’附件略微变化，ATT值也不会逐渐变化，或者不会使得输出语音不稳定。

在以上滞后过程A中，根据电源电压来选择性地使用第一和第二电源电压电平/ATT值设置表12b33和12b34，从而防止ATT值在电压阈值Leveln(Leveln’)附近逐渐变化并且使得输出语音稳定。然而，如图21所示，可以使用以下方法。准备具有大量衰减的特性X的ATT值设置表和具有少量衰减的特性Y的ATT值设置表。根据在输出当前一帧PCM数据时所检测的电源电压是不小于(电压增加)还是小于(电压减少)在输出之前一帧PCM数据时所检测的电压，来执行用于选择性地使用这些ATT值设置表的滞后过程B。因此，当电源电压将要下降或提高时，可以更有效更稳定地对ATT值进行设置。

图21是示出了用于根据当把PCM数据输出为语音时所检测的电源电压，通过滞后过程B来对两个衰减比(ATT值)进行选择性地设置的衰减比特性X和Y中的变化的图。

图22是示出了用于根据所检测的电源电压中的变化方向来选择性地使用具有特性X的电源电压电平/ATT值设置表和具有特性Y的电源电压电平/ATT值设置表的滞后过程B的流程图。

类似于图19所示的滞后过程A，在图17所示的用于当输出当前一帧PCM数据时对最小电源电压电平进行检测的步骤B1到B8之后，并且在用于对对应于最小电源电压电平的ATT值进行设置的步骤B9到B17的之前的步骤BH中，执行图22所示的滞后过程B。

如果当输出当前一帧PCM数据时所检测的电源电压低于当输出之前一帧PCM数据时所检测的电源电压，其中通过ATT值计算单元22来提取该PCM数据，并且电源电压降低了，如图21所示选择具有特性X的电源电压电平/ATT值设置表(步骤BH21到BH22)。

如果当输出当前一帧PCM数据时所检测的电源电压不低于当输出之前一帧PCM数据时所检测的电源电压，其中通过ATT值计算单元22来提取该PCM数据，并且电源电压提高了且电源的负载减少了，如图21所示选择第具有特性Y的电源电压电平/ATT值设置表(步骤BH21到BH23)。

如上所述，如果当输出当前合成语音时所检测的电源电压从当输出之前的合成语音时所检测的电源电压开始下降，就选择具有特性X的电源电压电平/ATT值设置表，当该PCM峰值从那提高时，选择具有特性Y的电源电压电平/ATT值设置表。当电源电压将要下降并且电池电源极大地耗尽时，可以增加衰减数量，以防止缩短电池电源的寿命并且排除掉电顾虑。此外，当语音电平将要降低并且电池电源的负载减少时，可以减少衰减数量，以保持足够的音量电平。

在根据第二实施例的语音输出控制设备中，ATT值计算单元22对每帧的PCM数据的ATT值进行计算，并且ATT设置单元23对数字衰减器24中的ATT值进行设置。因此，将被DMA传送到数字衰减器24的PCM数据调整到了对应于该ATT值的音量电平。参考图17和图15A到15C所示的流程图中的步骤B17a，当将一帧PCM数据和对应于PCM数据的检测的电源电压从ATT值计算单元22传送到RAM 12c中的缓冲存储器(BUF1/BUF2)12c6时，PCM数据本身的音量从之前一帧PCM数据的ATT值逐渐增加或减少到了当前一帧PCM数据的ATT值。在此情况下，不需要数字衰减器24和ATT设置单元23。

如上所述由于不需要数字衰减器24和ATT设置单元23，可以将衰减了的并且传送到缓冲存储器(BUF1/BUF2)12c6的一帧数据直接传送到DAC 25，并且输出为语音。可以用不在导致掉电的放大极限之内的最大电源电平来提高最小音量电平，从而使得文本数据的合成读音容易听见。此外，可以连续的增加或减少当将一帧PCM数据输出为语音时所执行的ATT过程的ATT值，以便不是间断地而是自然地输出文本语音。

在根据第一实施例的语音输出控制设备中，根据每帧的PCM峰值来设置合成语音的一帧PCM数据的ATT值(衰减比)，并且当将最大音量电平抑制在不会导致电池电源掉电的放大极限之内时，最小音量电平提高。在根据第二实施例的语音输出控制设备中，预先增加放大器18a的放大因子，以提高最小音量电平，并且电源电压下降从而抑制电池电源掉电并且延长了其寿命，据此来设置每帧PCM数据的ATT值(衰减比)。

(第三实施例)

图23A和23B是示出了当从包括在便携式设备中(电子词典)10的、根据本发明的第二实施例的语音输出控制设备中输出语音时所检测的电源电压，与用于根据电源电压来选择性地使用的ATT值(衰减比)设置特性A到D之间的关系的图。更具体地，图23A是示出了电源电压与ATT值设置特性A到D之间的关系的图，图23B是示出了输出语音与ATT值设置特性A到D之间的关系的图。

在根据第三实施例的语音输出控制设备中，当电池电源B的检测的电压V高于Level1时，选择具有第一(最小)衰减特性A的ATT值设置表，其中当对文本数据的合成读音进行生成和输出时将该电压V从电源电路19输出到CPU 11。当检测的电压落入以下范围：Level1≥V＞Level2时，选择具有第二衰减特性B的ATT值设置表；当检测的电压落入以下范围：Level2≥V＞Level3时，选择具有第三衰减特性C的ATT值设置表；当检测的电压落入以下范围：Level3≥V＞Level4时，选择具有第四(最大)衰减特性D的ATT值设置表。当检测的电压落入以下范围：Level4≥V时，其变得不高于CPU 11的最低操作电压，并且因此语音输出操作本身就停止了。

基于响应于检测的电源电压V的具有不同衰减特性的ATT值设置表，衰减比(ATT值)ATT1到ATT10对应于输入语音信号的PCM峰值PCM1到PCM10。随着检测的电源电压V的下降以及PCM峰值的上升，把更大量的衰减设置来对合成语音信号的PCM数据进行衰减。当提高最小音量电平时，抑制了电池电源掉电并且延长了其寿命。

图24是示出了根据本发明的第三实施例的语音输出控制设备的第一语音输出控制过程的流程图。

在根据第三实施例的语音输出控制过程中，首先，对图2所示的语音输出控制设备进行初始化，以将ATT值计算单元22、ATT设置单元23、RAM 12c中的缓冲存储器(BUF1/BUF2)12c6等清零(步骤C1)。

将PCM峰值设置为零，将检测到的电压的最小电平设置为3V(初始值：最大)并且将块数设置为1(步骤C2)。ATT值计算单元22从由语音合成引擎21所合成的语音的文本数据中，提取一个块(1/10帧：100个采样)的PCM数据(步骤C3)(见图4C)。

将电池电源B的电压从电源电路19输出，并且对其电平V进行检测并且将其存储在检测电压记录表(未示出)中(步骤C4)。

对当前在步骤C3中所提取的一块(100个采样)PCM数据的平均值进行计算(步骤C5)。确定所计算的平均值是否大于一帧中的PCM峰值(初始电平＝“0”)(步骤C6)。

当确定了所计算的平均值大于目前在一帧中所检测的PCM峰值时，将其作为新的PCM峰值重新写入(步骤C7)。

还确定在步骤C4的检测电压记录表中所存储的当前检测的电源电压是否低于上一个检测电压的最小值(3V＝初始值)(步骤C8)。

如果确定当前检测的电源电压是低于上一个检测电压的最小值(3V＝初始值)，则将当前检测的电源电压作为新的PCM峰值重新写入(步骤C9)。

如果当前提取的PCM数据的块位于第十块之前，或者其未到达一帧中的最后一块(步骤C10)，将一帧中的块数加一(步骤C11)。在增加的块中重复上述用于将该平均值与PCM峰值进行比较的比较和重写过程、电源电压检测过程以及用于将检测的电源电压与最小电压进行比较的比较和重写过程(步骤C3到C9)。

如果当前提取的PCM数据的块是第十块(步骤C10)，就获得了当对由语音合成引擎21所合成的语音的一帧PCM数据进行输出时，所检测的电源电压的最小电平(最小电压)。从而获得了一帧的PCM峰值。

将检测到的电源电压V的最小电平与用于选择对应于图23A和23B所示的电源电压的ATT值(衰减比)设置特性A到D的电压阈值电平Level1至Level4，从而确定哪个电压阈值电平包括最小电平(步骤C12至C15)。

如果当输出合成语音的当前一帧PCM数据时所检测的电源电压的最小电平高于由ATT值设置特性(见图23A)所表示的最大电压电平(3V)Level1，则如图23B所示选择具有第一(最小)衰减特性A的ATT值设置表(步骤C12→步骤C16)。

如果该最小电平不高于由ATT值设置特性(见图23A)所表示的Level1且高于Level2，则如图23B所示选择具有第二衰减特性B的ATT值设置表(步骤C13→步骤C17)。

如果该最小电平不高于Level2但高于Level3，则如图23B所示选择具有第三衰减特性C的ATT值设置表。(步骤C14→步骤C18)。

如果该最小电平不高于Level3但高于Level4，则如图23B所示选择具有第四(最大)衰减特性D的ATT值设置表(步骤C15→步骤C19)。

当根据当输出一帧的PCM数据时所检测的电源电压V来选择了具有第一到第四衰减特性A到D的ATT值设置表中的一个时，根据所选择的那个ATT值设置表来将一帧中的PCM峰值与其阈值PCM1到PCM10进行比较(图23B)，并且确定哪个PCM阈值包括了该PCM峰值(步骤C20到C23)。

如果一帧中的合成语音的PCM数据的PCM峰值小于PCM1，则ATT值等于零(没有衰减)(步骤C20→步骤B24)。将一帧(10块：1000个抽样)的PCM数据与ATT值一起设置到RAM 12c中的缓冲存储器(BUF1/BUF2)12c6中(步骤C29)。

如果上述PCM峰值不小于PCM1并且小于PCM2，则将其中一个ATT值设置表中的所示的ATT值设置为1(最小衰减比)，其中根据检测的电源电压V来选择该ATT值设置表(步骤C20→步骤C21→步骤C25)。如果上述PCM峰值不小于PCM2并且小于PCM3，则将在选择的ATT值设置表中所示的ATT值设置为2(步骤C21→步骤C22→步骤C26)。将一帧(10块：1000个抽样)的PCM数据与ATT值一起设置到RAM 12c中的缓冲存储器(BUF1/BUF2)12c6中(步骤C29)。

如果上述PCM峰值不小于PCM10，则将在选择的ATT值设置表中所示的ATT值设置为10(最大衰减比)(步骤C23→步骤C28)。将一帧(10块：1000个抽样)的PCM数据与ATT值一起设置到RAM 12c中的缓冲存储器(BUF1/BUF2)12c6中(步骤C29)。

在ATT设置单元23中，对根据电源电压V以及当从(BUF1/BUF2)12c6中输出一帧PCM数据时所检测的PCM峰值来确定的ATT值进行设置，并且对数字衰减器24的衰减比进行设置。将一帧PCM数据DMA传送到数字衰减器24，并且通过根据所检测的电源电压V和PCM峰值来设置的ATT值(衰减比)来对其进行衰减。此后，通过DAC25将PCM数据转换成模拟语音信号。通过放大器18a来放大该模拟语音信号，并且将其从扬声器18输出为语音。

根据ATT值，按顺序地重复ATT值的计算和设置过程以及对PCM数据进行衰减的过程，直到完成了对待输出的文本数据的合成语音进行产生和输出的过程，其中该ATT值对应于电源电压V和对于每帧所检测的PCM峰值(步骤C30→步骤C1到C2)。

当用通过对应于最大输出电平的衰减比来增加的放大因子来对输出为合成语音的文本语音信号进行放大时，该信号在最大输出电平的放大极限之内，并且因此可以在最小输出电平上容易地听见该语音。

将输出为合成语音的语音信号放大到可以在最小输出电平上容易地听见该语音的音量电平。如果担心电池电源B的检测电压将会下降直至耗尽，并且电池电源突然掉电，就有效地阻止语音的输出电平衰减。因此，可以保护持续操作以及电源。

根据如第三实施例的语音输出控制设备，当计算了每帧(63ms)的PCM数据的峰值时，将待输出为语音的文本数据的合成语音生成为PCM数据，并且根据对应于该PCM峰值的阈值PCM1到PCM10来设置不同的ATT值(衰减比)。随着PCM峰值的增加，通过更大的衰减比来衰减PCM数据，以使得输出电平在放大极限之内，并且在升高的最小输出电平上输出语音。当输出了每帧(63ms)的PCM数据时，检测电池电源B的电压，并且选择具有衰减特性A到D的ATT值设置表中的一个，用来设置对应于PCM峰值的ATT值(衰减比)。随着电源电压更剧烈地减少，过更大的衰减比来衰减PCM数据，以降低电池电源B的负载。当电池电源B终生增加时，不仅可以输出文本语音使得容易在足够的音量上听见该语音，而且不会由于电源负载瞬间增加而导致该文本语音的长音部分扭曲或者导致掉电，而且可以将更短的音调部分放大到容易听见的高音量电平。

在根据第三实施例以及根据第一和第二实施例的语音输出控制设备中，ATT值计算单元22计算每帧PCM数据的ATT值，并且ATT设置单元23设置数字衰减器24中的ATT值。因此，将DMA传送到数字衰减器24的PCM数据调整到对应于ATT值的音量电平。参考图25和图15A到15C所示的流程图中的步骤C29a，当把一帧PCM数据和对应于电源电压V的ATT值以及PCM峰值从ATT值计算单元22传送到RAM 12c中的缓冲存储器(BUF1/BUF2)12c6时，PCM数据音量自身逐步地从之前一帧PCM数据的ATT值增加或减少到当前一帧PCM数据的ATT值。在此情况下，不需要数字衰减器24或者ATT设置单元23。

如上所述由于不需要数字衰减器24和ATT设置单元23，可以将衰减了的并且传送到缓冲存储器(BUF1/BUF2)12c6的一帧数据直接传送到DAC 25，并且输出为语音。可以用不会导致掉电的放大极限之内的最大电路电平来提高最小音量电平，从而使得文本数据的合成读音容易听见。此外，可以连续的增加或减少当将一帧PCM数据输出为语音时所执行的ATT过程的ATT值，以便不是间断地而是自然地输出文本语音。

在根据第三实施例的语音输出控制设备中，当根据所检测的电源电压V来选择了具有衰减特性A到D的ATT设置表中的一个时，可以执行以下操作。如第二实施例中的滞后过程A(图18A到20)，把用于根据当前检测的电源电压是否低于上一个检测的电源电压来选择一个ATT设置表的电压阈值电平，在标准电压阈值电平Level1到Level4，和通过将对应的标准音量阈值电平增加固定的电压ΔV所获得的电压阈值电平Level1’(＝Level1+ΔV1)到Level4’(＝Level4+ΔV4)之间切换。如第二实施例中的滞后处理B(图21和22)，根据当前检测的帧的电源电压是否低于上一个检测的电源电压来选择具有衰减特性A到D的ATT设置表，将该表在具有更大量衰减的衰减特性A(X)到D(X)中的一个ATT设置表，和具有更少量衰减的衰减特性A(Y)到D(Y)中的一个ATT设置表之间切换。在以上两种情况中，可以获得与第二实施例相同的优势。

在根据第三实施例的语音输出控制设备中，当根据具有特性A到D的ATT设置表来对对应于PCM峰值的ATT值进行设置时，可以执行以下操作，其中根据检测的电源电压来选择ATT设置表。如第一实施例中的滞后过程A(图10A到12)，把用于根据当前PCM峰值是否不低于上一个PCM峰值来设置ATT值的PCM阈值，在标准PCM阈值PCM1到PCM10，和通过将对应的标准PCM阈值电平减少固定的音量电平ΔP所获得的PCM阈值电平PCM1’(＝PCM1-ΔP1)到PCM10’(＝PCM10-ΔP10)之间切换。如第一实施例中滞后过程(图13和14)，根据当前PCM峰值是否不低于上一个PCM峰值来选择具有衰减特性A到D的ATT设置表，将该表在具有更大量衰减的衰减特性X的ATT设置表，和具有更少量衰减的衰减特性Y的ATT设置表之间切换。在以上两种情况中，可以获得与第二实施例相同的优势。

的根据第三实施例的语音输出控制设备中，根据电源电压的下降来选择具有不同衰减特性的ATT设置表。基于所选择的ATT设置表，根据一帧中的PCM数据的PCM峰值来设置ATT值(衰减比)。从而可以提高文本语音的最小音量电平，而防止了电池电源掉电并且延长了其寿命。可以在如果只能替换电池电源一次时长时间使得该语音容易听见的音量电平上输出该文本语音。

可以将根据第一和第三实施例的语音输出控制设备的各自的过程，即，图7所示的流程图中的词典搜索语音输出过程，图9所示的流程图中的语音输出控制过程，图11所示的流程图中的滞后过程A，图14所示的流程图中滞后过程B，图17所示的流程图中的语音输出控制过程，图19所示的流程图中滞后过程A，图22所示的流程图中滞后过程B，图24和25所示的流程图中的语音输出控制过程，作为可以由计算机执行的程序，存储到存储卡(ROM卡、RAM卡等等)13、磁盘(软盘、硬盘等等)、光盘(CD-ROM、DVD等等)以及诸如半导体存储器的外部存储器中。具有文本数据的数据库(12b)，例如词典，的各种计算机将存储在外部存储介质(13)中的程序进行读到程序ROM 12a中。该程序控制该设备的操作，以完成每个实施例中的词典搜索功能和语音输出控制功能，并且执行实施例的上述过程。

可以用程序代码的形式，在通信网络(因特网)N上传递用于执行上述过程的程序数据。此外，可以从连接到通信网络(因特网)N的计算机终端(程序服务器)获得该程序数据，以完成上述的词典搜索功能和语音输出控制功能。

本领域的技术人员很容易想到另外的优点和变形。因此，本发明在其广度方面不局限于此处所示的具体细节和典型实施例。因此，在不脱离附加的权利要求及其等价物所定义的一般发明构思的精神和范围的情况下，可以做出各种修改。

Claims

1.一种语音输出控制设备，用于通过控制具有语音输出部件和向所述语音输出部件提供电源电压的电源部件的电子设备，来控制一系列语音数据项的输出，所述语音输出控制设备包括：

语音数据获得装置，用于从所述一系列语音数据项获得一个输出单元的语音数据；

电压检测装置，用于当输出由所述语音数据获得装置所获得的一个输出单元的语音数据时，检测从所述电源部件提供的电源电压；

音量电平调整装置，用于根据由所述电压检测装置所检测的电源电压，来调整由所述语音数据获得装置所获得的一个输出单元的语音数据的音量电平，以使得所述音量电平落入所述电子设备的放大极限内；以及

语音输出控制装置，用于使所述语音输出部件输出由所述音量电平调整装置调整了其音量电平的语音数据；

所述语音输出控制设备还包括：

文本存储装置，用于存储文本数据；以及

语音合成装置，用于合成以及生成对应于存储在所述文本存储装置中的所述文本数据的语音数据，以及

其中，所述语音数据获得装置从由所述语音合成装置所合成和生成的语音数据获得一个输出单元的语音数据。

2.一种语音输出控制设备，用于通过控制具有语音输出部件和向所述语音输出部件提供电源电压的电源部件的电子设备，来控制一系列语音数据项的输出，所述语音输出控制设备包括：

其中，所述音量电平调整装置包括衰减值设置装置，用于设置随着由所述电压检测装置所检测的电源电压的减小而增大的音量衰减值，以及

所述音量电平调整装置根据由所述衰减值设置装置所设置的音量衰减值，对由所述语音数据获得装置所获得的一个输出单元的语音数据的音量电平进行衰减和调整；

所述语音输出控制设备还包括检测电压比较装置，用于将当输出一个输出单元的语音数据时由所述电压检测装置上一次检测的上一个电源电压，与当输出一个输出单元的语音数据时由所述电压检测装置当前检测的当前电源电压进行比较，以及

其中，所述衰减值设置装置设置一个音量衰减值，所述音量衰减值在所述当前电源电压低于所述上一个电源电压的情况和所述当前电源电压高于所述上一个电源电压的情况之间变化。

3.一种语音输出控制设备，用于通过控制具有语音输出部件和向所述语音输出部件提供电源电压的电源部件的电子设备，来控制一系列语音数据项的输出，所述语音输出控制设备包括：

所述语音输出控制设备还包括音量电平获得装置，用于获得由所述语音数据获得装置所获得的一个输出单元的语音数据的最大音量电平，并且

其中，所述音量电平调整装置根据由所述电压检测装置所检测的电源电压以及由所述音量电平获得装置所获得的最大音量电平，来调整由所述语音数据获得装置所获得的一个输出单元的语音数据的音量电平；

其中，所述音量电平调整装置包括：

衰减特性选择装置，用于根据由所述电压检测装置所检测的电源电压来选择不同的音量衰减特性中的一个；以及

衰减值设置装置，用于根据由所述衰减特性选择装置所选择的不同音量衰减特性中的一个，来设置对应于由所述音量电平获得装置所获得的所述最大音量电平的音量衰减值，以及

其中，所述音量电平调整装置根据由所述衰减值设置装置所设置的所述音量衰减值，对由所述语音数据获得装置所获得的一个输出单元的语音数据的音量电平进行衰减和调整；

所述语音输出控制设备还包括音量电平比较装置，用于将由所述音量电平获得装置上一次获得的一个输出单元的语音数据的上一个最大音量电平，与由所述音量电平获得装置当前获得的一个输出单元的语音数据的当前最大音量电平进行比较，以及

其中，所述衰减值设置装置设置一个音量衰减值，所述音量衰减值在所述当前最大音量电平高于所述上一个最大音量电平的情况和所述当前最大音量电平低于所述上一个最大音量电平的情况之间变化。

4.如权利要求3所述的语音输出控制设备，还包括检测电压比较装置，用于将当输出一个输出单元的语音数据时由所述电压检测装置上一次检测的上一个电源电压，与当输出一个输出单元的语音数据时由所述电压检测装置当前检测的当前电源电压进行比较，以及

其中，所述衰减特性选择装置选择一个音量衰减特性，在衰减总量方面，所述音量衰减特性在所述当前电源电压低于所述上一个电源电压的情况和所述当前电源电压高于所述上一个电源电压的情况之间变化。

5.一种语音输出控制方法，用于通过控制具有语音输出部件和向所述语音输出部件提供电源电压的电源部件的电子设备，来控制一系列语音数据项的输出，所述语音输出控制方法包括：

语音数据获得步骤，用于从所述一系列语音数据项获得一个输出单元的语音数据；

电压检测步骤，用于当输出由所述语音数据获得步骤所获得的一个输出单元的语音数据时，检测从所述电源部件提供的电源电压；

音量电平调整步骤，用于根据由所述电压检测步骤所检测的电源电压，来调整由所述语音数据获得步骤所获得的一个输出单元的语音数据的音量电平，以使得所述音量电平落入所述电子设备的放大极限内；以及

语音输出控制步骤，用于使所述语音输出部件输出由所述音量电平调整步骤调整了其音量电平的语音数据；

所述语音输出控制方法还包括：

文本存储步骤，用于存储文本数据；以及

语音合成步骤，用于合成以及生成对应于通过所述文本存储步骤所存储的所述文本数据的语音数据，以及

其中，所述语音数据获得步骤包括从由所述语音合成步骤所生成的语音数据获得一个输出单元的语音数据。

6.一种语音输出控制方法，用于通过控制具有语音输出部件和向所述语音输出部件提供电源电压的电源部件的电子设备，来控制一系列语音数据项的输出，所述语音输出控制方法包括：

其中，所述音量电平调整步骤包括衰减值设置步骤，用于设置随着由所述电压检测步骤所检测的电源电压的减小而增大的音量衰减值，以及

所述音量电平调整步骤根据由所述衰减值设置步骤所设置的音量衰减值，对由所述语音数据获得步骤所获得的一个输出单元的语音数据的音量电平进行衰减和调整；

所述语音输出控制方法还包括检测电压比较步骤，用于将当输出一个输出单元的语音数据时由所述电压检测步骤上一次检测的上一个电源电压，与当输出一个输出单元的语音数据时由所述电压检测步骤当前检测的当前电源电压进行比较，以及

其中，所述衰减值设置步骤设置一个音量衰减值，所述音量衰减值在所述当前电源电压低于所述上一个电源电压的情况和所述当前电源电压高于所述上一个电源电压的情况之间变化。

7.一种语音输出控制方法，用于通过控制具有语音输出部件和向所述语音输出部件提供电源电压的电源部件的电子设备，来控制一系列语音数据项的输出，所述语音输出控制方法包括：

所述语音输出控制方法还包括音量电平获得步骤，用于获得由所述语音数据获得步骤所获得的一个输出单元的语音数据的最大音量电平，并且

其中，所述音量电平调整步骤根据由所述电压检测步骤所检测的电源电压以及由所述音量电平获得步骤所获得的最大音量电平，来调整由所述语音数据获得步骤所获得的一个输出单元的语音数据的音量电平；

其中，所述音量电平调整步骤包括：

衰减特性选择步骤，用于根据由所述电压检测步骤所检测的电源电压来选择不同的音量衰减特性中的一个；以及

衰减值设置步骤，用于根据由所述衰减特性选择步骤所选择的不同音量衰减特性中的一个，来设置对应于由所述音量电平获得步骤所获得的所述最大音量电平的音量衰减值，以及

所述音量电平调整步骤根据由所述衰减值设置步骤所设置的所述音量衰减值，对由所述语音数据获得步骤所获得的一个输出单元的语音数据的音量电平进行衰减和调整；

所述语音输出控制方法还包括音量电平比较步骤，用于将由所述音量电平获得步骤上一次获得的一个输出单元的语音数据的上一个最大音量电平，与由所述音量电平获得步骤当前获得的一个输出单元的语音数据的当前最大音量电平进行比较，以及

其中，所述衰减值设置步骤设置一个音量衰减值，所述音量衰减值在所述当前最大音量电平高于所述上一个最大音量电平的情况和所述当前最大音量电平低于所述上一个最大音量电平的情况之间变化。