JP2006311382A - 音声出力制御装置および音声出力制御プログラム - Google Patents

音声出力制御装置および音声出力制御プログラム Download PDF

Info

Publication number
JP2006311382A
JP2006311382A JP2005133572A JP2005133572A JP2006311382A JP 2006311382 A JP2006311382 A JP 2006311382A JP 2005133572 A JP2005133572 A JP 2005133572A JP 2005133572 A JP2005133572 A JP 2005133572A JP 2006311382 A JP2006311382 A JP 2006311382A
Authority
JP
Japan
Prior art keywords
output
power supply
audio
value
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005133572A
Other languages
English (en)
Other versions
JP4876434B2 (ja
Inventor
Koji Toriyama
康治 鳥山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2005133572A priority Critical patent/JP4876434B2/ja
Priority to CN200680007254XA priority patent/CN101138152B/zh
Priority to US11/410,759 priority patent/US7720215B2/en
Priority to PCT/JP2006/309126 priority patent/WO2006118292A1/en
Priority to TW095115010A priority patent/TWI335726B/zh
Publication of JP2006311382A publication Critical patent/JP2006311382A/ja
Application granted granted Critical
Publication of JP4876434B2 publication Critical patent/JP4876434B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/007Control dependent on the supply voltage

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Telephone Function (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

【課題】音声出力機能を備えた電子機器での音声出力制御装置で、例えば電池電源がある程度消耗した状態になっても、一連の音声データの大音量部分も小音量部分も聞き取りやすい最適な音量にして出力する。
【解決手段】外部アンプ18aの増幅率を上昇させて最小音量の底上げを図る一方で、音声出力対象のテキストデータの合成音声を生成しPCMデータとして作成すると共に、このPCMデータの1フレーム(63ms)毎の音声出力に際して、電池電源Bの電圧を検出し、この検出電源電圧値Vの大小に応じたスレッシュ値Level1〜4に対応してそれぞれ異なるATT値(減衰比)を設定し、電源電圧の低下幅が大きいほど大きい減衰比により減衰させてその電池電源Bに対する負荷が軽くなるようにしたので、例えば電源負荷の瞬時増大によるパワーダウンを招かずに聞き取りやすい音量で出力できる。
【選択図】 図2

Description

本発明は、例えば電池電源により駆動される音声出力機能を備えた電子機器での音声出力制御装置および音声出力制御プログラムに関する。
従来、オーディオ機器などの音声出力機能を有する電子機器では、その様々な使用環境に応じて出力音声の音量や音質などを最適な状態に調整するようにした出力音量調整装置が備えられている。
例えばその一つには、車載用オーディオ機器において、周囲の騒音レベルに合わせて音量と音質を可変するものがあり、騒音レベルが大きくなるのに伴い出力音量が歪むような大きさとなった場合には、音量を抑制して聴取者が聞き難くなるのを防止するようにした出力音量調整装置がある(例えば、特許文献1参照。)。
また、パーソナルコンピュータなどが備える音声出力装置では、記録レベルが異なる音声信号が入力される度に出力ボリュームが調整されて一定の音量に設定されるが、前回のボリューム調整位置のままで異なる音声信号を出力しようとした際に、そのボリューム位置が今回の出力音声が歪んでしまう音量となる位置に調整されていた場合には、音量を抑制して音声出力が歪むのを防止するようにした出力音量調整装置がある(例えば、特許文献2参照。)。
これら従来の出力音量調整装置は、その何れにあっても、入力された音声信号に対して周囲の騒音レベルやボリュームの出力ゲインなどの外的影響を考慮して、音声出力の歪みを防止するためにダイナミックレンジの圧縮を行うものである。
特開平04−365210号公報 特開2000−101375号公報
一方、音声出力機能付きの電子辞書など、単語や例文のテキストの読み上げ音声を出力する小型の電子機器があるが、テキスト音声の出力では、その読み上げのリズム・抑揚・イントネーションの強弱などによりダイナミックレンジの幅が非常に大きくなる。
一般にこのような小型の電子機器は、電池電源により駆動されるため、電池がある程度消耗した状態でも一連のテキスト音声出力の最大部分における一時的な電圧低下からパワーダウンが生じないよう、ボリュームを調整して最大出力音量を制限する必要がある。しかしこのように最大出力音量を制限すると小さな音声部分が聞き取れない、あるいは非常に聞き取り難い音量となってしまう。
予めリアルな音声を録音したテキスト音声データを音声出力する場合には、この録音音声の中で小さな音声部分について予め聞き取り可能なレベルまで持ち上げて修正しておくことが可能であるが、録音音声データではなく、読み上げ対象テキストをリアルタイムで音声合成処理してその合成音声を出力する場合には、事前に音量レベルの調整(修正)を行っておくことはできない。
本発明は、このような課題に鑑みなされたもので、例えば電池電源がある程度消耗した状態になっても、一連の音声データの大音量部分も小音量部分も聞き取りやすい最適な音量にして出力することが可能になる音声出力制御装置および音声出力制御プログラムを提供することを目的とする。
請求項1に記載の音声出力制御装置は、一連の音声データを出力する制御を行う音声出力制御装置であって、音声を出力する音声出力手段と、この音声出力手段により音声を出力させるための電源電圧を供給する電源手段と、一連の音声データの1出力単位の音声データを取得する音声データ取得手段と、この音声データ取得手段により取得された1出力単位の音声データの出力に伴い前記電源手段により供給される電源電圧を検出する電圧検出手段と、この電圧検出手段により検出された電源電圧に応じて、前記音声データ取得手段により取得された1出力単位の音声データの音量レベルを調整する音量レベル調整手段と、この音量レベル調整手段により音量レベルの調整された音声データを前記音声出力手段により出力させる音声出力制御手段とを備えたことを特徴としている。
請求項2に記載の音声出力制御装置は、前記請求項1に記載の音声出力制御装置において、前記音量レベル調整手段は、前記電圧検出手段により検出された電源電圧が低いほど大きな音量減衰値を設定する減衰値設定手段を有し、この減衰値設定手段により設定された音量減衰値に従って前記音声データ取得手段により取得された1出力単位の音声データの音量レベルを減衰して調整することを特徴としている。
請求項3に記載の音声出力制御装置は、前記請求項1または請求項2に記載の音声出力制御装置において、前記電圧検出手段は、前記音声データ取得手段により取得された1出力単位の音声データの出力に伴い当該1出力単位の音声データの出力期間において前記電源手段により供給される最低の電源電圧を検出することを特徴としている。
請求項4に記載の音声出力制御装置は、前記請求項1または請求項2に記載の音声出力制御装置において、前記電圧検出手段は、前記音声データ取得手段により取得された1出力単位の音声データの出力に伴い当該1出力単位の音声データの出力期間において前記電源手段により供給される最低と最高の平均の電源電圧を検出することを特徴としている。
請求項5に記載の音声出力制御装置は、前記請求項1または請求項2に記載の音声出力制御装置において、前記電圧検出手段は、前記音声データ取得手段により取得された1出力単位の音声データの出力に伴い当該1出力単位の音声データの出力期間において前記電源手段により供給される最低と最高の電源電圧を除いた平均の電源電圧を検出することを特徴としている。
請求項6に記載の音声出力制御装置は、前記請求項1または請求項2に記載の音声出力制御装置において、前記電圧検出手段は、前記音声データ取得手段により取得された1出力単位の音声データの出力に伴い当該1出力単位の音声データの出力期間において前記電源手段により供給される平均の電源電圧を検出することを特徴としている。
請求項7に記載の音声出力制御装置は、前記請求項1に記載の音声出力制御装置において、さらに、前記音声データ取得手段により取得された1出力単位の音声データの最大の音量レベルを取得する音量レベル取得手段を備え、前記音量レベル調整手段は、前記電圧検出手段により検出された電源電圧と前記音量レベル取得手段により取得された最大の音量レベルに応じて、前記音声データ取得手段により取得された1出力単位の音声データの音量レベルを調整することを特徴としている。
請求項8に記載の音声出力制御装置は、前記請求項7に記載の音声出力制御装置において、前記音量レベル調整手段は、前記電圧検出手段により検出された電源電圧に応じて異なる音量減衰特性を選択する減衰特性選択手段と、この減衰特性選択手段により選択された音量減衰特性に従って前記音量レベル取得手段により取得された最大の音量レベルに応じた音量減衰値を設定する減衰値設定手段とを有し、この減衰値設定手段により設定された音量減衰値に従って前記音声データ取得手段により取得された1出力単位の音声データの音量レベルを減衰して調整することを特徴としている。
請求項9に記載の音声出力制御装置は、前記請求項2または請求項7に記載の音声出力制御装置において、前記音量レベル調整手段は、さらに、前記音声データ取得手段により取得された1出力単位の音声データと前記減衰値設定手段により設定された音量減衰値とを対応付けて記憶する出力音声データ記憶手段を有し、この出力音声データ記憶手段により記憶された1出力単位の音声データが読み出された際に当該音声データの音量レベルを前記対応付けて記憶された音量減衰値に従って減衰して調整することを特徴としている。
請求項10に記載の音声出力制御装置は、前記請求項1ないし請求項9の何れか1項に記載の音声出力制御装置において、さらに、テキストデータを記憶するテキスト記憶手段と、このテキスト記憶手段により記憶されたテキストデータに対応した音声データを音声合成して生成する音声合成手段とを備え、前記音声データ取得手段は、前記音声合成手段により生成された一連の音声データから1出力単位の音声データを取得することを特徴としている。
請求項11に記載の音声出力制御装置は、前記請求項2に記載の音声出力制御装置において、さらに、前記電圧検出手段により前回の1出力単位の音声データの出力に伴い検出された電源電圧と今回の1出力単位の音声データの出力に伴い検出された電源電圧とを比較する検出電圧比較手段を備え、前記減衰値設定手段は、前記検出電圧比較手段により比較された前回の検出電源電圧より今回の検出電源電圧が低い場合と高い場合とで異なる大きさの音量減衰値を設定することを特徴としている。
請求項12に記載の音声出力制御装置は、前記請求項8に記載の音声出力制御装置において、さらに、前記音量レベル取得手段により取得された前回の1出力単位の音声データの最大の音量レベルと今回の1出力単位の音声データの最大の音量レベルとを比較する音量レベル比較手段を備え、前記減衰値設定手段は、前記音量レベル比較手段により比較された前回の最大音量レベルより今回の最大音量レベルが大きい場合と小さい場合とで異なる大きさの音量減衰値を設定することを特徴としている。
請求項13に記載の音声出力制御装置は、前記請求項8または請求項12に記載の音声出力制御装置において、さらに、前記電圧検出手段により前回の1出力単位の音声データの出力に伴い検出された電源電圧と今回の1出力単位の音声データの出力に伴い検出された電源電圧とを比較する検出電圧比較手段を備え、前記減衰特性選択手段は、前記検出電圧比較手段により比較された前回の検出電源電圧より今回の検出電源電圧が低い場合と高い場合とで全体の減衰量が異なる音量減衰特性を選択することを特徴としている。
本発明の請求項1(請求項14)に記載の音声出力制御装置(音声出力制御プログラム)によれば、音声データ取得手段により取得された1出力単位の音声データの出力に伴い、電圧検出手段によって電源手段により供給される電源電圧が検出されると、この検出された電源電圧に応じて、前記音声データ取得手段により取得された1出力単位の音声データの音量レベルが音量レベル調整手段によって調整され、この音量レベルの調整された音声データが音声出力制御手段によって音声出力手段により出力されるので、例えば最小音量レベルの増幅を図っても電池電源の降下の程度に応じた適切な音量レベルに調整して音声出力することができる。
本発明の請求項2に記載の音声出力制御装置によれば、請求項1に記載の音声出力制御装置において、音量レベル調整手段では、電圧検出手段により検出された電源電圧が低いほど、減衰値設定手段によって大きな音量減衰値が設定され、この設定された音量減衰値に従って音声データ取得手段により取得された1出力単位の音声データの音量レベルが減衰調整されるので、例えば小さな音の音声データの出力レベルをある値以上に保持しつつも電源電圧を大きく降下させる大きな音量レベルの音声データほど大きく減衰調整して、電池電源の負荷を軽減することができる。
本発明の請求項3に記載の音声出力制御装置によれば、請求項1または請求項2に記載の音声出力制御装置において、電圧検出手段では、音声データ取得手段により取得された1出力単位の音声データの出力に伴い当該1出力単位の音声データの出力期間において電源手段により供給される最低の電源電圧が検出されるので、例えば電池電源の音声出力時における最低検出電圧値に応じてパワーダウンなどを招かない適切な音量レベルに調整して音声出力することができる。
本発明の請求項4に記載の音声出力制御装置によれば、請求項1または請求項2に記載の音声出力制御装置において、電圧検出手段では、音声データ取得手段により取得された1出力単位の音声データの出力に伴い当該1出力単位の音声データの出力期間において電源手段により供給される最低と最高の平均の電源電圧が検出されるので、例えば電池電源の音声出力時における最低と最高の平均の検出電圧値に応じてパワーダウンなどを招かない適切な音量レベルに調整して音声出力することができる。
本発明の請求項5に記載の音声出力制御装置によれば、請求項1または請求項2に記載の音声出力制御装置において、電圧検出手段では、音声データ取得手段により取得された1出力単位の音声データの出力に伴い当該1出力単位の音声データの出力期間において電源手段により供給される最低と最高の電源電圧を除いた平均の電源電圧が検出されるので、例えば電池電源の音声出力時における最低と最高の電源電圧を除いた平均の検出電圧値に応じてパワーダウンなどを招かない適切な音量レベルに調整して音声出力することができる。
本発明の請求項6に記載の音声出力制御装置によれば、請求項1または請求項2に記載の音声出力制御装置において、電圧検出手段では、音声データ取得手段により取得された1出力単位の音声データの出力に伴い当該1出力単位の音声データの出力期間において電源手段により供給される平均の電源電圧が検出されるので、例えば電池電源の音声出力時における平均の検出電圧値に応じてパワーダウンなどを招かない適切な音量レベルに調整して音声出力することができる。
本発明の請求項7(請求項15)に記載の音声出力制御装置(音声出力制御プログラム)によれば、請求項1(請求項14)に記載の音声出力制御装置(音声出力制御プログラム)において、さらに、音声データ取得手段により取得された1出力単位の音声データの最大の音量レベルを取得する音量レベル取得手段を備え、音量レベル調整手段では、電圧検出手段により検出された電源電圧と音量レベル取得手段により取得された最大の音量レベルに応じて、音声データ取得手段により取得された1出力単位の音声データの音量レベルが調整されるので、例えば最小音量レベルの増幅を図っても大きな音量レベルの音声データや電池電源の負荷が大きいときの音声データはその音量レベルや検知電源電圧に応じた適切な音量レベルに調整して音声出力することができる。
本発明の請求項8に記載の音声出力制御装置によれば、請求項7に記載の音声出力制御装置において、音量レベル調整手段では、電圧検出手段により検出された電源電圧に応じて異なる音量減衰特性を選択する減衰特性選択手段と、この減衰特性選択手段により選択された音量減衰特性に従って音量レベル取得手段により取得された最大の音量レベルに応じた音量減衰値を設定する減衰値設定手段とを有し、この減衰値設定手段により設定された音量減衰値に従って音声データ取得手段により取得された1出力単位の音声データの音量レベルが減衰調整されるので、例えば電池電源の降下が大きいときには大きな減衰特性に従い且つ音声データの最大音量レベルに応じた音量減衰値に従ってパワーダウンなどを招かない適切な音量レベルに調整して音声出力することができる。
本発明の請求項9に記載の音声出力制御装置によれば、請求項2または請求項7に記載の音声出力制御装置において、音量レベル調整手段では、さらに、音声データ取得手段により取得された1出力単位の音声データと減衰値設定手段により設定された音量減衰値とを対応付けて記憶する出力音声データ記憶手段を有し、この出力音声データ記憶手段により記憶された1出力単位の音声データが読み出された際に当該音声データの音量レベルがその音量減衰値に従って減衰調整されるので、1出力単位の音声データ毎にこれに誤りなく対応付けた適切な音量減衰値により適切な音量レベルに調整して音声出力することができる。
本発明の請求項10に記載の音声出力制御装置によれば、請求項1ないし請求項9の何れか1項に記載の音声出力制御装置において、さらに、テキストデータを記憶するテキスト記憶手段と、このテキスト記憶手段により記憶されたテキストデータに対応した音声データを音声合成して生成する音声合成手段とを備え、音声データ取得手段では、音声合成手段により生成された一連の音声データから1出力単位の音声データが取得されるので、予め音量レベルを調整設定できない合成音声の音声データを出力する場合に特に、例えば最小音量レベルの増幅を図っても電池電源の降下の程度やその1出力単位の音声データの最大音量レベルに応じた適切な音量レベルに調整して音声出力することができる。
本発明の請求項11に記載の音声出力制御装置によれば、請求項2に記載の音声出力制御装置において、さらに、電圧検出手段により前回の1出力単位の音声データの出力に伴い検出された電源電圧と今回の1出力単位の音声データの出力に伴い検出された電源電圧とを比較する検出電圧比較手段を備え、減衰値設定手段では、検出電圧比較手段により比較された前回の検出電源電圧より今回の検出電源電圧が低い場合と高い場合とで異なる大きさの音量減衰値が設定されるので、例えば電池電源の検出電圧値が下降傾向にあるときには大きめの音量減衰値を設定しパワーダウンなどを招かない適切な音量レベルに調整して音声出力することができる。
本発明の請求項12に記載の音声出力制御装置によれば、請求項8に記載の音声出力制御装置において、さらに、音量レベル取得手段により取得された前回の1出力単位の音声データの最大の音量レベルと今回の1出力単位の音声データの最大の音量レベルとを比較する音量レベル比較手段を備え、減衰値設定手段では、音量レベル比較手段により比較された前回の最大音量レベルより今回の最大音量レベルが大きい場合と小さい場合とで異なる大きさの音量減衰値が設定されるので、例えば1出力単位毎の音声データの音量レベルが上昇傾向にあり電池電源の消耗に拍車を掛ける恐れがあるときには大きめの音量減衰値を設定しパワーダウンなどを招かない適切な音量レベルに調整して音声出力することができる。
本発明の請求項13に記載の音声出力制御装置によれば、請求項8または請求項12に記載の音声出力制御装置において、さらに、電圧検出手段により前回の1出力単位の音声データの出力に伴い検出された電源電圧と今回の1出力単位の音声データの出力に伴い検出された電源電圧とを比較する検出電圧比較手段を備え、減衰特性選択手段では、検出電圧比較手段により比較された前回の検出電源電圧より今回の検出電源電圧が低い場合と高い場合とで全体の減衰量が異なる音量減衰特性が選択されるので、例えば電池電源の降下傾向にあるときには大きめの減衰特性に従い且つ音声データの最大音量レベルに応じた音量減衰値に従ってパワーダウンなどを招かない適切な音量レベルに調整して音声出力することができる。
よって本発明によれば、例えば電池電源がある程度消耗した状態になっても、一連の音声データの大音量部分も小音量部分も聞き取りやすい最適な音量にして出力することが可能になる音声出力制御装置および音声出力制御プログラムを提供できる。
以下図面により本発明の実施の形態について説明する。
(第1実施形態)
図1は、本発明の実施形態に係る音声出力制御装置を搭載した携帯機器(電子辞書)10の電子回路の構成を示すブロック図である。
この携帯機器(電子辞書)10は、以下に説明する電子辞書機能を備えたPDA(personal digital assistants)、PC(personal computer)、携帯電話、電子ブックとして構成されるか、電子辞書専用の携帯機器として構成される。この携帯機器(電子辞書)10は、各種の記憶媒体に記録されたプログラム、または伝送されたプログラムを読み込んで、その読み込んだプログラムによって動作が制御されるコンピュータによって構成され、その電子回路には、CPU(central processing unit)11が備えられる。
CPU11は、プログラムROM12a内に予め記憶された装置制御プログラム、あるいはメモリカード13などの外部記憶媒体からプログラムROM12aに読み込まれた装置制御プログラム、あるいは図示しないインターネットN上のWebサーバ(この場合はプログラムサーバ)から通信機器を経由してプログラムROM12aに読み込まれた装置制御プログラムに応じて、回路各部の動作を制御するもので、前記プログラムROM12aに記憶された装置制御プログラムは、キーボード14やタッチパネル15である入力部16からのユーザ操作に応じた入力信号、あるいは外部接続されるEEPROM,RAM,ROMなどのメモリカード(記憶媒体)13との接続通信信号に応じて起動される。
前記CPU11には、前記プログラムROM12aの他、データベースROM12b、RAM12cが接続され、また前記メモリカード13、キーボード14、タッチパネル15が接続される他に、LCDからなる表示部17、音声出力用のアンプ18aを介したスピーカ18などが接続される。
そして、この携帯機器(電子辞書)10の電子回路は、電池電源Bによる電源回路19からの電圧供給によって駆動される。
図2は、前記携帯機器(電子辞書)10の電子回路に搭載された音声出力制御装置の主要部の構成を示すブロック図である。
この音声出力制御装置の主要部として、前記CPU11は、音声合成エンジン21、ATT値演算部22、ATT設定部23を有するソフト処理部20を備える。
音声合成エンジン21は、音声出力対象となる単語や例文などのテキストデータに対応した合成音声を生成すると共に当該合成音声信号のPCM(Pulse Code Modulation)データを作成する。
ATT値演算部22は、前記音声合成エンジン21にて作成された合成音声信号のPCM(Pulse Code Modulation)データを1フレーム(63ms)毎に1000個のsample数で抽出し、これを10分割した100sample(6.3ms)ずつの平均を計算し、そのうちの最大の平均値を該当1フレーム中のPCMピーク値として求めると共に、このPCMピーク値に応じて当該1フレームのPCMデータの音声出力レベルがパワーダウンの限界値を超えないための減衰比(ATT値)を求める(図4〜図6参照)。
ATT設定部23は、前記ATT値演算部22にて求められた1フレームのPCMデータについての減衰比(ATT値)を、RAM12cに保持された該当1フレームのPCMデータをデジタルアッテネータ24からDAC(Digital/Analog Converter)25を通して音声出力するのに伴い該デジタルアッテネータ24にセットする。
RAM12cは、前記ATT演算部22により1フレームずつ抽出されるPCMデータを対応するATT値と共に交互に一時記憶する2つのバッファBUF1,BUF2を有し、ATT値演算部22からBUF1/BUF2に対するPCMデータの書き込み処理(PCM Data Write)、各BUF1/BUF2からのPCMデータの読み出し処理(PCM Data Read)およびそのデジタルアッテネータ24への出力処理、これに伴う各BUF1/BUF2からのATT値の読み出し処理(ATTレベルRead)およびそのATT値のATT設定部23への出力処理、そして各BUF1/BUF2からのPCMデータの出力終了を前記音声合成エンジン21へ通知する処理は、何れもCPU11におけるDMAコントローラ/BUSコントローラ26によって実行される。
すなわちDMAコントローラ/BUSコントローラ26は、次のように制御動作する。
(1)音声合成エンジン21により作成されATT値演算部22により抽出された1フレーム分(1000sample)のPCMデータをBUF1に書き込む。
(2)同様に音声合成エンジン21により作成されATT値演算部22により抽出された次の1フレーム分(1000sample)のPCMデータをBUF2に書き込む。
(3)BUF1にセットされているATT値をATT設定部23に読み込みアッテネータ24にセットする。
(4)BUF1/BUF2に2フレーム分のPCMデータが書き込まれた時点で、BUF1を転送バッファに指定してそのPCMデータのアッテネータ24へのDMA転送を開始し、テキスト音声信号の出力を開始させる。
(5)BUF1からのPCMデータのDMA転送が終了すると、BUF2にセットされているATT値をATT設定部23に読み込みアッテネータ24にセットする。
(6)BUF2を転送バッファに指定してそのPCMデータのアッテネータ24へのDMA転送を開始し、テキスト音声信号の出力を開始させる。
(7)音声合成エンジン21に対してBUF2出力終了を通知し、次のフレームのPCMデータの作成を開始させる。
以後、音声出力対象として指定された全テキストデータの音声出力が終了するまで前記同様の制御動作が繰り返される。
図3は、前記携帯機器(電子辞書)10のプログラムROM12a、データベースROM12b、RAM12cに記憶されるデータの内容を示す図である。
プログラムROM12aに記憶される装置制御プログラムとしては、当該携帯機器(電子辞書)10の全体の動作を司るシステムプログラムが記憶される他に、辞書データ(12b1)に基づいて入力文字に応じた見出語の検索表示およびその説明情報の検索表示を行うための辞書検索処理プログラム12a1、表示上で指定されたテキストデータを合成音声による読み上げ音声として出力させるための合成音声出力処理プログラム12a2、この合成音声出力処理に際して出力対象であるテキストデータの文字列組合せや発音記号に従って各音素の音声データ(12b2)を合成してその読み上げ音声のPCMデータを生成するための音声合成処理プログラム12a3、この音声合成処理により生成されたPCMデータのピーク値に基づいて音声出力レベルがパワーダウンの限界値を超えないための減衰比(ATT値)を演算し該PCMデータの音声出力を制御するための音声出力制御処理プログラム12a4などが記憶される。
データベースROM12bには、英和辞書、英英辞書、和英辞書、国語辞書、漢和辞書などの各種の辞書データ12b1、音声合成処理にて使用される各音素に対応させた音声データ12b2、音声出力すべきPCMデータのピーク値に応じた減衰比(ATT値)を設定するためのATT値設定データ12b3(図5参照)などが記憶される。
なお、データベースROM12bに記憶された辞書データ12b1と同様に、メモリカード13に記憶された他の辞書データを外部から入力して利用可能である。
RAM12cには、入力部16(14,15)から入力された文字データを記憶するための入力文字メモリ12c1、辞書検索処理(12a1)に従い検索された見出語やその説明情報を記憶するための検索見出語メモリ12c2、検索表示された見出語及びその説明情報の中でユーザ入力に応じて指定された単語や例文などの位置データを記憶するための見出語情報指定位置メモリ12c3、音声出力制御処理(12a4)に伴いATT値演算部22(図2参照)にて計算されるPCMデータ1フレームあたりのPCMピーク値を記憶するためのPCM計算値メモリ12c4、電源回路19から供給される電源電圧の検出電圧Vを記憶するための電源電圧メモリ12c5、音声出力すべきPCMデータ1フレームずつを記憶するためのバッファメモリ(BUF1/BUF2(図2参照))12c6が備えられる。
この携帯機器(電子辞書)10では、辞書検索により表示された見出語及びその説明情報において、ユーザ操作により読み上げ音声の出力対象である単語や文などのテキストデータが指定されると、当該テキストデータを順次音声合成してPCMデータとする共に、このPCMデータの1フレームずつのピーク値に応じた減衰比(ATT値)を設定しその音声出力レベルがパワーダウンの限界値を直前で超えさせないようにして音声出力するための音声出力制御処理を行う。
これにより、読み上げ音声の出力が指定されたテキストデータの音声出力に際して、その音声合成したPCMデータのピーク値を当該PCMデータの段階で音声出力に伴うパワーダウンの限界値手前で抑えつつ、その分、アンプ18aの増幅率を上昇させて最低音量の底上げを図ることで、ダイナミックレンジの非常に大きいテキスト音声データの小音量部分および大音量部分の何れをも、聞き取りやすい最適な音量で出力することができる。
次に、前記携帯機器(電子辞書)10が搭載した第1実施形態の音声出力制御装置における音声出力制御機能の原理について説明する。
図4は、音声出力すべきテキスト音声信号の1フレーム毎にピーク値を求める際の信号抽出手順を説明するための図であり、同図(A)は出力対象のテキスト音声信号を示す波形図、同図(B)はこのテキスト音声信号に対する1フレームのサンプル状態を示す波形図、同図(C)はこの1フレームを10分割して拡大した状態を示す波形図である。
図4(A)に示すように、音声出力対象となる音声信号が与えられると、その信号先頭から63ms毎を順次1フレームとして、図4(B)に示すように、各フレーム内の信号が1000sample抽出され、この1フレーム毎の1000sampleの信号は、図4(C)に示すように、100sample(6.3ms)ずつに10分割される。そして、この10分割された100sample(6.3ms)ずつの音声信号それぞれの平均をPCMデータから算出し、その10個の平均の最大値を当該1フレームにおけるPCMデータのピーク値として求める。
図5は、音声出力すべきPCMデータのピーク値に応じた減衰比(ATT値)を設定するためのATT値設定テーブル(12b3)を示す図である。
図6は、前記携帯機器(電子辞書)10が搭載した第1実施形態の音声出力制御装置における作用・効果を説明するための図であり、同図(A)は音声信号入力を単に直線増幅して限界増幅値の範囲内で出力する場合の従来の入出力特性を示す図、同図(B)は音声入力信号のPCMピーク値に応じた減衰比(ATT値)を設定して出力する場合の入出力特性を示す図、同図(C)は同PCMピーク値に応じた減衰比(ATT値)を設定することで限界増幅値の範囲一杯まで増幅率を上昇させて最低音量出力レベルの底上げを図った本実施形態の入出力特性を示す図、同図(D)(E)は従来の入出力特性に従ったテキスト音声データの出力信号波形と本実施形態の入出力特性に従ったテキスト音声データの出力信号波形とを対比して示す図である。
図6(A)に示すように、従来の音量調整装置の入出力特性に従い音声信号を出力すると、音声信号の最小入力レベルから最大入力レベルまで直線性を持って一律に増幅出力されるので、その最大出力レベルが例えば電源負荷の瞬時増大に伴うパワーダウンを招かないよう限界増幅値を超えないように設定すると、最小出力レベルはその最小入力レベルに比例して小さく、特に抑揚のあるテキストの読み上げ音声出力では聞き取り難い音声部分が生じてしまう。
一方、図5のATT値設定テーブル(12b3)および図6(B)に示すように、音声入力信号のPCMピーク値PCM1〜PCM10に応じた減衰比(ATT値)ATT1〜ATT10を設定して入力レベルの大きい方のPCMデータを減衰させることで、この減衰により限界増幅値との間で余裕が生まれた分だけ、図6(C)に示すように、アンプ18aの増幅率を上昇させると、最大出力レベルが限界増幅値を超えない状態にして最小出力レベルを矢印Xで示すようにその増幅率上昇分だけ上方にシフトさせることができる。
この結果、図6(D)に示すような従来の入出力特性に従ったテキスト音声データの出力信号波形も、図6(E)に示すような本実施形態の入出力特性に従ったテキスト音声データの出力信号波形も、それぞれその出力信号の最大値PHは前記限界増幅値に合わせて同一であるものの、その出力信号の最小値を従来のPLから2倍以上振幅の増加したPL′に改善することができ、テキスト音声データの例えば抑揚の強い聞き取りやすい音声部分はそのまま聞き取りやすい音量で、抑揚の弱い従来聞き取り難かった音声部分は十分聞き取りやすい音量にして音声出力できるようになる。
次に、前記構成の携帯機器(電子辞書)10による辞書検索機能および第1実施形態の音声出力制御機能について説明する。
図7は、前記携帯機器(電子辞書)10による辞書検索音声出力処理を示すフローチャートである。
図8は、前記携帯機器(電子辞書)10の辞書検索音声出力処理に伴う検索情報表示画面G1の表示動作および音声発声動作を示す図である。
プログラムROM12aに記憶された辞書検索処理プログラム12a1が起動された状態で、キーボード14に対するユーザ操作に応じて検索対象となる文字が入力されRAM12c内の入力文字メモリ12c1に記憶されると(ステップS1)、この入力文字に対応する見出語がデータベースROM12bに記憶されている辞書データ12b1に基づき検索され、見出語一覧画面(図示せず)として表示部17に表示される(ステップS2)。
この見出語一覧画面の表示状態において、キーボード14に対するユーザ操作に応じたカーソル移動および実行(決定)キー入力によりユーザ所望の見出語が選択されると(ステップS3)、この選択された見出語とその説明情報が前記辞書データ12b1から読み出され検索見出語メモリ12c2に記憶されると共に、例えば図8(A)に示すように、検索情報表示画面G1として表示部17に表示される(ステップS4)。
すると、キー入力信号の入力待機状態となり(ステップS5)、キーボード14の「音声」キー16aの操作に応じたキー入力信号が入力されると(ステップS6)、例えば図8(B)に示すように、検索情報表示画面G1上で表示されている見出語「education」が反転指示表示Hされ、その反転指示位置情報が見出語情報指定位置メモリ12c3に記憶される(ステップS7)。
ここで、例えば図8(C)(D)に示すように、下カーソルキー「↓」16cからのキー入力信号が入力されると、当該キー信号入力の都度、そのカーソル方向に前記反転指示表示Hによる指定行が1文単位で移動されると共に、見出語情報指定位置メモリ12c3にて記憶管理されている反転指示位置情報が更新される(ステップS8→S9)。
そして、検索情報表示画面G1上での反転指示表示Hによる見出語あるいは説明情報の指定行がユーザ所望の位置に移動された状態で、キーボード14の「決定」キー16bの操作に応じたキー入力信号が入力されると(ステップS10)、当該反転表示されている見出語あるいは説明情報における例文のテキストデータについて、その読み上げ音声を出力するための合成音声出力処理に移行される。これにより、合成音声出力処理プログラム12a2が起動され、音声合成エンジン21にて順次生成される合成音声のテキスト音声データが、図9に示す音声出力制御処理に従ってスピーカ18から音声出力される(ステップSA)。
図9は、前記携帯機器(電子辞書)10による第1実施形態の音声出力制御処理を示すフローチャートである。
この音声出力制御処理では、まず図2における音声出力制御装置の初期設定が行われ、ATT値演算部22、ATT設定部23、RAM12c内のバッファメモリ(BUF1/BUF2)12c6などが“0”クリアされる(ステップA1)。
これと共に、PCMピーク値=0、ブロック数=1にセットされ(ステップA2)、音声合成エンジン21にて生成される合成音声のテキスト音声データから1ブロック分(10分の1フレーム:100sample)のPCMデータがATT値演算部22に抽出される(ステップA3)(図4(C)参照)。
すると、今回抽出された1ブロック(100sample)分のPCMデータの平均値が計算され(ステップA4)、この計算された今回の1ブロックあたりのPCMデータの平均値が1フレーム中のPCMピーク値(初期=“0”)より大きいか否か判断される(ステップA5)。
ここで、前記計算された今回の1ブロックあたりのPCMデータの平均値が1フレーム中のこれまでのPCMピーク値より大きいと判断された場合には、当該今回ブロックのPCMデータの平均値がPCMピーク値として書き換えられる(ステップA6)。
そして、現在抽出中のブロックが10ブロック目手前である、つまり、1フレームあたりの最終ブロックに到達しないと判断された場合には(ステップA7)、1フレームあたりのPCMデータにおけるカウントブロック数が“1”アップカウントされ(ステップA8)、このアップカウントされた次のブロックについて前記同様のPCMピーク値との大小比較書き換え処理が繰り返される(ステップA3〜A6)。
この後、ステップA7おいて、今回の抽出ブロックが10ブロック目であると判断されると、これにより、音声合成エンジン21により生成された合成音声におけるPCMデータ1フレームにおけるPCMピーク値が取得されたことになり、このPCMピーク値がデータベースROM12bに記憶されているATT値設定テーブル(12b3)(図5参照)に従いそのスレッシュ値PCM1〜PCM10と大小比較され、何れのPCMスレッシュ値の範囲であるか判断される(ステップA9〜A12)。
ここで、生成された合成音声の今回のPCMデータ1フレームにおけるPCMピーク値がATT値設定テーブル(12b3)(図5参照)で示されるPCM1未満の小さな音声レベルであると判断された場合には、ATT値=0(減衰なし)とされ(ステップA9→A13)、これと共に当該1フレーム分(10ブロック:1000sample)のPCMデータがRAM12c内のバッファメモリ(BUF1/BUF2)12c6にセットされる(ステップA18)。
また、前記生成された合成音声の今回のPCMデータ1フレームにおけるPCMピーク値がATT値設定テーブル(12b3)(図5参照)で示されるPCM1以上でPCM2未満であると判断された場合にはATT値=1(最小減衰比)(ステップA9→A10→A14)、PCM2以上でPCM3未満であると判断された場合にはATT値=2とされ(ステップA10→A11→A15)、これと共に当該1フレーム分(10ブロック:1000sample)のPCMデータがRAM12c内のバッファメモリ(BUF1/BUF2)12c6にセットされる(ステップA18)。
さらに、PCM10以上で大きな音声レベルであると判断された場合には、ATT値=10(最大減衰比)とされ(ステップA12→A17)、これと共に当該1フレーム分(10ブロック:1000sample)のPCMデータがRAM12c内のバッファメモリ(BUF1/BUF2)12c6にセットされる(ステップA18)。
すると、RAM12c内のバッファメモリ(BUF1/BUF2)12c6にセットされた1フレームのPCMデータにおけるATT値がATT設定部23にセットされてデジタルアッテネータ24の減衰比が設定されると共に、当該1フレームのPCMデータが前記デジタルアッテネータ24へDMA転送され、この1フレームのPCMデータはそのピーク値に対応付けられて設定されたATT値(減衰比)で減衰された後、DAC25によりアナログ音声信号に変換され、アンプ18aにより増幅されてスピーカ18から音声出力される。
この後、出力対象として指定されている前記テキストデータの合成音声生成出力処理が完了するまで前記ステップA1からのPCMデータ1フレーム毎のPCMピーク値に応じたATT値演算設定処理、およびこの設定ATT値に従った対応1フレームのPCMデータの減衰処理が順次繰り返される(ステップA19→A1〜A18)。
これにより、合成音声として出力されるテキスト音声信号は、図6(C)で示したように、その最大出力レベルで限界増幅の範囲内に抑えられる一方で、最小出力レベルで前記最大出力レベルでの減衰比に対応した分だけ上昇された増幅率で増幅されて十分聞き易い音量として出力されるようになる。
したがって、前記構成の携帯機器(電子辞書)10による第1実施形態の音声出力制御機能によれば、音声出力対象のテキストデータの合成音声を生成しPCMデータとして作成すると共に、このPCMデータの1フレーム(63ms)毎のピーク値を計算し、このPCMピーク値の大小に応じたスレッシュ値PCM1〜10に対応してそれぞれ異なるATT値(減衰比)を設定するためのATT値設定テーブル(12b3)に従い当該PCMデータの1フレームに対するATT値(減衰比)を設定し、PCMピーク値が高いほど大きい減衰比により減衰させてその出力レベルが限界増幅の範囲にあわせて収まるようにし、その分、最小の出力レベルを上昇させて音声出力するようにしたので、テキスト音声の抑揚の強い部分が歪まずにまた電源負荷の瞬時増大によるパワーダウンを招かずに十分大きな音量で聞き取りやすく出力されるのは勿論、抑揚の弱い部分であっても、聞き取りやすい音量レベルまで増幅されて出力されるようになる。
なお、前記第1実施形態の音声出力制御機能では、図5で示したように、1つのATT値設定テーブル(12b3)に記述された一連のスレッシュ値PCM1〜10に従ってPCMデータ1フレーム毎のPCMピーク値が何れのスレッシュ値PCMの範囲に有るかで当該PCMデータ1フレームの出力に伴うATT値(減衰比)を設定する構成としたが、このような構成では、PCMデータ1フレーム毎のピーク値があるスレッシュ値PCM付近を繰り返し前後した場合、その都度スレッシュ値PCMの範囲が変わりATT値の設定値が小刻みに変化して音声出力が不安定になる。そこで次の図10(A)(B)に示すように、前記テーブル同様の一連のスレッシュ値PCM1〜10を記述した第1のATT値設定テーブル12b31とこの第1のテーブル12b31の一連のスレッシュ値PCM1〜10を全て一定の幅Δpで異ならせた第2のATT値設定テーブル12b32とを用意し、今回のPCMデータ1フレームにおけるPCMピーク値が前回1フレームにおけるPCMピーク値以上(上昇時)であるか未満(下降時)であるかに応じてこの第1または第2のATT値設定テーブル12b31,12b32を使い分けするヒステリシス処理Aを行うことで、PCMピーク値の小さな上下動によってATT設定値が小刻みに変化するのを防止し、音声出力を安定化する構成としてもよい。
図10は、音声出力すべきPCMデータのピーク値に応じた減衰比(ATT値)をヒステリシス処理Aにより設定するための第1,第2のATT値設定テーブル(12b31,12b32)を示す図である。
図11は、前記第1,第2のATT値設定テーブル(12b31,12b32)をPCMピーク値の変動方向に応じて選択使用するためのヒステリシス処理Aを示すフローチャートである。
この図11におけるヒステリシス処理Aは、前記図9における第1実施形態の音声出力制御処理のステップA1〜A8において今回のPCMデータ1フレームにおけるPCMピーク値が求められた後段であって、且つその後のステップA9〜A18において当該PCMピーク値に応じたATT値を設定する前段のステップAHにおいて実行される。
すなわち、ATT値演算部22にて抽出されたPCMデータの今回の1フレームにおけるPCMピーク値が前回の1フレームにおけるPCMピーク値以上であり合成音声の入力レベルが上昇したと判断された場合には、図10(A)に示すような通常の音量スレッシュ値(PCM1〜PCM10)に従った第1のATT値設定テーブル12b31が使用される(ステップAH11〜AH12)。
一方、ATT値演算部22にて抽出されたPCMデータの今回の1フレームにおけるPCMピーク値が前回の1フレームにおけるPCMピーク値未満であり合成音声の入力レベルが下降したと判断された場合には、図10(B)に示すような前記通常の音量スレッシュ値(PCM1〜PCM10)に対し各スレッシュ値を一定幅ΔP1〜ΔP10で下げた音量スレッシュ値(PCM1′(=PCM1−ΔP1)〜PCM10′(=PCM10−ΔP10))に従った第2のATT値設定テーブル12b32が使用される(ステップAH11〜AH13)。
図12は、前記第1,第2のATT値設定テーブル(12b31,12b32)を選択使用するヒステリシス処理Aを伴う音声出力制御処理での設定ATT値の変化状態を示す図である。
これによれば、例えば図12のタイミングT1で示すように、今回の合成音声入力であるPCMピーク値が前回のPCMピーク値より上昇し第1のATT値設定テーブル12b31の音量スレッシュ値PCM5以上となることで設定ATT値が一旦ATT4からATT5に変化すると、その直後にPCMピーク値が当該第1のATT値設定テーブル12b31の音量スレッシュ値PCM5を若干下回ることがあっても、このようなPCMピーク値の下降時には第2のATT値設定テーブル12b32が使用されてその音量スレッシュ値PCM5′以上が保持されるので、設定ATT値がATT5のまま変化することはなく、PCMピーク値のPCM5前後での若干の変動によって設定ATT値が小刻みに変化し音声出力が不安定になることはない。
また、例えば図12のタイミングT2で示すように、今回の合成音声入力であるPCMピーク値が前回のPCMピーク値より下降し第2のATT値設定テーブル12b32の音量スレッシュ値PCM5′未満となることで設定ATT値が一旦ATT5からATT4に変化すると、その直後にPCMピーク値が当該第2のATT値設定テーブル12b32の音量スレッシュ値PCM5′を若干上回ることがあっても、このようなPCMピーク値の上昇時には第1のATT値設定テーブル12b31が使用されてその音量スレッシュ値PCM5未満が保持されるので、設定ATT値がATT4のまま変化することはなく、PCMピーク値のPCM5′前後での若干の変動によって設定ATT値が小刻みに変化し音声出力が不安定になることはない。
なお、前記ヒステリシス処理Aでは、前記PCMピーク値の変動方向に応じて第1,第2のATT値設定テーブル(12b31,12b32)を選択使用することで各音量スレッシュ値PCMn(PCMn′)前後での設定ATT値の小刻みな変化を抑制し音声出力の安定化を図る構成としたが、次の図13に示すように、減衰量の大きい特性XのATT値設定テーブルと減衰量の小さい特性YのATT値設定テーブルとを用意し、今回のPCMデータ1フレームにおけるPCMピーク値が前回1フレームにおけるPCMピーク値以上(上昇時)であるか未満(下降時)であるかに応じてこの特性Xまたは特性YのATT値設定テーブルを使い分けするヒステリシス処理Bを行うことで、PCMピーク値が上昇傾向にあるときと下降傾向にあるときとでより効果的に安定化したATT値を設定する構成としてもよい。
図13は、音声出力すべきPCMデータのピーク値に応じて2通りの減衰比(ATT値)をヒステリシス処理Bにより選択的に設定するための減衰比特性X,Yの変化状態を示す図である。
図14は、前記特性X,特性YのATT値設定テーブルをPCMピーク値の変動方向に応じて選択使用するためのヒステリシス処理Bを示すフローチャートである。
この図14におけるヒステリシス処理Bは、前記図11におけるヒステリシス処理Aと同様に、図9における第1実施形態の音声出力制御処理のステップA1〜A8において今回のPCMデータ1フレームにおけるPCMピーク値が求められた後段であって、且つその後のステップA9〜A18において当該PCMピーク値に応じたATT値を設定する前段のステップAHにおいて実行される。
すなわち、ATT値演算部22にて抽出されたPCMデータの今回の1フレームにおけるPCMピーク値が前回の1フレームにおけるPCMピーク値以上であり合成音声の入力レベルが上昇したと判断された場合には、図13に示すような減衰量が大きい方の特性Xに従ったATT値設定テーブルが使用される(ステップAH21〜AH22)。
一方、ATT値演算部22にて抽出されたPCMデータの今回の1フレームにおけるPCMピーク値が前回の1フレームにおけるPCMピーク値未満であり合成音声の入力レベルが下降したと判断された場合には、図13に示すような減衰量が小さい方の特性Yに従ったATT値設定テーブルが使用される(ステップAH21〜AH23)。
これによれば、今回の合成音声入力であるPCMピーク値が前回のPCMピーク値より上昇することで減衰量の大きい特性XのATT値設定テーブルが選択使用され、また前回のPCMピーク値より下降することで減衰量の小さい特性XのATT値設定テーブルが選択使用されるので、音声レベルが上昇傾向となり電池電源に対する負荷が重くなるようなときには減衰量を多めにして電池寿命の低下の抑制やパワーダウン発生の恐れの解消を図ることができ、しかも音声レベルが下降傾向となり電池電源に対する負荷が軽くなるようなときには減衰量を少なめにして十分な音量の維持を図ることができる。
なお、前記第1実施形態の音声出力制御機能では、ATT値演算部22においてPCMデータ1フレーム毎のATT値が求められ、ATT設定部23によってデジタルアッテネータ24にセットされると、当該デジタルアッテネータ24にDMA転送された1フレームのPCMデータがそのATT値に応じた音量レベルに調整されるが、前記図9のフローチャートにおけるステップA18aおよび次の図15を参照して説明するように、ATT値演算部22から1フレームのPCMデータとそのピーク値に応じたATT値とをRAM12c内のバッファメモリ(BUF1/BUF2)12c6に転送する際に、前回フレームのPCMデータに対するATT値から今回フレームのPCMデータに対するATT値へ向けて当該PCMデータ自体の音量値を増算または減算することで、前記デジタルアッテネータ24およびこのアッテネータ24に対するATT設定処理(23)を必要としない構成としてもよい。
図15は、前記携帯機器(電子辞書)10による第1実施形態の音声出力制御処理に伴う合成音声のPCMデータに対するATT(アッテネート)処理を示す図である。
例えば、前回のPCMデータ1フレームに対するATT値が“−50”で今回のPCMデータ1フレームに対するATT値が“−120”であるときには、当該今回フレームのPCMデータをRAM12c内のバッファメモリ(BUF1/BUF2)12c6に転送する際に、図15(A)(B)に示すように、この今回のPCMデータ1フレームにおける1sampleデータPCM1,PCM2,…毎に“−51”“−52”…と“−120”まで1dBずつ段階的に減算変化させる(ステップA18a)。
続いて、今回のPCMデータ1フレームに対するATT値が“−70”であるときには、図15(B)(C)に示すように、この今回のPCMデータ1フレームにおける1sampleデータPCM1,PCM2,…毎に“−119”“−118”…と“−70”まで1dBずつ段階的に増算変化させる(ステップA18a)。
これによれば、前記デジタルアッテネータ24およびこのアッテネータ24に対するATT設定処理(23)が必要なく、バッファメモリ(BUF1/BUF2)12c6にATT(アッテネート)処理されて転送された1フレームずつのPCMデータを直接DAC25に転送して音声出力することが可能になり、最大音量を限界増幅の範囲内で抑えつつ最小音量を底上げしてテキストデータの読み上げ合成音声をより聞き易く出力することができるばかりか、各PCMデータ1フレームの音声出力に伴うATT処理を1dBずつ連続的に増減変化させて行うことで、出力音声が不連続にならず自然なテキスト音声を出力することが可能になる。
なお、前記第1実施形態の音声出力制御機能では、合成音声のPCMデータ1フレーム毎のPCMピーク値の大小に応じて該当1フレームのPCMデータに対するATT値(減衰比)を設定し、最大音量を例えば電池電源のパワーダウンを招かない限界増幅の範囲内で抑える一方で最小音量の底上げを図る構成としたが、次の第2実施形態の音声出力制御機能にて説明するように、アンプ18aの増幅率を予め上昇させて最小音量の底上げを図っておくのと共に、電源電圧の低下具合に応じてPCMデータ1フレーム毎のATT値(減衰比)を設定することで、電池電源のパワーダウンを抑制すると共にその長寿命化を図り、1回の電池交換で長期間のテキスト音声出力を可能にする構成としてもよい。
つまり、前記第1実施形態では、出力音声レベルが大きい(PCMピーク値が高い)場合に、PCMデータに対し大きなATT値(減衰比)を設定しその出力音声レベルを抑制することで電池電源のパワーダウンなどの恐れを解消したものであるが、このように出力音声レベルが大きい場合にはアンプ部の負荷が増大して電圧降下が著しいため、次の第2実施形態において説明するように、その電圧降下具合に応じてPCMデータに対するATT値(減衰比)を設定しその出力音声レベルを抑制することで、前記第1実施形態と同様の効果が得られるものである。
(第2実施形態)
図16は、前記携帯機器(電子辞書)10による第2実施形態の音声出力制御機能での音声出力に対する電源電圧に応じたATT値(減衰比)の設定特性を示す図である。
すなわち、この第2実施形態の音声出力制御機能では、テキストデータの読み上げ合成音声の生成出力に際して、電源回路19からCPU11に出力される電池電源Bの検出電圧VがLevel1以下に低下すると、その電圧低下の幅に応じて合成音声のPCMデータに対するATT値(減衰比)が段階的に設定される。
例えばLevel1≧V>Level2ではATTv1(−2dB)に設定され、Level2≧V>Level3ではATTv2(−4dB)に設定され、Level3≧V>Level4ではATTv3(−6dB)に設定され、Level4≧VではCPU11の最低動作電圧以下となるので音声出力動作自体が停止される。
図17は、前記携帯機器(電子辞書)10による第2実施形態の音声出力制御処理を示すフローチャートである。
この第2実施形態の音声出力制御処理では、まず図2における音声出力制御装置の初期設定が行われ、ATT値演算部22、ATT設定部23、RAM12c内のバッファメモリ(BUF1/BUF2)12c6などが“0”クリアされる(ステップB1)。
これと共に、検出電圧の最小値=3V(初期値:最大)、ブロック数=1にセットされ(ステップB2)、音声合成エンジン21にて生成される合成音声のテキスト音声データから1ブロック分(10分の1フレーム:100sample)のPCMデータがATT値演算部22に抽出される(ステップB3)(図4(C)参照)。
すると、電源回路19から出力される電池電源Bの電圧レベルVが検知されて図示しない検知電圧記録テーブルに記憶され(ステップB4)、この記録された今回の検知電源電圧がこれ以前の検知電圧最小値(初期=3V)より小さいか否か判断される(ステップB5)。
ここで、前記今回の検知電源電圧がこれ以前の検知電圧最小値(初期=3V)より小さいと判断された場合には、当該今回検知電源電圧が検知電圧最小値として書き換えられる(ステップB6)。
そして、現在抽出中のブロックが10ブロック目手前である、つまり、1フレームあたりの最終ブロックに到達しないと判断された場合には(ステップB7)、1フレームあたりのPCMデータにおけるカウントブロック数が“1”アップカウントされ(ステップB8)、このアップカウントされた次のブロックについて前記同様の電源電圧検知処理およびその検知電源電圧との電圧最小値比較書き換え処理が繰り返される(ステップB3〜B6)。
この後、ステップB7おいて、今回の抽出ブロックが10ブロック目であると判断されると、これにより、音声合成エンジン21により生成された合成音声におけるPCMデータ1フレームの出力に伴う検知電源電圧の最小値(電圧最小値)が取得されたことになり、この電圧最小値が前記図16における電源電圧に応じたATT値(減衰比)設定特性(12b3)に従いそのスレッシュ電圧レベルLevel1〜Level4と大小比較され、何れのスレッシュ電圧レベルの範囲であるか判断される(ステップB9〜B12)。
ここで、生成された合成音声の今回のPCMデータ1フレームの出力に伴う電圧最小値がATT値設定特性(12b3)(図16参照)で示される例えば最大(3V)の電圧レベルLevel1より高いと判断された場合には、ATT値=0(減衰なし)とされ(ステップB9→B13)、これと共に今回1フレーム分(10ブロック:1000sample)のPCMデータがRAM12c内のバッファメモリ(BUF1/BUF2)12c6にセットされる(ステップB17)。
また、生成された合成音声の今回のPCMデータ1フレームの出力に伴う電圧最小値がATT値設定特性(12b3)(図16参照)で示される電圧レベルLevel1以下でLevel2より高いと判断された場合にはATTv1(最小減衰比)(ステップB9→B10→B14)、Level2以下でLevel3より高いと判断された場合にはATTv2とされ(ステップB10→B11→B15)、これと共に今回1フレーム分(10ブロック:1000sample)のPCMデータがRAM12c内のバッファメモリ(BUF1/BUF2)12c6にセットされる(ステップB17)。
さらに、Level3以下でLevel4より高いと判断された場合には、ATTv3(最大減衰比)とされ(ステップB12→B16)、これと共に当該1フレーム分(10ブロック:1000sample)のPCMデータがRAM12c内のバッファメモリ(BUF1/BUF2)12c6にセットされる(ステップB17)。
すると、RAM12c内のバッファメモリ(BUF1/BUF2)12c6にセットされた1フレームのPCMデータに対するATT値がATT設定部23にセットされてデジタルアッテネータ24の減衰比が設定されると共に、当該1フレームのPCMデータが前記デジタルアッテネータ24へDMA転送され、この1フレームのPCMデータは現在の検出電源電圧値に対応付けられて設定されたATT値(減衰比)で減衰された後、DAC25によりアナログ音声信号に変換され、アンプ18aにより増幅されてスピーカ18から音声出力される。
この後、出力対象として指定されている前記テキストデータの合成音声生成出力処理が完了するまで前記ステップB1からのPCMデータ1フレーム毎の検出電源電圧値に応じたATT値演算設定処理、およびこの設定ATT値に従った対応1フレームのPCMデータの減衰処理が順次繰り返される(ステップB18→B1〜B17)。
これにより、合成音声として出力されるテキスト音声信号は、最小出力レベルで十分聞き易い音量となるよう増幅出力される一方で、電池電源Bの検出電圧が低下して急激な電池の消耗やパワーダウンなどが危惧される場合には、効果的にその出力レベルが減衰抑制されるので、継続動作の保護や電源保護が図られるようになる。
したがって、前記構成の携帯機器(電子辞書)10による第2実施形態の音声出力制御機能によれば、外部アンプ18aの増幅率を上昇させて最小音量の底上げを図る一方で、音声出力対象のテキストデータの合成音声を生成しPCMデータとして作成すると共に、このPCMデータの1フレーム(63ms)毎の音声出力に際して、電池電源Bの電圧を検出し、この検出電源電圧値の大小に応じたスレッシュ値Level1〜4に対応してそれぞれ異なるATT値(減衰比)を設定し、電源電圧の低下幅が大きいほど大きい減衰比により減衰させてその電池電源Bに対する負荷が軽くなるようにしたので、例えばテキスト音声の抑揚の強い部分での電源負荷の瞬時増大によるパワーダウンを招かずに聞き取りやすい音量で出力できるのは勿論、抑揚の弱い部分であっても、聞き取りやすい音量レベルまで増幅して出力できるようになる。
なお、前記第2実施形態の音声出力制御機能では、合成音声のPCMデータ1フレームの出力に際しての電源電圧最小値を検出し(ステップB4〜B6)、この検出電源電圧の最小値の電圧レベルに応じて異なるATT値を設定する(ステップB9〜B16)構成としたが、ATT値を設定する基準として前記電源電圧の最小値ではなく、PCMデータの1フレーム出力中における最低と最高の検知電源電圧の平均値を求め(ステップB4a)、これに応じて異なるATT値を設定する構成としてもよい。
また、PCMデータの1フレーム出力中における全体の検知電源電圧の平均値を求め(ステップB4b)、これに応じて異なるATT値を設定する構成としてもよい。
さらに、PCMデータの1フレーム出力中における最低と最高の検知電源電圧を除いた残りの全検知電源電圧の平均値を求め(ステップB4c)、これに応じて異なるATT値を設定する構成としてもよい。
なお、前記第2実施形態の音声出力制御機能では、図16で示したように、検知電源電圧に応じた1つのATT値設定特性(12b3)に記述された一連の電圧スレッシュレベルLevel1〜4に従ってPCMデータ1フレーム毎の出力に伴うATT値(減衰比)を設定する構成としたが、このような構成では、PCMデータ1フレーム毎の検知電源電圧値がある電圧スレッシュレベルLeveln付近を繰り返し前後した場合、その都度電圧スレッシュレベルLevelnの範囲が変わりATT値の設定値が小刻みに変化して音声出力が不安定になる。そこで次の図18(A)(B)に示すように、前記同様のATT値設定特性(12b3)に応じた第1の電源電圧値対応ATT値設定テーブル12b33とこの第1のテーブル12b33の一連の電圧スレッシュレベルLevel1〜4をそれぞれ幅ΔV1〜ΔV4で異ならせた第2の電源電圧値対応ATT値設定テーブル12b34とを用意し、今回のPCMデータ1フレームの出力に伴う検出電源電圧値が前回1フレーム出力に伴う検出電源電圧値より低下(下降時)したか以上(上昇時)であるかに応じてこの第1または第2の電源電圧値対応ATT値設定テーブル12b33,12b34を使い分けするヒステリシス処理Aを行うことで、検知電源電圧値の小さな上下動によってATT設定値が小刻みに変化するのを防止し、音声出力を安定化する構成としてもよい。
図18は、音声出力すべきPCMデータの出力に伴う電源電圧値に応じた減衰比(ATT値)をヒステリシス処理Aにより設定するための第1,第2の電源電圧値対応ATT値設定テーブル(12b33,12b34)を示す図である。
図19は、前記第1,第2の電源電圧値対応ATT値設定テーブル(12b33,12b34)を検出電源電圧値の変動方向に応じて選択使用するためのヒステリシス処理Aを示すフローチャートである。
この図19におけるヒステリシス処理Aは、前記図17における第2実施形態の音声出力制御処理のステップB1〜B8において今回のPCMデータ1フレームの出力に伴う最小の電源電圧値が検出された後段であって、且つその後のステップB9〜B17において当該最小電源電圧値に応じたATT値を設定する前段のステップBHにおいて実行される。
すなわち、ATT値演算部22にて抽出されたPCMデータの今回の1フレームの出力に際しての検出電源電圧値が前回の1フレームの出力に際しての検出電源電圧値よりも低下し電源負荷が大きくなっていると判断された場合には、図18(A)に示すような通常の電圧スレッシュレベル(Level1〜Level4)に従った第1の電源電圧値対応ATT値設定テーブル12b33が使用される(ステップBH11〜BH12)。
一方、ATT値演算部22にて抽出されたPCMデータの今回の1フレームの出力に際しての検出電源電圧値が前回の1フレームの出力に際しての検出電源電圧値以上であり電源負荷が軽くなっていると判断された場合には、図18(B)に示すような前記通常の電圧スレッシュレベル(Level1〜Level4)に対し各スレッシュレベルをそれぞれの幅ΔV1〜ΔV4で上げた電圧スレッシュレベル(Level1′(=Level+ΔV1)〜Level4′(=Level4+ΔV4))に従った第2の電源電圧値対応ATT値設定テーブル12b34が使用される(ステップBH11〜BH13)。
図20は、前記第1,第2の電源電圧値対応ATT値設定テーブル(12b33,12b34)を選択使用するヒステリシス処理Aを伴う音声出力制御処理での設定ATT値の変化状態を示す図である。
これによれば、例えば図20のタイミングT1で示すように、今回のPCMデータ1フレームの出力に伴う検出電源電圧値が前回の検出電源電圧値より下降し第1の電源電圧値対応ATT値設定テーブル12b33の電圧スレッシュレベルLevel3より低下することで設定ATT値が一旦ATT2からATT3に変化すると、その直後に検出電源電圧値が当該第1の電源電圧値対応ATT値設定テーブル12b33の電圧スレッシュレベルLevel3を若干上回ることがあっても、このような電源電圧値の上昇時には第2の電源電圧値対応ATT値設定テーブル12b34が使用されてその電圧スレッシュレベルLevel3′未満が保持されるので、設定ATT値がATT3のまま変化することはなく、検出電源電圧値のLevel3前後での若干の変動によって設定ATT値が小刻みに変化し音声出力が不安定になることはない。
また、例えば図20のタイミングT2で示すように、今回のPCMデータ1フレームの出力に伴う検出電源電圧値が前回の検出電源電圧値より上昇し第2の電源電圧値対応ATT値設定テーブル12b34の電圧スレッシュレベルLevel3′以上になることで設定ATT値が一旦ATT3からATT2に変化すると、その直後に検出電源電圧値が当該第2の電源電圧値対応ATT値設定テーブル12b34の電圧スレッシュレベルLevel3′を若干下回ることがあっても、このような電源電圧値の下降時には第1の電源電圧値対応ATT値設定テーブル12b33が使用されてその電圧スレッシュレベルLevel3以上が保持されるので、設定ATT値がATT2のまま変化することはなく、検出電源電圧値のLevel3′前後での若干の変動によって設定ATT値が小刻みに変化し音声出力が不安定になることはない。
なお、前記ヒステリシス処理Aでは、前記検出電源電圧値の変動方向に応じて第1,第2の電源電圧値対応ATT値設定テーブル(12b33,12b34)を選択使用することで各電圧スレッシュレベルLeveln(Leveln′)前後での設定ATT値の小刻みな変化を抑制し音声出力の安定化を図る構成としたが、次の図21に示すように、減衰量の大きい特性Xの電源電圧値対応ATT値設定テーブルと減衰量の小さい特性Yの電源電圧値対応ATT値設定テーブルとを用意し、今回のPCMデータ1フレームの出力に伴う検出電源電圧値が前回1フレームの出力に伴う検出電源電圧値未満(下降時)であるか以上(上昇時)であるかに応じてこの特性Xまたは特性YのATT値設定テーブルを使い分けするヒステリシス処理Bを行うことで、電源電圧が下降消耗傾向にあるときと上昇回復傾向にあるときとでより効果的に安定化したATT値を設定する構成としてもよい。
図21は、音声出力の際の電源電圧値に応じて2通りの減衰比(ATT値)をヒステリシス処理Bにより選択的に設定するための減衰比特性X,Yの変化状態を示す図である。
図22は、前記特性X,特性Yの電源電圧値対応ATT値設定テーブルを検出電源電圧値の変動方向に応じて選択使用するためのヒステリシス処理Bを示すフローチャートである。
この図22におけるヒステリシス処理Bは、前記図19におけるヒステリシス処理Aと同様に、図17における第2実施形態の音声出力制御処理のステップB1〜B8において今回のPCMデータ1フレームの出力に伴う最小の電源電圧値が検出された後段であって、且つその後のステップB9〜B17において当該最小電源電圧値に応じたATT値を設定する前段のステップBHにおいて実行される。
すなわち、ATT値演算部22にて抽出されたPCMデータの今回の1フレームの出力に伴う検出電源電圧値が前回の1フレームの出力に伴う検出電源電圧値未満であり電源電圧が低下したと判断された場合には、図21に示すような減衰量が大きい方の特性Xに従ったATT値設定テーブルが使用される(ステップBH21〜BH22)。
一方、ATT値演算部22にて抽出されたPCMデータの今回の1フレームの出力に伴う検出電源電圧値が前回の1フレームの出力に伴う検出電源電圧値以上であり電源電圧が上昇回復して電源負荷が軽くなったと判断された場合には、図21に示すような減衰量が小さい方の特性Yに従ったATT値設定テーブルが使用される(ステップBH21〜BH23)。
これによれば、今回の合成音声出力の際の検出電源電圧値が前回の合成音声出力の際の検出電源電圧値より低下することで減衰量の大きい特性XのATT値設定テーブルが選択使用され、また前回の検出電源電圧値以上に上昇することで減衰量の小さい特性XのATT値設定テーブルが選択使用されるので、電源電圧が低下傾向となり電池電源の消耗が著しいようなときには減衰量を多めにして電池寿命の低下の抑制やパワーダウン発生の恐れの解消を図ることができ、しかも電源電圧が回復上昇傾向となり電池電源に対する負荷が軽くなるようなときには減衰量を少なめにして十分な音量の維持を図ることができる。
なお、前記第2実施形態の音声出力制御機能でも、前記第1実施形態の音声出力制御機能と同様に、ATT値演算部22においてPCMデータ1フレーム毎のATT値が求められ、ATT設定部23によってデジタルアッテネータ24にセットされると、当該デジタルアッテネータ24にDMA転送された1フレームのPCMデータがそのATT値に応じた音量レベルに調整されるが、前記図17のフローチャートにおけるステップB17aおよび前記図15を参照して説明するように、ATT値演算部22から1フレームのPCMデータとそのときの検出電源電圧値に応じたATT値とをRAM12c内のバッファメモリ(BUF1/BUF2)12c6に転送する際に、前回フレームのPCMデータに対するATT値から今回フレームのPCMデータに対するATT値へ向けて当該PCMデータ自体の音量値を1段階ずつ増算または減算することで、前記デジタルアッテネータ24およびこのアッテネータ24に対するATT設定処理(23)を必要としない構成としてもよい。
これによれば、前記デジタルアッテネータ24およびこのアッテネータ24に対するATT設定処理(23)が必要なく、バッファメモリ(BUF1/BUF2)12c6にATT(アッテネート)処理されて転送された1フレームずつのPCMデータを直接DAC25に転送して音声出力することが可能になり、最大音量をパワーダウンなどを招かない限界増幅の範囲内で抑えつつ最小音量を底上げしてテキストデータの読み上げ合成音声をより聞き易く出力することができるばかりか、各PCMデータ1フレームの音声出力に伴うATT処理を1dBずつ連続的に増減変化させて行うことで、出力音声が不連続にならず自然なテキスト音声を出力することが可能になる。
前記第1実施形態の音声出力制御機能では、合成音声のPCMデータ1フレーム毎のPCMピーク値の大小に応じて該当1フレームのPCMデータに対するATT値(減衰比)を設定し、最大音量を例えば電池電源のパワーダウンを招かない限界増幅の範囲内で抑える一方で最小音量の底上げを図る構成とし、また前記第2実施形態の音声出力制御機能では、アンプ18aの増幅率を予め上昇させて最小音量の底上げを図っておくのと共に、電源電圧の低下具合に応じてPCMデータ1フレーム毎のATT値(減衰比)を設定することで、電池電源のパワーダウンを抑制すると共にその長寿命化を図る構成としたが、次の第3実施形態の音声出力制御機能にて説明するように、電源電圧の低下具合に応じて減衰特性の異なるATT値テーブルを選択し、この選択された減衰特性のATT値テーブルに基づいてPCMデータ1フレーム毎のPCMピーク値の大小に応じたATT値(減衰比)を設定することで、電池電源のパワーダウンを抑制、長寿命化を図りつつ最小音量を底上げし、1回の電池交換で長期間、聞き取り易い音量でテキスト音声出力を可能にする構成としてもよい。
(第3実施形態)
図23は、前記携帯機器(電子辞書)10による第3実施形態の音声出力制御機能での音声出力に対する電源電圧に応じて選択使用される4つのATT値(減衰比)設定特性A〜Dを示す図であり、同図(A)は電源電圧とATT値設定特性A〜Dとの関係を示す図、同図(B)は音声出力に対する減衰特性の異なる4つのATT値設定特性A〜Dを示す図である。
すなわち、この第3実施形態の音声出力制御機能では、テキストデータの読み上げ合成音声の生成出力に際して、電源回路19からCPU11に出力される電池電源Bの検出電圧VがLevel1より高いときには第1(最小)の減衰特性AのATT値設定テーブルが選択使用され、Level1≧V>Level2では第2の減衰特性BのATT値設定テーブルが選択使用され、Level2≧V>Level3では第3の減衰特性CのATT値設定テーブルが選択使用され、Level3≧V>Level4では第4(最大)の減衰特性DのATT値設定テーブルが選択使用され、Level4≧VではCPU11の最低動作電圧以下となるので音声出力動作自体が停止される。
そして、このように検出電源電圧Vに応じて選択されたそれぞれ減衰特性の異なるATT値設定テーブルに基づいて、音声入力信号のPCMピーク値PCM1〜PCM10に応じた減衰比(ATT値)ATT1〜ATT10が設定されるので、検出電源電圧Vが低下し且つPCMピーク値が高くなるほど、大きな減衰量が設定されて合成音声信号のPCMデータが減衰され、最小音量の底上げが図られる一方で、最大音量出力時のパワーダウンの抑制や電池電源Bの長寿命化が図られる。
図24は、前記携帯機器(電子辞書)10による第3実施形態の音声出力制御処理(その1)を示すフローチャートである。
図25は、前記携帯機器(電子辞書)10による第3実施形態の音声出力制御処理(その2)を示すフローチャートである。
この第3実施形態の音声出力制御処理では、まず図2における音声出力制御装置の初期設定が行われ、ATT値演算部22、ATT設定部23、RAM12c内のバッファメモリ(BUF1/BUF2)12c6などが“0”クリアされる(ステップC1)。
これと共に、PCMピーク値=0、検出電圧の最小値=3V(初期値:最大)、ブロック数=1にセットされ(ステップC2)、音声合成エンジン21にて生成される合成音声のテキスト音声データから1ブロック分(10分の1フレーム:100sample)のPCMデータがATT値演算部22に抽出される(ステップC3)(図4(C)参照)。
すると、電源回路19から出力される電池電源Bの電圧レベルVが検知されて図示しない検知電圧記録テーブルに記憶される(ステップC4)。
また、前記ステップC3にて今回抽出された1ブロック(100sample)分のPCMデータの平均値が計算され(ステップC5)、この計算された今回の1ブロックあたりのPCMデータの平均値が1フレーム中のPCMピーク値(初期=“0”)より大きいか否か判断される(ステップC6)。
ここで、前記計算された今回の1ブロックあたりのPCMデータの平均値が1フレーム中のこれまでのPCMピーク値より大きいと判断された場合には、当該今回ブロックのPCMデータの平均値がPCMピーク値として書き換えられる(ステップC7)。
一方、前記ステップC4にて検知電圧記録テーブルに記憶された今回の検知電源電圧がこれ以前の検知電圧最小値(初期=3V)より小さいか否か判断される(ステップC8)。
ここで、前記今回の検知電源電圧がこれ以前の検知電圧最小値(初期=3V)より小さいと判断された場合には、当該今回検知電源電圧が検知電圧最小値として書き換えられる(ステップC9)。
そして、現在抽出中のブロックが10ブロック目手前である、つまり、1フレームあたりの最終ブロックに到達しないと判断された場合には(ステップC10)、1フレームあたりのPCMデータにおけるカウントブロック数が“1”アップカウントされ(ステップC11)、このアップカウントされた次のブロックについて前記同様のPCMピーク値との大小比較書き換え処理、電源電圧検知処理およびその検知電源電圧Vとの電圧最小値比較書き換え処理が繰り返される(ステップC3〜C9)。
この後、ステップC10おいて、今回の抽出ブロックが10ブロック目であると判断されると、これにより、音声合成エンジン21にて生成された合成音声におけるPCMデータ1フレームの出力に伴う検知電源電圧Vの最小値(電圧最小値)が取得されたことになるのと共に、同PCMデータ1フレームにおけるPCMピーク値が取得されたことになる。
するとまず、検知電源電圧Vの最小値が前記図23における電源電圧に応じたATT値(減衰比)設定特性A〜Dを選択するための電圧スレッシュレベルLevel1〜Level4と大小比較され、何れの電圧スレッシュレベルの範囲であるか判断される(ステップC12〜C15)。
ここで、生成された合成音声の今回のPCMデータ1フレームの出力に伴う電源電圧最小値がATT値設定特性(図23(A)参照)で示される例えば最大(3V)の電圧レベルLevel1より高いと判断された場合には、図23(B)に示すような第1(最小)の減衰特性AのATT値設定テーブルが選択使用される(ステップC12→C16)。
また、生成された合成音声の今回のPCMデータ1フレームの出力に伴う電源電圧最小値がATT値設定特性(図23(A)参照)で示される電圧レベルLevel1以下でLevel2より高いと判断された場合には、図23(B)に示すような第2の減衰特性BのATT値設定テーブルが選択使用される(ステップC13→C17)。
また、Level2以下でLevel3より高いと判断された場合には、図23(B)に示すような第3の減衰特性CのATT値設定テーブルが選択使用される(ステップC14→C18)。
さらに、Level3以下でLevel4より高いと判断された場合には、図23(B)に示すような第4(最大)の減衰特性DのATT値設定テーブルが選択使用される(ステップC15→C19)。
こうして、PCMデータ1フレームの出力に伴う検出電源電圧値Vに応じた減衰特性A〜DのATT値設定テーブルが選択されると、次に当該PCMデータ1フレームにおけるPCMピーク値が前記選択された減衰特性A〜DのATT値設定テーブル(図23(B)参照)に従いそのスレッシュ値PCM1〜PCM10と大小比較され、何れのPCMスレッシュ値の範囲であるか判断される(ステップC20〜C23)。
ここで、生成された合成音声の今回のPCMデータ1フレームにおけるPCMピーク値がPCM1未満の小さな音声レベルであると判断された場合には、ATT値=0(減衰なし)とされ(ステップC20→C24)、これと共に当該1フレーム分(10ブロック:1000sample)のPCMデータがRAM12c内のバッファメモリ(BUF1/BUF2)12c6にセットされる(ステップC29)。
また、前記生成された合成音声の今回のPCMデータ1フレームにおけるPCMピーク値がPCM1以上でPCM2未満であると判断された場合には、前記検出電源電圧値Vに応じて選択された減衰特性A〜DのATT値設定テーブルで示されるATT値=1(最小減衰比)(ステップC20→C21→C25)、PCM2以上でPCM3未満であると判断された場合には、同選択された減衰特性A〜DのATT値設定テーブルで示されるATT値=2とされ(ステップC21→C22→C26)、これと共に当該1フレーム分(10ブロック:1000sample)のPCMデータがRAM12c内のバッファメモリ(BUF1/BUF2)12c6にセットされる(ステップC29)。
さらに、PCM10以上で大きな音声レベルであると判断された場合には、前記検出電源電圧値Vに応じて選択された減衰特性A〜DのATT値設定テーブルで示されるATT値=10(最大減衰比)とされ(ステップC23→C28)、これと共に当該1フレーム分(10ブロック:1000sample)のPCMデータがRAM12c内のバッファメモリ(BUF1/BUF2)12c6にセットされる(ステップC29)。
すると、RAM12c内のバッファメモリ(BUF1/BUF2)12c6にセットされた1フレームのPCMデータに際しての検出電源電圧値VおよびPCMピーク値に応じて決定されたATT値がATT設定部23にセットされてデジタルアッテネータ24の減衰比が設定されると共に、当該1フレームのPCMデータが前記デジタルアッテネータ24へDMA転送され、この1フレームのPCMデータはその検出電源電圧値VおよびPCMピーク値に応じて設定されたATT値(減衰比)で減衰された後、DAC25によりアナログ音声信号に変換され、アンプ18aにより増幅されてスピーカ18から音声出力される。
この後、出力対象として指定されている前記テキストデータの合成音声生成出力処理が完了するまで前記ステップC1からのPCMデータ1フレーム毎の検出電源電圧値VおよびPCMピーク値に応じたATT値演算設定処理、およびこの設定ATT値に従った対応1フレームのPCMデータの減衰処理が順次繰り返される(ステップC30→C1〜C29)。
これにより、合成音声として出力されるテキスト音声信号は、図6(C)で示したように、その最大出力レベルで限界増幅の範囲内に抑えられる一方で、最小出力レベルで前記最大出力レベルでの減衰比に対応した分だけ上昇された増幅率で増幅されて十分聞き易い音量として出力されるようになる。
しかも、合成音声として出力されるテキスト音声信号は、最小出力レベルで十分聞き易い音量となるよう増幅出力される一方で、電池電源Bの検出電圧Vが低下して急激な電池の消耗やパワーダウンなどが危惧される場合には、効果的にその出力レベルが減衰抑制されるので、継続動作の保護や電源保護が図られるようになる。
したがって、前記構成の携帯機器(電子辞書)10による第3実施形態の音声出力制御機能によれば、音声出力対象のテキストデータの合成音声を生成しPCMデータとして作成すると共に、このPCMデータの1フレーム(63ms)毎のピーク値を計算し、このPCMピーク値の大小に応じたスレッシュ値PCM1〜10に対応してそれぞれ異なるATT値(減衰比)を設定し、PCMピーク値が高いほど大きい減衰比により減衰させてその出力レベルが限界増幅の範囲にあわせて収まるようにし、その分、最小の出力レベルを上昇させて音声出力した。またそれだけでなく、このPCMデータの1フレーム(63ms)毎の音声出力に際して、電池電源Bの電圧を検出し、この検出電源電圧値Vの大小に応じた減衰特性A〜DのATT値設定テーブルを選択して前記PCMピーク値に応じたATT値(減衰比)を設定し、電源電圧の低下幅が大きいほど大きい減衰比により減衰させてその電池電源Bに対する負荷が軽くなるようにした。このため、電池電源Bの長寿命化を図った上で、テキスト音声の抑揚の強い部分が歪まずにまた電源負荷の瞬時増大によるパワーダウンを招かずに十分大きな音量で聞き取りやすく音声出力できるのは勿論、抑揚の弱い部分であっても、聞き取りやすい音量レベルまで増幅して出力できるようになる。
なお、前記第3実施形態の音声出力制御機能でも、前記第1実施形態や第2実施形態の音声出力制御機能と同様に、ATT値演算部22においてPCMデータ1フレーム毎のATT値が求められ、ATT設定部23によってデジタルアッテネータ24にセットされると、当該デジタルアッテネータ24にDMA転送された1フレームのPCMデータがそのATT値に応じた音量レベルに調整されるが、前記図25のフローチャートにおけるステップC29aおよび前記図15を参照して説明するように、ATT値演算部22から1フレームのPCMデータとそのときの検出電源電圧値VおよびPCMピーク値に応じて設定されたATT値とをRAM12c内のバッファメモリ(BUF1/BUF2)12c6に転送する際に、前回フレームのPCMデータに対する設定ATT値から今回フレームのPCMデータに対する設定ATT値へ向けて当該PCMデータ自体の音量値を1段階ずつ増算または減算することで、前記デジタルアッテネータ24およびこのアッテネータ24に対するATT設定処理(23)を必要としない構成としてもよい。
これによれば、前記デジタルアッテネータ24およびこのアッテネータ24に対するATT設定処理(23)が必要なく、バッファメモリ(BUF1/BUF2)12c6にATT(アッテネート)処理されて転送された1フレームずつのPCMデータを直接DAC25に転送して音声出力することが可能になり、最大音量をパワーダウンなどを招かない限界増幅の範囲内で抑えつつ最小音量を底上げしてテキストデータの読み上げ合成音声をより聞き易く出力することができるばかりか、各PCMデータ1フレームの音声出力に伴うATT処理を1dBずつ連続的に増減変化させて行うことで、出力音声が不連続にならず自然なテキスト音声を出力することが可能になる。
また、前記第3実施形態の音声出力制御機能において、検知電源電圧値Vに応じた減衰特性A〜DのATT設定テーブルを選択する場合には、前記第2実施形態の音声出力制御機能におけるヒステリシス処理A(図18〜図20参照)で説明したのと同様に、今回の検知電源電圧値が前回の検知電源電圧値より低下したか否かに応じて当該減衰特性A〜DのATT設定テーブルを選択するための電圧スレッシュレベルを通常の電圧スレッシュレベルLevel1〜Level4とこれよれも一定電圧ΔV上げた電圧スレッシュレベルLevel1′(=Level1+ΔV1)〜Level4′(=Level4+ΔV4)とで切り替える構成としたり、同第2実施形態の音声出力制御機能におけるヒステリシス処理B(図21,図22参照)で説明したのと同様に、今回の検知電源電圧値が前回の検知電源電圧値より低下したか否かに応じて選択対象とする減衰特性A〜DのATT設定テーブルをそれぞれその減衰量が大きい方の減衰特性A(X)〜D(X)のATT設定テーブルと減衰量が小さい方の減衰特性A(Y)〜D(Y)のATT設定テーブルとで切り替える構成としたりし、それと同様の効果を得てもよい。
また、前記第3実施形態の音声出力制御機能において、前記検知電源電圧値に応じて選択された減衰特性A〜DのATT設定テーブルに従いPCMピーク値に応じたATT値を設定する場合には、前記第1実施形態の音声出力制御機能におけるヒステリシス処理A(図10〜図12参照)で説明したのと同様に、今回のPCMピーク値が前回のPCMピーク値以上であるか否かに応じて当該ATT値を設定するためのPCMスレッシュ値を通常のPCMスレッシュ値PCM1〜PCM10とこれよれも一定音量ΔP下げたPCMスレッシュ値PCM1′(=PCM1−ΔP1)〜PCM10′(=PCM10−ΔP10)とで切り替える構成としたり、同第1実施形態の音声出力制御機能におけるヒステリシス処理B(図13,図14参照)で説明したのと同様に、今回のPCMピーク値が前回のPCMピーク値以上であるか否かに応じて使用対象とする減衰特性A〜Dの各ATT設定テーブルをそれぞれその減衰量が大きい特性XのATT設定テーブルと減衰量が小さい特性YのATT設定テーブルとで切り替える構成としたりし、それと同様の効果を得てもよい。
なお、前記各実施形態において記載した携帯機器(電子辞書)10による各処理の手法、すなわち、図7のフローチャートに示す辞書検索音声出力処理、図9のフローチャートに示す合成音声出力処理に伴う第1実施形態の音声出力制御処理、図11のフローチャートに示す前記第1実施形態の音声出力制御処理に伴うヒステリシス処理A、図14のフローチャートに示す前記第1実施形態の音声出力制御処理に伴うヒステリシス処理B、図17のフローチャートに示す合成音声出力処理に伴う第2実施形態の音声出力制御処理、図19のフローチャートに示す前記第2実施形態の音声出力制御処理に伴うヒステリシス処理A、図22のフローチャートに示す前記第2実施形態の音声出力制御処理に伴うヒステリシス処理B、図24・図25のフローチャートに示す合成音声出力処理に伴う第3実施形態の音声出力制御処理等の各手法は、何れもコンピュータに実行させることができるプログラムとして、メモリカード(ROMカード、RAMカード等)13、磁気ディスク(フロッピディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の外部記憶媒体に格納して配布することができる。そして、辞書などテキストデータのデータベース(12b)を有する種々のコンピュータ端末は、この外部記憶媒体(13)に記憶されたプログラムをプログラムROM12aに読み込み、この読み込んだプログラムによって動作が制御されることにより、前記各実施形態において説明した辞書検索機能や音声出力制御機能を実現し、前述した手法による同様の処理を実行することができる。
また、前記各手法を実現するためのプログラムのデータは、プログラムコードの形態として通信ネットワーク(インターネット)N上を伝送させることができ、この通信ネットワーク(インターネット)Nに接続されたコンピュータ端末(プログラムサーバ)から前記のプログラムデータを取り込み、前述した辞書検索機能や音声出力制御機能を実現することもできる。
なお、本願発明は、前記各実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。さらに、前記各実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。例えば、各実施形態に示される全構成要件から幾つかの構成要件が削除されたり、幾つかの構成要件が組み合わされても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除されたり組み合わされた構成が発明として抽出され得るものである。
本発明の実施形態に係る音声出力制御装置を搭載した携帯機器(電子辞書)10の電子回路の構成を示すブロック図。 前記携帯機器(電子辞書)10の電子回路に搭載された音声出力制御装置の主要部の構成を示すブロック図。 前記携帯機器(電子辞書)10のプログラムROM12a、データベースROM12b、RAM12cに記憶されるデータの内容を示す図。 音声出力すべきテキスト音声信号の1フレーム毎にピーク値を求める際の信号抽出手順を説明するための図であり、同図(A)は出力対象のテキスト音声信号を示す波形図、同図(B)はこのテキスト音声信号に対する1フレームのサンプル状態を示す波形図、同図(C)はこの1フレームを10分割して拡大した状態を示す波形図。 音声出力すべきPCMデータのピーク値に応じた減衰比(ATT値)を設定するためのATT値設定テーブル(12b3)を示す図。 前記携帯機器(電子辞書)10が搭載した第1実施形態の音声出力制御装置における作用・効果を説明するための図であり、同図(A)は音声信号入力を単に直線増幅して限界増幅値の範囲内で出力する場合の従来の入出力特性を示す図、同図(B)は音声入力信号のPCMピーク値に応じた減衰比(ATT値)を設定して出力する場合の入出力特性を示す図、同図(C)は同PCMピーク値に応じた減衰比(ATT値)を設定することで限界増幅値の範囲一杯まで増幅率を上昇させて最低音量出力レベルの底上げを図った本実施形態の入出力特性を示す図、同図(D)(E)は従来の入出力特性に従ったテキスト音声データの出力信号波形と本実施形態の入出力特性に従ったテキスト音声データの出力信号波形とを対比して示す図。 前記携帯機器(電子辞書)10による辞書検索音声出力処理を示すフローチャート。 前記携帯機器(電子辞書)10の辞書検索音声出力処理に伴う検索情報表示画面G1の表示動作および音声発声動作を示す図。 前記携帯機器(電子辞書)10による第1実施形態の音声出力制御処理を示すフローチャート。 音声出力すべきPCMデータのピーク値に応じた減衰比(ATT値)をヒステリシス処理Aにより設定するための第1,第2のATT値設定テーブル(12b31,12b32)を示す図。 前記第1,第2のATT値設定テーブル(12b31,12b32)をPCMピーク値の変動方向に応じて選択使用するためのヒステリシス処理Aを示すフローチャート。 前記第1,第2のATT値設定テーブル(12b31,12b32)を選択使用するヒステリシス処理Aを伴う音声出力制御処理での設定ATT値の変化状態を示す図。 音声出力すべきPCMデータのピーク値に応じて2通りの減衰比(ATT値)をヒステリシス処理Bにより選択的に設定するための減衰比特性X,Yの変化状態を示す図。 前記特性X,特性YのATT値設定テーブルをPCMピーク値の変動方向に応じて選択使用するためのヒステリシス処理Bを示すフローチャート。 前記携帯機器(電子辞書)10による第1実施形態の音声出力制御処理に伴う合成音声のPCMデータに対するATT(アッテネート)処理を示す図。 前記携帯機器(電子辞書)10による第2実施形態の音声出力制御機能での音声出力に対する電源電圧に応じたATT値(減衰比)の設定特性を示す図。 前記携帯機器(電子辞書)10による第2実施形態の音声出力制御処理を示すフローチャート。 音声出力すべきPCMデータの出力に伴う電源電圧値に応じた減衰比(ATT値)をヒステリシス処理Aにより設定するための第1,第2の電源電圧値対応ATT値設定テーブル(12b33,12b34)を示す図。 前記第1,第2の電源電圧値対応ATT値設定テーブル(12b33,12b34)を検出電源電圧値の変動方向に応じて選択使用するためのヒステリシス処理Aを示すフローチャート。 前記第1,第2の電源電圧値対応ATT値設定テーブル(12b33,12b34)を選択使用するヒステリシス処理Aを伴う音声出力制御処理での設定ATT値の変化状態を示す図。 音声出力の際の電源電圧値に応じて2通りの減衰比(ATT値)をヒステリシス処理Bにより選択的に設定するための減衰比特性X,Yの変化状態を示す図。 前記特性X,特性Yの電源電圧値対応ATT値設定テーブルを検出電源電圧値の変動方向に応じて選択使用するためのヒステリシス処理Bを示すフローチャート。 前記携帯機器(電子辞書)10による第3実施形態の音声出力制御機能での音声出力に対する電源電圧に応じて選択使用される4つのATT値(減衰比)設定特性A〜Dを示す図であり、同図(A)は電源電圧とATT値設定特性A〜Dとの関係を示す図、同図(B)は音声出力に対する減衰特性の異なる4つのATT値設定特性A〜Dを示す図。 前記携帯機器(電子辞書)10による第3実施形態の音声出力制御処理(その1)を示すフローチャート。 前記携帯機器(電子辞書)10による第3実施形態の音声出力制御処理(その2)を示すフローチャート。
符号の説明
10 …携帯機器(電子辞書)
11 …CPU
12a…プログラムROM
12a1…辞書検索処理プログラム
12a2…合成音声出力処理プログラム
12a3…音声合成処理プログラム
12a4…音声出力制御処理プログラム
12b…データベースROM
12b1…辞書データ
12b2…音声データ
12b3…ATT値設定(テーブル)データ
12c…RAM
12c1…入力文字メモリ
12c2…検索見出語メモリ
12c3…見出語情報指定位置メモリ
12c4…PCM計算値メモリ
12c5…電源電圧メモリ
12c6…バッファメモリ(BUF1/BUF2)
13 …メモリカード
14 …キーボード(Key)
15 …タッチパネル
16 …入力部
16a…「音声」キー
16b…「決定」(実行)キー
16c…「↓」カーソルキー
17 …表示部(LCD)
18 …スピーカ
18a…アンプ(Amp)
19 …電源回路
20 …ソフト処理部
21 …音声合成エンジン
22 …ATT値演算部
23 …ATT設定部
24 …デジタルアッテネータ
25 …DAC(Digital/Analog Converter)
26 …DMAコントローラ/BUSコントローラ
B …電池電源
G1…検索情報表示画面
H …反転指示表示

Claims (15)

  1. 一連の音声データを出力する制御を行う音声出力制御装置であって、
    音声を出力する音声出力手段と、
    この音声出力手段により音声を出力させるための電源電圧を供給する電源手段と、
    一連の音声データの1出力単位の音声データを取得する音声データ取得手段と、
    この音声データ取得手段により取得された1出力単位の音声データの出力に伴い前記電源手段により供給される電源電圧を検出する電圧検出手段と、
    この電圧検出手段により検出された電源電圧に応じて、前記音声データ取得手段により取得された1出力単位の音声データの音量レベルを調整する音量レベル調整手段と、
    この音量レベル調整手段により音量レベルの調整された音声データを前記音声出力手段により出力させる音声出力制御手段と、
    を備えたことを特徴とする音声出力制御装置。
  2. 前記音量レベル調整手段は、
    前記電圧検出手段により検出された電源電圧が低いほど大きな音量減衰値を設定する減衰値設定手段を有し、
    この減衰値設定手段により設定された音量減衰値に従って前記音声データ取得手段により取得された1出力単位の音声データの音量レベルを減衰して調整する、
    ことを特徴とする請求項1に記載の音声出力制御装置。
  3. 前記電圧検出手段は、前記音声データ取得手段により取得された1出力単位の音声データの出力に伴い当該1出力単位の音声データの出力期間において前記電源手段により供給される最低の電源電圧を検出することを特徴とする請求項1または請求項2に記載の音声出力制御装置。
  4. 前記電圧検出手段は、前記音声データ取得手段により取得された1出力単位の音声データの出力に伴い当該1出力単位の音声データの出力期間において前記電源手段により供給される最低と最高の平均の電源電圧を検出することを特徴とする請求項1または請求項2に記載の音声出力制御装置。
  5. 前記電圧検出手段は、前記音声データ取得手段により取得された1出力単位の音声データの出力に伴い当該1出力単位の音声データの出力期間において前記電源手段により供給される最低と最高の電源電圧を除いた平均の電源電圧を検出することを特徴とする請求項1または請求項2に記載の音声出力制御装置。
  6. 前記電圧検出手段は、前記音声データ取得手段により取得された1出力単位の音声データの出力に伴い当該1出力単位の音声データの出力期間において前記電源手段により供給される平均の電源電圧を検出することを特徴とする請求項1または請求項2に記載の音声出力制御装置。
  7. さらに、
    前記音声データ取得手段により取得された1出力単位の音声データの最大の音量レベルを取得する音量レベル取得手段を備え、
    前記音量レベル調整手段は、
    前記電圧検出手段により検出された電源電圧と前記音量レベル取得手段により取得された最大の音量レベルに応じて、前記音声データ取得手段により取得された1出力単位の音声データの音量レベルを調整する、
    ことを特徴とする請求項1に記載の音声出力制御装置。
  8. 前記音量レベル調整手段は、
    前記電圧検出手段により検出された電源電圧に応じて異なる音量減衰特性を選択する減衰特性選択手段と、
    この減衰特性選択手段により選択された音量減衰特性に従って前記音量レベル取得手段により取得された最大の音量レベルに応じた音量減衰値を設定する減衰値設定手段とを有し、
    この減衰値設定手段により設定された音量減衰値に従って前記音声データ取得手段により取得された1出力単位の音声データの音量レベルを減衰して調整する、
    ことを特徴とする請求項7に記載の音声出力制御装置。
  9. 前記音量レベル調整手段は、さらに、
    前記音声データ取得手段により取得された1出力単位の音声データと前記減衰値設定手段により設定された音量減衰値とを対応付けて記憶する出力音声データ記憶手段を有し、
    この出力音声データ記憶手段により記憶された1出力単位の音声データが読み出された際に当該音声データの音量レベルを前記対応付けて記憶された音量減衰値に従って減衰して調整する、
    ことを特徴とする請求項2または請求項7に記載の音声出力制御装置。
  10. さらに、
    テキストデータを記憶するテキスト記憶手段と、
    このテキスト記憶手段により記憶されたテキストデータに対応した音声データを音声合成して生成する音声合成手段とを備え、
    前記音声データ取得手段は、前記音声合成手段により生成された一連の音声データから1出力単位の音声データを取得する、
    ことを特徴とする請求項1ないし請求項9の何れか1項に記載の音声出力制御装置。
  11. さらに、
    前記電圧検出手段により前回の1出力単位の音声データの出力に伴い検出された電源電圧と今回の1出力単位の音声データの出力に伴い検出された電源電圧とを比較する検出電圧比較手段を備え、
    前記減衰値設定手段は、前記検出電圧比較手段により比較された前回の検出電源電圧より今回の検出電源電圧が低い場合と高い場合とで異なる大きさの音量減衰値を設定する、
    ことを特徴とする請求項2に記載の音声出力制御装置。
  12. さらに、
    前記音量レベル取得手段により取得された前回の1出力単位の音声データの最大の音量レベルと今回の1出力単位の音声データの最大の音量レベルとを比較する音量レベル比較手段を備え、
    前記減衰値設定手段は、前記音量レベル比較手段により比較された前回の最大音量レベルより今回の最大音量レベルが大きい場合と小さい場合とで異なる大きさの音量減衰値を設定する、
    ことを特徴とする請求項8に記載の音声出力制御装置。
  13. さらに、
    前記電圧検出手段により前回の1出力単位の音声データの出力に伴い検出された電源電圧と今回の1出力単位の音声データの出力に伴い検出された電源電圧とを比較する検出電圧比較手段を備え、
    前記減衰特性選択手段は、前記検出電圧比較手段により比較された前回の検出電源電圧より今回の検出電源電圧が低い場合と高い場合とで全体の減衰量が異なる音量減衰特性を選択する、
    ことを特徴とする請求項8または請求項12に記載の音声出力制御装置。
  14. 音声出力部とこの音声出力部に電源電圧を供給する電源部とを有する電子機器のコンピュータを制御して一連の音声データを出力する制御を行うための音声出力制御プログラムであって、
    前記コンピュータを、
    一連の音声データの1出力単位の音声データを取得する音声データ取得手段、
    この音声データ取得手段により取得された1出力単位の音声データの出力に伴い前記電源部により供給される電源電圧を検出する電圧検出手段、
    この電圧検出手段により検出された電源電圧に応じて、前記音声データ取得手段により取得された1出力単位の音声データの音量レベルを調整する音量レベル調整手段、
    この音量レベル調整手段により音量レベルの調整された音声データを前記音声出力部により出力させる音声出力制御手段、
    として機能させるようにしたコンピュータ読み込み可能な音声出力制御プログラム。
  15. 前記コンピュータを、さらに、
    前記音声データ取得手段により取得された1出力単位の音声データの最大の音量レベルを取得する音量レベル取得手段として機能させようにし、
    前記音量レベル調整手段は、前記電圧検出手段により検出された電源電圧と前記音量レベル取得手段により取得された最大の音量レベルに応じて、前記音声データ取得手段により取得された1出力単位の音声データの音量レベルを調整するように機能する、
    ことを特徴とする請求項14に記載の音声出力制御プログラム。
JP2005133572A 2005-04-28 2005-04-28 音声出力制御装置および音声出力制御プログラム Expired - Fee Related JP4876434B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2005133572A JP4876434B2 (ja) 2005-04-28 2005-04-28 音声出力制御装置および音声出力制御プログラム
CN200680007254XA CN101138152B (zh) 2005-04-28 2006-04-25 语音输出控制设备以及方法
US11/410,759 US7720215B2 (en) 2005-04-28 2006-04-25 Speech output control device and recording medium recorded with speech output control programs
PCT/JP2006/309126 WO2006118292A1 (en) 2005-04-28 2006-04-25 Speech output control device and recording medium recorded with speech output control programs
TW095115010A TWI335726B (en) 2005-04-28 2006-04-27 Speech output control device and recording medium recorded with speech output control programs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005133572A JP4876434B2 (ja) 2005-04-28 2005-04-28 音声出力制御装置および音声出力制御プログラム

Publications (2)

Publication Number Publication Date
JP2006311382A true JP2006311382A (ja) 2006-11-09
JP4876434B2 JP4876434B2 (ja) 2012-02-15

Family

ID=36649829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005133572A Expired - Fee Related JP4876434B2 (ja) 2005-04-28 2005-04-28 音声出力制御装置および音声出力制御プログラム

Country Status (5)

Country Link
US (1) US7720215B2 (ja)
JP (1) JP4876434B2 (ja)
CN (1) CN101138152B (ja)
TW (1) TWI335726B (ja)
WO (1) WO2006118292A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009141670A (ja) * 2007-12-06 2009-06-25 Yamaha Corp 電子機器および音声再生装置
JP2010047205A (ja) * 2008-08-25 2010-03-04 Nippon Seiki Co Ltd 車両用報知装置
JP2010219781A (ja) * 2009-03-16 2010-09-30 Tamura Seisakusho Co Ltd ヘッドアンプとその制御方法
JP2011155437A (ja) * 2010-01-27 2011-08-11 Victor Co Of Japan Ltd 音声処理装置および音声処理方法
JP2011240901A (ja) * 2010-05-21 2011-12-01 Mazda Motor Corp 車両の電装部品制御装置
JP2012007943A (ja) * 2010-06-23 2012-01-12 Shimadzu Corp フーリエ変換赤外分光光度計
JP2012151687A (ja) * 2011-01-19 2012-08-09 Yamaha Corp ダイナミックレンジ圧縮回路
JP2014509470A (ja) * 2011-01-10 2014-04-17 クゥアルコム・インコーポレイテッド バッテリー電力の監視および音声信号の減衰

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4222321B2 (ja) * 2005-01-27 2009-02-12 ヤマハ株式会社 携帯型再生装置およびプログラム
US8165879B2 (en) * 2007-01-11 2012-04-24 Casio Computer Co., Ltd. Voice output device and voice output program
US20090235162A1 (en) * 2008-03-11 2009-09-17 Disney Enterprises, Inc. Method and system for providing enhanced virtual books
KR101581950B1 (ko) * 2009-01-12 2015-12-31 삼성전자주식회사 이동 단말에서 수화 음성 신호 처리 장치 및 방법
JP5842452B2 (ja) * 2011-08-10 2016-01-13 カシオ計算機株式会社 音声学習装置及び音声学習プログラム
EP2568601A1 (en) * 2011-09-09 2013-03-13 ST-Ericsson SA AGC with double slope
JP6535998B2 (ja) * 2014-09-16 2019-07-03 カシオ計算機株式会社 音声学習装置および制御プログラム
US10637419B2 (en) 2015-08-28 2020-04-28 Motorola Solutions, Inc. Attenuator circuit for an electronic device having a battery and method for controlling the electronic device
CN105827210A (zh) * 2015-08-31 2016-08-03 维沃移动通信有限公司 一种电压调节方法及终端
US10285081B1 (en) 2018-07-30 2019-05-07 Motorola Solutions, Inc. Method and apparatus for rapidly and dynamically adjusting current limiting in a portable communication device
US10263415B1 (en) 2018-07-30 2019-04-16 Motorola Solutions, Inc. Method and apparatus for rapidly and dynamically adjusting current limiting in a portable communication device
US10816603B1 (en) 2019-04-15 2020-10-27 Motorola Solutions, Inc. Determining available battery current in a portable electronic device
US10901479B1 (en) 2019-04-23 2021-01-26 Motorola Solutions, Inc. Method and apparatus for managing power-up of a portable communication device
CN110475182A (zh) * 2019-08-21 2019-11-19 四川长虹电器股份有限公司 伴音供电动态变化的声音系统及伴音输出调节方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01186042A (ja) * 1988-01-21 1989-07-25 Oki Electric Ind Co Ltd 音声メール装置
JPH02270412A (ja) * 1989-04-12 1990-11-05 Rohm Co Ltd 増幅回路
JPH0422204A (ja) * 1990-05-17 1992-01-27 Fujitsu Ten Ltd オーディオ回路
JPH04218871A (ja) * 1990-05-17 1992-08-10 Seiko Epson Corp 発音機能を備えた電子翻訳器
JPH04365210A (ja) * 1991-06-13 1992-12-17 Matsushita Electric Ind Co Ltd 車載音響再生装置
JPH08195634A (ja) * 1995-01-13 1996-07-30 Sanyo Electric Co Ltd 電力増幅装置
JP2004214843A (ja) * 2002-12-27 2004-07-29 Alpine Electronics Inc デジタルアンプ及びそのゲイン調整方法
JP2005072983A (ja) * 2003-08-25 2005-03-17 Matsushita Electric Ind Co Ltd 音声信号増幅装置及び音響装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2946856C2 (de) * 1978-12-27 1985-04-25 Sharp K.K., Osaka Wortspeichergerät
US5467393A (en) 1993-11-24 1995-11-14 Ericsson Inc. Method and apparatus for volume and intelligibility control for a loudspeaker
US5651056A (en) * 1995-07-13 1997-07-22 Eting; Leon Apparatus and methods for conveying telephone numbers and other information via communication devices
JP3279267B2 (ja) 1998-09-18 2002-04-30 日本電気株式会社 音声出力調整方法およびその装置
US7120803B2 (en) * 2000-04-03 2006-10-10 Yamaha Corporation Portable appliance for reproducing a musical composition, power saving method, and storage medium therefor
JP2002151974A (ja) 2000-11-14 2002-05-24 Ari:Kk パルス幅変調アンプ
JP2004152648A (ja) 2002-10-31 2004-05-27 Victor Co Of Japan Ltd 電池残量通知装置
US7110559B2 (en) * 2003-11-06 2006-09-19 Motorola, Inc. System and method for controlling audio output

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01186042A (ja) * 1988-01-21 1989-07-25 Oki Electric Ind Co Ltd 音声メール装置
JPH02270412A (ja) * 1989-04-12 1990-11-05 Rohm Co Ltd 増幅回路
JPH0422204A (ja) * 1990-05-17 1992-01-27 Fujitsu Ten Ltd オーディオ回路
JPH04218871A (ja) * 1990-05-17 1992-08-10 Seiko Epson Corp 発音機能を備えた電子翻訳器
JPH04365210A (ja) * 1991-06-13 1992-12-17 Matsushita Electric Ind Co Ltd 車載音響再生装置
JPH08195634A (ja) * 1995-01-13 1996-07-30 Sanyo Electric Co Ltd 電力増幅装置
JP2004214843A (ja) * 2002-12-27 2004-07-29 Alpine Electronics Inc デジタルアンプ及びそのゲイン調整方法
JP2005072983A (ja) * 2003-08-25 2005-03-17 Matsushita Electric Ind Co Ltd 音声信号増幅装置及び音響装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009141670A (ja) * 2007-12-06 2009-06-25 Yamaha Corp 電子機器および音声再生装置
JP2010047205A (ja) * 2008-08-25 2010-03-04 Nippon Seiki Co Ltd 車両用報知装置
JP2010219781A (ja) * 2009-03-16 2010-09-30 Tamura Seisakusho Co Ltd ヘッドアンプとその制御方法
JP2011155437A (ja) * 2010-01-27 2011-08-11 Victor Co Of Japan Ltd 音声処理装置および音声処理方法
JP2011240901A (ja) * 2010-05-21 2011-12-01 Mazda Motor Corp 車両の電装部品制御装置
JP2012007943A (ja) * 2010-06-23 2012-01-12 Shimadzu Corp フーリエ変換赤外分光光度計
JP2014509470A (ja) * 2011-01-10 2014-04-17 クゥアルコム・インコーポレイテッド バッテリー電力の監視および音声信号の減衰
US9119159B2 (en) 2011-01-10 2015-08-25 Qualcomm Incorporated Battery power monitoring and audio signal attenuation
JP2015233308A (ja) * 2011-01-10 2015-12-24 クゥアルコム・インコーポレイテッドQualcomm Incorporated バッテリー電力の監視および音声信号の減衰
JP2012151687A (ja) * 2011-01-19 2012-08-09 Yamaha Corp ダイナミックレンジ圧縮回路
US8902013B2 (en) 2011-01-19 2014-12-02 Yamaha Corporation Dynamic range compression circuit and class D amplifier

Also Published As

Publication number Publication date
CN101138152A (zh) 2008-03-05
TW200705803A (en) 2007-02-01
JP4876434B2 (ja) 2012-02-15
TWI335726B (en) 2011-01-01
US20060247920A1 (en) 2006-11-02
US7720215B2 (en) 2010-05-18
CN101138152B (zh) 2011-07-27
WO2006118292A1 (en) 2006-11-09

Similar Documents

Publication Publication Date Title
JP4876434B2 (ja) 音声出力制御装置および音声出力制御プログラム
US8654993B2 (en) Portable audio device providing automated control of audio volume parameters for hearing protection
KR101005949B1 (ko) 음성 읽어내기를 위한 장치, 기록 매체 및 방법
US10249321B2 (en) Sound rate modification
US20120106750A1 (en) Audio driver system and method
US7742920B2 (en) Variable voice rate apparatus and variable voice rate method
KR101019851B1 (ko) 음성 읽어내기를 위한 장치, 기록 매체 및 방법
CN113724686B (zh) 编辑音频的方法、装置、电子设备及存储介质
CN105825869B (zh) 语音处理装置和语音处理方法
JP6098149B2 (ja) 音声処理装置、音声処理方法および音声処理プログラム
US8983092B2 (en) Waveform shaping system to prevent electrical and mechanical saturation in loud speakers
JP2010068292A (ja) 音声出力装置、プロジェクタ、プログラムおよび情報記憶媒体
JP5717574B2 (ja) 携帯電子機器
JP2007219241A (ja) 音声処理装置、音声処理プログラム
JP7194559B2 (ja) プログラム、情報処理方法、及び情報処理装置
JP2011075622A (ja) 音響モデル適応装置、その方法、プログラム、及び記録媒体
JP5293478B2 (ja) 音声認識用の閾値管理プログラム、音声認識用の閾値管理方法、音声認識装置
JP2007271910A (ja) 合成音声生成装置
US8204257B2 (en) System and method for increasing ring tone volume
JP4841339B2 (ja) 韻律補正装置、音声合成装置、韻律補正方法、音声合成方法、韻律補正プログラム、および、音声合成プログラム
JP2015179198A (ja) 読み上げ装置、読み上げ方法及びプログラム
JP2004302285A (ja) 情報出力装置、情報出力プログラム
JP2007256815A (ja) 音声再生装置、音声再生方法、音声再生プログラム
US20120068918A1 (en) Method and apparatus for electronic reader operation
KR20080016183A (ko) 문자 크기 조절 가능한 오디오 플레이어 및 그 제어 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110411

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111101

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111114

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4876434

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141209

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees