JP2000276186A - 音声処理装置、音声処理方法、および該方法を記録した記録媒体 - Google Patents

音声処理装置、音声処理方法、および該方法を記録した記録媒体

Info

Publication number
JP2000276186A
JP2000276186A JP7986999A JP7986999A JP2000276186A JP 2000276186 A JP2000276186 A JP 2000276186A JP 7986999 A JP7986999 A JP 7986999A JP 7986999 A JP7986999 A JP 7986999A JP 2000276186 A JP2000276186 A JP 2000276186A
Authority
JP
Japan
Prior art keywords
tone
voice
tone level
audio
voices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7986999A
Other languages
English (en)
Inventor
Tomonori Shigeoka
朋憲 重岡
Keisuke Yasui
圭介 安井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information Systems Ltd
Original Assignee
Hitachi Information Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information Systems Ltd filed Critical Hitachi Information Systems Ltd
Priority to JP7986999A priority Critical patent/JP2000276186A/ja
Publication of JP2000276186A publication Critical patent/JP2000276186A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Control Of Amplification And Gain Control (AREA)

Abstract

(57)【要約】 【課題】 簡単な方法で違和感のない1つのナレーショ
ンを生成することを可能とした音声処理装置、音声処理
方法、および該音声処理方法を記録した記録媒体を提供
すること。 【解決手段】 結合する2つの音声を音声ファイル装置
103から取り出してその音調レベルを求め(入力情報
制御部102)、求めた2つの音声の音調レベルを表示
し(表示装置104,表示情報制御部105)、表示さ
れた2つの音声の音調レベルのうち少なくとも一方の音
調レベルを制御して両方の音調を揃える(イコライズ処
理部106)。そのときの音調レベルに基づいて2つの
音声を結合し(音声結合処理部107)、結合した音声
を格納する(音声格納処理部108,音声ファイル装置
103)。音調が揃っているか否かは音声再生により判
断する(音声再生装置109)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音調の異なる二つ
のナレーションを一つのナレーションとして結合する際
の音声処理技術に係り、特に、二つのナレーションそれ
ぞれの音調レベルを表示装置の画面に表示し、両者を比
較しながら、音調に関する適切な情報を入力してイコラ
イズ処理を行うことにより、二つのナレーションをスム
ーズに結合するための音声処理装置、音声処理方法、お
よび該方法を記録した記録媒体に関する。
【0002】
【従来の技術】従来、音声の速度を制御する音声処理方
法としては、処理対象の音声と希望する出力音声との時
間長の比によって、圧縮・伸長処理を行う方法があっ
た。この種の従来技術としては、「音声発声速度制御方
法」(NTTデータ通信(株)、特開平05-241598号公報)に
よる技術が知られている。この従来技術は、音声を希望
する時間長に変更する際、音声を1ピッチ単位に切り出
し、圧縮・伸長処理を行い、スムーズに各音声をつなぐ
ことにより、品質の低下を防ぐことを目的とした音声処
理方法である。
【0003】
【発明が解決しようとする課題】従来、音調の異なる複
数のナレーションを結合して1つのナレーションを生成
する場合、ナレーションの音調を変更して両者のバラン
スを合わせた後、それぞれを結合するようにしている。
その場合、音調を変更する度合いは、実際に聞いた感覚
で判断して決定するしかなく、操作者の主観(感覚)に
大きく依存していた。そのため、両者のナレーションの
音調をどの程度変更して結合するかが問題となる。
【0004】上記従来技術は、処理対象となる音声を同
一環境下で記録する場合はあまり問題にならないが、異
なる環境下、例えば、異なる時間や異なる日に、あるい
は異なる場所で記録された複数のナレーションの結合を
行う場合には、ファイル(ナレーション)ごとに音調が
大幅に異なる可能性があるので、適切な音調の変更を行
い違和感のない1つのナレーションを生成することは困
難である。本発明の目的は、従来の技術における上述の
如き問題を解消し、簡単な方法で違和感のない1つのナ
レーションを生成することを可能とした音声処理装置、
音声処理方法、および該音声処理方法を記録した記録媒
体を提供することにある。
【0005】
【課題を解決するための手段】本発明は、上記目的を達
成するために、複数のナレーションの結合を、音調レベ
ルを画面で確認しながらの対話処理(画面を見ながらの
音調の変更と実際の耳での確認の繰り返し)によって行
うようにしたことを特徴とものである。具体的には、本
発明の音声処理装置は、2つの音声を音調を変更して結
合する音声処理装置において、結合する2つの音声の音
調レベルを求める手段と、求めた2つの音声の音調レベ
ルを表示する手段と、表示された2つの音声の音調レベ
ルのうち少なくとも一方の音調レベルを制御する手段
と、制御された音調レベルに基づいて2つの音声を結合
する手段と、結合した音声を格納する手段とを有するこ
とを特徴としている。
【0006】また、本発明の音声処理方法は、2つの音
声を音調を変更して結合する音声処理方法において、結
合する2つの音声に対して複数のバンド域の音調レベル
を求めるステップと、求めた2つの音声の音調レベルを
表示するステップと、表示された2つの音声の音調レベ
ルのうち少なくとも一方の音調レベルを制御する音調レ
ベル制御ステップと、制御された音調レベルに基づいて
2つの音声を結合するステップと、結合した音声を音声
ファイル装置に格納するステップとを有することを特徴
としている。
【0007】さらに、本発明の記録媒体は、2つの音声
を音調を変更して結合する音声処理方法を記録した記録
媒体であって、結合する2つの音声に対して複数のバン
ド域の音調レベルを求める処理と、求めた2つの音声の
音調レベルを表示する処理と、表示された2つの音声の
音調レベルのうち少なくとも一方の音調レベルを制御す
る音調レベル制御処理と、制御された音調レベルに基づ
いて2つの音声を結合する処理と、結合した音声を音声
ファイル装置に格納する処理をプログラムコード化して
記録したコンピュータで読み取り可能な記録媒体である
ことを特徴としている。
【0008】上記構成によれば、音調の制御を、バンド
域ごとに対話処理によって行うことによって、必要なバ
ンド域のみ変更を行うことを可能とし、作業時間の短縮
とともに、音声品質を維持することが可能となる。ま
た、ナレーターの経験や体調、環境の変化などによる、
音調にばらつきがあるナレーションを1つの自然なナレ
ーションとして生成することが可能となるという効果が
得られる。
【0009】
【発明の実施の形態】<概要>従来のように、処理対象
の音声と出力音声との時間長の比によって圧縮・伸張処
理を行って音声の制御を行う場合、圧縮・伸張処理の度
合いは実際に耳で聞いた感覚で判断しなければならず、
客観的でないばかりか正確さも保証されない。そこで、
本発明では、音調の制御を、対話処理(画面を見ながら
の音調変更入力と実際の音の確認との繰り返し)により
行い、簡単な操作で音調のバランスがスムーズなナレー
ションを作成することを可能にしている。このように、
音調の制御を、画面を見ながら対話処理により行うこと
で、作業時間の短縮が可能であり、また、ナレータの経
験や体調・環境の変化などによる音調のばらつきをなく
し、複数のナレーションを結合して1つの自然なナレー
ションを生成することを可能にしている。
【0010】<実施例>以下、本発明の実施例を図面に
基づいて詳細に説明する。図1は、本発明の一実施例に
係る音声処理装置の構成を示すブロック図である。同図
において、101はキーボードやマウスなどの入力装
置、102は入力情報制御部、103は音声ファイル装
置、104は表示装置、105は表示情報制御部、10
6はイコライズ処理部、107は音声結合処理部、10
8は音声格納処理部、109は音声再生装置を示してい
る。
【0011】図2は、本発明の一実施例に係る表示情報
制御部105が行う処理の流れを説明するためのフロー
チャートである。図3は、本発明の一実施例に係る音調
レベル定義画面を示す図である。同図において、301
は音声波形領域、302はファイル名欄、303は参考
にする音声波形の開始時間欄、304は参考にする音声
波形の終了時間欄、305は変更する音声波形の開始時
間欄、306は変更する音声波形の終了時間欄、307
は参考にする音声波形の音調レベルA、308は変更す
る音声波形の音調レベルB、309はプレビューボタ
ン、310は確認ボタンを示している。音調レベルA領
域307および音調レベルB領域308は、各バンド域
ごとにその大きさ(単位は、例えばデシベル(dB))
を示す位置にツマミ(C)が表示されており、そのツマ
ミをマウスなどで上下にドラッグすることにより、音調
が変更できるようになっている。
【0012】図4は、本発明の一実施例に係る単位時間
当たりの音調レベルを示す図である。図5は、本発明の
一実施例に係る音声波形領域301への表示例を示す図
である。図6は、本発明の一実施例に係る「参考にする
音声波形の音調レベル」を示す図である。図7は、本発
明の一実施例に係る「変更する音声波形の音調レベル」
を示す図である。
【0013】次に,本実施例における音声処理装置にお
ける処理を、図1、図3および図4を用いて説明する。
まず、図3に示された音調定義画面のファイル名欄30
2に、入力装置101(キーボードなど)を用いて、音
声ファイル名を入力する。入力情報制御部102は、入
力されたファイル名に基づいて該ファイル名に対応する
音声ファイルを音声ファイル装置103から検索して抽
出し、表示情報制御部105に渡す。表示情報制御部1
05は、入力情報制御部102から渡された音声ファイ
ルの音声波形を表示装置104の音調レベル定義画面の
音声波形領域301に表示する。
【0014】図5は、音声波形領域301に表示された
音声波形の例を示す図である。図5の例においては、音
声波形領域301に、音声のサンプリングデータ波形が
横軸を時間、縦軸を周波数(Hz)として表示される。
【0015】次に、参考にする音声波形を選択し、音調
レベルA領域307にその音調レベルを表示する。ま
た、変更する音声波形を選択し、音調レベルB領域30
8にその音調レベルを表示する。
【0016】なお、指定範囲は、入力装置100によ
り、参考にする音声波形の場合は開始時間欄303およ
び終了時間欄304に、変更する音声波形の場合は開始
時間欄305および終了時間欄306に、対応する値を
入力することによって行うようにしてもよいし、あるい
は、マウスのドラッグ操作により該音声波形領域を指定
するようにしてもよい。
【0017】ここで、参考にする音声波形と変更する音
声波形の音調レベルの表示方法について、図4を用いて
説明する。同図に示すように、単位時間当たりの音声波
形により、予め決められたバンド域ごとの音量を計測す
る。ここでは、バンド域を125Hz,250Hz,500
Hz,1kHz,3kHzとし、音量単位をデシベル(dB)とす
る。計測した単位時間当たりのバンド域ごとの音量を、
選択波形内で平均化して生成した音調レベルを表示す
る。図4は、このようにして表示した音調レベルの一例
であり、この例では1kHz,3kHz,250Hz,125H
z,500Hzの順に音量が大きくなっていることがわか
る。
【0018】次に、上記のようにして求めたバンド域ご
との音量を、参考にする音声波形は音調レベルA領域3
07側に、変更する音声波形は音調レベルB領域308
側に表示し、参考にする音声波形と変更する音声波形の
音調レベルとを相互に比較し、音調レベルが異なってい
る場合、変更する音声波形の音調レベルの変更を行って
音調を合わせる。
【0019】ここで、音調レベルの変更方法について具
体的に説明する。一般的に音調レベルを上げる場合に
は、音調レベルB領域308のバンド域の高い部分(例
えば、500Hz以上)を大きくし、バンド域の低い部分
(例えば、500Hz未満)を小さくすることにより行
う。逆に、音調レベルを下げる場合には、音調レベルB
領域308のバンド域の低い部分(500Hz以下)を大
きくし、バンド域の高い部分(500Hz以上)を小さく
することにより行う。音調レベルのバンド域を大きくし
たり小さくしたりするのは、各バンド域の音量を表すツ
マミ(C)をマウスにより上または下にドラッグするこ
とによって行われる。
【0020】このように音調レベルを変更した後、この
変更処理の結果を確認するためにプレビューボタン30
9をクリックすると、新たに設定した音調レベル情報が
表示情報制御部105からイコライズ処理部106に渡
され、ここで音調の変更が行われる。次に、変更処理後
の音調データが音声結合処理部107に渡され、変更部
分およびその前後の音声波形と結合される。そして、結
合された音声ファイルを音声再生装置109により再生
される。
【0021】その結果、不都合な場合、すなわち音調の
調整が不充分で結合されたナレーションが不自然な場合
などには、適切な音調調整が確認できるまで上記イコラ
イズ処理を繰り返す。最後に、適切な音調調整の確認が
終了したら、確認ボタン310をクリックすることによ
り、音声結合処理部107から音声格納処理部108に
結合された音声ファイルが渡され、音声格納処理部10
8において、音声ファイル装置103に格納する。
【0022】以下、図2に示したフローチャートに基づ
いて、上述した表示情報制御部105およびイコライズ
処理部106の動作を詳細に説明する。まず、表示情報
制御部105において、入力装置101から入力された
音声ファイル名302に基づいて入力情報制御部102
が音声ファイル装置103から抽出した音声ファイルを
読み込み(ステップ201)、表示装置104の音声波
形領域301に音声のサンプリングデータ波形を表示す
る(ステップ202)。
【0023】次に、参考にする音声波形の開始時間およ
び終了時間を開始時間欄303および終了時間欄304
に入力する(ステップ203)。その結果、単位時間あ
たりの各バンド域の音調レベルを計測し、選択した音声
波形における平均のバンドレベルを算出し、得られた音
調を音調レベルA領域307に表示する(ステップ20
4)。
【0024】同様に、変更する音声波形の開始時間およ
び終了時間を開始時間欄305および終了時間欄306
に入力する(ステップ206)。その結果、単位時間あ
たりの各バンド域の音調レベルを計測し、選択波形にお
ける平均のバンドレベルを算出し、得られた音調を音調
レベルB領域308に表示する(ステップ207)。
【0025】ここで、音調レベルA領域307および音
調レベルB領域308に表示された2つの音調を画面上
で互いに比較し、音調の調整が必要な場合、音調の調整
を行う。音調レベルA領域307および音調レベルB領
域308への表示例を図6および図7に示す。音調レベ
ルA領域307および音調レベルB領域308に表示さ
れた音調レベルが揃っていない場合、それらを揃える処
理を行う(ステップ208)。
【0026】この処理としては、例えば上述したよう
な、音調レベルB領域308のバンド域の高い部分(例
えば、500Hz以上)を大きくし、バンド域の低い部分
(例えば、500Hz未満)を小さくすることにより音調
レベルを上げたり、逆に、音調レベルB308のバンド
域の低い部分(500Hz以下)を大きくし、バンド域の
高い部分(500Hz以上)を小さくすることにより音調
レベルを下げたりすることによって行われる。または、
各バンド域ごとに、ツマミ(C)をマウスでドラッグす
ることによってその音調レベルを制御するようにしてき
め細かく制御するようにしてもよい。
【0027】以上の処理を行った後、プレビューボタン
309をクリックすると、音声の再生が行われ、調整後
の音声を耳で確認する(ステップ209)。この確認の
結果、問題がある場合は問題がなくなるまで繰り返し処
理を行う(ステップ210:Y,ステップ205〜20
9の繰り返し)。問題がなくなれば確認ボタン310を
クリックして処理を終了する(ステップ210:N)。
以上説明した如く、本実施例によれば、音調の異なる音
声ファイルを同一の音調で結合することが可能になる。
【0028】上記実施例は本発明の一例を示したもので
あり、本発明はこれに限定されるべきものではないこと
は言うまでもない。例えば、上記実施例では、2つの音
声波形のうち、一方を変更する音声波形、他方を参考に
する音声波形とし、変更する音声波形の方の音調を変え
て結合しているが、両方の波形を変更するようにしても
よい。
【0029】なお、上記実施例で説明した音声処理方法
は、プログラムコード化してCD−ROMなどの記録媒
体に記録して市場に流通させることができる。この場
合、利用者はこの記録媒体を入手して自分の装置にイン
ストールして利用することにより、異なる音調の複数の
音声(ナレーション)を一つの連続した自然な音声(ナ
レーション)に簡単に合成することができるようにな
る。
【0030】
【発明の効果】以上、詳細に説明した如く、本発明によ
れば、音調の制御を対話処理によって行うことにより、
作業時間の短縮を図ることが可能となる。また、ナレー
ターの経験や体調、環境の変化などによる、音調にばら
つきがあるナレーションを1つの自然なナレーションと
して生成することが可能となる。上記効果を総じて、い
かなる音調のナレーションでも、必要最小限の処理で変
更を可能とする音声処理方法を実現することができると
いう顕著な効果を奏するものである。
【図面の簡単な説明】
【図1】本発明の一実施例に係る音声処理方法の構成を
示すブロック図である。
【図2】本発明の一実施例に係る表示情報制御部105
の処理を示すフローチャートである。
【図3】本発明の一実施例に係る音調レベル定義画面を
示す図である。
【図4】本発明の一実施例に係る単位時間当たりの音調
を示す図である。
【図5】本発明の一実施例に係る音声波形領域を示す図
である。
【図6】本発明の一実施例に係る参考にする音声波形の
音調レベルを示す図である。
【図7】本発明の一実施例に係る変更する音声波形の音
調レベルを示す図である。
【符号の説明】
101:入力装置 102:入力情報制御部 103:音声ファイル装置 104:表示装置 105:表示情報制御部 106:イコライズ処理部 107:音声結合処理部 108:音声格納処理部 109:音声再生装置 301:音声波形領域 302:ファイル名欄 303:参考にする音声波形の開始時間欄 304:参考にする音声波形の終了時間欄 305:変更する音声波形の開始時間欄 306:変更する音声波形の終了時間欄 307:参考にする音声波形の音調レベルA領域 308:変更する音声波形の音調レベルB領域 309:プレビューボタン 310:確認ボタン

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 2つの音声を音調を変更して結合する音
    声処理装置において、結合する2つの音声の音調レベル
    を求める手段と、求めた2つの音声の音調レベルを表示
    する手段と、表示された2つの音声の音調レベルのうち
    少なくとも一方の音調レベルを制御する手段と、制御さ
    れた音調レベルに基づいて2つの音声を結合する手段
    と、結合した音声を格納する手段とを有することを特徴
    とする音声処理装置。
  2. 【請求項2】 2つの音声を音調を変更して結合する音
    声処理方法において、結合する2つの音声に対して複数
    のバンド域の音調レベルを求めるステップと、求めた2
    つの音声の音調レベルを表示するステップと、表示され
    た2つの音声の音調レベルのうち少なくとも一方の音調
    レベルを制御する音調レベル制御ステップと、制御され
    た音調レベルに基づいて2つの音声を結合するステップ
    と、結合した音声を音声ファイル装置に格納するステッ
    プとを有することを特徴とする音声処理方法。
  3. 【請求項3】 2つの音声を音調を変更して結合する音
    声処理方法を記録した記録媒体であって、結合する2つ
    の音声に対して複数のバンド域の音調レベルを求める処
    理と、求めた2つの音声の音調レベルを表示する処理
    と、表示された2つの音声の音調レベルのうち少なくと
    も一方の音調レベルを制御する音調レベル制御処理と、
    制御された音調レベルに基づいて2つの音声を結合する
    処理と、結合した音声を音声ファイル装置に格納する処
    理をプログラムコード化して記録したことを特徴とする
    コンピュータで読み取り可能な記録媒体。
JP7986999A 1999-03-24 1999-03-24 音声処理装置、音声処理方法、および該方法を記録した記録媒体 Pending JP2000276186A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7986999A JP2000276186A (ja) 1999-03-24 1999-03-24 音声処理装置、音声処理方法、および該方法を記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7986999A JP2000276186A (ja) 1999-03-24 1999-03-24 音声処理装置、音声処理方法、および該方法を記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2000276186A true JP2000276186A (ja) 2000-10-06

Family

ID=13702230

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7986999A Pending JP2000276186A (ja) 1999-03-24 1999-03-24 音声処理装置、音声処理方法、および該方法を記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2000276186A (ja)

Similar Documents

Publication Publication Date Title
JP4302792B2 (ja) オーディオ信号処理装置及びオーディオ信号処理方法
US5151998A (en) sound editing system using control line for altering specified characteristic of adjacent segment of the stored waveform
US8874245B2 (en) Effects transitions in a music and audio playback system
US9942673B2 (en) Method and arrangement for fitting a hearing system
US8010366B1 (en) Personal hearing suite
US20060143012A1 (en) Voice synthesizing apparatus, voice synthesizing system, voice synthesizing method and storage medium
EP1826900A1 (en) Vehicle-mounted sound control system
JPWO2006009004A1 (ja) 音響再生システム
JP4237768B2 (ja) 音声処理装置、音声処理プログラム
US5963907A (en) Voice converter
JP4587916B2 (ja) 音声信号判別装置、音質調整装置、コンテンツ表示装置、プログラム、及び記録媒体
US8462964B2 (en) Recording apparatus, recording method, audio signal correction circuit, and program
JP2000276186A (ja) 音声処理装置、音声処理方法、および該方法を記録した記録媒体
JP2009086481A (ja) 音響装置、残響音付加方法、残響音付加プログラム及びその記録媒体
JP2009031357A (ja) 楽曲配信システム、楽曲編集装置、楽曲再生装置、楽曲記憶装置およびプログラム
JP2007003845A (ja) 再生情報生成装置及び音声再生装置
JP4561561B2 (ja) カラオケ装置
JPH1115488A (ja) 合成音声評価・合成装置
JP5591098B2 (ja) カラオケ多重録音編集システム
JP4360212B2 (ja) カラオケ装置
JP5731661B2 (ja) 記録装置、記録方法、及び記録制御用のコンピュータプログラム、並びに再生装置、再生方法、及び再生制御用のコンピュータプログラム
JP4479635B2 (ja) オーディオ装置及びカラオケ装置
JP4274418B2 (ja) 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム
JP2006171458A (ja) 音質調整装置、コンテンツ表示装置、プログラム、及び記録媒体
KR970008120A (ko) 디지탈 노래반주 시스템의 오디오 설정 방법