JP2001296894A - 音声処理装置および音声処理方法 - Google Patents

音声処理装置および音声処理方法

Info

Publication number
JP2001296894A
JP2001296894A JP2000110282A JP2000110282A JP2001296894A JP 2001296894 A JP2001296894 A JP 2001296894A JP 2000110282 A JP2000110282 A JP 2000110282A JP 2000110282 A JP2000110282 A JP 2000110282A JP 2001296894 A JP2001296894 A JP 2001296894A
Authority
JP
Japan
Prior art keywords
data
voice
audio
difference
interpolation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000110282A
Other languages
English (en)
Inventor
Koichi Hoshino
功一 星野
Masahiro Wakamori
正浩 若森
Manabu Ono
学 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000110282A priority Critical patent/JP2001296894A/ja
Publication of JP2001296894A publication Critical patent/JP2001296894A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 複数チャネルの音声データにおいて、一方の
音声データが所定の区間において欠損しても、欠損して
いない他方の音声データとの相関性が保たれる音声デー
タを補間し、聞くときの違和感を減少させる。 【解決手段】 音声編集装置1において、R入力端子2
に入力されたR音声データとL入力端子3に入力された
L音声データとに欠損がない場合、それぞれの入力され
た音声データをそのまま出力するとともに、相関処理手
段6において、R音声データとL音声データの相関を示
す音声差分データを求める。そしてR音声データに欠損
があった場合に、R音声補間手段7において、欠損して
いないL音声データと、あらかじめ相関処理手段6で求
められた音声差分データとから、L音声データとの相関
性が保たれたR音声補間データを作成し出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数チャネルの音
声データにおいて欠損した音声データを補間して出力す
る音声処理装置および音声処理方法に関する。
【0002】
【従来の技術】従来から記憶媒体に記憶された、あるい
は放送などで伝送された複数チャネルの音声データを再
生することが行われているが、記憶媒体の書き込みまた
は読み込み時の誤り、あるいは伝送路の障害などにより
音声データに欠損が生じることがある。
【0003】例えばハードディスクなどの記憶装置に記
憶された音声データ、あるいは伝送装置を通じて伝送さ
れる音声データであるステレオ音声を入力して出力する
音声処理装置である音声編集装置においては、記憶装置
でデータの書き込みあるいは読み出しが正しく処理が行
われずに一部のデータの欠損が生じる場合がある。また
伝送装置で、伝送状態の変化によって信号劣化が生じて
一部のデータが欠損したり、あるいは多重化による輻輳
などによって一部のデータが遅延して再生処理の必要時
に間に合わず、欠損と同等と判断して処理すべき遅延が
生じることもある。
【0004】したがって従来の音声処理装置では、音声
データに欠損が生じても再生ができるように、同チャネ
ルにおける欠損する直前の音声データ、あるいは再生が
遅延されるものにおいては前と後の音声データを用い
て、欠損した区間を補間する手段が用いられていた。
【0005】また特開平10−209977号公報に開
示されているように、受信データエラー(欠損区間)が
検出されたときに、同一のチャネルの過去のデータを用
いて、受信データエラーが生じても、連続して出力でき
る。
【0006】
【発明が解決しようとする課題】しかしながら従来の音
声処理装置においては、音声データが欠損した区間を、
同チャネルにおける欠損した直前あるいは欠損した前後
の音声データの特徴変化から音声補間データを求めてお
り、欠損している間に生じた特徴変化を考慮して補間す
ることができないという問題があった。
【0007】本発明はかかる点に鑑みてなされたもので
あり、複数チャネルの音声データにおける1つのチャネ
ルの音声データが欠損しても、他のチャネルの音声デー
タと比較して違和感の少ない音声データを出力できる優
れた音声処理装置を提供することを目的とする。
【0008】
【課題を解決するための手段】第一音声データが欠損し
た区間である第一音声欠損区間を検出する第一欠損区間
検出手段と、第一音声欠損区間でないと検出された第一
音声データおよび第一音声欠損区間でないと検出された
第二音声データと、第一音声欠損区間における第二音声
データとをパラメータとして、第一音声欠損区間におけ
る第一音声補間データを求める音声補間手段と、第一音
声データと第一音声補間データとを選択して出力する第
一音声出力手段とを備えた構成とした。
【0009】したがって第一音声欠損区間が生じても、
第一音声欠損区間における第二音声データを用いて、第
一音声欠損区間以外における第一音声データと第二音声
データとの相関性が保たれた第一音声補間データが求め
られ出力することができる。
【0010】また本発明の音声処理装置は、第一音声デ
ータと第二音声データとの特徴量の差をパラメータとし
て音声差分データを求める音声差分データ作成手段と、
第一音声データが欠損した区間である第一音声欠損区間
を検出する第一欠損区間検出手段と、第二音声データと
音声差分データとをパラメータとして第一音声補間デー
タを求める音声補間手段と、第一音声データと第一音声
補間データとを選択して出力する第一音声出力手段とを
備えた構成とした。
【0011】したがって第一音声欠損区間が生じても、
第一音声欠損区間における第一音声データと第二音声デ
ータの特徴量の差が、第一音声欠損区間の前、後、また
は前と後における第一音声データと第二音声データとの
特徴量の差と同様であると仮定し、その仮定した特徴量
の差に従い、第一音声データと相関性が高い第一音声欠
損区間における第二音声データを変換した音声補間デー
タを得て、第一音声データにかわって出力することがで
きる。
【0012】また本発明の音声処理装置は、特徴量が少
なくとも音量である構成とした。
【0013】したがって第一音声欠損区間が生じても、
第一音声データと第二音声データとの音量の相関性を保
った音声補間データを得ることができる。
【0014】また本発明の音声処理装置は、特徴量が少
なくとも遅延時間である構成とした。
【0015】したがって第一音声欠損区間が生じても、
第一音声データと第二音声データとの遅延時間の相関性
を保った音声補間データを得ることができる。
【0016】また本発明の音声処理装置は、音声差分デ
ータ作成手段が、第一音声データの周波数帯域を制限す
る第一帯域制限手段と、第二音声データを第一帯域制限
手段と同じ周波数帯域に制限する第二帯域制限手段とを
備えた構成とした。
【0017】したがって所定の周波数帯域における特徴
量の差から音声差分データを求めるため、所望の周波数
帯域における音量や遅延時間などの特徴量を考慮した音
声補間データを得ることができる。
【0018】また本発明の音声処理装置は、第一帯域制
限手段が周波数帯域を複数の周波数帯域に分割し、第二
帯域制限手段が第一帯域制限手段と同じ複数の周波数帯
域に分割し、音声差分データ作成手段が分割された周波
数帯域毎の第一音声データの特徴量と第二音声データの
特徴量の差から求められる複数の特徴量の差を音声差分
データとし、音声補間手段が分割された周波数帯域毎の
第二音声データと音声差分データとから得られる補間デ
ータを分割された複数の周波数帯域で合成して第一音声
補間データを求めること構成とした。
【0019】したがって各周波数帯域毎の特徴量の差か
ら得られる音声差分データによって補間データを求め
て、複数の周波数帯域における補間データを合成するこ
とで、各周波数帯域毎における音量や遅延時間などの特
徴量を考慮した音声補間データ得ることができる。
【0020】また本発明の音声処理装置は、第二音声デ
ータが欠損した区間である第二音声欠損区間を検出する
第二欠損区間検出手段を備え、音声差分データ作成手段
が第一音声データと第二音声データとが存在する複数の
音声存在区間におけるそれぞれの特徴量の差をパラメー
タとすることを特徴とする。
【0021】したがって複数の音声存在区間の特徴量の
差を平均化あるいは重み付けを行って音声差分データを
求めることができ、第一音声欠損区間が生じても、より
違和感の少ない相関性の高い音声補間データを得ること
ができる。
【0022】
【発明の実施の形態】図1は本発明の第一の実施形態に
おける音声編集装置のブロック図である。
【0023】図1において、音声編集装置1は左右のス
テレオ音声を入力し、欠損した音声データを補間した後
に左右のステレオ音声を出力する。そしてR入力端子2
に入力される右チャネルの音声データ(R音声データ)
と、L入力端子3に入力される左チャネルの音声データ
(L音声データ)とを音声データ処理をする。そして音
声データ処理後に、R出力端子4から右チャネルの音声
データを出力し、L出力端子5から左チャネルの音声デ
ータを出力する。
【0024】この音声編集装置1の音声データ処理につ
いてさらに説明をする。
【0025】R音声データが入力されるR入力端子2
と、L音声データが入力されるL入力端子3を通じて、
R音声データとL音声データは、R音声データとL音声デ
ータとの差分値である相関値を求める相関処理手段6に
入力さる。
【0026】そして相関処理手段6において、R音声デ
ータとL音声データとの相関値が音声差分データとして
求められて出力される。この相関処理手段6で求める相
関値は音声の特徴量から求めるが、ここでは単位時間に
おける音量変化を特徴量とした場合について述べる。
【0027】相関処理手段6においては、単位時間あた
りのR音声データの音量変化とL音声データの音量変化
との相関関係が、例えばR音声データとL音声データと
の音量がお互いに増加あるいは減少すること、または右
から左へ音が変化するためにR音声データの音量が減少
しながらL音声データの音量が増加することなどを示す
音声差分データとして求められる。
【0028】そして相関処理手段6で得られた音声差分
データと左チャネルであるL音声データとから、右チャ
ネル用のR音声補間データを求めるR音声補間手段7に
おいて、L音声データを音声差分データに応じて変化さ
せたR音声補間データが求められる。
【0029】同様に相関処理手段6で得られた音声差分
データと右チャネルであるR音声データとから、左チャ
ネル用のL音声補間データを求めるL音声補間手段8に
おいて、R音声データを音声差分データに応じて変化さ
せたL音声補間データが求められる。
【0030】そしてR音声データまたはL音声データが
入力されずに欠損したことが判定手段9で判定される
と、判定手段9の判定結果に応じてR音声選択手段10
及びL音声選択手段11の選択動作を行う。
【0031】このときR音声データが欠損しない場合
は、欠損せずに伝送されたR音声データをR音声選択手
段10からR出力端子4へ、R音声データが欠損した場
合は、R音声補間データをR音声選択手段10からR出
力端子4へ出力する。同様にL音声データが欠損しない
場合は、欠損せずに伝送されたL音声データをL音声選
択手段11からL出力端子5へ、L音声データが欠損し
た場合は、L音声補間データをL音声選択手段11から
L出力端子5へ出力する。
【0032】ここで出力する音声データの例について、
第一の実施形態における音声処理のフロチャート図であ
る図2を用いて概略を説明する。
【0033】入力される音声データがR音声データとL
音声データのいずれか一方でも欠損しているか否かを判
定し(ステップ101)、欠損区間がない場合は音声差
分データを更新して(ステップ102)、欠損せずに入
力されているR音声データとL音声データを出力し(ス
テップ103)、次の区間の処理へ移行する。
【0034】(ステップ101で)少なくとも欠損区間
がある場合は、R音声データがあるか否か判定し(ステ
ップ104)、R音声データがある場合は、入力された
R音声データと、あらかじめ得られている音声差分デー
タを用いてL音声補間データを求め(ステップ10
5)、欠損せずに入力されているR音声データとL音声
補間データを出力し(ステップ106)、次の区間の処
理へ移行する。
【0035】(ステップ104で)R音声データがない
場合はL音声データがあるか否か判定し(ステップ10
7)、L音声データがある場合は、入力されたL音声デ
ータと、あらかじめ得られている音声差分データを用い
てR音声補間データを求め(ステップ108)、欠損せ
ずに入力されているL音声データとR音声補間データを
出力し(ステップ109)、次の区間の処理へ移行す
る。
【0036】(ステップ107で)L音声データも存在
しない場合は全て欠損しているため、各種データを更新
したり出力することなく、次の区間の処理へ移行する。
【0037】さらに音声編集装置1の詳細について説明
をする。
【0038】ハードディスクなどの記憶装置に記憶され
た音声データ、あるいは伝送装置を通じて伝送される音
声データをステレオ音声データとして音声編集装置1に
入力する場合には、前述のとおり、記憶装置などにおけ
るデータの欠損、あるいは伝送装置などにおけるデータ
の欠損や必要以上の遅延が生じるために欠損と判断(以
下、必要以上の遅延も欠損として説明する)すべき場合
がある。
【0039】音声編集装置1では、音声データに欠損が
生じない場合は、R音声選択手段10では、判定手段9
においてR入力端子2に入力されたR音声データが欠損
なしと判断され、R入力端子2に入力されたR音声デー
タをR出力端子4から出力する。
【0040】同様にL音声選択手段11では、判定手段
9においてL入力端子3に入力されたR音声データが欠
損なしと判断され、L入力端子3に入力されたL音声デ
ータをL出力端子5から出力する。
【0041】なお判定手段9における音声データの欠損
の有無の判断は、音声編集手段1に入力される以前に記
憶装置あるいは伝送装置などで検出された結果によっ
て、入力される音声データにフラグ情報などが挿入され
ていたり、特異なデータ系列となっていることで判断す
ることができる。
【0042】また音声データに欠損が生じた場合に備え
て、音声データの欠損が生じない場合には、R音声デー
タとL音声データとの特徴量を音量とした差分につい
て、相関処理手段6において、R音声データを基準とし
たL音声データの音量変化の増減を音声差分データとし
て求める。ここで音声差分データは、所定の区間におけ
るそれぞれの差分量としてもよいし、複数の区間での変
化の平均あるいは時間軸で古い差分量は小さい係数を、
新しい差分量は大きい係数をかけて重み付けを行ったも
のを音声差分データとしてもよい。
【0043】次にR音声データに欠損が生じた場合は、
R音声補間手段7において、欠損したR音声データと時
間が対応している区間のL音声データを用いて、あらか
じめ相関手段6において得られた音声差分データに応じ
てそのL音声データの音量を変化されてR音声補間デー
タを得る。なおここで音声差分データはR音声データを
基準としているため、L音声データを音声差分データに
応じて減少させることでR音声補間データが得られる。
【0044】そしてR音声選択手段10において、判定
手段9でR音声データが欠損したという判断結果にした
がって、R音声補間手段7から入力されるR音声補間デ
ータをR出力端子4から出力する。
【0045】同様にL音声データに欠損が生じている場
合は、L音声補間手段8において、欠損したL音声デー
タと時間が対応している区間のR音声データの音量を、
あらかじめ相関手段6において得られた音声差分データ
に応じて変化させてL音声データを得る。なお音声差分
データはR音声データを基準としているためにR音声補
間手段7と異なり、R音声データに音声差分データを加
える処理により音声差分データに応じたL音声補間デー
タを得る。
【0046】そしてL音声選択手段11において、判定
手段9でL音声データが欠損した判断結果にしたがっ
て、L音声補間手段8から入力されるL音声補間データ
をL出力端子5から出力する。
【0047】したがって本発明の第一の実施形態におけ
る音声編集装置を用いると、例えば音声伝送モデル図で
ある図3に示す環境下においては以下に示す動作とな
る。
【0048】図3に示す音声録音環境モデル21で音源
22が曲線23上を移動したときに、その音声を右側マ
イク25と左側マイク26とで収録する。
【0049】そして右側マイク25と左側マイク26と
で集音した音をそれぞれ音声データ送信装置27から伝
送路28を通じて、図1の音声編集装置1を含む音声受
信装置29に入力し、R出力端子4から出力するR音声
データと、L出力端子5から出力するL音声データとを
それぞれ図示しないD/A変換装置や増幅器を通して、
音声再生環境モデル30における右側スピーカ31と左
側スピーカ32とから出力し、試聴位置33で試聴す
る。
【0050】この時に右側マイク25と左側マイク26
に収録される収録音は、音量が左右同時に増減をしなが
ら、右側マイク25の収録音の所定区間の平均値が徐々
に増加し、左側マイク26の収録音の所定区間の平均値
が徐々に減少する。
【0051】したがってそれぞれの収録音は、図4のよ
うに横軸が時間で、縦軸が音量を示す収録音の音量変化
図に示す音量変化となる。ここで波形41は右側マイク
25の収録音、波形42は左側マイク26の収録音を示
す。
【0052】そして右側マイク25の収録音が伝送情報
であるR音声データに変換されて音声受信装置29に伝
送され、左側マイク27の収録音が伝送情報であるL音
声データに変換されて音声受信装置29に伝送される。
【0053】ここでR音声データおよびL音声データが、
図5の伝送情報のタイムチャートに示すように、時刻t
0から時刻t1の間の区間43におけるR音声データが
欠損している場合、その区間43においてはR音声デー
タが音声受信装置29には伝送されない。なお音声受信
装置29においては音声データの欠損が、欠損がないこ
とを示すフラグ情報が音声データとともに欠損して伝送
されないことによって検出できるものとするが、その他
に音声データを特異なデータ系列とさせて検出すること
でもよい。
【0054】音声受信装置29では、右側スピーカ31
と左側スピーカ32に、図4と同様の音声を出力するこ
とが望まれるが、ここで時刻t0から時刻t1の間の区
間43でR音声データが欠損しているので、時刻t0以
前におけるR音声データの音量と、L音声データの音量
との差分に応じてL音声データを変換した音声補間デー
タを、時刻t0から時刻t1の間で右側スピーカ31か
ら出力する。
【0055】このときの音量変化を図6の再生音声の音
量変化図に示す。
【0056】図6において、横軸は時間、縦軸は音量を
示し、右側スピーカ31から出力される音声の音量変化
を波形44で示し、左側スピーカ31から出力される音
声の音量変化を波形45で示し、R音声データとL音声
データとの音量の差である音声差分データを、区間43
においては時刻t0以前のR音声データとL音声データ
との音量の差を一次近似して求められている波形46で
示している。
【0057】特に区間43ではR音声データが欠損した
が、時刻t0以前の音声差分データの変化から、区間4
3における音声差分データが一次近似式などで簡単に得
られ、その区間43における音声差分データとL音声デ
ータとからR音声データが求められので、波形44に示
す音声データ(波形45+波形46)が得られる。した
がって、波形44に示すR音声データを右側スピーカ3
1から出力することによって、音量におけるR音声デー
タとL音声データとの相関性を、R音声データが欠損し
ている区間43においても保たれるので、出力される音
声に違和感が生じない。
【0058】以上のように、R音声データが欠損しない
区間におけるL音声データと比較したR音声データの変
化である音声差分データに応じて、R音声データの欠損
した部分をL音声データから得られるため、R音声デー
タが欠損した区間においても、R音声データとL音声デ
ータの相関性が保たれたR音声データが得られる。
【0059】同様にL音声データが欠損した区間におい
ても、R音声データとL音声データの相関性が保たれた
L音声データが得られる。
【0060】次に本発明の第2の実施形態について発明
する。
【0061】図7は本発明の第2の実施形態における音
声編集装置のブロック図である。
【0062】図7の音声編集装置12は、音声データの
欠損がない区間においては図1の音声編集装置1と同様
に、判定手段9で欠損がないと判定された結果にしたが
って、R入力端子2に入力されたR音声データを、R音
声選択手段10からR出力端子4に出力する。また判定
手段9で欠損がないと判定された結果にしたがって、L
入力端子3に入力されたL音声データを、L音声選択手
段11からL出力端子5に出力する。
【0063】また音声データに欠損がない区間において
も音声編集装置1と同様に、相関処理手段6で入力され
るR音声データとL音声データから音声差分データを求
める。
【0064】そして音声編集装置12では、音声編集装
置1と異なって、R音声補間手段13では、欠損がない
区間におけるR音声データを元に、R音声データが欠損
された区間についてR音声相関データを求め、さらに求
められたR音声相関データが、同じ区間のL音声データ
と欠損がない区間での音声差分での音声差分データとか
ら、L音声データと相関性が保たれたR音声補間データ
を求めてR音声選択手段10に入力する。そしてR音声
データに欠損がある区間においては、R音声補間手段1
3で得られたR音声補間データをR出力端子4から出力
する。
【0065】L音声補間手段14でも同様に欠損がない
区間のL音声データを元に、L音声データが欠損された
区間についてL音声相関データを求め、さらに求められ
たL音声相関データが、同じ区間にR音声データと欠損
がない区間での音声差分データとから、R音声データと
相関性が保たれたL音声補間データを求めてL音声選択
手段11に入力する。そしてL音声データの欠損がある
区間においては、L音声補間手段14で得られたL音声
補間データをL出力端子5から出力する。
【0066】したがって音声データの欠損がある区間に
以前あるいは、以後、もしくは以前と以後に得られる音
声データから求めた音声相関データを、欠損がある区間
における他方の音声データとの相関性が保たれる音声補
間データとすることができる。
【0067】なお相関処理手段9では、まず入力される
R音声データとL音声データを、それぞれ独立に周波数
帯域を制限する帯域制限手段で帯域制限し、その帯域制
限されたR音声データとL音声データとの相関値から音
声差分データを求め、求められた音声差分データを用い
てR音声補間手段7あるいはR音声補間手段13でR音
声補間データを求め、L音声補間手段8あるいはL音声
補間手段14でL音声補間データを求めてもよい。この
場合に、雑音などを除去された帯域や、適切な特徴量の
差が得られる帯域を選択することができ、例えば人が発
する声などでは1kHz付近の帯域から得られる音量の
差分値を音声差分データとすることで、音声の特徴量の
差がよく得られ、欠損区間が生じても左右のステレオ音
声の違和感が少なくなる。
【0068】図8は本発明の第3の実施形態における音
声編集装置のブロック図である。
【0069】図8において、第一音声データを入力端子
801に第二音声データを入力端子802に入力する。
【0070】そして入力端子801に入力した第一音声
データを帯域分割手段805に、入力端子802に入力
した第二音声データを帯域分割手段806に入力する。
【0071】そして帯域分割手段805では、入力され
た音声データを高域成分と低域成分に分割して、高域成
分を高域用音声編集装置807に、低域成分を低域用音
声編集装置808に入力する。
【0072】同様に、帯域分割手段806で帯域分割さ
れた高域成分を高域用音声編集装置807に、低域成分
を低域用音声編集装置808に入力する。
【0073】ここで高域用音声編集装置807および低
域用音声編集装置808は、第1の実施形態における音
声編集装置1または第2の実施形態における音声編集装
置12を、高域用および低域用に調整したものを用いる
ことができる。
【0074】そして高域用音声編集装置807からは、
欠損部分が補間された第一音声データ及び第二音声デー
タの高域成分が出力される。
【0075】同様に低域用音声編集装置808からは、
欠損部分が補間された第一音声データ及び第二音声デー
タの低域成分が出力される。
【0076】帯域合成手段809は高域用音声編集装置
807から第一音声データの高域成分、低域用音声編集
装置808からは第一音声データの低域成分を入力とし
帯域合成を行い第一音声補間データとして出力する。
【0077】また帯域合成手段810は高域用音声編集
装置807から第二音声データの高域成分、低域用音声
編集装置808からは第二音声データの低域成分を入力
とし帯域合成を行い第二音声補間データとして出力す
る。
【0078】そして選択手段811で第一音声データか
第一音声補間データかを選択して、出力端子803に入
力する。
【0079】同様に選択手段812では第二音声データ
か第二音声補間データかを選択して、出力端子804に
入力する。
【0080】ここでは第一音声データと第二音声データ
をそれぞれ複数の帯域に分割して、同じ帯域の音声デー
タを比較することで、それぞれの帯域における音声差分
データが求められる。そして補間処理においても、同じ
帯域における音声差分データと第一音声データ(あるい
第二音声データ)とから第二音声補間データ(あるいは
第一音声データ)が得られる。
【0081】したがって欠損した区間においては、分割
された複数の帯域における音声補間データを合成し、分
割前の帯域に戻した音声補間データとして出力すること
ができる。
【0082】この場合には、特に周波数帯域毎に異なる
相関関係が生じていても、それぞれの帯域における相関
性を保った音声補間データを得ることができる。
【0083】また音声差分データとしては音量の変化を
用いる以外に、ピッチ成分などの特性値を第一音声デー
タと第二音声データで比較したものを音声差分データと
し、欠損がある区間の音声データについて、同じ区間で
欠損がない他方の音声データに対し、欠損がない区間に
おけるそれら特性値を対応させて音声補間データを得る
ようにしてもよい。
【0084】また入力音声データが2チャネルである以
外に、それ以上のチャネル数の音声データの相互の音声
差分データを用い、欠損した音声データ以外のそれぞれ
の音声データとの相関性を高めるようにしてもよい。
【0085】また相関処理手段6において、あらかじめ
音声データ間に所定値以上の強い相関がある場合にの
み、上記の処理によって欠損された区間に音声補間デー
タを用い、音声データ間に相関が所定値より弱い場合に
は異なる処理としてもよい。
【0086】また入力される各々のチャネルに音声デー
タに欠損に対する信頼性(欠損しにくくする設定)を情
報量、処理量、誤り訂正などによって異なるものとし、
一方の信頼性が高い音声データを用いて他方の音声デー
タのみ音声補間データを用いることで、音声データの全
体の情報量や処理量を削除するようにしてもよい。
【0087】また一方の音声データが欠損した区間の前
における特徴量の変化だけでなく、あらかじめ記憶され
ている音声データを用いる場合に、欠損した区間の後の
特徴量の変化も考慮して音声差分データを求めてもよ
い。
【0088】また同時に欠損しない複数の音声区間にお
ける平均化処理や欠損した区間に近いほど高い重み付け
処理を行った音声差分データを用いてもよい。
【0089】また一方の音声データが欠損した区間にお
いて、音声差分データと他方の音声データに加えて、欠
損した音声データの欠損した区間の前や後から予測した
予測音声データも用いて音声補間データを求めてもよ
い。
【0090】また特徴量は音量以外に、遅延時間や、ピ
ッチ周波数などの周波数差などを単独あるいは複合して
音声補間データを求めてもよい。
【0091】
【発明の効果】したがって本発明によれば、複数の音声
データを入力データとする音声編集装置において、一方
の音声データの欠損した区間における音声補間データと
して、同じ区間における他方の欠損していない音声デー
タと相関性が保たれた音声データを用いることができ
る。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における音声編集装置
のブロック図
【図2】本発明の第1の実施形態における音声処理のフ
ローチャート
【図3】音声伝送モデル図
【図4】収録音の音量変化図
【図5】伝送情報のタイムチャート
【図6】再生音声の音量変化図
【図7】本発明の第2の実施形態における音声編集装置
のブロック図
【図8】本発明の第3の実施形態における音声編集装置
のブロック図
【符号の説明】
1 音声編集装置 6 相関処理手段 7 R音声補間手段 8 L音声補間手段 9 判定手段 10 R音声選択手段 11 L音声選択手段 12 音声編集装置 13 R音声補間手段 14 L音声補間手段 805 帯域分割手段 806 帯域分割手段 807 高域用音声編集装置 808 低域用音声編集装置 809 帯域合成手段 810 帯域合成手段 811 選択手段 812 選択手段 813 音声編集装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小野 学 神奈川県横浜市港北区綱島東四丁目3番1 号 松下通信工業株式会社内 Fターム(参考) 5J064 AA01 BB01 BB04 BB12 BC14 BC18 BC21 BC25 BC27 BD01 9A001 BB02 EE05 GG05 HH15 HH34 JJ71 KK43

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 第一音声データの欠損区間を検出する第
    一欠損区間検出手段と、前記第一欠損区間検出手段によ
    り第一音声欠損区間でないと検出された第一音声データ
    第二音声データから、前記第一音声欠損区間における第
    一音声補間データを求める音声補間手段と、前記第一音
    声データと前記第一音声補間データとを選択して出力す
    る第一音声出力手段とを備え、前記第一音声欠損区間で
    は前記第一音声補間データが選択して出力されることを
    特徴とする音声処理装置。
  2. 【請求項2】 第一音声データの特徴量と第二音声デー
    タの特徴量の差をパラメータとして音声差分データを求
    める音声差分データ作成手段と、前記第一音声データが
    欠損した区間である第一音声欠損区間を検出する第一欠
    損区間検出手段と、前記第二音声データと前記音声差分
    データとをパラメータとして第一音声補間データを求め
    る音声補間手段と、前記第一音声データと前記第一音声
    補間データとを選択して出力する第一音声出力手段とを
    備え、前記第一音声欠損区間では、前記第一音声補間デ
    ータが選択して出力されることを特徴とする音声処理装
    置。
  3. 【請求項3】 前記特徴量が少なくとも音量であること
    を特徴とする請求項2に記載の音声処理装置。
  4. 【請求項4】 前記特徴量が少なくとも遅延時間である
    ことを特徴とする請求項2または3に記載の音声処理装
    置。
  5. 【請求項5】 前記音声差分データ作成手段が、前記第
    一音声データの周波数帯域を制限する第一帯域制限手段
    と、前記第二音声データの周波数帯域を前記第一帯域制
    限手段と同じ周波数帯域に制限する第二帯域制限手段と
    を備え、前記制限した周波数帯域における特徴量の差か
    ら前記音声差分データを求めることを特徴とする請求項
    2ないし4のいずれかに記載の音声処理装置。
  6. 【請求項6】 前記第一帯域制限手段が周波数帯域を複
    数の周波数帯域に分割し、前記第二帯域制限手段が前記
    第一帯域制限手段と同じ複数の周波数帯域に分割し、前
    記音声差分データ作成手段が前記分割された周波数帯域
    毎の前記第一音声データの特徴量と前記第二音声データ
    の特徴量の差から求められる複数の特徴量の差を前記音
    声差分データとし前記音声補間手段が前記分割された周
    波数帯域毎の前記第二音声データと、前記音声差分デー
    タとから得られる補間データを前記分割された複数の周
    波数帯域で合成して前記第一音声補間データを求めるこ
    とを特徴とする請求項5に記載の音声処理装置。
  7. 【請求項7】 前記第二音声データが欠損した区間であ
    る第二音声欠損区間を検出する第二欠損区間検出手段を
    さらに備え、前記第一欠損区間検出手段で第一音声デー
    タが欠損せず、かつ前記第二欠損区間検出手段で前記第
    二音声データが欠損されないと、前記音声差分データ作
    成手段が前記第一音声データと前記第二音声データが存
    在する複数の各音声存在区間における前記特徴量の差を
    パラメータとして前記音声差分データを求めることを特
    徴とする請求項2ないし6のいずれかに記載の音声処理
    装置。
  8. 【請求項8】 第一音声データの特徴量と第二音声デー
    タの特徴量の差をパラメータとして音声差分データを求
    める音声差分データ作成手段と、前記第二音声データと
    前記音声差分データとをパラメータとして第一音声補間
    データを求める音声補間手段とを備え、前記第一音声デ
    ータが欠損した第一音声欠損区間において、第一音声欠
    損区間以外における音声差分データと、第一音声欠損区
    間と同じ区間の第二音声データとをパラメータとして得
    られる第一音声補間データを、前記第一音声データに変
    えて出力することを特徴とする音声処理方法。
JP2000110282A 2000-04-12 2000-04-12 音声処理装置および音声処理方法 Pending JP2001296894A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000110282A JP2001296894A (ja) 2000-04-12 2000-04-12 音声処理装置および音声処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000110282A JP2001296894A (ja) 2000-04-12 2000-04-12 音声処理装置および音声処理方法

Publications (1)

Publication Number Publication Date
JP2001296894A true JP2001296894A (ja) 2001-10-26

Family

ID=18622820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000110282A Pending JP2001296894A (ja) 2000-04-12 2000-04-12 音声処理装置および音声処理方法

Country Status (1)

Country Link
JP (1) JP2001296894A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006019117A1 (ja) * 2004-08-19 2006-02-23 Nippon Telegraph And Telephone Corporation 多チャネル信号符号化方法、その復号化方法、これらの装置、プログラム及びその記録媒体
JP2007529020A (ja) * 2003-12-19 2007-10-18 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 多チャンネルオーディオシステムにおけるチャンネル信号隠蔽
JP2008139661A (ja) * 2006-12-04 2008-06-19 Nippon Telegr & Teleph Corp <Ntt> 音声信号受信装置、それに使用される音声パケット消失補償方法、その方法を実施するプログラム、及びそのプログラムを記録した記録媒体
JP2009181050A (ja) * 2008-01-31 2009-08-13 Panasonic Corp Ip電話装置およびそのパケットロス補償方法
WO2009157213A1 (ja) * 2008-06-27 2009-12-30 パナソニック株式会社 音響信号復号装置および音響信号復号装置におけるバランス調整方法
JP2010512078A (ja) * 2006-12-07 2010-04-15 エーケージー アコースティックス ゲーエムベーハー マルチチャネル配列のためのドロップアウトの補償
JP2010102042A (ja) * 2008-10-22 2010-05-06 Ntt Docomo Inc 音声信号出力装置、音声信号出力方法および音声信号出力プログラム
WO2010082471A1 (ja) * 2009-01-13 2010-07-22 パナソニック株式会社 音響信号復号装置及びバランス調整方法
US7835916B2 (en) 2003-12-19 2010-11-16 Telefonaktiebolaget Lm Ericsson (Publ) Channel signal concealment in multi-channel audio systems
JP5147851B2 (ja) * 2007-10-26 2013-02-20 株式会社ディーアンドエムホールディングス オーディオ信号補間装置及びオーディオ信号補間方法
JP2014032411A (ja) * 2013-09-17 2014-02-20 Ntt Docomo Inc 音声信号出力装置、音声信号出力方法および音声信号出力プログラム

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007529020A (ja) * 2003-12-19 2007-10-18 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 多チャンネルオーディオシステムにおけるチャンネル信号隠蔽
JP4723490B2 (ja) * 2003-12-19 2011-07-13 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 多チャンネルオーディオシステムにおけるチャンネル信号隠蔽
US7835916B2 (en) 2003-12-19 2010-11-16 Telefonaktiebolaget Lm Ericsson (Publ) Channel signal concealment in multi-channel audio systems
US7733973B2 (en) 2004-08-19 2010-06-08 The University Of Tokyo Multichannel signal encoding method, its decoding method, devices for these, program, and its recording medium
WO2006019117A1 (ja) * 2004-08-19 2006-02-23 Nippon Telegraph And Telephone Corporation 多チャネル信号符号化方法、その復号化方法、これらの装置、プログラム及びその記録媒体
CN1977309B (zh) * 2004-08-19 2010-11-10 日本电信电话株式会社 多信道信号编码方法、解码方法、用于该方法的装置和程序、以及其上存储程序的记录介质
JP2008139661A (ja) * 2006-12-04 2008-06-19 Nippon Telegr & Teleph Corp <Ntt> 音声信号受信装置、それに使用される音声パケット消失補償方法、その方法を実施するプログラム、及びそのプログラムを記録した記録媒体
JP2010512078A (ja) * 2006-12-07 2010-04-15 エーケージー アコースティックス ゲーエムベーハー マルチチャネル配列のためのドロップアウトの補償
JP5147851B2 (ja) * 2007-10-26 2013-02-20 株式会社ディーアンドエムホールディングス オーディオ信号補間装置及びオーディオ信号補間方法
JP2009181050A (ja) * 2008-01-31 2009-08-13 Panasonic Corp Ip電話装置およびそのパケットロス補償方法
WO2009157213A1 (ja) * 2008-06-27 2009-12-30 パナソニック株式会社 音響信号復号装置および音響信号復号装置におけるバランス調整方法
JPWO2009157213A1 (ja) * 2008-06-27 2011-12-08 パナソニック株式会社 音響信号復号装置および音響信号復号装置におけるバランス調整方法
RU2491656C2 (ru) * 2008-06-27 2013-08-27 Панасоник Корпорэйшн Устройство декодирования звукового сигнала и способ регулирования баланса устройства декодирования звукового сигнала
US8644526B2 (en) 2008-06-27 2014-02-04 Panasonic Corporation Audio signal decoding device and balance adjustment method for audio signal decoding device
JP5425067B2 (ja) * 2008-06-27 2014-02-26 パナソニック株式会社 音響信号復号装置および音響信号復号装置におけるバランス調整方法
JP2010102042A (ja) * 2008-10-22 2010-05-06 Ntt Docomo Inc 音声信号出力装置、音声信号出力方法および音声信号出力プログラム
WO2010082471A1 (ja) * 2009-01-13 2010-07-22 パナソニック株式会社 音響信号復号装置及びバランス調整方法
JP5468020B2 (ja) * 2009-01-13 2014-04-09 パナソニック株式会社 音響信号復号装置及びバランス調整方法
US8737626B2 (en) 2009-01-13 2014-05-27 Panasonic Corporation Audio signal decoding device and method of balance adjustment
JP2014032411A (ja) * 2013-09-17 2014-02-20 Ntt Docomo Inc 音声信号出力装置、音声信号出力方法および音声信号出力プログラム

Similar Documents

Publication Publication Date Title
KR101569032B1 (ko) 오디오 신호의 디코딩 방법 및 장치
US5065432A (en) Sound effect system
JP5149968B2 (ja) スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法
KR102160254B1 (ko) 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
US20050074135A1 (en) Audio device and audio processing method
JP4327886B1 (ja) 音質補正装置、音質補正方法及び音質補正用プログラム
JP7201721B2 (ja) 相関分離フィルタの適応制御のための方法および装置
JP3951690B2 (ja) 符号化装置および方法、並びに記録媒体
WO2010076850A1 (ja) 音場制御装置及び音場制御方法
EP1381254A2 (en) Method and apparatus for producing multi-channel sound
JP2000115883A (ja) オーディオシステム
US8635077B2 (en) Apparatus and method for expanding/compressing audio signal
US8750529B2 (en) Signal processing apparatus
JP2001296894A (ja) 音声処理装置および音声処理方法
JP5328637B2 (ja) マルチチャンネル復号装置、マルチチャンネル復号方法、プログラム及び半導体集積回路
KR101637407B1 (ko) 부가적인 출력 채널들을 제공하기 위하여 스테레오 출력 신호를 발생시키기 위한 장치와 방법 및 컴퓨터 프로그램
US20230254655A1 (en) Signal processing apparatus and method, and program
JP2007329631A (ja) 音響補正装置
JP2010136236A (ja) オーディオ信号処理装置、オーディオ信号処理方法およびプログラム
JP4402632B2 (ja) オーディオ装置
JP2010118978A (ja) 音像定位制御装置および音像定位制御方法
JP2905191B1 (ja) 信号処理装置、信号処理方法および信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体
KR101745019B1 (ko) 오디오 시스템 및 그 제어방법
JP4430105B2 (ja) 音響再生装置
JP5224586B2 (ja) オーディオ信号補間装置