JP2005208173A - 話速変換装置及び音声信号伝送システム - Google Patents
話速変換装置及び音声信号伝送システム Download PDFInfo
- Publication number
- JP2005208173A JP2005208173A JP2004012395A JP2004012395A JP2005208173A JP 2005208173 A JP2005208173 A JP 2005208173A JP 2004012395 A JP2004012395 A JP 2004012395A JP 2004012395 A JP2004012395 A JP 2004012395A JP 2005208173 A JP2005208173 A JP 2005208173A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- speed conversion
- speech speed
- stereo
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】 左右チャネルの入力音声信号L0,R0が入力されると、信号分離部1が、左右チャネルに含まれている同相成分信号Cv'と、各入力音声信号L0,R0から前記同相成分信号Cv'を除いた背景音信号Lb',Rb'に分離する。同相成分信号Cv'には左右チャネルの中央に定位する話者音声信号が含まれており、フィルタ2によって話者音声信号Cvを抽出する。話者音声信号Cvには話速変換部3によって話速変換処理が施され、その処理後の話者音声信号Vが左右チャネルの各加算器4a,4bによって信号分離部1で分離した背景音信号Lb',Rb'に加算される。
【選択図】図1
Description
また、外国語学習においては、実際の会話によるコミュニケーション能力の向上を図るためにリスニング学習が非常に重要であるが、初級の学習者の場合には、話者の発話速度についてゆけず、各種記録媒体に録音されたスピーチ音声を繰り返して聴くという従来型の単純な学習方式では不十分であることが指摘されている。
そこで、最近では、DSP(Digital Signal Processor)等を利用した話速変換技術が研究されており、音声信号自体を処理することによって、通常の発話速度の音声であっても、話者が恰もゆっくり話したかのように自然な音質で聴取できるシステムが実用化されつつある。
そして、前記の基本的処理に関連して、話速を任意の速度で変化させながら自然な音声を得るために、有声音と無声音の振幅や時間の伸長、無音時間の挿入等の信号処理に係る研究が様々な観点から行われており、例えば、下記特許文献1〜8等において多数の提案がなされている。
図4の回路構成は、入力はステレオ方式であるがモノラル出力とする場合であり、左右チャネルの音声信号L0,R0を加算器101で加算して話速変換部102へ入力させ、話速変換部102で話速変換処理が施された後のモノラル信号(L0+R0)'を左右チャネルに分けているだけである。即ち、図7における[原音]の欄に示すステレオ音声信号の入力に対して、同図の<モノラル処理>の欄に示す話速変換部入力は左右チャネルの音声信号が加算されたものになり、左右の出力は話速変換処理後の同一信号になっている。
図5の回路構成は、入力も出力もステレオ方式の信号とする場合であり、左右チャネルの音声信号L0,R0を加算器103で加算して話速変換分析部104へ入力させ、話速変換分析部104ではその入力信号L0+R0の分析に基づいて得られる制御信号(CONT)を左右チャネルに設けた話速変換合成部105,106へ出力する。各話速変換合成部105,106では、前記制御信号を用いて左右チャネルの入力音声信号L0,R0に含まれている話者音声の入力タイミングを検出しながら話速変換処理を行い、左右チャネルについて独立に話速変換した音声信号(L0)',(R0)'を出力させる。即ち、図7における[原音]の欄に示すステレオ音声信号の入力に対して、同図の<ステレオ対応処理>の欄に示す話速変換分析部入力は前記<モノラル処理>の場合と同様であるが、左右チャネル出力にはそれぞれの入力音声信号に対応した話速変換が施されている。
この話速変換装置は、図6に示すような回路構成を有しており、左右チャネルの各入力音声信号L0,R0を加算器107で加算した信号を求めると共に、減算器(特許文献9では「ボイスチェンジャー」とされている)108で左チャネルの信号から右チャネルの信号を差し引いた信号を求める。
今、話者音声が同相信号として左右チャネルに含まれている(話者音声が中央に定位している)とすると、加算器107の出力信号では同相成分同士の話者音声信号は2倍に強調され、減算器108の出力信号では話者音声信号はキャンセルされることになる。
従って、加算器107の出力信号を減衰器109で1/2に減衰させた後、減算器110で減衰器109の出力信号から減算器108の出力信号を減算すると背景音信号がキャンセルされた話者音声信号Cv'のみが出力される。
そして、この装置では減算器110が出力する話者音声信号Cv'に対して話速変換部111で話速変換処理を行い、加算器112によって話速変換処理後の信号Vに減算器108の出力を加算することで、話者音声に話速変換を施したモノラルの音声信号L0−R0+Vを出力する。
図4の構成の場合には、話者音声信号以外の背景音信号にも話速変換処理がなされるために入力音声信号に含まれている情報の多くが失われるが、この話速変換装置では、話者音声信号を背景音信号から分離した上で話速変換処理を行っており、話速変換の精度が高くなり、再生音の品質を向上させることができる。
図5の話速変換装置はステレオ出力方式であるが、左右チャネルの加算信号に基づいた分析に基づいて制御信号を作成しているために話者音声信号以外の背景音信号にも話速変換処理がなされる場合があり、あまり精度の高い話速変換は望めない。また、話速変換分析部104や話速変換合成部105,106に要するメモリ容量が大きくなり(モノラル処理の場合と比較して約2倍)、回路規模も大きくなって装置の製造コストが非常に高くなるという問題がある。
そこで、本発明は、前記の各問題点に鑑みて、簡単な回路構成で高精度な話速変換処理を可能にした入出力ステレオ方式の話速変換装置を提供することを目的として創作された。また、本発明は、その話速変換装置を利用したステレオ音声信号の伝送システムも提供する。
ここで、同相信号成分は左右チャネルの中央に定位する音声に係る信号成分であり、話者音声がある場合にはその音声信号に相当する。
帯域制限フィルタ手段は、同相成分信号に背景音信号が混入している可能性があるため、話者音声帯域の信号だけを抽出する機能を有している。
話速変換手段による処理は、帯域制限フィルタ手段を通過した話者音声信号に対して行われるため、高精度な話速変換が可能になる。
そして、左右チャネル用の各加算手段によって、信号分離手段が分離した左右チャネルの背景音信号に対して話速変換処理後の信号を加算すると、話者音声だけが話速変換されたステレオ方式の出力信号が得られる。
尚、多重化方式には、周波数分割多重化方式、時分割多重化方式、パケット多重化方式、ATM(非同期転送モード)多重化方式等があるが、いずれを採用してもよい。
また、話速変換機能をモノラル出力処理と同等のメモリ容量の小規模な回路構成で実現し、安価な話速変換装置を提供する。
本発明の音声信号伝送システムによれば、受信・再生装置側において、話者音声を通常の話速と話速変換処理を施した遅い話速に選択的に切り換えて聴くことができ、乗り物内や老人ホーム等の案内放送に適用することにより、外国語のヒヤリングに苦手な人と問題の無い人が混在していたり、難聴者と非難聴者が混在しているような場合であっても、両者に適切な音声サービスを行うことを可能にする。
[実施形態1]
この実施形態は話速変換装置に係るものであり、その基本的構成は図1に示される。
先ず、入力音声信号はステレオ方式であって、左右チャネルの音声信号L0,R0はそれぞれ背景音信号Lb,Rbと話者音声信号Cvとからなり、話者音声信号Cvは中央に定位した音源の信号として左右チャネルで同相になっている。
この信号分離部1には、Dolby Pro Logicシステムにおける信号分離回路やカラオケのボーカルマスキングで用いられている公知技術を適用できるが、この実施形態では図2に示す回路構成を採用しており、その一部に図6に示した話速変換装置における話者音声信号Cv'を得るまでの回路部分を利用している。
即ち、図2において点線で囲んだ部分がその回路部分に相当し、同部分の機能については既に説明していることから、ここではその説明を省略する。
この信号分離部1では、前記回路部分の出力として話者音声信号Cv'が得られているが、左右チャネル用の減算器1a,1bが設けられており、各減算器1a,1bによって左右チャネルの各入力音声信号L0,R0から前記話者音声信号Cv'をそれぞれ減算し、結果的に左右チャネルの各背景音信号Lb',Rb'を得ている。
このフィルタ2を設けたのは、信号分離部1では同相成分信号を話者音声信号Cv'として分離しているため、僅かではあるがその話者音声信号Cv'には背景音信号が含まれているからである。
そして、各加算器4a,4bには信号分離部1で分離した各背景音信号Lb',Rb'も入力されており、話速変換処理後の話者音声信号と各背景音信号Lb',Rb'とが加算され、各加算器4a,4bからはそれぞれ左右チャネルの加算信号Lb'+V,Rb'+Vが出力される。
但し、この場合、[原音]で示されている左入力の「い・ち・に・さ・ん」と右入力の「よ・ん・ご・ろ・く」の各音は背景音であり、「な・な・は・ち・く」だけが話者音声に相当する同相音である。
従って、信号分離部1は、「い・ち・に・さ・ん」/「よ・ん・ご・ろ・く」の音声信号が入力されている時間帯では、それらを左右チャネルの各背景音信号Lb',Rb'として出力するが、それらは同相成分の信号ではないために話者音声信号Cv'は殆ど出力されない状態にあり、フィルタ2を通過して話速変換部3へ入力される信号Cvは0レベルとなる。
一方、同相音である話者音声「な・な・は・ち・く」については、信号分離部1が話者音声信号Cv'として出力し、フィルタ2を経て話速変換部3において話速変換処理が施され、左右チャネルの加算器4a,4bにおいて信号分離部1が出力している各背景音信号Lb',Rb'に加算される。
即ち、各背景音信号Lb',Rb'は予め原音から「な・な・は・ち・く」の話者音声信号を除去したものになっており、その話者音声信号が除去された時間帯に話速変換処理を施して発話速度が遅くなった話者音声信号が加算されることになる。
また、この話速変換装置ではステレオ方式の入出力でありながら、モノラル出力の場合と同様に話速変換部3は1つだけであり、小規模な回路構成で比較的安価に製造することができる。
この実施形態は実施形態1の話速変換装置を用いた音声信号伝送システムに係り、そのシステム構成図は図3に示される。
同図において、20は旅客機内の案内放送システムの送信装置、30-1〜nは放送を受信してイヤホンで聴取する受信・再生装置であり、送信装置20が放送信号を出力する伝送路40にn個の各受信・再生装置30-1〜nが接続されている。
前置処理部21aは、入力音声信号L0,R0をPCM(Pulse Code Modulation)方式で変調し、圧縮と伝送符号化処理を施して多重化器23へ出力する。
また、前置処理部21bは、話速変換装置22の出力音声信号Lb'+V,Rb'+Vについて前記と同様の変調・圧縮・伝送符号化処理を施して多重化器23へ出力する。
そして、多重化器23は各前置処理部21a,21bから入力された伝送データを時分割多重化して伝送路へ出力する。
そして、受信音声選択スイッチの操作によって、通常のステレオ放送と話速変換処理を施したステレオ放送のいずれを受信するかが選択されると、前記MUXを制御して選択側の放送信号に係る伝送チャネルから放送信号を再生回路に取り込み、再生回路がステレオ方式のイヤホンによって音声出力させるようになっている。
Claims (2)
- 入力されるステレオ音声信号を、左右チャネルに含まれる同相成分信号と、前記各チャネル信号から前記同相成分信号を除去した各背景音信号とに分離する信号分離手段と、
前記信号分離手段が分離した前記同相成分信号中の話者音声信号だけを通過させる帯域制限フィルタ手段と、
前記帯域制限フィルタ手段が通過させた話者音声信号に対して話速変換処理を施す話速変換手段と、
前記信号分離手段が分離した前記各背景音信号に対して前記話速変換手段が話速変換処理を施した後の信号をそれぞれ加算することにより話速変換処理を施したステレオ音声信号を出力する加算手段と
を具備したことを特徴とする話速変換装置。 - 送信装置が伝送路を介して受信・再生装置へ音声信号を配信する音声信号伝送システムにおいて、
前記送信装置側は、入力されるステレオ音声信号と、そのステレオ音声信号に対して前記請求項1に記載の話速変換装置によって話速変換処理を施したステレオ音声信号とを多重化して前記伝送路へ送出し、
前記受信・再生装置は、前記2種類のステレオ音声信号が多重化された伝送信号からいずれのステレオ音声信号を受信するかを選択するための選択手段を備え、その選択手段で選択した方のステレオ音声信号を再生することを特徴とする音声信号伝送システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004012395A JP2005208173A (ja) | 2004-01-20 | 2004-01-20 | 話速変換装置及び音声信号伝送システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004012395A JP2005208173A (ja) | 2004-01-20 | 2004-01-20 | 話速変換装置及び音声信号伝送システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005208173A true JP2005208173A (ja) | 2005-08-04 |
Family
ID=34898779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004012395A Pending JP2005208173A (ja) | 2004-01-20 | 2004-01-20 | 話速変換装置及び音声信号伝送システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005208173A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007293214A (ja) * | 2006-04-27 | 2007-11-08 | Mitsubishi Electric Corp | 話速変換装置及びテレビジョン受像機並びに話速変換方法 |
JP2014095751A (ja) * | 2012-11-07 | 2014-05-22 | Nippon Hoso Kyokai <Nhk> | 受信機、受信方法及びプログラム |
CN108492819A (zh) * | 2018-03-30 | 2018-09-04 | 浙江吉利控股集团有限公司 | 语言练习方法、装置、智能车载终端及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0555697U (ja) * | 1991-12-20 | 1993-07-23 | 株式会社ケンウッド | ボイスキャンセル回路 |
JPH0560100U (ja) * | 1992-01-27 | 1993-08-06 | クラリオン株式会社 | 音響再生装置 |
JPH06153300A (ja) * | 1990-12-17 | 1994-05-31 | Toshiba Corp | ステレオ信号処理装置 |
JP2000341652A (ja) * | 1999-05-27 | 2000-12-08 | Matsushita Electric Ind Co Ltd | ディジタル放送用聴覚補償方法およびそれに用いる受信装置 |
JP2001069597A (ja) * | 1999-06-22 | 2001-03-16 | Yamaha Corp | 音声処理方法及び装置 |
JP3332659B2 (ja) * | 1995-05-25 | 2002-10-07 | 三洋電機株式会社 | 話速変換装置 |
JP2003244081A (ja) * | 2002-02-13 | 2003-08-29 | Nippon Hoso Kyokai <Nhk> | シルバー音声サービス方法および受信機 |
-
2004
- 2004-01-20 JP JP2004012395A patent/JP2005208173A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06153300A (ja) * | 1990-12-17 | 1994-05-31 | Toshiba Corp | ステレオ信号処理装置 |
JPH0555697U (ja) * | 1991-12-20 | 1993-07-23 | 株式会社ケンウッド | ボイスキャンセル回路 |
JPH0560100U (ja) * | 1992-01-27 | 1993-08-06 | クラリオン株式会社 | 音響再生装置 |
JP3332659B2 (ja) * | 1995-05-25 | 2002-10-07 | 三洋電機株式会社 | 話速変換装置 |
JP2000341652A (ja) * | 1999-05-27 | 2000-12-08 | Matsushita Electric Ind Co Ltd | ディジタル放送用聴覚補償方法およびそれに用いる受信装置 |
JP2001069597A (ja) * | 1999-06-22 | 2001-03-16 | Yamaha Corp | 音声処理方法及び装置 |
JP2003244081A (ja) * | 2002-02-13 | 2003-08-29 | Nippon Hoso Kyokai <Nhk> | シルバー音声サービス方法および受信機 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007293214A (ja) * | 2006-04-27 | 2007-11-08 | Mitsubishi Electric Corp | 話速変換装置及びテレビジョン受像機並びに話速変換方法 |
JP4680122B2 (ja) * | 2006-04-27 | 2011-05-11 | 三菱電機株式会社 | 話速変換装置及びテレビジョン受像機並びに話速変換方法 |
JP2014095751A (ja) * | 2012-11-07 | 2014-05-22 | Nippon Hoso Kyokai <Nhk> | 受信機、受信方法及びプログラム |
CN108492819A (zh) * | 2018-03-30 | 2018-09-04 | 浙江吉利控股集团有限公司 | 语言练习方法、装置、智能车载终端及存储介质 |
CN108492819B (zh) * | 2018-03-30 | 2020-07-07 | 浙江吉利控股集团有限公司 | 语言练习方法、装置、智能车载终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4939933B2 (ja) | オーディオ信号符号化装置及びオーディオ信号復号化装置 | |
JP6645437B2 (ja) | 音響再生装置 | |
CN101356573B (zh) | 对双耳音频信号的解码的控制 | |
TW201010450A (en) | Apparatus and method for generating audio output signals using object based metadata | |
KR20140028094A (ko) | 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치 | |
KR20000010930A (ko) | 음성 속도 변환 방법 및 그 장치 | |
CN101421779A (zh) | 用于产生环境信号的设备和方法 | |
JP2005352396A (ja) | 音響信号符号化装置および音響信号復号装置 | |
US20050004791A1 (en) | Perceptual noise substitution | |
WO2000019415A3 (en) | Method and apparatus for three-dimensional audio display | |
WO2008006108A2 (en) | Systems and methods for multi-dialog surround audio | |
EP2268064A1 (en) | Device and method for converting spatial audio signal | |
US7920708B2 (en) | Low computation mono to stereo conversion using intra-aural differences | |
JP2000059893A (ja) | 音声聴取補助装置および方法 | |
JP2005208173A (ja) | 話速変換装置及び音声信号伝送システム | |
CN1478371A (zh) | 音频信号处理装置 | |
JPH02196373A (ja) | 音声送受信装置 | |
JP4167346B2 (ja) | ディジタル放送用聴覚補償方法およびそれに用いる受信装置 | |
Kelly et al. | The continuity illusion revisited: coding of multiple concurrent sound sources | |
JP2003264899A (ja) | 情報提示装置および情報提示方法 | |
KR20070081735A (ko) | 오디오 신호의 인코딩/디코딩 방법 및 장치 | |
JP2003244081A (ja) | シルバー音声サービス方法および受信機 | |
JP2006270649A (ja) | 音声・音響信号処理装置およびその方法 | |
JPH05227112A (ja) | ディジタルオーディオ信号伝送方法および装置 | |
JP6204684B2 (ja) | 音響信号再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060630 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090316 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100204 |