JP2010266778A - 再生装置 - Google Patents
再生装置 Download PDFInfo
- Publication number
- JP2010266778A JP2010266778A JP2009119513A JP2009119513A JP2010266778A JP 2010266778 A JP2010266778 A JP 2010266778A JP 2009119513 A JP2009119513 A JP 2009119513A JP 2009119513 A JP2009119513 A JP 2009119513A JP 2010266778 A JP2010266778 A JP 2010266778A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- circuit
- sound
- point
- end point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
【解決手段】音声データを一区切り毎にブロック化して音声固まりを作り、その音声信号が有声音か無声音か無音かを識別して、音声が始まった位置を始端点とする。有声音の場合には終端に近い複数の音声波形のピーク値から推定近似線を用いて時間軸上にみなし終端点を決定し、無声音の場合にはレベル検出により終端点を決定することにより、有声音に含まれる無音部分と、無声音に含まれる聴感上では短縮できる無声部分と無音部分、音声データが存在しない無音とをカットし、再び音声信号をつなぎ合わせる。
【選択図】図1
Description
また特許文献2に記載されているように、音声区間と無音区間との識別を行い、有声音および無音と判別された音声信号については時間軸を圧縮し、無声音と判別された音声信号については時間軸を圧縮しないか、もしくは時間軸の圧縮比率に比べて低い圧縮率で時間軸圧縮を行う構成になっている。中には、音声区間と無音区間との識別を行い、無音区間は削除させ音声区間をピッチ同期による伸長圧縮制御を行ったり、または再生速度に応じて間引く処理を切り替えるように構成したものもある。
請求項2に記載の発明は、前記音声信号結合回路から出力される音声出力を保存する記憶回路を備えたものであり、音声データをカットすることにより、記憶するために必要な記憶容量を低減できるという作用を有する。
また、作り出された音声信号を、短縮された音声信号の形で記憶回路に保存することにより、記憶するために必要な記憶容量を低減できるという有利な効果が得られる。
図1は本発明の第1の実施の形態における再生装置の信号処理部分のブロック構成図を示し、図2は同じく第1の実施の形態における音声識別され区間割された音声信号波形図、
図3は同じく第1の実施の形態における信号合成後の音声出力波形、図4は同じく第1の実施の形態におけるみなし終端点を推定算出するための近似線関係図である。
図1において、1は音声入力、2は始端点用レベル検出回路、3は音声性質識別回路、4は音声ブロック化回路、5は有声音の信号経路、6は無声音の信号経路、7は無音の信号経路、8は音声信号ピーク検出回路、9はみなし終端点推定回路、10は終端点用レベル検出回路、11は音声区間カット回路、12は音声信号接合回路、13は音声出力で構成している。
音声性質識別回路3では、そのブロック化された音声信号の固まりの周波数成分や音声レベルを判断して、音声データの一ブロックが有声音か無声音あるいは無音かを識別する。
図2の上段部に示す音声ブロック化回路による分類のように、ポイントAまでは無音、ポイントAからDは有声音、ポイントDからGまでは無声音、ポイントGからKまでを有声音というようにまず分類を実施する。無音を判別するには、音声信号の有る無しを判断することで無音を認識できる。有声音か無声音かを判断するためには、その音声信号を構成する周波数と音声レベルとで判断が必要であり、一般的に高い周波数の低いレベルの波形が連続している場合は無声音であり、レベル変動を伴って低い周波数の波形で構成されているものは、有声音である。無声音、有声音を識別する方法に関しては、非常にたくさんの技術的資料や特許などが公開されており、本発明の主目的ではないため、ここでは省略する。
本第1の実施例では、有声音内に含まれる無声音部分と有声音間のわずかな無音部分についてはカットが行われていないが、更に短縮された音声信号を作り出すために検出しカットすることも可能である。この場合、図2に記載しているポイントMからBの区間、ポイントNからHの区間のカットを行うこととなる。
ここで、図4を用いて、先に述べた有声音の場合のみなし終端点の決定方法について説明する。無声音の場合は低いレベルで緩やかにレベルの減衰から音声が収束するが、有声音の場合は、それとは大きく異なった減衰となり、特に標準的な有声音のほとんどの減衰は、以下の特徴を持っている。まず減衰を開始する複数のピーク値の推定近似線の延長線上と時間軸との交点の角度をα、更に減衰が進んで終端側に寄った複数のピーク値によって作られる近似線の延長線上と時間軸との交点の角度をβとすると、β>αとなっている。つまり2段目の推定近似線の前に現れる減衰を開始した箇所の推定近似線の延長線上と時間軸との交点以降に音声信号が残ってしまうことはない。この交点をみなし終端点として、先の音声信号をカットするポイントとして使用すると、違和感のない合成後の音を再現できる。なぜこのポイントが良いのかは明確にはわからないが、多数の音声信号の加工を行い、試聴を繰り返し行った結果からその効果を確認した。また、複数の音声信号の波形を実際に確認し、推定近似線を形成するピーク値は、3〜5ポイントを用いた場合、良好な終端点を求めやすいデータとなった。
また、音声信号はその性質上、それを構成する周波数成分およびピーク値は、リニアではなく、振られた成分を持っている。そのため、厳格に波形のピーク点を追い求めて近似線を引いた場合、求めようとするみなし終端点を見つけられない場合が考えられる。このように、みなし終端点を算出する時のピーク値に対しては、あいまい度を含んだ判定方法が必要となる。
本第1の実施形態の説明では、図形による推定近似線を用いて行ったが、その具体的な近似の作成方法として、1次線形補間による近似線の作成を用いることにより、デジタル的な処理で終端点をもとめることもできる。
2 始端点用レベル検出回路
3 音声性質識別回路
4 音声ブロック化回路
5 有声音の信号経路
6 無声音の信号経路
7 無音の信号経路
8 音声信号ピーク検出回路
9 みなし終端点推定回路
10 終端点用レベル検出回路
11 音声区間カット回路
12 音声信号接合回路
13 音声出力
Claims (4)
- 音声を構成する有声音と無声音と無音とからなる音を再生もしくは録音再生する装置であって、
レベル検出により音声信号データが存在することを検出し始端点を決定する始端点用レベル検出回路と、
音声データの一ブロックが有声音か無声音あるいは無音かを識別する音声性質識別回路と、
前記音声性質識別回路で識別された音声データを一区切り毎にブロック化して音声固まりを決める音声ブロック化回路と、
前記音声性質識別回路で判定された音声データブロックが有声音の場合には、その音声波形の終端に近い複数の波形のピーク値を検出する音声信号ピーク検出回路と、
前記複数のピーク値の包絡線によって作る推定近似線からみなし終端点を推定するみなし終端点推定回路と、
前記音声性質識別回路で判定された音声データブロックが無声音の場合には、レベル検出により音声データが終了したことを検出する終端点用レベル検出回路と、
前記みなし終端点推定回路や終端点用レベル検出回路で決定された始端点と終端点の情報を元に音声信号のデータをカットする音声区間カット回路と、
カットした後の音声データをつなぎ合わせて生成し直す音声接合回路とを備え、
有声音の場合には前記みなし終端点推定回路で決定された終端点から前記始端点用レベル検出回路で決定される次の固まりの始端点までの期間の音声データをカットし、無声音の場合には前記終端点用レベル検出回路で決定された終端点から前記始端点用レベル検出回路で決定される次の固まりの始端点までの期間の音声データをカットし、無音の区間はすべてをカットする制御を行い再びつなぎ合わせることにより、言葉と言葉の間隙や1つの言葉の中に発生する無音部分および無声音に含まれる聴感上では短縮できる無声部分を削除して、違和感の少ない短縮された音声信号を作り出すことを特徴とする再生装置。 - 前記音声信号結合回路から出力される音声出力を保存する記憶回路を備え、
音声データをカットすることにより、記憶するために必要な記憶容量を低減したことを特徴とする請求項1記載の再生装置。 - 前記みなし終端点推定回路は、一次線形補間により推定される近似線を用いてみなし終端点を求めることを特徴とする請求項1記載の再生装置。
- 信号を判別して処理を行う時間と前期音声区間カット回路との処理のずれが起きないようにするため、音声入力と音声区間カット回路との間に、遅延回路を付加したことを特徴とする請求項1記載の再生装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009119513A JP5326796B2 (ja) | 2009-05-18 | 2009-05-18 | 再生装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009119513A JP5326796B2 (ja) | 2009-05-18 | 2009-05-18 | 再生装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010266778A true JP2010266778A (ja) | 2010-11-25 |
JP5326796B2 JP5326796B2 (ja) | 2013-10-30 |
Family
ID=43363777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009119513A Expired - Fee Related JP5326796B2 (ja) | 2009-05-18 | 2009-05-18 | 再生装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5326796B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021525903A (ja) * | 2018-05-31 | 2021-09-27 | シュアー アクイジッション ホールディングス インコーポレイテッドShure Acquisition Holdings,Inc. | 自動ミキシング用のインテリジェント音声起動のためのシステムおよび方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000305580A (ja) * | 1999-04-23 | 2000-11-02 | Roland Corp | 無音判別方法、無音判別装置およびコンピュータ読み取り可能な記録媒体 |
JP2001154684A (ja) * | 1999-11-24 | 2001-06-08 | Anritsu Corp | 話速変換装置 |
WO2006077626A1 (ja) * | 2005-01-18 | 2006-07-27 | Fujitsu Limited | 話速変換方法及び話速変換装置 |
JP2008203421A (ja) * | 2007-02-19 | 2008-09-04 | Animo:Kk | 話速変換プログラム、方法及び装置 |
-
2009
- 2009-05-18 JP JP2009119513A patent/JP5326796B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000305580A (ja) * | 1999-04-23 | 2000-11-02 | Roland Corp | 無音判別方法、無音判別装置およびコンピュータ読み取り可能な記録媒体 |
JP2001154684A (ja) * | 1999-11-24 | 2001-06-08 | Anritsu Corp | 話速変換装置 |
WO2006077626A1 (ja) * | 2005-01-18 | 2006-07-27 | Fujitsu Limited | 話速変換方法及び話速変換装置 |
JP2008203421A (ja) * | 2007-02-19 | 2008-09-04 | Animo:Kk | 話速変換プログラム、方法及び装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021525903A (ja) * | 2018-05-31 | 2021-09-27 | シュアー アクイジッション ホールディングス インコーポレイテッドShure Acquisition Holdings,Inc. | 自動ミキシング用のインテリジェント音声起動のためのシステムおよび方法 |
US11798575B2 (en) | 2018-05-31 | 2023-10-24 | Shure Acquisition Holdings, Inc. | Systems and methods for intelligent voice activation for auto-mixing |
JP7422685B2 (ja) | 2018-05-31 | 2024-01-26 | シュアー アクイジッション ホールディングス インコーポレイテッド | 自動ミキシング用のインテリジェント音声起動のためのシステムおよび方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5326796B2 (ja) | 2013-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4630876B2 (ja) | 話速変換方法及び話速変換装置 | |
CA2253749C (en) | Method and device for instantly changing the speed of speech | |
US8045571B1 (en) | Adaptive jitter buffer-packet loss concealment | |
CN108198548A (zh) | 一种语音唤醒方法及其系统 | |
JP2009048676A (ja) | 再生装置および方法 | |
KR20160023830A (ko) | 품질 제어를 이용하는 오디오 디코더, 방법 및 컴퓨터 프로그램 | |
JP4460580B2 (ja) | 速度変換装置、速度変換方法及びプログラム | |
JP2008076776A (ja) | データ記録装置、データ記録方法及びデータ記録プログラム | |
JP4965371B2 (ja) | 音声再生装置 | |
JP5326796B2 (ja) | 再生装置 | |
JP2001296894A (ja) | 音声処理装置および音声処理方法 | |
JPWO2009090705A1 (ja) | 記録再生装置 | |
JP3378672B2 (ja) | 話速変換装置 | |
JP2009075280A (ja) | コンテンツ再生装置 | |
JPH08146985A (ja) | 話速制御システム | |
JP4580297B2 (ja) | 音声再生装置、音声録音再生装置、およびそれらの方法、記録媒体、集積回路 | |
JP6409163B2 (ja) | 音声処理装置、音声処理プログラムおよび音声処理方法 | |
JP4212253B2 (ja) | 話速変換装置 | |
JP2009210712A (ja) | 音処理装置およびプログラム | |
JP2867744B2 (ja) | 音声再生装置 | |
JPH0854895A (ja) | 再生装置 | |
JP5956936B2 (ja) | 音声データ再生速度変換方法および音声データ再生速度変換装置 | |
WO1997009713A1 (fr) | Procede de traitement de signal audio en vue d'une reproduction fidele et a vitesse variable | |
US20200365170A1 (en) | Voice processing method, voice processing device, and recording medium | |
JP2008145841A (ja) | 再生装置、再生方法、信号処理装置、信号処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120125 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20121217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130625 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130708 |
|
LAPS | Cancellation because of no payment of annual fees |