JP6451143B2 - 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム - Google Patents
音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム Download PDFInfo
- Publication number
- JP6451143B2 JP6451143B2 JP2014167743A JP2014167743A JP6451143B2 JP 6451143 B2 JP6451143 B2 JP 6451143B2 JP 2014167743 A JP2014167743 A JP 2014167743A JP 2014167743 A JP2014167743 A JP 2014167743A JP 6451143 B2 JP6451143 B2 JP 6451143B2
- Authority
- JP
- Japan
- Prior art keywords
- correction
- input signal
- signal
- band
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
後述する全ての実施形態において、拡張する対象を人間の音声であるとし、入力信号における帯域である入力帯域は0Hz〜4kHz(又は300Hz〜3.4kHz)の帯域を有することを前提とする。しかし、本発明は、これに限定されず、例えば0Hz〜24kHzの帯域を有する音楽信号を帯域拡張対象とする場合こともでき、周波数に関する数値を音楽信号用に設定し直すことで、本発明を適用することができる。
以下、本発明による音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラムの第1の実施形態を、図面を参照しながら説明する。
図1は、第1の実施形態に係る音声帯域拡張装置の構成を示す機能ブロック図である。ここで、第1の実施形態の音声帯域拡張装置は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(音声帯域拡張プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図1で表すことができる。
次に、第1の実施形態の音声帯域拡張装置100の動作を説明する。
第1の実施形態によれば、前処理によって入力信号の周波数特性が変形させられている場合にも、入力信号を目標特徴量に基づいて補正し、広帯域化に用いる特徴量を補正した信号から抽出するようにしたので、広帯域化処理が前処理の影響を受け難くなり、明瞭性の高い広帯域化信号を生成することができる。
次に、本発明による音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラムの第2の実施形態を、図面を参照しながら説明する。
次に、本発明による音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラムの第3の実施形態を、図面を参照しながら説明する。
次に、本発明による音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラムの第4の実施形態を、図面を参照しながら説明する。
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
Claims (12)
- 入力信号の成分が存在しない周波数帯域に信号成分を追加して周波数帯域を拡張する音声帯域拡張装置において、
上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、
抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、
上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、
上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段と、
上記補正特徴量に基づいて上記入力信号の帯域を拡張して広帯域化信号を生成する広帯域化手段と
を備えることを特徴とする音声帯域拡張装置。 - 上記特徴量の少なくとも1つ、又は、上記補正特徴量の少なくとも1つが、上記入力信号の異なる2つの周波数帯域の振幅において、高域側の振幅を低域側の振幅で除した比である入力帯域振幅比であることを特徴とする請求項1に記載の音声帯域拡張装置。
- 上記特徴量の少なくとも1つ、又は、上記補正特徴量の少なくとも1つが、上記入力信号の2階差分の振幅又はパワーを、入力信号の振幅又はパワーで除したModGIであることを特徴とする請求項1に記載の音声帯域拡張装置。
- 上記特徴量の少なくとも1つ、又は、上記補正特徴量の少なくとも1つが、上記入力信号を2つ以上のサブバンドに帯域分割した各サブバンドの振幅又はパワーであるサブバンドパワーであることを特徴とする請求項1に記載の音声帯域拡張装置。
- 上記入力信号補正手段は、上記入力信号の周波数特性を、補正情報に基づいて直接操作するものであることを特徴とする請求項1〜請求項4のいずれかに記載の音声帯域拡張装置。
- 上記入力信号補正手段は、上記補正情報に基づいて、補正雑音を生成する補正雑音生成手段と、上記入力信号に上記補正雑音を加算する補正雑音加算手段とを有することを特徴とする請求項1〜請求項4のいずれかに記載の音声帯域拡張装置。
- 上記入力信号が音声区間であるか否かを判定する音声区間検出手段をさらに備え、
上記補正情報算出手段は、上記入力信号が音声区間でない場合に限り上記補正情報を形成、更新することを特徴とする請求項1〜請求項6のいずれかに記載の音声帯域拡張装置。 - 上記入力信号が音声区間である場合に限り上記入力信号に基づいて上記補正情報を修正する補正情報修正手段をさらに備え、
上記入力信号補正手段は、上記補正情報修正手段で修正された上記補正情報に基づいて上記入力信号を補正することを特徴とする請求項7に記載の音声帯域拡張装置。 - 上記補正情報修正手段は、上記補正情報のうち補正の大きさに関する補正量を修正するものであって、
上記入力信号の振幅の長期平均値を算出し、
上記入力信号の振幅を上記長期平均値で除して正規化振幅を算出し、
上記正規化振幅が第1の閾値より小さい場合には上記補正情報を修正せず、
上記正規化振幅が上記第1の閾値以上かつ第2の閾値より小さい場合には、上記補正量に、予め定められた修正重み係数と上記正規化振幅を乗じることで修正し、
上記正規化振幅が上記第2の閾値以上の場合には上記補正量に上記修正重み係数と上記第2の閾値を乗じることで修正する
ことを特徴とする請求項8に記載の音声帯域拡張装置。 - 入力信号に成分が存在しない周波数帯域に信号成分を追加して周波数帯域を拡張する音声帯域拡張プログラムであって、
コンピュータを、
上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、
抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、
上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、
上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段と、
上記補正特徴量に基づいて上記入力信号の帯域を拡張して広帯域化信号を生成する広帯域化手段と
して機能させることを特徴とする音声帯域拡張プログラム。 - 入力信号の周波数特性に関する1つ以上の特徴量を抽出する音声特徴量抽出装置において、
上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、
抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、
上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、
上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段と
を備えることを特徴とする音声特徴量抽出装置。 - 入力信号の周波数特性に関する1つ以上の特徴量を抽出する音声特徴量抽出プログラムであって、
コンピュータを、
上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、
抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、
上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、
上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段と
して機能させることを特徴とする音声特徴量抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014167743A JP6451143B2 (ja) | 2014-08-20 | 2014-08-20 | 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014167743A JP6451143B2 (ja) | 2014-08-20 | 2014-08-20 | 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016045249A JP2016045249A (ja) | 2016-04-04 |
JP6451143B2 true JP6451143B2 (ja) | 2019-01-16 |
Family
ID=55635898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014167743A Active JP6451143B2 (ja) | 2014-08-20 | 2014-08-20 | 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6451143B2 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3400474B2 (ja) * | 1992-11-09 | 2003-04-28 | 株式会社リコー | 音声認識装置および音声認識方法 |
JPH11212588A (ja) * | 1998-01-22 | 1999-08-06 | Hitachi Ltd | 音声処理装置、音声処理方法、及び音声処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2003271190A (ja) * | 2002-03-15 | 2003-09-25 | Matsushita Electric Ind Co Ltd | 雑音除去方法、雑音除去装置及び、それを用いた音声認識装置 |
JP5840087B2 (ja) * | 2012-07-19 | 2016-01-06 | 三菱電機株式会社 | 音声信号復元装置および音声信号復元方法 |
JP6152639B2 (ja) * | 2012-11-27 | 2017-06-28 | 沖電気工業株式会社 | 音声帯域拡張装置及びプログラム、並びに、音声特徴量算出装置及びプログラム |
JP6451136B2 (ja) * | 2014-08-05 | 2019-01-16 | 沖電気工業株式会社 | 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム |
-
2014
- 2014-08-20 JP JP2014167743A patent/JP6451143B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016045249A (ja) | 2016-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8442250B2 (en) | Hearing aid and method for controlling signal processing in a hearing aid | |
US8560308B2 (en) | Speech sound enhancement device utilizing ratio of the ambient to background noise | |
JP5666444B2 (ja) | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 | |
US8886499B2 (en) | Voice processing apparatus and voice processing method | |
JP4818335B2 (ja) | 信号帯域拡張装置 | |
JPWO2006046293A1 (ja) | 雑音抑圧装置 | |
US8694311B2 (en) | Method for processing noisy speech signal, apparatus for same and computer-readable recording medium | |
KR20120037954A (ko) | 음성의 표적화 및 잡음의 무시에 의한 음성 신호의 프로세싱에 있어서 잡음 감소를 위한 시스템 및 방법 | |
CA2891453C (en) | Method of and apparatus for evaluating intelligibility of a degraded speech signal | |
US8744846B2 (en) | Procedure for processing noisy speech signals, and apparatus and computer program therefor | |
US9418677B2 (en) | Noise suppressing device, noise suppressing method, and a non-transitory computer-readable recording medium storing noise suppressing program | |
US8744845B2 (en) | Method for processing noisy speech signal, apparatus for same and computer-readable recording medium | |
CN105869652B (zh) | 心理声学模型计算方法和装置 | |
JP6451143B2 (ja) | 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム | |
KR20200095370A (ko) | 음성 신호에서의 마찰음의 검출 | |
JP6451136B2 (ja) | 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム | |
JP6065488B2 (ja) | 帯域拡張装置及び方法 | |
JP7152112B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
US10257620B2 (en) | Method for detecting tonal signals, a method for operating a hearing device based on detecting tonal signals and a hearing device with a feedback canceller using a tonal signal detector | |
Rao et al. | Speech enhancement using cross-correlation compensated multi-band wiener filter combined with harmonic regeneration | |
JP6163785B2 (ja) | 音声帯域拡張装置及びプログラム | |
JP6536322B2 (ja) | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 | |
JP2022011889A (ja) | 音声区間検出回路 | |
JP2015169900A (ja) | 雑音抑圧装置 | |
JP2015119404A (ja) | マルチパス判定装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170515 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180612 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6451143 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |