JP6677110B2 - 音声信号処理装置及び音声信号処理プログラム - Google Patents
音声信号処理装置及び音声信号処理プログラム Download PDFInfo
- Publication number
- JP6677110B2 JP6677110B2 JP2016139753A JP2016139753A JP6677110B2 JP 6677110 B2 JP6677110 B2 JP 6677110B2 JP 2016139753 A JP2016139753 A JP 2016139753A JP 2016139753 A JP2016139753 A JP 2016139753A JP 6677110 B2 JP6677110 B2 JP 6677110B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- frequency region
- bands
- high frequency
- bandwidth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 361
- 230000014509 gene expression Effects 0.000 claims description 57
- 238000000034 method Methods 0.000 claims description 30
- 230000007423 decrease Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 11
- 230000001629 suppression Effects 0.000 description 11
- 230000002542 deteriorative effect Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000009825 accumulation Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
以下、図面を参照して第1実施形態の一例を詳細に説明する。
P[i]=R[i]2+I[i]2 …(2)
例えば、低周波数領域の下限インデックスLSは3(93.75Hz=31.25Hz×3)、上限インデックスLEは256(8000Hz=31.25Hz×256)であってよい。
例えば、高周波数領域の下限インデックスHSは257(8031.25Hz=31.25Hz×257)、高周波数領域の上限インデックスHEは1023(31968.75Hz=31.25Hz×1023)であってよい。
Hrt=10log10HP−10log10LP …(4)
Hnm=Hnmn Hrt<HrtLの場合 …(5)
Hnm=Hnmn+
((Hnmx−Hnmn)/(HrtH−HrtL))×(Hrt−HrtL)
HrtL≦Hrt<HrtHの場合 …(6)
Hnm=Hnmx Hrt≧HrtHの場合 …(7)
N=(HE−HS+1)/Hnm …(8)
Nは、四捨五入、切り上げ、または、切り下げで、整数の値とする。
m=HS+(j−1)×N …(9)
mR[LE+j]=tR/N …(10)
mI[LE+j]=tI/N …(11)
mR[p]=R[p] …(12)
mI[p]=I[p] …(13)
帯域併合を行わない低周波数領域でも、上記と同様に、mR[p]に音声信号の実部R[p]を記憶し、mI[p]に虚部I[p]を記憶する。低周波数領域では、pは低周波数領域の下限インデックスLS〜上限インデックスLEまで1ずつ増加する。
次に、第2実施形態の一例を説明する。第1実施形態と同様の構成及び作用については、説明を省略する。第2実施形態は、図4のステップ103の音声信号分析処理で、音声信号の高周波数領域の重要度の高さが、高周波数領域の音声信号のパワーの非定常性が高くなるにしたがって高くされる点で第1実施形態と異なる。また、第2実施形態は、ステップ104で高周波数領域の帯域数を算出する際に、音声信号のパワーの非定常性に基づいて高周波数領域の帯域数を算出する点で、第1実施形態と異なる。
Pav[hi]=(1−c1)*PavB[hi]+c1×P[hi] …(14)
Hnm=Hnmn Hst<HstLの場合 …(16)
Hnm=Hnmn+
((Hnmx−Hnmn)/(HstH−HstL))×(Hst−HstL)
HstL≦Hst<HstHの場合 …(17)
Hnm=Hnmx Hst≧HstHの場合 …(18)
次に、第3実施形態の一例を説明する。第1実施形態または第2実施形態と同様の構成及び作用については、説明を省略する。第3実施形態は、図4のステップ103の音声信号分析処理で、音声信号の高周波数領域の重要度の高さが、音声信号の基本周波数が高くなるにしたがって高くされる点で、第1実施形態または第2実施形態と異なる。また、第3実施形態は、ステップ104で高周波数領域の帯域数を算出する際に、音声信号の基本周波数の高さに基づいて高周波数領域の帯域数を算出する点で、第1実施形態または第2実施形態と異なる。
Bav=(1−c2)*BavB+c2*B …(19)
tNav=(1−c3)×NavB+c3×PA …(21)
寄与係数c3は、現在のフレームの音声信号のノイズのパワー仮平均tNavへの寄与を表す寄与係数であり、寄与係数c3は、0〜1であってよく、例えば、0.01であってよい。音声信号がユーザの発話による音声を含まないと判定されるフレームが出現するまで、tNavを算出する場合、NavBは40[dB]であってよい。
B=Fs/τ …(22)
Hnm=Hnmn Bav<BavLの場合 …(23)
Hnm=Hnmn+
((Hnmx−Hnmn)/(BavH−BavL))×(Bav−BavL)
BavL≦Bav<BavHの場合 …(24)
Hnm=Hnmx Bav≧BavHの場合 …(25)
次に、第4実施形態の一例を説明する。第1〜第3実施形態と同様の構成及び作用については、説明を省略する。第4実施形態は、図4のステップ103の音声信号分析処理で、音声信号の高周波数領域の重要度の高さが、音声信号が子音に対応する場合に子音に対応しない場合より高くされる点で、第1〜第3実施形態と異なる。また、第4実施形態は、ステップ104で高周波数領域の帯域数を算出する際に、音声信号が子音に対応するか否かに基づいて高周波数領域の帯域数を算出する点で、第1〜第3実施形態と異なる。
Hnm=d1×Hnm1+d2×Hnm2+
d3×Hnm3+d4×Hnm4 …(26)
d1〜d4は、0〜1の値を有する寄与係数であり、d1+d2+d3+d4=1である。例えば、d1=0.25、d2=0.2、d3=0.25、d4=0.3であってよい。
[第5実施形態]
HS=Amx−Hnm …(27)
即ち、低周波数領域の帯域数HS(=LE+1)をHS1からAmx−Hnm(=HS2)に低減することで、図21Cに例示するように、低周波数領域でHS1−HS2個の帯域数が低減し、高周波数領域の帯域数はHnmのままであるため、全体として帯域数をHS1−HS2個分低減することができる。
HS+Hnm≦Amx …(28)
HS≦(Amx×N−(HE+1))/(N−1) …(29)
下限インデックスHSは、切り下げで、整数の値とする。
なお、高周波数領域の併合帯域数Nを算出する方法については、図9のステップ131と同様であるため、説明を省略する。
HS+(HE−HS+1)/N≦Amx …(31)
式(31)の左辺にHSが現れるように変形すると、式(29)となる。
時間領域表現から周波数領域表現に変換した音声信号の低周波数領域を第1帯域幅で複数の第1帯域に分割する第1帯域分割部と、
前記音声信号の前記低周波数領域の周波数より周波数が高い高周波数領域の重要度の高さに基づいて、前記高周波数領域を分割するための前記第1帯域幅以上の第2帯域幅を決定する帯域幅決定部と、
前記帯域幅決定部で決定された前記第2帯域幅で、前記音声信号の前記高周波数領域を複数の第2帯域に分割する第2帯域分割部と、
前記複数の第1帯域の各々及び前記複数の第2帯域の各々に対して音声信号調整処理を実行する音声信号調整部と、
を含む、音声信号処理装置。
(付記2)
前記帯域幅決定部は、
前記高周波数領域の重要度の高さが高くなるにしたがって狭くなるように前記帯域幅を決定する、
付記1の音声信号処理装置。
(付記3)
前記音声信号の高周波数領域の重要度の高さは、
低周波数領域の音声信号のパワーに対する前記高周波数領域の音声信号のパワーの比率、前記高周波数領域の音声信号のパワーの非定常性、前記音声信号の基本周波数、及び前記音声信号が子音に対応するか否か、の少なくとも1つに基づいて決定され、
前記低周波数領域の音声信号のパワーに対する前記高周波数領域の音声信号のパワーの比率が大きくなるにしたがって高くなり、
前記高周波数領域の音声信号のパワーの非定常性が高くなるにしたがって高くなり、
前記音声信号の基本周波数が高くなるにしたがって高くなり、
前記音声信号が子音に対応する場合は子音に対応しない場合より高くなるように、
決定される、
付記1または付記2に記載の音声信号処理装置。
(付記4)
前記帯域幅決定部は、
前記高周波数領域の重要度の高さに基づいて係数を決定する係数決定部、
を含み、
前記第1帯域幅に前記係数決定部で決定された前記係数を乗じることで、前記第2帯域幅を決定する、
付記1〜付記3の何れかの音声信号処理装置。
(付記5)
前記係数は、前記高周波数領域の重要度の高さが高くなるにしたがって小さくなり、最も小さい場合、前記係数は1となるように決定される、
付記4の音声信号処理装置。
(付記6)
前記係数は自然数である、
付記4または付記5の音声信号処理装置。
(付記7)
前記高周波数領域は、周波数が所定の境界周波数以上の周波数領域であり、
前記低周波数領域は、周波数が前記境界周波数より低い周波数領域であり、
前記第1帯域分割部で分割される前記第1帯域の数と前記第2帯域分割部で分割される前記第2帯域の数との和が最大帯域数を越えないように前記境界周波数を低減する、
付記1〜付記6の何れかの音声信号処理装置。
(付記8)
時間領域表現から周波数領域表現に変換した音声信号の低周波数領域を第1帯域幅で複数の第1帯域に分割し、
前記音声信号の前記低周波数領域の周波数より周波数が高い高周波数領域の重要度の高さに基づいて、前記高周波数領域を分割するための前記第1帯域幅以上の第2帯域幅を決定し、
決定された前記第2帯域幅で、前記音声信号の前記高周波数領域を複数の第2帯域に分割し、
前記複数の第1帯域の各々及び前記複数の第2帯域の各々に対して音声信号調整処理を実行する、
音声信号処理をコンピュータに実行させるためのプログラム。
(付記9)
前記高周波数領域の重要度の高さが高くなるにしたがって狭くなるように前記帯域幅を決定する、
付記8のプログラム。
(付記10)
前記音声信号の高周波数領域の重要度の高さは、
低周波数領域の音声信号のパワーに対する前記高周波数領域の音声信号のパワーの比率、前記高周波数領域の音声信号のパワーの非定常性、前記音声信号の基本周波数、及び前記音声信号が子音に対応するか否か、の少なくとも1つに基づいて決定され、
前記低周波数領域の音声信号のパワーに対する前記高周波数領域の音声信号のパワーの比率が大きくなるにしたがって高くなり、
前記高周波数領域の音声信号のパワーの非定常性が高くなるにしたがって高くなり、
前記音声信号の基本周波数が高くなるにしたがって高くなり、
前記音声信号が子音に対応する場合は子音に対応しない場合より高くなるように、
決定される、
付記8または付記9のプログラム。
(付記11)
前記音声信号処理は、
前記高周波数領域の重要度の高さに基づいて係数を決定する、
ことをさらに含み、
前記第1帯域幅に、決定された前記係数を乗じることで、前記第2帯域幅を決定する、
付記8〜付記10の何れかのプログラム。
(付記12)
前記係数は、前記高周波数領域の重要度の高さが高くなるにしたがって小さくなり、最も小さい場合、前記係数は1となるように決定される、
付記11のプログラム。
(付記13)
前記係数は自然数である、
付記11または付記12のプログラム。
(付記14)
前記高周波数領域は、周波数が所定の境界周波数以上の周波数領域であり、
前記低周波数領域は、周波数が前記境界周波数より低い周波数領域であり、
分割される前記第1帯域の数と、分割される前記第2帯域の数と、の和が最大帯域数を越えないように前記境界周波数を低減する、
付記8〜付記13の何れかのプログラム。
23 第1帯域分割部
24 帯域幅決定部
25 第2帯域分割部
31 CPU
32 一次記憶部
33 二次記憶部
Claims (8)
- 時間領域表現から周波数領域表現に変換した音声信号の低周波数領域を第1帯域幅で複数の第1帯域に分割する第1帯域分割部と、
前記音声信号の前記低周波数領域の周波数より周波数が高い高周波数領域の重要度の高さに基づいて、前記高周波数領域を分割するための前記第1帯域幅以上の第2帯域幅を決定する帯域幅決定部と、
前記帯域幅決定部で決定された前記第2帯域幅で、前記音声信号の前記高周波数領域を複数の第2帯域に分割する第2帯域分割部と、
前記複数の第1帯域の各々及び前記複数の第2帯域の各々に対して音声信号調整処理を実行する音声信号調整部と、
を含む、音声信号処理装置。 - 前記帯域幅決定部は、
前記高周波数領域の重要度の高さが高くなるにしたがって狭くなるように前記第2帯域幅を決定する、
請求項1に記載の音声信号処理装置。 - 前記音声信号の高周波数領域の重要度の高さは、
低周波数領域の音声信号のパワーに対する前記高周波数領域の音声信号のパワーの比率、前記高周波数領域の音声信号のパワーの非定常性、前記音声信号の基本周波数、及び前記音声信号が子音に対応するか否か、の少なくとも1つに基づいて決定され、
前記低周波数領域の音声信号のパワーに対する前記高周波数領域の音声信号のパワーの比率が大きくなるにしたがって高くなり、
前記高周波数領域のパワーの非定常性が高くなるにしたがって高くなり、
前記音声信号の基本周波数が高くなるにしたがって高くなり、
前記音声信号が子音に対応する場合は子音に対応しない場合より高くなるように、
決定される、
請求項1または請求項2に記載の音声信号処理装置。 - 前記帯域幅決定部は、
前記高周波数領域の重要度の高さに基づいて係数を決定する係数決定部、
を含み、
前記第1帯域幅に前記係数決定部で決定された前記係数を乗じることで、前記第2帯域幅を決定する、
請求項1〜請求項3の何れか1項に記載の音声信号処理装置。 - 前記係数は、前記高周波数領域の重要度の高さが高くなるにしたがって小さくなり、最も小さい場合、前記係数は1となるように決定される、
請求項4に記載の音声信号処理装置。 - 前記係数は自然数である、
請求項4または請求項5に記載の音声信号処理装置。 - 前記高周波数領域は、周波数が所定の境界周波数以上の周波数領域であり、
前記低周波数領域は、周波数が前記境界周波数より低い周波数領域であり、
前記第1帯域分割部で分割される前記第1帯域の数と前記第2帯域分割部で分割される前記第2帯域の数との和が最大帯域数を越えないように前記境界周波数を低減する、
請求項1〜請求項6の何れか1項に記載の音声信号処理装置。 - 時間領域表現から周波数領域表現に変換した音声信号の低周波数領域を第1帯域幅で複数の第1帯域に分割し、
前記音声信号の前記低周波数領域の周波数より周波数が高い高周波数領域の重要度の高さに基づいて、前記高周波数領域を分割するための前記第1帯域幅以上の第2帯域幅を決定し、
決定された前記第2帯域幅で、前記音声信号の前記高周波数領域を複数の第2帯域に分割し、
前記複数の第1帯域の各々及び前記複数の第2帯域の各々に対して音声信号調整処理を実行する、
音声信号処理をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016139753A JP6677110B2 (ja) | 2016-07-14 | 2016-07-14 | 音声信号処理装置及び音声信号処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016139753A JP6677110B2 (ja) | 2016-07-14 | 2016-07-14 | 音声信号処理装置及び音声信号処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018010207A JP2018010207A (ja) | 2018-01-18 |
JP6677110B2 true JP6677110B2 (ja) | 2020-04-08 |
Family
ID=60994342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016139753A Active JP6677110B2 (ja) | 2016-07-14 | 2016-07-14 | 音声信号処理装置及び音声信号処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6677110B2 (ja) |
-
2016
- 2016-07-14 JP JP2016139753A patent/JP6677110B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018010207A (ja) | 2018-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW594676B (en) | Noise reduction device | |
JP5127754B2 (ja) | 信号処理装置 | |
JP4423300B2 (ja) | 雑音抑圧装置 | |
JP5875609B2 (ja) | 雑音抑圧装置 | |
JP4836720B2 (ja) | ノイズサプレス装置 | |
US9854368B2 (en) | Method of operating a hearing aid system and a hearing aid system | |
JP5483000B2 (ja) | 雑音抑圧装置、その方法及びプログラム | |
KR20130141478A (ko) | 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램 | |
US8694311B2 (en) | Method for processing noisy speech signal, apparatus for same and computer-readable recording medium | |
JP2001134287A (ja) | 雑音抑圧装置 | |
JP6135106B2 (ja) | 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム | |
JP2015050685A (ja) | オーディオ信号処理装置および方法、並びにプログラム | |
JP6339896B2 (ja) | 雑音抑圧装置および雑音抑圧方法 | |
JP6073456B2 (ja) | 音声強調装置 | |
US9418677B2 (en) | Noise suppressing device, noise suppressing method, and a non-transitory computer-readable recording medium storing noise suppressing program | |
JP2004341339A (ja) | 雑音抑圧装置 | |
CN106941006B (zh) | 用于音频信号的分离和低音增强的方法、装置和系统 | |
JP6162254B2 (ja) | 背景ノイズにおけるスピーチ了解度を増幅及び圧縮により向上させる装置と方法 | |
JP5443547B2 (ja) | 信号処理装置 | |
CN108831493B (zh) | 一种音频处理方法和装置 | |
JP6677110B2 (ja) | 音声信号処理装置及び音声信号処理プログラム | |
JP6547451B2 (ja) | 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム | |
EP1278185A2 (en) | Method for improving noise reduction in speech transmission | |
JP6707914B2 (ja) | ゲイン処理装置及びプログラム、並びに、音響信号処理装置及びプログラム | |
JP6282925B2 (ja) | 音声強調装置、音声強調方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20180405 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20180411 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20180725 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181019 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190402 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6677110 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |