JP4644876B2 - 音声処理装置 - Google Patents
音声処理装置 Download PDFInfo
- Publication number
- JP4644876B2 JP4644876B2 JP2005021866A JP2005021866A JP4644876B2 JP 4644876 B2 JP4644876 B2 JP 4644876B2 JP 2005021866 A JP2005021866 A JP 2005021866A JP 2005021866 A JP2005021866 A JP 2005021866A JP 4644876 B2 JP4644876 B2 JP 4644876B2
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- sound
- noise
- plosive
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 37
- 238000004458 analytical method Methods 0.000 claims description 23
- 238000001514 detection method Methods 0.000 claims description 16
- 230000005236 sound signal Effects 0.000 claims description 11
- 230000003595 spectral effect Effects 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 15
- 230000003321 amplification Effects 0.000 description 10
- 230000007423 decrease Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 238000003199 nucleic acid amplification method Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 230000008447 perception Effects 0.000 description 8
- 238000005352 clarification Methods 0.000 description 7
- 238000000034 method Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000000540 analysis of variance Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241000239290 Araneae Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000007127 saponification reaction Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Description
Kalikow,D.N.,Stevens,K.N.,and Elliott,L.L., Development of a test of speech intelligibility in noise using sentence materials with controlled word predictability, J. Acoust. Soc. Am., 61, pp.1337-1351, 1977 Florentine,M., Speech perception in noise by fluent non-native listeners, Trans. Tech. Comm. Physiol. Acoust., H-85-16、1985 上田和夫、駒木亮、山田玲子、雑音がアメリカ英語/r/,/1/知覚に及ぼす影響,日本心理学会第65回大会発表論文集,P.120 2001
図1は、本発明の音声処理装置を用いた通信システム1000の一例を示す概念図である。
音韻対立によって、音響的差異、聴取時の手掛かりが、母国語の異なる聞き手の間では一般に異なる。そのため、例えば/b/と/v/(以下BVと略)、/s/と/θ/(以下STHと略)も日本語母語話者にとって知覚困難な音韻だが、雑音付加の影響がRLの場合と異なる可能性がある。
(1.1 刺激)
RL対(right−1ight等)、BV対(base−vase等)、STH対(mouse−mouth等)の3種類の音韻で対立する音韻最小対の英単語対を使用し手実験を行った。各対立毎に50、30、30対(合計110対)の合計220語をアメリカ英語母語話者2名(男性1名、女性1名)が発話したものを刺激音声とした。無響室で収録された音声は単語毎に44.1kHz、16bitの精度でPCM(Pulse Code Modulation)形式のファイルとして保存された。
JA実験では、日本語を母語とし、3ケ月以上の外国滞在経験のない大学生11人が実験に参加した。AE実験では、23才から43才までのアメリカ英語母語話者3人が実験に参加した。全員が正常な聴力を持つことを確認した。
実鹸は3日間に分けて防音室内で行った。コンピュータ画面上に音韻最小対をなす英単語2語を視覚呈示し、同時にどちらか一方の単語をヘッドホンより両耳呈示した。実験参加者は、きこえた単語が画面上の単語対のどちらであったかを判断し、選択した。
付加した雑音の種類別に2日間に分けて行った。それぞれ話音別の2つのセクションから構成され、話者の順序は一定であった。各セクションは全SN仕の音声を含んだ音韻対立毎のブロックからなり、RL、BV、STH対立の順で提示した。各ブロック内で全音声刺激をランダムな順序で呈示し、回答の正誤に関するフイードバックは行わなかった。
雑音付加音声セッション終了後に音圧変動セッションを実施した。刺激が異なる以外は、構成および方法は雑音付加音声セッションと同じものを用いた。
(JA実験)
図8は、JA実験における雑音付加音声セッションの結果を示す図である。
図10は、AE実験における各音韻対立における雑音付加音声セッションの結果を示す図である。いずれの音韻対立においても、SN比の低下に伴って正答率が低下する傾向があることが示された。
アメリカ英語母語話者では、BV以外の音韻対において、雑音付加の影響を受けにくいSN比のレンジが存在するのに対し、日本語母語話者では、僅かな雑音付加で正答率が低下する傾向が示された。
音韻対により雑音の影響が異なった。RL対立は本実鹸で使用した雑音に対する耐性が比較的高かったが、BV対立は僅かな雑音付加によっても大きく影響を受け、STH対立ではほぼ一定の割合で正答率が低下した。これは、音韻対によって弁別に使用される音響的特徴が異なり、同じ雑音を付加した場合においても、異なる影響を及ぼしていることを示している。
日本語母語話者、アメリカ英語母語話者において、BV対立のある音韻では呈示音圧の低下により正答率が低下し、知覚が阻害される。しかし、RLやSTHは日本語母語話者でのみ呈示音圧の低下により正答率が低下する。
Claims (3)
- 音声処理装置であって、
前記音声処理装置から出力される音声信号の再生音声の聴取者の母国語の種類に応じて強調すべき音韻の強調情報を格納する記憶手段と、
前記聴取者の母国語の登録を受付ける手段と、
入力された音声信号を周波数分析するための周波数分析手段と、
前記周波数分析手段の分析結果に基づいて、各音韻部分を検出するための音韻検出手段と、
前記音韻検出手段の検出結果と、登録された前記聴取者の母国語の情報に対応した前記強調情報とに応じて、前記音韻部分を選択的に強調する強調処理手段と、
前記入力された音声信号と、前記選択的に強調された部分とを合成して出力する出力信号選択手段とを備える、音声処理装置。 - 前記強調すべき音韻は、破裂音の音韻である、請求項1記載の音声処理装置。
- 前記音韻検出手段は、前記周波数分析手段の分析結果において、閉鎖音が存在する場合は、前記閉鎖音に後続した音声に対し、スペクトル包絡を計算し、低い周波数帯から高い周波数帯にまで一定以上のパワーが所定時間内に存在している垂直パルスの有無により、破裂音に相当する音韻を検知し、
音響モデルを格納する音韻音響モデル格納手段をさらに備え、
前記音韻検出手段は、前記破裂音以外の音韻については、各音韻に対する前記音響モデルに基づく尤度計算によって、前記音韻を検知する、請求項2記載の音声処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005021866A JP4644876B2 (ja) | 2005-01-28 | 2005-01-28 | 音声処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005021866A JP4644876B2 (ja) | 2005-01-28 | 2005-01-28 | 音声処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006208820A JP2006208820A (ja) | 2006-08-10 |
JP4644876B2 true JP4644876B2 (ja) | 2011-03-09 |
Family
ID=36965741
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005021866A Active JP4644876B2 (ja) | 2005-01-28 | 2005-01-28 | 音声処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4644876B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5186943B2 (ja) * | 2008-02-15 | 2013-04-24 | ヤマハ株式会社 | 音声処理装置、再生装置およびプログラム |
JP5547414B2 (ja) * | 2009-03-09 | 2014-07-16 | 八幡電気産業株式会社 | 音声信号調整装置及びその調整方法 |
JP6481271B2 (ja) * | 2014-07-07 | 2019-03-13 | 沖電気工業株式会社 | 音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04113800A (ja) * | 1990-09-04 | 1992-04-15 | Rion Co Ltd | 補聴器 |
JPH05199588A (ja) * | 1992-01-21 | 1993-08-06 | Terumo Corp | 補聴器 |
JPH1083193A (ja) * | 1996-09-09 | 1998-03-31 | Matsushita Electric Ind Co Ltd | 音声合成装置および音声素片作成方法 |
JP2002014689A (ja) * | 2000-06-01 | 2002-01-18 | Avaya Technology Corp | デジタルに圧縮されたスピーチの了解度を向上させる方法および装置 |
JP2004135068A (ja) * | 2002-10-10 | 2004-04-30 | Rion Co Ltd | 補聴器、訓練装置、ゲーム装置、および音出力装置 |
-
2005
- 2005-01-28 JP JP2005021866A patent/JP4644876B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04113800A (ja) * | 1990-09-04 | 1992-04-15 | Rion Co Ltd | 補聴器 |
JPH05199588A (ja) * | 1992-01-21 | 1993-08-06 | Terumo Corp | 補聴器 |
JPH1083193A (ja) * | 1996-09-09 | 1998-03-31 | Matsushita Electric Ind Co Ltd | 音声合成装置および音声素片作成方法 |
JP2002014689A (ja) * | 2000-06-01 | 2002-01-18 | Avaya Technology Corp | デジタルに圧縮されたスピーチの了解度を向上させる方法および装置 |
JP2004135068A (ja) * | 2002-10-10 | 2004-04-30 | Rion Co Ltd | 補聴器、訓練装置、ゲーム装置、および音出力装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2006208820A (ja) | 2006-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11095991B2 (en) | Hearing evaluation and configuration of a hearing assistance-device | |
US10475467B2 (en) | Systems, methods and devices for intelligent speech recognition and processing | |
JP4439579B1 (ja) | 音質補正装置、音質補正方法及び音質補正用プログラム | |
RU2520420C2 (ru) | Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала | |
Hockley et al. | Analog-to-digital conversion to accommodate the dynamics of live music in hearing instruments | |
CN101103525A (zh) | 用于音频信号声级的频率相关放大的信号处理设备和音频系统及其方法 | |
JP4644876B2 (ja) | 音声処理装置 | |
JP2000152394A (ja) | 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置 | |
Stelmachowicz et al. | Preferred hearing-aid frequency responses in simulated listening environments | |
JP2010136236A (ja) | オーディオ信号処理装置、オーディオ信号処理方法およびプログラム | |
JP2006333396A (ja) | 音声信号拡声装置 | |
JP5058844B2 (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
Ahmetovic et al. | Enhancing screen reader intelligibility in noisy environments | |
JP4669988B2 (ja) | 言語学習装置 | |
JP5202021B2 (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
KR101682796B1 (ko) | 소음 환경에서 음절 형태 기반 음소 가중 기법을 이용한 음성의 명료도 향상 방법 및 이를 기록한 기록매체 | |
KR20210086217A (ko) | 쉰목소리 잡음 제거시스템 | |
JPS5879400A (ja) | 補聴器 | |
JP4669989B2 (ja) | 言語学習装置 | |
JP2011141540A (ja) | 音声信号処理装置、テレビジョン受像機、音声信号処理方法、プログラム、および、記録媒体 | |
Bergfeld et al. | The effects of peripheral stimuli and equipment used on Speech Intelligibility in Noise | |
JPH0698398A (ja) | 音声の無音区間検出伸長装置及び音声の無音区間検出伸長方法 | |
KR100372576B1 (ko) | 오디오신호 가공방법 | |
CN115188394A (zh) | 混音方法、装置、电子设备和存储介质 | |
Iglehart | Costs and benefits of peak clipping in amplification for profound hearing loss |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071129 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100720 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101119 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4644876 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |