JP2005531990A - 音声品質を評価する方法 - Google Patents
音声品質を評価する方法 Download PDFInfo
- Publication number
- JP2005531990A JP2005531990A JP2004517987A JP2004517987A JP2005531990A JP 2005531990 A JP2005531990 A JP 2005531990A JP 2004517987 A JP2004517987 A JP 2004517987A JP 2004517987 A JP2004517987 A JP 2004517987A JP 2005531990 A JP2005531990 A JP 2005531990A
- Authority
- JP
- Japan
- Prior art keywords
- power
- pronunciation
- voice quality
- speech
- quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000013441 quality evaluation Methods 0.000 claims abstract description 25
- 238000001303 quality assessment method Methods 0.000 claims abstract description 23
- 230000005236 sound signal Effects 0.000 claims description 24
- 238000001228 spectrum Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims 1
- 230000001419 dependent effect Effects 0.000 abstract description 4
- 238000011156 evaluation Methods 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Electrically Operated Instructional Devices (AREA)
- Telephone Function (AREA)
- Mobile Radio Communication Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】音声信号のひずんだバージョンを使用することによって、音声品質を評価するときに、異なる表音内容、異なる個々の話者、および異なる話し方を補償することが可能である。音声信号をひずませることによって客観的音声品質評価が低下する量は、具体的には音声信号のひずんだバージョンのひずみの量が厳密であるとき、異なる音声信号について同様に維持される。ひずんだ音声信号と当初のひずんでいない音声信号との客観的音声信号評価を比較して、発声依存明瞭度を補償する音声品質評価を得る。
Description
本発明の特徴、態様、および利点は、以下の記述、添付の請求項、および付随する図面に関してより良く理解されるであろう。
であり、上式で、μは、小さい一定値である。
であり、
は、si(t)のヒルベルト変換である。
上式で、εは、ある程度小さい一定値である。明瞭発音電力PA(m,i)と非明瞭発音電力PNA(m,i)との他の比較が可能である。たとえば、比較は、式(1)の逆数とすることが可能であり、または、比較は、明瞭発音電力PA(m,i)と非明瞭発音電力PNA(m,i)との差とすることが可能である。議論を簡単にするために、フローチャート300によって示した明瞭度分析モジュール26の実施形態について、式(1)のANR(m,i)を使用する比較に関して議論する。しかし、これは決して、本発明を限定すると解釈すべきではない。
上式で
であり、kは、周波数インデックスである。
上式で、
本発明について、ある実施形態を参照してかなり詳細に記述してきたが、他の形態も可能である。したがって、本発明の精神および範囲は、本明細書に包含される実施形態の記述に限定すべきではない。
Claims (20)
- 音声品質を評価する方法であって、
第1音声信号および第2音声信号についての第1音声品質評価および第2音声品質評価を決定する工程であって、前記第1音声信号が、前記第2音声信号のひずんだバージョンである工程と、
前記第1音声品質と前記第2音声品質とを比較して、補償された音声品質評価を得る工程とを含む方法。 - 前記第1音声品質評価および前記第2音声品質評価を決定する前に、前記第2音声信号をひずませて、前記第1音声信号を生成する工程をさらに含む、請求項1に記載の方法。
- 前記第1音声品質および前記第2音声品質が、客観的音声品質評価のための同一技法を使用して評価される、請求項1に記載の方法。
- 前記補償された音声品質評価が、前記第1音声品質と前記第2音声品質との差に相当する、請求項1に記載の方法。
- 前記補償された音声品質評価が、前記第1音声品質と前記第2音声品質との比に相当する、請求項1に記載の方法。
- 前記第1音声品質および前記第2音声品質が、音声の聴覚明瞭度分析を使用して評価される、請求項1に記載の方法。
- 前記第2音声品質または前記第1音声品質を評価する工程が、
前記音声信号またはひずんだ音声信号について明瞭発音電力と非明瞭発音電力とを比較する工程であって、明瞭発音電力および非明瞭発音電力が、前記音声信号または前記ひずんだ音声信号の明瞭発音周波数に関連付けられた電力および非明瞭発音周波数に関連付けられた電力である工程と、
前記比較に基づいて、前記第2音声品質または前記第1音声品質を評価する工程とを含む、請求項1に記載の方法。 - 前記明瞭発音周波数が、約2〜12.5Hzである、請求項7に記載の方法。
- 前記明瞭発音周波数が、人間の明瞭発音速度にほぼ対応する、請求項7に記載の方法。
- 前記非明瞭発音周波数が、明瞭発音周波数よりおおよそ高い、請求項7に記載の方法。
- 前記明瞭発音電力と前記非明瞭発音電力との前記比較が、前記明瞭発音電力と前記非明瞭発音電力との比である、請求項7に記載の方法。
- 前記比が、前記明瞭発音電力および小さい定数を含む分母と、前記非明瞭発音電力と小さい定数との和を含む分子とを含む、請求項10に記載の方法。
- 前記明瞭発音電力と前記非明瞭発音電力との比較が、前記明瞭発音電力と前記非明瞭発音電力との差である、請求項7に記載の方法。
- 前記第1音声品質または前記第2音声品質を評価する工程が、
前記比較を使用して局部音声品質を決定する工程を含む、請求項7に記載の方法。 - 前記局部音声品質が、DC成分電力に基づく重み付けファクタを使用してさらに決定される、請求項7に記載の方法。
- 前記第1音声品質または前記第2音声品質が、前記局部音声品質を使用して決定される、請求項9に記載の方法。
- 明瞭発音電力と非明瞭発音電力とを比較する前記工程が、
複数の臨界帯域信号から得られた複数の包絡線のそれぞれに対してフーリエ変換を実施する工程を含む、請求項7に記載の方法。 - 明瞭発音電力と非明瞭発音電力とを比較する前記工程が、
複数の臨界帯域信号を得るために、前記音声信号をろ波する工程を含む、請求項7に記載の方法。 - 明瞭発音電力と非明瞭発音電力とを比較する前記工程が、
複数の変調スペクトルを得るために、前記複数の臨界帯域信号について包絡線分析を実施する工程を含む、請求項18に記載の方法。 - 明瞭発音電力と非明瞭発音電力とを比較する前記工程が、
前記複数の変調スペクトルのそれぞれに対してフーリエ変換を実施する工程を含む、請求項18に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/186,862 US7308403B2 (en) | 2002-07-01 | 2002-07-01 | Compensation for utterance dependent articulation for speech quality assessment |
PCT/US2003/020354 WO2004003499A2 (en) | 2002-07-01 | 2003-06-27 | Compensation for utterance dependent articulation for speech quality assessment |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2005531990A true JP2005531990A (ja) | 2005-10-20 |
JP2005531990A5 JP2005531990A5 (ja) | 2006-05-25 |
JP4301514B2 JP4301514B2 (ja) | 2009-07-22 |
Family
ID=29779951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004517987A Expired - Fee Related JP4301514B2 (ja) | 2002-07-01 | 2003-06-27 | 音声品質を評価する方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7308403B2 (ja) |
EP (1) | EP1518096B1 (ja) |
JP (1) | JP4301514B2 (ja) |
KR (1) | KR101052432B1 (ja) |
CN (1) | CN1307611C (ja) |
AU (1) | AU2003253742A1 (ja) |
WO (1) | WO2004003499A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008513834A (ja) * | 2004-09-20 | 2008-05-01 | ネーデルラントセ オルハニサティー フォール トゥーヘパスト−ナトゥールウェッテンサッペリーク オンデルズック テーエヌオー | 知覚音声分析のための周波数補償 |
JP2011172235A (ja) * | 2008-04-18 | 2011-09-01 | Dolby Lab Licensing Corp | サラウンド体験に対する影響を最小限にしてマルチチャンネルオーディオにおけるスピーチの聴覚性を維持するための方法及び装置 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7165025B2 (en) * | 2002-07-01 | 2007-01-16 | Lucent Technologies Inc. | Auditory-articulatory analysis for speech quality assessment |
US7305341B2 (en) * | 2003-06-25 | 2007-12-04 | Lucent Technologies Inc. | Method of reflecting time/language distortion in objective speech quality assessment |
CN101262885B (zh) | 2005-06-10 | 2015-04-01 | 中外制药株式会社 | 含有sc(Fv)2的药物组合物 |
US7856355B2 (en) * | 2005-07-05 | 2010-12-21 | Alcatel-Lucent Usa Inc. | Speech quality assessment method and system |
KR100729555B1 (ko) * | 2005-10-31 | 2007-06-19 | 연세대학교 산학협력단 | 음성 품질의 객관적인 평가방법 |
CN101609686B (zh) * | 2009-07-28 | 2011-09-14 | 南京大学 | 基于语音增强算法主观评估的客观评估方法 |
CN101894560B (zh) * | 2010-06-29 | 2012-08-15 | 上海大学 | 一种无参考源的mp3音频清晰度客观评价方法 |
CN102157147B (zh) * | 2011-03-08 | 2012-05-30 | 公安部第一研究所 | 一种拾音系统语音质量客观评价的测试方法 |
DE102013005844B3 (de) * | 2013-03-28 | 2014-08-28 | Technische Universität Braunschweig | Verfahren und Vorrichtung zum Messen der Qualität eines Sprachsignals |
US9830905B2 (en) | 2013-06-26 | 2017-11-28 | Qualcomm Incorporated | Systems and methods for feature extraction |
EP2922058A1 (en) * | 2014-03-20 | 2015-09-23 | Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO | Method of and apparatus for evaluating quality of a degraded speech signal |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3971034A (en) * | 1971-02-09 | 1976-07-20 | Dektor Counterintelligence And Security, Inc. | Physiological response analysis method and apparatus |
IT1121496B (it) | 1979-12-14 | 1986-04-02 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per l effettuazione di misure oggettive di qualita su apparecchiature di trasmissione di segnali fonici |
JP2002517175A (ja) * | 1991-02-22 | 2002-06-11 | シーウェイ テクノロジーズ インコーポレイテッド | 人間の音源を識別するための手段および装置 |
US5454375A (en) * | 1993-10-21 | 1995-10-03 | Glottal Enterprises | Pneumotachograph mask or mouthpiece coupling element for airflow measurement during speech or singing |
US5794188A (en) * | 1993-11-25 | 1998-08-11 | British Telecommunications Public Limited Company | Speech signal distortion measurement which varies as a function of the distribution of measured distortion over time and frequency |
CA2196553C (en) * | 1994-08-18 | 2000-04-11 | Michael Peter Hollier | Analysis of audio quality |
GB9604315D0 (en) * | 1996-02-29 | 1996-05-01 | British Telecomm | Training process |
WO1997005730A1 (en) * | 1995-07-27 | 1997-02-13 | British Telecommunications Public Limited Company | Assessment of signal quality |
DE19647399C1 (de) * | 1996-11-15 | 1998-07-02 | Fraunhofer Ges Forschung | Gehörangepaßte Qualitätsbeurteilung von Audiotestsignalen |
US6052662A (en) * | 1997-01-30 | 2000-04-18 | Regents Of The University Of California | Speech processing using maximum likelihood continuity mapping |
US6246978B1 (en) * | 1999-05-18 | 2001-06-12 | Mci Worldcom, Inc. | Method and system for measurement of speech distortion from samples of telephonic voice signals |
US6609092B1 (en) * | 1999-12-16 | 2003-08-19 | Lucent Technologies Inc. | Method and apparatus for estimating subjective audio signal quality from objective distortion measures |
EP1187100A1 (en) * | 2000-09-06 | 2002-03-13 | Koninklijke KPN N.V. | A method and a device for objective speech quality assessment without reference signal |
US7165025B2 (en) * | 2002-07-01 | 2007-01-16 | Lucent Technologies Inc. | Auditory-articulatory analysis for speech quality assessment |
US7305341B2 (en) * | 2003-06-25 | 2007-12-04 | Lucent Technologies Inc. | Method of reflecting time/language distortion in objective speech quality assessment |
-
2002
- 2002-07-01 US US10/186,862 patent/US7308403B2/en active Active
-
2003
- 2003-06-27 AU AU2003253742A patent/AU2003253742A1/en not_active Abandoned
- 2003-06-27 CN CNB038009366A patent/CN1307611C/zh not_active Expired - Fee Related
- 2003-06-27 EP EP03762154.7A patent/EP1518096B1/en not_active Expired - Fee Related
- 2003-06-27 WO PCT/US2003/020354 patent/WO2004003499A2/en active Application Filing
- 2003-06-27 KR KR1020047003130A patent/KR101052432B1/ko not_active IP Right Cessation
- 2003-06-27 JP JP2004517987A patent/JP4301514B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008513834A (ja) * | 2004-09-20 | 2008-05-01 | ネーデルラントセ オルハニサティー フォール トゥーヘパスト−ナトゥールウェッテンサッペリーク オンデルズック テーエヌオー | 知覚音声分析のための周波数補償 |
JP4879180B2 (ja) * | 2004-09-20 | 2012-02-22 | ネーデルラントセ オルハニサティー フォール トゥーヘパスト−ナトゥールウェッテンサッペリーク オンデルズック テーエヌオー | 知覚音声分析のための周波数補償 |
JP2011172235A (ja) * | 2008-04-18 | 2011-09-01 | Dolby Lab Licensing Corp | サラウンド体験に対する影響を最小限にしてマルチチャンネルオーディオにおけるスピーチの聴覚性を維持するための方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2004003499A3 (en) | 2004-04-01 |
JP4301514B2 (ja) | 2009-07-22 |
EP1518096A2 (en) | 2005-03-30 |
CN1307611C (zh) | 2007-03-28 |
WO2004003499A2 (en) | 2004-01-08 |
AU2003253742A8 (en) | 2004-01-19 |
CN1550000A (zh) | 2004-11-24 |
US20040002857A1 (en) | 2004-01-01 |
KR20050012712A (ko) | 2005-02-02 |
US7308403B2 (en) | 2007-12-11 |
AU2003253742A1 (en) | 2004-01-19 |
KR101052432B1 (ko) | 2011-07-29 |
EP1518096B1 (en) | 2014-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ma et al. | Objective measures for predicting speech intelligibility in noisy conditions based on new band-importance functions | |
US9064502B2 (en) | Speech intelligibility predictor and applications thereof | |
US7343022B2 (en) | Spectral enhancement using digital frequency warping | |
JP4551215B2 (ja) | 音声の聴覚明瞭度分析を実施する方法 | |
US9031837B2 (en) | Speech quality evaluation system and storage medium readable by computer therefor | |
US20050114127A1 (en) | Methods and apparatus for maximizing speech intelligibility in quiet or noisy backgrounds | |
JP4301514B2 (ja) | 音声品質を評価する方法 | |
US20040267523A1 (en) | Method of reflecting time/language distortion in objective speech quality assessment | |
US9245538B1 (en) | Bandwidth enhancement of speech signals assisted by noise reduction | |
Huber et al. | Objective assessment of a speech enhancement scheme with an automatic speech recognition-based system | |
US20090161882A1 (en) | Method of Measuring an Audio Signal Perceived Quality Degraded by a Noise Presence | |
KR20170098761A (ko) | 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법 | |
Chanda et al. | Speech intelligibility enhancement using tunable equalization filter | |
RU2589298C1 (ru) | Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке | |
Pujar et al. | Wiener filter based noise reduction algorithm with perceptual post filtering for hearing aids | |
Pourmand et al. | Computational auditory models in predicting noise reduction performance for wideband telephony applications | |
Pujar et al. | Cascaded structure of noise reduction and multiband frequency compression of speech signal to improve speech perception for monaural hearing aids | |
Dimolitsas et al. | Dependence of opinion scores on listening sets used in degradation category rating assessments | |
Shinde et al. | Quality evaluation of combined temporal and spectral processing for hearing impaired | |
JPH0417520B2 (ja) | ||
Zorila et al. | Effectiveness of Near-End Speech Enhancement Under Equal-Loudness and Equal-Level Constraints. | |
Brouckxon et al. | Design and evaluation of a microphone signal conditioning system | |
JPH09153769A (ja) | 騒音抑圧装置 | |
Ellaham | Binaural speech intelligibility prediction and nonlinear hearing devices | |
Kressner | Auditory models for evaluating algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060330 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060330 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071210 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080310 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080610 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081204 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090323 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090417 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120501 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120501 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130501 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140501 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |