JP6759927B2 - 発話評価装置、発話評価方法、および発話評価プログラム - Google Patents
発話評価装置、発話評価方法、および発話評価プログラム Download PDFInfo
- Publication number
- JP6759927B2 JP6759927B2 JP2016186324A JP2016186324A JP6759927B2 JP 6759927 B2 JP6759927 B2 JP 6759927B2 JP 2016186324 A JP2016186324 A JP 2016186324A JP 2016186324 A JP2016186324 A JP 2016186324A JP 6759927 B2 JP6759927 B2 JP 6759927B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- utterance evaluation
- utterance
- audio signal
- change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
- G10L2025/906—Pitch tracking
Description
図1は、第1の実施形態における、発話評価装置の利用形態の一例を示す機能ブロック図である。図1の機能ブロック図において、発話評価装置10は、周波数分析部11、スペクトル変換部12、相関算出部13、制御部14を有する。発話評価装置10は、入力音声を分析し、分析結果を変化量として出力する。
図2は、第2の実施形態における、発話評価装置の利用形態の一例を示す機能ブロック図である。図2の機能ブロック図において発話評価装置20aは、線形予測分析部21、周波数分析部22、自己相関算出部23、スペクトル保持部24、スペクトル変換部25、相関算出部26、制御部27、評価部28を有する。発話評価装置20aはFPGA(field-programmable gate array)などのプログラマブルロジックデバイスを用いて実現してもよいし、発話評価装置20aの各機能を処理するための発話評価プログラムをCPU(Central Processing Unit)で実行することにより実現してもよい。
(数1)
(数2)
(数3)
(数5)
(数7)
図5は、第3の実施形態における、発話評価装置の利用形態の一例を示す機能ブロック図である。図5の機能ブロック図において発話評価装置20bは、FFT部51、判定部52、スペクトル保持部53、スペクトル変換部54、相関算出部55、制御部56、評価部57を有する。発話評価装置20bはFPGA(field-programmable gate array)などのプログラマブルロジックデバイスを用いて実現してもよいし、発話評価装置20bの各機能を処理するための発話評価プログラムをCPU(Central Processing Unit)で実行することにより実現してもよい。
(数8)
(数9)
(数10)
(数11)
11:周波数分析部
12:スペクトル変換部
13:相関算出部
14:制御部
30、37:通信端末
36:公衆網
15:演算処理装置
60:コンピュータ
61:表示装置
62:CPU
63:記憶装置
64:発話評価プログラム
65:音声データ
66:評価データ
Claims (8)
- 第1期間の音声信号である第1音声信号を周波数変換した第1入力スペクトルを生成すると共に、前記第1期間より前の第2期間の前記音声信号である第2音声信号を周波数変換した第2入力スペクトルを生成する周波数変換部と、
前記第2入力スペクトルの周波数をあらかじめ設定した変化率に基づき変換した、加工スペクトルを生成するスペクトル変換部と、
前記第1入力スペクトルと前記加工スペクトルとの相関値を算出する相関算出部と、
前記第1入力スペクトルに基づき、パワースペクトルの凹凸度を算出する算出部と、
前記変化率および前記相関値に基づき、前記第1音声信号から前記第2音声信号へのピッチ周波数の変化量を判定する制御部とを有し、
前記制御部は、前記凹凸度が予め設定した閾値以上の場合に、前記変化量を判定する、
発話評価装置。 - 前記スペクトル変換部は、複数の前記変化率に基づき複数の加工スペクトルを生成し、
前記相関算出部は、前記第1入力スペクトルと前記複数の加工スペクトルとの相関値をそれぞれ算出し、
前記制御部は、複数の前記変化率のうち前記相関値が最も大きい前記変化率に基づき前記変化量を判定する、請求項1に記載の発話評価装置。 - 前記スペクトル変換部は、前記変化率を0.5倍から2倍までの間で設定する、請求項1に記載の発話評価装置。
- 前記第1音声信号を線形予測分析し第1残差信号を生成すると共に前記第2音声信号を線形予測分析し第2残差信号を生成する線形予測分析部をさらに有し、
前記周波数変換部は、前記第1残差信号および前記第2残差信号を周波数分析し、前記第1入力スペクトルおよび前記第2入力スペクトルを算出する、
請求項1に記載の発話評価装置。 - 前記変化量に基づき発話印象を判定する評価部をさらに有する、請求項1に記載の発話評価装置。
- 前記評価部は、複数時刻における前記変化量の統計量に基づき発話印象を評価する、請求項5に記載の発話評価装置。
- 発話評価処理を実行する発話評価装置の発話評価方法であって、前記発話評価装置が、
第1音声信号を周波数変換した第1入力スペクトルを生成すると共に前記第1音声信号を受信する前の第2音声信号を周波数変換した第2入力スペクトルを生成し、
前記第2入力スペクトルの周波数をあらかじめ設定した変化率に基づき変換した、加工スペクトルを生成し、
前記第1入力スペクトルと前記加工スペクトルとの相関値を算出し、
前記第1入力スペクトルに基づき、パワースペクトルの凹凸度を算出し、
前記凹凸度が予め設定した閾値以上の場合に、前記変化率および前記相関値に基づき、前記第1音声信号から前記第2音声信号への変化量を判定する
処理を実行する、発話評価装置の発話評価方法。 - 発話評価処理を実行する発話評価装置の発話評価プログラムであって、前記発話評価装置に、
第1音声信号を周波数変換した第1入力スペクトルを生成すると共に前記第1音声信号を受信する前の第2音声信号を周波数変換した第2入力スペクトルを生成し、
前記第2入力スペクトルの周波数をあらかじめ設定した変化率に基づき変換した、加工スペクトルを生成し、
前記第1入力スペクトルと前記加工スペクトルとの相関値を算出し、
前記第1入力スペクトルに基づき、パワースペクトルの凹凸度を算出し、
前記凹凸度が予め設定した閾値以上の場合に、前記変化率および前記相関値に基づき、前記第1音声信号から前記第2音声信号への変化量を判定する
処理を実行させる、発話評価装置の発話評価プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016186324A JP6759927B2 (ja) | 2016-09-23 | 2016-09-23 | 発話評価装置、発話評価方法、および発話評価プログラム |
US15/703,249 US10381023B2 (en) | 2016-09-23 | 2017-09-13 | Speech evaluation apparatus and speech evaluation method |
EP17191059.9A EP3300079A1 (en) | 2016-09-23 | 2017-09-14 | Speech evaluation apparatus and speech evaluation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016186324A JP6759927B2 (ja) | 2016-09-23 | 2016-09-23 | 発話評価装置、発話評価方法、および発話評価プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018049246A JP2018049246A (ja) | 2018-03-29 |
JP6759927B2 true JP6759927B2 (ja) | 2020-09-23 |
Family
ID=59887064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016186324A Active JP6759927B2 (ja) | 2016-09-23 | 2016-09-23 | 発話評価装置、発話評価方法、および発話評価プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10381023B2 (ja) |
EP (1) | EP3300079A1 (ja) |
JP (1) | JP6759927B2 (ja) |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0636158B2 (ja) * | 1986-12-04 | 1994-05-11 | 沖電気工業株式会社 | 音声分析合成方法及び装置 |
US5729658A (en) * | 1994-06-17 | 1998-03-17 | Massachusetts Eye And Ear Infirmary | Evaluating intelligibility of speech reproduction and transmission across multiple listening conditions |
JP4121578B2 (ja) * | 1996-10-18 | 2008-07-23 | ソニー株式会社 | 音声分析方法、音声符号化方法および装置 |
CN1192358C (zh) * | 1997-12-08 | 2005-03-09 | 三菱电机株式会社 | 声音信号加工方法和声音信号加工装置 |
CN1143268C (zh) * | 1997-12-24 | 2004-03-24 | 三菱电机株式会社 | 声音编码方法、声音译码方法、声音编码装置和声音译码装置 |
TWI221574B (en) | 2000-09-13 | 2004-10-01 | Agi Inc | Sentiment sensing method, perception generation method and device thereof and software |
JP3676969B2 (ja) | 2000-09-13 | 2005-07-27 | 株式会社エイ・ジー・アイ | 感情検出方法及び感情検出装置ならびに記録媒体 |
JP3963850B2 (ja) * | 2003-03-11 | 2007-08-22 | 富士通株式会社 | 音声区間検出装置 |
JP3744934B2 (ja) * | 2003-06-11 | 2006-02-15 | 松下電器産業株式会社 | 音響区間検出方法および装置 |
JP2007004001A (ja) | 2005-06-27 | 2007-01-11 | Tokyo Electric Power Co Inc:The | オペレータ応対能力診断装置、オペレータ応対能力診断プログラム、プログラム格納媒体 |
JP4728868B2 (ja) | 2006-04-18 | 2011-07-20 | 日本電信電話株式会社 | 応対評価装置、その方法、プログラムおよびその記録媒体 |
JP2008015212A (ja) | 2006-07-06 | 2008-01-24 | Dds:Kk | 音程変化量抽出方法、ピッチの信頼性算出方法、ビブラート検出方法、歌唱訓練プログラム及びカラオケ装置 |
JP4294724B2 (ja) * | 2007-08-10 | 2009-07-15 | パナソニック株式会社 | 音声分離装置、音声合成装置および声質変換装置 |
JP5293329B2 (ja) * | 2009-03-26 | 2013-09-18 | 富士通株式会社 | 音声信号評価プログラム、音声信号評価装置、音声信号評価方法 |
FR2943875A1 (fr) * | 2009-03-31 | 2010-10-01 | France Telecom | Procede et dispositif de classification du bruit de fond contenu dans un signal audio. |
JP5923994B2 (ja) * | 2012-01-23 | 2016-05-25 | 富士通株式会社 | 音声処理装置及び音声処理方法 |
JP5864285B2 (ja) | 2012-01-26 | 2016-02-17 | 株式会社三井住友銀行 | 電話応対業務支援システムおよびその方法 |
US8949118B2 (en) * | 2012-03-19 | 2015-02-03 | Vocalzoom Systems Ltd. | System and method for robust estimation and tracking the fundamental frequency of pseudo periodic signals in the presence of noise |
-
2016
- 2016-09-23 JP JP2016186324A patent/JP6759927B2/ja active Active
-
2017
- 2017-09-13 US US15/703,249 patent/US10381023B2/en active Active
- 2017-09-14 EP EP17191059.9A patent/EP3300079A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP3300079A1 (en) | 2018-03-28 |
JP2018049246A (ja) | 2018-03-29 |
US20180090156A1 (en) | 2018-03-29 |
US10381023B2 (en) | 2019-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5732976B2 (ja) | 音声区間判定装置、音声区間判定方法、及びプログラム | |
US11532315B2 (en) | Linear prediction analysis device, method, program, and storage medium | |
EP1995723B1 (en) | Neuroevolution training system | |
JP5542206B2 (ja) | オーディオ・システムの知覚品質を判定する方法およびシステム | |
WO2022012195A1 (zh) | 音频信号处理方法和相关装置 | |
JP4769673B2 (ja) | オーディオ信号補間方法及びオーディオ信号補間装置 | |
KR20160023767A (ko) | 스피치 신호 품질을 측정하기 위한 시스템들 및 방법들 | |
JP6182895B2 (ja) | 処理装置、処理方法、プログラム及び処理システム | |
WO2019000178A1 (zh) | 一种丢帧补偿方法及设备 | |
RU2682851C2 (ru) | Усовершенствованная коррекция потери кадров с помощью речевой информации | |
CN110415714B (zh) | 线性预测分析装置、线性预测分析方法以及记录介质 | |
RU2621003C2 (ru) | Адаптивное к тональности квантование низкой сложности аудиосигналов | |
JP2013205831A (ja) | 音声品質客観評価装置及び方法 | |
JP6759927B2 (ja) | 発話評価装置、発話評価方法、および発話評価プログラム | |
JP2017134197A (ja) | パラメータ調整システム、パラメータ調整方法、プログラム | |
US9165561B2 (en) | Apparatus and method for processing voice signal | |
JP6229576B2 (ja) | サンプリング周波数推定装置 | |
KR100931487B1 (ko) | 노이지 음성 신호의 처리 장치 및 그 장치를 포함하는 음성기반 어플리케이션 장치 | |
Gan et al. | Audio quality evaluation using frequency structural similarity measure | |
JP2020190606A (ja) | 音声雑音除去装置及びプログラム | |
JP2019045527A (ja) | 音声処理プログラム、音声処理方法および音声処理装置 | |
JP2019060976A (ja) | 音声処理プログラム、音声処理方法および音声処理装置 | |
WO2016203753A1 (ja) | 雑音検出装置、雑音抑圧装置、雑音検出方法、雑音抑圧方法、および、記録媒体 | |
US8644346B2 (en) | Signal demultiplexing device, signal demultiplexing method and non-transitory computer readable medium storing a signal demultiplexing program | |
US20130304462A1 (en) | Signal processing apparatus and method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20180528 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190611 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200331 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200520 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200817 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6759927 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |