JP6891662B2 - 音声評価プログラム、音声評価方法および音声評価装置 - Google Patents
音声評価プログラム、音声評価方法および音声評価装置 Download PDFInfo
- Publication number
- JP6891662B2 JP6891662B2 JP2017123588A JP2017123588A JP6891662B2 JP 6891662 B2 JP6891662 B2 JP 6891662B2 JP 2017123588 A JP2017123588 A JP 2017123588A JP 2017123588 A JP2017123588 A JP 2017123588A JP 6891662 B2 JP6891662 B2 JP 6891662B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- evaluation
- distribution
- unit
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims description 327
- 230000005236 sound signal Effects 0.000 claims description 89
- 238000000034 method Methods 0.000 claims description 72
- 238000001514 detection method Methods 0.000 claims description 65
- 238000012545 processing Methods 0.000 claims description 44
- 238000012854 evaluation process Methods 0.000 claims description 16
- 239000011295 pitch Substances 0.000 description 226
- 238000004364 calculation method Methods 0.000 description 93
- 238000006243 chemical reaction Methods 0.000 description 33
- 238000010586 diagram Methods 0.000 description 32
- 230000006870 function Effects 0.000 description 8
- 239000004065 semiconductor Substances 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Telephonic Communication Services (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
検出した前記ピッチ周波数の検出頻度の分布に基づいて、検出した前記ピッチ周波数のうち評価対象とする評価対象領域を選択し、
前記検出頻度の分布と選択した前記評価対象領域に基づいて、音声を評価する
処理をコンピュータに実行させることを特徴とする音声評価プログラム。
音声信号を解析してピッチ周波数を検出し、
検出した前記ピッチ周波数の検出頻度の分布に基づいて、検出した前記ピッチ周波数のうち評価対象とする評価対象領域を選択し、
前記検出頻度の分布と選択した前記評価対象領域に基づいて、音声を評価する
処理をコンピュータに実行させることを特徴とする音声評価方法。
検出した前記ピッチ周波数の検出頻度の分布に基づいて、検出した前記ピッチ周波数のうち評価対象とする評価対象領域を選択し、前記検出頻度の分布と選択した前記評価対象領域に基づいて、音声を評価する評価部と、
を有することを特徴とする音声評価装置。
150,300 収録機器
Claims (13)
- 音声信号を解析してピッチ周波数を検出し、
検出した前記ピッチ周波数の検出頻度の分布に基づいて、検出した前記ピッチ周波数のうち評価対象とする評価対象領域を選択し、
前記検出頻度の分布と選択した前記評価対象領域に基づいて、音声を評価する
処理をコンピュータに実行させることを特徴とする音声評価プログラム。 - 前記分布の中心部に対応するピッチ周波数に第1の重みを乗算し、前記分布の裾部分に対応するピッチ周波数に前記第1の重みよりも小さい第2の重みを乗算することで、前記分布を補正する処理を更に実行させ、前記評価する処理は、補正した分布の広がりを基にして、発話区間内の音声の印象を評価することを特徴とする請求項1に記載の音声評価プログラム。
- 前記ピッチ周波数を検出する処理は、各時刻のピッチ周波数と、一定時間内における平均のピッチ周波数、上限のピッチ周波数、下限のピッチ周波数のいずれかを検出することを特徴とする請求項1または2に記載の音声評価プログラム。
- 前記評価する処理は、複数のピッチ周波数に関する、分散、標準偏差、範囲、平方和、四分位範囲のいずれかの統計量を算出し、前記統計量を基にして、音声の印象を評価することを特徴とする請求項1、2または3に記載の音声評価プログラム。
- 予め定めた所定区間内の音声信号を解析して得られるピッチ周波数を基にして、ユーザの平常時の検出頻度の基準分布を推定する処理を更に実行させ、前記評価する処理は、前記基準分布と、補正された分布とを基にして、音声の印象を評価することを特徴とする請求項2に記載の音声評価プログラム。
- 前記基準分布と、話者情報とを対応づけて記憶装置に記憶する処理を更に実行させ、前記評価する処理は、話者情報に対応する基準分布を選択し、選択した基準分布の広がりと、補正された分布の広がりとを基にして、音声の印象を評価することを特徴とする請求項5に記載の音声評価プログラム。
- 前記基準分布を推定する処理は、指定された話者情報に対応する基準分布が前記記憶装置に記憶されている場合に、記憶装置に記憶された指定された話者情報に対応する基準分布を、前記基準分布を推定する場合の初期値に設定することを特徴とする請求項6に記載の音声評価プログラム。
- 前記分布を補正する処理は、予め定められた所定区間における複数のピッチ周波数を基にして、前記分布の中心部および前記分布の裾部を特定することを特徴とする請求項2に記載の音声評価プログラム。
- 前記評価する処理は、異なる話者情報毎に音声を評価し、複数話者による会話全体を評価することを特徴とする請求項1に記載の音声評価プログラム。
- 前記評価する処理は、各時刻における音声の印象をそれぞれ評価し、各評価結果に関するスコアを算出することを特徴とする請求項1に記載の音声評価プログラム。
- 前記評価する処理は、前記分布の広がりが大きい場合は声の印象が良いと評価し、前記分布の広がりが小さい場合は声の印象が悪いと評価することを特徴とする請求項2、3または4に記載の音声評価プログラム。
- コンピュータが実行する音声評価方法であって、
音声信号を解析してピッチ周波数を検出し、
検出した前記ピッチ周波数の検出頻度の分布に基づいて、検出した前記ピッチ周波数のうち評価対象とする評価対象領域を選択し、
前記検出頻度の分布と選択した前記評価対象領域に基づいて、音声を評価する
処理をコンピュータに実行させることを特徴とする音声評価方法。 - 音声信号を解析してピッチ周波数を検出するピッチ検出部と、
検出した前記ピッチ周波数の検出頻度の分布に基づいて、検出した前記ピッチ周波数のうち評価対象とする評価対象領域を選択し、前記検出頻度の分布と選択した前記評価対象領域に基づいて、音声を評価する評価部と、
を有することを特徴とする音声評価装置。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017123588A JP6891662B2 (ja) | 2017-06-23 | 2017-06-23 | 音声評価プログラム、音声評価方法および音声評価装置 |
EP18821009.0A EP3644316A4 (en) | 2017-06-23 | 2018-03-30 | VOICE EVALUATION PROGRAM, VOICE EVALUATION METHOD, AND VOICE EVALUATION DEVICE |
CN201880003613.7A CN109791774B (zh) | 2017-06-23 | 2018-03-30 | 记录介质、声音评价方法以及声音评价装置 |
PCT/JP2018/013867 WO2018235380A1 (ja) | 2017-06-23 | 2018-03-30 | 音声評価プログラム、音声評価方法および音声評価装置 |
US16/354,260 US11232810B2 (en) | 2017-06-23 | 2019-03-15 | Voice evaluation method, voice evaluation apparatus, and recording medium for evaluating an impression correlated to pitch |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017123588A JP6891662B2 (ja) | 2017-06-23 | 2017-06-23 | 音声評価プログラム、音声評価方法および音声評価装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019008130A JP2019008130A (ja) | 2019-01-17 |
JP6891662B2 true JP6891662B2 (ja) | 2021-06-18 |
Family
ID=64736984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017123588A Active JP6891662B2 (ja) | 2017-06-23 | 2017-06-23 | 音声評価プログラム、音声評価方法および音声評価装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11232810B2 (ja) |
EP (1) | EP3644316A4 (ja) |
JP (1) | JP6891662B2 (ja) |
CN (1) | CN109791774B (ja) |
WO (1) | WO2018235380A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3438980B1 (en) * | 2016-03-30 | 2020-04-08 | Fujitsu Limited | Utterance impression determination program, method for determining utterance impression, and utterance impression determination device |
US20200111386A1 (en) * | 2018-10-03 | 2020-04-09 | Edupresent Llc | Presentation Assessment And Valuation System |
EP3931826A4 (en) * | 2019-08-13 | 2022-05-11 | Samsung Electronics Co., Ltd. | SERVER SUPPORTING VOICE RECOGNITION OF A DEVICE AND METHOD OF OPERATING THE SERVER |
CN113658581B (zh) * | 2021-08-18 | 2024-03-01 | 北京百度网讯科技有限公司 | 声学模型的训练、语音处理方法、装置、设备及存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3747492B2 (ja) * | 1995-06-20 | 2006-02-22 | ソニー株式会社 | 音声信号の再生方法及び再生装置 |
JP3447221B2 (ja) * | 1998-06-17 | 2003-09-16 | ヤマハ株式会社 | 音声変換装置、音声変換方法、および音声変換プログラムを記録した記録媒体 |
JP2006267465A (ja) * | 2005-03-23 | 2006-10-05 | Tokyo Electric Power Co Inc:The | 発話状態評価装置、発話状態評価プログラム、プログラム格納媒体 |
JP4587854B2 (ja) * | 2005-03-23 | 2010-11-24 | 東京電力株式会社 | 感情解析装置、感情解析プログラム、プログラム格納媒体 |
FR2926786B1 (fr) * | 2008-01-30 | 2010-02-19 | Eurocopter France | Procede d'optimisation d'un rotor anti-couple carene a gene acoustique minimale pour un giravion, notamment un helicoptere, et rotor anti-couple carene ainsi obtenu |
JP5293018B2 (ja) * | 2008-09-09 | 2013-09-18 | ソニー株式会社 | 音楽情報処理装置、音楽情報処理方法およびコンピュータプログラム |
US8818806B2 (en) * | 2010-11-30 | 2014-08-26 | JVC Kenwood Corporation | Speech processing apparatus and speech processing method |
JP5772448B2 (ja) * | 2011-09-27 | 2015-09-02 | 富士ゼロックス株式会社 | 音声解析システムおよび音声解析装置 |
JP2015087557A (ja) | 2013-10-31 | 2015-05-07 | 三菱電機株式会社 | 発話様式検出装置および発話様式検出方法 |
JP6759560B2 (ja) * | 2015-11-10 | 2020-09-23 | ヤマハ株式会社 | 調律推定装置及び調律推定方法 |
-
2017
- 2017-06-23 JP JP2017123588A patent/JP6891662B2/ja active Active
-
2018
- 2018-03-30 CN CN201880003613.7A patent/CN109791774B/zh active Active
- 2018-03-30 WO PCT/JP2018/013867 patent/WO2018235380A1/ja active Application Filing
- 2018-03-30 EP EP18821009.0A patent/EP3644316A4/en active Pending
-
2019
- 2019-03-15 US US16/354,260 patent/US11232810B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11232810B2 (en) | 2022-01-25 |
CN109791774A (zh) | 2019-05-21 |
CN109791774B (zh) | 2023-03-10 |
EP3644316A4 (en) | 2020-06-24 |
WO2018235380A1 (ja) | 2018-12-27 |
US20190214039A1 (en) | 2019-07-11 |
JP2019008130A (ja) | 2019-01-17 |
EP3644316A1 (en) | 2020-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6891662B2 (ja) | 音声評価プログラム、音声評価方法および音声評価装置 | |
US11986283B2 (en) | Methods and apparatus for cough detection in background noise environments | |
KR101153093B1 (ko) | 다감각 음성 향상을 위한 방법 및 장치 | |
JP5728888B2 (ja) | 信号処理装置および方法、並びにプログラム | |
US9959886B2 (en) | Spectral comb voice activity detection | |
CN106558308B (zh) | 一种互联网音频数据质量自动打分系统及方法 | |
Ba et al. | BaNa: A hybrid approach for noise resilient pitch detection | |
WO2018014673A1 (zh) | 一种啸叫检测方法和装置 | |
US20200251129A1 (en) | Voice processing method and voice processing apparatus | |
CN112700399B (zh) | 缺陷检测视觉化方法及其系统 | |
JP7095414B2 (ja) | 音声処理プログラム、音声処理方法および音声処理装置 | |
Poorjam et al. | A parametric approach for classification of distortions in pathological voices | |
JP7000757B2 (ja) | 音声処理プログラム、音声処理方法および音声処理装置 | |
US10636438B2 (en) | Method, information processing apparatus for processing speech, and non-transitory computer-readable storage medium | |
JP6904198B2 (ja) | 音声処理プログラム、音声処理方法および音声処理装置 | |
JP6672478B2 (ja) | 生体音解析方法、プログラム、記憶媒体及び生体音解析装置 | |
JP6907859B2 (ja) | 音声処理プログラム、音声処理方法および音声処理装置 | |
JP7293826B2 (ja) | 問題検出装置、問題検出方法および問題検出プログラム | |
CN111415681A (zh) | 一种基于音频数据确定音符的方法及装置 | |
CN113516965B (zh) | 一种语音测试方法、计算机设备及可读存储介质 | |
CN106372657B (zh) | 一种基于图像识别的运动数据偏差修正的方法和装置 | |
CN117727311A (zh) | 音频处理方法及装置、电子设备及计算机可读存储介质 | |
CN116978405A (zh) | 无参考说话人日志系统评价方法、装置及设备 | |
EP2148327A1 (en) | A method and a device and a system for determining the location of distortion in an audio signal | |
JP2019020600A (ja) | 評価プログラム、評価方法および評価装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210318 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210427 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210510 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6891662 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |