JP2010026068A - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP2010026068A JP2010026068A JP2008184897A JP2008184897A JP2010026068A JP 2010026068 A JP2010026068 A JP 2010026068A JP 2008184897 A JP2008184897 A JP 2008184897A JP 2008184897 A JP2008184897 A JP 2008184897A JP 2010026068 A JP2010026068 A JP 2010026068A
- Authority
- JP
- Japan
- Prior art keywords
- differential wave
- vocal cord
- source differential
- sound source
- vocal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】 有声音において、入力音声の声帯音源微分波を推定し、この声帯音源微分波から基本周期ごとに現れる急峻な立ち上がりの最小位置と最大位置を特定し、立ち上がりの最大位置から次の立ち上がりの最小位置までの区間の声帯音源微分波が有する特徴を数値化することによって基本周期やパワーに依存することなく、声の張りに関する特徴量を算出する。
【選択図】 図2
Description
Alku, P., Backstrom, T., & Vilkman, E. (2002). Normalized amplitude quotient for parameterization of the glottal flow. Journal of the Acoustic Society of America: 112(2), 701-710.
このような積分処理を行うと、αが1.0に近い場合、−6dB/octの特性が付加される。残差波形はフラットな周波数特性を有するため、積分処理を行うことで、−6dB/octの特性を付加することができる。なお、残差波形から声帯音源微分波を得る処理は積分処理に限定することはなく、例えば−6dB/octの特性を有するFIRフィルタによって処理しても良い。
Claims (6)
- 音声を入力する入力手段と、
前記入力手段によって入力された音声をフレームに区分する区分手段と、
前記区分手段から出力されたフレーム音声に対して線形予測分析を行って、線形予測の残差波形を算出し、この残差波形に基づいて声帯音源波に放射特性を加えた声帯音源微分波を推定する声帯音源微分波演算手段と、
前記区分手段によって区分されるフレーム音声から基本周期を算出する基本周期演算手段と、
前記声帯音源微分波演算手段によって推定された声帯音源微分波に対して、前記基本周期ごとに急峻な立ち上がり位置を特定し、隣り合う急峻な立ち上がり位置間の前記声帯音源微分波から特徴量を算出する特徴量算出手段とを有することを特徴とする情報処理装置。 - 前記特徴量算出手段は、前記声帯音源微分波演算手段によって推定された声帯音源微分波に対して、前記基本周期ごとに急峻な立ち上がりの最小位置と最大位置とを特定して、急峻な立ち上がりの最大位置と次の急峻な立ち上がりの最小位置とを結ぶ線分を取得し、前記声帯音源微分波と前記線分との差分の合計値を特徴量として算出することを特徴とする請求項1に記載の情報処理装置。
- 前記特徴量算出手段は、前記声帯音源微分波演算手段によって推定された声帯音源微分波に対して、前記基本周期ごとに急峻な立ち上がりの最小位置と最大位置とを特定して、急峻な立ち上がりの最大位置と次の急峻な立ち上がりの最小位置とを結ぶ線分を取得し、前記声帯音源微分波と前記線分との差分の荷重和を特徴量として算出することを特徴とする請求項1に記載の情報処理装置。
- 前記基本周期演算手段によってフレーム音声の基本周期が算出されなかった場合、当該フレームに対して前記特徴量算出手段による特徴量の算出を行わないことを特徴とする請求項1に記載の情報処理装置。
- 前記声帯音源微分波の前記基本周期ごとの急峻な波形の立ち上がり位置は、前記基本周期ごとに声帯音源微分波を微分して得られる値が最大値のサンプルから前後に前記微分して得られる値が前記最大値の所定の割合以上のサンプルが連続する区間とすることを特徴とする請求項1に記載の情報処理装置。
- 入力された音声をフレームに区分する区分機能と、
前記区分機能によって得られるフレーム音声に対して線形予測分析を行って、線形予測の残差波形を算出し、この残差波形に基づいて声帯音源波に放射特性を加えた声帯音源微分波を推定する声帯音源微分波演算機能と、
前記区分機能によって区分されるフレーム音声から基本周期を算出する基本周期演算機能と、
前記声帯音源微分波演算機能によって推定された声帯音源微分波に対して、前記基本周期ごとに急峻な立ち上がり位置を特定し、隣り合う急峻な立ち上がり位置間の前記声帯音源微分波から特徴量を算出する特徴量算出機能とを有することを特徴とする音声特徴量算出プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008184897A JP4970371B2 (ja) | 2008-07-16 | 2008-07-16 | 情報処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008184897A JP4970371B2 (ja) | 2008-07-16 | 2008-07-16 | 情報処理装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2010026068A true JP2010026068A (ja) | 2010-02-04 |
| JP4970371B2 JP4970371B2 (ja) | 2012-07-04 |
Family
ID=41731986
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008184897A Expired - Fee Related JP4970371B2 (ja) | 2008-07-16 | 2008-07-16 | 情報処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4970371B2 (ja) |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03171100A (ja) * | 1989-11-30 | 1991-07-24 | Nec Corp | 音声分析合成装置 |
| JPH1185197A (ja) * | 1997-09-02 | 1999-03-30 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 音声信号分析装置 |
| JPH1185198A (ja) * | 1997-09-08 | 1999-03-30 | Nec Corp | ボコーダ符号化復号装置 |
| JP2003330478A (ja) * | 2002-05-16 | 2003-11-19 | Japan Science & Technology Corp | 音声波形の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、音声信号の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、ならびに擬似音節核抽出装置およびプログラム |
| JP2005189483A (ja) * | 2003-12-25 | 2005-07-14 | Advanced Telecommunication Research Institute International | 声質モデル生成方法、声質変換方法、並びにそれらのためのコンピュータプログラム、当該プログラムを記録した記録媒体、及び当該プログラムによりプログラムされたコンピュータ |
-
2008
- 2008-07-16 JP JP2008184897A patent/JP4970371B2/ja not_active Expired - Fee Related
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03171100A (ja) * | 1989-11-30 | 1991-07-24 | Nec Corp | 音声分析合成装置 |
| JPH1185197A (ja) * | 1997-09-02 | 1999-03-30 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 音声信号分析装置 |
| JPH1185198A (ja) * | 1997-09-08 | 1999-03-30 | Nec Corp | ボコーダ符号化復号装置 |
| JP2003330478A (ja) * | 2002-05-16 | 2003-11-19 | Japan Science & Technology Corp | 音声波形の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、音声信号の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、ならびに擬似音節核抽出装置およびプログラム |
| JP2005189483A (ja) * | 2003-12-25 | 2005-07-14 | Advanced Telecommunication Research Institute International | 声質モデル生成方法、声質変換方法、並びにそれらのためのコンピュータプログラム、当該プログラムを記録した記録媒体、及び当該プログラムによりプログラムされたコンピュータ |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4970371B2 (ja) | 2012-07-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Ramamohan et al. | Sinusoidal model-based analysis and classification of stressed speech | |
| CN107657964A (zh) | 基于声学特征和稀疏数学的抑郁症辅助检测方法及分类器 | |
| Ilyas | Pseudo-colored rate map representation for speech emotion recognition | |
| Simantiraki et al. | Stress detection from speech using spectral slope measurements | |
| KR20170009338A (ko) | 음성 인식을 위한 모델 구축 장치 및 음성 인식 장치 및 방법 | |
| Martinez et al. | Prosodic features and formant modeling for an ivector-based language recognition system | |
| Carignan | A practical method of estimating the time-varying degree of vowel nasalization from acoustic features | |
| JPH10133693A (ja) | 音声認識装置 | |
| Přibil et al. | GMM-based speaker gender and age classification after voice conversion | |
| Subhashree et al. | Speech emotion recognition: performance analysis based on fused algorithms and GMM modelling | |
| Saxon et al. | Objective measures of plosive nasalization in hypernasal speech | |
| Chandrashekar et al. | Breathiness indices for classification of dysarthria based on type and speech intelligibility | |
| Hosain et al. | Deep-learning-based speech emotion recognition using synthetic bone-conducted speech | |
| Dissen et al. | Formant Estimation and Tracking Using Deep Learning. | |
| Dubuisson et al. | On the use of the correlation between acoustic descriptors for the normal/pathological voices discrimination | |
| Dhar et al. | A system to predict emotion from Bengali speech | |
| Submitter et al. | Gender recognition and classification of speech signal | |
| Ahmed et al. | Enhancing English accent identification in automatic speech recognition using spectral features and hybrid CNN-BiLSTM model | |
| JP7159655B2 (ja) | 感情推定システムおよびプログラム | |
| WO2003098597A1 (en) | Syllabic kernel extraction apparatus and program product thereof | |
| Badr et al. | Estimating age in short utterances based on multi-class classification approach | |
| US20140074468A1 (en) | System and Method for Automatic Prediction of Speech Suitability for Statistical Modeling | |
| JP2007219286A (ja) | 音声のスタイル検出装置、その方法およびそのプログラム | |
| Mohanta et al. | Classifying emotional states using pitch and formants in vowel regions | |
| JP4970371B2 (ja) | 情報処理装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101119 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20101119 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111212 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111220 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120215 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120313 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120404 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150413 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150413 Year of fee payment: 3 |
|
| LAPS | Cancellation because of no payment of annual fees |
