JP4839970B2 - 韻律識別装置及び方法、並びに音声認識装置及び方法 - Google Patents
韻律識別装置及び方法、並びに音声認識装置及び方法 Download PDFInfo
- Publication number
- JP4839970B2 JP4839970B2 JP2006161370A JP2006161370A JP4839970B2 JP 4839970 B2 JP4839970 B2 JP 4839970B2 JP 2006161370 A JP2006161370 A JP 2006161370A JP 2006161370 A JP2006161370 A JP 2006161370A JP 4839970 B2 JP4839970 B2 JP 4839970B2
- Authority
- JP
- Japan
- Prior art keywords
- input
- relative pitch
- frequency
- prosodic
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
図1は、本発明の実施の形態に用いられる韻律識別装置のシステム構成の一例を概略的に示すブロック図であり、基本的に一般の音声認識装置とほぼ同様の構成となっている。この図1に示す韻律識別装置は、入力部11、音響分析部12、識別部13、及び出力部15を有して構成されている。
出力部15では、送信されてきた認識結果を画面に表示したり、音として出力したり、さらには、その認識結果を用いて、他の装置を動作させたりなどの指令を行なう。
本発明の実施の形態の音響分析部12は、図1に示すように、周波数特性分析部21と相対ピッチ変化量計算部22の2つを有して成る。
次に、本発明の実施の形態のシステムを、一般的な音声認識装置と並列に使用する場合について説明する。図18に、本発明の実施の形態システムを一般的な音声認識装置と並列に使用した場合のシステム構成図を、また図19にそのフローチャートを示す。
Claims (4)
- 入力音声の韻律的特徴の識別を行う韻律識別装置において、
入力音声の時間的に異なる対数周波数軸上の2つの周波数特性の間の周波数方向の変化としての相対ピッチ変化量を求める音響分析手段と、
この音響分析手段からの出力に基づいて入力音声の韻律的特徴を識別する識別手段とを有し、
上記音響分析手段は、上記対数周波数軸上の2つの周波数特性を列ベクトルX、Yで表すとき、ベクトルXと、Yの転置ベクトルとの積で表される相互相関行列における各ピーク同士を結ぶ稜線の主対角線からのシフト量、又は上記2つの周波数特性のそれぞれにおいて対応する点として決定される対応点の上記相互相関行列の主対角線からのシフト量を相対ピッチ差とし、所望の分析フレーム数において、隣接する分析フレーム間の当該相対ピッチ差を積算して上記相対ピッチ変化量を求める
韻律識別装置。 - 入力音声の韻律的特徴の識別を行う韻律識別方法において、
入力音声の時間的に異なる対数周波数軸上の2つの周波数特性の間の周波数方向の変化としての相対ピッチ変化量を求める音響分析工程と、
この音響分析工程において得られた出力に基づいて入力音声の韻律的特徴を識別する識別工程とを有し、
上記音響分析工程では、上記対数周波数軸上の2つの周波数特性を列ベクトルX、Yで表すとき、ベクトルXと、Yの転置ベクトルとの積で表される相互相関行列における各ピーク同士を結ぶ稜線の主対角線からのシフト量、又は上記2つの周波数特性のそれぞれにおいて対応する点として決定される対応点の上記相互相関行列の主対角線からのシフト量を相対ピッチ差とし、所望の分析フレーム数において、隣接する分析フレーム間の当該相対ピッチ差を積算して上記相対ピッチ変化量を求める
韻律識別方法。 - 音声信号を入力する入力手段と、
この入力手段からの入力音声の時間的に異なる対数周波数軸上の2つの周波数特性の間の周波数方向の変化としての相対ピッチ変化量を求める音響分析手段と、
この音響分析手段からの出力に基づいて入力音声の韻律的特徴を識別する韻律識別手段と、
上記入力手段からの入力音声を音響分析して得られる特徴量に基づいて音声認識を行う音声認識手段と、
上記韻律識別手段からの出力と上記音声認識手段からの出力とを用いて、特定の音声認識結果に対してそれに対応した音声信号の韻律的特徴を付与する選択手段とを有し、
上記音響分析手段は、上記対数周波数軸上の2つの周波数特性を列ベクトルX、Yで表すとき、ベクトルXと、Yの転置ベクトルとの積で表される相互相関行列における各ピーク同士を結ぶ稜線の主対角線からのシフト量、又は上記2つの周波数特性のそれぞれにおいて対応する点として決定される対応点の上記相互相関行列の主対角線からのシフト量を相対ピッチ差とし、所望の分析フレーム数において、隣接する分析フレーム間の当該相対ピッチ差を積算して上記相対ピッチ変化量を求める
音声認識装置。 - 音声信号を入力する入力工程と、
この入力工程において入力された入力音声の時間的に異なる対数周波数軸上の2つの周波数特性の間の周波数方向の変化としての相対ピッチ変化量を求める音響分析工程と、
この音響分析工程において得られた出力に基づいて入力音声の韻律的特徴を識別する韻律識別工程と、
上記入力工程において入力された入力音声を音響分析して得られる特徴量に基づいて音声認識を行う音声認識工程と、
上記韻律識別工程において得られた出力と上記音声認識工程において得られた出力とを用いて、特定の音声認識結果に対してそれに対応した音声信号の韻律的特徴を付与する選択工程とを有し、
上記音響分析工程では、上記対数周波数軸上の2つの周波数特性を列ベクトルX、Yで表すとき、ベクトルXと、Yの転置ベクトルとの積で表される相互相関行列における各ピーク同士を結ぶ稜線の主対角線からのシフト量、又は上記2つの周波数特性のそれぞれにおいて対応する点として決定される対応点の上記相互相関行列の主対角線からのシフト量を相対ピッチ差とし、所望の分析フレーム数において、隣接する分析フレーム間の当該相対ピッチ差を積算して上記相対ピッチ変化量を求める
音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006161370A JP4839970B2 (ja) | 2006-06-09 | 2006-06-09 | 韻律識別装置及び方法、並びに音声認識装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006161370A JP4839970B2 (ja) | 2006-06-09 | 2006-06-09 | 韻律識別装置及び方法、並びに音声認識装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007328288A JP2007328288A (ja) | 2007-12-20 |
JP4839970B2 true JP4839970B2 (ja) | 2011-12-21 |
Family
ID=38928773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006161370A Expired - Fee Related JP4839970B2 (ja) | 2006-06-09 | 2006-06-09 | 韻律識別装置及び方法、並びに音声認識装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4839970B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4599420B2 (ja) * | 2008-02-29 | 2010-12-15 | 株式会社東芝 | 特徴量抽出装置 |
TWI426501B (zh) * | 2010-11-29 | 2014-02-11 | Inst Information Industry | 旋律辨識方法與其裝置 |
JP6165046B2 (ja) * | 2013-12-18 | 2017-07-19 | 一般財団法人電力中央研究所 | 音源位置の推定方法、推定装置及び推定プログラム |
JP7135896B2 (ja) * | 2019-01-28 | 2022-09-13 | トヨタ自動車株式会社 | 対話装置、対話方法及びプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2940835B2 (ja) * | 1991-03-18 | 1999-08-25 | 日本電信電話株式会社 | ピッチ周波数差分特徴量抽出法 |
JP4209301B2 (ja) * | 2003-09-08 | 2009-01-14 | 株式会社和真 | 多焦点用眼鏡枠 |
JP2006084664A (ja) * | 2004-09-15 | 2006-03-30 | Denso Corp | 音声認識装置および音声認識プログラム |
-
2006
- 2006-06-09 JP JP2006161370A patent/JP4839970B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007328288A (ja) | 2007-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4264841B2 (ja) | 音声認識装置および音声認識方法、並びに、プログラム | |
JP4882899B2 (ja) | 音声解析装置、および音声解析方法、並びにコンピュータ・プログラム | |
US7013276B2 (en) | Method of assessing degree of acoustic confusability, and system therefor | |
JP4911034B2 (ja) | 音声判別システム、音声判別方法及び音声判別用プログラム | |
US10553240B2 (en) | Conversation evaluation device and method | |
JP2018072650A (ja) | 音声対話装置及び音声対話方法 | |
JP2010020102A (ja) | 音声認識装置、音声認識方法及びコンピュータプログラム | |
JP4353202B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
JP5040778B2 (ja) | 音声合成装置、方法及びプログラム | |
JP2006267464A (ja) | 感情解析装置、感情解析プログラム、プログラム格納媒体 | |
Chittaragi et al. | Acoustic-phonetic feature based Kannada dialect identification from vowel sounds | |
JP4839970B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
US20050246168A1 (en) | Syllabic kernel extraction apparatus and program product thereof | |
JP2015055653A (ja) | 音声認識装置及び方法、並びに、電子機器 | |
Hasija et al. | Recognition of children Punjabi speech using tonal non-tonal classifier | |
Yavuz et al. | A Phoneme-Based Approach for Eliminating Out-of-vocabulary Problem Turkish Speech Recognition Using Hidden Markov Model. | |
JP2010060846A (ja) | 合成音声評価システム及び合成音声評価方法 | |
KR20100088461A (ko) | 음성 신호를 이용한 감정 인식 장치 및 방법 | |
JP2001312293A (ja) | 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体 | |
JP2011180308A (ja) | 音声認識装置及び記録媒体 | |
KR20100111544A (ko) | 음성인식을 이용한 발음 교정 시스템 및 그 방법 | |
Percybrooks et al. | Voice conversion with linear prediction residual estimaton | |
JP2011158515A (ja) | 音声認識装置および音声認識方法 | |
Minematsu et al. | Para-linguistic information represented as distortion of the acoustic universal structure in speech | |
Tabassum et al. | Speaker independent speech recognition of isolated words in room environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090601 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110407 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110906 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110919 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141014 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |