JP4585590B2 - 基本周波数変化量抽出装置、方法及びプログラム - Google Patents
基本周波数変化量抽出装置、方法及びプログラム Download PDFInfo
- Publication number
- JP4585590B2 JP4585590B2 JP2008248000A JP2008248000A JP4585590B2 JP 4585590 B2 JP4585590 B2 JP 4585590B2 JP 2008248000 A JP2008248000 A JP 2008248000A JP 2008248000 A JP2008248000 A JP 2008248000A JP 4585590 B2 JP4585590 B2 JP 4585590B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- logarithmic
- fundamental frequency
- unit
- spectrogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Description
102 ハフ変換部
103 直線群抽出部
Claims (9)
- 入力された音声信号に基づいて、対数周波数軸上で等間隔に求められた周波数成分からなる対数周波数スペクトルであって時刻毎に当該時刻を含む所定の時間範囲の対数周波数スペクトルを連結した対数周波数スペクトログラムを計算する対数周波数スペクトログラム計算部と、
前記対数周波数スペクトログラムの時系列の各時刻において、当該対数周波数スペクトログラムについて周波数成分の強さを用いて投票を行うことにより、直線を検出するためのハフ変換を行うハフ変換部と、
前記投票の結果である投票値を用いて、直線の集まりである直線群と、周波数成分の強さが第1閾値より大きい投票値又は周波数成分の強さの大きい順に所定の順位以内の投票値とを抽出する直線群抽出部と、
前記直線群に含まれる個々の直線の傾きと抽出された前記投票値とを用いて、基本周波数の時間変化量を計算する基本周波数変化量計算部と、
を備えることを特徴とする基本周波数変化量抽出装置。 - 前記基本周波数変化量計算部は、
任意の傾き毎に、当該傾きを共通に持つ前記直線について抽出された前記投票値を加算する対象投票値加算部と、
任意の傾きから、加算された前記投票値の総和の最大値を与える傾きを抽出する傾き抽出部と、
抽出された傾きを用いて、基本周波数の時間変化量を計算する基本周波数変化量算出部と、
を有することを特徴とする請求項1に記載の基本周波数変化量抽出装置。 - 前記基本周波数変化量算出部は、抽出された傾きと、線形周波数軸上における周波数の最大値と、線形周波数軸上における周波数の最小値とを用いて、基本周波数の時間変化量を計算することを特徴とする請求項2に記載の基本周波数変化量抽出装置。
- 前記対数周波数スペクトログラムから、周波数成分の強さが第2閾値より大きい特徴点又は周波数成分の強さの大きい順に所定の順位以内の特徴点を抽出する特徴点抽出部を更に備え、
前記ハフ変換部は、抽出された前記特徴点の周波数成分の強さのみを用いて投票を行うことにより、前記ハフ変換を行うことを特徴とする請求項1乃至請求項3のいずれか1項に記載の基本周波数変化量抽出装置。 - 前記特徴点抽出部は、前記対数周波数スペクトログラムの各点に対して、周波数成分の強さと前記第2閾値との比較を行い、周波数成分の強さが前記第2閾値より大きい点を前記特徴点として抽出することを特徴とする請求項4に記載の基本周波数変化量抽出装置。
- 前記特徴点抽出部は、前記対数周波数スペクトログラムの各点に対して、周波数成分の強さの大きい順に所定の順位以内の点を前記特徴点として抽出することを特徴とする請求項4に記載の基本周波数変化量抽出装置。
- 前記対数周波数スペクトログラム計算部は、
所定の間隔の時刻毎に所定の時間範囲に分解された前記音声信号であるフレーム毎に周波数分析を行い、前記対数周波数スペクトルを計算する周波数分析部と、
時刻毎に、当該時刻を含む所定の時間範囲の対数周波数スペクトルを連結する対数周波数スペクトログラム連結部と、
を有することを特徴とする請求項1乃至請求項6のいずれか1項に記載の基本周波数変化量抽出装置。 - 対数周波数スペクトログラム計算部と、ハフ変換部と、直線群抽出部と、基本周波数変化量計算部とを備える基本周波数変化量抽出装置で実行される基本周波数変化量抽出方法であって、
前記対数周波数スペクトログラム計算部が、入力された音声信号に基づいて、対数周波数軸上で等間隔に求められた周波数成分からなる対数周波数スペクトルであって時刻毎に当該時刻を含む所定の時間範囲の対数周波数スペクトルを連結した対数周波数スペクトログラムを計算する対数周波数スペクトログラム計算ステップと、
前記ハフ変換部が、前記対数周波数スペクトログラムの時系列の各時刻において、当該対数周波数スペクトログラムについて周波数成分の強さを用いて投票を行うことにより、直線を検出するためのハフ変換を行うハフ変換ステップと、
前記直線群抽出部が、前記投票の結果である投票値を用いて、直線の集まりである直線群と、周波数成分の強さが第1閾値より大きい投票値又は周波数成分の強さの大きい順に所定の順位以内の投票値とを抽出する直線群抽出ステップと、
前記基本周波数変化量計算部が、前記直線群に含まれる個々の直線の傾きと抽出された前記投票値とを用いて、基本周波数の時間変化量を計算する基本周波数変化量計算ステップと、
を含むことを特徴とする基本周波数変化量抽出方法。 - 請求項8に記載の基本周波数変化量抽出方法をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008248000A JP4585590B2 (ja) | 2008-09-26 | 2008-09-26 | 基本周波数変化量抽出装置、方法及びプログラム |
US12/556,382 US8554546B2 (en) | 2008-09-26 | 2009-09-09 | Apparatus and method for calculating a fundamental frequency change |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008248000A JP4585590B2 (ja) | 2008-09-26 | 2008-09-26 | 基本周波数変化量抽出装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010078990A JP2010078990A (ja) | 2010-04-08 |
JP4585590B2 true JP4585590B2 (ja) | 2010-11-24 |
Family
ID=42058385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008248000A Active JP4585590B2 (ja) | 2008-09-26 | 2008-09-26 | 基本周波数変化量抽出装置、方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8554546B2 (ja) |
JP (1) | JP4585590B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101996628A (zh) * | 2009-08-21 | 2011-03-30 | 索尼株式会社 | 提取语音信号的韵律特征的方法和装置 |
WO2013046629A1 (ja) * | 2011-09-30 | 2013-04-04 | 旭化成株式会社 | 基本周波数抽出装置および基本周波数抽出方法 |
US9965685B2 (en) * | 2015-06-12 | 2018-05-08 | Google Llc | Method and system for detecting an audio event for smart home devices |
KR102164306B1 (ko) * | 2019-12-31 | 2020-10-12 | 브레인소프트주식회사 | 디제이변환에 기초한 기본주파수 추출 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2940835B2 (ja) * | 1991-03-18 | 1999-08-25 | 日本電信電話株式会社 | ピッチ周波数差分特徴量抽出法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009047831A (ja) | 2007-08-17 | 2009-03-05 | Toshiba Corp | 特徴量抽出装置、プログラムおよび特徴量抽出方法 |
JP4599420B2 (ja) | 2008-02-29 | 2010-12-15 | 株式会社東芝 | 特徴量抽出装置 |
-
2008
- 2008-09-26 JP JP2008248000A patent/JP4585590B2/ja active Active
-
2009
- 2009-09-09 US US12/556,382 patent/US8554546B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2940835B2 (ja) * | 1991-03-18 | 1999-08-25 | 日本電信電話株式会社 | ピッチ周波数差分特徴量抽出法 |
Also Published As
Publication number | Publication date |
---|---|
US8554546B2 (en) | 2013-10-08 |
US20100082336A1 (en) | 2010-04-01 |
JP2010078990A (ja) | 2010-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8073686B2 (en) | Apparatus, method and computer program product for feature extraction | |
US8831942B1 (en) | System and method for pitch based gender identification with suspicious speaker detection | |
JP2009047831A (ja) | 特徴量抽出装置、プログラムおよび特徴量抽出方法 | |
JP5949550B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
JP4182444B2 (ja) | 信号処理装置、信号処理方法、及びプログラム | |
JP2000298475A (ja) | 和音判定装置、方法及び記録媒体 | |
KR20080065910A (ko) | 정보처리장치 및 방법과 프로그램 | |
JP2008139568A (ja) | 音声処理装置および音声処理方法、並びに、プログラム | |
JP2006195449A (ja) | 声質判定装置、声質判定方法、および声質判定プログラム | |
JP4585590B2 (ja) | 基本周波数変化量抽出装置、方法及びプログラム | |
Yarra et al. | A mode-shape classification technique for robust speech rate estimation and syllable nuclei detection | |
KR20070069631A (ko) | 음성 신호에서 음소를 분절하는 방법 및 그 시스템 | |
JP5924968B2 (ja) | 楽譜位置推定装置、及び楽譜位置推定方法 | |
JP4630183B2 (ja) | 音声信号分析装置、音声信号分析方法及び音声信号分析プログラム | |
JP2008256942A (ja) | 音声合成データベースのデータ比較装置及び音声合成データベースのデータ比較方法 | |
JP4839970B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
RU2559689C2 (ru) | Способ определения риска развития заболеваний индивида по его голосу и аппаратно-программный комплекс для реализации способа | |
US8103512B2 (en) | Method and system for aligning windows to extract peak feature from a voice signal | |
Ni et al. | Quantitative and structural modeling of voice fundamental frequency contours of speech in Mandarin | |
JP2010060846A (ja) | 合成音声評価システム及び合成音声評価方法 | |
Płonkowski | Using bands of frequencies for vowel recognition for Polish language | |
JP4760179B2 (ja) | 音声特徴量算出装置およびプログラム | |
JP4362072B2 (ja) | 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体 | |
JP2009086476A (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP6790851B2 (ja) | 音声処理プログラム、音声処理方法、及び音声処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100721 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100810 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100903 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4585590 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130910 Year of fee payment: 3 |