JP2010102129A - 基本周波数抽出方法、基本周波数抽出装置、およびプログラム - Google Patents
基本周波数抽出方法、基本周波数抽出装置、およびプログラム Download PDFInfo
- Publication number
- JP2010102129A JP2010102129A JP2008273605A JP2008273605A JP2010102129A JP 2010102129 A JP2010102129 A JP 2010102129A JP 2008273605 A JP2008273605 A JP 2008273605A JP 2008273605 A JP2008273605 A JP 2008273605A JP 2010102129 A JP2010102129 A JP 2010102129A
- Authority
- JP
- Japan
- Prior art keywords
- fundamental frequency
- data
- information
- cepstrum
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
【解決手段】パワースペクトルデータとその平滑化処理したデータとの差分データをケプトラム処理して得られたピーク値から抽出した基本周波数候補データの群を、連続する所定のデータ数ずつ時系列にそのデータ値の大小を比較してその昇順もしくは降順にソートしたその中央値またはその近傍の代表値のケフレンシー情報から、基本周波数値とする代表値判定を行う基本周波数抽出方法を特徴とする。
【選択図】図1
Description
まず、本発明の基本周波数抽出方法について、図1〜図4を用いて説明する。
従来の手法で求めた基本周波数をひし形「◇」で示し(図3の30に示すデータ群参照)、本発明を適用して求めた基本周波数を丸でプロットした(図3の31に示すデータ群参照)。本データは典型的なオフィス環境で男性が発話したものを用い、パワースペクトルの移動平均処理(S4の平滑化処理)を、連続する15データずつで行い、本発明では、その中央値判定には、連続する9データずつ昇順(または降順)にソートした際の5番目のデータ値を、前記9データの中間データである5番目のデータ値として入れ替えることにより算出した。100Hz付近のデータが本被験者の基本周波数である。音素(発話の最小単位“あ”、“い”などの一単語(一音節))単位での、立ち上がり、立下りにおける基本周波数の検出精度は欠落する(=本手法では検出されず欠落する)が、発話中の主要な基本周波数成分は十分に抽出されている。たとえば環境ノイズに起因する誤検出を効果的に抑制できる(この環境ノイズはオフィス等の実環境におけるノイズ成分中の大部分を占めるものであり、調和構造を有しないものである)。よって本発明の方法により、全体的に良好な基本周波数の抽出を安定して行うことが可能になる。なお環境ノイズとして、たとえば機械の動作音やキーボード操作音、歩行時のノイズや空調などが挙げられる。
次に図6を用いて、本発明の基本周波数抽出装置について説明する。
21 パワースペクトルデータ
22 平滑処理データ
23 差分データ
24 ケプストラムデータ
25 帯域制限による高周波のノイズ成分を抑制した部分
26 ローカルピーク
26a ピーク値
30 音声以外のノイズ等による誤検出が多数検出された例(従来の手法で求めた基本周波数のデータ群)
31 本発明を適用して求めた基本周波数のデータ群
60 前処理部
61 パワースペクトル処理部
62 平滑化(帯域制限)処理部
63 差分処理部
64 ケプストラム処理部
65 ピーク値検出部
66 中央値判定部
67 後処理部
68 演算処理部
69−1 分散値算出部
69−2 平滑化処理部
Claims (11)
- パワースペクトルデータとその平滑化処理したデータとの差分データをケプトラム処理して得られたピーク値から抽出した基本周波数候補データの群を、連続する所定のデータ数ずつ時系列にそのデータ値の大小を比較してその昇順もしくは降順にソートしたその中央値またはその近傍の代表値のケフレンシー情報から、基本周波数値とする代表値判定を行うことを特徴とする基本周波数抽出方法。
- 音声データから基本周波数情報を抽出する基本周波数抽出方法であって、少なくともフーリエ変換と対数演算処理によるパワースペクトル情報の算出処理工程と、フーリエ変換もしくは逆フーリエ変換によるケプストラム情報抽出処理を含む基本周波数候補抽出工程と、前記基本周波数候補抽出工程後に、複数の連続するケプストラム情報を、連続する所定数ごとに比較処理を行い、前記比較結果により得られる中央値またはその近傍の代表値のケフレンシー情報から、基本周波数を決定する基本周波数情報抽出工程を有することを特徴とする基本周波数抽出方法。
- 前記比較処理は、前記ケプストラムデータを平滑化処理により演算処理したデータ群を用いて行うことを特徴とする請求項2に記載の基本周波数抽出方法。
- 前記パワースペクトル情報の算出処理工程で切り出された所定数の音声データごとの分散値を算出し、前記閾値未満の所定数の音声データに対して、前記パワースペクトル情報の算出処理工程と、基本周波数候補抽出工程とを省略する判定処理を行うことを特徴とする請求項2または3に記載の基本周波数抽出方法。
- 所定数のケプストラム情報を入力し、前記所定数のケプストラム情報ごとに比較を行い、前記比較結果により得られる中央値またはその近傍の代表値のケフレンシー情報から基本周波数を決定する中央値判定手段により基本周波数情報を抽出することを特徴とする基本周波数抽出装置。
- 音声データから基本周波数情報を抽出する装置であって、
少なくともフーリエ変換と対数演算処理によるパワースペクトル情報の変換処理手段と、フーリエ変換もしくは逆フーリエ変換処理によるケプストラム情報抽出過程から基本周波数情報を算出する基本周波数情報抽出手段とを前段に有し、
前記複数の所定数のケプストラム情報が当該前段から前記中央値判定手段に入力されることを特徴とする請求項5に記載の基本周波数抽出装置。 - 前記中央値判定手段は、所定数のケプストラムデータごとにケプストラム値の比較を行う際に、前記ケプストラムデータを平滑化処理部により平滑化処理されたデータ群を用いて前記中央値比較処理を行うことを特徴とする請求項5または6に記載の基本周波数抽出装置。
- 前記基本周波数抽出装置において、前記パワースペクトル情報の変換処理手段により切り出された所定数のデータごとの分散値を算出し、前記分散値が閾値未満の前記所定数のデータに対して、前記パワースペクトル情報の変換処理手段と、基本周波数情報抽出手段における処理を省略する判定手段を有することを特徴とする請求項第5から7のいずれか1項に記載の基本周波数抽出装置。
- 音声データから基本周波数情報を抽出させるプログラムであって、
少なくともフーリエ変換と対数演算によるパワースペクトル情報の変換処理と、フーリエ変換もしくは逆フーリエ変換処理によるケプストラム情報抽出過程からピッチ情報を算出するピッチ情報抽出処理により基本周波数情報を抽出する処理とを有し、前記ピッチ情報抽出処理において所定数のケプストラム情報ごとの比較を行い、前記比較結果により得られる中央値およびその近傍を含む代表値のケフレンシー情報から基本周波数を決定する処理を実行させるためのプログラム。 - 前記基本周波数情報抽出処理において、所定数のケプストラムデータごとのケプストラム値の比較を行う際に、前記ケプストラムデータを平滑化処理したデータ群を用いて前記中央値比較処理を行わせることを特徴とする請求項9に記載のプログラム。
- 前記プログラムにおいて、前記パワースペクトル情報算出処理により切り出された所定数のデータごとの分散値を算出し、前記分散値が閾値未満のデータの場合には前記パワースペクトル情報の算出処理と、前記基本周波数候補抽出処理とを省略し、前記分散値が閾値以上のデータの場合には続行する判定処理を行わせることを特徴とする請求項9または10に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008273605A JP5282523B2 (ja) | 2008-10-23 | 2008-10-23 | 基本周波数抽出方法、基本周波数抽出装置、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008273605A JP5282523B2 (ja) | 2008-10-23 | 2008-10-23 | 基本周波数抽出方法、基本周波数抽出装置、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010102129A true JP2010102129A (ja) | 2010-05-06 |
JP5282523B2 JP5282523B2 (ja) | 2013-09-04 |
Family
ID=42292827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008273605A Expired - Fee Related JP5282523B2 (ja) | 2008-10-23 | 2008-10-23 | 基本周波数抽出方法、基本周波数抽出装置、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5282523B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012093641A (ja) * | 2010-10-28 | 2012-05-17 | Toshiba Corp | 携帯型電子機器 |
CN106776664A (zh) * | 2015-11-25 | 2017-05-31 | 北京搜狗科技发展有限公司 | 一种基频序列处理方法及装置 |
KR102164306B1 (ko) * | 2019-12-31 | 2020-10-12 | 브레인소프트주식회사 | 디제이변환에 기초한 기본주파수 추출 방법 |
CN112597331A (zh) * | 2020-12-25 | 2021-04-02 | 腾讯音乐娱乐科技(深圳)有限公司 | 显示音域匹配信息的方法、装置、设备和存储介质 |
WO2022019425A1 (ko) * | 2020-07-21 | 2022-01-27 | 브레인소프트 주식회사 | 복합음을 구성하는 순음의 추출 방법 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110379438B (zh) * | 2019-07-24 | 2020-05-12 | 山东省计算中心(国家超级计算济南中心) | 一种语音信号基频检测与提取方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63124100A (ja) * | 1986-11-13 | 1988-05-27 | 藤崎 博也 | 基本周波数分析装置 |
JPH04176244A (ja) * | 1990-11-09 | 1992-06-23 | Hitachi Ltd | 音声情報処理装置 |
JPH09210763A (ja) * | 1996-02-07 | 1997-08-15 | Nec Corp | 高調波ピッチ検出装置 |
JPH1124698A (ja) * | 1997-07-09 | 1999-01-29 | Sony Corp | 信号識別装置、コードブツク切換装置、信号識別方法及びコードブツク切換方法 |
-
2008
- 2008-10-23 JP JP2008273605A patent/JP5282523B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63124100A (ja) * | 1986-11-13 | 1988-05-27 | 藤崎 博也 | 基本周波数分析装置 |
JPH04176244A (ja) * | 1990-11-09 | 1992-06-23 | Hitachi Ltd | 音声情報処理装置 |
JPH09210763A (ja) * | 1996-02-07 | 1997-08-15 | Nec Corp | 高調波ピッチ検出装置 |
JPH1124698A (ja) * | 1997-07-09 | 1999-01-29 | Sony Corp | 信号識別装置、コードブツク切換装置、信号識別方法及びコードブツク切換方法 |
Non-Patent Citations (2)
Title |
---|
CSNG199900763005; 加藤誠二他: '"移動平均と帯域制限を用いたケプストラム型基本周波数抽出とその応用"' 電子情報通信学会技術研究報告 Vol.94,No.522(1995-02), pp.29-36 * |
JPN6012033233; 加藤誠二他: '"移動平均と帯域制限を用いたケプストラム型基本周波数抽出とその応用"' 電子情報通信学会技術研究報告 Vol.94,No.522(1995-02), pp.29-36 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012093641A (ja) * | 2010-10-28 | 2012-05-17 | Toshiba Corp | 携帯型電子機器 |
CN106776664A (zh) * | 2015-11-25 | 2017-05-31 | 北京搜狗科技发展有限公司 | 一种基频序列处理方法及装置 |
KR102164306B1 (ko) * | 2019-12-31 | 2020-10-12 | 브레인소프트주식회사 | 디제이변환에 기초한 기본주파수 추출 방법 |
WO2021137419A1 (ko) * | 2019-12-31 | 2021-07-08 | 브레인소프트 주식회사 | 디제이변환에 기초한 기본주파수 추출 방법 |
US11574646B2 (en) | 2019-12-31 | 2023-02-07 | Brainsoft Inc. | Fundamental frequency extraction method using DJ transform |
WO2022019425A1 (ko) * | 2020-07-21 | 2022-01-27 | 브레인소프트 주식회사 | 복합음을 구성하는 순음의 추출 방법 |
CN112597331A (zh) * | 2020-12-25 | 2021-04-02 | 腾讯音乐娱乐科技(深圳)有限公司 | 显示音域匹配信息的方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5282523B2 (ja) | 2013-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108198547B (zh) | 语音端点检测方法、装置、计算机设备和存储介质 | |
CN109256138B (zh) | 身份验证方法、终端设备及计算机可读存储介质 | |
US8655656B2 (en) | Method and system for assessing intelligibility of speech represented by a speech signal | |
WO2014153800A1 (zh) | 语音识别系统 | |
US20050143997A1 (en) | Method and apparatus using spectral addition for speaker recognition | |
US20090177468A1 (en) | Speech recognition with non-linear noise reduction on mel-frequency ceptra | |
CN108305639B (zh) | 语音情感识别方法、计算机可读存储介质、终端 | |
CN112951259B (zh) | 音频降噪方法、装置、电子设备及计算机可读存储介质 | |
JP5282523B2 (ja) | 基本周波数抽出方法、基本周波数抽出装置、およびプログラム | |
JP3006677B2 (ja) | 音声認識装置 | |
CN108682432B (zh) | 语音情感识别装置 | |
JP4736632B2 (ja) | ボーカル・フライ検出装置及びコンピュータプログラム | |
Labied et al. | An overview of automatic speech recognition preprocessing techniques | |
KR100571574B1 (ko) | 비선형 분석을 이용한 유사화자 인식방법 및 그 시스템 | |
Hanilçi et al. | Comparing spectrum estimators in speaker verification under additive noise degradation | |
Revathy et al. | Performance comparison of speaker and emotion recognition | |
JP4677548B2 (ja) | パラ言語情報検出装置及びコンピュータプログラム | |
KR20070069631A (ko) | 음성 신호에서 음소를 분절하는 방법 및 그 시스템 | |
Shome et al. | Reference free speech quality estimation for diverse data condition | |
CN116312561A (zh) | 一种电力调度系统人员声纹识别鉴权降噪和语音增强方法、系统及装置 | |
Lu | Reduction of musical residual noise using block-and-directional-median filter adapted by harmonic properties | |
JP2006215228A (ja) | 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体 | |
Tomchuk | Spectral masking in MFCC calculation for noisy speech | |
Shome et al. | Non-negative frequency-weighted energy-based speech quality estimation for different modes and quality of speech | |
JP4537821B2 (ja) | オーディオ信号分析方法、その方法を用いたオーディオ信号認識方法、オーディオ信号区間検出方法、それらの装置、プログラムおよびその記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110811 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110818 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130408 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130430 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130513 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5282523 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |