JP2002049399A5 - - Google Patents

Download PDF

Info

Publication number
JP2002049399A5
JP2002049399A5 JP2000238898A JP2000238898A JP2002049399A5 JP 2002049399 A5 JP2002049399 A5 JP 2002049399A5 JP 2000238898 A JP2000238898 A JP 2000238898A JP 2000238898 A JP2000238898 A JP 2000238898A JP 2002049399 A5 JP2002049399 A5 JP 2002049399A5
Authority
JP
Japan
Prior art keywords
audio signal
digital audio
spectrum data
power spectrum
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000238898A
Other languages
Japanese (ja)
Other versions
JP4645869B2 (en
JP2002049399A (en
Filing date
Publication date
Application filed filed Critical
Priority to JP2000238898A priority Critical patent/JP4645869B2/en
Priority claimed from JP2000238898A external-priority patent/JP4645869B2/en
Publication of JP2002049399A publication Critical patent/JP2002049399A/en
Publication of JP2002049399A5 publication Critical patent/JP2002049399A5/ja
Application granted granted Critical
Publication of JP4645869B2 publication Critical patent/JP4645869B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【特許請求の範囲】
【請求項1】
ディジタルオーディオ信号を変換するディジタル信号処理方法において、
上記ディジタルオーディオ信号からパワースペクトルデータを算出する周波数分析ステップと、
上記パワースペクトルデータを最大値幅で正規化して正規化データを算出する正規化ステップと、
上記正規化データに基づいてそのクラスを分類するクラス分類ステップと、
上記分類されたクラスに対応した予測方式で上記ディジタルオーディオ信号を予測演算することにより上記ディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成する予測演算ステップと
を具えることを特徴とするディジタル信号処理方法。
【請求項2】
上記周波数分析ステップでは、窓関数の各種演算処理方法が具えられ、
上記ディジタルオーディオ信号の周波数特性に応じて、所望の上記演算処理方法が用いられる
ことを特徴とする請求項1に記載のディジタル信号処理方法。
【請求項3】
上記スペクトルデータ抽出ステップでは、
上記一部のパワースペクトルデータを抽出する際、直流成分のパワースペクトルデータが除かれる
ことを特徴とする請求項1に記載のディジタル信号処理方法。
【請求項4】
上記予測演算ステップでは、
予め所望とするディジタルオーディオ信号に基づいて学習により生成されている予測係数が用いられる
ことを特徴とする請求項1に記載のディジタル信号処理方法。
【請求項5】
上記パワースペクトルデータは、ほぼ左右対称の成分からなり、
上記スペクトルデータ抽出ステップでは、
上記パワースペクトルデータのうち、左右いづれかの成分が抽出対象とされる
ことを特徴とする請求項1に記載のディジタル信号処理方法。
【請求項6】
ディジタルオーディオ信号を変換するディジタル信号処理装置において、
上記ディジタルオーディオ信号からパワースペクトルデータを算出する周波数分析手段と、
上記パワースペクトルデータを最大値幅で正規化して正規化データを算出する正規化手段と、
上記正規化データに基づいてそのクラスを分類するクラス分類手段と、
上記分類されたクラスに対応した予測方式で上記ディジタルオーディオ信号を予測演算することにより上記ディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成する予測演算手段と
を具えることを特徴とするディジタル信号処理装置。
【請求項7】
上記周波数分析手段は、窓関数の各種演算処理手段を具え、
上記ディジタルオーディオ信号の周波数特性に応じて、所望の上記演算処理手段を用いる
ことを特徴とする請求項6に記載のディジタル信号処理装置。
【請求項8】
上記スペクトルデータ抽出手段は、
上記一部のパワースペクトルデータを抽出する際、直流成分のパワースペクトルデータを除く
ことを特徴とする請求項6に記載のディジタル信号処理装置。
【請求項9】
上記予測演算手段は、
予め所望とするディジタルオーディオ信号に基づいて学習により生成されている予測係数を用いる
ことを特徴とする請求項6に記載のディジタル信号処理装置。
【請求項10】
上記パワースペクトルデータは、ほぼ左右対称の成分からなり、
上記スペクトルデータ抽出手段は、
上記パワースペクトルデータのうち、左右いづれかの成分を抽出対象とする
ことを特徴とする請求項6に記載のディジタル信号処理装置。
【請求項11】
ディジタルオーディオ信号からパワースペクトルデータを算出する周波数分析ステップと、
上記パワースペクトルデータを最大値幅で正規化して正規化データを算出する正規化ステップと、
上記正規化データに基づいてそのクラスを分類するクラス分類ステップと、
上記分類されたクラスに対応した予測方式で上記ディジタルオーディオ信号を予測演算することにより上記ディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成する予測演算ステップと
を含むプログラムをディジタル信号処理装置に実行させるプログラム格納媒体。
【請求項1
ディジタルオーディオ信号を変換するディジタル信号処理装置の上記変換処理の予測に用いられる予測係数を生成する学習方法において、
所望とするディジタルオーディオ信号から当該ディジタルオーディオ信号を劣化させた生徒ディジタルオーディオ信号を生成する生徒ディジタルオーディオ信号生成ステップと、
上記生徒ディジタルオーディオ信号からパワースペクトルデータを算出する周波数分析ステップと、
上記パワースペクトルデータを最大値幅で正規化して正規化データを算出する正規化ステップと、
上記正規化データに基づいてそのクラスを分類するクラス分類ステップと、
上記ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号とに基づいて上記クラスに対応する予測係数を算出する予測係数算出ステップと
を具えることを特徴とする学習方法。
【請求項1
上記周波数分析ステップでは、窓関数の各種演算処理方法が具えられ、
上記ディジタルオーディオ信号の周波数特性に応じて、所望の上記演算処理方法が用いられる
ことを特徴とする請求項1に記載の学習方法。
【請求項1
上記スペクトルデータ抽出ステップでは、
上記一部のパワースペクトルデータを抽出する際、直流成分のパワースペクトルデータが除かれる
ことを特徴とする請求項1に記載の学習方法。
【請求項1
上記パワースペクトルデータは、ほぼ左右対称の成分からなり、
上記スペクトルデータ抽出ステップでは、
上記パワースペクトルデータのうち、左右いづれかの成分が抽出対象とされる
ことを特徴とする請求項1に記載の学習方法。
【請求項1
ディジタルオーディオ信号を変換するディジタル信号処理装置の上記変換処理の予測演算に用いられる予測係数を生成する学習装置において、
所望とするディジタルオーディオ信号から当該ディジタルオーディオ信号を劣化させた生徒ディジタルオーディオ信号を生成する生徒ディジタルオーディオ信号生成手段と、
上記生徒ディジタルオーディオ信号からパワースペクトルデータを算出する周波数分析手段と、
上記パワースペクトルデータを最大値幅で正規化して正規化データを算出する正規化手段と、
上記正規化データに基づいてそのクラスを分類するクラス分類手段と、
上記ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号とに基づいて上記クラスに対応する予測係数を算出する予測係数算出手段と
を具えることを特徴とする学習装置。
【請求項17
上記周波数分析手段は、窓関数の各種演算処理手段を具え、
上記ディジタルオーディオ信号の周波数特性に応じて、所望の上記演算処理手段を用いる
ことを特徴とする請求項1に記載の学習装置。
【請求項18
上記スペクトルデータ抽出手段は、
上記一部のパワースペクトルデータを抽出する際、直流成分のパワースペクトルデータを除く
ことを特徴とする請求項1に記載の学習装置。
【請求項19
上記パワースペクトルデータは、ほぼ左右対称の成分からなり、
上記スペクトルデータ抽出手段は、
上記パワースペクトルデータのうち、左右いづれかの成分を抽出対象とする
ことを特徴とする請求項1に記載の学習装置。
【請求項2
所望とするディジタルオーディオ信号から当該ディジタルオーディオ信号を劣化させた生徒ディジタルオーディオ信号を生成する生徒ディジタルオーディオ信号生成ステップと、
上記生徒ディジタルオーディオ信号からパワースペクトルデータを算出する周波数分析ステップと、
上記パワースペクトルデータを最大値幅で正規化して正規化データを算出する正規化ステップと、
上記正規化データに基づいてそのクラスを分類するクラス分類ステップと、
上記ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号とに基づいて上記クラスに対応する予測係数を算出する予測係数算出ステップと
を含むプログラムをディジタル信号処理装置に実行させるプログラム格納媒体。
[Claims]
[Claim 1]
In a digital signal processing method for converting a digital audio signal,
A frequency analysis step for calculating power spectrum data from the above digital audio signal,
The normalization step of normalizing the above power spectrum data with the maximum price range and calculating the normalized data,
A classification step that classifies the class based on the above normalized data,
It is characterized by including a prediction calculation step of generating a new digital audio signal by converting the digital audio signal by predicting and calculating the digital audio signal by a prediction method corresponding to the classified class. Digital signal processing method.
2.
In the above frequency analysis step, various arithmetic processing methods of the window function are provided.
The digital signal processing method according to claim 1, wherein a desired arithmetic processing method is used according to the frequency characteristics of the digital audio signal.
3.
In the above spectrum data extraction step,
The digital signal processing method according to claim 1, wherein when extracting a part of the power spectrum data, the power spectrum data of the DC component is removed.
4.
In the above prediction calculation step,
The digital signal processing method according to claim 1, wherein a prediction coefficient generated by learning based on a desired digital audio signal in advance is used.
5.
The power spectrum data is composed of almost symmetrical components.
In the above spectrum data extraction step,
The digital signal processing method according to claim 1, wherein one of the left and right components of the power spectrum data is to be extracted.
6.
In a digital signal processing device that converts a digital audio signal,
A frequency analysis means for calculating power spectrum data from the above digital audio signal,
A normalization means for calculating the normalized data by normalizing the power spectrum data with the maximum price range,
A class classification means that classifies the class based on the above normalized data,
It is characterized by providing a predictive calculation means for generating a new digital audio signal obtained by converting the digital audio signal by predicting and calculating the digital audio signal by a prediction method corresponding to the classified class. Digital signal processing device.
7.
The frequency analysis means includes various arithmetic processing means of the window function.
The digital signal processing apparatus according to claim 6, wherein a desired arithmetic processing means is used according to the frequency characteristics of the digital audio signal.
8.
The spectrum data extraction means
The digital signal processing apparatus according to claim 6, wherein when extracting a part of the power spectrum data, the power spectrum data of the DC component is removed.
9.
The above prediction calculation means
The digital signal processing apparatus according to claim 6, wherein a prediction coefficient generated by learning based on a desired digital audio signal in advance is used.
10.
The power spectrum data is composed of almost symmetrical components.
The spectrum data extraction means
The digital signal processing apparatus according to claim 6, wherein one of the left and right components of the power spectrum data is to be extracted.
11.
A frequency analysis step that calculates power spectrum data from a digital audio signal,
The normalization step of normalizing the above power spectrum data with the maximum price range and calculating the normalized data,
A classification step that classifies the class based on the above normalized data,
A digital signal processing device is a program including a prediction calculation step of converting the digital audio signal to generate a new digital audio signal by predicting and calculating the digital audio signal by a prediction method corresponding to the classified class. Program storage medium to be executed by.
[Claim 1 2 ]
In a learning method for generating a prediction coefficient used for predicting the above conversion process of a digital signal processing device that converts a digital audio signal,
A student digital audio signal generation step of generating a student digital audio signal obtained by degrading the digital audio signal from a desired digital audio signal, and
The frequency analysis step of calculating the power spectrum data from the above student digital audio signal,
The normalization step of normalizing the above power spectrum data with the maximum price range and calculating the normalized data,
A classification step that classifies the class based on the above normalized data,
A learning method including a prediction coefficient calculation step for calculating a prediction coefficient corresponding to the class based on the digital audio signal and the student digital audio signal.
[Claim 1 3 ]
In the above frequency analysis step, various arithmetic processing methods of the window function are provided.
Depending on the frequency characteristics of the digital audio signal, the learning method of claim 1 2, characterized in that the desired above processing method is used.
[Claim 1 4 ]
In the above spectrum data extraction step,
When extracting the power spectrum data for some the learning method of claim 1 2, characterized in that the power spectral data of the DC component is removed.
15.
The power spectrum data is composed of almost symmetrical components.
In the above spectrum data extraction step,
Of the power spectrum data, the learning method of claim 1 2, characterized in that the left and right Izure of components are extracted.
16.
In a learning device that generates a prediction coefficient used in a prediction calculation of the above conversion process of a digital signal processing device that converts a digital audio signal,
A student digital audio signal generation means for generating a student digital audio signal obtained by degrading the digital audio signal from a desired digital audio signal, and
A frequency analysis means for calculating power spectrum data from the student digital audio signal,
A normalization means for calculating the normalized data by normalizing the power spectrum data with the maximum price range,
A class classification means that classifies the class based on the above normalized data,
A learning device including a prediction coefficient calculating means for calculating a prediction coefficient corresponding to the class based on the digital audio signal and the student digital audio signal.
17.
The frequency analysis means includes various arithmetic processing means of the window function.
The learning apparatus according to claim 16 , wherein a desired arithmetic processing means is used according to the frequency characteristics of the digital audio signal.
18.
The spectrum data extraction means
The learning apparatus according to claim 16 , wherein when extracting a part of the power spectrum data, the power spectrum data of the DC component is removed.
19.
The power spectrum data is composed of almost symmetrical components.
The spectrum data extraction means
The learning apparatus according to claim 16 , wherein one of the left and right components of the power spectrum data is to be extracted.
2. The method of claim 1 0]
A student digital audio signal generation step of generating a student digital audio signal obtained by degrading the digital audio signal from a desired digital audio signal, and
The frequency analysis step of calculating the power spectrum data from the above student digital audio signal,
The normalization step of normalizing the above power spectrum data with the maximum price range and calculating the normalized data,
A classification step that classifies the class based on the above normalized data,
A program storage medium for causing a digital signal processing apparatus to execute a program including a prediction coefficient calculation step for calculating a prediction coefficient corresponding to the class based on the digital audio signal and the student digital audio signal.

JP2000238898A 2000-08-02 2000-08-02 DIGITAL SIGNAL PROCESSING METHOD, LEARNING METHOD, DEVICE THEREOF, AND PROGRAM STORAGE MEDIUM Expired - Fee Related JP4645869B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000238898A JP4645869B2 (en) 2000-08-02 2000-08-02 DIGITAL SIGNAL PROCESSING METHOD, LEARNING METHOD, DEVICE THEREOF, AND PROGRAM STORAGE MEDIUM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000238898A JP4645869B2 (en) 2000-08-02 2000-08-02 DIGITAL SIGNAL PROCESSING METHOD, LEARNING METHOD, DEVICE THEREOF, AND PROGRAM STORAGE MEDIUM

Publications (3)

Publication Number Publication Date
JP2002049399A JP2002049399A (en) 2002-02-15
JP2002049399A5 true JP2002049399A5 (en) 2007-04-05
JP4645869B2 JP4645869B2 (en) 2011-03-09

Family

ID=18730529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000238898A Expired - Fee Related JP4645869B2 (en) 2000-08-02 2000-08-02 DIGITAL SIGNAL PROCESSING METHOD, LEARNING METHOD, DEVICE THEREOF, AND PROGRAM STORAGE MEDIUM

Country Status (1)

Country Link
JP (1) JP4645869B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8488819B2 (en) 2006-01-19 2013-07-16 Lg Electronics Inc. Method and apparatus for processing a media signal

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4988716B2 (en) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド Audio signal decoding method and apparatus
US8577686B2 (en) 2005-05-26 2013-11-05 Lg Electronics Inc. Method and apparatus for decoding an audio signal
CN104681030B (en) 2006-02-07 2018-02-27 Lg电子株式会社 Apparatus and method for encoding/decoding signal
JP6010539B2 (en) * 2011-09-09 2016-10-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America Encoding device, decoding device, encoding method, and decoding method
CN115937282B (en) * 2023-01-10 2024-08-02 郑州思昆生物工程有限公司 Registration method, device, equipment and storage medium of fluorescence image

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01204538A (en) * 1988-02-10 1989-08-17 Kokusai Denshin Denwa Co Ltd <Kdd> Vector quantizing system
JP2570603B2 (en) * 1993-11-24 1997-01-08 日本電気株式会社 Audio signal transmission device and noise suppression device
JP3277696B2 (en) * 1994-05-28 2002-04-22 ソニー株式会社 Digital signal processing apparatus and method
JP3794505B2 (en) * 1995-03-22 2006-07-05 ソニー株式会社 Signal conversion apparatus and signal conversion method
JP3824176B2 (en) * 1995-03-31 2006-09-20 ソニー株式会社 Image signal conversion method, image signal conversion apparatus, and image signal transmission apparatus
JPH09167240A (en) * 1995-12-15 1997-06-24 Sony Corp Digital image signal processing device and method therefor
JP3946812B2 (en) * 1997-05-12 2007-07-18 ソニー株式会社 Audio signal conversion apparatus and audio signal conversion method
JPH113094A (en) * 1997-06-12 1999-01-06 Kobe Steel Ltd Noise eliminating device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8488819B2 (en) 2006-01-19 2013-07-16 Lg Electronics Inc. Method and apparatus for processing a media signal

Similar Documents

Publication Publication Date Title
CN110136731B (en) Cavity causal convolution generation confrontation network end-to-end bone conduction voice blind enhancement method
Liutkus et al. Adaptive filtering for music/voice separation exploiting the repeating musical structure
Virtanen Sound source separation using sparse coding with temporal continuity objective
US9754603B2 (en) Speech feature extraction apparatus and speech feature extraction method
Wu et al. Speaker identification using discrete wavelet packet transform technique with irregular decomposition
WO2007070007A1 (en) A method and system for extracting audio features from an encoded bitstream for audio classification
Rump et al. Autoregressive MFCC Models for Genre Classification Improved by Harmonic-percussion Separation.
CN112420055A (en) Substation state identification method and device based on voiceprint characteristics
CN111028833B (en) Interaction method and device for interaction and vehicle interaction
Jančovič et al. Bird species recognition from field recordings using HMM-based modelling of frequency tracks
JP2006521576A5 (en)
JP2002049399A5 (en)
Degaonkar et al. Emotion modeling from speech signal based on wavelet packet transform
CN111583965A (en) Voice emotion recognition method, device, equipment and storage medium
US7966179B2 (en) Method and apparatus for detecting voice region
CN114863905A (en) Voice category acquisition method and device, electronic equipment and storage medium
Ernawan et al. Efficient discrete tchebichef on spectrum analysis of speech recognition
Borin et al. Exploring deep learning architectures for urban sound classification
Khonglah et al. Low frequency region of vocal tract information for speech/music classification
Fahmeeda et al. Voice Based Gender Recognition Using Deep Learning
JPH01255000A (en) Apparatus and method for selectively adding noise to template to be used in voice recognition system
Morovati Increase the accuracy of speech signal categories in high noise environments
JP2885984B2 (en) Voice analyzer
CN113012706B (en) Data processing method and device and electronic equipment
JP3346200B2 (en) Voice recognition device