JP4392805B2 - オーディオ情報分類装置 - Google Patents
オーディオ情報分類装置 Download PDFInfo
- Publication number
- JP4392805B2 JP4392805B2 JP2008117035A JP2008117035A JP4392805B2 JP 4392805 B2 JP4392805 B2 JP 4392805B2 JP 2008117035 A JP2008117035 A JP 2008117035A JP 2008117035 A JP2008117035 A JP 2008117035A JP 4392805 B2 JP4392805 B2 JP 4392805B2
- Authority
- JP
- Japan
- Prior art keywords
- audio information
- noise
- data
- unit
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
E.ScheirerとM.Slaneyの"Construction and evaluation of a robust multifeature speech/music discriminator, Proceedings of IEEE ICASSP, pp.1331-1334, 1997
σe 2 >α (3)
ここに、αは予め定められた第1の閾値である。
2 の場合と同様に、Nj =1としても重心値に大きく変化がなく、すべてのサンプルについて計算する場合よりも処理時間を削減することが可能である。
Claims (2)
- オーディオ情報から雑音区間を判別するオーディオ情報分類装置において、
入力されたオーディオ情報から有音部のみを抽出する有音抽出手段と、
入力されたオーディオ情報から有音時の単位時間ごとの周波数成分を抽出するオーディオ周波数データ抽出手段と、
オーディオ周波数成分から単位時間における周波数軸上のエネルギー重心の平均と重心の分散を求めて、雑音区間か否かを判別する雑音区間抽出手段を具備し、
前記雑音区間抽出手段は、周波数軸上のエネルギー重心の平均と分散を特徴ベクトルとしたBayes 決定則を用いて、テストデータに対して雑音と雑音以外の共分散行列を求めておき、入力データに対して正規分布パターンにおけるBayes 決定識別関数を用いて各雑音区間と非雑音区間の判別を行うことを特徴とするオーディオ情報分類装置。 - 請求項1に記載のオーディオ情報分類装置において、
前記オーディオ周波数データ抽出手段によって抽出される単位時間ごとの周波数成分は、入力されたオーディオ情報がMPEGデータである場合、単位時間分のMPEG符号化データにおける周波数軸上のエネルギー重心を利用することを特徴とするオーディオ情報分類装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008117035A JP4392805B2 (ja) | 2008-04-28 | 2008-04-28 | オーディオ情報分類装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008117035A JP4392805B2 (ja) | 2008-04-28 | 2008-04-28 | オーディオ情報分類装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005153911A Division JP4201204B2 (ja) | 2005-05-26 | 2005-05-26 | オーディオ情報分類装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009189158A Division JP4497485B2 (ja) | 2009-08-18 | 2009-08-18 | オーディオ情報分類装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008186033A JP2008186033A (ja) | 2008-08-14 |
JP4392805B2 true JP4392805B2 (ja) | 2010-01-06 |
Family
ID=39729074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008117035A Expired - Lifetime JP4392805B2 (ja) | 2008-04-28 | 2008-04-28 | オーディオ情報分類装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4392805B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102446506A (zh) * | 2010-10-11 | 2012-05-09 | 华为技术有限公司 | 音频信号的分类识别方法及装置 |
WO2021042537A1 (zh) * | 2019-09-04 | 2021-03-11 | 平安科技(深圳)有限公司 | 语音识别认证方法及系统 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4497485B2 (ja) * | 2009-08-18 | 2010-07-07 | Kddi株式会社 | オーディオ情報分類装置 |
KR101964359B1 (ko) * | 2017-11-14 | 2019-04-01 | 네오컨버전스 주식회사 | 딥러닝용 오디오 데이터 생성방법 및 장치 |
-
2008
- 2008-04-28 JP JP2008117035A patent/JP4392805B2/ja not_active Expired - Lifetime
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102446506A (zh) * | 2010-10-11 | 2012-05-09 | 华为技术有限公司 | 音频信号的分类识别方法及装置 |
CN102446506B (zh) * | 2010-10-11 | 2013-06-05 | 华为技术有限公司 | 音频信号的分类识别方法及装置 |
WO2021042537A1 (zh) * | 2019-09-04 | 2021-03-11 | 平安科技(深圳)有限公司 | 语音识别认证方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP2008186033A (ja) | 2008-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11386916B2 (en) | Segmentation-based feature extraction for acoustic scene classification | |
JP2000066691A (ja) | オーディオ情報分類装置 | |
CN108831443B (zh) | 一种基于堆叠自编码网络的移动录音设备源识别方法 | |
KR100763899B1 (ko) | 앵커 샷 검출 방법 및 장치 | |
JP4201204B2 (ja) | オーディオ情報分類装置 | |
JP2009511954A (ja) | モノラルオーディオ信号からオーディオソースを分離するためのニューラル・ネットワーク識別器 | |
CN102714034B (zh) | 信号处理的方法、装置和系统 | |
US20090125304A1 (en) | Method and apparatus to detect voice activity | |
KR20140031790A (ko) | 잡음 환경에서 강인한 음성 구간 검출 방법 및 장치 | |
CN111429935A (zh) | 一种语音话者分离方法和装置 | |
JP4392805B2 (ja) | オーディオ情報分類装置 | |
US7747435B2 (en) | Information retrieving method and apparatus | |
Kumar et al. | Intelligent Audio Signal Processing for Detecting Rainforest Species Using Deep Learning. | |
Chandra et al. | Usable speech detection using the modified spectral autocorrelation peak to valley ratio using the LPC residual | |
JP3607450B2 (ja) | オーディオ情報分類装置 | |
JP2004125944A (ja) | 情報識別装置及び方法、並びにプログラム及び記録媒体 | |
JP2003524218A (ja) | Tesparパラメータでトレーニングされたhmmを用いる発話処理 | |
JP4497485B2 (ja) | オーディオ情報分類装置 | |
Metzger et al. | Using Approximate Entropy as a speech quality measure for a speaker recognition system | |
Velayatipour et al. | A review on speech-music discrimination methods | |
Sharma et al. | Non intrusive codec identification algorithm | |
Gubka et al. | A comparison of audio features for elementary sound based audio classification | |
Feng et al. | Noise Classification Speech Enhancement Generative Adversarial Network | |
JP2011085824A (ja) | 音響識別装置、その処理方法およびプログラム | |
CN118197357A (zh) | 角色判定模型的构建方法、角色判定方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090701 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091007 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091008 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121023 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131023 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131023 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151023 Year of fee payment: 6 |
|
EXPY | Cancellation because of completion of term |