JP4987282B2 - 情報処理装置、情報処理方法、およびプログラム - Google Patents
情報処理装置、情報処理方法、およびプログラム Download PDFInfo
- Publication number
- JP4987282B2 JP4987282B2 JP2005310407A JP2005310407A JP4987282B2 JP 4987282 B2 JP4987282 B2 JP 4987282B2 JP 2005310407 A JP2005310407 A JP 2005310407A JP 2005310407 A JP2005310407 A JP 2005310407A JP 4987282 B2 JP4987282 B2 JP 4987282B2
- Authority
- JP
- Japan
- Prior art keywords
- level feature
- feature quantity
- low
- quantity extraction
- extraction formula
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 24
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000000605 extraction Methods 0.000 claims abstract description 349
- 238000004364 calculation method Methods 0.000 claims abstract description 64
- 238000000034 method Methods 0.000 claims description 113
- 230000008569 process Effects 0.000 claims description 109
- 238000012545 processing Methods 0.000 claims description 45
- 239000011159 matrix material Substances 0.000 claims description 21
- 230000014509 gene expression Effects 0.000 abstract description 38
- 238000004519 manufacturing process Methods 0.000 abstract description 9
- 230000035772 mutation Effects 0.000 description 21
- 238000011156 evaluation Methods 0.000 description 19
- 238000002790 cross-validation Methods 0.000 description 13
- 230000001755 vocal effect Effects 0.000 description 11
- 239000000284 extract Substances 0.000 description 8
- 238000001514 detection method Methods 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 238000003860 storage Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/571—Chords; Chord sequences
- G10H2210/576—Chord progression
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/005—Algorithms for electrophonic musical instruments or musical processing, e.g. for automatic composition or resource allocation
- G10H2250/011—Genetic algorithms, i.e. using computational steps analogous to biological selection, recombination and mutation on an initial population of, e.g. sounds, pieces, melodies or loops to compose or otherwise generate, e.g. evolutionary music or sound synthesis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
AIC=−2×最大対数尤度+2×自由パラメータ数
AIC=学習用データ数×((log2π)+1+log(平均2乗誤差))+2×(n+1)
となる。
BIC=−2×最大対数尤度+log(学習用データ数)×自由パラメータ数
例えば、学習アルゴリズムにRegression(線形)が採用されている場合(図25の場合)、 BIC=学習用データ数×((log2π)+1+log(平均2乗誤差))+log(学習用データ数)×(n+1)
となる。BICはAICと比較して、学習用データ数が増加してもその値が増加し難いことが特徴である。
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
Claims (5)
- コンテンツデータの特徴を表す高レベル特徴量を検出する情報処理装置において、
前記コンテンツデータまたは前記コンテンツデータに対応するメタデータを入力として低レベル特徴量を出力する複数の低レベル特徴量抽出式からなる低レベル特徴量抽出式リストを生成する低レベル特徴量抽出式リスト生成手段と、
前記コンテンツデータまたは前記コンテンツデータに対応するメタデータを、前記低レベル特徴量抽出式リストを構成する各低レベル特徴量抽出式に入力して前記低レベル特徴量を演算する第1の演算手段と、
演算された前記低レベル特徴量を入力として前記コンテンツデータの特徴を示す高レベル特徴量を出力する高レベル特徴量抽出式を用いて前記高レベル特徴量を演算する第2の演算手段と
を備え、
前記コンテンツデータまたは前記コンテンツデータに対応する前記メタデータは、複数の次元軸を保有するマトリクスとして表現され、
前記低レベル特徴量抽出式リスト生成手段は、入力された前記マトリクスに所定の演算処理を行う複数のオペレータを任意に組み合わせた前記低レベル特徴量抽出式を所定の数だけ生成して低レベル特徴量抽出式リストを生成し、
前記オペレータは、入力された前記マトリックスの保有する次元軸のうち、任意の次元軸を前記所定の演算処理の対象に指定するための処理対象軸指定情報を含む
情報処理装置。 - 演算された前記高レベル特徴量と、予め得られている前記コンテンツデータに対応する真の高レベル特徴量との誤差を算出する算出手段と、
前記低レベル特徴量を入力として前記誤差を出力するリジェクト領域抽出式を、算出された前記誤差を教師データとする学習によって生成するリジェクト領域抽出式生成手段と、
前記コンテンツデータに対応する高レベル特徴量を取得する場合、生成された前記誤差推定式に演算された前記低レベル特徴量を適用して対応する誤差を推定し、推定した前記誤差に応じて前記第2の演算手段に前記高レベル特徴量を演算させる演算制御手段と
をさらに備える請求項1に記載の情報処理装置。 - 前記低レベル特徴量抽出式リスト生成手段は、次の更新世代の低レベル特徴量抽出式リストを、前の更新世代の低レベル特徴量抽出式リストに基づく、選択、交差、または突然変異のうちの少なくとも1つを含む更新処理によって生成する
請求項1に記載の情報処理装置。 - コンテンツデータの特徴を表す高レベル特徴量を検出する情報処理装置の情報処理方法において、
前記コンテンツデータまたは前記コンテンツデータに対応するメタデータを入力として低レベル特徴量を出力する複数の低レベル特徴量抽出式からなる低レベル特徴量抽出式リストを生成する低レベル特徴量抽出式リスト生成ステップと、
前記コンテンツデータまたは前記コンテンツデータに対応するメタデータを、前記低レベル特徴量抽出式リストを構成する各低レベル特徴量抽出式に入力して前記低レベル特徴量を演算する第1の演算ステップと、
演算された前記低レベル特徴量を入力として前記コンテンツデータの特徴を示す高レベル特徴量を出力する高レベル特徴量抽出式を用いて前記高レベル特徴量を演算する第2の演算ステップと
を含み、
前記コンテンツデータまたは前記コンテンツデータに対応する前記メタデータは、複数の次元軸を保有するマトリクスとして表現され、
前記低レベル特徴量抽出式リスト生成ステップは、入力された前記マトリクスに所定の演算処理を行う複数のオペレータを任意に組み合わせた前記低レベル特徴量抽出式を所定の数だけ生成して低レベル特徴量抽出式リストを生成し、
前記オペレータは、入力された前記マトリックスの保有する次元軸のうち、任意の次元軸を前記所定の演算処理の対象に指定するための処理対象軸指定情報を含む
情報処理方法。 - コンテンツデータの特徴を表す高レベル特徴量を検出する情報処理装置の制御用のプログラムであって、
前記コンテンツデータまたは前記コンテンツデータに対応するメタデータを入力として低レベル特徴量を出力する複数の低レベル特徴量抽出式からなる低レベル特徴量抽出式リストを生成する低レベル特徴量抽出式リスト生成ステップと、
前記コンテンツデータまたは前記コンテンツデータに対応するメタデータを、前記低レベル特徴量抽出式リストを構成する各低レベル特徴量抽出式に入力して前記低レベル特徴量を演算する第1の演算ステップと、
演算された前記低レベル特徴量を入力として前記コンテンツデータの特徴を示す高レベル特徴量を出力する高レベル特徴量抽出式を用いて前記高レベル特徴量を演算する第2の演算ステップと
を含む処理を情報処理装置のコンピュータに実行させ、
前記コンテンツデータまたは前記コンテンツデータに対応する前記メタデータは、複数の次元軸を保有するマトリクスとして表現され、
前記低レベル特徴量抽出式リスト生成ステップは、入力された前記マトリクスに所定の演算処理を行う複数のオペレータを任意に組み合わせた前記低レベル特徴量抽出式を所定の数だけ生成して低レベル特徴量抽出式リストを生成し、
前記オペレータは、入力された前記マトリックスの保有する次元軸のうち、任意の次元軸を前記所定の演算処理の対象に指定するための処理対象軸指定情報を含む
プログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005310407A JP4987282B2 (ja) | 2005-10-25 | 2005-10-25 | 情報処理装置、情報処理方法、およびプログラム |
EP06255369A EP1780703A1 (en) | 2005-10-25 | 2006-10-18 | Information processing apparatus, information processing method and program |
US11/584,612 US7738982B2 (en) | 2005-10-25 | 2006-10-23 | Information processing apparatus, information processing method and program |
KR1020060103227A KR20070044780A (ko) | 2005-10-25 | 2006-10-24 | 정보 처리 장치, 정보 처리 방법, 및 프로그램 |
CN2006100643410A CN101030366B (zh) | 2005-10-25 | 2006-10-25 | 信息处理装置,信息处理方法以及程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005310407A JP4987282B2 (ja) | 2005-10-25 | 2005-10-25 | 情報処理装置、情報処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007121456A JP2007121456A (ja) | 2007-05-17 |
JP4987282B2 true JP4987282B2 (ja) | 2012-07-25 |
Family
ID=37696076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005310407A Expired - Fee Related JP4987282B2 (ja) | 2005-10-25 | 2005-10-25 | 情報処理装置、情報処理方法、およびプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US7738982B2 (ja) |
EP (1) | EP1780703A1 (ja) |
JP (1) | JP4987282B2 (ja) |
KR (1) | KR20070044780A (ja) |
CN (1) | CN101030366B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4935047B2 (ja) * | 2005-10-25 | 2012-05-23 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP4333700B2 (ja) * | 2006-06-13 | 2009-09-16 | ソニー株式会社 | 和音推定装置及び方法 |
JP4239109B2 (ja) | 2006-10-20 | 2009-03-18 | ソニー株式会社 | 情報処理装置および方法、プログラム、並びに記録媒体 |
WO2009128662A2 (en) * | 2008-04-16 | 2009-10-22 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
KR101062351B1 (ko) * | 2008-04-16 | 2011-09-05 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 이의 장치 |
JP5594532B2 (ja) | 2010-11-09 | 2014-09-24 | ソニー株式会社 | 情報処理装置および方法、情報処理システム、並びに、プログラム |
JP2013080538A (ja) | 2011-10-04 | 2013-05-02 | Sony Corp | コンテンツ再生装置およびコンテンツ再生方法、並びにプログラム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3299574B2 (ja) * | 1992-12-04 | 2002-07-08 | 富士通株式会社 | 認識装置 |
JP2993862B2 (ja) * | 1995-03-22 | 1999-12-27 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 信号認識方法、信号認識装置、信号認識装置の学習方法及び信号認識装置の学習装置 |
DE19649296C2 (de) * | 1996-11-28 | 2002-01-17 | Blue Chip Music Gmbh | Verfahren zur Tonhöhenerkennung bei zupf- oder schlagerregten Saiteninstrumenten |
ATE368261T1 (de) | 1997-03-10 | 2007-08-15 | Fraunhofer Ges Forschung | Sichere identifikation mit vorauswahl und rückweisungsklasse |
JP4027051B2 (ja) * | 2001-03-22 | 2007-12-26 | 松下電器産業株式会社 | 楽曲登録装置、楽曲登録方法、及びそのプログラムと記録媒体 |
US6996525B2 (en) * | 2001-06-15 | 2006-02-07 | Intel Corporation | Selecting one of multiple speech recognizers in a system based on performance predections resulting from experience |
EP1300831B1 (en) * | 2001-10-05 | 2005-12-07 | Sony Deutschland GmbH | Method for detecting emotions involving subspace specialists |
EP1431956A1 (en) * | 2002-12-17 | 2004-06-23 | Sony France S.A. | Method and apparatus for generating a function to extract a global characteristic value of a signal contents |
JP4115923B2 (ja) * | 2003-11-05 | 2008-07-09 | シャープ株式会社 | 楽曲検索システムおよび楽曲検索方法 |
EP1531478A1 (en) * | 2003-11-12 | 2005-05-18 | Sony International (Europe) GmbH | Apparatus and method for classifying an audio signal |
-
2005
- 2005-10-25 JP JP2005310407A patent/JP4987282B2/ja not_active Expired - Fee Related
-
2006
- 2006-10-18 EP EP06255369A patent/EP1780703A1/en not_active Withdrawn
- 2006-10-23 US US11/584,612 patent/US7738982B2/en not_active Expired - Fee Related
- 2006-10-24 KR KR1020060103227A patent/KR20070044780A/ko active IP Right Grant
- 2006-10-25 CN CN2006100643410A patent/CN101030366B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP1780703A1 (en) | 2007-05-02 |
KR20070044780A (ko) | 2007-04-30 |
CN101030366B (zh) | 2011-06-01 |
US20070095197A1 (en) | 2007-05-03 |
CN101030366A (zh) | 2007-09-05 |
JP2007121456A (ja) | 2007-05-17 |
US7738982B2 (en) | 2010-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4935047B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP4948118B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP4987282B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5164209B2 (ja) | 分類モデル生成装置、分類装置、分類モデル生成方法、分類方法、分類モデル生成プログラム、分類プログラムおよび記録媒体 | |
US20130066452A1 (en) | Information processing device, estimator generating method and program | |
JP2007122186A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2020154564A (ja) | 学習方法、学習プログラムおよび学習装置 | |
US8712936B2 (en) | Information processing apparatus, information processing method, and program | |
JP4392621B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2009104274A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US20120136818A1 (en) | Information Processing Device, Information Processing Method, and Program | |
JP2009110212A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6233432B2 (ja) | 混合モデルの選択方法及び装置 | |
JP4392622B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN110674860A (zh) | 基于邻域搜索策略的特征选择方法、存储介质和终端 | |
JP7224263B2 (ja) | モデル生成方法、モデル生成装置及びプログラム | |
WO2023053918A1 (ja) | 予測モデル作成方法、予測方法、予測モデル作成装置、予測装置、予測モデル作成プログラム、予測プログラム | |
US20240153474A1 (en) | Melody extraction from polyphonic symbolic music | |
JP2012238075A (ja) | 特徴選択装置、特徴選択方法及び特徴選択プログラム | |
JP2013164863A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN110633753A (zh) | 基于邻域搜索策略的特征选择装置 | |
JP2008181294A (ja) | 情報処理装置および方法、並びにプログラム | |
Bosio et al. | Microarray classification with hierarchical data representation and novel feature selection criteria | |
Afif et al. | Support Vector Machines with Weighted Powered Kernels for Data Classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100601 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100723 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101228 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110112 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20110401 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120425 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150511 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |