JP7286894B2 - 信号変換システム、機械学習システムおよび信号変換プログラム - Google Patents
信号変換システム、機械学習システムおよび信号変換プログラム Download PDFInfo
- Publication number
- JP7286894B2 JP7286894B2 JP2020571028A JP2020571028A JP7286894B2 JP 7286894 B2 JP7286894 B2 JP 7286894B2 JP 2020571028 A JP2020571028 A JP 2020571028A JP 2020571028 A JP2020571028 A JP 2020571028A JP 7286894 B2 JP7286894 B2 JP 7286894B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- time
- data
- values
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Description
本発明は、前記課題にかんがみてなされたもので、信号の時間変化の特徴を捉えやすいデータを生成する技術を提供することを目的とする。
(1)システムの構成:
(1-1)機械学習処理:
(1-2)特徴出力処理:
(2)他の実施形態:
図1は、本発明の一実施形態である信号変換システム、特徴出力システム、機械学習システムとして機能するコンピュータ10の概略構成を示す図である。コンピュータ10は、マイクロホン10a、A/D変換部10b、制御部20、記憶媒体30、表示部40を備えている。制御部20は、図示しないCPU,RAM,ROMを備えており、記憶媒体30等に記憶された各種プログラムを実行することができる。マイクロホン10a、A/D変換部10b、制御部20、記憶媒体30、表示部40は、一体的なコンピュータで構成されていても良いし、少なくとも一部が別の装置であり、USBケーブル等によって接続される構成であっても良い。コンピュータ10の態様は種々の態様であって良く、例えば、据置型の汎用コンピュータであっても良いし、スマートフォンやタブレット端末などの可搬型のコンピュータであっても良い。
本実施形態においては、機械学習を行うために予め教師データ30aが用意される。教師データ30aは、音波信号と当該音波信号が示す音の音源の種類とを対応づけた情報である。例えば、音楽を示す音波信号に音楽であることが対応づけられた1組のデータや、音楽以外の音(人の発話等)を示す音波信号に音楽ではないことが対応づけられた1組のデータが教師データ30aとなり得る。むろん、教師データ30aとしては、機械学習を行うために充分な量のデータが予め用意される。
次に、音源の種類を分類する特徴出力処理を図5に示すフローチャートに基づいて説明する。コンピュータ10の周辺で分類対象の音源から音が出力されている状態で、コンピュータ10の利用者は、キーボードやマウスなどの図示しない入力部を操作して特徴出力処理の実行開始指示を行う。利用者が当該実行開始指示を行うと、制御部20は、特徴出力処理の実行を開始する。
以上の実施形態は本発明を実施するための一例であり、時間変化する信号の時間軸上の各位置における値を多次元量で表現し、多次元量の成分毎の時間変化を示す時系列データを出力する限りにおいて、他にも種々の実施形態を採用可能である。例えば、1台のコンピュータ10によって、信号変換システム、機械学習システム、特徴出力システムが構成されていたが、それぞれが別のシステムであっても良いし、2個のシステムが1台のシステムとして構成されてもよい。
Claims (11)
- 時間変化する信号であって、時間軸上の複数の位置における値のそれぞれが1個の成分で表現された前記信号を取得する信号取得部と、
複数の前記位置毎の値のそれぞれを、複数の成分の値で表現した多次元量に変換する変換部と、
前記多次元量を、連続する複数の前記位置における前記多次元量の同一の成分の値を少なくとも含む、L個(Lは1以上、前記多次元量の成分の数以下の整数)の時系列データとして出力する出力部と、
L個の前記時系列データを入力して前記信号の特徴に関する情報を出力するように機械学習された機械学習モデルに対して、L個の前記時系列データを入力し、前記信号の特徴に関する情報を出力する特徴出力部と、
を備える信号変換システム。 - 前記機械学習モデルは、
畳み込みニューラルネットワークを含む、
請求項1に記載の信号変換システム。 - 前記変換部は、
複数の前記位置毎の値のそれぞれを、n進数(nは2以上の整数)の値に変換し、変換された値の各桁を前記多次元量の成分とする、
請求項1または請求項2に記載の信号変換システム。 - nは2である、
請求項3に記載の信号変換システム。 - 前記信号は音を示す、
請求項1~請求項4のいずれかに記載の信号変換システム。 - 前記時系列データは、
前記多次元量から、同一の成分の値の時間変化を示す1次元データがL個(Lは1以上、前記多次元量の成分の数以下の整数)抽出されたデータである、
請求項1~請求項5のいずれかに記載の信号変換システム。 - 前記時系列データは、
前記多次元量から、
時間軸上の同一の前記位置における異なる成分の値が第1軸方向に並び、
時間軸上の異なる前記位置における同一の成分の値が前記第1軸方向と異なる第2軸方向に並ぶ2次元データが抽出されたデータである、
請求項1~請求項5のいずれかに記載の信号変換システム。 - 前記2次元データを入力する畳み込みニューラルネットワークを含む機械学習済モデルに基づいて、前記信号の特徴に関する情報を出力する特徴出力部、をさらに備える、
請求項7に記載の信号変換システム。 - 機械学習システムに利用されるニューラルネットワークへの入力信号の信号変換システムであって、
時間変化する信号であって、時間軸上の複数の位置における値のそれぞれが1個の成分で表現された前記信号を取得する信号取得部と、
複数の前記位置毎の値のそれぞれを、2進数の値に変換し、変換された値の各桁が成分となる多次元量に変換する変換部と、
前記多次元量から、連続する複数の前記位置における前記多次元量の同一の成分の値の時間変化を示す1次元データをL個(Lは1以上、前記多次元量の成分の数以下の整数)抽出して出力する出力部と、
L個の前記1次元データを入力して前記信号の特徴に関する情報を出力するように機械学習された機械学習モデルに対して、L個の前記1次元データを入力し、前記信号の特徴に関する情報を出力する特徴出力部と、
を備える、信号変換システム。 - 請求項1~請求項7のいずれかに記載の信号変換システムと、
前記時系列データを入力し、前記信号の特徴に関する情報を出力する機械学習済モデルを機械学習する機械学習部と、
を備える機械学習システム。 - コンピュータを、
時間変化する信号であって、時間軸上の複数の位置における値のそれぞれが1個の成分で表現された前記信号を取得する信号取得部、
複数の前記位置毎の値のそれぞれを、複数の成分の値で表現した多次元量に変換する変換部、
前記多次元量を、連続する複数の前記位置における前記多次元量の同一の成分の値を少なくとも含む、L個(Lは1以上、前記多次元量の成分の数以下の整数)の時系列データとして出力する出力部、
L個の前記時系列データを入力して前記信号の特徴に関する情報を出力するように機械学習された機械学習モデルに対して、L個の前記時系列データを入力し、前記信号の特徴に関する情報を出力する特徴出力部、
として機能させる信号変換プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019020267 | 2019-02-07 | ||
JP2019020267 | 2019-02-07 | ||
PCT/JP2019/049337 WO2020162048A1 (ja) | 2019-02-07 | 2019-12-17 | 信号変換システム、機械学習システムおよび信号変換プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2020162048A1 JPWO2020162048A1 (ja) | 2020-08-13 |
JPWO2020162048A5 JPWO2020162048A5 (ja) | 2022-01-25 |
JP7286894B2 true JP7286894B2 (ja) | 2023-06-06 |
Family
ID=71947094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020571028A Active JP7286894B2 (ja) | 2019-02-07 | 2019-12-17 | 信号変換システム、機械学習システムおよび信号変換プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7286894B2 (ja) |
WO (1) | WO2020162048A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20240005217A1 (en) * | 2020-11-30 | 2024-01-04 | Nec Corporation | Information processing device, information processing method, and recording medium |
WO2022113338A1 (ja) * | 2020-11-30 | 2022-06-02 | 日本電気株式会社 | 情報処理装置、情報処理方法、及び、記録媒体 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003332914A (ja) | 2001-08-23 | 2003-11-21 | Nippon Telegr & Teleph Corp <Ntt> | ディジタル信号符号化方法、復号化方法、これらの装置及びプログラム |
JP6259946B1 (ja) | 2017-07-20 | 2018-01-10 | 株式会社Nttドコモ | 機械学習システム、識別システム及びプログラム |
JP2018517928A (ja) | 2015-09-24 | 2018-07-05 | グーグル エルエルシー | 音声活動検出 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56158563A (en) * | 1980-05-12 | 1981-12-07 | Sony Corp | Automatic answering telephone set |
US4415767A (en) * | 1981-10-19 | 1983-11-15 | Votan | Method and apparatus for speech recognition and reproduction |
US20050228661A1 (en) * | 2002-05-06 | 2005-10-13 | Josep Prous Blancafort | Voice recognition method |
JP6236296B2 (ja) * | 2013-11-14 | 2017-11-22 | 株式会社デンソーアイティーラボラトリ | 学習装置、学習プログラム、及び学習方法 |
-
2019
- 2019-12-17 JP JP2020571028A patent/JP7286894B2/ja active Active
- 2019-12-17 WO PCT/JP2019/049337 patent/WO2020162048A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003332914A (ja) | 2001-08-23 | 2003-11-21 | Nippon Telegr & Teleph Corp <Ntt> | ディジタル信号符号化方法、復号化方法、これらの装置及びプログラム |
JP2018517928A (ja) | 2015-09-24 | 2018-07-05 | グーグル エルエルシー | 音声活動検出 |
JP6259946B1 (ja) | 2017-07-20 | 2018-01-10 | 株式会社Nttドコモ | 機械学習システム、識別システム及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JPWO2020162048A1 (ja) | 2020-08-13 |
WO2020162048A1 (ja) | 2020-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102071582B1 (ko) | 딥 뉴럴 네트워크(Deep Neural Network)를 이용하여 문장이 속하는 클래스(class)를 분류하는 방법 및 장치 | |
CN111292764B (zh) | 辨识系统及辨识方法 | |
JP7422946B2 (ja) | ベイジアングラフ探索を用いたニューラルネットワークアーキテクチャの自動構築 | |
TWI698807B (zh) | 以類別為基礎修剪之人工類神經網路 | |
CA3098447A1 (en) | Systems and methods for unifying statistical models for different data modalities | |
WO2020028760A1 (en) | System and method for neural network orchestration | |
JP7286894B2 (ja) | 信号変換システム、機械学習システムおよび信号変換プログラム | |
CN111444967A (zh) | 生成对抗网络的训练方法、生成方法、装置、设备及介质 | |
EP3637327A1 (en) | Computing device and method | |
Dogan et al. | A novel ternary and signum kernelled linear hexadecimal pattern and hybrid feature selection based environmental sound classification method | |
Copiaco et al. | Scalogram neural network activations with machine learning for domestic multi-channel audio classification | |
Sunny et al. | Recognition of speech signals: an experimental comparison of linear predictive coding and discrete wavelet transforms | |
JP2021513701A (ja) | 情報処理装置、方法およびプログラム | |
US20200057932A1 (en) | System and method for generating time-spectral diagrams in an integrated circuit solution | |
Colonna et al. | Recognizing family, genus, and species of anuran using a hierarchical classification approach | |
CN115130650A (zh) | 一种模型训练方法及相关装置 | |
da Silva et al. | Audio plugin recommendation systems for music production | |
CN113870896A (zh) | 基于时频图和卷积神经网络的运动声音判假方法、装置 | |
Barua et al. | An accurate automated speaker counting architecture based on James Webb Pattern | |
CN113569867A (zh) | 一种图像处理方法、装置、计算机设备及存储介质 | |
KR102469669B1 (ko) | 아날로그 신호와 디지털 신호를 이용한 합성곱 신경망 모델 학습 방법 | |
CN117668701B (zh) | Ai人工智能机器学习系统及方法 | |
CN112102830B (zh) | 一种粗颗粒度指令识别方法和装置 | |
Cao et al. | Pyramid Memory Block and Timestep Attention for Speech Emotion Recognition. | |
Zhang et al. | Cascade Temporal Convolutional Network for Multitask Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A5211 Effective date: 20210518 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210604 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220318 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230314 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230407 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7286894 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |