JP2017058877A - 学習装置、音声検出装置、学習方法およびプログラム - Google Patents
学習装置、音声検出装置、学習方法およびプログラム Download PDFInfo
- Publication number
- JP2017058877A JP2017058877A JP2015182167A JP2015182167A JP2017058877A JP 2017058877 A JP2017058877 A JP 2017058877A JP 2015182167 A JP2015182167 A JP 2015182167A JP 2015182167 A JP2015182167 A JP 2015182167A JP 2017058877 A JP2017058877 A JP 2017058877A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- probability
- neural network
- output layer
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
Description
つぎに、ニューラルネットワーク20の出力層44において用いる関数について説明する。
図5は、実施形態に係る学習装置30のハードウェア構成の一例を示す図である。本実施形態に係る学習装置30は、例えば図5に示すようなハードウェア構成の情報処理装置により実現される。この情報処理装置は、CPU(Central Processing Unit)201と、RAM(Random Access Memory)202と、ROM(Read Only Memory)203と、操作入力装置204と、表示装置205と、記憶装置206と、通信装置207とを備える。そして、これらの各部は、バスにより接続される。
12 分析部
14 スコア算出部
20 ニューラルネットワーク
22 検出部
30 学習装置
40 入力層
42 隠れ層
44 出力層
46 構造記憶部
48 パラメータ記憶部
52 訓練データ記憶部
54 変換部
56 伝播部
58 確率算出部
60 誤差算出部
62 更新部
64 収束判定部
Claims (13)
- 入力信号が特定のクラスに属する事後確率を出力するニューラルネットワークを学習する学習装置であって、
前記ニューラルネットワークの出力層は、それぞれのクラスに対応するN個(Nは2以上の整数)のユニットと、1個の追加ユニットとを含み、
前記学習装置は、
サンプル信号を前記ニューラルネットワークに与え、前記出力層におけるそれぞれのユニットについて、直前の層から出力された信号を設定されたパラメータに従って結合したN+1個の入力値を取得する伝播部と、
それぞれの前記入力値を前記事後確率を算出するための関数に入力して、前記出力層のそれぞれのユニットに対応するN+1個の確率値を含む確率ベクトルを生成する確率算出部と、
前記出力層のそれぞれのユニットに対応するN+1個の目標値を含む教師ベクトルと、前記確率ベクトルとの誤差を小さくするように、前記ニューラルネットワークに含まれるパラメータを更新する更新部と、
を備え、
前記追加ユニットに対応する目標値は、予め定められた定数である
学習装置。 - 前記教師ベクトルは、それぞれのクラスに対応する目標値が、前記サンプル信号が前記クラスに属する確率に基づく値である
請求項1に記載の学習装置。 - 前記教師ベクトルは、それぞれの目標値が0以上であり、全ての目標値の和が1であり、前記追加ユニットに対応する目標値が1/2である
請求項2に記載の学習装置。 - 前記教師ベクトルは、正解クラスに対応する目標値が1/2であり、前記追加ユニットに対応する目標値が1/2であり、他の目標値が0である
請求項3に記載の学習装置。 - 前記伝播部は、前記サンプル信号を前記ニューラルネットワークの入力層から順方向に伝播させて、N+1個の前記入力値を取得する
請求項1から4の何れか1項に記載の学習装置。 - 前記更新部は、前記誤差を前記ニューラルネットワークの前記出力層から逆方向に伝播させて、前記誤差を小さくするようにそれぞれの層のパラメータを更新する
請求項5に記載の学習装置。 - 前記出力層のそれぞれのユニットに対応するN+1個の目標値を含む教師ベクトルと、前記確率ベクトルとの誤差を算出する誤差算出部をさらに備える
請求項1から6の何れか1項に記載の学習装置。 - 前記確率算出部は、それぞれの前記入力値をsoftmax関数に入力して、N+1個の確率値を含む前記確率ベクトルを生成する
請求項7に記載の学習装置。 - 前記誤差算出部は、cross−entropy誤差を算出する
請求項8に記載の学習装置。 - 前記ニューラルネットワークの前記出力層のそれぞれのユニットは、当該ユニットに対応する前記入力値から、前記追加ユニットに対応する前記入力値を減算する関数により、前記入力信号が当該ユニットに対応するクラスに属する前記事後確率の確率値を算出する
請求項9に記載の学習装置。 - 音声信号から指定された検索パターンと類似する部分を検出する音声検出装置であって、
前記音声信号を音声パラメータ系列に変換する分析部と、
前記音声パラメータ系列に含まれるそれぞれの音声パラメータについて、検索パターンにおける発生のしやすさを表すスコアを前記ニューラルネットワークを用いて算出するスコア算出部と、
前記スコアに基づき、前記音声信号に前記検索パターンが含まれているかを検出する検出部と、
前記ニューラルネットワークを学習する、請求項1から10の何れか1項に記載の学習装置と、
を備える音声検出装置。 - 入力信号が特定のクラスに属する事後確率を出力するニューラルネットワークを学習する学習方法であって、
前記ニューラルネットワークの出力層は、それぞれのクラスに対応するN個(Nは2以上の整数)のユニットと、1個の追加ユニットとを含み、
サンプル信号を前記ニューラルネットワークに与え、前記出力層におけるそれぞれのユニットについて、直前の層から出力された信号を設定されたパラメータに従って結合したN+1個の入力値を取得する伝播ステップと、
それぞれの前記入力値を前記事後確率を算出するための関数に入力して、前記出力層のそれぞれのユニットに対応するN+1個の確率値を含む確率ベクトルを生成する確率算出ステップと、
前記出力層のそれぞれのユニットに対応するN+1個の目標値を含む教師ベクトルと、前記確率ベクトルとの誤差を小さくするように、前記ニューラルネットワークに含まれるパラメータを更新する更新ステップと、
を実行し、
前記追加ユニットに対応する目標値は、予め定められた定数である
学習方法。 - 情報処理装置を、入力信号が特定のクラスに属する事後確率を出力するニューラルネットワークを学習する学習装置として機能させるためのプログラムであって、
前記ニューラルネットワークの出力層は、それぞれのクラスに対応するN個(Nは2以上の整数)のユニットと、1個の追加ユニットとを含み、
前記学習装置を
サンプル信号を前記ニューラルネットワークに与え、前記出力層におけるそれぞれのユニットについて、直前の層から出力された信号を設定されたパラメータに従って結合したN+1個の入力値を取得する伝播部と、
それぞれの前記入力値を前記事後確率を算出するための関数に入力して、前記出力層のそれぞれのユニットに対応するN+1個の確率値を含む確率ベクトルを生成する確率算出部と、
前記出力層のそれぞれのユニットに対応するN+1個の目標値を含む教師ベクトルと、前記確率ベクトルとの誤差を小さくするように、前記ニューラルネットワークに含まれるパラメータを更新する更新部と、
して機能させ、
前記追加ユニットに対応する目標値は、予め定められた定数である
プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015182167A JP6509694B2 (ja) | 2015-09-15 | 2015-09-15 | 学習装置、音声検出装置、学習方法およびプログラム |
US15/257,463 US10839288B2 (en) | 2015-09-15 | 2016-09-06 | Training device, speech detection device, training method, and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015182167A JP6509694B2 (ja) | 2015-09-15 | 2015-09-15 | 学習装置、音声検出装置、学習方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017058877A true JP2017058877A (ja) | 2017-03-23 |
JP6509694B2 JP6509694B2 (ja) | 2019-05-08 |
Family
ID=58236944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015182167A Active JP6509694B2 (ja) | 2015-09-15 | 2015-09-15 | 学習装置、音声検出装置、学習方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10839288B2 (ja) |
JP (1) | JP6509694B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019139651A (ja) * | 2018-02-14 | 2019-08-22 | Kddi株式会社 | 未知の複数次元のベクトルデータ群をクラス分類するプログラム、装置及び方法 |
JP2019164618A (ja) * | 2018-03-20 | 2019-09-26 | 株式会社東芝 | 信号処理装置、信号処理方法およびプログラム |
JP2020112483A (ja) * | 2019-01-15 | 2020-07-27 | 春江 姚 | 外観検査システム、計算モデル構築方法及び計算モデル構築プログラム |
JP2020201731A (ja) * | 2019-06-11 | 2020-12-17 | 日本放送協会 | 畳み込みニューラルネットワーク学習装置およびそのプログラム |
KR20210089430A (ko) * | 2020-01-08 | 2021-07-16 | 한국전자통신연구원 | 간접광고를 포함한 뉴스 기사 생성 시스템 및 방법 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6461660B2 (ja) * | 2015-03-19 | 2019-01-30 | 株式会社東芝 | 検出装置、検出方法およびプログラム |
US10832129B2 (en) * | 2016-10-07 | 2020-11-10 | International Business Machines Corporation | Transfer of an acoustic knowledge to a neural network |
US10762423B2 (en) | 2017-06-27 | 2020-09-01 | Asapp, Inc. | Using a neural network to optimize processing of user requests |
JP7077746B2 (ja) * | 2018-04-24 | 2022-05-31 | 日本電信電話株式会社 | 学習装置、学習方法及び学習プログラム |
US10893495B2 (en) * | 2019-02-06 | 2021-01-12 | Nokia Technologies Oy | Method and apparatus for providing timing synchronization |
US11037547B2 (en) | 2019-02-14 | 2021-06-15 | Tencent America LLC | Token-wise training for attention based end-to-end speech recognition |
US11455144B1 (en) * | 2019-11-21 | 2022-09-27 | Xilinx, Inc. | Softmax calculation and architecture using a modified coordinate rotation digital computer (CORDIC) approach |
CN111858221B (zh) * | 2020-07-28 | 2024-09-27 | 中国科学院微电子研究所 | 基于神经网络的高效指令测试序列生成方法及装置 |
CN112116143B (zh) * | 2020-09-14 | 2023-06-13 | 贵州大学 | 一种基于神经网络的森林虫害发生概率计算处理方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0566796A (ja) * | 1991-09-09 | 1993-03-19 | Sanyo Electric Co Ltd | 音声認識装置および音声パターン正規化装置 |
JP2015095212A (ja) * | 2013-11-14 | 2015-05-18 | 株式会社デンソーアイティーラボラトリ | 識別器、識別プログラム、及び識別方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02195400A (ja) * | 1989-01-24 | 1990-08-01 | Canon Inc | 音声認識装置 |
US5317673A (en) * | 1992-06-22 | 1994-05-31 | Sri International | Method and apparatus for context-dependent estimation of multiple probability distributions of phonetic classes with multilayer perceptrons in a speech recognition system |
JPH10198645A (ja) | 1997-01-07 | 1998-07-31 | Nippon Telegr & Teleph Corp <Ntt> | ニューラルネット学習方法及び装置 |
EP1450350A1 (en) * | 2003-02-20 | 2004-08-25 | Sony International (Europe) GmbH | Method for Recognizing Speech with attributes |
US7660713B2 (en) * | 2003-10-23 | 2010-02-09 | Microsoft Corporation | Systems and methods that detect a desired signal via a linear discriminative classifier that utilizes an estimated posterior signal-to-noise ratio (SNR) |
US20140046696A1 (en) * | 2012-08-10 | 2014-02-13 | Assurerx Health, Inc. | Systems and Methods for Pharmacogenomic Decision Support in Psychiatry |
-
2015
- 2015-09-15 JP JP2015182167A patent/JP6509694B2/ja active Active
-
2016
- 2016-09-06 US US15/257,463 patent/US10839288B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0566796A (ja) * | 1991-09-09 | 1993-03-19 | Sanyo Electric Co Ltd | 音声認識装置および音声パターン正規化装置 |
JP2015095212A (ja) * | 2013-11-14 | 2015-05-18 | 株式会社デンソーアイティーラボラトリ | 識別器、識別プログラム、及び識別方法 |
Non-Patent Citations (1)
Title |
---|
JACOB DEVLIN ET.AL: ""Fast and Robust Neural Network Joint Models for Statistical Machine Translation"", PROC. OF THE 52ND ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, JPN6019000549, 23 June 2014 (2014-06-23), US, pages 1370 - 1380, XP055861667, ISSN: 0003958013, DOI: 10.3115/v1/P14-1129 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019139651A (ja) * | 2018-02-14 | 2019-08-22 | Kddi株式会社 | 未知の複数次元のベクトルデータ群をクラス分類するプログラム、装置及び方法 |
JP2019164618A (ja) * | 2018-03-20 | 2019-09-26 | 株式会社東芝 | 信号処理装置、信号処理方法およびプログラム |
JP2020112483A (ja) * | 2019-01-15 | 2020-07-27 | 春江 姚 | 外観検査システム、計算モデル構築方法及び計算モデル構築プログラム |
JP2020201731A (ja) * | 2019-06-11 | 2020-12-17 | 日本放送協会 | 畳み込みニューラルネットワーク学習装置およびそのプログラム |
KR20210089430A (ko) * | 2020-01-08 | 2021-07-16 | 한국전자통신연구원 | 간접광고를 포함한 뉴스 기사 생성 시스템 및 방법 |
KR102413174B1 (ko) * | 2020-01-08 | 2022-06-27 | 한국전자통신연구원 | 간접광고를 포함한 뉴스 기사 생성 시스템 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP6509694B2 (ja) | 2019-05-08 |
US20170076200A1 (en) | 2017-03-16 |
US10839288B2 (en) | 2020-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6509694B2 (ja) | 学習装置、音声検出装置、学習方法およびプログラム | |
US11264044B2 (en) | Acoustic model training method, speech recognition method, acoustic model training apparatus, speech recognition apparatus, acoustic model training program, and speech recognition program | |
US11176946B2 (en) | Method and apparatus for speech recognition | |
US11158305B2 (en) | Online verification of custom wake word | |
JP6712642B2 (ja) | モデル学習装置、その方法、及びプログラム | |
US9984682B1 (en) | Computer-implemented systems and methods for automatically generating an assessment of oral recitations of assessment items | |
JP6222821B2 (ja) | 誤り修正モデル学習装置、及びプログラム | |
JP6933264B2 (ja) | ラベル生成装置、モデル学習装置、感情認識装置、それらの方法、プログラム、および記録媒体 | |
KR101182965B1 (ko) | 데이터 학습용 방법 및 장치, 데이터 인식용 장치, 및 데이터 생성용 장치 | |
US10580432B2 (en) | Speech recognition using connectionist temporal classification | |
JP2019159654A (ja) | 時系列情報の学習システム、方法およびニューラルネットワークモデル | |
JPWO2008004666A1 (ja) | 音声認識装置、音声認識方法、および音声認識用プログラム | |
US10741184B2 (en) | Arithmetic operation apparatus, arithmetic operation method, and computer program product | |
KR20180038707A (ko) | 동적 가중치 값과 토픽 정보를 이용하는 음성인식 방법 | |
CN112669845A (zh) | 语音识别结果的校正方法及装置、电子设备、存储介质 | |
JP6646337B2 (ja) | 音声データ処理装置、音声データ処理方法および音声データ処理プログラム | |
JP6605997B2 (ja) | 学習装置、学習方法及びプログラム | |
JP2019078857A (ja) | 音響モデルの学習方法及びコンピュータプログラム | |
KR20200120595A (ko) | 언어 모델 학습 방법 및 장치, 음성 인식 방법 및 장치 | |
Becerra et al. | A comparative case study of neural network training by using frame-level cost functions for automatic speech recognition purposes in Spanish | |
JP4939560B2 (ja) | 音声認識装置とその方法と、プログラム | |
JP6235922B2 (ja) | 重み付き有限状態オートマトン作成装置、記号列変換装置、音声認識装置、それらの方法、及びプログラム | |
JP2017167378A (ja) | 単語スコア計算装置、単語スコア計算方法及びプログラム | |
JP5161174B2 (ja) | 経路探索装置、音声認識装置、これらの方法及びプログラム | |
Bykov et al. | Improvement of the learning process of the automated speaker recognition system for critical use with HMM-DNN component |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180131 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190403 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6509694 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |