JPH0696048A - ニューラルネットを用いた認識装置 - Google Patents

ニューラルネットを用いた認識装置

Info

Publication number
JPH0696048A
JPH0696048A JP4247918A JP24791892A JPH0696048A JP H0696048 A JPH0696048 A JP H0696048A JP 4247918 A JP4247918 A JP 4247918A JP 24791892 A JP24791892 A JP 24791892A JP H0696048 A JPH0696048 A JP H0696048A
Authority
JP
Japan
Prior art keywords
unit
learning
recognition
integer
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4247918A
Other languages
English (en)
Inventor
Masanori Miyatake
正典 宮武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP4247918A priority Critical patent/JPH0696048A/ja
Publication of JPH0696048A publication Critical patent/JPH0696048A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明は、学習時と認識時の演算処理におけ
る精度を夫々異ならしめ、認識時の演算処理精度を学習
時のそれより低くすることによって、認識時の演算処理
を高速化、簡素化することが可能なニューラルネットを
用いた認識装置を提供することを目的とする。 【構成】 本発明は学習パターンを入力する入力ユニッ
ト、及び該入力ユニットに情報伝達経路にて結合された
出力ユニットからなるニューラルネットワークと、上記
出力ユニットの出力理想値である教師信号に基づいて上
記ニューラルネットワークのユニット間の結合状態を、
演算処理精度の高い学習演算手段にて決定するネットワ
ーク学習部と、該ネットワーク学習部によって決定され
た上記ユニット間の結合状態に基づいて、認識すべきパ
ターンの認識を、上記学習演算手段の演算処理精度より
低い精度の認識演算手段にて行なう認識部と、を具備す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声、文字等をニュー
ラルネットワークを用いて認識する認識装置に関する。
【0002】
【従来の技術】ニューラルネットワークを用いた音声認
識装置が、日本音響学会平成2年度秋季研究発表会講演
論文集「ニューラルネットを用いた不特定話者数字単語
音声認識の検討」(平成2年9月、講演番号2−P−1
4)に開示されており、その音声認識装置のブロック図
を図5に示す。
【0003】同図において、1は入力された学習デー
タ、又は識別データの音声を分析し、その音声の特徴パ
ラメータを抽出する音声分析部、2は音声分析部1で抽
出された特徴パラメータを用いて、浮動小数点演算方式
によって音声パターンを作成するパターン作成部、3は
パターン作成部2で作成された音声パターンを学習パタ
ーンとして複数のカテゴリ毎に分けて蓄積する学習パタ
ーン蓄積部、4はニューラルネットワークのユニット間
の結合の有無、即ちニューラルネットワークの形状を記
憶しているユニット間結合情報記憶部、5はユニット間
結合情報記憶部4に記憶されたユニット間結合の結合係
数を記憶する結合係数記憶部、6はユニット間結合情報
記憶部4及び結合係数記憶部5に記憶された情報を用い
てニューラルネットモデルに基づく演算を浮動小数点演
算方式で演算を行うニューラルネット演算部である。
【0004】7はパターン作成部2を、学習時には学習
パターン蓄積部3に、また認識時にはニューラルネット
演算部6に接続する第1スイッチ、8は学習パターン蓄
積部3からニューラルネット演算部6に送信される音声
パターンの属するカテゴリに応じた教師信号を発生する
教師信号発生部、9は教師信号発生部8の教師信号とニ
ューラルネット演算部6の出力値との誤差を演算する誤
差演算部、10は誤差演算部9で演算された誤差を基に
して、誤差逆伝搬(Error Back Propagation)法によっ
て結合係数記憶部5に記憶された結合係数を変更・修正
する学習演算部であり、誤差演算部9、及び学習演算部
10からネットワーク学習部が構成されており、誤差演
算部9、及び学習演算部10はいずれも浮動小数点演算
方式を用いて演算を行なう。
【0005】11は認識判定部、12はニューラルネッ
ト演算部6を学習時には誤差演算部9に、また認識時に
は認識判定部11に接続する第2スイッチである。
【0006】図6は階層型ニューラルネットワークを示
したものであり、これは図5におけるユニット間結合情
報記憶部4、結合係数記憶部5及びニューラルネット演
算部6によって構成されている。
【0007】13aは入力層、13bは中間層、13c
は出力層であり、夫々I個、J個、K個のユニットより
構成されている。上下方向に隣接する各層を構成する夫
々のユニットは図示した通り、情報伝達経路によって接
続されており、その情報伝達経路の結合係数は、学習に
よって修正され乍ら、最終的にある一定の値に決定され
る。
【0008】入力層13aを構成するユニットの個数
は、入力されるパラメータの数に、また出力層13cを
構成するユニットの個数は、認識すべきカテゴリの数に
夫々一致する。
【0009】ここで、具体的に各層のユニットの個数を
述べると、入力される音声は、周波数帯域を16分割、
時間を8分割してパターン化するようにしているので、
入力層13aのユニット数I=16×8=128であ
る。
【0010】また、認識すべきカテゴリは15単語であ
るので、出力層13cのユニット数K=15であり、更
に中間層13bのユニット数Jは、約50とする。
【0011】上述の如き構成において、学習パターン蓄
積部3における学習パターンの蓄積並びにニューラルネ
ットワークの学習について説明する。尚、その学習パタ
ーンとして、一桁の数字音声「れい」、「いち」、
「に」、「さん」、「し」、「ご」、「ろく」、「し
ち」、「はち」、「く」及びこれらの読み替えである
「ぜろ」、「まる」、「よん」、「なな」、「きゅう」
の計15単語を例に挙げる。
【0012】まず、第1スイッチ7を操作し、パターン
作成部2を学習パターン蓄積部3に接続する。この後、
一桁数字音声「れい」を音声分析部1に入力する。音声
分析部1では、その音声「れい」がマイクロフォン、テ
ープレコーダ等のアナログ出力であれば、A/D変換し
たうえで、例えば100〜6000Hzの周波数帯域を
16分割し、夫々の周波数帯域における大きさ、即ち1
6個の周波数成分を5ミリ秒毎に抽出すると共に、必要
に応じてパワー情報等も抽出する。
【0013】パターン作成部2では、音声分析部1で抽
出された周波数成分及びパワー情報に基づいて、入力音
声「れい」の開始時刻及び終了時刻を判定して音声区間
を決定し、その音声区間を8分割し、各区間における5
ミリ秒毎に抽出された周波数成分の平均を各周波数成分
毎に算出する。即ち、1つの入力音声に対して、16×
8個のデータからなる音声パターンが作成される。
【0014】パターン作成部2で作成された音声パター
ンは、第1スイッチ7を経由して、学習パターン蓄積部
3に送られ、「れい」に対応するカテゴリの学習パター
ンとして蓄積される。
【0015】以下、上述と同様に「いち」、「に」、・・
・・・、「きゅう」の14個の学習パターンがカテゴリ毎
に学習パターン蓄積部3に蓄積される。
【0016】学習パターン蓄積部3に学習パターンが蓄
積されると、第2スイッチ12を操作し、ニューラルネ
ット演算部6の出力層13cを誤差演算部9に接続す
る。学習パターン蓄積部3から「れい」のカテゴリに属
する1個の学習パターンが、ニューラルネット演算部6
の入力層13aに入力されると共に、学習パターン蓄積
部3から数字音声「れい」が属するカテゴリcの番号
(但し、1≦c≦K、cは整数、上述の例の場合K=1
5である。)が教師信号発生部8に送られる。
【0017】ニューラルネット演算部6では、ユニット
間結合情報記憶部4に記憶されているネットワーク形状
と、これに対応付けて結合係数記憶部5に記憶されてい
るユニット間結合係数とを用いて、入力層13aに入力
された学習パターンに対して、ニューラルネット演算部
6内部で演算を行ない、その結果を出力層13cのK個
のユニットから出力値Ok(k=1、2、・・・・・・、K)
(以下、Okという。)を出力する。
【0018】教師信号発生部8では、学習パターン蓄積
部3から送られてきたカテゴリcに応じた教師信号Tk
(k=1、2、・・・・・・、K)(以下、Tkという。)を
発生させて、誤差演算部9に送る。
【0019】一方、誤差演算部9では、教師信号発生部
8の教師信号Tkとニューラルネット演算部6の出力値
Okとの誤差、即ち、 Ek=Tk−Ok (k=1、2、・・・・・・、K) ・・・(1) を演算する。
【0020】学習演算部10は、式(1)に示される誤
差Ekが最小になるように、ユニット間結合情報記憶部
4に記憶されているネットワーク形状を参照し乍ら、結
合係数記憶部5に記憶されているユニット間結合係数を
誤差逆伝搬法に基づいて変更する。
【0021】この操作を繰り返すことによって、結合係
数記憶部5に記憶されているユニット間結合係数を徐々
に変化させ、最適解に近付ける。
【0022】尚、実際には、最適解を求めることは困難
であるので、学習を十分繰り返すことで準最適解を求
め、この準最適解であっても実用上は問題はない。
【0023】そこで、学習を終えたニューラルネットワ
ークを用いて、音声認識の動作を行なうに際しては、第
1、第2スイッチ7、12を操作し、パターン作成部2
をニューラルネット演算部6に、またニューラルネット
演算部6の出力層13cを認識判定部11に接続するこ
とによって、音声認識の動作が可能になる。
【0024】斯して、音声分析部1に音声が入力される
と、上述の如く学習パターンの蓄積動作と同様な手順に
従ってパターン作成部2にて、音声パターンが作成され
ると、その音声パターンは、ニューラルネット演算部6
に送られ、最終的に決定された結合係数に基づいてニュ
ーラルネット演算部6にて演算が行われ、その出力結果
が出力層13cから出力される。その出力値をOkとす
ると、認識判定部11では、出力値Okの最大値を検出
し、そのときのkの値に応じた信号を認識結果として図
示しない外部出力装置に出力する。
【0025】上述の構成にあっては、音声、又は文字の
パターンをニューラルネットに学習させる場合、種々の
変形パターンを考慮して一つのカテゴリに対して複数の
学習パターンを準備し、夫々のパターンを繰り返し入力
することが行われている。即ち、延べ百万個の学習パタ
ーンを繰り返し入力しながら、結合係数記憶部5に記憶
されているユニット間結合係数を徐々に変化させて、最
適な、或るいは準最適な解を求めている。
【0026】従って、学習時のニューラルネット演算部
6での演算は、高速で、且つ高い精度が要求されるた
め、従来は、例えばミニコンピュータ、ワークステーシ
ョン等の高速演算処理が可能なコンピュータ上で、32
ビットの浮動小数点演算を行っていた。
【0027】一方、認識時には、入力される一つの音声
に対して一つの音声パターンが作成されるだけであるの
で、比較的安価な信号処理プロセッサにて実時間内で十
分処理することができ、しかも学習時に要求されるほど
の演算精度は必要ない。
【0028】しかしながら、学習時、又は認識時に第1
スイッチ7、第2スイッチ12にて切り換えを行い、ネ
ットワーク学習部、認識部との切り換え行っているもの
の、ニューラルネット演算部6は学習時も、認識時も同
じ処理を行うように構成されているため、認識時におい
てはニューラルネット演算部6の32ビットの浮動小数
点演算の機能は、過剰な機能であると共に、却って演算
処理速度を遅くする原因となっていた。
【0029】
【発明が解決しようとする課題】本発明は、上述の問題
に鑑み成されたものであり、学習時と認識時の演算処理
における精度を夫々異ならしめ、認識時の演算処理精度
を学習時のそれより低くすることによって、認識時の演
算処理を高速化、簡素化することが可能なニューラルネ
ットを用いた認識装置を提供することを目的とする。
【0030】
【課題を解決するための手段】本発明は、学習パターン
を入力する入力ユニット、及び該入力ユニットに情報伝
達経路にて結合された出力ユニットからなるニューラル
ネットワークと、上記出力ユニットの出力理想値である
教師信号に基づいて上記ニューラルネットワークのユニ
ット間の結合状態を、演算処理精度の高い学習演算手段
にて決定するネットワーク学習部と、該ネットワーク学
習部によって決定された上記ユニット間の結合状態に基
づいて、認識すべきパターンの認識を、上記学習演算手
段の演算処理精度より低い精度の認識演算手段にて行な
う認識部と、を具備することを特徴とする。
【0031】
【作用】ニューラルネットの学習時には、演算処理精度
の高い学習演算手段を用い、認識時には、該学習演算手
段の演算処理精度より低い精度の認識演算手段を用い
る。
【0032】
【実施例】本発明の第1の実施例を図1乃至図3に示
す。尚、従来と同一機能を有する構成については同一番
号を付す。
【0033】第1の実施例が図5の従来技術の構成と異
なる主な点は、学習部側整数変換部14a、認識部側整
数変換部14b、整数化結合係数記憶部15、及びニュ
ーラルネット整数演算部16を具備する点である。そこ
で、これらの構成を順次説明する。
【0034】14aは結合係数記憶部5に記憶されてい
る浮動小数点からなるユニット間の結合係数に定数Mを
掛けて整数に変換する学習部側整数変換部、14bはパ
ターン作成部2で作成される浮動小数点からなる音声パ
ターンに定数Nを掛けて整数に変換する認識部側整数変
換部、15は学習部側整数変換部14aで整数化された
ユニット間結合係数を記憶する整数化結合係数記憶部、
16はニューラルネット整数演算部であり、ユニット間
結合情報記憶部4に記憶されているネットワーク形状の
情報と整数化結合係数記憶部15に記憶された整数化さ
れたユニット間結合係数とを用いて、ニューラルネット
モデルに基づいて整数方式による演算を行う。尚、認識
部は、認識判定部11、認識部側整数変換部14b、及
びニューラルネット整数演算部16から構成されてい
る。
【0035】次に、第1の実施例の動作について説明す
る。尚、学習時の動作については従来と同じであるので
省略し、それ以降の動作について述べることとする。
【0036】学習の終了後、結合係数記憶部5に記憶さ
れたユニット間結合係数は学習部側整数変換部14aに
送られ、定数Mが掛けられ、浮動小数点のユニット間結
合係数が整数に変換され、整数化結合係数記憶部15に
格納される。
【0037】この後、第1スイッチ7を操作し、パター
ン作成部2を認識部側整数変換部14bに接続すること
で、認識動作が可能になり、以下に、その認識時の動作
について説明する。
【0038】音声分析部1に音声が入力されると、学習
パターンの蓄積動作と同様な手順に従ってパターン作成
部2にて音声パターンが作成される。作成された音声パ
ターンは学習部側整数変換部14bに送られ、定数Nが
掛けられて、浮動小数点の学習パターンデータが整数に
変換され、その後ニューラルネット整数演算部16に送
られる。ニューラルネット整数演算部16では、ユニッ
ト間結合情報記憶部4に記憶されているネットワーク形
状の情報と整数化結合係数記憶部15に格納された整数
化されたユニット間結合係数とを用いて、ニューラルネ
ットモデルに基づいた整数による演算が行われ、その出
力結果が出力層13cから出力される。
【0039】尚、各ユニットの入力と出力の間には、si
gmoid等の関数が用いられているが、これは関数をテー
ブル化することで容易に整数演算に対応することができ
る。認識判定部11では、従来と同様に出力値Okの最
大値を検出し、そのときのkの値に応じた信号を認識結
果として図示しない外部出力装置に出力する。
【0040】ところで、学習部側整数変換部14a、及
び認識部側整数変換部14bで用いる定数M、Nである
が、これはパターン作成部2にて作成される音声パター
ン、及び学習の結果、結合係数記憶部5に蓄積されるユ
ニット間結合係数の値に応じて適宜決まるものである。
【0041】図2、及び図3は、「従来の技術」に記載
された文献「ニューラルネットを用いた不特定話者数字
単語音声認識の検討」で用いられている実験条件を用
い、浮動小数点を整数に変換した場合の認識性能を調べ
るため、定数M、Nをそれぞれ種々に変化させて認識率
を測定した結果である。図2ではN=256に固定した
ときのMの変化に対する認識率、図3ではM=1024
に固定したときのNの変化に対する認識率を示してい
る。なお、浮動小数点のまま認識させたときの認識率
は、98.3%である。
【0042】これらから明らかなように、広範囲のM、
Nの値に対して安定した認識率が得られると共に、その
認識率は浮動小数点のまま認識させたときの認識率と比
較しても、認識率の低下はみられず、本発明が非常に有
効であることが明らかにされた。
【0043】従って、パターン作成部2にて作成される
音声パターン、及び学習の結果、結合係数記憶部5に蓄
積されるユニット間結合係数の値がある程度想定できれ
ば、定数M、Nの値は実用上なんら不都合のない程度に
容易に決めることができることが確認された。
【0044】次に、本発明の第2の実施例を図4に基づ
いて説明し、第1の実施例と同じ機能を有する構成につ
いては、同一番号を付す。
【0045】第2の実施例が第1の実施例の構成と異な
る主な点は、認識部側整数変換部14bの代わりにこれ
と同等の機能を有する整数パターン作成部19を設け、
また整数化結合係数記憶部15の代わりにこれと同等の
機能を有するROMライター17、及びROM18を設
けることである。そこで、これらの構成を順次説明す
る。
【0046】17はユニット間結合情報記憶部4に記憶
されたネットワーク形状の情報と、学習部側整数変換部
14aで整数に変換されたユニット間結合係数とを、R
OM(読み出し専用メモリ)に書き込むためのROMラ
イター、18はROMライター17でネットワーク形状
の情報、及びユニット間結合係数が書き込まれたROM
であり、このROM18は、必ずしもROMライター1
7と結合されている必要はなく、いったん情報が書き込
まれれば、ROMライター17から離されて装着される
ように成すこともできる。
【0047】19は整数パターン作成部であり、入力音
声に対し整数値の音声パターンを出力し、この整数値の
音声パターンは、図1の実施例における認識部側整数変
換部14bの出力と同等のものであるが、浮動小数点の
音声パターンを整数変換する必要はなく、特性の同じア
ナログのバンドパスフィルタにより得られる周波数成分
出力を16ビットのA/D変換器によってデジタル化
し、整数値の音声パターンを得ることも可能である。
【0048】20は、音声分析部1を、学習時にはパタ
ーン作成部2に、認識時には整数パターン作成部19に
接続するための第3スイッチである。なお、この第3ス
イッチ20は、学習終了後はジャンパーや半田付けなど
を用い、直接音声分析部1を整数パターン作成部19に
結合させてもよい。
【0049】以下に、第2の実施例における学習動作、
及び認識動作について説明する。
【0050】まず、第3スイッチ20を操作して音声分
析部1をパターン作成部2に接続し、従来と同じ手順で
ニューラルネットの学習を行う。学習が終了すると、学
習の結果得られた結合係数記憶部5内のユニット間結合
係数は、整数変換部14aで浮動小数点から整数に変換
されROMライター17によって、またユニット間結合
情報記憶部4に記憶されたネットワーク形状の情報は、
ROMライター17によって、ROM18に書き込まれ
る。
【0051】次に第3スイッチ20を操作して、音声分
析部1を整数パターン作成部19に接続し、認識処理を
可能にする。音声が入力されると、音声分析部1にて分
析された結果を用いて整数パターン作成部19にて整数
値の音声パターンが作成され、ニューラルネット整数演
算部16に送付される。ニューラルネット整数演算部1
6では、ROM18に書き込まれたネットワーク形状の
情報と整数化されたユニット間結合係数を用い、入力さ
れた音声に対する認識処理を行い、その出力結果が出力
層13cから出力される。認識判定部11では、従来と
同様に出力値Okの最大値を検出し、そのときのkの値
に応じた信号を認識結果として図示しない外部出力装置
に出力する。
【0052】尚、ROM18は容易に大量の複製が可能
なので、図4の点線で囲まれた部分だけを製造すること
で、認識専用装置を作ることも可能である。
【0053】また、上述のニューラルネット整数演算部
16で行っている整数演算は、固定小数点演算といわれ
ているものを含んでいる。すなわち、整数演算と固定小
数点演算は実体は同じであり、小数点が何ビット目に位
置すると見なすかの違いだけである。
【0054】更に、以上の説明ではネットワーク学習部
における演算を浮動小数点演算方式で、認識部における
演算を整数演算方式で行う場合を述べたが、学習を64
ビットの浮動小数点演算方式で、認識を32ビットの浮
動小数点演算方式で行うことも可能である。
【0055】
【発明の効果】本発明によれば、ネットワーク学習部に
て精度の高い演算を行った結果に基づいて、認識部の認
識演算手段にて上記ネットワーク学習部の精度より低い
精度の演算を行うことによって、認識に要する演算処理
時間を従来より短縮することができ、認識部をネットワ
ーク学習部から分離した場合には、その認識部の演算回
路を簡素化することができる。
【0056】更に、認識部の認識演算手段が、ネットワ
ーク学習部の精度より低い精度であったとしても、本発
明の認識率は従来のそれと比較しても遜色はない。
【図面の簡単な説明】
【図1】本発明の第1の実施例のニューラルネットを用
いた認識装置のブロック図
【図2】本発明の第1の実施例のニューラルネットを用
いた認識装置における認識率と定数Mとの関係を示す図
【図3】本発明の第1の実施例のニューラルネットを用
いた認識装置における認識率と定数Nとの関係を示す図
【図4】本発明の第2の実施例のニューラルネットを用
いた認識装置のブロック図
【図5】従来のニューラルネットを用いた認識装置のブ
ロック図
【図6】ニューラルネットワークの模式図
【符号の説明】 1 音声分析部 2 パターン作成部 3 学習パターン作成部 4 ユニット間結合情報記憶部 5 結合係数記憶部 6 ニューラルネット演算部 8 教師信号発生部 9 誤差演算部 10 学習演算部 11 認識判定部 14a 学習部側整数変換部 14b 認識部側整数変換部 15 整数化結合係数記憶部 16 ニューラルネット整数演算部 17 ROMライター 18 ROM 19 整数パターン作成部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 学習パターンを入力する入力ユニット、
    及び該入力ユニットに情報伝達経路にて結合された出力
    ユニットからなるニューラルネットワークと、上記出力
    ユニットの出力理想値である教師信号に基づいて上記ニ
    ューラルネットワークのユニット間の結合状態を学習演
    算手段にて決定するネットワーク学習部と、該ネットワ
    ーク学習部によって決定された上記ユニット間の結合状
    態を示す情報に基づいて、認識すべきパターンの認識を
    認識演算手段にて行なう認識部と、を具備するニューラ
    ルネットを用いた認識装置であって、 上記ネットワーク学習部の具備する学習演算手段は、精
    度の高い演算手段によって構成され、また上記認識部の
    具備する認識演算手段は、上記学習演算手段の精度より
    低い精度の演算手段によって構成されていることを特徴
    とするニューラルネットを用いた認識装置。
  2. 【請求項2】 上記学習演算手段は、浮動小数点演算を
    行なうと共に、上記認識演算手段は、整数演算を行なう
    ことを特徴とする請求項1記載のニューラルネットを用
    いた認識装置。
  3. 【請求項3】 上記認識部は、認識時に少なくともネッ
    トワーク学習部から分離可能であることを特徴とする請
    求項1、又は2記載のニューラルネットを用いた認識装
JP4247918A 1992-09-17 1992-09-17 ニューラルネットを用いた認識装置 Pending JPH0696048A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4247918A JPH0696048A (ja) 1992-09-17 1992-09-17 ニューラルネットを用いた認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4247918A JPH0696048A (ja) 1992-09-17 1992-09-17 ニューラルネットを用いた認識装置

Publications (1)

Publication Number Publication Date
JPH0696048A true JPH0696048A (ja) 1994-04-08

Family

ID=17170496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4247918A Pending JPH0696048A (ja) 1992-09-17 1992-09-17 ニューラルネットを用いた認識装置

Country Status (1)

Country Link
JP (1) JPH0696048A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3702906A1 (en) 2019-02-26 2020-09-02 Fujitsu Limited Information processing apparatus, control method for information processing apparatus, and control program for information processing apparatus
US20210157283A1 (en) * 2019-11-26 2021-05-27 Apex Artificial Intelligence Industries, Inc. Adaptively controlling groups of automated machines
US11043962B2 (en) 2018-02-26 2021-06-22 Fujitsu Limited Information processing apparatus, information processing method, and recording medium
CN113593538A (zh) * 2021-09-02 2021-11-02 北京声智科技有限公司 语音特征的分类方法、相关设备及可读存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11043962B2 (en) 2018-02-26 2021-06-22 Fujitsu Limited Information processing apparatus, information processing method, and recording medium
EP3702906A1 (en) 2019-02-26 2020-09-02 Fujitsu Limited Information processing apparatus, control method for information processing apparatus, and control program for information processing apparatus
US11182156B2 (en) 2019-02-26 2021-11-23 Fujitsu Limited Selectively changing arithmetic data types used in arithmetic execution of deep learning applications based on expressible ratio and fluctuation value comparisons to threshold values
US20210157283A1 (en) * 2019-11-26 2021-05-27 Apex Artificial Intelligence Industries, Inc. Adaptively controlling groups of automated machines
CN113593538A (zh) * 2021-09-02 2021-11-02 北京声智科技有限公司 语音特征的分类方法、相关设备及可读存储介质
CN113593538B (zh) * 2021-09-02 2024-05-03 北京声智科技有限公司 语音特征的分类方法、相关设备及可读存储介质

Similar Documents

Publication Publication Date Title
EP0085543B1 (en) Speech recognition apparatus
Sakoe Two-level DP-matching--A dynamic programming-based pattern matching algorithm for connected word recognition
EP0086589B1 (en) Speech recognition system
EP0342630A2 (en) Speech recognition with speaker adaptation by learning
CN112083806B (zh) 一种基于多模态识别的自学习情感交互方法
EP0112717B1 (en) Continuous speech recognition apparatus
CN109979436B (zh) 一种基于频谱自适应法的bp神经网络语音识别系统及方法
EP0282272A1 (en) Voice recognition system
CN111326178A (zh) 基于卷积神经网络的多模态语音情感识别系统及方法
Sunny et al. Recognition of speech signals: an experimental comparison of linear predictive coding and discrete wavelet transforms
US5164990A (en) Method and apparatus for recognizing unknown spoken words and by feature extraction and comparison with reference words
CN109754791A (zh) 声控方法及系统
JPH0696048A (ja) ニューラルネットを用いた認識装置
Liu et al. Learning salient features for speech emotion recognition using CNN
CN114360584A (zh) 一种基于音素级的语音情感分层式识别方法及系统
CN113065352B (zh) 一种电网调度工作文本的操作内容识别方法
CN113963690A (zh) 一种低内存消耗的高效离线命令词识别系统和建模方法
Huang et al. A dual-complementary acoustic embedding network learned from raw waveform for speech emotion recognition
JPH0619870A (ja) ニューラルネットワークの学習方法
JPH06266398A (ja) ニューラルネットワークを用いた演算装置
Li et al. Adaptive Mask Based Attention Mechanism for Mandarin Speech Recognition
JPH10333699A (ja) 音声認識および音声合成装置
JP3052520B2 (ja) パターン分類装置
JP2757356B2 (ja) 単語音声認識方法および装置
Wei et al. TFC-SpeechFormer: Efficient Emotion Recognition Based on Deep Speech Analysis and Hierarchical Progressive Structures