JP2009086202A - 音声認識における音響尤度並列計算装置及びそのプログラム - Google Patents

音声認識における音響尤度並列計算装置及びそのプログラム Download PDF

Info

Publication number
JP2009086202A
JP2009086202A JP2007254642A JP2007254642A JP2009086202A JP 2009086202 A JP2009086202 A JP 2009086202A JP 2007254642 A JP2007254642 A JP 2007254642A JP 2007254642 A JP2007254642 A JP 2007254642A JP 2009086202 A JP2009086202 A JP 2009086202A
Authority
JP
Japan
Prior art keywords
acoustic
calculation
likelihood
parallel
acoustic likelihood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007254642A
Other languages
English (en)
Other versions
JP4854032B2 (ja
Inventor
Ryoichi Yagi
良一 八木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2007254642A priority Critical patent/JP4854032B2/ja
Publication of JP2009086202A publication Critical patent/JP2009086202A/ja
Application granted granted Critical
Publication of JP4854032B2 publication Critical patent/JP4854032B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】音響尤度計算の処理時間を短縮できる音声認識における音響尤度並列計算装置及びそのプログラムを提供することにある。
【解決手段】音響尤度計算は、音響特徴量保持部14と音響尤度並列計算部15で並列計算により行われる。該音響特徴量保持部14と音響尤度並列計算部15は、それぞれGPUメモリとGPUに相当し、該音響尤度計算は、GPGPUのピクセルシェーダの並列演算をカスケード接続することにより行われる。前記GPGPUのピクセルシェーダでは、データ記憶領域に確保された38次元の各々のμ、χに対し、演算式(2)第二項(χ−μ)の演算を一括実行して38次元の結果zを算出させ、該ピクセルシェーダにおいて、続けて、z、σに対し、演算式(2)第二項(z×z)/(σ×σ)の演算を一括実行し、38次元の結果P’を算出させる。そして、該P’を、38個加算することにより、音響特徴量の合計尤度が算出される。
【選択図】図2

Description

本発明は音声認識における音響尤度並列計算装置及びそのプログラムに関し、特に音声認識における音響特徴量の積和演算部分を並列演算化することで尤度計算の処理時間を短縮可能にする音響尤度計算装置及びそのプログラムに関する。
音声認識では、マイクからデジタル・サンプリングされた音声は時系列の音響特徴量に変換され、母音や子音といった認識単位毎の音響モデルとパターン・マッチングが行われる。一方、隠れマルコフモデル(Hidden Markov Model: HMM)で表現される音響モデルは、数百の状態(State)で構成され、それぞれの状態は音響特徴量(38次元)の入力に対して尤度(対数化した確率)を出力する多次元正規分布を持つ。
この多次元正規分布は次の演算式(1)で表される。
Figure 2009086202
ここに、μは平均、σは分散、χは互いに独立する38次元(38個)のパラメータである。
前記(1)式を対数化して尤度にすると、次の演算式(2)の通り、2次関数の和で表される。
Figure 2009086202
ここに、演算式(2)の括弧{ }内の第1項は定数項であり、予め計算しておけるため、演算式(2)は括弧{ }内の第二項の38回の積和演算となる。この音響特徴量の積和演算を音響尤度計算と呼ぶ。
さて、下記の特許公報1には、前記尤度計算演算式(演算式(2))を単純な積和演算式へ分解し、個々の積和演算の計算コストを下げることで高速実行する方法が開示されている。また、下記の特許文献2には、音響特徴量の変化量に閾値を設け、音響尤度計算の実行回数の絞込みを行うことで高速実行する方法が開示されている。さらに、下記の特許文献3には、公知の尤度計算演算式の定数部をテーブル化し、計算量を削減することで高速実行する方法が開示されている。
一方、下記の非特許文献1には、音響モデルの状態を予備選択することで、無駄な音響尤度計算を減らし、また、非選択の音響モデルの状態に対しても、事前に他音響モデルから算出した近似値を適用することで高速実行する方法が開示されている。
特開2005-031151号公報 特開2000-250580号公報 特開2000-322081号公報 情報処理学会 論文誌 IPSJ-JNL4307023、李晃伸他2名、「音素環境独立HMMを用いた混合ガウス分布選択による音響尤度計算量の削減」
音響尤度計算を高速実行するために、前記した特許文献1〜3、非特許文献1に記されている従来技術を適用しようとすると、以下のような課題が存在する。
(a)特許文献1に記載の方法では、音響モデルの状態数や音響特徴量の次元数が増大すると、分解された個々の積和演算の累積度が増大するため、並列化が困難である。
(b)特許文献2あるいは特許文献3に記載の方法では、音響モデルの状態数や音響特徴量の次元数が増大すると、音響特徴量や定数を記憶するデータ記憶領域が増大するため、データ記憶領域の限られた機器では、実装が困難である。
(c)非特許文献1に記載の方法では、音響モデルの状態数や音響特徴量の次元数が増大すると、非選択の音響モデルの状態から算出した近似値を記憶するデータ記憶領域が増大するため、データ記憶領域の限られた機器では、実装が困難である。
本発明は、前記した従来技術の課題に鑑みてなされたものであり、その目的は、音響尤度計算の処理時間を短縮できる音声認識における音響尤度並列計算装置及びそのプログラムを提供することにある。
前記した目的を達成するために、本発明は、入力音声を分析し音響特徴量に変換する音響特徴量変換部と、音響尤度計算の並列実行手順を登録する音響尤度並列実行手順登録部と、入力音声の音響特徴量と音響モデルの状態を保持する音響特徴量保持部と、前記音響尤度並列実行手順登録部によって登録された音響尤度並列実行手順に従い、入力音声の音響特徴量と音響モデルの状態を用いて尤度計算を実行する音響尤度並列計算部と、前記音響尤度並列計算部から尤度計算結果を出力させる音響尤度並列計算制御部と、前記音響尤度並列計算部から音響尤度計算結果を取得する音響尤度計算結果取得部とを具備する点に特徴がある。
また、前記音響尤度並列計算部には、一般的にはグラフィック処理を行うGPGPU(General Purpose Graphic Processing Unit)を使用し、該GPGPUのピクセルシェーダのそれぞれの並列演算をカスケード接続することで音響尤度計算を実行させるようにした点に他の特徴がある。
また、GPGPUのピクセルシェーダの並列演算をカスケード接続することで音響尤度計算を実行させる音響尤度並列計算のプログラムであって、コンピュータに、データ記憶領域に確保された38次元の各々のμ、χに対し、演算式(2)の第二項の(χ−μ)の演算を一括実行して38次元の結果zを算出させる機能と、z、σに対し、演算式(2)の第二項(z×z)/(σ×σ)の演算を一括実行し、38次元の結果P’を算出させる機能とを、前記ピクセルシェーダで実現させるためのプログラムを提供する点に、さらに他の特徴がある。
本発明による音響尤度並列計算装置によれば、音響モデルの状態数や音響特徴量の次元数に依存しない可変のデータ記憶領域を利用することで、従来の尤度計算方法をそのまま並列実行出来る。これにより、前記演算式(2)を、短時間で実行することが可能となる。
また、可変のデータ記憶領域に、音響モデルの状態数や音響特徴量の次元数を保持することで、音響尤度並列計算前後のデータ記憶領域の使用頻度とデータ記憶総量を低く抑えることができるようになる。
まず、本発明の原理を説明する。一般的なPCや携帯電話端末では、CPUの演算処理能力は限定されるため、音声認識処理において処理量の特に多い音響尤度計算を、通常グラフィック処理を行っているGPGPU(General Purpose Graphic Processing Unit)を転用して行うことで、膨大な演算処理を高効率かつ高精度で行え、大語彙辞書での音声認識処理をリアルタイムで実行するようにする。具体的には、3Dグラフィック処理等で用いられる頂点処理(バーテックスシェーダ)やテクスチャ処理(ピクセルシェーダ)のマトリックス並列演算をベクトル処理と見做して複数並列処理のカスケード接続の処理形態を構成し、音響尤度計算における並列・順次処理を効率的にマッピングすることで、高速化を図るものである。この発明によれば、また、これまでCPU側で必要としていた膨大なメモリもGPGPU側で吸収することができる。
以下に、図面を参照して、本発明を詳細に説明する。図1は音響尤度並列計算装置のハード構成を示すブロック図である。
図示されているように、該音響尤度並列計算装置は、ハード構成としては、CPU1、メモリ2,GPGPU(General Purpose Graphic Processing Unit)3,ディスプレイ4およびこれらを接続するバス5から構成される。また、GPGPU3は、GPU31と可変のデータ記憶領域を有するGPUメモリ32とからなる。図から分かるように、GPUメモリ32はGPU31から直接アクセスされてデータの読み書きをすることができるが、CPU1からは直接にアクセスされることはできない。このため、CPU1は、GPU31を介してGPUメモリ32にアクセスするようにする。
図2は、該音響尤度並列計算装置の機能ブロック図であり、入力音声を分析し、音響特徴量に変換する音響特徴量変換部11と、音響尤度計算の並列実行手順を登録する音響尤度並列実行手順登録部12と、入力音声の音響特徴量と音響モデルの状態を保持する音響特徴量保持部14と、該音響特徴量保持部14で保持された入力音声の音響特徴量と音響モデルの状態と音響尤度並列実行手順登録部12に予め登録されている音響尤度並列実行手順に従い、尤度計算を実行する音響尤度並列計算部15と、該音響尤度並列計算部15から尤度計算結果を出力させる音響尤度並列計算制御部13とからなる。
ここに、前記音響特徴量変換部11、音響尤度並列計算制御部13は、図1のCPU1が行う機能であり、前記音響尤度並列実行手順登録部12はメモリ2に相当する。また、前記音響特徴量保持部14はGPUメモリ32に相当し、前記音響尤度並列計算部15はGPU31が行う機能である。
次に、該音響尤度並列計算装置の動作を説明する。GPGPU3は元々グラフイックの処理、例えば画像のピクセルを回転させたり、その色を変化させたりする処理を高速に行うためのものであるので、これをCPUの演算用のアクセラレータとして用いる場合には、予め、演算のためのデータ領域のサイズとか、演算の変数の定義、演算の処理手順(プログラム)とかを、CPU1側からGPU31に設定またはロードすることが必要になる。
そこで、図3(a)に示すように、CPU1はGPU31を介してGPUメモリ32に、n個の独立するパラメータχ、音声特徴量の分散σ、平均μのための記憶領域(テクスチャ)を用意し、各記憶領域のサイズを、例えば512×512(ピクセル)とする。また、CPU1はGPU31に、演算の変数の定義や、図3(b)のような演算の処理手順をロードする。
つまり、図2においては、音響尤度並列実行手順登録部12が音響尤度並列計算部15に対して、初期設定フェーズとして、以下の初期設定を行う。
〈初期設定フェーズ〉
・音声特徴量をn次元(n個)とする。
・音響モデルの状態数をm個とする。
・nの平均をμ、nの分散をσ、n個の独立するパラメータをχとする。
・μ、σ、χから求めた尤度計算結果(音響モデルの状態各々の尤度確率)をpとする。
・μ、σ、χ、pを、各々保持するためのデータ記憶領域のサイズをl=m×nとし、データ記憶領域を確保する。
前記初期設定フェーズが終わると、次は並列演算フェーズに移る。該並列演算フェーズでは、前記演算式(2)の右辺第二項の演算、すなわち38回の積和演算を行う。具体的には、図2の音響特徴量変換部11は、入力音声を時系列の38個の音響特徴量(デジタル)に変換し、該38個の音響特徴量は音響尤度並列計算部15を介して音響特徴量保持部14に格納される。なお、好ましくは、音声の25m秒を1フレームとした場合、音響特徴量38個×音響モデルの状態数546個×音響モデルの状態の任意の組み合わせ数×1フレーム分、例えば38個×546個×音響モデルの状態の任意の組み合わせ数分の音響特徴量を一括して音響特徴量保持部14に格納すると、処理速度をさらに向上することができる。
該音響特徴量として、前記した38次元(一般的に、n次元)の音声特徴量平均μ、分散σ、独立するパラメータχが求められているので、音響尤度並列計算部15はこれらの特徴量を用いて、下記の並列演算フェーズの処理を行う。
〈並列演算処理フェーズ〉
・前記データ記憶領域(音響特徴量保持部14)に確保された各々のμ、χに対し、演算式(2)第二項(χ−μ)の演算を一括実行し、結果をzとする。
・続いて、z、σに対し、演算式(2)第二項(z×z)/(σ×σ)の演算を一括実行し、演算結果をPとし、該Pを保持するためのデータ記憶領域P’(音響特徴量保持部14)に設定する。
図4は、該並列演算処理フェーズの概念図である。このフェーズは、前記GPGPUのピクセルシェーダのそれぞれの並列演算をカスケード接続することにより行われる。前記GPGPUのピクセルシェーダでは、データ記憶領域に確保された38次元の各々のμ、χに対し、演算式(2)第二項(χ−μ)の演算を一括実行して38次元の結果zを算出させ、該ピクセルシェーダにおいて、続けて、z、σに対し、演算式(2)第二項(z×z)/(σ×σ)の演算を一括実行し、38次元の結果P’を算出させる。
前記並列演算処理フェーズが終わると、次は終了フェーズに移る。該終了フェーズでは、音響尤度並列計算制御部13は、音響尤度並列計算部15を介して音響特徴量保持部14にアクセスし、n個のpを読み出し、以下の終了フェーズの処理を行う。
〈終了フェーズ〉
・データ記憶領域(音響特徴量保持部14)上のn次元(n個)分のP’に対してシグマ演算を実行し、音響特徴量の合計尤度を算出する。
つまり、音響尤度並列計算制御部13は、P’の記憶領域からP’の値を38個読み出して、図5に示されている式の演算(音響尤度計算)を行う。ここに、Cは定数部分である。
以上のように、本実施形態によれば、入力音声のn個又はn×1フレームの特徴量をGPUメモリ32に一括して格納し、前記並列演算処理フェーズで説明した並列演算処理を行うようにしたので、演算式(2)第二項(z×z)/(σ×σ)の演算を一括して実行できるようになる。このため、従来の尤度計算方法をそのまま並列実行でき、前記演算式(2)を短時間で実行することが可能となる。
なお、本発明は前記した実施形態に限定されず、前記ピクセルシェーダの同時ベクトル演算数を上げ、複数の音響モデルに対する演算(音響特徴量38個×音響モデルの状態数546個×音響モデルの状態の任意の重ね合わせ数×M)(Mは1より大きい正の整数)の処理を同時に実行することにより、速度向上を図ることができる。例えば、音声を1フレームずつ並列処理する場合には、例えばMは、その実施形態における音声フレームの最大並列処理実行数となる。
本発明の一実施形態のハード構成を示すブロック図である。 本発明の一実施形態の機能を示すブロック図である。 初期設定フェーズの概念を説明する図である。 並列処理フェーズの概念を説明する図である。 終了フェーズの概念を説明する図である。
符号の説明
1・・・CPU、2・・・メモリ、3・・・GPGPU、4・・・ディスプレイ、5・・・バス、31・・・GPU、32・・・GPUメモリ、11・・・音響特徴量変換部、12・・・音響尤度並列実行手順登録部、13・・・音響尤度並列計算制御部、14・・・音響特徴量保持部、15・・・音響尤度並列計算部。

Claims (7)

  1. 入力音声を分析し音響特徴量に変換する音響特徴量変換部と、
    音響尤度計算の並列実行手順を登録する音響尤度並列実行手順登録部と、
    入力音声の音響特徴量と音響モデルの状態を保持する音響特徴量保持部と、
    前記音響尤度並列実行手順登録部によって登録された音響尤度並列実行手順に従い、入力音声の音響特徴量と音響モデルの状態を用いて尤度計算を実行する音響尤度並列計算部と、
    前記音響尤度並列計算部から尤度計算結果を出力させる音響尤度並列計算制御部と、
    前記音響尤度並列計算部から音響尤度計算結果を取得する音響尤度計算結果取得部と、
    を具備することを特徴とする音響尤度並列計算装置。
  2. 請求項1に記載の音響尤度並列計算装置において、
    前記音響尤度並列計算部には、一般的にはグラフィック処理を行うGPGPU(General Purpose Graphic Processing Unit)を使用することを特徴とする音響尤度並列計算装置。
  3. 請求項2に記載の音響尤度並列計算装置において、
    前記GPGPUのピクセルシェーダの並列演算をカスケード接続することで音響尤度計算を実行させることを特徴とする音響尤度並列計算装置。
  4. 請求項3に記載の音響尤度並列計算装置において、
    前記ピクセルシェーダは、データ記憶領域に確保された38次元の各々のμ、χに対し、下記の演算式(2)の第二項の(χ−μ)の演算を一括実行して38次元の結果zを算出させ、続けて、z、σに対し、演算式(2)の第二項(z×z)/(σ×σ)の演算を一括実行し、38次元の結果P’を算出させることを特徴とする音響尤度並列計算装置。
    Figure 2009086202
    ここに、μは平均、σは分散、χは互いに独立する38次元(38個)のパラメータである。
  5. 請求項3または4に記載の音響尤度並列計算装置において、
    前記ピクセルシェーダの同時ベクトル演算数を上げ、複数の音響モデルに対する演算(38次元×M)(Mは1より大きい正の整数)の処理を同時に実行することで速度向上を実現したことを特徴とする音響尤度並列計算装置。
  6. 請求項1ないし5のいずれかに記載の音響尤度並列計算装置において、
    各次元の計算処理結果を足し算する処理(Σ演算)については、CPUにて実行することを特徴とする音響尤度並列計算装置。
  7. GPGPUのピクセルシェーダの並列演算をカスケード接続することで音響尤度計算を実行させる音響尤度並列計算のプログラムであって、
    コンピュータに、
    データ記憶領域に確保された38次元の各々のμ、χに対し、下記の演算式(2)の第二項の(χ−μ)の演算を一括実行して38次元の結果zを算出させる機能と、
    z、σに対し、演算式(2)の第二項(z×z)/(σ×σ)の演算を一括実行し、38次元の結果P’を算出させる機能とを、前記ピクセルシェーダで実現させるためのプログラム。
    Figure 2009086202
    ここに、μは平均、σは分散、χは互いに独立する38次元(38個)のパラメータである。
JP2007254642A 2007-09-28 2007-09-28 音声認識における音響尤度並列計算装置及びそのプログラム Expired - Fee Related JP4854032B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007254642A JP4854032B2 (ja) 2007-09-28 2007-09-28 音声認識における音響尤度並列計算装置及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007254642A JP4854032B2 (ja) 2007-09-28 2007-09-28 音声認識における音響尤度並列計算装置及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2009086202A true JP2009086202A (ja) 2009-04-23
JP4854032B2 JP4854032B2 (ja) 2012-01-11

Family

ID=40659724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007254642A Expired - Fee Related JP4854032B2 (ja) 2007-09-28 2007-09-28 音声認識における音響尤度並列計算装置及びそのプログラム

Country Status (1)

Country Link
JP (1) JP4854032B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8786617B2 (en) 2010-10-28 2014-07-22 Mizuho-DL Financial Technology Co. Ltd. Parallelization of random number generation processing by employing GPU
CN104538033A (zh) * 2014-12-29 2015-04-22 江苏科技大学 基于嵌入式gpu系统的并行化语音识别系统及方法
KR20150065171A (ko) * 2012-09-07 2015-06-12 카네기 멜론 유니버시티 하이브리드 지피유/씨피유(gpu/cpu) 데이터 처리 방법
WO2020042902A1 (zh) * 2018-08-29 2020-03-05 深圳追一科技有限公司 语音识别的方法、系统和存储介质
US11545149B2 (en) 2019-08-20 2023-01-03 Samsung Electronics Co., Ltd. Electronic device and method for controlling the electronic device

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0535923A (ja) * 1991-02-28 1993-02-12 Toshiba Corp パターン識別回路
JP2006171185A (ja) * 2004-12-14 2006-06-29 Asahi Kasei Corp 音声認識装置および音声認識方法
JP2006201265A (ja) * 2005-01-18 2006-08-03 Matsushita Electric Ind Co Ltd 音声認識装置
JP2007005341A (ja) * 2005-06-21 2007-01-11 Advantest Corp 電子ビーム露光装置
JP2007078943A (ja) * 2005-09-13 2007-03-29 Hitachi Ltd 音響スコア計算プログラム
JP2008513825A (ja) * 2004-09-23 2008-05-01 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 話者に依存しない堅牢な音声認識システム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0535923A (ja) * 1991-02-28 1993-02-12 Toshiba Corp パターン識別回路
JP2008513825A (ja) * 2004-09-23 2008-05-01 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 話者に依存しない堅牢な音声認識システム
JP2006171185A (ja) * 2004-12-14 2006-06-29 Asahi Kasei Corp 音声認識装置および音声認識方法
JP2006201265A (ja) * 2005-01-18 2006-08-03 Matsushita Electric Ind Co Ltd 音声認識装置
JP2007005341A (ja) * 2005-06-21 2007-01-11 Advantest Corp 電子ビーム露光装置
JP2007078943A (ja) * 2005-09-13 2007-03-29 Hitachi Ltd 音響スコア計算プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8786617B2 (en) 2010-10-28 2014-07-22 Mizuho-DL Financial Technology Co. Ltd. Parallelization of random number generation processing by employing GPU
KR20150065171A (ko) * 2012-09-07 2015-06-12 카네기 멜론 유니버시티 하이브리드 지피유/씨피유(gpu/cpu) 데이터 처리 방법
JP2015529350A (ja) * 2012-09-07 2015-10-05 カーネギー メロン ユニバーシティCarnegie Mellon University ハイブリッドgpu/cpuデータ処理方法
KR101970041B1 (ko) * 2012-09-07 2019-04-18 카네기 멜론 유니버시티 하이브리드 지피유/씨피유(gpu/cpu) 데이터 처리 방법
CN104538033A (zh) * 2014-12-29 2015-04-22 江苏科技大学 基于嵌入式gpu系统的并行化语音识别系统及方法
WO2020042902A1 (zh) * 2018-08-29 2020-03-05 深圳追一科技有限公司 语音识别的方法、系统和存储介质
US11545149B2 (en) 2019-08-20 2023-01-03 Samsung Electronics Co., Ltd. Electronic device and method for controlling the electronic device
US11967325B2 (en) 2019-08-20 2024-04-23 Samsung Electronics Co., Ltd. Electronic device and method for controlling the electronic device

Also Published As

Publication number Publication date
JP4854032B2 (ja) 2012-01-11

Similar Documents

Publication Publication Date Title
US20220415452A1 (en) Method and apparatus for determining drug molecule property, and storage medium
CN110659725B (zh) 神经网络模型的压缩与加速方法、数据处理方法及装置
JP6138148B2 (ja) 演算論理ユニットアーキテクチャ
JP4854032B2 (ja) 音声認識における音響尤度並列計算装置及びそのプログラム
CN111476138B (zh) 建筑图纸构件识别模型构建方法、识别方法及相关设备
CN112509600A (zh) 模型的训练方法、装置、语音转换方法、设备及存储介质
CN104063714A (zh) 一种用于视频监控的、基于cuda并行计算与稀疏表示的快速人脸识别算法
US11574030B1 (en) Solving optimization problems using a hybrid computer system
Brugger et al. A quantitative cross-architecture study of morphological image processing on CPUs, GPUs, and FPGAs
US20210064928A1 (en) Information processing apparatus, method, and non-transitory storage medium
DE102022125316A1 (de) Unüberwachtes alignment für text-zu-sprache-synthese unter verwenden neuronaler netzwerke
US20150255090A1 (en) Method and apparatus for detecting speech segment
Khujayorov et al. Parallel signal processing based-on graphics processing units
Poli et al. Voice command recognition with dynamic time warping (dtw) using graphics processing units (gpu) with compute unified device architecture (cuda)
CN112508116A (zh) 分类器生成方法、装置、存储介质及电子设备
CN113780555B (zh) 基于数据增强的模型训练方法、装置、设备及存储介质
Chen et al. GPU-MEME: Using graphics hardware to accelerate motif finding in DNA sequences
CN116383634A (zh) 一种滑坡信号识别方法、装置和电子设备
Li et al. A laplacian pyramid based generative h&e stain augmentation network
CN113450764A (zh) 文本语音识别方法、装置、设备及存储介质
JP7468650B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
Ismagilov Performance Evaluation of the Rockchip Systems-on-Chip Through YOLOv4 Object Detection Model
WO2023220891A1 (en) Resolution-switchable segmentation networks
Shipton et al. Implementing WaveNet Using Intel® Stratix® 10 NX FPGA for Real-Time Speech Synthesis
WO2023220892A1 (en) Expanded neural network training layers for convolution

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111019

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111021

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141104

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees