JP2009086202A - 音声認識における音響尤度並列計算装置及びそのプログラム - Google Patents
音声認識における音響尤度並列計算装置及びそのプログラム Download PDFInfo
- Publication number
- JP2009086202A JP2009086202A JP2007254642A JP2007254642A JP2009086202A JP 2009086202 A JP2009086202 A JP 2009086202A JP 2007254642 A JP2007254642 A JP 2007254642A JP 2007254642 A JP2007254642 A JP 2007254642A JP 2009086202 A JP2009086202 A JP 2009086202A
- Authority
- JP
- Japan
- Prior art keywords
- acoustic
- calculation
- likelihood
- parallel
- acoustic likelihood
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】音響尤度計算は、音響特徴量保持部14と音響尤度並列計算部15で並列計算により行われる。該音響特徴量保持部14と音響尤度並列計算部15は、それぞれGPUメモリとGPUに相当し、該音響尤度計算は、GPGPUのピクセルシェーダの並列演算をカスケード接続することにより行われる。前記GPGPUのピクセルシェーダでは、データ記憶領域に確保された38次元の各々のμ、χに対し、演算式(2)第二項(χ−μ)の演算を一括実行して38次元の結果zを算出させ、該ピクセルシェーダにおいて、続けて、z、σに対し、演算式(2)第二項(z×z)/(σ×σ)の演算を一括実行し、38次元の結果P’を算出させる。そして、該P’を、38個加算することにより、音響特徴量の合計尤度が算出される。
【選択図】図2
Description
〈初期設定フェーズ〉
〈並列演算処理フェーズ〉
〈終了フェーズ〉
Claims (7)
- 入力音声を分析し音響特徴量に変換する音響特徴量変換部と、
音響尤度計算の並列実行手順を登録する音響尤度並列実行手順登録部と、
入力音声の音響特徴量と音響モデルの状態を保持する音響特徴量保持部と、
前記音響尤度並列実行手順登録部によって登録された音響尤度並列実行手順に従い、入力音声の音響特徴量と音響モデルの状態を用いて尤度計算を実行する音響尤度並列計算部と、
前記音響尤度並列計算部から尤度計算結果を出力させる音響尤度並列計算制御部と、
前記音響尤度並列計算部から音響尤度計算結果を取得する音響尤度計算結果取得部と、
を具備することを特徴とする音響尤度並列計算装置。 - 請求項1に記載の音響尤度並列計算装置において、
前記音響尤度並列計算部には、一般的にはグラフィック処理を行うGPGPU(General Purpose Graphic Processing Unit)を使用することを特徴とする音響尤度並列計算装置。 - 請求項2に記載の音響尤度並列計算装置において、
前記GPGPUのピクセルシェーダの並列演算をカスケード接続することで音響尤度計算を実行させることを特徴とする音響尤度並列計算装置。 - 請求項3または4に記載の音響尤度並列計算装置において、
前記ピクセルシェーダの同時ベクトル演算数を上げ、複数の音響モデルに対する演算(38次元×M)(Mは1より大きい正の整数)の処理を同時に実行することで速度向上を実現したことを特徴とする音響尤度並列計算装置。 - 請求項1ないし5のいずれかに記載の音響尤度並列計算装置において、
各次元の計算処理結果を足し算する処理(Σ演算)については、CPUにて実行することを特徴とする音響尤度並列計算装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007254642A JP4854032B2 (ja) | 2007-09-28 | 2007-09-28 | 音声認識における音響尤度並列計算装置及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007254642A JP4854032B2 (ja) | 2007-09-28 | 2007-09-28 | 音声認識における音響尤度並列計算装置及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009086202A true JP2009086202A (ja) | 2009-04-23 |
JP4854032B2 JP4854032B2 (ja) | 2012-01-11 |
Family
ID=40659724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007254642A Expired - Fee Related JP4854032B2 (ja) | 2007-09-28 | 2007-09-28 | 音声認識における音響尤度並列計算装置及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4854032B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8786617B2 (en) | 2010-10-28 | 2014-07-22 | Mizuho-DL Financial Technology Co. Ltd. | Parallelization of random number generation processing by employing GPU |
CN104538033A (zh) * | 2014-12-29 | 2015-04-22 | 江苏科技大学 | 基于嵌入式gpu系统的并行化语音识别系统及方法 |
KR20150065171A (ko) * | 2012-09-07 | 2015-06-12 | 카네기 멜론 유니버시티 | 하이브리드 지피유/씨피유(gpu/cpu) 데이터 처리 방법 |
WO2020042902A1 (zh) * | 2018-08-29 | 2020-03-05 | 深圳追一科技有限公司 | 语音识别的方法、系统和存储介质 |
US11545149B2 (en) | 2019-08-20 | 2023-01-03 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the electronic device |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0535923A (ja) * | 1991-02-28 | 1993-02-12 | Toshiba Corp | パターン識別回路 |
JP2006171185A (ja) * | 2004-12-14 | 2006-06-29 | Asahi Kasei Corp | 音声認識装置および音声認識方法 |
JP2006201265A (ja) * | 2005-01-18 | 2006-08-03 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JP2007005341A (ja) * | 2005-06-21 | 2007-01-11 | Advantest Corp | 電子ビーム露光装置 |
JP2007078943A (ja) * | 2005-09-13 | 2007-03-29 | Hitachi Ltd | 音響スコア計算プログラム |
JP2008513825A (ja) * | 2004-09-23 | 2008-05-01 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 話者に依存しない堅牢な音声認識システム |
-
2007
- 2007-09-28 JP JP2007254642A patent/JP4854032B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0535923A (ja) * | 1991-02-28 | 1993-02-12 | Toshiba Corp | パターン識別回路 |
JP2008513825A (ja) * | 2004-09-23 | 2008-05-01 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 話者に依存しない堅牢な音声認識システム |
JP2006171185A (ja) * | 2004-12-14 | 2006-06-29 | Asahi Kasei Corp | 音声認識装置および音声認識方法 |
JP2006201265A (ja) * | 2005-01-18 | 2006-08-03 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JP2007005341A (ja) * | 2005-06-21 | 2007-01-11 | Advantest Corp | 電子ビーム露光装置 |
JP2007078943A (ja) * | 2005-09-13 | 2007-03-29 | Hitachi Ltd | 音響スコア計算プログラム |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8786617B2 (en) | 2010-10-28 | 2014-07-22 | Mizuho-DL Financial Technology Co. Ltd. | Parallelization of random number generation processing by employing GPU |
KR20150065171A (ko) * | 2012-09-07 | 2015-06-12 | 카네기 멜론 유니버시티 | 하이브리드 지피유/씨피유(gpu/cpu) 데이터 처리 방법 |
JP2015529350A (ja) * | 2012-09-07 | 2015-10-05 | カーネギー メロン ユニバーシティCarnegie Mellon University | ハイブリッドgpu/cpuデータ処理方法 |
KR101970041B1 (ko) * | 2012-09-07 | 2019-04-18 | 카네기 멜론 유니버시티 | 하이브리드 지피유/씨피유(gpu/cpu) 데이터 처리 방법 |
CN104538033A (zh) * | 2014-12-29 | 2015-04-22 | 江苏科技大学 | 基于嵌入式gpu系统的并行化语音识别系统及方法 |
WO2020042902A1 (zh) * | 2018-08-29 | 2020-03-05 | 深圳追一科技有限公司 | 语音识别的方法、系统和存储介质 |
US11545149B2 (en) | 2019-08-20 | 2023-01-03 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the electronic device |
US11967325B2 (en) | 2019-08-20 | 2024-04-23 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the electronic device |
Also Published As
Publication number | Publication date |
---|---|
JP4854032B2 (ja) | 2012-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220415452A1 (en) | Method and apparatus for determining drug molecule property, and storage medium | |
CN110659725B (zh) | 神经网络模型的压缩与加速方法、数据处理方法及装置 | |
JP6138148B2 (ja) | 演算論理ユニットアーキテクチャ | |
JP4854032B2 (ja) | 音声認識における音響尤度並列計算装置及びそのプログラム | |
CN111476138B (zh) | 建筑图纸构件识别模型构建方法、识别方法及相关设备 | |
CN112509600A (zh) | 模型的训练方法、装置、语音转换方法、设备及存储介质 | |
CN104063714A (zh) | 一种用于视频监控的、基于cuda并行计算与稀疏表示的快速人脸识别算法 | |
US11574030B1 (en) | Solving optimization problems using a hybrid computer system | |
Brugger et al. | A quantitative cross-architecture study of morphological image processing on CPUs, GPUs, and FPGAs | |
US20210064928A1 (en) | Information processing apparatus, method, and non-transitory storage medium | |
DE102022125316A1 (de) | Unüberwachtes alignment für text-zu-sprache-synthese unter verwenden neuronaler netzwerke | |
US20150255090A1 (en) | Method and apparatus for detecting speech segment | |
Khujayorov et al. | Parallel signal processing based-on graphics processing units | |
Poli et al. | Voice command recognition with dynamic time warping (dtw) using graphics processing units (gpu) with compute unified device architecture (cuda) | |
CN112508116A (zh) | 分类器生成方法、装置、存储介质及电子设备 | |
CN113780555B (zh) | 基于数据增强的模型训练方法、装置、设备及存储介质 | |
Chen et al. | GPU-MEME: Using graphics hardware to accelerate motif finding in DNA sequences | |
CN116383634A (zh) | 一种滑坡信号识别方法、装置和电子设备 | |
Li et al. | A laplacian pyramid based generative h&e stain augmentation network | |
CN113450764A (zh) | 文本语音识别方法、装置、设备及存储介质 | |
JP7468650B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
Ismagilov | Performance Evaluation of the Rockchip Systems-on-Chip Through YOLOv4 Object Detection Model | |
WO2023220891A1 (en) | Resolution-switchable segmentation networks | |
Shipton et al. | Implementing WaveNet Using Intel® Stratix® 10 NX FPGA for Real-Time Speech Synthesis | |
WO2023220892A1 (en) | Expanded neural network training layers for convolution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110610 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111019 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111021 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141104 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |