JP2010096808A - 音響分析パラメータ生成方法とその装置と、プログラムと記録媒体 - Google Patents
音響分析パラメータ生成方法とその装置と、プログラムと記録媒体 Download PDFInfo
- Publication number
- JP2010096808A JP2010096808A JP2008264911A JP2008264911A JP2010096808A JP 2010096808 A JP2010096808 A JP 2010096808A JP 2008264911 A JP2008264911 A JP 2008264911A JP 2008264911 A JP2008264911 A JP 2008264911A JP 2010096808 A JP2010096808 A JP 2010096808A
- Authority
- JP
- Japan
- Prior art keywords
- acoustic
- adjustment parameter
- output probability
- acoustic analysis
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】この発明の音響分析パラメータ生成方法は、入力フレーム選択過程と、出力確率計算過程と、スコア計算過程と、スコア評価過程と、最適調整パラメータ候補記録過程と、調整パラメータ管理過程とを含む。入力フレーム選択過程においてスコア計算に用いる音声ディジタル信号の一部の区間を選択する。選択した区間の音響特徴量と音響モデルとを用いてフレーム毎の各状態の出力確率を計算し、最尤状態系列を所定フレーム数に渡って累積して出力確率スコアを求め、出力確率スコアが最大になる調整パラメータを、それ以降に使用する最適調整パラメータとして出力する。
【選択図】図8
Description
松本 弘「雑音環境下の音声認識手法」、情報科学技術フォーラムFIT2003,平成15年9月10日
この発明は、このような点に鑑みてなされたものであり、高速・省メモリ化できる音響分析パラメータ生成方法とその装置と、プログラムと記録媒体を提供することを目的とする。
態)、s2(第2状態)、s3(第3状態)を並べたものであり、状態の確率連鎖(状態遷移)としては、自己遷移a11、a22、a33と、次状態へのa12、a23、a34からなる。この状態遷移系列の中で最も尤度の高い音素モデルの組み合わせが、音声認識結果として出力される。
αi);μms,Ums)は平均ベクトルμms,共分散行列Umsから計算されるスコア、cmsは重み係数、Msは状態sに属する分布数である。
調整パラメータαiを持ち、例えば小さな値のパラメータから順に出力するものと仮定する。
μms,Umsとを入力として式(1)により出力確率を計算する(ステップS10)。スコア計算部11は、調整パラメータαiに対する出力確率スコアSCORE(αi)を式(2)で求める(ステップS110)。
(ステップS12)。最初の比較動作では、前回の出力確率スコアSCORE(αi-1
)が存在しない。よって、スコア評価部12は最適調整パラメータとして今回の調整パラメータαi(初回i=0なのでα0と等価)を最適調整パラメータ候補として出力する(
ステップS12のY)。2回目以降の比較動作では、前回の出力確率スコアSCORE(αi-1)と最新の出力確率スコアSCORE(αi)とを比較して、出力確率スコアの大きい方の調整パラメータを最適調整パラメータ候補として出力する(ステップS12のY又はN)。最適調整パラメータ候補記録部13は、スコア評価部12が出力する調整パラメータαiを最適調整パラメータ候補として記録する(ステップS130又はS131)。
高速化できる。
(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R
(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてフラッシュメモリー等を用いることができる。
Claims (10)
- 入力される音声ディジタル信号の一部の区間に対する音響特徴量を、フレーム単位で算出する入力フレーム選択過程と、
上記フレーム単位の音響特徴量と音響モデルとを入力として、上記フレーム毎の各状態の出力確率を計算する出力確率計算過程と、
上記出力確率の最尤状態系列を所定フレーム数に渡って累積して出力確率スコアを求めるスコア計算過程と、
上記出力確率スコアを評価して上記出力確率スコアが最大になる上記調整パラメータを最適調整パラメータ候補として出力するスコア評価過程と、
上記最適調整パラメータ候補を記録する最適調整パラメータ候補記録過程と、
上記調整パラメータを複数個備え上記所定フレーム数に対して上記調整パラメータをそれぞれ出力した後に上記最適調整パラメータ候補を上記調整パラメータとして出力する調整パラメータ管理過程と、
を含む音響分析パラメータ生成方法。 - 請求項1に記載した音響分析パラメータ生成方法において、
上記入力フレーム選択過程は、
入力される音声ディジタル信号の一部の区間を選択音声信号として出力する信号選択ステップと、
調整パラメータを用いて上記選択音声信号の音響特徴量をフレーム毎に算出する特徴量算出ステップと、
を含むことを特徴とする音響分析パラメータ生成方法。 - 請求項1に記載した音響分析パラメータ生成方法において、
上記入力フレーム選択過程は、
調整パラメータを用いて上記音声ディジタル信号のフレーム毎に音響特徴量を算出する特徴量算出ステップと、
上記音響特徴量の一部を選択して出力する特徴量選択ステップと、
を含むことを特徴とする音響分析パラメータ生成方法。 - 請求項1乃至3の何れかに記載した音響分析パラメータ生成方法において、
上記入力フレーム選択過程は、予め定められた上記区間を選択することを特徴とする音響分析パラメータ生成方法。 - 請求項1乃至3の何れかに記載した音響分析パラメータ生成方法において、
上記入力フレーム選択過程は、予め定められた割合で上記区間を選択することを特徴とする音響分析パラメータ生成方法。 - 請求項1乃至5の何れかに記載した音響分析パラメータ生成方法において、
上記入力フレーム選択過程は、上記入力される音声ディジタル信号の先頭から上記区間を選択する過程であることを特徴とする音響分析パラメータ生成方法。 - 請求項1乃至5の何れかに記載した音響分析パラメータ生成方法において、
上記入力フレーム選択過程は、上記入力される音声ディジタル信号から等間隔に上記区間を選択する過程であることを特徴とする音響分析パラメータ生成方法。 - 入力される音声ディジタル信号の一部の区間に対する音響特徴量をフレーム単位で算出する入力フレーム選択部と、
フレーム単位の音響特徴量と音響モデルとを入力として、上記フレーム毎の各状態の出力確率を計算する出力確率計算部と、
上記出力確率の最尤状態系列を所定フレーム数に渡って累積して出力確率スコアを求めるスコア計算部と、
上記出力確率スコアを評価して上記出力確率スコアが最大になる上記調整パラメータを最適調整パラメータ候補として出力するスコア評価部と、
上記最適調整パラメータ候補を記録する最適調整パラメータ候補記録部と、
上記調整パラメータを複数個備え上記所定フレーム数に対して上記調整パラメータをそれぞれ出力した後に上記最適調整パラメータ候補を上記調整パラメータとして出力する調整パラメータ管理部と、
を具備する音響分析パラメータ生成装置。 - 請求項1乃至7の何れかに記載した音響分析パラメータ生成方法をコンピュータに機能させるための方法プログラム。
- 請求項9に記載した何れかの方法プログラムを記録したコンピュータで読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008264911A JP5166195B2 (ja) | 2008-10-14 | 2008-10-14 | 音響分析パラメータ生成方法とその装置と、プログラムと記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008264911A JP5166195B2 (ja) | 2008-10-14 | 2008-10-14 | 音響分析パラメータ生成方法とその装置と、プログラムと記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010096808A true JP2010096808A (ja) | 2010-04-30 |
JP5166195B2 JP5166195B2 (ja) | 2013-03-21 |
Family
ID=42258560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008264911A Expired - Fee Related JP5166195B2 (ja) | 2008-10-14 | 2008-10-14 | 音響分析パラメータ生成方法とその装置と、プログラムと記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5166195B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10074361B2 (en) | 2015-10-06 | 2018-09-11 | Samsung Electronics Co., Ltd. | Speech recognition apparatus and method with acoustic modelling |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170290669A1 (en) | 2016-04-11 | 2017-10-12 | Zafer Termanini | System and method for side insertion of a bicondylar mini knee implant |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06214596A (ja) * | 1993-01-14 | 1994-08-05 | Ricoh Co Ltd | 音声認識装置および話者適応化方法 |
JP2001255886A (ja) * | 2000-03-09 | 2001-09-21 | Matsushita Electric Ind Co Ltd | 音声認識方法および音声認識装置 |
JP2008233782A (ja) * | 2007-03-23 | 2008-10-02 | Kddi Corp | パタンマッチング装置、パタンマッチングプログラム、およびパタンマッチング方法 |
JP2009300837A (ja) * | 2008-06-16 | 2009-12-24 | Nippon Telegr & Teleph Corp <Ntt> | 音響分析パラメータ生成装置とその方法と、それを用いた音声認識装置と、プログラムと記録媒体 |
-
2008
- 2008-10-14 JP JP2008264911A patent/JP5166195B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06214596A (ja) * | 1993-01-14 | 1994-08-05 | Ricoh Co Ltd | 音声認識装置および話者適応化方法 |
JP2001255886A (ja) * | 2000-03-09 | 2001-09-21 | Matsushita Electric Ind Co Ltd | 音声認識方法および音声認識装置 |
JP2008233782A (ja) * | 2007-03-23 | 2008-10-02 | Kddi Corp | パタンマッチング装置、パタンマッチングプログラム、およびパタンマッチング方法 |
JP2009300837A (ja) * | 2008-06-16 | 2009-12-24 | Nippon Telegr & Teleph Corp <Ntt> | 音響分析パラメータ生成装置とその方法と、それを用いた音声認識装置と、プログラムと記録媒体 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10074361B2 (en) | 2015-10-06 | 2018-09-11 | Samsung Electronics Co., Ltd. | Speech recognition apparatus and method with acoustic modelling |
US10607603B2 (en) | 2015-10-06 | 2020-03-31 | Samsung Electronics Co., Ltd. | Speech recognition apparatus and method with acoustic modelling |
US11176926B2 (en) | 2015-10-06 | 2021-11-16 | Samsung Electronics Co., Ltd. | Speech recognition apparatus and method with acoustic modelling |
Also Published As
Publication number | Publication date |
---|---|
JP5166195B2 (ja) | 2013-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10297247B2 (en) | Phonotactic-based speech recognition and re-synthesis | |
WO2007046267A1 (ja) | 音声判別システム、音声判別方法及び音声判別用プログラム | |
JP7191792B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
WO2019107170A1 (ja) | 緊急度推定装置、緊急度推定方法、プログラム | |
JPWO2018163279A1 (ja) | 音声処理装置、音声処理方法、および音声処理プログラム | |
JP2009128490A (ja) | 学習データ選択装置、学習データ選択方法、プログラムおよび記録媒体、音響モデル作成装置、音響モデル作成方法、プログラムおよび記録媒体 | |
JP5166195B2 (ja) | 音響分析パラメータ生成方法とその装置と、プログラムと記録媒体 | |
JP5852550B2 (ja) | 音響モデル生成装置とその方法とプログラム | |
JP5427140B2 (ja) | 音声認識方法、音声認識装置及び音声認識プログラム | |
JP4922377B2 (ja) | 音声認識装置とその方法と、プログラム | |
JP4843646B2 (ja) | 音声認識装置とその方法と、プログラムと記録媒体 | |
JP4729078B2 (ja) | 音声認識装置とその方法と、プログラムとその記録媒体 | |
JP4852129B2 (ja) | 音声認識装置とその方法と、プログラム | |
JP5961530B2 (ja) | 音響モデル生成装置とその方法とプログラム | |
JP5722295B2 (ja) | 音響モデル生成方法と音声合成方法とそれらの装置とプログラム | |
JP6599408B2 (ja) | 音響信号処理装置、方法及びプログラム | |
JP4798606B2 (ja) | 音声認識装置、およびプログラム | |
JP4981850B2 (ja) | 音声認識装置とその方法と、プログラムと記録媒体 | |
JP4962930B2 (ja) | 発音評定装置、およびプログラム | |
JP6526602B2 (ja) | 音声認識装置、その方法、及びプログラム | |
JP5089651B2 (ja) | 音声認識装置及び音響モデル作成装置とそれらの方法と、プログラムと記録媒体 | |
JP5369079B2 (ja) | 音響モデル作成方法とその装置とプログラム | |
JP5066668B2 (ja) | 音声認識装置、およびプログラム | |
JP5235849B2 (ja) | 音声認識装置とその方法と、プログラム | |
JP2019028301A (ja) | 音響信号処理装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110106 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121220 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151228 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5166195 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |