JP2015141253A - 音声認識装置、及びプログラム - Google Patents
音声認識装置、及びプログラム Download PDFInfo
- Publication number
- JP2015141253A JP2015141253A JP2014012766A JP2014012766A JP2015141253A JP 2015141253 A JP2015141253 A JP 2015141253A JP 2014012766 A JP2014012766 A JP 2014012766A JP 2014012766 A JP2014012766 A JP 2014012766A JP 2015141253 A JP2015141253 A JP 2015141253A
- Authority
- JP
- Japan
- Prior art keywords
- word
- speech recognition
- error correction
- model
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】音声認識装置1は、単語及びクラスに基づく統計的言語モデルを学習データから学習し、クラスに属する単語のリストを音声認識対象に応じて書き換える。音声認識装置1は、統計的音響モデルと、書き換え後の統計的言語モデルと、単語及びクラスに基づく言語的な特徴により音声認識における単語の誤り傾向を修正するための誤り修正モデルとを用いて音声データを音声認識する。音声認識装置1は、音声認識結果をユーザー入力により修正して得た正解単語列に含まれる各単語を整列させる。音声認識装置1は、音声データの入力の度に、音声認識結果と整列させた正解単語列とのそれぞれに含まれる単語及びクラスに基づく言語的な特徴から単語誤りの傾向を学習し、学習した単語誤りの傾向に応じて誤り修正モデルを逐次更新する。
【選択図】図2
Description
この発明によれば、音声認識装置は、音声データと正解単語列とを含む学習データから単語及び単語のクラスに基づく統計的言語モデルを学習する。音声認識装置は、学習した統計的言語モデルに含まれるクラスに属する単語のリストを、音声認識対象に応じた単語のリストに書き換える。音声認識装置は、入力された音声データを、統計的音響モデルと、統計的言語モデルと、単語及びクラスに基づく言語的な特徴により音声認識における単語の誤り傾向を修正するための誤り修正モデルとを用いて音声認識する。音声認識装置は、キーボード等を用いたユーザーの入力に従って音声認識結果を修正して正解単語列を得ると、正解単語列に含まれる各単語を音声データに基づいて時刻順に整列する。音声認識装置は、音声データが入力されるたびに逐次、音声認識結果と整列させた正解単語列とのそれぞれに含まれる単語及び単語が属するクラスに基づく言語的な特徴から単語誤りの傾向を学習し、学習した単語誤りの傾向に応じて現在の誤り修正モデルを更新する。
これにより、音声認識装置は、統計的言語モデルの学習に用いた学習データの語彙と音声認識させたい語彙とが異なる場合でも、音声認識対象に適合した誤り修正モデルを逐次学習し、音声認識に適用することができる。
この発明によれば、音声認識装置は、音声認識結果とその音声認識結果に対応する整列させた正解単語列とのそれぞれにおける、単語のクラスとその単語に隣接する単語列との共起、あるいは、クラスに属する所定の単語の出現数を用いて単語の誤り傾向を学習する。音声認識装置は、学習した単語の誤り傾向に応じて現在の誤り修正モデルを更新する。
これにより、音声認識装置は、音声認識結果と整列させた正解単語列とのそれぞれについて、単語が属するクラスと当該単語に隣接する単語列との共起や、クラスに属する所定の単語の出現数を計数することによって、音声認識における単語の誤り傾向を効率的に学習し、学習結果から誤り修正モデルを更新することができる。
この発明によれば、誤り修正モデルは、音声認識結果の音響スコア及び言語スコアにより算出される音声認識のスコアを、重み付けされた言語的な特徴により修正する式であり、音声認識装置は、音声認識結果と整列させた正解単語列とに含まれる言語的な特徴から単語誤りの傾向を学習し、誤り修正モデルに用いる言語的な特徴とその重みとを学習する。
これにより、音声認識装置は、音声認識の認識誤り傾向を効率的に学習し、誤り修正モデルにおける言語的な特徴の重みを更新することができる。
この発明によれば、音声認識装置は、音声認識結果に含まれる単語誤り数と、誤り修正モデルにより修正された音声認識結果及び正解単語列の音声認識のスコアから得られる音声認識結果の事後確率とを用いて定められる評価関数により算出した評価値が、正解単語列の事後確率が最大であることを示す評価値、あるいは、音声認識結果の期待される認識誤りが最小であることを示す評価値となるように言語的な特徴の重みを決定し、誤り修正モデルを更新する。
これにより、音声認識装置は、言語的な特徴の重みを効率的に学習し、誤り修正モデルを更新することができる。
音声認識では、学習データの語彙と音声認識の対象の音声(発話内容)の語彙とが完全に一致することは少ない。例えば、スポーツ中継の音声を音声認識対象とする場合、学習データ中に含まれる選手の名前の中に、スポーツ中継の対象となる試合に出場する選手の名前が含まれていないことがある。
そこで、本発明の一実施形態の音声認識装置は、事前に定義した単語クラスとクラス言語モデルを用いて、対象となる放送番組を音声認識しながら逐次的に誤り修正モデルを学習し、音声認識に適用する。
続いて、本実施形態の音声認識装置に適用される誤り修正モデルの学習アルゴリズムを説明する。
本実施形態の音声認識装置は、音声認識において、少量の学習データもしくは断片的な情報しか得られない場合でも、単語の属性に応じたクラスに基づく誤り修正モデルを逐次的かつ統計的に頑健に学習し、音声認識に適用する。
文献「北 研二,”確率的言語モデル”,東京大学出版会,1999年,p.72−74」によれば、単語の属性に応じたクラスが与えられたときのn−gram言語モデル(クラス言語モデル)は一般に、以下の式(1)により表される。
ベイズの定理によれば、音声入力xが与えられたとき、この音声入力xに対して尤もらしい単語列w^(「^」は、「ハット」を表す。)は、以下の式(2)により求めることができる。
P(x|w)は、単語列wに対する音響的な尤もらしさを示す尤度であり、そのスコアは隠れマルコフモデル(Hidden Markov Model、HMM)及びガウス混合分布(Gaussian Mixture Model、GMM)に代表される統計的音響モデルに基づいて計算される。
P(w)は、単語列wに対する言語的な尤もらしさであり、そのスコアは、単語またはクラスn−gram言語モデル等の統計的言語モデルにより計算される。なお、単語またはクラスn−gram言語モデルは、N項の単語またはN項の単語及びクラスの連鎖(Nは、例えば1、2、または3である。)の統計に基づいて、(N−1)項の単語または(N−1)項の単語及びクラスの履歴から次の単語またはクラスの生起確率を与えるモデルである。
従来法における素性関数fiの言語的ルールである素性の例として、以下の(1a)、(1b)に示すような、単語の共起関係に基づくものがある。
(1b)単語列wに含まれる連続しない単語2つ組(u,v)の数
(2b)単語列wに含まれる連続する単語・クラスの3つ組(u,v,o(z))の数
また、音声認識することにより、これらのクラスは実現値として特定の単語のインスタンスを持つこととなるため、音声認識結果とその修正結果である正解単語列からは、従来の単語3つ組による素性関数fiを得ることができる。同図の例では、クラス<選手>のインスタンスは、音声認識結果においては単語「中村」であり、正解単語列では単語「中山」である。そのため、単語3つ組(中村,が,ゴール)、(中山,が,ゴール)を素性とする素性関数fiが用いられる。
さらに、クラスから特定の単語のインスタンスが生起する関係が、新たな素性関数hkとして定義される。例えば、クラス<選手>に属する単語「中村」が単語列に出現する数、クラス<選手>に属する単語「中山」が単語列に出現する数を素性とする素性関数hkが用いられる。
本実施形態の音声認識装置は、これらの素性関数fi、gj、hkを用いて誤り修正モデルを学習するが、この学習を、音声認識結果とその修正結果を用いて逐次的に行う。
図2は、本発明の一実施形態による音声認識装置1の構成を示す機能ブロック図であり、本実施形態と関係する機能ブロックのみ抽出して示してある。
音声認識装置1は、コンピュータ装置により実現される。同図に示すように、音声認識装置1は、音声言語資源記憶部11、音響モデル記憶部12、言語モデル記憶部13、誤り修正モデル記憶部14、クラスモデル作成部21、音声認識部22、誤り修正部23、整列部24、特徴量抽出部25、及び誤り修正モデル学習部26を備えて構成される。
以下に、本実施形態の、音声認識装置1の各部の処理について詳細を述べる。
図3は、音声認識装置1の処理手順を示す図である。同図に示す一連の処理は、音声認識装置1に、音声認識対象の放送番組の音声データD3が入力される度に逐次的に行うものとする。
図3の処理を実行する前にまず、音声言語資源記憶部11は、放送から収集された放送音声及び字幕データD1を蓄積する。この放送音声及び字幕データD1が示す放送字幕などのテキストデータに含まれる単語のうち、クラスに属する単語には、クラスを特定する情報を予め付加しておく。例えば、放送字幕などのテキストに含まれる人名などの固有名詞に、クラスを特定する情報を付与しておく。クラスを特定する情報として例えば、先の例のような“選手名”や“チーム名”といったクラス名を用いる。これらのクラス分類は、音声認識対象となる音声の種類により異なるため、テキストデータを形態素解析した際に得られる品詞に基づくなどして、タスクに応じてユーザーが決定し、付与する。
音声認識部22は、音響モデル記憶部12に記憶されている統計的音響モデル、言語モデル記憶部13に記憶されているクラス言語モデル、及び誤り修正モデル記憶部14に記憶されている式(6)に示すような誤り修正モデルを用いて、音声データD3の音声認識を行う。この際、音声認識部22は、小休止をはさんだ音声区間ごとに音声データD3を分割し、分割した音声区間を1つの処理単位である音声入力xとして音声認識する。このとき、音声認識部22は、クラス言語モデルが示す各クラスに属する単語の情報を用いて、音声認識結果に含まれる単語が属するクラスを得る。また、音声認識部22は、音声認識結果whypのスコアを、式(6)に示す誤り修正モデルのargmaxが対象としている評価関数を用いて算出する。つまり、音声認識部22は、以下の式(14)に示すように、音声認識結果whypについて{fam(x|whyp)+λlmflm(whyp)}により算出される音声認識のスコアを、誤り修正スコアにより修正した(対数)スコアs(whyp)を算出する。なお、誤り修正スコアは、{Σiλifi(whyp)+Σjμjgj(whyp)+Σkνkhk(whyp)}に相当する。
誤り修正部23は、音声認識部22から出力された音声認識結果データD4が示す音声認識結果whypのうち、もっともらしさの順位が最も高い音声認識結果を、キーボード等の図示しない入力手段によりユーザーが入力した指示に従って修正する。誤り修正部23は、修正結果である正解単語列wrefを設定した正解単語列データD5を出力する。正解単語列データD5は、放送局内で放送波に重畳され、放送字幕データD6として放送される。
整列部24は、既存の技術により、正解単語列データD5が示す正解単語列wrefと、この正解単語列wrefに対応する音声入力xを用いて、正解単語列wrefを構成する各単語が発話された時刻(単語の開始・終了区間)を同定して整列する。この際、整列部24は、整列させた各単語について、音響モデル記憶部12に記憶されている統計的音響モデルによる音響スコア、及び、言語モデル記憶部13に記憶されているクラス言語モデルによる言語スコアを算出する。さらに、整列部24は、整列させた各単語について誤り修正スコアを算出する。具体的には、整列部24は、上述した式(14)の{Σiλifi(whyp)+Σjμjgj(whyp)+Σkνkhk(whyp)}の部分に、音声認識結果whypに代えて正解単語列wrefの各単語を用いて誤り修正スコアを算出する。このとき、整列部24は、は、クラス言語モデルが示す各クラスに属する単語の情報を用いて、正解単語列wrefに含まれる単語が属するクラスを得る。整列部24は、整列させた単語からなる正解単語列wrefに各単語の音響スコア、言語スコア、及び誤り修正スコアを付加した整列済み正解単語列データD7を出力する。
特徴量抽出部25は、音声認識結果データD4が示す音声認識結果whypと、整列済み正解単語列データD7が示す整列済みの正解単語列wrefとから、言語的特徴に基づく素性関数を抽出する。本実施形態では、特徴量抽出部25は、以下のルールを素性とする素性関数を定義する。
(1−2)音声認識結果whypに含まれる連続する単語2つ組(u,v)、単語3つ組(u,f,z)の数
(2−2)音声認識結果whypに含まれる連続する単語・クラスの2つ組(u,o(v))、3つ組(u,v,o(z))の数
加えて、特徴量抽出部25は、以下の(3−1)、(3−2)に示すルールを素性とする素性関数hkを定義する。
(3−2)音声認識結果whypに含まれるクラスo(u)に属する単語uの数
誤り修正モデル学習部26は、音声認識結果データD4が示す音声認識結果whyp、整列済み正解単語列データD7が示す整列済みの正解単語列wref、および、素性関数データD8が示す素性関数fi、gj、hkを利用して誤り修正モデルを更新(学習)する。
本実施形態によれば、音声認識装置1は、クラスモデルによる素性を用いることで、学習データ中に認識させたい単語が出現しなくても、頑健な誤り修正モデルを構成可能となり、従来よりも認識誤りが削減される。
なお、上述の音声認識装置1は、内部にコンピュータシステムを有している。そして、音声認識装置1の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
Claims (5)
- 統計的音響モデルを記憶する音響モデル記憶部と、
統計的言語モデルを記憶する言語モデル記憶部と、
単語及び単語が属するクラスに基づく言語的な特徴により音声認識における単語の誤り傾向を修正するための誤り修正モデルを記憶する誤り修正モデル記憶部と、
音声データと正解単語列とを含む学習データから単語及び単語のクラスに基づく統計的言語モデルを学習し、学習した前記統計的言語モデルに含まれるクラスに属する単語のリストを音声認識対象に応じて書き換えて前記言語モデル記憶部に書き込むクラスモデル作成部と、
入力された音声データを、前記音響モデル記憶部が記憶している前記統計的音響モデル、前記言語モデル記憶部が記憶している前記統計的言語モデル、及び前記誤り修正モデル記憶部が記憶している前記誤り修正モデルを用いて音声認識し、音声認識の結果得られた単語列である音声認識結果を出力する音声認識部と、
前記音声認識部から出力された前記音声認識結果をユーザーの入力に従って修正し、正解単語列を生成する誤り修正部と、
前記誤り修正部が生成した前記正解単語列に含まれる各単語を前記音声データに基づいて時刻順に整列する整列部と、
前記音声データが入力されるたびに、前記音声認識部により前記音声データから得られた前記音声認識結果と前記整列部が整列させた前記正解単語列とのそれぞれに含まれる単語及び単語が属するクラスに基づく言語的な特徴から単語誤りの傾向を学習し、学習した単語誤りの傾向に応じて前記誤り修正モデル記憶部に記憶されている前記誤り修正モデルを逐次更新する誤り修正モデル学習部と、
を備えることを特徴とする音声認識装置。 - 前記言語的な特徴は、単語が属する前記クラスと当該単語に隣接する単語列との共起、あるいは、前記クラスに属する所定の単語の出現数である、
ことを特徴とする請求項1に記載の音声認識装置。 - 前記誤り修正モデルは、前記統計的音響モデルに基づいて得られる前記音声認識結果の音響スコアと、前記統計的言語モデルに基づいて得られる前記音声認識結果の言語スコアとにより算出される前記音声認識結果の音声認識のスコアを、重み付けされた前記言語的な特徴により修正する式である、
ことを特徴とする請求項1または請求項2に記載の音声認識装置。 - 前記誤り修正モデル学習部は、前記正解単語列との比較により得られる前記音声認識結果の単語誤り数と、前記誤り修正モデルにより修正された前記音声認識結果及び前記正解単語列の音声認識のスコアから得られる前記音声認識結果の事後確率とを用いて定められる評価関数により算出される評価値に基づいて、前記正解単語列の事後確率が最大、あるいは、前記音声認識結果の認識誤りが最小となるように前記言語的な特徴の重みを統計的に算出する、
ことを特徴とする請求項3に記載の音声認識装置。 - コンピュータを、
統計的音響モデルを記憶する音響モデル記憶手段と、
統計的言語モデルを記憶する言語モデル記憶手段と、
単語及び単語が属するクラスに基づく言語的な特徴により音声認識における単語の誤り傾向を修正するための誤り修正モデルを記憶する誤り修正モデル記憶手段と、
音声データと正解単語列とを含む学習データから単語及び単語のクラスに基づく統計的言語モデルを学習し、学習した前記統計的言語モデルに含まれるクラスに属する単語のリストを音声認識対象に応じて書き換えて前記言語モデル記憶手段に書き込むクラスモデル作成手段と、
入力された音声データを、前記音響モデル記憶手段が記憶している前記統計的音響モデル、前記言語モデル記憶手段が記憶している前記統計的言語モデル、及び前記誤り修正モデル記憶手段が記憶している前記誤り修正モデルを用いて音声認識し、音声認識の結果得られた単語列である音声認識結果を出力する音声認識手段と、
前記音声認識手段から出力された前記音声認識結果をユーザーの入力に従って修正し、正解単語列を生成する誤り修正手段と、
前記誤り修正手段が生成した前記正解単語列に含まれる各単語を前記音声データに基づいて時刻順に整列する整列手段と、
前記音声データが入力されるたびに、前記音声認識手段により前記音声データから得られた前記音声認識結果と前記整列手段が整列させた前記正解単語列とのそれぞれに含まれる単語及び単語が属するクラスに基づく言語的な特徴から単語誤りの傾向を学習し、学習した単語誤りの傾向に応じて前記誤り修正モデル記憶手段に記憶されている前記誤り修正モデルを逐次更新する誤り修正モデル学習手段と、
を具備する音声認識装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014012766A JP6366166B2 (ja) | 2014-01-27 | 2014-01-27 | 音声認識装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014012766A JP6366166B2 (ja) | 2014-01-27 | 2014-01-27 | 音声認識装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015141253A true JP2015141253A (ja) | 2015-08-03 |
JP6366166B2 JP6366166B2 (ja) | 2018-08-01 |
Family
ID=53771662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014012766A Active JP6366166B2 (ja) | 2014-01-27 | 2014-01-27 | 音声認識装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6366166B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10276151B2 (en) | 2016-06-29 | 2019-04-30 | Samsung Electronics Co., Ltd. | Electronic apparatus and method for controlling the electronic apparatus |
CN111652130A (zh) * | 2020-06-02 | 2020-09-11 | 上海语识信息技术有限公司 | 一种非特定字体的数字、符号和字母组的识别方法 |
US20210090576A1 (en) * | 2019-09-19 | 2021-03-25 | Giving Tech Labs, LLC | Real Time and Delayed Voice State Analyzer and Coach |
CN113168836A (zh) * | 2018-09-27 | 2021-07-23 | 株式会社OPTiM | 计算机系统、语音识别方法以及程序 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008058341A (ja) * | 2006-08-29 | 2008-03-13 | Nippon Hoso Kyokai <Nhk> | 単語分類装置及び音声認識装置及び単語分類プログラム |
JP2008216341A (ja) * | 2007-02-28 | 2008-09-18 | Nippon Hoso Kyokai <Nhk> | 誤り傾向学習音声認識装置及びコンピュータプログラム |
JP2011524991A (ja) * | 2008-04-15 | 2011-09-08 | モバイル テクノロジーズ,エルエルシー | 現場にて音声−音声翻訳をメンテナンスするシステム及び方法 |
-
2014
- 2014-01-27 JP JP2014012766A patent/JP6366166B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008058341A (ja) * | 2006-08-29 | 2008-03-13 | Nippon Hoso Kyokai <Nhk> | 単語分類装置及び音声認識装置及び単語分類プログラム |
JP2008216341A (ja) * | 2007-02-28 | 2008-09-18 | Nippon Hoso Kyokai <Nhk> | 誤り傾向学習音声認識装置及びコンピュータプログラム |
JP2011524991A (ja) * | 2008-04-15 | 2011-09-08 | モバイル テクノロジーズ,エルエルシー | 現場にて音声−音声翻訳をメンテナンスするシステム及び方法 |
Non-Patent Citations (1)
Title |
---|
小林 彰夫 AKIO KOBAYASHI: ""報告 単語誤り最小化に基づく識別的リスコアリングによる音声認識 Discriminative Rescoring Based on Mi", NHK技研R&D NO.131 (2012-01-15), JPN6017041858, 15 January 2012 (2012-01-15), JP, pages 28 - 39, ISSN: 0003673327 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10276151B2 (en) | 2016-06-29 | 2019-04-30 | Samsung Electronics Co., Ltd. | Electronic apparatus and method for controlling the electronic apparatus |
CN113168836A (zh) * | 2018-09-27 | 2021-07-23 | 株式会社OPTiM | 计算机系统、语音识别方法以及程序 |
CN113168836B (zh) * | 2018-09-27 | 2024-04-23 | 株式会社OPTiM | 计算机系统、语音识别方法以及程序产品 |
US20210090576A1 (en) * | 2019-09-19 | 2021-03-25 | Giving Tech Labs, LLC | Real Time and Delayed Voice State Analyzer and Coach |
CN111652130A (zh) * | 2020-06-02 | 2020-09-11 | 上海语识信息技术有限公司 | 一种非特定字体的数字、符号和字母组的识别方法 |
CN111652130B (zh) * | 2020-06-02 | 2023-09-15 | 上海语识信息技术有限公司 | 一种非特定字体的数字、符号和字母组的识别方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6366166B2 (ja) | 2018-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6222821B2 (ja) | 誤り修正モデル学習装置、及びプログラム | |
Mangu et al. | Finding consensus in speech recognition: word error minimization and other applications of confusion networks | |
US8019602B2 (en) | Automatic speech recognition learning using user corrections | |
JP6047364B2 (ja) | 音声認識装置、誤り修正モデル学習方法、及びプログラム | |
CN108899013B (zh) | 语音搜索方法、装置和语音识别系统 | |
JP6051004B2 (ja) | 音声認識装置、誤り修正モデル学習方法、及びプログラム | |
JP4852448B2 (ja) | 誤り傾向学習音声認識装置及びコンピュータプログラム | |
JP5932869B2 (ja) | N−gram言語モデルの教師無し学習方法、学習装置、および学習プログラム | |
US8494847B2 (en) | Weighting factor learning system and audio recognition system | |
JP6031316B2 (ja) | 音声認識装置、誤り修正モデル学習方法、及びプログラム | |
Elsner et al. | Bootstrapping a unified model of lexical and phonetic acquisition | |
CN112861521B (zh) | 语音识别结果纠错方法、电子设备及存储介质 | |
JP6810580B2 (ja) | 言語モデル学習装置およびそのプログラム | |
JP6366166B2 (ja) | 音声認識装置、及びプログラム | |
JP2004226982A (ja) | 隠れ軌跡隠れマルコフモデルを使用した音声認識の方法 | |
JP5180800B2 (ja) | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム | |
JP6183988B2 (ja) | 音声認識装置、誤り修正モデル学習方法、及びプログラム | |
JP5437204B2 (ja) | 言語モデル処理装置および音声認識装置、ならびにプログラム | |
JP6300394B2 (ja) | 誤り修正モデル学習装置、及びプログラム | |
JP2013117683A (ja) | 音声認識装置、誤り傾向学習方法、及びプログラム | |
JP5723711B2 (ja) | 音声認識装置および音声認識プログラム | |
JP2016024325A (ja) | 言語モデル生成装置、およびそのプログラム、ならびに音声認識装置 | |
JP6086714B2 (ja) | 音声認識装置、誤り修正モデル学習方法、及びプログラム | |
JP7039511B2 (ja) | モデル間距離を用いた発音評価用のプログラム、装置及び方法 | |
JP2017151198A (ja) | 音響モデル生成装置およびそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180605 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180702 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6366166 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |