JP5723711B2 - 音声認識装置および音声認識プログラム - Google Patents
音声認識装置および音声認識プログラム Download PDFInfo
- Publication number
- JP5723711B2 JP5723711B2 JP2011165365A JP2011165365A JP5723711B2 JP 5723711 B2 JP5723711 B2 JP 5723711B2 JP 2011165365 A JP2011165365 A JP 2011165365A JP 2011165365 A JP2011165365 A JP 2011165365A JP 5723711 B2 JP5723711 B2 JP 5723711B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- language
- information
- topic
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は、上記問題点を解決するためになされたものであり、発話における話題に応じて、高精度な音声認識結果を得ることができる、音声認識装置および音声認識プログラムを提供することを目的とする。
ここで、話題情報は、音声データが示す発話内容に対応する内容を有する情報である。例えば、話題情報は、話者による発話の内容に対応する、話題、話の概要、要約、あらすじ、ポイント等が示された話題テキストを含む情報である。具体的には、例えば、放送番組を制作する際に用いられる、制作番組の進行予定内容が記載された番組進行予定シート(構成予定シート)の情報や、講演の際に用いられる、スピーチ内容が記載された講演用メモの情報、講演後にまとめられた講演記録の情報や、会議の議事録の情報である。
また、テキスト情報源は、様々なテキスト情報を保有する情報源である。例えば、テキスト情報源は、当該音声認識装置がネットワークを介してアクセスし、所望のテキスト情報を検索して取得可能な多数のウェブサイトである。または、テキスト情報源は、例えば、様々な分野それぞれに関するテキスト情報を格納するデータベースである。
このように構成することにより、本発明の一態様である音声認識装置は、音声データが示す発話内容に対応する話題や要約等の概要的な内容を有する話題情報と、外部のテキスト情報源から取得する様々な関連テキスト情報の集合とを用いることにより、発話における話題の内容に対応して言語モデルを選択し且つ適応化することができる。
このように構成することにより、本発明の一態様である音声認識装置は、発話における話題の変化に追従して言語モデルを選択し且つ適応化しながら、音声データを音声認識処理して認識結果テキスト情報を生成し出力することができる。
[3]上記[1]または[2]記載の音声認識装置において、前記話題情報は、前記音声データが示す発話内容に対応する内容が含まれる話題テキストと、前記話題テキストの先頭を起点とした発話進行の経過時間を示す経過時間情報とを有し、前記正解単語探索部は、前記正解候補単語列と前記正解候補単語列における各正解候補単語に対応したタイムスタンプ情報とを含む認識結果テキスト情報を生成し、前記話題トラッキング部は、前記正解候補単語列と前記話題テキストとの類似度を計算するとともに、前記経過時間情報が示す経過時間と前記タイムスタンプ情報が示す各時間とに基づく時間係数を計算し、前記時間係数を前記類似度に重み付けすることに基づいて前記発話対応テキストを抽出することを特徴とする。
例えば、話題トラッキング部は、経過時間情報が示す経過時間と各正解候補単語に対応付けられたタイムスタンプ情報が示す時間との差分の総和の逆数を計算し、この計算結果を時間係数とする。そして、話題トラッキング部は、時間係数を類似度に重み付け加算する。
このように構成することにより、時間に関する情報を類似度の一部としてみなすことができ、発話対応テキストの抽出精度を向上させることができる。
[4]上記[1]から[3]いずれか一項記載の音声認識装置において、前記言語モデル記憶部は、カテゴリ別の複数の言語モデルを記憶し、前記言語モデル適応化部は、前記発話相当付近テキストに基づいて、前記カテゴリ別の複数の言語モデルから単語列被覆率が最大値となる言語モデルを選択し、前記言語モデルを前記関連テキスト情報により適応化することを特徴とする。
[1 構成]
図1は、本発明の一実施形態である音声認識装置を適用した音声認識システムの全体構成を示すブロック図である。同図に示すように、音声認識システム100は、音声認識装置1と、テキスト情報源2とを、ネットワーク3を介して接続した構成を有する。
音声認識装置1は、一発話分の認識結果テキスト情報と、音声認識処理を実行する前に設定された話題情報とに基づいて、発話の話題に関連性が最も高い言語モデルを複数の言語モデルから選択し、テキスト情報源2から取得する関連テキスト集合に基づいて、選択した言語モデルを適応化する。話題情報は、音声データが示す発話内容に対応する内容を有する情報である。この話題情報については、その詳細を後述する。
すなわち、音声認識装置1は、音声データが示す発話内容における話題の変化に追従して、動的に言語モデルを適応化するものである。
これらの構成のうち、基本言語モデル記憶部10と、適応化言語モデル記憶部20と、音響モデル記憶部30と、話題情報記憶部70とは、磁気ハードディスク装置および各種半導体記憶装置またはいずれかにより実現される。
なお、基本言語モデル記憶部10と適応化言語モデル記憶部20とを併せて言語モデル記憶部と呼ぶ。
なお、以下の説明において、言語モデル11−1〜11−nのうちいずれか一の言語モデルを言語モデル11と呼ぶことがある。
音響モデル記憶部30は、音響モデルを記憶する。音響モデルは、音素ごとの音響特徴量の統計的データである。この統計的データとは、音響特徴量と言語表現との統計的確率を表わすデータである。音響モデルは、例えば、混合正規分布を出力確率とした隠れマルコフモデルである。この音響モデルは、一般的な話者(例えば、標準語を話す成人)に共通のものであってもよいし、話者属性(例えば、性別、年齢層等)ごとのデータであってもよい。
発音ネットワーク・スコア情報記憶部61は、適応化言語モデル記憶部20に記憶された適応化言語モデルに含まれる言語表現と、発音ネットワークと、言語スコアメモリとを記憶する。発音ネットワークは、適応化言語モデルに登録された言語表現に対応する音素の列を表す。つまり、発音ネットワークは、適応化言語モデルに登録された全単語についての音素の結合関係を示す。言語スコアメモリは、登録された言語表現ごとの言語スコアのデータ集合である。
更新部62は、言語モデル適応化部90が適応化言語モデル記憶部20を更新した際に、適応化言語モデルに基づいて発音ネットワーク・スコア情報記憶部61に記憶された発音ネットワークおよび言語スコアメモリを更新する
一発話期間に含まれる一または複数の正解候補単語を時系列に配列して得られる正解候補単語列(テキスト)を、推定発話テキストと呼ぶ。認識結果テキスト情報の具体例については後述する。
正解単語探索部60は、発話間ポーズ期間内に発音ネットワークおよび言語スコアメモリを更新することにより、これら更新直後の発話期間において、最新の適応化言語モデルを適用した音声認識処理を実行することができる。
正解単語探索部60による音声認識処理および更新処理の詳細については後述する。
本実施形態では、番組の開始時点からの経過予定時間を示す経過予定時間情報と、制作番組の進行予定内容を示す話題テキストとを含む番組進行予定シートの情報を、話題情報とした例を用いて説明する。
言語モデル適応化部90は、選択した言語モデル11を関連テキスト集合により適応化し、適応化言語モデルとして適応化言語モデル記憶部20に記憶させる。言語モデル適応化部90による言語モデルの動的適応化処理については後述する。
[2.1 音声認識処理および更新処理]
次に、正解単語探索部60による音声認識処理および更新処理について説明する。
図4は、正解単語探索部60における、発音ネットワークおよび言語スコアメモリの一部分を概念的に示す図である。同図に示すように、発音ネットワークは、適応化言語モデルに対応し、全単語についての音素の結合関係を示すものとなっている。具体的には、発音ネットワークは、/ai/、/au/、/aka/、/aki/等の発音となる音素列を示している。
また、各音素には、あらかじめ学習された各音素の音響特徴量のガウス分布に対応する音響モデル(平均および分散)が対応付けられている。
なお、言語スコアメモリは、生起確率および言語スコアについて、いずれか一方だけを有していればよい。
次に、話題トラッキング部80による発話対応テキストの抽出処理について説明する。
話題トラッキング部80は、話題情報記憶部70に記憶された話題情報に含まれる話題テキストにおける各テキストについて、テキストごとに、出現する各単語の頻度を要素とする単語頻度ベクトル(話題テキスト単語頻度ベクトル)を計算する。話題情報が話題情報記憶部70に記憶された後、話題トラッキング部80は、話題情報記憶部70に記憶された話題テキストにおける各テキストの話題テキスト単語頻度ベクトルを計算し、これら話題テキスト単語頻度ベクトルを、内部の記憶部または話題情報記憶部70に記憶させる。
具体的に、図2に示す認識結果テキスト情報が正解単語探索部60から供給されると、話題トラッキング部80は、推定発話テキストである「美肌効果の高い呼吸法があるんです」に対する推定発話単語頻度ベクトルを計算する。
具体的に、図3に示す話題情報において、話題テキストにおけるテキスト「呼吸法、実践してる?美肌、冷え解消、リラックス」には、経過時間情報「1:30」が対応付けられている。よって、話題トラッキング部80は、経過時間である“1分30秒”と、図2に示す各正解候補単語に対応付けられたタイムスタンプ情報が示す時間“1分38秒2ミリ秒”、“1分38秒51ミリ秒”、・・・、“1分41秒90ミリ秒”それぞれとの差分の総和の逆数を計算して時間係数とする。
なお、経過時間情報が示す経過時間には、所定時間のマージンを設けるようにしてもよい。所定時間は、任意の一定時間でもよいし、経過時間に応じて変動する時間でもよい。
具体的には、例えば、話題トラッキング部80は、図3に示す話題情報と図2に示す認識結果テキスト情報との照合により、推定発話テキストである「美肌効果の高い呼吸法があるんです」に類似度が最も高いテキストとして、「呼吸法、実践してる?美肌、冷え解消、リラックス」を話題テキストから抽出する。
次に、言語モデル適応化部90による関連テキスト集合の取得処理について説明する。
言語モデル適応化部90は、話題情報から抽出した発話相当付近テキストに出現する各単語の頻度を要素とする単語頻度ベクトル(発話相当付近テキスト単語頻度ベクトル)を計算する。
言語モデル適応化部90は、その発話相当付近テキスト単語頻度ベクトルに対するコサイン類似度があらかじめ決定された類似度閾値を超える値となる単語頻度ベクトルを有するテキストを、関連テキスト情報としてテキスト情報源2から検索する。そして、言語モデル適応化部90は、検索した一または複数の関連テキスト情報を関連テキスト集合としてテキスト情報源2から取り込む。
なお、言語モデル適応化部90は、発話相当付近テキスト単語頻度ベクトルの計算処理を、オンライン処理として実行してもよいし、オフライン処理として実行してもよい。
次に、言語モデル適応化部90による言語モデルの適応化処理について説明する。
言語モデル適応化部90は、適応化処理の第1の例として、選択した言語モデル11から得る各単語の出現頻度と、取得した関連テキスト集合から得る各単語の出現頻度とについて、関連テキスト集合から得る各単語の出現頻度に重み付けした線形重み和を計算する。つまり、言語モデル適応化部90は、言語モデル11から得る各単語の出現頻度C(h,w)と、関連テキスト集合から得る各単語の出現頻度C’(h,w)に所定の重み係数αによる重み付けをしたものとの和を、下記の式(1)により計算する。
ただし、式(1)において、wは、直前の単語履歴hに続く一単語を表わす。単語履歴hは、言語モデル11がユ二グラムの場合はnull(ヌル)、バイグラムの場合は一単語、トライグラムの場合は二単語である。
次に、本実施形態である音声認識装置1の動作について説明する。
図5は、音声認識装置1が実行する音声認識処理の概略の処理手順を示すフローチャートである。外部から供給された話題情報が話題情報記憶部70に記憶された後、その話題情報に対応する音声データが外部から供給されることにより、音声認識装置1は本フローチャートによる処理を実行する。
次に、音声認識装置1は、ステップS101の処理に戻す。
ステップS201において、話題トラッキング部80は、正解単語探索部60から供給される認識結果テキスト情報を取り込む。
次に、話題トラッキング部80は、認識結果テキスト情報に含まれる推定発話テキストおよび正解候補単語ごとのタイムスタンプ情報と、話題情報記憶部70に記憶された話題情報に含まれる話題テキストおよび経過時間情報とを照合し、話題テキストにおいて推定発話テキストに対応するテキストを発話対応テキストとして抽出する。
次に、言語モデル適応化部90は、発話相当付近テキストを検索キーとして、テキスト情報源2を検索し、発話相当付近テキストの内容に関連する内容を有する一または複数の関連テキスト情報を、関連テキスト集合として取り込む。
次に、音声認識装置1は、ステップS201の処理に戻す。
また、音声認識装置1は、認識結果テキスト情報と、音声データが示す発話内容に対応する内容を含む話題情報とを照合することにより、認識結果テキスト情報に対応する発話対応テキストを含む所定範囲の発話相当付近テキストを、話題情報から抽出する。音声認識装置1は、発話相当付近テキストに関連する内容を有する一または複数の関連テキスト情報をテキスト情報源2において検索し、テキスト情報源2から、その検索結果を関連テキスト集合として取り込む。音声認識装置1は、保有する複数の言語モデルの中から、発話相当付近テキストに関連性が最も高い言語モデルを選択し、関連テキスト集合を用いてその選択した言語モデルを適応化し、確率値を更新する。
また、音声認識装置1は、発話間ポーズ期間において、適応化された最新の適応化言語モデルにしたがって、発音ネットワークおよび言語スコアメモリを変更する。
よって、本実施形態によれば、従来のように複数の言語モデルから単に選択した言語モデルや、静的に適応化した言語モデルよりも、高精度に音声認識結果を得ることができる。
2 テキスト情報源
3 ネットワーク
10 基本言語モデル記憶部
11−1〜11−n 言語モデル
20 適応化言語モデル記憶部
30 音響モデル記憶部
40 音声データ取得部
50 音響分析部
60 正解単語探索部
61 発音ネットワーク・スコア情報記憶部
62 更新部
70 話題情報記憶部
80 話題トラッキング部
90 言語モデル適応化部
100 音声認識システム
Claims (5)
- 言語表現ごとの統計的データを言語モデルとして記憶する言語モデル記憶部と、
音素ごとの音響特徴量の統計的データを音響モデルとして記憶する音響モデル記憶部と、
テキスト情報を時系列に含む話題情報を記憶する話題情報記憶部と、
前記言語モデルに含まれる前記言語表現と前記言語表現に対応する音素の列を表す発音ネットワークと前記言語モデルに含まれる統計的データに基づく前記言語表現ごとの言語スコアとを記憶する発音ネットワーク・スコア情報記憶部と、
取り込んだ音声データに基づいて音響特徴量を算出する音響分析部と、
前記音響分析部が算出した前記音響特徴量と前記発音ネットワーク・スコア情報記憶部に記憶された前記発音ネットワークにおける音素に対応する前記音響モデルとに基づき前記言語表現ごとの音響スコアを求め、前記発音ネットワーク・スコア情報記憶部から前記言語表現ごとの言語スコアを求め、前記音響スコアと前記言語スコアとに基づいて正解候補単語列を探索し、前記正解候補単語列を含む認識結果テキスト情報を生成する正解単語探索部と、
前記正解単語探索部が生成した前記認識結果テキスト情報と前記話題情報記憶部に記憶された前記話題情報とを照合し、前記認識結果テキスト情報に対応するテキスト情報を、前記話題情報から発話対応テキストとして抽出する話題トラッキング部と、
前記話題情報記憶部に記憶された前記話題情報から、前記話題トラッキング部が抽出した前記発話対応テキストを含む所定範囲のテキストを発話相当付近テキストとして抽出し、前記発話相当付近テキストに関連する関連テキスト情報を外部のテキスト情報源から取得し、前記言語モデル記憶部に記憶された前記言語モデルを前記関連テキスト情報に基づき適応化して前記言語モデル記憶部を更新する言語モデル適応化部と、
前記言語モデル適応化部が前記言語モデル記憶部を更新した際に、適応化された言語モデルに基づいて前記発音ネットワーク・スコア情報記憶部に記憶された前記発音ネットワークと前記言語スコアとを更新する更新部と、
を備えることを特徴とする音声認識装置。 - 前記音響分析部は、前記音声データに基づいて、前記音響特徴量を計算するとともに発話間ポーズ期間を検出し、
前記正解単語探索部は、前記発話間ポーズ期間を除く期間において、前記音響分析部が算出した前記音響特徴量と前記発音ネットワーク・スコア情報記憶部に記憶された前記発音ネットワークにおける音素に対応する前記音響モデルとに基づき前記言語表現ごとの音響スコアを求め、前記発音ネットワーク・スコア情報記憶部から前記言語表現ごとの言語スコアを求め、前記音響スコアと前記言語スコアとに基づいて正解候補単語列を探索し、前記正解候補単語列を含む認識結果テキスト情報を生成し、
前記更新部は、前記言語モデル適応化部が前記言語モデル記憶部を更新後、前記発話間ポーズ期間において、適応化された言語モデルに基づいて前記発音ネットワーク・スコア情報記憶部に記憶された前記言語スコアを更新する
ことを特徴とする請求項1記載の音声認識装置。 - 前記話題情報は、前記音声データが示す発話内容に対応する内容が含まれる話題テキストと、前記話題テキストの先頭を起点とした発話進行の経過時間を示す経過時間情報とを有し、
前記正解単語探索部は、前記正解候補単語列と前記正解候補単語列における各正解候補単語に対応したタイムスタンプ情報とを含む認識結果テキスト情報を生成し、
前記話題トラッキング部は、前記正解候補単語列と前記話題テキストとの類似度を計算するとともに、前記経過時間情報が示す経過時間と前記タイムスタンプ情報が示す各時間とに基づく時間係数を計算し、前記時間係数を前記類似度に重み付けすることに基づいて前記発話対応テキストを抽出する
ことを特徴とする請求項1または2記載の音声認識装置。 - 前記言語モデル記憶部は、カテゴリ別の複数の言語モデルを記憶し、
前記言語モデル適応化部は、前記発話相当付近テキストに基づいて、前記カテゴリ別の複数の言語モデルから単語列被覆率が最大値となる言語モデルを選択し、前記言語モデルを前記関連テキスト情報により適応化する
ことを特徴とする請求項1から3いずれか一項記載の音声認識装置。 - 言語表現ごとの統計的データを言語モデルとして記憶する言語モデル記憶部と、音素ごとの音響特徴量の統計的データを音響モデルとして記憶する音響モデル記憶部と、テキスト情報を時系列に含む話題情報を記憶する話題情報記憶部と、前記言語モデルに含まれる前記言語表現と前記言語表現に対応する音素の列を表す発音ネットワークと前記言語モデルに含まれる統計的データに基づく前記言語表現ごとの言語スコアとを記憶する発音ネットワーク・スコア情報記憶部とを備えるコンピュータを、
取り込んだ音声データに基づいて音響特徴量を算出する音響分析部と、
前記音響分析部が算出した前記音響特徴量と前記発音ネットワーク・スコア情報記憶部に記憶された前記発音ネットワークにおける音素に対応する前記音響モデルとに基づき前記言語表現ごとの音響スコアを求め、前記発音ネットワーク・スコア情報記憶部から前記言語表現ごとの言語スコアを求め、前記音響スコアと前記言語スコアとに基づいて正解候補単語列を探索し、前記正解候補単語列を含む認識結果テキスト情報を生成する正解単語探索部と、
前記正解単語探索部が生成した前記認識結果テキスト情報と前記話題情報記憶部に記憶された前記話題情報とを照合し、前記認識結果テキスト情報に対応するテキスト情報を、前記話題情報から発話対応テキストとして抽出する話題トラッキング部と、
前記話題情報記憶部に記憶された前記話題情報から、前記話題トラッキング部が抽出した前記発話対応テキストを含む所定範囲のテキストを発話相当付近テキストとして抽出し、前記発話相当付近テキストに関連する関連テキスト情報を外部のテキスト情報源から取得し、前記言語モデル記憶部に記憶された前記言語モデルを前記関連テキスト情報に基づき適応化して前記言語モデル記憶部を更新する言語モデル適応化部と、
前記言語モデル適応化部が前記言語モデル記憶部を更新した際に、適応化された言語モデルに基づいて前記発音ネットワーク・スコア情報記憶部に記憶された前記発音ネットワークと前記言語スコアとを更新する更新部と、
して機能させるための音声認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011165365A JP5723711B2 (ja) | 2011-07-28 | 2011-07-28 | 音声認識装置および音声認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011165365A JP5723711B2 (ja) | 2011-07-28 | 2011-07-28 | 音声認識装置および音声認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013029652A JP2013029652A (ja) | 2013-02-07 |
JP5723711B2 true JP5723711B2 (ja) | 2015-05-27 |
Family
ID=47786752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011165365A Expired - Fee Related JP5723711B2 (ja) | 2011-07-28 | 2011-07-28 | 音声認識装置および音声認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5723711B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6165657B2 (ja) * | 2014-03-20 | 2017-07-19 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
KR20210052564A (ko) * | 2018-11-05 | 2021-05-10 | 주식회사 엘솔루 | 빅 데이터를 이용한 최적의 언어 모델 생성 방법 및 이를 위한 장치 |
CN111161739B (zh) * | 2019-12-28 | 2023-01-17 | 科大讯飞股份有限公司 | 语音识别方法及相关产品 |
CN112382278B (zh) * | 2020-11-18 | 2021-08-17 | 北京百度网讯科技有限公司 | 流式语音识别结果显示方法、装置、电子设备和存储介质 |
CN113077792B (zh) * | 2021-03-24 | 2024-03-05 | 平安科技(深圳)有限公司 | 佛学主题词识别方法、装置、设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001100781A (ja) * | 1999-09-30 | 2001-04-13 | Sony Corp | 音声処理装置および音声処理方法、並びに記録媒体 |
JP2005284209A (ja) * | 2004-03-31 | 2005-10-13 | Kddi Corp | 音声認識方式 |
JP5296598B2 (ja) * | 2009-04-30 | 2013-09-25 | 日本放送協会 | 音声情報抽出装置 |
-
2011
- 2011-07-28 JP JP2011165365A patent/JP5723711B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013029652A (ja) | 2013-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9911413B1 (en) | Neural latent variable model for spoken language understanding | |
US10713289B1 (en) | Question answering system | |
US10347244B2 (en) | Dialogue system incorporating unique speech to text conversion method for meaningful dialogue response | |
US20230317074A1 (en) | Contextual voice user interface | |
US9711139B2 (en) | Method for building language model, speech recognition method and electronic apparatus | |
US10489393B1 (en) | Quasi-semantic question answering | |
US8620658B2 (en) | Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition | |
US11823678B2 (en) | Proactive command framework | |
JP4195428B2 (ja) | 多数の音声特徴を利用する音声認識 | |
US10490182B1 (en) | Initializing and learning rate adjustment for rectifier linear unit based artificial neural networks | |
EP2453436B1 (en) | Automatic language model update | |
US10170107B1 (en) | Extendable label recognition of linguistic input | |
US10832668B1 (en) | Dynamic speech processing | |
JP4987682B2 (ja) | 音声チャットシステム、情報処理装置、音声認識方法およびプログラム | |
JP2003036093A (ja) | 音声入力検索システム | |
JP2004523004A (ja) | 階層言語モデル | |
Chia et al. | Statistical lattice-based spoken document retrieval | |
US10515637B1 (en) | Dynamic speech processing | |
JP5723711B2 (ja) | 音声認識装置および音声認識プログラム | |
Koumpis et al. | Automatic summarization of voicemail messages using lexical and prosodic features | |
US10417345B1 (en) | Providing customer service agents with customer-personalized result of spoken language intent | |
JP2013117683A (ja) | 音声認識装置、誤り傾向学習方法、及びプログラム | |
HaCohen-Kerner et al. | Language and gender classification of speech files using supervised machine learning methods | |
Lestari et al. | Adaptation to pronunciation variations in Indonesian spoken query-based information retrieval | |
JP4986301B2 (ja) | 音声認識処理機能を用いたコンテンツ検索装置、プログラム及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140902 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140917 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150330 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5723711 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |