JP2013050742A - 音声認識装置および音声認識方法 - Google Patents
音声認識装置および音声認識方法 Download PDFInfo
- Publication number
- JP2013050742A JP2013050742A JP2012270688A JP2012270688A JP2013050742A JP 2013050742 A JP2013050742 A JP 2013050742A JP 2012270688 A JP2012270688 A JP 2012270688A JP 2012270688 A JP2012270688 A JP 2012270688A JP 2013050742 A JP2013050742 A JP 2013050742A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- conversion
- conversion candidate
- speech recognition
- language model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】音声認識装置は、音声データを取得する音声データ取得部と、音響モデルおよび第1言語モデルを参照して、音声データに対する音声認識処理をおこない、その認識結果を示す認識文字列を生成する音声認識部と、認識文字列に含まれる一部の文字列を、変換対象文字列として決定する変換対象文字列決定部と、認識文字列において、決定された変換対象文字列の前または後に接続された文字列を、参照文字列として決定する参照文字列決定部と、第2言語モデルを参照して、決定された参照文字列との接続関係が示されている文字列を、変換対象文字列を変換する候補の変換候補文字列として決定する変換候補文字列決定部と、決定された変換候補文字列を出力する出力部とを備える。
【選択図】図3
Description
まず、第1実施形態を説明する。図1は、第1実施形態にかかる音声認識装置100の構成を示す。音声認識装置100は、入力された音声を認識して、認識した音声に応じた文字を出力する装置である。この第1実施形態では、音声認識機能を有するパーソナル・コンピュータを、音声認識装置100として用いている。
音声データ取得部312が、音声認識処理の対象とする音声データを取得する。具体的には、音声データ取得部312は、マイク120から入力された音声信号を、音声認識処理の対象とする音声データとして取得する。既に音声データがメモリ等の記憶媒体に格納されている場合、音声データ取得部312は、この記憶媒体に格納されている音声データを、音声認識処理の対象とする音声データとして取得してもよい。
音声認識部314が、音響モデル格納部302に格納された音響モデルおよび第1言語モデル格納部304に格納された第1言語モデルに基づく音声認識処理をおこなうことで、ステップS502で取得された音声データが示す音声を認識して、尤もらしい文字列を、当該認識結果を示す認識文字列として生成する。ここで、音声認識部314による音声認識処理の一例について説明する。図6は、音声認識部314による音声認識処理の一例を示す。この例では、音声認識部314によって、「今から京都駅に行きます」という音声の音声データから、「今から京都的に行きます」という認識文字列が生成されている。この例では、音声認識部314は、「駅」を「的」と誤って認識してしまっている。この理由としては、たとえば、「駅」という単語が第1言語モデルに示されていない、音声データに含まれている雑音などにより音声に歪みが生じて「駅」が認識結果およびその候補とされなかった等、様々な理由が挙げられる。なお、音響モデルの構成、第1言語モデルの構成、および音声認識部314による音声認識処理の具体的な方法は様々である。本実施形態では、音声データから認識文字列を生成することができればよいため、これを実現することができるものであれば、これらについてどのようなものを用いてもよい。
音声認識部314が、ステップS504で生成された認識文字列を構成する文字列のそれぞれについて、音声認識の信頼度を算出する。ここで、音声認識部314によって算出された信頼度の一例について説明する。図7は、音声認識部314によって算出された信頼度の一例を示す。図7は、音声認識部314によって生成された「今から京都的に行きます」という認識文字列を構成する形態素のそれぞれについての、音声認識部314が算出した音声認識の信頼度を示す。ここでいう信頼度とは、音声データから文字列が正しく認識された可能性の度合いを示す。信頼度が高いほど、その文字列が正しく認識された可能性が高いことを示す。たとえば、図7に示す例では、「今から京都的に行きます」という認識文字列を構成する、「今」、「から」、「京都」、「的」、「に」、「行き」、「ます」の各形態素のそれぞれについて、信頼度が示されている。この例では、「今」の信頼度は「95」、「から」の信頼度は「92」、「京都」の信頼度は「80」、「的」の信頼度は「50」、「に」の信頼度は「70」、「行き」の信頼度は「93」、「ます」の信頼度は「93」である。
変換対象文字列決定部316が、ステップS504で生成された認識文字列のうちの、変換対象とする変換対象文字列を決定する。たとえば、変換対象文字列決定部316は、音声認識部314が生成した認識文字列のうちの、認識結果としての信頼度が所定の閾値よりも低い文字列、あるいはその組み合わせからなる文字列を、変換対象文字列として決定する。この方法を適用した場合、間違っている可能性の高い文字列を、変換対象文字列として決定することができる。また、変換対象文字列をユーザに選択させるようなことがないので、ユーザの操作負担を軽減することができる。たとえば、所定の閾値として「60」が設定されており、図7に示したとおり、「今から京都的に行きます」という認識文字列を構成する、「今」、「から」、「京都」、「的」、「に」、「行き」、「ます」の各形態素のそれぞれについての信頼度が算出されている場合、変換対象文字列決定部316は、これら形態素のうち、信頼度として「60」よりも低い「50」が算出されている「的」を、変換対象文字列として決定する。
参照文字列決定部318が、ステップS504で生成された認識文字列のうちの、ステップS508で決定された変換対象文字列の前または後ろに接続された一部の文字列を参照文字列として決定する。具体的には、参照文字列決定部318は、音声認識部314が生成した認識文字列の前または後ろに接続された文字列のうちの、予め定められた条件に合致する文字列を、参照文字列として決定する。この条件には、変換対象文字列を基準とした参照文字列の方向、参照文字列を構成する文字列の単位、および参照文字列を構成する文字列の数が含まれる。たとえば、認識文字列を基準とした参照文字列の方向には、「前方」、「後方」、または「前方と後方の双方」のいずれかが設定される。また、参照文字列を構成する文字列の単位には、「文字」、「単語」、「形態素」、「文節」等が設定される。また、参照文字列を構成する文字列の数としては、「1」等の任意の整数が設定される。これらが組み合わされて、たとえば「変換対象文字列の前方の1形態素を参照文字列とする」といった条件が予めメモリ等の記憶媒体に格納されているのである。この「変換対象文字列の前方の1形態素を参照文字列とする」という条件によれば、たとえば、上記したとおり、「今から京都的に行きます」という認識文字列のうちの、「的」が変換対象文字列として決定された場合、この「的」の前方にある1つの形態素である「京都」が、参照文字列として決定される。また、「変換対象文字列の前方および後方の1文字を参照文字列とする」という条件によれば、この「的」の前方の1文字である「都」と、後方の1文字である「に」とが、参照文字列として決定される。
変換候補文字列決定部320が、第2言語モデルを参照して、当該第2言語モデルにおいてステップS510で決定された参照文字列との接続関係が示されている文字列を、ステップS508で決定された変換対象文字列を変換する候補の変換候補文字列として決定する。たとえば、上記したとおり、変換対象文字列として「的」が決定され、参照文字列として「京都」が決定されたとする。そして、図4に示すとおり、第2言語モデルにおいて、文字列「京都」と、「府」、「市」、「駅」、「の」のそれぞれとの対応関係が示されているとする。この場合、変換候補文字列決定部320は、これら「府」、「市」、「駅」、「の」のそれぞれを変換候補文字列として決定する。変換候補文字列には、変換対象文字列と同じ文字列が含まれていてもよい。たとえば、上記例では、変換対象文字列「的」に対し、変換候補文字列「的」が含まれていてもよい。
出力部322が、ステップS512で決定された変換候補文字列を出力する。たとえば、出力部322は、変換候補文字列を、認識文字列とともに、ユーザが視認できるよう、ディスプレイ130に表示させる。ここで、変換候補文字列が一つの場合、出力部322は、認識文字列における変換対象文字列を変換候補文字列に変換するか否かをユーザが選択可能な形態で出力する。また、変換候補文字列が複数の場合、出力部322は、これら複数の変換候補文字列を、いずれの変換候補文字列で変換対象文字列を変換するかをユーザが選択可能な形態で出力する。
変換対象文字列が変更され、もしくは変更されずに、認識文字列が確定すると、音声認識装置100は、この認識文字列をユーザが利用できるように、メモリ等の記憶媒体に格納したり、他のアプリケーションの入力文字列としたりして、一連の音声認識処理を終了する。
次に、第2実施形態を説明する。第1実施形態では、第2言語モデルにおいて文字列間の接続関係が形態素単位で示されていた。これに対し、第2実施形態では、第2言語モデルにおいて文字列間の接続関係がユーザ入力単位で示されている。ユーザがある文字列を入力する場合に、この文字列を複数の部分的な文字列に区切って段階的に入力する場合がある。たとえば、「京都府の県庁所在地は京都市です」という文字列を入力する場合に、この文字列を「京都」、「府の」、「県庁所在地」、「は」、「京都」、「市です」、という複数の部分的な文字列に区切って段階的に入力するといった具合である。
次に、第3実施形態を説明する。第1実施形態では、第2言語モデルにおいて、参照文字列と複数の文字列との接続関係が示されている場合、これら複数の文字列の一部または全てを変換候補文字列として出力することとした。ここで、参照文字列との接続関係が示されている文字列が膨大な数の場合、これら複数の文字列の全てを変換候補文字列として出力してしまうと、ユーザが混乱してしまう。また、これら複数の文字列の一部を変換候補文字列として出力すると、膨大な数の文字列の中から変換候補文字列を決定するための処理に時間がかかってしまうばかりか、適切な変換候補文字列を決定することができない。
次に、第4実施形態を説明する。実施形態で説明した各機能部について、これらの一部を外部の情報処理装置に設けて、音声認識装置100は、外部の情報処理装置から一部のデータを参照したり、外部の情報処理装置に一部の処理をおこなわせたりする構成としてもよい。すなわち、音声認識装置100は、第1実施形態のように単独で音声認識処理をおこなうものに限らず、他の情報処理装置との通信をおこなって、音声認識処理をおこなうようなものであってもよい。この第4実施形態では、音声認識装置100を、他の情報処理装置との通信をおこなって、音声認識処理をおこなうように構成する場合の一例を説明する。
なお、本発明は、上記した形態での実施に限らず、以下のように変形させて実施してもよい。また、以下の変形例を組み合わせてもよい。
各実施形態では、音声認識装置の一例として音声認識機能を有するパーソナル・コンピュータを用いたが、これに限らず、音声認識装置は、実施形態で説明した音声認識装置100と同様の音声認識機能を実現することができるものであれば、携帯電話機、PDA(Personal Digital Assistant)、ナビゲーション装置、携帯音楽プレーヤー、ノートPC(Personal Computer)、家電製品など、どのような機器であってもよい。
第3実施形態では、文字列の範囲が異なる複数の参照文字列を決定し、決定された複数の参照文字列のうちの、適切な変換候補文字列が得られる参照文字列を用いて、変換対象文字列を変換する候補の変換候補文字列を決定する構成の一具体例として、参照文字列に対応付けられている文字列の数が所定数よりも少なくなるまで参照文字列の範囲を後方に拡張していくことによって、変換候補文字列の数を絞り込む例を説明したが、これに限定するものではない。たとえば、参照文字列の範囲を前方に拡張したり、前後の双方に拡張したりすることによって、変換候補文字列の数を絞り込むようにしてもよい。また、参照文字列に対応付けられている文字列の数が下限値よりも少ない場合は、下限値よりも多くなるまで参照文字列の範囲を縮小していくことによって変換候補文字列の数を増やすようにしてもよい。また、参照文字列に対応付けられている文字列のうちの、所定の相関度以上の相関度を有する文字列の数が上限値よりも少なくなるか、もしくは下限値よりも多くなるまで、参照文字列の範囲を拡張していくことによって変換候補文字列の数を絞り込むか、もしくは、参照文字列の範囲を縮小していくことによって変換候補文字列の数を増やすようにしてもよい。また、全ての文字列の相関度がある閾値よりも低ければ、この閾値よりも相関度が高い文字列が出現するまで、参照文字列の範囲を縮小していくことによって変換候補文字列の数を増やすようにしてもよい。また、全ての文字列の相関度がある閾値よりも高ければ、この閾値よりも相関度が低い文字列が出現するまで、参照文字列の範囲を拡張していくことによって変換候補文字列の数を絞り込むようにしてもよい。
第4実施形態において、複数のクライアント装置11で音声認識部314による音声認識処理を共有することで、複数のクライアント装置11の各々に対して、均質な処理結果を提供することができる構成であれば、音声認識システム10は、どのような装置構成であってもよく、また、各装置に対してどのような機能が設けられていてもよい。たとえば、第4実施形態において、音声認識部314を、音声認識装置100に設け、音声認識部314は、通信部330によるサーバ装置12との通信によって、サーバ装置12に設けられた音響モデル格納部302および第1言語モデル格納部304から、音響モデルおよび第1言語モデルを参照するように構成してもよい。また、音声認識部314だけでなく、変換対象文字列決定部316や、参照文字列決定部318を、サーバ装置12に設ける構成としてもよい。また、サーバ装置12およびクライアント装置11とは別に、音声認識装置100を設け、音声認識装置100が、クライアント装置11から音声データを取得して、そのクライアント装置11に設けられた第2言語モデルを参照して、これまでに説明した音声認識処理をおこない、その処理結果として、認識文字列および変換候補文字列をそのクライアント装置11に出力する構成としてもよい。
各実施形態において、音声認識部314は、複数の認識文字列を生成するものであってもよい。たとえば、変換対象文字列決定部316が、「今から京都駅に行きます」という音声データから、第1候補の「今から京都的に行きます」という認識文字列と、第2候補の「今から京都劇に行きます」という認識文字列とを生成するといった具合である。
Claims (7)
- 音声データを取得する音声データ取得部と、
音声の特徴量と文字との対応関係を示す音響モデルおよび文字列間の接続関係を示す第1言語モデルを参照して、前記音声データに対する音声認識処理をおこない、その認識結果を示す認識文字列を生成する音声認識部と、
前記認識文字列のうち、ユーザによって指定された文字列、認識結果としての信頼度が所定の閾値よりも低い文字列、または、認識結果としての信頼度が所定の閾値よりも低い文字列の組み合わせからなる文字列を、変換対象文字列として決定する変換対象文字列決定部と、
前記認識文字列において、決定された前記変換対象文字列の直前または直後に接続された文字列から予め定められた条件に従って参照文字列を決定する参照文字列決定部と、
ユーザが過去に入力した文字列から抽出された文字列同士の接続関係を示す第2言語モデルを参照して、決定された前記参照文字列との接続関係が示されている文字列を、前記変換対象文字列を変換する候補の変換候補文字列として決定する変換候補文字列決定部と、
決定された前記変換候補文字列を出力する出力部と
を備えることを特徴とする音声認識装置。 - 前記第2言語モデルにおいて、前記参照文字列に対して所定の範囲外の数の前記変換候補文字列が得られた場合、
前記参照文字列決定部は、
前記認識文字列において、前記変換対象文字列の直前または直後に接続された文字列の数を増減して、その増減後の数の文字列を新たな参照文字列として決定し、
前記変換候補文字列決定部は、
前記第2言語モデルにおいて前記新たな参照文字列との接続関係が示されている文字列を、前記変換候補文字列として決定する
ことを特徴とする請求項1に記載の音声認識装置。 - 前記出力部は、
前記認識文字列における前記変換対象文字列を、前記変換候補文字列に変換して、変換後の前記認識文字列を出力する
ことを特徴とする請求項1または2に記載の音声認識装置。 - 前記変換候補文字列決定部は、
前記第2言語モデルにおいて前記参照文字列との接続関係が示されている文字列のそれぞれについて、前記変換対象文字列との相関度を算出し、少なくとも、当該相関度が最も高い文字列または当該相関度が閾値よりも高い文字列を、前記変換対象文字列を変換する候補の変換候補文字列として決定する
ことを特徴とする請求項1から3のいずれかに記載の音声認識装置。 - 前記出力部は、
前記変換候補文字列の音素のうち、前記変換対象文字列の音素と一致しない音素が削除された変換候補文字列、または、前記変換候補文字列と前記参照文字列との接続関係について文法チェックをおこなうことにより特定された前記変換候補文字列に含まれる出力不要な文字が削除された変換候補文字列を出力する
ことを特徴とする請求項1から4のいずれかに記載の音声認識装置。 - 前記音響モデルおよび前記第1言語モデルを記憶したサーバ装置との通信をおこなう通信部を備え、
前記音声認識部は、
前記通信部による前記サーバ装置との通信によって、前記サーバ装置が記憶している前記音響モデルおよび前記第1言語モデルを参照し、前記音声認識処理をおこなう
ことを特徴とする請求項1から5のいずれかに記載の音声認識装置。 - 音声認識装置による音声認識方法であって、
音声データを取得する音声データ取得工程と、
音声の特徴量と文字との対応関係を示す音響モデルおよび文字列間の接続関係を示す第1言語モデルを参照して、前記音声データに対する音声認識処理をおこない、その認識結果を示す認識文字列を生成する音声認識工程と、
前記認識文字列のうち、ユーザによって指定された文字列、認識結果としての信頼度が所定の閾値よりも低い文字列、または、認識結果としての信頼度が所定の閾値よりも低い文字列の組み合わせからなる文字列を、変換対象文字列として決定する変換対象文字列決定工程と、
前記認識文字列において、決定された前記変換対象文字列の直前または直後に接続された文字列から予め定められた条件に従って参照文字列を決定する参照文字列決定工程と、
ユーザが過去に入力した文字列から抽出された文字列同士の接続関係を示す第2言語モデルを参照して、決定された前記参照文字列との接続関係が示されている文字列を、前記変換対象文字列を変換する候補の変換候補文字列として決定する変換候補文字列決定工程と、
決定された前記変換候補文字列を出力する出力工程と
を備えることを特徴とする音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012270688A JP5396530B2 (ja) | 2012-12-11 | 2012-12-11 | 音声認識装置および音声認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012270688A JP5396530B2 (ja) | 2012-12-11 | 2012-12-11 | 音声認識装置および音声認識方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010138741A Division JP5160594B2 (ja) | 2010-06-17 | 2010-06-17 | 音声認識装置および音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013050742A true JP2013050742A (ja) | 2013-03-14 |
JP5396530B2 JP5396530B2 (ja) | 2014-01-22 |
Family
ID=48012754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012270688A Expired - Fee Related JP5396530B2 (ja) | 2012-12-11 | 2012-12-11 | 音声認識装置および音声認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5396530B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016191740A (ja) * | 2015-03-30 | 2016-11-10 | 株式会社エヌ・ティ・ティ・データ | 音声処理装置、音声処理方法およびプログラム |
US10134387B2 (en) | 2014-11-12 | 2018-11-20 | Samsung Electronics Co., Ltd. | Image display apparatus, method for driving the same, and computer readable recording medium |
JP2019507362A (ja) * | 2016-02-05 | 2019-03-14 | グーグル エルエルシー | 外部データソースを用いた音声の再認識 |
CN110914897A (zh) * | 2018-06-18 | 2020-03-24 | 菱洋电子株式会社 | 语音识别系统和语音识别装置 |
US11205415B2 (en) | 2018-11-15 | 2021-12-21 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11352988A (ja) * | 1998-06-09 | 1999-12-24 | Olympus Optical Co Ltd | 音声認識装置 |
JP2001117916A (ja) * | 1999-10-20 | 2001-04-27 | Toshiba Corp | ディクテーション方法および装置 |
JP2002358097A (ja) * | 2001-06-01 | 2002-12-13 | Mitsubishi Electric Corp | 音声認識装置 |
JP2005234236A (ja) * | 2004-02-19 | 2005-09-02 | Canon Inc | 音声認識装置、音声認識方法、記憶媒体およびプログラム |
JP2008262120A (ja) * | 2007-04-13 | 2008-10-30 | Nippon Hoso Kyokai <Nhk> | 発話評価装置及び発話評価プログラム |
JP4189336B2 (ja) * | 2004-02-25 | 2008-12-03 | 株式会社東芝 | 音声情報処理システム、音声情報処理方法及びプログラム |
-
2012
- 2012-12-11 JP JP2012270688A patent/JP5396530B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11352988A (ja) * | 1998-06-09 | 1999-12-24 | Olympus Optical Co Ltd | 音声認識装置 |
JP2001117916A (ja) * | 1999-10-20 | 2001-04-27 | Toshiba Corp | ディクテーション方法および装置 |
JP2002358097A (ja) * | 2001-06-01 | 2002-12-13 | Mitsubishi Electric Corp | 音声認識装置 |
JP2005234236A (ja) * | 2004-02-19 | 2005-09-02 | Canon Inc | 音声認識装置、音声認識方法、記憶媒体およびプログラム |
JP4189336B2 (ja) * | 2004-02-25 | 2008-12-03 | 株式会社東芝 | 音声情報処理システム、音声情報処理方法及びプログラム |
JP2008262120A (ja) * | 2007-04-13 | 2008-10-30 | Nippon Hoso Kyokai <Nhk> | 発話評価装置及び発話評価プログラム |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10134387B2 (en) | 2014-11-12 | 2018-11-20 | Samsung Electronics Co., Ltd. | Image display apparatus, method for driving the same, and computer readable recording medium |
JP2016191740A (ja) * | 2015-03-30 | 2016-11-10 | 株式会社エヌ・ティ・ティ・データ | 音声処理装置、音声処理方法およびプログラム |
JP2019507362A (ja) * | 2016-02-05 | 2019-03-14 | グーグル エルエルシー | 外部データソースを用いた音声の再認識 |
CN110914897A (zh) * | 2018-06-18 | 2020-03-24 | 菱洋电子株式会社 | 语音识别系统和语音识别装置 |
CN110914897B (zh) * | 2018-06-18 | 2023-03-07 | 菱洋电子株式会社 | 语音识别系统和语音识别装置 |
US11205415B2 (en) | 2018-11-15 | 2021-12-21 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
US11615780B2 (en) | 2018-11-15 | 2023-03-28 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
US11961506B2 (en) | 2018-11-15 | 2024-04-16 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
Also Published As
Publication number | Publication date |
---|---|
JP5396530B2 (ja) | 2014-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6251958B2 (ja) | 発話解析装置、音声対話制御装置、方法、及びプログラム | |
US11238842B2 (en) | Intent recognition and emotional text-to-speech learning | |
JP6493866B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
KR102191425B1 (ko) | 인터랙티브 캐릭터 기반 외국어 학습 장치 및 방법 | |
JP5703256B2 (ja) | 単語レベルの変換候補生成に基づく音声認識システム及び方法 | |
KR101255402B1 (ko) | 대안들의 목록을 사용하는 오인된 단어들의 다시 받아쓰기 | |
JP6150268B2 (ja) | 単語登録装置及びそのためのコンピュータプログラム | |
US7742924B2 (en) | System and method for updating information for various dialog modalities in a dialog scenario according to a semantic context | |
US20150179173A1 (en) | Communication support apparatus, communication support method, and computer program product | |
JPWO2007097390A1 (ja) | 音声認識システム、音声認識結果出力方法、及び音声認識結果出力プログラム | |
JP5396530B2 (ja) | 音声認識装置および音声認識方法 | |
WO2011033834A1 (ja) | 音声翻訳システム、音声翻訳方法および記録媒体 | |
JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
JPWO2011064829A1 (ja) | 情報処理装置 | |
JP5160594B2 (ja) | 音声認識装置および音声認識方法 | |
JP2014202848A (ja) | テキスト生成装置、方法、及びプログラム | |
JP5688677B2 (ja) | 音声入力支援装置 | |
JP2008243080A (ja) | 音声を翻訳する装置、方法およびプログラム | |
JP7326931B2 (ja) | プログラム、情報処理装置、及び情報処理方法 | |
CN112002304B (zh) | 语音合成方法及装置 | |
JP5054711B2 (ja) | 音声認識装置および音声認識プログラム | |
KR102299269B1 (ko) | 음성 및 스크립트를 정렬하여 음성 데이터베이스를 구축하는 방법 및 장치 | |
JP5208795B2 (ja) | 通訳装置、方法、及びプログラム | |
JP5696638B2 (ja) | 対話制御装置、対話制御方法及び対話制御用コンピュータプログラム | |
JP2017187797A (ja) | テキスト生成装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121211 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130219 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130408 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130430 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130731 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131015 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131021 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5396530 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |