JP6235280B2 - 音声同時処理装置、方法およびプログラム - Google Patents
音声同時処理装置、方法およびプログラム Download PDFInfo
- Publication number
- JP6235280B2 JP6235280B2 JP2013194639A JP2013194639A JP6235280B2 JP 6235280 B2 JP6235280 B2 JP 6235280B2 JP 2013194639 A JP2013194639 A JP 2013194639A JP 2013194639 A JP2013194639 A JP 2013194639A JP 6235280 B2 JP6235280 B2 JP 6235280B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- processing unit
- unit
- speech
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Description
(第1の実施形態)
第1の実施形態に係る音声同時処理装置について図1のブロック図を参照して説明する。
本実施形態に係る音声同時処理装置100は、取得部101、音声認識部102、認識結果記憶部103、検出部104、処理単位記憶部105および出力部106を含む。
なお、確定文字列は、確定した音声区間に対する最尤の文字列のみでもよいし、確定した音声区間に対応する他の候補を含む形式、例えば文字列ラティス形式で生成してもよい。同様に、候補文字列集合も1つの候補文字列ごとに区別して生成してもよいし、文字列ラティス形式で出力してもよい。
また、確定文字列および候補文字列の生成方法の別例としては、音声認識処理中の音声に相当する文字列候補が予め決められた単語数に達した位置をポーズの代わりに用いたり、文字列候補の生成確率が一定の閾値を超える位置をポーズの代わりに用いることで、確定文字列および候補文字列を生成してもよい。
また、検出部104では、処理単位となる分割点を、例えば、条件付き確率場(Conditioning Random Field)を用いて確率的に推定することができる。機械学習では、理想的な処理単位の情報が付与された学習データ(コーパス)を用いて分割点を学習してもよいし、あるいは、理想的な処理単位の情報が付与されていないデータにおいて、本実施形態に係る音声同時処理装置に接続する装置が理想的に動作する確率を最大化するような分割点を学習するようにしてもよい。
機械学習手法は、本実施の形態で説明した条件付き確率場の他にも、HMM、サポートベクターマシン(Support Vector Machine:SVM)といったその他のモデルを用いて分割点を推定してもよく、上述の実現形態に限るものではない。また、統計的に分割点を検出する方法以外にも、例えば、形態素系列におけるパターンマッチングによる手法や、構文情報を用いた手法などを適用することができる。
出力部106は、認識結果記憶部103から確定文字列および候補文字列を、処理単位記憶部105から処理単位文字列をそれぞれ受け取り、外部へ出力する。外部への出力は、処理単位文字列が生成されるごとに出力してもよいし、ある程度処理単位文字列が蓄積されてからまとめて出力するようにしてもよい。なお、LCD(Liquid crystal display)やOLED(organic light emitting diode)ディスプレイのような表示デバイスや、プリンタデバイス、スピーカなどの音声デバイス、ハードディスクドライブなどの記憶媒体への記憶デバイスを含んでもよい。
ステップS201では、音声認識部102が、取得部101で取得した音声に対して音声認識処理を行ない、確定文字列と候補文字列集合とを得る。
ステップS202では、検出部104が、確定文字列と候補文字列集合に含まれるそれぞれの候補文字列とを連結して組合せ文字列を生成し、組合せ文字列を要素する組合せ文字列集合を得る。ここでは、候補文字列の数に対応する組合せ文字列が生成されることになる。
認識結果記憶部103には、確定文字列301と1以上の候補文字列302とが対応付けられて記憶される。ここでは、確定文字列301「千葉市内で」に対して、候補文字列302「火照るん」、「ホテルの」、「掘っているん」、「補填の」がそれぞれ対応付けられる。確定文字列301とそれぞれの候補文字列302とを連結することで、組合せ文字列を得ることができる。すなわち、組合せ文字列として、「千葉市内で火照るん」、「千葉市内のホテルで」、「千葉市内で掘っているん」および「千葉市内で補填の」が得られ、これら4つの組合せ文字列の集合が組合せ文字列集合となる。
図4は、条件付き確率場を用いて、組合せ文字列401に含まれる形態素に、処理単位への分割点の候補位置を示すラベル402を付与した例を示す。「B」は、処理単位の開始位置となる形態素の位置を示し、「I」は、処理単位の途中にある形態素の位置を示す。
ここでは、確定文字列601「ホテルの予約をし」と、確定文字列601に対応する1以上の候補文字列602が得られた場合を想定する。図6に示すように、候補文字列602としては、「たいん」、「退院」、「タイの」および「たインド」が得られる。
図7に示すように、組合せ文字列701「ホテルの予約をしたいん」は、ラベル702「B」に対応する分割点が先頭の「ホテル」以外存在しないので、部分文字列に分割できない。一方、組合せ文字列701「ホテルの予約をし退院」は、ラベル702「B」に対応する分割点が先頭以外に存在するので、「ホテルの予約をし」と「退院」との文字列に分割できる。そのほか、候補文字列の先頭の文字列部分に該当するラベル702は、文字列「タイの」がラベル702「B」、文字列「たインド」がラベル702「I」として得られる。
この場合、全ての組合せ文字列701に共通し、かつ分割点で分割した結果が確定文字列に含まれるような文字列、つまり、それぞれの組合せ文字列でラベル702が「B」で共通する分割点が存在しない。よって、新たな処理単位文字列は生成されず、処理単位記憶部105には追加されない。
一方、第1の実施形態に係る音声同時処理装置では、発話の文脈を解析して処理単位を検出するため、元の発話が有する意図が正しく反映されない処理単位の出力を抑制することができる。
第2の実施形態では、発話の状況に応じて処理単位文字列に関する情報を更新する点が第1の実施形態と異なる。このようにすることで、後続する音声の認識結果によって適切な処理単位が変わってしまう場合でも、元の発話が持つ意図が正しく反映された処理単位を出力できる。
第2の実施形態に係る音声同時処理装置800は、取得部101、認識結果記憶部103、検出部104、出力部106、音声認識部801、処理単位記憶部802および更新部803を含む。
取得部101、認識結果記憶部103、検出部104および出力部106については、第1の実施形態と同様の動作を行なうのでここでの説明は省略する。
さらに、更新部803は、追加された処理単位情報に先行して、予め設定した時間内に連続して発話された音声区間に対応する処理単位情報が存在する場合、対応する処理単位情報に含まれる処理単位文字列を時系列順に連結して、再処理単位文字列を生成する。さらに、再処理単位文字列の分割点と処理単位記憶部802に記憶された処理単位文字列の分割点とが異なる場合、連結された以前の処理単位情報に含まれる処理単位文字列と時間情報とを、再処理単位文字列と再処理単位文字列に対応する時間情報とに置き換える。
ステップS201からステップS203まで、およびステップS205の処理については、第1の実施形態に係る音声同時処理装置100の動作と同様であるので説明を省略する。
ステップS902では、更新部803が、未出力の処理単位情報が存在するかどうかを判定する。未出力の処理単位情報が存在する場合は、ステップS903へ進み、未出力の処理単位情報が存在しない場合は、ステップS205に進む。
ステップS903では、予め設定した時間内に連続して発話された処理単位文字列が複数あれば、複数の処理単位文字列を時系列順に沿って連結し、再処理単位文字列を生成する。
ステップS905では、更新部803が、再処理単位文字列について、処理単位記憶部802に記憶される処理単位文字列の分割点と異なる分割点を検出したかどうかを判定する。異なる分割点を検出した場合はステップS906に進み、異なる分割点を検出しない場合はステップS205に進む。
ステップS906では、更新部803が、処理単位記憶部802に記憶される処理単位情報を再処理単位文字列を含む新たな処理単位情報で更新し、ステップS205へ進む。以上で第2の実施形態に係る音声同時処理装置800の動作を終了する。
図10は、処理単位情報1000を示すテーブルであり、処理単位情報1000として、処理単位文字列501と時間情報1001とが対応付けられて記憶される。ここでは、時間情報1001として、処理単位文字列501を検出した区間に対応する音声の開始時刻1002と終了時刻1003とが処理単位文字列501に対応付けられる。具体的には、図10に示す処理単位文字列501「千葉市内で」と、開始時刻1002「10:03:31.21」と、終了時刻1003「10:03:32.73」とが対応付けられる。
まず、図10に示す処理単位情報1000に含まれる処理単位文字列「千葉市内で」が未出力であり、予め設定した時間内で連続する発話に対応する文字列は、「千葉市内で」のみであると仮定する。このとき、更新部803のステップS902の処理において、未出力の処理単位情報が存在すると判定され、処理単位文字列「千葉市内で」について分割点を検出する。
ここで、図12に示す処理単位情報が出力部106から全て出力された状態、すなわち、「千葉市内で」、「ホテルの予約をしたいんですが」、「良いホテルを見つけて」が順に出力された状態を仮定する。音声同時処理装置800が機械翻訳装置に接続される場合は、「In Chiba city」、「I’d like to make a hotel reservation.」、「Please find a good hotel.」が出力されると仮定する。
図9に示す更新部803の更新処理において、処理単位情報1301「もらえませんか」が未出力であるため、処理単位情報1301「もらえませんか」が処理対象となる。このとき、連続して発話したかどうかの閾値が、1秒であった場合、処理単位情報1302「千葉市内で」と処理単位情報1303「ホテルを予約したいんですが」との発話間の差は、0.05秒であり、処理単位情報1303「ホテルを予約したいんですが」と処理単位情報1304「良いホテルを見つけて」との差は0.17秒、および、処理単位情報1304「良いホテルを見つけて」と処理単位情報1301「もらえませんか」との差は、0.31秒であるため、これらの処理単位情報に対応する発話は、予め設定した時間内に連続して発話されたと決定する。よって、これらの処理単位文字列を時系列順に連結した組合せ文字列「千葉市内でホテルの予約をしたいんですが良いホテルをみつけてもらえませんか」が、再処理単位文字列として生成される。
図14に示すように分割点の検出結果として、図13に示す処理単位文字列「良いホテルを見つけて」と「もらえませんか」とは異なる処理単位文字列「良いホテルを見つけてもらえませんか」が検出される。
処理単位情報として、図13に示す処理単位情報1304「良いホテルを見つけて」と処理単位情報1301「もらえませんか」とが、図15に示す処理単位情報1501「良いホテルを見つけてもらえませんか」に更新される。また、処理単位文字列「良いホテルを見つけてもらえませんか」の音声に対応する開始時刻1002と終了時刻1003とが、処理単位情報1304「良いホテルを見つけて」の開始時刻「10:03:37.72」と処理単位情報1301「もらえませんか」の終了時刻「10:03:41.97」とに更新される。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
Claims (10)
- 音声信号を取得する取得部と、
前記音声信号のうち音声認識処理を完了して文字列に変換された音声区間に対応する文字列である確定文字列と、該確定文字列に続く音声区間であって音声認識の処理途上にあり、変換結果である文字列が確定していない音声区間に対応する複数の候補文字列とを生成する音声認識部と、
前記確定文字列と複数の前記候補文字列とをそれぞれ連結した複数の組合せ文字列に対し、自然言語処理における処理単位の開始位置となる形態素の位置を示す分割点により各組合せ文字列を分割した際に、前記各組合せ文字列における先頭から最初の分割点までの文字列のそれぞれが前記確定文字列と一致する場合、該文字列を処理単位文字列として検出する検出部と、
前記処理単位文字列を出力する出力部と、を具備することを特徴とする音声同時処理装置。 - 新たに取得した第1処理単位文字列と以前に取得された第2処理単位文字列との関係により、前記分割点の位置が変化する場合、前記第2処理単位文字列を更新する更新部をさらに具備することを特徴とする請求項1に記載の音声同時処理装置。
- 前記処理単位文字列と、該処理単位文字列が発話された音声区間に対応する音声信号の時間情報とを対応付けて処理単位情報として記憶する記憶部と、
前記記憶部に新たな処理単位情報である第1処理単位情報が追加された場合に、該第1処理単位情報に先行しかつ閾値以内の時間で連続して発話された音声区間に対応する第2処理単位情報が存在する場合、該第2処理単位情報と前記第1処理単位情報とに含まれる処理単位文字列を時系列順に連結して再処理単位文字列を生成し、該再処理単位文字列および該再処理単位文字列に対応する時間情報で前記記憶部に記憶される処理単位情報を更新する更新部と、をさらに具備することを特徴とする請求項1に記載の音声同時処理装置。 - 前記音声認識部は、前記処理単位文字列が発話された時間に関する時間情報を取得し、
前記更新部は、前記時間情報を参照して、前記第2処理単位情報が存在するかどうかを判定することを特徴とする請求項3に記載の音声同時処理装置。 - 前記音声認識部は、話者の話す速度である話速を取得し、
前記更新部は、前記話速を参照して、前記第2処理単位情報が存在するかどうかを判定することを特徴とする請求項3に記載の音声同時処理装置。 - 前記自然言語処理が機械翻訳の場合、前記処理単位は、前記音声信号を同時並行して訳出するのに適する翻訳単位であることを特徴とする請求項1から請求項5のいずれか1項に記載の音声同時処理装置。
- 前記自然言語処理が音声対話の場合、前記処理単位は、前記音声信号を同時並行して音声対話のタスクとして出力される単位であることを特徴とする請求項1から請求項5のいずれか1項に記載の音声同時処理装置。
- 音声信号を取得し、
前記音声信号のうち音声認識処理を完了して文字列に変換された音声区間に対応する文字列である確定文字列と、該確定文字列に続く音声区間であって音声認識の処理途上にあり、変換結果である文字列が確定していない音声区間に対応する複数の候補文字列とを生成し、
前記確定文字列と複数の前記候補文字列とをそれぞれ連結した複数の組合せ文字列に対し、自然言語処理における処理単位の開始位置となる形態素の位置を示す分割点により各組合せ文字列を分割した際に、前記各組合せ文字列における先頭から最初の分割点までの文字列のそれぞれが前記確定文字列と一致する場合、該文字列を処理単位文字列として検出し、
前記処理単位文字列を出力することを特徴とする音声同時処理方法。 - コンピュータを、
音声信号を取得する取得手段と、
前記音声信号のうち音声認識処理を完了して文字列に変換された音声区間に対応する文字列である確定文字列と、該確定文字列に続く音声区間であって音声認識の処理途上にあり、変換結果である文字列が確定していない音声区間に対応する複数の候補文字列とを生成する音声認識手段と、
前記確定文字列と複数の前記候補文字列とをそれぞれ連結した複数の組合せ文字列に対し、自然言語処理における処理単位の開始位置となる形態素の位置を示す分割点により各組合せ文字列を分割した際に、前記各組合せ文字列における先頭から最初の分割点までの文字列のそれぞれが前記確定文字列と一致する場合、該文字列を処理単位文字列として検出する検出手段と、
前記処理単位文字列を出力する出力手段として機能させるための音声同時処理プログラム。 - 音声信号を取得する取得部と、
前記音声信号のうち音声認識処理を完了して文字列に変換された音声区間に対応する文字列である確定文字列と、該確定文字列に続く音声区間であって音声認識の処理途上にあり、変換結果である文字列が確定していない音声区間に対応する候補文字列とを生成する音声認識部と、
前記確定文字列と前記候補文字列とを連結した組合せ文字列に対し、自然言語処理における処理単位の開始位置となる形態素の位置を示す分割点により該組合せ文字列を分割した際に、該組合せ文字列における先頭から最初の分割点までの文字列が前記確定文字列と一致する場合、該文字列を処理単位文字列として検出する検出部と、
前記処理単位文字列を出力する出力部と、を具備することを特徴とする音声同時処理装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013194639A JP6235280B2 (ja) | 2013-09-19 | 2013-09-19 | 音声同時処理装置、方法およびプログラム |
CN201410465639.7A CN104464734A (zh) | 2013-09-19 | 2014-09-12 | 声音同时处理装置、方法及程序 |
US14/490,722 US9672820B2 (en) | 2013-09-19 | 2014-09-19 | Simultaneous speech processing apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013194639A JP6235280B2 (ja) | 2013-09-19 | 2013-09-19 | 音声同時処理装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015060127A JP2015060127A (ja) | 2015-03-30 |
JP6235280B2 true JP6235280B2 (ja) | 2017-11-22 |
Family
ID=52668735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013194639A Active JP6235280B2 (ja) | 2013-09-19 | 2013-09-19 | 音声同時処理装置、方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9672820B2 (ja) |
JP (1) | JP6235280B2 (ja) |
CN (1) | CN104464734A (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6303622B2 (ja) * | 2014-03-06 | 2018-04-04 | ブラザー工業株式会社 | 画像処理装置 |
JP2016057986A (ja) * | 2014-09-11 | 2016-04-21 | 株式会社東芝 | 音声翻訳装置、方法およびプログラム |
JP2016062357A (ja) | 2014-09-18 | 2016-04-25 | 株式会社東芝 | 音声翻訳装置、方法およびプログラム |
US11875392B1 (en) * | 2014-12-23 | 2024-01-16 | Amazon Technologies, Inc. | Method and system for determining and presenting information related to a semantic context of electronic message text or voice data |
JP6470097B2 (ja) | 2015-04-22 | 2019-02-13 | 株式会社東芝 | 通訳装置、方法およびプログラム |
JP2017167805A (ja) | 2016-03-16 | 2017-09-21 | 株式会社東芝 | 表示支援装置、方法およびプログラム |
WO2019031268A1 (ja) * | 2017-08-09 | 2019-02-14 | ソニー株式会社 | 情報処理装置、及び情報処理方法 |
CN110619873A (zh) * | 2019-08-16 | 2019-12-27 | 北京小米移动软件有限公司 | 音频处理方法、装置及存储介质 |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3006496B2 (ja) | 1996-03-21 | 2000-02-07 | 日本電気株式会社 | 音声認識装置 |
US6374219B1 (en) * | 1997-09-19 | 2002-04-16 | Microsoft Corporation | System for using silence in speech recognition |
JP3633254B2 (ja) | 1998-01-14 | 2005-03-30 | 株式会社日立製作所 | 音声認識システムおよびそのプログラムを記録した記録媒体 |
JP4465564B2 (ja) * | 2000-02-28 | 2010-05-19 | ソニー株式会社 | 音声認識装置および音声認識方法、並びに記録媒体 |
JP2002149187A (ja) * | 2000-11-07 | 2002-05-24 | Sony Corp | 音声認識装置および音声認識方法、並びに記録媒体 |
GB2391679B (en) * | 2002-02-04 | 2004-03-24 | Zentian Ltd | Speech recognition circuit using parallel processors |
JP2004012615A (ja) | 2002-06-04 | 2004-01-15 | Sharp Corp | 連続音声認識装置および連続音声認識方法、連続音声認識プログラム、並びに、プログラム記録媒体 |
US7664642B2 (en) * | 2004-03-17 | 2010-02-16 | University Of Maryland | System and method for automatic speech recognition from phonetic features and acoustic landmarks |
JP4322785B2 (ja) * | 2004-11-24 | 2009-09-02 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識プログラム |
US8560327B2 (en) * | 2005-08-26 | 2013-10-15 | Nuance Communications, Inc. | System and method for synchronizing sound and manually transcribed text |
JP2007079122A (ja) * | 2005-09-14 | 2007-03-29 | Advanced Telecommunication Research Institute International | 音声処理装置、およびプログラム |
US7831425B2 (en) * | 2005-12-15 | 2010-11-09 | Microsoft Corporation | Time-anchored posterior indexing of speech |
JP2008134475A (ja) * | 2006-11-28 | 2008-06-12 | Internatl Business Mach Corp <Ibm> | 入力された音声のアクセントを認識する技術 |
US8515728B2 (en) * | 2007-03-29 | 2013-08-20 | Microsoft Corporation | Language translation of visual and audio input |
US7917355B2 (en) * | 2007-08-23 | 2011-03-29 | Google Inc. | Word detection |
JP2009058671A (ja) * | 2007-08-30 | 2009-03-19 | National Institute Of Information & Communication Technology | 処理単位分割装置、処理単位分割方法、プログラム、及びデータ構造 |
JP2010230695A (ja) * | 2007-10-22 | 2010-10-14 | Toshiba Corp | 音声の境界推定装置及び方法 |
JP5112116B2 (ja) | 2008-03-07 | 2013-01-09 | 株式会社東芝 | 機械翻訳する装置、方法およびプログラム |
US9583095B2 (en) | 2009-07-17 | 2017-02-28 | Nec Corporation | Speech processing device, method, and storage medium |
CN101996631B (zh) * | 2009-08-28 | 2014-12-03 | 国际商业机器公司 | 用于对齐文本的方法和装置 |
JPWO2011033834A1 (ja) * | 2009-09-18 | 2013-02-07 | 日本電気株式会社 | 音声翻訳システム、音声翻訳方法および記録媒体 |
JP2011092496A (ja) | 2009-09-29 | 2011-05-12 | Imasen Electric Ind Co Ltd | リクライニング装置 |
WO2011070972A1 (ja) * | 2009-12-10 | 2011-06-16 | 日本電気株式会社 | 音声認識システム、音声認識方法および音声認識プログラム |
US20110218802A1 (en) * | 2010-03-08 | 2011-09-08 | Shlomi Hai Bouganim | Continuous Speech Recognition |
JP5058280B2 (ja) | 2010-03-12 | 2012-10-24 | シャープ株式会社 | 翻訳装置、翻訳方法及びコンピュータプログラム |
JP5725028B2 (ja) * | 2010-08-10 | 2015-05-27 | 日本電気株式会社 | 音声区間判定装置、音声区間判定方法および音声区間判定プログラム |
KR20130014893A (ko) * | 2011-08-01 | 2013-02-12 | 한국전자통신연구원 | 음성 인식 장치 및 방법 |
JP5750380B2 (ja) | 2012-02-10 | 2015-07-22 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法および音声翻訳プログラム |
JP2013206253A (ja) | 2012-03-29 | 2013-10-07 | Toshiba Corp | 機械翻訳装置、方法、およびプログラム |
JP5653392B2 (ja) | 2012-06-29 | 2015-01-14 | 株式会社東芝 | 音声翻訳装置、方法およびプログラム |
US9734820B2 (en) * | 2013-11-14 | 2017-08-15 | Nuance Communications, Inc. | System and method for translating real-time speech using segmentation based on conjunction locations |
-
2013
- 2013-09-19 JP JP2013194639A patent/JP6235280B2/ja active Active
-
2014
- 2014-09-12 CN CN201410465639.7A patent/CN104464734A/zh not_active Withdrawn
- 2014-09-19 US US14/490,722 patent/US9672820B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20150081272A1 (en) | 2015-03-19 |
JP2015060127A (ja) | 2015-03-30 |
US9672820B2 (en) | 2017-06-06 |
CN104464734A (zh) | 2015-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6235280B2 (ja) | 音声同時処理装置、方法およびプログラム | |
US10448115B1 (en) | Speech recognition for localized content | |
US9640175B2 (en) | Pronunciation learning from user correction | |
CN106463113B (zh) | 在语音辨识中预测发音 | |
US10446147B1 (en) | Contextual voice user interface | |
US8731926B2 (en) | Spoken term detection apparatus, method, program, and storage medium | |
US9767790B2 (en) | Voice retrieval apparatus, voice retrieval method, and non-transitory recording medium | |
US11074909B2 (en) | Device for recognizing speech input from user and operating method thereof | |
JP6011565B2 (ja) | 音声検索装置、音声検索方法及びプログラム | |
JP2013206253A (ja) | 機械翻訳装置、方法、およびプログラム | |
US9754024B2 (en) | Voice retrieval apparatus, voice retrieval method, and non-transitory recording medium | |
KR20080018622A (ko) | 휴대용 단말기의 음성 인식 시스템 | |
US10535339B2 (en) | Recognition result output device, recognition result output method, and computer program product | |
JP2016062357A (ja) | 音声翻訳装置、方法およびプログラム | |
KR20210001937A (ko) | 사용자의 음성 입력을 인식하는 디바이스 및 그 동작 방법 | |
Hu et al. | Phoneme-based contextualization for cross-lingual speech recognition in end-to-end models | |
KR102580904B1 (ko) | 음성 신호를 번역하는 방법 및 그에 따른 전자 디바이스 | |
JP2015201215A (ja) | 機械翻訳装置、方法、およびプログラム | |
JP6391925B2 (ja) | 音声対話装置、方法およびプログラム | |
JP6027754B2 (ja) | 適応化装置、音声認識装置、およびそのプログラム | |
JP6599914B2 (ja) | 音声認識装置、音声認識方法およびプログラム | |
JP2011075973A (ja) | 音声認識装置とその方法と、プログラム | |
JP5166195B2 (ja) | 音響分析パラメータ生成方法とその装置と、プログラムと記録媒体 | |
JP6526602B2 (ja) | 音声認識装置、その方法、及びプログラム | |
JP6006674B2 (ja) | 音響モデル選択装置とその方法とプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170221 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170926 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171026 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6235280 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |