JP2013225115A - 音声認識装置、音声認識プログラム、及び、音声認識方法 - Google Patents
音声認識装置、音声認識プログラム、及び、音声認識方法 Download PDFInfo
- Publication number
- JP2013225115A JP2013225115A JP2013044442A JP2013044442A JP2013225115A JP 2013225115 A JP2013225115 A JP 2013225115A JP 2013044442 A JP2013044442 A JP 2013044442A JP 2013044442 A JP2013044442 A JP 2013044442A JP 2013225115 A JP2013225115 A JP 2013225115A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- correction
- corrected
- voice recognition
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 82
- 238000012937 correction Methods 0.000 claims abstract description 151
- 238000001514 detection method Methods 0.000 claims description 14
- 238000003780 insertion Methods 0.000 claims description 11
- 230000037431 insertion Effects 0.000 claims description 11
- 238000012217 deletion Methods 0.000 claims description 8
- 230000037430 deletion Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 235000016496 Panda oleosa Nutrition 0.000 claims 1
- 240000000220 Panda oleosa Species 0.000 claims 1
- 238000012545 processing Methods 0.000 description 22
- 238000006243 chemical reaction Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 15
- 230000004044 response Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Navigation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【解決手段】音声認識装置は、ドライバ等の発話内容の音声認識結果(音声文字列)を表示した後、ステアリングに取り付けられたタッチパッドを介して、ドライバから、音声文字列における誤認識箇所(誤認識文字列)の正常な音声認識結果である修正文字列の入力を受け付ける(S230)。そして、音声文字列から、修正文字列と文字数が同じ文字列を抽出すると共に、これらの文字列のうち、修正文字列と一致する文字が最も多い文字列を誤認識文字列として検出し(S240)、該誤認識文字列を修正文字列に置換することで、音声文字列の修正を行う(S265)。
【選択図】図4
Description
[構成の説明]
まず、第一実施形態の車載用の音声認識装置10の構成について、図1を用いて説明する。
すなわち、この音声認識装置10に搭載された(制御部13のROMに記憶された)音声認識プログラム100は、マイク11にて生成された音声信号に基づき周知の方法により音声認識を行い、音声認識結果を示す文字列(音声文字列)を生成する音声認識処理部110を有する(図3参照)。
次に、第一実施形態の音声認識装置10の動作について説明する。第一実施形態では、音声認識装置10は、タッチパッド20を介して入力された文字からなる修正文字列により、ドライバ等の発話内容の認識結果である音声文字列から、誤認識された文字列(誤認識文字列)を検出する。そして、音声文字列における誤認識文字列を修正文字列に置換することで修正済文字列を生成し、修正済文字列に基づき各種処理を行う。
S215では、制御部13は、過去に行われた音声文字列の修正の記録である修正記録データに基づく音声文字列の修正(自動修正)を行うか否かを判定する。
具体的には、例えば、図5に記載されているように、修正文字列300と同一の文字数の文字列を対象文字列とすると共に、最初に、音声文字列310の始端に位置する文字を先頭とする対象文字列320を抽出する。その後、先頭の文字を音声文字列310の終端に向かって一文字ずつずらしながら、音声文字列310から対象文字列321〜324を順次抽出する。そして、音声文字列310の終端に位置する文字を最後尾とする対象文字列325が抽出されると、音声文字列310から全ての対象文字列を抽出したものとし、対象文字列の抽出を終える。
また、これ以外にも、周知の方法により修正文字列を構成する各品詞を抽出し、これらの品詞を対象文字列として抽出しても良い。
なお、制御部13は、音声認識処理を終了すると、修正済文字列が、音声認識装置10や他の車載装置50への操作を行うための語句として登録された文字列と一致するか否かを判定し、一致する場合には、修正済文字列に基づき各種処理を行う。また、通信装置50cを介してメールの送信等が行われる場合には、修正済文字列を文書とし、車内LAN40を介して通信装置50cに送信する。
[構成の説明]
次に、第二実施形態の車載用の音声認識装置10について説明する。
次に、第二実施形態の音声認識装置10の動作について説明する。第二実施形態では、音声認識装置10は、タッチパッド20を介して修正文字列の入力を受け付けると共に、音声文字列に含まれる文字列を修正範囲として指定する操作を受け付ける。そして、修正範囲の文字列を修正文字列に置換することで音声文字列の修正を行い、修正済の音声文字列(修正済文字列)に基づき、第一実施形態と同様の処理を行う。
S415では、制御部13は、第一実施形態と同様にして、タッチパッド20を介して修正文字列の入力を受け付け、S420に処理を移行する。
具体的には、例えば、図7に記載されているように、制御部13は、表示部15に表示された音声文字列330の両端に位置する文字と重複した状態で、左カーソル331と右カーソル332とを表示する。
[構成の説明]
次に、第三実施形態の車載用の音声認識装置10について説明する。
次に、第三実施形態の音声認識装置10の動作について説明する。第三実施形態では、音声認識装置10は、タッチパッド20を介して音声文字列を編集する操作を受け付ける。また、修正文字列の入力を受け付けると共に、音声文字列における修正文字列の挿入位置や修正範囲を指定する操作を受け付け、これらに基づき音声文字列の編集を行う。そして、編集がなされた音声文字列(修正済文字列)に基づき、第一,第二実施形態と同様の処理を行う。
S515では、制御部13は、いずれかのタッチパッド20を介して、修正文字列を入力するか否かの指示を受け付ける。そして、該指示を受け付けた場合には(S515:Yes)、S525に処理を移行し、該指示を受け付けなかった場合には(S515:No)、S520に処理を移行する。
具体的には、図9に記載されているように、例えば、制御部13は、音声文字列の中央に位置する文字に重複した状態で、一つのカーソル350を表示し、タッチパッド20を介して受け付けた操作に応じて、カーソル350の位置をいずれかの文字に重複する位置に移動させる。
S530では、制御部13は、他方(例えば左側)のタッチパッド20を介して、修正文字列を用いて音声文字列を編集する指示を受け付ける。具体的には、例えば、S520と同様、該タッチパッド20に対するピンチ操作により修正範囲の指定を受け付けると共に、修正範囲の文字列を修正文字列に置換する指示を受け付けても良い。また、これ以外にも、例えば、該タッチパッド20に対するスライド操作により、修正文字列の挿入位置等の指定を受け付けると共に、該挿入位置に修正文字列を挿入する指示を受け付けても良い。
[構成の説明]
次に、第四実施形態の車載用の音声認識装置10について説明する。
[動作の説明]
次に、第四実施形態の音声認識装置10の動作について説明する。第四実施形態では、音声認識装置10は、第一実施形態と同様、タッチパッド20を介して入力された修正文字列により音声文字列から誤認識文字列を検出すると共に、誤認識文字列を修正文字列に置換することで修正済文字列を生成し、修正済文字列に基づき各種処理を行う。
S640では、音声認識装置10の制御部13は、一方のタッチパッド20を介して修正範囲の設定を受け付ける。
S650では、制御部13は、音声文字列における修正範囲に含まれる文字列の中から、第一実施形態における音声認識処理のS240と同様にして誤認識文字列を検出し、S655に処理を移行する。なお、修正範囲に複数の文字列が含まれるという場合には、各文字列に対して誤認識文字列の検出がなされる。
S675では、制御部13は、S265と同様にして、誤認識文字列を修正文字列に置換すると共に、置換がなされた音声文字列から削除文字列を削除することで、修正済文字列を生成する。そして、制御部13は、音声文字列の表示領域360において、修正文字列363,367を明示した状態で修正済文字列を表示し(図12,13)、S680に処理を移行する。
[第五実施形態]
[構成の説明]
まず、第五実施形態の音声認識装置について説明する。
次に、第五実施形態の音声認識装置(音声認識プログラム100を実行するPC60)の動作について説明する。PC60においても、第一或いは第四実施形態とほぼ同様の音声認識処理により、ユーザの発話内容の音声認識や音声認識結果の修正が行われるが、修正文字列や削除文字列の入力方法等が相違している。
第一〜第五実施形態の音声認識装置によれば、音声認識結果(音声文字列)に誤りがある場合には、タッチパッド20等を介して行った操作により該誤りを修正することができ、誤認識された部分(誤認識文字列)を容易且つ正確に修正することができる。このため、例えば車内のような騒音の多い環境であっても、発話による車載装置やPCの操作やメール等の文書の作成を円滑に行うことができる。
[他の実施形態]
(1)第一〜第五実施形態の音声認識装置では、音声認識結果を示すひらがなの文字列に対して漢字変換,カタカナ変換がなされたものが音声文字列として生成されると共に、ドライバ等により入力された文字列に漢字変換,カタカナ変換,ひらがな変換を行ったものが修正文字列として用いられる。しかしながら、この漢字変換等は必ずしも必要というわけではなく、ひらがな(或いはカタカナ)の音声文字列を生成すると共に、ドライバ等からひらがな(或いはカタカナ)の修正文字列の入力を受け付け、音声文字列の修正を行っても良い。
[特許請求の範囲との対応]
上記実施形態の説明で用いた用語と、特許請求の範囲の記載に用いた用語との対応を示す。
また、第一実施形態の音声認識処理のS205が認識手段,認識ステップに、S210が表示手段,表示ステップに、S220が修正手段に、S230,S235が受付手段,受付ステップに、S240が抽出手段,検出手段に、S250が検出手段に、S265が修正手段,修正ステップに、S270が記録手段に相当する。
また、第四実施形態の音声認識処理のS605が認識手段,認識ステップに、S610が表示手段,表示ステップに、S620が修正手段に、S630が受付手段,受付ステップに、S635〜S645が受付手段に、S650が検出手段,抽出手段に相当する。また、S660が検出手段に、S675が修正手段,修正ステップに、S680が記録手段に相当する。
Claims (19)
- ユーザにより発話された内容を認識し、認識結果を示す文字列である音声文字列を生成する認識手段(S205,S405,S505,S605)と、
前記認識手段により生成された前記音声文字列を表示する表示手段(S210,S410,S510,S610)と、
ユーザが体の一部に当接させた状態で操作を行う操作部(20,62)を介して、前記表示手段により表示された前記音声文字列の修正に用いる修正文字列の入力を受け付ける受付手段(S230,S415,S525,S630)と、
前記受付手段により入力が受け付けられた前記修正文字列を用いて、前記音声文字列の前記修正を行う修正手段(S265,S420,S425,S530,S535,S675)と、
を備えることを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記音声文字列における予め定められた修正範囲の中から、ユーザが発話した内容と異なる文字列である誤認識文字列を検出する検出手段(S240,S650)をさらに備え、
前記修正手段は、前記検出手段により検出された前記誤認識文字列を、前記受付手段により入力が受け付けられた前記修正文字列に置換することで、前記修正を行うこと(S265,S675)、
を特徴とする音声認識装置。 - 請求項2に記載の音声認識装置において、
前記操作部には、板状の操作面が設けられていること、
を特徴とする音声認識装置。 - 請求項2または請求項3に記載の音声認識装置において、
前記受付手段は、さらに、前記操作部を介して、前記修正範囲の入力を受け付け(S640)、
前記検出手段は、前記音声文字列における前記修正範囲から、前記誤認識文字列を検出すること(S650)、
を特徴とする音声認識装置。 - 請求項3を引用する請求項4に記載の音声認識装置において、
前記受付手段は、前記操作部の前記操作面をさする操作を、前記修正範囲を定めるための基準位置を指定する操作として検出すると共に、前記操作面を押圧する力の大きさを、前記基準位置を基準として前記修正範囲の指定する操作として検出することで、前記修正範囲の入力を受け付けること(S640)、
を特徴とする音声認識装置。 - 請求項5に記載の音声認識装置において、
前記受付手段は、前記修正範囲の入力を受け付けた後、さらに、前記操作部の前記操作面を予め定められた方向にさする操作を検出することで、前記修正の指示を受け付け(S645)、
前記修正手段は、前記受付手段が前記修正の指示を受け付けると、前記修正を行うこと(S675)、
を特徴とする音声認識装置。 - 請求項2から請求項6のうちのいずれか1項に記載の音声認識装置において、
前記検出手段は、前記修正範囲の中から、前記受付手段により入力が受け付けられた前記修正文字列と一致する文字が最も多い文字列を、前記誤認識文字列として検出し(S240,S650)、
前記修正手段は、前記検出手段により検出された前記誤認識文字列を、該誤認識文字列の検出に係る前記修正文字列に置換することで、前記修正を行うこと(S265,S675)、
を特徴とする音声認識装置。 - 請求項7に記載の音声認識装置において、
前記修正文字列を構成する文字の数に基づき定められた文字数を修正文字数とし、前記修正範囲における前記修正文字数の文字列を全て抽出する抽出手段(S240,S650)をさらに備え、
前記検出手段は、前記抽出手段により抽出された文字列のうち、前記修正文字列と一致する文字が最も多い文字列を、前記誤認識文字列として検出すること(S240,S650)、
を特徴とする音声認識装置。 - 請求項2から請求項8のうちのいずれか1項に記載の音声認識装置において、
前記認識手段は、漢字を含む文字列を前記音声文字列として生成し(S205,S605)、
前記受付手段は、前記修正に用いる文字列の入力を受け付けた後、該文字列を構成する予め定められた仮名文字を漢字に変換し、該変換がなされた文字列を、前記修正文字列とすること(S230,S630)、
を特徴とする音声認識装置。 - 請求項3、または、請求項3を引用する請求項4から請求項9のうちのいずれか1項に記載の音声認識装置において、
前記音声認識装置は車両に搭載されており、
前記操作部は、前記車両のステアリング(30)に取り付けられており、
前記受付手段は、前記操作部の前記操作面をさする操作により描かれた文字を検出することで、前記修正文字列の入力を受け付けること(S230,S630)、
を特徴とする音声認識装置。 - 請求項10に記載の音声認識装置において、
前記ステアリングには、少なくとも二つの前記操作部が取り付けられており、
前記受付手段は、いずれかの前記操作部を介して前記修正文字列の入力を受け付けると共に(S230,S630)、さらに、他の前記操作部の前記操作面をさする操作により描かれた文字を検出することで、前記音声文字列から削除すべき削除文字列の入力を受け付け(S235,S635)、
前記修正手段は、さらに、前記受付手段により入力が受け付けられた前記削除文字列を前記音声文字列から削除することで、該音声文字列を修正すること(S265,S675)、
を特徴とする音声認識装置。 - 請求項2から請求項11のうちのいずれか1項に記載の音声認識装置において、
前記修正手段によりなされた前記修正に係る前記誤認識文字列と、該誤認識文字列を置換した前記修正文字列とを修正記録として記録する記録手段(S270,S680)をさらに備え、
前記修正手段は、さらに、前記修正記録として記録された前記誤認識文字列が前記音声文字列に含まれている場合には、該誤認識文字列を、該修正記録において該誤認識文字列の置換に用いられたものとして記録された前記修正文字列に置換することで、前記修正を行うこと(S220,S620)、
を特徴とする音声認識装置。 - 請求項7、または、請求項7を引用する請求項8から請求項11のうちのいずれか1項に記載の音声認識装置において、
前記修正手段によりなされた前記修正に係る前記誤認識文字列と、該誤認識文字列を置換した前記修正文字列とを修正記録として記録する記録手段(S270,S680)をさらに備え、
前記検出手段は、前記音声文字列の中から、一つの前記修正文字列につき複数の文字列を前記誤認識文字列として検出した場合には、前記修正記録に係る前記誤認識文字列に基づき、検出した複数の文字列の中から、誤検出では無い前記誤認識文字列を特定すること(S250,S660)、
を特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記音声認識装置は、車両に搭載されており、
前記操作部(20)には、板状の操作面が設けられていると共に、前記車両のステアリング(30)に取り付けられており、
前記受付手段は、前記操作部の前記操作面をさする操作により描かれた文字を検出することで、前記修正文字列の入力を受け付けると共に(S415,S525)、該操作面を介して、前記音声文字列における前記修正文字列の挿入位置、或いは、前記音声文字列から削除する削除文字を指定する修正情報の入力を受け付け(S420,S530)、
前記修正手段は、前記音声文字列における前記修正情報により指定された前記挿入位置に前記修正文字列を挿入すると共に、前記修正情報により前記削除文字が指定された場合には、前記音声文字列から該削除文字を削除することで、前記修正を行うこと(S425,S535)、
を特徴とする音声認識装置。 - 請求項14に記載の音声認識装置において、
前記ステアリングには、少なくとも二つの前記操作部が取り付けられており、
前記受付手段は、いずれかの前記操作部を介して、前記削除文字から構成される削除文字列の一端を指定する前記修正情報の入力を受け付けると共に、他の前記操作部を介して、該削除文字列の他端を指定する前記修正情報の入力を受け付け(S420)、
前記表示手段は、前記音声文字列上に、前記修正情報により指定された、前記削除文字列の前記一端を示すカーソル及び前記他端を示すカーソルを表示すること(S420)、
を特徴とする音声認識装置。 - 請求項15に記載の音声認識装置において、
前記受付手段は、いずれかの前記操作部の前記操作面を押圧する力の大きさを、前記削除文字列の前記一端を指定する操作として検出することで、前記修正情報の入力を受け付けると共に、他の前記操作部の前記操作面を押圧する力の大きさを、該削除文字列の前記他端を指定する操作として検出することで、前記修正情報の入力を受け付けること(S420)、
を特徴とする音声認識装置。 - 請求項15に記載の音声認識装置において、
前記受付手段は、いずれかの前記操作部の前記操作面をさする操作を、前記削除文字列の前記一端を指定する操作として検出することで、前記修正情報の入力を受け付けると共に、他の前記操作部の前記操作面をさする操作を、該削除文字列の前記他端を指定する操作として検出することで、前記修正情報の入力を受け付けること(S420)、
を特徴とする音声認識装置。 - ユーザにより発話された内容を認識し、認識結果を示す文字列である音声文字列を生成する認識手段(S205,S405,S505,S605)と、
前記認識手段により生成された前記音声文字列を表示する表示手段(S210,S410,S510,S610)と、
ユーザが体の一部に当接させた状態で操作を行う操作部(20,62)を介して、前記表示手段により表示された前記音声文字列の修正に用いる修正文字列の入力を受け付ける受付手段(S230,S415,S525,S630)と、
前記受付手段により入力が受け付けられた前記修正文字列を用いて、前記音声文字列の前記修正を行う修正手段(S265,S420,S425,S530,S535,S675)と、
してコンピュータを動作させることを特徴とする音声認識プログラム。 - ユーザにより発話された内容を認識し、認識結果を示す文字列である音声文字列を生成する認識ステップ(S205,S405,S505,S605)と、
前記認識ステップにて生成された前記音声文字列を表示する表示ステップ(S210,S410,S510,S610)と、
ユーザが体の一部に当接させた状態で操作を行う操作部(20,62)を介して、前記表示ステップにて表示された前記音声文字列の修正に用いる修正文字列の入力を受け付ける受付ステップ(S230,S415,S525,S630)と、
前記受付ステップにて入力を受け付けた前記修正文字列を用いて、前記音声文字列の前記修正を行う修正ステップ(S265,S420,S425,S530,S535,S675)と、
を有することを特徴とする音声認識方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013044442A JP6169864B2 (ja) | 2012-03-21 | 2013-03-06 | 音声認識装置、音声認識プログラム、及び、音声認識方法 |
US13/847,001 US9153234B2 (en) | 2012-03-21 | 2013-03-19 | Speech recognition apparatus, method of recognizing speech, and computer readable medium for the same |
DE102013204841A DE102013204841A1 (de) | 2012-03-21 | 2013-03-19 | Spracherkennungsvorrichtung, Spracherkennungsverfahren und computerlesbares Speichermedium |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012064054 | 2012-03-21 | ||
JP2012064054 | 2012-03-21 | ||
JP2013044442A JP6169864B2 (ja) | 2012-03-21 | 2013-03-06 | 音声認識装置、音声認識プログラム、及び、音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013225115A true JP2013225115A (ja) | 2013-10-31 |
JP6169864B2 JP6169864B2 (ja) | 2017-07-26 |
Family
ID=49112433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013044442A Expired - Fee Related JP6169864B2 (ja) | 2012-03-21 | 2013-03-06 | 音声認識装置、音声認識プログラム、及び、音声認識方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9153234B2 (ja) |
JP (1) | JP6169864B2 (ja) |
DE (1) | DE102013204841A1 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020071286A1 (ja) * | 2018-10-03 | 2020-04-09 | パナソニックIpマネジメント株式会社 | 入力装置、入力方法および入力システム |
WO2020158218A1 (ja) * | 2019-01-28 | 2020-08-06 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
WO2021006401A1 (ko) * | 2019-07-11 | 2021-01-14 | 엘지전자 주식회사 | 자율주행시스템에서 차량의 제어 방법 및 그 장치 |
JP2021081731A (ja) * | 2020-05-15 | 2021-05-27 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッドBeijing Baidu Netcom Science Technology Co., Ltd. | 音声認識方法、装置、機器及び読み取り可能な記憶媒体 |
WO2023073945A1 (ja) * | 2021-10-29 | 2023-05-04 | パイオニア株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9218811B2 (en) * | 2013-06-28 | 2015-12-22 | Google Technology Holdings LLC | Electronic device and method for managing voice entered text using gesturing |
DE102014019005A1 (de) * | 2014-12-18 | 2016-06-23 | Audi Ag | Verfahren zum Betreiben einer Bedienvorrichtung eines Kraftfahrzeugs in unterschiedlichen Bedienmodi sowie Bedienvorrichtung und Kraftfahrzeug |
US9971758B1 (en) * | 2016-01-06 | 2018-05-15 | Google Llc | Allowing spelling of arbitrary words |
EP3474276A4 (en) * | 2016-06-15 | 2019-07-31 | Sony Corporation | INFORMATION PROCESSING DEVICE AND INFORMATION PROCESSING METHOD |
CN107657471B (zh) * | 2016-09-22 | 2021-04-30 | 腾讯科技(北京)有限公司 | 一种虚拟资源的展示方法、客户端及插件 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002350146A (ja) * | 2001-05-25 | 2002-12-04 | Mitsubishi Electric Corp | ナビゲーション装置 |
JP2007065347A (ja) * | 2005-08-31 | 2007-03-15 | Denso Corp | 音声認識システム |
JP2008293109A (ja) * | 2007-05-22 | 2008-12-04 | Toshiba Corp | テキスト処理装置及びプログラム |
JP2010039694A (ja) * | 2008-08-04 | 2010-02-18 | Yahoo Japan Corp | 文字修飾サーバ、装置、方法及びシステム |
JP2010113457A (ja) * | 2008-11-05 | 2010-05-20 | Ricoh Elemex Corp | ガス漏れ警報システム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3104661B2 (ja) * | 1997-11-25 | 2000-10-30 | 日本電気株式会社 | 日本語文章作成装置 |
US5970460A (en) * | 1997-12-05 | 1999-10-19 | Lernout & Hauspie Speech Products N.V. | Speech recognition and editing system |
JP2000259178A (ja) | 1999-03-08 | 2000-09-22 | Fujitsu Ten Ltd | 音声認識装置 |
US6986106B2 (en) * | 2002-05-13 | 2006-01-10 | Microsoft Corporation | Correction widget |
JP4042589B2 (ja) | 2003-02-27 | 2008-02-06 | 株式会社豊田中央研究所 | 車両用音声入力装置 |
JP2005096519A (ja) | 2003-09-22 | 2005-04-14 | Nissan Motor Co Ltd | 情報操作装置 |
JP2005283797A (ja) | 2004-03-29 | 2005-10-13 | Nissan Motor Co Ltd | 音声認識装置および音声認識方法 |
US7941316B2 (en) * | 2005-10-28 | 2011-05-10 | Microsoft Corporation | Combined speech and alternate input modality to a mobile device |
JP2009046082A (ja) | 2007-08-22 | 2009-03-05 | Denso Corp | 車両用操作装置及び車両用操作プログラム |
US20090326938A1 (en) * | 2008-05-28 | 2009-12-31 | Nokia Corporation | Multiword text correction |
JP2009298285A (ja) | 2008-06-12 | 2009-12-24 | Tokai Rika Co Ltd | 入力装置 |
JP2010018204A (ja) | 2008-07-11 | 2010-01-28 | Nippon Soken Inc | 情報提示装置および情報提示システム |
JP4966324B2 (ja) | 2009-01-19 | 2012-07-04 | 株式会社東芝 | 音声翻訳装置、および方法 |
JP5430382B2 (ja) | 2009-12-16 | 2014-02-26 | キヤノン株式会社 | 入力装置及び方法 |
JP5874435B2 (ja) | 2012-02-22 | 2016-03-02 | 株式会社日本自動車部品総合研究所 | 車両用入力装置 |
-
2013
- 2013-03-06 JP JP2013044442A patent/JP6169864B2/ja not_active Expired - Fee Related
- 2013-03-19 US US13/847,001 patent/US9153234B2/en active Active
- 2013-03-19 DE DE102013204841A patent/DE102013204841A1/de not_active Ceased
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002350146A (ja) * | 2001-05-25 | 2002-12-04 | Mitsubishi Electric Corp | ナビゲーション装置 |
JP2007065347A (ja) * | 2005-08-31 | 2007-03-15 | Denso Corp | 音声認識システム |
JP2008293109A (ja) * | 2007-05-22 | 2008-12-04 | Toshiba Corp | テキスト処理装置及びプログラム |
JP2010039694A (ja) * | 2008-08-04 | 2010-02-18 | Yahoo Japan Corp | 文字修飾サーバ、装置、方法及びシステム |
JP2010113457A (ja) * | 2008-11-05 | 2010-05-20 | Ricoh Elemex Corp | ガス漏れ警報システム |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020071286A1 (ja) * | 2018-10-03 | 2020-04-09 | パナソニックIpマネジメント株式会社 | 入力装置、入力方法および入力システム |
JPWO2020071286A1 (ja) * | 2018-10-03 | 2021-09-02 | パナソニックIpマネジメント株式会社 | 入力装置、入力方法および入力システム |
JP7178576B2 (ja) | 2018-10-03 | 2022-11-28 | パナソニックIpマネジメント株式会社 | 入力装置、入力方法および入力システム |
WO2020158218A1 (ja) * | 2019-01-28 | 2020-08-06 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
WO2021006401A1 (ko) * | 2019-07-11 | 2021-01-14 | 엘지전자 주식회사 | 자율주행시스템에서 차량의 제어 방법 및 그 장치 |
US11628851B2 (en) | 2019-07-11 | 2023-04-18 | Lg Electronics Inc. | Method and apparatus for controlling a vehicle in autonomous driving system |
JP2021081731A (ja) * | 2020-05-15 | 2021-05-27 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッドBeijing Baidu Netcom Science Technology Co., Ltd. | 音声認識方法、装置、機器及び読み取り可能な記憶媒体 |
JP7271497B2 (ja) | 2020-05-15 | 2023-05-11 | 阿波▲羅▼智▲聯▼(北京)科技有限公司 | 音声認識方法、装置、機器及び読み取り可能な記憶媒体 |
US11798548B2 (en) | 2020-05-15 | 2023-10-24 | Apollo Intelligent Connectivity (Beijing) Technology Co., Ltd. | Speech recognition method, apparatus, device and readable storage medium |
WO2023073945A1 (ja) * | 2021-10-29 | 2023-05-04 | パイオニア株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
DE102013204841A1 (de) | 2013-09-26 |
US20130275130A1 (en) | 2013-10-17 |
JP6169864B2 (ja) | 2017-07-26 |
US9153234B2 (en) | 2015-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6169864B2 (ja) | 音声認識装置、音声認識プログラム、及び、音声認識方法 | |
US7706615B2 (en) | Information processing method and information processing device | |
EP1016078B1 (en) | Speech recognition computer input method and device | |
US8879845B2 (en) | Character recognition for overlapping textual user input | |
JP4829901B2 (ja) | マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置 | |
TWI266280B (en) | Multimodal disambiguation of speech recognition | |
JP5622566B2 (ja) | アジア文字を生成するための認識アーキテクチャ | |
EP2535844A2 (en) | Character recognition for overlapping textual user input | |
US10643603B2 (en) | Acoustic model training using corrected terms | |
JP2006515073A (ja) | 音声認識を実行するための方法、システム、及びプログラミング | |
US9946704B2 (en) | Tone mark based text suggestions for chinese or japanese characters or words | |
WO2004023455A2 (en) | Methods, systems, and programming for performing speech recognition | |
US6963840B2 (en) | Method for incorporating multiple cursors in a speech recognition system | |
EP2897055A1 (en) | Information processing device, information processing method, and program | |
JP6355823B2 (ja) | 入力表示制御装置、入力表示制御方法及び入力表示システム | |
KR101385012B1 (ko) | 필기 및 음성 인식을 이용한 멀티모달 입력장치 및 그 입력장치의 제어방법 | |
WO2012144525A1 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP2002350146A (ja) | ナビゲーション装置 | |
KR20160000449A (ko) | 음성 인식 텍스트 수정 방법 및 이 방법을 구현한 장치 | |
US20200037049A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
JP2006039954A (ja) | データベース検索装置、プログラム及びナビゲーション装置 | |
JP2010015439A (ja) | 情報入力装置および情報処理方法 | |
US20240212674A1 (en) | System, method and device for multimodal text editing | |
US11886801B1 (en) | System, method and device for multimodal text editing | |
JP3592803B2 (ja) | 音声認識装置および音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150803 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161004 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20161201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170629 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6169864 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |