JP2019133025A - 情報処理装置および情報処理方法 - Google Patents

情報処理装置および情報処理方法 Download PDF

Info

Publication number
JP2019133025A
JP2019133025A JP2018015434A JP2018015434A JP2019133025A JP 2019133025 A JP2019133025 A JP 2019133025A JP 2018015434 A JP2018015434 A JP 2018015434A JP 2018015434 A JP2018015434 A JP 2018015434A JP 2019133025 A JP2019133025 A JP 2019133025A
Authority
JP
Japan
Prior art keywords
input
speech recognition
character
characters
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018015434A
Other languages
English (en)
Other versions
JP7056185B2 (ja
Inventor
輝英 林田
Teruo Hayashida
輝英 林田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2018015434A priority Critical patent/JP7056185B2/ja
Priority to CN201910087000.2A priority patent/CN110111781B/zh
Priority to US16/262,131 priority patent/US11217238B2/en
Publication of JP2019133025A publication Critical patent/JP2019133025A/ja
Application granted granted Critical
Publication of JP7056185B2 publication Critical patent/JP7056185B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/086Recognition of spelled words
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

【課題】音声認識の精度を向上できる情報処理装置および情報処理方法を提供する。【解決手段】情報処理装置において、第1受付部30は、文字の入力を受け付ける。第2受付部32は、音声の入力を受け付ける。音声認識部38は、第1受付部30が1以上の文字の入力を受け付けた状態において、第2受付部32が音声の入力を受け付けた場合、当該音声を音声認識して、第1受付部30に入力された文字から始まる音声認識結果を出力する。【選択図】図1

Description

本発明は、音声情報を処理する情報処理装置および情報処理方法に関する。
ユーザによるタッチパッドへの入力内容に応じてナビゲーション装置のメニューの階層を選択し、その階層用の音声認識辞書を用いて音声認識を行う音声認識装置が知られている(例えば、特許文献1参照)。
特開2007−240688号公報
入力したい文字を音声認識以外の方法で途中まで入力した後、入力を断念して音声認識により入力しなおす場合がある。この場合に、音声認識の精度を向上させる余地がある。
本発明はこうした状況に鑑みてなされたものであり、その目的は、音声認識の精度を向上できる情報処理装置および情報処理方法を提供することにある。
上記課題を解決するために、本発明のある態様の情報処理装置は、文字の入力を受け付ける第1受付部と、音声の入力を受け付ける第2受付部と、前記第1受付部が1以上の文字の入力を受け付けた状態において、前記第2受付部が音声の入力を受け付けた場合、当該音声を音声認識して、前記第1受付部に入力された文字から始まる音声認識結果を出力する音声認識部と、を備える。
この態様によると、文字の入力を受け付けた状態において、音声の入力を受け付けた場合、入力された文字から始まる音声認識結果を出力するので、音声認識の精度を向上できる。
前記情報処理装置は、複数の単語を含む音声認識辞書を記憶する記憶部をさらに備えてもよい。前記音声認識部は、前記音声認識辞書の複数の単語の中から、前記第1受付部に入力された文字から始まる単語を選択して前記音声認識結果として出力してもよい。
前記音声認識部は、前記第1受付部に入力された文字から始まる前記音声認識結果が得られない場合、前記第1受付部に入力された文字とは無関係に前記音声認識結果を出力してもよい。
前記音声認識部は、前記第1受付部が複数の文字の入力を受け付け、且つ、前記複数の文字から始まる前記音声認識結果が得られない場合、前記複数の文字のうち予め定められた部分の文字から始まる前記音声認識結果を出力してもよい。
前記予め定められた部分の文字は、前記複数の文字の最後の文字以外の文字であってもよい。
本発明の別の態様は、情報処理方法である。この方法は、文字の入力を受け付けるステップと、音声の入力を受け付けるステップと、1以上の文字の入力を受け付けた状態において、音声の入力を受け付けた場合、当該音声を音声認識して、入力された文字から始まる音声認識結果を出力するステップと、を備える。
本発明によれば、音声認識の精度を向上できる。
第1の実施の形態に係る車載システムの構成を示すブロック図である。 図1の音声認識装置の処理を示すフローチャートである。
(第1の実施の形態)
図1は、第1の実施の形態に係る車載システム1の構成を示すブロック図である。車載システム1は、車両に搭載される。車載システム1は、入力装置10と、車載装置12と、マイク14と、音声認識スイッチ16と、音声認識装置18とを備える。
入力装置10は、ユーザの操作に応じて文字の入力を行うための装置である。入力装置10は、例えば、車両の運転席と助手席の間のセンターコンソールに設けられ、ユーザのタッチ操作が入力されるタッチパッドである。入力装置10は、タッチ操作による操作信号を車載装置12に出力する。ユーザは、センターコンソールに手首を置き、ダッシュボードに設けられた図示しない表示部を見ながら、入力装置10を見ずに入力装置10にタッチ操作、例えばスライド操作やタップ操作を入力して、文字入力を行ったり、車載機能を選択したりする。
入力装置10は、表示部の表示面に設けられ、ユーザのタッチ操作が入力されるタッチパネルであってもよいし、ユーザの操作が入力される他の入力装置であってもよい。
車載装置12は、入力装置10から供給される操作信号に基づいて、ユーザの操作に関連する画像を表示部に表示させる。車載装置12は、特に限定されないが、例えば、カーナビゲーション装置である。例えば、ユーザが車載装置12に経路案内用の目的地を設定する場合、ユーザによる入力装置10のスライド操作に応じて表示部に表示されるカーソルが移動し、表示部に表示された複数の文字のうち任意の文字の位置でタップ操作がなされると、その文字が車載装置12に入力される。このようにして、複数の文字が入力され、目的地の設定が実行される。文字入力は、入力した人名から電話番号を検索する場合など、様々な状況で行われうる。車載装置12は、入力された文字のデータを、音声認識装置18に出力する。
ユーザは、入力したい文字を入力装置10によって途中まで手入力した後、入力を断念する可能性がある。入力を断念する理由としては、例えば、入力装置10による文字入力に困難さや面倒さを感じたため、または、運転状況の変化のためなどが想定される。ユーザは、文字入力を断念した場合、音声認識によって文字を入力しなおす。例えば、入力したい文字が「ワンワンパーク」である場合、ユーザは、入力装置10によって「ワ」や「ワン」などまで入力した後、入力を断念し、「ワンワンパーク」と発話する。
マイク14は、車両の車室内に設けられ、車両の乗員により発話された音声を取得し、その音声のデータを音声認識装置18に出力する。
音声認識スイッチ16は、ユーザが音声認識を希望するときにユーザにより操作されるスイッチであり、例えば、ステアリングホイールに設けられている。音声認識スイッチ16は、例えば押しボタン式やレバー式のメカニカルスイッチであり、ユーザが押下すると、操作信号を音声認識装置18に出力する。
音声認識装置18は、第1受付部30と、第2受付部32と、第3受付部34と、記憶部36と、音声認識部38とを備える。音声認識装置18は、情報処理装置として機能する。
第1受付部30は、車載装置12から文字の入力を受け付け、その文字を音声認識部38に出力する。
第3受付部34は、音声認識スイッチ16から操作信号を受け付ける。第3受付部34は、操作信号を受け付けた場合、音声認識指示を第2受付部32に出力する。
第2受付部32は、第3受付部34から音声認識指示が出力された場合、所定期間、マイク14から音声の入力を受け付け、その音声を音声認識部38に出力する。
記憶部36は、複数の単語を含む音声認識辞書を記憶している。複数の単語は、例えば、カーナビゲーション装置に目的地として設定されうる地名、電話帳に登録された人名などの固有名詞を含む。記憶部36は、車載装置12に設けられていてもよい。
音声認識部38は、第1受付部30が文字の入力を受け付けていない状態において、第2受付部32が音声の入力を受け付けた場合、周知の技術によって当該音声を音声認識して、音声認識結果を車載装置12に出力する。具体的には、音声認識部38は、音声認識辞書の複数の単語の中から、認識された文字列との一致度が高い単語を選択して音声認識結果として出力する。
認識された文字列との一致度が高いとは、信頼度が高いともいえる。信頼度は、音声データから単語が正しく認識された可能性の度合いを示す。信頼度が高いほど、単語が正しく認識された可能性が高いことを示す。音声認識部38は、信頼度が所定値以上の1以上の音声認識結果を出力する。所定値は、実験により適宜設定することができる。
音声認識部38は、第1受付部30が1以上の文字の入力を受け付けた状態において、第2受付部32が音声の入力を受け付けた場合、当該音声を音声認識して、第1受付部30に入力された文字から始まる音声認識結果を車載装置12に出力する。具体的には、音声認識部38は、音声認識辞書の複数の単語の中から、第1受付部30に入力された文字から始まり、且つ、認識された文字列との一致度が高い単語を選択して音声認識結果として出力する。音声認識部38は、信頼度が所定値以上の1以上の音声認識結果を出力する。
例えば、入力したい文字が「ワンワンパーク」であり、第1受付部30に入力された文字が「ワン」であり、認識された文字列が「ワンワンパーク」であり、「ワンワンパーク」が音声認識辞書に含まれる場合、「ワンワンパーク」が音声認識結果として出力される。「ダイイチパーク」など、「ワン」以外の文字から始まる「・・パーク」が音声認識辞書に含まれていても、これらは音声認識結果として出力されない。また、「ワンホテル」など、「ワン」の文字から始まる「ワン・・」が音声認識辞書に含まれていても、これらの信頼度が低ければ、これらは音声認識結果として出力されない。
音声認識部38は、第1受付部30に入力された文字から始まる音声認識結果が得られない場合、すなわち、入力された文字から始まり、且つ、信頼度が所定値以上の音声認識結果が得られない場合、第1受付部30に入力された文字とは無関係に音声認識結果を出力する。つまり、この場合、音声認識部38は、音声認識辞書の複数の単語の中から、認識された文字列との一致度が高い単語を選択して音声認識結果として出力する。この場合、第1受付部30に入力された文字が誤っている可能性がある。
車載装置12は、音声認識部38から出力された1以上の音声認識結果を表示部に表示させ、そのなかから1つの音声認識結果をユーザに選択させる。このような選択は、ユーザによる入力装置10のタッチ操作に応じて実行される。これにより、音声認識結果である文字列が車載装置12に設定される。
この構成は、ハードウエア的には、任意のコンピュータのCPU、メモリ、その他のLSIで実現でき、ソフトウエア的にはメモリにロードされたプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。
次に、以上の構成による車載システム1の全体的な動作を説明する。図2は、図1の音声認識装置18の処理を示すフローチャートである。図2の処理は、定期的に繰り返される。
音声認識指示がない場合(S10のN)、処理を終了する。音声認識指示がある場合(S10のY)、第2受付部32は、マイク14から音声入力を受け付ける(S12)。第1受付部30に文字入力がなかった場合(S14のN)、音声認識部38は、音声を音声認識し(S16)、音声認識結果を出力し(S18)、処理を終了する。
第1受付部30に文字入力があった場合(S14のY)、音声認識部38は、文字入力を参照して音声を音声認識する(S20)。入力された文字から始まる音声認識結果が得られた場合(S22のY)、音声認識部38は、得られた音声認識結果を出力し(S24)、処理を終了する。入力された文字から始まる音声認識結果が得られない場合(S22のN)、音声認識部38は、入力された文字とは無関係に音声認識結果を出力し(S26)、処理を終了する。
このように本実施の形態によれば、文字の入力を受け付けた状態において、音声の入力を受け付けた場合、入力された文字から始まる音声認識結果を出力するので、文字入力を有効活用して、音声認識の精度を向上できる。
また、音声認識辞書の複数の単語の中から、入力された文字から始まる単語を選択して音声認識結果として出力するので、音声認識の精度をより向上できる。
また、入力された文字から始まる音声認識結果が得られない場合、第1受付部30に入力された文字とは無関係に音声認識結果を出力するので、文字が誤入力された場合にも適切に対処でき、より適切な音声認識結果を出力できる。
(第2の実施の形態)
第2の実施の形態では、第1受付部30に入力された複数の文字から始まる音声認識結果が得られない場合に、複数の文字のうち予め定められた部分の文字から始まる音声認識結果を出力することが、第1の実施の形態と異なる。以下では、第1の実施の形態との相違点を中心に説明する。
車載システム1の構成は、図1と同一であるため、図示は省略する。音声認識部38は、第1受付部30が複数の文字の入力を受け付け、且つ、複数の文字から始まる音声認識結果が得られない場合、複数の文字のうち予め定められた部分の文字から始まる音声認識結果を出力する。予め定められた部分の文字は、例えば、複数の文字の最後の1文字以外の文字である。つまり、音声認識部38は、複数の文字のうち最後の1文字を除外した1以上の文字から始まる音声認識結果を出力する。
例えば、入力したい文字が「ワンワンパーク」であるが、ユーザが2文字目の入力を誤り、第1受付部30に入力された文字が「ワワ」であり、続いて音声認識を行う状況を想定する。この状況で、認識された文字列が「ワンワンパーク」であり、「ワンワンパーク」が音声認識辞書に含まれ、「ワワ」から始まる単語が音声認識辞書に含まれない場合、音声認識結果は得られない。この場合、入力された「ワワ」から最後の「ワ」を除外した「ワ」から始まる「ワンワンパーク」が音声認識結果として出力される。
音声認識部38は、複数の文字のうち予め定められた部分の文字から始まる音声認識結果が得られない場合、入力された文字とは無関係に音声認識結果を出力する。
音声認識部38は、第1受付部30が1つの文字の入力を受け付け、且つ、入力された文字から始まる音声認識結果が得られない場合、入力された文字とは無関係に音声認識結果を出力する。
本実施の形態によれば、複数の文字から始まる音声認識結果が得られない場合、複数の文字のうち予め定められた部分の文字から始まる音声認識結果を出力するので、誤入力された可能性がある文字を除外して、正しい音声認識結果を出力できる可能性を高めることができる。
ユーザは、入力装置10により文字を誤入力すると、入力を断念する可能性がある。この場合、複数の文字のうち最後の1文字が誤っている。複数の文字のうち最後の1文字を除外した文字から始まる音声認識結果を出力するため、誤入力された可能性が高い最後の1文字を除外して、より精度の高い音声認識結果を出力できる。
以上、実施の形態をもとに本発明を説明した。実施の形態はあくまでも例示であり、各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
例えば、第1の実施の形態において、第1受付部30に入力された文字から始まる音声認識結果が得られない場合、音声認識部38は、音声認識結果が得られないことを車載装置12に通知して、待機してもよい。第2の実施の形態において、第1受付部30に入力された1つの文字から始まる音声認識結果が得られない場合、および、第1受付部30に入力された複数の文字のうち予め定められた部分の文字から始まる音声認識結果が得られない場合、音声認識部38は、音声認識結果が得られないことを車載装置12に通知して、待機してもよい。通知を受けた車載装置12は、音声認識できなかったことを音声や画像によりユーザに通知する。これらの場合、ユーザは、再度、音声認識スイッチ16を操作して発話を行う。音声認識部38は、新たな音声認識指示に応じて第2受付部32が新たな音声の入力を受け付けた場合、当該音声を音声認識して、第1受付部30に入力された文字とは無関係に音声認識結果を出力する。この変形例では、音声認識装置18の構成の自由度を向上できる。
1…車載システム、10…入力装置、12…車載装置、14…マイク、16…音声認識スイッチ、18…音声認識装置、30…第1受付部、32…第2受付部、34…第3受付部、36…記憶部、38…音声認識部。

Claims (6)

  1. 文字の入力を受け付ける第1受付部と、
    音声の入力を受け付ける第2受付部と、
    前記第1受付部が1以上の文字の入力を受け付けた状態において、前記第2受付部が音声の入力を受け付けた場合、当該音声を音声認識して、前記第1受付部に入力された文字から始まる音声認識結果を出力する音声認識部と、
    を備えることを特徴とする情報処理装置。
  2. 複数の単語を含む音声認識辞書を記憶する記憶部をさらに備え、
    前記音声認識部は、前記音声認識辞書の複数の単語の中から、前記第1受付部に入力された文字から始まる単語を選択して前記音声認識結果として出力することを特徴とする請求項1に記載の情報処理装置。
  3. 前記音声認識部は、前記第1受付部に入力された文字から始まる前記音声認識結果が得られない場合、前記第1受付部に入力された文字とは無関係に前記音声認識結果を出力することを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記音声認識部は、前記第1受付部が複数の文字の入力を受け付け、且つ、前記複数の文字から始まる前記音声認識結果が得られない場合、前記複数の文字のうち予め定められた部分の文字から始まる前記音声認識結果を出力することを特徴とする請求項1または2に記載の情報処理装置。
  5. 前記予め定められた部分の文字は、前記複数の文字の最後の文字以外の文字であることを特徴とする請求項4に記載の情報処理装置。
  6. 文字の入力を受け付けるステップと、
    音声の入力を受け付けるステップと、
    1以上の文字の入力を受け付けた状態において、音声の入力を受け付けた場合、当該音声を音声認識して、入力された文字から始まる音声認識結果を出力するステップと、
    を備えることを特徴とする情報処理方法。
JP2018015434A 2018-01-31 2018-01-31 情報処理装置および情報処理方法 Active JP7056185B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018015434A JP7056185B2 (ja) 2018-01-31 2018-01-31 情報処理装置および情報処理方法
CN201910087000.2A CN110111781B (zh) 2018-01-31 2019-01-29 信息处理装置和信息处理方法
US16/262,131 US11217238B2 (en) 2018-01-31 2019-01-30 Information processing device and information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018015434A JP7056185B2 (ja) 2018-01-31 2018-01-31 情報処理装置および情報処理方法

Publications (2)

Publication Number Publication Date
JP2019133025A true JP2019133025A (ja) 2019-08-08
JP7056185B2 JP7056185B2 (ja) 2022-04-19

Family

ID=67393615

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018015434A Active JP7056185B2 (ja) 2018-01-31 2018-01-31 情報処理装置および情報処理方法

Country Status (3)

Country Link
US (1) US11217238B2 (ja)
JP (1) JP7056185B2 (ja)
CN (1) CN110111781B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021010474A1 (ja) 2019-07-18 2021-01-21 住友電気工業株式会社 立方晶窒化硼素焼結体

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62229300A (ja) * 1986-03-31 1987-10-08 キヤノン株式会社 音声認識装置
JP2000056792A (ja) * 1998-05-25 2000-02-25 Nokia Mobile Phones Ltd ユ―ザの発話を認識するための方法及び装置
JP2000187658A (ja) * 1998-12-22 2000-07-04 Toshiba Corp 文字列予測方法、及び文字列予測装置
JP2002350146A (ja) * 2001-05-25 2002-12-04 Mitsubishi Electric Corp ナビゲーション装置
JP2005196140A (ja) * 2003-12-30 2005-07-21 Microsoft Corp テキストを入力するための方法
WO2006137246A1 (ja) * 2005-06-21 2006-12-28 Pioneer Corporation 音声認識装置、音声認識方法、音声認識プログラムおよび記録媒体
US20080133228A1 (en) * 2006-11-30 2008-06-05 Rao Ashwin P Multimodal speech recognition system

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11184495A (ja) * 1997-12-24 1999-07-09 Toyota Motor Corp 音声認識装置
US7881936B2 (en) * 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
JP2001042996A (ja) 1999-07-28 2001-02-16 Toshiba Corp 文書作成装置、文書作成方法
JP2004234529A (ja) 2003-01-31 2004-08-19 Cross Culture Ltd キオスク端末
US8095364B2 (en) * 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
JP2007240688A (ja) 2006-03-07 2007-09-20 Clarion Co Ltd 音声認識装置及びそれを用いたナビゲーション装置、音声認証装置、方法及びプログラム
US8612230B2 (en) * 2007-01-03 2013-12-17 Nuance Communications, Inc. Automatic speech recognition with a selection list
CN101082836A (zh) * 2007-06-29 2007-12-05 华中科技大学 一种整合语音输入和手写输入功能的汉字输入系统
JP2010038751A (ja) * 2008-08-06 2010-02-18 Alpine Electronics Inc ナビゲーション装置
EP2339576B1 (en) * 2009-12-23 2019-08-07 Google LLC Multi-modal input on an electronic device
EP3084714A4 (en) * 2013-12-20 2017-08-02 Robert Bosch GmbH System and method for dialog-enabled context-dependent and user-centric content presentation
US10446141B2 (en) * 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
KR102277749B1 (ko) * 2014-11-13 2021-07-16 엘지전자 주식회사 디스플레이 장치 및 그 제어 방법
CN106155992A (zh) * 2015-03-24 2016-11-23 中兴通讯股份有限公司 语音和/或字符信息的过滤方法、装置及终端
KR20190138915A (ko) * 2018-06-07 2019-12-17 현대자동차주식회사 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62229300A (ja) * 1986-03-31 1987-10-08 キヤノン株式会社 音声認識装置
JP2000056792A (ja) * 1998-05-25 2000-02-25 Nokia Mobile Phones Ltd ユ―ザの発話を認識するための方法及び装置
JP2000187658A (ja) * 1998-12-22 2000-07-04 Toshiba Corp 文字列予測方法、及び文字列予測装置
JP2002350146A (ja) * 2001-05-25 2002-12-04 Mitsubishi Electric Corp ナビゲーション装置
JP2005196140A (ja) * 2003-12-30 2005-07-21 Microsoft Corp テキストを入力するための方法
WO2006137246A1 (ja) * 2005-06-21 2006-12-28 Pioneer Corporation 音声認識装置、音声認識方法、音声認識プログラムおよび記録媒体
US20080133228A1 (en) * 2006-11-30 2008-06-05 Rao Ashwin P Multimodal speech recognition system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
渡邉康司 他: ""音声とペン入力の同時入力に対する認識方式の検討"", 電子情報通信学会技術研究報告, vol. 106, no. 123, JPN6021030814, 16 June 2006 (2006-06-16), pages 49 - 54, ISSN: 0004566589 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021010474A1 (ja) 2019-07-18 2021-01-21 住友電気工業株式会社 立方晶窒化硼素焼結体

Also Published As

Publication number Publication date
CN110111781A (zh) 2019-08-09
US11217238B2 (en) 2022-01-04
US20190237075A1 (en) 2019-08-01
JP7056185B2 (ja) 2022-04-19
CN110111781B (zh) 2023-02-17

Similar Documents

Publication Publication Date Title
US10475448B2 (en) Speech recognition system
JP5637131B2 (ja) 音声認識装置
CN109427329B (zh) 信息处理装置、车载装置和存储介质
US9715877B2 (en) Systems and methods for a navigation system utilizing dictation and partial match search
JP2007535731A (ja) 殊に自動車のためのリスト項目選択方法および情報システムまたは娯楽システム
US20070005358A1 (en) Method for determining a list of hypotheses from a vocabulary of a voice recognition system
US8417036B2 (en) Method for selecting a designation
JP2019128374A (ja) 情報処理装置、及び情報処理方法
JP2019133025A (ja) 情報処理装置および情報処理方法
US20070180384A1 (en) Method for selecting a list item and information or entertainment system, especially for motor vehicles
US9128517B2 (en) Vehicular terminal with input switching
JP5986468B2 (ja) 表示制御装置、表示システム及び表示制御方法
JP2018028733A (ja) 入力装置、入力装置の制御方法、表示装置および入力プログラム
JP2000338993A (ja) 音声認識装置、その装置を用いたナビゲーションシステム
JP2002281145A (ja) 電話番号入力装置
JP3718088B2 (ja) 音声認識修正方式
JP2000122685A (ja) ナビゲーションシステム
US11341189B2 (en) Multi-character string search engine for in-vehicle information system
JP4453377B2 (ja) 音声認識装置、プログラム及びナビゲーション装置
JP2021174236A (ja) 制御装置、コンピュータプログラム、および制御システム
US9858918B2 (en) Root cause analysis and recovery systems and methods
JP2019139658A (ja) 情報処理装置および情報処理方法
JP2019212168A (ja) 音声認識システムおよび情報処理装置
JP2006260210A (ja) 文字入力装置
JP2017187559A (ja) 音声認識装置及びコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200826

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211008

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220321

R151 Written notification of patent or utility model registration

Ref document number: 7056185

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151