JP6233650B2 - 操作補助装置および操作補助方法 - Google Patents

操作補助装置および操作補助方法 Download PDF

Info

Publication number
JP6233650B2
JP6233650B2 JP2014104188A JP2014104188A JP6233650B2 JP 6233650 B2 JP6233650 B2 JP 6233650B2 JP 2014104188 A JP2014104188 A JP 2014104188A JP 2014104188 A JP2014104188 A JP 2014104188A JP 6233650 B2 JP6233650 B2 JP 6233650B2
Authority
JP
Japan
Prior art keywords
keyword
uttered
predetermined
sight
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014104188A
Other languages
English (en)
Other versions
JP2015219441A (ja
Inventor
威 関口
威 関口
國枝 伸行
伸行 國枝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2014104188A priority Critical patent/JP6233650B2/ja
Priority to US14/715,573 priority patent/US9418653B2/en
Publication of JP2015219441A publication Critical patent/JP2015219441A/ja
Application granted granted Critical
Publication of JP6233650B2 publication Critical patent/JP6233650B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/013Eye tracking input arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/083Recognition networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/24Speech recognition using non-acoustical features
    • G10L15/25Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/038Indexing scheme relating to G06F3/038
    • G06F2203/0381Multimodal input, i.e. interface arrangements enabling the user to issue commands by simultaneous use of input devices of different nature, e.g. voice plus gesture on digitizer
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、キーワードの発話による操作を補助する操作補助装置および操作補助方法に関する。
近年、予め定められたキーワードが発話されたときにこれを検出し、システムを起動させる等の所定の機器動作を開始させる技術が、広く実用化されている。
キーワードが発話されたか否かの判定(以下「キーワード判定」という)は、通常、発話音声にキーワードが含まれていることの尤もらしさ(以下「尤度」という)を示す評価値(スコア)を算出し、当該評価値が所定の閾値以上となっているか否かを判定することによって行われる。評価値は、例えば、発話音声に対する音声認識処理によって算出される。
ところが、実際にキーワードが発話されていても、周囲の音や発話の不明瞭さ等に起因して、評価値が低くなる場合がある。この場合、ユーザはキーワードを発話しているつもりであるにもかかわらず機器操作を行うことができないといった状況(以下「操作失敗」という)となる。
そこで、キーワードと発話音声との間の類似度を算出し、算出された類似度が所定の範囲内であるとき、キーワードが発話されたと判定する技術が、例えば特許文献1に記載されている。かかる従来技術によれば、操作失敗の発生を低減することができる。
特開平11−231896号公報 国際公開第2008/007781号
しかしながら、ユーザがキーワードを忘れていたり勘違いして覚えているような場合、キーワードと発話音声との間の類似度は低くなる。このため、従来技術では、操作失敗を回避することができずに、キーワード発話による操作(以下「キーワード発話操作」という)が不能となるおそれがある。
本発明の目的は、キーワード発話操作が不能となることを回避できる操作補助装置および操作補助方法を提供することである。
本開示の操作補助装置は、発話音声を入力する音声入力部と、ユーザの視線が所定の対象物に向いたとき、その旨を検出する視線入力部と、入力された複数の前記発話音声の間の類似度が所定の範囲内である後に、前記視線が前記所定の対象物に向いたことを条件として、前記所定の対象物に関連するキーワードが発話されたと判定するキーワード検出部と、を有する。
本開示の操作補助装置は、発話音声を入力する音声入力部から、入力された前記発話音声を取得し、ユーザの視線が所定の対象物に向いたとき、その旨を検出する視線入力部から、前記視線が前記所定の対象物に向いたか否かの検出結果を取得し、取得された複数の前記発話音声の間の類似度が所定の範囲内である後に、前記視線が所定の対象物に向いたことを条件として、前記所定の対象物に関連するキーワードが発話されたと判定するキーワード検出部、を有する。
本開示の操作補助装置は、発話音声を入力する音声入力部と、入力された前記発話音声を、所定の対象物に関連するキーワードが発話されたか否かの判定を行うキーワード検出装置へ送信する送信部と、前記キーワード検出装置から、前記キーワードが発話されたと判定されたことを示す発話検出情報が送信されたとき、当該発話検出情報を受信するクライアント側受信部と、を有し、ユーザの視線が前記所定の対象物に向いたとき、その旨を検出する視線入力部、を更に有し、前記送信部は、前記視線が前記所定の対象物に向いたか否かを示す情報を、前記キーワード検出装置へ送信し、前記キーワード検出装置は、複数の前記発話音声の間の類似度が所定の範囲内である後に、前記視線が所定の対象物に向いたことを条件として、前記所定の対象物に関連するキーワードが発話されたと判定する装置である。
本開示の操作補助方法は、発話音声を入力するステップと、ユーザの視線が前記所定の対象物に向いたとき、その旨を検出するステップと、入力された複数の前記発話音声の間の類似度が所定の範囲内である後に、前記視線が所定の対象物に向いたことを条件として、前記所定の対象物に関連するキーワードが発話されたと判定するステップと、を有する。
本開示によれば、キーワード発話操作が不能となることを回避できる。
本発明の実施の形態に係る操作補助装置の構成の一例を示すブロック図 本実施の形態におけるユーザの動作の例を示す図 本実施の形態におけるキーワード発話操作が試みられた場合に検出される情報の一例を示す図 本実施の形態に係る操作補助装置の動作の一例を示すフローチャート 本実施の形態に係る操作補助装置を用いた場合のユーザおよび対象物の動作の一例を示す図
以下、本発明の一実施の形態について、図面を参照して詳細に説明する。
本実施の形態は、本発明を、車両の運転席近傍に設置される対象物に適用した場合の、具体的態様の例である。
<操作補助装置の構成>
まず、本実施の形態に係る操作補助装置の構成について説明する。
図1は、本実施の形態に係る操作補助装置の構成の一例を示すブロック図である。
図1において、操作補助装置100は、音声入力部200、視線入力部300、およびキーワード検出部400を有する。なお、操作補助装置100は、キーワード発話操作の対象となる対象物500(例えば、カーエアコン制御装置)に接続されている。なお、対象物500は、操作補助装置100と一体的に構成されていてもよい。
対象物500に関連するキーワードは、予め定められているものとする。また、かかるキーワードは、対象物500に対して所定の動作(例えば、ユーザとの対話処理)を開始させるためのキーワードであるものとする。
音声入力部200は、ユーザの発話音声を入力し、入力された発話音声をキーワード検出部400へ出力する。例えば、音声入力部200は、マイクロフォン(図示せず)を備え、周囲の音を収集して音声データに変換し、キーワード検出部400へ出力する。例えば、車両の運転者あるいは同乗者が発話を行っている場合、当該音声データには、その発話音声が含まれることになる。
視線入力部300は、ユーザ(例えば、車両の運転者)の視線が前記所定の対象物に向いたとき、その旨を検出し、キーワード検出部400へ通知する。例えば、視線入力部300は、デジタルビデオカメラ(図示せず)を備え、ユーザの顔を撮影して得られた映像を解析し、ユーザの視線が対象物500に向いているか否かを、逐次判定する。なお、デジタルビデオカメラは、可視光カメラであってもよいし、赤外線カメラであってもよい。
ユーザの視線が対象物500に向いているか否かの判定(以下、「視線判定」という)は、例えば、特許文献2に記載の手法等の公知の視線方向検出手法を採用した上で、デジタルビデオカメラと対象物500との配置関係を設定することにより、行うことができる。なお、視線入力部300は、視線の方向と、ユーザから見た対象物500の方向との差が、所定の範囲内であるとき、ユーザが対象物500に視線を向けていると判定してもよい。かかる所定の範囲は、例えば、視線方向の検出誤差や、各機器の設置誤差を考慮して、決定される。
キーワード検出部400は、入力された複数の発話音声の間の類似度が所定の範囲内である直後に、ユーザの視線が対象物500に向いたことを条件として、対象物500に関連するキーワードが発話されたと判定する。そして、キーワード検出部400は、キーワードが発話されたと判定したとき、対象物500に対して前記所定の動作を開始させる。
キーワード検出部400は、キーワード判定部410、情報保存部420、および発話判定部430を有する。
キーワード判定部410は、キーワードが発話音声に含まれていることの尤度を示す評価値を算出する。そして、算出された前記評価値が、キーワード判定部410は、比較的高い値に対応する、第1の閾値以上の第1のレベルであるとき、キーワードが発話されたと判定する。また、キーワード判定部410は、キーワードが発話されたと判定すると、制御信号の出力等により、対象物500に対して所定の動作を開始させる。
評価値は、例えば、発声された音声がキーワードらしいほど大きな値となるように設定される。評価値としては、例えば、公知の音声認識処理により得られる、音声データに含まれる音声がキーワードに一致することを判定する際に用いられる信頼度を、採用することができる。信頼度は、隠れマルコフモデル(HMM: Hidden Markov Model)における事後確率や、音声認識処理で得られた尤度(音響的な尤度や言語的な尤度)をもとに算出できる。この場合、キーワード判定部410は、上記キーワードに関する音響モデル、辞書、および言語モデルを予め格納しており、これらの情報を参照して音声認識処理を行い、上記評価値を算出する。
あるいは、評価値としては、例えば、予め登録されたキーワードの音声データと入力された音声データとの間の距離から計算される類似度を採用することができる。類似度は、音声データ間の距離を、例えば、スペクトル等の所定の音特徴量を使った公知の距離算出手法により計算し、音声区間でDP(Dynamic Programming)マッチングを行う等して算出することができる。この場合、キーワード判定部410は、上記キーワードの音声データあるいは音特徴量を、予め格納している。
また、キーワード判定部410は、評価値が第1の閾値未満かつ第2の閾値以上という第2のレベルであるとき、当該評価値に対応する発話音声を、情報保存部420に保存する。なお、ここで保存される発話音声とは、音声データそのものであってもよいし、音声データ間の類似度の算出に必要な音特徴量であってもよい。
情報保存部420は、メモリ等の情報記録媒体を有し、キーワード判定部410および発話判定部430により使用される。すなわち、情報保存部420は、評価値が第2のレベルであると判定された区間の発話音声を保存する。
発話判定部430は、ユーザの視線が対象物500に向いたタイミングから遡った所定の時間内に入力された発話音声が、情報保存部420に2以上の所定数保存されているとき、情報保存部420から該当する発話音声を読み出す。ユーザの視線が対象物500に向いたタイミングから遡った所定の時間内とは、例えば、当該タイミングから10秒遡った時刻から、当該タイミングまでの区間である。そして、発話判定部430は、当該発話音声の間の類似度を算出し、算出された類似度が所定の範囲内であることを条件として、キーワードが発話されたと判定する。そして、発話判定部430は、キーワードが発話されたと判定すると、制御信号の出力等により、対象物500に対して所定の動作を開始させる。
なお、所定の時間は、キーワード発話操作のための発話が開始されてから、所定の動作が開始されない場合に、無意識に対象物500に視線を向けるまでの時間よりも若干長い時間であることが望ましく、例えば、10秒である。
また、所定数とは、キーワード発話操作のための発話が開始されたにもかかわらず所定の動作が開始されない場合に、無意識に対象物500に視線を向けるまでに同じ発話が繰り返される回数であることが望ましく、例えば、3である。
また、類似度は、公知の登録型の音声認識アルゴリズムによって算出すればよい。すなわち、発話判定部430は、情報保存部420に保存されたいずれかの音声データを登録された音声とみなし、別の保存された音声データとのマッチング処理を行うことによって類似度を算出できる。また、類似度としては、例えば、上述の評価値と同様に、スペクトル等の所定の音特徴量について、複数の音声データ間の距離から計算される値を採用することができる。また、3つ以上の音声データ間の類似度は、例えば、音声データのペア毎に音声データ間の類似度を算出し、算出されたペア毎の類似度の平均値を採用することができる。
また、類似度の判定の対象となる上記所定の範囲とは、同一の言葉の発話音声であることの尤度が十分に高いレベルであり、例えば、所定の閾値以上という数値範囲である。
操作補助装置100は、図示しないが、例えば、CPU(Central Processing Unit)、制御プログラムを格納したROM(Read Only Memory)等の記憶媒体、およびRAM(Random Access Memory)等の作業用メモリを有する。この場合、上記した各部の機能は、CPUが制御プログラムを実行することにより実現される。
このような構成を有する操作補助装置100は、キーワードに近く互いに類似する言葉が繰り返し発話された後に、ユーザの視線が対象物500に向いたとき、キーワードが発話されたと判定することができる。そして、操作補助装置100は、キーワードが発話されたと判定することにより、対象物500に対して所定の動作を開始させることができる。すなわち、操作補助装置100は、ユーザがキーワード発話操作を行いたいにもかかわらず、キーワードを誤って繰り返し発声した場合のキーワード発話操作を許容することができる。
<キーワード発話操作の許容>
キーワード発話操作の許容のトリガとなる、類似する言葉が繰り返し発話された後にユーザの視線が対象物500に向いた場合とは、キーワード発話操作が試みられた可能性が高い場合である。ここで、その理由について説明する。
図2は、キーワード発話操作を行うときのユーザの動作の例を示す図である。
ここでは、図2に示すように、対象物500が、ディスプレイ画面およびスピーカを備えたカーエアコン制御装置である場合を例示する。操作補助装置100は、例えば、カーエアコン制御装置としての対象物500に組み込まれている。
ここで、ユーザとの音声対話による対象物500に対する音声操作機能を起動させるためのキーワードとして、「音声認識スタート」が予め登録されているものとする。なお、音声操作機能は、対象物500が発話音声による操作を受け付ける機能であり、例えば、操作補助装置100の音声認識機能を用いて実現される。
ユーザ600が、「音声認識スタート」と発話した場合、例えば、図2Aに示すように、対象物500は、上述の所定の動作として、音声対話を開始する。対象物500は、例えば、「はい、何を操作しますか?」という音声を出力する。続けて、ユーザが「エアコンをつけて」と発話したとき、対象物500はこれを検出し、「はい、エアコンを動作させます」という返答の音声を出力しながら、カーエアコンをオンにする。
一方、ユーザ600が、キーワードを勘違いし、「音認スタート」と発話した場合、図2Bに示すように、対象物500は、上述の所定の動作を開始せず、「はい、何を操作しますか?」という音声を出力しない。すると、キーワードが認識されなかったと感じたユーザ600は、「音認スタート」と、同じ言葉の発話を繰り返す。そして、同じ言葉の発話を繰り返したにもかかわらず、対象物500が相変わらず動作を開始しない場合、ユーザ600は、図2Bに示すように、対象物500に対して、無意識に視線610を向ける。また、発話したキーワードが連続して認識されない回数が多いほど、ユーザ600が対象物500に視線610を向ける率が高くなる。
したがって、似たような言葉が繰り返し発話され、その後にユーザ600の視線610が対象物500に向いた場合、ユーザ600(あるいは、同乗者等の他の人)がキーワード発話操作を試みた可能性が高いといえる。
図3は、キーワード発話操作が試みられた場合に操作補助装置100で検出される情報の一例を示す図である。
図3Aは、入力音声の時間波形を示す図である。図3Bは、視線方向の検出結果を示す図である。図3Cは、第1および第2の閾値と評価値との関係を示す図である。図3A〜図3Cの横軸は、同一の時間軸に対応している。
ユーザは、区間P1、P2、P3に、「音認スタート」という、誤ったキーワードを発話したとする。この場合、図3Aに示すように、区間P1、P2、P3のそれぞれに、対応する波形の音声データ711、712、713が現れる。そして、図3Cに示すように、区間P1、P2、P3のそれぞれに対応する時刻T1、T2、T3に、評価値721、722、723が算出される。
「音認スタート」は、正しいキーワードである「音声認識スタート」とは異なるものの、大部分の音が重複している。したがって、図3Cに示すように、評価値721、722、723は、全て、第1の閾値Th未満、かつ、第2の閾値Th以上(つまり、第2のレベル)となる。この場合、キーワード検出は失敗となるが、図3Dに示すように、区間P1、P2、P3の音声データ711、712、713は、情報保存部420に保存される。
そして、図3Bに示すように、時刻T1から所定の時間が経過する前の時刻Tvに、ユーザの視線が対象物500に向いていることを示す検出結果730が得られたとする。
この場合、保存された音声データ711、712、713の間の類似度が算出される。ここでは、「音認スタート」という同一の言葉が発話されているため、比較的高い値に対応する所定の範囲に属する値で類似度が算出される。すると、「音認スタート」という誤ったキーワードしか発話されていないにもかかわらず、操作補助装置100は、正しいキーワードが発話されたと判定し、キーワード発話操作を許容する。
このように、操作補助装置100は、ユーザが誤ったキーワードを使用してキーワード発話操作を試みたときに、これを検出し、かかるキーワード発話操作を許容することができる。したがって、操作補助装置100は、ユーザがキーワードを忘れていたり勘違いして覚えている場合であっても、キーワード発話操作が不能となることを回避できる。
<操作補助装置の動作>
次に、操作補助装置100の動作について説明する。
図4は、操作補助装置100の動作の一例を示すフローチャートである。操作補助装置100は、例えば、対象物500が所定の動作を行っていない間、以下に説明する処理を繰り返し実行する。
まず、ステップS1100において、音声入力部200は、一定間隔での音声データの入力を開始する。また、視線入力部300は、視線の方向の入力を開始する。すなわち、視線入力部300は、一定間隔での視線判定を開始する。視線入力部300は、視線判定の間隔が十分に短い場合、視線が対象物500に向けられた時間がほんの一瞬であっても、これを検出することができる。
そして、ステップS1200において、キーワード判定部410は、新たに入力された音声データの区間について、キーワードの評価値を算出する。
そして、ステップS1300において、キーワード判定部410は、算出された評価値が、第1のレベル(つまり、第1の閾値以上)であるか否かを判定する。キーワード判定部410は、評価値が第1のレベルである場合(S1300:YES)、処理をステップS1400へ進める。また、キーワード判定部410は、評価値が第1のレベルではない場合(S1300:NO)、処理をステップS1500へ進める。
ステップS1400において、キーワード判定部410は、対象物500に対して、例えば、図2に説明した音声対話等の所定の動作を開始させて、一連の処理を終了する。
ステップS1500において、キーワード判定部410は、評価値が、第2のレベル(つまり、第1の閾値未満かつ第2の閾値以上)であるか否かを判定する。キーワード判定部410は、評価値が第2のレベルである場合(S1500:YES)、処理をステップS1600へ進める。また、キーワード判定部410は、評価値が第2のレベルではない場合(S1500:NO)、処理を後述のステップS1700へ進める。
ステップS1600において、キーワード判定部410は、評価値が第2のレベルであると判定された発話音声(音声データ)を情報保存部420に保存して、ステップS1700へ進む。なお、キーワード判定部410は、発話音声に対応付けて、発話音声が入力された時刻を示す時刻情報についても、情報保存部420に保存する。
ユーザがキーワードを勘違いしており、誤ったキーワードを繰り返し発話した場合、その都度、ステップS1600において、発話音声の音声データが蓄積されることになる。
なお、キーワード判定部410は、発話音声が入力された時刻から上述の所定の時間が経過する毎に、当該発話音声を、情報保存部420から削除してもよい。この場合、キーワード判定部410は、必ずしも上述の時刻を示す時刻情報を保存しなくてもよい。
ステップS1700において、発話判定部430は、視線が対象物500に向いたか否かを判定する。すなわち、発話判定部430は、視線入力部300から、ユーザの視線が対象物500に向いている旨の通知を受けたか否かを判断する。発話判定部430は、視線が対象物500に向いた場合(S1700:YES)、処理をステップS1800へ進める。また、発話判定部430は、視線が対象物500に向いていない場合(S1700:NO)、処理を後述のステップS2000へ進める。
ステップS1800において、発話判定部430は、情報保存部420に保存された複数の発話音声の間の類似度を算出する。なお、発話判定部430は、所定の時間内に入力された発話音声のみを、類似度算出の対象とする。また、発話判定部430は、情報保存部420に保存された複数の発話音声の個数が所定値未満の場合、類似度を算出しないようにする。
なお、キーワード(誤ったキーワードを含む)が発話されてから、対象物500の反応がないことに気付いてユーザが視線を対象物500に向けるまでには、通常、数秒程度の時間が掛かる。したがって、発話判定部430は、直前の短い区間に入力された発話音声については、類似度算出の対象外としてもよい。
そして、ステップS1900において、発話判定部430は、算出された類似度が所定の範囲内であるか否かを判断する。発話判定部430は、類似度が所定の範囲内である場合(ステップS1900:YES)、処理をステップS1400へ進める。すなわち、発話判定部430は、対象物500に対して所定の動作を開始させて、一連の処理を終了する。なお、ステップS1400における動作の開始指示は、キーワード判定部410および発話判定部430のいずれが行ってもよい。
また、発話判定部430は、類似度が所定の範囲内ではない場合(ステップS1900:NO)、処理をステップS2000へ進める。
ステップS2000において、キーワード検出部400は、ユーザ操作等によりキーワード発話操作の処理の終了が指示されたか否かを判断する。キーワード検出部400は、処理の終了が指示されていない場合(S2000:NO)、処理をステップS1200へ戻す。また、キーワード検出部400は、処理の終了が指示された場合(S2000:Y
ES)、一連の動作を終了する。
このような動作により、操作補助装置100は、キーワードが発話された場合のみならず、キーワードに近い言葉が繰り返し発話された後にユーザの視線が対象物500に向いた場合にも、キーワードが発話されたと判定することができる。
図5は、操作補助装置100を用いた場合のユーザおよび対象物500の動作の一例を示す図であり、図2に対応するものである。
図5に示すように、ユーザ600が、正しいキーワードに近い「音認スタート」という発話を繰り返したが、被操作対象500が反応しないため、対象物500に視線610を向けたとする。すると、操作補助装置100の機能により、正しいキーワードが発話されたものと擬制され、「はい、何を操作しますか?」という音声が対象物500から出力される。すなわち、対象物500に対するキーワード発話操作が行われる。
<本実施の形態の効果>
以上のように、本実施の形態に係る操作補助装置100は、複数の発話音声の間の類似度が所定の範囲内である後に、ユーザ600の視線が対象物500に向いたことを条件として、対象物500を操作するためのキーワードが発話されたと判定する。
これにより、操作補助装置100は、誤ったキーワードしか発話できないことによる操作失敗を回避し、キーワード発話操作が不能となることを回避できる。
ボタンを押す等の手動操作を要さずに機器操作ができることのメリットとしては、例えば、離れた場所にいても何も持たずに操作できることが挙げられる。ボタン操作が不要な音声インターフェースは、車の運転中といった手が離せないような状況に好適であり、助手席に同乗者に声で頼むような感覚での機器操作を実現することができる。
(実施の形態の応用例)
なお、以上説明した操作補助装置は、複数のキーワードを検出の対象としてもよい。また、複数の対象物について、異なるキーワードが登録されている場合には、対象物毎に、視線が向いているか否かの判定を行う必要がある。この場合、操作補助装置は、例えば、登録された各キーワードと対象物の方向(検出されるべき視線方向)とを対応付けたテーブルを使用する。
また、上述の各閾値、類似度の判定の対象となるレベル、および所定の時間は、評価値の種別、類似度の種別、操作補助装置の用途、およびユーザが要求する精度等により、適切な値が採用されることが望ましい。適切な値は、例えば、実験や経験則から決定される。
また、発話判定部は、ユーザに対してキーワードが発話されたか否かを、スピーカとマイクロフォンを用いた音声対話等により、問い合わせてもよい。そして、発話判定部は、キーワードが発話された旨の回答がユーザから得られ、かつ、算出した類似度が所定の範囲内であるとき、キーワードが発話されたと判定してもよい。
また、発話判定部は、類似度が所定の範囲内であるとき、スピーカからの音声出力等により、ユーザに対して、キーワードを通知してもよい。この場合、新たに入力される発話音声に対するキーワード検出が成功する可能性が高くなる。
あるいは、発話判定部は、ユーザに対して、スピーカとマイクロフォンを用いた音声対話等により、所定の情報を問い合わせてもよい。そして、発話判定部は、正しい回答がユーザから得られたとき、ユーザに対してキーワードを通知してもよい。更に、発話判定部は、正しい回答が得られ、かつ、算出した類似度が所定の範囲内である場合にのみ、ユーザに対してキーワードを通知するようにしてもよい。
また、キーワード検出部は、発話音声の評価値が第1の閾値以上であった場合と、発話音声の評価値が第1の閾値未満であった場合(キーワード発話操作を許容した場合)とで、音声対話の仕方を変えてもよい。例えば、キーワード検出部は、キーワード発話操作を許容した場合には、「はい、何を操作しますか?」ではなく、「はい、何か御用ですか?」という音声を出力させる。
また、操作補助装置は、評価値を考慮せずに、つまり、キーワードと発話音声との関係を考慮せずに、キーワード発話操作を許容してもよい。この場合、操作補助装置は、正しいキーワードとは全く異なる言葉が繰り返し発話された場合であっても、その後に視線が対象物に向いた場合には、キーワードが発話されたと判定することになる。これにより、キーワード発話操作が不能となるのを、より確実に回避することができる。但し、この場合、ユーザがキーワード発話操作を意図していないにもかかわらず、キーワードが発話されたと判定される可能性が高くなる。
また、操作補助装置が採用する評価値の種別、評価値の取得手法、視線判定の手法、類似度の種別、類似度の取得手法、およびキーワード検出結果の用途は、上述の例に限定されるものではない。例えば、カーナビゲーション装置やカーオーディオ装置等の各種車載機器の他、家電機器や工場設備等、各種の機器や設備を、上記対象物とすることができる。
また、操作補助装置の構成の一部を、所定の対象物の近傍にクライアント側装置として配置し、操作補助装置の構成の他の部分を、クライアント装置と離隔した装置あるいはシステムとして配置してもよい。
例えば、上述のキーワード検出部は、通信ネットワーク上に配置されたサーバ等に、キーワード検出装置として配置することができる。
この場合、例えば、操作補助装置には、入力された発話音声および視線が前記所定の対象物に向いたか否かを示す情報をキーワード検出装置に送信する送信部と、キーワード検出装置から送信された発話検出情報を受信する受信部とを設ければよい。ここで、発話検出情報とは、キーワードが発話されたと判定されたことを示す情報である。
また、キーワード検出装置には、操作補助装置から送信された発話音声および視線が所定の対象物に向いたか否かを示す情報を受信する受信部と、キーワード検出部によるキーワード判定の結果に応じて発話検出情報を操作補助装置へ送信する送信部とを設ければよい。
更に、キーワード検出部のうち、キーワード判定部、情報保存部、および発話判定部は、それぞれ別の装置に配置することも可能である。この場合、発話判定部は、音声入力部あるいは情報保存部から、入力された発話音声を取得し、視線入力部から、視線が前記所定の対象物に向いたか否かの検出結果を取得する必要がある。
このような分散型のシステムを採用することにより、各装置の処理負荷を軽減したり、1つの機能部を複数のユーザで共用することが容易となる。
また、各装置のハードウェア構成は、上述の例に限定されない。
例えば、各機能部は、典型的には、集積回路であるIC(Integrated Circuit)として実現されてもよい。各機能部は、個別に1チップ化されてもよいし、その一部または全部を含むように1チップ化されてもよい。なお、かかる集積回路は、集積度の違いにより、LSI(Large Scale Integration)、システムLSI、スーパーLSI、ウルトラLSI等とも称される。
また、集積回路化の手法はICに限るものではなく、専用回路で実現してもよい。すなわち、各機能部は、LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用することにより、実現されるものであってもよい。
更には、半導体技術の進歩または派生する別技術によってLSIに置き換えることができる各種集積回路化の技術を用いて、回路の集積化を行ってもよい。このような技術としては、例えば、バイオ技術の適用が挙げられる。
また、各装置のメモリは、不揮発性メモリであればよく、例えば、ディップスイッチのように、スイッチでデータを保持するものであってもよい。
本開示の操作補助装置は、発話音声を入力する音声入力部と、ユーザの視線が所定の対象物に向いたとき、その旨を検出する視線入力部と、入力された複数の前記発話音声の間の類似度が所定の範囲内である後に、前記視線が前記所定の対象物に向いたことを条件として、前記所定の対象物に関連するキーワードが発話されたと判定するキーワード検出部と、を有する。
なお、上記操作補助装置において、前記キーワード検出部は、前記キーワードが発話されたと判定したとき、前記所定の対象物に対して所定の動作を開始させてもよい。
また、上記操作補助装置において、前記キーワード検出部は、前記キーワードが発話されたと判定したとき、前記所定の対象物に対する音声操作機能を起動させてもよい。
また、上記操作補助装置において、前記キーワード検出部は、前記視線が前記所定の対象物に向いたタイミングから遡った所定の時間内に入力された、2以上の所定数の前記発話音声の間の類似度が前記所定の範囲内であることを条件として、前記キーワードが発話されたと判定してもよい。
また、上記操作補助装置において、前記キーワード検出部は、前記キーワードが前記発話音声に含まれていることの尤度を示す評価値を算出し、算出された前記評価値が所定の閾値以上である複数の前記発話音声の間の類似度が、前記所定の範囲内である後に、前記視線が前記所定の対象物に向いたことを条件として、前記キーワードが発話されたと判定してもよい。
また、上記操作補助装置において、前記キーワード検出部は、前記キーワードが前記発話音声に含まれていることの尤度を示す評価値を算出し、算出された前記評価値が第1の閾値以上であるとき、前記キーワードが発話されたと判定するキーワード判定部と、前記評価値が、第1の閾値未満かつ第2の閾値以上であるとき、当該評価値に対応する前記発話音声を保存する情報保存部と、前記視線が所定の対象物に向いたタイミングから遡った所定の時間内に入力された前記発話音声が前記情報保存部に所定数保存されているとき、当該発話音声の間の類似度を算出し、算出された前記類似度が前記所定の範囲内であることを条件として、前記キーワードが発話されたと判定する発話判定部と、を有してもよい。
また、上記操作補助装置において、前記発話判定部は、前記ユーザに対して前記キーワードが発話されたか否かを問い合わせ、前記キーワードが発話された旨の回答が前記ユーザから得られ、かつ、前記類似度が前記所定の範囲内であるとき、前記キーワードが発話されたと判定してもよい。
また、上記操作補助装置において、前記発話判定部は、前記類似度が前記所定の範囲内であるとき、前記ユーザに対して前記キーワードを通知してもよい。
また、上記操作補助装置において、前記発話判定部は、前記ユーザに対して所定の情報を問い合わせ、正しい回答が前記ユーザから得られ、かつ、前記類似度が前記所定の範囲内であるとき、前記ユーザに対して前記キーワードを通知してもよい。
本開示の操作補助装置は、発話音声を入力する音声入力部から、入力された前記発話音声を取得し、ユーザの視線が所定の対象物に向いたとき、その旨を検出する視線入力部から、前記視線が前記所定の対象物に向いたか否かの検出結果を取得し、取得された複数の前記発話音声の間の類似度が所定の範囲内である後に、前記視線が所定の対象物に向いたことを条件として、前記所定の対象物に関連するキーワードが発話されたと判定するキーワード検出部、を有する。
本開示の操作補助装置は、発話音声を入力する音声入力部と、入力された前記発話音声を、所定の対象物に関連するキーワードが発話されたか否かの判定を行うキーワード検出装置へ送信する送信部と、前記キーワード検出装置から、前記キーワードが発話されたと判定されたことを示す発話検出情報が送信されたとき、当該発話検出情報を受信するクライアント側受信部と、を有し、ユーザの視線が前記所定の対象物に向いたとき、その旨を検出する視線入力部、を更に有し、前記送信部は、前記視線が前記所定の対象物に向いたか否かを示す情報を、前記キーワード検出装置へ送信し、前記キーワード検出装置は、複数の前記発話音声の間の類似度が所定の範囲内である後に、前記視線が所定の対象物に向いたことを条件として、前記所定の対象物に関連するキーワードが発話されたと判定する装置である。
本開示の操作補助方法は、発話音声を入力するステップと、ユーザの視線が前記所定の対象物に向いたとき、その旨を検出するステップと、入力された複数の前記発話音声の間の類似度が所定の範囲内である後に、前記視線が所定の対象物に向いたことを条件として、前記所定の対象物に関連するキーワードが発話されたと判定するステップと、を有する。
本発明は、キーワード発話操作が不能となることを回避できる操作補助装置および操作補助方法として有用である。本発明は、例えば、車載器搭載の音声認識装置および音声対話装置に好適である。
100 操作補助装置
200 音声入力部
300 視線入力部
400 キーワード検出部
410 キーワード判定部
420 情報保存部
430 発話判定部
500 対象物

Claims (12)

  1. 発話音声を入力する音声入力部と、
    ユーザの視線が所定の対象物に向いたとき、その旨を検出する視線入力部と、
    入力された複数の前記発話音声の間の類似度が所定の範囲内である後に、前記視線が前記所定の対象物に向いたことを条件として、前記所定の対象物に関連するキーワードが発話されたと判定するキーワード検出部と、を有する、
    操作補助装置。
  2. 前記キーワード検出部は、
    前記キーワードが発話されたと判定したとき、前記所定の対象物に対して所定の動作を開始させる、
    請求項1に記載の操作補助装置。
  3. 前記キーワード検出部は、
    前記キーワードが発話されたと判定したとき、前記所定の対象物に対する音声操作機能を起動させる、
    請求項1に記載の操作補助装置。
  4. 前記キーワード検出部は、
    前記視線が前記所定の対象物に向いたタイミングから遡った所定の時間内に入力された、2以上の所定数の前記発話音声の間の類似度が前記所定の範囲内であることを条件として、前記キーワードが発話されたと判定する、
    請求項1に記載の操作補助装置。
  5. 前記キーワード検出部は、
    前記キーワードが前記発話音声に含まれていることの尤度を示す評価値を算出し、算出された前記評価値が所定の閾値以上である複数の前記発話音声の間の類似度が、前記所定の範囲内である後に、前記視線が前記所定の対象物に向いたことを条件として、前記キーワードが発話されたと判定する、
    請求項1に記載の操作補助装置。
  6. 前記キーワード検出部は、
    前記キーワードが前記発話音声に含まれていることの尤度を示す評価値を算出し、算出された前記評価値が第1の閾値以上であるとき、前記キーワードが発話されたと判定するキーワード判定部と、
    前記評価値が、第1の閾値未満かつ第2の閾値以上であるとき、当該評価値に対応する前記発話音声を保存する情報保存部と、
    前記視線が所定の対象物に向いたタイミングから遡った所定の時間内に入力された前記発話音声が前記情報保存部に所定数保存されているとき、当該発話音声の間の類似度を算出し、算出された前記類似度が前記所定の範囲内であることを条件として、前記キーワードが発話されたと判定する発話判定部と、を有する、
    請求項1に記載の操作補助装置。
  7. 前記発話判定部は、
    前記ユーザに対して前記キーワードが発話されたか否かを問い合わせ、前記キーワードが発話された旨の回答が前記ユーザから得られ、かつ、前記類似度が前記所定の範囲内であるとき、前記キーワードが発話されたと判定する、
    請求項6に記載の操作補助装置。
  8. 前記発話判定部は、
    前記類似度が前記所定の範囲内であるとき、前記ユーザに対して前記キーワードを通知する、
    請求項6に記載の操作補助装置。
  9. 前記発話判定部は、
    前記ユーザに対して所定の情報を問い合わせ、正しい回答が前記ユーザから得られ、かつ、前記類似度が前記所定レベルであるとき、前記ユーザに対して前記キーワードを通知する、
    請求項6に記載の操作補助装置。
  10. 発話音声を入力する音声入力部から、入力された前記発話音声を取得し、ユーザの視線が所定の対象物に向いたとき、その旨を検出する視線入力部から、前記視線が前記所定の対象物に向いたか否かの検出結果を取得し、取得された複数の前記発話音声の間の類似度が所定の範囲内である後に、前記視線が所定の対象物に向いたことを条件として、前記所定の対象物に関連するキーワードが発話されたと判定するキーワード検出部、を有する、
    操作補助装置。
  11. 発話音声を入力する音声入力部と、
    入力された前記発話音声を、所定の対象物に関連するキーワードが発話されたか否かの判定を行うキーワード検出装置へ送信する送信部と、
    前記キーワード検出装置から、前記キーワードが発話されたと判定されたことを示す発話検出情報が送信されたとき、当該発話検出情報を受信するクライアント側受信部と、を有し、
    ユーザの視線が前記所定の対象物に向いたとき、その旨を検出する視線入力部、を更に有し、
    前記送信部は、
    前記視線が前記所定の対象物に向いたか否かを示す情報を、前記キーワード検出装置へ送信し、
    前記キーワード検出装置は、
    複数の前記発話音声の間の類似度が所定の範囲内である後に、前記視線が所定の対象物に向いたことを条件として、前記所定の対象物に関連するキーワードが発話されたと判定する装置である、
    操作補助装置。
  12. 発話音声を入力するステップと、
    ユーザの視線が前記所定の対象物に向いたとき、その旨を検出するステップと、
    入力された複数の前記発話音声の間の類似度が所定の範囲内である後に、前記視線が所定の対象物に向いたことを条件として、前記所定の対象物に関連するキーワードが発話されたと判定するステップと、を有する、
    操作補助方法。
JP2014104188A 2014-05-20 2014-05-20 操作補助装置および操作補助方法 Active JP6233650B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014104188A JP6233650B2 (ja) 2014-05-20 2014-05-20 操作補助装置および操作補助方法
US14/715,573 US9418653B2 (en) 2014-05-20 2015-05-18 Operation assisting method and operation assisting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014104188A JP6233650B2 (ja) 2014-05-20 2014-05-20 操作補助装置および操作補助方法

Publications (2)

Publication Number Publication Date
JP2015219441A JP2015219441A (ja) 2015-12-07
JP6233650B2 true JP6233650B2 (ja) 2017-11-22

Family

ID=54556502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014104188A Active JP6233650B2 (ja) 2014-05-20 2014-05-20 操作補助装置および操作補助方法

Country Status (2)

Country Link
US (1) US9418653B2 (ja)
JP (1) JP6233650B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101595090B1 (ko) * 2015-04-30 2016-02-17 주식회사 아마다스 음성 인식을 이용한 정보 검색 방법 및 장치
JP6739907B2 (ja) * 2015-06-18 2020-08-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 機器特定方法、機器特定装置及びプログラム
JP2017090611A (ja) * 2015-11-09 2017-05-25 三菱自動車工業株式会社 音声認識制御システム
JP6447578B2 (ja) * 2016-05-27 2019-01-09 トヨタ自動車株式会社 音声対話装置および音声対話方法
WO2017221492A1 (ja) * 2016-06-20 2017-12-28 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
US10531048B2 (en) 2016-12-15 2020-01-07 Motorola Solutions, Inc. System and method for identifying a person, object, or entity (POE) of interest outside of a moving vehicle
JP6827629B2 (ja) * 2017-08-10 2021-02-10 トヨタ自動車株式会社 情報提供装置、情報提供システム
JP2019053165A (ja) * 2017-09-14 2019-04-04 株式会社東芝 音声認識装置
JP2021144259A (ja) * 2018-06-06 2021-09-24 ソニーグループ株式会社 情報処理装置および方法、並びにプログラム
US10861444B2 (en) * 2018-09-24 2020-12-08 Rovi Guides, Inc. Systems and methods for determining whether to trigger a voice capable device based on speaking cadence
US11526674B2 (en) * 2019-03-01 2022-12-13 Rakuten Group, Inc. Sentence extraction system, sentence extraction method, and information storage medium
JP7266432B2 (ja) * 2019-03-14 2023-04-28 本田技研工業株式会社 エージェント装置、エージェント装置の制御方法、およびプログラム
JP7442330B2 (ja) 2020-02-05 2024-03-04 キヤノン株式会社 音声入力装置およびその制御方法ならびにプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3524370B2 (ja) 1998-02-19 2004-05-10 富士通テン株式会社 音声起動システム
US20020107695A1 (en) * 2001-02-08 2002-08-08 Roth Daniel L. Feedback for unrecognized speech
EP1262954A1 (en) * 2001-05-30 2002-12-04 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for verbal entry of digits or commands
CN101489467B (zh) 2006-07-14 2011-05-04 松下电器产业株式会社 视线方向检测装置和视线方向检测方法
JP2008058409A (ja) * 2006-08-29 2008-03-13 Aisin Aw Co Ltd 音声認識方法及び音声認識装置
JP2008309966A (ja) * 2007-06-13 2008-12-25 Fujitsu Ten Ltd 音声入力処理装置および音声入力処理方法
US8515754B2 (en) * 2009-04-06 2013-08-20 Siemens Aktiengesellschaft Method for performing speech recognition and processing system
US9934780B2 (en) * 2012-01-17 2018-04-03 GM Global Technology Operations LLC Method and system for using sound related vehicle information to enhance spoken dialogue by modifying dialogue's prompt pitch
CN104428832B (zh) * 2012-07-09 2018-06-26 Lg电子株式会社 语音识别装置及其方法
US9245523B2 (en) * 2013-07-25 2016-01-26 Nice-Systems Ltd Method and apparatus for expansion of search queries on large vocabulary continuous speech recognition transcripts

Also Published As

Publication number Publication date
US20150340030A1 (en) 2015-11-26
JP2015219441A (ja) 2015-12-07
US9418653B2 (en) 2016-08-16

Similar Documents

Publication Publication Date Title
JP6233650B2 (ja) 操作補助装置および操作補助方法
JP6350903B2 (ja) 操作補助装置および操作補助方法
US10504511B2 (en) Customizable wake-up voice commands
US10446155B2 (en) Voice recognition device
CN106796786B (zh) 语音识别系统
US8306815B2 (en) Speech dialog control based on signal pre-processing
US10650802B2 (en) Voice recognition method, recording medium, voice recognition device, and robot
US10176806B2 (en) Motor vehicle operating device with a correction strategy for voice recognition
US10147423B2 (en) Context-aware query recognition for electronic devices
JP6227209B2 (ja) 車載用音声認識装置および車載機器
US10733986B2 (en) Apparatus, method for voice recognition, and non-transitory computer-readable storage medium
JP2009192942A (ja) 音声対話装置及び支援方法
JP2008058409A (ja) 音声認識方法及び音声認識装置
JP2009015148A (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
JP6459330B2 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
US20090106025A1 (en) Speaker model registering apparatus and method, and computer program
CN108352167B (zh) 包括可佩戴设备的车辆语音识别
JP2018116206A (ja) 音声認識装置、音声認識方法及び音声認識システム
JP6966374B2 (ja) 音声認識システム及びコンピュータプログラム
KR20190138915A (ko) 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법
JP7172120B2 (ja) 音声認識装置及び音声認識方法
CN107195298B (zh) 根本原因分析以及校正系统和方法
McAree et al. Floor determination in the operation of a lift by a mobile guide robot
JP6999236B2 (ja) 音声認識システム
CN110580901B (zh) 语音识别设备、包括该设备的车辆及该车辆控制方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171003

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171011

R151 Written notification of patent or utility model registration

Ref document number: 6233650

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151