JP6427755B2 - データ入力装置、データ入力方法、プログラム及び車載機 - Google Patents

データ入力装置、データ入力方法、プログラム及び車載機 Download PDF

Info

Publication number
JP6427755B2
JP6427755B2 JP2014032688A JP2014032688A JP6427755B2 JP 6427755 B2 JP6427755 B2 JP 6427755B2 JP 2014032688 A JP2014032688 A JP 2014032688A JP 2014032688 A JP2014032688 A JP 2014032688A JP 6427755 B2 JP6427755 B2 JP 6427755B2
Authority
JP
Japan
Prior art keywords
input
phrase
character string
unit
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014032688A
Other languages
English (en)
Other versions
JP2015158563A (ja
Inventor
和俊 柏本
和俊 柏本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2014032688A priority Critical patent/JP6427755B2/ja
Priority to US14/618,214 priority patent/US9613625B2/en
Priority to EP15154586.0A priority patent/EP2911148B1/en
Publication of JP2015158563A publication Critical patent/JP2015158563A/ja
Application granted granted Critical
Publication of JP6427755B2 publication Critical patent/JP6427755B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)

Description

本発明はタッチパネル・キー操作等の手入力による文字列入力装置と音声認識機能を併用したデータ入力技術に関する。
従来の手入力による文字列入力装置と音声認識機能を併用したデータ入力装置としては、手入力により入力された文字から入力される文字列候補を予測し、予測した文字列候補に認識対象語を絞って音声認識を行うものが知られている(例えば特許文献1参照)。
特開2005−182208号公報
しかしながら、従来のデータ入力装置では、ユーザが文字列入力装置により入力した入力済みの文字列も発話しなければならなかった。
また、文字列候補として共通語句を含む候補が多数予測された場合、予測された文字列候補に認識対象語を絞っても音声認識の精度を向上させることができないという課題があった。
例えば、車を運転して「マクドナルド(登録商標)鴨居店」に行きたいユーザーが、車載機に「マクド」と打ち込んだところで車が発進し、以降キー入力ができないため音声入力に切り替わった場合を想定する。車載機には文字列候補として、例えば「マクドナルド(登録商標)鴨居店」「マクドナルド(登録商標)中山店」「マクドナルド(登録商標)小杉店」が表示される。
ユーザは、「マクドナルド(登録商標)鴨居店」と入力済みの「マクド」も発話しなければならなかった。
予測された文字列候補は共通語句である「マクドナルド(登録商標)」を含む。文字列候補の大部分が共通語句のため、文字列候補に認識対象語を絞っても音声認識の精度を向上させることはできない。
本発明は、上記課題を解決するもので、入力済みの文字列の発話を不要とし、また、認識対象語を絞り込むことにより音声認識の精度を向上させることにある。
上記課題を解決するために本発明のデータ入力装置は、文字列入力部と、音声入力部と、音声認識辞書を格納する辞書格納部と、前記文字列入力部により入力された文字列から始まる複数の語句を前記音声認識辞書から抽出し、前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句の集合から成る動的音声認識辞書を生成する辞書生成部と、前記音声入力部により入力された音声と前記動的音声認識辞書に含まれる前記差分語句とを対比して、前記音声に一致する前記差分語句があるか否かを判定する音声認識部と、前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定する入力文字列確定部とを備えた構成となっている。
また、上記課題を解決するために本発明のデータ入力装置は、文字列入力部と、音声入力部と、音声認識辞書を格納する辞書格納部と、表示部と、前記音声認識辞書から抽出された、前記文字列入力部により入力された文字列から始まる複数の語句を前記表示部に表示させる表示制御部と、前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句と前記音声入力部により入力された音声とを対比して、前記音声に一致する前記差分語句があるか否かを判定する音声認識部と、前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定する入力文字列確定部と、を備えた構成となっている。
また、上記課題を解決するために本発明のデータ入力方法は、文字列入力部により入力された文字列から始まる複数の語句を音声認証辞書から抽出し、前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句の集合から成る動的音声認識辞書を生成するステップと、音声入力部により入力された音声と前記動的音声認識辞書に含まれる前記差分語句とを対比して、前記音声に一致する前記差分語句があるか否かを判定するステップと、前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定するステップと、を備えた構成となっている。
また、上記課題を解決するために本発明のデータ入力方法は、音声認識辞書から抽出された、文字列入力部により入力された文字列から始まる複数の語句を表示部に表示させるステップと、前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句と音声入力部により入力された音声
とを対比して、前記音声に一致する前記差分語句があるか否かを判定するステップと、前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定するステップと、を備えた構成となっている。
なお、ここで文字列には、1文字も含む。音声認識辞書に格納された語句とは、音声認識の単位をなす文字列をいう。強調して表示するとは、色、太さ、大きさ、フォントを変えて表示すること、点滅表示すること、枠で囲んで表示すること、これらの組み合わせも含む。
本発明によれば、入力済みの文字列の発話を不要とし、また、認識対象語を絞り込むことにより音声認識の精度を向上させることができる。
本発明の実施の形態1におけるデータ入力装置の構成と車両を示すブロック図 本発明の実施の形態1におけるデータ入力装置を用いたデータ入力処理の一例を示すフロー図 本発明の実施の形態1における動的音声認識辞書の生成過程の一例を示す概念図 本発明の実施の形態1におけるデータ入力装置を用いたデータ入力時の表示画面の遷移の一例を示す図
(実施の形態1)
以下、本発明の実施の形態を図面を参照しながら説明する。なお、実施の形態では車載機へのデータ入力として説明するが、本発明は車載機へのデータ入力に限定されるものではない。
図1は、本発明の実施の形態1におけるデータ入力装置の構成と車両を示すブロック図である。
図1において、データ入力装置1000は、車両1100に搭載されたカーナビゲーションシステム等の車載機1102、車両の走行状態を判定する走行状態判定部1101と接続されている。
データ入力装置1000は、入力部として、タッチパネル、キー入力デバイス等の手入力により文字列を入力する文字列入力部1001と、マイク等の音声を入力する音声入力部1002の2つの入力部を備えている。
入力切替部1003は、走行状態判定部1101から入力される車両の走行状態の判定結果に基づき、ユーザが使用する入力部を文字列入力部1001から音声入力部1002へ、音声入力部1002から文字列入力部1001へと切替える。
入力文字列確定部1004は、文字列入力部1001から入力された文字列を入力文字列の一部として確定する。入力文字列確定部1004は、入力文字列の一部として確定した文字列と音声認識部1007の音声認識結果に基づき入力文字列を確定する。入力文字列確定部1004は、確定した入力文字列を車載機1102へ出力する。入力文字列確定部1004は、音声入力部1002から入力された音声を音声認識部1007へ出力し、音声認識部1007から音声認識の結果を入力する。
動的音声認識辞書生成部1006は、入力文字列確定部1004が入力文字の一部として確定した文字列と音声認識辞書1009から動的音声認識辞書1010を生成する。
音声認識部1007は、音声入力部1002から入力された音声を、辞書格納部1008に格納された辞書を用いて認識する。
辞書格納部1008は、音声認識辞書1009と動的音声認識辞書1010とを格納する。音声認識辞書1009はデータ入力装置1000が予め備えている辞書である。動的音声認識辞書1010は、動的音声認識辞書生成部1006が動的に生成する辞書である。
表示制御部1005は、表示部1016の表示を制御する。表示部1016は、表示制御部1005の制御に従い入力文字列確定部1004が確定した文字列、辞書格納部1008に格納された辞書の語句を表示する。
車両1100に搭載された走行状態判定部は、車両の走行状態を判定し、「発進」、「停車」を含む判定結果を入力切替部1003へ出力する。車載機1102は、カーナビゲーションシステム、ディスプレイオーディオ等のデータ入力を必要とする機器である。
以上のように構成されたデータ入力装置1000について、以下にその動作について説明する。図2は本発明の実施の形態1におけるデータ入力装置1000を用いたデータ入力処理の一例を示す図である。
図2において、ユーザーは文字列入力部1001を用いて文字の入力を行う(S201)。入力文字列確定部1004は、入力された文字を入力文字列の一部として確定する。
動的音声認識辞書生成部1006は、入力文字列の一部として確定された文字列を基に、音声認識辞書1009から動的音声認識辞書1010を生成する(S202)。
動的音声認識辞書1010は、音声認識辞書1009に格納された語句で入力文字列の一部として確定した文字列と先頭が一致する複数の語句から、複数の語句に共通する共通語句を除いた差分語句を格納した辞書である。動的音声認識辞書1010の生成に関しては、後に図面を用いて説明する。
入力文字列確定部1004は、音声入力モードか否かを判定する(S203)。音声入力モードとは、入力切替部1003が、入力部を文字列入力部1001から音声入力部1002に切り替えた状態をいう。
音声入力モードでない場合(S203でNOの場合)、S201からS202を繰り返す。動的音声認識辞書生成部1006は、文字が入力され、入力文字列の一部が更新される度に動的音声認識辞書1010を生成する。
音声入力モードの場合(S203でYESの場合)、表示制御部1005は、入力文字列確定部1004が入力文字列の一部として確定した文字列と先頭が一致する音声認識辞書の語句(以後、入力文字列候補と称す)を表示部1016に表示する(S204)。
表示制御部1005は、入力文字列候補のうち、動的音声認識辞書1010に格納された差分語句を強調して表示する。表示制御部1005は、音声入力モードであることを表示部1016に表示する。表示制御部1005は、文字列入力部1001から文字を入力できないことを表示部1016に示す。
ユーザは入力文字列を確定するために必要な語句を発話する(S205)。
ユーザの発話は音声入力部1002から音声認識部1007へ入力される。音声認識部1007は、動的音声認識辞書1010を用いて発話の認識を行う。音声認識部1007は、動的音声認識辞書1010に格納された差分語句とユーザが発話した語句とのマッチングを行う(S206)。
ユーザの発話を認識できた場合、即ち、ユーザが発話した語句と差分語句とがマッチした場合(S207でYESの場合)、入力文字列確定部1004は、ユーザが発話した語句とマッチした差分語句を含む入力文字列候補を入力文字列として確定する(S210)。
ユーザの発話を認識できない場合、即ち、ユーザが発話した語句と差分語句とがマッチしない場合(S207でNOの場合)、音声認識部1007は、音声認識辞書1009を用いて発話の認識を行う。音声認識部1007は、音声認識辞書1009に格納された語句とユーザが発話した語句とのマッチングを行う(S208)。
ユーザの発話を認識できた場合(S209でYESの場合)、入力文字列確定部1004は、認識結果と入力文字列の一部として確定した文字列に基づき入力文字列を確定する。
ユーザの発話を認識できない場合(S209でNOの場合)、S205からの処理を繰り返す。
図3は、動的音声認識辞書1010の生成過程の一例を示す概念図である。図3において語句301は、音声認識辞書1009に格納された語句の一例である。音声認識辞書1009には、「イロハニホ鴨居店」等、具体的店舗名を表す語句が格納されている。動的音声認識辞書1010を用いない従来の音声認識は、これらの語句とユーザが発話した語句とのマッチングを行う。
語句302は、文字列入力部1001から文字列「イロハ」が入力された時に、動的音声認識辞書生成部1006が、音声認識辞書1009に格納された語句301から抽出した語句である。
動的音声認識辞書生成部1006は、音声認識辞書1009に格納された語句から文字列入力部1001から入力された文字列と先頭が一致する語句を抽出する。抽出された語句「イロハニホ鴨居店」「イロハニホ中山店」「イロハニホ新横店」「イロハニホ小杉店」は、入力された文字列「イロハ」と先頭が一致する語句である。
動的音声認識辞書生成部1006は、抽出した語句302を複数の語句に共通する共通語句3021「イロハニホ」と共通語句を除いた差分語句3022とに分ける。動的音声認識辞書生成部1006は、差分語句3022のみを格納した新たな辞書、動的音声認識辞書1010を生成する。語句303は、音声認識辞書1009に格納された語句301から生成した動的音声認識辞書1010に格納された語句の一例である。
図4は、本発明の実施の形態1におけるデータ入力装置を用いたデータ入力時の表示画面の遷移の一例を示す図である。
表示部1016を液晶表示パネル、文字列入力部1001を液晶表示パネルと重ねて配
置されたタッチパネルとして説明するが、表示部1016、文字列入力部1001は、これらに限定されるものではない。
表示画面401は、文字列入力部1001に相当するタッチパネル入力部4012と、タッチパネル入力部4012から入力された文字列を表示する入力文字列表示部4011を有している。入力文字列表示部4011に表示された文字は、入力文字列の一部として入力文字列確定部1004が確定した文字列である。
ユーザーは車両を運転中かつ停車中であり、近場の「イロハニホ」チェーン店へのルート案内を所望しているものとする。図4の表示画面402は、ユーザーがタッチパネル入力部4011から、「イロハ」まで文字列を入力した入力途中の表示画面である。
ユーザが車両を発進すると、走行状態判定部1101は判定結果として「発進」を入力切替部1003に出力する。入力切替部1003は、入力部を文字列入力部1001から音声入力部1002へ切替える。表示画面402は、表示画面403へと遷移する。
表示画面403には、入力文字列候補4031が表示される。入力文字列候補4031は、入力文字列確定部1004が入力文字列の一部として確定した文字列「イロハ」と先頭が一致する音声認識辞書1009に格納された語句である。入力文字列候補4031は、複数の語句で共通する共通語句「イロハニホ」と差分語句「鴨居店」「中山点」「新横店」「小杉店」等からなる。入力文字列候補4031は、差分語句が太字で強調表示される。ユーザが入力文字列を確定するために、強調表示された差分語句のみを発話すればよいことを示している。
表示画面403は、タッチパネル入力部4012の表示なくし、タッチパネル入力部4012から文字を入力できないことを示している。
表示画面403には、入力部が音声入力に切替ったこと、音声入力モードであることを示すマイクアイコン4032が表示される。
表示画面403の表示中に、ユーザが「鴨居店」と発話すれば、音声認識部1007は動的音声認識辞書1010を用いて発話の認識を行う。音声認識部1007は発話された語句を「鴨居店」と認識する。入力文字列確定部1004は、音声認識の認識結果である「鴨居店」を含む文字列入力候補「イロハニホ鴨居店」を入力文字列として確定する。入力文字列確定部1004は、確定した文字列「イロハニホ鴨居店」を車載機1102へ出力する。
以上のように本発明の実施の形態1におけるデータ入力装置、およびデータ入力方法によれば、共通語句を除いた差分語句を格納した動的音声認識辞書を用いて音声認識を行うことにより、入力済みの語句の発話を不要とし、また、認識対象語を共通語句を取り除いた差分語句に絞り込むことにより音声認識の精度を向上させることができる。
なお、実施の形態1では、1文字も文字列と称している。強調表示として太字を説明したが、色、大きさ、フォントを変えて表示すること、点滅表示すること、枠で囲んで表示すること、これらを組み合わせて表示するものであってもよい。
また、文字列入力部1001、表示部1016を車載機が備える入力装置、出力装置と兼用する構成としてもよい。
また、本発明の実施の形態1にかかわるデータ入力装置は、専用のハードウェアによっ
て実現される他に、その機能を実現するためのプログラムをコンピュータが読み取り可能な記録媒体に記録し、この記憶媒体に記録されたプログラムをコンピュータシステムに読み込ませて、実行するものであってもよい。
本発明のデータ入力装置及びデータ入力方法は、カーナビゲーションシステム等の車載機へのデータ入力装置及びデータ入力方法として有用である。
1000 データ入力装置
1001 文字列入力部
1002 音声入力部
1004 入力文字列確定部
1006 動的音声認識辞書生成部
1016 表示部
1010 動的音声認識辞書
1102 車載機
3021 共通語句
3022 差分語句

Claims (10)

  1. 文字列入力部と、
    音声入力部と、
    音声認識辞書を格納する辞書格納部と、
    前記文字列入力部により入力された文字列から始まる複数の語句を前記音声認識辞書から抽出し、前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句の集合から成る動的音声認識辞書を生成する辞書生成部と、
    前記音声入力部により入力された音声と前記動的音声認識辞書に含まれる前記差分語句とを対比して、前記音声に一致する前記差分語句があるか否かを判定する音声認識部と、
    前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定する入力文字列確定部と、
    を備える、データ入力装置。
  2. 表示部と、
    前記表示部の表示を制御する表示制御部と、
    をさらに備え、
    前記表示制御部は、前記表示部に対し、前記共通語句と前記差分語句とを含む前記複数の語句を表示させるとともに、前記複数の語句のそれぞれに含まれる前記差分語句を強調して表示させる、
    請求項1に記載のデータ入力装置。
  3. 前記音声認識部は、前記音声に一致する前記差分語句がない場合、前記音声と前記音声認識辞書に含まれる語句とを対比して、前記音声に一致する語句があるか否かを判定し、
    前記音声に一致する語句がある場合、前記入力文字列確定部は、当該語句を入力文字列として確定する、
    請求項1または請求項2に記載のデータ入力装置。
  4. 車両の走行状態に基づき前記文字列入力部から前記音声入力部へ切り替える入力切替部、
    をさらに備える、請求項1乃至請求項3の何れか1項に記載のデータ入力装置。
  5. 前記辞書生成部は、前記文字列入力部により文字が入力される度に前記動的音声認識辞書を生成する、
    請求項1から請求項4の何れか1項に記載のデータ入力装置。
  6. 請求項1から請求項5の何れか1項に記載された前記データ入力装置が確定した前記入力文字列を入力として動作する、
    車載機。
  7. 文字列入力部と、
    音声入力部と、
    音声認識辞書を格納する辞書格納部と、
    表示部と、
    前記音声認識辞書から抽出された、前記文字列入力部により入力された文字列から始まる複数の語句を前記表示部に表示させる表示制御部と、
    前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句と前記音声入力部により入力された音声とを対比して、前記音声に一致する前記差分語句があるか否かを判定する音声認識部と、
    前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定する入力文字列確定部と、
    を備える、データ入力装置。
  8. 文字列入力部により入力された文字列から始まる複数の語句を音声認証辞書から抽出し、前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句の集合から成る動的音声認識辞書を生成するステップと、
    音声入力部により入力された音声と前記動的音声認識辞書に含まれる前記差分語句とを対比して、前記音声に一致する前記差分語句があるか否かを判定するステップと、
    前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定するステップと、を備える、
    データ入力方法。
  9. 音声認識辞書から抽出された、文字列入力部により入力された文字列から始まる複数の語句を表示部に表示させるステップと、
    前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句と音声入力部により入力された音声とを対比して、前記音声に一致する前記差分語句があるか否かを判定するステップと、
    前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定するステップと、を備える、
    データ入力方法。
  10. 請求項8または請求項9に記載のデータ入力方法をコンピュータに実行させるためのプログラム。
JP2014032688A 2014-02-24 2014-02-24 データ入力装置、データ入力方法、プログラム及び車載機 Expired - Fee Related JP6427755B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014032688A JP6427755B2 (ja) 2014-02-24 2014-02-24 データ入力装置、データ入力方法、プログラム及び車載機
US14/618,214 US9613625B2 (en) 2014-02-24 2015-02-10 Data input device, data input method, storage medium, and in-vehicle apparatus
EP15154586.0A EP2911148B1 (en) 2014-02-24 2015-02-11 Data input device, data input method, and in-vehicle apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014032688A JP6427755B2 (ja) 2014-02-24 2014-02-24 データ入力装置、データ入力方法、プログラム及び車載機

Publications (2)

Publication Number Publication Date
JP2015158563A JP2015158563A (ja) 2015-09-03
JP6427755B2 true JP6427755B2 (ja) 2018-11-28

Family

ID=52465262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014032688A Expired - Fee Related JP6427755B2 (ja) 2014-02-24 2014-02-24 データ入力装置、データ入力方法、プログラム及び車載機

Country Status (3)

Country Link
US (1) US9613625B2 (ja)
EP (1) EP2911148B1 (ja)
JP (1) JP6427755B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6848881B2 (ja) * 2015-12-16 2021-03-24 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
CN108583479A (zh) * 2018-03-14 2018-09-28 斑马网络技术有限公司 车辆辅助控制方法及其辅助控制系统
CN109085829B (zh) * 2018-08-09 2022-03-08 北京智行者科技有限公司 一种动静态目标识别方法
WO2020100878A1 (ja) 2018-11-13 2020-05-22 コニカミノルタプラネタリウム株式会社 プラネタリウムの制御装置、制御方法およびそのプログラム

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0916891A (ja) * 1995-07-03 1997-01-17 Aqueous Res:Kk 車載用情報入力装置
DE69817844T2 (de) * 1997-06-27 2004-05-06 M.H. Segan Ltd. Partnership, Great Barrington Verfahren und vorrichtung zur spracherkennungscomputereingabe
US7149970B1 (en) * 2000-06-23 2006-12-12 Microsoft Corporation Method and system for filtering and selecting from a candidate list generated by a stochastic input method
WO2004023455A2 (en) 2002-09-06 2004-03-18 Voice Signal Technologies, Inc. Methods, systems, and programming for performing speech recognition
JP4012143B2 (ja) 2003-12-16 2007-11-21 キヤノン株式会社 情報処理装置およびデータ入力方法
WO2005076259A1 (ja) * 2004-02-10 2005-08-18 Nec Corporation 音声入力システム、電子機器、音声入力方法、および、音声入力用プログラム
JP4684583B2 (ja) * 2004-07-08 2011-05-18 三菱電機株式会社 対話装置
US8880047B2 (en) * 2005-08-03 2014-11-04 Jeffrey C. Konicek Realtime, location-based cell phone enhancements, uses, and applications
US20070100619A1 (en) * 2005-11-02 2007-05-03 Nokia Corporation Key usage and text marking in the context of a combined predictive text and speech recognition system
JP4458037B2 (ja) * 2005-12-16 2010-04-28 株式会社デンソー 情報入力装置
US20080282154A1 (en) 2006-09-11 2008-11-13 Nurmi Mikko A Method and apparatus for improved text input
US8571862B2 (en) * 2006-11-30 2013-10-29 Ashwin P. Rao Multimodal interface for input of text
US7912700B2 (en) 2007-02-08 2011-03-22 Microsoft Corporation Context based word prediction
US20080235029A1 (en) * 2007-03-23 2008-09-25 Cross Charles W Speech-Enabled Predictive Text Selection For A Multimodal Application
KR20090019198A (ko) * 2007-08-20 2009-02-25 삼성전자주식회사 음성 인식을 이용한 텍스트 입력 자동 완성 방법 및 장치
JP2010139826A (ja) * 2008-12-12 2010-06-24 Toyota Motor Corp 音声認識システム
EP2211336B1 (en) * 2009-01-23 2014-10-08 Harman Becker Automotive Systems GmbH Improved speech input using navigation information
JP5709980B2 (ja) * 2011-04-08 2015-04-30 三菱電機株式会社 音声認識装置およびナビゲーション装置
US8498864B1 (en) * 2012-09-27 2013-07-30 Google Inc. Methods and systems for predicting a text
US8914012B2 (en) * 2012-10-16 2014-12-16 Excelfore Corporation System and method for monitoring apps in a vehicle to reduce driver distraction

Also Published As

Publication number Publication date
EP2911148A1 (en) 2015-08-26
JP2015158563A (ja) 2015-09-03
EP2911148B1 (en) 2017-04-12
US20150243277A1 (en) 2015-08-27
US9613625B2 (en) 2017-04-04

Similar Documents

Publication Publication Date Title
US10706853B2 (en) Speech dialogue device and speech dialogue method
CN106796786B (zh) 语音识别系统
JP5259020B2 (ja) 音声認識装置
JP6427755B2 (ja) データ入力装置、データ入力方法、プログラム及び車載機
JP2009169139A (ja) 音声認識装置
US9600475B2 (en) Speech translation apparatus and method
JP5195414B2 (ja) 応答生成装置及びプログラム
JP2014202848A (ja) テキスト生成装置、方法、及びプログラム
JP2008242462A (ja) 多言語の非ネイティブ音声の認識
JP2013019958A (ja) 音声認識装置
JP5277704B2 (ja) 音声認識装置及びこれを用いる車両システム
JP6499228B2 (ja) テキスト生成装置、方法、及びプログラム
WO2016042600A1 (ja) 情報提供システム
JP3718088B2 (ja) 音声認識修正方式
US11107474B2 (en) Character input device, character input method, and character input program
JP2016102823A (ja) 情報処理システム、音声入力装置及びコンピュータプログラム
JP5446540B2 (ja) 情報検索装置、制御方法及びプログラム
WO2012017525A1 (ja) 処理装置及びコマンド入力支援方法
JP2017102320A (ja) 音声認識装置
JP2021128222A (ja) 情報処理装置及びプログラム
JP2005316022A (ja) ナビゲーション装置及びプログラム
JP2006184421A (ja) 音声認識装置及び音声認識方法
JP2016048338A (ja) 音声認識装置及びコンピュータプログラム
JP2015206909A (ja) 音声認識装置
JP2010175921A (ja) 音声認識装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20160519

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160907

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171101

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180410

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180918

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181001

R151 Written notification of patent or utility model registration

Ref document number: 6427755

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees