JP2008203296A - 音声認識装置及びナビゲーション装置 - Google Patents

音声認識装置及びナビゲーション装置 Download PDF

Info

Publication number
JP2008203296A
JP2008203296A JP2007035868A JP2007035868A JP2008203296A JP 2008203296 A JP2008203296 A JP 2008203296A JP 2007035868 A JP2007035868 A JP 2007035868A JP 2007035868 A JP2007035868 A JP 2007035868A JP 2008203296 A JP2008203296 A JP 2008203296A
Authority
JP
Japan
Prior art keywords
telephone
correction
displayed
display unit
telephone number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007035868A
Other languages
English (en)
Other versions
JP4672686B2 (ja
Inventor
Ryuichi Suzuki
竜一 鈴木
Manabu Ootsuka
まなぶ 大塚
Katsushi Asami
克志 浅見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2007035868A priority Critical patent/JP4672686B2/ja
Priority to US12/010,338 priority patent/US8145487B2/en
Publication of JP2008203296A publication Critical patent/JP2008203296A/ja
Application granted granted Critical
Publication of JP4672686B2 publication Critical patent/JP4672686B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/56Arrangements for indicating or recording the called number at the calling subscriber's set
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3608Destination input or retrieval using speech input, e.g. using speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/274Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
    • H04M1/2745Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
    • H04M1/27485Appending a prefix to or inserting a pause into a dialling sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/6075Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/10Details of telephonic subscriber devices including a GPS signal receiver

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)
  • Telephone Function (AREA)

Abstract

【課題】ユーザの発話した内容に従い電話番号をグループ分けして表示できるようにする。
【解決手段】マイクにより集音された音声を音声認識により認識し(S102)、認識した音声に含まれる電話番号に、市外局番、市内局番、加入者番号のグループに区切る語彙が含まれるか否かに基づいて該電話番号をグループ分けするか否かを判定し(S104)、電話番号をグループ分けすると判定した場合、電話番号を市外局番、市内局番、加入者番号にグループ分けして表示部に表示させる(S106)。
【選択図】図3

Description

本発明は、マイクにより集音された音声に含まれる電話番号を認識して表示部に表示する音声認識装置及びナビゲーション装置に関する。
従来、ユーザの音声に含まれる数字列を音声認識により認識する装置が種々提案されている(例えば、特許文献1〜3参照)。
特開平11−305793号公報 特開平10−254489号公報 特開2006−58390号公報
電話番号は、1つの連続した数字列として表示する場合と、市外局番、市内局番、加入者番号のグループをカッコや「―」で区切って表示する場合とがある。例えば、電話番号が市外局番、市内局番、加入者番号のグループに区切って表示される場合、グループ間を「ハイフン」や「の」で区切って発話されることが多い。
しかしながら、特許文献1〜3に記載の装置は、このように電話番号が区切って発話された場合、ユーザが発話した通りに認識し、発話された区切り方に従って電話番号を市外局番、市内局番、加入者番号のグループに分けて表示することができない。したがって、ユーザが発話した内容と異なる表示となってしまい、ユーザに違和感を与えてしまうことが考えられる。
また、車両用ナビゲーション装置には、目的地施設の電話番号を音声入力して目的地施設を検索する電話番号検索機能を備えたものがある。この電話番号検索機能では、電話番号が音声入力されると、タウンページに登録されている電話番号等を用いて作成されたデータベースを参照し、このデータベースに登録されている区切り方に従って目的地の施設の電話番号が表示されるようになっている。
このような装置では、例えば、交換局の統廃合などにより市外局番、市内局番、加入者番号の区切り方が変更された場合、ユーザが新しい区切り方に従って発話したにもかかわらず、データベースに登録された電話番号に従って変更前の区切り方で電話番号が表示されてしまい、ユーザに違和感を与えてしまうことが考えられる。
本発明は上記点に鑑みたもので、ユーザの発話した内容に従い電話番号をグループ分けして表示できるようにすることを目的とする。
本発明の第1の特徴は、マイクにより集音された音声を認識する音声認識手段と、音声認識手段によって認識された音声に含まれる電話番号の内容から該電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定するグループ分け判定手段と、グループ分け判定手段によって電話番号をグループ分けすると判定された場合、電話番号を市外局番、市内局番、加入者番号にグループ分けして表示部に表示させる表示制御手段と、を備えたことである。
このような構成では、認識された音声に含まれる電話番号の内容から電話番号を市外局番、市内局番、加入者番号にグループ分けすると判定された場合、電話番号が市外局番、市内局番、加入者番号にグループ分けして表示部に表示されるので、ユーザの発話した内容に従い電話番号をグループ分けして表示することができる。
また、本発明の第2の特徴は、音声認識手段によって認識された音声に含まれる電話番号に、市外局番、市内局番、加入者番号のグループに区切る語彙が含まれるか否かに基づいて電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定することである。
このように、認識された音声に含まれる電話番号に、市外局番、市内局番、加入者番号のグループに区切る語彙が含まれるか否かに基づいて電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定することができる。なお、電話番号を市外局番、市内局番、加入者番号のグループに区切る語彙としては、「ハイフン」、「の」、「カッコ」、「スペース」等がある。
また、本発明の第3の特徴は、音声認識手段によって認識された音声に含まれる電話番号に、桁読み語彙が含まれるか否かに基づいて電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定することである。
このように、認識された音声に含まれる電話番号に、桁読み語彙が含まれるか否かに基づいて電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定することができる。なお、桁読み語彙としては、例えば、「さんびゃくよんじゅうご」、「ろくせんななひゃくはちじゅうきゅう」等がある。
また、本発明の第4の特徴は、音声認識手段によって認識された音声に含まれる電話番号に該電話番号を複数のグループに区切る無音状態が含まれるか否かに基づいて電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定することである。
このように、認識された音声に含まれる電話番号に該電話番号を複数のグループに区切る無音状態が含まれるか否かに基づいて電話番号を市外局番、市内局番、加入者番号にグループ分けすることができる。なお、無音状態は、音声入力のない状態が予め定められた期間以上継続した状態のことをいう。
本発明の第5の特徴は、音声認識手段によって認識された音声に含まれる電話番号に該電話番号を複数のグループに区切る長音が含まれるか否かに基づいて電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定することである。
このように、認識された音声に含まれる電話番号に該電話番号を複数のグループに区切る長音が含まれるか否かに基づいて電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定することができる。
また、本発明の第6の特徴は、グループ分け判定手段によって電話番号を市外局番、市内局番、加入者番号にグループ分けしないと判定された場合、電話番号を区切ることなく連続して表示部に表示させることである。
このように、電話番号を市外局番、市内局番、加入者番号にグループ分けしないと判定された場合、電話番号が連続して表示部に表示されるので、ユーザの発話した内容に従い電話番号を連続して表示部に表示させることができる。
また、本発明の第7の特徴は、表示制御手段により表示部に表示された電話番号を訂正するか否かをユーザに確認する訂正確認手段と、訂正確認手段によって表示部に表示された電話番号を訂正することが確認された場合、ユーザの操作に応じて電話番号の一部を訂正位置として特定し、訂正位置の番号を訂正する番号訂正手段と、を備えたことである。
このような構成では、表示部に表示された電話番号を訂正することが確認された場合、ユーザの操作に応じて電話番号の一部を訂正位置として特定し、訂正位置の番号のみを訂正することができるので、表示部に表示された電話番号が誤認識されていても、誤認識された部分のみを特定して訂正することが可能である。
また、本発明の第8の特徴は、表示制御手段により電話番号が表示部にグループ分けして表示されている場合、番号訂正手段は、電話番号の訂正位置をグループ分けされたグループ単位で特定し、訂正位置の番号をグループ単位で訂正することである。
このような構成では、電話番号が表示部にグループ分けして表示されている場合、電話番号の訂正位置をグループ分けされたグループ単位で特定し、訂正位置の番号をグループ単位で訂正することができるので、表示部に表示された電話番号が誤認識されていても、誤認識された部分のみをグループ単位で特定して訂正することが可能である。
また、本発明の第9の特徴は、表示部の前面に配置され、接触面に対するタッチ操作および接触位置を検出するタッチスイッチを備え、番号訂正手段は、タッチスイッチによるタッチ操作が検出された場合、タッチ操作された位置に表示された電話番号の一部を訂正位置として特定することである。
このように、タッチ操作された位置に表示された電話番号の一部を訂正位置として特定することができる。
また、本発明の第10の特徴は、表示部の前面に配置され、接触面に対するタッチ操作および接触位置を検出するタッチスイッチを備え、番号訂正手段は、予め定められた時間内に、タッチスイッチにより電話番号の中の複数の数字へのタッチ操作が検出された場合、タッチ操作された位置に表示された電話番号の中の複数の数字を訂正位置として特定することである。
このように、予め定められた時間内に、タッチスイッチにより電話番号の中の複数の数字へのタッチ操作が検出された場合、タッチ操作された位置に表示された電話番号の中の複数の数字を訂正位置として特定することができる。
また、本発明の第11の特徴は、訂正位置を特定した後、音声認識手段によって訂正位置の変更を指示する語彙が認識されると、認識された語彙に従い訂正位置を変更することである。
このような構成では、訂正位置の変更を指示する語彙が認識された場合、認識された語彙に従い訂正位置が変更される。すなわち、ユーザは発話により訂正位置の変更を指示することができる。
また、本発明の第12の特徴は、訂正位置の数字を増加させる増加ボタンおよび訂正位置の数字を減少させる減少ボタンを表示部に表示させ、タッチスイッチによるタッチ操作が検出された場合、タッチ操作された位置に表示されたボタンへの操作に応じて訂正位置の番号を訂正することである。
このように、訂正位置の数字を増加させる増加ボタンおよび訂正位置の数字を減少させる減少ボタンが表示部に表示され、タッチ操作された位置に表示されたボタンへの操作に応じて訂正位置の番号が訂正されるので、電話番号が誤認識されていても、誤認識された部分のみを容易に訂正することができる。
また、本発明の第13の特徴は、訂正位置の新たな番号の発話をユーザに促した後、音声認識手段によって認識された番号を新たな番号として訂正位置の番号を訂正することである。
このような構成では、訂正位置の新たな番号の発話をユーザに促した後、音声認識された番号を新たな番号として訂正位置の番号が訂正される。すなわち、ユーザは発話により訂正位置の新たな番号を指示することができる。
また、本発明の第14の特徴は、表示制御手段により表示部に表示された電話番号のいずれかの位置に番号を挿入するか否かをユーザに確認する挿入確認手段と、挿入確認手段によって表示部に表示された電話番号のいずれかの位置に番号を挿入すると判定された場合、ユーザの操作に応じて番号の挿入位置を特定し、挿入位置に番号を挿入する番号挿入手段と、を備えたことである。
このような構成では、表示部に表示された電話番号のいずれかの位置に番号を挿入すると判定された場合、ユーザの操作に応じて番号の挿入位置を特定し、挿入位置に番号が挿入されるので、表示部に表示された電話番号が誤認識されていても、番号の挿入位置を特定し、挿入位置に番号を挿入して修正することが可能である。
また、本発明の第15の特徴は、表示制御手段により電話番号が表示部にグループ分けして表示されている場合、番号挿入手段は、番号を挿入するグループを特定し、ユーザの操作に応じてグループのいずれかの位置に番号を挿入することである。
このように、番号を挿入するグループを特定し、ユーザの操作に応じてグループのいずれかの位置に番号を挿入することができるので、表示部に表示された電話番号が誤認識されていても、誤認識された部分のグループを特定し、該グループのいずれかの位置に番号を挿入して修正することが可能である。
また、本発明の第16の特徴は、表示部の前面に配置され、接触面に対するタッチ操作および接触位置を検出するタッチスイッチを備え、番号挿入手段は、電話番号の数字間に挿入位置を指定するための挿入ボタンを表示させ、タッチスイッチによるタッチ操作が検出された場合、タッチ操作された位置に表示された挿入ボタンの位置を挿入位置として特定することである。
このように、タッチ操作された位置に表示された挿入ボタンの位置を挿入位置として特定することができる。
また、本発明の第17の特徴は、表示部の前面に配置され、接触面に対するタッチ操作および接触位置を検出するタッチスイッチを備え、番号挿入手段は、タッチスイッチにより2つの隣り合う数字へのタッチ操作が検出された場合、タッチ操作された数字の間を挿入位置として特定することである。
このように、タッチスイッチにより2つの隣り合う数字へのタッチ操作が検出された場合、タッチ操作された数字の間を挿入位置として特定することができる。
また、本発明の第18の特徴は、挿入位置へ挿入する番号の発話をユーザに促した後、音声認識手段によって認識された番号を挿入位置に挿入することである。
このような構成では、挿入位置へ挿入する番号の発話をユーザに促した後、音声認識された番号が挿入位置に挿入される。すなわち、ユーザは発話により挿入位置に挿入する番号を指示することができる。
また、本発明の第19の特徴は、表示制御手段により表示部に表示された電話番号の一部を削除するか否かをユーザに確認する削除確認手段と、削除確認手段によって表示部に表示された電話番号の一部を削除すると判定された場合、ユーザの操作に応じて削除する番号の削除位置を特定し、削除位置の番号を削除する番号削除手段と、を備えたことである。
このような構成では、表示部に表示された電話番号の一部を削除すると判定された場合、ユーザの操作に応じて削除する番号の削除位置が特定され、削除位置の番号が削除されるので、表示部に表示された電話番号が誤認識されていても、誤認識された番号のみを特定して削除することが可能である。
また、本発明の第20の特徴は、表示制御手段により電話番号が表示部にグループ分けして表示されている場合、番号削除手段は、電話番号の削除位置をグループ分けされたグループ単位で特定し、削除位置の番号をグループ単位で削除することである。
このような構成では、電話番号が表示部にグループ分けして表示されている場合、電話番号の削除位置をグループ分けされたグループ単位で特定し、削除位置の番号をグループ単位で削除することができるので、表示部に表示された電話番号が誤認識されていても、誤認識された部分のみをグループ単位で特定して削除することが可能である。
また、本発明の第21の特徴は、表示部の前面に配置され、接触面に対するタッチ操作および接触位置を検出するタッチスイッチを備え、番号削除手段は、タッチスイッチによるタッチ操作が検出された場合、タッチ操作された位置に表示された電話番号の数字を削除位置として特定することである。
このように、タッチ操作された位置に表示された電話番号の数字を削除位置として特定することができる。
また、本発明の第22の特徴は、表示部の前面に配置され、接触面に対するタッチ操作および接触位置を検出するタッチスイッチを備え、番号削除手段は、予め定められた時間内に、タッチスイッチにより電話番号の中の複数の数字へのタッチ操作が検出された場合、タッチ操作された位置に表示された電話番号の中の複数の数字を削除位置として特定することである。
このように、予め定められた時間内に、タッチスイッチにより電話番号の中の複数の数字へのタッチ操作が検出された場合、タッチ操作された位置に表示された電話番号の中の複数の数字を削除位置として特定することができる。
また、本発明の第23の特徴は、表示制御手段により表示部に表示された電話番号を、表示された区切り方でトークバック音声をスピーカから出力させるトークバック音声出力手段を備えたことである。
このように、表示部に表示された電話番号を、表示された区切り方でトークバック音声をスピーカから出力させることができる。
また、本発明の第24の特徴は、表示制御手段が、電話番号をグループ分けする際に、最も可能性の高い区切り方で区切る第1の候補と2番目に可能性の高い区切り方で区切る第2の候補の類似度が予め定められた規格値よりも大きいことを判定した場合、第1の候補と第2の候補の両方を表示部に表示させることである。
このような構成では、電話番号をグループ分けする際に、最も可能性の高い区切り方で区切る第1の候補と2番目に可能性の高い区切り方で区切る第2の候補が類似しており、その類似度が予め定められた規格値よりも大きい場合、最も可能性の高い区切り方で区切る第1の候補と2番目に可能性の高い区切り方で区切る第2の候補の両方が表示される。ユーザは第1の候補と第2の候補のいずれかを選択して、意図する区切り方でグループ分けされた電話番号を表示させることが可能である。
また、本発明の第25の特徴は、所定のナビゲーション処理を実行するナビゲーション装置であって、本発明の第1ないし第24の特徴のいずれか1つに記載の音声認識装置を備え、その音声認識装置によって得られた話者の意図する電話番号を前記ナビゲーション処理に用いることである。
このように、音声認識装置によって得られた話者の意図する電話番号をナビゲーション処理に用いることができる。
本発明の一実施形態に係る音声認識装置をナビゲーション装置へ搭載した場合の構成を図1に示す。本ナビゲーション装置20は、位置検出器21、データ入力器22、操作スイッチ群23、通信装置24、外部メモリ25、表示装置26、リモコンセンサ27および制御回路28を備えている。
位置検出器21は、いずれも周知のジャイロスコープ21a、距離センサ21bおよびGPS受信機21cを有しており、これらセンサの各々の性質に基づいた現在位置や向きを特定するための情報を制御回路28に出力する。
データ入力器22は、地図データ等の各種データが記憶された記憶媒体から各種データを入力するためのものである。
操作スイッチ群23は、表示装置26の表示画面の周囲に設けられた押ボタンスイッチや表示装置26の表示部に設けられたタッチスイッチ等によって構成されており、ユーザのスイッチ操作に応じた信号を制御回路28へ出力する。タッチスイッチは、表示装置26の表示部の前面に重ねて配置され、接触面に対するタッチ操作および接触位置を検出する。
通信装置24は、無線通信網を介して外部と無線通信を行うための装置である。
外部メモリ25は、後述する制御回路28に設けられたRAMやROMとは別に設けられたメモリであり、フラッシュメモリ等の不揮発性記憶媒体によって構成されている。
表示装置26は、液晶等の表示部を有し、制御回路28から入力される映像信号に応じた映像を表示部に表示させる。
リモコンセンサ27は、ユーザの操作に基づいて赤外線等による無線信号を送信するリモコン27aから受信した信号を制御回路28へ出力する。
制御回路28は、CPU、RAM、ROM、I/Oなどを有するコンピュータとして構成されており、CPUはROMに記憶されたプログラムに従って各種処理を実施する。
制御回路28の処理としては、位置検出器21から入力される情報に基づいて現在位置を特定する現在位置特定処理、現在位置周辺の地図上に自車位置マークを重ねて表示させる地図表示処理、交通情報の表示操作に応じて通信装置24を介して交通情報を取得して現在位置周辺の交通情報を表示する交通情報表示処理等がある。
本実施形態における制御回路28は、図2に示す音声認識ユニット10を備えている。この音声認識ユニット10は、スピーカ14から出力させる音声を合成する音声合成部11と、マイク15によって集音された音声をデジタル化して音声信号の分析を行い音声認識する音声認識部12と、CPUやメモリ等を有するコンピュータとして構成された制御部13を備えている。制御部13のCPUは、メモリに記憶されたプログラムに従って各種処理を行う。
制御部13には、ユーザの操作に応じて、PTT(Push to Talk)スイッチ16から発話の開始を示す信号が入力されるようになっている。
本ナビゲーション装置20は、制御回路28と制御部13が連携して、マイク15により集音された音声に含まれる電話番号を認識して表示装置26の表示部に表示させるとともに、スピーカ14から表示した電話番号のトークバック音声を出力させる電話番号認識処理を実施する。図3に、制御回路28と制御部13による電話番号認識処理のフローチャートを示す。イグニッションスイッチがオンすると、ナビゲーション装置20は起動状態となる。制御回路28と制御部13は、ユーザの操作に応じてPTTスイッチ16から発話の開始を示す信号が入力されると、図4に示す入力待ち状態の電話番号入力画面を表示装置26の表示部に表示させるとともに、図3に示す電話番号認識処理を実施する。
まず、マイク15を介してユーザの発話入力があるか否かを判定する(S100)。ユーザの発話入力がない場合、S100の判定を繰り返す。
ユーザの発話入力があると、S100の判定はYESとなり、次に、音声認識を行う(S102)。具体的には、マイク15により集音された音声を音声認識部12に音声認識させる。
次に、音声認識部12により認識された音声に含まれる電話番号の内容から電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定する(S104)。
本実施形態では、以下の(1)〜(4)に従って電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定する。
(1)認識された音声に含まれる電話番号に該電話番号を市外局番、市内局番、加入者番号のグループに区切る語彙が含まれる場合、電話番号を市外局番、市内局番、加入者番号にグループ分けすると判定し、認識された音声に含まれる電話番号に該電話番号を市外局番、市内局番、加入者番号のグループに区切る語彙が含まれない場合、電話番号をグループ分けしないと判定する。なお、電話番号を市外局番、市内局番、加入者番号のグループに区切る語彙としては、「ハイフン」、「の」、「カッコ」、「スペース」等がある。
例えば、「012の345の6789」と発話入力があった場合、「の」が含まれるため、グループ分けすると判定する。また、「012ハイフン345ハイフン6789」と発話入力があった場合、「ハイフン」が含まれるため、グループ分けすると判定する。これらの場合、「012」と「345」と「6789」といったように、「の」や「ハイフン」の位置で区切られる。反対に、「0123456789」と発話入力があった場合、グループ分けしないと判定する。
(2)認識された音声に含まれる電話番号に、桁読み語彙が含まれる場合、電話番号を市外局番、市内局番、加入者番号にグループ分けし、認識された音声に含まれる電話番号に桁読み語彙が含まれない場合、電話番号をグループ分けしない。桁読み語彙としては、例えば、「さんびゃくよんじゅうご」、「ろくせんななひゃくはちじゅうきゅう」等がある。
例えば、「0123、よんじゅうご、6789」と発話入力があった場合、桁読み語彙の「よんじゅうご」が含まれるため、グループ分けすると判定する。この場合、「0123」と「45」と「6789」といったように、桁読み語彙の位置で区切られる。
(3)認識された音声に含まれる電話番号に該電話番号を複数のグループに区切る無音状態が含まれる場合、電話番号を市外局番、市内局番、加入者番号にグループ分けすると判定し、認識された音声に含まれる電話番号に該電話番号を複数のグループに区切る無音状態が含まれない場合、電話番号をグループ分けしないと判定する。無音状態は、音声入力のない状態が予め定められた期間(例えば、0.5秒)以上継続した状態をいう。
例えば、「012」と発話入力があり、その後、1秒間無音状態が継続して「345」と発話入力があり、その後、1秒間無音状態が継続して「6789」と発話入力があった場合、電話番号に予め定められた期間以上継続した無音状態が2回含まれるため、グループ分けすると判定する。この場合、「012」と「345」と「6789」といったように、無音状態の位置で区切られる。
(4)認識された音声に含まれる電話番号に該電話番号を複数のグループに区切る長音が含まれる場合、電話番号を市外局番、市内局番、加入者番号にグループ分けすると判定し、認識された音声に含まれる電話番号に該電話番号を複数のグループに区切る長音が含まれない場合、電話番号をグループ分けしないと判定する。長音とは、予め定められた期間(例えば、0.5秒)以上長く伸ばして発せられる音を意味する。なお、認識された音声に含まれる電話番号に長音が含まれるか否かを判定する技術は周知である。
例えば、「0123456789」の「2」が「にー」といったように1秒以上継続した長音で、かつ、「5」が「ごー」といったように1秒以上継続した長音の場合、長音が2つ含まれるため、グループ分けすると判定する。この場合、「012」と「345」と「6789」といったように、長音の位置で区切られる。
なお、上記した(1)〜(4)の1つでもグループ分けすると判定された場合には、グループ分けすると判定する。グループ分けすると判定された場合にはS106へ進み、グループ分けしないと判定された場合にはS122進む。
ここでは、S104にてグループ分けすると判定されたものとして説明する。S106では、グループ単位で認識結果を表示する。具体的には、電話番号を市外局番、市内局番、加入者番号にグループ分けした電話番号入力画面を表示装置26の表示部に表示させる。図5は、「012の345の6789」と発話入力があった場合の表示例である。ユーザの発話した内容に従い、「012」と「345」と「6789」のグループ毎に枠で囲まれ表示されている。
次に、表示装置26の表示部にグループ分けして表示された電話番号を、表示された区切り方でトークバック音声をスピーカ14から出力させる(S108)。具体的には、電話番号をグループ単位でトークバック音声を出力させるための音声信号を音声合成部11へ出力し、この音声合成部11にトークバック音声をスピーカ14から出力させる。
S110では表示部に表示された電話番号の一部を訂正する訂正操作を実施するか否かをユーザに確認し、S114では表示部に表示された電話番号のいずれかの位置に番号を挿入するか否かをユーザに確認し、S118では表示部に表示された電話番号の一部を削除するか否かをユーザに確認する。具体的には、図6に示すように、訂正操作、挿入操作および削除操作のいずれか1つの操作を実施するか、あるいは入力完了(確定)するか否かをユーザに確認する確認画面を表示装置26の表示画面に表示させ、ユーザの操作スイッチ群23のタッチスイッチの操作により、訂正操作、挿入操作および削除操作のいずれか1つの操作の指示がなされたか否かにより訂正操作を実施するか、挿入操作を実施するか、削除操作を実施するか、あるいは入力完了(確定)するかを判定する。
ユーザ操作により訂正操作の実施指示がなされた場合、S110の判定はYESとなり、次に、グループ単位の訂正操作を実施する(S112)。このグループ単位の訂正操作では、まず、タッチスイッチへのタッチ操作に応じて、タッチ操作された位置に表示された電話番号のグループを訂正位置として特定する。例えば、図7に示すように、「012−345−6789」の「345」のグループがタッチ操作された場合、この「345」のグループが訂正位置として特定され、「345」の色が変更される。
そして、「2グループ目の「345」を訂正します、訂正したい数字をどうぞ、ピッ」といったガイダンスをスピーカ14から音声出力させる。
このように訂正位置の新たな番号の発話をユーザに促した後、ユーザによって新たな番号の音声入力があると、訂正位置の番号が新たな番号に訂正される。例えば、ユーザによって、「746」を表す音声入力があると、図8に示すように、「012−746−6789」に訂正され、「2グループ目の「345」を「746」に訂正しました」といったガイダンスがスピーカ14から音声出力される。
また、訂正位置が特定された後、訂正したい数字の発話をユーザに促すガイダンスがスピーカ14から音声出力される前に、「左」、「右」、「次」、「戻る」といった訂正位置の変更を指示する語彙が認識されると、認識された語彙に従い訂正位置を変更する。例えば、市内局番の「345」が訂正位置として特定された状態で、「左」または「戻る」が認識されると、市外局番の「012」が訂正位置に変更される。また、市内局番の「345」が訂正位置として特定された状態で、「右」または「次」が認識されると、加入者番号の「6789」が訂正位置に変更され、変更された訂正位置による訂正操作が実施される。このようにして、S112の訂正操作の実施処理が終了すると、S110へ戻る。
また、図6に示した訂正操作、挿入操作および削除操作のいずれか1つの操作を実施するか否かをユーザに確認する確認画面に従って、ユーザ操作により挿入操作の実施指示がなされた場合、S114の判定はYESとなり、次に、グループ単位の挿入操作を実施する(S116)。このグループ単位の挿入操作では、まず、タッチスイッチへのタッチ操作に応じて、タッチ操作された位置に表示された電話番号のグループを挿入位置として特定する。
そして、挿入位置への新たな番号の発話をユーザに促した後、ユーザによって番号の音声入力があると、この音声入力による番号が挿入位置に挿入される。例えば、「012−356−7890」の「356」のグループがタッチ操作された場合、この「356」が挿入対象のグループとして特定される。更に、タッチスイッチにより2つの隣り合う数字へのタッチ操作が検出された場合、タッチ操作された数字の間を挿入位置として特定する。例えば、タッチスイッチにより「35」へのタッチ操作が検出された場合、「3」と「5」の間が挿入位置として特定され、「4」を表す音声入力があると、「3」と「5」の間に「4」が挿入され、「012−3456−7890」に修正され、上記したS116の挿入操作の実施処理は終了する。このようにS116の挿入操作の実施処理が終了すると、S110へ戻る。
また、図6に示した訂正操作、挿入操作および削除操作のいずれか1つの操作を実施するか否かをユーザに確認する確認画面に従って、ユーザ操作により削除操作の実施指示がなされた場合、S118の判定はYESとなり、次に、グループ単位の削除操作を実施する(S120)。このグループ単位の削除操作では、まず、タッチスイッチへのタッチ操作に応じて、タッチ操作された位置に表示された電話番号のグループを削除位置として特定する。
そして、削除位置として特定した番号の発話をユーザに促した後、ユーザによって削除する番号の音声入力があると、この音声入力により削除位置の番号が削除される。
例えば、「012−345−6789」の「345」のグループがタッチ操作された場合、この「345」が削除対象のグループとして特定される。そして、削除位置として特定した番号の発話をユーザに促した後、ユーザによって、例えば、「4」を表す音声入力があると、「4」が削除され、「012−35−6789」に修正され、S120の削除操作の実施は終了する。このようにS120の削除操作の実施が終了すると、S110へ戻る。
また、ユーザの確認画面に従って入力完了(確定)することが確認された場合、S110、S114、S118の判定はそれぞれNOとなり、本処理を終了する。
ここまでは、S104にてグループ分けすると判定されたものとして説明したが、S104にてグループ分けしないと判定された場合には、以下に示す作動となる。
S104にてグループ分けしないと判定された場合、S104の判定はNOとなり、1文字単位で認識結果を表示する(S122)。具体的には、電話番号をグループ分けすることなく1文字単位で表した電話番号入力画面を表示装置26の表示部に表示させる。図9は、「0123456789」と1文字単位で発話入力があった場合の表示例で、ユーザの発話した内容に従い、グループ分けすることなく、1文字単位で「0123456789」と表示されている。
次に、表示装置26の表示部に1文字単位で表示された電話番号を表すトークバック音声をスピーカ14から出力させる(S124)。具体的には、電話番号を連続した区切りなしのトークバック音声を出力させるための音声信号を音声合成部11へ出力し、音声合成部11にトークバック音声をスピーカ14から出力させる。
S126では表示部に表示された電話番号の一部を訂正する訂正操作を実施するか否かをユーザに確認し、S130では表示部に表示された電話番号のいずれかの位置に番号を挿入するか否かをユーザに確認し、S134では表示部に表示された電話番号の一部を削除するか否かをユーザに確認する。具体的には、上記したようにグループ分けして電話番号を表示する場合と同様に、図6に示した訂正操作、挿入操作および削除操作のいずれか1つの操作を実施するか否かをユーザに確認する確認画面を表示装置26の表示画面に表示させ、ユーザの操作スイッチ群23のタッチスイッチの操作により、訂正操作、挿入操作および削除操作のいずれか1つの操作の指示がなされたか否かにより訂正操作を実施するか、挿入操作を実施するか、あるいは削除操作を実施するかを判定する。
ユーザ操作により訂正操作の実施指示がなされた場合、S126の判定はYESとなり、次に、1文字単位の訂正操作を実施する(S128)。この1文字単位の訂正操作では、まず、タッチスイッチへのタッチ操作に応じて、タッチ操作された位置に表示された電話番号の1文字を訂正位置として特定する。例えば、図10(a)に示すように、「0123456789」の「3」がタッチ操作された場合、この「3」が訂正位置として特定され、「3」の色が変更される。
そして、「4桁目の「3」を訂正します、訂正したい数字をどうぞ、ピッ」といったガイダンスをスピーカ14から音声出力させる。
このように訂正位置の新たな番号の発話をユーザに促した後、ユーザによって新たな番号の音声入力があると、この音声入力により訂正位置の番号が新たな番号に訂正される。例えば、ユーザによって、「7」を表す音声入力があると、図10(b)に示すように、「0127456789」に訂正される。
また、訂正位置が特定された後、訂正したい数字の発話をユーザに促すガイダンスがスピーカ14から音声出力される前に、「左」、「右」、「次」、「戻る」といった訂正位置の変更を指示する語彙が認識されると、認識された語彙に従い訂正位置を変更する。例えば、図11(a)に示すように、「0123456789」の「3」が訂正位置として特定された状態で、「右」または「次」が認識されると、「4」が訂正位置に変更され、変更された訂正位置による訂正操作が実施される。このようにして、S128の訂正操作の実施処理が終了すると、S126へ戻る。
また、図6に示した訂正操作、挿入操作および削除操作のいずれか1つの操作を実施するか否かをユーザに確認する確認画面に従って、ユーザ操作により挿入操作の実施指示がなされた場合、S130の判定はYESとなり、次に、1文字単位の挿入操作を実施する(S132)。この1文字単位の挿入操作では、まず、タッチスイッチへのタッチ操作に応じて、タッチ操作された位置に表示された電話番号の数字を挿入位置として特定する。この1文字単位の挿入操作では、まず、タッチスイッチへのタッチ操作に応じて、タッチ操作された位置に表示された電話番号の数字を挿入位置として特定する。ここでは、タッチスイッチにより2つの隣り合う数字へのタッチ操作が検出された場合、タッチ操作された数字の間を挿入位置として特定する。例えば、図12(a)に示すように、「012356789」の「3」と「5」がタッチ操作された場合、この「35」を挿入対象として特定する。
そして、挿入位置への新たな番号の発話をユーザに促した後、ユーザによって番号の音声入力があると、この音声入力による番号が挿入位置に挿入される。例えば、ユーザによって、「4」を表す音声入力があると、「3」と「5」の間に「4」が挿入され、図12(b)に示すように「0123456789」に修正され、上記したS132の挿入操作の実施処理は終了する。このようにS132の挿入操作の実施処理が終了すると、S126へ戻る。
また、図6に示した訂正操作、挿入操作および削除操作のいずれか1つの操作を実施するか否かをユーザに確認する確認画面に従って、ユーザ操作により削除操作の実施指示がなされた場合、S134の判定はYESとなり、次に、1文字単位の削除操作を実施する(S136)。この1文字単位の削除操作では、まず、タッチスイッチへのタッチ操作に応じて、タッチ操作された位置に表示された電話番号の数字を削除位置として特定する。例えば、図13(a)に示すように、「0123456789」の「4」がタッチ操作された場合、この「4」を削除対象として特定し、この「4」が削除され、図13(b)に示すように、「012356789」に修正され、S136の削除操作の実施は終了する。このようにS136の削除操作の実施が終了すると、S126へ戻る。
また、ユーザの確認画面に従って入力完了(確定)することが確認された場合、S126、S130、S134の判定はそれぞれNOとなり、本処理を終了する。
上記した構成によれば、認識された音声に含まれる電話番号の内容から電話番号を市外局番、市内局番、加入者番号にグループ分けすると判定された場合、電話番号が市外局番、市内局番、加入者番号にグループ分けして表示部に表示されるので、ユーザの発話した内容に従い電話番号をグループ分けして表示することができる。
電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定は、音声認識された音声に含まれる電話番号に、市外局番、市内局番、加入者番号のグループに区切る語彙が含まれるか否かに基づいて判定することができる。
また、電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定は、音声認識された音声に含まれる電話番号に、桁読み語彙が含まれるか否かに基づいて判定することもできる。
また、電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定は、音声認識された音声に含まれる電話番号に、該電話番号を複数のグループに区切る無音状態が含まれるか否かに基づいて判定することもできる。
また、電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定は、音声認識された音声に含まれる電話番号に、該電話番号を複数のグループに区切る長音が含まれるか否かに基づいて判定することもできる。
また、電話番号を市外局番、市内局番、加入者番号にグループ分けしないと判定された場合、電話番号を区切ることなく連続して表示部に表示させることができる。
なお、本発明は上記実施形態に限定されるものではなく、本発明の趣旨に基づいて種々なる形態で実施することができる。
例えば、上記実施形態では、S128の1文字単位の訂正操作において、電話番号の訂正位置を特定した後、音声認識により認識された番号を新たな番号として訂正位置の番号を訂正する例を示したが、例えば、図14に示すように、訂正位置の数字を増加させる増加ボタンIおよび訂正位置の数字を減少させる減少ボタンDを表示装置26の表示部に表示させ、タッチスイッチによるタッチ操作が検出された場合、タッチ操作された位置に表示されたボタンI、Dへの操作に応じて訂正位置の番号を増加または減少させて訂正するようにしてもよい。
また、上記実施形態では、S116、S132の挿入操作において、タッチスイッチへのタッチ操作により電話番号の挿入位置を特定する例を示したが、例えば、図15(a)に示すように、電話番号の数字間に挿入位置を指定するための挿入ボタンSを表示させ、タッチスイッチによるタッチ操作が検出された場合、図15(b)に示すように、タッチ操作された位置に表示された挿入ボタンSの位置を挿入位置として特定してもよい。この場合、挿入位置が特定した後、挿入する番号の発話をユーザに促し、挿入する番号の音声入力があると、この番号を挿入位置に挿入することができる。例えば、挿入する番号の発話をユーザに促した後、「4」を表す音声入力があると、挿入位置に「4」が挿入され、図15(c)に示すように、「0123456789」に修正することができる。
また、上記実施形態では、S102にて音声認識された音声に含まれる電話番号の内容から電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定する例を示したが、例えば、認識された音声に含まれる電話番号に該電話番号を複数のグループに区切る無音状態が3つ以上含まれる場合、1つの区切り方で電話番号を市外局番、市内局番、加入者番号にグループ分けするのが困難な場合がある。このような場合、複数の区切り方の候補のうち、最も可能性の高い区切り方で区切る第1の候補と2番目に可能性の高い区切り方で区切る第2の候補の類似度を求め、類似度が予め定められた規格値よりも大きいことを判定した場合、第1の候補と第2の候補の両方を表示部に表示させるようにしてもよい。例えば、図16に示すように、第1の候補として「012−345−6789」を表示し、第2の候補として「0123−45−6789」を表示し、ユーザに選択を促すようにしてもよい。
また、上記実施形態では、S128の1文字単位の訂正操作において、電話番号の1文字を訂正位置として特定し、訂正する例を示したが、一度に複数の数字を訂正位置として特定するようにしてもよい。この場合、例えば、図17に示すように、「0123456789」の「3」と「7」を訂正位置として特定した後、訂正位置の新たな番号の発話をユーザに促し、「48」を表す音声入力があると、「3」が「4」に訂正され、「7」が「8」に訂正され、「0124456889」に修正される。
また、上記実施形態では、S114、S130にて、表示部に表示された電話番号のいずれかの位置に番号を挿入するか否かをユーザに確認し、ユーザの操作に応じて挿入操作を実施することを判定した場合に、挿入操作を実施する例を示したが、音声認識した電話番号が、認識すべき電話番号の桁数を満たしているか否かを判定し、認識すべき電話番号の桁数を満たしていないと判定された場合に挿入操作を実施するようにしてもよい。例えば、音声認識した電話番号が10桁未満で、認識すべき電話番号の桁数を満たしていないと判定された場合に挿入操作を実施するようにしてもよい。
また、上記実施形態では、(1)〜(4)に示したように、認識された音声に含まれる電話番号の内容から電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定する例を示したが、例えば、音声認識した電話番号のイントネーション、アクセント、ピッチ、周波数特性の情報を用いて電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定するようにしてもよい。
また、上記実施形態では、制御回路28と制御部13が連携して、マイク15により集音された音声に含まれる電話番号を認識して表示装置26の表示部に表示させるとともに、スピーカ14から表示した電話番号のトークバック音声を出力させる電話番号認識処理を実施する例を示したが、例えば、この電話番号認識処理により認識した電話番号により電話番号検索を実施して目的地設定を実施し、目的地に至る案内経路を設定し、この案内経路に従って走行案内を実施するようにしてもよい。
なお、上記実施形態における構成と特許請求の範囲の構成との対応関係について説明すると、音声認識ユニット10とS102が音声認識手段に相当し、S104がグループ分け判定手段に相当し、S106、S122が表示制御手段に相当し、S110、S126が訂正確認手段に相当し、S112、S128が番号訂正手段に相当し、S114、S130が挿入確認手段に相当し、S116、S132が番号挿入手段に相当し、S118、S134が削除確認手段に相当し、S120、S136が番号削除手段に相当し、S108、S124がトークバック音声出力手段に相当する。
本発明の一実施形態に係る音声認識装置をナビゲーション装置へ搭載した場合の構成を示す図である。 音声認識ユニットの構成を示す図である。 制御回路と制御部による電話番号認識処理を示すフローチャートである。 入力待ち状態の電話番号入力画面の表示例を示す図である。 電話番号を市外局番、市内局番、加入者番号にグループ分けした場合の電話番号入力画面の表示例を示す図である。 訂正操作、挿入操作および削除操作のいずれか1つの操作を実施するか、あるいは入力完了(確定)するか否かをユーザに確認する確認画面の表示例を示す図である。 グループ単位の訂正操作時の表示について説明するための図である。 グループ単位の訂正操作時の表示について説明するための図である。 電話番号を市外局番、市内局番、加入者番号にグループ分けしない場合の電話番号入力画面の表示例を示す図である。 1文字単位の訂正操作の表示について説明するための図である。 1文字単位の訂正操作の表示について説明するための図である。 1文字単位の挿入操作の表示について説明するための図である。 1文字単位の削除操作の表示について説明するための図である。 1文字単位の訂正操作の変形例について説明するための図である。 挿入操作の変形例について説明するための図である。 電話番号を市外局番、市内局番、加入者番号にグループ分けして表示する際の変形例について説明するための図である。 1文字単位の訂正操作の変形例について説明するための図である。
符号の説明
10…音声認識ユニット、11…音声合成部、12…音声認識部、13…制御部、
14…スピーカ、15…マイク、16…PTTスイッチ、20…ナビゲーション装置、
21…位置検出器、21a…ジャイロスコープ、21b…距離センサ、
21c…GPS受信機、22…データ入力器、23…操作スイッチ群、
24…通信装置、25…外部メモリ、26…表示装置、27…リモコンセンサ、
28…制御回路。

Claims (25)

  1. マイクにより集音された音声を認識する音声認識手段と、
    前記音声認識手段によって認識された音声に含まれる電話番号の内容から該電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定するグループ分け判定手段と、
    前記グループ分け判定手段によって前記電話番号をグループ分けすると判定された場合、前記電話番号を市外局番、市内局番、加入者番号にグループ分けして表示部に表示させる表示制御手段と、を備えたことを特徴とする音声認識装置。
  2. 前記グループ分け判定手段は、前記音声認識手段によって認識された音声に含まれる電話番号に、前記市外局番、市内局番、加入者番号のグループに区切る語彙が含まれるか否かに基づいて前記電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定することを特徴とする請求項1に記載の音声認識装置。
  3. 前記グループ分け判定手段は、前記音声認識手段によって認識された音声に含まれる電話番号に、桁読み語彙が含まれるか否かに基づいて前記電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定することを特徴とする請求項1または2に記載の音声認識装置。
  4. 前記グループ分け判定手段は、前記音声認識手段によって認識された音声に含まれる電話番号に該電話番号を複数のグループに区切る無音状態が含まれるか否かに基づいて前記電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定することを特徴とする請求項1ないし3のいずれか1つに記載の音声認識装置。
  5. 前記グループ分け判定手段は、前記音声認識手段によって認識された音声に含まれる電話番号に該電話番号を複数のグループに区切る長音が含まれるか否かに基づいて前記電話番号を市外局番、市内局番、加入者番号にグループ分けするか否かを判定することを特徴とする請求項1ないし4のいずれか1つに記載の音声認識装置。
  6. 前記表示制御手段は、前記グループ分け判定手段によって前記電話番号を市外局番、市内局番、加入者番号にグループ分けしないと判定された場合、前記電話番号を区切ることなく連続して表示部に表示させることを特徴とする請求項1ないし5のいずれか1つに記載の音声認識装置。
  7. 前記表示制御手段により前記表示部に表示された前記電話番号を訂正するか否かをユーザに確認する訂正確認手段と、
    前記訂正確認手段によって前記表示部に表示された前記電話番号を訂正することが確認された場合、ユーザの操作に応じて前記電話番号の一部を訂正位置として特定し、前記訂正位置の番号を訂正する番号訂正手段と、を備えたことを特徴とする請求項1ないし6のいずれか1つに記載の音声認識装置。
  8. 前記表示制御手段により前記電話番号が前記表示部にグループ分けして表示されている場合、前記番号訂正手段は、前記電話番号の訂正位置をグループ分けされたグループ単位で特定し、前記訂正位置の番号をグループ単位で訂正することを特徴とする請求項7に記載の音声認識装置。
  9. 前記表示部の前面に配置され、接触面に対するタッチ操作および接触位置を検出するタッチスイッチを備え、
    前記番号訂正手段は、前記タッチスイッチによる前記タッチ操作が検出された場合、前記タッチ操作された位置に表示された前記電話番号の一部を前記訂正位置として特定することを特徴とする請求項7または8に記載の音声認識装置。
  10. 前記表示部の前面に配置され、接触面に対するタッチ操作および接触位置を検出するタッチスイッチを備え、
    前記番号訂正手段は、予め定められた時間内に、前記タッチスイッチにより前記電話番号の中の複数の数字への前記タッチ操作が検出された場合、前記タッチ操作された位置に表示された前記電話番号の中の複数の数字を訂正位置として特定することを特徴とする請求項7または8に記載の音声認識装置。
  11. 前記番号訂正手段は、前記訂正位置を特定した後、前記音声認識手段によって前記訂正位置の変更を指示する語彙が認識されると、認識された語彙に従い前記訂正位置を変更することを特徴とする請求項7ないし10のいずれか1つに記載の音声認識装置。
  12. 前記番号訂正手段は、前記訂正位置の数字を増加させる増加ボタンおよび前記訂正位置の数字を減少させる減少ボタンを前記表示部に表示させ、前記タッチスイッチによる前記タッチ操作が検出された場合、前記タッチ操作された位置に表示されたボタンへの操作に応じて前記訂正位置の番号を訂正することを特徴とする請求項7ないし10のいずれか1つに記載の音声認識装置。
  13. 前記番号訂正手段は、前記訂正位置の新たな番号の発話をユーザに促した後、前記音声認識手段によって認識された番号を新たな番号として前記訂正位置の番号を訂正することを特徴とする請求項7ないし10のいずれか1つに記載の音声認識装置。
  14. 前記表示制御手段により前記表示部に表示された前記電話番号のいずれかの位置に番号を挿入するか否かをユーザに確認する挿入確認手段と、
    前記挿入確認手段によって前記表示部に表示された前記電話番号のいずれかの位置に番号を挿入すると判定された場合、ユーザの操作に応じて前記番号の挿入位置を特定し、前記挿入位置に番号を挿入する番号挿入手段と、を備えたことを特徴とする請求項1ないし13のいずれか1つに記載の音声認識装置。
  15. 前記表示制御手段により前記電話番号が前記表示部にグループ分けして表示されている場合、前記番号挿入手段は、前記番号を挿入するグループを特定し、ユーザの操作に応じて前記グループのいずれかの位置に前記番号を挿入することを特徴とする請求項14に記載の音声認識装置。
  16. 前記表示部の前面に配置され、接触面に対するタッチ操作および接触位置を検出するタッチスイッチを備え、
    前記番号挿入手段は、前記電話番号の数字間に挿入位置を指定するための挿入ボタンを表示させ、前記タッチスイッチによる前記タッチ操作が検出された場合、前記タッチ操作された位置に表示された前記挿入ボタンの位置を前記挿入位置として特定することを特徴とする請求項14または15に記載の音声認識装置。
  17. 前記表示部の前面に配置され、接触面に対するタッチ操作および接触位置を検出するタッチスイッチを備え、
    前記番号挿入手段は、前記タッチスイッチにより2つの隣り合う数字への前記タッチ操作が検出された場合、前記タッチ操作された数字の間を前記挿入位置として特定することを特徴とする請求項14または15に記載の音声認識装置。
  18. 前記番号挿入手段は、前記挿入位置へ挿入する番号の発話をユーザに促した後、前記音声認識手段によって認識された番号を前記挿入位置に挿入することを特徴とする請求項14ないし17のいずれか1つに記載の音声認識装置。
  19. 前記表示制御手段により前記表示部に表示された前記電話番号の一部を削除するか否かをユーザに確認する削除確認手段と、
    前記削除確認手段によって前記表示部に表示された前記電話番号の一部を削除すると判定された場合、ユーザの操作に応じて削除する番号の削除位置を特定し、前記削除位置の番号を削除する番号削除手段と、を備えたことを特徴とする請求項1ないし18のいずれか1つに記載の音声認識装置。
  20. 前記表示制御手段により前記電話番号が前記表示部にグループ分けして表示されている場合、前記番号削除手段は、前記電話番号の削除位置をグループ分けされたグループ単位で特定し、前記削除位置の番号をグループ単位で削除することを特徴とする請求項19に記載の音声認識装置。
  21. 前記表示部の前面に配置され、接触面に対するタッチ操作および接触位置を検出するタッチスイッチを備え、
    前記番号削除手段は、前記タッチスイッチによる前記タッチ操作が検出された場合、前記タッチ操作された位置に表示された前記電話番号の数字を削除位置として特定することを特徴とする請求項19または20に記載の音声認識装置。
  22. 前記表示部の前面に配置され、接触面に対するタッチ操作および接触位置を検出するタッチスイッチを備え、
    前記番号削除手段は、予め定められた時間内に、前記タッチスイッチにより前記電話番号の中の複数の数字への前記タッチ操作が検出された場合、前記タッチ操作された位置に表示された前記電話番号の中の複数の数字を削除位置として特定することを特徴とする請求項19または20に記載の音声認識装置。
  23. 前記表示制御手段により前記表示部に表示された前記電話番号を、表示された区切り方でトークバック音声をスピーカから出力させるトークバック音声出力手段を備えたことを特徴とする請求項1ないし22のいずれか1つに記載の音声認識装置。
  24. 前記表示制御手段は、前記電話番号をグループ分けする際に、最も可能性の高い区切り方で区切る第1の候補と2番目に可能性の高い区切り方で区切る第2の候補の類似度が予め定められた規格値よりも大きいことを判定した場合、前記第1の候補と第2の候補の両方を前記表示部に表示させることを特徴とする請求項1ないし22のいずれか1つに記載の音声認識装置。
  25. 所定のナビゲーション処理を実行するナビゲーション装置であって、請求項1ないし24のいずれか1つに記載の音声認識装置を備え、その音声認識装置によって得られた話者の意図する電話番号を前記ナビゲーション処理に用いることを特徴とするナビゲーション装置。
JP2007035868A 2007-02-16 2007-02-16 音声認識装置及びナビゲーション装置 Expired - Fee Related JP4672686B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007035868A JP4672686B2 (ja) 2007-02-16 2007-02-16 音声認識装置及びナビゲーション装置
US12/010,338 US8145487B2 (en) 2007-02-16 2008-01-24 Voice recognition apparatus and navigation apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007035868A JP4672686B2 (ja) 2007-02-16 2007-02-16 音声認識装置及びナビゲーション装置

Publications (2)

Publication Number Publication Date
JP2008203296A true JP2008203296A (ja) 2008-09-04
JP4672686B2 JP4672686B2 (ja) 2011-04-20

Family

ID=39780919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007035868A Expired - Fee Related JP4672686B2 (ja) 2007-02-16 2007-02-16 音声認識装置及びナビゲーション装置

Country Status (2)

Country Link
US (1) US8145487B2 (ja)
JP (1) JP4672686B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010211122A (ja) * 2009-03-12 2010-09-24 Nissan Motor Co Ltd 音声認識装置及び方法
JP2012090151A (ja) * 2010-10-21 2012-05-10 Mazda Motor Corp 車両用情報機器
JP2013011466A (ja) * 2011-06-28 2013-01-17 Clarion Co Ltd ナビゲーション装置、ナビゲーション装置を用いた音声認識方法、および、プログラム
KR101610413B1 (ko) * 2010-12-07 2016-04-08 현대자동차주식회사 장음 인식에 따른 제어 장치
JP2020177261A (ja) * 2019-04-15 2020-10-29 コニカミノルタ株式会社 操作受付装置、制御方法、画像形成システム、及び、プログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110246194A1 (en) * 2010-03-30 2011-10-06 Nvoq Incorporated Indicia to indicate a dictation application is capable of receiving audio
CN104655146B (zh) * 2015-02-11 2017-12-01 北京远特科技股份有限公司 一种在车辆中进行导航或通信的方法和系统
CN111179921A (zh) * 2018-11-12 2020-05-19 奇酷互联网络科技(深圳)有限公司 数字信息的处理方法、移动终端以及计算机存储介质
CN115150492B (zh) * 2022-06-30 2024-06-07 青岛海信移动通信技术有限公司 一种手机对讲一体机

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1146238A (ja) * 1997-07-29 1999-02-16 Fujitsu Ten Ltd 電話機
JPH11143490A (ja) * 1997-11-10 1999-05-28 Sony Corp 音声操作機能付き電子機器、電子機器における音声操作方法、及び音声操作機能付き電子機器を備える自動車
JP2000187497A (ja) * 1998-12-22 2000-07-04 Hitachi Ltd 音声による言語入力装置
JP2001154691A (ja) * 1999-11-26 2001-06-08 Alpine Electronics Inc 音声認識装置
JP2003150192A (ja) * 2001-11-08 2003-05-23 Denso Corp 音声認識装置
JP2004037998A (ja) * 2002-07-05 2004-02-05 Denso Corp 音声制御装置
JP2004053620A (ja) * 2002-07-16 2004-02-19 Denso Corp 音声認識装置
JP2006039954A (ja) * 2004-07-27 2006-02-09 Denso Corp データベース検索装置、プログラム及びナビゲーション装置
JP2006515073A (ja) * 2002-09-06 2006-05-18 ヴォイス シグナル テクノロジーズ インコーポレーティッド 音声認識を実行するための方法、システム、及びプログラミング
JP2007025075A (ja) * 2005-07-13 2007-02-01 Xanavi Informatics Corp ナビゲーション装置

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2119397C (en) * 1993-03-19 2007-10-02 Kim E.A. Silverman Improved automated voice synthesis employing enhanced prosodic treatment of text, spelling of text and rate of annunciation
DE19709990C2 (de) 1997-03-11 2000-03-02 Philips Corp Intellectual Pty System zur Erkennung gesprochener Ziffernfolgen
JP4300596B2 (ja) 1998-04-16 2009-07-22 ソニー株式会社 車載用ナビゲーションシステム
JP3815110B2 (ja) 1999-04-09 2006-08-30 株式会社日立製作所 音声入力装置及び音声入力方法
JP3718088B2 (ja) 1999-09-24 2005-11-16 アルパイン株式会社 音声認識修正方式
WO2002013503A2 (en) * 2000-08-10 2002-02-14 Alcatel Internetworking, Inc. Method of configuring a plurality of voip gateways
US6741680B2 (en) * 2000-12-22 2004-05-25 International Business Machines Corporation Telephone message system with flexible presentation capability
US7313526B2 (en) 2001-09-05 2007-12-25 Voice Signal Technologies, Inc. Speech recognition using selectable recognition modes
US7467089B2 (en) 2001-09-05 2008-12-16 Roth Daniel L Combined speech and handwriting recognition
US7809574B2 (en) 2001-09-05 2010-10-05 Voice Signal Technologies Inc. Word recognition using choice lists
US7444286B2 (en) 2001-09-05 2008-10-28 Roth Daniel L Speech recognition using re-utterance recognition
US7716058B2 (en) 2001-09-05 2010-05-11 Voice Signal Technologies, Inc. Speech recognition using automatic recognition turn off
US7505911B2 (en) 2001-09-05 2009-03-17 Roth Daniel L Combined speech recognition and sound recording
US7526431B2 (en) 2001-09-05 2009-04-28 Voice Signal Technologies, Inc. Speech recognition using ambiguous or phone key spelling and/or filtering
US7577569B2 (en) 2001-09-05 2009-08-18 Voice Signal Technologies, Inc. Combined speech recognition and text-to-speech generation
US7634403B2 (en) 2001-09-05 2009-12-15 Voice Signal Technologies, Inc. Word recognition using word transformation commands
US7225130B2 (en) 2001-09-05 2007-05-29 Voice Signal Technologies, Inc. Methods, systems, and programming for performing speech recognition
US7366667B2 (en) * 2001-12-21 2008-04-29 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for pause limit values in speech recognition
JP4203984B2 (ja) 2002-08-01 2009-01-07 アルパイン株式会社 音声入力装置及び音声入力受付方法
JP2004093698A (ja) 2002-08-29 2004-03-25 Alpine Electronics Inc 音声入力方法
US6963637B2 (en) * 2002-12-18 2005-11-08 International Business Machines Corporation Methods, systems, and media to capture a redialing sequence and to redial
JP4212947B2 (ja) 2003-05-02 2009-01-21 アルパイン株式会社 音声認識システムおよび音声認識の訂正・学習方法
JP4275572B2 (ja) * 2003-06-30 2009-06-10 ヤマハ発動機株式会社 船舶搭載エンジン制御装置
US7555316B2 (en) * 2003-09-24 2009-06-30 Honda Motor Co., Ltd. System and method for formatting and displaying numbers
US7664639B2 (en) * 2004-01-14 2010-02-16 Art Advanced Recognition Technologies, Inc. Apparatus and methods for speech recognition
US7454008B1 (en) * 2004-03-25 2008-11-18 Prairie Systems, Inc. System for classifying lists of telephone numbers
JP2005275228A (ja) 2004-03-26 2005-10-06 Equos Research Co Ltd ナビゲーション装置
KR100605959B1 (ko) * 2004-06-21 2006-08-02 삼성전자주식회사 음성을 이용한 번호입력방법
JP2006058390A (ja) 2004-08-17 2006-03-02 Nissan Motor Co Ltd 音声認識装置
US7965822B2 (en) * 2005-09-28 2011-06-21 Siemens Enterprise Communications, Inc. Telephony dialing using speech recognition
US20070201631A1 (en) * 2006-02-24 2007-08-30 Intervoice Limited Partnership System and method for defining, synthesizing and retrieving variable field utterances from a file server
US20070286398A1 (en) * 2006-06-07 2007-12-13 Venkatesan Ramamoorthy Voice Recognition Dialing For Alphabetic Phone Numbers
US8055502B2 (en) * 2006-11-28 2011-11-08 General Motors Llc Voice dialing using a rejection reference

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1146238A (ja) * 1997-07-29 1999-02-16 Fujitsu Ten Ltd 電話機
JPH11143490A (ja) * 1997-11-10 1999-05-28 Sony Corp 音声操作機能付き電子機器、電子機器における音声操作方法、及び音声操作機能付き電子機器を備える自動車
JP2000187497A (ja) * 1998-12-22 2000-07-04 Hitachi Ltd 音声による言語入力装置
JP2001154691A (ja) * 1999-11-26 2001-06-08 Alpine Electronics Inc 音声認識装置
JP2003150192A (ja) * 2001-11-08 2003-05-23 Denso Corp 音声認識装置
JP2004037998A (ja) * 2002-07-05 2004-02-05 Denso Corp 音声制御装置
JP2004053620A (ja) * 2002-07-16 2004-02-19 Denso Corp 音声認識装置
JP2006515073A (ja) * 2002-09-06 2006-05-18 ヴォイス シグナル テクノロジーズ インコーポレーティッド 音声認識を実行するための方法、システム、及びプログラミング
JP2006039954A (ja) * 2004-07-27 2006-02-09 Denso Corp データベース検索装置、プログラム及びナビゲーション装置
JP2007025075A (ja) * 2005-07-13 2007-02-01 Xanavi Informatics Corp ナビゲーション装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010211122A (ja) * 2009-03-12 2010-09-24 Nissan Motor Co Ltd 音声認識装置及び方法
JP2012090151A (ja) * 2010-10-21 2012-05-10 Mazda Motor Corp 車両用情報機器
KR101610413B1 (ko) * 2010-12-07 2016-04-08 현대자동차주식회사 장음 인식에 따른 제어 장치
JP2013011466A (ja) * 2011-06-28 2013-01-17 Clarion Co Ltd ナビゲーション装置、ナビゲーション装置を用いた音声認識方法、および、プログラム
JP2020177261A (ja) * 2019-04-15 2020-10-29 コニカミノルタ株式会社 操作受付装置、制御方法、画像形成システム、及び、プログラム
JP7275795B2 (ja) 2019-04-15 2023-05-18 コニカミノルタ株式会社 操作受付装置、制御方法、画像形成システム、及び、プログラム
US11722609B2 (en) 2019-04-15 2023-08-08 Konica Minolta, Inc. Operation receiving apparatus, control method, image forming system, and recording medium that perform print setting based on voice and manual operations

Also Published As

Publication number Publication date
JP4672686B2 (ja) 2011-04-20
US20080288254A1 (en) 2008-11-20
US8145487B2 (en) 2012-03-27

Similar Documents

Publication Publication Date Title
JP4672686B2 (ja) 音声認識装置及びナビゲーション装置
US10475448B2 (en) Speech recognition system
US7822613B2 (en) Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus
JP4736982B2 (ja) 作動制御装置、プログラム
US7310602B2 (en) Navigation apparatus
JP5637131B2 (ja) 音声認識装置
JP2013068532A (ja) 情報端末、サーバー装置、検索システムおよびその検索方法
US20020010579A1 (en) Speech recognition apparatus and method using two opposite words
JP3702867B2 (ja) 音声制御装置
JP2009251388A (ja) 母国語発話装置
CN110556104B (zh) 语音识别装置、语音识别方法以及存储程序的存储介质
JP5986468B2 (ja) 表示制御装置、表示システム及び表示制御方法
JP2005275228A (ja) ナビゲーション装置
JP3726783B2 (ja) 音声認識装置
JP4525376B2 (ja) 音声−数字変換装置および音声−数字変換プログラム
JP2002281145A (ja) 電話番号入力装置
JP2011232668A (ja) 音声認識機能を備えたナビゲーション装置およびその検出結果提示方法
JP4453377B2 (ja) 音声認識装置、プログラム及びナビゲーション装置
JP2007057805A (ja) 車両用情報処理装置
US20150192425A1 (en) Facility search apparatus and facility search method
JP2006039954A (ja) データベース検索装置、プログラム及びナビゲーション装置
JP2005114964A (ja) 音声認識方法および音声認識処理装置
JP4645708B2 (ja) コード認識装置および経路探索装置
JP4941494B2 (ja) 音声認識システム
JP2011080824A (ja) ナビゲーション装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080605

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090422

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090630

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101008

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110119

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140128

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees