JP4155383B2 - 音声認識機器操作装置 - Google Patents

音声認識機器操作装置 Download PDF

Info

Publication number
JP4155383B2
JP4155383B2 JP2001060876A JP2001060876A JP4155383B2 JP 4155383 B2 JP4155383 B2 JP 4155383B2 JP 2001060876 A JP2001060876 A JP 2001060876A JP 2001060876 A JP2001060876 A JP 2001060876A JP 4155383 B2 JP4155383 B2 JP 4155383B2
Authority
JP
Japan
Prior art keywords
word
function
instruction
voice recognition
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001060876A
Other languages
English (en)
Other versions
JP2002258892A (ja
Inventor
博 宍戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2001060876A priority Critical patent/JP4155383B2/ja
Publication of JP2002258892A publication Critical patent/JP2002258892A/ja
Application granted granted Critical
Publication of JP4155383B2 publication Critical patent/JP4155383B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Selective Calling Equipment (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、利用者がマイクから入力した機器操作用の音声を認識し、各種機器を操作することができるようにした音声認識機器操作装置に関し、特に複数の機器や機能が作動しているとき、操作を行う機器や機能を特定することがなくても各機器や機能共通の言葉を用いて特定の機器の操作を行うことができるようにした音声認識機器操作装置に関する。
【0002】
【従来の技術】
近年の音声認識技術の進歩により、利用者がマイクから入力した音声を認識し、各種機器を操作することができるようになっている。特に車両搭載機器においては、これを操作する人は主として運転者であるため、これらの機器の操作により視線をそらし、脇見運転により安全運転が損なわれないように前記音声認識機器操作装置を用いることが多く、運転者の口の近辺や運転席の周囲に設置したマイクから入力される音声を認識して、例えばナビゲーション装置、オーディオ機器、携帯電話の操作を行い、更にはエアコン等の操作を行う開発もなされている。
【0003】
また一般家庭においても音声認識機器操作装置を用いて、テレビ、ビデオ、オーディオ機器、エアコン、照明、給湯設備、ドアロック等の各種機器を音声により操作する研究が住宅設備機器メーカーや電気機器メーカーによって進められている。このように一般家庭において音声認識による機器操作を行うことによって、テレビやビデオ、オーディオ機器毎の多数のリモコン、或いはエアコンのリモコンをなくし、スイッチ類が設置されているところまで行かずに照明のオンオフ及び明るさの調節を行うことができるようにし、また風呂への給湯や追い炊き等を行うことができるようにし、またドアロックを遠くから行うことができるようにすると共に特定音声の登録によりドアロックの開錠を特定者のみに限定する等、多くの分野で音声認識機器操作装置を用いることが検討され、特に高齢者世帯の増加により、また身障者用の機器としても広く普及しようとしている。
【0004】
一方、例えば車両用オーディオ機器についてみると、ヘッドユニットに対してラジオ、カセットテープ、CD、MD等のメディア、更にはCDチェンジャやMDチェンジャ等を接続し、これらのうちから選択したメディアのオーディオ信号をヘッドユニットに出力している。ヘッドユニットではこのオーディオ信号をDSP等のオーディオ信号処理を行うことにより、イコライザ機能、音場制御機能を行い、或いはアンプ機能により音量調節してスピーカから出力するようにしている。
【0005】
このようなオーディオ機器に対して前記のような音声認識機器操作装置を用いる際には、例えばオーディオ機器の音量を調節するためには、例えば「音量アップ」のような言葉を発声することにより音声認識装置はこの言葉を音声処理し、次いでテキストデータに変換してその内容を分析し、上記の言葉を「音量」という機能を示す言葉と、その機能をどのように変化させるかを指示する「アップ」という言葉に分解する。
【0006】
なお、上記のように機能を示す言葉を以降「機能語」と呼び、その機能をどのように変化させるかを示す言葉を「指示語」と呼ぶ。
【0007】
それにより「音量」という言葉を認識してオーディオ機器の各種操作機能のうち音量調整機能の操作を選択し、「アップ」という言葉を認識してその機能における音量を増加させる操作と減少させる操作のうち、音量を増加させる方向の操作を選択して操作を行い、このようにして上記の言葉を音声認識することによってオーディオ機器の音量を増加させる作動がなされる。
【0008】
また、音声認識機器操作装置を用いて上記オーディオ機器の操作指示を行う際、各種オーディオ機器のうちラジオを選択しているときに受信局を変えるとき、受信周波数を上げる方向に変更する際には、例えば「周波数アップ」というような言葉を発声することにより操作指示を行う。音声認識機器操作装置はこの言葉を音声認識処理し、この言葉の「周波数」という機能語と「アップ」という指示語に分解する。ここで「周波数」という言葉を認識することによってラジオ受信機の各種機能のうち同調周波数を変化させる機能の操作を選択し、「アップ」という言葉を認識することによってその機能における同調周波数を増加させる操作と減少させる操作のうち、周波数を増加させる方向の操作を選択して操作を行い、このようにして上記の言葉を音声認識することによってラジオの受信局を、その周波数が増加する方向に選局がなされる。
【0009】
【発明が解決しようとする課題】
上記のように、オーディオ機器を操作する際、特に音量の増減や受信周波数の増減は、例えばラジオ、CD、MD等のメディアの選択、AM放送とFM放送の選択のようにいずれかを選択して操作を行うものと異なり、例えば音量についてはその増加を「アップ」という言葉で指示した後、その結果に応じて更に「アップ」という言葉で増加を指示し、これを連続的に行うように、同じ機能について操作を連続的に指示するものが存在する。この点については前記のようなラジオの受信周波数についても同様であり、現在受信している局からその受信周波数を増加させるとき、前記のような「アップ」という発声により選局された局が所望の局ではないときには続いて再度「アップ」という発声をし、これが繰り返えされ、或いは「ダウン」の発声がなされることとなる。
【0010】
このように連続的に操作指示を行うことがある機能については、前記の場合において音量を増加する操作を行いたいとき、「アップ」という操作を行う言葉には、音量を増加する機能と受信周波数を増加する機能とが存在するため、いずれの機能をアップさせるかを明示するために「音量アップ」「音量アップ」という言葉を繰り返す必要がある。このことは周波数を増加する操作を行うときも同様であり、周波数を増加するためには「周波数アップ」「周波数アップ」という言葉を繰り返す必要がある。
【0011】
また、このようなことは前記のようなオーディオ機器に限らず、例えばエアコンの温度設定の調節に際して、設定温度を上昇させるため「温度をアップ」という言葉を発声する際も同様であり、一般家庭用機器に音声認識機器操作装置を用いた際には、前記のようなオーディオ機器、エアコンに加えて照明機器を音声により操作することができる場合は、光量を調節するために「光量アップ」「光量アップ」のような言葉を繰り返す必要がある。
【0012】
上記のように、同じ指示語によって連続的に操作を行う機能が複数存在するとき、単に指示語のみ発声しただけでは他の機能の操作と区別がつかないため、常に機能語と共に発声する必要がある。しかしながら、例えば車両搭載機器において頻繁に「アップ」という言葉が使われるのは、例えオーディオ機器でラジオが作動しており、エアコンが作動しているときでも一般的にオーディオの音量であることが多く、特に他の機器が作動していないときには音量しかあり得ない。また、1回だけ音量について「アップ」という言葉が使われた後に連続して「アップ」という言葉が発せられたときには、それは音量である確率が極めて高い。それにも関わらず従来の音声認識機器操作装置においては常に機能語と指示語を一緒に発声しなければならず不便であった。
【0013】
この対策として、例えば音量を増加させる操作を行うときは「アップ」という指示語を使用し、周波数を増加させる操作の際は「上」という指示語を用い、また、エアコンの設定温度を増加させる操作の時は「寒い」という指示語を用い、更に照明の光量を増加させる操作では「明るく」という指示語を用いるというように、各機能によって異なる指示語を使用するように予め設定しておくことも考えられる。
【0014】
しかしながら、各機能について各々その機能の設定の量を増加させる操作を行うにすぎず、ほとんど同じような操作を行うものについても、各機能によって異なる言葉を用いることは利用者にとってかえってわかりにくくなり、操作に混乱を与える原因となることが考えられ、使用しにくい音声認識機器操作装置とならざるをえない。
【0015】
したがって本発明は、機器の機能を操作する特定の指示語が複数の機能に共通して用いられている場合であって、これらの機器が全て作動しているときであっても、指示語を発声しただけで利用者が希望する機能に対する指示語を推定して、所望の操作を行うことができるようにした音声認識機器操作装置を提供することを主たる目的とする。
【0016】
【課題を解決するための手段】
本発明に係る音声認識機器操作装置は、上記課題を解決するため、利用者が入力した機器操作音声を認識する音声認識部と、前記音声認識部で認識された音声から、機器の機能を選択する機能語とその機能の操作を指示する指示語とを識別し、指示語単独の音声入力が行われたことを検出する識別部と、機器の機能とこれを操作する指示語を記録した操作指示データベースと、前記識別部で識別した指示語が複数の機能に共通の指示語であるか否かを、前記操作指示データベースから検出する操作可能機能検出部と、前記指示語に対応して使用頻度を記録する使用頻度データベースと、前記操作可能機能検出部で複数の機能に共通の指示語であることが検出されたとき、前記使用頻度データベースから前記複数の機能のうち最も使用頻度の高い機能を検索する使用頻度検索部と、前記使用頻度検索部で検索された最も使用頻度の高い機能の機能語を、入力した指示語に付加し操作語として出力する操作語形成部と、機器に対する操作指示信号が出力されるとき、前記使用頻度データベースのデータを修正する使用頻度修正部とを備えたたものである。
【0017】
また、本発明に係る他の音声認識機器操作装置は、前記音声認識機器操作装置に接続した接続機器の作動状態を検出する作動中機器検出部を備え、入力した指示語が前記作動中機器検出部で検出した作動中の機器の中で複数の機能に共通した指示語であるとき、前記使用頻度検索部で前記複数の機能の使用頻度の検索を行うようにしたものである。
【0018】
また、本発明に係る他の音声認識機器操作装置は、出力した操作指示信号を検出し、先に出力した機能の操作と同一の操作を行うことができる指示語が続いて入力されたときには、他の機能に優先して、先の出力と同じ機能を選択する手段を備えたものである。
【0019】
また、本発明に係る他の音声認識機器操作装置は、同じ操作語が連続して出力されたときには、連続する程度に応じてその操作語によって操作する機器の操作量を変化するようにしたものである。
【0020】
また、本発明に係る他の音声認識機器操作装置は、前記使用頻度データベースは、予めモデルユーザの利用によって得られた値を初期値として記録したものである。
【0021】
また、本発明に係る他の音声認識機器操作装置は、前記音声認識機器操作装置を車両搭載機器の操作に用いたものである。
【0022】
【発明の実施の形態】
本発明の実施の形態を図面に沿って説明する。図1は本発明における音声認識機器操作装置の実施例における主要機能ブロック及びそれらの相互の関係を示す機能ブロック図である。同図において、音声認識機器操作装置1の音声認識部4に音声入力開始スイッチ3の操作後にマイク2から利用者の機器操作指示用の音声が入力されると、音声認識部4ではその音声データを解析し、解析したデータについて音声認識辞書データベース22のデータを検索し、利用者の音声をテキストデータに変換する。
【0023】
認識された音声は機能語・指示語識別部5において、利用者が発声した例えば「音量アップ」のような言葉について、「音量」の機能語と「アップ」の指示語の存在を識別し、利用者が入力した操作指示の音声はその両方が組み合わされている音声であるか否かを判別する。その結果、上記のように機能語と指示語の両方が含まれていると判別された場合には、その言葉はそのままで機器を操作することができる言葉であるので、以降の処理を行うことなくその操作指示を操作指示信号出力部9に出力する。操作指示信号出力部9には図示実施例においては操作機器A〜操作機器Cの3個の音声認識により操作を行う機器が接続されている例を示しており、上記の例においてはオーディオ機器に対して音量を1段階増加する操作指示を行う。なお、この1段階で増加する量は後述するように音声操作指示の出力状況に応じて変化するように設定することができる。
【0024】
上記機能語・指示語識別部5において、例えば「アップ」のような指示語のみであり機能語が存在しない音声が入力されたと識別されたときには、これを操作可能機能検出部6に出力する。音声認識により操作を行うことができる操作機器A〜操作機器Cのうち、実際に現在作動しその機能を行うことができる状態になっているものを作動中機器検出部20で検出しており、その検出信号を作動中機器記憶部21に記憶している。前記操作可能機器検出部6では、前記のように「アップ」のような指示語のみが入力されたときには、この作動中機器記憶部21のデータを検索し、現在実際に音声認識により操作することができる機器、及び機能を特定する。
【0025】
この音声認識機器操作装置1には、例えば図2に示すように、操作機器とその機能、及びその機能に対する各種操作について、それらが使用される頻度を蓄積している操作指示使用頻度データベース12を備えている。同図は車両搭載機器において、音声により操作することができるものの例を示しており、それらの機器の例としてオーディオ機器ではヘッドユニット、ラジオ、CDプレーヤ等を備えている例を示しており、その他音声によって操作することができる車両搭載機器としてエアコン、ナビゲーション装置等を備え、これらが1つの音声認識機器操作装置により音声によって操作することができる例を示している。操作可能機能検出部6では、前記作動中機器記憶部21で検出した現在作動している機器に関して、更に上記操作指示・使用頻度データベース12を検索し、同じ指示語で操作することができる機器或いは機能が他に存在するか否か、また存在するときにはそれは何であるかを検索する。
【0026】
ここに示す操作指示・使用頻度データベース12においては、上記のように各機器の各種機能における操作がどのような指示語によって操作を行うことができるかのデータが記録され、それにより特定の指示語がどのような機器を作動することができるかが検索され、また同一の指示語でどのような機器や機能が作動されるのかも検索することができると共に、更にそれに加えてこの指示語に対応して使用頻度のデータを記録し、それにより各指示語が使用される頻度を他と比較するためのデータが記録され、種々の検索にしようすることができる例を示している。しかしながらこれを分割し、例えば使用頻度のデータは対応する指示語と共に別の使用頻度データとしてメモリに記録しておき、使用頻度データ以外を操作指示データとして他のメモリに記録し、各々独立して検索し読み出すように構成することもできる。
【0027】
図2においてオーディオ機器のヘッドユニットにおいては、これを操作することができる機能の例として音量、イコライザー等があり、そのうち音量の機能についてはこれを音声によって操作することができる指示は音量の増・減であり、この指示は各々「アップ」・「ダウン」によって行うことができる例を示している。また、イコライザーについてはこのオーディオ機器が備えているイコライザー機能に合わせてその機能を操作するための操作指示が行われ、そのときの指示語はその操作指示に合わせて利用者にわかりやすいものが設定される。
【0028】
一方、同じオーディオ機器におけるラジオにおいては、音声で操作することができる機能の例として受信周波数の例を示しており、受信周波数を増減する操作指示に際して「アップ」「ダウン」の言葉を用いることにより行われる。同図にはオーディオ機器としてCDプレーヤも音声によってその再生機能が操作される例を示しており、再生の操作指示を行うときには「プレイ」という言葉で行われ、停止は「ストップ」、次の曲に飛ばすときには「スキップ」という言葉によってそれぞれ操作を行うことができることを示している。なお、オーディオ機器としてMDプレーヤを備えている場合も同様の言葉によって同様の機能をなすようにすることができる。
【0029】
図2の例においては更にエアコンも音声によって操作することができる例を示しており、このエアコンについては設定温度の変更と風量の変更の機能が操作され、両機能ともその増減の操作指示を「アップ」「ダウン」の言葉によって操作を行うようにした例を示している。その他、ナビゲーション装置についても既に広く行われているように多くの機能が種々の音声指示によって操作が行われる。上記例の他、更に各種の機器が予め定められた音声によって同様に操作指示を行うことができる。
【0030】
図2に示す例においては、音声によって操作を行うことができる多くの音声操作機器において、特にその機能の増減を「アップ」と「ダウン」の言葉によって行うことができる機器及び操作は、オーディオ機器のヘッドユニットにおける音量の増減、ラジオの受信周波数の増減、エアコンの設定温度の増減、及びエアコンの風量の増減が行われるようになっており、したがって従来の音声による操作においては単に「アップ」という音声を入力したのみでは利用者がいずれの機器や機能を選択して操作指示を行おうとしているのかわからず、操作を行うことができない例を示している。
【0031】
図2の操作指示・使用頻度データのテーブルには、前記の指示語にそれぞれ対応して使用頻度記録部を備え、この使用頻度データについては図1の操作指示・使用頻度データベース12に示すように、予めモデルユーザによる使用実績に応じた使用頻度初期データ10が入力されている。また実際に利用者が音声による操作指示を行う毎に、操作指示信号出力部9から出力される操作信号を操作信号検出部15で検出し、使用頻度修正部16によってこのデータを書き換えることによりこの使用頻度データ11が形成される例を示している。
【0032】
このデータにより、例えば利用者が「音量」等の機能語の発声を省略し、単に「アップ」と発声したときには、使用頻度検索部13がこの操作指示・使用頻度データベース12内の使用頻度データ11を検索し、最も使用頻度の高いものを利用者が意図した機能であると判別し、操作機能推定部7に出力するようにしている。この判別に際しては、予め設定されたモデルユーザの使用によって得られたデータのみでなく、利用者の個性も加味されたデータに基づき適切なものが選択される。
【0033】
操作可能機能検出部6で得られた、前記のような利用者の音声によって操作することができる機能のデータに基づいて、操作機能推定部7では作動している機器のみについて使用頻度検索部13で前記のような検索を行い、最も利用者が意図していると推定される機器及び機能を検索する。それにより、例えば図2に示す例においてオーディ機器が作動しエアコンが作動していないときには、「アップ」という指示語に対応する機能を検索する際、エアコンのデータの検索は行わず、オーディオ機器のみの検索を行る。
【0034】
更にオーディオ機器において必ず作動するヘッドユニットに接続し選択されているオーディオ機器が例えばラジオである場合には、ラジオの機能を操作する言葉の中に周波数を増加する言葉の指示語として同じ「アップ」が使用されていることを検索し、ラジオの受信周波数を増加する方向に操作する「アップ」の使用頻度n21と、ヘッドユニットの音量を増加する「アップ」という言葉の使用頻度n11を比較し、音量の「アップ」の方が使用頻度が大きい場合には、利用者は音量の機能の操作を行おうとしていると推定する。その結果に基づいて図1の操作語形成部8では前記「アップ」という指示語に「音量」という機能語を加え、「音量アップ」という操作語を形成する。なお、このようにして機能を推定して操作語を形成し出力した結果、利用者の意図するものと異なる場合には利用者はこれに気づき、従来と同様に例えば「周波数アップ」のような意図する機能を行う機能語も加えた操作語を発声することによって従来どおり実行することができる。
【0035】
また、前記の場合、ラジオが選択されずCDプレーヤの作動が選択されている場合には、このことが前記作動中機器記憶部21のデータにより得られるので、使用頻度検索部13ではこの条件の下に操作指示使用頻度データベース12内を検索し、その結果、現在作動している機器の中で「アップ」で操作することができる機器或いは機能はヘッドユニットの音量以外に存在しないことがわかり、直ちに音量の増加の操作指示を行わせる。
【0036】
一方、オーディオ機器でラジオが選択されていて作動中の時、エアコンも作動しているときには、前記のような「アップ」という言葉が発せられたときには前記のようなオーディオ機器の他エアコンのデータも検索され、設定温度と風量についても「アップ」という言葉が使用されることが検索されるので、これらの全ての機能の操作について「アップ」が使用される使用頻度を検索し、最も使用頻度の高いものを選択する。このときには図2に示す使用頻度データのうちn11、n21、n31、n41のデータが比較され、最も多いものが選択される。その結果音量が最も使用頻度が大きいと判別されたときには、「音量アップ」の言葉に対応した機器操作信号がオーディオ機器に対して出力される。
【0037】
図1に示す例においては更に最新出力記憶部14を備え、操作指示信号出力部9から出力された最新の操作語を記憶しておき、操作機能推定部7では前記のような機能語の推定作動を行うほか、この最新出力記憶部14のデータを参照して、先に出力したものが例えばラジオの周波数の「アップ」であったときには、次に連続して利用者が発声した「アップ」は当然前回のものと同じもであると判別し、前記使用頻度データを検索することなく周波数を増加する操作を行わせることができるようにした例を示している。
【0038】
操作指示・使用頻度データベース12における使用頻度データ11は、前記のようにモデルユーザによる実際の使用によって得られるものであるが、その際には例えば図4に示すような使用頻度データベース作成装置30によって行うことができる。即ち、図示する例においては従来用いられている音声認識機器操作装置とほぼ同様の装置を用いており、音声認識部33では音声入力開始スイッチ32の操作の後にマイク31から入力された利用者の音声を、音声辞書データベース34を参照して認識し、操作語識別部35に出力する。
【0039】
操作機器A〜操作機器Cの各機器の作動状態は作動中機器検出部44で検出され、作動中機器記憶部45に一時記憶する。操作語識別部35ではこの作動中機器記憶部45のデータを参照して操作語を識別し、これを操作信号出力部36で機器操作信号とし、所定の操作機器に出力して操作機器A〜操作機器Cの操作を行う。このとき利用者が入力する音声は、従来と同様に機能語と指示語を一体にした正確な操作語を発声することにより実行される。
【0040】
但し、このモデルユーザの使用によるにデータの蓄積に際しては、前記図1に示すものと同一のシステムで、操作指示・使用頻度データベースにおける使用頻度データだけが最初全くない状態、或いは適当な値を入れておいたものを使用し、モデルユーザはこのシステムのデータ蓄積のために使用していることを十分知った上で種々の試行錯誤を行いながら利用することによりデータの蓄積を行うことも可能である。
【0041】
なお、ここで接続される操作機器は、通常は特定の車の標準装備の種々の機器を接続しているものを使用し、各種の使用態様で多くのデータを得ることもあるが、その他、例えばカーオーディオ機器メーカがオーディオに対して特に本発明による機能を付与する場合には、単にオーディオ機器のみ音声によって操作を行うことができる状態にして、音量の「アップ」と周波数の「アップ」の使用頻度データを取得し、これを利用することもでき、あるいは他の特定機器と組み合わせた状態で使用してデータを得ることもできる。
【0042】
操作信号出力部36から出力される前記のような操作語は、操作信号検出部39によって検出され、前記図2に示すものと同じデータ構成からなる操作指示・使用頻度データベース38の使用頻度データ37を、使用頻度更新部40によって更新する。この更新に際しては、音声による操作指示が1回行われる毎に使用頻度データに1加えることによりデータ更新を行うことができるが、例えば音声による操作指示が1回行われたときには例えば所定の計数として0.2を掛けた値を加える等により更新速度を調節することも可能である。また、その値が極端に大きくなることを防止するため、指数曲線に沿って増加させることもできる。なお、このようなデータベースの更新は、前記図1に示す装置における使用頻度修正部16においても同様にして行ってもよい。
【0043】
図4に示すようなブロック図から構成される前記のような使用頻度データベース作成装置においては、例えば図5(a)に示す作動フローによって処理することができる。即ち、使用頻度データベースの作成処理に際して、操作語音声の入力受付が行われる(ステップS21)。これは図4における音声認識部33に音声入力スイッチ32から音声認識装置の使用開始の信号が入り、マイク31から利用者の音声が入力することによって行われる。次いで、この音声認識により操作を行うことができるように接続されている操作機器A〜操作機器Cのうち、現在作動中の機器の検出が作動中機器検出部44によって行われ、このデータを作動中機器記憶部45に記憶する(ステップS22)。
【0044】
次いで、作動中機器記憶部45のデータを参照して操作指示を行う機器を検索して特定し(ステップS23)、入力した操作語を特定して(ステップS24)、操作信号出力部36から所定の機器に対して機器操作信号を出力する。このとき出力される信号を操作信号検出部39で検出し、使用頻度更新部40によって操作指示・使用頻度データベース38における対応する使用頻度データ37を更新し(ステップS25)、この処理を終了する(ステップS26)。上記更新に当たっては、単にデータに1を加えるほか、前記のように計数をかけたものを加え、或いは指数関数的に増加させる等種々の更新手法により更新処理を行うことができる。
【0045】
それにより、前記のような「アップ」という指示語で作動する機器或いは機能のみについて例示している図4(b)のデータの表において、例えば「音量アップ」の操作語が出力されたときにはオーディオ機器のヘッドユニットにおける音量を増加の操作指示に対応する使用頻度のデータn11の更新を行う。同様に例えば「温度アップ」の操作語が出力されたときには、エアコンの設定温度を増加する操作指示に対応する使用頻度のデータn31の更新を行う。この更新をモデルユーザにより所定期間行った後に、製品製造時にこのデータをメモリ内に書き込み、利用者がこの製品を最初に使用する時の初期値とする。
【0046】
このように、同じ指示語で複数の機器或いは機能が行われる際に利用者がどの機器或いは機能を意図しているのかを推定するデータが、既にモデルユーザの使用によって得られた予め適切と思われる初期値を入力しているので、この製品の利用者は最初から前記のように「アップ」のような指示語のみを入力したときでも、ほぼ適切な機器或いは機能の操作を行うことができる。
【0047】
図1に示される装置において、操作指示・使用頻度データベース12に上記のようにして得られた初期データを備えている製品の使用に際しては、例えば図3に示されるような作動フローによって順に処理を行い、前記のような単に「アップ」という指示語を発声したのみで適切な機能語を付与して操作語とし、出力を行うことができる。即ち、機能語付指示語を決定する処理において、最初各種機器を音声によって操作を行う操作語の音声の入力受付がなされる(ステップS1)。これは図1において音声認識部4に音声入力スイッチ3から音声認識装置の使用開始の信号が入力し、マイク2から利用者の音声が入力することによって行われる。
【0048】
次いで入力した操作語は指示語単独であるか否かを判別する(ステップS2)。その判別に際しては図1における機能語・指示語識別部5において、前記音声認識部4においてテキストデータ化した操作指示信号を解析することにより行われる。このステップS2において操作語は指示語単独であると判別されたとき、即ち前記「アップ」のように指示語単独で発声されたと判別されたときには、次のステップS3において作動中の機器の検出及び記憶が行われる。これは図1における作動中機器検出部20、及び作動中機器記憶部21において行われる。また、指示語単独ではないと判別されたときには、例えば「音声アップ」のように機能語と操作語が組み合わされた完成されている操作語であるので直ちにステップS10に進み、この操作語を操作指示信号として出力する。
【0049】
次に作動中機器記憶部のデータにより操作対象機器の特定を行う(ステップS4)。これは図1の操作可能機能検出部6において行われ、例えばここで音声によって操作を行うことができる機器であるエアコンが現在は使用されていないこと等がが検出される。その後、操作可能機能データベースから指示語で操作可能な機能を得る(ステップS5)。この操作可能機能データベースは図1に示す実施例においては操作指示・使用頻度データベース12が対応し、操作可能機能検出部6がこのデータを検索することによって行われる。
【0050】
その後、操作可能の機能は1種類であるか否かを判別する(ステップS6)。この判別において1種類のみであると判別されたときには、その機能語を指示語に付加して操作語にし(ステップS13)、これを操作指示信号として出力する(ステップS10)。これは図1における操作語形成部8及び操作指示信号出力部9において行われる。上記のように、現在作動している機器の中で、同じ指示語で作動する機器または機能が複数存在すると判別されたときには、図示実施例においては前回と同じ指示語か否かを判別している(ステップS7)。
【0051】
この判別において前回行った指示語と同じ指示語を続けて発声したときには、利用者は先の操作語と同じ機能を行わせるために連続して同じ指示語を発声したものと推定し、前回と同じ機能語を自動的に選択し(ステップS12)、前記指示語にこの機能語を付加して操作語にし(ステップS13)、これを操作指示信号として出力する(ステップS10)。このような前回の指示語との比較は、図1における最新出力記憶部14において記憶しているデータを検索することにより行うことができる。
【0052】
前記ステップS7において前回と同じ指示語ではないと判別したときには、使用頻度の高い機能を検索しそれを機能語として決定する(ステップS8)。これは図1における使用頻度検索部13において行われる。その後、決定した機能の機能語に前記指示語を付加して操作語にし(ステップS9)、これを操作指示信号として出力する(ステップS10)。
【0053】
前記のように種々のケースに応じて決定された操作指示信号が出力された後には、決定した機能の指示語の使用頻度を更新する(ステップS11)。この更新に際しては前記図4及び図5におけるモデルユーザの使用による使用頻度データの更新と同様に、使用頻度データに1ずつ加えることにより行うことができ、その他1に係数を乗じた値をを加えることができ、更にこの係数を徐々に変化させることにより指数曲線に沿って増加させ、データのオーバーフローを防ぐ等の更新方法を採用することができる。このようなデータの更新が終了するとこの作動フローは終了する(ステップS14)。
【0054】
本発明は上記実施例の他種々の態様で実施することができ、例えば利用者がこの音声認識機器操作装置を使用しているとき、例えば音量を「アップ」する操作を連続して繰り返したことを、例えば図1の最新出力記憶部14で同じ出力が連続して記憶されたことを検出する等によりわかったときには、このデータを別途メモリに記録し、例えば音量を「アップ」する操作指示が行われたとき、オーディオ機器において音量を増加する量が利用者の意図しているものより小さいことにより繰り返し同じ操作指示を行ったことが推定されるので、以降は前記メモリのデータに基づいて操作指示信号出力部9から出力する操作量の信号を増量する等により、利用者の意図に沿った音量の増量を行うことができるようにしても良い。その際、音量の増量の程度は、利用者が同じ指示語を繰り返した程度により変化させることもできる。また、操作指示信号出力部では、この程度に応じて1回の「アップ」という発声により例えば2回音量増加の信号を出力する等、適宜学習を行って種々の手段によって作動させることもでき、それにより利用者の個性に合わせた操作制御を行うことができる。
【0055】
前記実施例においては特に車両搭載機器の機器操作に用いた例を示したが、本発明は例えば家庭用オーディ機器、テレビ、ビデオ、エアコン、照明、給湯設備、ドアロック等の各機器の音声による操作、及びこれらの総合的な操作等、種々の分野における音声認識による機器操作に対して、同様の態様によって広く使用することができる。
【0056】
【発明の効果】
本発明は、上記のように構成したので、機器の機能を操作する特定の指示語が複数の機能に共通して用いられる場合でも、利用者が希望する機能を使用頻度データによって推定することにより、その特定の指示語を発声しただけで、この機能を指示する機能語と前記指示語を組み合わせて操作語とし、適切な機器の操作を行わせることができる。それにより、全ての場合において原則として機能語を発声する必要が無くなり、使用しやすい音声認識機器操作装置とすることができる。
【0057】
また、本発明に係る他の音声認識機器操作装置は、前記音声認識機器操作装置に接続した接続機器の作動状態を検出する作動中機器検出部を備え、入力した指示語が前記作動中機器検出部で検出した作動中の機器の中で複数の機能に共通した指示語であるとき、前記使用頻度検索部で前記複数の機能の使用頻度の検索を行うようにしたので、利用者が発声した指示語は現在作動している機器のものであると推定できるため、より確実な利用者の意図する機能を推定することができる。また、使用頻度の検索を行う範囲を現在作動している機器に限定することができるので、データ上では多くの共通の指示語で作動する機能があっても、実際は1つだけに過ぎない場合があり、少なくともその検索範囲が絞られるため、高速且つ確実な検索が可能となる。
【0058】
また、本発明に係る他の音声認識機器操作装置は、出力した操作指示信号を検出し、先に出力した機能の操作と同一の操作を行うことができる指示語が続いて入力されたときには、他の機能に優先して、先の出力と同じ機能を選択する手段を備えたので、先に音声認識により操作された機能の操作は、単に指示語のみ発声するだけでその機能の操作を行うことができ、利用しやすい音声認識機器操作装置とすることができる。
【0059】
また、本発明に係る他の音声認識機器操作装置は、同じ操作語が連続して出力されたときには、連続する程度に応じてその操作語によって操作する機器の操作量を変化させたので、例えば音量を連続的に増加させることが多いことが検出されたときには、次には1回の操作指示で大きく音量を増加させる等、同じ操作指示を行っても利用者の個性に合わせて機器の操作を行うことができ、利用性の良い音声認識機器操作装置とすることができる。
【0060】
また、本発明に係る他の音声認識機器操作装置は、前記使用頻度データベースは、予めモデルユーザの利用によって得られた値を初期値として記録したので、この音声認識機器装置を最初に使用するときから、単に指示語が入力されたときでもほぼ適切な機能を選択し操作指示を行うことができる。
【0061】
また、本発明に係る他の音声認識機器操作装置は、前記音声認識機器操作装置を車両搭載機器の操作に用いたので、通常運転者が行うことが多い車両搭載機器の操作を安全運転のために音声認識によって行う際、機能語と指示語の組み合わせを考えることなく指示語のみで適切な操作指示を行うことができ、利用しやすい装置とすることができる。
【図面の簡単な説明】
【図1】本発明の実施例の機能ブロック図である。
【図2】同実施例に用いられる操作指示・使用頻度データベースに記録されるデータの例を示す図表である。
【図3】本発明の実施例の作動フロー図である。
【図4】 本発明の実施例に用いられる操作指示・使用頻度データベースに記録される使用頻度データについて、その初期データを得るための使用頻度データベース作成装置の例を示すブロック図である。
【図5】同使用頻度データベース作成装置を実行する作動フロー図である。
【符号の説明】
1 音声認識機器操作装置
2 マイク
3 音声入力開始スイッチ
4 音声認識部
5 機能語・指示語識別部
6 操作可能機能検出部
7 操作機能推定部
8 操作語形成部
9 操作指示信号出力部
10 使用頻度初期データ
11 使用頻度データ
12 操作指示・使用頻度データベース
13 使用頻度検索部
14 最新出力記憶部
15 操作信号検出部
16 使用頻度修正部
17〜19 操作機器
20 作動中機器検出部
21 作動中機器記憶部
22 音声認識辞書データベース

Claims (6)

  1. 利用者が入力した機器操作音声を認識する音声認識部と、
    前記音声認識部で認識された音声から、機器の機能を選択する機能語とその機能の操作を指示する指示語とを識別し、指示語単独の音声入力が行われたことを検出する識別部と、
    機器の機能とこれを操作する指示語を記録した操作指示データベースと、
    前記識別部で識別した指示語が複数の機能に共通の指示語であるか否かを、前記操作指示データベースから検出する操作可能機能検出部と、
    前記指示語に対応して使用頻度を記録する使用頻度データベースと、
    前記操作可能機能検出部で複数の機能に共通の指示語であることが検出されたとき、前記使用頻度データベースから前記複数の機能のうち最も使用頻度の高い機能を検索する使用頻度検索部と、
    前記使用頻度検索部で検索された最も使用頻度の高い機能の機能語を、入力した指示語に付加し操作語として出力する操作語形成部と、
    機器に対する操作指示信号が出力されるとき、前記使用頻度データベースのデータを修正する使用頻度修正部とを備えたことを特徴とする音声認識機器操作装置。
  2. 前記音声認識機器操作装置に接続した接続機器の作動状態を検出する作動中機器検出部を備え、
    入力した指示語が前記作動中機器検出部で検出した作動中の機器の中で複数の機能に共通した指示語であるとき、前記使用頻度検索部で前記複数の機能の使用頻度の検索を行うことを特徴とする請求項1記載の音声認識機器操作装置。
  3. 出力した操作指示信号を検出し、先に出力した機能の操作と同一の操作を行うことができる指示語が続いて入力されたときには、他の機能に優先して、先の出力と同じ機能を選択する手段を備えたことを特徴とする請求項1記載の音声認識機器操作装置。
  4. 同じ操作語が連続して出力されたときには、連続する程度に応じてその操作語によって操作する機器の操作量を変化することを特徴とする請求項1記載の音声認識機器操作装置。
  5. 前記使用頻度データベースは、予めモデルユーザの利用によって得られた値を初期値として記録したものであることを特徴とする請求項1記載の音声認識機器操作装置。
  6. 前記音声認識機器操作装置を車両搭載機器の操作に用いたことを特徴とする請求項1記載の音声認識機器操作装置。
JP2001060876A 2001-03-05 2001-03-05 音声認識機器操作装置 Expired - Fee Related JP4155383B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001060876A JP4155383B2 (ja) 2001-03-05 2001-03-05 音声認識機器操作装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001060876A JP4155383B2 (ja) 2001-03-05 2001-03-05 音声認識機器操作装置

Publications (2)

Publication Number Publication Date
JP2002258892A JP2002258892A (ja) 2002-09-11
JP4155383B2 true JP4155383B2 (ja) 2008-09-24

Family

ID=18920244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001060876A Expired - Fee Related JP4155383B2 (ja) 2001-03-05 2001-03-05 音声認識機器操作装置

Country Status (1)

Country Link
JP (1) JP4155383B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10328950B2 (en) 2014-09-15 2019-06-25 Denso Corporation Vehicle equipment control device and method of searching for control content

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4223832B2 (ja) * 2003-02-25 2009-02-12 富士通株式会社 適応型音声対話システム及び方法
US20080228492A1 (en) * 2003-12-05 2008-09-18 Kabushikikaisha Kenwood Device Control Device, Speech Recognition Device, Agent Device, Data Structure, and Device Control
US7529676B2 (en) * 2003-12-05 2009-05-05 Kabushikikaisha Kenwood Audio device control device, audio device control method, and program
DE602004016683D1 (de) * 2003-12-05 2008-10-30 Kenwood Corp Einrichtungssteuereinrichtung und einrichtungssteuerverfahren
JP4503310B2 (ja) * 2004-02-20 2010-07-14 本田技研工業株式会社 電子機器制御装置
JP2005300989A (ja) * 2004-04-13 2005-10-27 Mitsubishi Electric Corp 音声認識システム
JP2005345903A (ja) * 2004-06-04 2005-12-15 Honda Motor Co Ltd 音声による機器制御装置
JP4628803B2 (ja) * 2005-01-25 2011-02-09 本田技研工業株式会社 音声認識型機器制御装置
JP4857805B2 (ja) * 2006-02-21 2012-01-18 パナソニック電工株式会社 リモコン装置及び遠隔制御システム
JP6025091B2 (ja) * 2012-03-29 2016-11-16 パナソニックIpマネジメント株式会社 機器制御装置、機器制御システムおよびプログラム
JP6073881B2 (ja) * 2012-06-19 2017-02-01 株式会社Nttドコモ 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム
JP6348831B2 (ja) * 2014-12-12 2018-06-27 クラリオン株式会社 音声入力補助装置、音声入力補助システムおよび音声入力方法
US9472196B1 (en) 2015-04-22 2016-10-18 Google Inc. Developer voice actions system
JP2017091785A (ja) * 2015-11-09 2017-05-25 パナソニックIpマネジメント株式会社 照明制御システム及びプログラム
WO2018073907A1 (ja) * 2016-10-19 2018-04-26 三菱電機株式会社 音声認識装置及び音声認識方法
JP6565883B2 (ja) 2016-12-02 2019-08-28 トヨタ自動車株式会社 車両用制御装置
JP6513749B2 (ja) 2017-08-09 2019-05-15 レノボ・シンガポール・プライベート・リミテッド 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム
KR102428148B1 (ko) * 2017-08-31 2022-08-02 삼성전자주식회사 가전 기기의 음성 인식을 위한 시스템과 서버, 방법
WO2019176252A1 (ja) * 2018-03-13 2019-09-19 ソニー株式会社 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
JP7385635B2 (ja) * 2021-08-12 2023-11-22 Necパーソナルコンピュータ株式会社 音声コマンド認識システム、音声コマンド認識方法、及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10328950B2 (en) 2014-09-15 2019-06-25 Denso Corporation Vehicle equipment control device and method of searching for control content

Also Published As

Publication number Publication date
JP2002258892A (ja) 2002-09-11

Similar Documents

Publication Publication Date Title
JP4155383B2 (ja) 音声認識機器操作装置
US7822613B2 (en) Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus
EP3472831B1 (en) Techniques for wake-up word recognition and related systems and methods
US8005681B2 (en) Speech dialog control module
US9092435B2 (en) System and method for extraction of meta data from a digital media storage device for media selection in a vehicle
JP4260788B2 (ja) 音声認識機器制御装置
JP2003044069A (ja) 音声認識による誤動作の防止及び音声認識率の向上が可能な電子機器及び方法
US20050216271A1 (en) Speech dialogue system for controlling an electronic device
US20080221891A1 (en) Interactive speech recognition system
US20060235701A1 (en) Activity-based control of a set of electronic devices
JP2007286136A (ja) 車載用音声認識装置及び音声認識方法
JP2000322078A (ja) 車載型音声認識装置
US20140349599A1 (en) System And Method for Searching Stored Audio Data Based on a Search Pattern
JP4770374B2 (ja) 音声認識装置
EP1065652B1 (en) Voice-based manipulation method and apparatus
KR101944303B1 (ko) 음성인식을 이용한 자동 음원 선곡이 가능한 자동차 오디오 시스템 제어방법
JP2007043356A (ja) 音量自動調節装置および音量自動調節方法
JP2006215418A (ja) 音声入力装置及び音声入力方法
JP5037041B2 (ja) 車載用音声認識装置及び音声コマンド登録方法
JP2001337687A (ja) 機器音声操作装置
JP4201869B2 (ja) 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体
JP2003146145A (ja) 情報提示装置及び方法
JPH05197385A (ja) 音声認識装置
WO2019058453A1 (ja) 音声対話制御装置および音声対話制御方法
KR20110043213A (ko) 스티어링 휠 리모콘을 이용한 음성 안내 기능을 가지는 차량용 오디오 장치 및 음성 안내 프로그램을 기록한 기록매체

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060131

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080702

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080702

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110718

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4155383

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120718

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120718

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130718

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130718

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140718

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees