JP2007193138A - 画像形成装置 - Google Patents
画像形成装置 Download PDFInfo
- Publication number
- JP2007193138A JP2007193138A JP2006011635A JP2006011635A JP2007193138A JP 2007193138 A JP2007193138 A JP 2007193138A JP 2006011635 A JP2006011635 A JP 2006011635A JP 2006011635 A JP2006011635 A JP 2006011635A JP 2007193138 A JP2007193138 A JP 2007193138A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- user
- unit
- image forming
- forming apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002194 synthesizing effect Effects 0.000 claims abstract 2
- 230000015572 biosynthetic process Effects 0.000 claims description 19
- 238000003786 synthesis reaction Methods 0.000 claims description 19
- 238000000034 method Methods 0.000 claims description 12
- 238000012790 confirmation Methods 0.000 claims description 6
- 230000001360 synchronised effect Effects 0.000 claims description 4
- 239000004973 liquid crystal related substance Substances 0.000 abstract description 4
- 230000007613 environmental effect Effects 0.000 description 12
- 239000000284 extract Substances 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000007639 printing Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 208000016354 hearing loss disease Diseases 0.000 description 2
- 230000007257 malfunction Effects 0.000 description 2
- 208000029257 vision disease Diseases 0.000 description 2
- 230000004393 visual impairment Effects 0.000 description 2
- 206010047571 Visual impairment Diseases 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Landscapes
- Control Or Security For Electrophotography (AREA)
Abstract
【課題】ユーザの声紋パターンを登録しておくことで、暗証番号を入力せずに認証を行うことができ、且つ画面を確認しながら音声応答できることで操作の利便性を向上させる画像形成装置を提供する。
【解決手段】この画像形成装置100は、図示しない利用者の音声を電気信号に変換するマイク8と、合成音を発音するスピーカ9と、キーや液晶表示パネルから構成される操作表示部10と、マイク8、スピーカ9及び操作表示部10の信号をインターフェースするユーザインターフェース7と、利用者の音声を認識し、認識した音声からキーワードを抽出する音声認識部4と、指定した音声を合成して出力する音声合成部5と、声紋の特徴を抽出し登録されている声紋パターンと照合する声紋認証部6と、対話を記述した文書を解釈する対話インタプリタ3と、ファイル情報を記憶するハードディスク2と、を備えて構成される。
【選択図】図1
【解決手段】この画像形成装置100は、図示しない利用者の音声を電気信号に変換するマイク8と、合成音を発音するスピーカ9と、キーや液晶表示パネルから構成される操作表示部10と、マイク8、スピーカ9及び操作表示部10の信号をインターフェースするユーザインターフェース7と、利用者の音声を認識し、認識した音声からキーワードを抽出する音声認識部4と、指定した音声を合成して出力する音声合成部5と、声紋の特徴を抽出し登録されている声紋パターンと照合する声紋認証部6と、対話を記述した文書を解釈する対話インタプリタ3と、ファイル情報を記憶するハードディスク2と、を備えて構成される。
【選択図】図1
Description
本発明は、画像形成装置に関し、さらに詳しくは、利用者の音声を認識することにより利用者を特定し、且つその利用者の音声による操作手順を実行する画像形成装置に関するものである。
従来の各種電子機器においては、視覚障害を有した利用者の要求を音声認識技術により装置が認識して、次の操作手順を音声により知らせる技術が開発されている。また、聴覚障害を有した利用者に対しては、大きな表示部を設けたり、操作手順を順次表示部に文字として表示したり、或いは利用者が振動部に接触して振動の種類により操作方法を認識する手法が採られていた。
また最近では、セキュリティの関係から利用者を特定する目的で、ユーザ認証部を設けて利用制限するために、操作キーを利用して暗証番号を押すようにする装置も開発されている。しかし、視覚障害を有した利用者にとっては操作キーを操作することが難しく、また、音声入力だけで制御すると操作履歴を確認することができないといった問題と、一般の音声認識装置は平均的な音声パターンを利用しているため、ユーザによって音声認識率が異なるといった問題もある。更に、全ての音声を認識しようとすると、認識率を高めるために認識レベルを低くせざるを得なくなり、その結果、装置の誤動作につながる虞が出てくる。
また、聴覚障害を有した利用者に対して操作画面だけで操作を行なわせると、機能が階層化されている場合、目的の操作を入力するのに手間取るといった問題がある。
また、聴覚障害を有した利用者に対して操作画面だけで操作を行なわせると、機能が階層化されている場合、目的の操作を入力するのに手間取るといった問題がある。
また従来技術として特許文献1には、装置本体の操作ツリーを構造化した構造化文書を、音声構造化文書に変換して、入出力通信自在に記憶させる。また、マイクロホンからのオペレータの指示を音声構造化文書によって制御情報に変換し、装置本体を制御する。また、オペレータのフィールド毎の使用頻度や誤認識率などを集計し、構造化文書に変換して出力する。そして集計結果に基づいて、操作ツリーの体系を変更し、オペレータがより容易に入力できるようにし、またキーワードを変更するなどにより音声認識を容易にする音声制御装置について開示されている。
また特許文献2には、個人情報の識別を行なう個人識別手段と、個人識別手段によって識別された個人情報に基づいて機器の動作をカスタマイズするカスタマイズ手段とを有する画像形成装置について開示されている。
また特許文献3には、マイクロホンからの音声に含まれる指示が、音声認識部で認識され、それに対応する制御信号が制御信号作成部で作成される。また、通信部を介して入力された音声に含まれる指示が音声認識部で認識され、それに対応する制御信号が制御信号作成部で作成され、制御信号に基づき装置の機能実施部の動作が制御される画像形成装置について開示されている。
特開2003−302997公報
特開2000−231309公報
特開2002−287796公報
また特許文献3には、マイクロホンからの音声に含まれる指示が、音声認識部で認識され、それに対応する制御信号が制御信号作成部で作成される。また、通信部を介して入力された音声に含まれる指示が音声認識部で認識され、それに対応する制御信号が制御信号作成部で作成され、制御信号に基づき装置の機能実施部の動作が制御される画像形成装置について開示されている。
しかしながら、特許文献1に開示されている従来技術は、音声構造化文書を変更することにより、音声制御の内容を容易に変更することができるが、セキュリティの点で多くの問題を含んでいる。
また、特許文献2に開示されている従来技術は、個人情報に基づいて機器の動作をカスタマイズすることは容易である反面、特許文献1と同様にセキュリティの点で多くの問題を含んでいる。
また、特許文献3に開示されている従来技術は、通信部を介して入力された音声に含まれる指示が認識されて装置を遠隔制御するものであるが、通信データの中から音声データを抽出する必要があり、その抽出能力により音声認識率が左右されるといった問題がある。
また、特許文献2に開示されている従来技術は、個人情報に基づいて機器の動作をカスタマイズすることは容易である反面、特許文献1と同様にセキュリティの点で多くの問題を含んでいる。
また、特許文献3に開示されている従来技術は、通信部を介して入力された音声に含まれる指示が認識されて装置を遠隔制御するものであるが、通信データの中から音声データを抽出する必要があり、その抽出能力により音声認識率が左右されるといった問題がある。
本発明は、かかる課題に鑑み、ユーザの声紋パターンを登録しておくことで、暗証番号を入力せずに認証を行うことができ、且つ画面を確認しながら音声応答できることで操作の利便性を向上させる画像形成装置を提供することを目的とする。
また、他の目的は、ユーザの音声パターンを集計することで音声認識率を向上させることである。
また、他の目的は、遠隔地でも画面を確認しながら音声応答できることで操作の利便性を更に向上させることである。
また、他の目的は、ユーザの音声パターンを集計することで音声認識率を向上させることである。
また、他の目的は、遠隔地でも画面を確認しながら音声応答できることで操作の利便性を更に向上させることである。
本発明はかかる課題を解決するために、請求項1は、利用者の音声を認識することにより、操作手順を実行する画像形成装置であって、前記利用者の音声を認識し、認識した音声からキーワードを抽出する音声認識部と、指定した音声を合成して出力する音声合成部と、声紋の特徴を抽出し登録されている声紋パターンと照合する声紋認証部と、対話を記述した文書を解釈する対話インタプリタと、対話を記述したXML文書ファイルと、前記利用者毎に音声をパターン化し、該利用者が利用する毎に更新される音声パターンファイルと、認証された利用者のキーワードをパターン化して登録する声紋パターンファイルと、を備えたことを特徴とする。
本発明の最も大きな特徴は、装置を制御する利用者を特定するために、予め利用者のキーワード声紋パターンを登録しておき、装置を操作する場合、利用者が登録したキーワードを音声入力することにより、装置の操作許可を得るようにした点である。
本発明の最も大きな特徴は、装置を制御する利用者を特定するために、予め利用者のキーワード声紋パターンを登録しておき、装置を操作する場合、利用者が登録したキーワードを音声入力することにより、装置の操作許可を得るようにした点である。
請求項2は、前記利用者が音声を入力することにより、前記音声認識部により該利用者のキーワードを抽出し、該キーワードと前記声紋パターンファイルに登録されたキーワードとを前記声紋認証部により比較し、該比較の結果が一致した場合、該利用者の音声に基づいて操作手順を実行することを特徴とする。
登録した利用者のキーワードは声紋認証部に記憶されている。従って、利用者が音声を入力すると、音声認識部がキーワードを抽出し、そのキーワードが登録されたキーワードと一致するか否かを声紋認証部により比較する。一致していれば、入力した利用者は認証されていると判断されて、それ以降、操作を実行することができる。
登録した利用者のキーワードは声紋認証部に記憶されている。従って、利用者が音声を入力すると、音声認識部がキーワードを抽出し、そのキーワードが登録されたキーワードと一致するか否かを声紋認証部により比較する。一致していれば、入力した利用者は認証されていると判断されて、それ以降、操作を実行することができる。
請求項3は、前記声紋認証部により利用者が認証された場合、前記音声認識部により認識された音声に基づいて前記対話インタプリタにより対話を解釈し、前記音声合成部により合成音を作成して該利用者に提供することを特徴とする。
声紋認証部により利用者が認証されると、入力された音声は認識されて対話インタプリタにより順次機械語に変換され、対話形式の合成音が生成され、その合成音が利用者に提供されて操作が始まる。
声紋認証部により利用者が認証されると、入力された音声は認識されて対話インタプリタにより順次機械語に変換され、対話形式の合成音が生成され、その合成音が利用者に提供されて操作が始まる。
請求項4は、音声により入力した操作履歴及び印刷物の確認映像を出力する画面生成部と、該画面生成部により表示された画面と前記音声合成部により合成された音声との同期をとる音声画面同期部と、を更に備えたことを特徴とする。
本発明は、音声が認識できない場合に、印刷物の確認映像と音声を同期させることにより、利用者に音声を認識させるものである。
本発明は、音声が認識できない場合に、印刷物の確認映像と音声を同期させることにより、利用者に音声を認識させるものである。
請求項5は、前記声紋認証部により利用者が認証された場合、前記音声認識部により認識された音声に基づいて前記対話インタプリタにより対話を解釈し、前記音声合成部により合成音を作成すると共に、前記画面生成部により操作部の表示画面を作成し、前記音声画面同期部により前記合成音と前記表示画面とを同期させて該利用者に提供することを特徴とする。
本発明は、声紋認証部により利用者が認証された場合、操作方法の合成音を提供すると共に、操作部の表示画面を作成して音声と同期して利用者に提供するものである。
本発明は、声紋認証部により利用者が認証された場合、操作方法の合成音を提供すると共に、操作部の表示画面を作成して音声と同期して利用者に提供するものである。
請求項6は、インターネット及びイントラネットなどのTCP/IPネットワークを使って音声データを送受信するVOIPゲートウェイを更に備え、前記利用者が前記VOIPゲートウェイを介して音声を入力することにより、前記声紋認証部により利用者が認証された場合、前記音声認識部により認識された音声に基づいて前記対話インタプリタにより対話を解釈し、前記音声合成部により合成音を作成して該利用者に提供することを特徴とする。
遠隔操作を行う場合、ネットワークに接続した装置から音声データを送信して行うことができる。そのとき必要なものは、インターネット及びイントラネットなどのTCP/IPネットワークを使って音声データを送受信するVOIPゲートウェイである。本発明はこのVOIPゲートウェイをユーザインターフェースに接続して、ネットワークに接続した音声操作端末から音声を入力し、その結果を音声で送信したり、画像データとして複合機、FAX及びプリンタに送信するものである。
遠隔操作を行う場合、ネットワークに接続した装置から音声データを送信して行うことができる。そのとき必要なものは、インターネット及びイントラネットなどのTCP/IPネットワークを使って音声データを送受信するVOIPゲートウェイである。本発明はこのVOIPゲートウェイをユーザインターフェースに接続して、ネットワークに接続した音声操作端末から音声を入力し、その結果を音声で送信したり、画像データとして複合機、FAX及びプリンタに送信するものである。
請求項7は、前記音声認識部に入力する音声を断接する音声断接手段を更に備えたことを特徴とする。
実際の操作時は、音声入力をON、OFFする手段が必要である。即ち、常に音声入力が入力されていると、不必要な音声により装置が誤動作する可能性があるためである。そこで本発明では、音声認識部に入力する音声を断接する音声断接手段を更に備え、音声認識が必要なときにのみ音声を入力するものである。
実際の操作時は、音声入力をON、OFFする手段が必要である。即ち、常に音声入力が入力されていると、不必要な音声により装置が誤動作する可能性があるためである。そこで本発明では、音声認識部に入力する音声を断接する音声断接手段を更に備え、音声認識が必要なときにのみ音声を入力するものである。
本発明によれば、装置を制御する利用者を特定するために、予め利用者のキーワードの声紋パターンを登録しておき、装置を操作する場合、利用者が登録したキーワードを音声入力することにより、装置の操作許可を得るようにしたので、許可されない利用者による操作を防止することでセキュリティ管理の質を向上させることができる。
以下、本発明を図に示した実施形態を用いて詳細に説明する。但し、この実施形態に記載される構成要素、種類、組み合わせ、形状、その相対配置などは特定的な記載がない限り、この発明の範囲をそれのみに限定する主旨ではなく単なる説明例に過ぎない。
図1は本発明の第1の実施形態に係る画像形成装置の要部ブロック図である。尚、図1では、画像形成装置の画像形成部は公知であるので省略している。また、本発明は制御対象として画像形成装置に限定されるものではない。この画像形成装置100は、図示しない利用者の音声を電気信号に変換するマイク8と、合成音を発音するスピーカ9と、キーや液晶表示パネルから構成される操作表示部10と、マイク8、スピーカ9及び操作表示部10の信号をインターフェースするユーザインターフェース7と、利用者の音声を認識し、認識した音声からキーワードを抽出する音声認識部4と、指定した音声を合成して出力する音声合成部5と、声紋の特徴を抽出し登録されている声紋パターンと照合する声紋認証部6と、対話を記述した文書を解釈する対話インタプリタ3と、ファイル情報を記憶するハードディスク2と、を備えて構成される。尚、ハードディスク2には、対話を記述したXML文書ファイル2aと、利用者毎に音声をパターン化し、利用者が利用する毎に更新される音声パターンファイル2bと、認証された利用者のキーワードをパターン化して登録する声紋パターンファイル2cと、を記憶している。
図1は本発明の第1の実施形態に係る画像形成装置の要部ブロック図である。尚、図1では、画像形成装置の画像形成部は公知であるので省略している。また、本発明は制御対象として画像形成装置に限定されるものではない。この画像形成装置100は、図示しない利用者の音声を電気信号に変換するマイク8と、合成音を発音するスピーカ9と、キーや液晶表示パネルから構成される操作表示部10と、マイク8、スピーカ9及び操作表示部10の信号をインターフェースするユーザインターフェース7と、利用者の音声を認識し、認識した音声からキーワードを抽出する音声認識部4と、指定した音声を合成して出力する音声合成部5と、声紋の特徴を抽出し登録されている声紋パターンと照合する声紋認証部6と、対話を記述した文書を解釈する対話インタプリタ3と、ファイル情報を記憶するハードディスク2と、を備えて構成される。尚、ハードディスク2には、対話を記述したXML文書ファイル2aと、利用者毎に音声をパターン化し、利用者が利用する毎に更新される音声パターンファイル2bと、認証された利用者のキーワードをパターン化して登録する声紋パターンファイル2cと、を記憶している。
次に画像形成装置100の概略動作について図1を参照して説明する。まず、ユーザ認証について説明する。尚、認証を受けるために予め対象となる利用者の声紋パターンを声紋パターンファイル2cに登録しておく必要がある。この説明では、登録者が音声を入力する場合について説明する。利用者はマイク8に向かって登録したキーワード(例えば、名前等)を発声する。その音は電気信号に変換されてユーザインターフェース7を介して音声認識部4に入力される。音声認識部4は音声から機械語に変換するために音声を認識する。このとき、音声パターンファイル2bに記憶されている音声パターンを更新するために、音声を順次記憶していく。これにより、同一登録者の音声認識率を高めることができる。それと同時に、音声認識部4により認識された音声の声紋パターンと声紋パターンファイル2cに予め登録してある声紋パターンとを声紋認識部6により比較する。声紋パターンファイル2cの中に記憶されている声紋パターンと一致する声紋パターンが存在すると、音声合成部5が声紋認証部6の比較結果の合成音を作成して利用者に提示する。音声を入力した利用者は認証された利用者であると判断し、以後、この利用者の音声の指示に従って画像形成の動作が行なわれる。
次にコピー動作について説明する。尚、ここではユーザ認証が行なわれた後の動作として説明する。まず、利用者が印刷に必要な情報を音声で入力する。音声認識部4はそれらを認識して必要な制御情報を抽出する。次に、音声合成部5が設定した情報の合成音を作成し、ユーザインターフェース7を介してスピーカ9により報知して利用者と対話形式にやり取りを行い、確認がとれると画像形成装置100は制御情報に則って動作を開始する。そして、画像形成装置100が動作を完了すると、動作完了を利用者に知らせるために音声合成部5が合成音を作成し、ユーザインターフェース7を介してスピーカ9により報知する。尚、利用者と対話形式にやり取りを行い、印刷に必要な情報が足りない場合、音声合成部5が足りない情報をユーザに要求する合成音を作成する。(これは情報が足りるまで繰り返す。)
図2は本発明の第2の実施形態に係る画像形成装置の要部ブロック図である。尚、図2では、画像形成装置の画像形成部は公知であるので省略している。また、本発明は制御対象として画像形成装置に限定されるものではない。同じ構成要素には図1と同じ参照番号を付して説明する。この画像形成装置110は、図示しない利用者の音声を電気信号に変換するマイク8と、合成音を発音するスピーカ9と、キーや液晶表示パネルから構成される操作表示部10と、マイク8、スピーカ9及び操作表示部10の信号をインターフェースするユーザインターフェース7と、利用者の音声を認識し、認識した音声からキーワードを抽出する音声認識部4と、指定した音声を合成して出力する音声合成部5と、声紋の特徴を抽出し登録されている声紋パターンと照合する声紋認証部6と、対話を記述した文書を解釈する対話インタプリタ3と、ファイル情報を記憶するハードディスク2と、音声により入力した操作履歴及び印刷物の確認映像を出力する画面生成部12と、画面生成部12により表示された画面と音声合成部5により合成された音声との同期をとる音声画面同期部11と、を備えて構成される。尚、ハードディスク2には、対話を記述したXML文書ファイル2aと、利用者毎に音声をパターン化し、利用者が利用する毎に更新される音声パターンファイル2bと、認証された利用者のキーワードをパターン化して登録する声紋パターンファイル2cと、を記憶している。
次に画像形成装置110の概略動作について図2を参照して説明する。まず、ユーザ認証について説明する。尚、認証を受けるために予め対象となる利用者の声紋パターンを声紋パターンファイル2cに登録しておく必要がある。この説明では、登録者が音声を入力する場合について説明する。利用者はマイク8に向かって登録したキーワード(例えば、名前等)を発声する。その音は電気信号に変換されてユーザインターフェース7を介して音声認識部4に入力される。音声認識部4は音声から機械語に変換するために音声を認識する。このとき、音声パターンファイル2bに記憶されている音声パターンを更新するために、音声を順次記憶していく。これにより、同一登録者の音声認識率を高めることができる。それと同時に、音声認識部4により認識された音声の声紋パターンと声紋パターンファイル2cに予め登録してある声紋パターンとを声紋認識部6により比較する。声紋パターンファイル2cの中に記憶されている声紋パターンと一致する声紋パターンが存在すると、音声合成部5が声紋認証部6の比較結果の合成音を作成し、画面生成部12が操作表示部10の表示画面を作成する。そして、音声画面同期部11が合成音と表示画面との同期をとり利用者に提示する。音声を入力した利用者は認証された利用者であると判断し、以後、この利用者の音声の指示に従って画像形成の動作が行なわれる。
次にコピー動作について説明する。尚、ここではユーザ認証が行なわれた後の動作として説明する。まず、利用者が印刷に必要な情報を音声で入力する。音声認識部4はそれらを認識して必要な制御情報を抽出する。次に、音声合成部5が設定した情報の合成音を作成し、画面生成部12が操作表示部10の表示画面を作成する。そして、音声画面同期部11が合成音と表示画面との同期をとり、ユーザインターフェース7を介してスピーカ9により報知して利用者と対話形式にやり取りを行い、確認がとれると画像形成装置110は制御情報に則って動作を開始する。そして、画像形成装置1が動作を完了すると、動作完了を利用者に知らせるために音声合成部5が合成音を作成し、ユーザインターフェース7を介してスピーカ9により報知する。尚、利用者と対話形式にやり取りを行い、印刷に必要な情報が足りない場合、音声合成部5が足りない情報を利用者に要求する合成音を作成する。(これは情報が足りるまで繰り返す。)
図3は本発明の第3の実施形態に係る画像形成装置の要部ブロック図である。尚、図3では、画像形成装置120の画像形成部は公知であるので省略してあり、且つ図1及び図2と同じ部分については図示を省略している。また、本発明は制御対象として画像形成装置に限定されるものではない。この画像形成装置120は、インターネット及びイントラネットなどのTCP/IPネットワークを使って音声データを送受信するVOIPゲートウェイ13を更に備え、VOIPゲートウェイ13は、公衆回線網又はインターネット14に接続され、公衆回線網又はインターネット14には、例えば、音声操作端末類15と、MFP16と、FAX17と、LP18が接続されている。尚、音声操作端末類15として、カーナビ15a、携帯電話15b、固定電話15cがある。
次に画像形成装置120の概略動作について図3を参照して説明する。まず、ユーザ認証について説明する。尚、認証を受けるために予め対象となる利用者の声紋パターンを声紋パターンファイル2cに登録しておく必要がある。この説明では、登録者が音声を入力する場合について説明する。利用者は音声操作端末類15の例えば携帯電話15bから公衆回線網14を介して電話を掛ける。そして回線が接続されると、利用者が認証のために登録した音声を発声する。その音声はVOIPゲートウェイ13を介して、電気信号に変換されてユーザインターフェース7を介して音声認識部4に入力される。これ以降の動作は第1と第2の実施形態と同様なので、説明を省略する。
次にコピー動作について説明する。尚、ここではユーザ認証が行なわれた後の動作として説明する。まず、利用者は音声操作端末類15の例えば携帯電話15bから公衆回線網14を介して電話を掛ける。そして回線が接続されると、利用者が認証のために登録した音声を発声する。その音声はVOIPゲートウェイ13を介して、電気信号に変換されてユーザインターフェース7を介して音声認識部4に入力される。これ以降の動作は第1と第2の実施形態と同様なので、説明を省略する。
図4は本発明の操作表示部の外観構成図である。この操作表示部10は、液晶等の表示パネル10aと、テンキーやスタートボタン10bと、スピーカ9と、マイク8と、マイク8からの音声入力をON/OFFする音声入力解除ボタン19と、を備えて構成される。尚、図4ではこれらが一体となって構成されているが、夫々が個別でも構わない。
図5は本発明の第1の実施形態の動作をより詳しく説明するフローチャートである。尚、認証を受けるために予め対象となる利用者のキーワードの声紋パターンを声紋パターンファイル2cに登録しておく必要がある。この説明では、登録者が音声を入力する場合について説明する。利用者はマイク8に向かって登録したキーワード(例えば、名前等)を発声する(S1)。その音は電気信号に変換されてユーザインターフェース7を介して音声認識部4に入力される。音声認識部4は音声から機械語に変換するために音声を認識する(S2)。このとき、音声が認識されない場合(S2でNOのルート)は、繰り返して音声認識動作を行なう。認識されると、音声パターンファイル2bに記憶されている音声パターンを更新するために、音声を順次記憶していく。これにより、同一登録者の音声認識率を高めることができる。また、予め登録したキーワードを抽出し(S4)、音声認識部4により認識されたキーワードと声紋パターンファイル2cに予め登録してあるキーワードとを声紋認識部6により比較する。声紋パターンファイル2cの中に記憶されているキーワードと一致するキーワードが存在すると(S5でYESのルート)、対話インタプリタ3により音声合成部5が声紋認証部6の比較結果の合成音を作成して利用者に提示する(S6)。音声を入力した利用者は認証された利用者であると判断し、以後、この利用者の音声の指示に従って画像形成の動作が行なわれる。
図6は本発明の第2の実施形態の動作をより詳しく説明するフローチャートである。同じステップには図5と同じ参照番号を付して説明する。尚、S1からS6までは、図5と同様であるので説明を省略する。即ち、S6により音声合成部5が声紋認証部6の比較結果の合成音を作成し、画面生成部12が操作表示部10の表示画面を作成する(S7)。そして、音声画面同期部11が合成音と表示画面との同期をとり利用者に提示する(S8)。音声を入力した利用者は認証された利用者であると判断し、以後、この利用者の音声の指示に従って画像形成の動作が行なわれる。
(実施例)
次に、実施例として本発明の画像形成装置と利用者とのやりとりの一例を示す。尚、ここでは基本的な操作を例にとり、Pを利用者、Mを装置として表している。
P:環境計画書を20部、A4でプリントアウトしてください。
M:その他にプリントアウト設定をされますか。
P:いいえ。
M:環境計画書を20部、A4でプリントアウトします。
《処理中》
M:環境計画書を20部、A4でプリントアウトしました。
次に、エラーが発生した場合について説明する。
P:環境計画書を20部、A4でプリントアウトしてください。
M:その他にプリントアウト設定をされますか。
P:いいえ。
M:環境計画書を20部、A4でプリントアウトします。
《処理中に紙詰まり》
M:紙詰まりがおこりました。コピーを中止します。
※もし、別のMFPがあるのならば、そちらでコピーをするかMが聞く。
※管理者に紙詰まりを通知する。
次に、実施例として本発明の画像形成装置と利用者とのやりとりの一例を示す。尚、ここでは基本的な操作を例にとり、Pを利用者、Mを装置として表している。
P:環境計画書を20部、A4でプリントアウトしてください。
M:その他にプリントアウト設定をされますか。
P:いいえ。
M:環境計画書を20部、A4でプリントアウトします。
《処理中》
M:環境計画書を20部、A4でプリントアウトしました。
次に、エラーが発生した場合について説明する。
P:環境計画書を20部、A4でプリントアウトしてください。
M:その他にプリントアウト設定をされますか。
P:いいえ。
M:環境計画書を20部、A4でプリントアウトします。
《処理中に紙詰まり》
M:紙詰まりがおこりました。コピーを中止します。
※もし、別のMFPがあるのならば、そちらでコピーをするかMが聞く。
※管理者に紙詰まりを通知する。
次に細かな設定操作をする場合について説明する。
P:環境計画書を20部、A4でプリントアウトしてください。
M:その他にプリントアウト設定をされますか。
P:2in1、両面でお願いします。
M:環境計画書を2in1、両面で編集し、20部、A4でプリントアウトしてよろしいですか。
P:はい。
M:環境計画書を2in1、両面で編集し、20部、A4でプリントアウトします。
《処理中》
M:環境計画書を20部、A4でプリントアウトしました。
P:環境計画書を20部、A4でプリントアウトしてください。
M:その他にプリントアウト設定をされますか。
P:2in1、両面でお願いします。
M:環境計画書を2in1、両面で編集し、20部、A4でプリントアウトしてよろしいですか。
P:はい。
M:環境計画書を2in1、両面で編集し、20部、A4でプリントアウトします。
《処理中》
M:環境計画書を20部、A4でプリントアウトしました。
次に予約をする場合について説明する。
P:環境計画書を10部、明日の午後2時までにコピーをしておいてください。
M:はい、わかりました。
《処理中》
M:予約が完了しました。環境計画書を10部、明日の午後2時までにコピーをしておきます。
予約完了の内容が画面にも表示される。
また、予約が実行されるとメールで通知される。
P:環境計画書を10部、明日の午後2時までにコピーをしておいてください。
M:はい、わかりました。
《処理中》
M:予約が完了しました。環境計画書を10部、明日の午後2時までにコピーをしておきます。
予約完了の内容が画面にも表示される。
また、予約が実行されるとメールで通知される。
次に外出先の複合機で印刷する場合について説明する。
P:環境計画書を15部、○○店に設置されているMFPにプリントアウトしてください。
M:はい、わかりました。
《処理中》
M:○○店のMFPからを15部プリントアウトしました。
P:環境計画書を15部、○○店に設置されているMFPにプリントアウトしてください。
M:はい、わかりました。
《処理中》
M:○○店のMFPからを15部プリントアウトしました。
以上の通り本発明によれば、装置を制御する利用者を特定するために、予め利用者のキーワードの声紋パターンを登録しておき、装置を操作する場合、利用者が登録したキーワードを音声入力することにより、装置の操作許可を得るようにしたので、許可されない利用者による操作を防止することでセキュリティ管理の質を向上させることができる。
また、利用者が音声を入力することにより、音声認識部4によりこの利用者のキーワードを抽出し、キーワードと声紋パターンファイル2cに登録されたキーワードとを声紋認証部6により比較し、比較の結果一致した場合、利用者の音声に基づいて操作手順を実行するので、許可されない利用者による操作を防止することができる。
また、利用者が音声を入力することにより、音声認識部4によりこの利用者のキーワードを抽出し、キーワードと声紋パターンファイル2cに登録されたキーワードとを声紋認証部6により比較し、比較の結果一致した場合、利用者の音声に基づいて操作手順を実行するので、許可されない利用者による操作を防止することができる。
また、声紋認証部6により利用者が認証された場合、音声認識部4により認識された音声に基づいて対話インタプリタ3により対話を解釈し、音声合成部5により合成音を作成して利用者に提供するので、操作の手順を分かり易くすることができる。
また、音声により入力した操作履歴及び印刷物の確認映像を出力する画面生成部と、この画面生成部12により表示された画面と音声合成部5により合成された音声との同期をとる音声画面同期部11と、を更に備えたので、音声が認識されないときでも、画面上から操作手順を確認することができる。
また、音声により入力した操作履歴及び印刷物の確認映像を出力する画面生成部と、この画面生成部12により表示された画面と音声合成部5により合成された音声との同期をとる音声画面同期部11と、を更に備えたので、音声が認識されないときでも、画面上から操作手順を確認することができる。
また、声紋認証部4により利用者が認証された場合、音声認識部4により認識された音声に基づいて対話インタプリタ3により対話を解釈し、音声合成部5により合成音を作成すると共に、画面生成部12により操作部の表示画面を作成し、音声画面同期部11により合成音と表示画面とを同期させて利用者に提供するので、対話形式の合成音が認識されないときでも、画面上から操作手順を確認することができる。
また、利用者がVOIPゲートウェイ13を介して音声を入力することにより、声紋認証部6により利用者が特定された場合、音声認識部4により認識された音声に基づいて対話インタプリタ3により対話を解釈し、音声合成部5により合成音を作成して利用者に提供するので、遠隔地からでも複数の情報機器を操作することができる。
また、音声認識部4に入力する音声を断接する音声断接手段を更に備えたので、音声入力のタイミングを利用者が指定することができ、不必要な音声を除外することができる。
また、利用者がVOIPゲートウェイ13を介して音声を入力することにより、声紋認証部6により利用者が特定された場合、音声認識部4により認識された音声に基づいて対話インタプリタ3により対話を解釈し、音声合成部5により合成音を作成して利用者に提供するので、遠隔地からでも複数の情報機器を操作することができる。
また、音声認識部4に入力する音声を断接する音声断接手段を更に備えたので、音声入力のタイミングを利用者が指定することができ、不必要な音声を除外することができる。
2 ハードディスク、2a XML文書ファイル、2b 音声パターンファイル、2c 声紋パターンファイル、3 対話インタプリタ、4 音声認識部、5 音声合成部、6 声紋認証部、7ユーザインターフェース、8 マイク、9 スピーカ、10 操作表示部、100 画像形成装置
Claims (7)
- 利用者の音声を認識することにより、操作手順を実行する画像形成装置であって、
前記利用者の音声を認識し、認識した音声中からキーワードを抽出する音声認識部と、指定した音声を合成して出力する音声合成部と、声紋の特徴を抽出し登録されている声紋パターンと照合する声紋認証部と、対話を記述した文書を解釈する対話インタプリタと、対話を記述したXML文書ファイルと、前記利用者毎に音声をパターン化し、該利用者が利用する毎に更新される音声パターンファイルと、認証された利用者のキーワードをパターン化して登録する声紋パターンファイルと、を備えたことを特徴とする画像形成装置。 - 前記利用者が音声を入力することにより、前記音声認識部により該利用者のキーワードを抽出し、該キーワードと前記声紋パターンファイルに登録されたキーワードとを前記声紋認証部により比較し、該比較の結果が一致した場合、該利用者の音声に基づいて操作手順を実行することを特徴とする請求項1に記載の画像形成装置。
- 前記声紋認証部により利用者が認証された場合、前記音声認識部により認識された音声に基づいて前記対話インタプリタにより対話を解釈し、前記音声合成部により合成音を作成して該利用者に提供することを特徴とする請求項1又は2に記載の画像形成装置。
- 音声により入力した操作履歴及び印刷物の確認映像を出力する画面生成部と、該画面生成部により表示された画面と前記音声合成部により合成された音声との同期をとる音声画面同期部と、を更に備えたことを特徴とする請求項1、2又は3に記載の画像形成装置。
- 前記声紋認証部により利用者が認証された場合、前記音声認識部により認識された音声に基づいて前記対話インタプリタにより対話を解釈し、前記音声合成部により合成音を作成すると共に、前記画面生成部により操作部の表示画面を作成し、前記音声画面同期部により前記合成音と前記表示画面とを同期させて該利用者に提供することを特徴とする請求項4に記載の画像形成装置。
- インターネット及びイントラネットなどのTCP/IPネットワークを使って音声データを送受信するVOIPゲートウェイを更に備え、前記利用者が前記VOIPゲートウェイを介して音声を入力することにより、前記声紋認証部により利用者が認証された場合、前記音声認識部により認識された音声に基づいて前記対話インタプリタにより対話を解釈し、前記音声合成部により合成音を作成して該利用者に提供することを特徴とする請求項1乃至5の何れか一項に記載の画像形成装置。
- 前記音声認識部に入力する音声を断接する音声断接手段を更に備えたことを特徴とする請求項1乃至6の何れか一項に記載の画像形成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006011635A JP2007193138A (ja) | 2006-01-19 | 2006-01-19 | 画像形成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006011635A JP2007193138A (ja) | 2006-01-19 | 2006-01-19 | 画像形成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007193138A true JP2007193138A (ja) | 2007-08-02 |
Family
ID=38448879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006011635A Pending JP2007193138A (ja) | 2006-01-19 | 2006-01-19 | 画像形成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007193138A (ja) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010134367A (ja) * | 2008-12-08 | 2010-06-17 | Mitsubishi Electric Corp | 電気機器 |
WO2015033523A1 (ja) * | 2013-09-03 | 2015-03-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音声対話制御方法 |
JP2015213256A (ja) * | 2014-05-02 | 2015-11-26 | キヤノン株式会社 | 画像形成装置、情報処理方法及びプログラム |
JP2019041156A (ja) * | 2017-08-22 | 2019-03-14 | オンキヨー株式会社 | 制御装置、制御装置の制御方法、プログラム、記憶媒体および被制御装置 |
JP2019071061A (ja) * | 2018-10-18 | 2019-05-09 | マクセル株式会社 | 映像表示装置 |
JP2019201299A (ja) * | 2018-05-16 | 2019-11-21 | コニカミノルタ株式会社 | 画像処理装置、画像形成装置、機密情報管理方法及びプログラム |
JP2020055115A (ja) * | 2018-09-28 | 2020-04-09 | キヤノン株式会社 | 画像処理装置、その制御方法、及びプログラム |
CN111048064A (zh) * | 2020-03-13 | 2020-04-21 | 同盾控股有限公司 | 基于单说话人语音合成数据集的声音克隆方法及装置 |
JP2020088679A (ja) * | 2018-11-28 | 2020-06-04 | コニカミノルタ株式会社 | 画像形成装置 |
JP2020102171A (ja) * | 2018-12-25 | 2020-07-02 | コニカミノルタ株式会社 | 音声処理システム、ジョブ生成装置、ジョブ生成方法およびジョブ生成プログラム |
JP2020198553A (ja) * | 2019-06-03 | 2020-12-10 | コニカミノルタ株式会社 | 画像処理装置及びプログラム |
US10868929B2 (en) | 2018-11-30 | 2020-12-15 | Ricoh Company, Ltd. | Information processing apparatus, information processing system, and information processing method |
JP2021092884A (ja) * | 2019-12-09 | 2021-06-17 | コニカミノルタ株式会社 | サーバー装置、通信システム、制御方法及び制御用のコンピュータープログラム |
US11227356B2 (en) | 2012-11-30 | 2022-01-18 | Maxell, Ltd. | Picture display device, and setting modification method and setting modification program therefor |
US11302321B2 (en) | 2018-11-30 | 2022-04-12 | Ricoh Company, Ltd. | Audio-based operation system, method of processing information using audio-based operation and storage medium |
US11544366B2 (en) | 2020-03-18 | 2023-01-03 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium storing program |
US11714585B2 (en) | 2021-06-01 | 2023-08-01 | Toshiba Tec Kabushiki Kaisha | Image forming apparatus configured to perform authentication to enable an operation for an authorized user |
US11947645B2 (en) | 2020-06-26 | 2024-04-02 | Fujifilm Business Innovation Corp. | Voice-based authentication after successful authentication based on non-voice input |
-
2006
- 2006-01-19 JP JP2006011635A patent/JP2007193138A/ja active Pending
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010134367A (ja) * | 2008-12-08 | 2010-06-17 | Mitsubishi Electric Corp | 電気機器 |
US11227356B2 (en) | 2012-11-30 | 2022-01-18 | Maxell, Ltd. | Picture display device, and setting modification method and setting modification program therefor |
US11823304B2 (en) | 2012-11-30 | 2023-11-21 | Maxell, Ltd. | Picture display device, and setting modification method and setting modification program therefor |
WO2015033523A1 (ja) * | 2013-09-03 | 2015-03-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音声対話制御方法 |
JPWO2015033523A1 (ja) * | 2013-09-03 | 2017-03-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声対話制御方法 |
JP2018169624A (ja) * | 2013-09-03 | 2018-11-01 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声対話制御方法 |
JP2015213256A (ja) * | 2014-05-02 | 2015-11-26 | キヤノン株式会社 | 画像形成装置、情報処理方法及びプログラム |
JP2019041156A (ja) * | 2017-08-22 | 2019-03-14 | オンキヨー株式会社 | 制御装置、制御装置の制御方法、プログラム、記憶媒体および被制御装置 |
JP2019201299A (ja) * | 2018-05-16 | 2019-11-21 | コニカミノルタ株式会社 | 画像処理装置、画像形成装置、機密情報管理方法及びプログラム |
JP7119558B2 (ja) | 2018-05-16 | 2022-08-17 | コニカミノルタ株式会社 | 画像処理装置、画像形成装置、機密情報管理方法及びプログラム |
JP7175696B2 (ja) | 2018-09-28 | 2022-11-21 | キヤノン株式会社 | 画像処理システム、画像処理装置、及びその制御方法 |
JP2023025021A (ja) * | 2018-09-28 | 2023-02-21 | キヤノン株式会社 | 画像処理システム、及びその制御方法 |
JP2020055115A (ja) * | 2018-09-28 | 2020-04-09 | キヤノン株式会社 | 画像処理装置、その制御方法、及びプログラム |
JP7084274B2 (ja) | 2018-10-18 | 2022-06-14 | マクセル株式会社 | 映像表示装置 |
JP2019071061A (ja) * | 2018-10-18 | 2019-05-09 | マクセル株式会社 | 映像表示装置 |
JP2020088679A (ja) * | 2018-11-28 | 2020-06-04 | コニカミノルタ株式会社 | 画像形成装置 |
JP7095571B2 (ja) | 2018-11-28 | 2022-07-05 | コニカミノルタ株式会社 | 画像形成装置 |
US11302321B2 (en) | 2018-11-30 | 2022-04-12 | Ricoh Company, Ltd. | Audio-based operation system, method of processing information using audio-based operation and storage medium |
US10868929B2 (en) | 2018-11-30 | 2020-12-15 | Ricoh Company, Ltd. | Information processing apparatus, information processing system, and information processing method |
JP2020102171A (ja) * | 2018-12-25 | 2020-07-02 | コニカミノルタ株式会社 | 音声処理システム、ジョブ生成装置、ジョブ生成方法およびジョブ生成プログラム |
JP7139937B2 (ja) | 2018-12-25 | 2022-09-21 | コニカミノルタ株式会社 | 音声処理システム、ジョブ生成装置、ジョブ生成方法およびジョブ生成プログラム |
JP2020198553A (ja) * | 2019-06-03 | 2020-12-10 | コニカミノルタ株式会社 | 画像処理装置及びプログラム |
JP7388006B2 (ja) | 2019-06-03 | 2023-11-29 | コニカミノルタ株式会社 | 画像処理装置及びプログラム |
JP2021092884A (ja) * | 2019-12-09 | 2021-06-17 | コニカミノルタ株式会社 | サーバー装置、通信システム、制御方法及び制御用のコンピュータープログラム |
JP7476527B2 (ja) | 2019-12-09 | 2024-05-01 | コニカミノルタ株式会社 | サーバー装置、通信システム、制御方法及び制御用のコンピュータープログラム |
CN111048064A (zh) * | 2020-03-13 | 2020-04-21 | 同盾控股有限公司 | 基于单说话人语音合成数据集的声音克隆方法及装置 |
US11544366B2 (en) | 2020-03-18 | 2023-01-03 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium storing program |
US11947645B2 (en) | 2020-06-26 | 2024-04-02 | Fujifilm Business Innovation Corp. | Voice-based authentication after successful authentication based on non-voice input |
US11714585B2 (en) | 2021-06-01 | 2023-08-01 | Toshiba Tec Kabushiki Kaisha | Image forming apparatus configured to perform authentication to enable an operation for an authorized user |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007193138A (ja) | 画像形成装置 | |
JP7159000B2 (ja) | 自然言語に基づく複合機制御システム及び方法 | |
JP5146429B2 (ja) | 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム | |
JP2008129713A (ja) | 複数のモダリティを関連付けるための方法、そのプログラムおよび複数モダリティを関連付けるマルチモーダルシステム | |
JP7520483B2 (ja) | 情報処理システム、情報処理装置、制御方法、プログラム | |
JP2007025351A (ja) | 演奏システム | |
JP2000029585A (ja) | 音声コマンド認識画像処理装置 | |
JP7580950B2 (ja) | 情報処理装置、情報処理システム、制御方法、並びにプログラム | |
JP2006330576A (ja) | 機器操作システム、音声認識装置、電子機器、情報処理装置、プログラム、及び記録媒体 | |
JP6455352B2 (ja) | 電力供給装置および画像形成装置 | |
JP2004227136A (ja) | 印刷装置 | |
US20210152700A1 (en) | Image processing system, setting control method, image processing apparatus, and storage medium | |
JP2004206636A (ja) | ネットワークプリンタシステム及びプリンタ | |
JP7286321B2 (ja) | 情報処理システム、情報処理装置、制御方法、プログラム | |
JP2002342049A (ja) | 音声対応印刷処理システムおよびその制御方法、並びに記録媒体、コンピュータプログラム | |
JP2006146665A (ja) | 画像処理システム、および、画像処理方法 | |
JP2023003642A (ja) | 制御システム、サーバシステム、制御方法、及びプログラム | |
JP7418076B2 (ja) | 情報処理システム、情報処理装置、情報処理方法 | |
JP7327939B2 (ja) | 情報処理システム、情報処理装置、制御方法、プログラム | |
US12051411B2 (en) | Speech setting system, speech setting assistance device and non-transitory computer-readable recording medium encoded with speech setting assistance program | |
JP2022007620A (ja) | 情報処理装置及びプログラム | |
JP2020187423A (ja) | 画像形成システム、画像形成装置、および制御方法 | |
JP2022007018A (ja) | 音声設定システム、音声設定支援装置および音声設定支援プログラム | |
JP2005038067A (ja) | 音声入力機能を備えたフォームを提供する電子フォームシステム | |
JP2006181874A (ja) | 画像形成装置及び画像処理方法 |