JP2005257903A - 画像形成装置および音声入力処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム - Google Patents
画像形成装置および音声入力処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム Download PDFInfo
- Publication number
- JP2005257903A JP2005257903A JP2004067526A JP2004067526A JP2005257903A JP 2005257903 A JP2005257903 A JP 2005257903A JP 2004067526 A JP2004067526 A JP 2004067526A JP 2004067526 A JP2004067526 A JP 2004067526A JP 2005257903 A JP2005257903 A JP 2005257903A
- Authority
- JP
- Japan
- Prior art keywords
- switching
- language
- speech recognition
- paper size
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Control Or Security For Electrophotography (AREA)
Abstract
【課題】 操作者が選択する用紙サイズに応じて参照すべき言語の順序を切り替えて、複数の言語情報中から参照すべき単語情報領域を優先的に切り替えながら音声認識処理を実行させることである。
【解決手段】 操作パネルによる指示に従い、コントローラ部のCPUが転写用紙サイズを切り換える用紙サイズ切り換えがあると判断した場合に、該切り換え出力に応じて、CPU503が認識する際に参照すべきRAM505内の言語領域の参照順序を切り換え制御する構成を特徴とする。
【選択図】 図3
【解決手段】 操作パネルによる指示に従い、コントローラ部のCPUが転写用紙サイズを切り換える用紙サイズ切り換えがあると判断した場合に、該切り換え出力に応じて、CPU503が認識する際に参照すべきRAM505内の言語領域の参照順序を切り換え制御する構成を特徴とする。
【選択図】 図3
Description
本発明は、音声入力される音声情報を言語別に認識処理可能な画像形成装置および音声入力処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラムに関するものである。
従来、この種の画像形成装置は、多機能化が進み、種々の機能(コピー機能、ファクシミ機能等)を組み合わせ処理可能な複合機が実用化されている。そして、このような複合機には、各種の画像処理を設定したり、現在の状況をユーザに通知するための操作パネルが設けられ、この操作パネルをユーザが直接操作することで、意図する画像処理を実行させることができる。
さらに、上記のような複合機を含む画像形成装置において、操作パネル上のキー入力による設定以外に音声による入力で各種モードの設定が行えるものが、例えば下記特許文献1によって既に提案されている。
特開2001−175278号公報
しかしながら、上記特許文献1に開示されるような画像形成装置では、音声入力モードにおいて、対応すべき言語は1つとは限らないため、各国の言語に対応させた音声認識エンジンをあらかじめ備える必要が生じる。
したがって、音声入力モードが設定されたとしても、何ヶ国語もの言語に対応させた場合は、言語認識処理に要する時間がかかるだけでなく、誤認識を起こしやすくなるという問題点もあり、好ましくないという課題が指摘されていた。
本発明は、上記の問題点を解決するためになされたもので、第1の目的は、前記用紙サイズ切り換え出力に応じて、音声認識する際に参照すべき記憶手段内の言語領域の参照順序を切り換え制御することにより、操作者が選択する用紙サイズに応じて参照すべき言語の順序を切り替えて、複数の言語情報中から参照すべき単語情報領域を優先的に切り替えながら音声認識処理を実行させることができ、音声認識処理に要する時間を大幅に短縮することができる利便性に優れた画像形成装置および音声入力処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラムを提供することである。
第2の目的は、表示言語切り換え出力に応じて、音声認識する際に参照すべき記憶手段内の言語領域の参照順序を切り換え制御することにより、操作者が選択する用紙サイズに応じて参照すべき言語の順序を切り替えて、複数の言語情報中から参照すべき単語情報領域を優先的に切り替えながら音声認識処理を実行させることができ、音声認識処理に要する時間を大幅に短縮することができる利便性に優れた画像形成装置および音声入力処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラムを提供することである。
第3の目的は、用紙サイズまたは表示言語の何れを優先させるかの選択状態と、前記用紙サイズ切り換え出力と、または表示言語切り換え出力とに応じて、音声認識する際に参照すべき記憶手段内の言語領域の参照順序を切り換え制御することにより、操作者が選択する用紙サイズに応じて参照すべき言語の順序を切り替えて、複数の言語情報中から参照すべき単語情報領域を優先的に切り替えながら音声認識処理を実行させることができ、音声認識処理に要する時間を大幅に短縮することができる利便性に優れた画像形成装置および音声入力処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラムを提供することである。
本発明は、音声入力手段を有する画像形成装置において、異なる領域に音声認識に必要な単語情報を言語別に複数記憶する記憶手段と、前記音声入力手段から入力された音声を前記単語情報を参照して音声認識する音声認識手段と、転写用紙サイズを切り換える用紙サイズ切り換え手段と、前記用紙サイズ切り換え手段の切り換え出力に応じて、前記音声認識手段が認識する際に参照すべき前記記憶手段内の言語領域の参照順序を切り換え制御する制御手段とを有することを特徴とする。
また、本発明は、音声入力手段を有する画像形成装置において、異なる領域に音声認識に必要な単語情報を言語別に複数記憶する記憶手段と、前記音声入力手段から入力された音声を前記単語情報を参照して音声認識する音声認識手段と、操作パネルに表示される表示言語を切り換える表示言語切り換え手段と、前記表示言語切り換え手段の切り換え出力に応じて、前記音声認識手段が認識する際に参照すべき前記記憶手段内の言語領域の参照順序を切り換え制御する制御手段とを有することを特徴とする。
さらに、本発明は、音声入力手段を有する画像形成装置において、異なる領域に音声認識に必要な単語情報を言語別に複数記憶する記憶手段と、前記音声入力手段から入力された音声を前記単語情報を参照して音声認識する音声認識手段と、転写用紙サイズの系列を切り換える用紙サイズ切り換え手段と、操作パネルに表示される表示言語を切り換える表示言語切り換え手段と、前記音声認識手段が認識する際に参照すべき前記記憶手段内の言語領域を切り換える変更手段と、前記音声認識手段による音声認識の際に前記用紙サイズまたは前記表示言語の何れを優先するかを選択する選択手段と、前記選択手段の選択状態と、前記用紙サイズ切り換え手段の切り換え出力と、または前記表示言語切り換え手段の切り換え出力とに応じて、前記音声認識手段が認識する際に参照すべき前記記憶手段内の言語領域の参照順序を切り換え制御する制御手段とを有することを特徴とする。
本発明は、異なる領域に音声認識に必要な単語情報を言語別に複数記憶する記憶手段を備え、音声入力手段を有する画像形成装置における音声入力処理方法において、前記音声入力手段から入力された音声を前記単語情報を参照して音声認識する音声認識ステップと、転写用紙サイズを切り換える用紙サイズ切り換えステップと、前記用紙サイズ切り換えステップの切り換え出力に応じて、前記音声認識ステップが認識する際に参照すべき前記記憶手段内の言語領域の参照順序を切り換え制御する制御ステップとを有することを特徴とする。
本発明は、異なる領域に音声認識に必要な単語情報を言語別に複数記憶する記憶手段を備え、音声入力手段を有する画像形成装置における音声入力処理方法において、前記音声入力手段から入力された音声を前記単語情報を参照して音声認識する音声認識ステップと、操作パネルに表示される表示言語を切り換える表示言語切り換えステップと、前記表示言語切り換えステップの切り換え出力に応じて、前記音声認識ステップが認識する際に参照すべき前記記憶手段内の言語領域の参照順序を切り換え制御する制御ステップとを有することを特徴とする。
本発明は、異なる領域に音声認識に必要な単語情報を言語別に複数記憶する記憶手段を備え、音声入力手段を有する画像形成装置における音声入力処理方法において、前記音声入力手段から入力された音声を前記単語情報を参照して音声認識する音声認識ステップと、転写用紙サイズの系列を切り換える用紙サイズ切り換えステップと、操作パネルに表示される表示言語を切り換える表示言語切り換えステップと、前記音声認識ステップが認識する際に参照すべき前記記憶手段内の言語領域を切り換える変更ステップと、前記音声認識ステップによる音声認識の際に前記用紙サイズまたは前記表示言語の何れを優先するかを選択する選択ステップと、前記選択ステップの選択状態と、前記用紙サイズ切り換えステップの切り換え出力と、または前記表示言語切り換えステップの切り換え出力とに応じて、前記音声認識ステップが認識する際に参照すべき前記記憶手段内の言語領域の参照順序を切り換え制御する制御ステップとを有することを特徴とする。
本発明によれば、操作者が選択する用紙サイズに応じて参照すべき言語の順序を切り替えて、複数の言語情報中から参照すべき単語情報領域を優先的に切り替えながら音声認識処理を実行させることができ、音声認識処理に要する時間を大幅に短縮することができる。
また、操作者が選択する用紙サイズに応じて参照すべき言語の順序を切り替えて、複数の言語情報中から参照すべき単語情報領域を優先的に切り替えながら音声認識処理を実行させることができ、音声認識処理に要する時間を大幅に短縮することができる。
さらに、操作者が選択する用紙サイズに応じて参照すべき言語の順序を切り替えて、複数の言語情報中から参照すべき単語情報領域を優先的に切り替えながら音声認識処理を実行させることができ、音声認識処理に要する時間を大幅に短縮することができる。
次に本発明を実施するための最良の形態について図面を参照して説明する。
図1は、本発明の一実施形態を示す画像形成装置の構成を説明する概略断面図である。
図1において、101は原稿台ガラスであり、原稿自動送り装置142から給送された原稿が順次、所定位置に載置される。102は例えばハロゲンランプから構成される原稿照明ランプで、原稿台ガラス101に載置された原稿を露光する。103、104、105は走査ミラーであり、図示しない光学走査ユニットに収容され、往復動しながら、原稿からの反射光をCCDユニット106に導く。CCDユニット106はCCDに原稿からの反射光を結像させる結像レンズ107、例えばCCDから構成される撮像素子108、撮像素子108を駆動するCCDドライバ109等から構成されている。
撮像素子108からの画像信号出力は例えば8ビットのデジタルデータに変換された後、コントローラ部139に入力される。また、110は感光ドラムであり、前露光ランプ112によって画像形成に備えて除電される。113は1次帯電器であり、感光ドラム110を一様に帯電させる。117は露光手段であり、例えば半導体レーザ等で構成され、画像形成や装置全体の制御を行うコントローラ部139で処理された画像データに基づいて感光ドラム110を露光し、静電潜像を形成する。118は現像器であり、黒色の現像剤(トナー)が収容されている。
119は転写前帯電器であり、感光ドラム110上に現像されたトナー像を用紙に転写する前に高圧をかける。120、122、124は給紙ユニットであり、各給紙ローラ121、123、125の駆動により、転写用紙が装置内へ給送され、レジストローラ126の配設位置で一旦停止し、感光ドラム110に形成された画像との書き出しタイミングがとられ再給送される。127は転写帯電器であり、感光ドラム110に現像されたトナー像を給送される転写用紙に転写する。128は分離帯電器であり、転写動作の終了した転写用紙を感光ドラム110より分離する。転写されずに感光ドラム110上に残ったトナーはクリーナー111によって回収される。
129は搬送ベルトで、転写プロセスの終了した転写用紙を定着器130に搬送し、例えば熱により定着される。131はフラッパであり、定着プロセスの終了した転写用紙の搬送パスを、ステイプルソータ132または中間トレイ137の配置方向のいずれかに制御する。ステイプルソータ132に排紙された用紙は各ビンに仕分けされ、コントローラ部139からの指示によりステイプル部141がステイプルを行う。また、133〜136は給送ローラであり、一度定着プロセスの終了した転写用紙を中間トレイ137に反転(多重)または非反転(両面)して給送する。138は再給送ローラであり、中間トレイ137に載置された転写用紙を再度、レジストローラ126の配設位置まで搬送する。
139はコントローラ部で、後述するマイクロコンピュータ、音声認識処理部、画像処理部等を備えており、操作パネル140からの指示に従って、あるいは音声入力を解読して、前述の画像形成動作を行う。
図2は、図1に示した画像形成装置の操作パネル140の構成を説明するのブロック図である。
図2において、401はCPUで、操作パネル140全体の制御を行うものであり、装置の制御手順(制御プログラム)を記憶した読み取り専用メモリ403(ROM)からプログラムを順次読み取り、実行する。CPU401のアドレスバスおよびデータバスはバスドライバ回路、アドレスデコーダ回路402をへて各負荷に接続されている。
また、404は入力データの記憶や作業用記憶領域等として用いる主記憶装置であるランダムアクセスメモリ(RAM)である。405はI/Oインタフェースであり、キー及びLEDにて構成されるキー/LED部222からのキー入力、LEDへの出力のインタフェースである。
219は表示をおこなうLCD221への表示データをコントロールするLCDコントローラであり、表示用のバッファメモリ(VRAM)に一時的に表示データを蓄積し、LCD221に表示データを転送する。216は音声入出力ユニット(音声I/F)であり、ハンドセット218からの音声入出力、スピーカ217への音声出力のための回路を備えている。
CPU401はバスを介して音声データの入出力を行う。また、406は外部CPUとの通信用のDPRAM(デュアルポートRAM)であり、このRAMを介して、外部CPUとデータのやり取りを行う。
図3は、図1に示した音声入出力ユニット216の詳細構成を説明するブロック図であり、図2と同一のものには同一の符号を付してある。
図3において、音声入出力ユニット216は、CPU503からCPUバスを介して入力された音声データをスピーカ217もしくはハンドセット218から音声出力する回路と、ハンドセット218から音声入力された音声データをCPU503に対しCPUバスを介して入力する回路から構成される。
503は、音声入出力ユニット216の制御及び入力音声の音声認識を行うCPUであり、装置の制御手順(制御プログラム)を記憶した読み取り専用メモリ504(ROM)からプログラムを順次読み取り、実行する。音声認識については、公知のDPマッチング法あるいはHMM(Hidden Markov Model)手法を用いる。
505は入力データの記憶や作業用記憶領域等として用いる主記憶装置であるランダムアクセスメモリ(RAM)である。
また、RAM505内には音声認識のパターンマッチングに使用する単語辞書があり、本装置の操作及び設定に必要な比較すべき標準単語が格納されている。例えば日本語、英語、フランス語、イタリア語、ドイツ語の5ヶ国語について各々指定アドレスから格納されている。
なお、RAM505内には音声認識のパターンマッチングに使用する単語辞書を、例えば異なる領域に音声認識に必要な単語情報を所定の優先順位に基づき言語別に複数追加記憶可能として、仕向け地や使用者の言語環境に適応して自在に変更可能に構成されている。
また、日本語、英語、フランス語、イタリア語、ドイツ語の辞書の格納アドレスは、参照順位とすべき、例えば優先順位に基づいて設定することも、任意の順序とすることも可能に構成されているものとする。
506は、操作パネル全体の制御を行うCPU401との通信用のDPRAM(デュアルポートRAM)であり、このRAMを介して、CPU401とデータのやり取りを行う。
217はスピーカであり、アンプ529から入力されたアナログ信号を音声出力する。218はハンドセットであり、アンプ528から入力されたアナログ信号の音声出力と、音声入力したアナログ信号をアンプ537への出力と、ハンドセット218のオンフック、オフフック検知信号をレジスタ制御部513への出力を行う。
511はバスI/F制御部であり、FIFO521、531への読み書きタイミングを生成させる為にタイミング制御部512へ制御信号を入力し、CPU503のCPUバスとFIFO521、531間の音声データのやり取りを行う。また、レジスタ制御部513の各種レジスタへの読み書きと、割り込み生成部515によって入力された割り込み信号をもとにCPU503へ割り込みも行う。タイミング制御部512は、バスI/F制御部511の制御信号とレジスタ制御部513のコントロールレジスタとステータスレジスタに従ってFIFO521、531への読み書きのタイミング制御を行うものである。
また、FIFO521、531の書込み位置、読出し位置を示すアドレスをレジスタ制御部513のカウンタレジスタとして持ち、そのカウントアップ制御も行う。レジスタ制御部513は、バスI/F制御部511、タイミング制御部512、アンプON_OFF制御部514、割り込み生成部515、A/D,D/A制御部516、データ変換部522、524、532、534、補間部523、間引き部533で利用されるステータスレジスタ、コントロールレジスタ、カウンタレジスタを含み、これらレジスタの制御も行う。
この制御例として、ハンドセット218から入力されたオンフック、オフフック検知信号によってステータスレジスタのON_OFFを切り換えたり、FIFO521、531の書込み位置、読出し位置を示すカウンタレジスタがFIFOサイズに達した時にステータスレジスタを立てたり、音声入出力ユニット216の処理終了を示すステータスレジスタを立てたりすることが挙げられる。
514はアンプON_OFF制御部であり、レジスタ制御部513のコントロールレジスタに従ってアンプ527、528、537のON_OFF制御を行う。このコントロールレジスタはバスI/F制御部511を介し、CPU503から制御される。
また、オンフック、オフフックを示すステータスレジスタによってON_OFF制御される場合もある。515は割り込み生成部であり、レジスタ制御部513のステータスレジスタのステータスに変化があったときに割り込み信号を生成し、バスI/F制御部511を介してCPU503に割り込み信号を出力する。
ここで、割り込み信号を生成する例として、ハンドセット218のオンフック、オフフックを検知したとき、FIFO 521、531の読み書きが終了したとき、音声入出力ユニット216の処理が終了したときなどが挙げられる。A/D,D/A制御部516は、レジスタ制御部513のコントロールレジスタに従ってD/A変換部525 とA/D変換部535のサンプリング周波数変更、ON_OFF制御、変換開始制御を行う。
このコントロールレジスタはバスI/F制御部511を介し、CPU503から制御される。また、オンフック、オフフックを示すステータスレジスタによってON_OFF制御される場合もある。FIFO(First In First Out)521、531は、音声データ用のバッファメモリである。ここで、このFIFOはダブルバッファ構成であってもよい。
データ変換部522、524、532、534は、補間部523あるいは間引き部533のようにデータ処理で使用するデータ幅と、FIFO521、531あるいはD/A変換部525、A/D変換部535とのデータ幅を合わせるためのデータ変換部である。この変換部は全てが同じデータ幅で処理されている場合には不要となる。
補間部523は、D/A変換部525でのサンプリング周波数よりも音声データのサンプリング周波数が小さくデータ量が少ないときにデータ補間するものである。また、レジスタ制御部513のコントロールレジスタに従い補間方法を変える。このコントロールレジスタはバスI/F制御部511を介し、CPU503から制御される。
D/A変換部525は、A/D,D/A制御部516で設定されたサンプリング周波数に従い、デジタル信号をアナログ信号へ変換するものである。526、536はLPF(Low Pass Filter)であり、高周波成分をカットするフィルタである。
ここで、LPF526のカットオフ周波数はD/A変換部525のサンプリング周波数の1/2以下の周波数で、LPF536のカットオフ周波数はA/D変換部535のサンプリング周波数の1/2以下の周波数である。527、528、537はアンプであり、信号増幅をするもので、アンプON_OFF制御部514によってON_OFFが制御される。
間引き部533は、A/D変換部535でのサンプリング周波数よりも音声データのサンプリング周波数が小さくデータ量が少ないときにデータ間引きするものである。また、レジスタ制御部513のコントロールレジスタに従い間引き方法を変える。A/D変換部535は、A/D,D/A制御部516で設定されたサンプリング周波数に従いアナログ信号をデジタル信号へ変換する。
図4は、図1に示した画像形成装置におけるコントローラ部139の構成を説明するブロック図である。
図4において、201は画像形成装置全体の制御を行うCPUであり、装置本体の制御手順(制御プログラム)を記憶した読み取り専用メモリ203(ROM)からプログラムを順次読み取り、実行する。CPU201のアドレスバスおよびデータバスはバスドライバ回路、アドレスデコーダ回路202をへて各負荷に接続されている。また、204は入力データの記憶や作業用記憶領域等として用いる主記憶装置であるランダムアクセスメモリ(RAM)である。
205はI/Oインタフェースであり、給紙系、搬送系、光学系の駆動を行うモータ類207、クラッチ類208、ソレノイド類209、また、搬送される用紙を検知するための紙検知センサ類210等の装置の各負荷に接続される。カセットサイズSW223は各用紙カセットのサイズを設定するものであり、例えばA4、A3、LTR等の紙サイズに対して4ビットのコードで入力される。現像器118には現像器内のトナー量を検知するトナー残量センサ211が配置されており、その出力信号がI/Oポート205に入力される。215は高圧ユニットであり、CPU201の指示に従って、前述の1次帯電器113、現像器118、転写前帯電器119、転写帯電器127、分離帯電器128へ高圧を出力する。
206は画像処理部であり、CCDユニット106から出力された画像信号が入力され、後述する画像処理を行い、画像データに従ってレーザユニット117の制御信号を出力する。レーザユニット117から出力されるレーザ光は感光ドラム110を照射し、露光するとともに非画像領域において受光センサであるビーム検知センサ213によって発光状態が検知され、その出力信号がI/Oポート205に入力される。
図5は、図4に示した画像処理部206の詳細構成を説明するブロック図である。
図5において、CCD108により電気信号に変換された画像信号は、まずシェーディング回路301によって画素間のばらつきの補正を行った後、変倍回路302において、縮小コピー時はデータの間引き処理を行い、拡大コピー時はデータの補間を行う。次に、エッジ強調回路303において、例えば5×5のウインドウで2次微分を行い、画像のエッジを強調する。この画像データは輝度データであるのでプリンタに出力するための濃度データに変換するためγ変換回路304でテーブルサーチによりデータ変換を行う。
そして、濃度データに変換された画像データは2値化処理部305へ入力される。ここでは、例えばED法により多値データを2値データに変換する。2値に変換された画像データは合成回路307に入力される。合成回路307では、入力された画像データと例えばDRAMにより構成される画像用メモリ310内の画像データを選択的に出力する、またはORをとって出力する。この画像用メモリ310に対するリードライト制御はメモリ制御部309で行う。これらの画像データはレーザの発光強度の信号に変換するためPWM回路308へ入力され、画像の濃度に従ったパルス幅をレーザユニットに対して出力する。
図6は、図1に示した画像形成装置の操作パネル140の構成を説明する平面図である。
図6において、LCD表示部1032は、LCD上にタッチパネルシートが貼られており、システムの操作画面を表示するとともに、表示してあるキーが押されるとその位置情報をCPU401に伝える。テンキー1028はコピー枚数など、数字の入力時に使用する。
スタートキー1029は原稿画像の読み取り動作を開始する時などに用いる。ストップキー1030は稼働中の動作を止めるときに使用する。リセットキー1031は操作部からの設定を初期化する時に用いる。
また、1023はガイドキーであり、キーの機能が解らないとき押すとそのキーの説明が表示される。1024はコピーモードキーであり、複写を行うときに押す。1025はファクスキーであり、ファクスに関する設定を行うときに押す。1026はファイルキーであり、ファイルデータを出力したいときに押す。1027はプリンターキーであり、コンピュータ等の外部装置からのプリント出力に関する設定などを行なうときに使用する。
1033は、音声キーであり、音声の入出力を受け付けるときに、キーを押下して設定を行い、設定をオフにする場合には再度、押下して設定を解除することができる。1034はパワスイッチである。
217はスピーカで、音声によるガイドがスピーカを通して出力する。218はハンドセットであり、これを使用して音声を入力したり、音声ガイドを聞くことができる。
図7は、図6に示した操作パネル140のLCD表示部1032の標準表示画面例を説明する図である。
図7において、1001は拡張機能キーであり、このキーを押すことによって両面複写、多重複写、移動、とじ代の設定、枠消しの設定等のモードに入る。1002は画像モードキーであり、複写画像に対して網掛け、影付け、トリミング、マスキングを行うための設定モードに入る。1003はユーザモードキーであり、モードメモリの登録、標準モード画面の設定がユーザごとに行える。1004は応用ズームキーであり、原稿のX方向、Y方向を独立に変倍するモード、原稿のサイズと複写サイズから変倍率を計算するズームプログラムのモードに入る。
1005、1006、1007はM1キー、M2キー、M3キーであり、それぞれのモードメモリを呼び出す際に押す。1008はコールキーであり、前回設定されていた複写モードを呼び出す際に押す。1009はオプションキーであり、フィルムから直接複写するためのフィルムプロジェクタ等のオプション機能の設定を行う。1010はソータキーであり、ソート出力、グループ出力等のモード設定を行う。
1011は原稿混載キーであり、原稿フィーダにA4サイズとA3サイズ、またはB5サイズとB4サイズの原稿を一緒にセットする際に押す。1012は等倍キーであり、複写倍率を100%にする際に押す。1014、1015はそれぞれ縮小キー、拡大キーであり、定形の縮小、拡大を行う際に押す。1016はズームキーであり、1%刻みで非定形の縮小、拡大を行う際に押す。1013は用紙選択キーであり、複写用紙の選択を行う際に押す。
1018、1020は濃度キーであり、1018を押すごとに濃く複写され、1020を押すごとに薄く複写される。1017は濃度表示であり、濃度キーを押すと表示が左右へ変化する。1019はAEキーであり、新聞のように地肌の濃い原稿を自動濃度調整複写するときに押す。
1021はHiFiキーであり、写真原稿のように中間調の濃度が多い原稿の複写の際に押す。1022は文字強調キーであり、文字原稿の複写で文字を際立たせたい場合に押下する。1034は音声設定キーであり、音声のボリューム設定等の音声入出力時の各種設定を行う時に押す。
図8は、図6に示した操作パネル140のLCD表示部1032の表示画面例を説明する図であり、図7に示したユーザモードキー1003を押した時に入るユーザモード内の設定で操作パネルに表示する表示言語を設定する画面例に対応する。なお、本実施形態では現在の表示言語として日本語が選択されている。
図8において、表示言語の変更を行う場合には、日本語キー801、英語キー802、フランス語キー803、ドイツ語キー804、イタリア語キー805のどれかを押し、その後にOKキー806を押す。設定が終了したら、戻るキー807を押して、この設定画面を終了する。
図9は、図6に示した操作パネル140のLCD表示部1032の表示画面例を説明する図であり、音声認識による詳細設定画面例に対応し、本画面は図6における音声キー1033を押して設定できる各種音声関連の項目の1つを選択する事で表示できる。なお、図7と同一部分には同一の符号を付してある。
図9において、901は用紙優先キーであり、入力音声の音声認識を用紙のカセットサイズに応じた制御で行う場合に押す。902は表示言語優先キーであり、入力音声の音声認識を操作パネルの表示言語に応じた制御で行う場合に押す。用紙優先キー901または表示言語優先キー902を押した後、OKキー903を押す事で設定される。設定が終了したら、戻るキー904を押して、この設定画面を終了する。
図10は、図3に示した音声入出力ユニット216内のCPU503がアクセスするRAM505のアドレスマップを説明する図である。
図10において、図3のCPU503は、制御プログラムを記憶した読み取り専用メモリ504(ROM)内のプログラムを実行する際に、RAM505をワークメモリとして使用するとともに、音声認識の際のパターンマッチングに使用する単語辞書があり、比較すべき標準単語が格納されている。本実施形態ではワーク領域としてF00000番地〜FFFFFF番地が割り当てられている。
また、単語辞書領域としてA00000番地〜EFFFFF番地が割り当てられており、日本語辞書領域(A00000番地〜AFFFFF番地)、英語辞書領域(B00000番地〜BFFFFF番地)、フランス語辞書領域(C00000番地〜CFFFFF番地)、ドイツ語辞書領域(D00000番地〜DFFFFF番地)、イタリア語辞書領域(E00000番地〜EFFFFF番地)に分割されマッピングされている。
音声認識の際にはそれぞれの辞書領域をA00000番地から順番にアクセスしていき、パターンマッチングを行い、一致すれば終了するが、それぞれの辞書領域のアクセス順を変更してパターンマッチングを行うことも可能である。アドレスの順にアクセスする場合では日本語、英語、フランス語、ドイツ語、イタリア語の順番になるが、英語を優先して音声認識したい場合にはアドレスアクセスの制御を変更することで英語、フランス語、ドイツ語、イタリア語、日本語の順に変更できる。
図11は、本発明に係る画像形成装置における第1のデータ処理手順の一例を示すフローチャートであり、カセットの用紙サイズに応じて音声認識を行う場合の処理手順に対応する。なお、S1〜S7は各ステップを示す。
まず、CPU401は、ステップS1で操作パネル140上の音声キー1033が入力されたかどうかを判断する。入力されていないと判断した場合は、本処理を終了し、入力されていると判断した場合は、ステップS2でカセットサイズSW212の入力を読み取る。この入力によってカセットサイズがAB系列かインチ系列かを判断する。
次に、ステップS3で、ステップS2の検出結果に応じて、RAM505内の認識用の単語辞書の認識順の変更が必要かどうかを判断する。
例えば、デフォルトの認識順として、日本語、英語、フランス語、ドイツ語、イタリア語の順になっているとする。
そして、ステップS2でインチ系列と判断された場合には、ステップS3の判断では比較順の変更が必要と判断し、ステップS4で英語、フランス語、ドイツ語、イタリア語、日本語の順に言語順序を変更する。
また、ステップS2でAB系列と判断された場合には、ステップS3の判断では比較順の変更が必要ないと判断し、ステップS4はスキップする。
次にステップS5に進み、音声認識処理を開始し、ステップS6で設定された単語辞書の認識順に従ってパターンマッチング処理を行い、ステップS7でパターンが一致して処理が終了したかどうかを判断し、一致して処理を終了すると判断した場合は、本処理を終了するが、一致しないと判断した場合には、ステップS6に戻ってパターンマッチング処理を繰り返す。
図12は、本発明に係る画像形成装置における第2のデータ処理手順の一例を示すフローチャートであり、操作パネルの表示言語に応じて音声認識を行う処理手順に対応する。なお、S11〜S17は各ステップを示す。
まず、CPU401はステップS11で操作パネル140上の音声キー1033が入力されたかどうかを判断して、入力されていないと判断した場合は、本処理を終了し、入力されていると判断した場合は、ステップS12で操作パネルの表示言語として設定された言語情報を読み取る。この入力によって操作パネルに表示している言語が何語であるかを判断する。次に、ステップS13で、ステップS2の検出結果に応じて、RAM505内の認識用の単語辞書の認識順の変更が必要かどうかを判断する。
例えば、デフォルトの認識順として、日本語、英語、フランス語、ドイツ語、イタリア語の順になっているとする。また、ステップS12で英語と判断された場合には、ステップS13の判断では比較順の変更が必要と判断し、ステップS14で英語、フランス語、ドイツ語、イタリア語、日本語の順に変更する。
ステップS12で日本語と判断された場合にはステップS13の判断では比較順の変更が必要ないと判断し、ステップS14はスキップする。
次に、ステップS15に進み、音声認識処理を開始し、ステップS16で設定された単語辞書の認識順に従ってパターンマッチング処理を行い、ステップS17でパターンが一致して処理が終了したかどうかを判断し、YESならば一致して処理を終了するが、一致していない場合はステップS16に戻ってパターンマッチング処理を繰り返す。
図13は、本発明に係る画像形成装置における第3のデータ処理手順の一例を示すフローチャートであり、カセットの用紙サイズに応じて音声認識を行うか、操作パネルの表示言語に応じて音声認識を行うかを選択する処理手順に対応する。なお、S31〜S39は各ステップを示す。
まず、CPU401はステップS31で操作パネル140上の音声キー1033が入力されたかどうかを判断する。入力されていないと判断した場合は、本処理を終了し、入力されていると判断した場合は、ステップS32で音声認識詳細設定の用紙優先キー901が押されたか表示言語優先キー902が押されて表示言語優先が選択された否かを判断して、ステップS32で用紙優先キー901が押されて設定されたと判断した場合は、ステップS33に進み、カセットサイズSW223の入力を読み取る。この入力によってカセットサイズがAB系列かインチ系列かを判断する。
一方、ステップS32で表示言語優先キー902が押されて設定されたと判断した場合は、ステップS34に進み、操作パネル140の表示言語として設定された言語情報を読み取る。この入力によって操作パネル140に表示している言語が何語であるかを判断する。
次に、ステップS35で、ステップS33またはステップS34の検出結果に応じて、RAM505内の認識用の単語辞書の認識順の変更が必要かどうかを判断する。例えば、デフォルトの認識順として、日本語、英語、フランス語、ドイツ語、イタリア語の順になっているとする。
ステップS32の処理の後、ステップS33に進んだ場合、ステップS33でインチ系列と判断された場合には、ステップS35の判断では比較順の変更が必要と判断し、ステップS36で英語、フランス語、ドイツ語、イタリア語、日本語の順に変更する。
また、ステップS33でAB系列と判断された場合には、ステップS35の判断では比較順の変更が必要ないと判断し、ステップS36はスキップする。
一方、ステップS32の処理の後、ステップS34に進んだ場合、ステップS34で英語と判断された場合には、ステップS35の判断では比較順の変更が必要と判断し、ステップS36で英語、フランス語、ドイツ語、イタリア語、日本語の順に変更する。
そして、ステップS34で日本語と判断された場合には、ステップS35の判断では比較順の変更が必要ないと判断し、ステップS36はスキップする。
次にステップS37に進み、音声認識処理を開始し、ステップS38で設定された単語辞書の認識順に従ってパターンマッチング処理を行い、ステップS39でパターンが一致して処理が終了したかどうかを判断し、一致したら終了するが、一致しない場合はステップS38に戻ってパターンマッチング処理を繰り返す。
上記のように、音声認識を行う時に用紙サイズ情報や操作パネルの表示言語情報に応じた制御を行える構成としたので、従来の様に多言語における音声認識においても誤認識を減少させるとともに認識処理速度を上げることが可能となり、装置の音声入力機能の使い勝手が格段に向上する。
以下、図14に示すメモリマップを参照して本発明に係る画像形成装置で読み取り可能なデータ処理プログラムの構成について説明する。
図14は、本発明に係る画像形成装置で読み取り可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。
なお、特に図示しないが、記憶媒体に記憶されるプログラム群を管理する情報、例えばバージョン情報,作成者等も記憶され、かつ、プログラム読み出し側のOS等に依存する情報、例えばプログラムを識別表示するアイコン等も記憶される場合もある。
さらに、各種プログラムに従属するデータも上記ディレクトリに管理されている。また、各種プログラムをコンピュータにインストールするためのプログラムや、インストールするプログラムが圧縮されている場合に、解凍するプログラム等も記憶される場合もある。
本実施形態における図11〜図13に示す機能が外部からインストールされるプログラムによって、ホストコンピュータにより遂行されていてもよい。そして、その場合、CD−ROMやフラッシュメモリやFD等の記憶媒体により、あるいはネットワークを介して外部の記憶媒体から、プログラムを含む情報群を出力装置に供給される場合でも本発明は適用されるものである。
以上のように、前述した実施形態の機能を実現するソフトウエアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。
この場合、記憶媒体から読み出されたプログラムコード自体が本発明の新規な機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
従って、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
プログラムを供給するための記憶媒体としては、例えばフレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVDなどを用いることができる。
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは、圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバやftpサーバ等も本発明の請求項に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明は上記実施形態に限定されるものではなく、本発明の趣旨に基づき種々の変形(各実施形態の有機的な組合せを含む)が可能であり、それらを本発明の範囲から排除するものではない。
本発明の様々な例と実施形態を示して説明したが、当業者であれば、本発明の趣旨と範囲は、本明細書内の特定の説明に限定されるものではない。
なお、本発明は、上記した実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
139 コントローラ部
140 操作パネル
201、401 CPU
216 音声入出力ユニット
140 操作パネル
201、401 CPU
216 音声入出力ユニット
Claims (10)
- 音声入力手段を有する画像形成装置において、
異なる領域に音声認識に必要な単語情報を言語別に複数記憶する記憶手段と、
前記音声入力手段から入力された音声を前記単語情報を参照して音声認識する音声認識手段と、
転写用紙サイズを切り換える用紙サイズ切り換え手段と、
前記用紙サイズ切り換え手段の切り換え出力に応じて、前記音声認識手段が認識する際に参照すべき前記記憶手段内の言語領域の参照順序を切り換え制御する制御手段と、
を有することを特徴とする画像形成装置。 - 音声入力手段を有する画像形成装置において、
異なる領域に音声認識に必要な単語情報を言語別に複数記憶する記憶手段と、
前記音声入力手段から入力された音声を前記単語情報を参照して音声認識する音声認識手段と、
操作パネルに表示される表示言語を切り換える表示言語切り換え手段と、
前記表示言語切り換え手段の切り換え出力に応じて、前記音声認識手段が認識する際に参照すべき前記記憶手段内の言語領域の参照順序を切り換え制御する制御手段と、
を有することを特徴とする画像形成装置。 - 音声入力手段を有する画像形成装置において、
異なる領域に音声認識に必要な単語情報を言語別に複数記憶する記憶手段と、
前記音声入力手段から入力された音声を前記単語情報を参照して音声認識する音声認識手段と、
転写用紙サイズの系列を切り換える用紙サイズ切り換え手段と、
操作パネルに表示される表示言語を切り換える表示言語切り換え手段と、
前記音声認識手段が認識する際に参照すべき前記記憶手段内の言語領域を切り換える変更手段と、
前記音声認識手段による音声認識の際に前記用紙サイズまたは前記表示言語の何れを優先するかを選択する選択手段と、
前記選択手段の選択状態と、前記用紙サイズ切り換え手段の切り換え出力と、または前記表示言語切り換え手段の切り換え出力とに応じて、前記音声認識手段が認識する際に参照すべき前記記憶手段内の言語領域の参照順序を切り換え制御する制御手段と、
を有することを特徴とする画像形成装置。 - 前記記憶手段は、異なる領域に音声認識に必要な単語情報を所定の優先順位に基づき言語別に複数記憶していることを特徴とする請求項1〜3のいずれかに記載の画像形成装置。
- 前記記憶手段は、異なる領域に音声認識に必要な単語情報を所定の優先順位に基づき言語別に複数追加記憶可能とすることを特徴とする請求項1〜3のいずれかに記載の画像形成装置。
- 異なる領域に音声認識に必要な単語情報を言語別に複数記憶する記憶手段を備え、音声入力手段を有する画像形成装置における音声入力処理方法において、
前記音声入力手段から入力された音声を前記単語情報を参照して音声認識する音声認識ステップと、
転写用紙サイズを切り換える用紙サイズ切り換えステップと、
前記用紙サイズ切り換えステップの切り換え出力に応じて、前記音声認識ステップが認識する際に参照すべき前記記憶手段内の言語領域の参照順序を切り換え制御する制御ステップと、
を有することを特徴とする音声入力処理方法。 - 異なる領域に音声認識に必要な単語情報を言語別に複数記憶する記憶手段を備え、音声入力手段を有する画像形成装置における音声入力処理方法において、
前記音声入力手段から入力された音声を前記単語情報を参照して音声認識する音声認識ステップと、
操作パネルに表示される表示言語を切り換える表示言語切り換えステップと、
前記表示言語切り換えステップの切り換え出力に応じて、前記音声認識ステップが認識する際に参照すべき前記記憶手段内の言語領域の参照順序を切り換え制御する制御ステップと、
を有することを特徴とする音声入力処理方法。 - 異なる領域に音声認識に必要な単語情報を言語別に複数記憶する記憶手段を備え、音声入力手段を有する画像形成装置における音声入力処理方法において、
前記音声入力手段から入力された音声を前記単語情報を参照して音声認識する音声認識ステップと、
転写用紙サイズの系列を切り換える用紙サイズ切り換えステップと、
操作パネルに表示される表示言語を切り換える表示言語切り換えステップと、
前記音声認識ステップが認識する際に参照すべき前記記憶手段内の言語領域を切り換える変更ステップと、
前記音声認識ステップによる音声認識の際に前記用紙サイズまたは前記表示言語の何れを優先するかを選択する選択ステップと、
前記選択ステップの選択状態と、前記用紙サイズ切り換えステップの切り換え出力または前記表示言語切り換えステップの切り換え出力とに応じて、前記音声認識ステップが認識する際に参照すべき前記記憶手段内の言語領域の参照順序を切り換え制御する制御ステップと、
を有することを特徴とする音声入力処理方法。 - 請求項6〜8のいずれかに記載の音声入力処理方法を実行させるためのプログラムを格納したことを特徴とするコンピュータが読み取り可能な記憶媒体。
- 請求項6〜8のいずれかに記載の音声入力処理方法を実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004067526A JP2005257903A (ja) | 2004-03-10 | 2004-03-10 | 画像形成装置および音声入力処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004067526A JP2005257903A (ja) | 2004-03-10 | 2004-03-10 | 画像形成装置および音声入力処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005257903A true JP2005257903A (ja) | 2005-09-22 |
Family
ID=35083701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004067526A Pending JP2005257903A (ja) | 2004-03-10 | 2004-03-10 | 画像形成装置および音声入力処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005257903A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016014874A (ja) * | 2014-06-30 | 2016-01-28 | ゼロックス コーポレイションXerox Corporation | 音声認識 |
JP2019144759A (ja) * | 2018-02-19 | 2019-08-29 | コニカミノルタ株式会社 | 画像処理装置、画像処理装置の制御方法、およびプログラム |
-
2004
- 2004-03-10 JP JP2004067526A patent/JP2005257903A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016014874A (ja) * | 2014-06-30 | 2016-01-28 | ゼロックス コーポレイションXerox Corporation | 音声認識 |
JP2019144759A (ja) * | 2018-02-19 | 2019-08-29 | コニカミノルタ株式会社 | 画像処理装置、画像処理装置の制御方法、およびプログラム |
JP7003720B2 (ja) | 2018-02-19 | 2022-01-21 | コニカミノルタ株式会社 | 画像処理装置、画像処理装置の制御方法、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3471935B2 (ja) | 画像形成装置および画像レイアウト決定方法 | |
JPH11196256A (ja) | 画像形成方法及び画像形成装置 | |
JP2007086173A (ja) | 音声入力機能を備えた装置 | |
JP2003087560A (ja) | 画像形成装置 | |
JP2007058432A (ja) | 画像形成装置 | |
JP3437509B2 (ja) | 画像形成装置並びに音声により指示可能な画像形成装置の制御方法および記憶媒体 | |
US5832337A (en) | Image forming apparatus having a one side mode for forming an image on one side of a recording sheet and a both side mode for forming an image on both sides of a recording sheet | |
JP2005257903A (ja) | 画像形成装置および音声入力処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム | |
JP2007067534A (ja) | 携帯情報端末 | |
JPH10224536A (ja) | 画像形成装置 | |
JPH11119952A (ja) | 画像形成装置及びその制御方法 | |
JP2005219460A (ja) | 画像形成装置および画像形成装置の制御方法およびプログラム | |
JP2006159846A (ja) | 画像形成装置 | |
JP2005196047A (ja) | 電子装置および入力設定方法 | |
JP2006231752A (ja) | 画像形成装置 | |
JPH11102095A (ja) | 画像形成装置 | |
JP2006162851A (ja) | マンマシンインターフェース装置 | |
JP2003162395A (ja) | 画像形成装置、文書改行方法、プログラム、及び記憶媒体 | |
JP2006167961A (ja) | 画像形成装置 | |
JP2007006193A (ja) | 画像形成装置 | |
JP2006023412A (ja) | 画像処理装置および画像処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム | |
JPH11125996A (ja) | 画像形成装置および画像形成装置の制御方法 | |
JP2003345548A (ja) | 画像形成システム | |
JP3219530B2 (ja) | 画像形成装置及び画像形成方法 | |
JP3768674B2 (ja) | 画像形成装置及びその制御方法 |