JP2007114297A - Image forming apparatus with speech recognition means - Google Patents
Image forming apparatus with speech recognition means Download PDFInfo
- Publication number
- JP2007114297A JP2007114297A JP2005303220A JP2005303220A JP2007114297A JP 2007114297 A JP2007114297 A JP 2007114297A JP 2005303220 A JP2005303220 A JP 2005303220A JP 2005303220 A JP2005303220 A JP 2005303220A JP 2007114297 A JP2007114297 A JP 2007114297A
- Authority
- JP
- Japan
- Prior art keywords
- vocabulary
- voice
- key
- input
- image forming
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Control Or Security For Electrophotography (AREA)
- Accessory Devices And Overall Control Thereof (AREA)
Abstract
Description
本発明は、音声により指示可能な画像形成装置の制御方法および記憶媒体に関するものである。 The present invention relates to an image forming apparatus control method and a storage medium that can be instructed by voice.
従来の画像形成装置は、オペレータにより設定された複写モードをモードメモリ手段に記憶することができる。通常のモードメモリ手段は、オペレータが登録した番号および/または文字と設定された複写モードとを対応付けて記憶している。 The conventional image forming apparatus can store the copy mode set by the operator in the mode memory means. The normal mode memory means stores the number and / or character registered by the operator in association with the set copy mode.
このモードメモリ手段に記憶された複写モードを呼び出す際には、複数の記憶されている複写モードに対応付けられて記憶される番号をソフトキーとしてタッチパネル式表示部に表示し、オペレータがその番号に対応するソフトキーを押下することにより複写モードの内容を呼び出して表示部に表示していた。そしてオペレータは表示される複写モードの内容を確認し、複写等の画像処理を実行させていた。 When calling the copy mode stored in the mode memory means, the number stored in association with a plurality of stored copy modes is displayed as a soft key on the touch panel display unit, and the operator sets the number to that number. The contents of the copy mode are called up and displayed on the display unit by pressing the corresponding soft key. The operator confirms the content of the displayed copy mode and executes image processing such as copying.
従来例としては、例えば特許文献1をあげることが出来る。
しかしながら、近年の画像形成装置の発展により、記憶できる複写モードの個数が数多くなってきているので、記憶できる複写モード個数分の呼出しキーをすべて標準の操作画面中に配置することができず、そのため標準画面から直接呼出しできる複写モードが制限されている。 However, with the recent development of image forming apparatuses, the number of copy modes that can be stored has increased. Therefore, all the call keys for the number of copy modes that can be stored cannot be arranged in the standard operation screen. The copy mode that can be called directly from the standard screen is restricted.
よって、複写モードの呼出しキーは、標準画面に表示されず他の画面に表示される様になっているので、呼出しキーが表示される画面を表示するためには、画面を切り替えるための複数のキーを押下しなければならなかった。 Therefore, the call key in the copy mode is not displayed on the standard screen, but is displayed on another screen. In order to display the screen on which the call key is displayed, a plurality of screen switching keys are displayed. I had to press a key.
したがって、上記従来の画像形成装置において、記憶できる複写モードの個数が多くなればなるほど、記憶される複写モードを呼び出すまでに複数のキー入力を行わなければならず、複写モードを呼び出すまでの操作が非常に煩雑であるとともに多くの時間がかかってしまうという問題点があった。 Therefore, in the conventional image forming apparatus, as the number of copy modes that can be stored increases, a plurality of key inputs must be performed before the stored copy mode is called, and the operation until the copy mode is called is increased. There is a problem that it is very complicated and takes a lot of time.
本発明は、上記の問題点を解決するためになされたもので、音声認識技術を使用し音声発話により複写モードの呼出しを行えるようにしたものである。 The present invention has been made in order to solve the above-described problems, and enables a copy mode to be called by voice utterance using voice recognition technology.
本発明に係る第1〜第5の発明の目的は、複数の操作キーにより設定された像形成モードをメモリ資源に複数グループ記憶し、登録モードにおいて、入力される音声を前記メモリ資源に記憶される像形成モードに対応付けて登録し、呼出モードにおいて、入力される音声を既に登録された音声と比較し、該比較結果に基づいて、入力された音声に対応付けられた像形成モードの呼出しを制御することにより、像形成モードを呼び出すために複数のキー入力を行うことなく、音声を入力するという簡単な操作で像形成モードを容易に呼出すことが可能になる。それにより、ユーザの操作負担を格段に低減させる像形成モード設定環境を提供することができる画像形成装置並びに音声により指示可能な画像形成装置の制御方法および記憶媒体を提供することである。 An object of the first to fifth aspects of the present invention is to store a plurality of groups of image forming modes set by a plurality of operation keys in a memory resource, and in a registration mode, input sound is stored in the memory resource. In the call mode, the input voice is compared with the already registered voice, and the call of the image formation mode associated with the input voice is made based on the comparison result. By controlling the image forming mode, it is possible to easily call the image forming mode by a simple operation of inputting sound without performing a plurality of key inputs to call the image forming mode. Accordingly, an image forming apparatus capable of providing an image forming mode setting environment that significantly reduces a user's operation burden, an image forming apparatus control method that can be instructed by voice, and a storage medium are provided.
音声認識機能をもつ画像形成装置において、ユーザが機能に対して音声認識対象語彙となる名称を自由に設定可能にする。 In an image forming apparatus having a voice recognition function, a user can freely set a name to be a voice recognition target vocabulary for the function.
認識対象語彙の登録時には、他の語彙と重複していないか、似ている語彙は使用されていないかのチェックを行い問題なければ登録を行う。 When registering the recognition target vocabulary, it is checked whether it is not duplicated with other vocabularies or a similar vocabulary is not used.
これにより、ユーザが複写モードを呼び出す際も表示領域を気にすることなく音声で使用することが出来るだけでなく、機能名称もよりユーザが使用しやすい名称を設定することが可能となる。 As a result, when the user calls the copy mode, not only can the user use the voice without worrying about the display area, but the function name can be set to a name that is easier for the user to use.
さらに声紋認証機能を持つ上記画像形成装置により、第1発声でユーザ認証と音声認識処理を行うことが可能となるため、ユーザの作業手順が減るだけでなく同時にユーザのカスタマイズされた画面や語彙でのユーザインターフェイスの提供が可能となる。 Furthermore, the above image forming apparatus having a voiceprint authentication function enables user authentication and voice recognition processing with the first utterance, so that not only the user's work procedure is reduced, but also the user's customized screen and vocabulary can be used at the same time. It is possible to provide a user interface.
以上説明したように、本発明では、ユーザが機能に対して音声認識対象語彙となる名称を自由に設定可能にすることが可能になる。加えて、認識対象語彙の登録時には、他の語彙と重複していないか、似ている語彙は使用されていないかのチェックを行い問題なければ登録を行うためユーザが複写モードを呼び出す際も表示領域を気にすることなく音声で使用することが出来るだけでなく、機能名称もよりユーザが使用しやすい名称を設定することが可能となる。 As described above, according to the present invention, a user can freely set a name that is a speech recognition target vocabulary for a function. In addition, when registering a recognition target vocabulary, it is checked whether it is duplicated with another vocabulary or a similar vocabulary is not being used. In addition to being able to use the voice without worrying about the area, it is possible to set a function name that is easier for the user to use.
さらに声紋認証機能を持つ上記画像形成装置により、第1発声でユーザ認証と音声認識処理を行うことが可能となるため、ユーザの作業手順が減るだけでなく同時にユーザのカスタマイズされた画面や語彙でのユーザインターフェイスの提供が可能となる。 Furthermore, the above image forming apparatus having a voiceprint authentication function enables user authentication and voice recognition processing with the first utterance, so that not only the user's work procedure is reduced, but also the user's customized screen and vocabulary can be used at the same time. It is possible to provide a user interface.
以下、図面を参照して本発明の一実施形態を説明する。 Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
〔装置の構成〕
図1は、本発明の一実施形態を示す画像形成装置の一例を説明する断面構成図である。本実施形態では、画像形成装置の一例として複写装置を挙げて説明する。
[Device configuration]
FIG. 1 is a cross-sectional configuration diagram illustrating an example of an image forming apparatus showing an embodiment of the present invention. In this embodiment, a copying apparatus will be described as an example of an image forming apparatus.
図1において、100は複写装置(本体)である。200は循環式自動原稿送り装置(以下、RDFと記す)で、原稿載置台101に原稿を自動的に給送する。250はソータで、複写装置100から排出される画像形成済みの転写紙の仕分けをする。これらRDF200とソータ250は本体100に対して自在に組み合わせて使用出来るように構成されている。200aは排紙トレイで、RDF200により原稿載置台101に給送された原稿を排紙するトレイである。
In FIG. 1,
原稿載置台101は、RDF200から給送される原稿を載置する原稿台ガラスである。102は光学系で、原稿載置台101に載置される原稿画像を露光操作するものであり、原稿照明ランプ(露光ランプ)103、走査ミラー145、レンズ143、モータ104等から構成されている。
The document placement table 101 is a document table glass on which a document fed from the
106は一次帯電器、107はブランク露光ユニット、108は電位センサ、109は現像器、110は転写帯電器、111は分離帯電器、112はクリーニング装置で、これらが感光体ドラム105の周囲に配設される。感光体ドラム105とこれら各部106〜112等により画像記録手段が構成されている。113はモータで、感光体ドラム105を図中の矢印方向に回転駆動する。
106 is a primary charger, 107 is a blank exposure unit, 108 is a potential sensor, 109 is a developer, 110 is a transfer charger, 111 is a separation charger, and 112 is a cleaning device. These are arranged around the photosensitive drum 105. Established. The photosensitive drum 105 and these
114は上段カセット、115は下段カセットで、転写紙が格納されるものである。118、119は給紙ローラで、ピックアップローラ116、117により上下段カセット114、115からピックアップされた転写紙を給紙ローラ132まで搬送する。124はデッキで、本体100に装備される例えば4000枚の転写紙を収納し得るものである。125はリフタで、デッキ124に収納される転写紙が給紙ローラ126に常に当接するように転写紙の量に応じて上昇する。
120はレジストローラで、給紙ローラ132またはデッキ124の給紙ローラ126により搬送される転写紙の先端と感光体ドラム105上に現像されたトナー像の先端とのタイミングが一致するように転写紙を感光体ドラム105へ搬送する。
Reference numeral 120 denotes a registration roller, and the transfer paper is fed so that the leading edge of the transfer paper conveyed by the
121は搬送ベルトで、トナー像が転写された転写紙を定着器122まで搬送する。122は定着器で、定着ローラ144により転写紙に加圧および加熱することによりトナー像を転写紙に定着させる。123は排出ローラで、トナー像が定着された転写紙を排紙する。127は排紙フラッパで、排出ローラ123から送り出された転写紙の搬送経路を両面記録側ないし多重記録側と排出側(ソータ250)のいずれかに切り替える。ここで、両面記録ないし多重記録が設定されている場合は、排出ローラ123から送り出された転写紙の搬送経路を両面記録側ないし多重記録側に切り替える。
A
128は下搬送パスで、排出ローラ123から送り出された転写紙を反転パス129を介し、転写紙を裏返して再給紙トレイ130に導く。131は多重フラッパで、両面記録と多重記録の搬送経路を切り替えるものであり、これを左方向に倒す事により反転パスを経由させずに転写紙を直接下搬送パス128に導くことができる。130は再給紙トレイで、下搬送パス128から搬送されてくる転写紙をいったん格納する。
給紙ローラ132は経路133を通じて転写紙を感光体ドラム105側に給紙する。134は排紙ローラで、排紙フラッパ127の近傍に配置されて該排紙フラッパ127により排出側に切り替えられた転写紙を機外に排出する排出ローラである。
The
以下、各部の動作について説明する。 Hereinafter, the operation of each unit will be described.
モータ104により露光ランプ103および走査ミラーを駆動して、原稿載置台101に載置された原稿を走査しつつ露光ランプ103で原稿を照明し、原稿からの反射光を走査ミラー145とレンズ143により感光体ドラム105に照射する。
The
感光体ドラム105はメインモータ113により図1に示す矢印の方向に回転されるものであり、この時1次帯電器106により感光体ドラム105の表面はコロナ帯電させられており、光学系102から原稿の反射光が照射されると感光体ドラム105の表面に静電潜像が形成される。この静電潜像は、現像器109により現像されてトナー像として可視化される。
The photosensitive drum 105 is rotated in the direction of the arrow shown in FIG. 1 by the
一方、上段カセット114あるいは下段カセット115からピックアップローラ116、117を介し、給紙ローラ118、119により本体100内に送られた転写紙が、レジストローラ120によりトナー像の先端と転写紙の先端とが一致するようにタイミングがとられた後、感光体ドラム105に給送され、転写帯電器110によりトナー像が転写される。
On the other hand, the transfer paper sent from the
転写紙にトナー像が転写された後、転写紙は分離帯電器111により感光体ドラム105から分離され、搬送ベルト121により定着器122に導かれて加圧、加熱によりトナー像が転写紙上に定着される。その後、排出ローラ123により排出される。また、クリーニング装置112により、感光体ドラム105の表面が清掃される。
After the toner image is transferred to the transfer paper, the transfer paper is separated from the photosensitive drum 105 by the
両面記録(両面複写)や多重記録(多重複写)時には、排紙フラッパ127を上方に上げて、複写済みの転写紙を反転パス129、搬送パス128を介して両面記録時には既に画像が記録された面が上にくるように、多重記録時には既に画像が記録された面が下にくるように再給紙トレイ130に格納する。このとき、両面記録時には多重フラッパ131を図中右方向へ倒し、また多重記録時には該多重フラッパ131を図中左方向へ倒しておく。
At the time of double-sided recording (double-sided copying) or multiple recording (multiple copying), the
次に行う裏面記録時や多重記録時には、再給紙トレイ130に格納されている転写紙が、下から1枚ずつ給紙ローラ132により経路133を介して本体のレジストローラ120に導かれる。本体100から転写紙を反転して排出する時には、排紙フラッパ127を図中上方に上げ、多重フラッパ131を図中右方向へ倒し、複写済みの転写紙を搬送パス129側へ搬送し、転写紙の後端が第1の送りローラ140を通過した後に反転ローラ142によって第2の送りローラ141側へ搬送し、排出ローラ134によって、転写紙を裏返して機外へ排出する。
At the time of backside recording or multiple recording to be performed next, the transfer paper stored in the
[ブロック図]
図2は、本発明の一実施形態を示す画像形成装置を制御する制御系の一例を説明するブロック図である。
[Block Diagram]
FIG. 2 is a block diagram illustrating an example of a control system that controls the image forming apparatus according to the embodiment of the present invention.
図において、1000は図1の本体100を表す。230は制御回路(コントローラ)で、CPU230a、ROM230b、RAM230c、不揮発性メモリ230d等から構成され、CPU230aがROM230bに格納された制御プログラムに基づいて複写シーケンスを総括制御する。RAM230cはCPU230aのワークエリア等に使用される。
In the figure, 1000 represents the
不揮発性メモリ230dは、ハードディスク、フラッシュメモリ、EEPROM、EPROM等から構成され、音声認識、および音声合成に必要なプログラムおよびデータが記憶されている。 The non-volatile memory 230d includes a hard disk, flash memory, EEPROM, EPROM, and the like, and stores programs and data necessary for speech recognition and speech synthesis.
218は操作部で、コピーモード(片面・両面・多重モード、複写倍率、カセット選択等)設定キー、複写枚数等を設定するテンキー、複写動作開始を指示するスタートキー、複写動作停止を指示するストップキー、動作モードを標準状態に復帰させるリセットキー等のキー入力部及び動作モードの設定状態等を表示するLED・液晶等の表示部が配置されている。なお、詳細は後述する図3で説明する。
An
201はアナログ/デジタル(A/D)変換部で、サーミスタ202により検出された定着ローラ144の表面温度を表すアナログ信号をデジタル信号に変換し、該変換されたデジタル値をコントローラ230に入力する。なお、コントローラ230は、サーミスタ202の検出値により、定着ローラ144の表面温度が所定値になるように制御している。
An analog / digital (A / D)
203は高圧制御部で、1次帯電器106、転写帯電器110等の帯電系及び現像器109等に所定の電位を印加する高圧ユニット204の制御を行う。205はモータ制御部で、各種ステッピングモータ、メイン駆動モータ等のモータの駆動を制御する。
A high-voltage control unit 203 controls a high-voltage unit 204 that applies a predetermined potential to the charging system such as the
207はDC負荷制御部で、ピックアップローラ116用等の図示しないソレノイド、レジストローラ120用等のクラッチ及びファン等の駆動を制御する。
208はセンサ類で、転写紙の紙詰まり検知用等の各種センサにより構成され、これらセンサの検知結果はコントローラ230に入力される。
A DC load control unit 207 controls driving of a solenoid (not shown) for the pickup roller 116, a clutch for the registration roller 120, a fan, and the like.
Reference numeral 208 denotes sensors, which are constituted by various sensors for detecting a paper jam of the transfer paper, and the detection results of these sensors are input to the
マイク312は、音声の入力を検出する。ゲインコントロール(Gainコントロール)212は、マイク312から入力される音声を音声認識に最適な音量に調整する。A/D変換部213は、アナログ信号をデジタル信号に変換するものであり、ゲインコントロール212から入力される音声をA/D変換する。該変換された値がコントローラ230に入力され、コントローラ230で音声認識が行われる。
The
コントローラ230で音声合成された音声データはデジタル/アナログ(D/A)変換部219においてデジタル信号をアナログ信号に変換され、該変換された値がスピーカー220より出力される。
The voice data synthesized by the
214はACドライバで、図1に示した原稿照明ランプ103等のAC負荷209及び定着ヒータ210へのAC電源供給を制御するとともに、原稿照明ランプ103、定着ヒータ210等の異常を検出し、シャットオフ機能付きのメインスイッチ(MSW)215をオフ状態にする。さらに、コントローラ230の制御により、メインスイッチ215前後のAC入力が切り替えられて電源217に入力される。
An
217は電源で、コントローラ230等にDC電源の供給を行っている。また、ACドライバ214からのAC電源が入力されると共に、入力電源プラグ211から、メインスイッチ(MSW)215、ドアスイッチ(DSW)216を介してAC電源が入力される。
A
ペーパーデッキ124は、転写紙の収納枚数を増加させるための給紙装置であり、フィーダ200は、複数枚の原稿を自動的にセットするための自動原稿送り装置、ソータ250は、排出される転写紙を仕分けするための仕分け装置である。
The
ファクシミリ部221は、電話回線を介して受信した圧縮画像データを伸長して、伸長された画像データをコントローラ230へ転送、およびコントローラ230から転送された画像データを圧縮して、圧縮された圧縮画像データは電話回線を介して送信する。なお、ファクシミリ部221により受信した圧縮画像データは、不揮発メモリ230dに一時的に保存することができる。
The
コンピュータインタフェース部223は、ネットワーク226を介してパーソナルコンピュータ又はワークステーション(PC/WS)224、またはスキャナまたはネットワークスキャナ225とコントローラ230とを接続するインターフェイスであり、PC/WSl10から転送された画像を表すコードデータ(画像データ、PDL(Page Description Language、ページ記述言語)データ)と、スキャナまたはネットワークスキャナ225から転送される所定の通信媒体-例えばネットワーク、セントロニクスケーブル、232Cケーブル等を介して受信した画像データを展開してコントローラ230を介して不揮発性メモリ230dに記憶する。
The computer interface unit 223 is an interface for connecting the personal computer or workstation (PC / WS) 224 or the scanner or
なお、図示はしないが、PC/WS110は、各種情報を表示する表示部、使用者からの入力を受け付けるキーボード及びポインティングデバイス、CPU、RAM、ROM、ネットワークインタフェース等を有している。又、ネットワークスキャナ225は、原稿画像を読み取る読み取り部、使用者からの入力を受け付ける操作パネル、各種情報を表示する表示部、CPU、RAM、ROM、ネットワークインタフェースを有する。
Although not shown, the PC / WS 110 includes a display unit that displays various information, a keyboard and a pointing device that accept input from the user, a CPU, a RAM, a ROM, a network interface, and the like. The
〔操作部の説明〕
図3は、図2に示した操作部218の構成の一例を説明する平面図である。
[Explanation of operation unit]
FIG. 3 is a plan view for explaining an example of the configuration of the
図において、300はコピースタートキーで、複写動作を開始させる時に押下する。301はストップキーで、コピーをストップ(中止、中断)するときに押下する。302はクリアキーで、入力された数値をクリアするときに押下する。
In the figure,
303はIDキーで、このIDキー303により特定の操作者に対して複写動作を可能にし、IDキーによりIDを入力しない限り複写動作を禁止することが可能となる。
304はガイドキーで、複写装置100、RDF200、ソータ250等が有する各機能の説明を必要とするときに押下する。305はオペレータメモリキーで、複写装置100、RDF200、ソータ250等の仕様や状態などを設定するときに押下する。オペレータモード内には、所望の機能をキーに割り当てる機能設定(2種類)、仕様設定、タイマ設定、調整/クリーニング設定がある。
A
306は割り込みキーで、コピー中に割り込んで別のコピーを行いたいときに押下する。307は予熱キーで、電力消費を少なくする予熱モードに移行したいときや、予熱モードから復帰したいときに押下する。308はリセットキーで、複写モードを標準複写モードに戻したいときに押下する。309はテンキー群で、数値の入力、例えば倍率の設定、コピー部数等の入力等に使用する。
An interrupt key 306 is pressed when interrupting during copying and another copy is desired. A preheating
310は液晶表示操作部で、タッチパネルディスプレイにより構成され、複写装置100、RDF200、ソータ250等の状態や、複写モードの設定状況を表示し、表示されたソフトキーをタッチすることにより、この表示される画面が変化、遷移し、複写モードの設定操作等を行えるようになっている。311は音声入力キーで、このキーを押下することによりマイク312の入力を可能にする。313はスピーカーで音声ガイダンスやユーザが発声した音声を確認するための音声出力が行われる。
A liquid crystal
[標準画面]
図4は、図3に示した液晶表示操作部310に表示される標準画面の一例を示す模式図である。
[Standard screen]
FIG. 4 is a schematic diagram showing an example of a standard screen displayed on the liquid crystal
操作部上部にはコピー401、送信402、ボックス403のように複数の機能ごとにボタン表示されている。図4はコピー401が押下されたときのコピー機能の初期画面を表している。
Buttons are displayed for each of a plurality of functions such as a
404は状態表示欄で、複写装置100、RDF200、ソータ240等の状態、設定されている置数、設定されている倍率、指定した用紙サイズ等が表示される。
A
405は等倍キーで原稿と同じサイズでコピーするときに押下する。
406は倍率キーで出力サイズを原稿サイズよりも縮小/拡大したいときに押下する。
A
407は用紙選択キーで用紙のサイズや種類、給紙位置を選択するときに押下する。
A
408、409、410は濃度キーでコピー濃度を手動で調整するときに408薄くキーまたは510濃くキーを押下する。自動濃度調整を設定、または解除するときは409自動キーを押下する。 408, 409, and 410 are density keys, and when the copy density is manually adjusted, the 408 light key or 510 dark key is pressed. To set or cancel the automatic density adjustment, the user presses the 409 automatic key.
411はソータキーで、ソータ240の出力形態(ノンソート、ソート、グループソートなど)ステイプル位置の設定などを行うときに押下する。
412は両面キーで、片面/両面の原稿やブック原稿を用紙の表裏に、また両面原稿を片面にコピーする際に押下する。
413は画質キーで、画質(文字のみの原稿、文字/写真混在の原稿、写真のみの原稿など)を選択してコピーするときに押下する。
414は割り込みキーで、コピー中に割り込んでコピーを行いたいときに押下する。 An interrupt key 414 is pressed when it is desired to interrupt and copy during copying.
415、416はお好みキーで、コピー基本画面上の倍率、ソータ、両面の各モードキーや応用モード画面上の各モードキーの中から任意のキーを2個まで登録することができる。使用することが多い機能を登録することにより階層をたどらなくても設定画面に飛ぶことが可能になる。
本実施例では設定した機能を登録できるモードメモリ、原稿サイズと出力サイズより自動的に倍率を決定する自動変倍が登録されているものとする。 In this embodiment, it is assumed that a mode memory capable of registering the set function and automatic scaling for automatically determining the magnification from the document size and the output size are registered.
417は応用モードキーで複写装置が有する種々の機能を行うときに押下するものであり、応用モードキー417を押下すると応用モード画面(図5)が表示される。
418はステータス行で、複写装置100のステータスを表示する領域であり、例えばジャムなどのアラームメッセージやPDLプリントが行われているときにPDLプリント中であることを示すステータスメッセージを表示する領域である。
A
419は音声名称設定キーで、ユーザが音声認識で使用する語彙を追加や確認、削除を行う場合に押下する。
A voice
420はシステム状況/中止キーで複写装置100のデバイス情報を表示する画面やプリントジョブ状況の確認や順番を変更したり、中止したりするときに押下する。(図示しない)
402は送信キーで、複写装置100で読み取った画像をネットワーク226上の機器にE−mail送信、FTP送信する。またはFAXにより電話回線を使って送信するための設定画面を表示する。(図示しない)
403はボックスキーで、複写装置100で読み取った画像を不揮発性メモリ230dのハードディスク内のボックス領域に保存したり、ボックス領域に保存されている画像データを指定して印刷したり、ネットワーク226上の機器に送信するための設定画面を表示する。(図示せず)図4は標準画面(基本画面)で、電源投入時、図3に示したリセットキー308押下後、コピー動作終了後等の標準状態における液晶表示操作部310に表示される画面である。401は状態表示欄で、複写装置100、RDF200、ソータ240等の状態、設定されている置数、設定されている倍率、指定した用紙サイズ等が表示される。
A
[モードメモリ登録方法]
図4、図9〜図13を用いて、モードメモリに機能を登録する方法について説明を行う。
[Mode memory registration method]
A method for registering a function in the mode memory will be described with reference to FIGS. 4 and 9 to 13.
両面から両面/左右開きから上下開き、ステイプルソート、15部という設定がよく使われる機能である場合を例に本実施例の説明を行う。 The present embodiment will be described by taking as an example a case where settings such as double-sided / double-sided / left / right open, up / down open, staple sort, and 15 copies are frequently used functions.
図4の標準画面の両面キー416を押下する。押下すると設定画面(図9)がオープンする。図9は両面の種類の選択画面である。901は片面から両面キーで、2枚の片面原稿を1枚の用紙の両面にコピーしたい場合に押下する。902は両面から両面キーでRDF200にセットされた両面原稿の表裏を1枚の用紙の表裏にコピーしたい場合に押下する。903は両面から片面キーでRDF200にセットされた両面現行の表裏を別々の用紙に片面コピーしたい場合に押下する。904はページ連写両面キーで本などの見開き原稿の左右ページを1枚の用紙の表裏に両面コピーしたい場合に押下する。905は詳細設定キーで片面から両面キー901、両面から両面キー902、両面から片面キー903が選択されている際に押下可能になるキーで、原稿が両面の場合は原稿が左右開きなのか上下開きなのか、出力が両面の場合は出力を左右開きにするのか上下開きにするのか設定を行うことができる。906は設定取消キーで両面機能の設定を取り消したい場合に押下する。907はOKキーで両面機能の設定を確定する場合に押下する。
A double-
本実施例では両面から両面を設定するため、902の両面から両面キーを押下する。そして、左右開きから上下開きを設定するため、905の詳細設定キーを押下する。
In this embodiment, in order to set both sides from both sides, the both sides key 902 is pressed from both sides. Then, in order to set the vertical opening from the left / right opening, the
押下すると図10の両面詳細設定画面がオープンする。両面原稿の種類と両面コピー出力の種類を選択する画面である。1001は原稿左右開きキーで原稿が左右開きの場合に押下する。1002は原稿上下開きキーで原稿が上下開きの場合に押下する。1003はコピー左右開きキーで、コピーを左右開きに出力したい場合に押下する。1004はコピー上下開きキーでコピーを上下開きに出力したい場合に押下する。1005は閉じるキーで選択された詳細を登録するためのキーである。
When pressed, the double-sided detailed setting screen of FIG. 10 is opened. This is a screen for selecting the type of duplex original and the type of duplex copy output.
本実施例では左右開きから上下開きを設定するため、原稿左右開きキー1001とコピー上下開きキー1004を押下し、閉じる1005キーを押下すると左右開きから上下開きが設定され、図9の両面種類の選択画面に戻る。両面機能についての設定は完了しているためOKキー907を押下し、両面機能の設定を終了させる。設定が終了すると図4の標準画面に戻る。設定されている機能は反転される。(図12)
次にソータの設定を行うため図4ソータキー411を押下すると図11ソータの種類選択画面がオープンする。1101はソートキーで複数枚の原稿をコピーする場合に自動的に丁合いしたい場合に押下する。1102はグループキーで複数マイの原稿をコピーする場合にページごとに仕分けをする場合に押下する。1103はステイプルソートキーで複数マイの原稿をコピーする場合に自動的に丁合いしコピー終了後にステイプル(ホチキス止め)したい場合に押下する。1104はシフトキーで、ソート機能、グループ機能を使ってコピーするときに出力した用紙をまとめてシフトさせて仕分けする場合に押下する。1105は排紙面指定キーで出力される用紙の印字面向きを設定する場合に押下する。1106は設定取消キーでソータ機能の設定を取り消したい場合に押下する。1107はOKキーでソータ機能の設定を確定する場合に押下する。
In this embodiment, since the vertical opening is set from the left / right opening, the document left /
Next, when the
本実施例ではステイプルソートを設定するため、ステイプルソートキー1103を押下し、OKキー1107を押下して設定を確定する。設定が終了すると図4の標準画面に戻る。設定されている機能は反転される。(図12)
最後に部数の設定を行う。図4の標準画面よりテンキーで「1」「5」を入力すると15部が設定される。図12は全ての設定が完了した際の標準画面である。
In this embodiment, in order to set the staple sort, the
Finally, set the number of copies. When “1” and “5” are entered using the numeric keys on the standard screen of FIG. 4, 15 copies are set. FIG. 12 shows a standard screen when all settings are completed.
ここまでで両面から両面/左右開きから上下開き、ステイプルソート、15部の設定が完了したので、次にモードメモリの登録方法について説明を行う。 Up to this point, the double-sided / double-sided / left / right open, up / down open, stapling sort, and setting of 15 copies have been completed. Next, the mode memory registration method will be described.
図12のモードメモリ415キーを押下するとモードメモリ設定画面が表示される。
When the
図13を用いてモードメモリ設定について説明を行う。 The mode memory setting will be described with reference to FIG.
図13(a)はモードメモリ登録画面である。M1〜M9のキーの9通り機能を登録することができる。本実施例では9つのキーのうちM1を押下した場合について説明を行う。M1のキーを押下するとキーが反転し、登録キー、名称登録キーが押下可能になる。(図13(b))押下可能になった登録キーを押下すると図13(c)が表示され、登録を行う機能の確認画面が表示される。はいキーを押下すると図13(d)が表示され、M1に正しく登録されたことを表す。次に名称登録キーを押下すると図13(e)キーボード画面が表示される。現在表示されているM1に対し名称を設定することが可能になる。入力が完了した際にOKキーを押下すると図13(f)が表示され、「format1」が名称に設定されていることを確認できる。 FIG. 13A shows a mode memory registration screen. Nine functions of the keys M1 to M9 can be registered. In the present embodiment, a case where M1 is pressed among nine keys will be described. When the M1 key is pressed, the key is reversed and the registration key and name registration key can be pressed. (FIG. 13 (b)) When the registration key that can be pressed is pressed, FIG. 13 (c) is displayed, and a confirmation screen for the function to be registered is displayed. When the Yes key is pressed, FIG. 13D is displayed, indicating that it has been correctly registered in M1. Next, when the name registration key is pressed, the keyboard screen shown in FIG. 13 (e) is displayed. A name can be set for M1 currently displayed. When the OK key is pressed when the input is completed, FIG. 13F is displayed, and it can be confirmed that “format1” is set as the name.
[音声名称設定方法]
図4〜図7、図13を用いて先ほど登録したモードメモリM1(format1)に音声名称を設定する方法について説明を行う。
[Voice name setting method]
A method for setting a voice name in the mode memory M1 (format 1) registered earlier will be described with reference to FIGS.
図13(g)において音声名称設定キー419を押下し、音声名称設定モードに入る。音声名称設定モードに入ると音声名称設定キー419は反転し現在音声名称設定モードに入っていることを表す。次に名称設定を行いたいキーを押下する。ここではモードメモリ1に名称を割り当てるためformat1と名称をつけられたキーを押下する。
In FIG. 13G, the voice
押下すると図5の名称設定画面が表示される。501は登録名称表示画面でモードメモリ1に登録されている名称が表示される。502は消去禁止アイコンで、プリセットされている名称を表している。503、504はページめくりキーで複数の語彙が登録されており、表示が複数ページにわたる場合に押下可能になる。505は追加キーで名称を追加したい場合に押下する。506は詳細/編集キーで、現在選択されている名称のアクセントを変更したい場合に押下する。507は消去キーで現在選択されている名称を消去したい場合に押下する。プリセット以外の名称が選択されている際に押下可能となる。
When pressed, the name setting screen of FIG. 5 is displayed. A registered
508は設定取消キーで、名称設定を取り止めたい場合に押下する。509は戻るキーで設定を反映させずに前の画面に戻る場合に押下する。510はOKキーで設定を反映させて前の画面に戻る場合に押下する。
A setting cancel key 508 is pressed to cancel the name setting. A
ここで、追加キー505を押下した場合の動きについて説明する。
Here, the movement when the
押下すると図6の名称登録画面が表示される。601は名称入力画面で入力した名称を視覚的に確認することができる。602はソフトキーボード群で、キー入力により名称を入力する。603はキャンセルキーで名称登録をキャンセルしたい場合に押下する。604はアクセント設定キーで入力された名称のアクセント確認、アクセント変更を行う場合に押下する。605はOKキーで入力したもので正しければOKキーを押下する。このキーを押下すると、入力した文字列と名称登録を行いたいキー(ここではモードメモリ1)の認識ID、設定したアクセントが不揮発性メモリ230dに記憶される。
When pressed, the name registration screen of FIG. 6 is displayed. A
本実施例ではモードメモリ1に「いつもの」という名称を登録する場合について説明する。ソフトキーボードより「イツモノ」と名称を入力する。正しく登録されているかどうか確認する場合やアクセントの変更を行う場合はアクセント設定キー604を押下する。
In this embodiment, a case where the name “ordinary” is registered in the
アクセント設定キー604を押下した際の画面を、図7のアクセント設定画面に示す。
A screen when the
701はアクセント変更キー郡で、図6で入力した文字列が表示される。キーがあがっている箇所にアクセントがついている。アクセントを変更する場合は、このキー群を操作する。702は音声確認キーで設定したアクセントにより読み上げを行う。このキーを押下すると、現在入力されているテキスト文と設定されているアクセントに基づいてデジタル音声データが生成される。生成されたデジタル音声データはD/A変換部219よりアナログ音声データに変換されスピーカー220より出力される。
703はキャンセルキーで名称登録をキャンセルしたい場合に押下する。704は戻るキーで設定を反映させずに図6の名称登録画面に戻る場合に押下する。705はOKキーで設定を反映させ図6の名称登録画面に戻る場合に押下する。
A
図7の705OKキーを押下すると図6の名称設定画面に戻り、登録した名称が表示される。(図示しない)OKキー610を押下すると、図4で発声可能な文言ですでに登録されている場合や似た名称がすでに登録されているかどうかのチェックが行われる。NGである場合はエラー画面が表示される。(図示しない)OKである場合は追加登録が完了する。 When the 705 OK key in FIG. 7 is pressed, the screen returns to the name setting screen in FIG. 6 and the registered name is displayed. When an OK key 610 (not shown) is pressed, a check is made as to whether or not a similar name has already been registered in the words that can be spoken in FIG. If it is NG, an error screen is displayed. If it is OK (not shown), the additional registration is completed.
図16のフローチャートを用いて上記について詳細に説明を行う。(()内は図16のステップを表す)
まず音声名称設定モードが選択されたか否か判断する(S1601)。音声名称設定モードに入っていない場合は待機を行う。音声名称設定モードが選択された場合は音声名称設定モードを起動する(S1602)。次に一定時間内に機能選択があるかどうか判断する(S1603)。一定時間に機能選択がなかった場合はユーザにタイムアウト通知を行ない(S1604)、音声名称設定モードを抜け(S1605)待機を行う。一定時間内に機能選択があった場合は、選択された機能名称に割り当てられている音声名称を取得し音声名称設定画面を表示する(S1606)。次に一定時間内に入力があったかどうか判断し(S1607)、入力がなかった場合は(S1604)のステップを行う。一定時間に入力があった場合は名称の選択か追加の選択かを判断する(S1608)。名称の選択である場合は、選択された名称がプリセット名称か否か判断する(S1609)。プリセット名称である場合は、削除が禁止されているため削除キーは選択不可のままで編集キーを選択可能にする(S1610)。プリセット名称でない場合は、削除キーと編集キーを選択可能にする(S1611)。次に一定時間内に入力があったかどうか判断し(S1612)、入力がなかった場合は(S1604)のステップを行う。一定時間に入力が合った場合は名称か追加か編集か削除か判断を行う(S1613)。名称が選択された場合は(S1609)のステップを行う。追加である場合は後述の(S1618)のステップを行う。編集である場合はアクセント編集画面を表示する(S1614)。入力が完了したか否か判断し(S1615)、完了した場合は編集されたアクセントを登録する。(S1613)において削除が選択された場合は選択された名称を削除する。
The above will be described in detail using the flowchart of FIG. (() Represents the steps in FIG. 16)
First, it is determined whether or not the voice name setting mode has been selected (S1601). If not in voice name setting mode, wait. When the voice name setting mode is selected, the voice name setting mode is activated (S1602). Next, it is determined whether or not there is a function selection within a certain time (S1603). If no function is selected for a certain period of time, a time-out notification is sent to the user (S1604), the voice name setting mode is exited (S1605), and a standby is performed. If a function is selected within a certain time, the voice name assigned to the selected function name is acquired and the voice name setting screen is displayed (S1606). Next, it is determined whether or not there is an input within a predetermined time (S1607). If there is no input, the step of (S1604) is performed. If there is an input for a certain period of time, it is determined whether the name is selected or added (S1608). If the name is selected, it is determined whether the selected name is a preset name (S1609). If it is a preset name, since deletion is prohibited, the edit key can be selected without selecting the delete key (S1610). If it is not a preset name, a delete key and an edit key can be selected (S1611). Next, it is determined whether or not there is an input within a predetermined time (S1612). If there is no input, the step of (S1604) is performed. If the input matches for a certain time, it is determined whether the name is added, edited, or deleted (S1613). If a name is selected, step (S1609) is performed. If it is added, a step (S1618) described later is performed. If it is editing, an accent editing screen is displayed (S1614). It is determined whether or not the input is completed (S1615), and if completed, the edited accent is registered. When deletion is selected in (S1613), the selected name is deleted.
(S1608)のステップにおいて追加が選択された場合、名称入力画面を表示する(S1618)。次に入力が確定したか否か判断し(S1619)、入力が確定した場合は名称チェックを行う(S1620)。名称チェックでは入力された名称が結び付けられている機能名が使用されている画面を検索する。検索された画面内で使用されている語彙と入力した名称が同じかどうか、もしくは似ているかどうかの判断を行う。すでに登録されている名称と同じ場合、もしくは似ている場合はNGと判断されユーザに対しNGの通知と名称の再入力要求を行う(S1623)。すでに登録されている名称と同じでない、かつ似ていない場合はOKと判断され、名称が登録される(S1622)。登録される場合機能名が使用されている全ての画面に対し名称が追加登録される。ユーザによる終了が選択されたか否か判断し(S1624)、終了していない場合は、再度(S1606)のステップに戻る。終了が選択された場合は音声名称設定モードを抜け(S1625)、最初の画面に戻る。 When addition is selected in the step of (S1608), a name input screen is displayed (S1618). Next, it is determined whether or not the input is confirmed (S1619). If the input is confirmed, the name is checked (S1620). In the name check, a screen in which the function name to which the input name is linked is used is searched. It is determined whether the vocabulary used in the searched screen and the input name are the same or similar. If it is the same as or already similar to the registered name, it is judged as NG and a NG notification and a name re-input request are made to the user (S 1623). If it is not the same as the name already registered and it is not similar, it is judged as OK and the name is registered (S1622). When registered, names are additionally registered for all screens where function names are used. It is determined whether or not termination by the user has been selected (S1624). If not terminated, the process returns to step (S1606) again. When the end is selected, the voice name setting mode is exited (S1625), and the screen returns to the first screen.
[音声認識方法]
次に図8、図14を用いて音声により設定を復元する手法について説明を行う。
[Voice recognition method]
Next, a method for restoring settings by voice will be described with reference to FIGS.
図8は本発明に係る画像形成装置における音声認識処理手順の一例を説明するフローチャートであり、図2に示したROM230bに格納される制御プログラムに基づいてCPU230aにより実行される処理に対応する。なお、(801)〜(807)は各ステップを示す。 FIG. 8 is a flowchart for explaining an example of the voice recognition processing procedure in the image forming apparatus according to the present invention, and corresponds to the processing executed by the CPU 230a based on the control program stored in the ROM 230b shown in FIG. In addition, (801)-(807) show each step.
まず、液晶表示操作部310に図14(a)に示した標準画面を表示させ(801)、図3に示した音声入力キー311が押下されたかどうかを判断し(802)、音声入力キー311が押下されていないと判断した場合は、ステップ(802)に戻り、音声入力キー311が押下されていると判断した場合は、ステップ(803)に進む。この際液晶表示操作部310に図14(b)に示した画面が表示される。1420は音声認識中モードであることをユーザに知らせるためのステータス行である。
First, the standard screen shown in FIG. 14A is displayed on the liquid crystal display operation unit 310 (801), it is determined whether the
ステップ(803)では、音声入力キー311が押下されている間にマイク312から入力される音声がゲインコントロール回路212、A/D変換部213を介して制御回路230に入力される。
In step (803), the sound input from the
ステップ(804)では、ステップ(803)において入力される音声と図2に示した不揮発性メモリ230dに登録名称と対応付けて登録される名称から生成される表音記号と入力された音声データから生成される表音記号から尤度を計算する。 In step (804), the phonetic symbol generated from the voice input in step (803), the name registered in association with the registered name in the nonvolatile memory 230d shown in FIG. 2, and the input voice data. The likelihood is calculated from the generated phonetic symbols.
次に、ステップ(805)では、ステップ(804)において一番尤度が高かったもの名称に対する結果が閾値以上であるかどうかを判定する。 Next, in step (805), it is determined whether or not the result for the name having the highest likelihood in step (804) is greater than or equal to a threshold value.
閾値以上でなかった場合は、認識に失敗していると判断しステップ(806)を実行し再び認識待機状態に戻る。 If it is not equal to or greater than the threshold value, it is determined that recognition has failed, and step (806) is executed to return to the recognition standby state again.
閾値以上であった場合は、ステップ(807)において認識結果に割り当てられている機能を実行する。この際液晶表示操作部310には図14(c)が表示され、1430に認識結果と機能割り当てが表示される。
If it is equal to or greater than the threshold value, the function assigned to the recognition result in step (807) is executed. At this time, FIG. 14C is displayed on the liquid crystal
ステップ(406)では、ステップ(403)で入力された音声に対応するコピー機能を呼び出す。この際液晶表示操作部310には図14(d)が表示され、対応する機能が復元される。
In step (406), a copy function corresponding to the sound input in step (403) is called. At this time, FIG. 14D is displayed on the liquid crystal
先の実施例では不特定話者による音声認識の例を説明したが、声紋認証機能を持つ音声認識での実施例1について図18のデータ図、図15のフローチャートを用いて説明を行う。
In the previous embodiment, an example of speech recognition by an unspecified speaker has been described. However,
まず、音声認識モードを起動する(S1501)。次に図18の共通語彙データ、Aさんのデータ、Bさんのデータで認識待機する(S1502)。音声入力があったかどうかを判断し(S1503)、音声入力があった場合は声紋認証を実行する(S1505)。声紋認証の結果がAさんであったかBさんであったか登録されていないユーザであるかを判断する(S1505)。Aさんであった場合はAさんの語彙データと共通語彙データで入力された音声データに対する音声認識を行う(S1506)。Bさんであった場合はBさんの語彙データと共通データで入力された音声データに対する音声認識を行う(S1507)。登録されていないユーザであった場合は共通データで入力された音声に対する音声認識を行う(S1508)。音声認識結果に対する認識IDを取得し(S1509)、認識IDに対する判定を行う(S1510)。入力された音声認識結果が終了であると判断された場合、音声認識モードを終了する(S1511)。入力された音声認識結果が終了以外であると判断された場合、認識IDに割り当てられた処理を実行し(S1512)、(S1502)のステップに戻り、共通語彙データ、Aさんのデータ、Bさんのデータで音声入力の待機を行う。 First, the voice recognition mode is activated (S1501). Next, the process stands by for recognition using the common vocabulary data, the data of Mr. A, and the data of Mr. B in FIG. It is determined whether or not there is a voice input (S1503). If there is a voice input, voiceprint authentication is executed (S1505). It is determined whether the result of the voiceprint authentication is Mr. A, Mr. B, or an unregistered user (S1505). If it is Mr. A, voice recognition is performed on the voice data input with Mr. A's vocabulary data and common vocabulary data (S1506). In the case of Mr. B, voice recognition is performed on the voice data input as common data with Mr. B's vocabulary data (S1507). If the user is not registered, voice recognition is performed on the voice input with the common data (S1508). A recognition ID for the voice recognition result is acquired (S1509), and a determination for the recognition ID is made (S1510). If it is determined that the input voice recognition result is the end, the voice recognition mode is ended (S1511). If it is determined that the input speech recognition result is other than the end, the process assigned to the recognition ID is executed (S1512), and the process returns to the step (S1502) to return to the common vocabulary data, A's data, B Wait for voice input with the data.
次に声紋認証機能を持つ音声認識での実施例2について図19のデータ図、図17のフローチャートを用いて説明を行う。まず、音声認識モードを起動する(S1701)。次に図19の共通データ、Aさんのデータ、Bさんのデータで認識待機する(S1702)。音声入力があったかどうかを判断し(S1703)、音声入力が合った場合は声紋認証を実行する(S1705)。声紋認証の結果がAさんであったかBさんであったか登録されていないユーザであるかを判断する(S1705)。Aさんであった場合はAさんの語彙データと共通語彙データで入力された音声データに対する音声認識を行う(S1706)。Bさんであった場合はBさんの語彙データと共通データで入力された音声データに対する音声認識を行う(S1707)。登録されていないユーザであった場合は共通データで入力された音声に対する音声認識を行う(S1708)。音声認識結果に対する認識IDを取得し(S1709)、認識IDに対する判定を行う(S1710)。入力された音声認識結果が終了であると判断された場合、認証情報をクリアし(S1711)、音声認識モードを終了する(S1712)。入力された音声認識結果がログアウトであると判断された場合、認証情報をクリアし(S1713)、(S1702)のステップに戻り、共通語彙データ、Aさんのデータ、Bさんのデータで音声入力の待機を行う。終了以外であると判断された場合、認識IDに割り当てられた処理を実行し(S1714)、(S1706)(S1707)(S1708)のステップで確定した語彙データで音声入力の待機を行い(S1715)、音声入力があったかどうかを判断する(S1703)。音声入力があった場合は(S1716)、展開されている語彙データで音声認識を実行し(S1717)、(S1709)に戻り、認識IDの判定を行う。 Next, a second embodiment of speech recognition having a voiceprint authentication function will be described with reference to the data diagram of FIG. 19 and the flowchart of FIG. First, the voice recognition mode is activated (S1701). Next, the process waits for recognition using the common data, the data of Mr. A, and the data of B in FIG. 19 (S1702). It is determined whether or not there is a voice input (S1703). If the voice input is correct, voiceprint authentication is executed (S1705). It is determined whether the result of the voiceprint authentication is Mr. A or Mr. B or whether the user is not registered (S1705). If it is Mr. A, voice recognition is performed on the voice data inputted with the vocabulary data of A and the common vocabulary data (S1706). If it is Mr. B, voice recognition is performed on the voice data input with the vocabulary data and common data of Mr. B (S1707). If the user is not registered, voice recognition is performed on the voice input as common data (S1708). A recognition ID for the voice recognition result is acquired (S1709), and a determination for the recognition ID is made (S1710). If it is determined that the input voice recognition result is the end, the authentication information is cleared (S1711), and the voice recognition mode is ended (S1712). If it is determined that the input voice recognition result is logout, the authentication information is cleared (S1713), and the process returns to the step (S1702), and voice input is performed with the common vocabulary data, the data of A, and the data of B. Wait. If it is determined that it is not the end, the process assigned to the recognition ID is executed (S1714), and the voice input is waited for with the vocabulary data determined in the steps of (S1706), (S1707), and (S1708) (S1715). It is determined whether or not there is a voice input (S1703). If there is a voice input (S1716), voice recognition is executed with the expanded vocabulary data (S1717), and the process returns to (S1709) to determine the recognition ID.
上記実施形態においては複写装置を一例として説明しているが、プリンタまたはコピー機能、プリンタ機能、ファクシミリ機能等を有する複合複写機等において上記実施形態を適用するように構成してもよい。この場合、コピーモードだけでなく印刷モード、ファクシミリモード等の複合複写機で設定可能な処理モードを登録可能に構成し、該登録された処理モードを上述したように音声で呼び出すように構成される。 In the above-described embodiment, the copying apparatus is described as an example. However, the above-described embodiment may be applied to a printer or a multifunction copying machine having a copy function, a printer function, a facsimile function, and the like. In this case, it is possible to register not only the copy mode but also a processing mode that can be set by the multifunction copying machine such as a printing mode and a facsimile mode, and the registered processing mode is configured to be called out by voice as described above. .
また、本発明を適用可能な画像形成装置は、電子写真方式でも、インクジェット式、昇華式、熱転写式でもその他の方式でもよい。 The image forming apparatus to which the present invention can be applied may be an electrophotographic system, an ink jet system, a sublimation system, a thermal transfer system, or other systems.
さらに、本実施形態では、画像形成装置の像形成モードと入力される音声を対応付けて登録する場合について説明したが、画像形成装置の像形成モードに限られるものではなく、その他の設定に対応する音声を登録する場合にも本発明が適用できることは言うまでもない。 Furthermore, in this embodiment, the case where the image forming mode of the image forming apparatus and the input sound are registered in association with each other has been described. However, the image forming mode is not limited to the image forming mode of the image forming apparatus, and other settings are supported. Needless to say, the present invention can also be applied to the case of registering voice to be recorded.
以上より、表示画面の大きさにより処理モードを呼び出すキーを画面に一覧表示できない場合でも複数のキー入力という煩雑な操作を行うことなく、音声を入力するという簡単な操作で処理モードを短時間で呼び出すことができ、ユーザの操作負担を格段に低減させる像形成モード設定環境を提供することができる。 From the above, even if the keys that call the processing mode cannot be displayed in a list on the screen depending on the size of the display screen, the processing mode can be changed in a short time with a simple operation of inputting voice without performing complicated operations such as inputting multiple keys. It is possible to provide an image forming mode setting environment that can be called up and that greatly reduces the user's operation burden.
前述した実施形態の機能を実現するソフトウエアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。 A storage medium storing software program codes for realizing the functions of the above-described embodiments is supplied to a system or apparatus, and a computer (or CPU or MPU) of the system or apparatus stores program codes stored in the storage medium. It goes without saying that the object of the present invention can also be achieved by executing the reading.
この場合、記憶媒体から読み出されたプログラムコード自体が本発明の新規な機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。 In this case, the program code itself read from the storage medium realizes the novel function of the present invention, and the storage medium storing the program code constitutes the present invention.
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク等を用いることができる。 As a storage medium for supplying the program code, for example, a flexible disk, hard disk, optical disk, magneto-optical disk, CD-ROM, CD-R, magnetic tape, nonvolatile memory card, ROM, EEPROM, silicon disk, etc. Can be used.
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an OS (operating system) or the like running on the computer based on the instruction of the program code. It goes without saying that a case where the function of the above-described embodiment is realized by performing part or all of the actual processing and the processing is included.
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Further, after the program code read from the storage medium is written to a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, the function expansion is performed based on the instruction of the program code. It goes without saying that the case where the CPU or the like provided in the board or the function expansion unit performs part or all of the actual processing and the functions of the above-described embodiments are realized by the processing.
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのソフトウエアによって表されるプログラムを格納した記憶媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。 Further, the present invention may be applied to a system composed of a plurality of devices or an apparatus composed of a single device. Needless to say, the present invention can be applied to a case where the present invention is achieved by supplying a program to a system or apparatus. In this case, by reading the storage medium storing the program represented by the software for achieving the present invention into the system or apparatus, the system or apparatus can enjoy the effects of the present invention. .
さらに、本発明を達成するためのソフトウエアによって表されるプログラムをネットワーク上のデータベースから通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。 Furthermore, by downloading and reading a program represented by software for achieving the present invention from a database on a network by a communication program, the system or apparatus can enjoy the effects of the present invention. .
Claims (6)
音声を入力する音声入力手段と、
前記複数の操作キーに対し、音声認識で使用する語彙が記憶されている語彙記憶手段と
前記音声入力手段により入力される音声データを音声認識し認識結果を返す音声認識手段と
前記音声認識手段から受け取った認識結果をもとに前記語彙記憶手段に登録されている操作キーに該当する処理を行う制御手段と、
を有することを特徴とする画像形成装置。 Multiple operation keys for setting various image forming modes,
Voice input means for inputting voice;
From the vocabulary storage means for storing the vocabulary used for speech recognition with respect to the plurality of operation keys, the speech recognition means for speech recognition of speech data input by the speech input means and returning a recognition result, and the speech recognition means Control means for performing processing corresponding to the operation key registered in the vocabulary storage means based on the received recognition result;
An image forming apparatus comprising:
前記名称入力手段により登録された語彙を前記語彙記憶手段に登録する語彙登録手段と
を有する請求項1記載の画像形成装置。 2. The image according to claim 1, further comprising: a vocabulary input unit that inputs a vocabulary used in speech recognition for the plurality of operation keys; and a vocabulary registration unit that registers a vocabulary registered by the name input unit in the vocabulary storage unit. Forming equipment.
前記名称入力手段により登録された語彙を前記語彙記憶手段に追加登録してよいか否かを判断する語彙登録判断手段と
前記名称登録判断手段により、登録してもよいと判断された場合に語彙記憶手段に登録する制御手段
を有する請求項1、2記載の画像形成装置。 Whether or not the vocabulary input means for inputting the vocabulary used in speech recognition and the vocabulary registered by the name input means may be additionally registered in the vocabulary storage means for the processing means including voice commands other than the operation keys. The image forming apparatus according to claim 1, further comprising: a vocabulary registration determining unit that determines and a control unit that registers in the vocabulary storage unit when it is determined that registration is possible by the name registration determining unit.
前記名称登録判断手段により、登録してもよいと判断された場合に語彙記憶手段に登録する制御手段
を有する請求項2、3記載の画像形成装置。 A vocabulary registration determination unit that determines whether or not the vocabulary registered by the name input unit may be additionally registered in the vocabulary storage unit; and a vocabulary when the name registration determination unit determines that the vocabulary may be registered The image forming apparatus according to claim 2, further comprising a control unit registered in the storage unit.
前記語彙登録手段より登録された語彙データをユーザごとに記憶する前記語彙記憶手段、
前記音声入力手段により入力された音声データに対し認証を行う声紋認証手段、
前記声紋認証手段により認証されたユーザの語彙データを語彙記憶手段より取得する語彙取得手段、
前記語彙取得手段により取得した語彙データをもとに前記音声入力手段より入力された音声データに対し音声認識を行う音声認識手段
を更に有することを特徴とする請求項2、3記載の画像形成装置。 Vocabulary registration means capable of vocabulary registration for each user,
The vocabulary storage means for storing the vocabulary data registered by the vocabulary registration means for each user;
Voiceprint authentication means for authenticating the voice data input by the voice input means;
Vocabulary acquisition means for acquiring vocabulary data of a user authenticated by the voiceprint authentication means from a vocabulary storage means;
4. The image forming apparatus according to claim 2, further comprising voice recognition means for performing voice recognition on the voice data input from the voice input means based on the vocabulary data acquired by the vocabulary acquisition means. .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005303220A JP2007114297A (en) | 2005-10-18 | 2005-10-18 | Image forming apparatus with speech recognition means |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005303220A JP2007114297A (en) | 2005-10-18 | 2005-10-18 | Image forming apparatus with speech recognition means |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007114297A true JP2007114297A (en) | 2007-05-10 |
Family
ID=38096582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005303220A Withdrawn JP2007114297A (en) | 2005-10-18 | 2005-10-18 | Image forming apparatus with speech recognition means |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007114297A (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015087901A (en) * | 2013-10-30 | 2015-05-07 | 京セラドキュメントソリューションズ株式会社 | Information processor, image formation system, and information processing method |
JP2016011995A (en) * | 2014-06-27 | 2016-01-21 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | Extension system of pronunciation dictionary, extension program, expansion method, learning method of acoustic model using extension pronunciation dictionary obtained by the same, learning program, and learning system |
JP2019090917A (en) * | 2017-11-14 | 2019-06-13 | 株式会社情報環境デザイン研究所 | Voice-to-text conversion device, method and computer program |
JP2019181699A (en) * | 2018-04-02 | 2019-10-24 | キヤノン株式会社 | Image processor, control method of image processor and program |
JP2020038348A (en) * | 2018-09-04 | 2020-03-12 | キヤノン株式会社 | Voice interactive device, its control method, and program |
EP3671350A1 (en) | 2018-12-17 | 2020-06-24 | Konica Minolta, Inc. | Image processing system, image forming apparatus, voice input inhibition determination method, and program |
US11159684B2 (en) | 2018-12-27 | 2021-10-26 | Canon Kabushiki Kaisha | Image forming system and image forming apparatus |
US11665293B2 (en) | 2019-11-20 | 2023-05-30 | Canon Kabushiki Kaisha | Image processing system, setting control method, image processing apparatus, and storage medium |
-
2005
- 2005-10-18 JP JP2005303220A patent/JP2007114297A/en not_active Withdrawn
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015087901A (en) * | 2013-10-30 | 2015-05-07 | 京セラドキュメントソリューションズ株式会社 | Information processor, image formation system, and information processing method |
JP2016011995A (en) * | 2014-06-27 | 2016-01-21 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | Extension system of pronunciation dictionary, extension program, expansion method, learning method of acoustic model using extension pronunciation dictionary obtained by the same, learning program, and learning system |
JP2019090917A (en) * | 2017-11-14 | 2019-06-13 | 株式会社情報環境デザイン研究所 | Voice-to-text conversion device, method and computer program |
JP2019181699A (en) * | 2018-04-02 | 2019-10-24 | キヤノン株式会社 | Image processor, control method of image processor and program |
JP7098385B2 (en) | 2018-04-02 | 2022-07-11 | キヤノン株式会社 | Image processing equipment, control methods and programs |
JP2020038348A (en) * | 2018-09-04 | 2020-03-12 | キヤノン株式会社 | Voice interactive device, its control method, and program |
JP7458716B2 (en) | 2018-09-04 | 2024-04-01 | キヤノン株式会社 | Speech dialogue device, control method thereof, and program |
EP3671350A1 (en) | 2018-12-17 | 2020-06-24 | Konica Minolta, Inc. | Image processing system, image forming apparatus, voice input inhibition determination method, and program |
US11159684B2 (en) | 2018-12-27 | 2021-10-26 | Canon Kabushiki Kaisha | Image forming system and image forming apparatus |
US11665293B2 (en) | 2019-11-20 | 2023-05-30 | Canon Kabushiki Kaisha | Image processing system, setting control method, image processing apparatus, and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8345321B2 (en) | Image input and output using scan-all-first input mode | |
US8723805B2 (en) | Information input device, information input method, and information input program | |
JP2007114297A (en) | Image forming apparatus with speech recognition means | |
US20020051666A1 (en) | Image forming apparatus having function of automatically selecting one of sheet feeders, method of controlling the image forming apparatus and storage medium | |
JP5322464B2 (en) | Image forming apparatus, control method therefor, storage medium, and program | |
EP0998118B1 (en) | Image storage apparatus | |
JP4510652B2 (en) | Image processing apparatus, information processing method, program, and storage medium | |
JP2011044779A (en) | Information processor, display control method, and program | |
JP2002189388A (en) | Image forming device, method for controlling the same and storage medium | |
US8656033B2 (en) | Information processing apparatus and data processing method | |
US6876824B2 (en) | Image forming apparatus and sheet setting control method | |
JP2007189525A (en) | Image processor | |
JP3437509B2 (en) | IMAGE FORMING APPARATUS, METHOD OF CONTROLLING IMAGE FORMING APPARATUS DIRECTABLE BY VOICE, AND STORAGE MEDIUM | |
US7061631B2 (en) | Data processing apparatus and method for maintaining security of image data, and computer program thereof stored in a computer readable medium | |
US7734458B1 (en) | Translating apparatus having different modes for translating and outputting document data | |
JP2007243313A (en) | Image forming apparatus, control method, image forming system, storage medium and program | |
JP2001175278A (en) | Controller having display means | |
JPH11146115A (en) | Image forming device | |
JP2001246802A (en) | Image input/output device, its controlling method, and storage medium | |
JP3234257B2 (en) | Image forming device | |
EP2107426A1 (en) | Image forming apparatus, method of controlling the image forming apparatus, and storage medium | |
JP7124551B2 (en) | Image processing device, image processing method and control program | |
JP2006185052A (en) | Information processor, image forming apparatus, method for controlling information processor, computer program, and computer readable storage medium | |
JP2007036837A (en) | Image generation apparatus and information processing apparatus | |
JP3604798B2 (en) | Image processing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20090106 |