JP2021081505A - 画像処理装置及び制御方法 - Google Patents

画像処理装置及び制御方法 Download PDF

Info

Publication number
JP2021081505A
JP2021081505A JP2019207111A JP2019207111A JP2021081505A JP 2021081505 A JP2021081505 A JP 2021081505A JP 2019207111 A JP2019207111 A JP 2019207111A JP 2019207111 A JP2019207111 A JP 2019207111A JP 2021081505 A JP2021081505 A JP 2021081505A
Authority
JP
Japan
Prior art keywords
dictionary
state
image processing
voice recognition
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019207111A
Other languages
English (en)
Inventor
憲三 山本
Kenzo Yamamoto
憲三 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2019207111A priority Critical patent/JP2021081505A/ja
Publication of JP2021081505A publication Critical patent/JP2021081505A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Control Or Security For Electrophotography (AREA)
  • Facsimiles In General (AREA)

Abstract

【課題】より短時間で音声認識を可能とすることができる画像形成装置を提供する。【解決手段】画像形成装置は、各状態に対応して発話内容を想定した語句を含む辞書を記憶している記憶回路110、操作者による音声の入力を受け付けるマイク、状態の遷移を検出する検出部122、検出部122により、状態の遷移が検出された場合、遷移後の状態に対応する辞書を選択する辞書選択部123、入力された音声に音声認識を施して文字列を生成し、選択された辞書から、生成した前記文字列に対応する語句を検索し、検索された語句を用いて、指示命令を生成する音声認識処理部124を備える。【選択図】図2

Description

本開示は、操作者の音声指示を受け付ける画像処理装置に関する。
近年、画像処理装置は、音声入力機能及び音声認識機能を備え、利用者の音声を認識することにより、音声による指示を受け付けるようになってきている。
特許文献1には、大規模な地震発生などの緊急時であっても適切な音声認識結果を得ることができる音声認識装置が開示されている。音声認識装置の言語モデル記憶部には、平常時の発話内容を想定した単語が登録された言語モデルが記憶されている。
第一に、音声認識装置の音声認識部は、緊急速報の受信前である平常時には、サーバー型音声認識を行う。すなわち、大規模な学習データを用いて学習した精密なモデルを保持した音声認識サーバーが携帯通信網内に設置されており、音声認識装置は、入力音声を音声認識サーバーへ送信し、音声認識サーバーによる認識結果を受信する。
第二に、通信状態に問題があるなど音声認識サーバーとの通信が確保できない場合には、クライアント型音声認識を行う。すなわち、音声認識部は、言語モデル記憶部に記憶された言語モデルを用いて入力音声に音声認識を施す。
特開2015−219253号公報
上記の通り、特許文献1により開示された技術によると、平常時において、サーバー型音声認識を行うと、高速の処理性能を有するサーバーにおいて、音声認識を行なうので、音声認識に要する時間は、短くてすむ。しかし、端末装置からサーバーに対して、音声データを送信するための時間を要し、また、サーバーから端末装置に対して、音声認識結果を送信するための時間を要する。また、平常時において、端末装置側でモデル記憶部に記憶された言語モデルを用いて音声認識を行なう場合、この言語モデルには、精密な音声認識を行うための大量の単語が登録されているので、音声認識において、入力された音声データに合致する単語を検索するため、時間を要する。
しかし、例えば、音声入力機能及び音声認識機能を備える画像処理装置において、利用者の音声操作により、誤った印刷設定をして、プリントジョブを実行した場合、その直後に、利用者が「キャンセル」と発話しても、上記のサーバー型音声認識を行なう場合においても、また、上記のクライアント型音声認識を行なう場合においても、音声認識結果を取得するまでに、時間を要するため、「キャンセル」に対する認識結果を受け取った時点では、既に、プリントが完了している場合がある。
実行中のプリントジョブをキャンセルする場合以外にも、上記のように、音声認識に時間を要するため、最初の音声操作が画像処理装置に認識されなかったと利用者が判断し、二度めの音声操作をする場合があり、このような場合に、画像処理装置において、二度の音声操作により、二回、ジョブが実行される場合がある。
本開示の態様は、画像処理装置の状態に対応する辞書を選択することにより、従来技術と比較してより短時間での音声認識を可能とする画像処理装置及び制御方法を提供することを目的とする。
上記目的を達成するため、本開示の一態様は、他の状態から遷移した一の状態において、操作者により入力された音声に音声認識を施して抽出した指示命令に基づいて、画像処理又は画像処理に付随する処理を行う画像処理装置であって、各状態に対応して発話内容を想定した語句を含む辞書を記憶している記憶手段と、状態の遷移を検出する検出手段と、状態の遷移が検出された場合、遷移後の状態に対応する辞書を選択する選択手段と、入力された音声に音声認識を施して文字列を生成し、選択された辞書から、生成した前記文字列に対応する語句を検索し、検索された語句を用いて、指示命令を生成する音声認識手段とを備えることを特徴とする。
ここで、前記検出手段により検出される遷移後の状態は、ジョブの実行状態であり、前記選択手段は、ジョブの実行状態に対応する辞書を選択してもよい。
ここで、前記検出手段により検出される遷移後の状態は、管理者により使用される管理者モードであり、前記選択手段は、管理者モードに対応する辞書を選択してもよい。
ここで、前記検出手段により検出される遷移後の状態は、サービスマンによりにより使用されるメンテナンスモードであり、前記選択手段は、メンテナンスモードに対応する辞書を選択してもよい。
ここで、前記記憶手段に記憶されている各辞書において、対応する状態に対応する語句が、他の状態に対応する語句より、優先して配置しており、前記音声認識手段は、選択された前記辞書において、優先して配置された語句から順に、検索してもよい。
また、本開示の一態様は、他の状態から遷移した一の状態において、操作者により入力された音声に音声認識を施して抽出した指示命令に基づいて、画像処理又は画像処理に付随する処理を行う画像処理装置において用いられる制御方法であって、前記画像処理装置は、各状態に対応して発話内容を想定した語句を含む辞書を記憶しており、前記制御方法は、状態の遷移を検出し、状態の遷移が検出された場合、遷移後の状態に対応する辞書を選択し、入力された音声に音声認識を施して文字列を生成し、選択された辞書から、生成した前記文字列に対応する語句を検索し、検索された語句を用いて、指示命令を生成することを特徴とする。
上記の態様によると、画像処理装置の状態に対応する辞書を選択することにより、従来技術と比較してより短時間での音声認識を可能としている。
実施の形態の画像形成装置10の概略構成を示す図である。 制御回路100の構成を示すブロック図である。 画像形成装置10におけるモードの遷移を示す遷移図である。 辞書の切り換えの一例(その1)を示す。 辞書の切り換えの一例(その2)を示す。 辞書の切り換えの一例(その3)を示す。 画像形成装置10における動作を示すフローチャートである。 辞書選択処理の動作を示すフローチャートである。 優先度に従って配置された語句を含む辞書の一例を示す。
1 実施の形態
本開示に係る一の実施の形態としての画像形成装置10について図面を参照しながら説明する。
1.1 画像形成装置10
画像形成装置10は、図1に示すように、スキャナー、プリンター及びコピー機の機能を有するタンデム型のカラー複合機(MFP:MultiFunction Peripheral)である。
画像形成装置10は、操作者から音声による入力を受け付け、受け付けた音声の指示に従って、動作する。ここで、操作者には、画像形成装置10によるプリント、スキャン等のサービスを受ける利用者、画像形成装置10を管理する管理者及び画像形成装置10の保守・点検等を行うサービスマンが含まれる。
また、画像形成装置10は、複数のモード(状態)を切り換えて動作する。つまり、一の状態から他の状態に遷移して、動作する。ここで、モードの例は、ジョブ実行中モード、ジョブの実行が終了した後、一定時間が経過するまでの時間経過待ちモード、利用者によりジョブの設定がされるジョブ設定モード、管理者により管理用の操作がされる管理者モード、サービスマンにより保守・点検等がされるサービスマンモード及び各モードから復帰等するニュートラルモード等である。
画像形成装置10は、この図に示すように、筐体底部に、記録シートを収容し、給送する給紙部13が設けられている。給紙部13の上方には、電子写真方式により画像を形成するプリンター12が設けられている。プリンター12のさらに上方に、原稿を読み取って画像データを生成するイメージリーダー11、及び、操作画面を表示し、操作者から入力操作を受け付ける操作パネル19が設けられている。
イメージリーダー11は、自動原稿搬送装置を有している。自動原稿搬送装置は、原稿トレイにセットされた原稿を、搬送路を介して、1枚ずつ原稿ガラス板へ搬送する。イメージリーダー11は、自動原稿搬送装置によって原稿ガラス板の所定位置に搬送された原稿、又は、操作者により原稿ガラス板の上に載置された画像をスキャナーの移動によって読み取り、レッド(R)、グリーン(G)、ブルー(B)の多値デジタル信号からなる画像データを得る。
イメージリーダー11で得られた各色成分の画像データは、制御回路100において各種のデータ処理を受け、更にイエロー(Y)、マゼンタ(M)、シアン(C)、ブラック(K)の各再現色の画像データに変換される。
プリンター12は、駆動ローラーと従動ローラーとバックアップローラーとにより張架される中間転写ベルト21、二次転写ローラー22、中間転写ベルト21に対向して中間転写ベルト21の走行方向Xに沿って所定間隔で配置された作像部20Y、20M、20C、20K、定着部50、制御回路100等からなる。
作像部20Y、20M、20C、20Kは、それぞれ、Y、M、C、K色のトナー像を作像する。具体的には、作像部20Kは、像担持体である感光体ドラム、感光体ドラム表面を露光走査するためのLEDアレイ、帯電チャージャー、現像器、クリーナー及び一次転写ローラーなどからなる。作像部20Y、20M、20Cも、作像部20Kと同じ構成を有している。
作像部20Kにおいて、感光体ドラムは、帯電チャージャーにより一様に帯電され、LEDアレイにより露光され、感光体ドラムの表面に静電潜像が形成される。静電潜像は、対応する色の現像器により現像され、感光体ドラムの表面にK色のトナー像が形成され、トナー像は、中間転写ベルト21の裏面側に配設された一次転写ローラーの静電作用により、中間転写ベルト21の表面上に転写される。
作像部20Y、20M、20Cについても、作像部20Kと同様であり、中間転写ベルト21の表面上にY〜C色のトナー像を転写する。
中間転写ベルト21上で、Y〜K色のトナー像が多重転写されるように、各色の作像タイミングがずらされている。
給紙部13は、サイズの異なる記録シートを収容する給紙カセット60、61、62と、この記録シートを各給紙カセットから搬送路に繰り出すためのピックアップローラー63、64、65とから構成されている。
給紙部13のいずれかの給紙カセットから、作像部20Y〜20Kによる作像動作に合わせて、記録シートが給送される。
記録シートは、二次転写ローラー22とバックアップローラーとが中間転写ベルト21を挟んで対向する二次転写位置へと搬送路上を搬送され、二次転写位置で、二次転写ローラー22の静電的作用により、中間転写ベルト21上で多重転写されたY〜K色のトナー像が記録シートへ二次転写される。Y〜K色のトナー像が二次転写された記録シートは、さらに定着部50まで搬送される。
記録シートの表面のトナー像は、定着部50の加熱ローラー51とこれに圧接された加圧ローラー52との間に形成される定着ニップを通過する際に、加熱及び加圧により、記録シートの表面に融着して定着され、記録シートは、定着部50を通過した後、排出トレイ15へ送出される。
操作パネル19には、液晶表示板などで構成される表示部が設けられ、操作者によって設定された内容や各種のメッセージを表示する。操作パネル19は、操作者からの、コピー開始の指示、コピー枚数の設定、複写条件の設定、データの出力先の設定、音声入力の開始などを受け付け、受け付けた内容を制御回路100に通知する。また、操作パネル19には、操作者の音声の入力を受け付けるマイク18が備えられている。
1.2 制御回路100
制御回路100は、図2に示すように、CPU101、ROM102、RAM103、画像メモリ104、画像処理回路105、ネットワーク通信回路106、スキャナー制御回路107、入出力回路108、プリンター制御回路109、記憶回路110、入力回路111等から構成されている。
CPU101、ROM102及びRAM103は、主制御部101aを構成している。
RAM103は、各種の制御変数及び操作パネル19により設定されたコピー枚数などを一時記憶すると共に、CPU101によるプログラム実行時のワークエリアを提供する。
ROM102には、コピー動作などの各種ジョブを実行させるための制御プログラムなどが格納されている。
CPU101は、ROM102に記憶されている制御プログラムに従って動作する。
CPU101が、制御プログラムに従って動作することにより、主制御部101aは、機能的に、統括制御部121、検出部122、辞書選択部123、音声認識処理部124及び実行部125を構成する。
統括制御部121は、画像メモリ104、画像処理回路105、ネットワーク通信回路106、スキャナー制御回路107、入出力回路108、プリンター制御回路109、記憶回路110、入力回路111等を統一的に制御する。
また、統括制御部121は、検出部122、辞書選択部123、音声認識処理部124及び実行部125を制御して、それぞれの動作を実行させる。検出部122、辞書選択部123、音声認識処理部124及び実行部125については、後述する。
さらに、統括制御部121は、操作パネル19から操作者の操作を受け付ける。操作者の操作には、音声により入力される操作指示も含まれる。操作者の操作が、例えば、プリント指示である場合、統括制御部121は、プリンター制御回路109に対して、画像形成処理を実行させる。操作者の操作がその他の指示である場合、統括制御部121は、その他の処理を実行させる。
画像メモリ104は、プリントジョブ等の画像データを一時的に記憶する。
画像処理回路105は、例えば、イメージリーダー11で得られたR、G、Bの各色成分の画像データに対して、各種のデータ処理を施して、Y、M、C、Kの各再現色の画像データに変換する。
ネットワーク通信回路106は、LANなどのネットワークを介してPC(パーソナルコンピューター)などの外部端末装置からのプリントジョブを受け付ける。
スキャナー制御回路107は、イメージリーダー11を制御し、原稿の画像の読み取り動作を実行させる。
プリンター制御回路109は、プリンター12を制御し、画像形成を実行させる。
記憶回路110については、以下に説明する。
入力回路111は、マイク18からアナログの音声信号を受け取り、受け取った音声信号をデジタル信号に変換し、増幅等を行って、音声データを生成し、生成した音声データを音声認識処理部124に対して、出力する。
(2)記憶回路110
記憶回路110(記憶手段)は、例えば、不揮発性の半導体メモリ等から構成されている。もちろん、記憶回路110は、ハードディスクから構成されている、としてもよい。
記憶回路110は、予め、全ワード辞書201、ジョブ設定用辞書202、ジョブ実行中用辞書203、ジョブ実行後用辞書204、管理者用辞書205及びサービスマン用辞書206を記憶している。
これらの辞書は、後述する音声認識処理において、音声データに音声認識を施して、入力された音声を表した文字列に対応する語句を検索するために、用いられる。
全ワード辞書201は、ニュートラルモードに対応している。全ワード辞書201は、ニュートラルモードの場合に、全ての操作者から音声により入力される発話内容を想定した語句を含んでいる。図4に示すように、全ワード辞書201は、「カラー」、「濃度」、「画面」、「2in1」、・・・、「キャンセル」、「ストップ」、「止めて」、・・・、「マシン調整」、「プロセス調整」等の語句を含む。
ジョブ設定用辞書202は、ジョブ設定モードに対応している。ジョブ設定用辞書202は、ジョブ設定モードの場合に、主として、利用者から音声により入力される発話内容を想定した語句を含んでいる。図4に示すように、ジョブ設定用辞書202は、ジョブ設定において用いられる「カラー」、「濃度」、「画面」、「2in1」、・・・等の語句を含む。
ジョブ実行中用辞書203は、ジョブ実行中モードに対応している。ジョブ実行中用辞書203は、ジョブ実行中モードの場合に、主として、利用者から音声により入力される発話内容を想定した語句を含んでいる。図4に示すように、ジョブ実行中用辞書203は、ジョブ実行中に用いられる「キャンセル」、「ストップ」、「止めて」、・・・等の語句を含む。
ジョブ実行後用辞書204は、ジョブ実行が終了した後の時間経過待ちモードに対応している。ジョブ実行後用辞書204は、時間経過待ちモードにおいて、主として、利用者から音声により入力される発話内容を想定した語句を含んでいる。図4に示すように、ジョブ実行後用辞書204は、時間経過待ちモードにおいて用いられる「ジョブ表示」、「履歴」、「通信リスト」、・・・等の語句を含む。
管理者用辞書205は、管理者モードに対応している。管理者用辞書205は、管理者モードの場合に、管理者から音声により入力される発話内容を想定した語句を含んでいる。図5に示すように、管理者用辞書205は、画像形成装置10に対する管理において用いられる「ネットワーク」、「TCP/IP設定」、「セキュリティ設定」、「ユーザー認証」、・・・等の語句を含む。
サービスマン用辞書206は、サービスマンモードに対応している。サービスマン用辞書206は、サービスマンモードの場合に、サービスマンから音声により入力される発話内容を想定した語句を含んでいる。図6に示すように、サービスマン用辞書206は、画像形成装置10に対する保守・点検等において用いられる「マシン調整」、「プロセス調整」、「ファームウェアバージョン」、「カウンター」、「ADF調整」、・・・等の語句を含む。
(3)検出部122
図3に、画像形成装置10におけるモードの遷移を示す。
この図に示すように、画像形成装置10においては、ニュートラルモード301、ジョブ設定モード302、ジョブ実行中モード303、時間経過待ちモード304、管理者モード305及びサービスマンモード306等の間を遷移する。
画像形成装置10は、電源ON(311)の後、一定時間が経過すると、ニュートラルモード301に遷移する。
画像形成装置10は、ニュートラルモード301において、ジョブ設定が開始され(312)、ジョブが開始され(314)、管理者モードが開始され(317)及びサービスマンモードが開始される(319)と、それぞれ、ジョブ設定モード302、ジョブ実行中モード303、管理者モード305及びサービスマンモード306に遷移する。
また、画像形成装置10は、ジョブ設定モード302、管理者モード305及びサービスマンモード306において、それぞれのモードが終了すると(313、318、320)、ニュートラルモード301に遷移する。
また、画像形成装置10は、ジョブ設定モード302において、ジョブが開始されると(321)、ジョブ実行中モード303に遷移する。
さらに、画像形成装置10は、ジョブ実行中モード303において、そのモードが終了すると(315)、時間経過待ちモード304に遷移する。また、画像形成装置10は、時間経過待ちモード304において、そのモードが終了(満了)すると(316)、ニュートラルモード301に遷移する。
検出部122(検出手段)は、画像形成装置10における上記のモードの切換えを検出する(遷移を検出する)。
具体的には、検出部122は、電源ON(311)の後の一定時間の経過、ジョブ設定の開始(312)、管理者モードの開始(317)及びサービスマンモードの開始(319)を検出する。また、検出部122は、ジョブ設定モード302、ジョブ実行中モード303、管理者モード305及びサービスマンモード306のそれぞれのモードの終了(313、315、318、320)を検出する。さらに、検出部122は、時間経過待ちモード304の満了(316)を検出する。
上記の検出により、検出部122は、モードの切換えを検出する。
(4)辞書選択部123
辞書選択部123(選択手段)は、検出部122により、モードの切換えが検出された場合、切り換え後のモードに対応する辞書を選択する。
具体的には、ニュートラルモード301、ジョブ設定モード302、ジョブ実行中モード303、時間経過待ちモード304、管理者モード305及びサービスマンモード306への切換えが検出された場合、辞書選択部123は、それぞれ、全ワード辞書201、ジョブ設定用辞書202、ジョブ実行中用辞書203、ジョブ実行後用辞書204、管理者用辞書205及びサービスマン用辞書206を選択する。
(5)音声認識処理部124
音声認識処理部124(音声認識手段)は、統括制御部121の制御により、以下に示すようにして、受信した音声データに音声認識処理を施して、MFPコマンドを生成する。
音声認識処理部124は、マイク18から、入力回路111を介して、受信した音声データに対して、母音、子音、撥音の音素のパターンに一致する区間を特定し、音素を表す識別子の並び(文字列)を生成する。次に、音声認識処理部124は、辞書選択部123により選択された辞書から、生成した文字列に対応する語句を検索する。次に、音声認識処理部124は、意味解析を行って、品詞を特定し、係り受けの判定を行う。次に、音声認識処理部124は、処理の操作対象と動作等を特定する。こうして、音声認識処理部124は、特定した処理の操作対象と動作等から、MFPコマンド(指示命令)を生成する。
例えば、利用者の音声入力が、「カラーで、3部コピーして」である場合、MFPコマンドは、次のようになる。
MFPコマンド=コピージョブ(色=カラー、部数=3)
次に、音声認識処理部124は、MFPコマンドを、実行部125に対して出力する。
なお、生成されるMFPコマンドは、コピージョブには限定されない。MFPコマンドは、スキャンジョブ、プリントジョブ等も含む。
また、生成されるMFPコマンドは、設定パラメーター(例えば、色=カラー、部数=3)を伴う、ジョブ(例えば、コピージョブ)には、限定されない。
MFPコマンドは、各モードにおいて発話される設定パラメーターのみを含むとしてもよい。例えば、MFPコマンドは、ジョブに伴う設定パラメーター(例えば、色=カラー)のみを含むとしてもよい。また、MFPコマンドは、管理者モードにおいて発話されるされる設定パラメーター(例えば、「ネットワーク」、「セキュリティ設定」等)のみを含むとしてもよい。さらに、MFPコマンドは、サービスマンモードにおいて発話されるされる設定パラメーター(例えば、「マシン調整」、「プロセス調整」等)のみを含むとしてもよい。
(6)実行部125
実行部125は、音声認識処理部124から、MFPコマンドを、受信する。実行部125は、受信したMFPコマンドに従って、処理を実行する。
受信したMFPコマンドが例えば、「プリント実行」である場合、実行部125は、プリントジョブを実行する。受信したMFPコマンドが例えば、「濃度の設定」である場合、実行部125は、濃度の設定を行う。受信したMFPコマンドが例えば、「キャンセル」である場合、実行部125は、実行中のプリントジョブを停止する。
このように、実行部125は、MFPコマンド(指示命令)に従って、画像処理又は画像処理に付随する処理を行う。
1.3 画像形成装置10における辞書の切り換え例
画像形成装置10における辞書の切り換え例について説明する。
(1)辞書の切り換え例(その1)
辞書の切り換えの一例を図4に示す。
検出部122が、電源ONの後の一定時間の経過を検出すると(251)、辞書選択部123は、全ワード辞書201を選択する。音声認識処理部124は、全ワード辞書201を用いる。
次に、検出部122が、ジョブ設定開始を検出すると(252)、辞書選択部123は、ジョブ設定用辞書202を選択する。音声認識処理部124は、ジョブ設定用辞書202を用いる。
次に、検出部122が、ジョブ開始を検出すると(253)、辞書選択部123は、ジョブ実行中用辞書203を選択する。音声認識処理部124は、ジョブ実行中用辞書203を用いる。
次に、検出部122が、ジョブ終了を検出すると(254)、辞書選択部123は、ジョブ実行後用辞書204を選択する。音声認識処理部124は、ジョブ実行後用辞書204を用いる。
次に、検出部122が、オートリセットを検出すると(つまり、時間経過待ちモードの満了を検出すると)(255)、辞書選択部123は、全ワード辞書201を選択する。音声認識処理部124は、全ワード辞書201を用いる。
(2)辞書の切り換え例(その2)
辞書の切り換えの一例を図5に示す。
検出部122が、電源ONの後の一定時間の経過を検出すると(261)、辞書選択部123は、全ワード辞書201を選択する。音声認識処理部124は、全ワード辞書201を用いる。
次に、検出部122が、管理者モードの開始を検出すると(262)、辞書選択部123は、管理者用辞書205を選択する。音声認識処理部124は、管理者用辞書205を用いる。
次に、検出部122が、管理者モードの終了を検出すると(263)、辞書選択部123は、全ワード辞書201を選択する。音声認識処理部124は、全ワード辞書201を用いる。
(3)辞書の切り換え例(その3)
辞書の切り換えの一例を図6に示す。
検出部122が、電源ONの後の一定時間の経過を検出すると(271)、辞書選択部123は、全ワード辞書201を選択する。音声認識処理部124は、全ワード辞書201を用いる。
次に、検出部122が、サービスマンモードの開始を検出すると(272)、辞書選択部123は、サービスマン用辞書206を選択する。音声認識処理部124は、サービスマン用辞書206を用いる。
次に、検出部122が、サービスマンモードの終了を検出すると(273)、辞書選択部123は、全ワード辞書201を選択する。音声認識処理部124は、全ワード辞書201を用いる。
1.4 画像形成装置10における動作
(1)画像形成装置10における動作
画像形成装置10における動作について、図7に示すフローチャートを用いて説明する。
操作パネル19は、操作者から入力を受け付け、受け付けた入力が音声入力の開始である場合(ステップS101で「音声入力」)、辞書選択処理が実施される(ステップS102)。次に、マイク18は、音声の入力を受け付ける(ステップS103)。次に、音声認識処理部124は、入力された音声データに対して、音声認識を施す(ステップS104)。実行部125は、認識結果に応じて、処理を実行する(ステップS105)。
操作パネル19から、音声入力の終了を受信した場合(ステップS106で「YES」)、ステップS101に戻って、処理を繰り返す。
操作パネル19から、音声入力の終了を受信しない場合(ステップS106で「NO」)、ステップS102に戻って、処理を繰り返す。
操作パネル19から受け付けた入力が音声入力の開始以外である場合(ステップS101で「他」)、他の処理が実施される。
(2)辞書選択処理における動作
辞書選択処理における動作について、図8に示すフローチャートを用いて説明する。なお、ここで説明する動作は、図7に示すフローチャートのステップS102における詳細である。
検出部122は、画像形成装置10におけるモードの変化を検出する(ステップS121)。
検出部122がジョブ設定開始を検出すると(ステップS121で「ジョブ設定開始」)、辞書選択部123は、ジョブ設定用辞書202を選択する(ステップS122)。
検出部122がジョブ開始を検出すると(ステップS121で「ジョブ開始」)、辞書選択部123は、ジョブ実行中用辞書203を選択する(ステップS123)。
検出部122がジョブ終了を検出すると(ステップS121で「ジョブ終了」)、辞書選択部123は、ジョブ実行後用辞書204を選択する(ステップS124)。
検出部122がオートリセットを検出すると(つまり、時間経過待ちモードの満了を検出すると)(ステップS121で「満了」)、辞書選択部123は、全ワード辞書201を選択する(ステップS125)。
検出部122が電源ONの後の一定時間の経過を検出すると(ステップS121で「電源ON」)、辞書選択部123は、全ワード辞書201を選択する(ステップS126)。
検出部122が管理者モードの開始を検出すると(ステップS121で「管理者モード開始)、辞書選択部123は、管理者用辞書205を選択する(ステップS127)。
検出部122が管理者モードの終了を検出すると(ステップS121で「管理者モード終了)、辞書選択部123は、全ワード辞書201を選択する(ステップS128)。
検出部122がサービスマンモードの開始を検出すると(ステップS121で「サービスマンモード開始)、辞書選択部123は、サービスマン用辞書206を選択する(ステップS129)。
検出部122がサービスマンモードの終了を検出すると(ステップS121で「サービスマンモード終了)、辞書選択部123は、全ワード辞書201を選択する(ステップS130)。
検出部122がモードの変化を検出しない場合(ステップS121で「変化なし)、辞書選択部123による辞書の選択は行われない。その時点における辞書の選択が維持される。
1.5 まとめ
上記の実施の形態によると、画像形成装置10は、各モードに対応して発話内容を想定した語句を含む辞書を記憶している。検出部122は、モードの変化を検出し、辞書選択部123は、モードの切換えが検出された場合、切り換え後のモードに対応する辞書を選択する。音声認識処理部124は、モードに応じて選択された辞書を用いて、音声データに音声認識を施す。
このように、画像形成装置10のモードに対応する辞書を選択することにより、音声認識処理において、従来技術と比較してより短時間での音声認識を可能としている。
2 その他の変形例
本開示について、上記の実施の形態に基づいて説明しているが、実施の形態に限定されない。実施の形態の変形例について、以下に説明する。
(1)上記の実施の形態において、画像形成装置10の取り得るモードに対応する辞書は、そのモードにおいて、発話が予想される語句のみを含んでいる。しかし、これには限定されない。
記憶回路110に記憶されている各辞書において、対応する状態に対応する語句が、他の状態に対応する語句より、優先して配置している、としてもよい。
(a)例えば、記憶回路110は、図4に示すジョブ実行中用辞書203に代えて、図9に示すジョブ実行中用辞書211を記憶してもよい。
ジョブ実行中用辞書211は、ジョブ実行中用の部分211aと、ジョブ設定用の部分211bと、ジョブ実行後用の部分211cとから構成されている。部分211a、部分211b及び部分211cは、それぞれ、ジョブ実行中用辞書203、ジョブ設定用辞書202、ジョブ実行後用辞書204と同じ内容の語句を含んでいる。
部分211aは、部分211b及び部分211cより、優先度が高くなるように、ジョブ実行中用辞書211内において、配置されている。また、部分211bは、部分211cより、優先度が高くなるように、ジョブ実行中用辞書211内において、配置されている。
例えば、部分211aは、ジョブ実行中用辞書211の先頭位置に配置されている。また、部分211bは、部分211aに続く位置に配置されている。さらに、部分211cは、部分211bに続く位置に配置されている。音声認識処理部124は、ジョブ実行中用辞書211において語句を検索する場合に、ジョブ実行中用辞書211の先頭位置から末尾に向けて、語句の検索を行う。従って、ジョブ実行中用辞書211の先頭位置(つまり、部分211a)に配置されている語句が最初に検索される。
こうして、ジョブ実行中用辞書211のうち、部分211aが最初に検索されるので、ジョブ実行中の状態において、ジョブ実行中用辞書211を選択することにより、ジョブ実行中の状態において、発話されると予想される語句を短時間で検索することができる。
また、ジョブ実行中用辞書211は、部分211b、部分211cをも含んでいるので、ジョブ実行中に、ジョブ設定のための発話がされた場合であっても、その音声を認識することができるし、ジョブ実行中に、ジョブ実行後のための発話がされた場合であっても、その音声を認識することができる。
このように、ジョブ実行中用辞書211においては、実行中のジョブを停止させるための語句に、最も高い優先度を設定している。これにより、実行中のジョブを停止させるための語句の音声認識に要する時間を短縮している。また、ジョブ実行中用辞書211には、ジョブ設定用の語句及びジョブ実行後用の語句も含まれている。このため、ジョブ実行中に、ジョブ設定用の語句又はジョブ実行後用の語句が発話された場合であっても、音声認識を可能としている。
なお、部分211cは、部分211bより、優先度が高くなるように、ジョブ実行中用辞書211内において、配置されている、としてもよい。
(b)ジョブ設定モードにおいても、又は、時間経過待ちモードにおいても、ジョブ実行中用辞書211と同様に、優先度が設定された辞書を選択してよい。
例えば、ジョブ設定モードにおいては、図4に示すジョブ設定用辞書202に代えて、次に示すジョブ設定用辞書を選択してもよい。
このジョブ設定用辞書においては、図9に示す部分211bが、部分211a及び部分211cより、優先度が高くなるように、配置されている。また、部分211cが、部分211aより、優先度が高くなるように、配置されている。
また、例えば、時間経過待ちモードにおいては、図4に示すジョブ実行後用辞書204に代えて、次に示すジョブ実行後用辞書を選択してもよい。
このジョブ実行後用辞書においては、図9に示す部分211cが、部分211a及び部分211bより、優先度が高くなるように、配置されている。また、部分211bが、部分211aより、優先度が高くなるように、配置されている。
(c)管理者モードにおいても、ジョブ実行中用辞書211と同様に、優先度が設定された辞書を選択してよい。
例えば、管理者モードにおいては、図5に示す管理者用辞書205に代えて、次に示す管理者用辞書を選択してもよい。
この管理者用辞書においては、図9に示す部分211aが、優先度が最も高くなるように、配置されている。また、管理者用辞書205と同じ内容の語句が、部分211aに続いて、優先度が高くなるように、配置されている。
このように、この管理者用辞書には、ジョブの実行の停止に係る語句を含む部分211aが、最も優先度を高く設定して、含まれている。このため、管理者が緊急にジョブを停止したい場合であっても、音声データが効果的に音声認識される。
(d)サービスマンモードにおいても、ジョブ実行中用辞書211と同様に、優先度が設定された辞書を選択してよい。
例えば、サービスマンモードにおいては、図6に示すサービスマン用辞書206に代えて、次に示すサービスマン用辞書を選択してもよい。
このサービスマン辞書においては、サービスマン用辞書206と同じ内容の語句が、最も優先度が高くなるように、配置されている。続いて、図5に示す管理者用辞書205と同じ内容の語句が、次の優先度となるように、配置されている。
このように、このサービスマン用辞書には、図6に示すサービスマン用辞書206の内容と同じ語句、及び、図5に示す管理者用辞書205と同じ内容の語句が含まれている。サービスマンが発話する内容と、管理者が発話する内容との間には、重複が多いと考えられるので、サービスマンが、管理者用辞書205に含まれる語句と同じ内容の発話をした場合であっても、音声データが効果的に音声認識される。
(2)上記の実施の形態において、画像形成装置10は、中間転写ベルト21を備えているが、これには限定されない。
画像形成装置は、中間転写ベルトを備えず、感光体ドラムから記録シートに対して、直接、トナー像を転写する直接転写方式を採用している、としてもよい。
(3)上述したように、画像形成装置は、マイクロプロセッサーとメモリとを備えたコンピューターシステムである。メモリは、コンピュータープログラムを記憶しており、マイクロプロセッサーは、コンピュータープログラムに従って動作するとしてもよい。
マイクロプロセッサーは、フェッチ部、解読部、実行部、レジスタファイル、命令カウンターなどから構成されている。フェッチ部は、メモリに記憶されているコンピュータープログラムから、コンピュータープログラムに含まれる各命令コードを1個ずつ読み出す。解読部は、読み出した命令コードを解読する。実行部は、解読結果に従って動作する。このように、マイクロプロセッサーは、メモリに記憶されているコンピュータープログラムに従って動作する。
ここで、コンピュータープログラムは、所定の機能を達成するために、コンピューターに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
また、コンピュータープログラムは、コンピューター読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、光ディスク、半導体メモリなどに記録されているとしてもよい。
また、コンピュータープログラムを、有線又は無線の電気通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送してもよい。
(4)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。
本開示の態様にかかる画像処理装置は、その状態に対応する辞書を選択することにより、従来技術と比較してより短時間での音声認識を可能とする、という優れた効果を奏する。このため、操作者の音声指示を受け付ける装置として有用である。
10 画像形成装置
11 イメージリーダー
12 プリンター
13 給紙部
18 マイク
19 操作パネル
100 制御回路
101 CPU
101a 主制御部
102 ROM
103 RAM
104 画像メモリ
105 画像処理回路
106 ネットワーク通信回路
107 スキャナー制御回路
108 入出力回路
109 プリンター制御回路
110 記憶回路
111 入力回路
121 統括制御部
122 検出部
123 辞書選択部
124 音声認識処理部
125 実行部

Claims (6)

  1. 他の状態から遷移した一の状態において、操作者により入力された音声に音声認識を施して抽出した指示命令に基づいて、画像処理又は画像処理に付随する処理を行う画像処理装置であって、
    各状態に対応して発話内容を想定した語句を含む辞書を記憶している記憶手段と、
    状態の遷移を検出する検出手段と、
    状態の遷移が検出された場合、遷移後の状態に対応する辞書を選択する選択手段と、
    入力された音声に音声認識を施して文字列を生成し、選択された辞書から、生成した前記文字列に対応する語句を検索し、検索された語句を用いて、指示命令を生成する音声認識手段と
    を備えることを特徴とする画像処理装置。
  2. 前記検出手段により検出される遷移後の状態は、ジョブの実行状態であり、
    前記選択手段は、ジョブの実行状態に対応する辞書を選択する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記検出手段により検出される遷移後の状態は、管理者により使用される管理者モードであり、
    前記選択手段は、管理者モードに対応する辞書を選択する
    ことを特徴とする請求項1に記載の画像処理装置。
  4. 前記検出手段により検出される遷移後の状態は、サービスマンによりにより使用されるメンテナンスモードであり、
    前記選択手段は、メンテナンスモードに対応する辞書を選択する
    ことを特徴とする請求項1に記載の画像処理装置。
  5. 前記記憶手段に記憶されている各辞書において、対応する状態に対応する語句が、他の状態に対応する語句より、優先して配置しており、
    前記音声認識手段は、選択された前記辞書において、優先して配置された語句から順に、検索する
    ことを特徴とする請求項1に記載の画像処理装置。
  6. 他の状態から遷移した一の状態において、操作者により入力された音声に音声認識を施して抽出した指示命令に基づいて、画像処理又は画像処理に付随する処理を行う画像処理装置において用いられる制御方法であって、
    前記画像処理装置は、各状態に対応して発話内容を想定した語句を含む辞書を記憶しており、
    前記制御方法は、
    状態の遷移を検出し、
    状態の遷移が検出された場合、遷移後の状態に対応する辞書を選択し、
    入力された音声に音声認識を施して文字列を生成し、選択された辞書から、生成した前記文字列に対応する語句を検索し、検索された語句を用いて、指示命令を生成する
    ことを特徴とする制御方法。
JP2019207111A 2019-11-15 2019-11-15 画像処理装置及び制御方法 Pending JP2021081505A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019207111A JP2021081505A (ja) 2019-11-15 2019-11-15 画像処理装置及び制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019207111A JP2021081505A (ja) 2019-11-15 2019-11-15 画像処理装置及び制御方法

Publications (1)

Publication Number Publication Date
JP2021081505A true JP2021081505A (ja) 2021-05-27

Family

ID=75964962

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019207111A Pending JP2021081505A (ja) 2019-11-15 2019-11-15 画像処理装置及び制御方法

Country Status (1)

Country Link
JP (1) JP2021081505A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003195885A (ja) * 2001-12-25 2003-07-09 Canon Inc 通信装置およびその制御方法
JP2009194577A (ja) * 2008-02-13 2009-08-27 Konica Minolta Business Technologies Inc 画像形成装置、音声案内方法及び音声案内プログラム
JP2019031017A (ja) * 2017-08-08 2019-02-28 キヤノン株式会社 画像形成装置、制御方法及びプログラム
JP2019144759A (ja) * 2018-02-19 2019-08-29 コニカミノルタ株式会社 画像処理装置、画像処理装置の制御方法、およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003195885A (ja) * 2001-12-25 2003-07-09 Canon Inc 通信装置およびその制御方法
JP2009194577A (ja) * 2008-02-13 2009-08-27 Konica Minolta Business Technologies Inc 画像形成装置、音声案内方法及び音声案内プログラム
JP2019031017A (ja) * 2017-08-08 2019-02-28 キヤノン株式会社 画像形成装置、制御方法及びプログラム
JP2019144759A (ja) * 2018-02-19 2019-08-29 コニカミノルタ株式会社 画像処理装置、画像処理装置の制御方法、およびプログラム

Similar Documents

Publication Publication Date Title
US8805256B2 (en) Printing apparatus capable of preventing sheet feed error in cleaning, method of controlling the printing apparatus, and storage medium
JP4102794B2 (ja) 画像形成装置、画像処理装置、画像形成方法、およびその方法をコンピュータに実行させるプログラム
JP4433026B2 (ja) 用紙分別装置
JP2008102204A (ja) 画像形成装置
JP5764187B2 (ja) 画像形成装置
JP2021081505A (ja) 画像処理装置及び制御方法
KR101317784B1 (ko) 화상형성장치 및 그 방법
US8724190B2 (en) Image forming apparatus, image forming method, and computer-readable recording medium
JP2012218292A (ja) 画像形成装置
US9128445B2 (en) Printing apparatus, method for controlling printing apparatus, and storage medium
JP5264229B2 (ja) 画像形成装置、画像形成装置の制御方法、制御プログラム、及び記憶媒体
JP2006011132A (ja) 画像形成装置
JP2020065199A (ja) ジョブ管理装置、複合機及びジョブ管理方法
US20070003295A1 (en) Image-processing device, image forming device, electronic equipment, and image forming method
JP7115259B2 (ja) 画像形成装置及びプログラム
JP2021091182A (ja) 画像処理装置及び制御方法
JP2006251507A (ja) 画像形成装置
JP2006081010A (ja) 画像形成システム
JP2002091247A (ja) 画像形成装置
JP2006031448A (ja) 自動翻訳装置および自動翻訳システム
JPH11215277A (ja) 画像形成装置
JP2021012630A (ja) 画像形成装置、及び、画像形成システム
JP2020154118A (ja) 画像形成装置、画像形成装置の制御方法、及びプログラム
JP2023007756A (ja) 画像形成装置及び画像形成装置の制御方法
JP3853824B2 (ja) デジタル複写機

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230905

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240305