JP7119967B2 - 音声認識装置、画像形成装置、音声認識方法よび音声認識プログラム - Google Patents

音声認識装置、画像形成装置、音声認識方法よび音声認識プログラム Download PDF

Info

Publication number
JP7119967B2
JP7119967B2 JP2018231002A JP2018231002A JP7119967B2 JP 7119967 B2 JP7119967 B2 JP 7119967B2 JP 2018231002 A JP2018231002 A JP 2018231002A JP 2018231002 A JP2018231002 A JP 2018231002A JP 7119967 B2 JP7119967 B2 JP 7119967B2
Authority
JP
Japan
Prior art keywords
sequence
time
sound
job
hardware resources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018231002A
Other languages
English (en)
Other versions
JP2020095091A (ja
Inventor
一朗 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2018231002A priority Critical patent/JP7119967B2/ja
Publication of JP2020095091A publication Critical patent/JP2020095091A/ja
Application granted granted Critical
Publication of JP7119967B2 publication Critical patent/JP7119967B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Control Or Security For Electrophotography (AREA)

Description

この発明は、音声認識装置、画像形成装置、音声認識方法よび音声認識プログラム、特に、ノイズをキャンセルする機能を備えた音声認識装置、その音声認識装置を備えた画像形成装置、その音声認識装置で実行される音声認識方法、および、その音声認識装置を制御するコンピューターにその音声認識方法を実行させる音声認識プログラムに関する。
近年、音声認識機能を備えたMFP(Multi Function Peripheral)等の画像形成装置が知られている。一方、MFPは、用紙等の記録媒体に画像を形成するための機械的な部材を多く備えているため、音が発生する。このため、MFPがジョブを実行している最中に、マイクロフォンで集音した音に、MFPがジョブを実行することにより発生する音が含まれる場合があり、音声認識の精度が低下するといった問題がある。
特開2004-77601号公報には、操作者の発声に基づく音声入力により操作指令を可能とするとともに、装置が動作シーケンスに伴って稼働する際に発生する動作音を予め動作音データとしてデータ化しておき、前記入力音声を認識して操作指令を判別する際に、動作シーケンスに対応する前記動作音データを参照して前記音声入力において取得された音データから音声データを抽出し、該音声データに基づいて入力音声を認識することを特徴とする音声入力機能を有する稼働装置が記載されている。
しかしながら、動作ノイズ音は、MFPが有する可動部材の経時変化や画像が形成される用紙の紙種の違い等により変動する。このため、MFPが同一のジョブを異なる時点で実行する場合、MFPが動作する音が異なる場合がある。このため、MFPで発生する音の経時的な変化に対応していないため、音声認識精度の向上に限界がある。
特開2004-77601号公報
この発明は上述した問題点を解決するためになされたもので、この発明の目的の一つは、音声認識の精度を高めた音声認識装置を提供することである。
この発明の他の目的は、音声認識の精度を高めた音声認識方法を提供することである。
この発明のさらに他の目的は、音声認識の精度を高めた音声認識プログラムを提供することである。
上述した目的を達成するために、この発明のある局面によれば、音声認識装置は、音を収集する音収集手段と、それぞれが可動部を有する複数のハードウェア資源を制御してジョブを実行する画像形成装置に投入されたジョブに基づいて、複数のハードウェア資源それぞれの経時的な動作の状態を示す動作シーケンスを決定する動作シーケンス決定手段と、動作シーケンス決定手段により決定される動作シーケンスが所定期間に動作する1以上のハードウェア資源が同一の複数の部分シーケンスを含む場合、複数の部分シーケンスのうち基本シーケンスの間に音収集手段により収集される音に基づいて、複数の部分シーケンスのうち基本シーケンスよりも後の参照シーケンスの間に音収集手段により収集される音を補正する補正手段と、補正手段により補正された音に基づいて音声を認識する音声認識手段と、を備える。
この局面に従えば、画像形成装置に投入されたジョブに基づいて、動作シーケンスが決定され、動作シーケンスが所定期間に動作する1以上のハードウェア資源が同一の複数の部分シーケンスを含む場合、基本シーケンスの間に収集される音に基づいて、複数の部分シーケンスのうち基本シーケンスよりも後の参照シーケンスの間に収集される音が補正され、補正された音に基づいて音声が認識される。このため、画像形成装置で発生する音が経時的に変化する場合であっても画像形成装置で発生する音を集音された音から除去することができる。その結果、音声を認識する精度を高めた音声認識装置を提供することができる。
好ましくは、動作シーケンス決定手段は、画像形成装置が第1ジョブと第1ジョブとは別の第2ジョブとを並列して実行する場合、第1ジョブにより定められる処理に基づいて決定される第1動作シーケンスと第2ジョブにより定められる処理に基づいて決定される第2動作シーケンスとを合成した合成シーケンスを、動作シーケンスとして決定する。
この局面に従えば、第1ジョブにより定められる処理に基づいて決定される第1動作シーケンスと第2ジョブにより定められる処理に基づいて決定される第2動作シーケンスとを合成した合成シーケンスが動作シーケンスとして決定される。このため、合成シーケンスから基本シーケンスと参照シーケンスとを決定することができる。
好ましくは、動作シーケンス決定手段は、動作シーケンスを決定した時点における画像形成装置が動作させる1以上のハードウェア資源がジョブを実行中に変更される場合、変更された後の1以上のハードウェア資源を動作させるための動作シーケンスを新たに決定する。
この局面に従えば、動作するハードウェア資源が変更される場合に、変更後の1以上のハードウェア資源を動作させるための動作シーケンスが新たに決定されるので、動作するハードウェア資源の変更する場合であっても音声認識の精度を向上させることができる。
好ましくは、複数のハードウェア資源は、記録媒体に画像を形成する画像形成手段と、それぞれが複数種類の記録媒体を収容し、かつ、画像形成手段に記録媒体を供給する複数の供給手段と、を含む。
この局面に従えば、画像形成手段に記録媒体を供給している供給手段が、別の供給手段に変更される場合であっても音声認識精度を向上させることができる。
好ましくは、複数のハードウェア資源のうち単位動作を繰り返す基本ハードウェア資源が単位動作を実行する単位期間で動作シーケンスを分割した複数の分割シーケンスを決定する分割手段を、さらに備え、補正手段は、複数の分割シーケンスが単位期間で動作する1以上のハードウェア資源が同一の複数の分割部分シーケンスを含む場合、複数の分割部分シーケンスを部分シーケンスに決定する。
この局面に従えば、基本ハードウェア資源が単位動作を実行する単位期間で動作シーケンスを分割した複数の分割シーケンスが決定され、単位期間で動作する1以上のハードウェア資源が同一の複数の分割部分シーケンスが部分シーケンスに決定される。このため、部分シーケンスを容易に決定することができる。
好ましくは、補正手段は、複数の分割部分シーケンスが複数の第1分割部分シーケンスと、複数の第1分割部分シーケンスとは単位期間に動作する1以上のハードウェア資源が異なる複数の第2分割部分シーケンスとを含む場合、複数の第1分割部分シーケンスのうち第1基本シーケンスの間に音収集手段により収集される音に基づいて、複数の第1分割部分シーケンスのうち第1基本シーケンスよりも後の第1参照シーケンスの間に音収集手段により収集される音を補正し、複数の第2分割部分シーケンスのうち第2基本シーケンスの間に音収集手段により収集される音に基づいて、複数の第2分割部分シーケンスのうち第2基本シーケンスよりも後の第2参照シーケンスの間に音収集手段により収集される音を補正する。
この局面に従えば、複数の第1分割部分シーケンスのうち第1基本シーケンスの間に収集される音に基づいて、複数の第1分割部分シーケンスのうち第1基本シーケンスよりも後の第1参照シーケンスの間に収集される音が補正され、複数の第2分割部分シーケンスのうち第2基本シーケンスの間に収集される音に基づいて、複数の第2分割部分シーケンスのうち第2基本シーケンスよりも後の第2参照シーケンスの間に収集される音が補正される。このため、動作シーケンスが複数の第1分割部分シーケンスと複数の第2分割部分シーケンスとを含み、第1分割部分シーケンスと第2分割部分シーケンスとで動作するハードウェア資源が異なる場合であっても、音を補正することができる。
好ましくは、複数のハードウェア資源は、記録媒体に画像を形成する画像形成手段と、画像が形成された複数の記録媒体をまとめて処理する後処理手段と、を含む。
この局面に従えば、画像形成手段が動作する複数の第1分割部分シーケンスと、画像形成手段と後処理手段とが動作する複数の第2分割部分シーケンスそれぞれで、音を補正することができる。
好ましくは、後処理手段は、画像が形成された複数の記録媒体を物理的に加工する加工手段と、複数の記録媒体をまとめて排出する位置を変更するシフト手段と、を含む。
好ましくは、基本ハードウェア資源は、記録媒体に画像を形成する画像形成手段である。
この局面に従えば、分割シーケンスを容易に決定することができる。
この発明の他の局面によれば、画像形成装置は、上記の音声認識装置を備える。
この局面に従えば、音声を認識する精度を高めた画像形成装置を提供することができる。
この発明のさらに他の局面によれば、音声認識方法は、音収集手段により収集された音を取得する音取得ステップと、それぞれが可動部を有する複数のハードウェア資源を制御してジョブを実行する画像形成装置に投入されたジョブに基づいて、複数のハードウェア資源それぞれの経時的な動作の状態を示す動作シーケンスを決定する動作シーケンス決定ステップと、動作シーケンス決定ステップにおいて決定される動作シーケンスが所定期間に動作する1以上のハードウェア資源が同一の複数の部分シーケンスを含む場合、複数の部分シーケンスのうち基本シーケンスの間に音取得ステップにおいて取得される音に基づいて、複数の部分シーケンスのうち基本シーケンスよりも後の参照シーケンスの間に音取得ステップにおいて取得される音を補正する補正ステップと、補正ステップにおいて補正された音に基づいて音声を認識する音声認識ステップと、を音声認識装置に実行させる。
この局面に従えば、音声を認識する精度を高めた音声認識方法を提供することができる。
この発明のさらに他の局面によれば、音声認識プログラムは、音収集手段により収集された音を取得する音取得ステップと、それぞれが可動部を有する複数のハードウェア資源を制御してジョブを実行する画像形成装置に投入されたジョブに基づいて、複数のハードウェア資源それぞれの経時的な動作の状態を示す動作シーケンスを決定する動作シーケンス決定ステップと、動作シーケンス決定ステップにおいて決定される動作シーケンスが所定期間に動作する1以上のハードウェア資源が同一の複数の部分シーケンスを含む場合、複数の部分シーケンスのうち基本シーケンスの間に音取得ステップにおいて取得される音に基づいて、複数の部分シーケンスのうち基本シーケンスよりも後の参照シーケンスの間に音取得ステップにおいて取得される音を補正する補正ステップと、補正ステップにおいて補正された音に基づいて音声を認識する音声認識ステップと、をコンピューターに実行させる。
この局面に従えば、音声を認識する精度を高めた音声認識プログラムを提供することができる。
本発明の実施の形態の1つにおけるMFPの外観を示す斜視図である。 MFPのハードウェア構成の概要を示すブロック図である。 MFPが備えるCPUが有する機能の一例を示すブロック図である。 キーワードテーブルの一例を示す図である。 シーケンス決定処理の流れの一例を示すフローチャートである。 ジョブ制御処理の流れの一例を示すフローチャートである。 ジョブ生成処理の流れの一例を示すフローチャートである。 音声補正処理の流れの一例を示すフローチャートである。 ジョブの内容を示す第1の図である。 動作シーケンスの一例を示す第1の図である。 ジョブの内容を示す第2の図である。 ジョブの内容を示す第3の図である。 動作シーケンスの一例を示す第2の図である。 ジョブの内容を示す第3の図である。 動作シーケンスの一例を示す第3の図である。 動作シーケンスの一例を示す第4の図である。
以下、本発明の実施の形態における画像形成装置について図面を参照して説明する。以下の説明では同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがってそれらについての詳細な説明は繰返さない。また、以下の説明においては、画像形成装置の一例としてMFPを説明するが、MFPは、音声認識装置としても機能する。さらに、以下に説明するMFPは、画像を形成する対象となる記録媒体として、複数種類の記録媒体のいずれにも画像を形成することが可能である。記録媒体は、紙などの用紙の他、OHP(Overhead projector)シート、布等を含む。また、記録媒体の種類は、記録媒体の坪量および材質の違いの他、記録媒体のサイズの違いを含む。以下の説明では、特に言及しない限り、記録媒体を用紙とする場合を例に説明する。
図1は、本発明の実施の形態の1つにおけるMFPの外観を示す斜視図である。図2は、MFPのハードウェア構成の概要を示すブロック図である。図1および図2を参照して、MFP100は、メイン回路110と、原稿を読み取るための原稿読取部130と、原稿を原稿読取部130に搬送するための自動原稿搬送装置120と、原稿読取部130が原稿を読み取って出力する画像データに基づいて用紙等に画像を形成するための画像形成部140と、画像形成部140に用紙を供給するための給紙部150と、画像が形成された用紙を処理する後処理部155と、ユーザーインターフェースとしての操作パネル160とを含む。
後処理部155は、シフト機構、パンチ機構及およびステープル機構を備えている。シフト機構は、画像形成部140により画像が形成された複数の用紙をまとめた束を別の束と異なる位置に配置するために、複数の用紙をまとめた束を配置する位置を変化させる機構である。パンチ機構は、複数の用紙をまとめた束にパンチ穴をあける機構である。ステープル機構は、複数の用紙をまとめた束にステープル針を打ち込む機構である。
メイン回路110は、CPU111と、通信インターフェース(I/F)部112と、ROM113と、RAM114と、大容量記憶装置としてのハードディスクドライブ(HDD)115と、ファクシミリ部116と、音を収集するマイクロフォン117と、外部記憶装置118と、を含む。CPU111は、自動原稿搬送装置120、原稿読取部130、画像形成部140、給紙部150、後処理部155および操作パネル160と接続され、MFP100の全体を制御する。
ROM113は、CPU111が実行するプログラム、またはそのプログラムを実行するために必要なデータを記憶する。RAM114は、CPU111がプログラムを実行する際の作業領域として用いられる。さらに、RAM114は、原稿読取部130から連続的に送られてくる画像データを一時的に記憶する。
通信I/F部112は、MFP100をネットワークに接続するためのインターフェースである。CPU111は、通信I/F部112を介して、他のコンピューターとの間で通信し、データを送受信する。また、通信I/F部112は、ネットワークを介してインターネットに接続されたコンピューターと通信が可能である。
ファクシミリ部116は、公衆交換電話網(PSTN)に接続され、PSTNにファクシミリデータを送信する、またはPSTNからファクシミリデータを受信する。ファクシミリ部116は、受信したファクシミリデータを、HDD115に記憶する、または画像形成部140に出力する。画像形成部140は、ファクシミリ部116により受信されたファクシミリデータを用紙にプリントする。また、ファクシミリ部116は、HDD115に記憶されたデータをファクシミリデータに変換して、PSTNに接続されたファクシミリ装置に送信する。
外部記憶装置118は、CPU111により制御され、CD-ROM(Compact Disk Read Only Memory)118A、または半導体メモリが装着される。本実施の形態においては、CPU111は、ROM113に記憶されたプログラムを実行する例を説明するが、CPU111は、外部記憶装置118を制御して、CD-ROM118AからCPU111が実行するためのプログラムを読出し、読み出したプログラムをRAM114に記憶し、実行するようにしてもよい。
マイクロフォン117が配置される位置を限定するものではないが、マイクロフォン117は、操作パネル160を操作するユーザーが発声する音を収集するために、操作パネル160の近傍に配置されるのが好ましい。マイクロフォン117は、収集した音をデジタル信号の音データに変換し、音データをCPU111に出力する。
なお、CPU111が実行するためのプログラムを記憶する記録媒体としては、CD-ROM118Aに限られず、フレキシブルディスク、カセットテープ、光ディスク(MO(Magnetic Optical Disc)/MD(Mini Disc)/DVD(Digital Versatile Disc))、ICカード、光カード、マスクROM、EPROM(Erasable Programmable ROM)などの半導体メモリ等の媒体でもよい。さらに、CPU111がネットワークに接続されたコンピューターからプログラムをダウンロードしてHDD115に記憶する、または、ネットワークに接続されたコンピューターがプログラムをHDD115に書込みするようにして、HDD115に記憶されたプログラムをRAM114にロードしてCPU111で実行するようにしてもよい。ここでいうプログラムは、CPU111により直接実行可能なプログラムだけでなく、ソースプログラム、圧縮処理されたプログラム、暗号化されたプログラム等を含む。
図3は、MFPが備えるCPUが有する機能の一例を示すブロック図である。図3に示す機能は、MFP100が備えるCPU111が、ROM113、HDD115またはCD-ROM118Aに記憶された音声認識プログラムを実行することにより、CPU111に形成される機能である。図3を参照して、CPU111は、音取得部51と、補正部53と、音声認識部55と、操作決定部57と、操作受付部59と、ジョブ生成部61と、処理実行部63と、動作シーケンス決定部65と、を含む。
処理実行部63は、ジョブを実行する。処理実行部63は、ジョブにより定められる処理を実行するために、複数のハードウェア資源を制御する。ハードウェア資源は、通信I/F部112、HDD115、ファクシミリ部116、自動原稿搬送装置120、原稿読取部130、画像形成部140、給紙部150、後処理部155および操作パネル160を含む。ジョブは、例えば、コピージョブ、プリントジョブ、スキャンジョブ、ファクシミリ送信ジョブ、データ送信ジョブを含む。なお、処理実行部63が実行可能なジョブは、これらに限定されることなく、他のジョブを含んでもよい。
コピージョブは、原稿読取部130に原稿を読み取らせるスキャン処理と、原稿読取部130が原稿を読み取って出力するデータの画像を画像形成部140に形成させるプリント処理とを含む。プリントジョブは、画像形成部140に、HDD115に記憶されたデータ、通信I/F部112が外部から受信するプリントデータの画像を用紙に形成させるプリント処理を含む。スキャンジョブは、原稿読取部130に原稿を読み取らせるスキャン処理と、原稿読取部130が原稿を読み取って出力する画像データを出力する出力処理を含む。出力処理は、データをHDD115に記憶させるデータ記憶処理と、データを通信I/F部112に外部に送信するデータ送信処理を含む。ファクシミリ送信ジョブは、原稿読取部130に原稿を読み取らせるスキャン処理と、原稿読取部130が原稿を読み取って出力するデータをファクシミリ部116に送信させるファクシミリ送信処理とを含む。データ送信ジョブは、HDD115に記憶されたデータまたは原稿読取部130が原稿を読み取って出力するデータを、通信I/F部112を制御して他のコンピューターに送信するデータ送信処理を含む。
処理実行部63は、複数のジョブを並列で実行する場合がある。例えば、プリント処理を定めるジョブと、スキャン処理を定めるジョブとを並列で実行することが可能である。
処理実行部63は、単一のジョブを実行中に、制御するハードウェア資源が変更される場合、変更前後のハードウェア資源それぞれを識別するための資源識別情報を動作シーケンス決定部65に出力する。例えば処理実行部63は、給紙部150が備える3つの給紙カセットのうち第1段目の給紙カセットから用紙を供給していた状態で、第1段目の給紙カセットに収容された用紙がなくなる場合に、代替可能な用紙を収容する第2段目の給紙カセットから用紙を供給する状態に変更する。
音取得部51は、音を収集するマイクロフォン117と接続され、マイクロフォン117が出力する音データを取得する。音取得部51は、マイクロフォン117から取得される音データを補正部53に出力する。
補正部53は、音取得部51から入力される音データから音声の成分を抽出し、音声の成分の音データを音声認識部55に出力する。補正部53の詳細は、後述する。
音声認識部55は、補正部53から入力される音データを音声認識する。具体的には、音声認識部55は、音データを文字情報に変換する。音声認識部55は、文字情報を操作決定部57に出力する。音データから音声を認識する技術は公知なので、ここでは説明を繰り返さない。
操作決定部57は、音声認識部55から入力される文字情報から操作を決定する。操作決定部57は、文字情報からキーワードを抽出する。MFP100が実行可能な処理にキーワードを関連付けた処理関連情報としてキーワードテーブルがHDD115に記憶されている。操作決定部57は、キーワードテーブルで定められた1以上のキーワードのいずれかを文字情報から抽出する。操作決定部57は、1つの文字情報から複数のキーワードを抽出する場合があり、1つの文字情報からキーワードを抽出しない場合がある。操作決定部57は、文字情報から抽出されたキーワードを操作受付部59に出力する。
図4は、キーワードテーブルの一例を示す図である。キーワードテーブルは、キーワードと、MFP100に実行させる処理またはMFP100が実行する処理を特定するための設定値とを関連付ける複数のキーワードレコードを含む。キーワードレコードは、キーワードの項目と処理/設定値の項目とを含む。キーワードレコードにおいて、キーワードの項目にはキーワードが設定され、処理/設定値の項目には処理の名称または設定値が設定される。キーワードテーブルが、キーワードとMFP100に実行させる処理とを関連付ける一例としては、キーワード「スキャン」を含むキーワードレコードは、キーワード「スキャン」に対してMFP100に原稿を読み取らせるスキャン処理を関連付ける。また、キーワード「2in1」を含むキーワードレコードは、キーワード「2in1」に対して2ページの画像を合成する2in1処理を関連付ける。キーワードテーブルは、1つのキーワードに対して複数の処理を関連付ける場合がある。例えば、キーワード「コピー」を含むキーワードレコードは、キーワード「コピー」に対してコピー処理を関連付ける。コピー処理は、MFP100に原稿を読み取らせるスキャン処理と用紙に画像を形成するプリント処理とを含む。
キーワードテーブルが、キーワードとMFP100が実行する処理を特定する設定値とを関連付ける一例としては、キーワード「カラー」に対してMFP100が実行する処理の設定値としてフルカラーを関連付ける。また、別の一例として、キーワード「ユーザー名」に対してMFP100が実行する処理の設定値としてユーザー名のユーザーの宛先を関連付ける。なお、キーワード「Taro」は予め登録されたユーザーの名称を示す。宛先は、名称が「Taro」のユーザーに対して予め登録された電子メールアドレスである。
図3に戻って、操作決定部57は、キーワードに基づいて、操作を決定する。キーワードからMFP100に実行させる処理を設定する操作、または、MFP100が処理を実行するために用いる設定値を設定する操作を決定する。操作決定部57は、キーワードから決定された操作を操作受付部59に出力する。例えば、操作決定部57は、キーワード「コピー」から、キーワード「コピー」に関連付けられたスキャン処理およびプリント処理を設定する操作を決定し、キーワード「フルカラー」からフルカラーの設定値を設定する操作を決定する。また、操作決定部57は、キーワード「送る」からキーワード「送る」に関連付けられたスキャン処理およびデータ送信処理を設定する操作を決定し、キーワード「Taro」からキーワード「Taro」に関連付けられた宛先の設定値を設定する操作を決定する。
操作受付部59は、操作決定部57から操作が入力される。また、操作受付部59は、ユーザーが操作部163に入力する操作を受け付ける。操作受付部59は、操作決定部57から入力される操作および操作部163にユーザーにより入力された操作を、ジョブ生成部61に出力する。
ジョブ生成部61は、操作受付部59から入力される操作に従って、処理実行部63が実行するジョブを生成する。ジョブ生成部61は、操作決定部57から入力される操作に従ってジョブを生成する。具体的には、ジョブ生成部61は、処理を設定する操作または設定値を設定する操作にしたがって、処理を設定する設定操作で特定される処理を、設定値を設定する操作により特定される設定値で処理実行部63に実行させるジョブを生成する。ジョブ生成部61は、ジョブを処理実行部63および動作シーケンス決定部65に出力する。
例えば、スキャン処理およびプリント処理を設定する操作と、フルカラーの設定値を設定する操作とが、操作受付部59から入力される場合、ジョブ生成部61は、原稿をフルカラーで読み取るスキャン処理と、スキャン処理が実行されて出力されるフルカラーの画像データの画像をフルカラーで用紙に形成するプリント処理とを定めたコピージョブを生成する。また、スキャン処理およびデータ送信処理を設定する操作と、キーワード「Taro」に関連付けられた宛先の設定値を設定する操作とが、操作受付部59から入力される場合、ジョブ生成部61は、原稿をモノクロで読み取るスキャン処理と、スキャン処理が実行されて出力されるモノクロの画像データを名称がTaroのユーザーに対して登録された電子メールアドレス宛てに電子メールを送信するデータ送信処理とを定めたデータ送信ジョブを生成する。
動作シーケンス決定部65は、複数のハードウェア資源それぞれの経時的な動作の状態を示す動作シーケンスを決定する。具体的には、動作シーケンス決定部65は、ジョブ生成部61からジョブが入力される場合、複数のハードウェア資源のうちからジョブにより定められる処理を実行するために制御する1以上のハードウェア資源を決定する。動作シーケンス決定部65は、1以上のハードウェア資源それぞれの経時的な動作の状態に基づいて、そのジョブを実行する間の動作シーケンスを決定する。動作シーケンス決定部65は、動作シーケンスを補正部53に出力する。
動作シーケンス決定部65は、合成シーケンス決定部73と、変更対応部75と、を含む。合成シーケンス決定部73は、処理実行部63が第1ジョブと第1ジョブとは別の第2ジョブとを並列して実行する場合、第1ジョブにより定められる処理に基づいて決定される第1動作シーケンスと第2ジョブにより定められる処理に基づいて決定される第2動作シーケンスとを合成した合成シーケンスを、動作シーケンスに決定する。例えば、処理実行部63が、プリント処理を定める第1ジョブと、スキャン処理を定める第2ジョブとを並列で実行する場合がある。合成シーケンス決定部73は、第1ジョブにより定められるプリント処理に基づいて第1動作シーケンスを決定し、第2ジョブにより定められるスキャン処理に基づいて第2動作シーケンスを決定する。合成シーケンス決定部73は、第1動作シーケンスと第2動作シーケンスとを合成した合成シーケンスを、動作シーケンスに決定する。
変更対応部75は、動作シーケンスを決定した時点における処理実行部63が動作させる1以上のハードウェア資源がジョブを実行中に変更される場合、変更された後の1以上のハードウェア資源を動作させるための動作シーケンスを新たに決定する。具体的には、例えば、処理実行部63が、プリント処理を定めるジョブを実行している間に、給紙部150が備える3つの給紙カセットのうち第1段目の給紙カセットから用紙を供給する第1状態から第2段目の給紙カセットから用紙を供給する第2状態に切り換える場合がある。第1段目の給紙カセットに収容されている用紙がなくなる場合などである。この場合、処理実行部63が動作させる1以上のハードウェア資源が、第1段目の給紙カセットから第2段目の給紙カセットに切り換えられる。第1状態では、動作シーケンス決定部65は、第1給紙カセットを含む複数のハードウェア資源それぞれの経時的な動作の状態を示す動作シーケンスを決定している。変更対応部75は、第1状態から第2状態に変更する場合、第2給紙カセットを含む複数のハードウェア資源それぞれの経時的な動作の状態を示す動作シーケンスを新たに決定する。
補正部53は、動作シーケンス決定部65から入力される動作シーケンスが所定期間に動作する1以上のハードウェア資源が同一の複数の部分シーケンスを含む場合、複数の部分シーケンスのうち基本シーケンスの間に音取得部51により取得される音データに基づいて、複数の部分シーケンスのうち基本シーケンスよりも後の参照シーケンスの間に音取得部51により取得される音データを補正する。基本シーケンスは、複数の部分シーケンスのうち最も先の部分シーケンスが好ましい。具体的は、補正部53は、基本シーケンスの間に音取得部51から入力される音データを基本データとしてHDD115に記憶し、参照シーケンスの間に音取得部51から入力される音データをHDD115に記憶された基本データで補正する。音取得部51から入力される音データから基本データの成分を除去する。例えば、補正部53は、参照シーケンスの間に音取得部51から入力される音データから基本データを周波数ごとに減算する。
補正部53は、分割部71を含む。複数のハードウェア資源のうち単位動作を繰り返す基本ハードウェア資源が単位動作を実行する単位期間で動作シーケンスを分割した複数の分割シーケンスを決定する。ここでは、ジョブをプリント処理する場合において、画像形成部140を基本ハードウェア資源とする場合を例に説明する。プリント処理を定めるジョブが複数枚の用紙に画像を形成する処理を定める場合、単位動作は、画像形成部140が1枚の用紙に画像を形成する動作であり、単位期間は、画像形成部140が1枚の用紙に形成する画像の形成を開始してから画像形成部140が次の用紙に形成するがの形成を開始する直前までの時間である。したがって、分割部71は、プリント処理を定めるジョブに基づいて決定される動作シーケンスを、画像形成する用紙の枚数と同じ数の分割シーケンスに分割する。
補正部53は、複数の分割シーケンスが単位期間で動作する1以上のハードウェア資源が同一の複数の分割部分シーケンスを含む場合、複数の分割シーケンスのうちで単位期間に動作する1以上のハードウェア資源が同一の複数の分割部分シーケンスそれぞれを部分シーケンスに決定する。
ジョブがプリント処理と後処理とを定める場合がある。プリント処理においては、単位動作は、画像形成部140が1枚の用紙に画像を形成する動作である。これに対して、後処理は、画像形成部140が複数枚の用紙に画像を形成した後に後処理部155が1回動作する。例えば、後処理を3枚の用紙をまとめてステープル処理する場合、画像形成部140が3枚の用紙に画像を形成した後に後処理部155が1回動作する。このため、動作シーケンスを分割した複数の分割シーケンスは、後処理部155が動作しない複数の分割部分シーケンスと、後処理部155が動作する複数の分割部分シーケンスとを含む。以下、後処理部155が動作しない分割部分シーケンスを第1分割部分シーケンスといい、後処理部155が動作する分割部分シーケンスを第2分割部分シーケンスという。
補正部53は、複数の第1分割部分シーケンスのうち第1基本シーケンスの間に音取得部51が出力する音データに基づいて、複数の第1分割部分シーケンスのうち第1基本シーケンスよりも後の第1参照シーケンスの間に音取得部51が出力する音データを補正する。複数の第1分割部分シーケンスの第1基本シーケンスは、複数の第1分割部分シーケンスのうちで最も先の第1分割部分シーケンスが好ましい。また、補正部53は、複数の第2分割部分シーケンスのうち第2基本シーケンスの間に音取得部51が出力する音データに基づいて、複数の第2分割部分シーケンスのうち第2基本シーケンスよりも後の第2参照シーケンスの間に音取得部51が出力する音データを補正する。複数の第2分割部分シーケンスの第1基本シーケンスは、複数の第2分割部分シーケンスのうちで最も先の第2分割部分シーケンスが好ましい。
図5は、シーケンス決定処理の流れの一例を示すフローチャートである。シーケンス決定処理は、MFP100が備えるCPU111が、ROM113、HDD115またはCD-ROM118Aに記憶された音声認識プログラムを実行することにより、CPU111により実行される処理である。図5を参照して、CPU111は、ジョブを決定したか否かを判断する(ステップS01)。ジョブが決定されたならば処理はステップS02に進むが、そうでなければ処理はステップS11に進む。
ステップS02においては、ジョブに基づいて動作シーケンスが決定され、処理はステップS03に進む。CPU111は、複数のハードウェア資源それぞれの経時的な動作の状態を示す動作シーケンスを決定する。具体的には、CPU111は、複数のハードウェア資源のうちからジョブにより定められる処理を実行するために制御する1以上のハードウェア資源を決定し、そのジョブを実行する間に制御される1以上のハードウェア資源それぞれの経時的な動作の状態を示す動作シーケンスを決定する。
ステップS03においては、ジョブが実行中か否かを判断する。ステップS01において決定されたジョブとは別のジョブが実行されていれば処理はステップS04に進むが、そうでなければ処理はステップS05に進む。ステップS04においては、実行中のジョブに対して決定された動作シーケンスと、ステップS02において決定された動作シーケンスとを合成した合成シーケンスを生成し、処理をステップS05に進める。合成シーケンスが生成される場合、ステップS05以降の処理において、合成シーケンスが、動作シーケンスに決定され、動作シーケンスとして取り扱われる。
ステップS11においては、それまでに実行していたジョブが終了したか否かが判断される。ジョブが終了したならば処理はステップS12に進むが、そうでなければ処理はステップS01に戻る。ステップS12においては、実行中のジョブが存在するか否かが判断される。実行中のジョブが存在するならば処理はステップS13に進むが、そうでなければ処理はステップS01に戻る。ステップS13においては、実行中ジョブの動作シーケンスが決定され、処理はステップS05に進む。
ステップS05においては、変更フラグがONに設定され、処理はステップS06に進む。変更フラグは、動作シーケンスが変更されたことを示すフラグであり、動作シーケンスが変更される場合にONに設定され、その動作シーケンスの基本シーケンスにおける音が記憶されるとOFFに設定される。
ステップS06においては、分割シーケンスが決定され、処理はステップS07に進む。CPU111は、ステップS02において決定された動作シーケンス、ステップS04が実行される場合には合成シーケンスである動作シーケンス、ステップS13が実行される場合は実行中の動作シーケンスを処理対象とする。CPU111は、処理対象の動作シーケンスを、複数のハードウェア資源のうち単位動作を繰り返す基本ハードウェア資源が単位動作を実行する単位期間で分割することにより、複数の分割シーケンスを決定する。ここでは、ステップS01において決定されたジョブがプリント処理を定める場合を例に説明する。CPU111は、画像形成部140を基本ハードウェア資源に決定し、画像形成部140が1枚の用紙に画像を形成する動作に要する単位期間で動作シーケンスを分割することにより複数の分割シーケンスを決定する。
ステップS07においては、複数の分割シーケンスのうちから単位時間内に動作する1以上のハードウェア資源が同一の分割シーケンスが抽出され、処理はステップS08に進む。ステップS08においては、ステップS07において抽出された複数の分割シーケンスを部分シーケンスに決定し、処理をステップS09に進める。ステップS09においては、複数の部分シーケンスのうちから基本シーケンスが決定され、処理はステップS10に進む。複数の部分シーケンスのうち最も先の部分シーケンスが基本シーケンスに決定される。ステップS10においては、参照シーケンスが決定され、処理は終了する。複数の部分シーケンスのうち基本シーケンスより後の1以上の部分シーケンスが参照シーケンスに決定される。
CPU111は、ステップS07において、複数の分割シーケンスのうちから単位時間内に動作する1以上のハードウェア資源が同一の分割シーケンスを抽出し、それらを部分シーケンスに決定する。単位時間内に動作する1以上のハードウェア資源が同一の分割シーケンスの種類が複数の場合がある。例えば、ジョブがプリント処理と後処理とを定める場合である。この場合、CPU111は、動作シーケンスを分割した複数の分割シーケンスのうちから単位時間内に動作する1以上のハードウェア資源が同一でかつ後処理部155が動作しない複数の分割シーケンスを抽出し、それらを第1分割部分シーケンスに決定するとともに、単位時間内に動作する1以上のハードウェア資源が同一でかつ後処理部155が動作する複数の分割シーケンスを抽出し、それらを第2分割部分シーケンスに決定する。
そして、CPU111は、ステップS09において、複数の第1分割部分シーケンスのうち最も先の第1分割部分シーケンスを第1基本シーケンスに決定するとともに、複数の第2分割部分シーケンスのうち最も先の第2分割部分シーケンスを第2基本シーケンスに決定する。さらに、CPU111は、ステップS10において、複数の第1分割部分シーケンスのうち第1基本シーケンス以外の1以上の第1分割部分シーケンスそれぞれを第1参照シーケンスに決定するとともに、複数の第2分割部分シーケンスのうち基本シーケンス以外の1以上の第2分割部分シーケンスそれぞれを第2参照シーケンスに決定する。
図6は、ジョブ制御処理の流れの一例を示すフローチャートである。ジョブ制御処理は、MFP100が備えるCPU111が、ROM113、HDD115またはCD-ROM118Aに記憶された音声認識プログラムを実行することにより、CPU111により実行される処理である。図6を参照して、CPU111は、ジョブ生成処理を実行し(ステップS21)、処理をステップS22に進める。ジョブ生成処理の詳細は後述するが、MFP100を操作するユーザーが入力する操作に従ってジョブを生成する処理である。
ステップS22においては、実行指示操作が受け付けられたか否かが判断される。実行指示操作が受け付けられるまで待機状態となり、実行指示操作が受け付けられたならば処理はステップS23に進む。操作部163にユーザーにより入力された操作が実行指示操作か否かが判断される。ステップS23においては、ステップS21において生成されたジョブの実行が開始され、処理はステップS24に進む。ステップS24においては、変更フラグがONに設定されているか否かを判断する。変更フラグがONに設定されているならば処理はステップS25に進むが、そうでなければ処理はステップS28に進む。
ステップS25においては、ステップS23において開始されたジョブが基本シーケンスの状態か否かが判断される。基本シーケンスの状態ならば処理はステップS26に進むが、そうでなければ処理はステップS28に進む。ステップS26においては、基本データが記憶され、処理はステップS27に進む。CPU111は、基本シーケンスの間にマイクロフォン117が出力する音データを基本データとしてHDD115に記憶する。
ステップS27においては、変更フラグがOFFに設定され、処理はステップS28に進む。ステップS28においては、ステップS23において開始されたジョブが終了したか否かが判断される。ジョブが終了したならば処理は終了するが、そうでなければ処理はステップS24に戻る。
図7は、ジョブ生成処理の流れの一例を示すフローチャートである。ジョブ生成処理は、ジョブ制御処理のステップS21において実行される処理である。図7を参照して、CPU111は、操作パネル160で操作を受け付けたか否かを判断する。操作部163がユーザーにより入力される操作を受け付けたならば処理をステップS32に進めるが、そうでなければ処理をステップS34に進める。ステップS32においては、処理または設定値が設定され、処理はステップS33に進む。
ステップS31において受け付けられた操作が処理の選択を指示する処理選択操作ならば、処理選択操作により特定される処理がジョブに設定され、ステップS31において受け付けられた操作が処理を実行するための設定値の設定を指示する設定操作ならば、設定操作により特定される設定値が設定される。
ステップS34においては、マイクロフォン117が出力する音データが取得され、処理はステップS35に進む。マイクロフォン117を制御し、マイクロフォン117が出力する音データが取得される。ステップS35においては、ジョブが実行中か否かが判断される。ジョブが実行中ならば処理はステップS36に進むが、そうでなければ処理はステップS37に進む。ステップS36においては、音声補正処理が実行され、処理はステップS37に進む。音声補正処理の詳細は後述するが、音データを補正する処理である。ステップS37においては、音データで特定される音声が音声認識され、処理はステップS38に進む。音声認識により音声が文字で構成される文字情報に変換される。ステップS38においては、音声から変換された文字情報が決定され、処理はステップS39に進む。
ステップS39においては、文字情報がキーワードを含むか否かが判断される。文字情報がキーワードを含むならば処理はステップS40に進むが、そうでなければ処理はステップS33に進む。ステップS40においては、文字情報に含まれるキーワードに対応する処理または設定値が特定され、処理はステップS32に進む。ステップS32においては、ステップS40において決定された処理または設定値が設定される。
ステップS33においては、ジョブが決定されたか否かを判断する。ステップS32において設定された処理または設定値に基づいて、ジョブが決定されるか否かを判断する。ジョブが決定されたならば処理はジョブ制御処理に戻るが、そうでなければ処理はステップS31に戻る。
図8は、音声補正処理の流れの一例を示すフローチャートである。音声補正処理は、ジョブ生成処理のステップS36において実行される処理である。図8を参照して、CPU111は、実行中のジョブが参照シーケンスの状態か否かを判断する(ステップS41)。参照シーケンスならば処理はステップS42に進むが、そうでなければ処理はジョブ生成処理に戻る。ステップS42においては、基本データがHDD115から読出され、処理はステップS43に進む。基本データは、ジョブを実行している状態が基本シーケンスの間にマイクロフォン117から出力される音データである。ステップS43においては、参照シーケンスの間にマイクロフォン117が出力する音データが基本データで補正され、処理はジョブ生成処理に戻る。参照シーケンスの間にマイクロフォン117が出力する音データをHDD115に記憶された基本データで補正する。参照シーケンスの間にマイクロフォン117が出力する音データから基本データの成分を除去する。例えば、CPU111は、周波数ごとに、音データから基本データを減算する。
図9は、ジョブの内容を示す第1の図である。図9を参照して、ジョブの内容は、ジョブ種類の項目、読み込みの項目、用紙の項目、カラーの項目、給紙口の項目、印刷面の項目、後処理の項目により特定される。ジョブ種の項目は、ジョブの種類を示す。読み込みの項目は、原稿の読取方法を示す。用紙の項目は、画像が形成される用紙の種類を示す。カラーの項目は、カラーまたはモノクロのいずれで画像形成するかを示す。給紙口の項目は、上段、中段および下段のいずれの給紙カセットを用いるかを示す。印刷面の項目は、用紙の画像が形成される面を示す。後処理の項目は、複数の用紙に実行される後処理の内容を示す。
図9においては、ジョブ種類の項目に、「コピー1to3」が設定されており、1枚の原稿を1回読み取るスキャン処理と、3枚の用紙に画像形成するプリント処理が定められたジョブであること示される。読み込みの項目に、「DF A4 1枚」が設定されており、A4サイズの1枚の原稿を、自動原稿搬送装置120で読み取る読取方法で原稿を読み取る処理が定められたジョブであることが示される。用紙の項目に「A4 3枚」が設定されており、A4サイズの用紙の3枚に画像を形成する処理が定められたジョブであることが示される。カラーの項目に「フルカラー」が設定されており、カラーで画像を形成する処理を定めたジョブであることが示される。給紙口の項目に「トレイ1」が設定されており、上段のカセットに収納された用紙を搬送する処理を定めたジョブであることが示される。印刷面の項目に「片面」が設定されており、用紙の片面に画像を形成する処理を定めたジョブであることが示される。後処理の項目に何も設定されておらず、後処理が定められていないジョブであることが示される。
図10は、動作シーケンスの一例を示す第1の図である。図10に示す動作シーケンスは、図9に示した内容のジョブが実行される間の動作シーケンスを示す。図9に示した動作シーケンスは、スキャン処理と、プリント処理とを並列で実行するジョブである。図10(A)は、スキャン処理の動作シーケンスの一例を示す図である。図10(B)は、プリント処理の動作シーケンスの一例を示す図である。図10(C)は、合成シーケンスの一例を示す図である。
図10(A)を参照して、時刻t1においてスキャン処理が開始さされ、時刻t3で3枚の原稿の読取が完了する。スキャン処理において、ハードウェア資源として、自動原稿搬送装置120および原稿読取部130が動作する。図10(B)を参照して、時刻t3より前の時刻t2において、プリント処理が実行される。プリント処理において、ハードウェア資源として画像形成部140および給紙部150が動作する。1枚目の用紙に対するプリント処理は、時刻t2で開始されて時刻t4で終了する。2枚目の用紙に対するプリント処理は、時刻t4で開始されて時刻t5で終了する。3枚目の用紙に対するプリント処理は、時刻t5で開始されて時刻t6で終了する。
この場合、画像形成部140が基本ハードウェア資源であり、その単位動作は1枚の原稿に画像を形成する動作である。画像形成部140が1枚目の用紙を処理する時刻t2から時刻t4までの期間と、2枚目の用紙を処理する時刻t4から時刻t5までの期間と、3枚目の用紙を処理する時刻t5から時刻t6までの期間は同じであり、単位期間である。
したがって、図10(C)を参照して、合成シーケンスは、時刻t2から時刻t4までの分割シーケンスと、時刻t4から時刻t5までの分割シーケンスと、時刻t5から時刻t6までの分割シーケンスと、に分割される。時刻t2から時刻t4までの分割シーケンスで動作するハードウェア資源は、自動原稿搬送装置120、原稿読取部130、画像形成部140および給紙部150である。時刻t4から時刻t5までの分割シーケンスで動作するハードウェア資源と、時刻t5から時刻t6までの分割シーケンスとで、それぞれ動作するハードウェア資源は、画像形成部140および給紙部150で同じである。したがって、時刻t4から時刻t5までの分割シーケンスと、時刻t5から時刻t6までの分割シーケンスとは、部分シーケンスである。さらに、2つの部分シーケンスのうち先の時刻t4から時刻t5までの分割シーケンスが基本シーケンスであり、基本シーケンスより後の時刻t5から時刻t6までの分割シーケンスが参照シーケンスである。
時刻t4から時刻t5までの基本シーケンスの間にマイクロフォン117が出力する音データが基本データとしてHDD115に記憶される。また、時刻t5から時刻t6までの分割シーケンスでマイクロフォン117が出力する音データが、基本データ、換言すれば、時刻t4から時刻t5までの基本シーケンスの間にマイクロフォン117が出力する音データで補正される。
このため、時刻t5から時刻t6までの分割シーケンスで、ユーザーが音声を発声する場合、時刻t5から時刻t6までの分割シーケンスの間にマイクロフォン117が出力する音データにユーザーの音声が含まれる。この場合に、時刻t5から時刻t6までの分割シーケンスでマイクロフォン117が出力する音データが、基本データで補正されるので、画像形成部140および給紙部150が発生する音をノイズとして除去することができる。その結果、ユーザーの音声を認識する精度を高くすることができる。
図11は、ジョブの内容を示す第2の図である。図11を参照して、ジョブ種類の項目に、「プリント6頁」が設定されており、6つの画像を用紙に形成するプリント処理が定められたジョブであること示される。読み込みの項目に何も設定されていない。用紙の項目に「A4 6枚」が設定されており、A4サイズの用紙の6枚に画像を形成するプリント処理が定められたジョブであることが示される。カラーの項目に「フルカラー」が設定されており、カラーで画像を形成するプリント処理を定めたジョブであることが示される。給紙口の項目に「トレイ1」が設定されており、上段のカセットに収納された用紙を搬送するプリント処理を定めたジョブであることが示される。印刷面の項目に「片面」が設定されており、用紙の片面に画像を形成するプリント処理を定めたジョブであることが示される。後処理の項目に何も設定されておらず、後処理が定められていないジョブであることが示される。
図12は、ジョブの内容を示す第3の図である。図12を参照して、ジョブ種類の項目に、「Scan8頁」が設定されており、8枚の原稿を読み取るスキャン処理が定められたジョブであること示される。読み込みの項目、用紙の項目、給紙口の項目および印刷面の項目には何も設定されていない。カラーの項目に「フルカラー」が設定されており、カラーで原稿を読み取る処理を定めたジョブであることが示される。後処理の項目に何も設定されておらず、後処理が定められていないジョブであることが示される。
図13は、動作シーケンスの一例を示す第2の図である。図13に示す動作シーケンスは、図11に示したプリント処理を定めるジョブを実行する間に図12に示したスキャン処理を定めるジョブの実行が指示され、2つのジョブが並列で実行される場合の動作シーケンスを示す。図13(A)は、プリント処理の動作シーケンスの一例を示す図である。図13(B)は、スキャン処理の動作シーケンスの一例を示す図である。図13(C)は、合成シーケンスの一例を示す図である。
図13(A)を参照して、時刻t1においてジョブが開始されると、プリント処理が開始される。プリント処理において、ハードウェア資源として画像形成部140および給紙部150が動作する。1枚目の用紙に対するプリント処理は、時刻t1で開始されて時刻t2で終了する。2枚目の用紙に対するプリント処理は、時刻t2で開始されて時刻t3で終了する。3枚目の用紙に対するプリント処理は、時刻t3で開始されて時刻t4で終了する。4枚目の用紙に対するプリント処理は、時刻t4で開始されて時刻t6で終了する。5枚目の用紙に対するプリント処理は、時刻t6で開始されて時刻t7で終了する。6枚目の用紙に対するプリント処理は、時刻t7で開始されて時刻t8で終了する。
図13(B)を参照して、時刻t5においてスキャン処理が開始され、時刻t8で終了する。図13(C)を参照して、合成シーケンスにおいて、画像形成部140が基本ハードウェア資源であり、その単位動作は1枚の原稿に画像を形成する動作である。画像形成部140が6枚の用紙それぞれにプリント処理を期間は同じであり、単位期間である。したがって、合成シーケンスは、時刻t1から時刻t2までの分割シーケンスと、時刻t2から時刻t3までの分割シーケンスと、時刻t3から時刻t4までの分割シーケンスと、時刻t4から時刻t6までの分割シーケンスと、時刻t6から時刻t7までの分割シーケンスと、時刻t7から時刻t8までの分割シーケンスと、に分割される。
時刻t1から時刻t2までの分割シーケンス、時刻t2から時刻t3までの分割シーケンス、および時刻t3から時刻t4までの分割シーケンスそれぞれで動作するハードウェア資源は、画像形成部140および給紙部150で同じである。時刻t6から時刻t7までの分割シーケンス、および時刻t7から時刻t9までの分割シーケンスで、それぞれ動作するハードウェア資源は、自動原稿搬送装置120、原稿読取部130、画像形成部140および給紙部150で同じである。
したがって、時刻t1から時刻t2までの分割シーケンス、時刻t2から時刻t3までの分割シーケンス、および時刻t3から時刻t4までの分割シーケンスそれぞれが第1分割部分シーケンスであり、時刻t6から時刻t7までの分割シーケンスおよび時刻t7から時刻t8までの分割シーケンスそれぞれが第2分割部分シーケンスである。
さらに、3つの第1分割部分シーケンスのうち先の時刻t1から時刻t2までの第1分割部分シーケンスが第1基本シーケンスであり、第1基本シーケンスより後の時刻t2から時刻t3までの第1分割部分シーケンスおよび時刻t3から時刻t4までの第1分割部分シーケンスが第1参照シーケンスである。また、2つの第2分割部分シーケンスのうち先の時刻t6から時刻t7までの第2分割部分シーケンスが第2基本シーケンスであり、第2基本シーケンスより後の時刻t7から時刻t8までの第2分割部分シーケンスが第2参照シーケンスである。
時刻t1から時刻t2までの第1基本シーケンスの間にマイクロフォン117が出力する音データが基本データとしてHDD115に記憶される。また、時刻t2から時刻t3までの第1分割部分シーケンスまたは時刻t3から時刻t4までの第1分割部分シーケンスでマイクロフォン117が出力する音データが、基本データ、換言すれば、時刻t1から時刻t2までの第1基本シーケンスの間にマイクロフォン117が出力する音データで補正される。このため、時刻t2から時刻t4までの2つの第1分割部分シーケンスで、ユーザーが音声を発声する場合、時刻t2から時刻t4までの2つの第1分割部分シーケンスの間にマイクロフォン117が出力する音データにユーザーの音声が含まれる。この場合に、時刻t2から時刻t4までの2つの第1分割部分シーケンスでマイクロフォン117が出力する音データが、基本データで補正されるので、画像形成部140および給紙部150が発生する音をノイズとして除去することができる。その結果、ユーザーの音声を認識する精度を高くすることができる。同様に、時刻t6から時刻t7までの第2基本シーケンスの間にマイクロフォン117が出力する音データが基本データとしてHDD115に記憶される。また、時刻t7から時刻t8までの第2分割部分シーケンスでマイクロフォン117が出力する音データが、基本データ、換言すれば、時刻t6から時刻t7までの第2基本シーケンスの間にマイクロフォン117が出力する音データで補正される。このため、時刻t7から時刻t8までの第2分割部分シーケンスで、ユーザーが音声を発声する場合、時刻t7から時刻t8までの2つの第2分割部分シーケンスの間にマイクロフォン117が出力する音データにユーザーの音声が含まれる。この場合に、時刻t7から時刻t8までの第2分割部分シーケンスでマイクロフォン117が出力する音データが、基本データで補正されるので、自動原稿搬送装置120、原稿読取部130、画像形成部140および給紙部150が発生する音をノイズとして除去することができる。その結果、ユーザーの音声を認識する精度を高くすることができる。
図14は、ジョブの内容を示す第3の図である。図14を参照して、ジョブ種類の項目は、「プリント3頁」が設定されており、3つの画像を形成するプリント処理が定められたジョブであること示される。読み込みの項目、用紙の項目、カラーの項目、給紙口の項目、印刷面の項目は、図11に示したジョブの内容と同じである。後処理の項目に「ステープル」が設定されており、後処理としてステープル加工処理を定めたジョブであることが示される。このため、3つの画像がそれぞれ形成された3枚の用紙がステープル加工処理され、3枚の用紙がステープル加工された束が2つ生成されることが示される。
図15は、動作シーケンスの一例を示す第3の図である。図15に示す動作シーケンスは、図14に示したプリント処理および後処理を定めるジョブが実行される場合の動作シーケンスを示す。図15(A)は、プリント処理の動作シーケンスの一例を示す図である。図15(B)は、後処理の動作シーケンスの一例を示す図である。図15(C)は、合成シーケンスの一例を示す図である。
図15(A)を参照して、時刻t1においてジョブが開始されると、プリント処理が開始される。プリント処理において、ハードウェア資源として画像形成部140および給紙部150が動作する。第1ページの画像を1枚目の用紙に形成するプリント処理は時刻t1で開始されて時刻t2で終了する。第2ページの画像を2枚目の用紙に形成するプリント処理は時刻t2で開始されて時刻t3で終了する。第3ページの画像を3枚目の用紙に形成するプリント処理は、時刻t3で開始されて時刻t5で終了する。第1ページの画像を4枚目の用紙に形成するプリント処理は時刻t5で開始されて時刻t6で終了する。第2ページの画像を5枚目の用紙に形成するプリント処理は時刻t6で開始されて時刻t7で終了する。第3ページの画像を6枚目の用紙に形成するプリント処理は、時刻t7で開始されて時刻t9で終了する。
図15(B)を参照して、1枚目~3枚目の用紙の束に対するステープル加工処理は時刻t4で開始されて時刻t5で終了する。4枚目~6枚目の用紙の束に対するステープル加工処理は時刻t8で開始されて時刻t9で終了する。
図15(C)を参照して、合成シーケンスにおいて、画像形成部140が基本ハードウェア資源であり、その単位動作は1枚の原稿に画像を形成する動作である。画像形成部140が6枚の用紙それぞれにプリント処理を期間は同じであり、単位期間である。したがって、合成シーケンスは、時刻t1から時刻t2までの分割シーケンスと、時刻t2から時刻t3までの分割シーケンスと、時刻t3から時刻t5までの分割シーケンスと、時刻t5から時刻t6までの分割シーケンスと、時刻t6から時刻t7までの分割シーケンスと、時刻t7から時刻t9までの分割シーケンスと、に分割される。
時刻t1から時刻t2までの分割シーケンス、時刻t2から時刻t3までの分割シーケンス、時刻t5から時刻t6までの分割シーケンス、および時刻t6から時刻t7までの分割シーケンスでそれぞれ動作するハードウェア資源は、画像形成部140および給紙部150で同じである。また、時刻t3から時刻t5までの分割シーケンスおよび時刻t7から時刻t9までの分割シーケンスでそれぞれ動作するハードウェア資源は、画像形成部140、給紙部150および後処理部155で同じである。
したがって、時刻t1から時刻t2までの分割シーケンス、時刻t2から時刻t3までの分割シーケンス、時刻t5から時刻t6までの分割シーケンス、および時刻t6から時刻t7までの分割シーケンスそれぞれが第1分割部分シーケンスであり、時刻t3から時刻t5までの分割シーケンスおよび時刻t7から時刻t9までの分割シーケンスそれぞれが第2分割部分シーケンスである。
さらに、4つの第1分割部分シーケンスのうち最先の時刻t1から時刻t2までの第1分割部分シーケンスが第1基本シーケンスであり、第1基本シーケンスより後の時刻t2から時刻t3までの第1分割部分シーケンス、時刻t5から時刻t6までの第1分割部分シーケンスおよび時刻t6から時刻t7までの第1分割部分シーケンスが第1参照シーケンスである。また、2つの第2分割部分シーケンスのうち最先の時刻t3から時刻t5までの第2分割部分シーケンスが第2基本シーケンスであり、第2基本シーケンスより後の時刻t7から時刻t9までの第2分割部分シーケンスが第2参照シーケンスである。
時刻t1から時刻t2までの第1基本シーケンスの間にマイクロフォン117が出力する音データが基本データとしてHDD115に記憶される。また、時刻t2から時刻t3までの第1分割部分シーケンス、時刻t5から時刻t6までの第1分割部分シーケンスおよび時刻t6から時刻t7までの第1分割部分シーケンスでマイクロフォン117が出力する音データが、基本データ、換言すれば、時刻t1から時刻t2までの第1基本シーケンスの間にマイクロフォン117が出力する音データで補正される。このため、時刻t2から時刻t3までの第1分割部分シーケンス、時刻t5から時刻t6までの第1分割部分シーケンスおよび時刻t6から時刻t7までの第1分割部分シーケンスでマイクロフォン117が出力する音データが、基本データで補正されるので、画像形成部140および給紙部150が発生する音をノイズとして除去することができる。その結果、ユーザーの音声を認識する精度を高くすることができる。同様に、時刻t3から時刻t5までの第2基本シーケンスの間にマイクロフォン117が出力する音データが基本データとしてHDD115に記憶される。また、時刻t7から時刻t9までの第2分割部分シーケンスでマイクロフォン117が出力する音データが、基本データ、換言すれば、時刻t3から時刻t5までの第2基本シーケンスの間にマイクロフォン117が出力する音データで補正される。このため、時刻t7から時刻t9までの第2分割部分シーケンスでマイクロフォン117が出力する音データが、基本データで補正されるので、画像形成部140、給紙部150および後処理部155が発生する音をノイズとして除去することができる。その結果、ユーザーの音声を認識する精度を高くすることができる。
図16は、動作シーケンスの一例を示す第4の図である。図16に示す動作シーケンスは、図11に示した内容のジョブを実行する間のプリントの動作シーケンスを示す。ただし、3枚目の用紙に画像を形成した段階で上段の給紙カセットの残量がゼロになり、代替カセットとして中段の給紙カセットから用紙が供給される場合を示している。このため、1枚目から3枚目の用紙に画像を形成するプリント処理の単位時間は、4枚目から6枚目の用紙に画像を形成するプリント処理の単位時間より短い。したがって、動作シーケンスは、1枚目の用紙に対するプリント処理である時刻t1から時刻t2までの分割シーケンス、2枚目の用紙に対するプリント処理である時刻t2から時刻t3までの分割シーケンス、3枚目の用紙に対するプリント処理である時刻t3から時刻t4までの分割シーケンス、4枚目の用紙に対するプリント処理である時刻t4から時刻t5までの分割シーケンス、5枚目の用紙に対するプリント処理である時刻t5から時刻t6までの分割シーケンス、6枚目の用紙に対するプリント処理である時刻t6から時刻t7までの分割シーケンス、に分割される。
時刻t1から時刻t2までの分割シーケンス、時刻t2から時刻t3までの分割シーケンス、および時刻t3から時刻t4までの分割シーケンスそれぞれで動作するハードウェア資源は、画像形成部140および給紙部150の上段給紙カセットで同じである。時刻t4から時刻t5までの分割シーケンス、時刻t5から時刻t6までの分割シーケンス、および時刻t6から時刻t7までの分割シーケンスで、それぞれ動作するハードウェア資源は、画像形成部140および給紙部150の中段給紙カセットで同じである。
したがって、時刻t1から時刻t2までの分割シーケンス、時刻t2から時刻t3までの分割シーケンス、および時刻t3から時刻t4までの分割シーケンスそれぞれが第1分割部分シーケンスであり、時刻t4から時刻t5までの分割シーケンス、時刻t5から時刻t6までの分割シーケンス、および時刻t6から時刻t7までの分割シーケンスそれぞれが第2分割部分シーケンスである。
さらに、3つの第1分割部分シーケンスのうち先の時刻t1から時刻t2までの第1分割部分シーケンスが第1基本シーケンスであり、第1基本シーケンスより後の時刻t2から時刻t3までの第1分割部分シーケンスおよび時刻t3から時刻t4までの第1分割部分シーケンスが第1参照シーケンスである。また、3つの第2分割部分シーケンスのうち先の時刻t4から時刻t5までの第2分割部分シーケンスが第2基本シーケンスであり、第2基本シーケンスより後の時刻t5から時刻t6までの第2分割部分シーケンスおよび時刻t6から時刻t7までの第2分割部分シーケンスが第2参照シーケンスである。
時刻t1から時刻t2までの第1基本シーケンスの間にマイクロフォン117が出力する音データが基本データとしてHDD115に記憶される。また、時刻t2から時刻t3までの第1分割部分シーケンス、時刻t3から時刻t4までの第1分割部分シーケンスでマイクロフォン117が出力する音データが、基本データ、換言すれば、時刻t1から時刻t2までの第1基本シーケンスの間にマイクロフォン117が出力する音データで補正される。このため、時刻t2から時刻t3までの分割シーケンス、時刻t3から時刻t4までの第1分割部分シーケンスでマイクロフォン117が出力する音データが、基本データで補正されるので、画像形成部140および給紙部150が発生する音をノイズとして除去することができる。その結果、ユーザーの音声を認識する精度を高くすることができる。同様に、時刻t4から時刻t5までの第2基本シーケンスの間にマイクロフォン117が出力する音データが基本データとしてHDD115に記憶される。また、時刻t5から時刻t6までの第2分割部分シーケンス、時刻t6から時刻t7までの第2分割部分シーケンスでマイクロフォン117が出力する音データが、基本データ、換言すれば、時刻t4から時刻t5までの第2基本シーケンスの間にマイクロフォン117が出力する音データで補正される。このため、時刻t5から時刻t6までの第2分割部分シーケンス、時刻t6から時刻t7までの第2分割部分シーケンスでマイクロフォン117が出力する音データが、基本データで補正されるので、画像形成部140および給紙部150が発生する音をノイズとして除去することができる。その結果、ユーザーの音声を認識する精度を高くすることができる。
以上説明したように、本実施の形態におけるMFP100は、MFP100に投入されたジョブに基づいて、動作シーケンスを決定し、動作シーケンスが所定期間に動作する1以上のハードウェア資源が同一の複数の部分シーケンスを含む場合、基本シーケンスの間に収集される音に基づいて、複数の部分シーケンスのうち基本シーケンスよりも後の参照シーケンスの間に収集される音を補正し、補正された音に基づいて音声を認識する。このため、1以上のハードウェア資源で発生する音を除去した後の音から音声を認識するので、音声を認識する精度を高めることができる。また、MFP100は、動作する1以上のハードウェア資源が同じ動作を繰り返し連続する場合に、最初の動作の期間に発生する音で、後の動作の期間に発生する音を補正するので、ハードウェア資源が発生する音が経時的に変化する場合であっても、ハードウェア資源が発生する音を、収音された音から除去することができる。
また、MFP100は、複数のハードウェア資源のうち単位動作を繰り返す基本ハードウェア資源が単位動作を実行する単位期間で動作シーケンスを分割した複数の分割シーケンスを決定し、複数の分割シーケンスが単位期間で動作する1以上のハードウェア資源が同一の複数の分割部分シーケンスを部分シーケンスに決定する。このため、部分シーケンスを容易に決定することができる。
また、MFP100は、複数の分割部分シーケンスが複数の第1分割部分シーケンスと複数の第2分割部分シーケンスとを含み、第1分割部分シーケンスと第2分割部分シーケンスとで動作するハードウェア資源が異なる場合、複数の第1分割部分シーケンスのうち第1基本シーケンスの間に収集される音に基づいて、複数の第1分割部分シーケンスのうち第1基本シーケンスよりも後の第1参照シーケンスの間に収集される音を補正し、複数の第2分割部分シーケンスのうち第2基本シーケンスの間に収集される音に基づいて、複数の第2分割部分シーケンスのうち第2基本シーケンスよりも後の第2参照シーケンスの間に収集される音を補正する。このため、動作シーケンスが、動作する1以上のハードウェア資源が異なる第1分割部分シーケンスと第2分割部分シーケンスを含む場合であっても、音を補正することができる。
なお、上述した実施の形態においては、MFP100が音声認識装置として機能する場合を例に説明したが、図3に示した機能のうち音取得部51、補正部53、音声認識部55、動作シーケンス決定部65を、MFP100と別体の音声認識装置に実行させるようにしてもよい。この場合における音声認識装置は、たとえば、コンピューターを用いることができる。音声認識装置として機能するコンピューターは、画像形成装置として機能するMFP100と通信することにより、MFP100に投入されたジョブと、MFP100の動作の状態と、をMFP100から取得する。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
100 MFP、110 メイン回路、111 CPU、112 通信I/F部、115 HDD、116 ファクシミリ部、117 マイクロフォン、118 外部記憶装置、120 自動原稿搬送装置、130 原稿読取部、140 画像形成部、150 給紙部、155 後処理部、160 操作パネル、161 表示部、163 操作部、51 音取得部、53 補正部、55 音声認識部、57 操作決定部、59 操作受付部、61 ジョブ生成部、63 処理実行部、65 動作シーケンス決定部、71 分割部、73 合成シーケンス決定部、75 変更対応部。

Claims (12)

  1. 音を収集する音収集手段と、
    それぞれが可動部を有する複数のハードウェア資源を制御してジョブを実行する画像形成装置に投入された前記ジョブに基づいて、複数の前記ハードウェア資源それぞれの経時的な動作の状態を示す動作シーケンスを決定する動作シーケンス決定手段と、
    前記動作シーケンス決定手段により決定される前記動作シーケンスが所定期間に動作する1以上の前記ハードウェア資源が同一の複数の部分シーケンスを含む場合、複数の前記部分シーケンスのうち基本シーケンスの間に前記音収集手段により収集される音に基づいて、複数の前記部分シーケンスのうち前記基本シーケンスよりも後の参照シーケンスの間に前記音収集手段により収集される音を補正する補正手段と、
    前記補正手段により補正された音に基づいて音声を認識する音声認識手段と、を備えた音声認識装置。
  2. 前記動作シーケンス決定手段は、前記画像形成装置が第1ジョブと前記第1ジョブとは別の第2ジョブとを並列して実行する場合、前記第1ジョブにより定められる処理に基づいて決定される第1動作シーケンスと前記第2ジョブにより定められる処理に基づいて決定される第2動作シーケンスとを合成した合成シーケンスを、前記動作シーケンスとして決定する、請求項1に記載の音声認識装置。
  3. 前記動作シーケンス決定手段は、前記動作シーケンスを決定した時点における前記画像形成装置が動作させる1以上の前記ハードウェア資源が前記ジョブを実行中に変更される場合、変更された後の1以上の前記ハードウェア資源を動作させるための前記動作シーケンスを新たに決定する、請求項1または2に記載の音声認識装置。
  4. 複数の前記ハードウェア資源は、記録媒体に画像を形成する画像形成手段と、
    それぞれが複数種類の記録媒体を収容し、かつ、前記画像形成手段に記録媒体を供給する複数の供給手段と、を含む請求項3に記載の音声認識装置。
  5. 複数の前記ハードウェア資源のうち単位動作を繰り返す基本ハードウェア資源が前記単位動作を実行する単位期間で前記動作シーケンスを分割した複数の分割シーケンスを決定する分割手段を、さらに備え、
    前記補正手段は、複数の前記分割シーケンスが前記単位期間で動作する1以上の前記ハードウェア資源が同一の複数の分割部分シーケンスを含む場合、複数の前記分割部分シーケンスそれぞれを前記部分シーケンスに決定する、請求項1~3のいずれかに記載の音声認識装置。
  6. 前記補正手段は、複数の前記分割部分シーケンスが複数の第1分割部分シーケンスと、前記第1分割部分シーケンスとは前記単位期間に動作する1以上の前記ハードウェア資源が異なる複数の第2分割部分シーケンスとを含む場合、複数の前記第1分割部分シーケンスのうち第1基本シーケンスの間に前記音収集手段により収集される音に基づいて、複数の前記第1分割部分シーケンスのうち前記第1基本シーケンスよりも後の第1参照シーケンスの間に前記音収集手段により収集される音を補正し、複数の前記第2分割部分シーケンスのうち第2基本シーケンスの間に前記音収集手段により収集される音に基づいて、複数の前記第2分割部分シーケンスのうち前記第2基本シーケンスよりも後の第2参照シーケンスの間に前記音収集手段により収集される音を補正する、請求項5に記載の音声認識装置。
  7. 複数の前記ハードウェア資源は、記録媒体に画像を形成する画像形成手段と、
    画像が形成された複数の記録媒体をまとめて処理する後処理手段と、を含む、請求項6に記載の音声認識装置。
  8. 前記後処理手段は、画像が形成された複数の記録媒体を物理的に加工する加工手段と、
    複数の記録媒体をまとめて排出する位置を変更するシフト手段と、を含む、請求項7に記載の音声認識装置。
  9. 前記基本ハードウェア資源は、記録媒体に画像を形成する画像形成手段である、請求項5または6に記載の音声認識装置。
  10. 前記画像形成装置は、請求項1~9のいずれかに記載の音声認識装置を備えた、画像形成装置。
  11. 音収集手段により収集された音を取得する音取得ステップと、
    それぞれが可動部を有する複数のハードウェア資源を制御してジョブを実行する画像形成装置に投入された前記ジョブに基づいて、複数の前記ハードウェア資源それぞれの経時的な動作の状態を示す動作シーケンスを決定する動作シーケンス決定ステップと、
    前記動作シーケンス決定ステップにおいて決定される前記動作シーケンスが所定期間に動作する1以上の前記ハードウェア資源が同一の複数の部分シーケンスを含む場合、複数の前記部分シーケンスのうち基本シーケンスの間に前記音取得ステップにおいて取得される音に基づいて、複数の前記部分シーケンスのうち前記基本シーケンスよりも後の参照シーケンスの間に前記音取得ステップにおいて取得される音を補正する補正ステップと、
    前記補正ステップにおいて補正された音に基づいて音声を認識する音声認識ステップと、を音声認識装置に実行させる音声認識方法。
  12. 音収集手段により収集された音を取得する音取得ステップと、
    それぞれが可動部を有する複数のハードウェア資源を制御してジョブを実行する画像形成装置に投入された前記ジョブに基づいて、複数の前記ハードウェア資源それぞれの経時的な動作の状態を示す動作シーケンスを決定する動作シーケンス決定ステップと、
    前記動作シーケンス決定ステップにおいて決定される前記動作シーケンスが所定期間に動作する1以上の前記ハードウェア資源が同一の複数の部分シーケンスを含む場合、複数の前記部分シーケンスのうち基本シーケンスの間に前記音取得ステップにおいて取得される音に基づいて、複数の前記部分シーケンスのうち前記基本シーケンスよりも後の参照シーケンスの間に前記音取得ステップにおいて取得される音を補正する補正ステップと、
    前記補正ステップにおいて補正された音に基づいて音声を認識する音声認識ステップと、をコンピューターに実行させる音声認識プログラム。


JP2018231002A 2018-12-10 2018-12-10 音声認識装置、画像形成装置、音声認識方法よび音声認識プログラム Active JP7119967B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018231002A JP7119967B2 (ja) 2018-12-10 2018-12-10 音声認識装置、画像形成装置、音声認識方法よび音声認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018231002A JP7119967B2 (ja) 2018-12-10 2018-12-10 音声認識装置、画像形成装置、音声認識方法よび音声認識プログラム

Publications (2)

Publication Number Publication Date
JP2020095091A JP2020095091A (ja) 2020-06-18
JP7119967B2 true JP7119967B2 (ja) 2022-08-17

Family

ID=71085138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018231002A Active JP7119967B2 (ja) 2018-12-10 2018-12-10 音声認識装置、画像形成装置、音声認識方法よび音声認識プログラム

Country Status (1)

Country Link
JP (1) JP7119967B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004206063A (ja) 2002-10-31 2004-07-22 Seiko Epson Corp 音響モデル作成方法および音声認識装置ならびに音声認識装置を有する乗り物
JP2010136335A (ja) 2008-11-05 2010-06-17 Ricoh Co Ltd 画像形成装置、制御方法およびプログラム
JP2011253126A (ja) 2010-06-03 2011-12-15 Canon Inc 音声信号処理装置、及びその制御方法
JP2012132950A (ja) 2010-12-17 2012-07-12 Fujitsu Ltd 音声認識装置、音声認識方法および音声認識プログラム
WO2014017371A1 (ja) 2012-07-25 2014-01-30 株式会社ニコン 信号処理装置、撮像装置、及び、プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004077601A (ja) * 2002-08-12 2004-03-11 Konica Minolta Holdings Inc 音声入力機能を有する稼働装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004206063A (ja) 2002-10-31 2004-07-22 Seiko Epson Corp 音響モデル作成方法および音声認識装置ならびに音声認識装置を有する乗り物
JP2010136335A (ja) 2008-11-05 2010-06-17 Ricoh Co Ltd 画像形成装置、制御方法およびプログラム
JP2011253126A (ja) 2010-06-03 2011-12-15 Canon Inc 音声信号処理装置、及びその制御方法
JP2012132950A (ja) 2010-12-17 2012-07-12 Fujitsu Ltd 音声認識装置、音声認識方法および音声認識プログラム
WO2014017371A1 (ja) 2012-07-25 2014-01-30 株式会社ニコン 信号処理装置、撮像装置、及び、プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
西村義隆他,MFTを用いたロボットの動作音に頑健な音声認識手法の提案,人工知能学会AIチャレンジ研究会(第24回)資料,2006年11月,pp.1-8

Also Published As

Publication number Publication date
JP2020095091A (ja) 2020-06-18

Similar Documents

Publication Publication Date Title
JP5146479B2 (ja) 文書管理装置、文書管理方法、文書管理プログラム
JP2018046416A (ja) 情報処理装置及びプログラム
JP7119967B2 (ja) 音声認識装置、画像形成装置、音声認識方法よび音声認識プログラム
JP3943983B2 (ja) 音声認識装置及びその方法、プログラム
JP2019215485A (ja) 画像形成装置、画像形成システム、制御方法および制御プログラム
CN112202981B (zh) 声音操作系统、控制装置、记录介质以及处理装置
US10606531B2 (en) Image processing device, and operation control method thereof
JP7205308B2 (ja) ジョブ生成装置、画像処理装置、ジョブ生成方法およびジョブ生成プログラム
US11647129B2 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
JP7314499B2 (ja) 情報処理システム、情報処理装置、ジョブ制御方法およびジョブ制御プログラム
JP2006323584A (ja) ページ出力制御装置およびページ出力制御プログラム
JP4459123B2 (ja) 情報処理装置及びユーザインターフェース制御方法
JP4081984B2 (ja) 画像読取装置、画像読取方法、画像読取プログラムおよび画像読取プログラムを記録したコンピュータ読み取り可能な記録媒体
WO2010032373A1 (ja) 動画記録再生装置、動画記録再生方法および動画記録再生プログラムを記録したコンピュータ読み取り可能な記録媒体
JP7139937B2 (ja) 音声処理システム、ジョブ生成装置、ジョブ生成方法およびジョブ生成プログラム
JP4548257B2 (ja) 画像形成装置、画像形成方法及びプログラム
JP2004077601A (ja) 音声入力機能を有する稼働装置
JP4562547B2 (ja) 画像形成装置、プログラムおよび記録媒体
JP2021056633A (ja) 音声設定システム、音声設定支援プログラムおよび音声設定支援装置
US11700338B2 (en) Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor
JP7447458B2 (ja) 制御装置、制御システム及び制御プログラム
US20220076673A1 (en) Speech setting system, speech setting assistance device and non-transitory computer-readable recording medium encoded with speech setting assistance program
JP2021057697A (ja) 音声設定システム、音声設定支援プログラムおよび音声設定支援装置
JP2022007018A (ja) 音声設定システム、音声設定支援装置および音声設定支援プログラム
JP2007067685A (ja) 画像形成システム、画像形成装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220622

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220718

R150 Certificate of patent or registration of utility model

Ref document number: 7119967

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150