JP7271925B2 - 音声操作システム、音声操作方法および音声操作プログラム - Google Patents

音声操作システム、音声操作方法および音声操作プログラム Download PDF

Info

Publication number
JP7271925B2
JP7271925B2 JP2018230042A JP2018230042A JP7271925B2 JP 7271925 B2 JP7271925 B2 JP 7271925B2 JP 2018230042 A JP2018230042 A JP 2018230042A JP 2018230042 A JP2018230042 A JP 2018230042A JP 7271925 B2 JP7271925 B2 JP 7271925B2
Authority
JP
Japan
Prior art keywords
processing
instruction
voice
processing device
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018230042A
Other languages
English (en)
Other versions
JP2020091448A (ja
Inventor
卓也 川野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2018230042A priority Critical patent/JP7271925B2/ja
Priority to US16/675,444 priority patent/US20200184970A1/en
Publication of JP2020091448A publication Critical patent/JP2020091448A/ja
Application granted granted Critical
Publication of JP7271925B2 publication Critical patent/JP7271925B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00244Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00403Voice input means, e.g. voice commands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Facsimiles In General (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、音声操作システム、音声操作方法および音声操作プログラムに関し、特に音声指示をやり直す必要がある場合における装置動作の開始遅延を抑制する技術に関する。
近年、スマートスピーカーを介してバーチャルアシスタントサーバーを利用することによって様々なタスクやサービスをデバイスに音声指示し、実行させる技術が実用化されている。画像形成装置の技術分野においても、このような音声インターフェイスを用いて装置を操作することが検討されている。
このため、例えば、音声認識技術を用いて指示音声からテキストデータを生成し、得られたテキストデータに含まれる名詞や助詞、動詞を組み合わせた一文を認識することによって、画像形成装置を操作する技術が提案されている(特許文献1を参照)。このようにすれば、語句の順序の制約を受けることなく自由な順序で音声指示を行うことができるのでユーザーの利便性を高めることができる。
特開2011-65108号公報
上記の従来技術は、各語句を音声認識することができることを前提としており、音声認識に失敗した語句がある場合には、ユーザーが意図した通りの操作を画像形成装置に対して指示することができない場合もあり得る。このような場合には、スマートスピーカーを用いて音声認識に失敗した旨をユーザーに通知して、音声指示の再入力を促せば、画像形成装置に対する操作内容の正確性を改善することができる。
しかしながら、ユーザーに音声指示を繰り返させると、その分だけ画像形成装置によるジョブの実行開始が遅延してしまう。例えば、図28に示すように、ユーザーがスマートスピーカー(SS)に向かって「プリントして下さい」と音声指示した場合、バーチャルアシスタントサーバーが音声認識に失敗しなければ、画像形成装置に対して直ちにプリント命令するので、図28に示すように、ウォームアップ開始、完了を経て、画像形成処理が速やかに開始される。
一方、ユーザー指示の音声認識に失敗した場合には、例えば、「もう一度お願いします」のように、スマートスピーカーを用いてユーザーに再指示を要求し、この再指示の要求に対する「プリントして下さい」との再指示の音声をユーザーから受け付ける。この再指示の音声認識に成功したら、バーチャルアシスタントサーバーは画像形成装置に対してプリント命令を行い、画像形成装置はプリント命令に従って画像形成処理を開始する。
このため、ユーザー指示の音声認識に失敗して、ユーザーに再指示を要求する場合には、画像形成装置による画像形成処理の開始が遅くなってしまう。また、音声認識を成功させるために、ユーザーが音声指示の発話をゆっくり行うと、更に時間がかかってしまう。
本発明は、上述のような問題に鑑みて為されたものであって、ユーザー指示の音声認識に失敗した場合におけるジョブの実行開始の遅延を抑制することができる音声操作システム、音声操作方法および音声操作プログラムを提供することを目的とする。
上記目的を達成するため、本発明の一形態に係る音声操作システムは、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムであって、前記受付装置は、前記音声指示を音声認識する音声認識手段と、前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知手段と、を備え、前記処理装置は、画像処理装置であって、前記操作命令の命令内容に対応する処理を実行する処理手段と、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶手段と、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定手段と、を備え、前記処理手段は、前記処理特定手段が特定した事前処理を、前記処理として実行し、前記処理特定手段は、前記操作命令が、プリント操作に関する命令である場合には、当該画像処理装置がウォームアップ処理を完了したか否かを確認して、ウォームアップ処理が完了していなければ、前記事前処理をウォームアップ処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作システムは、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムであって、前記受付装置は、前記音声指示を音声認識する音声認識手段と、前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知手段と、を備え、前記処理装置は、端末装置であって、前記操作命令の命令内容に対応する処理を実行する処理手段と、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶手段と、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定手段と、を備え、前記処理手段は、前記処理特定手段が特定した事前処理を、前記処理として実行し、前記処理特定手段は、前記操作命令が、プリント操作に関する命令である場合には、前記事前処理を前記端末装置がプリントジョブを作成するためのプリンター・ドライバーを起動するとともに、前記操作命令で指定されているプリント条件を前記プリンター・ドライバーに入力する処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作システムは、 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムであって、前記受付装置は、前記音声指示を音声認識する音声認識手段と、前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知手段と、を備え、前記処理装置は、画像処理装置であって、前記操作命令の命令内容に対応する処理を実行する処理手段と、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶手段と、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定手段と、を備え、前記処理手段は、前記処理特定手段が特定した事前処理を、前記処理として実行し、前記処理特定手段は、前記操作命令が、前記画像処理装置が原稿から読み取った画像データ、または予め記憶している画像データのファイル送信に関する命令である場合には、前記事前処理を送信すべきファイルを作成可能な複数のファイル形式で作成する処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作システムは、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムであって、前記受付装置は、前記音声指示を音声認識する音声認識手段と、前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知手段と、を備え、前記処理装置は、画像処理装置であって、前記操作命令の命令内容に対応する処理を実行する処理手段と、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶手段と、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定手段と、を備え、前記処理手段は、前記処理特定手段が特定した事前処理を、前記処理として実行し、前記処理特定手段は、前記操作命令が、コピー操作に関する命令である場合には、当該画像処理装置がウォームアップ処理を完了したか否かを確認して、ウォームアップ処理が完了していなければ、前記事前処理をウォームアップ処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作システムは、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムであって、前記受付装置は、前記音声指示を音声認識する音声認識手段と、前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知手段と、を備え、前記処理装置は、画像処理装置であって、前記操作命令の命令内容に対応する処理を実行する処理手段と、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶手段と、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定手段と、を備え、前記処理手段は、前記処理特定手段が特定した事前処理を、前記処理として実行し、前記処理特定手段は、前記操作命令が、自動原稿搬送装置を用いた原稿の読み取りを要する命令である場合には、前記事前処理を、自動原稿搬送装置を用いて原稿の両面を読み取る処理とすることを特徴とする音声操作システム。
また、本発明の別の一形態に係る音声操作システムは、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムであって、前記受付装置は、前記音声指示を音声認識する音声認識手段と、前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知手段と、を備え、前記処理装置は、画像処理装置であって、前記操作命令の命令内容に対応する処理を実行する処理手段と、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶手段と、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定手段と、を備え、前記処理手段は、前記処理特定手段が特定した事前処理を、前記処理として実行し、前記処理特定手段は、前記操作命令が、カラー画像の形成に関する命令である場合には、前記事前処理をカラー設定に対応したトナー又はインクの供給を準備する処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作システムは、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムであって、前記受付装置は、前記音声指示を音声認識する音声認識手段と、前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知手段と、を備え、前記処理装置は、画像処理装置であって、前記操作命令の命令内容に対応する処理を実行する処理手段と、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶手段と、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定手段と、を備え、前記処理手段は、前記処理特定手段が特定した事前処理を、前記処理として実行し、前記処理特定手段は、前記操作命令が、複数の辞書のうちのいずれかの辞書を用いた文字認識処理に関する命令である場合には、前記事前処理を前記複数の辞書をそれぞれ用いた複数の文字認識結果を用意する処理をとすることを特徴とする。
また、前記受付装置は、更に、前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、当該一部の再指示を受け付ける再指示受付手段と、当該再指示された一部を、追加操作命令として、前記処理装置へ通知する追加通知手段と、を備え、前記処理装置は、更に、前記操作命令および追加操作命令に応じた本処理を、前記事前処理の結果を利用して、実行する本実行手段を備えてもよい。
また、前記受付装置は、更に、音声認識によってユーザーを特定するユーザー特定手段と、特定したユーザーを前記処理装置に通知するユーザー通知手段と、を備え、前記通知手段は、前記音声指示から特定されたユーザーを併せて通知し、前記追加通知手段は、前記再指示から特定されたユーザーを併せて通知し、前記処理装置は、更に、ユーザーに対応付けられた複数のジョブを実行することができ、前記通知されたユーザーに対応付けられたジョブを特定するジョブ特定手段を備え、前記本実行手段は、同一のユーザーに係る操作命令および追加操作命令に応じた本処理を実行してもよい。
また、前記再指示受付手段は、前記音声指示のうち音声認識を失敗した一部を示して再指示を要求する再指示要求手段を備え、当該要求に対するユーザーの回答を、前記再指示として受け付けてもよい。
また、前記再指示要求手段は、前記音声指示のうち音声認識に失敗した一部を音声出力するとともに、当該一部の音声認識に失敗した旨の音声を出力することによって、再指示を要求してもよい。
また、前記再指示要求手段は、前記音声指示のうち音声認識に失敗した一部を警告音に置き換えた音声を出力することによって、再指示を要求してもよい。
また、前記処理特定手段は、前記操作命令において解像度が指定されている場合には、前記事前処理を、前記解像度に応じた定着温度のウォームアップ処理としてもよい。
また、前記処理特定手段は、前記操作命令において解像度が指定されている場合には、前記事前処理を、前記指定された解像度でファイルを作成する処理としてもよい。
また、前記処理特定手段は、前記画像処理装置が複数の送信方法でファイルを送信することができる場合には、前記事前処理は、前記各送信方法における通信設定処理を含んでもよい。
また、前記処理特定手段は、前記操作命令において、入力する画像サイズの変倍率が指定されている場合には、前記事前処理は、原稿を読み取って画像データを生成し、得られた画像データに前記変倍率で変倍する処理を含んでもよい。
また、前記処理特定手段は、前記操作命令において、用紙サイズが指定されている場合には、前記事前処理は、指定された用紙サイズの用紙を搬送して、当該搬送方向におけるトナー像の転写位置よりも上流側の待機位置で当該用紙を待機させる処理を含んでもよい。
また、前記本実行手段は、前記受付装置から追加操作命令を通知されるまで、本処理の実行を待ってもよい。
また、複数の処理装置を有し、前記受付装置は、前記ユーザーおよび前記処理装置の位置を特定して、前記ユーザーからの距離が最も短い処理装置を選択する装置選択手段を備え、前記通知手段は、前記装置選択手段が選択した処理装置へ前記通知を行ってもよい。
また、前記受付装置は、前記音声指示を受け付けるスマートスピーカーと、前記音声認識手段と、前記通知手段とを有するサーバーと、を備えてもよい。
また、本発明の一形態に係る音声操作方法は、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムが実行する音声操作方法であって、前記受付装置が前記音声指示を音声認識する音声認識ステップと、前記音声認識ステップが前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、前記処理装置は、画像処理装置であって、前記画像処理装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、前記画像処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、前記画像処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を含み、前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、前記処理特定ステップにおいては、前記操作命令が、プリント操作に関する命令である場合には、当該画像処理装置がウォームアップ処理を完了したか否かを確認して、ウォームアップ処理が完了していなければ、前記事前処理をウォームアップ処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作方法は、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムが実行する音声操作方法であって、前記受付装置が前記音声指示を音声認識する音声認識ステップと、前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、前記処理装置は、端末装置であって、前記端末装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、前記端末装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、前記端末装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を含み、前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、前記処理特定ステップにおいては、前記操作命令が、プリント操作に関する命令である場合には、前記事前処理を前記端末装置がプリントジョブを作成するためのプリンター・ドライバーを起動するとともに、前記操作命令で指定されているプリント条件を前記プリンター・ドライバーに入力する処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作方法は、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムが実行する音声操作方法であって、前記受付装置が前記音声指示を音声認識する音声認識ステップと、前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、前記処理装置は画像処理装置であって、前記画像処理装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、前記画像処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、前記画像処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を含み、前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、前記処理特定ステップにおいては、前記操作命令が、前記画像処理装置が原稿から読み取った画像データ、または予め記憶している画像データのファイル送信に関する命令である場合には、前記事前処理を送信すべきファイルを作成可能な複数のファイル形式で作成する処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作方法は、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムが実行する音声操作方法であって、前記受付装置が前記音声指示を音声認識する音声認識ステップと、前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、前記処理装置は画像処理装置であって、前記画像処理装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、前記画像処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、前記画像処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を含み、前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、前記処理特定ステップにおいては、前記操作命令が、コピー操作に関する命令である場合には、当該画像処理装置がウォームアップ処理を完了したか否かを確認して、ウォームアップ処理が完了していなければ、前記事前処理をウォームアップ処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作方法は、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムが実行する音声操作方法であって、前記受付装置が前記音声指示を音声認識する音声認識ステップと、前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、前記処理装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、前記処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、前記処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を含み、前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、前記処理特定ステップにおいては、前記操作命令が、自動原稿搬送装置を用いた原稿の読み取りを要する命令である場合には、前記事前処理を、自動原稿搬送装置を用いて原稿の両面を読み取る処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作方法は、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムが実行する音声操作方法であって、前記受付装置が前記音声指示を音声認識する音声認識ステップと、前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、前記処理装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、前記処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、前記処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を含み、前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、前記処理特定ステップにおいては、前記操作命令が、カラー画像の形成に関する命令である場合には、前記事前処理をカラー設定に対応したトナー又はインクの供給を準備する処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作方法は、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムが実行する音声操作方法であって、前記受付装置が前記音声指示を音声認識する音声認識ステップと、前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、前記処理装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、前記処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、前記処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を含み、前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、前記処理特定ステップにおいては、前記操作命令が、複数の辞書のうちのいずれかの辞書を用いた文字認識処理に関する命令である場合には、前記事前処理を前記複数の辞書をそれぞれ用いた複数の文字認識結果を用意する処理をとすることを特徴とする。
また、複数の処理装置を有する音声操作システムにおいて、前記受付装置が、前記ユーザーおよび前記処理装置の位置を特定して、前記ユーザーからの距離が最も短い処理装置を選択する装置選択ステップを含み、前記通知ステップにおいては、前記装置選択ステップにて選択した処理装置へ前記通知を行ってもよい。
また、本発明の一形態に係る音声操作プログラムは、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有するコンピューターシステムに音声操作を実行させる音声操作プログラムであって、前記受付装置が前記音声指示を音声認識する音声認識ステップと、前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、前記処理装置は画像処理装置であって、前記受付装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、前記画像処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、前記画像処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を前記コンピューターシステムに実行させ、前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、前記処理特定ステップにおいては、前記操作命令が、プリント操作に関する命令である場合には、当該画像処理装置がウォームアップ処理を完了したか否かを確認して、ウォームアップ処理が完了していなければ、前記事前処理をウォームアップ処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作プログラムは、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有するコンピューターシステムに音声操作を実行させる音声操作プログラムであって、前記受付装置が前記音声指示を音声認識する音声認識ステップと、前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、前記処理装置は端末装置であって、前記受付装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、前記端末装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、前記端末装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を前記コンピューターシステムに実行させ、前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、前記処理特定ステップにおいては、前記操作命令が、プリント操作に関する命令である場合には、前記事前処理を前記端末装置がプリントジョブを作成するためのプリンター・ドライバーを起動するとともに、前記操作命令で指定されているプリント条件を前記プリンター・ドライバーに入力する処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作プログラムは、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有するコンピューターシステムに音声操作を実行させる音声操作プログラムであって、前記受付装置が前記音声指示を音声認識する音声認識ステップと、前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、前記処理装置は画像処理装置であって、前記受付装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、前記画像処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、前記画像処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を前記コンピューターシステムに実行させ、前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、前記処理特定ステップにおいては、前記操作命令が、前記画像処理装置が原稿から読み取った画像データ、または予め記憶している画像データのファイル送信に関する命令である場合には、前記事前処理を送信すべきファイルを作成可能な複数のファイル形式で作成する処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作プログラムは、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有するコンピューターシステムに音声操作を実行させる音声操作プログラムであって、前記受付装置が前記音声指示を音声認識する音声認識ステップと、前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、前記処理装置は画像処理装置であって、前記受付装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、前記画像処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、前記画像処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を前記コンピューターシステムに実行させ、前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、前記処理特定ステップにおいては、前記操作命令が、コピー操作に関する命令である場合には、当該画像処理装置がウォームアップ処理を完了したか否かを確認して、ウォームアップ処理が完了していなければ、前記事前処理をウォームアップ処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作プログラムは、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有するコンピューターシステムに音声操作を実行させる音声操作プログラムであって、前記受付装置が前記音声指示を音声認識する音声認識ステップと、前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、前記受付装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、前記処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、前記処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を前記コンピューターシステムに実行させ、前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、前記処理特定ステップにおいては、前記操作命令が、自動原稿搬送装置を用いた原稿の読み取りを要する命令である場合には、前記事前処理を、自動原稿搬送装置を用いて原稿の両面を読み取る処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作プログラムは、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有するコンピューターシステムに音声操作を実行させる音声操作プログラムであって、前記受付装置が前記音声指示を音声認識する音声認識ステップと、前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、前記受付装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、前記処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、前記処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を前記コンピューターシステムに実行させ、前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、前記処理特定ステップにおいては、前記操作命令が、カラー画像の形成に関する命令である場合には、前記事前処理をカラー設定に対応したトナー又はインクの供給を準備する処理とすることを特徴とする。
また、本発明の別の一形態に係る音声操作プログラムは、処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有するコンピューターシステムに音声操作を実行させる音声操作プログラムであって、前記受付装置が前記音声指示を音声認識する音声認識ステップと、前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、前記受付装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、前記処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、前記処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を前記コンピューターシステムに実行させ、前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、前記処理特定ステップにおいては、前記操作命令が、複数の辞書のうちのいずれかの辞書を用いた文字認識処理に関する命令である場合には、前記事前処理を前記複数の辞書をそれぞれ用いた複数の文字認識結果を用意する処理をとすることを特徴とする。
また、本発明に係る音声操作プログラムは、複数の処理装置を有するコンピューターシステムにおいて、前記受付装置が、前記ユーザーおよび前記処理装置の位置を特定して、前記ユーザーからの距離が最も短い処理装置を選択する装置選択ステップを含み、前記通知ステップにおいては、前記装置選択ステップにおいて選択した処理装置へ前記通知を行ってもよい。
このようにすれば、ユーザー指示の音声認識に失敗した場合におけるジョブの実行開始の遅延を抑制することができる。
本発明の実施の形態に係る画像形成システムの主要な構成を示す図である。 ユーザー指示の音声認識処理が成功した場合における処理の流れを表すシーケンス図である。 ユーザー指示の音声認識処理が一部失敗した場合における処理の流れを表すシーケンス図である。 スマートスピーカー100の主要なハードウェア構成を示すブロック図である。 バーチャルアシスタントサーバー110の主要なハードウェア構成を示すブロック図である。 バーチャルアシスタントサーバー110の主要な機能構成を示すブロック図である。 操作対象特定テーブルを例示する図である。 バーチャルアシスタントサーバー110のメインルーチンを説明するフローチャートである。 バーチャルアシスタントサーバー110の事前操作命令処理を説明するフローチャートである。 バーチャルアシスタントサーバー110の再指示要求処理を説明するフローチャートである。 バーチャルアシスタントサーバー110の追加操作命令処理を説明するフローチャートである。 バーチャルアシスタントサーバー110の通常操作命令処理を説明するフローチャートである。 複合機120の主要な構成を示す図である。 複合機120の主要なハードウェア構成を示すブロック図である。 複合機120の主要な機能構成を示すブロック図である。 事前処理テーブル1505を例示する図である。 複合機120のメインルーチンを説明するフローチャートである。 複合機120の事前処理を説明するフローチャートである。 複合機120の本処理を説明するフローチャートである。 複合機120の通常処理を説明するフローチャートである。 携帯端末装置130の主要なハードウェア構成を示すブロック図である。 携帯端末装置130の主要な機能構成を示すブロック図である。 事前処理テーブル2205を例示する図である。 携帯端末装置130のメインルーチンを説明するフローチャートである。 携帯端末装置130の事前処理を説明するフローチャートである。 携帯端末装置130の本処理を説明するフローチャートである。 携帯端末装置130の通常処理を説明するフローチャートである。 従来技術に係る音声操作を説明する図である。
以下、本発明に係る音声操作システム、音声操作方法および音声操作プログラムの実施の形態について、画像形成システムを例にとり、図面を参照しながら説明する。
[1]画像形成システムの構成
まず、本実施の形態に係る画像形成システムの構成について説明する。
図1に示すように、画像形成システム1は、スマートスピーカー(SS: Smart Speaker)100、バーチャルアシスタント(VA: Virtual Assistant)サーバー110、複合機(MFP: Multi-Function Peripheral)120等を、通信ネットワーク150を用いて相互通信可能に接続したものである。通信ネットワーク150には、いわゆるインターネットやLAN(Local Area Network)が含まれる。
スマートスピーカー100は、画像形成システム1のユーザーから音声によってユーザー指示を受け付けると、音声データを生成してバーチャルアシスタントサーバー110へ送信する。また、スマートスピーカー100は、バーチャルアシスタントサーバー110から音声データを受信すると、当該音声データを音声出力する。
バーチャルアシスタントサーバー110は、スマートスピーカー100からユーザー指示の音声データを受信すると、音声認識処理によってテキストデータに変換し、当該テキストデータを解析することによってユーザー指示の内容に応じた処理を複合機120に実行させる。また、音声認識処理に失敗した場合には、ユーザーに再指示を要求するテキストデータを生成して、音声合成処理によって当該テキストデータから音声データを合成し、当該音声データをスマートスピーカー100へ送信する。
複合機120は、プリンター機能、スキャナー機能、コピー機能、ファクシミリ機能などの機能を有しており、バーチャルアシスタントサーバー110や携帯端末装置130、パーソナルコンピューター(PC)140等からジョブを受け付けて実行する。また、複合機120は、操作パネルを備えており、当該操作パネルによって受け付けたジョブも実行する。
携帯端末装置130は、画像形成に用いる電子データをユーザーに作成させる機能と、作成した電子データを含む印刷ジョブを複合機120へ送信する機能とを備えている。印刷ジョブを送信する際には、プリンター・ドライバーが起動される。携帯端末装置130は、無線LAN親機160と無線接続することによって、通信ネットワーク150を経由して複合機120に印刷ジョブを送信する。
パーソナルコンピューター140は、携帯端末装置130と同様に、画像形成に用いる電子データをユーザーに作成させる機能と、作成した電子データを含む印刷ジョブを複合機120へ送信する機能とを備えている。印刷ジョブを送信する際には、プリンター・ドライバーが起動され、通信ネットワーク150を経由して複合機120に印刷ジョブを送信する。
[2]画像形成システム1の動作
次に、画像形成システム1の動作について説明する。
図2に示すように、画像形成システム1のユーザーが、ユーザー指示をスマートスピーカー100に音声入力すると、スマートスピーカー100はユーザー指示の音声データを生成して、バーチャルアシスタントサーバー110へ送信する。
バーチャルアシスタントサーバー110は、スマートスピーカー100からユーザー指示の音声データを受信すると、当該音声データから話者識別処理によってユーザーを特定して、ユーザー識別情報を生成する。また、音声認識処理によってユーザー指示の音声データからテキストデータを生成し、自然言語処理によって当該テキストデータからユーザー指示に係る操作対象および命令内容を特定する。
なお、操作対象が複合機120であって、かつ複合機120が複数ある場合には、スマートスピーカー100の位置を特定して、スマートスピーカー100に最も近い複合機120を操作対象とする。
バーチャルアシスタントサーバー110は、ユーザー識別情報、命令内容および当該命令が通常操作命令であることを表す命令識別情報からなる通常操作命令を作成し、操作対象へ送信する。操作対象は、例えば、複合機120や携帯端末装置130である。
操作対象の複合機120または携帯端末装置130は、通常操作命令を受信すると、ユーザー識別情報を用いてユーザー認証を実行し、ユーザー認証が成功したら、命令内容を参照して命令を実行する。
しかしながら、ユーザー指示の音声データからテキストデータを生成する音声認識処理が一部失敗する場合もある。
例えば、スマートスピーカー100に対していわゆる話し言葉でユーザー指示が行われると、話し言葉は音声の音響的特徴が曖昧となる発声の怠けが起こることから、音声認識時に音素の混同が起こり易くなるため、音声認識処理が部分的に失敗する場合がある。また、「えーっと」「あのー」等のフィラーと呼ばれる単語の挿入や、「は」「が」などの助詞の脱落,更に「○○っていう」等の話し言葉特有の発声変形がある箇所でも音声認識処理に失敗する可能性がある。言うまでもなく、雑音の混入によっても音声認識処理に失敗し得る。
このように、ユーザー指示の音声認識処理が一部失敗した場合においても、図3に示すように、まず、画像形成システム1のユーザーが、ユーザー指示をスマートスピーカー100に音声入力すると、スマートスピーカー100はユーザー指示の音声データを生成して、バーチャルアシスタントサーバー110へ送信する。
バーチャルアシスタントサーバー110は、スマートスピーカー100からユーザー指示の音声データを受信すると、当該音声データから話者識別処理によってユーザーを特定して、ユーザー識別情報を生成する。
音声認識処理によってユーザー指示の音声データからテキストデータを生成する際に一部失敗した場合には、バーチャルアシスタントサーバー110は、ユーザーに対して再指示を要求する音声データを合成して、スマートスピーカー100へ送信する。スマートスピーカー100は、再生指示要求の音声データを音声出力する。
また、バーチャルアシスタントサーバー110は、ユーザー指示の音声データから話者識別処理によってユーザーを識別して、ユーザー識別情報を生成するとともに、音声認識処理に失敗した部分を除いてテキストデータを生成し、自然言語処理によって当該テキストデータからユーザー指示に係る操作対象および命令内容を特定する。そして、当該命令が事前操作命令であることを表す命令識別情報、ユーザー識別情報および音声認識処理に成功した部分の命令内容を含む事前操作命令を、ユーザー指示に係る操作対象へ送信する。
事前操作命令を受信した複合機120または携帯端末装置130は、ユーザー識別情報を用いてユーザー認証を実行し、当該ユーザー認証が成功したら、事前操作命令に含まれた命令内容を参照して、当該命令内容に対応する事前処理を特定し、特定した事前処理を実行する。
その後、スマートスピーカー100は、ユーザーから再指示を受けると、再指示の音声データを生成して、バーチャルアシスタントサーバー110へ送信する。
再指示の音声データを受信したバーチャルアシスタントサーバー110は、再指示の音声データから話者識別処理によってユーザーを特定して、ユーザー識別情報を生成する。また、バーチャルアシスタントサーバー110は、音声認識処理によって再指示のテキストデータを生成し、自然言語処理によって当該テキストデータから再指示に係る操作対象および命令内容を特定する。
そして、バーチャルアシスタントサーバー110は、当該命令が追加操作命令であることを表す命令識別情報、再指示に係るユーザー識別情報および命令内容を含む追加操作命令を、再指示に係る操作対象へ送信する。
追加操作命令を受信した複合機120または携帯端末装置130は、ユーザー識別情報を用いてユーザー認証を実行し、当該ユーザー認証が成功したら、追加操作命令に含まれた命令内容と先に受信した事前操作命令に含まれた命令内容とを参照して、これらの命令内容に対応する本処理を特定し、特定した本処理を実行する。
[3]スマートスピーカー100の構成
次に、スマートスピーカー100の構成について説明する。
図4に示すように、スマートスピーカー100は、音声処理部401、通信制御部402および位置検出部403を備えており、更に、音声処理部401にはマイク411とスピーカー412が接続されている。
音声処理部401は、マイク411を用いて集音したアナログ音声信号をAD(Analogue to Digital)変換し、更に圧縮符号化した音声データを生成したり、通信制御部402から受け付けた音声データからアナログ音声信号を復元して、スピーカー412に音声出力させたりする。通信制御部402は、通信ネットワーク150を経由してバーチャルアシスタントサーバー110と音声データ等の送受信を行うための通信処理を実行する。
位置検出部403は、GPS(Global Positioning System)を用いてスマートスピーカー100の現在位置を検出し、バーチャルアシスタントサーバー110へ音声データを送信する際に併せて位置情報を送信する。
[4]バーチャルアシスタントサーバー110の構成と動作
次に、バーチャルアシスタントサーバー110の構成と動作について説明する。
(4-1)バーチャルアシスタントサーバー110の構成
図5に示すように、バーチャルアシスタントサーバー110は、CPU(Central Processing Unit)500やROM(Read Only Memory)501、RAM(Random Access Memory)502等を備えており、RAM502を作業用記憶領域として、HDD(Hard Disk Drive)503からOS(Operating System)その他のプログラムを読み出して実行する。
NIC(Network Interface Card)504は、通信ネットワーク150を経由してスマートスピーカー100や複合機120、携帯端末装置130、PC140と相互接続するための通信処理を実行する。ROM501はブートプログラムを記憶しており、CPU500はリセット後に当該ブートプログラムを読み出して起動する。
図6は、バーチャルアシスタントサーバー110の機能構成を示すブロック図である。図6に示すように、バーチャルアシスタントサーバー110は、指示受付部601にてスマートスピーカー100からユーザー指示および再指示の音声データとスマートスピーカー100の位置情報とを受け付ける。
指示認識部602は、ユーザー指示および再指示の音声データから音声認識処理によってテキストデータを生成する。本実施の形態においては、ノイズリダクションアルゴリズムを用いて音声データのノイズレベルを低減してから、音声データの周波数特性を用いて音声データを音素単位でモデル化した音響モデルP(X|S)、単語ごとに当該単語を構成する音素を定義した発音辞書P(S|W)および単語のつながり易さを規定した言語モデルP(W)の三つの確率モデルの積P(X|S)・P(S|W)・P(W)が最大になる単語列Wを求めることによって、テキストデータを生成する。
認識結果判定部603は、ユーザー指示の音声認識処理が一部失敗したか否かを判定する。例えば、上述のように話し言葉における発音の怠けが発生すると、音声データ中の当該期間では音声の音響的特徴が曖昧になるので、音響モデルP(X|S)の値が小さくなる。また、雑音の混入によっても確率モデルの値が低下する。このような確率モデルの値の低下を検出すれば、音声認識処理が一部失敗したと判定することができる。
再指示要求合成部604は、ユーザー指示の音声認識処理に一部失敗したと認識結果判定部603が判定した場合に、ユーザー指示の音声データのうち音声認識処理に失敗した部分を警告音(例えば、「ピーッ」というビープ音を用いてもよい。)に置換し、再指示を要求するメッセージの音声データを追加することによって再指示要求の音声データを合成する。
例えば、ユーザー指示の音声データが「近くのMFPで、このWordファイルを、2in1、(音声認識処理に失敗した部分)、A4再生紙にプリントして」である場合、まず、音声認識処理に失敗した部分を警告音に置換して、「近くのMFPで、このWordファイルを、2in1、(警告音)、A4再生紙にプリントして」との音声データを合成する。更に、「聞き取れませんでした。もう一度言って下さい。」との再指示を要求するメッセージの音声データを追加する。
その結果、再指示要求の音声データとして、「聞き取れませんでした。もう一度言って下さい。近くのMFPで、このWordファイルを、2in1、(警告音)、A4再生紙にプリントして」との音声データを得る。
再指示要求送信部608は、再指示要求合成部604が合成した再指示要求の音声データをスマートスピーカー100へ送信する。
ユーザー特定部606は、ユーザー指示および再指示の音声データからテキスト独立型の話者識別処理によってユーザー識別情報を生成する。話者識別処理においては、まず、ノイズリダクションアルゴリズムを用いて音声データのノイズレベルを低減してから、例えば、混合ガウス分布(GMM: Gaussian mixture model)によって表現した話者モデルの平均ベクトルを連結し、高次元のベクトル(GMM supervector)を構成した後、識別モデルであるサポートベクターマシン(SVM: Support Machine)によって話者識別を行う手法を用いることができる。なお、他の方法を用いてユーザー識別情報を生成してもよいことは言うまでもない。
操作命令生成部607は、通常操作命令、事前操作命令および追加操作命令を生成する。操作命令生成部607は、再指示要求の音声データスマートスピーカー100へ送信した後に受け付けた指示は再指示であると判断して、追加操作命令の命令識別情報を選択する。再指示でないと判断した場合であって、指示認識部602が音声認識処理に成功したと、認識結果判定部603が判定した場合には、通常操作命令の命令識別情報を選択する。更に、指示認識部602が音声認識処理に一部失敗したと、認識結果判定部603が判定した場合には、事前操作命令の命令識別情報を選択する。
操作命令生成部607は、指示認識部602からユーザー指示または再指示のテキストデータを取得して、音声認識処理に成功した部分の命令内容を特定し、ユーザー特定部606からユーザー識別情報を取得して、命令識別情報、ユーザー識別情報および命令内容を含んだ操作命令を生成する。
操作対象特定部609は、指示受付部601からスマートスピーカー100の位置情報を取得し、操作命令生成部607から命令内容を取得して、操作対象を特定する。このため、操作対象特定部609は、命令内容と複合機120の位置情報との組み合わせに、操作対象を対応付ける操作対象特定テーブルを記憶しており、当該操作対象特定テーブルを参照して、スマートスピーカー100の位置に応じた操作対象を特定する。
図7は、操作対象特定テーブルを例示する図である。図7に示すように、操作対象特定テーブルにおいては、例えば、命令内容が「プリント」であって、かつMFPの位置情報aaaaがスマートスピーカー100に最も近い場合には、操作対象として、MFP#1と携帯端末装置#1を選択する。また、命令内容が「スキャン」であって、かつMFPの位置情報bbbbがスマートスピーカー100に最も近い場合には、操作対象として、MFP#3を選択する。
このようにすればスマートスピーカー100に最も近い位置に配設されている複合機120を操作対象とすることができる。ユーザーはスマートスピーカー100の近くにいて、音声指示を行っているので、スマートスピーカー100に近い複合機120はユーザーにも近い位置にあることになる。そのような複合機120を選択して操作すれば、ユーザーの利便性を向上させることができる。
操作命令送信部610は、操作命令生成部607が生成した操作命令を、操作対象特定部609が特定した操作対象へ送信する。
(4-2)バーチャルアシスタントサーバー110の動作
次に、バーチャルアシスタントサーバー110の動作について説明する。
(4-2-1)メインルーチン
図8に示すように、バーチャルアシスタントサーバー110は、指示受付部601にてユーザー指示を受け付けると(S801:YES)、指示認識部602にて、音声認識処理によってユーザー指示の音声データからテキストデータを生成する(S802)。
指示認識部602がユーザー指示の音声認識処理に一部失敗した、と認識結果判定部603が判定した場合には(S803:YES)、事前操作命令処理(S804)および再指示要求処理(S805)を順次実行する。その後、指示受付部601がスマートスピーカー100から再指示の音声データを受信したら(S806:YES)、追加操作命令処理(S807)を実行する。追加操作命令処理の完了後、ステップS801へ進んで上記の処理を繰り返す。
指示認識部602がユーザー指示の音声認識処理に成功した、と認識結果判定部603が判定した場合には(S803:NO)、通常操作命令処理を実行した後(S811)、ステップS801へ進んで上記の処理を繰り返す。
(4-2-2)事前操作命令処理(S804)
事前操作命令処理においては、図9に示すように、ユーザー特定部606にて、ユーザー指示の音声データから話者識別処理によってユーザー識別情報を特定し(S901)、操作命令生成部607にて、自然言語処理を用いてユーザー指示のテキストデータから命令内容を生成する(S902)。
更に、操作命令生成部607にて、当該命令が事前操作命令であることを表す命令識別情報、ユーザー識別情報および命令内容を含む事前操作命令を生成する(S903)。
操作対象特定部609は、指示受付部601が音声データとともに受信した位置情報からスマートスピーカー100の位置を特定するとともに(S904)、当該スマートスピーカー100の位置情報および事前操作命令の命令内容を参照することによって、操作対象となる装置を特定する(S905)。その後、操作命令送信部610にて当該操作対象へ事前操作命令を送信し(S906)、メインルーチンに復帰する。
(4-2-3)再指示要求処理(S805)
再指示要求処理においては、図10に示すように、再指示要求合成部604にて、ユーザー指示の音声データにおいて音声認識処理に失敗した部分を警告音に置換して再指示要求の音声データを合成し(S1001)、更に当該音声データに再指示を要求するメッセージの音声データを追加する(S1002)。このようにして合成された再指示要求の音声データを再指示要求送信部608にてスマートスピーカー100へ送信した後(S1003)、メインルーチンに復帰する。
(4-2-4)追加操作命令処理(S807)
追加操作命令処理においては、図11に示すように、ユーザー特定部606にて、話者識別処理によって再指示の音声データからユーザー識別情報を特定し(S1101)、指示認識部602にて、音声認識処理によって再指示の音声データからテキストデータを生成し(S1102)、操作命令生成部607にて、自然言語処理を用いて再指示のテキストデータから命令内容を生成する(S1103)。そして、操作命令生成部607にて、当該命令が追加操作命令であることを表す命令識別情報、ユーザー識別情報および命令内容を含む追加操作命令を生成する(S1104)。
次に、操作対象特定部609にて、再指示とともに受信したスマートスピーカー100の位置情報を指示受付部601から受け付けてスマートスピーカー100の位置情報を特定し(S1105)、追加操作命令の命令内容と、スマートスピーカー100の位置情報とを用いて、操作対象を特定する(S1106)。そして、操作命令送信部610にて当該操作対象へ追加操作命令を送信した後(S1107)、メインルーチンに復帰する。
(4-2-5)操作命令処理(S811)
操作命令処理においては、図12に示すように、ユーザー特定部606にて、ユーザー指示の音声データから話者識別処理によってユーザー識別情報を特定する(S1201)。次に、操作命令生成部607にて、自然言語処理を用いてユーザー指示のテキストデータから命令内容を生成し(S1202)、当該命令が通常操作命令であることを表す命令識別情報、ユーザー識別情報および命令内容を含む通常操作命令を生成する(S1203)。
操作対象特定部609は、ユーザー指示受付部601が音声データとともに受信した位置情報からスマートスピーカー100の位置を特定するとともに(S1204)、操作命令の命令内容を参照することによって、操作対象となる装置を特定する(S1205)。その後、操作命令送信部615にて当該操作対象へ事前操作命令を送信し(S1206)、メインルーチンに復帰する。
[5]複合機120の構成と動作
次に、複合機120の構成と動作について説明する。
(5-1)複合機120の構成
図13に示すように、複合機120は、スキャナー装置1310、プリンター装置1320、給紙装置1330およびフィニッシャー装置1340を備えており、プリンター機能やスキャナー機能、コピー機能、ファクシミリ機能、ドキュメント・サーバー機能などの機能を果たす。
スキャナー装置1310は、プリンター装置1320が備える操作パネル1321によってユーザーから原稿の読み取り指示を受け付けると、自動原稿搬送装置(ADF: Automatic Document Feeder)1311を用いて、原稿トレイ1312に載置された原稿束から原稿を1枚ずつ画像読み取り部1313へ搬送し、画像読み取り部1313を用いて、原稿を読み取り画像データを生成する。読み取られた原稿は排紙トレイ1314上に排出される。
プリンター装置1320は、いわゆるタンデム型のカラープリンターであって、電子写真方式によって画像を形成する。プリンター装置1320は制御部1300を備えており、制御部1300は通信ネットワーク150を経由してバーチャルアシスタントサーバー110から通常操作命令や事前操作命令、追加操作命令を受け付けたり、操作パネル1321を用いたユーザーの指示入力によって印刷ジョブを受け付けたりする。
プリンター装置1320は、制御部1300にて印刷ジョブを受け付けると、モノクロ画像を形成する場合には、作像部1322Kのみを用いてK色のトナー像を形成して、中間転写ベルト1323上に静電転写(一次転写)する。また、カラー画像を形成する場合には、作像部1322Y、1322M、1322Cおよび1322Kを用いてYMCK各色のトナー像を形成して、これらのトナー像が互いに重なり合うように中間転写ベルト1323上に静電転写(一次転写)する。これによって、カラートナー像が形成される。
中間転写ベルト1323は、二次転写ローラー対1325、従動ローラーおよびテンションローラーに張架されており、二次転写ローラー対1325の回転駆動によって矢印A方向に回転走行する。中間転写ベルト1323は、当該回転走行によってトナー像を、二次転写ローラー対1325まで搬送する。
給紙装置1330は、給紙トレイ1331、1332、1333および1334のうち、印刷ジョブにおける紙種の指定に応じた給紙トレイに収容されている記録シートを、それぞれピックアップローラー1331r、1332r、1333rおよび1334rを用いて1枚ずつ繰り出す。繰り出された記録シートは、搬送ローラーによって搬送され、タイミングローラー1324によってスキューを補正されるとともに、搬送タイミングを調整された後、二次転写ローラー対1325まで搬送される。
二次転写ローラー対1325には二次転写バイアス電圧が印可されており、これによって、中間転写ベルト1323上のトナー像が記録シートへ静電転写(二次転写)される。二次転写後に中間転写ベルト1323上に残留するトナーは、クリーニングブレード1326によって掻き取られ廃棄される。記録シートは、定着装置1327によってトナー像を熱定着された後、搬送経路1328を経由して、フィニッシャー装置1340へ向かって搬送される。
定着装置1327は、高温の定着ニップに記録シートを通紙することによって、トナー像を熱定着する。このため、定着装置1327は、熱定着に先立って、定着ニップの温度(定着温度)を所定の目標温度まで昇温しておく必要がある。この昇温処理をウォームアップという。定着装置1327は、ウォームアップの目標温度はトナー像の解像度に応じて変更することによって、高い定着画質を実現する。
フィニッシャー装置1340は、印刷ジョブにおいて後処理が指示されているか否かに応じて経路切り替え爪1345の姿勢を制御する。後処理が指示されていない場合には、記録シートは、搬送経路1341を経由し、経路切り替え爪1345によって排紙トレイ1342へ導かれる。また、後処理が指示されている場合には、経路切り替え爪1345は記録シートを後処理装置1343へ導く。
後処理装置1343は、印刷ジョブにおける指示に応じて、記録シート束の整合、パンチ、ステープルおよび折り等の後処理を記録シートに施す。後処理を施された記録シートは排紙トレイ1344上へ排出される。
図14に示すように、制御部1300は、CPU1400やROM1401、RAM1402等を備えており、複合機120に電源が投入されると、CPU1400は、一旦リセットされた後、ROM1401からブートプログラムを読み出して起動し、RAM1402を作業用記憶領域として、HDD1403からOSや監視制御プログラム等を読み出して実行する。これによって、制御部1300は、スキャナー装置1310、プリンター装置1320、給紙装置1330およびフィニッシャー装置1340の動作を監視制御する。
NIC1404は、通信ネットワーク150を経由してバーチャルアシスタントサーバー110や携帯端末装置130、PC140と相互接続するための通信処理を実行する。ファクシミリインターフェイス1405はファクシミリ回線を経由して他のファクシミリ装置とファクシミリデータを送受信するための通信処理を実行する。
図15は、複合機120の主要な機能構成を表したブロック図である。図15に示すように、複合機120は、命令受付部1501やユーザー認証部1502、命令内容取得部1503等を備えている。
命令受付部1501は、バーチャルアシスタントサーバー110から通常操作命令、事前操作命令および追加操作命令を受信する。
ユーザー認証部1502は、操作命令に含まれているユーザー識別情報を参照して、認証処理を実行する。
命令内容取得部1503は、ユーザー認証部1502のユーザー認証が成功した場合に、命令受付部1501が受信した命令に含まれている命令内容を取得する。
通常処理実行部1504は、命令受付部1501が受け付けた操作命令が通常操作命令である場合に、命令内容取得部1503で取得した命令内容の通常処理を実行する。
事前処理テーブル1505は、事前操作命令の命令内容、事前処理を実行するか否かを判定するための事前処理条件および事前処理を関連付けて記憶する。図16に例示するように、事前処理テーブル1505においては、命令内容ごとに、事前処理条件と事前処理とが記憶される。
例えば、事前操作命令の命令内容がプリントであって、かつ複合機120のウォームアップが完了である場合には、事前処理としてウォームアップを実行する。また、事前操作命令の命令内容が解像度を指定したプリントであって、かつ複合機120のウォームアップが完了である場合には、事前処理として解像度に応じたウォームアップを実行する。
事前処理特定部1506は、事前処理テーブル1505を参照して、命令内容取得部1503が取得した事前操作命令の命令内容に対応する欄が事前処理テーブル1505にあり、かつ、当該欄の事前処理条件が充足されている場合には、当該欄の事前処理を特定する。
事前処理実行部1509は、事前処理特定部1506が特定した事前処理を実行する。事前処理実行部1509は、事前処理として、例えば、定着装置1327のウォームアップを行ったり、スキャナー装置1310で原稿から読み取って生成した画像データのファイル形式や解像度を変換したりする。
画像データのファイル形式には、例えば、PDF(Portable Document Format)やJPEG(Joint Photographic Experts Group)、TIFF(Tagged Image File Format)、ビットマップ形式などが挙げられる。また、解像度は、例えば、600dpi(Dot Per Inch)、400dpi、300dpiおよび200dpiなどである。
更に、事前処理としては、スキャン送信やBOX送信を行う場合の通信設定も行うことができる。通信設定することができる通信方法としては、例えば、SMB(Server Message Block)、電子メール、FTP(File Transfer Protocol)、ファクシミリを挙げることができる。
事前処理として、OCR処理を実行する場合には、OCR処理に用いる辞書として、例えば、日本語や英語、中国語などの辞書を挙げることができる。
事前操作命令記憶部1507は、命令内容取得部1503が取得した事前操作命令の命令内容を記憶する。
本処理特定部1508は、命令内容取得部1503が取得した追加操作命令の命令内容と、事前操作命令記憶部1507が記憶している事前操作命令の命令内容と、を組み合わせた命令内容の本処理を特定する。
本処理実行部1510は、本処理特定部1508が特定した本処理を実行する。
(5-2)複合機120の動作
次に、複合機120の動作について説明する。
図17に示すように、複合機120は、命令受付部1501にて操作命令を受け付けると(S1701:YES)、ユーザー認証部1502は、操作命令に含まれたユーザー識別情報を取得し(S1702)、取得したユーザー識別情報を用いてユーザー認証を実行する(S1703)。当該ユーザー認証に失敗したら(S1704:NO)、ステップS1701へ進んで、上記の処理を繰り返す。ユーザー認証に成功したら(S1704:YES)、操作命令に含まれる命令識別情報を参照する(S1705)。
命令識別情報が事前操作命令を示す場合は(S1706:YES)、事前処理を実行する(S1711)。命令識別情報が追加操作命令を示す場合は(S1707:YES)、本処理を実行する(S1712)。また、通常操作命令である場合には(S1708:YES)、通常処理を実行する(S1713)。ステップS1711、S1712およびS1713の処理の後、ステップS1701へ進んで、上記の処理を繰り返す。
(5-2-1)事前処理(S1711)
事前処理においては、図18に示すように、まず、命令内容取得部1503にて事前操作命令の命令内容を取得し(S1801)、事前処理特定部1506にて事前処理テーブル1505を参照して、命令内容に対応する事前処理条件が記憶されているか確認する(S1802)。該当する事前処理条件が事前処理テーブル1505に記憶されている場合には(S1803:YES)、事前処理テーブル1505において事前処理条件に対応する事前処理を特定し(S1804)、特定した事前処理を実行する(S1805)。
事前操作命令の命令に対応する事前処理条件が事前処理テーブルに記憶されていない場合(S1803:NO)、およびステップS1805の処理の後、事前操作命令記憶部1507は事前操作命令に係るユーザー識別情報と命令内容とを関連付けて記憶して(S1806)、上位ルーチンに復帰する。
(5-2-2)本処理(S1712)
本処理においては、図19に示すように、まず、命令内容取得部1503にて追加操作命令の命令内容を取得し(S1901)、事前操作命令記憶部1507が、当該追加操作命令に係るユーザー識別情報に関連付けて記憶している命令内容を特定する(S1902)。そして、本処理特定部1508にて追加操作命令に係る命令内容と、当該追加操作命令に対応する事前操作命令に係る命令内容と、から本処理を特定し(S1903)、本処理実行部1510にて当該本処理を実行した後(S1904)、上位ルーチンに復帰する。
(5-2-3)通常処理(S1713)
通常処理においては、図20に示すように、命令内容取得部1503にて通常操作命令の命令内容を取得し(S2001)、通常処理実行部1504にて当該命令内容の通常処理を実行した後(S2002)、上位ルーチンに復帰する。
(5-3)事前処理の具体例
事前処理について具体例を挙げて説明する。
(5-3-1)具体例1
複合機120は、事前操作命令の命令内容に「プリント」または「コピー」という語が含まれている場合には、事前処理テーブル1505を参照して、「プリントまたはコピー」になっている命令内容の欄を探し、当該欄に対応する事前処理条件の欄を参照する。図16の例では、当該事前処理条件の欄に「ウォームアップが未完了」と記載されているので、複合機120は、定着装置1327の定着温度を参照して、所定の目標温度に達しているか否かを確認する。
ウォームアップが未完了である場合には、事前処理の欄に記載されている「ウォームアップ」を事前処理として実行する。このようにすれば、追加操作命令を受け付けてからウォームアップを開始する場合と比較して、プリントおよびコピーにおけるFCOT(First Copy Out Time)を短縮することができるので、ユーザーの利便性を高めることができる。
また、ウォームアップが完了している場合には、事前処理は不要である。
ユーザー指示を例示して説明すると、ユーザー指示が「近くのMFPで、このWordファイルを、2in1、両面で、A4再生紙にプリントして」であって、バーチャルアシスタントサーバー110が「両面で」の部分だけ音声認識に失敗した場合に、スマートスピーカー100を用いてユーザーに対して、「聞き取れませんでした。もう一度言って下さい」とユーザー指示の再入力を要求し、ユーザー指示が再入力されてから、複合機120がプリントを開始すると、プリントジョブの開始時間が遅くなる。
これに対して、上述のように、スマートスピーカー100を用いてユーザーに対して、「条件は、2in1、ピーッ、A4再生紙、で良いですか?」と音声認識に失敗した部分を警告音にして再指示を要求する。また、これと並行して、「近くのMFPで、このWordファイルを、2in1、A4再生紙にプリントして」という音声認識に成功した部分を利用して、事前操作命令を複合機120へ送信し、事前処理としてウォームアップを実施すれば、再指示によって確定した指示内容でのプリントジョブの開始時間を早めることができる。
(5-3-2)具体例2
事前操作命令の命令内容に「プリント」または「コピー」という語と、カラー設定を行う語とが含まれている場合には、事前処理テーブル1505を参照して、「プリントまたはコピー+カラー設定」になっている命令内容の欄を探し、当該欄に対応する事前処理条件の欄を参照する。図16の例では、当該事前処理条件の欄に「カラー設定が確定している」と記載されているので、事前操作命令の命令内容でカラー設定が確定しているか否かを確認する。
カラー設定が確定している場合には、カラー、2色カラーおよびモノクロのいずれかにカラー設定において使用されるトナーを供給する準備を実行する。
このようにすれば、追加操作命令を受け付けてからトナーを供給する準備を開始する場合と比較して、プリントおよびコピーを早く完了させることができるので、ユーザーの利便性を高めることができる。
(5-3-3)具体例3
事前操作命令の命令内容に「プリント」という語と、解像度を指定する語とが含まれている場合には、「プリント+解像度」の欄に対応する事前処理条件の欄を参照する。図16の例では、当該事前処理条件の欄に「ウォームアップが未完了」と記載されているので、複合機120は、定着装置1327の定着温度を参照して、所定の目標温度に達しているか否かを確認する。
ウォームアップが未完了である場合には、事前処理の欄に記載されている「解像度に応じたウォームアップ」を事前処理として実行する。ここで、解像度に応じたウォームアップとは解像度に対応する定着温度までウォームアップを実施することをいう。このようにすれば、追加操作命令を受け付けてからウォームアップを開始する場合よりもFCOTを短縮することができる。
また、ウォームアップが完了している場合には、事前処理は不要である。
(5-3-4)具体例4
事前操作命令の命令内容が「スキャン」または「BOX送信」という語が含まれている場合には、「スキャン又はBOX送信」の欄に対応する事前処理条件の欄が3つあるので、3つの事前処理条件を順に参照する。1つ目の事前処理条件として、当該事前操作命令においてファイル形式が指定する語が含まれているか否かを確認する(図16)。
ファイル形式を指定する語が含まれていない場合には、事前処理の欄に記載されている「可能なすべてのファイル形式に変換」を事前処理として実行する。可能なすべてのファイル形式とは、複合機120で生成可能なすべてのファイル形式であって、例えば、PDF、JPEG、TIFFおよびビットマップ形式などである。
このようにすれば、追加操作命令を受け付けてから、追加操作命令で指定されたファイル形式のファイルを選択するだけで済むので、追加操作命令を受けてからファイル形式を変換する場合と比較して、スキャンやBOX送信を早く完了させることができる。
なお、事前操作命令でファイル形式が指定されている場合には、直ちに指定されたファイル形式に変換する。
(5-3-5)具体例5
事前操作命令の命令内容が「スキャン」または「BOX送信」という語が含まれている場合には、「スキャン又はBOX送信」の欄に対応する2つ目の事前処理条件の欄も参照して、当該事前操作命令において解像度を指定する語が含まれているか否かを確認する(図16)。
解像度を指定する語が含まれていない場合には、事前処理の欄に記載されている「可能なすべての解像度に変換」を事前処理として実行する。可能なすべての解像度とは、複合機120で生成可能なすべての解像度であって、例えば、600dpi、400dpi、300dpiおよび200dpiなどである。
このようにすれば、追加操作命令を受け付けてから、追加操作命令で指定された解像度のファイルを選択するだけで済むので、追加操作命令を受けてから解像度を変換する場合と比較して、スキャンやBOX送信を早く完了させることができる。
なお、事前操作命令で解像度が指定されている場合には、直ちに指定された解像度に変換する。
(5-3-6)具体例6
事前操作命令の命令内容が「スキャン」または「BOX送信」という語が含まれている場合には、更に「スキャン又はBOX送信」の欄に対応する3つ目の事前処理条件の欄も参照して、当該事前操作命令において送信方法を指定する語が含まれているか否かを確認する(図16)。
送信方法を指定する語が含まれていない場合には、事前処理の欄に記載されている「可能なすべての送信方法で通信設定」を事前処理として実行する。可能なすべての送信方法とは、複合機120で実行可能なすべての送信方法であって、例えば、SMB、電子メール、FTP、ファクシミリなどである。通信設定は、例えば、通信を開始するために必要となるリソースを確保する処理や、コネクションやセッションの確立などである。
このようにすれば、追加操作命令を受け付けると、直ちに送信を開始することができるので、追加操作命令を受けてから通信設定を行う場合と比較して、スキャンやBOX送信を早く完了させることができる。
なお、事前操作命令で送信方法が指定されている場合には、指定された送信方法についてのみ通信設定を実行する。
ユーザー指示を例示して説明すると、ユーザー指示が「スキャンしたファイルを、1つのファイルにしてCompactPDF形式でPCにSMB送信してくれ」であって、バーチャルアシスタントサーバー110が「SMB」の部分だけ認識できなかった場合に、スマートスピーカー100を用いてユーザーに対して、「聞き取れませんでした。もう一度言って下さい」とユーザー指示の再入力を要求し、ユーザー指示が再入力されてから、複合機120がスキャンを開始すると、スキャン送信ジョブの完了が遅くなる。
これに対して、上述のように、スマートスピーカー100を用いてユーザーに対して、「どの送信方法で送信しますか?」、若しくは「ピーッ送信しますか?」と音声認識に失敗した部分を警告音にして再指示を要求する。また、これと並行して、「スキャンしたファイルを、1つのファイルにしてCompactPDF形式でPCに送信してくれ」という音声認識に成功した部分を利用して、事前操作命令を複合機120へ送信し、事前処理として通信設定を実施すれば、再指示によって確定した指示内容でのスキャン送信ジョブの完了を早めることができる。
(5-3-7)具体例7
事前操作命令の命令内容に「コピー」という語と、変倍率を指定する語とが含まれている場合には、「コピー+変倍率」の欄に対応する事前処理条件の欄が2つあるので、2つの事前処理条件を順に参照する。1つ目の事前処理条件として、定着装置1327の定着温度を参照して、所定の目標温度に達しているか否かを確認する(図16)。
定着温度が所定の目標温度に達しておらず、従ってウォームアップが完了していない場合には、事前処理の欄に記載されている「ウォームアップ+変倍処理」を事前処理として実行する。ウォームアップは定着装置1327を所定の目標温度まで昇温する処理であり、変倍処理は、指定された変倍率で画像データを変倍する処理である。
また、2つの事前処理条件に対応して、定着温度が所定の目標温度に達しており、ウォームアップが完了している場合には、事前処理の欄に記載されているように、変倍処理のみを実行する。
このようにすれば、追加操作命令を受け付けてから、ウォームアップおよび変倍処理を実行する場合と比較して、コピーを早期に完了させることができる。
(5-3-8)具体例8
事前操作命令の命令内容に「コピー」という語と、用紙サイズを指定する語とが含まれている場合には、「コピー+用紙サイズ」の欄に対応する事前処理条件の欄が2つあるので、2つの事前処理条件を順に参照する。1つ目の事前処理条件として、定着装置1327の定着温度を参照して、所定の目標温度に達しているか否かを確認する(図16)。
定着温度が所定の目標温度に達しておらず、従ってウォームアップが完了していない場合には、事前処理の欄に記載されている「ウォームアップ+用紙待機」を事前処理として実行する。ウォームアップは定着装置1327を所定の目標温度まで昇温する処理であり、用紙待機は、指定されたサイズの用紙の搬送を開始して、当該用紙の先端をタイミングローラー1324に突き当てた状態、言い換えると転写開始直前の位置で待機させる処理である。
また、2つの事前処理条件に対応して、定着温度が所定の目標温度に達しており、ウォームアップが完了している場合には、事前処理の欄に記載されているように、用紙待機のみを実行する。
このようにすれば、追加操作命令を受け付けてから、ウォームアップおよび用紙搬送を開始する場合と比較して、コピーを早期に完了させることができる。
(5-3-9)具体例9
事前操作命令の命令内容に「コピー」または「スキャン送信」という語と、自動原稿搬送装置1311の使用を指定する語とが含まれている場合には、「コピーまたはスキャン送信+ADF使用」の欄に対応する事前処理条件の欄を参照して、事前操作命令の命令内容に送信方法が指定されているか否かを確認する(図16)。
送信方法が指定されていない場合には、自動原稿搬送装置1331を用いて原稿の両面を読み取るとともに、可能なすべての送信方法について通信設定を実行する。
このようにすれば、追加操作命令を受け付けてから、原稿の読み取りおよび通信設定を開始する場合と比較して、コピーおよびスキャン送信を早期に完了させることができる。
なお、スキャン送信に用いる送信方法には、例えば、BOX送信、ファクシミリ送信、SMB、FTPおよび電子メールが挙げられる。
(5-3-10)具体例10
事前操作命令の命令内容に「OCR」という語が含まれている場合には、「OCR」の欄に対応する事前処理条件の欄を参照して、OCRに用いる辞書が事前操作命令において指定されているか否かを確認する(図16)。
辞書が指定されていない場合には、複合機120が利用し得るすべての辞書について、辞書ごとにOCR処理を実行する。複合機120が利用し得る辞書としては、例えば、日本語、英語、中国語などの辞書を挙げることができる。
このようにすれば、追加操作命令を受け付けてから、追加操作命令の命令内容において指定された辞書を用いてOCR処理を実行する場合と比較して、OCRを早期に完了させることができる。
[6]携帯端末装置130の構成と動作
次に、携帯端末装置130の構成と動作について説明する。
(6-1)携帯端末装置130の構成
図21に示すように、携帯端末装置130は、CPU2101、ROM2102、RAM2103等を備えており、CPU2101はリセットされると、ROM2102からブートプログラムを読み出して起動し、RAM2103を作業用記憶領域として、HDD2104から読み出したOSやアプリケーション・プログラムを実行する。アプリケーション・プログラムには、複合機120を利用するためのプリンター・ドライバーが含まれる。
無線通信回路2105は公衆回線網(図示省略)と無線通信するための処理を実行し、近距離無線通信回路2106は、無線LAN親機160および通信ネットワーク150を経由して複合機120と相互接続するための通信処理を実行する。タッチパネル2107は、タッチパッド2110と液晶ディスプレイ(LCD: Liquid Crystal Display)2111とを備えており、ユーザーに対して情報を提示したり、ユーザーからの指示入力を受け付けたりする。
撮像処理部2108はいわゆるカメラであって、静止画や動画を撮影するための処理を実行する。音声処理部2109は、マイク2112とスピーカー2113とを備えており、マイク2112を用いてユーザー指示や再指示の音声をアナログ音声信号に生成し、更に、アナログ音声信号をデジタル音声信号に変換したり、デジタル音声信号をアナログ音声信号に変換した後、スピーカー2113を用いて、アナログ音声信号を用いて音声出力を行ったりする。
図22に示すように、携帯端末装置130は、アプリケーション・プログラムを実行することによって、複合機120と同様に、命令受付部2201やユーザー認証部2202、命令内容取得部2203等の機能を果たす。
命令受付部2201は、バーチャルアシスタントサーバー110から通常操作命令、事前操作命令および追加操作命令を受信する。ユーザー認証部2202は、操作命令に含まれているユーザー識別情報を参照して、認証処理を実行する。
命令内容取得部2203は、ユーザー認証部2202のユーザー認証が成功した場合に、命令受付部2201が受信した命令に含まれている命令内容を取得する。通常処理実行部2204は、命令受付部2201が受け付けた操作命令が通常操作命令である場合に、命令内容取得部2203で取得した命令内容の通常処理を実行する。
事前処理テーブル2205は、事前操作命令の命令内容、事前処理を実行するか否かを判定するための事前処理条件および事前処理を関連付けて記憶する。図23に例示するように、事前処理テーブル2205においては、命令内容ごとに、事前処理条件と事前処理とが記憶される。
例えば、事前操作命令の命令内容がプリントであって、かつ携帯端末装置130のウォームアップが完了である場合には、事前処理としてウォームアップを実行する。また、事前操作命令の命令内容が解像度を指定したプリントであって、かつ携帯端末装置130のウォームアップが完了である場合には、事前処理として解像度に応じたウォームアップを実行する。
事前処理特定部2206は、事前処理テーブル2205を参照して、命令内容取得部2203が取得した事前操作命令の命令内容に対応する欄が事前処理テーブル2205にあり、かつ、当該欄の事前処理条件が充足されている場合には、当該欄の事前処理を特定する。
事前処理実行部2209は、事前処理特定部2206が特定した事前処理を実行する。事前操作命令記憶部2207は、命令内容取得部2203が取得した事前操作命令の命令内容を記憶する。
本処理特定部2208は、命令内容取得部2203が取得した追加操作命令の命令内容と、事前操作命令記憶部2207が記憶している事前操作命令の命令内容と、を組み合わせた命令内容の本処理を特定する。本処理実行部2210は、本処理特定部2208が特定した本処理を実行する。
(6-2)携帯端末装置130の動作
次に、携帯端末装置130の動作について説明する。
図24に示すように、携帯端末装置130は、複合機120と同様に、命令受付部2201にて操作命令を受け付けると(S2401:YES)、ユーザー認証部2202は、操作命令に含まれたユーザー識別情報を取得し(S2402)、取得したユーザー識別情報を用いてユーザー認証を実行する(S2403)。当該ユーザー認証に失敗したら(S2404:NO)、ステップS2401へ進んで、上記の処理を繰り返す。ユーザー認証に成功したら(S2404:YES)、操作命令に含まれる命令識別情報を参照する(S2405)。
命令識別情報が事前操作命令を示す場合は(S2406:YES)、事前処理を実行する(S2411)。命令識別情報が追加操作命令を示す場合は(S2407:YES)、事前操作命令の命令内容と追加操作命令の命令内容とから特定される本処理を実行する(S2412)。また、通常操作命令である場合には(S2408:YES)、通常処理を実行する(S2413)。ステップS2411、S2412およびS2413の処理の後、ステップS2401へ進んで、上記の処理を繰り返す。
(6-2-1)事前処理(S2411)
事前処理においては、図25に示すように、まず、命令内容取得部2203にて事前操作命令の命令内容を取得する(S2501)。次に、事前処理特定部2206にて事前処理テーブル2205を参照して、命令内容に対応する事前処理条件が記憶されているか確認する(S2502)。該当する事前処理条件が事前処理テーブル2205に記憶されている場合には(S2503:YES)、事前処理テーブル2205において事前処理条件に対応する事前処理を特定し(S2504)、特定した事前処理を実行する(S2505)。
事前操作命令の命令に対応する事前処理条件が事前処理テーブルに記憶されていない場合(S2503:NO)、およびステップS2505の処理の後、事前操作命令記憶部2207は事前操作命令に係るユーザー識別情報と命令内容とを関連付けて記憶して(S2506)、上位ルーチンに復帰する。
(6-2-2)本処理(S2412)
本処理においては、図26に示すように、まず、命令内容取得部2203にて追加操作命令の命令内容を取得する(S2601)。次に、事前操作命令記憶部2207が、当該追加操作命令に係るユーザー識別情報に関連付けて記憶している命令内容を特定する(S2602)。そして、本処理特定部2208にて追加操作命令に係る命令内容と、当該追加操作命令に対応する事前操作命令に係る命令内容と、から本処理を特定し(S2603)、本処理実行部2210にて当該本処理を実行した後(S2604)、上位ルーチンに復帰する。
(6-2-3)通常処理(S2413)
通常処理においては、図27に示すように、命令内容取得部2203にて通常操作命令の命令内容を取得し(S2701)、通常処理実行部2204にて当該命令内容の通常処理を実行した後(S2702)、上位ルーチンに復帰する。
(6-3)事前処理の具体例
事前処理について具体例を挙げて説明する。
携帯端末装置130は、事前操作命令の命令内容に「プリント」という語が含まれている場合には、事前処理テーブル2205を参照して、「プリント」になっている命令内容の欄を探し、当該欄に対応する事前処理条件の欄を参照する。図23の例では、当該事前処理条件の欄に「プリンター・ドライバーが未起動」と記載されているので、携帯端末装置130は、プリンター・ドライバーが起動されているか否かを確認する。
プリンター・ドライバーが起動されていない場合には、事前処理の欄に記載されている「プリンター・ドライバーを起動する」を事前処理として実行する。このようにすれば、追加操作命令を受け付けてからプリンター・ドライバーを起動する場合と比較して、携帯端末装置130のユーザーはプリンター・ドライバーが起動されるのを待つことなく、プリンター・ドライバーを操作することができる。従って、ユーザーの待ち時間を短縮することができるので、ユーザーの利便性を高めることができる。
また、プリンター・ドライバーが既に起動されている場合には、事前処理としてプリンター・ドライバーを起動する必要は無い。
[7]変形例
以上、本発明を実施の形態に基づいて説明してきたが、本発明が上述の実施の形態に限定されないのは勿論であり、以下のような変形例を実施することができる。
(7-1)上記実施の形態においては、ユーザー指示の音声認識に一部失敗したら再指示を要求する場合を例にとって説明したが、本発明がこれに限定されないのは言うまでもなく、これに代えて次のようにしてもよい。
例えば、ユーザー指示の音声認識に一部失敗した場合に、バーチャルアシスタントサーバー110において事前処理条件を確認し、複合機120等において事前処理が実行できない場合には、スマートスピーカー100を用いてユーザーに対して、例えば、「聞き取れませんでした。もう一度言って下さい」のようなメッセージを音声出力して、ユーザー指示全体の再入力を要求する。
このように、複合機120等において事前処理が実行できる場合にのみ、事前処理を実行することができる複合機120等に対して、バーチャルアシスタントサーバー110が事前操作命令を送信しても、上記実施の形態と同様の効果を得ることができる。
なお、複合機120等において事前処理が実行できるか否かの確認は、バーチャルアシスタントサーバー110がユーザー指示の音声認識に一部失敗した場合に、ユーザー指示のうち音声認識に成功した部分のテキストデータを含むユーザー指示受付未完了通知を複合機120等に送信して、事前処理条件を確認させ、確認結果を返信させることによって行ってもよい。
(7-2)上記実施の形態においては、バーチャルアシスタントサーバー110を用いる場合を例にとって説明したが、本発明がこれに限定されないのは言うまでもなく、バーチャルアシスタントサーバー110を経由することなく、スマートスピーカー100と複合機120とが音声データを送受信することによって処理を行ってもよい。
(7-3)上記実施の形態においては、特に言及しなかったが、複合機120等は事前処理を完了した後、当該事前処理に係る事前操作命令に対応する追加操作命令をバーチャルアシスタントサーバー110から受信するまで待機状態でスタンバイしていてもよい。この待機状態とは、例えば、事前処理がウォームアップである場合には、ウォームアップ完了後、定着温度を所定の目標温度に維持した状態である。また、可能なファイル形式や可能な解像度で生成したファイルを削除せずに維持する状態であってもよい。
(7-4)上記実施の形態においては、スマートスピーカー100がGPSを用いて設置位置を検出する場合を例にとって説明したが、本発明がこれに限定されないのは言うまでもなく、これに代えて、スマートスピーカー100のシリアル番号など位置情報以外の情報を用いてスマートスピーカー100を識別し、個々のスマートスピーカー100と複合機120との対応表を参照して、スマートスピーカー100毎に直近の複合機120を特定してもよい。
(7-5)上記実施の形態においては、複合機120が備えるプリンター装置1320がタンデム方式のカラープリンターである場合を例にとって説明したが、本発明がこれに限定されないのは言うまでもなく、プリンター装置1320はタンデム方式外の方式のカラープリンターであってもよいし、モノクロプリンターであってもよい。また、プリンター装置1329はインクジェット方式など電子写真方式以外の方式を採用してもよい。
また、複合機120が備える機能の如何に関わらず本発明を適用すれば同様の効果を得ることができる。
本発明に係る音声操作システム、音声操作方法および音声操作プログラムは、音声指示をやり直す必要がある場合における装置動作の開始遅延を抑制することができる技術として有用である。
1………………………画像形成システム
100…………………スマートスピーカー
110…………………バーチャルアシスタントサーバー
120…………………複合機
130…………………携帯端末装置
140…………………PC
150…………………通信ネットワーク
1505、2205…事前処理テーブル

Claims (36)

  1. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムであって、
    前記受付装置は、
    前記音声指示を音声認識する音声認識手段と、
    前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知手段と、を備え、
    前記処理装置は、画像処理装置であって、
    前記操作命令の命令内容に対応する処理を実行する処理手段と、
    前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶手段と、
    通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定手段と、を備え、
    前記処理手段は、前記処理特定手段が特定した事前処理を、前記処理として実行し、
    前記処理特定手段は、
    前記操作命令が、プリント操作に関する命令である場合には、
    当該画像処理装置がウォームアップ処理を完了したか否かを確認して、ウォームアップ処理が完了していなければ、
    前記事前処理をウォームアップ処理とする
    ことを特徴とする音声操作システム。
  2. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムであって、
    前記受付装置は、
    前記音声指示を音声認識する音声認識手段と、
    前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知手段と、を備え、
    前記処理装置は、端末装置であって、
    前記操作命令の命令内容に対応する処理を実行する処理手段と、
    前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶手段と、
    通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定手段と、を備え、
    前記処理手段は、前記処理特定手段が特定した事前処理を、前記処理として実行し、
    前記処理特定手段は、
    前記操作命令が、プリント操作に関する命令である場合には、
    前記事前処理を前記端末装置がプリントジョブを作成するためのプリンター・ドライバーを起動するとともに、前記操作命令で指定されているプリント条件を前記プリンター・ドライバーに入力する処理とする
    ことを特徴とする音声操作システム。
  3. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムであって、
    前記受付装置は、
    前記音声指示を音声認識する音声認識手段と、
    前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知手段と、を備え、
    前記処理装置は、画像処理装置であって、
    前記操作命令の命令内容に対応する処理を実行する処理手段と、
    前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶手段と、
    通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定手段と、を備え、
    前記処理手段は、前記処理特定手段が特定した事前処理を、前記処理として実行し、
    前記処理特定手段は、
    前記操作命令が、前記画像処理装置が原稿から読み取った画像データ、または予め記憶している画像データのファイル送信に関する命令である場合には、
    前記事前処理を送信すべきファイルを作成可能な複数のファイル形式で作成する処理とする
    ことを特徴とする音声操作システム。
  4. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムであって、
    前記受付装置は、
    前記音声指示を音声認識する音声認識手段と、
    前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知手段と、を備え、
    前記処理装置は、画像処理装置であって、
    前記操作命令の命令内容に対応する処理を実行する処理手段と、
    前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶手段と、
    通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定手段と、を備え、
    前記処理手段は、前記処理特定手段が特定した事前処理を、前記処理として実行し、
    前記処理特定手段は、
    前記操作命令が、コピー操作に関する命令である場合には、
    当該画像処理装置がウォームアップ処理を完了したか否かを確認して、ウォームアップ処理が完了していなければ、
    前記事前処理をウォームアップ処理とする
    ことを特徴とする音声操作システム。
  5. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムであって、
    前記受付装置は、
    前記音声指示を音声認識する音声認識手段と、
    前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知手段と、を備え、
    前記処理装置は、画像処理装置であって、
    前記操作命令の命令内容に対応する処理を実行する処理手段と、
    前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶手段と、
    通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定手段と、を備え、
    前記処理手段は、前記処理特定手段が特定した事前処理を、前記処理として実行し、
    前記処理特定手段は、
    前記操作命令が、自動原稿搬送装置を用いた原稿の読み取りを要する命令である場合には、
    前記事前処理を、自動原稿搬送装置を用いて原稿の両面を読み取る処理とする
    ことを特徴とする音声操作システム。
  6. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムであって、
    前記受付装置は、
    前記音声指示を音声認識する音声認識手段と、
    前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知手段と、を備え、
    前記処理装置は、画像処理装置であって、
    前記操作命令の命令内容に対応する処理を実行する処理手段と、
    前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶手段と、
    通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定手段と、を備え、
    前記処理手段は、前記処理特定手段が特定した事前処理を、前記処理として実行し、
    前記処理特定手段は、
    前記操作命令が、カラー画像の形成に関する命令である場合には、
    前記事前処理をカラー設定に対応したトナー又はインクの供給を準備する処理とする
    ことを特徴とする音声操作システム。
  7. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムであって、
    前記受付装置は、
    前記音声指示を音声認識する音声認識手段と、
    前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知手段と、を備え、
    前記処理装置は、画像処理装置であって、
    前記操作命令の命令内容に対応する処理を実行する処理手段と、
    前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶手段と、
    通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定手段と、を備え、
    前記処理手段は、前記処理特定手段が特定した事前処理を、前記処理として実行し、
    前記処理特定手段は、
    前記操作命令が、複数の辞書のうちのいずれかの辞書を用いた文字認識処理に関する命令である場合には、
    前記事前処理を前記複数の辞書をそれぞれ用いた複数の文字認識結果を用意する処理をとする
    ことを特徴とする音声操作システム。
  8. 前記受付装置は、更に、
    前記音声認識手段が前記音声指示の一部について音声認識を失敗した場合に、当該一部の再指示を受け付ける再指示受付手段と、
    当該再指示された一部を、追加操作命令として、前記処理装置へ通知する追加通知手段と、を備え、
    前記処理装置は、更に、
    前記操作命令および追加操作命令に応じた本処理を、前記事前処理の結果を利用して、実行する本実行手段を備える
    ことを特徴とする請求項2から7のいずれかに記載の音声操作システム。
  9. 前記受付装置は、更に、
    音声認識によってユーザーを特定するユーザー特定手段と、
    特定したユーザーを前記処理装置に通知するユーザー通知手段と、を備え、
    前記通知手段は、前記音声指示から特定されたユーザーを併せて通知し、
    前記追加通知手段は、前記再指示から特定されたユーザーを併せて通知し、
    前記処理装置は、更に、
    ユーザーに対応付けられた複数のジョブを実行することができ、
    前記通知されたユーザーに対応付けられたジョブを特定するジョブ特定手段を備え、
    前記本実行手段は、同一のユーザーに係る操作命令および追加操作命令に応じた本処理を実行する
    ことを特徴とする請求項に記載の音声操作システム。
  10. 前記再指示受付手段は、
    前記音声指示のうち音声認識を失敗した一部を示して再指示を要求する再指示要求手段を備え、
    当該要求に対するユーザーの回答を、前記再指示として受け付ける
    ことを特徴とする請求項8または9に記載の音声操作システム。
  11. 前記再指示要求手段は、
    前記音声指示のうち音声認識に失敗した一部を音声出力するとともに、当該一部の音声認識に失敗した旨の音声を出力することによって、再指示を要求する
    ことを特徴とする請求項10に記載の音声操作システム。
  12. 前記再指示要求手段は、
    前記音声指示のうち音声認識に失敗した一部を警告音に置き換えた音声を出力することによって、再指示を要求する
    ことを特徴とする請求項10に記載の音声操作システム。
  13. 前記処理特定手段は、
    前記操作命令において解像度が指定されている場合には、
    前記事前処理を、前記解像度に応じた定着温度のウォームアップ処理とする
    ことを特徴とする請求項に記載の音声操作システム。
  14. 前記処理特定手段は、
    前記操作命令において解像度が指定されている場合には、
    前記事前処理を、前記指定された解像度でファイルを作成する処理とする
    ことを特徴とする請求項に記載の音声操作システム。
  15. 前記処理特定手段は、
    前記画像処理装置が複数の送信方法でファイルを送信することができる場合には、
    前記事前処理は、前記各送信方法における通信設定処理を含む
    ことを特徴とする請求項3または14に記載の音声操作システム。
  16. 前記処理特定手段は、
    記操作命令において、入力する画像サイズの変倍率が指定されている場合には、
    前記事前処理は、原稿を読み取って画像データを生成し、得られた画像データに前記変倍率で変倍する処理を含む
    ことを特徴とする請求項に記載の音声操作システム。
  17. 前記処理特定手段は、
    前記操作命令において、用紙サイズが指定されている場合には、
    前記事前処理は、指定された用紙サイズの用紙を搬送して、当該搬送方向におけるトナー像の転写位置よりも上流側の待機位置で当該用紙を待機させる処理を含む
    ことを特徴とする請求項4または16に記載の音声操作システム。
  18. 前記本実行手段は、前記受付装置から追加操作命令を通知されるまで、本処理の実行を待つ
    ことを特徴とする請求項8から12のいずれかに記載の音声操作システム。
  19. 複数の処理装置を有し、
    前記受付装置は、前記ユーザーおよび前記処理装置の位置を特定して、前記ユーザーからの距離が最も短い処理装置を選択する装置選択手段を備え、
    前記通知手段は、前記装置選択手段が選択した処理装置へ前記通知を行う
    ことを特徴とする請求項1から18のいずれかに記載の音声操作システム。
  20. 前記受付装置は、
    前記音声指示を受け付けるスマートスピーカーと、
    前記音声認識手段と、前記通知手段とを有するサーバーと、を備える
    ことを特徴とする請求項1から19のいずれかに記載の音声操作システム。
  21. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムが実行する音声操作方法であって、
    前記受付装置が前記音声指示を音声認識する音声認識ステップと、
    前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、
    前記処理装置は、画像処理装置であって、
    前記画像処理装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、
    前記画像処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、
    前記画像処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を含み、
    前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、
    前記処理特定ステップにおいては、
    前記操作命令が、プリント操作に関する命令である場合には、
    当該画像処理装置がウォームアップ処理を完了したか否かを確認して、ウォームアップ処理が完了していなければ、
    前記事前処理をウォームアップ処理とする
    ことを特徴とする音声操作方法。
  22. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムが実行する音声操作方法であって、
    前記受付装置が前記音声指示を音声認識する音声認識ステップと、
    前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、
    前記処理装置は、端末装置であって、
    前記端末装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、
    前記端末装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、
    前記端末装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を含み、
    前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、
    前記処理特定ステップにおいては、
    前記操作命令が、プリント操作に関する命令である場合には、
    前記事前処理を前記端末装置がプリントジョブを作成するためのプリンター・ドライバーを起動するとともに、前記操作命令で指定されているプリント条件を前記プリンター・ドライバーに入力する処理とする
    ことを特徴とする音声操作方法。
  23. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムが実行する音声操作方法であって、
    前記受付装置が前記音声指示を音声認識する音声認識ステップと、
    前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、
    前記処理装置は、画像処理装置であって、
    前記画像処理装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、
    前記画像処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、
    前記画像処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を含み、
    前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、
    前記処理特定ステップにおいては、
    前記操作命令が、前記画像処理装置が原稿から読み取った画像データ、または予め記憶している画像データのファイル送信に関する命令である場合には、
    前記事前処理を送信すべきファイルを作成可能な複数のファイル形式で作成する処理とする
    ことを特徴とする音声操作方法。
  24. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムが実行する音声操作方法であって、
    前記受付装置が前記音声指示を音声認識する音声認識ステップと、
    前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、
    前記処理装置は、画像処理装置であって、
    前記画像処理装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、
    前記画像処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、
    前記画像処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を含み、
    前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、
    前記処理特定ステップにおいては、
    前記操作命令が、コピー操作に関する命令である場合には、
    当該画像処理装置がウォームアップ処理を完了したか否かを確認して、ウォームアップ処理が完了していなければ、
    前記事前処理をウォームアップ処理とする
    ことを特徴とする音声操作方法。
  25. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムが実行する音声操作方法であって、
    前記受付装置が前記音声指示を音声認識する音声認識ステップと、
    前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、
    前記処理装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、
    前記処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、
    前記処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を含み、
    前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、
    前記処理特定ステップにおいては、
    前記操作命令が、自動原稿搬送装置を用いた原稿の読み取りを要する命令である場合には、
    前記事前処理を、自動原稿搬送装置を用いて原稿の両面を読み取る処理とする
    ことを特徴とする音声操作方法。
  26. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムが実行する音声操作方法であって、
    前記受付装置が前記音声指示を音声認識する音声認識ステップと、
    前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、
    前記処理装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、
    前記処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、
    前記処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を含み、
    前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、
    前記処理特定ステップにおいては、
    前記操作命令が、カラー画像の形成に関する命令である場合には、
    前記事前処理をカラー設定に対応したトナー又はインクの供給を準備する処理とする
    ことを特徴とする音声操作方法。
  27. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有する音声操作システムが実行する音声操作方法であって、
    前記受付装置が前記音声指示を音声認識する音声認識ステップと、
    前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、
    前記処理装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、
    前記処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、
    前記処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を含み、
    前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、
    前記処理特定ステップにおいては、
    前記操作命令が、複数の辞書のうちのいずれかの辞書を用いた文字認識処理に関する命令である場合には、
    前記事前処理を前記複数の辞書をそれぞれ用いた複数の文字認識結果を用意する処理をとする
    ことを特徴とする音声操作方法。
  28. 複数の処理装置を有する音声操作システムにおいて、
    前記受付装置が、前記ユーザーおよび前記処理装置の位置を特定して、前記ユーザーからの距離が最も短い処理装置を選択する装置選択ステップを含み、
    前記通知ステップにおいては、前記装置選択ステップにて選択した処理装置へ前記通知を行う
    ことを特徴とする請求項21から27のいずれかに記載の音声操作方法。
  29. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有するコンピューターシステムに音声操作を実行させる音声操作プログラムであって、
    前記受付装置が前記音声指示を音声認識する音声認識ステップと、
    前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、
    前記処理装置は、画像処理装置であって、
    前記受付装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、
    前記画像処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、
    前記画像処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を前記コンピューターシステムに実行させ
    前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、
    前記処理特定ステップにおいては、
    前記操作命令が、プリント操作に関する命令である場合には、
    当該画像処理装置がウォームアップ処理を完了したか否かを確認して、ウォームアップ処理が完了していなければ、
    前記事前処理をウォームアップ処理とする
    ことを特徴とする音声操作プログラム。
  30. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有するコンピューターシステムに音声操作を実行させる音声操作プログラムであって、
    前記受付装置が前記音声指示を音声認識する音声認識ステップと、
    前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、
    前記処理装置は、端末装置であって、
    前記受付装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、
    前記端末装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、
    前記端末装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を前記コンピューターシステムに実行させ
    前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、
    前記処理特定ステップにおいては、
    前記操作命令が、プリント操作に関する命令である場合には、
    前記事前処理を前記端末装置がプリントジョブを作成するためのプリンター・ドライバーを起動するとともに、前記操作命令で指定されているプリント条件を前記プリンター・ドライバーに入力する処理とする
    ことを特徴とする音声操作プログラム。
  31. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有するコンピューターシステムに音声操作を実行させる音声操作プログラムであって、
    前記受付装置が前記音声指示を音声認識する音声認識ステップと、
    前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、
    前記処理装置は、画像処理装置であって、
    前記受付装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、
    前記画像処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、
    前記画像処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を前記コンピューターシステムに実行させ
    前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、
    前記処理特定ステップにおいては、
    前記操作命令が、前記画像処理装置が原稿から読み取った画像データ、または予め記憶している画像データのファイル送信に関する命令である場合には、
    前記事前処理を送信すべきファイルを作成可能な複数のファイル形式で作成する処理とする
    ことを特徴とする音声操作プログラム。
  32. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有するコンピューターシステムに音声操作を実行させる音声操作プログラムであって、
    前記受付装置が前記音声指示を音声認識する音声認識ステップと、
    前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、
    前記処理装置は、画像処理装置であって、
    前記受付装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、
    前記画像処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、
    前記画像処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を前記コンピューターシステムに実行させ
    前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、
    前記処理特定ステップにおいては、
    前記操作命令が、コピー操作に関する命令である場合には、
    当該画像処理装置がウォームアップ処理を完了したか否かを確認して、ウォームアップ処理が完了していなければ、
    前記事前処理をウォームアップ処理とする
    ことを特徴とする音声操作プログラム。
  33. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有するコンピューターシステムに音声操作を実行させる音声操作プログラムであって、
    前記受付装置が前記音声指示を音声認識する音声認識ステップと、
    前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、
    前記受付装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、
    前記処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、
    前記処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を前記コンピューターシステムに実行させ
    前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、
    前記処理特定ステップにおいては、
    前記操作命令が、自動原稿搬送装置を用いた原稿の読み取りを要する命令である場合には、
    前記事前処理を、自動原稿搬送装置を用いて原稿の両面を読み取る処理とする
    ことを特徴とする音声操作プログラム。
  34. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有するコンピューターシステムに音声操作を実行させる音声操作プログラムであって、
    前記受付装置が前記音声指示を音声認識する音声認識ステップと、
    前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、
    前記受付装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、
    前記処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、
    前記処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を前記コンピューターシステムに実行させ
    前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、
    前記処理特定ステップにおいては、
    前記操作命令が、カラー画像の形成に関する命令である場合には、
    前記事前処理をカラー設定に対応したトナー又はインクの供給を準備する処理とする
    ことを特徴とする音声操作プログラム。
  35. 処理装置と、前記処理装置に対するユーザーの音声指示を受け付ける受付装置と、を有するコンピューターシステムに音声操作を実行させる音声操作プログラムであって、
    前記受付装置が前記音声指示を音声認識する音声認識ステップと、
    前記音声認識ステップにおいて前記音声指示の一部について音声認識を失敗した場合に、前記受付装置が、前記音声指示のうち音声認識に成功した部分に対応する操作命令を前記処理装置へ通知する通知ステップと、
    前記受付装置が、前記操作命令の命令内容に対応する処理を実行する処理ステップと、
    前記処理装置が、前記操作命令の命令内容と、当該命令内容に対応する事前処理と、当該事前処理を実行するための事前処理条件と、を対応付けて記憶する記憶ステップと、
    前記処理装置が、通知された操作命令に対応付けられた事前処理条件が充足された場合に、当該操作命令に対応付けられた事前処理を特定する処理特定ステップと、を前記コンピューターシステムに実行させ
    前記処理ステップにおいては、前記処理特定ステップにおいて特定した事前処理を、前記処理として実行し、
    前記処理特定ステップにおいては、
    前記操作命令が、複数の辞書のうちのいずれかの辞書を用いた文字認識処理に関する命令である場合には、
    前記事前処理を前記複数の辞書をそれぞれ用いた複数の文字認識結果を用意する処理をとする
    ことを特徴とする音声操作プログラム。
  36. 複数の処理装置を有するコンピューターシステムにおいて、
    前記受付装置が、前記ユーザーおよび前記処理装置の位置を特定して、前記ユーザーからの距離が最も短い処理装置を選択する装置選択ステップを含み、
    前記通知ステップにおいては、前記装置選択ステップにて選択した処理装置へ前記通知を行う
    ことを特徴とする請求項29から35のいずれかに記載の音声操作プログラム。
JP2018230042A 2018-12-07 2018-12-07 音声操作システム、音声操作方法および音声操作プログラム Active JP7271925B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018230042A JP7271925B2 (ja) 2018-12-07 2018-12-07 音声操作システム、音声操作方法および音声操作プログラム
US16/675,444 US20200184970A1 (en) 2018-12-07 2019-11-06 Voice operation system, voice operation method, and voice operation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018230042A JP7271925B2 (ja) 2018-12-07 2018-12-07 音声操作システム、音声操作方法および音声操作プログラム

Publications (2)

Publication Number Publication Date
JP2020091448A JP2020091448A (ja) 2020-06-11
JP7271925B2 true JP7271925B2 (ja) 2023-05-12

Family

ID=70972055

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018230042A Active JP7271925B2 (ja) 2018-12-07 2018-12-07 音声操作システム、音声操作方法および音声操作プログラム

Country Status (2)

Country Link
US (1) US20200184970A1 (ja)
JP (1) JP7271925B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11003419B2 (en) 2019-03-19 2021-05-11 Spotify Ab Refinement of voice query interpretation
JP2021086445A (ja) * 2019-11-28 2021-06-03 株式会社リコー 情報処理システム、情報処理方法及び情報処理装置
CN111312240A (zh) * 2020-02-10 2020-06-19 北京达佳互联信息技术有限公司 数据控制方法、装置、电子设备及存储介质
US11481401B2 (en) * 2020-11-25 2022-10-25 International Business Machines Corporation Enhanced cognitive query construction

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000029492A (ja) 1998-07-09 2000-01-28 Hitachi Ltd 音声翻訳装置、音声翻訳方法、音声認識装置
JP2001324891A (ja) 2000-05-17 2001-11-22 Ricoh Co Ltd 画像形成装置
JP2002175226A (ja) 2000-08-29 2002-06-21 Casio Comput Co Ltd 後位装置、印刷装置、情報取得方法、印刷支援方法、印刷支援システム、携帯通信端末および印刷方法
JP2003051887A (ja) 2001-08-06 2003-02-21 Minolta Co Ltd 制御システムおよび制御方法
JP2006023444A (ja) 2004-07-07 2006-01-26 Nissan Motor Co Ltd 音声対話装置
JP2006279924A (ja) 2005-03-29 2006-10-12 Toshiba Corp 画像形成方法及び画像形成装置
JP2006326964A (ja) 2005-05-25 2006-12-07 Konica Minolta Business Technologies Inc 画像形成装置
JP2009147493A (ja) 2007-12-12 2009-07-02 Seiko Epson Corp 印刷装置、複合機、印刷方法
JP2011166665A (ja) 2010-02-15 2011-08-25 Murata Machinery Ltd 複合機
JP2012049684A (ja) 2010-08-25 2012-03-08 Sharp Corp 複合機
JP2012139860A (ja) 2010-12-28 2012-07-26 Riso Kagaku Corp 画像形成装置及び画像形成システム
JP2013175060A (ja) 2012-02-24 2013-09-05 Ricoh Co Ltd 情報処理装置、ファイル処理方法、プログラム
JP2014007657A (ja) 2012-06-26 2014-01-16 Oki Data Corp 画像処理装置
JP2014146202A (ja) 2013-01-29 2014-08-14 Brother Ind Ltd 端末装置、システム、および、コンピュータプログラム
JP2017076117A (ja) 2015-10-16 2017-04-20 グーグル インコーポレイテッド ホットワード認識
US20180150280A1 (en) 2016-11-28 2018-05-31 Samsung Electronics Co., Ltd. Electronic device for processing multi-modal input, method for processing multi-modal input and sever for processing multi-modal input
JP6400871B1 (ja) 2018-03-20 2018-10-03 ヤフー株式会社 発話制御装置、発話制御方法、および発話制御プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09114931A (ja) * 1995-10-18 1997-05-02 Canon Inc 文字認識装置及びその方法

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000029492A (ja) 1998-07-09 2000-01-28 Hitachi Ltd 音声翻訳装置、音声翻訳方法、音声認識装置
JP2001324891A (ja) 2000-05-17 2001-11-22 Ricoh Co Ltd 画像形成装置
JP2002175226A (ja) 2000-08-29 2002-06-21 Casio Comput Co Ltd 後位装置、印刷装置、情報取得方法、印刷支援方法、印刷支援システム、携帯通信端末および印刷方法
JP2003051887A (ja) 2001-08-06 2003-02-21 Minolta Co Ltd 制御システムおよび制御方法
JP2006023444A (ja) 2004-07-07 2006-01-26 Nissan Motor Co Ltd 音声対話装置
JP2006279924A (ja) 2005-03-29 2006-10-12 Toshiba Corp 画像形成方法及び画像形成装置
JP2006326964A (ja) 2005-05-25 2006-12-07 Konica Minolta Business Technologies Inc 画像形成装置
JP2009147493A (ja) 2007-12-12 2009-07-02 Seiko Epson Corp 印刷装置、複合機、印刷方法
JP2011166665A (ja) 2010-02-15 2011-08-25 Murata Machinery Ltd 複合機
JP2012049684A (ja) 2010-08-25 2012-03-08 Sharp Corp 複合機
JP2012139860A (ja) 2010-12-28 2012-07-26 Riso Kagaku Corp 画像形成装置及び画像形成システム
JP2013175060A (ja) 2012-02-24 2013-09-05 Ricoh Co Ltd 情報処理装置、ファイル処理方法、プログラム
JP2014007657A (ja) 2012-06-26 2014-01-16 Oki Data Corp 画像処理装置
JP2014146202A (ja) 2013-01-29 2014-08-14 Brother Ind Ltd 端末装置、システム、および、コンピュータプログラム
JP2017076117A (ja) 2015-10-16 2017-04-20 グーグル インコーポレイテッド ホットワード認識
US20180150280A1 (en) 2016-11-28 2018-05-31 Samsung Electronics Co., Ltd. Electronic device for processing multi-modal input, method for processing multi-modal input and sever for processing multi-modal input
JP6400871B1 (ja) 2018-03-20 2018-10-03 ヤフー株式会社 発話制御装置、発話制御方法、および発話制御プログラム

Also Published As

Publication number Publication date
US20200184970A1 (en) 2020-06-11
JP2020091448A (ja) 2020-06-11

Similar Documents

Publication Publication Date Title
JP7271925B2 (ja) 音声操作システム、音声操作方法および音声操作プログラム
JP5038229B2 (ja) 画像処理装置、画像処理方法並びに画像処理プログラム及びそれを記録する記録媒体
JP4928373B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP5058904B2 (ja) 画像処理装置、画像処理方法、及びそのプログラム
JP5043715B2 (ja) 画像処理装置
JP2006350551A (ja) 文書変換装置、文書変換方法、文書変換システム、文書処理装置および情報処理装置
JP2020102166A (ja) 画像処理システム、画像処理方法、プログラム、画像処理装置、情報処理装置
US8717584B2 (en) Image processing apparatus and control method thereof
US20080180707A1 (en) Image processing apparatus, image processing system, and image processing method
US8185504B2 (en) Image processing apparatus and image processing method
JP5288879B2 (ja) 印刷装置及びその制御方法、プログラム、並びに、コンピュータ読み取り可能な記憶媒体
JP2023025021A (ja) 画像処理システム、及びその制御方法
JP2009282709A (ja) 画像処理装置及びその制御方法、プログラム、記憶媒体
JP2009165025A (ja) 画像処理システム、画像処理システムの制御方法、及び制御プログラム
JP5022986B2 (ja) 画像処理装置及び画像処理方法ならびに画像処理方法を実行させるプログラム
JP2022001997A (ja) 情報処理装置、情報処理システム、制御方法、並びにプログラム
US8259313B2 (en) Image processing apparatus, method, and computer-readable medium storing the program thereof
US8224091B2 (en) Image processing apparatus, method of controlling the same, and program for extracting information usable for a search
JP5084543B2 (ja) 画像処理装置及び画像処理方法
JP2008146606A (ja) 画像形成装置及びその制御方法
JP2007125850A (ja) 画像形成装置及びその制御方法
US11700338B2 (en) Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor
US20180210681A1 (en) Image forming system and image forming method
JP7483487B2 (ja) 画像形成システム、画像形成システムの制御方法、及びプログラム
JP5265042B2 (ja) 画像処理装置、画像処理方法並びに画像処理プログラム及びそれを記録する記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230328

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230410

R150 Certificate of patent or registration of utility model

Ref document number: 7271925

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150