JP7458716B2 - 音声対話装置及びその制御方法、並びにプログラム - Google Patents

音声対話装置及びその制御方法、並びにプログラム Download PDF

Info

Publication number
JP7458716B2
JP7458716B2 JP2019121813A JP2019121813A JP7458716B2 JP 7458716 B2 JP7458716 B2 JP 7458716B2 JP 2019121813 A JP2019121813 A JP 2019121813A JP 2019121813 A JP2019121813 A JP 2019121813A JP 7458716 B2 JP7458716 B2 JP 7458716B2
Authority
JP
Japan
Prior art keywords
job
voice
identification information
execution
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019121813A
Other languages
English (en)
Other versions
JP2020038348A (ja
Inventor
諭 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to KR1020190104951A priority Critical patent/KR102537797B1/ko
Priority to US16/554,778 priority patent/US11140284B2/en
Priority to CN202211498819.6A priority patent/CN115811576A/zh
Priority to CN201910811041.1A priority patent/CN110875993B/zh
Publication of JP2020038348A publication Critical patent/JP2020038348A/ja
Priority to US17/471,296 priority patent/US11647129B2/en
Application granted granted Critical
Publication of JP7458716B2 publication Critical patent/JP7458716B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00482Output means outputting a plurality of job set-up options, e.g. number of copies, paper size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00403Voice input means, e.g. voice commands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1202Dedicated interfaces to print systems specifically adapted to achieve a particular effect
    • G06F3/1203Improving or facilitating administration, e.g. print management
    • G06F3/1204Improving or facilitating administration, e.g. print management resulting in reduced user or operator actions, e.g. presetting, automatic actions, using hardware token storing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/1253Configuration of print job parameters, e.g. using UI at the client
    • G06F3/1254Automatic configuration, e.g. by driver
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/1253Configuration of print job parameters, e.g. using UI at the client
    • G06F3/1257Configuration of print job parameters, e.g. using UI at the client by using pre-stored settings, e.g. job templates, presets, print styles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1278Dedicated interfaces to print systems specifically adapted to adopt a particular infrastructure
    • G06F3/1285Remote printer device, e.g. being remote from client or server
    • G06F3/1287Remote printer device, e.g. being remote from client or server via internet
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1278Dedicated interfaces to print systems specifically adapted to adopt a particular infrastructure
    • G06F3/1285Remote printer device, e.g. being remote from client or server
    • G06F3/1288Remote printer device, e.g. being remote from client or server in client-server-printer device configuration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00395Arrangements for reducing operator input
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1202Dedicated interfaces to print systems specifically adapted to achieve a particular effect
    • G06F3/1203Improving or facilitating administration, e.g. print management
    • G06F3/1205Improving or facilitating administration, e.g. print management resulting in increased flexibility in print job configuration, e.g. job settings, print requirements, job tickets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Description

本発明は、音声対話装置及びその制御方法、並びにプログラムに関する。
対話エージェント機能を備える音声対話装置としてのMFPが知られている。MFPは、対話エージェント機能を用いて、ユーザが発した音声をジョブの設定指示やジョブの実行指示等として受け付ける(例えば、特許文献1参照)。これにより、ユーザは、MFPの操作部を操作することなく、指示の内容を発話するだけで、ジョブの設定指示やジョブの実行指示を容易に行うことができる。
特開2014-222513号公報
しかしながら、従来では、複数の種別の設定値を設定する必要があるジョブの実行指示を対話エージェント機能によって行う場合、ジョブ毎にユーザが複数の種別の設定値を発する必要があり、ユーザビリティが低下するという問題が生じる。
本発明の目的は、対話エージェント機能のユーザビリティを向上することができる音声対話装置及びその制御方法、並びにプログラムを提供することにある。
上記目的を達成するために、本発明の音声対話装置は、入力された音声をジョブの実行に関する指示として受け付ける音声対話装置であって、入力された第1の音声が示す設定値に基づいて前記ジョブを実行するジョブ実行手段と、前記ジョブの実行を完了した後、入力された第2の音声が示す識別情報と当該ジョブの実行に使用した設定値とを対応付けて登録する登録手段と、前記ジョブの実行を完了した後、当該ジョブの実行に使用した設定値を登録することをユーザが選択した場合に、前記設定値を登録する際に使用する前記識別情報の候補名を出力する手段とを備え、前記ジョブ実行手段は、入力された第3の音声に前記識別情報が含まれている場合、前記識別情報に対応付けて登録された前記設定値に基づいて前記ジョブを実行することを特徴とする。
本発明によれば、対話エージェント機能のユーザビリティを向上することができる。
本発明の実施の形態に係る音声対話装置としてのMFPに搭載された対話エージェント機能を説明するための図である。 図1のMFPのハードウェア構成を概略的に示すブロック図である。 図1のMFP、自然言語処理サービス、及び複合機管理サービスによって実行される音声識別情報生成処理の手順を示すシーケンス図である。 図1のMFPとユーザとの対話の様子を示す図である。 図1のMFPによって実行されるジョブ実行処理の手順を示すフローチャートである。 図1のMFPとユーザとの対話の様子を示す図である。 図1のMFPとユーザとの対話の様子を示す図である。 図1のMFPが設定可能な機能設定情報の一例を示す図である。 ファックスジョブの実行に関するMFPとユーザとの対話の様子を示す図である。 図1のMFPにおける通知の一例を示す図である。 図1のMFPが管理する管理テーブルの一例を示す図である。 ジョブの実行に使用された機能設定情報が既に登録されている場合のMFPとユーザとの対話の様子を示す図である。 図1のMFPが備える事前通知機能を説明するための図である。 図5のジョブ実行処理の変形例の手順を示すフローチャートである。 図1のMFPとユーザとの対話の様子を示す図である。 自然言語処理サービス及び複合機管理サービスの機能を備えるMFPの機能ブロック図である。
以下、本発明の実施の形態について図面を参照しながら詳述する。なお、本実施の形態では、音声対話装置としてのMFPに本発明を適用した場合について説明するが、本発明はMFPに限られない。例えば、スマートスピーカー、スマートフォン、タブレット端末、及びPCといった対話エージェント機能を備える装置に本発明を適用してもよい。
図1は、本発明の実施の形態に係る音声対話装置としてのMFP101に搭載された対話エージェント機能を説明するための図である。MFP101は、画像形成処理を行う画像形成装置である。MFP101は、コピー機能、スキャン機能、及びFAX機能等の画像形成処理の実行を伴うジョブを実行するための複数の機能を備える。また、MFP101は、対話エージェント機能を備える。対話エージェント機能を利用することで、ユーザは、指示の内容を発話するだけでジョブの実行指示やジョブの設定指示を行うことができる。MFP101は、ユーザが発した音声を受けると、当該音声を自然言語で表現したユーザ操作リクエストを、自然言語処理サービス102に送信する。自然言語処理サービス102は、クラウド103を構成するモジュールである。自然言語処理サービス102は、MFP101からユーザ操作リクエストを受信すると、当該ユーザ操作リクエストに基づいて自然言語処理を行い、ユーザが発した音声に含まれる字句を解析する。また、自然言語処理サービス102は、解析結果を複合機管理サービス104に送信する。複合機管理サービス104も、自然言語処理サービスと同様に、クラウド103を構成するモジュールである。複合機管理サービス104は、自然言語処理サービス102から受信した解析結果に基づいて、MFP101が上記音声を識別可能な音声識別情報を生成し、当該音声識別情報をMFP101に送信する。MFP101は、受信した音声識別情報に基づいて、例えば、MFP101が受けた音声が示す設定値をジョブの実行に必要となる機能設定情報として設定する。
図2は、図1のMFP101のハードウェア構成を概略的に示すブロック図である。図2において、MFP101は、CPU201、ROM202、RAM203、eMMC204、マイク・スピーカ205、プリンタ206、スキャナ207、操作部208、及びネットワーク制御部209を備える。CPU201、ROM202、RAM203、eMMC204、マイク・スピーカ205、プリンタ206、スキャナ207、操作部208、及びネットワーク制御部209はバス210を介して互いに接続されている。
CPU201は、MFP101全体の動作を制御する。CPU201は、ROM202やeMMC204に記憶されたプログラムを読み出し、読取制御、印刷制御、及び送信制御等の各種制御を行う。RAM203は、CPU201がプログラムを実行する際にワークエリア等として使用される揮発性のメモリである。eMMC204は、画像データや各種プログラムを記憶する。マイク・スピーカ205は、ユーザが発した音声を受ける。また、マイク・スピーカ205は、ユーザから受けた音声に対する応答メッセージを音声出力する。
プリンタ206は、バス210を介して転送された画像データに基づいて印刷処理を行う。スキャナ207は、配置された原稿を読み取って画像データを生成する。操作部208は、表示部(不図示)やハードキー(不図示)等を備える。表示部は、ユーザが指で操作可能なタッチパネルとして動作する。ネットワーク制御部209は、LAN211と接続するためのNIC(Network Interface Card)(不図示)を備える。
図3は、図1のMFP101、自然言語処理サービス102、及び複合機管理サービス104によって実行される音声識別情報生成処理の手順を示すシーケンス図である。図3の処理は、マイク・スピーカ205で音声を受けた際に実行される。
図3において、MFP101は、マイク・スピーカ205で音声を受けると(ステップS301)、当該音声を自然言語で表現したユーザ操作リクエストを自然言語処理サービス102に送信する(ステップS302)。自然言語処理サービス102は、受信したユーザ操作リクエストに基づいて自然言語処理を実行し、マイク・スピーカ205で受けた音声に含まれる字句を解析する(ステップS303)。次いで、自然言語処理サービス102は、解析結果を複合機管理サービス104へ送信する(ステップS304)。複合機管理サービス104は、受信した解析結果に基づいて音声識別情報を生成し(ステップS305)、当該音声識別情報をMFP101へ送信する(ステップS306)。MFP101は、受信した音声識別情報からユーザの指示を特定し、特定した指示に対する応答メッセージをマイク・スピーカ205から音声出力する。このように、本実施の形態では、図3の処理により、MFP101は、マイク・スピーカ205で音声を受ける毎に受けた音声の音声識別情報を複合機管理サービス104から取得し、取得した音声識別情報に基づいてマイク・スピーカ205で受けた各音声の内容を把握することができる。以下では、図3の処理に関する動作の説明を省略し、MFP101は、マイク・スピーカ205で音声を受けた際に当該音声の音声識別情報を複合機管理サービス104から取得することとして説明する。
次に、対話エージェント機能を利用してジョブの実行指示を行う際のユーザ及びMFP101の対話について説明する。
図4において、MFP101は、例えば、音声入力動作を開始するための所定の音声入力キーワードを含む音声メッセージ401、及びコピー機能の利用を示す図4の音声メッセージ402をマイク・スピーカ205で受けると、コピージョブの機能設定情報の設定を促す音声メッセージ403をマイク・スピーカ205から出力する。以下では、コピージョブの機能設定情報をコピー設定情報とする。その後、コピー設定情報に関する音声メッセージ404~406をマイク・スピーカ205で受けると、MFP101は、音声メッセージ404~406に基づいてコピー設定情報として「4in1」、「カラー」、「両面」、「ステイプル」を設定する。MFP101は、設定した内容を示す音声メッセージ407をマイク・スピーカ205から出力する。また、MFP101は、設定したコピー設定情報でコピージョブを実行する。コピージョブの実行を完了すると、MFP101は、音声メッセージ408を出力して、当該コピージョブで使用した機能設定情報をプリセットとして保存するか否かをユーザに選択させる。ユーザから上記機能設定情報をプリセットとして保存することを示す音声メッセージ409をマイク・スピーカ205で受けると、MFP101は、プリセット名の設定を促す音声メッセージ410をマイク・スピーカ205から出力する。その後、ユーザからプリセット名を示す音声メッセージ411をマイク・スピーカ205で受けると、MFP101は、上記プリセット名を上記機能設定情報に対応付けて登録する。これにより、ユーザは、次回から上記プリセット名を発するだけで、当該プリセット名に対応付けられた機能設定情報をMFP101に設定することが可能となる。なお、登録された情報は、ROM202等に格納される。また、MFP101は、次回から上記機能設定情報を上記プリセット名で呼び出し可能である旨を示す音声メッセージ412をマイク・スピーカ205から出力する。このとき、MFP101は、上記機能設定情報の具体値である「4in1」、「カラー」、「両面」、「ステイプル」や、プリセット名である「チーム内打ち合わせ」をマイク・スピーカ205から出力する。
図5は、図1のMFP101によって実行されるジョブ実行処理の手順を示すフローチャートである。図5の処理は、CPU201がROM202やeMMC204に記憶されたプログラムを実行することによって行われる。図5の処理は、例えば、MFP101が起動した際に実行される。
図5において、まず、CPU201は、マイク・スピーカ205で音声を受けると、複合機管理サービス104から受信した上記音声の音声識別情報に基づいて上記音声に所定の音声入力キーワードが含まれているか否かを判別する(ステップS501)。上記音声に所定の音声入力キーワードが含まれていると(ステップS501でYES)、CPU201は、音声入力動作を開始する(ステップS502)。その後、CPU201は、マイク・スピーカ205で別の音声を受けると、受けた音声の音声識別情報に基づいてユーザに指定された機能を特定する(ステップS503)。例えば、図6の音声メッセージ601を受けた場合、CPU201は、音声メッセージ601の音声識別情報に基づいて、ユーザに指定された機能がコピー機能であることを特定する。次いで、CPU201は、特定した機能を利用するジョブの機能設定情報の設定を促す図6の音声メッセージ602をマイク・スピーカ205から出力する。その後、CPU201は、マイク・スピーカ205で別の音声を受けると、受けた音声に予め登録されたプリセット名が含まれているか否かを判別する(ステップS504)。
ステップS504の判別の結果、受けた音声に予め登録されたプリセット名が含まれているとき(例えば、図6の音声メッセージ603を参照。)、CPU201は、上記プリセット名に対応付けられた機能設定情報を設定する。機能設定情報は、例えば、音声メッセージ412に含まれるコピー設定情報のように、ジョブの実行に必要となる複数の種別の設定値を含む。次いで、CPU201は、設定した機能設定情報でジョブを実行する(ステップS505)。また、CPU201は、プリセット名に対応付けられた機能設定情報でジョブが実行された旨を示す音声メッセージ604を出力し、本処理を終了する。
ステップS504の判別の結果、受けた音声に予め登録されたプリセット名が含まれていないとき(例えば、図7の音声メッセージ701を参照。)、CPU201は上記音声に含まれる単語に類似するプリセット名の候補リストを出力する(ステップS506)。例えば、「打ち合わせ用4in1」、「打ち合わせ用2in1」がプリセット名として予め登録された状態で、マイク・スピーカ205で「打ち合わせ用」の単語を含む音声メッセージ701を受けた場合、CPU201は、プリセット名の候補リストとして「打ち合わせ用4in1」及び「打ち合わせ用2in1」を含む図7の音声メッセージ702をマイク・スピーカ205から出力する。その後、CPU201は、マイク・スピーカ205で別の音声を受けると、受けた音声の音声識別情報に基づいて候補リストの中から一つのプリセット名が選択されたか否かを判別する(ステップS507)。
ステップS507の判別の結果、候補リストの中から一つのプリセット名が選択されたとき、CPU201は、選択されたプリセット名に対応付けられた機能設定情報を設定し、ステップS505の処理を行う。
ステップS507の判別の結果、候補リストの中から一つのプリセット名が選択されないとき、CPU201は、プリセット名を使わずに機能設定情報を設定する。具体的に、CPU201は、図4に示すように、ジョブの実行に必要となる各設定値を対話で確認し、マイク・スピーカ205で受けた各音声が示す複数の種別の設定値を機能設定情報として設定する。CPU201は、設定した機能設定情報でジョブを実行する(ステップS508)。次いで、CPU201は、音声メッセージ408をマイク・スピーカ205から出力して、上記ジョブで使用した機能設定情報をプリセットとして保存するか否かをユーザに選択させる。その後、CPU201は、マイク・スピーカ205で別の音声を受けると、受けた音声の音声識別情報に基づいて上記ジョブで使用した機能設定情報をプリセットとして保存するか否かを判別する(ステップS509)。
ステップS509の判別の結果、上記ジョブで使用した機能設定情報をプリセットとして保存しないとき、CPU201は、本処理を終了する。ステップS509の判別の結果、上記ジョブで使用した機能設定情報をプリセットとして保存するとき、CPU201は、上記機能設定情報に対応付けるプリセット名を示す音声をマイク・スピーカ205で受けたか否かを判別する(ステップS510)。
ステップS510の判別の結果、上記機能設定情報に対応付けるプリセット名を示す音声をマイク・スピーカ205で受けたとき、CPU201は、受けた音声が示すプリセット名を上記機能設定情報に対応付けて登録する(ステップS511)。その後、CPU201は、本処理を終了する。
ステップS510の判別の結果、上記機能設定情報に対応付けるプリセット名を示す音声をマイク・スピーカ205で受けないとき、CPU201は、マイク・スピーカ205で最後に音声を受けてから予め設定された所定の時間を経過したか否かを判別する(ステップS512)。
ステップS512の判別の結果、マイク・スピーカ205で最後に音声を受けてから所定の時間を経過しないとき、CPU201は、ステップS510の処理に戻る。ステップS512の判別の結果、マイク・スピーカ205で最後に音声を受けてから所定の時間を経過したとき、CPU201は、本処理を終了する。
上述した実施の形態によれば、受けた音声にプリセット名が含まれている場合、プリセット名に対応付けて予め登録された複数の種別の設定値に基づいてジョブが実行される。すなわち、複数の種別の設定値を設定するジョブの実行指示を対話エージェント機能によって行う際に、ジョブ毎にユーザが複数の種別の設定値を発する必要がない。これにより、対話エージェント機能によるジョブの実行指示を行う際のユーザの手間を軽減することができ、もって、対話エージェント機能のユーザビリティを向上することができる。
また、上述した実施の形態では、ジョブの実行を完了した後、当該ジョブの実行に使用した複数の種別の設定値に対応付けるプリセット名を登録するか否かがユーザに選択される。これにより、プリセット名の登録に関し、ユーザの意図を反映させることができる。
さらに、上述した実施の形態では、プリセット名を登録する際に、当該プリセット名に対応付ける全ての設定値を含む音声メッセージ412がマイク・スピーカ205から出力される。これにより、プリセット名を登録する際に、当該プリセット名に対応付けられる設定値をユーザが把握することができる。
上述した実施の形態では、複数の種別の設定値は、画像形成処理の実行に必要となる設定値である。これにより、画像形成処理の実行を伴うジョブの実行指示を対話エージェント機能によって行う際のユーザの手間を軽減することができる。
以上、本発明について、上述した実施の形態を用いて説明したが、本発明は上述した実施の形態に限定されるものではない。例えば、プリセット名に対応付けられる機能設定情報は、コピー設定情報以外の機能設定情報、例えば、図8に示すコピー機能、ファックス機能、スキャンして送信機能、スキャンして保存機能、保存ファイルの利用機能、受信トレイ機能、セキュアプリント機能、及びプリント機能といったMFP101が備える機能を利用するジョブの機能設定情報であっても良い。例えば、ユーザからファックスジョブで使用した機能設定情報をプリセットとして保存することを示す図9の音声メッセージ901をマイク・スピーカ205で受け、その後、ユーザからプリセット名を示す音声メッセージ902をマイク・スピーカ205で受けると、MFP101は、メッセージ902が示すプリセット名を上記ファックスジョブで使用した機能設定情報に対応付けて登録する。
また、上述した実施の形態では、MFP101が事前通知機能を備えていても良い。事前通知機能は、ジョブの機能設定情報の設定を促すメッセージの応答としてユーザから受けた音声にプリセット名が含まれている場合、ジョブを実行する前に、上記プリセット名に対応付けて予め登録された複数の種別の設定値をマイク・スピーカ205から出力する機能である。この機能により、ユーザがMFP101に設定された機能設定情報をジョブの実行前に確認することができる。
さらに、上述した実施の形態では、事前通知機能によってマイク・スピーカ205から出力される設定値の種別数が所定の数より多い場合、MFP101は、マイク・スピーカ205から上記設定値を音声出力せずに、図10に示すように、上記設定値を操作部208に表示しても良い。また、この場合、マイク・スピーカ205から上記設定値を音声出力しつつ、上記設定値を操作部208に表示しても良い。このように上記設定値を操作部208に表示することで、プリセット名に機能設定情報として複数種の設定値が対応付けられても、ユーザが当該機能設定情報の内容を容易に把握することができる。
上述した実施の形態では、図11の管理テーブル1100によってプリセット名及び機能設定情報がユーザ毎に管理されても良い。管理テーブル1100は、MFP101及びクラウド103の少なくとも一方に格納される。管理テーブル1100では、各ユーザに対応付けしてプリセット名及び機能設定情報が登録されている。例えば、管理テーブル1100には、図11の「チーム内打ち合わせ」のように同一のプリセット名であっても、ユーザa,c毎に異なる内容の機能設定情報が登録されている。MFP101は、プリセット名を示すメッセージをマイク・スピーカ205で受けた場合、ユーザがMFP101にログインした際に使用したログイン情報又はユーザの声紋認証の認証結果に基づいてユーザを特定する。MFP101は、管理テーブル1100の中から、マイク・スピーカ205で受けたメッセージが示すプリセット名に対応付けられた機能設定情報であって上記特定したユーザに関する機能設定情報を特定し、特定した機能設定情報を用いてジョブを実行する。機能設定情報をユーザ毎に管理することで、対話エージェント機能のユーザビリティを更に向上することができる。
上述した実施の形態では、ジョブの実行に使用された機能設定情報がプリセットとして既に保存されている場合、MFP101は、図12のメッセージ1201をマイク・スピーカ205から出力して、上記機能設定情報に対応付けられたプリセット名を変更するか否かをユーザに選択させても良い。
また、上述した実施の形態では、上記事前通知機能のON/OFFをユーザに設定させても良い。ユーザが設定した事前通知機能のON/OFFの何れかを示す設定値は、ROM202等に格納される。事前通知機能をONに設定されたMFP101は、ジョブの機能設定情報の設定を促すメッセージの応答としてユーザから受けた音声にプリセット名が含まれている場合、ジョブを実行する前に、例えば、図13(a)のメッセージ1301をマイク・スピーカ205から出力する。メッセージ1301には、上記プリセット名に対応付けて登録された機能設定情報が含まれる。一方、事前通知機能をOFFに設定されたMFP101は、ジョブの機能設定情報の設定を促すメッセージの応答としてユーザから受けた音声にプリセット名が含まれている場合、例えば、図13(b)に示すように、当該プリセット名に対応付けて登録された機能設定情報をマイク・スピーカ205から出力することなく、ジョブを実行する。
図14は、図5のジョブ実行処理の変形例の手順を示すフローチャートである。図14の処理も、CPU201がROM202やeMMC204に記憶されたプログラムを実行することによって行われる。図14の処理も、例えば、MFP101が起動した際に実行される。
図14において、CPU201は、ステップS501~S504の処理を行う。ステップS504の判別の結果、受けた音声に予め登録されたプリセット名が含まれていないとき、CPU201は、ステップS506、S507の処理を行う。
ステップS507の判別の結果、候補リストの中から一つのプリセット名が選択されたとき、又はステップS504の判別の結果、受けた音声に予め登録されたプリセット名が含まれているとき、CPU201は、事前通知機能がON及びOFFの何れであるかを判別する(ステップS1401)。
ステップS1401の判別の結果、事前通知機能がONであるとき、CPU201は、受けた音声に含まれるプリセット名に対応付けて予め登録された機能設定情報を示すメッセージ、例えば、図13のメッセージ1301を通知する(ステップS1402)。ステップS1402の通知は、マイク・スピーカ205による音声出力及び操作部208へのメッセージ表示の少なくとも一方で行われる。次いで、CPU201は、マイク・スピーカ205で別の音声を受けると、受けた音声の音声識別情報に基づいて、上記機能設定情報の内容を変更するか否かを判別する(ステップS1403)。
ステップS1403の判別の結果、上記機能設定情報の内容を変更しないとき、又はステップS1401の判別の結果、事前通知機能がOFFであるとき、CPU201は、ステップS505以降の処理を行う。ステップS1403の判別の結果、上記機能設定情報の内容を変更するとき、又はステップS507の判別の結果、候補リストの中から一つのプリセット名が選択されないとき、CPU201は、ステップS508~S510の処理を行う。
ステップS510の判別の結果、上記機能設定情報に対応付けるプリセット名を示す音声をマイク・スピーカ205で受けたとき、CPU201は、受けた音声が示すプリセット名と同じプリセット名が登録されているか否かを判別する(ステップS1404)。
ステップS1404の判別の結果、受けた音声が示すプリセット名と同じプリセット名が登録されていないとき、CPU201は、ステップS511以降の処理を行う。ステップS1404の判別の結果、受けた音声が示すプリセット名と同じプリセット名が登録されているとき、CPU201は、例えば、図15のメッセージ1501をマイク・スピーカ205から出力して、プリセット名の登録情報を上書きするか否かをユーザに選択させる(ステップS1405)。プリセット名の登録情報の上書きは、管理テーブル1100において、上記プリセット名に関し、予め対応付けられた機能設定情報をステップS508で使用した機能設定情報に更新する処理である。
ステップS1405において、ユーザからプリセット名の登録情報を上書きすることを示すメッセージをマイク・スピーカ205で受けたとき、CPU201は、上記プリセット名の登録情報を上書きし(ステップS1406)、本処理を終了する。
ステップS1405において、ユーザからプリセット名の登録情報を上書きしないことを示すメッセージをマイク・スピーカ205で受けたとき、CPU201は、例えば、図15のメッセージ1502をマイク・スピーカ205から出力して、上記プリセット名の候補を通知する(ステップS1407)。ステップS1407では、CPU201は、受けた音声が示すプリセット名と登録済みのプリセット名との差分から特徴となる文字列を含むプリセット名の候補を生成し、当該プリセット名の候補を通知する。ステップS1407の通知は、マイク・スピーカ205による音声出力及び操作部208へのメッセージ表示の少なくとも一方で行われる。次いで、CPU201は、ステップS512の処理を行う。
上述した実施の形態では、ユーザが発した音声をMFP101のマイク・スピーカ205が受ける場合について説明したが、MFP101以外の他の装置、例えば、スマートスピーカーといったモバイル端末(不図示)によってユーザが発した音声を受けても良い。モバイル端末は、ユーザが発した音声を受けると、例えば、無線LANルータ212を介して上記ユーザ操作リクエストをMFP101に送信する。MFP101は、ステップS302の処理として、受信したユーザ操作リクエストを自然言語処理サービス102に転送する。自然言語処理サービス102は、受信したユーザ操作リクエストに基づいてステップS303、S304の処理を行い、複合機管理サービス104は、ステップS305、S306の処理を行って、音声識別情報をMFP101に送信する。
また、モバイル端末は、ユーザが発した音声を受けると、例えば、無線LANルータ212を介して上記ユーザ操作リクエストを自然言語処理サービス102へ送信する。自然言語処理サービス102は、受信したユーザ操作リクエストに基づいてステップS303、S304の処理を行い、複合機管理サービス104は、ステップS305、S306の処理を行って、音声識別情報をMFP101に送信する。
また、上述した実施の形態では、MFPが自然言語処理サービス102及び複合機管理サービス104の機能を備えていても良い。図16は、自然言語処理サービス102及び複合機管理サービス104の機能を備えるMFP1600の機能ブロック図である。
音声入力部1601は、ユーザが発した音声を受けると、当該音声に関するデータ(以下、「音声データ」という。)を音質調整部1602へ送信する。音質調整部1602は、音質が調整された音声データを自然言語処理部1603及び声紋判定部1607へ送信する。自然言語処理部1603は、音質が調整された音声データをテキストデータに変換し、当該テキストデータを字句解析部1604へ送信する。字句解析部1604は、受信したテキストデータを字句に変換し、当該字句をコマンド解析部1605へ送信する。コマンド解析部1605は、受信した字句を解析して、ユーザが発した音声が示す指示を特定する。コマンド解析部1605は、特定した指示を示すコマンドデータをコマンドDB1606に格納すると共に、当該コマンドデータを制御部1311へ送信する。声紋判定部1607は、音質が調整された音声データから声紋を判定し、判定した結果から特定したユーザに関する情報(以下、「ユーザ情報」という。)を生成し、当該ユーザ情報をユーザ識別部1608へ送信する。ユーザ識別部1608は、声紋判定部1607から取得したユーザ情報とユーザDB1609に予め登録されたユーザ登録情報とに基づいてユーザ認証を行う。ユーザ識別部1608は、ユーザ情報及びユーザ認証の結果を示すユーザ識別情報を制御部1311へ送信する。機器状態管理部1610は、MFP1600の機器状態情報を制御部1311へ送信する。制御部1611は、音声出力部1612へ応答命令を送信し、設定部1613へ使用する設定値に関する設定コマンドを送信し、出力部1615へ利用する機能を示す機能コマンドを送信する。設定部1613は、プリセットに関する情報をプリセットDB1614と送受信し、例えば、音声入力部1601が受けた音声が示すプリセット名に対応付けられた機能設定情報を出力部1615へ送信する。出力部1615は、機能コマンドが示す機能により、設定部1613から取得した機能設定情報を用いてジョブを実行する。例えば、出力部1615は、機能コマンドが示すFAX部1616により、設定部1613から取得した機能設定情報を用いてFAXデータを外部装置へ送信する。
本発明は、上述の実施の形態の1以上の機能を実現するプログラムをネットワーク又は記憶媒体を介してシステム又は装置に供給し、該システム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読み出して実行する処理でも実現可能である。また、本発明は、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
101 MFP
201 CPU
408、412 音声メッセージ

Claims (8)

  1. 入力された音声をジョブの実行に関する指示として受け付ける音声対話装置であって、
    入力された第1の音声が示す設定値に基づいて前記ジョブを実行するジョブ実行手段と、
    前記ジョブの実行を完了した後、入力された第2の音声が示す識別情報と当該ジョブの実行に使用した設定値とを対応付けて登録する登録手段と、
    前記ジョブの実行を完了した後、当該ジョブの実行に使用した設定値を登録することをユーザが選択した場合に、前記設定値を登録する際に使用する前記識別情報の候補名を出力する手段とを備え、
    前記ジョブ実行手段は、入力された第3の音声に前記識別情報が含まれている場合、前記識別情報に対応付けて登録された前記設定値に基づいて前記ジョブを実行することを特徴とする音声対話装置。
  2. 前記設定値は、1または複数の種別の設定値であることを特徴とする請求項1に記載の音声対話装置。
  3. 画像形成処理を行う画像形成装置であることを特徴とする請求項1又は2に記載の音声対話装置。
  4. 前記設定値は、前記画像形成処理の実行に必要となる設定値であることを特徴とする請求項に記載の音声対話装置。
  5. 入力された第3の音声に前記識別情報が含まれている場合、前記ジョブを実行する前に、前記識別情報に対応付けて登録された前記設定値を出力することを特徴とする請求項1乃至のいずれか1項に記載の音声対話装置。
  6. 音声を出力する出力手段を有し、
    前記設定値の出力は、前記出力手段による音声出力であることを特徴とする請求項に記載の音声対話装置。
  7. 入力された音声をジョブの実行に関する指示として受け付ける音声対話装置の制御方法であって、
    入力された第1の音声が示す設定値に基づいて前記ジョブを実行するジョブ実行ステップと、
    前記ジョブの実行を完了した後、入力された第2の音声が示す識別情報と当該ジョブの実行に使用した設定値とを対応付けて登録する登録ステップと
    前記ジョブの実行を完了した後、当該ジョブの実行に使用した設定値を登録することをユーザが選択した場合に、前記設定値を登録する際に使用する前記識別情報の候補名を出力するステップとを有し、
    前記ジョブ実行ステップは、入力された第3の音声に前記識別情報が含まれている場合、前記識別情報に対応付けて登録された前記設定値に基づいて前記ジョブを実行することを特徴とする音声対話装置の制御方法。
  8. 入力された音声をジョブの実行に関する指示として受け付ける音声対話装置の制御方法をコンピュータに実行させるプログラムであって、
    前記音声対話装置の制御方法は、
    入力された第1の音声が示す設定値に基づいて前記ジョブを実行するジョブ実行ステップと、
    前記ジョブの実行を完了した後、入力された第2の音声が示す識別情報と当該ジョブの実行に使用した設定値とを対応付けて登録する登録ステップと
    前記ジョブの実行を完了した後、当該ジョブの実行に使用した設定値を登録することをユーザが選択した場合に、前記設定値を登録する際に使用する前記識別情報の候補名を出力するステップとを有し、
    前記ジョブ実行ステップは、入力された第3の音声に前記識別情報が含まれている場合、前記識別情報に対応付けて登録された前記設定値に基づいて前記ジョブを実行することを特徴とするプログラム。
JP2019121813A 2018-09-04 2019-06-28 音声対話装置及びその制御方法、並びにプログラム Active JP7458716B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020190104951A KR102537797B1 (ko) 2018-09-04 2019-08-27 대화형 에이전트 기능이 설치된 화상 형성 시스템, 그 제어 방법 및 저장 매체
US16/554,778 US11140284B2 (en) 2018-09-04 2019-08-29 Image forming system equipped with interactive agent function, method of controlling same, and storage medium
CN202211498819.6A CN115811576A (zh) 2018-09-04 2019-08-30 带交互代理功能的图像形成系统及其控制方法和存储介质
CN201910811041.1A CN110875993B (zh) 2018-09-04 2019-08-30 带交互代理功能的图像形成系统及其控制方法和存储介质
US17/471,296 US11647129B2 (en) 2018-09-04 2021-09-10 Image forming system equipped with interactive agent function, method of controlling same, and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018165379 2018-09-04
JP2018165379 2018-09-04

Publications (2)

Publication Number Publication Date
JP2020038348A JP2020038348A (ja) 2020-03-12
JP7458716B2 true JP7458716B2 (ja) 2024-04-01

Family

ID=69737931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019121813A Active JP7458716B2 (ja) 2018-09-04 2019-06-28 音声対話装置及びその制御方法、並びにプログラム

Country Status (4)

Country Link
US (1) US11647129B2 (ja)
JP (1) JP7458716B2 (ja)
KR (1) KR102537797B1 (ja)
CN (1) CN115811576A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023034013A (ja) * 2021-08-30 2023-03-13 キヤノン株式会社 情報処理装置およびその制御方法、情報処理システム、プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102012A (ja) 2005-10-06 2007-04-19 Canon Inc 画像形成装置
JP2007114297A (ja) 2005-10-18 2007-05-10 Canon Inc 音声認識手段を持つ画像形成装置
JP2008257383A (ja) 2007-04-03 2008-10-23 Seiko Epson Corp 印刷装置、印刷方法、およびコンピュータプログラム
JP2011065108A (ja) 2009-09-18 2011-03-31 Konica Minolta Business Technologies Inc 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2365189A (en) * 2000-07-26 2002-02-13 Canon Kk Voice-controlled machine
JP4343626B2 (ja) 2003-09-02 2009-10-14 キヤノン株式会社 画像通信制御方法、画像通信制御プログラム、および画像通信装置
JP2007201686A (ja) 2006-01-25 2007-08-09 Murata Mach Ltd 画像読取装置
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
JP4818166B2 (ja) 2007-03-09 2011-11-16 株式会社リコー 画像形成装置、画像形成システム、画像形成方法および画像形成プログラム
JP2010097454A (ja) * 2008-10-17 2010-04-30 Seiko Epson Corp プリンタドライバ
JP5586932B2 (ja) * 2009-12-11 2014-09-10 キヤノン株式会社 データ処理装置、画像形成装置、データ処理装置の制御方法、画像形成装置の制御方法、及びプログラム
US20150254024A1 (en) 2014-03-06 2015-09-10 Xerox Corporation Using preset combination of page exception print settings to establish exception pages within documents
JP6327930B2 (ja) 2014-05-02 2018-05-23 キヤノン株式会社 画像形成装置、情報処理方法及びプログラム
JP7091821B2 (ja) * 2018-05-14 2022-06-28 コニカミノルタ株式会社 画像処理装置及びプログラム
US11140284B2 (en) * 2018-09-04 2021-10-05 Canon Kabushiki Kaisha Image forming system equipped with interactive agent function, method of controlling same, and storage medium

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102012A (ja) 2005-10-06 2007-04-19 Canon Inc 画像形成装置
JP2007114297A (ja) 2005-10-18 2007-05-10 Canon Inc 音声認識手段を持つ画像形成装置
JP2008257383A (ja) 2007-04-03 2008-10-23 Seiko Epson Corp 印刷装置、印刷方法、およびコンピュータプログラム
JP2011065108A (ja) 2009-09-18 2011-03-31 Konica Minolta Business Technologies Inc 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム

Also Published As

Publication number Publication date
JP2020038348A (ja) 2020-03-12
US20210409561A1 (en) 2021-12-30
US11647129B2 (en) 2023-05-09
KR20200027423A (ko) 2020-03-12
KR102537797B1 (ko) 2023-05-31
CN115811576A (zh) 2023-03-17

Similar Documents

Publication Publication Date Title
JP6900694B2 (ja) 情報処理システム、端末装置、情報処理方法およびプログラム
US11140284B2 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
JP7071098B2 (ja) 音声制御システム、制御方法およびプログラム
US9648180B2 (en) Information processing system performing operation based on tag information, information processing device, portable terminal and non-transitory computer readable recording medium
JP6704881B2 (ja) システム
US11475892B2 (en) Speech control system, speech control method, image processing apparatus, speech control apparatus, and storage medium
US8264716B2 (en) Ringtone, voice, and sound notification of printer status
US10664205B2 (en) Image processing apparatus transmitting registration request including incapability information indicating that any setting is incapable of being designated
US11256968B2 (en) System, method for controlling the same, and method for controlling server
JP2019095835A (ja) 音声制御システム、制御方法及びプログラム
JP2009194577A (ja) 画像形成装置、音声案内方法及び音声案内プログラム
JP2019096295A (ja) 音声制御システム、制御方法及びプログラム
US20230254421A1 (en) Image processing system, setting control method, image processing apparatus, and storage medium
US11438469B2 (en) Wireless terminal, management server and intention interpretation server
JP7458716B2 (ja) 音声対話装置及びその制御方法、並びにプログラム
US11036441B1 (en) System and method for creation and invocation of predefined print settings via speech input
JP2017184156A (ja) 情報処理装置、情報処理システム、情報処理装置の制御方法、及び、プログラム
US11825042B2 (en) Peripheral device management system, peripheral device management method, and printing apparatus control system
CN110764720B (zh) 打印设备、打印设备的控制方法和存储介质
JP2013058010A (ja) 画像処理システム、画像処理装置、画像形成装置およびプログラム
JP7447203B2 (ja) 情報処理装置、音声制御デバイス、印刷装置およびプログラム
US11700338B2 (en) Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor
JP2024014484A (ja) データ処理装置、画像形成装置及びその制御方法、並びにプログラム
JP2021170154A (ja) 制御装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220627

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231024

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240319

R151 Written notification of patent or utility model registration

Ref document number: 7458716

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151