JP7175696B2 - 画像処理システム、画像処理装置、及びその制御方法 - Google Patents

画像処理システム、画像処理装置、及びその制御方法 Download PDF

Info

Publication number
JP7175696B2
JP7175696B2 JP2018184982A JP2018184982A JP7175696B2 JP 7175696 B2 JP7175696 B2 JP 7175696B2 JP 2018184982 A JP2018184982 A JP 2018184982A JP 2018184982 A JP2018184982 A JP 2018184982A JP 7175696 B2 JP7175696 B2 JP 7175696B2
Authority
JP
Japan
Prior art keywords
information
box
natural language
user
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018184982A
Other languages
English (en)
Other versions
JP2020055115A5 (ja
JP2020055115A (ja
Inventor
晋太郎 岡村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2018184982A priority Critical patent/JP7175696B2/ja
Priority to US16/580,091 priority patent/US11146696B2/en
Priority to CN201910911291.2A priority patent/CN110971772A/zh
Publication of JP2020055115A publication Critical patent/JP2020055115A/ja
Priority to US17/469,068 priority patent/US11785150B2/en
Publication of JP2020055115A5 publication Critical patent/JP2020055115A5/ja
Priority to JP2022179738A priority patent/JP2023025021A/ja
Application granted granted Critical
Publication of JP7175696B2 publication Critical patent/JP7175696B2/ja
Priority to US18/360,938 priority patent/US20230388427A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1202Dedicated interfaces to print systems specifically adapted to achieve a particular effect
    • G06F3/1203Improving or facilitating administration, e.g. print management
    • G06F3/1204Improving or facilitating administration, e.g. print management resulting in reduced user or operator actions, e.g. presetting, automatic actions, using hardware token storing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/1267Job repository, e.g. non-scheduled jobs, delay printing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/04Training, enrolment or model building
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00244Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00403Voice input means, e.g. voice commands
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00474Output means outputting a plurality of functional options, e.g. scan, copy or print
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00488Output means providing an audible output to the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/02Casings; Cabinets ; Supports therefor; Mountings therein
    • H04R1/028Casings; Cabinets ; Supports therefor; Mountings therein associated with devices performing functions other than acoustics, e.g. electric candles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/08Mouthpieces; Microphones; Attachments therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/1238Secure printing, e.g. user identification, user rights for device usage, unallowed content, blanking portions or fields of a page, releasing held jobs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces

Description

本発明は、画像処理システム、画像処理装置、及びその制御方法に関する。
複合機にはコピー機能以外に、スキャナで読み取った原稿画像を複写機内部のHDD(ハードディスクドライブ)等の記憶装置へ格納し、再利用を可能とする機能(ボックス機能)が備わっている。ボックスへ格納されている画像データはUI(ユーザインタフェース)から呼び出してプリントしたり、ネットワークを介して外部へ送信したりすることができる。このように、ボックス内の画像データは多目的な用途で利用される。
しかし、このような複合機等の電子デバイスの機能の高度化に伴い、ユーザにとっては操作が煩雑になってきている。特許文献1では、自然言語での指示や操作が可能な対話エージェントが提案されている。
特開2014-222513号公報
しかしながら、上記従来技術には以下に記載する課題がある。例えば、ボックス機能において、画像データが格納される領域は、それぞれにボックス番号が付与された複数の領域(ボックス)に分けられている。従って、ユーザは、例えば画像データの用途別に複数のボックス番号の領域を使い分けることが可能である。しかし、上記従来技術では、対話エージェントを使用したボックス操作において、ユーザはいつ、複数のボックスの何れに、どんな原稿を保存したかを覚えていない可能性がある。そのため、ユーザは結局UI上でボックスの内容を確認しながら所望する画像ファイルを選択することになり、煩雑な操作が必要とされる。このように、対話エージェントによるユーザビリティが低下するという問題がある。
本発明は、上述の問題の少なくとも一つに鑑みて成されたものであり、対話エージェントを介した操作によって、装置に保存された情報にアクセスする際に、ユーザがアクセスを所望する情報を好適に特定してユーザの利便性を改善する仕組みを提供することを目的とする。
本発明は、例えば、ボックス機能における複数のボックスを用いて画像データを管理することが可能な画像処理システムであって、音を取得するマイクロフォンと、前記マイクロフォンを介して入力されたユーザの自然言語の音声情報を取得し、該自然言語の音声情報から得られる特徴報と、前記自然言語の音声情報に基づいて生成される字句情報とを取得する取得手段と、前記ボックス機能を実行するために利用可能な情報として前記取得した字句情報から前記ボックス機能を使用する意図に対応する1以上の単語を取得することに従って、前特徴情報基づいて前記複数のボックスの中から少なくとも1つのボックスを特定する特定手段と、前記自然言語の音声情報の取得に応じて、前記特定されたボックスに関する情報を含む応答情報を出力する出力手段とを備えることを特徴とする。
本発明によれば、対話エージェントを介した操作によって、装置に保存された情報にアクセスする際に、ユーザがアクセスを所望する情報を好適に特定してユーザの利便性を改善することができる。
一実施形態に係る複合機のハードウェア構成を示す図。 一実施形態に係るシステム構成を示す図。 一実施形態に係る対話エージェント動作例を示す図。 一実施形態に係るボックス保存処理を示すシーケンス図。 一実施形態に係る対話エージェント動作例を示す図。 一実施形態に係るボックスプリント処理を示すシーケンス図。 一実施形態に係るファイル管理情報の一例を示す図。 一実施形態に係るアクションを実行するための情報を示す図。 一実施形態に係る対話エージェント動作例を示す図。 一実施形態に係るボックス送信処理を示すシーケンス図。 一実施形態に係る複合機の処理手順の一例を示すフローチャート。 一実施形態に係る複合機の保存処理を示すフローチャート。
以下に本発明の一実施形態を示す。以下で説明される個別の実施形態は、本発明の上位概念、中位概念及び下位概念など種々の概念を理解するために役立つであろう。また、本発明の技術的範囲は、特許請求の範囲によって確立されるのであって、以下の個別の実施形態によって限定されるわけではない。なお、実施形態に係る画像処理装置として複合機(デジタル複合機/MFP/Multi Function Peripheral)を例に説明する。しかしながら本発明の主旨を逸脱しない範囲で、レーザプリンタやFAXなどの電子写真方式の画像処理装置に適用することが可能である。また、本発明は、適用対象を画像処理装置に限定する必要はなく、画像形成機能や画像処理機能を有していない情報処理装置にも適用することも可能である。
<第1の実施形態>
<画像処理装置の構成>
以下では、添付図面を参照して、本発明の第1の実施形態について説明する。まず、図1を参照して、本実施形態に係る複合機10のハードウェア構成を説明する。本実施形態の複合機10はスキャナ機能を備えた複合機を想定しているが、スキャナ機能を備えない複合機であってもよい。また、本発明を適用する画像処理装置を一例に説明するが、図2を用いて後述する画像処理システムにおける各装置が協働して実現する機能等を画像処理装置やその他の装置にどのように割り当てるかは任意である。従って、本発明を以下で説明する本実施形態の構成に限定する意図はない。
複合機10は、プリンタ部13、スキャナ部14、操作部15、スピーカ16、マイク17、及びコントローラ100を備える。コントローラ100は、CPU101、RAM102、ROM103、HDD104、画像処理部105、プリンタI/F106、スキャナI/F107、操作部I/F108、音声処理部109、無線LAN I/F110、及び有線LAN I/F111を備える。
CPU101は、ROM103が記憶している制御プログラムを読み出して、複合機10の動作を統括的に制御するための様々な処理を実行する。ROM103は、制御プログラム等を記憶している。RAM102は、CPU101の主メモリ、ワークエリア等の一時記憶領域として用いられ、印刷時等に画像処理部105によって種々の画像処理が施された画像データを保持する画像メモリとしても利用される。HDD104は、印刷データやスキャン画像等の様々なデータを記憶する。HDD104は、以下で説明する複数の分割されたボックス領域(例えば、100個)を含み、ボックス機能を提供する。なお、複合機10の場合、1つのCPU101が後述するフローチャートに示す各処理を実行するものとするが、他の形態であっても構わない。例えば、複数のCPUが協働して後述するフローチャートに示す各処理を実行するように構成することもできる。
プリンタ部13は、プリンタI/F106を介してCPU101によって制御され、外部装置から受信した印刷データやスキャナ部14によって生成されたスキャン画像等に基づいて、シートに印刷処理を実行する。スキャナ部14は、スキャナI/F107を介してCPU101によって制御され、原稿を読み取ってスキャン画像(読取画像データ)を生成する。スキャナ部14によって生成されたスキャン画像は、プリンタ部13によってシート等に印刷されたり、HDD104のボックス領域に記憶されたりする。
操作部15は、タッチパネル機能を有する液晶表示部やキーボードを備え、各種画像を表示する。ユーザは、操作部15を介して複合機10に対して指示や情報を入力することができる。操作部15は、操作部I/F108を介して、コントローラ100に接続されている。
スピーカ16は音声処理部109で処理した音波信号を発信するための出力インタフェースである。マイク17は外部から音波信号を受信するための入力インタフェースである。有線LAN I/F111は、LAN I/Fコネクタを介してLAN12に接続し、通信先のPCとネットワーク通信を行う。無線LAN I/F110は、アンテナである無線LAN通信部11を介して、アクセスポイント等の外部装置(不図示)との間で無線LAN通信を実行する。コントローラ100内の各ブロックはシステムバス112によって相互にデータを送受可能に接続されている。マイク17は外部から音波信号を受信するための入力インタフェースである。スピーカ16は、複合機10のコントローラ100内の音声処理部109で処理した音波信号を発信するための出力インタフェースである。
<システム構成>
次に、図2を参照して、本実施形態のシステム構成を説明する。本実施形態に係る複合機10は、ユーザと、音声入力等により対話を行う対話エージェントを有する。当該対話エージェントは、ユーザ50からの操作入力を、マイク17から自然言語で受け取り、クラウド上の自然言語処理、字句解析サービス(例えば、サーバ装置)30へ送信する。ここで複合機10がユーザの音声を取得する構成については、複合機10に接続されたマイク17に限らず、モバイル端末40に内蔵されたマイク(不図示)を用いてもよい。この場合、複合機10とモバイル端末40を無線LANやUSBにより無線接続又は有線接続60することで、複合機10を介してモバイル端末40に入力されたユーザの音声を自然言語処理、字句解析サービス30へ送信する。或いは、モバイル端末40からの音声を自然言語処理、字句解析サービス30へ直接送信してもよい。
本実施形態では、自然言語処理、字句解析サービス30をクラウド上のサービスとして説明する。しかしながら、本発明を限定する意図はなく、複合機10やモバイル端末40等に設けられてもよい。自然言語処理、字句解析サービス30は、複合機10又はモバイル端末40上の対話エージェントからユーザからの操作を自然言語で受け取ると、自然言語処理を行い、抽出された字句を解析する。その結果に応じて、クラウド上のサービスである複合機管理サービス20と通信を行い、自然言語処理、字句解析サービス30からの通信に基づいて、複合機10と通信を行う。複合機管理サービス20は、管理サーバの一例である。複合機管理サービス20は、自然言語処理、字句解析サービス30と、複数の複合機との間に設けられる中間機能であり、複合機管理サービス20からの命令を所定の複合機へ送信し、当該複合機からのレスポンスを自然言語処理、字句解析サービス30へ通知する。なお、複合機管理サービス20は、自然言語処理、字句解析サービス30と同じ装置に設けられてもよいし、別の装置に設けられてもよい。本実施形態では、ユーザの音声を取得する構成として複合機10に接続されたマイク17を用いた場合の動作を一例に説明する。
<対話エージェント>
次に、図3を参照して、本実施形態の対話エージェントの動作例を説明する。まず、ユーザ50が複合機10の操作部15を操作する、又はユーザ50が複合機10に対して所定の単語を発話することによって、対話エージェントが起動され、複合機10は対話モードに入る。そして、ユーザ50は301にて、複合機10上の対話エージェントを起動させた状態で、自然言語による音声でボックス機能の起動を伝える。ボックス機能とは、上述したように、HDD104が備える複数のボックス領域へのファイルの保存や、所定のボックス領域からのファイルの読み出し機能を提供するものである。301、303は、ユーザ50の音声で入力された情報を示す。302、304、305は、自然言語処理、字句解析サービス30からの送信に応じ、スピーカ16を介した音声による再生、又は操作部15に表示される自然言語データである。図3に示す内容は、複合機10やモバイル端末40の操作部等に表示されてもよい。
複合機10は入力された自然言語データ301を自然言語処理、字句解析サービス30に送信する。自然言語処理、字句解析サービス30は、入力された自然言語データを解析し、文節及び単語に区切る。そして、それぞれの単語の中から名詞を取り出し、それらの名詞を固有名詞やその他の名詞に分類する。その結果、分類された名詞の中に、予め登録された「アクションを実行するための情報」が揃っているかを判別する。
図8に本実施形態におけるアクションを実行するための情報800の例を示す。例えば、本実施形態においてボックス機能を使用するための呼び出し名801「ボックス」やボックス機能に対するアクション802「保存、プリント、送信」等を予め登録しておく。さらに、時間を表す付加情報803「○月、○日、○時、○分、今日、昨日、○日前」等や、所定のボックス領域を指すボックス番号を示す付加情報804「○番」を予め登録しておく。自然言語処理、字句解析サービス30による自然言語301の判別の結果、図3の例では「アクションを実行するための情報」のうち、付加情報2「ボックス番号」(804)が不足していると判断される。そのため、自然言語処理、字句解析サービス30は、「ボックス番号」を特定するための問い合わせを複合機10に送信する。
複合機10の対話エージェントは、受信した問い合わせ302を音声及び表示の少なくとも一方で出力する。本実施形態において付加情報803、804は、必ずしも必要な情報ではなく、アクション802と併せて判断される補助的な情報である。この情報を用いた他の例としては、「○日前に保存したファイルを送信して」や「○番のボックスに保存したファイルをプリント」といった複数パターンの自然言語データからボックス機能を操作可能である。
ユーザ50は、複合機10上の対話エージェントから、303にて保存したいボックス番号を自然言語で伝える。複合機10は自然言語処理、字句解析サービス30に入力された自然言語データを自然言語処理、字句解析サービス30に送信する。自然言語処理、字句解析サービス30は、受信した入力を解析する。その結果、予め登録されている処理を実行するための情報が揃ったため、自然言語処理、字句解析サービス30は、複合機管理サービス20にボックス機能開始を要求する。その後、複合機管理サービス20から自然言語処理、字句解析サービス30を介して複合機10に自然言語により処理を開始する旨を応答し(304)、ボックス保存処理を実行する。複合機10はユーザに対して原稿のスキャンを実行している旨を音声で案内する(305)。
<保存処理のシーケンス>
次に、図4を参照して、本実施形態の保存処理のシーケンスを説明する。ここではユーザが希望する任意のボックスへ画像データを保存する処理の流れを例に説明する。以下で説明する処理は、例えば、各装置のCPUがROMやHDDに格納された制御プログラムをRAMに読み出して実行することにより実現される。
複合機10上の対話エージェントがユーザからの操作を自然言語で受け取ると、S401で、複合機10は、自然言語処理、字句解析サービス30に自然言語で表現されるユーザ操作リクエストを送信する。続いて、S402で、自然言語処理、字句解析サービス30は、ユーザ操作リクエストを自然言語処理し、字句解析する。その後、S403で、自然言語処理、字句解析サービス30は、解析の結果、予め登録されている情報が揃っていない場合、自然言語で表現されたユーザ操作レスポンスを複合機10に送信する。自然言語処理、字句解析サービス30には、予め、必要な情報と、それが揃ったときに実行する処理が登録されており、複合機10と自然言語処理、字句解析サービス30は、上述のやり取りを、必要な情報が揃うまで繰り返す。
図3と図8を例に説明すると、例えばボックス機能における必要な情報とは、図8のアクション802を実行するための情報800を指す。図3ではユーザ50が複合機10に対して「ボックスに保存したい」と伝えた場合、「何番のボックスに保存するか」といった情報が不足している。そのため、自然言語処理、字句解析サービス30は「保存」というアクション802を実行するために必要な付加情報804(ボックス番号)をユーザ50に対して問い合わせる。
次に、S404で、自然言語処理、字句解析サービス30は、上述のやり取りの結果、必要な情報が揃うと、複合機管理サービス20に、複合機のボックス機能の起動要求を送信する。S405で、複合機管理サービス20は、自然言語処理、字句解析サービス30から複合機のボックス機能の開始要求を受信すると、自然言語処理、字句解析サービス30に対してボックス機能の開始応答を送信する。S406で、自然言語処理、字句解析サービス30は、複合機管理サービス20からボックス開始応答を受信すると、複合機10に対しボックス機能の開始応答を送信する。また、S407で、複合機管理サービス20は、複合機10に対しボックス機能の開始命令を送信する。上記ボックス機能の開始応答や開始命令における通知には、ユーザとの対話で決定したボックス番号(例えば、303)が含まれる。従って、複合機10は指定されたボックス番号に対してボックス機能の処理を実行する。なお、複合機10は、ボックス機能の処理の中で、上記指定されたボックス番号以外のボックス番号のボックスにアクセスすることも可能である。
次に、S408で、複合機10は、ボックス機能の開始命令を受信すると、図12を用いて後述するボックス保存処理を実行する。保存形式はpdfやjpeg、TIFF等の任意のフォーマットでよい。続いて、S409で、複合機10はボックス保存処理の終了後、ボックス機能の完了応答として複合機管理サービス20に応答し、処理を終了する。ここで、複合機10は、複合機管理サービス20に対してファイル管理情報を生成して、送信する。複合機管理サービス20は、複合機10から受信したファイル管理情報を複合機管理サービスが備えるHDD等の記憶装置に格納する。複合機管理サービス20は、過去に受信したファイル管理情報の履歴を検索できるようファイル情報管理データベースとして保管しているものとし、データベースの更新処理を実施する。
<ファイル管理情報>
ここで、図7を参照して、ファイル管理情報700の一例を説明する。なお、以下で説明するファイル管理情報700は、複合機管理サービス20で管理する情報であるが、各複合機においてもユーザと対話した記録として、当該対話に関連するファイル管理情報700を保持してもよい。ファイル管理情報700は、保存されるデータ(ファイル)ごとに生成される情報であり、保存したデータに関連する情報や、保存したユーザに関連する情報が含まれる。なお、図7で説明するファイル管理情報700に本発明を限定する意図はなく、全ての情報を管理しなくてもよく、或いは、追加的に他の情報を管理してもよい。
ファイル管理情報700には、ファイル名701、保存日時702、用紙サイズ703、ページ数704、ボックス番号705、及びユーザID706、及び音声ID(VoiceID)707といった情報が含まれる。ユーザID706は、ユーザ50が複合機10に対してID入力やIDカードにより個人認証等を行うことで特定してもよい。音声ID707は、自然言語処理、字句解析サービス30が予めユーザ50の音声の特徴情報を登録しておき、ユーザ操作のリクエスト時にユーザを識別し、ユーザ操作のレスポンス時に複合機10に対して識別したユーザを通知してもよい。また、ファイル管理情報700に含まれる情報は前述したものに限らず他の情報であってもよい。また、ユーザ指示により、該当するファイルを検索する際に、予め識別されたユーザID706又は音声ID707によって保存されたファイルのみ検索するようにすればさらに利便性は向上する。
<処理手順>
次に、図11を参照して、本実施形態に係る複合機10の処理手順を説明する。以下で説明する処理は、例えば、複合機10のCPU101がROM103、HDD104に予め格納された制御プログラムをRAM102に読み出して実行することにより実現される。なお、ここでは、ユーザが音声により対話エージェントと対話を行う場合について説明する。
S1101で、CPU101は、マイク17によってユーザの音声入力を受信し、当該音声の認識(話者の特定)を行う。ここでのユーザからの音声入力の受信は、図3を用いて説明した、対話エージェントの起動時の音声入力や、301に示す入力の際に行われる。話者認識では、受信した音声信号の特徴を抽出して、ユーザごとの特徴情報の生成が行われる。話者認識によって特定される情報は、固有の生体情報であり、話者を特定する情報として用いられる。当該処理については既知の手法を用いて行うものであり、詳細な説明は省略する。なお、当該話者認識については、複合機10で行ってもよいし、クラウド上のサーバで行われてもよい。クラウド上のサーバで行う場合には、受信した音声信号を当該サーバへ送信し、応答として、固有の特徴情報に紐づけられた音声IDを取得してもよい。
話者を特定すると、S1102で、CPU101は、特定された話者が既に登録されているかどうかを判定する。ここでは、登録した話者のテーブルを参照して、特定した話者と一致する情報、例えば音声IDが登録されているか否かを判定してもよい。当該テーブルについては、複合機10で保持しているテーブルでも良いし、複合機管理サービス20で管理されているファイル管理情報でもよい。複合機管理サービス20のファイル管理情報を用いる場合は、CPU101は、特定した話者の音声ID(特徴情報)を、複合機管理サービス20へ送信し、応答として、特定した話者が既に登録されているかの情報を取得するようにしてもよい。また、最初は自装置で保持しているテーブルを参照して判定し、該当者がいなければ複合機管理サービス20へ問い合わせるようにしてもよい。これは、各複合機のメモリ資源を有効に使用すべく、各複合機が関連するユーザのみを登録するような場合に有効である。話者が既に登録されている場合は、S1104に進み、そうでない場合はS1103に進む。
S1103で、CPU101は、特定された話者の音声IDを、保持しているテーブル又は複合機管理サービス20へ登録し、S1104へ進む。S1104で、CPU101は、S402で解析されたユーザ操作によるリクエストがボックス保存処理であるか否かを判定する。ボックス保存処理であればS1106へ進み、そうでない場合はS1105へ進む。S1105で、CPU101は、ユーザのリクエストに応じて、ボックスへのアクセスを行い、処理を終了する。一方、S1106で、CPU101は、HDD104の所定の領域であるボックスへの保存処理を実行し、処理を終了する。ボックス保存処理の詳細については図12を用いて後述する。
<ボックス保存処理>
次に、図12を参照して、本実施形態に係るS1106のボックス保存処理の詳細を説明する。以下で説明する処理は、例えば、複合機10のCPU101がROM103、HDD104に予め格納された制御プログラムをRAM102に読み出して実行することにより実現される。
S1201で、CPU101は、複合機10の自動原稿搬送装置又は原稿台に載置された原稿をスキャナ部14によって読み取って画像データを生成する。続いて、S1202で、CPU101は、生成された画像データを、S406やS407で指定されたボックス番号のボックスに保存する。さらに、S1203で、CPU101は、保存した画像データのファイル情報を生成して保存する。ここで、ファイル情報とは、少なくともファイル名、保存日時、ファイルサイズ(用紙サイズ)、ページ数、保存したボックスのボックス番号、及びユーザIDを含む。なお、ユーザIDに加えて又は代えて、特定された話者の音声ID(特徴情報)が含まれてもよい。
次に、S1204で、CPU101は、複合機10によるボックス使用履歴を更新し、学習を行う。ここで、ボックス使用履歴とは、所定のボックス番号のボックスに対して行った操作の内容や、日時が含まれる。続いて、S1205で、CPU101は、特定した話者の情報(ユーザIDや音声ID)と、生成したファイル情報と、ボックス使用履歴とを紐づけて保存する。
なお、S1203乃至S1205で保存される情報は、複合機10に保存してもよいし、複合機管理サービス20に送信して、当該装置において保存してもよいし、或いは、その両方であってもよい。これらの保存情報は、図7を用いて説明したファイル管理情報として複合機10又は複合機管理サービス20で管理され、対話エージェントを起動した際に、ユーザがアクセスしうるボックスを推定するために利用することができる。つまり、本実施形態に係るシステムでは、対話エージェントを起動する際や、上記301のユーザ入力において受信した音声に対して話者特定を行い、特定した話者が過去に使用したボックスを提示する。これにより、ユーザインタフェースにおける利便性を向上させることができる。
本実施形態ではスキャンした原稿をボックスに保存するフローに関して説明したが、ボックスに保存されているファイルをプリント、又は外部へ送信する場合も同様に実施することができる。この場合、ユーザは対話エージェントに対して保存するボックス番号ではなく、プリント、又は送信したいファイルの宛先(例えばメールアドレス)を伝えればよい。
本発明によればボックス機能により保存された画像データ(ファイル)の管理情報を蓄積しておき、次にボックス機能を使用する際、対話エージェントを介して画像データの管理情報を参照することで、ユーザが所望する画像データを特定することができる。これにより、対話エージェントを使用したボックス機能の操作におけるユーザの利便性を向上させることが可能になる。以下では、管理情報の利用方法についてより詳細に説明する。
上述したように、ユーザ50は複合機10の対話エージェントに対して保存するボックス番号を伝える必要があった。しかし、ユーザ50が保存したファイルを再利用(プリントやネットワーク経由での外部送信等)する場合、いつ、どこに、どんなファイルを保存しているか覚えていない場合、ファイルを探すには音声による操作だけでは不便が生じる。そのため、ユーザ50は音声と操作部15による操作を併用する場合が考えられるが、これらの操作は煩雑なものとなってしまう。そこで、本実施形態では、ユーザが音声によってボックス機能を操作する際の利便性をさらに向上させるための動作の例を説明する。
<ボックスプリント処理>
次に、図5を参照して、本実施形態に係るボックスプリント処理時の対話エージェントの動作例を説明する。まず、ユーザ50が複合機10の操作部15を操作する、又はユーザ50が複合機10に対して所定の単語を発話することによって、複合機10上で対話エージェントが起動され、複合機10は対話モードに移行する。そして、ユーザ50は501で、複合機10上の対話エージェントを起動させた状態で、自然言語による音声でボックス機能の起動を伝える。501、503は、ユーザ50の音声で入力された情報である。502、504は、自然言語処理、字句解析サービス30からの送信に応じ、スピーカ16を介した音声による再生、又は操作部15に表示される自然言語データである。
501で、ユーザは、「〇月×日に保存したファイルをプリント」と発話する。これに対して、図11を用いて上述したように、複合機10は、ユーザが当該データ(ファイル)を保存した際の話者の登録情報(特に、音声ID)やそれに紐づけられたファイル情報などに従って、ユーザ入力の音声から話者を特定する。さらに、複合機10は、特定した話者に紐づく保存されているファイルを特定する。なお、これらの特定処理は、複合機管理サービス20や自然言語処理、字句解析サービス30において行ってもよい。
その後、複合機10は、自然言語処理、字句解析サービス30からの指示に従って、「ファイル名:abcdefでよろしいですか?」と、ユーザに対して応答する。ここで、所望のファイルであれば、ユーザ50は、503で「はい」と応答する。複合機10は、504で「ファイル名:abcdefをプリントします」と応答し、プリントを実行する。
<ボックスプリント処理のシーケンス>
次に、図6を参照して、本実施形態に係るボックスプリント処理のシーケンスを説明する。以下で説明する処理は、例えば、各装置のCPUがROMやHDDに格納された制御プログラムをRAMに読み出して実行することにより実現される。
S601で、複合機10は、入力された自然言語データ(501)を自然言語処理、字句解析サービス30に送信する。なお、ここで、複合機10は、図11を用いて上述したように、ユーザ入力された音声から話者の特定を行う。S602で、自然言語処理、字句解析サービス30は、入力された自然言語データを解析し、文節及び単語に区切り、それぞれの単語の中から名詞を取り出し、それらの名詞を固有名詞やその他の名詞に分類する。その結果、自然言語処理、字句解析サービス30は、分類された名詞の中に、予め登録した、「アクションを実行するための情報」が揃っているか否かを判別する。自然言語処理、字句解析サービス30は、解析の結果、予め登録されている情報が揃っていない場合には、S603で、自然言語で表現されたユーザ操作レスポンスを複合機10に送信する。自然言語処理、字句解析サービス30には、予め、必要な情報と、それが揃ったときに実行する処理が登録されており、複合機10と自然言語処理、字句解析サービス30はこれらのやり取りを、必要な情報が揃うまで繰り返す。
ここで、話者を特定することができれば、自然言語処理、字句解析サービス30は、複合機管理サービス20や複合機10と連携して、ユーザがアクセスしようとしているボックス番号やファイルを推定する。推定した情報は、当該ユーザ操作レスポンスで(502)でユーザに問い合わせられる。このようにユーザの音声IDから管理されている情報(ボックスやファイル)等を特定し、ユーザに提示することにより、ユーザインタフェースにおける利便性を向上することができる。例えば、ファイル管理情報に含まれる名詞として、保存日時を表す「○月×日」が含まれる場合、自然言語処理、字句解析サービス30は、S604で、複合機管理サービス20に対して、特定した話者によって「○月×日」に保存されたファイルがあるかを照合する。続いて、S605で、複合機管理サービス20は、後述するファイル管理情報の中から保存日時「○月×日」に該当するファイルを検索する。該当するファイルがあった場合は、S606で、複合機管理サービス20は、ファイル管理情報の照合結果を、自然言語処理、字句解析サービス30へ送信する。その後、S607で、自然言語処理、字句解析サービス30は、照合結果を自然言語による音声に変換して複合機10に送信する(502)。
その後、S608~S610において、S601~S603と同様に、ユーザ50の音声から予め登録した、「アクションを実行するための情報」が揃うまで、判別する処理を繰り返す(503)。次に、S611で、自然言語処理、字句解析サービス30は、上述のやり取りの結果、必要な情報が揃うと、複合機管理サービス20に、複合機のボックス機能の起動要求を送信する。S612で、複合機管理サービス20は、自然言語処理、字句解析サービス30から複合機のボックス機能の開始要求を受信すると、自然言語処理、字句解析サービス30に対してボックス機能の開始応答を送信する。S613で、自然言語処理、字句解析サービス30は、複合機管理サービス20からボックス機能の開始応答を受信すると、複合機10に対しボックス機能の開始応答を送信する(504)。また、S614で、複合機管理サービス20は、複合機10に対しボックス機能の開始命令を送信する。当該開始命令には、少なくともアクセスするボックス番号と、所定のファイルを示す情報と、ボックスプリント指示(印刷指示)とが含まれる。
次に、S615で、複合機10は、ボックス機能の開始命令を受信すると、指定されたボックス番号のボックス領域に保存された所定のファイルのボックスプリント処理を実行する。S616で、複合機10は、ボックスプリント処理を終了した後、ボックス機能の完了応答として複合機管理サービス20に応答を送信する。続いて、S617で、複合機10は、複合機管理サービス20に対してファイル管理情報を生成して、送信する。複合機管理サービス20は、複合機10から受信したファイル管理情報を複合機管理サービスが備えるHDD等の記憶装置に格納する。
S618で、複合機管理サービス20は、過去に受信したファイル管理情報の履歴を検索できるようファイル情報管理データベースとして保管しているものとし、データベースの更新処理を実施する。S619で、複合機管理サービス20は、複合機10に対して、ファイル管理情報の更新が成功したことを示すファイル管理情報の更新応答を送信し、処理を終了する。
以上説明したように、本実施形態に係る画像処理装置は、ユーザと自然言語を用いて対話可能な対話エージェントを有する画像処理装置である。当該対話エージェントは、クラウド上にある各種サーバの自然言語処理、字句解析サービスと、複合機管理サービスと連携して実現されうる。本画像処理装置は、対話エージェントと対話を行うユーザの音声を受信し、受信した音声の特徴からユーザを特定し、特定されたユーザに紐づけられた保存領域又は保存データを推定し、対話エージェントを通じて、推定された保存領域又は保存データを提示する。このように、本実施形態によれば、対話エージェントを介した操作によって、装置に保存された情報にアクセスする際に、ユーザがアクセスを所望する情報を好適に特定してユーザの利便性を改善することができる。
また、本実施形態に係る画像処理装置は、ユーザを特定できない場合は、音声の特徴に基づくユーザを新たに登録する。この際、音声からユーザを特定するための識別情報と、使用したファイルや保存領域の履歴情報とを紐づけて登録する。また、ボックス領域に対してファイルの保存が行われた場合には、ファイル管理情報をデータベース化して管理しておく。ファイル管理情報は、ファイル名、保存日時、原稿の用紙サイズ、原稿のページ数、保存されたボックス領域を示すボックス番号、ユーザID、及び音声IDの少なくとも1つを含む。このように、本実施形態によれば、ファイル管理情報をデータベース化して記憶しておくことで、ボックス内のファイルを再利用する際の利便性を向上させることができる。
<第2の実施形態>
以下では、本発明の第2の実施形態を説明する。上記第1の実施形態ではファイル管理情報をデータベース化し、ボックス内のファイルをプリントする動作を説明した。本実施形態ではボックス内のファイルを、LAN12等のネットワークを通じて複合機10の外部、例えばメールアドレス宛てにファイルを送信する動作の例を説明する。
<ボックス送信処理>
図9を参照して、本実施形態に係る対話エージェント動作例を説明する。まず、ユーザ50が複合機10の操作部15を操作する、又はユーザ50が複合機10に対して所定の単語を発話することによって、対話エージェントが起動される。複合機10は対話モードに移行する。
そして、ユーザ50は901にて、複合機10上の対話エージェントを起動させた状態で、自然言語による音声でボックス機能の起動を伝える。ここで、複合機10は、図5を用いて説明したのと同様に、話者の特定を行う。901、903、905は、ユーザ50の音声で入力された情報である。902、904、906は、自然言語処理、字句解析サービス30からの送信に応じ、スピーカ16を介した音声による再生、又は操作部15に表示される自然言語データである。
具体的には、901で、ユーザは、「abcdefというファイルを送信」と発話する。これに対して、自然言語処理、字句解析サービス30は、ボックス送信処理を実行する指示であると解析し、そのために必要な情報、例えば、送信宛先の情報を対話により取得する(902、903)。その後、必要な情報が揃うと、自然言語処理、字句解析サービス30は、最終的な指示の確認を行い(904、905)、処理の実行を複合機10に依頼する(906)。
<ボックス送信処理のシーケンス>
次に、図10を参照して、本実施形態に係るボックス送信処理シーケンスを説明する。ここでは、上記第1の実施形態で説明した図6と異なる部分について主に説明する。即ち、S1007~S1009で自然言語処理、字句解析サービス30が複合機10に対して送信先のアドレスを照合する点についてのみ説明する。他の処理であるS1001乃至S1006、S1014乃至S1022は、図6のS601乃至S607、S608乃至S619と同様の処理であるため説明を省略する。
本実施形態における複合機10のボックスはアドレス帳機能を備えており、予め「名前」と「メールアドレス」を登録しておけば、ボックス送信時にアドレス帳を利用してファイルを送信することができる。S1007で、自然言語処理、字句解析サービス30は、903で入力された音声の解析結果から、複合機10のアドレス帳に該当する名前(ここでは、”佐藤”)が存在するか否かを複合機10に対して照合する。
S1008で、複合機10は、自然言語処理、字句解析サービス30から入力されたアドレス情報に含まれる名前からアドレス帳を照合し、自然言語処理、字句解析サービス30に対して照合結果を応答する。アドレス帳に存在する場合は、S1010で、自然言語処理、字句解析サービス30は、最終的な指示の確認を行う(904)。
その後、S1017で、複合機管理サービス20は、ボックス機能の開始命令に、少なくとも、送り先情報(アドレス帳に登録された名前)と、ボックス番号、ファイル、ボックス送信処理の指示(送信指示)を付加し、複合機10に送信する。S1018で、複合機10は、ボックス送信処理を実行する際に、送り先情報を元にメールアドレスを参照し、ファイルの送り先を決定し、処理を実行する。
以上説明したように、本実施形態に係る画像処理装置は、ボックス内に保存されたファイルを外部装置へ送信するボックス送信を行う場合であっても、上記第1の実施形態と同様の効果を得ることができる。より具体的には、対話エージェントを通じて操作を行うユーザ(話者)を特定し、特定した話者に関連するボックスや保存ファイルを提示することにより、ユーザがボックス送信の指示を行う際の利便性を向上させることができる。
<変形例>
なお、本発明は上記第1及び第2の実施形態に限らず様々な変形が可能である。例えば、上記実施形態では、ユーザの音声IDを特定し、当該音声IDに紐づく、ボックス番号やその中に保存されたファイルを特定する制御について説明した。しかし、ユーザが必ずしも1つのボックスのみを利用するわけではなく、複数のボックスやファイル等を利用することも当然に予想される。そのような場合に、ユーザは1つずつのボックスを確認し、所望の保存ファイルを探し出すことは煩わしいものである。そこで、このような場合においては、ファイル管理情報として、音声IDに紐づけて、その使用履歴からボックスやファイル等の使用頻度又は最新の使用状況から所定のボックスやファイルを優先的に提示するように制御してもよい。これにより、上述のようなケースであっても、ユーザインタフェースの利便性を向上することができる。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
10:複合機管理サービス、30:自然言語処理、字句解析サービス、40:モバイル端末、50:ユーザ

Claims (10)

  1. ボックス機能における複数のボックスを用いて画像データを管理することが可能な画像処理システムであって、
    音を取得するマイクロフォンと、
    前記マイクロフォンを介して入力されたユーザの自然言語の音声情報を取得し、該自然言語の音声情報から得られる特徴報と、前記自然言語の音声情報に基づいて生成される字句情報とを取得する取得手段と、
    前記ボックス機能を実行するために利用可能な情報として前記取得した字句情報から前記ボックス機能を使用する意図に対応する1以上の単語を取得することに従って、前特徴情報基づいて前記複数のボックスの中から少なくとも1つのボックスを特定する特定手段と、
    前記自然言語の音声情報の取得に応じて、前記特定されたボックスに関する情報を含む応答情報を出力する出力手段と
    を備えることを特徴とする画像処理システム。
  2. 前記特定されたボックスに関する前記情報は、該特定されたボックスのボックス番号、及び該特定されたボックスに格納されたファイルの少なくとも1つを含むことを特徴とする請求項1に記載の画像処理システム。
  3. ディスプレイを介して前記特定されたボックスに関する前記情報を表示する表示手段をさらに備えることを特徴とする請求項1又は2に記載の画像処理システム。
  4. 画像データを保存することを指示する自然言語の音声情報に基づいて、前記複数のボックスのうちの1つに画像を保存する保存手段と、
    前記画像データについての情報を示す管理情報を生成する生成手段と
    をさらに備えることを特徴とする請求項1乃至の何れか1項に記載の画像処理システム。
  5. 前記管理情報は、ファイル名、保存日時、文書の用紙サイズ、文書のページ数、保存されるボックス領域を示すボックス番号、ユーザID、及び前記特徴情報を示す音声IDの少なくとも1つを含むことを特徴とする請求項4に記載の画像処理システム。
  6. 前記出力手段は、前記取得した特徴情報に関連する使用履歴に基づいて前記応答情報を出力することを特徴とする請求項1乃至の何れか1項に記載の画像処理システム。
  7. 画像データの出力指示を受け付ける受付手段をさらに備えることを特徴とする請求項1乃至の何れか1項に記載の画像処理システム。
  8. 前記特定手段は、ボックス機能の実行に対応する指示情報が取得された場合に、前記取得した特徴情報に関連する使用履歴に基づいて、前記複数のボックスのうち、前記取得した特徴情報に関連付けられる少なくとも1つのボックスを特定することを特徴とする請求項1乃至の何れか1項に記載の画像処理システム。
  9. ボックス機能における複数のボックスを用いて画像データを管理することが可能な画像処理装置であって、
    音を取得するマイクロフォンと、
    前記マイクロフォンを介して入力されたユーザの自然言語の音声情報を取得し、該自然言語の音声情報から得られる特徴報と、前記自然言語の音声情報に基づいて生成される字句情報とを取得する取得手段と、
    前記ボックス機能を実行するために利用可能な情報として前記取得した字句情報から前記ボックス機能を使用する意図に対応する1以上の単語を取得することに従って、前特徴情報基づいて前記複数のボックスの中から少なくとも1つのボックスを特定する特定手段と、
    前記自然言語の音声情報の取得に応じて、前記特定されたボックスに関する情報を含む応答情報を出力する出力手段と
    を備えることを特徴とする画像処理装置。
  10. 音を取得するマイクロフォンを備え、ボックス機能における複数のボックスを用いて画像データを管理することが可能な画像処理装置の制御方法であって、
    取得手段が、前記マイクロフォンを介して入力されたユーザの自然言語の音声情報を取得し、該自然言語の音声情報から得られる特徴報と、前記自然言語の音声情報に基づいて生成される字句情報とを取得する取得工程と、
    特定手段が、前記ボックス機能を実行するために利用可能な情報として前記取得した字句情報から前記ボックス機能を使用する意図に対応する1以上の単語を取得することに従って、前特徴情報基づいて前記複数のボックスの中から少なくとも1つのボックスを特定する特定工程と、
    出力手段が、前記自然言語の音声情報の取得に応じて、前記特定されたボックスに関する情報を含む応答情報を出力する出力工程と
    を含むことを特徴とする画像処理装置の制御方法。
JP2018184982A 2018-09-28 2018-09-28 画像処理システム、画像処理装置、及びその制御方法 Active JP7175696B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2018184982A JP7175696B2 (ja) 2018-09-28 2018-09-28 画像処理システム、画像処理装置、及びその制御方法
US16/580,091 US11146696B2 (en) 2018-09-28 2019-09-24 Image processing system, image processing apparatus, and image processing method using a plurality of boxes for a box function corresponding to user identified voice ID
CN201910911291.2A CN110971772A (zh) 2018-09-28 2019-09-25 图像处理系统、图像处理设备以及图像处理方法
US17/469,068 US11785150B2 (en) 2018-09-28 2021-09-08 Image processing system, image processing apparatus, and image processing method
JP2022179738A JP2023025021A (ja) 2018-09-28 2022-11-09 画像処理システム、及びその制御方法
US18/360,938 US20230388427A1 (en) 2018-09-28 2023-07-28 Image processing system, image processing apparatus, and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018184982A JP7175696B2 (ja) 2018-09-28 2018-09-28 画像処理システム、画像処理装置、及びその制御方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022179738A Division JP2023025021A (ja) 2018-09-28 2022-11-09 画像処理システム、及びその制御方法

Publications (3)

Publication Number Publication Date
JP2020055115A JP2020055115A (ja) 2020-04-09
JP2020055115A5 JP2020055115A5 (ja) 2021-11-04
JP7175696B2 true JP7175696B2 (ja) 2022-11-21

Family

ID=69947795

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018184982A Active JP7175696B2 (ja) 2018-09-28 2018-09-28 画像処理システム、画像処理装置、及びその制御方法
JP2022179738A Pending JP2023025021A (ja) 2018-09-28 2022-11-09 画像処理システム、及びその制御方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022179738A Pending JP2023025021A (ja) 2018-09-28 2022-11-09 画像処理システム、及びその制御方法

Country Status (3)

Country Link
US (3) US11146696B2 (ja)
JP (2) JP7175696B2 (ja)
CN (1) CN110971772A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7151478B2 (ja) * 2018-12-28 2022-10-12 京セラドキュメントソリューションズ株式会社 画像形成装置
JP2022052313A (ja) * 2020-09-23 2022-04-04 セイコーエプソン株式会社 送信装置、通信システム及び表示装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006287806A (ja) 2005-04-04 2006-10-19 Konica Minolta Business Technologies Inc 文書管理システム、文書管理装置及び文書管理プログラム
JP2007188001A (ja) 2006-01-16 2007-07-26 Konica Minolta Business Technologies Inc 情報処理装置、音声コマンド実行プログラムおよび音声コマンド実行方法
JP2007193138A (ja) 2006-01-19 2007-08-02 Ricoh Co Ltd 画像形成装置
JP2009194577A (ja) 2008-02-13 2009-08-27 Konica Minolta Business Technologies Inc 画像形成装置、音声案内方法及び音声案内プログラム
US20100284035A1 (en) 2009-05-08 2010-11-11 Samsung Electronics Co., Ltd. Method of storing print data, and image forming apparatus and image forming system to perform the method

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3299126B2 (ja) * 1996-10-07 2002-07-08 ブラザー工業株式会社 通信装置
JP2007058684A (ja) * 2005-08-25 2007-03-08 Kyocera Mita Corp 文書管理システム
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8213041B2 (en) * 2006-09-25 2012-07-03 Kyocera Mita Corporation Image forming apparatus provided with an image filing function for saving files in an organized manner
JP2008271047A (ja) 2007-04-18 2008-11-06 Murata Mach Ltd 画像読取装置
JP5146429B2 (ja) * 2009-09-18 2013-02-20 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム
EP2498250B1 (en) * 2011-03-07 2021-05-05 Accenture Global Services Limited Client and server system for natural language-based control of a digital network of devices
AU2012316484A1 (en) * 2011-09-30 2014-04-17 Apple Inc. Automatically adapting user interfaces for hands-free interaction
CN103680497B (zh) * 2012-08-31 2017-03-15 百度在线网络技术(北京)有限公司 基于视频的语音识别系统及方法
JP6206081B2 (ja) * 2013-10-17 2017-10-04 コニカミノルタ株式会社 画像処理システム、画像処理装置及び携帯端末装置
JP6327930B2 (ja) * 2014-05-02 2018-05-23 キヤノン株式会社 画像形成装置、情報処理方法及びプログラム
US9338493B2 (en) * 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10580404B2 (en) * 2016-09-01 2020-03-03 Amazon Technologies, Inc. Indicator for voice-based communications
JP6863810B2 (ja) * 2017-04-25 2021-04-21 株式会社Subaru オイルの昇温装置
US20190266286A1 (en) * 2018-02-28 2019-08-29 Jordi Torras Method and system for a semantic search engine using an underlying knowledge base

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006287806A (ja) 2005-04-04 2006-10-19 Konica Minolta Business Technologies Inc 文書管理システム、文書管理装置及び文書管理プログラム
JP2007188001A (ja) 2006-01-16 2007-07-26 Konica Minolta Business Technologies Inc 情報処理装置、音声コマンド実行プログラムおよび音声コマンド実行方法
JP2007193138A (ja) 2006-01-19 2007-08-02 Ricoh Co Ltd 画像形成装置
JP2009194577A (ja) 2008-02-13 2009-08-27 Konica Minolta Business Technologies Inc 画像形成装置、音声案内方法及び音声案内プログラム
US20100284035A1 (en) 2009-05-08 2010-11-11 Samsung Electronics Co., Ltd. Method of storing print data, and image forming apparatus and image forming system to perform the method

Also Published As

Publication number Publication date
US11785150B2 (en) 2023-10-10
CN110971772A (zh) 2020-04-07
US11146696B2 (en) 2021-10-12
US20210409560A1 (en) 2021-12-30
JP2020055115A (ja) 2020-04-09
US20200106895A1 (en) 2020-04-02
JP2023025021A (ja) 2023-02-21
US20230388427A1 (en) 2023-11-30

Similar Documents

Publication Publication Date Title
US11355106B2 (en) Information processing apparatus, method of processing information and storage medium comprising dot per inch resolution for scan or copy
JP2023025021A (ja) 画像処理システム、及びその制御方法
JP4226618B2 (ja) 制御装置、複合機、複合機制御システム、制御プログラム、およびコンピュータ読み取り可能な記録媒体
US11769485B2 (en) Job record specifying device, image processing apparatus, server, job record specifying method, and recording medium
US8209621B2 (en) Image processing system, image processing apparatus and information processing apparatus
US11211069B2 (en) Information processing system, information processing method, and non-transitory recording medium
JP2012099030A (ja) 情報処理装置、ワークフロー管理システム、ワークフローの実行方法およびプログラム
JP2005332403A (ja) 複数の装置による画像仕上げ機能の選択を単一の位置において組み合わせるシステムおよび方法
JP7112278B2 (ja) 画像処理装置及びその制御方法、並びにプログラム
CN111625204A (zh) 控制系统、服务器系统和控制方法
JP5110140B2 (ja) 画像形成装置、表示方法、および表示プログラム
JP2008271542A (ja) ドキュメント処理装置のオーディオビジュアル制御システムおよび方法
US11240390B2 (en) Server apparatus, voice operation system, voice operation method, and recording medium
US10956107B1 (en) Methods and systems for keyword-based printing
JP2006228062A (ja) 印刷システム、印刷方法及びそのプログラム
US20140055813A1 (en) Apparatus and method of forming an image, terminal and method of controlling printing, and computer-readable recording medium
JP5402108B2 (ja) 画像形成装置
US11647129B2 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
JP2020024582A (ja) 画像処理装置及びその制御方法、並びにプログラム
JP7361509B2 (ja) 周辺装置管理システム、印刷装置制御システム、制御方法、印刷制御装置及びプログラム
JP7314499B2 (ja) 情報処理システム、情報処理装置、ジョブ制御方法およびジョブ制御プログラム
CN111045610A (zh) 打印控制系统和控制方法
CN114424159A (zh) 支援程序、信息处理装置及打印方法
CN112256214A (zh) 作业取消打印方法、图像形成装置以及系统、计算机存储介质
US10956106B1 (en) Methods and systems enabling a user to customize content for printing

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210922

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210922

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221011

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221109

R151 Written notification of patent or utility model registration

Ref document number: 7175696

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151