WO2024024643A1 - 画像形成装置 - Google Patents

画像形成装置 Download PDF

Info

Publication number
WO2024024643A1
WO2024024643A1 PCT/JP2023/026677 JP2023026677W WO2024024643A1 WO 2024024643 A1 WO2024024643 A1 WO 2024024643A1 JP 2023026677 W JP2023026677 W JP 2023026677W WO 2024024643 A1 WO2024024643 A1 WO 2024024643A1
Authority
WO
WIPO (PCT)
Prior art keywords
input
voice
control unit
instruction
image forming
Prior art date
Application number
PCT/JP2023/026677
Other languages
English (en)
French (fr)
Inventor
翔一 坂口
文弥 坂下
惇平 高田
優実 広部
拓磨 藤川
Original Assignee
京セラドキュメントソリューションズ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 京セラドキュメントソリューションズ株式会社 filed Critical 京セラドキュメントソリューションズ株式会社
Priority to CN202380014082.2A priority Critical patent/CN118120220A/zh
Priority to JP2024537655A priority patent/JPWO2024024643A1/ja
Publication of WO2024024643A1 publication Critical patent/WO2024024643A1/ja

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41JTYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
    • B41J29/00Details of, or accessories for, typewriters or selective printing mechanisms not otherwise provided for
    • B41J29/42Scales and indicators, e.g. for determining side margins
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03GELECTROGRAPHY; ELECTROPHOTOGRAPHY; MAGNETOGRAPHY
    • G03G21/00Arrangements not provided for by groups G03G13/00 - G03G19/00, e.g. cleaning, elimination of residual charge
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Definitions

  • the present invention relates to an image forming apparatus capable of giving voice instructions.
  • Some image forming apparatuses such as copying machines and multifunction peripherals, are equipped with an operation panel for users to perform manual input operations. By operating the operation panel, the user can select one function from a plurality of functions (for example, copy function, scanner function, facsimile function) or make settings for the function.
  • functions for example, copy function, scanner function, facsimile function
  • Patent Document 1 listed below describes that the contents of voice instructions are reflected in job settings
  • Patent Document 2 listed below describes how to select a user from among a plurality of pieces of jib history information based on keywords included in the user's voice. This document describes how to narrow down the intended job history information.
  • Patent Documents 1 and 2 do not disclose any means for solving the problem during voice input.
  • the present invention has been made in view of the above circumstances, and an object of the present invention is to make it possible to ensure security and input accuracy when uttering and inputting voice for voice instructions.
  • An image forming apparatus is an image forming apparatus that includes an image forming section that forms an image on a recording medium, and includes a display section, a display control section that displays an operation screen on the display section, and a user an operation unit into which manual input instructions are input by manual operation, a voice input unit into which voice is input from the user, a reception desk that receives voice instructions based on the voice input to the voice input unit, and the manual input instructions. and a control unit that controls the operation of the image forming apparatus to execute a job based on the manual input instruction and the voice instruction received by the reception unit, and the control unit is configured to receive the manual input instruction and the voice instruction.
  • FIG. 1 is a perspective view showing the appearance of an image forming apparatus according to an embodiment of the present invention.
  • 1 is a functional block diagram schematically showing the main internal configuration of an image forming apparatus.
  • (A) and (B) are diagrams showing an example of an operation screen displayed on a display unit.
  • (A) and (B) are diagrams showing an example of an operation screen displayed on a display unit.
  • FIG. 3 is a diagram showing an example of an operation screen displayed on a display unit.
  • FIG. 3 is a diagram showing an example of an operation screen displayed on a display unit.
  • FIG. 3 is a diagram showing an example of an operation screen displayed on a display unit.
  • 3 is a flowchart illustrating an example of processing performed by a control unit of an image forming apparatus.
  • FIG. 3 is a diagram showing an example of an operation screen displayed on a display unit.
  • FIG. 1 is a perspective view showing the appearance of an image forming apparatus according to an embodiment of the present invention.
  • FIG. 2 is a functional block diagram schematically showing the main internal configuration of the image forming apparatus.
  • the image forming apparatus 1 is a multifunction device that has multiple functions such as a copy function, a printer function, a scanner function, and a facsimile function, and includes a document feeding section 6, a document reading section 5, , an image forming section 12, a fixing section 13, a paper feeding section 14, a storage section 8, a motion sensor 21, an operation section 47, a facsimile communication section 71, a network interface section 91, a microphone 22, and a speaker 23.
  • a document feeding section 6 a document reading section 5
  • an image forming section 12 a fixing section 13
  • a paper feeding section 14 a storage section 8
  • a motion sensor 21 an operation section 47
  • a facsimile communication section 71 a network interface section 91
  • microphone 22 and a speaker 23.
  • the document feeding section 6 is configured to be openable and closable by a hinge (not shown) on the top surface of the document reading section 5, and the document feeding section 6 is configured to be able to open and close the document placed on a platen glass (not shown). Functions as a holding cover.
  • the document feeding unit 6 is also called an ADF (Auto Document Feeder) or a DP (Document Processor), and is equipped with a document placement tray 61, and transfers the document placed on the document placement tray 61 to the document reading unit. 5. Supply one sheet at a time.
  • the original reading unit 5 optically reads the image of the original supplied to the original reading unit 5 by the original feeding unit 6 or placed on the platen glass, and generates image data.
  • the image data generated by the document reading section 5 is stored in an unillustrated image memory or the like.
  • the image forming section 12 Based on the image data generated by the document reading operation or the image data received from a computer as an external device (for example, a personal computer) connected to a network, the image forming section 12 generates a recording sheet fed from the paper feeding section 14. A toner image is formed on recording paper as a medium.
  • the fixing unit 13 heats and presses the recording paper on which the toner image has been formed by the image forming unit 12 to fix the toner image on the recording paper. It is discharged at 51.
  • the paper feed section 14 includes a plurality of paper feed cassettes 141.
  • the storage unit 8 is a large capacity storage device such as an HDD (Hard Disk Drive) or an SSD (Solid State Drive), and stores various control programs and the like.
  • HDD Hard Disk Drive
  • SSD Solid State Drive
  • the human sensor 21 detects a person approaching the image forming apparatus 1.
  • a sensor that detects infrared rays emitted by a human body is used.
  • the operation unit 47 receives instructions from the operator regarding various operations and processes that can be executed by the image forming apparatus 1, such as an instruction to execute an image forming operation.
  • the operation unit 47 includes a display unit 473 that displays operation guidance for the operator.
  • the operation unit 47 also receives instructions from the user via the touch panel included in the display unit 473 based on the user's operation (touch operation) on the operation screen displayed on the display unit 473 or the user's operation on the physical keys. Accept input.
  • the display section 473 consists of an LCD (Liquid Crystal Display) or the like.
  • the display section 473 includes a touch panel. When the operator performs an operation of touching a button or key displayed on the screen, the touch panel receives an instruction associated with the position of the touch operation.
  • the facsimile communication unit 71 includes an unillustrated encoding/decoding unit, modulation/demodulation unit, and NCU (Network Control Unit), and performs facsimile transmission and reception using a public telephone line or the like.
  • the network interface unit 91 is a communication interface that sends and receives various data to and from devices (for example, a personal computer) within the local area or on the Internet.
  • the microphone 22 collects sounds around the image forming apparatus 1 and converts them into electrical signals (audio data). Note that the microphone 22 is provided at a suitable location where it is easy to collect the voice uttered by the user, for example, at the operation unit 47.
  • the speaker 23 outputs various sounds, such as operation sounds and sound effects when operating the operation unit 47, dance sounds explaining the operation method, and warning sounds when a trouble occurs in the image forming apparatus 1.
  • the speaker 23 is provided at a location that is not visible from the outside of the image forming apparatus 1, for example, within the operation section 47.
  • the control unit 10 is configured to include a processor, a RAM (Random Access Memory), a ROM (Read Only Memory), and a dedicated hardware circuit.
  • the processor is, for example, a CPU (Central Processing Unit), an ASIC (Application Specific Integrated Circuit), or an MPU (Micro Processing Unit).
  • the control unit 10 includes a control section 100, a display control section 101, a voice analysis section 102, and a reception section 103.
  • the control unit 10 functions as a control section 100, a display control section 101, an audio analysis section 102, and a reception section 103 by the operation of the processor according to a control program stored in the storage section 8.
  • these control sections 100 and the like may be configured by hardware circuits without depending on the operation according to the control program by the control unit 10.
  • the control unit 100 controls the overall operation of the image forming apparatus 1.
  • the control section 100 includes a document feeding section 6, a document reading section 5, an image forming section 12, a fixing section 13, a paper feeding section 14, a storage section 8, a human sensor 21, an operation section 47, a facsimile communication section 71, and a network interface. 91, the microphone 22, and the speaker 23, and controls the driving of these respective parts.
  • the control unit 100 controls the operation of the image forming unit 12 and the like to form a document image obtained by reading by the document reading unit 5 on recording paper as a recording medium.
  • the control unit 100 controls the microphone 22 to turn on, enables audio input to the microphone 22, and the human sensor 21 detects the approaching person.
  • a predetermined period of time for example, 30 seconds
  • the microphone 22 is controlled to be turned off.
  • the control unit 100 can also turn on and off the microphone 22 in accordance with an instruction input to the operation unit 47.
  • the display control unit 101 controls the display on the display unit 473.
  • the display control unit 101 displays a selection screen on the display unit 473 for allowing the user to select a function to be executed from among a plurality of functions executable by the image forming apparatus 1, and also displays a selection screen from the selection screen.
  • Display unit 473 displays a setting screen for accepting input related to setting of each function, which is also a lower layer.
  • FIGS. 3A and 3B are diagrams showing examples of screens displayed on the display section 473.
  • the operation screen SC1 shown in FIG. 3A is a selection screen for allowing the user to select a function to be executed from among a plurality of functions executable by the image forming apparatus 1.
  • the operation screen SC1 displays a "copy” button, a “send (scanner function)” button, a “fax (facsimile function)” button, and the like. Note that the operation screen SC1 as the selection screen is also a "home” screen.
  • the control unit 100 displays the operation screen SC2 shown in FIG. 3(B) on the display unit 473 in accordance with this instruction.
  • the operation screen SC2 is displayed on the display section 473 as a lower hierarchy than the "home” screen.
  • the operation screen SC2 is a setting screen for accepting input related to settings of the "copy” function.
  • "Copy” function "Paper selection”, “Color selection”, “Page consolidation”, “Reduction/Enlargement”, “Duplex/Split”, and “Staple/Punch” are written.
  • Six buttons will be displayed. These buttons are images for accepting settings related to the "copy” function.
  • a symbol G1 whose design is a microphone is displayed on the operation screen SC1 shown in FIG. 3(A) and the operation screen SC2 shown in FIG. 3(B) (top left in FIGS. 3(A) and (B)).
  • the display of the symbol G1 indicates that voice input to the microphone 22 is possible. That is, the control unit 100 displays the symbol G1 on the operation screen SC2 when the microphone 22 is turned on and the microphone 22 is in a state where voice input is possible.
  • control unit 100 when the control unit 100 turns off the microphone 22 and disables voice input, the control unit 100 displays the operation screen SC1 and On the operation screen SC2 (top left in FIGS. 3A and 3B), a symbol G2 is displayed, which is an image of an "x" superimposed on a symbol G1 whose design is a microphone.
  • the speech analysis unit 102 converts the electrical signal (speech data) converted by the microphone 22 into text data using existing speech recognition technology, and analyzes the text data using existing natural language processing technology. , recognize voice instructions from the user.
  • the reception unit 103 receives an instruction input by manual input operation via the operation unit 47 (including a touch panel) on the screen currently displayed on the display unit 473 and a voice recognized by the voice analysis unit 102 via the microphone 22.
  • the instruction (analysis result by the voice analysis unit 102) is received as an instruction from the user.
  • the control unit 100 executes the job according to the contents of the instruction received by the reception unit 103.
  • the display control unit 101 displays on the display unit 473 a setting screen that displays the instructions input by manual input operation or the content indicated by the audio instructions. For example, when the operation screen SC2 as the setting screen shown in FIG. ” to “black and white” and “page aggregation” to “2in1” are input, and the reception unit 103 receives these instructions. At this time, the display control unit 101 changes the "paper selection” setting from “auto” to "A4", the "color selection” setting from “full color” to “black and white”, and the "page The display section 473 displays an operation screen SC2 (setting screen) in which "Aggregation” is switched from “Off” to "2in1".
  • the display control section 101 displays an operation screen SC2 as shown in FIG. 6 on the display section 473.
  • the control unit 100 operates in a manual input only mode in which only manual input instructions input by operating the operation unit 47 are accepted by the reception unit 103, and in a voice input enabled mode in which the voice instructions and the manual input instructions are accepted by the reception unit 103. Switch between.
  • the control unit 100 sets the manual input only mode so that the reception unit 103 does not accept voice instructions. (i) Turns off the microphone 22 so that only manual input instructions are accepted by the reception unit 103. or (ii) prevent the reception unit 103 from accepting a voice instruction in which voice is input to the microphone 22 in the on state and the voice is analyzed by the voice analysis unit 102. good.
  • the control unit 100 switches to the manual input only mode when the display control unit 101 displays on the display unit 473 an operation screen for accepting input of information for which input by voice instruction is prohibited in advance.
  • Information that is previously prohibited from being input using voice instructions is, for example, taboo content that is not likely to be leaked (e.g., user ID or password), and/or information that does not maintain accuracy with voice input and cannot provide accurate instructions.
  • This is predetermined voice input prohibition information, such as instruction contents that cannot be input (for example, an email address to send an email to, an IP address to send data to, etc.).
  • voice input prohibition information such as instruction contents that cannot be input (for example, an email address to send an email to, an IP address to send data to, etc.).
  • the display control unit 101 When the display control unit 101 is switched to the voice input enabled mode, the display control unit 101 causes the operation screen displayed on the display unit 473 to display an image or message indicating that voice instructions are accepted. On the other hand, when the display control unit 101 is switched to the manual input only mode, the display control unit 101 causes the operation screen displayed on the display unit 473 to display an image or a message indicating that the voice instruction cannot be accepted.
  • the control unit 100 switches the operation mode of the image forming apparatus 1 to a manual input only mode,
  • the reception unit 103 does not accept voice instructions regarding the user ID and password, but only accepts manual input operations.
  • the display control unit 101 displays a symbol G2 on the authentication screen SC3, which is a symbol of a microphone with an "X" superimposed thereon, indicating that these operation targets do not accept voice instructions.
  • the authentication screen SC3 may be displayed when performing system settings other than when logging in. Further, when performing private printing, a password is required to be input, and a similar authentication screen SC3 is displayed in this case as well.
  • control unit 10 of the image forming apparatus 1 will be described based on the flowchart shown in FIG. 8. Note that this process is performed when the operation screen displayed on the display unit 473 is switched. Note that, as an initial setting, the control unit 100 switches the operation mode of the image forming apparatus 1 to a voice input enabled mode.
  • the control unit 100 determines whether the switched operation screen is an operation screen for accepting input of the voice input prohibition information (S1). .
  • control unit 100 determines that the operation screen after table switching is an operation screen for accepting input of the voice input prohibition information (S1 "Yes")
  • the control unit 100 changes the operation mode of the image forming apparatus 1.
  • the reception unit 103 does not accept voice instructions for the user ID and password, but only accepts manual input operations.
  • the display control unit 101 causes the operation screen to display an image or message indicating that the voice instruction cannot be accepted, as shown in the example in FIG. 7 (S3).
  • control unit 100 determines that the operation screen after table switching is not an operation screen for accepting the input of the voice input prohibition information (S1 "No")
  • the control unit 100 changes the operation mode of the image forming apparatus 1 to the voice input prohibition information.
  • the input enabled mode remains (S4). After this, the process ends.
  • the operation screen for accepting the input of the voice input prohibition information for example, private information (confidential information) such as a user ID or password
  • the reception screen is displayed on the display unit 473. Since the section 103 does not accept voice instructions but only manual input instructions, the user does not have to say personal information such as a user ID or password, making it possible to prevent leakage of confidential information and ensure security. become.
  • the display unit 473 displays an operation screen for accepting destination information for data transmission, such as an e-mail address to which the email is to be sent, an IP address to which the data is to be sent, etc., as the voice input prohibition information
  • the reception is Since the unit 103 does not accept voice instructions but only manual input instructions, the user must input the destination information by manually operating the operation unit 47, and the destination information (instruction content) The accuracy of input is maintained, and information (instructions) can be input accurately.
  • the display control unit 101 may display, on the operation screen of the display unit 473, both input items that accept voice instructions and input items that accept only manual input instructions (for example, the display control unit 101 displays the input items that accept only manual input instructions). Operation screen SC1). When displaying such an operation screen on the display unit 473, the display control unit 101 displays an input item that only accepts manual input instructions with an image or message indicating that voice input is not accepted.
  • the symbol G1 of a microphone is displayed, and on the other hand, the "System Settings" and “Internet” buttons that do not accept voice instructions are displayed with the symbol G1 of a microphone as an image indicating that they do not accept voice input.
  • a symbol G2 with "x" superimposed on it is displayed.
  • the control unit 100 switches the operation mode of the image forming apparatus 1 to a voice input enabled mode. Based on the content of the audio information inputted from the audio analysis unit 102, the receiving unit 103 performs a process of not accepting audio instructions indicating audio input prohibition information, but accepting audio instructions other than audio input prohibition information.
  • the control unit 100 stores the total number of voice instructions and manual input instructions received by the reception unit 103. Then, when the operation screen to be the initial screen is displayed on the display unit 473 by the display control unit 101, the control unit 100 selects the manual input only mode or the voice input mode, whichever has the larger total number of receptions. mode, the operation mode of the image forming apparatus 1 is switched to this mode.
  • the reception unit 103 does not accept voice instructions for inputting voice input prohibition information, but only accepts manual input instructions. This allows users to switch to the mode they frequently use when displaying the initial screen, improving convenience while ensuring the security and accuracy of input information. Become.
  • the audio data collected by the microphone 22 and converted is analyzed by the audio analysis unit 102 in the image forming apparatus 1
  • a device called a smart speaker A speaker with a built-in microphone and an AI (artificial intelligence) assistant function is adopted, the user's voice is collected by the speaker, and the image forming apparatus 1 uses the speaker as an audio input unit to analyze the audio from the speaker.
  • the receiving unit 103 may receive the results.
  • the present invention is not limited to the configuration of the above embodiments, and various modifications are possible. Further, in the embodiment described above, the configuration and processing shown in the embodiment using FIGS. 1 to 9 are merely one embodiment of the present invention, and the present invention is not intended to be limited to the configuration and processing.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Facsimiles In General (AREA)
  • Control Or Security For Electrophotography (AREA)

Abstract

画像形成装置(1)は、操作部(47)を介した手入力指示、及びマイクロフォン(22)を介した音声指示を受け付ける受付部(103)と、受付部(103)が受け付けた設定に基づいて、ジョブを実行する制御部(100)と、を備える。制御部(100)は、手入力指示だけが受付部に受け付けられる手入力専用モードと、音声指示及び手入力指示が受付部に受け付けられる音声入力可能モードとを切り替え、音声指示による入力が予め禁止された情報の入力を受け付けるための操作画面(SC3)が表示制御部(SC2)によって表示部(101)に表示されているときは、手入力専用モードに切り替える。

Description

画像形成装置
 本発明は、音声指示が可能な画像形成装置に関する。
 複写機や複合機等の画像形成装置には、ユーザーが手入力操作を行うための操作パネルを備えるものがある。ユーザーは、操作パネルを介して操作を行うことで、複数の機能(例えば、コピー機能、スキャナー機能、ファクシミリ機能)の中から1つの機能を選択し、或いは、機能に対する設定を行うことができる。
 また、画像形成装置には、音声指示を可能とするものが、種々提案され、実用化されている。例えば、下記特許文献1には、音声指示の内容をジョブ設定に反映させることが記載され、下記特許文献2には、ユーザー音声に含まれるキーワードに基づいて、複数のジブ履歴情報の中からユーザーが意図するジョブ履歴情報を絞り込むことが記載されている。
特開2020-098383号公報 特開2019-205052号公報
 しかしながら、音声入力時は、ユーザーが発声している内容が周囲に伝わりやすい。操作内容が単なる機能選択や設定であれば、周囲に伝わったとしても問題はないが、ユーザーIDやパスワードなどの個人情報が周囲に伝わるのはセキュリティー上好ましくない。また、音声入力では入力の正確性が保たれず正確な指示を入力できない指示内容の場合もある。ところが、上記特許文献1,2には、音声入力時における当該問題を解決する手段は何ら開示されていない。
 本発明は、上記の事情に鑑みなされたものであり、音声指示用の音声を発声して入力する際におけるセキュリティー及び入力正確性を確保可能にすることを目的とする。
 本発明の一局面に係る画像形成装置は、記録媒体に画像を形成する画像形成部を備える画像形成装置であって、表示部と、前記表示部に操作画面を表示させる表示制御部と、ユーザーによる手動操作で手入力指示が入力される操作部と、ユーザーから音声が入力される音声入力部と、前記音声入力部に入力された音声に基づく音声指示と、前記手入力指示とを受け付ける受付部と、前記受付部が受け付けた前記手入力指示及び前記音声指示に基づいて前記画像形成装置の動作を制御してジョブを実行する制御部と、を備え、前記制御部は、前記手入力指示だけが前記受付部に受け付けられる手入力専用モードと、前記音声指示及び前記手入力指示が前記受付部に受け付けられる音声入力可能モードとを切り替え、前記音声指示による入力が予め禁止された情報の入力を受け付けるための前記操作画面が前記表示制御部によって前記表示部に表示されているときは、前記手入力専用モードに切り替えるものである。
 本発明によれば、音声指示用の音声を発声して入力する際におけるセキュリティー及び入力正確性の確保が可能になる。
本発明の一実施形態に係る画像形成装置の外観を示す斜視図である。 画像形成装置の主要内部構成を概略的に示す機能ブロック図である。 (A)及び(B)は、表示部に表示される操作画面の一例を示す図である。 (A)及び(B)は、表示部に表示される操作画面の一例を示す図である。 表示部に表示される操作画面の一例を示す図である。 表示部に表示される操作画面の一例を示す図である。 表示部に表示される操作画面の一例を示す図である。 画像形成装置の制御ユニットで行われる処理の一例を示すフローチャートである。 表示部に表示される操作画面の一例を示す図である。
  以下、本発明の一実施形態に係る画像形成装置について図面を参照して説明する。図1は、本発明の一実施形態に係る画像形成装置の外観を示す斜視図である。図2は、画像形成装置の主要内部構成を概略的に示す機能ブロック図である。第1実施形態に係る画像形成装置1は、例えば、コピー機能、プリンター機能、スキャナー機能、及びファクシミリ機能のような複数の機能を兼ね備えた複合機であり、原稿給送部6、原稿読取部5、画像形成部12、定着部13、給紙部14、記憶部8、人感センサー21、操作部47、ファクシミリ通信部71、ネットワークインターフェイス部91、マイクロフォン22、及びスピーカー23を含んで構成されている。
 原稿給送部6は、原稿読取部5の上面に図略のヒンジ等によって開閉可能に構成され、原稿給送部6は、図略のプラテンガラス上に載置された原稿を読み取る場合に原稿押さえカバーとして機能する。また、原稿給送部6は、ADF(Auto Document Feeder)やDP(Document Processor)と呼ばれるものであり、原稿載置トレイ61を備え、原稿載置トレイ61に載置された原稿を原稿読取部5へ1枚ずつ供給する。
 画像形成装置1で原稿読取動作が行われる場合について説明する。原稿給送部6により原稿読取部5へ供給された原稿、又は上記プラテンガラス上に載置されている原稿の画像を、原稿読取部5が光学的に読み取り、そして画像データを生成する。原稿読取部5により生成された画像データは、図略の画像メモリー等に保存される。
 画像形成装置1で画像形成動作が行われる場合について説明する。原稿読取動作により生成された画像データや、ネットワーク接続された外部装置(例えば、パソコン)としてのコンピューターから受信した画像データに基づいて、画像形成部12が、給紙部14から給紙される記録媒体としての記録紙にトナー像を形成する。
 定着部13は、画像形成部12によりトナー像が形成された記録紙を加熱及び加圧してトナー像を記録紙に定着させるものであり、定着処理が施された記録紙は排出トレイ1
51に排出される。給紙部14は、複数の給紙カセット141を備える。
 記憶部8は、HDD(Hard Disk Drive)又はSSD(Solid State Drive)等の大容量記憶装置であり、各種の制御プログラム等を記憶する。
 人感センサー21は、画像形成装置1への接近者を検知する。人感センサー21としては、例えば、人体が発する赤外線を検知するセンサーが用いられる。
 操作部47は、画像形成装置1が実行可能な各種動作及び処理について、操作者から、画像形成動作実行指示等の指示を受け付ける。操作部47は、操作者への操作案内等を表示する表示部473を備えている。また、操作部47は、表示部473が有するタッチパネルを介して、表示部473に表示されている操作画面に対するユーザーによる操作(タッチ操作)や物理キーに対するユーザーによる操作に基づく、ユーザーからの指示の入力を受け付ける。
 表示部473は、LCD(Liquid Crystal Display)等からなる。表示部473は、タッチパネルを備えている。操作者は画面表示されるボタンやキーに触れる操作を行うと、タッチパネルにより、タッチ操作された位置に対応付けられた指示が受け付けられる。
 ファクシミリ通信部71は、図略の符号化/複合化、変復調部及びNCU(Network Control Unit)を備え、公衆電話回線網等を用いてファクシミリの送受信を行うものである。
 ネットワークインターフェイス部91は、ローカルエリア内、又はインターネット上の部装置(例えば、パソコン)と種々のデータの送受信を行う通信インターフェイスである。
 マイクロフォン22は、画像形成装置1の周囲の音を集音して電気信号(音声データ)変換する。なお、マイクロフォン22は、ユーザーの発話する音声を集音しやすい適当な箇所、例えば、操作部47に設けられている。
 スピーカー23は、操作部47を操作するときの操作音や効果音、操作方法を解説するイダンス音声、画像形成装置1でトラブルが発生した場合の警告音等の各種音声を出力する。例えば、スピーカー23は、画像形成装置1の外側からは見えない箇所、例えば、操作部47内に設けられる。
 制御ユニット10は、プロセッサー、RAM(Random Access Memory)、ROM(Read Only Memory)、及び専用のハードウェア回路を含んで構成される。プロセッサーは、例えばCPU(Central Processing Unit)、ASIC(Application Specific Integrated Circuit)、又はMPU(Micro Processing Unit)等である。制御ユニット10は、制部100と、表示制御部101と、音声解析部102と、受付部103と、を備えている。
 制御ユニット10は、記憶部8に記憶されている制御プログラムに従った上記プロセッサーによる動作により、制御部100、表示制御部101、音声解析部102、及び受付部103として機能するものである。但し、これら制御部100等は、制御ユニット10による制御プログラムに従った動作によらず、それぞれハードウェア回路により構成することも可能である。以下、特に触れない限り、各実施形態について同様である。
 制御部100は、画像形成装置1の全体的な動作制御を司る。制御部100は、原稿給送部6、原稿読取部5、画像形成部12、定着部13、給紙部14、記憶部8,人感センサー21,操作部47、ファクシミリ通信部71、ネットワークインターフェイス部91、マイクロフォン22、及びスピーカー23と接続され、これら各部の駆動制御等を行う。例えば、制御部100は、画像形成部12等の動作を制御して、原稿読取部5による読み取りで得られた原稿画像を、記録媒体としての記録紙に形成させる。
 また、制御部100は、人感センサー21により接近者が検知されると、マイクロフォン22を制御してオン状態にして、マイクロフォン22への音声入力を可能にし、人感センサー21により接近者が検知されなくなってから予め定められた時間(例えば、30秒)が経過すると、マイクロフォン22を制御してオフ状態にする。なお、マイクロフォン22のオンオフの切り替えは、操作部47に入力される指示に従って制御部100が行うことも可能である。
 表示制御部101は、表示部473の表示を制御する。例えば、表示制御部101は、画像形成装置1で実行可能とされている複数の機能の中から実行する機能をユーザーに選択させるための選択画面を表示部473に表示すると共に、当該選択画面よりも下位階層である、各機能の設定に係る入力を受け付けるための設定画面を表示部473に表示する。
 図3(A)及び(B)は、表示部473に表示される画面の一例を示す図である。図3(A)に示した操作画面SC1は、画像形成装置1で実行可能とされている複数の機能の中から実行する機能をユーザーに選択させるための選択画面である。操作画面SC1には、「コピー」ボタンや「送信(スキャナー機能)」ボタン、「ファクス(ファクシミリ機能)」ボタンなどが表示される。なお、上記選択画面としての操作画面SC1は「ホーム」画面でもある。ユーザーにより「コピー」ボタンが押下されると、操作部47にコピー機能選択指示が受け付けられ、制御部100が、この指示に従って、図3(B)に示した操作画面SC2を表示部473に表示させる。
 操作画面SC2は、「ホーム」画面よりも下位階層として表示部473に表示される。操作画面SC2は、「コピー」機能の設定に係る入力を受け付けるための設定画面である。「コピー」機能の設定画面の中央部には、「用紙選択」や「カラー選択」、「ページ集約」、「縮小/拡大」、「両面/分割」、及び「ステープル/パンチ」と記された6つのボタンが表示される。これらボタンは、「コピー」機能に関する設定を受け付けるための画像である。
 図3(A)に示した操作画面SC1及び図3(B)に示した操作画面SC2には(図3(A)(B)では左上)、図柄がマイクロフォンとされた記号G1が表示される。記号G1の表示は、マイクロフォン22への音声入力が可能な状態であることを示す。すなわち、制御部100は、マイクロフォン22をオンとして、マイクロフォン22を音声入力可能な状態としているときに操作画面SC2に記号G1を表示させる。
 一方、制御部100は、マイクロフォン22をオフとして、マイクロフォン22を音声入力が不可能な状態としているときは、図4(A)及び図4(B)に例を示すように、操作画面SC1及び操作画面SC2には(図3(A)(B)では左上)、図柄がマイクロフォンとされた記号G1に「×」の画像が重ねられた記号G2が表示される。
 音声解析部102は、マイクロフォン22により変換された電気信号(音声データ)を既存の音声認識技術を用いてテキストデータに変換し、当該テキストデータを既存の自然言語処理技術を用いて解析することにより、ユーザーによる音声指示を認識する。
 受付部103は、表示部473に現在表示中の画面に対する操作部47(タッチパネルを含む)を介した手入力操作により入力された指示、及びマイクロフォン22を介して音声解析部102により認識された音声指示(音声解析部102による解析結果)をユーザーからの指示として受け付ける。制御部100は、受付部103が受け付けた指示の内容に従ってジョブを実行する。
 表示制御部101は、手入力操作により入力された指示又は上記音声指示が示す内容を表示した設定画面を表示部473に表示する。例えば、図3(B)に示した設定画面としての操作画面SC2が表示部473に表示されているときに、ユーザーが操作部47を介して「用紙選択」を「A4」に、「カラー選択」を「白黒」に、「ページ集約」を「2in1」に設定する指示を入力し、受付部103がこれら指示を受け付ける。このとき、表示制御部101は、図5に示すような、「用紙選択」の設定が「自動」から「A4」に、「カラー選択」の設定が「フルカラー」から「白黒」に、「ページ集約」が「オフ」から「2in1」に切り替えて表示する操作画面SC2(設定画面)を表示部473に表示する。
 図3(A)に示した操作画面SC1が表示部473に表示されているときに、ユーザーが「白黒コピー」というキーワードを発話し、スピーカー23及び音声解析部102を介して受付部103がこれら音声指示を受け付けると、表示制御部101は、図6に示すような操作画面SC2を表示部473に表示する。
 制御部100は、操作部47の操作で入力された手入力指示だけが受付部103に受け付けられる手入力専用モードと、上記音声指示及び上記手入力指示が受付部103に受け付けられる音声入力可能モードとを切り替える。ここで制御部100は、手入力専用モードとして受付部103が音声指示を受け付けないようにする手法は、(i)マイクロフォン22をオフにすることで手入力指示だけが受付部103に受け付けられるようにすること、又は(ii) オン状態のマイクロフォン22に音声が入力されて当該音声が音声解析部102で解析された音声指示を受付部103が受け付けないようにすること、のいずれであってもよい。制御部100は、音声指示による入力が予め禁止された情報の入力を受け付けるための操作画面が表示制御部101によって表示部473に表示されているときは、手入力専用モードに切り替える。上記の音声指示による入力が予め禁止された情報は、例えば、漏洩の好ましくない禁句内容(例えば、ユーザーID又はパスワード等)、及び/又は、音声入力では入力の正確性が保たれず正確な指示を入力できない指示内容(例えば、電子メール送信先とするメールアドレス、データ送信先とするIPアドレス等)といった、予め定められた音声入力禁止情報である。上記の音声指示による入力が予め禁止された情報を、以下では音声入力禁止情報と称する。
 表示制御部101は、音声入力可能モードに切り替えられているときは、表示部473に表示させる操作画面に、音声指示が受け付けられることを示す画像又はメッセージを表示させる。一方、表示制御部101は、手入力専用モードに切り替えられているときは、表示部473に表示させる操作画面に、音声指示が受け付けられないことを示す画像又はメッセージを表示させる。
 図7に例を示すように、ユーザーID及びパスワードの入力を求める認証画面SC3が表示部473に表示されたとき、制御部100は、画像形成装置1の動作モードを手入力専用モードに切り替え、受付部103が、ユーザーID及びパスワードについては音声指示を受け付けず、手入力操作だけを受け付ける状態にする。また、表示制御部101は、これら操作対象が音声指示を受け付けないことを示す、マイクロフォンの図柄に「×」が重ねられた記号G2を認証画面SC3に表示する。認証画面SC3が表示されるのは、ログイン時以外にシステム設定を行う場合などがある。また、プライベートプリントを行う場合、パスワードの入力が求められ、この場合も、同様の認証画面SC3が表示される。
 次に、画像形成装置1の制御ユニット10で行われる処理の一例について、図8に示すフローチャートに基づいて説明する。なお、この処理は、表示部473に表示される操作画面の切り替えが生じたときに行われる処理である。なお、初期設定として、制御部100は、画像形成装置1の動作モードを音声入力可能モードに切り替えている。
 制御部100は、表示制御部101によって表示部473の操作画面が切り替えられたき、切り替え後の操作画面が、上記音声入力禁止情報の入力を受け付けるための操作画
面であるかを判定する(S1)。
 ここで、制御部100は、表切り替え後の操作画面が、上記音声入力禁止情報の入力を受け付けるための操作画面であると判定したとき(S1「Yes」)、画像形成装置1の動作モードを手入力専用モードに切り替え(S2)、受付部103が、ユーザーID及びパスワードについては音声指示を受け付けず、手入力操作だけを受け付ける状態にする。
 このとき、表示制御部101は、図7に例を示したように、操作画面に、音声指示が受け付けられないことを示す画像又はメッセージを表示させる(S3)。
 一方、制御部100は、表切り替え後の操作画面が、上記音声入力禁止情報の入力を受け付けるための操作画面ではないと判定したとき(S1「No」)、画像形成装置1の動作モードを音声入力可能モードのままとしておく(S4)。この後、処理は終了する。
 このように、上記実施形態によれば、上記音声入力禁止情報、例えばユーザーID又はパスワード等のプライベート情報(機密情報)の入力を受け付けるための操作画面が表示部473に表示されるときは、受付部103は、音声指示を受け付けず、手入力指示だけを受け付けるため、ユーザーはユーザーID又はパスワード等の個人情報を発声しないことになり、機密情報の漏洩を防止してセキュリティーを確保することが可能になる。また、電子メール送信先とするメールアドレス、データ送信先とするIPアドレス等、データ送信の相手先情報を上記音声入力禁止情報として受け付けるための操作画面が表示部473に表示されるときも、受付部103は、音声指示を受け付けず、手入力指示だけを受け付けるため、ユーザーは、当該相手先情報を、操作部47を手動で操作して入力することになり、当該相手先情報(指示内容)の入力についての正確性が保たれ、正確に情報(指示)を入力できる。
 また、更なる実施形態を説明する。表示制御部101は、表示部473の操作画面において、音声指示を受け付ける入力項目と、手入力指示のみを受け付ける入力項目との両方を表示させる場合がある(例えば、図3(A)に示した操作画面SC1)。表示制御部101は、このような操作画面を表示部473に表示させるとき、手入力指示のみを受け付ける入力項目については、音声入力を受け付けないことを示す画像又はメッセージを付加して表示させる。
 例えば、図9に操作画面SC4としての例を示すように、表示制御部101は、操作画面SC4に、音声指示を受け付ける「コピー」、「送信」、「ファクス」、「ユーザーボックス」のボタンには、図柄がマイクロフォンの記号G1を表示させ、これに対して、音声指示を受け付けない「システム設定」、「インターネット」のボタンには、音声入力を受け付けないことを示す画像として、マイクロフォンの図柄に「×」が重ねられた記号G2を表示させる。
 このような操作画面SC24表示時には、制御部100は、画像形成装置1の動作モードを音声入力可能モードに切り替えておく。音声解析部102から入力されてくる音声情の内容に基づき、受付部103は、音声入力禁止情報を示す音声指示は受け付けず、音声入力禁止情報以外の音声指示を受け付ける処理を行う。
 続いて、更なる実施形態を説明する。制御部100は、受付部103が受け付けた音声指示及び手入力指示のそれぞれの通算の受付数を記憶しておく。そして、制御部100は、初期画面とする操作画面が表示制御部101によって表示部473に表示されるときは、手入力専用モード又は音声入力可能モードのうち、上記通算の受付数が多い方のモードに、画像形成装置1の動作モードを切り換える。但し、この場合も、受付部103は、音声入力禁止情報の入力については、音声指示を受け付けず、手入力指示だけを受け付ける。これにより、ユーザーに対して、初期画面の表示時にユーザーが頻繁に使用しているモードに切り替えて利便性を向上させつつ、入力対象となる情報のセキュリティー及び入力正確性を確保することが可能になる。
 なお、ここまでマイクロフォン22で集音され、変換された音声データを、画像形成装置1内の音声解析部102で解析する場合について説明しているが、更なる実施形態として、スマートスピーカーと呼ばれる、マイクロフォンを内蔵した、AI(人工知能)アシスタント機能を持つスピーカーを採用し、当該スピーカーでユーザーの音声を集音し、画像形成装置1は、当該スピーカーを音声入力部として、当該スピーカーからの音声解析結果を受付部103が受け付けるようにしてもよい。
 本発明は上記実施の形態の構成に限られず種々の変形が可能である。また、上記実施形では、図1乃至図9を用いて上記実施形態により示した構成及び処理は、本発明の一実施形態に過ぎず、本発明を当該構成及び処理に限定する趣旨ではない。

Claims (6)

  1.  記録媒体に画像を形成する画像形成部を備える画像形成装置であって、
     表示部と、
     前記表示部に操作画面を表示させる表示制御部と、
     ユーザーによる手動操作で手入力指示が入力される操作部と、
     ユーザーから音声が入力される音声入力部と、
     前記音声入力部に入力された音声に基づく音声指示と、前記手入力指示とを受け付ける受付部と、
     前記受付部が受け付けた前記手入力指示及び前記音声指示に基づいて前記画像形成装置の動作を制御してジョブを実行する制御部と、を備え、
     前記制御部は、
     前記手入力指示だけが前記受付部に受け付けられる手入力専用モードと、前記音声指示及び前記手入力指示が前記受付部に受け付けられる音声入力可能モードとを切り替え、
     前記音声指示による入力が予め禁止された情報の入力を受け付けるための前記操作画面が前記表示制御部によって前記表示部に表示されているときは、前記手入力専用モードに切り替える、画像形成装置。
  2.  前記制御部が、前記手入力専用モードに切り替えているとき、
     前記表示制御部は、前記操作画面に、前記音声指示が受け付けられないことを示す画像又はメッセージを表示させる、請求項1に記載の画像形成装置。
  3.  前記表示制御部は、前記操作画面において、前記音声指示を受け付ける入力項目と、前記手入力指示のみを受け付ける入力項目との両方を表示させるときは、前記手入力指示のみを受け付ける入力項目については、音声入力を受け付けないことを示す画像又はメッセージを付加して表示させ、
     前記制御部は、前記音声入力可能モードに切り替えておき、
     前記受付部は、前記音声指示による入力が予め禁止された情報を示す前記音声指示を受け付けず、前記音声指示による入力が予め禁止された情報以外を示す前記音声指示を受け付ける、請求項1に記載の画像形成装置。
  4.  前記制御部は、前記受付部が受け付けた前記音声指示及び前記手入力指示のそれぞれの通算の受付数を記憶しておき、初期画面とする前記操作画面が前記表示制御部によって前記表示部に表示されるときは、前記手入力専用モード又は前記音声入力可能モードのうち、前記通算の受付数が多い方のモードに切り換える、請求項1に記載の画像形成装置。
  5.  前記音声指示による入力が予め禁止された情報は、認証に必要なプライベート情報、又はデータ送信の相手先情報である、請求項1に記載の画像形成装置。
  6.  前記画像形成装置への接近者を検知する人感センサーを更に備え、
     前記制御部は、
     前記人感センサーにより接近者が検知された場合に、前記音声入力部を音声入力が可能な状態とし、
     前記人感センサーにより接近者が検知されなくなってから予め定められた時間が経過したときに、前記音声入力部をオフ状態にして音声入力が不可能な状態とする、請求項1に記載の画像形成装置。
PCT/JP2023/026677 2022-07-29 2023-07-20 画像形成装置 WO2024024643A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202380014082.2A CN118120220A (zh) 2022-07-29 2023-07-20 图像形成装置
JP2024537655A JPWO2024024643A1 (ja) 2022-07-29 2023-07-20

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022121285 2022-07-29
JP2022-121285 2022-07-29

Publications (1)

Publication Number Publication Date
WO2024024643A1 true WO2024024643A1 (ja) 2024-02-01

Family

ID=89706444

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/026677 WO2024024643A1 (ja) 2022-07-29 2023-07-20 画像形成装置

Country Status (3)

Country Link
JP (1) JPWO2024024643A1 (ja)
CN (1) CN118120220A (ja)
WO (1) WO2024024643A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007079852A (ja) * 2005-09-13 2007-03-29 Canon Inc データ処理装置、データ処理方法及びコンピュータプログラム
JP2007333778A (ja) * 2006-06-12 2007-12-27 Toshiichi Shinshi 商品売買システムとそれを実現するためのコンピュータプログラムとその方法
JP2014196847A (ja) * 2013-03-29 2014-10-16 パナソニック株式会社 冷蔵庫
JP2016126704A (ja) * 2015-01-08 2016-07-11 コニカミノルタ株式会社 情報処理装置、入力手段選択方法、およびコンピュータプログラム
JP2019205052A (ja) 2018-05-23 2019-11-28 コニカミノルタ株式会社 ジョブ履歴特定装置、画像処理装置、サーバー、ジョブ履歴特定方法及びプログラム
JP2020098383A (ja) 2018-12-17 2020-06-25 コニカミノルタ株式会社 情報処理装置及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007079852A (ja) * 2005-09-13 2007-03-29 Canon Inc データ処理装置、データ処理方法及びコンピュータプログラム
JP2007333778A (ja) * 2006-06-12 2007-12-27 Toshiichi Shinshi 商品売買システムとそれを実現するためのコンピュータプログラムとその方法
JP2014196847A (ja) * 2013-03-29 2014-10-16 パナソニック株式会社 冷蔵庫
JP2016126704A (ja) * 2015-01-08 2016-07-11 コニカミノルタ株式会社 情報処理装置、入力手段選択方法、およびコンピュータプログラム
JP2019205052A (ja) 2018-05-23 2019-11-28 コニカミノルタ株式会社 ジョブ履歴特定装置、画像処理装置、サーバー、ジョブ履歴特定方法及びプログラム
JP2020098383A (ja) 2018-12-17 2020-06-25 コニカミノルタ株式会社 情報処理装置及びプログラム

Also Published As

Publication number Publication date
CN118120220A (zh) 2024-05-31
JPWO2024024643A1 (ja) 2024-02-01

Similar Documents

Publication Publication Date Title
US11055042B2 (en) Image forming apparatus and method for controlling image forming apparatus
JP2007142912A (ja) 操作パネルおよび操作パネルのカスタマイズシステム
JP7210937B2 (ja) 画像形成装置
JP2009177526A (ja) 画像処理装置
JP5459260B2 (ja) 画像形成装置、設定方法および設定プログラム
WO2024024643A1 (ja) 画像形成装置
JP2008236752A (ja) 複写又は走査の設定に対するユーザの好みの自動検出
US9699333B2 (en) Image forming system including a portable terminal device
WO2024024642A1 (ja) 画像形成装置
JPWO2024024643A5 (ja)
WO2024024644A1 (ja) 画像形成装置
WO2024024641A1 (ja) 画像形成装置
JP6579005B2 (ja) タッチ式入力装置、画像形成装置およびタッチ式入力装置の制御方法
JP2009258895A (ja) 情報処理装置及びプログラム
JP6354696B2 (ja) 表示装置、および画像処理装置
JP2021026570A (ja) 電子機器及び画像形成装置
JP2007055114A (ja) 画像形成装置
JP2020120353A (ja) 画像読取装置及び画像形成装置
JP7363129B2 (ja) 電子機器及び画像形成装置
JP5454436B2 (ja) 表示処理装置およびコンピュータプログラム
JPWO2024024641A5 (ja)
JPWO2024024644A5 (ja)
JP2008271047A (ja) 画像読取装置
JP2010194728A (ja) 処理装置、およびその操作手順案内方法
JP6624138B2 (ja) 入力装置、および画像形成装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23846374

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2024537655

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 202380014082.2

Country of ref document: CN