JP7333761B2 - システム及び画像形成システム - Google Patents

システム及び画像形成システム Download PDF

Info

Publication number
JP7333761B2
JP7333761B2 JP2020013994A JP2020013994A JP7333761B2 JP 7333761 B2 JP7333761 B2 JP 7333761B2 JP 2020013994 A JP2020013994 A JP 2020013994A JP 2020013994 A JP2020013994 A JP 2020013994A JP 7333761 B2 JP7333761 B2 JP 7333761B2
Authority
JP
Japan
Prior art keywords
display
identification
voice
identification code
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020013994A
Other languages
English (en)
Other versions
JP2021120809A (ja
Inventor
洋樹 棟朝
慶子 蛭川
祐機 岩本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2020013994A priority Critical patent/JP7333761B2/ja
Priority to US17/159,286 priority patent/US11567629B2/en
Priority to CN202110124927.6A priority patent/CN113206922A/zh
Publication of JP2021120809A publication Critical patent/JP2021120809A/ja
Priority to US18/089,326 priority patent/US11861140B2/en
Application granted granted Critical
Publication of JP7333761B2 publication Critical patent/JP7333761B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04817Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00403Voice input means, e.g. voice commands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00244Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/00413Display of information to the user, e.g. menus using menus, i.e. presenting the user with a plurality of selectable options
    • H04N1/00416Multi-level menus
    • H04N1/00419Arrangements for navigating between pages or parts of the menu
    • H04N1/00424Arrangements for navigating between pages or parts of the menu using a list of graphical elements, e.g. icons or icon bar
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Facsimiles In General (AREA)
  • Control Or Security For Electrophotography (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)

Description

本発明は、システム等に関する。
従来、音声により装置の操作を行う技術が知られている。例えば、音声を像形成モードに対応付けて登録し、呼出モードにおいて、入力される音声を既に登録された音声と比較し、該比較結果に基づいて、入力された音声に対応付けられた像形成モードの呼び出しを制御する画像形成装置が提案されている(例えば、特許文献1参照)。また、GUI(グラフイカル・ユーザ・インタフェース)画面上で選択可能なオブジェクト上またはその近辺に音声認識用の発声すべきキーワードまたは識別用通し番号等を文字で表示するマンマシンインタフェース装置が提案されている(例えば、特許文献2参照)。
特開2000-181292 特開2000-267837
しかしながら、特許文献1及び特許文献2に開示された技術は、予め装置が有しているモードや機能と音声とを対応させるものであり、装置が予め有していないファイルを選択する場合については考慮されていない。また、ユーザがファイルを選択する場面では、ファイル名や拡張子をどのようにユーザが発声すればよいか、或いはどのように装置が音声によって出力すればよいかは、ユーザによっても、ファイルによっても異なる。例えば、ユーザがファイル名を発声する場合、ファイル名の基底名(例えば、「Flower.jpg」というファイル名における「Flower」の部分)を、英語の単語として発声する場合や、1文字ずつ発声する場合がある。また、拡張子(例えば、「Flower.jpg」というファイル名における「jpg」の部分)を、1文字ずつ発声する場合や、特有の呼び方(例えば、「txt」であれば「テキスト」、「jpg」であれば「ジェイペグ」)を発声する場合がある。さらに、基底名と拡張子を区切る記号である「.」を、ユーザによって「ドット」と発声したり「ピリオド」と発声したりすることが考えられる。このようにユーザによるファイル名の発声の仕方は様々考えられる。同様にして、装置がファイル名を音声により出力する場合も様々な方法が考えられる。このように、ユーザと装置との間で、音声により任意のファイルを特定するためにやりとりされる音声は様々考えられ、特にファイルの選択に関して、音声操作に特化したインタフェースについて考慮されていないことが多かった。
本願は上述した課題に鑑み、音声操作に適したインタフェースを備えるシステム等を提供することを目的とする。
上述した課題を解決するための第1の実施態様は、制御装置(例えば、図1の制御装置10、図4の制御部600)と、ファイルを記憶する記憶装置(例えば、図1の記憶装置20、図4の記憶部650)と、表示装置(例えば、図1の表示装置30、図4の表示部610)と、音声装置(例えば、図1の音声入出力装置40、図4の音声入出力部630)とを備えたシステムであって、
前記制御装置は、
前記音声装置を介して、ユーザから一覧表示するコマンドの音声が入力されると、前記ファイルを特定する第1の識別表示を前記表示装置に一覧表示し、
前記一覧表示するファイルに識別符号を割当て第2の識別表示として表示し、
前記音声装置を介して、ユーザから前記識別符号を含む音声が入力されると、当該識別符号に対応するファイルを選択する、
ことを特徴とするシステムである。
第2の実施態様は、前記制御装置は、
前記第1の識別表示を前記表示装置に一覧表示するとき、ユーザが一覧表示された第1の識別表示の中からファイルが選択可能な場合にのみ、前記ユーザから識別符号を含む音声の入力を受け付ける第1の実施態様のシステムである。
第3の実施態様は、前記制御装置は、
所定の処理が実行可能であり、
前記所定の処理が実行されると、前記第1の識別表示と前記第2の識別表示とを前記表示装置に一覧表示可能であり、
前記所定の処理が実行中に前記音声装置を介してユーザから前記識別符号を含む音声が入力されると、当該識別符号に対応するファイルを選択する
ことを特徴とする第1又は第2の実施態様のシステムである。
第4の実施態様は、前記所定の処理は、ユーザが複数参加可能な会議処理であることを特徴とする第3の実施態様のシステムである。
第5の実施態様は、前記制御装置は、
ユーザから前記音声装置を介して音声の入力がなされて一覧表示をした場合は、前記識別符号について音声装置からの入力を受け付け、
ユーザから音声装置以外の装置を介して入力がなされて一覧表示をした場合は、音声装置以外の装置からの入力を受け付ける
ことを特徴とする第1から第4の何れかの実施態様のシステムである。
第6の実施態様は、前記第1の識別表示は、ファイル名と、ファイルの属性を示すアイコンであることを特徴とする第1から第5の何れかの実施態様のシステムである。
第7の実施態様は、前記制御装置は、前記一覧表示するファイルをグルーピングし、同一のグループに含まれる複数のファイルに一の識別符号を割当てることを特徴とする第1から第6の何れかのシステムである。
第8の実施態様は、制御装置(例えば、図8の画像形成装置70、図9の制御部700)と、ファイルを記憶する記憶装置(例えば、図8の画像形成装置70、図9の記憶部770)と、表示装置(例えば、図8の画像形成装置70、図9の表示部750)と、音声装置(例えば、図8の音声入出力装置90、図9の音声入出力部760)とを含む画像形成装置であって、
前記制御装置は、
前記ファイルのサムネイル画像を前記表示装置に一覧表示し、
前記一覧表示したサムネイル画像に識別符号を含む画像を重畳して表示し、
前記音声装置を介して、ユーザから識別符号が音声入力された場合には、当該識別符号に対応するファイルに基づいて画像を形成する、
ことを特徴とする画像形成システムである。
第9の実施態様は、前記識別符号を含む画像は、少なくとも前記サムネイル画像の短辺の3分の1以上の大きさの画像であることを特徴とする第8の実施態様の画像形成システムである。
第10の実施態様は、前記識別符号を含む画像は、矩形状の非透過の画像に、前記識別符号が含まれている画像であることを特徴とする第8又は第9の実施態様の画像形成システムである。
第11の実施態様は、前記識別符号を含む画像は、前記サムネイル画像の何れかの隅部に重畳表示される画像であることを特徴とする第8から第10の何れかに記載の実施態様の画像形成システムである。
第12の実施態様は、前記制御装置は、前記一覧表示したサムネイル画像の中から一のサムネイル画像を順次選択し、選択したサムネイル画像に対応する前記識別符号を前記音声装置から音声出力することを特徴とする第8から第11の何れの実施態様の画像形成システムである。
第13の実施態様は、前記制御装置は、前記選択したサムネイル画像に対応する前記識別符号を前記音声装置から音声出力するときに、併せて当該サムネイル画像を強調表示させることを特徴とする第12の実施態様の画像形成システムである。
第14の実施態様は、前記制御装置は、前記サムネイルの強調表示として、サムネイル画像を拡大して表示する、サムネイル画像の周囲に枠を表示する、サムネイル画像の色を反転して表示する、サムネイル画像を点滅して表示する、のうち少なくとも何れか1つの方法により表示させることを特徴とする第13の実施態様の画像形成システムである。
第15の実施態様は、前記制御装置は、前記選択したサムネイル画像に対応する前記識別符号を前記音声装置から音声出力するときに、併せて当該識別符号を含む画像を拡大して表示することを特徴とする第12の実施態様の画像形成システムである。
本発明によれば、音声操作に適したインタフェースを備えることができる。
第1実施形態におけるシステム全体を説明するための図である。 第1実施形態における処理装置の機能構成を説明するための図である。 第1実施形態におけるファイル選択処理を説明するための図である。 第2実施形態における表示装置の機能構成を説明するための図である。 第2実施形態における表示装置の処理を説明するための図である。 第2実施形態における動作例を説明するための図である。 第2実施形態における動作例を説明するための図である。 第4実施形態における印刷システム全体を説明するための図である。 第4実施形態における画像形成装置の機能構成を説明するための図である。 第4実施形態における画像形成装置の処理を説明するための図である。 第4実施形態における動作例を説明するための図である。 第4実施形態における動作例を説明するための図である。 第5実施形態における画像形成装置の処理を説明するための図である。 第5実施形態における動作例を説明するための図である。
以下、本発明の実施の形態について、図面を参照して説明する。なお、各実施形態は、本発明を説明する都合上記載したものであり、本発明の技術的範囲が以下の実施形態に限定されるものではない。
[1.第1実施形態]
[1.1 全体構成]
図1は、システム1の概略を示した図である。システム1では、例えば制御装置10と、記憶装置20と、表示装置30と、音声入出力装置40とを備えている。
ここで、システム1を構成する装置は、それぞれ独立の装置であってもよいし、1つの装置の中で構成されてもよいし、複数の装置を組み合わせてもよい。
また、音声入出力装置40は、外部サービスを利用してもよい。例えば、音声入出力装置40は、ユーザが発した音声から言葉を認識し、入力文として会話サービスに送信する。会話サービスは、受信した入力文に基づいて対応する応答文(会話文)を音声入出力装置40に送信する。音声入出力装置40は、応答文に基づいて音声を出力する。
ここで、会話サービスとは、ユーザから文や音声の入力を受け付け、入力された内容からユーザの要求を認識し、要求に対する応答として、要求に対する処理の実行結果やユーザに提示する情報を含む応答文や応答する音声を出力するサービスである。また、会話サービスは、このような、ユーザからの入力と入力に対する応答とを継続的に繰り返して行うことにより、対話を成立させる。
なお、会話サービスは、外部サービスを利用せずに、システム1で実現してもよい。例えば、制御装置10において、会話処理を実現するプログラムを実行することにより、システム1だけで会話サービスをユーザに提供することができる。
[1.2 機能構成]
図2は、システム1を処理装置50に適用した場合の構成を示す図である。処理装置50は、制御装置10に対応する制御部500と、記憶装置20に対応する記憶部550と、表示装置30に対応する表示部510と、音声入出力装置40に対応する音声入出力部530とを備えている。以下、処理装置50について説明する。
制御部500は、処理装置50の全体を制御するための機能部である。制御部500は、記憶部550に記憶されている各種プログラムを読み出して実行することにより各種機能を実現しており、1又は複数の演算装置(例えばCPU(Central Processing Unit))により構成される。
制御部500は、プログラムを実行することにより、音声認識部502として機能する。音声認識部502は、音声入出力部530を介して音声が入力された場合、入力された音声を認識する。なお、音声認識部502は、認識した音声の内容を示す情報(例えば、文字の情報)を、一時的に記憶部550に出力してもよい。
表示部510は、ファイルの内容を表示したり、処理装置50の各種状態や、操作入力の状態を表示したりする。例えば、液晶ディスプレイ(LED:Liquid Crystal Display)や、有機ELパネル、電動誘導方式を利用した電子ペーパ等により構成されている。
入力部520は、ユーザからの操作入力を受け付ける。例えば、静電容量式や、感圧式のタッチパネルにより構成される。なお、入力部520は、ユーザが情報を入力できればよく、例えば、タッチパネルと操作ペンを組み合わせてもよいし、キーボードやマウスといった入力装置であってもよい。
音声入出力部530は、音声の入力と出力とを行う。例えば、音声を入力するマイクと、音声の出力を行うスピーカにより構成される。なお、音声入出力部530は、インタフェースであってもよい。例えば、インタフェースに外部のマイクや、スピーカ等を接続してもよい。また、近距離無線通信(例えば、Bluetooth(登録商標))や、スマートスピーカ等の装置であってもよい。
記憶部550は、処理装置50の動作に必要な各種プログラムや、各種データが記憶されている機能部である。記憶部550は、例えば、半導体メモリであるSSD(Solid State Drive)や、HDD(Hard Disk Drive)等により構成されている。また、記憶部550は、ファイルを記憶するためのファイル記憶領域552を確保している。
通信部560は、他の装置と通信を行う。例えば、LAN(Local Area Network)に接続して、他の装置とコメントに関する情報を送受信したり、ドキュメントを送受信したりする。通信方式は、一般的なイーサネット(登録商標)であるLANの他にも、LTE/4G/5Gといった通信を利用してもよい。
[1.3 処理の流れ]
処理装置50が実行するファイル選択処理の流れについて、図3のフロー図を参照して説明する。ファイル選択処理とは、入力された音声に基づき、ファイル記憶領域552に記憶されたファイルのうち、1のファイルを選択する処理である。なお、ファイル記憶領域552には、予めファイルが記憶されていることとして説明する。
はじめに、制御部500は、一覧表示するコマンドを受信したか否かを判定する(ステップS102)。一覧表示するコマンドとは、例えば、ファイル記憶領域552に記憶されたファイルを一覧で表示部510に表示する要求を示す音声であり、例えば、「ファイルを表示して」「フォルダを開いて」「Open document」といった音声である。制御部500は、音声入出力部530を介して入力され、音声認識部502によって認識された音声の内容に基づき、一覧表示するコマンドを受信したか否かを判定する。
具体的には、ファイルを一覧表示する際にユーザによって発せられる内容を文字で示した情報(キーワード)を、記憶部550に予め記憶させる。そして、制御部500は、音声認識部502によって認識された音声の内容を示す文字の情報がキーワードと一致した場合に、一覧表示するコマンドを受信したと判定する。
一覧表示するコマンドを受信した場合、制御部500は、ファイル記憶領域552から、表示部510に表示するファイルを抽出する(ステップS102;Yes→ステップS104)。制御部500は、ファイル記憶領域552に記憶されたファイルを全て抽出してもよいし、所定のフォルダに記憶されたファイルを抽出してもよいし、所定の条件を満たすファイル(例えば、作成された日時が今日であるファイル)を抽出する。
つづいて、制御部500は、抽出したファイルに対応する識別符号を割り当てる(ステップS106)。識別符号は、ファイルを一意に特定することが可能な番号であり、例えば、連番(数字)である。なお、識別符号はファイルを一意に特定することができればよく、例えば、アルファベットであってもよい。
つづいて、制御部500は、ファイルと識別符号とを表示部510に一覧表示する(ステップS108)。具体的には、制御部500は、ファイルを特定する第1の識別表示と、当該ファイルに割り当てられた識別符号を示す第2の識別表示とを、ファイルごとに、並べて表示部510に表示する。なお、制御部500は、第1の識別表示を表示部510に並べて表示させた上で、第1の識別表示に対応する第2の識別表示を、第1の識別表示の周囲に表示させてもよい。このように、第1の識別表示と第2の識別表示とが所定の方法に基づいて表示されることにより、ユーザは、ファイルと当該ファイルに割り当てられた識別符号との対応を、表示部510を見ることで把握できる。
制御部500は、第1の識別表示として、例えば、ファイル名やファイルの属性(例えば、ファイルの種類、ファイルの作成者、ファイルの作成日等)を表示する。なお、制御部500は、ファイルの属性を、アイコン、絵、記号等によって表示してもよい。また、制御部500は、第2の識別表示として、例えば、識別符号を含んだ矩形を、対応するファイルの近傍に表示する。
つづいて、制御部500は、識別符号を含むコマンドを受信したか否かを判定する(ステップS110)。識別符号を含むコマンドとは、少なくとも、識別符号を示す内容を含んだ音声であり、例えば、「5番」「Number 5」といった音声である。なお、識別符号を含むコマンドには、ファイルに対する処理を示す内容が含まれてもよい。例えば、識別符号を含むコマンドは、ファイルに対する処理として「開く」という処理の内容を含めた、「5番を開く」「Open 5th document」といった音声であってもよい。
具体的には、制御部500は、音声認識部502によって認識された音声の内容に、第2の識別表示として表示した識別符号の何れかを示す数字の呼び方が含まれる場合、識別符号を含むコマンドを受信したと判定する。
識別符号を含むコマンドを受信した場合は、制御部500は、受信したコマンドに含まれる識別符号に対応するファイルを選択する(ステップS110;Yes→ステップS112)。
なお、識別符号を含むコマンドを受信しなかった場合において、ユーザによって他の処理を実行することが指定された場合は、制御部500は、指定された処理を実行する(ステップS110;No→ステップS114;Yes)。
また、識別符号を含むコマンドを受信せず、ユーザにより何れの処理も指定されなかった場合、制御部100は、再びステップS110へ処理を遷移する(ステップS114;No→ステップS110)。
このように、本実施形態によれば、処理装置はファイルに識別符号を割り当てて、割り当てた識別符号を、ファイルを特定する情報とともに表示する。したがって、ユーザは、ファイルに割り当てられた識別符号を含む音声を発するだけで、容易にファイルを選択することが可能となる。識別符号を含む音声を発するだけでファイルが選択できるため、ユーザは、ファイル名やファイル名に含まれる拡張子をどのように発声すればよいかを考慮することなく、識別符号により適切にファイルを選択することが可能となる。
[2.第2実施形態]
第2実施形態について説明する。第2実施形態は、システム1を会議システムとして適用した実施形態である。図4は、会議システムを提供可能な表示装置60を示した図である。表示装置60は、制御装置10に対応する制御部600と、記憶装置20に対応する記憶部650と、表示装置30に対応する表示部610と、音声入出力装置40に対応する音声入出力部630と、を備えて構成される。表示装置60は、例えば、会議室に設置されるインタラクティブ・ホワイトボード(IWB:Interactive Whiteboard)といった表示装置である。なお、表示装置60は、ユーザが使用する端末装置であってもよい。
制御部600は、表示装置60の全体を制御するための機能部である。制御部600は、記憶部650に記憶されている各種プログラムを読み出して実行することにより各種機能を実現しており、1又は複数の演算装置(例えばCPU)により構成される。
制御部600は、プログラムを実行することにより、音声認識部602及び会議処理部604として機能する。音声認識部602は、音声入出力部630を介して音声が入力された場合、入力された音声を認識する。なお、音声認識部602は、認識した音声の内容を示す情報(例えば、文字の情報)を、一時的に記憶部650に出力してもよい。
会議処理部604は、会議の進行を支援するため、ユーザが複数参加可能な会議に関する処理(会議処理)を実行する。会議処理部604は、会議処理として、例えば、会議に参加する複数のユーザ同士で行われるチャットの機能を提供する処理を実行する。また、会議処理部604は、会議処理として、表示装置60と接続されている装置(例えば、会議に参加する複数のユーザがそれぞれ使用する端末装置)との間で、ファイルの送受信を行う処理を実行したりする。
表示部610は、ファイルの内容を表示したり、表示装置60の各種状態や、操作入力の状態を表示したりする。例えば、液晶ディスプレイ(LED:Liquid Crystal Display)や、有機ELパネル、電動誘導方式を利用した電子ペーパ等により構成されている。
入力部620は、ユーザからの操作入力を受け付ける。例えば、静電容量式や、感圧式のタッチパネルにより構成される。なお、入力部620は、ユーザが情報を入力できればよく、例えば、タッチパネルと操作ペンを組み合わせてもよいし、キーボードやマウスといった入力装置であってもよい。
音声入出力部630は、音声の入力と出力とを行う。例えば、音声を入力するマイクと、音声の出力を行うスピーカにより構成される。なお、音声入出力部630は、インタフェースであってもよい。例えば、インタフェースに外部のマイクや、スピーカ等を接続してもよい。また、近距離無線通信(例えば、Bluetooth)や、スマートスピーカ等の装置であってもよい。
記憶部650は、表示装置60の動作に必要な各種プログラムや、各種データが記憶されている機能部である。記憶部650は、例えば、半導体メモリであるSSDや、HDD等により構成されている。また、記憶部650は、ファイルを記憶するためのファイル記憶領域652を確保している。
通信部660は、他の装置と通信を行う。例えば、LANに接続して、他の装置と会議に関する情報を送受信したり、ファイルを送受信したりする。通信方式は、一般的なイーサネットであるLANの他にも、LTE/4G/5Gといった通信を利用してもよい。
つづいて、図5を参照して、表示装置60が実行する処理について説明する。はじめに、制御部600は、表示部610に、初期状態として、メニュー画面を表示する(ステップS202)。メニュー画面は、例えば、1又は複数の会議の情報や、会議に関連するファイル表示する。例えば、制御部600は、通信部660を介して、会議の情報(例えば、会議名、会議に参加するユーザの名前、開始時刻、終了時刻、会議に関連するファイルのファイル名等)を管理する装置から、会議の情報を取得し、表示部610に表示する。なお、会議に関連するファイルは、例えば、ユーザによって会議の情報が登録されたときに指定されたファイルであったり、会議の参加者であるユーザに対して事前に送信された会議招待メールに添付されたファイルであったりする。
なお、メニュー画面が表示されているときは、会議が開始されておらず、会議処理が実行されていないため、制御部600は、メニュー画面に表示される会議に関連するファイルをユーザによって選択できないようにする。具体的には、制御部600は、ファイルへの識別符号の割り当て及び第2の識別表示の表示を行わない。また、制御部600は、ユーザから、識別符号を含む音声(コマンド)の入力がされても、その音声の入力を受け付けない。
つづいて、制御部600(会議処理部604)は、ユーザによる会議開始の操作に基づき、会議処理を開始することにより、会議を開始する(ステップS204)。このとき、例えば、制御部600は、開始された会議に関連するファイルを取得し、ファイル記憶領域652に記憶する。また、制御部600(会議処理部604)は、会議処理において、会議に参加するユーザが使用する端末装置からファイルを受信し、受信したファイルをファイル記憶領域652に記憶してもよい。
つづいて、制御部600は、ファイル選択処理を実行する(ステップS206)。ファイル選択処理は、第1実施形態で説明したファイル選択処理と同等の処理である。例えば、制御部600は、音声入出力部630を介して入力された音声を音声認識部602により認識し、一覧表示のコマンドを受信したか否かを判定する。一覧表示のコマンドを受信した場合は、制御部600は、ファイル記憶領域652に記憶されたファイルに対して識別符号を割り当て、第1の識別表示と第2の識別表示とを行う。このようにすることで、制御部600は、会議処理が実行されると、第1の識別表示と第2の識別表示とを表示部610に一覧表示する。また、音声入出力部630を介して会議の参加者であるユーザから識別符号を含む音声が入力されると、制御部600は、入力された識別符号に対応するファイルを選択する。このようにすることで、制御部600は、ユーザがファイルの選択が可能な会議処理の実行中のみにおいて、第1の識別表示及び第2の識別表示を表示部610に表示する。また、制御部600は、ユーザがファイルの選択が可能な会議処理の実行中のみにおいて、ユーザから識別符号を含む音声(コマンド)が入力されたときに、当該識別符号に対応するファイルを選択する。
つづいて、制御部600は、ファイル選択処理によって選択されたファイルを、表示部610に表示する(ステップS208)。例えば、制御部600は、選択されたファイルを表示することが可能なアプリケーションを起動させ、当該アプリケーションを介して、ユーザによって選択されたファイルを表示処理することで表示する。
つづいて、図6及び図7を参照して、本実施形態の動作例について説明する。図6は、メニュー画面を示す表示画面W200の例である。表示画面W200は、表示部610に表示されたり、ユーザが使用する端末装置に表示されたりする。表示画面200には、会議に関連するファイルを表示する領域E200を含む。領域E200には、例えば、第1の識別表示として、表示M200と表示M202とが含まれる。表示M200として、1のファイルを特定するためのファイル名(例えば、「MeetingUI_v1.3.pptx」)と、当該1のファイルの属性であるファイルの種類を示すアイコンとが表示される。同様にして、表示M202として、1のファイルを特定するためのファイル名(例えば、「check_mobileUI_v6.pptx」)と、当該1のファイルの属性であるファイルの種類を示すアイコンとが表示される。なお、この時点では、会議は開始されていないため、ユーザの操作に基づくファイルの選択は行われない。また、領域E200には、第2の識別表示は表示されない。そのため、表示装置60は、識別符号を含む音声(コマンド)の入力を受け付けない。
図7(a)は、会議処理が開始されたあとに、表示部610やユーザが使用する端末装置に表示される表示画面W210の例である。表示画面210は、ユーザの入力に基づき、ファイルを選択することが可能な画面である。表示画面210には、会議に関連するファイルを表示する領域E210を含む。また、領域E210には、ファイルごとに、第1の識別表示を表示する領域と、第2の識別表示を表示する領域とが含まれ、第1の識別表示と第2の識別表示とが、縦に一列に並べて表示される。このため、ユーザは、一覧表示された第1の識別表示の中から、ファイルを選択することが可能である。また、表示装置60は、識別符号を含む音声(コマンド)の入力を受け付ける。
なお、表示装置60は、ユーザの操作に基づくファイルの選択を、会議処理以外にも、例えば、ユーザの音声を認識して表示装置60の制御を行う機能(音声認識制御)に関する処理を開始した後に行ってもよい。例えば、図6に示したボイススイッチアイコンB200は、ユーザによって選択されることで、音声認識制御を可能とするボタンである。表示装置60は、図6のボイススイッチアイコンB200が選択されたことに基づいて、音声認識制御に関する機能を開始し、図7(a)に示した表示画面W210のように、第2の識別表示を追加して表示するようにしてもよい。
領域E210には、例えば図7(a)に示すように、第1の識別表示である表示M210と、第2の識別表示である表示M212とが含まれ、第1の識別表示M210の左隣に第2の識別表示M212が表示される。表示M210は、図6の表示M200と同様である。また、表示M212として、識別符号である「1」を含む矩形が表示される。このような表示により、「MeetingUI_v1.3.pptx」というファイル名のファイルは、識別符号「1」と対応することが示される。
同様にして、領域E210には、第1の識別表示である表示M214と、第2の識別表示である表示M216とが含まれ、第1の識別表示M214の左隣に第2の識別表示M216が表示される。表示M214は、図6の表示M202と同様である。また、表示M216として、識別符号である「2」を含む矩形が表示される。このような表示により、「check_mobileUI_v6.pptx」というファイル名のファイルは、識別符号「2」と対応することが示される。
ユーザは、表示画面W210に表示された識別符号である「1」又は「2」を含む音声を入力することで、識別符号に対応するファイルを選択することができる。
なお、ユーザの入力に基づき、ファイルを選択することが可能な画面は、図7(a)に示した表示画面W210以外であっても、例えば、図7(b)に示した表示画面W220であってもよい。表示画面W220は、第1の識別表示及び第2の識別表示を縦に1列に並べて表示させた表示画面W210とは異なり、第1の識別表示及び第2の識別表示が、複数列に並べて表示される領域E220を含む。
領域E220には、図7(b)に示すように、ファイルごとに、第1の識別表示及び第2の識別表示が表示される。例えば、領域E220には、第1の識別表示である表示M220と、第2の識別表示である表示M222とが含まれる。表示M220として、1のファイルを特定するためのファイル名(例えば、「New notebook.one」)と、当該1のファイルの属性であるファイルの種類を示すアイコンとが表示される。また、表示M222として、識別符号である「1」を含む矩形が表示される。この場合、「New notebook.one」というファイル名のファイルは、識別符号「1」と対応する。
また、図7(b)に示すように、表示画面W220には、識別符号として「1」から「12」まで表示されている。したがって、ユーザは、識別符号である「1」から「12」までの何れかの番号を含む音声を入力することで、識別符号に対応するファイルを選択することができる。
なお、表示部610やユーザが使用する端末装置に表示されるファイル数が所定値(例えば、図7(b)の場合は12個)を超える場合、第1の識別表示及び第2の識別表示を含む領域をスクロール可能にしてもよい。ユーザによるスクロール操作がされたとき、表示装置60は、第1の識別表示及び第2の識別表示を含む領域に表示されるファイルに対して識別符号を1から割り当て直した上で、第1の識別表示及び第2の識別表示を更新する。これにより、ファイル数が多数の場合であっても、第2の識別表示として、所定値以下の数字が表示される。したがって、ユーザは、ファイル記憶領域652に記憶されたファイル数が多数の場合であっても、所定値までの何れかの番号を発声すればファイルを選択することができる。例えば、図7(b)の例では、ユーザは1~12までの何れかの番号を発声するだけで済む。
また、表示装置60は、ファイルをグルーピングして、同一のグループに含まれる複数のファイルに対して1の識別符号を割り当ててもよい。表示装置60は、ファイルをグルーピングする際に、例えば、作成日や更新日等の日付、作成者、ファイル形式、利用頻度などの属性を利用する。これにより、ユーザは、1の識別符号を含むコマンドを入力することで、入力した識別符号に対応する複数のファイルを表示装置60に表示させることができる。このように、表示装置60は、1のコマンドにより複数のファイルを表示することにより、ユーザの利便性を向上させることができる。
本実施形態によれば、ユーザは、識別符号を含むコマンドを音声で入力するという簡易な操作により、表示部に表示するファイルを選択し、表示させることが可能となる。
[3.第3実施形態]
第3実施形態は、第1実施形態又は第2実施形態に記載した処理に加えて、音声装置以外の装置からのコマンドの入力を受け付ける実施形態である。
はじめに、本実施形態を、第2実施形態で説明した会議システムに適用した場合について説明する。この場合、制御部500は、ファイル選択処理のステップS102において、一覧表示するコマンドとして、音声によるコマンドと、入力部620による操作によるコマンドの何れかを受信する。入力部620による操作によるコマンドを受信する場合とは、例えば、制御部600が表示部610に一覧表示するためのボタンを表示し、ユーザにより一覧表示するためのボタンが選択された場合である。
また、ステップS102において音声によるコマンドが入力された場合は、ステップS110において、制御部600は、識別符号を含むコマンドが音声入出力部630を介して入力されたか否かを判定する。この場合、制御部600は、第2の識別表示をタッチする操作や、第2の識別表示と対応する番号のボタンを選択する操作等、入力部620を介して識別符号を含むコマンドが入力されても、入力部620を介して入力されたコマンドは無視する。
一方、制御部600は、ステップS102において入力部620による操作によるコマンドが入力された場合は、識別符号を含むコマンドが入力部620を介して入力されたか否かを判定する。この場合、制御部600は、識別符号を含むコマンドが音声入出力部630を介して入力されても、音声入出力部630を介して入力されたコマンドは無視する。
このような処理により、制御部600は、一覧表示するコマンドとして入力された機能部に基づき、識別符号を含むコマンドの入力を受け付ける。
なお、本実施形態を第1実施形態のシステム1に適用する場合は、システム1において制御装置10に、ユーザから音声以外の方法により操作の入力を受け付ける入力装置を接続する。制御装置10は、入力装置から一覧表示するコマンドを受信したときは、識別符号を含むコマンドを入力装置から受信し、音声入出力装置40からは受信しない。一方で、制御装置10は、音声入出力装置40から一覧表示するコマンドを受信したときは、識別符号を含むコマンドを音声入出力装置40から受信し、入力装置からは受信しない。
このように、本実施形態によれば、ユーザは、一覧表示するコマンドを入力する操作と、識別符号を含むコマンドを入力する操作とを音声操作のみ、もしくは入力装置への入力操作のみに統一のうえ継続して行うことができ、意図しない操作によりファイルが選択されてしまうことを防ぐことができる。
[4.第4実施形態]
第4実施形態について説明する。第4実施形態は、システム1を印刷システムとして適用した実施形態である。
[4.1 全体構成]
図8は、システム1を適用した印刷システム2の概略を示した図である。印刷システム2では、例えば画像形成装置70と、音声処理装置80と、対話装置85と、音声入出力装置90とを備えている。また、画像形成装置70と対話装置85、音声処理装置80と対話装置85、音声処理装置80と音声入出力装置90とがそれぞれ接続されている。なお、画像形成装置70及び音声入出力装置90は、ユーザが所在する場所に設置され、音声処理装置80及び対話装置85は、インターネット(クラウド上)に設置されてもよい。
印刷システム2を構成する装置は、それぞれ独立の装置であってもよいし、1つの装置の中で構成されてもよいし、複数の装置を組み合わせてもよい。
印刷システム2において、システム1の制御装置10、記憶装置20、表示装置30は、画像形成装置70によって構成される。また、システム1の音声入出力装置40は、音声処理装置80と対話装置85と音声入出力装置90とによって構成される。
具体的には、図8に示した印刷システム2では、音声入出力装置90はユーザが発した音声を入力し、音声ストリームを音声処理装置80へ送信する。音声処理装置80は、入力した音声ストリームを認識し、入力文として対話装置85へ送信する。対話装置85は、会話サービスを提供する装置であり、入力文に対する応答文を生成する。なお、対話装置85は、画像形成装置70との間で情報を送受信し、画像形成装置70の状態を取得し、入力文に対して、例えば画像形成装置70の状態を示す応答文を生成して音声処理装置80へ送信する。応答文を受信した音声処理装置80は、応答文を音声として出力するための音声ストリームを生成し音声入出力装置90へ送信する。音声ストリームを受信した音声入出力装置90は、受信した音声ストリームに基づき、音声を出力する。
[4.2 機能構成]
なお、以下では、図8に示した印刷システム2を、画像形成装置70によって構成した場合について説明する。この場合、画像形成装置70には、図8に示した、音声処理装置80と対話装置85と音声入出力装置90とに対応する機能部を含める。
図9は、印刷システム2を提供可能な画像形成装置70を示した図である。画像形成装置70は、制御装置10に対応する制御部700と、記憶装置20に対応する記憶部770と、表示装置30に対応する表示部750と、音声入出力装置40に対応する音声入出力部760と、を備えて構成される。
制御部700は、画像形成装置70の全体を制御するための機能部である。制御部700は、記憶部770に記憶されている各種プログラムを読み出して実行することにより各種機能を実現しており、1又は複数の演算装置(例えばCPU)により構成される。
制御部700は、プログラムを実行することにより、音声認識部702及び対話処理部704として機能する。音声認識部702は、音声入出力部760を介して音声が入力された場合、入力された音声を認識する。なお、音声認識部702は、認識した音声の内容を示す情報(例えば、文字の情報)を、一時的に記憶部770に出力してもよい。
対話処理部704は、会話サービスを実現する。対話処理部704は、入力された音声に対応する応答文を、音声入出力部760を介して出力する。
画像入力部710は、画像形成装置70に入力される画像データを取得するための機能部である。画像入力部710は、USB(Universal Serial Bus)メモリや、SDカード等の記憶媒体から画像データを取得してもよい。また、他の端末装置と接続を行う通信部790を介して、他の端末装置から画像データを取得してもよい。また、画像入力部710は、取得した画像データをファイルとしてファイル記憶領域772に記憶する。
原稿読取部715は、画像を読み取って画像データを生成する機能部である。例えば、原稿読取部715は、CCD(Charge Coupled Device)やCIS(Contact Image Sensor)等のイメージセンサによって画像を電気信号に変換し、電気信号を量子化及び符号化
することでデジタルデータを生成するスキャナ装置等により構成される。また、原稿読取部715は、生成した画像データをファイルとしてファイル記憶領域772に記憶する。
画像処理部720は、画像データに各種画像処理を施す機能部である。例えば、画像処理部720は、画像データの鮮鋭化処理を行ったり、色変換処理を行ったりする。
画像形成部730は、ファイルに基づく画像を記録媒体(例えば記録用紙)に形成する機能部である。画像形成部730は、例えば、電子写真方式を利用したレーザプリンタ等により構成される。
入力部740は、ユーザによる操作指示を受け付けるための機能部であり、ハードキー(例えば、テンキー)やボタン等により構成される。表示部750は、ユーザに各種情報を表示するための機能部であり、例えば、LCDや有機ELディスプレイ等により構成される。なお、画像形成装置70は、入力部740と表示部750とが一体に形成されるタッチパネルを備えてもよい。また、入力を検出する方式は、例えば、抵抗膜方式、赤外線方式、電磁誘導方式、静電容量方式といった、一般的な検出方式であればよい。
ユーザ認証部755は、ユーザ認証を行う。例えば、入力部740から入力されたユーザ名、パスワードが、ユーザ情報776に記憶されているユーザ名、パスワードと一致するか否かにより認証を行う。なお、ユーザ認証部755は、ユーザの生体情報や画像を取得し、生体認証(例えば、指紋認証、掌紋認証、顔認証、音声認証、虹彩認証等)を行ってもよい。
音声入出力部760は、音声の入力と出力とを行う。例えば、音声を入力するマイクと、音声の出力を行うスピーカにより構成される。
記憶部770は、画像形成装置70の動作に必要な各種プログラムや、各種データが記憶されている機能部である。記憶部770は、例えば、半導体メモリであるSSDや、HDD等により構成されている。また、記憶部770は、ファイルを記憶するためのファイル記憶領域772を確保し、印刷ファイルリスト774、ユーザ情報776,待受画面情報778、ジョブ実行画面情報780を記憶している。
印刷ファイルリスト774は、ファイル記憶領域772に記憶されているファイルのうち、画像形成部730において形成する画像のファイルを特定する情報(例えば、ファイル名)を記憶したリストである。印刷ファイルリスト774は、ファイルを特定する情報の他に、印刷の順番、優先度、印刷の設定、印刷の操作を行ったユーザ名等が記憶されてもよい。
ユーザ情報776は、ユーザに関する情報を記憶する。例えば、ユーザ認証に関する情報(例えば、ユーザ名、パスワード、ユーザに関する生体情報)を記憶する。
待受画面情報778は、コマンドの入力を待ち受ける待受画面を表示部750に表示するために必要な情報(例えば、表示部750に表示する文字列やアイコンや、文字列やアイコンを配置する位置の情報等)を記憶する。また、ジョブ実行画面情報780は、画像形成装置70が実行するジョブを実行する際に表示するジョブ実行画面を表示部750に表示するために必要な情報を記憶する。
通信部790は、他の装置と通信を行う。例えば、LANに接続して、ファイルを送受信したりする。通信方式は、一般的なイーサネットであるLANの他にも、LTE/4G/5Gといった通信を利用してもよい。
[4.3 処理の流れ]
つづいて、図10を参照して、画像形成装置70が記憶部770に記憶されたプログラムを読み出して実行する処理について説明する。図10に示した処理は、ユーザ認証部755によりユーザを認証した後に、制御部700により実行される。
はじめに、制御部700は、初期状態として、待受画面情報778を読み出して、待受画面を表示部750に表示する(ステップS502)。
つづいて、制御部700は、音声入出力部760を介して入力され、音声認識部702によって認識された音声の内容に基づき、画面切替コマンドを受信したか否かを判定する(ステップS504)。画面切替コマンドとは、画像形成装置70の操作の入力を、音声によって行う画面に切り替えることを示すコマンドであり、例えば、「音声で操作」といった、特定の単語(ウェイクワード)を含む音声によるコマンドである。
音声切替コマンドを受信した場合、制御部700は、表示部750に表示されている待受画面を、音声操作用画面に切り替えて表示する(ステップS504;Yes→ステップS506)。音声操作用画面は、音声によって入力可能なコマンドの内容を含む画面である。
制御部700は、音声入出力部760を介して入力され、音声認識部702によって認識された音声の内容に基づき、ファイル取得コマンドを受信したか否かを判定する(ステップS508)。ファイル取得コマンドとは、ファイル記憶領域772に記憶されているファイルを取得することを指示するための音声によるコマンドであり、例えば、「ジョブを表示」「Release my jobs」といった音声によるコマンドである。
ファイル取得コマンドを受信した場合は、制御部700は、ファイル記憶領域772に記憶されているファイルを取得する(ステップS508;Yes→ステップS510)。このとき、制御部700は、認証されたユーザが印刷可能なファイルのみを取得してもよい。
つづいて、制御部700は、取得したファイルのサムネイル画像を表示部750に一覧表示する(ステップS512)。また、制御部700は、取得したファイルに識別符号を割り当て、識別符号を含む画像を、識別符号に対応するファイルのサムネイル画像に重畳させて表示する(ステップS514)。このように、制御部700は、ファイル取得コマンドを受信したことを契機として、ファイルのサムネイル画像と識別符号を含む画像とを表示する。したがって、本実施形態においては、ファイル取得コマンドは、一覧表示するコマンドに対応する。
識別符号を含む画像は、例えば、所定の色を背景色とし、背景の上に識別符号を重ねた矩形状の画像であり、識別符号を含む画像は、少なくともサムネイル画像の短辺の3分の1以上の大きさの画像である。また、識別符号を含む画像は、非透過の画像であってもよいし、ユーザによって識別符号が識別可能な程度に透過させた半透過の画像であってもよい。制御部700は、識別符号を含む画像を、サムネイル画像の何れかの隅部に重畳させて表示する。
つづいて、制御部700は、印刷コマンドを受信したか否かを判定する(ステップS516)。印刷コマンドとは、ファイルに基づく画像を画像形成部730によって形成することで印刷をすることを示すコマンドであり、例えば、「5番」「5番を印刷して」といったように、少なくとも識別符号を含む音声によるコマンドである。制御部700は、音声入出力部760を介して入力され、音声認識部702によって認識された音声の内容に基づき、印刷コマンドを受信したか否かを判定する。
印刷コマンドを受信した場合は、印刷コマンドに含まれる識別符号に対応するファイルの画像を画像形成部730により形成することで、印刷処理を実行する(ステップS516;Yes→ステップS518)。なお、印刷コマンドを受信した後、すぐに印刷ができない場合は、制御部700は、識別符号に対応するファイルを特定する情報を、印刷ファイルリスト774に記憶してもよい。また、印刷処理を実行するとき、制御部700は、ジョブ実行画面情報780を読み出して、実行する印刷ジョブに関する画面を表示部750に表示してもよい。
なお、ステップS516において、印刷コマンド以外のコマンドを受信した場合は、受信したコマンドが印刷以外の他の処理を行うことを示すコマンドを受信したか否かを判定する(ステップS516;No→ステップS520)。他の処理を行うことを示すコマンドを受信した場合は、制御部700は、受信したコマンドに基づき、他の処理を実行する(ステップS520;Yes)。他の処理を行うことを示すコマンドを受信しなかった場合、制御部700は、再びステップS516へ処理を遷移する(ステップS520;No→ステップS516)。
[4.4 動作例]
つづいて、図11及び図12を参照して本実施形態の動作例を説明する。図11(a)は、音声操作用画面の表示画面W500の例である。表示画面W500には、ファイル取得コマンドを入力するためにユーザが発する音声の内容(例えば、「Release my job」)を表示する領域E500が含まれる。ユーザは、領域E500等に表示された内容を確認し、音声によるコマンドを入力する。なお、表示画面W500には、認証したユーザが印刷可能なファイルの数を表示する領域E502が含まれていてもよい。
図11(b)は、サムネイル画像が表示され、サムネイル画像に識別符号を含む画像が重畳表示された画面である表示画面W510の例である。例えば、図11(b)に示すように、表示画面W510には、サムネイル画像M510の左隅に、識別符号を含む画像M512が表示される。なお、サムネイル画像と識別符号の他に、サムネイル画像の近傍に、ファイル名M514が表示されてもよい。
図12は、識別符号を含む画像の表示例を示した図である。例えば、図12(a)のように、サムネイル画像が縦長である場合、識別符号を含む画像は、識別符号を含む画像の長辺の長さが、サムネイル画像の短辺である横辺の3分の1以上の長さとなるように表示される。また、図12(b)のように、サムネイル画像が横長である場合、識別符号を含む画像は、識別符号を含む画像の短辺の長さが、サムネイル画像の短辺である縦辺の3分の1以上の長さとなるように表示される。このようにすることで、識別符号を含む画像は、少なくともサムネイル画像の短辺の3分の1以上の大きさの画像となり、ユーザにより容易に識別符号を確認させることができる。
なお、サムネイル画像が縦長である場合、図12(c)に示すように、好ましくは、識別符号を含む画像は、識別符号を含む画像の長辺の長さが、サムネイル画像の短辺である横辺の2分の1以上の長さであってもよい。
また、識別符号を含む画像は、サムネイル画像の何れかの隅部に表示されればよく、例えば、図12(d)のように左下に表示されてもよく、右上、右下に表示されてもよい。さらに、図12(e)のように、サムネイルの中央に表示されてもよい。この場合でも、識別符号を含む画像は、サムネイル画像の短辺の3分の1以上の大きさの画像とする。
また、識別符号を含む画像は、サムネイル画像が縦長である場合であっても、長辺を基準としてもよい。例えば、図12(f)のように、識別符号を含む画像の短辺の長さが、サムネイル画像の長辺の長さの4分の1以上の長さとなるように表示されてもよい。
このように、識別符号を含む画像は様々な表示方法が考えられるが、表示方法については、予め設定されていてもよいし、ユーザによって設定可能であってもよい。
このように、本実施形態によれば、画像形成装置は、ユーザからのファイル取得コマンドの受信を契機として、記憶されたファイルのサムネイル画像を、ユーザに発声させる識別符号とともに一覧表示することができる。また、画像形成装置は、ユーザによって印刷コマンドとして識別符号を含む音声が発声された場合、印刷コマンドに基づき、印刷を実行することができる。これにより、ユーザは、識別符号を含む音声を発声するだけで、画像形成装置に対して、所望するファイルを印刷させることが可能となる。
[5.第5実施形態]
つづいて、第5実施形態について説明する。第5実施形態は、第4実施形態で説明した処理に加えて、画像形成装置が、一覧表示したサムネイル画像の中から、一のサムネイル画像を順次選択し、選択したサムネイル画像に対応する識別符号を音声入出力部から音声出力する処理を実行する実施形態である。本実施形態は、第4実施形態の図10を図13に置き換えたものである。なお、同一の機能部及び処理には同一の符号を付し、説明については省略する。
図13を参照して、画像形成装置70が記憶部770に記憶されたプログラムを読み出して実行する処理について説明する。本実施形態では、制御部700は、ステップS512及びステップS514の処理を実行してサムネイル画像及び識別符号を表示部750に表示させた後、1を初期値とした変数nを用いて、n番目のサムネイル画像から順次サムネイル画像を選択する。そして、制御部700は、選択したn番目のサムネイル画像に対応するファイルに割り当てられた識別符号を含む音声を、音声入出力部760を介して出力する(ステップS602)。識別符号を含む音声には、識別符号の他に、例えば、ファイル名や、ファイルの種類や、作成日時などの情報を含めてもよい。
制御部700は、一のサムネイル画像を選択したとき、選択した一のサムネイル画像及び当該サムネイル画像に重畳表示された識別表示を含む画像を、他のサムネイル画像及び当該他のサムネイル画像に重畳表示された識別表示とは表示方法を異ならせてもよい。このようにすることで、制御部700は、音声によって出力された識別符号と、識別符号に対応するサムネイル画像及び識別表示を含む画像とを連動させる。
例えば、制御部700は、一のサムネイル画像を選択したとき、選択したサムネイル画像を他のサムネイル画像の表示方法とは異なる方法によって表示(強調表示)するために、次のように表示する。
(1)選択したサムネイル画像を拡大させる
(2)選択したサムネイル画像の周囲に枠を表示する
(3)選択したサムネイル画像を点滅させる
(4)選択したサムネイル画像の色を反転させる
(5)選択したサムネイル画像に所定の色(例えば、赤色)を半透明の状態で重畳させる
(6)選択したサムネイル画像以外のサムネイル画像の透過率を高めて選択したサムネイル画像よりも目立たなくする
なお、制御部700は、選択したサムネイル画像ではなく、選択したサムネイル画像に対応する識別符号を含む画像を強調表示するために、以下のように表示してもよい。
(1)識別符号を含む画像を拡大させる
(2)識別符号を含む画像の周囲に枠を表示する
(3)識別符号を含む画像の背景色を変化させる
(4)識別符号を含む画像を点滅表示させる
このように、制御部700は、識別符号を含む画像のみを強調表示することで、サムネイル画像が拡大されて他のサムネイル画像を隠したりすることがなく、視認性を確保することが可能となる。
なお、制御部700は、上述した表示方法のうち2以上の表示方法を組み合わせてもよく、例えば、選択したサムネイル画像と、当該選択したサムネイル画像に対応する識別符号とを拡大して表示してもよい。また、制御部700は、上述した表示方法以外の表示方法により、サムネイル画像や識別符号を含む画像を強調表示してもよい。
また、制御部700は、ステップS602におけるn番目の音声出力が終了したら、強調表示したn番目のサムネイル画像や識別符号を含む画像の表示を、元の(強調表示する前の)表示態様に戻す。
つづいて、制御部700は、全てのファイルに対する識別符号の音声による出力が終了したか否かを判定する(ステップS604)。全てのファイルに対する識別符号の音声による出力が終了していない場合は、nに1を加算して、ステップS602に戻る(ステップS604;No→ステップS606→ステップS602)。このようにすることで、制御部700は、全てのファイルについて、識別符号を音声により出力することが可能となる。
なお、制御部700は、全てのファイルに対する識別符号の音声による出力が終了した後に印刷コマンドを受信したか否かを判定するのではなく、音声による識別符号の出力を実行しているときに、印刷コマンドを受信したか否かを判定してもよい。この場合、制御部700は、印刷コマンドを受信したときは、音声による識別符号の出力を終了し、印刷コマンドに含まれる識別符号に対応するファイルの印刷処理を実行する。このようにすることで、ユーザは、印刷を所望するファイルに対応する識別符号を確認した後、すぐに印刷コマンドを入力することが可能となる。
本実施形態における動作例を、図14を参照して説明する。図14(a)は、1番目のサムネイル画像が選択され、サムネイル画像が拡大して表示されているときの表示画面W600の例である。表示画面W600の領域E600には、拡大された1番目のサムネイル画像と、識別符号を含む画像とファイル名とが含まれる。このとき、音声入出力部760を介して、識別符号を含む音声(例えば、「1番目、Ocean.jpg」といった音声)が出力される。なお、ファイル名は、所定の読み方に従って、音声によって出力される。
図14(b)は、2番目のサムネイル画像が選択され、サムネイル画像が拡大して表示されているときの表示画面W610の例である。表示画面W610の領域E610には、拡大された2番目のサムネイル画像と、識別符号を含む画像とファイル名とが含まれる。このとき、音声入出力部760を介して、識別符号を含む音声(例えば、「2番目、Flower.png」といった音声)が出力される。
なお、同様にして、3番目から6番目のサムネイル画像が順次選択され、拡大して表示され、音声入出力部760を介して、識別符号を含む音声が出力される。
本実施形態によれば、ユーザは、音声入出力部から出力される音声及び表示部に表示される画面を確認することで、印刷を所望するファイルを適切に選択することができる。
[6.変形例]
本発明は上述した各実施の形態に限定されるものではなく、種々の変更が可能である。すなわち、本発明の要旨を逸脱しない範囲内において適宜変更した技術的手段を組み合わせて得られる実施の形態についても本発明の技術的範囲に含まれる。
また、上述した実施形態は、説明の都合上、それぞれ別に説明している部分があるが、技術的に可能な範囲で組み合わせて実行してもよいことは勿論である。例えば、第2実施形態と第5実施形態とを組み合わせてもよい。この場合、第2実施形態における表示装置60は、ファイルと識別符号とを一覧表示した後、音声入出力部530を介して、識別符号を含む音声を出力する。
また、実施形態において各装置で動作するプログラムは、上述した実施形態の機能を実現するように、CPU等を制御するプログラム(コンピュータを機能させるプログラム)である。そして、これら装置で取り扱われる情報は、その処理時に一時的に一時記憶装置(例えば、RAM)に蓄積され、その後、各種ROM(Read Only Memory)やHDD等の記憶装置に格納され、必要に応じてCPUによって読み出し、修正・書き込みが行なわれる。
ここで、プログラムを格納する記録媒体としては、半導体媒体(例えば、ROMや、不揮発性のメモリカード等)、光記録媒体・光磁気記録媒体(例えば、DVD(Digital Versatile Disc)、MO(Magneto Optical Disc)、MD(Mini Disc)、CD(Compact Disc)、BD (Blu-ray Disk) 等)、磁気記録媒体(例えば、磁気テープ、フレキシブルディスク等)等の何れであってもよい。また、ロードしたプログラムを実行することにより、上述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、オペレーティングシステムあるいは他のアプリケーションプログラム等と共同して処理することにより、本発明の機能が実現される場合もある。
また、市場に流通させる場合には、可搬型の記録媒体にプログラムを格納して流通させたり、インターネット等のネットワークを介して接続されたサーバコンピュータに転送したりすることができる。この場合、サーバコンピュータの記憶装置も本発明に含まれるのは勿論である。
1 システム
10 制御装置
20 記憶装置
30 表示装置
40 音声入出力装置
50 処理装置
500 制御部
502 音声認識部
510 表示部
520 入力部
530 音声入出力部
550 記憶部
552 ファイル記憶領域
560 通信部
60 表示装置
600 制御部
602 音声認識部
604 会議処理部
610 表示部
620 入力部
630 音声入出力部
650 記憶部
652 ファイル記憶領域
660 通信部
70 画像形成装置
700 制御部
702 音声認識部
704 対話処理部
710 画像入力部
715 原稿読取部
720 画像処理部
730 画像形成部
740 入力部
750 表示部
760 音声入出力部
770 記憶部
772 ファイル記憶領域
774 印刷ファイルリスト
776 ユーザ情報
778 待受画面情報
780 ジョブ実行画面情報
790 通信部
80 音声処理装置
85 対話装置
90 音声入出力装置

Claims (14)

  1. 制御装置と、ファイルを記憶する記憶装置と、表示装置と、音声装置とを備えたシステムであって、
    前記制御装置は、
    前記音声装置を介して、ユーザから前記ファイルを一覧表示するコマンドの音声が入力されると、前記ファイルを特定する第1の識別表示を前記表示装置に一覧表示し、
    前記第1の識別表示を前記表示装置に一覧表示したとき、ユーザが一覧表示された第1の識別表示の中からファイルが選択可能な場合にのみ、前記一覧表示するファイルに識別符号を割当て第2の識別表示として追加して表示し、
    前記第1の識別表示を前記表示装置に一覧表示するとき、ユーザが一覧表示された第1の識別表示の中からファイルが選択可能な場合にのみ、前記ユーザから識別符号を含む音声の入力を受け付け、
    前記音声装置を介して、ユーザから前記識別符号を含む音声が入力されると、当該識別符号に対応するファイルを選択する、
    ことを特徴とするシステム。
  2. 前記制御装置は、
    ユーザが複数参加可能な会議処理が実行可能であり、
    前記会議処理により会議が開始される前は、前記第1の識別表示前記表示装置に一覧表示可能であり、
    前記会議処理により会議が開始された後は、前記第1の識別表示に、前記第2の識別表示を追加して表示し、
    前記会議処理により会議が開始された後に前記音声装置を介してユーザから前記識別符号を含む音声が入力されると、当該識別符号に対応するファイルを選択する
    ことを特徴とする請求項1記載のシステム。
  3. 前記制御装置は、
    音声操作を開始可能なボタンを前記表示装置に表示可能であって、
    前記ボタンが選択された後に、前記表示装置に一覧表示された第1の識別表示に対して、第2の識別表示を追加して表示し、
    前記第2の識別表示が表示されている場合にのみ、前記ユーザから識別符号を含む音声の入力を受け付ける
    請求項1に記載のシステム。
  4. 前記制御装置は、
    ユーザから前記音声装置を介して音声の入力がなされて一覧表示をした場合は、前記識別符号について前記音声装置からの入力を受け付け、
    ユーザから前記音声装置以外の装置を介して入力がなされて一覧表示をした場合は、前記音声装置以外の装置からの入力を受け付ける
    ことを特徴とする請求項1からの何れか一項に記載のシステム。
  5. 前記第1の識別表示は、ファイル名と、ファイルの属性を示すアイコンであることを特徴とする請求項1からの何れか一項に記載のシステム。
  6. 前記制御装置は、前記一覧表示するファイルをグルーピングし、同一のグループに含まれる複数のファイルに一の識別符号を割当てることを特徴とする請求項1からの何れか一項に記載のシステム。
  7. 前記制御装置は、
    前記第1の識別表示として前記ファイルのサムネイル画像を表示し、
    前記第2の識別表示は、前記第1の識別表示に重畳して表示する
    請求項1に記載のシステム。
  8. 前記第2の識別表示は、少なくとも前記サムネイル画像の短辺の3分の1以上の大きさの画像であることを特徴とする請求項に記載の画像形成システム。
  9. 前記第2の識別表示は、矩形状の画像に、前記識別符号が含まれている画像であることを特徴とする請求項又はに記載の画像形成システム。
  10. 前記第2の識別表示は、前記サムネイル画像の何れかの隅部に重畳表示される画像であることを特徴とする請求項からの何れか一項に記載の画像形成システム。
  11. 前記制御装置は、前記一覧表示したサムネイル画像の中から一のサムネイル画像を順次選択し、選択したサムネイル画像に対応する前記識別符号を前記音声装置から音声出力することを特徴とする請求項から10の何れか一項に記載の画像形成システム。
  12. 前記制御装置は、前記選択したサムネイル画像に対応する前記識別符号を前記音声装置から音声出力するときに、併せて当該サムネイル画像を強調表示させることを特徴とする請求項11に記載の画像形成システム。
  13. 前記強調表示は、前記サムネイル画像を拡大して表示する、前記サムネイル画像の周囲に枠を表示する、前記サムネイル画像の色を反転して表示する、前記サムネイル画像を点滅して表示する、のうち少なくとも何れか1つの方法による表示であることを特徴とする請求項12に記載の画像形成システム。
  14. 前記制御装置は、前記選択したサムネイル画像に対応する前記識別符号を前記音声装置から音声出力するときに、併せて当該識別符号を含む画像を拡大して表示することを特徴とする請求項11に記載の画像形成システム。
JP2020013994A 2020-01-30 2020-01-30 システム及び画像形成システム Active JP7333761B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2020013994A JP7333761B2 (ja) 2020-01-30 2020-01-30 システム及び画像形成システム
US17/159,286 US11567629B2 (en) 2020-01-30 2021-01-27 System and image forming system
CN202110124927.6A CN113206922A (zh) 2020-01-30 2021-01-29 系统及图像形成系统
US18/089,326 US11861140B2 (en) 2020-01-30 2022-12-27 System and image forming system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020013994A JP7333761B2 (ja) 2020-01-30 2020-01-30 システム及び画像形成システム

Publications (2)

Publication Number Publication Date
JP2021120809A JP2021120809A (ja) 2021-08-19
JP7333761B2 true JP7333761B2 (ja) 2023-08-25

Family

ID=77025295

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020013994A Active JP7333761B2 (ja) 2020-01-30 2020-01-30 システム及び画像形成システム

Country Status (3)

Country Link
US (2) US11567629B2 (ja)
JP (1) JP7333761B2 (ja)
CN (1) CN113206922A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022143464A (ja) * 2021-03-17 2022-10-03 富士フイルムビジネスイノベーション株式会社 情報処理装置およびプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009253970A (ja) 2008-04-08 2009-10-29 Lg Electronics Inc 移動端末機及びそのメニュー制御方法
JP2011248444A (ja) 2010-05-24 2011-12-08 Konica Minolta Business Technologies Inc 表示制御装置およびそれを用いたプレゼンテーション方法
JP2016218868A (ja) 2015-05-22 2016-12-22 富士通株式会社 表示制御方法、情報処理装置及び表示制御プログラム
JP2020009011A (ja) 2018-07-04 2020-01-16 大日本印刷株式会社 フォトブック作製システム及びサーバ装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3437509B2 (ja) 1998-10-09 2003-08-18 キヤノン株式会社 画像形成装置並びに音声により指示可能な画像形成装置の制御方法および記憶媒体
JP2000267837A (ja) 1999-03-15 2000-09-29 Nippon Hoso Kyokai <Nhk> マンマシンインターフェース装置およびマンマシンインターフェース制御プログラムを記録した記録媒体
US20010043234A1 (en) * 2000-01-03 2001-11-22 Mallik Kotamarti Incorporating non-native user interface mechanisms into a user interface
EP1693829B1 (en) * 2005-02-21 2018-12-05 Harman Becker Automotive Systems GmbH Voice-controlled data system
JP4894252B2 (ja) * 2005-12-09 2012-03-14 ソニー株式会社 データ表示装置、データ表示方法及びデータ表示プログラム
CN100394429C (zh) * 2005-12-16 2008-06-11 北京金山软件有限公司 一种基于wap网站实现对页面显示内容排版的方法
KR100657520B1 (ko) * 2006-01-26 2006-12-14 삼성전자주식회사 정보 단말 장치에서 파일 계층 구조의 탐색 방법
JP4804417B2 (ja) * 2007-05-17 2011-11-02 キヤノン株式会社 動画撮像装置及び動画撮像方法
KR101348116B1 (ko) 2008-05-09 2014-01-16 삼성전자주식회사 화상형성장치 및 그 식별자 부가 파일 표시방법
EP2285068B1 (en) * 2009-08-07 2014-06-25 BlackBerry Limited Method, mobile device and computer readable medium for mobile telepresence
JP2012168790A (ja) * 2011-02-15 2012-09-06 Brother Ind Ltd 表示プログラム、及び、表示装置
US20180249263A1 (en) * 2015-08-13 2018-08-30 Meq Inc. Playing Modified Audio Signals to a Group of Listeners
US10838685B2 (en) * 2017-03-23 2020-11-17 Fuji Xerox Co., Ltd. Information processing device and non-transitory computer-readable medium
US11385775B2 (en) * 2020-04-30 2022-07-12 Citrix Systems, Inc. Intelligent monitor and layout management

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009253970A (ja) 2008-04-08 2009-10-29 Lg Electronics Inc 移動端末機及びそのメニュー制御方法
JP2011248444A (ja) 2010-05-24 2011-12-08 Konica Minolta Business Technologies Inc 表示制御装置およびそれを用いたプレゼンテーション方法
JP2016218868A (ja) 2015-05-22 2016-12-22 富士通株式会社 表示制御方法、情報処理装置及び表示制御プログラム
JP2020009011A (ja) 2018-07-04 2020-01-16 大日本印刷株式会社 フォトブック作製システム及びサーバ装置

Also Published As

Publication number Publication date
US11861140B2 (en) 2024-01-02
US20210243314A1 (en) 2021-08-05
US11567629B2 (en) 2023-01-31
CN113206922A (zh) 2021-08-03
US20230134080A1 (en) 2023-05-04
JP2021120809A (ja) 2021-08-19

Similar Documents

Publication Publication Date Title
JP6903808B2 (ja) リアルタイム手書き認識の管理
JP6606301B1 (ja) デジタルアシスタントサービスの遠距離拡張
JP3728304B2 (ja) 情報処理方法、情報処理装置、プログラム、及び記憶媒体
CN101998107B (zh) 信息处理装置、会议系统和信息处理方法
JP4031255B2 (ja) ジェスチャコマンド入力装置
JP2022084625A (ja) ユーザアカウントに対する認証資格証明を管理するためのデバイス、方法、及びグラフィカルユーザインターフェース
JP2007235921A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
CN111566604A (zh) 电子装置及其操作方法
CN113572889A (zh) 简化用户接口生成
US11861140B2 (en) System and image forming system
CN104252312A (zh) 触笔词典共享
JP7263869B2 (ja) 情報処理装置及びプログラム
US20220068276A1 (en) Information processor, print system, and control method
TWI453655B (zh) 多功能事務機及其警示方法
KR101116689B1 (ko) 제스처 인식을 이용한 도트코드 기반 정보 출력 방법 및 장치
JP2017102939A (ja) オーサリング装置、オーサリング方法、およびプログラム
US8515173B2 (en) Image processing system, image processing method and computer readable medium
JP7383885B2 (ja) 情報処理装置及びプログラム
JP2012108899A (ja) 電子機器、ネットワークシステム、およびコンテンツ編集方法
JP6080058B2 (ja) オーサリング装置、オーサリング方法、およびプログラム
JP6390131B2 (ja) 処理実行システム、処理実行装置および処理実行プログラム
JP2023018516A (ja) 情報処理システム、情報処理システムの制御方法およびプログラム
JP2021071658A (ja) サーバ装置、通信システムおよび情報処理方法
JP2020047227A (ja) フォトブック作製システム及びサーバ装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230425

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230815

R150 Certificate of patent or registration of utility model

Ref document number: 7333761

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150