JP4702936B2 - 情報処理装置及び制御方法、プログラム - Google Patents
情報処理装置及び制御方法、プログラム Download PDFInfo
- Publication number
- JP4702936B2 JP4702936B2 JP2005188317A JP2005188317A JP4702936B2 JP 4702936 B2 JP4702936 B2 JP 4702936B2 JP 2005188317 A JP2005188317 A JP 2005188317A JP 2005188317 A JP2005188317 A JP 2005188317A JP 4702936 B2 JP4702936 B2 JP 4702936B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- voice recognition
- merged
- output
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 41
- 230000010365 information processing Effects 0.000 title claims description 10
- 230000008569 process Effects 0.000 claims description 25
- 230000006870 function Effects 0.000 description 14
- 238000012790 confirmation Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Description
U2:「両面出力」
S3:「両面出力、でよろしいですか?」
U4:「はい」
S5:「他に設定があれば、設定値を発声して下さい。設定が完了した場合はスタートボタンを押して下さい。」
U6:「A4用紙」
S7:「A4用紙、でよろしいですか?」
U8:「はい」
上記において、S3、S7は認識結果をユーザに確認させるための提示であり、U4,U8はユーザによる確定指示である。
音声により、画像データをプリント出力するための複数の設定値を選択する情報処理装置の制御方法であって、
前記画像データを保持する保持工程と、
入力された音声について音声認識処理をして、設定値の候補を得る音声認識工程と、
前記複数の設定値のうち、設定済みとなっている設定値を取得する取得工程と、
前記音声認識工程で複数の設定値の候補が得られた場合、前記複数の設定値の候補に前記取得工程で取得した設定済みとなっている設定値をそれぞれマージして複数のマージ済みデータを生成するマージ工程と、
前記画像データを前記複数のマージ済みデータそれぞれの設定値に基づいてプリント出力する場合に得られる出力結果を表す画像を、前記複数のマージ済みデータごとに生成する生成工程と、
前記生成工程で生成された複数の画像を表示手段に出力する出力工程と、
前記複数の画像のいずれかをユーザに選択させる選択工程と、を有する。
なお、以下の各実施形態では、本発明を複写機に適用した場合を説明するが、本発明の適用はこれに限られるものではない。
図1Aは実施形態による複写機の概略構成を示すブロック図である。図1Aにおいて、1は複写機を示している。複写機1は原稿画像を光学的に読みよって画像信号を生成するスキャナ部11と、スキャナ部11によって得られた画像信号をプリントするプリンタ部12を有する。スキャナ部11とプリンタ部12によって複写機能を実現するが、その構成に特に制限はなく、スキャナ部11とプリンタ部12には周知の構成を適用できる。
1位:A4[用紙サイズ]
2位:A3[用紙サイズ]
3位:A4R[用紙サイズ]
第1実施形態では、出力するマージ済みデータをテキストデータとして説明した。しかし、出力形態はこのようなテキスト形式に限られるものではない。例えば、ユーザへの認識結果の提示形態を音声とすることも可能である。この場合、マージ済みデータから音声合成処理により音声データが生成されることになる。音声データの合成処理はデータマージ部108、マージ済みデータ出力部107、或いは制御部13の何れで実行されてもよい。
更に、設定済みデータベース103に格納されるデータは、ユーザが対話的に設定したデータに限定されるものではない。例えば、複写機1の場合、ユーザが原稿をスキャナ部11の原稿台又は給紙装置に載せた段階で、その原稿の1枚目あるいは全ての原稿をスキャンし、その画像データをJPEG或いはビットマップ(***.jpg, ***.bmp)の形式で設定済みデータベース103に格納してもよい。例えば、図3の設定済みデータベース103の“原稿”という設定項目の設定値として、原稿をスキャンして得られた画像データを登録するようにしてもよい。この場合、例えば、制御部13がスキャナ部11の原稿台に載せられた原稿、又は給紙装置に載せられた原稿の1枚目を読み取り、その原稿画像データを設定済みデータベース103の“原稿”の設定値として保持させる。このとき、後述のように画像を縮小し、サムネイル画像として保持させるようにしてもよい。なお、原稿をスキャンすることにより、原稿サイズや原稿種別を判定し、これを設定値として反映させるようにしてもよい。
第4実施形態では、第3実施形態に加え、画像提示されるマージ済みデータの用紙の大きさや、サムネイル画像の大きさ等の比率を正確に出力する。これにより、音声認識結果の確認のためのインターフェースを、設定しようとしている出力フォーマットが適正かどうかの確認にも利用可能になる。A4両面出力やA3両面出力等に対応する画像は、実際のA4サイズやA3サイズを所定倍率で縮小したものである。また、スキャン画像から生成されるサムネイル画像も、この所定倍率で縮小されたものとする。
また、上記実施形態では、原稿画像のサムネイルを両面出力を示す用紙の画像と合成し、これを部数分重ねて表示しているが、一番上の用紙の画像にのみ原稿画像のサムネイルを合成するようにしてもよい。
更に、データマージ部108が設定済みデータと音声認識結果をマージする際に、もともと設定済みデータベース103にあったデータと、今回の音声認識結果によるデータを区別できるようにマージしてもよい。例えば、図5Aは、図3の設定済みデータベースのデータに、
1位:A4[用紙サイズ]
2位:A3[用紙サイズ]
3位:A4R[用紙サイズ]
という音声認識結果を画像データとしてマージし、それを表示した例である。
なお、本発明の目的は、前述した実施例の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても達成されることは言うまでもない。
Claims (5)
- 音声により、画像データをプリント出力するための複数の設定値を選択する情報処理装置の制御方法であって、
前記画像データを保持する保持工程と、
入力された音声について音声認識処理をして、設定値の候補を得る音声認識工程と、
前記複数の設定値のうち、設定済みとなっている設定値を取得する取得工程と、
前記音声認識工程で複数の設定値の候補が得られた場合、前記複数の設定値の候補に前記取得工程で取得した設定済みとなっている設定値をそれぞれマージして複数のマージ済みデータを生成するマージ工程と、
前記画像データを前記複数のマージ済みデータそれぞれの設定値に基づいてプリント出力する場合に得られる出力結果を表す画像を、前記複数のマージ済みデータごとに生成する生成工程と、
前記生成工程で生成された複数の画像を表示手段に出力する出力工程と、
前記複数の画像のいずれかをユーザに選択させる選択工程と、を有することを特徴とする情報処理装置の制御方法。 - 前記設定値は、枚数、用紙サイズ、濃度、両面出力、片面出力についての設定値を含む、ことを特徴とする請求項1に記載の情報処理装置の制御方法。
- 前記出力工程では、更に、前記複数の画像のうち、前記マージ済みデータに設定された用紙サイズの用紙からはみ出る画像と、前記用紙からはみ出ない画像とを識別可能に出力する、ことを特徴とする請求項1または請求項2に記載の情報処理装置の制御方法。
- 音声により、画像データをプリント出力するための複数の設定値を選択する情報処理装置であって、
前記画像データを保持する保持手段と、
入力された音声について音声認識処理をして、設定値の候補を得る音声認識手段と、
前記複数の設定値のうち、設定済みとなっている設定値を取得する取得手段と、
前記音声認識手段で複数の設定値の候補が得られた場合、前記複数の設定値の候補に前記取得手段で取得した設定済みとなっている設定値をそれぞれマージして複数のマージ済みデータを生成するマージ手段と、
前記画像データを前記複数のマージ済みデータそれぞれの設定値に基づいてプリント出力する場合に得られる出力結果を表す画像を、前記複数のマージ済みデータごとに生成する生成手段と、
前記生成手段で生成された複数の画像を表示手段に出力する出力手段と、
前記複数の画像のいずれかをユーザに選択させる選択手段と、を備えることを特徴とする情報処理装置。 - コンピュータに、音声により、画像データをプリント出力するための複数の設定値を選択する情報処理装置の動作方法を実行させるプログラムであって、前記コンピュータに、
前記画像データを保持する保持工程と、
入力された音声について音声認識処理をして、設定値の候補を得る音声認識工程と、
前記複数の設定値のうち、設定済みとなっている設定値を取得する取得工程と、
前記音声認識工程で複数の設定値の候補が得られた場合、前記複数の設定値の候補に前記取得工程で取得した設定済みとなっている設定値をそれぞれマージして複数のマージ済みデータを生成するマージ工程と、
前記画像データを前記複数のマージ済みデータそれぞれの設定値に基づいてプリント出力する場合に得られる出力結果を表す画像を、前記複数のマージ済みデータごとに生成する生成工程と、
前記生成工程で生成された複数の画像を表示手段に出力する出力工程と、
前記複数の画像のいずれかをユーザに選択させる選択工程と、を実行させることを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005188317A JP4702936B2 (ja) | 2005-06-28 | 2005-06-28 | 情報処理装置及び制御方法、プログラム |
US11/477,342 US20060293896A1 (en) | 2005-06-28 | 2006-06-28 | User interface apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005188317A JP4702936B2 (ja) | 2005-06-28 | 2005-06-28 | 情報処理装置及び制御方法、プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2007010754A JP2007010754A (ja) | 2007-01-18 |
JP2007010754A5 JP2007010754A5 (ja) | 2008-08-14 |
JP4702936B2 true JP4702936B2 (ja) | 2011-06-15 |
Family
ID=37568668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005188317A Expired - Fee Related JP4702936B2 (ja) | 2005-06-28 | 2005-06-28 | 情報処理装置及び制御方法、プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20060293896A1 (ja) |
JP (1) | JP4702936B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11222185B2 (en) | 2006-10-26 | 2022-01-11 | Meta Platforms, Inc. | Lexicon development via shared translation database |
US9128926B2 (en) * | 2006-10-26 | 2015-09-08 | Facebook, Inc. | Simultaneous translation of open domain lectures and speeches |
US8972268B2 (en) | 2008-04-15 | 2015-03-03 | Facebook, Inc. | Enhanced speech-to-speech translation system and methods for adding a new word |
JP7192220B2 (ja) * | 2018-03-05 | 2022-12-20 | コニカミノルタ株式会社 | 画像処理装置、情報処理装置及びプログラム |
JP7188036B2 (ja) | 2018-11-30 | 2022-12-13 | 株式会社リコー | 情報処理装置、情報処理システム、および方法 |
JP7318381B2 (ja) * | 2019-07-18 | 2023-08-01 | コニカミノルタ株式会社 | 画像形成システムおよび画像形成装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6121526A (ja) * | 1984-07-10 | 1986-01-30 | Nippon Signal Co Ltd:The | 音声認識入力装置 |
JPH05216618A (ja) * | 1991-11-18 | 1993-08-27 | Toshiba Corp | 音声対話システム |
JPH0990818A (ja) * | 1995-09-24 | 1997-04-04 | Ricoh Co Ltd | 複写装置 |
JP2001042890A (ja) * | 1999-07-30 | 2001-02-16 | Toshiba Tec Corp | 音声認識装置 |
JP2005148724A (ja) * | 2003-10-21 | 2005-06-09 | Zenrin Datacom Co Ltd | 音声認識を用いた情報入力を伴う情報処理装置 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69232407T2 (de) * | 1991-11-18 | 2002-09-12 | Toshiba Kawasaki Kk | Sprach-Dialog-System zur Erleichterung von Rechner-Mensch-Wechselwirkung |
JPH0772767A (ja) * | 1993-06-15 | 1995-03-17 | Xerox Corp | 対話型ユーザ支援システム |
JP3582675B2 (ja) * | 1994-10-28 | 2004-10-27 | セイコーエプソン株式会社 | 画像データをメモリに蓄積する装置及び方法 |
US5774841A (en) * | 1995-09-20 | 1998-06-30 | The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration | Real-time reconfigurable adaptive speech recognition command and control apparatus and method |
US6249761B1 (en) * | 1997-09-30 | 2001-06-19 | At&T Corp. | Assigning and processing states and arcs of a speech recognition model in parallel processors |
US7881936B2 (en) * | 1998-12-04 | 2011-02-01 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US7720682B2 (en) * | 1998-12-04 | 2010-05-18 | Tegic Communications, Inc. | Method and apparatus utilizing voice input to resolve ambiguous manually entered text input |
US6694487B1 (en) * | 1998-12-10 | 2004-02-17 | Canon Kabushiki Kaisha | Multi-column page preview using a resizing grid |
US6253184B1 (en) * | 1998-12-14 | 2001-06-26 | Jon Ruppert | Interactive voice controlled copier apparatus |
US6816837B1 (en) * | 1999-05-06 | 2004-11-09 | Hewlett-Packard Development Company, L.P. | Voice macros for scanner control |
JP3619087B2 (ja) * | 1999-11-02 | 2005-02-09 | キヤノン株式会社 | 情報処理装置、情報処理方法およびコンピュータ読み取り可能なプログラムを格納した記憶媒体 |
US6865284B2 (en) * | 1999-12-20 | 2005-03-08 | Hewlett-Packard Development Company, L.P. | Method and system for processing an electronic version of a hardcopy of a document |
GB0025331D0 (en) * | 2000-10-16 | 2000-11-29 | Canon Kk | Control apparatus |
EP1211594A3 (en) * | 2000-11-30 | 2006-05-24 | Canon Kabushiki Kaisha | Apparatus and method for controlling user interface |
US20030020760A1 (en) * | 2001-07-06 | 2003-01-30 | Kazunori Takatsu | Method for setting a function and a setting item by selectively specifying a position in a tree-structured menu |
US20030036909A1 (en) * | 2001-08-17 | 2003-02-20 | Yoshinaga Kato | Methods and devices for operating the multi-function peripherals |
US6842593B2 (en) * | 2002-10-03 | 2005-01-11 | Hewlett-Packard Development Company, L.P. | Methods, image-forming systems, and image-forming assistance apparatuses |
US7363224B2 (en) * | 2003-12-30 | 2008-04-22 | Microsoft Corporation | Method for entering text |
US20060095267A1 (en) * | 2004-10-28 | 2006-05-04 | Fujitsu Limited | Dialogue system, dialogue method, and recording medium |
JP4878471B2 (ja) * | 2005-11-02 | 2012-02-15 | キヤノン株式会社 | 情報処理装置およびその制御方法 |
-
2005
- 2005-06-28 JP JP2005188317A patent/JP4702936B2/ja not_active Expired - Fee Related
-
2006
- 2006-06-28 US US11/477,342 patent/US20060293896A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6121526A (ja) * | 1984-07-10 | 1986-01-30 | Nippon Signal Co Ltd:The | 音声認識入力装置 |
JPH05216618A (ja) * | 1991-11-18 | 1993-08-27 | Toshiba Corp | 音声対話システム |
JPH0990818A (ja) * | 1995-09-24 | 1997-04-04 | Ricoh Co Ltd | 複写装置 |
JP2001042890A (ja) * | 1999-07-30 | 2001-02-16 | Toshiba Tec Corp | 音声認識装置 |
JP2005148724A (ja) * | 2003-10-21 | 2005-06-09 | Zenrin Datacom Co Ltd | 音声認識を用いた情報入力を伴う情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
US20060293896A1 (en) | 2006-12-28 |
JP2007010754A (ja) | 2007-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3938121B2 (ja) | 情報処理装置及びその制御方法、プログラム | |
JP3746378B2 (ja) | 電子メモ処理装置、電子メモ処理方法、および電子メモ処理プログラムを記録したコンピュータ読取り可能な記録媒体 | |
JP4702936B2 (ja) | 情報処理装置及び制御方法、プログラム | |
US20030036909A1 (en) | Methods and devices for operating the multi-function peripherals | |
JP2005031882A (ja) | 情報処理方法及び情報処理装置 | |
JP4615786B2 (ja) | 画像形成装置、プログラムおよび記録媒体 | |
JP2009194577A (ja) | 画像形成装置、音声案内方法及び音声案内プログラム | |
JP2016081140A (ja) | 画像処理装置、画像処理装置の制御方法、及びプログラム | |
US8773696B2 (en) | Method and system for generating document using speech data and image forming apparatus including the system | |
TWI453655B (zh) | 多功能事務機及其警示方法 | |
JP2009230230A (ja) | データ処理装置、画像形成装置およびプログラム | |
JP4010864B2 (ja) | 画像形成装置、プログラムおよび記録媒体 | |
JP2017102939A (ja) | オーサリング装置、オーサリング方法、およびプログラム | |
JP4459123B2 (ja) | 情報処理装置及びユーザインターフェース制御方法 | |
JP2006333365A (ja) | 情報処理装置およびプログラム | |
US7480073B2 (en) | Image processing apparatus, method and program | |
JPH11119790A (ja) | 光学式文字認識装置、および光学式文字認識プログラムを記録した記録媒体 | |
JP6229433B2 (ja) | 操作案内サーバ、操作案内システム、画像形成装置およびプログラム | |
JP4562547B2 (ja) | 画像形成装置、プログラムおよび記録媒体 | |
JP2007013905A (ja) | 情報処理装置およびプログラム | |
JP2004351622A (ja) | 画像形成装置、プログラムおよび記録媒体 | |
JP4561156B2 (ja) | ドキュメント処理装置 | |
JP4530681B2 (ja) | 機器操作装置、画像形成装置、プログラム及び記録媒体 | |
JP7327939B2 (ja) | 情報処理システム、情報処理装置、制御方法、プログラム | |
JP2022178558A (ja) | 画像形成装置およびその操作手順説明の作成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080627 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080627 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110304 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110307 |
|
LAPS | Cancellation because of no payment of annual fees |