JP5331936B2 - 音声制御画像編集 - Google Patents
音声制御画像編集 Download PDFInfo
- Publication number
- JP5331936B2 JP5331936B2 JP2012501398A JP2012501398A JP5331936B2 JP 5331936 B2 JP5331936 B2 JP 5331936B2 JP 2012501398 A JP2012501398 A JP 2012501398A JP 2012501398 A JP2012501398 A JP 2012501398A JP 5331936 B2 JP5331936 B2 JP 5331936B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- audio
- subject
- text
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 37
- 239000011521 glass Substances 0.000 claims description 35
- 241001465754 Metazoa Species 0.000 claims description 31
- 230000006870 function Effects 0.000 claims description 8
- 238000010295 mobile communication Methods 0.000 claims description 3
- 238000007664 blowing Methods 0.000 claims 1
- 238000004891 communication Methods 0.000 description 38
- 238000010586 diagram Methods 0.000 description 29
- 238000012545 processing Methods 0.000 description 22
- 238000001514 detection method Methods 0.000 description 17
- 238000013519 translation Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 230000004044 response Effects 0.000 description 5
- 229910052724 xenon Inorganic materials 0.000 description 3
- FHNFHKCVQCLJFQ-UHFFFAOYSA-N xenon atom Chemical compound [Xe] FHNFHKCVQCLJFQ-UHFFFAOYSA-N 0.000 description 3
- 208000032041 Hearing impaired Diseases 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010428 oil painting Methods 0.000 description 1
- MBYLVOKEDDQJDY-UHFFFAOYSA-N tris(2-aminoethyl)amine Chemical compound NCCN(CCN)CCN MBYLVOKEDDQJDY-UHFFFAOYSA-N 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/56—Cameras or camera modules comprising electronic image sensors; Control thereof provided with illuminating means
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/265—Mixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
- H04N9/8211—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a sound signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
- H04N9/8233—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a character code signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/52—Details of telephonic subscriber devices including functional features of a camera
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/63—Control of cameras or camera modules by using electronic viewfinders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/67—Focus control based on electronic image sensor signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Studio Devices (AREA)
- User Interface Of Digital Computer (AREA)
- Television Signal Processing For Recording (AREA)
Description
本明細書において説明するシステム及び/又は方法は、音声制御画像編集を実行するデバイスを提供できる。例えば、図1に示されるような例示的な構成、システム及び/又は方法は、2人の被験者(例えば、第1の被験者120及び第2の被験者130)と関連付けられたデバイス110を提供してもよく、被験者の画像はデバイス110により撮影される。デバイス110は、カメラ、移動電話等を含んでもよい。被験者120/130には、画像がデバイス110により撮影される人物を含んでもよい。
図2は、本明細書において説明するシステム及び/又は方法が実現される例示的なデバイス200を示す図である。図2に示されるように、デバイス200は、筐体210、レンズ220、フラッシュユニット230、ビューファインダ240及びボタン250を含んでもよい。筐体210は、デバイスの構成要素を外部の要素から保護してもよい。
図5は、デバイス200/300が実行できる単一の人物の場合の例示的な音声制御画像編集動作500を示す図である。図示されるように、デバイス200/300は、第1の被験者120(例えば、単一の人物)の画像を撮影できるように、第1の被験者120と共に配置されてもよい。デバイス200/300のユーザは、デバイス200/300と関連付けられた会話の吹き出しモード(例えば、画像撮影モード)を選択してもよく、デバイス200/300は、第1の被験者120と関連付けられた(例えば、マイク360/390を介して)オーディオ510を記録し始めてもよい。ユーザが写真を撮る場合、デバイス200/300は、第1の被験者120の画像520を撮影してもよく、記録されたオーディオ510(例えば、画像520が撮影される時間に時間的に近接する)及び撮影された画像520をデバイス200/300のメモリ420に格納してもよい。記録されたオーディオ510は、デバイス200/300により画像520が撮影される前及び後の双方に記録されるオーディオを含んでもよい。例えば記録されたオーディオ510は、第1の被験者120により話された言葉(例えば、「I’m sorry, I have no time to speak for the moment. I’m in Paris working!」)を含んでもよい。デバイス200/300は、記録されたオーディオ510を画像520が撮影された頃に話された(例えば、被験者120により)言葉を記録するオーディオクリップに短くしてもよい。オーディオクリップは、記録されたオーディオ510間で無音期間を識別することにより、全文を含んでもよい。
図12は、デバイス200/300が実行できる単一の人物の場合の例示的な音声制御画像編集動作1200を示す図である。図示されるように、デバイス200/300は、ユーザ1220が(例えば、デバイス200/300を介して)被験者1210(例えば、被験者120/130に類似する)の画像を撮影できるように、被験者1210及びユーザ1220と共に配置されてもよい。ユーザ1020は、デバイス200/300と関連付けられた会話の吹き出しモード(例えば、画像撮影モード)を選択してもよく、音声コマンド1230をデバイス200/300に提供してもよい。音声コマンド1230は、特定の動作を実行するようにデバイス200/300に命令する1つ又は複数の言葉を含んでもよい。例えば音声コマンド1230は、思考の吹き出し動作を実行するようにデバイス200/300に命令するコマンド(例えば、「思考の吹き出し」)を含んでもよい。音声コマンド1230を受信した後、デバイス200/300は、ユーザ1220により提供された(例えば、マイク360/390を介して)オーディオ1240を記録し始めてもよい。ユーザ1220が写真を撮る場合、デバイス200/300は、被験者1210の画像1250を撮影してもよく、記録されたオーディオ1240(例えば、画像1250が撮影される時間に時間的に近接する)及び撮影された画像1250をデバイス200/300のメモリ420に格納してもよい。記録されたオーディオ1240は、デバイス200/300により画像1250が撮影される前及び後の双方に記録されるオーディオを含んでもよい。例えば記録されたオーディオ1240は、ユーザ1220により話された言葉(例えば、「A football and friends would be nice!」)を含んでもよい。デバイス200/300は、記録されたオーディオ1240を画像1250が撮影された頃に話された(例えば、ユーザ1220により)言葉を記録するオーディオクリップに短くしてもよい。オーディオクリップは、記録されたオーディオ1240間で無音期間を識別することにより、全文を含んでもよい。
図16〜図18は、本明細書において説明する実現例に係る音声制御画像編集の例示的な処理1600を示すフローチャートである。一実現例において、処理1600は、デバイス200/300の1つ以上の構成要素により実行されてもよい。別の実現例において、処理1600のうちのいくつか又は全ては、デバイス200/300を含むかあるいは除外する別のデバイス又はデバイスのグループにより実行されてもよい。
本明細書において説明したシステム及び/又は方法は、音声制御画像編集を実行するデバイスを提供してもよい。
Claims (9)
- デバイスにより被写体の画像を撮影するステップと、
前記被写体が人物である場合、
前記被写体と関連付けられたオーディオを前記デバイスのメモリに記録するステップと、
前記デバイスのプロセッサにより、前記撮影された画像において前記人物の頭の場所を判定するステップと、
前記プロセッサにより前記オーディオをテキストに変換するステップと、
前記プロセッサにより前記テキストを含む会話の吹き出しを作成するステップと、
前記プロセッサにより、前記撮影された画像において前記会話の吹き出しを前記人物の頭の前記場所の隣に位置付けて最終画像を作成するステップと、
前記被写体が動物である場合、
前記デバイスのユーザにより提供されたオーディオを記録するステップと、
前記撮影された画像において前記動物の頭の場所を判定するステップと、
前記ユーザにより提供された前記オーディオをテキストに変換するステップと、
前記ユーザにより提供された前記オーディオから変換された前記テキストを含む会話の吹き出しを作成するステップと、
前記撮影された画像において前記ユーザにより提供された前記オーディオから変換された前記テキストを含む前記会話の吹き出しを前記動物の頭の前記場所の隣に位置付けて異なる画像を作成するステップと、
を有することを特徴とする方法。 - 前記最終画像又は前記異なる画像を、前記デバイスのディスプレイ上に表示するステップと、
前記最終画像又は前記異なる画像を前記デバイスの前記メモリに格納するステップと、
を更に有することを特徴とする請求項1に記載の方法。 - 前記被写体が無生物の被写体である場合、
前記デバイスのユーザにより提供されたオーディオを記録するステップと、
前記ユーザにより提供された前記オーディオをユーザ提供テキストに変換するステップと、
前記ユーザ提供テキストを前記撮影された画像と関連付けてユーザ規定画像を作成するステップと、
を更に有することを特徴とする請求項1に記載の方法。 - 前記被写体が複数の人物を含む場合、
前記複数の人物から提供されるオーディオを記録するステップと、
前記複数の人物のビデオを解析して各人物の口の動きを判定するステップと、
前記オーディオを各人物の前記口の動きと比較して各人物と関連付けられる前記オーディオの部分を判定するステップと、
各人物と関連付けられた前記オーディオ部分をテキスト部分に変換するステップと、
人物毎に各人物と関連付けられたテキスト部分を含む会話の吹き出しを作成するステップと、
前記撮影された画像に基づいて各人物の頭の場所を判定するステップと、
会話の吹き出しの各々を対応する各人物の頭の場所と共に位置付けて複数の人物の最終画像を作成するステップと、
を更に有することを特徴とする請求項1に記載の方法。 - 前記オーディオは第1言語で提供され、前記オーディオをテキストに変換するステップは、
前記オーディオを前記第1言語とは異なる第2言語に提供されるテキストに変換するステップを有することを特徴とする請求項1に記載の方法。 - 前記被写体の複数の画像を撮影するステップと、
各々が前記テキストの部分を含む複数の会話の吹き出しを作成するステップと、
前記複数の会話の吹き出しの各々を対応する前記複数の画像のうちの1つと関連付けて時間順の画像を作成するステップと、
を更に有することを特徴とする請求項1に記載の方法。 - 思考の吹き出の動作の実行命令を受信したとき、
前記デバイスのユーザにより提供されたオーディオを記録するステップと、
前記ユーザにより提供された前記オーディオをユーザ提供テキストに変換するステップと、
前記ユーザ提供テキストを含む思考の吹き出しを作成するステップと、
前記撮影された画像において前記思考の吹き出しを前記人物の頭の前記場所の隣に位置付けて思考の吹き出しの画像を作成するステップと、
を更に有することを特徴とする請求項1に記載の方法。 - 前記デバイスは、
無線電話と、
パーソナル移動通信システム(PCS)端末と、
カメラと、
カメラ機能を備えたビデオカメラと、
双眼鏡と、
ビデオ眼鏡とのうち少なくとも1つを含むことを特徴とする請求項1に記載の方法。 - 被写体の画像を撮影する手段と、
前記被写体が人物である場合、
前記被写体と関連付けられたオーディオを記録する手段と、
前記撮影された画像において前記人物の頭の場所を判定する手段と、
前記オーディオをテキストに変換する手段と、
前記テキストを含む会話の吹き出しを作成する手段と、
前記撮影された画像において前記会話の吹き出しを前記人物の頭の前記場所の隣に位置付けて最終画像を作成する手段と、
前記被写体が動物である場合、
デバイスのユーザが提供するオーディオを記録する手段と、
前記撮影された画像において前記動物の頭の場所を判定する手段と、
前記ユーザが提供したオーディオをテキストに変換する手段と、
前記ユーザが提供したオーディオから変換されたテキストを含む会話の吹き出しを作成する手段と、
前記ユーザから提供された前記オーディオから変換されたテキストを含む前記会話の吹き出しを、前記撮影された画像における前記人物の頭の前記場所の隣に位置付けて異なる画像を作成する手段と、
前記最終画像又は前記異なる画像を表示する手段と、
前記最終画像又は前記異なる画像を格納する手段と、
を備えることを特徴とするデバイス。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/408,866 | 2009-03-23 | ||
US12/408,866 US20100238323A1 (en) | 2009-03-23 | 2009-03-23 | Voice-controlled image editing |
PCT/IB2009/053734 WO2010109274A1 (en) | 2009-03-23 | 2009-08-25 | Voice-controlled image editing |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012521705A JP2012521705A (ja) | 2012-09-13 |
JP5331936B2 true JP5331936B2 (ja) | 2013-10-30 |
Family
ID=41228448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012501398A Expired - Fee Related JP5331936B2 (ja) | 2009-03-23 | 2009-08-25 | 音声制御画像編集 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20100238323A1 (ja) |
EP (1) | EP2411980B1 (ja) |
JP (1) | JP5331936B2 (ja) |
WO (1) | WO2010109274A1 (ja) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010124034A (ja) * | 2008-11-17 | 2010-06-03 | Hoya Corp | 撮像装置 |
JP2010124039A (ja) * | 2008-11-17 | 2010-06-03 | Hoya Corp | 撮像装置 |
JP4930564B2 (ja) * | 2009-09-24 | 2012-05-16 | カシオ計算機株式会社 | 画像表示装置及び方法並びにプログラム |
US8464952B2 (en) * | 2009-11-18 | 2013-06-18 | Hand Held Products, Inc. | Optical reader having improved back-illuminated image sensor |
US20130155277A1 (en) * | 2010-06-02 | 2013-06-20 | Ruiz Rodriguez Ezequiel | Apparatus for image data recording and reproducing, and method thereof |
US9323250B2 (en) | 2011-01-28 | 2016-04-26 | Intouch Technologies, Inc. | Time-dependent navigation of telepresence robots |
US9098611B2 (en) | 2012-11-26 | 2015-08-04 | Intouch Technologies, Inc. | Enhanced video interaction for a user interface of a telepresence network |
JP5439455B2 (ja) * | 2011-10-21 | 2014-03-12 | 富士フイルム株式会社 | 電子コミック編集装置、方法及びプログラム |
JP2013097773A (ja) * | 2011-11-07 | 2013-05-20 | Sony Corp | 情報処理装置、情報処理方法、及びプログラム |
KR101830656B1 (ko) * | 2011-12-02 | 2018-02-21 | 엘지전자 주식회사 | 이동 단말기 및 이의 제어방법 |
US9361021B2 (en) | 2012-05-22 | 2016-06-07 | Irobot Corporation | Graphical user interfaces including touchpad driving interfaces for telemedicine devices |
WO2013176760A1 (en) | 2012-05-22 | 2013-11-28 | Intouch Technologies, Inc. | Graphical user interfaces including touchpad driving interfaces for telemedicine devices |
US9263044B1 (en) * | 2012-06-27 | 2016-02-16 | Amazon Technologies, Inc. | Noise reduction based on mouth area movement recognition |
US20140036102A1 (en) * | 2012-08-05 | 2014-02-06 | Hiti Digital, Inc. | Image capture device and method for image processing by voice recognition |
TW201407538A (zh) * | 2012-08-05 | 2014-02-16 | Hiti Digital Inc | 影像擷取裝置與利用語音辨識進行影像處理的方法 |
US9094576B1 (en) | 2013-03-12 | 2015-07-28 | Amazon Technologies, Inc. | Rendered audiovisual communication |
WO2014158508A1 (en) * | 2013-03-14 | 2014-10-02 | Motorola Mobility Llc | Context-based tagging of photographic images based on recorded audio at time of image capture |
JP6179889B2 (ja) * | 2013-05-16 | 2017-08-16 | パナソニックIpマネジメント株式会社 | コメント情報生成装置およびコメント表示装置 |
US11199906B1 (en) | 2013-09-04 | 2021-12-14 | Amazon Technologies, Inc. | Global user input management |
KR102306538B1 (ko) * | 2015-01-20 | 2021-09-29 | 삼성전자주식회사 | 콘텐트 편집 장치 및 방법 |
US9984100B2 (en) * | 2015-09-29 | 2018-05-29 | International Business Machines Corporation | Modification of images and associated text |
CN106156310A (zh) * | 2016-06-30 | 2016-11-23 | 努比亚技术有限公司 | 一种图片处理装置和方法 |
CN106791370A (zh) * | 2016-11-29 | 2017-05-31 | 北京小米移动软件有限公司 | 一种拍摄照片的方法和装置 |
US11316865B2 (en) | 2017-08-10 | 2022-04-26 | Nuance Communications, Inc. | Ambient cooperative intelligence system and method |
US11404148B2 (en) | 2017-08-10 | 2022-08-02 | Nuance Communications, Inc. | Automated clinical documentation system and method |
CN107886947A (zh) * | 2017-10-19 | 2018-04-06 | 珠海格力电器股份有限公司 | 一种图像处理的方法以及装置 |
US11250383B2 (en) | 2018-03-05 | 2022-02-15 | Nuance Communications, Inc. | Automated clinical documentation system and method |
US11222716B2 (en) | 2018-03-05 | 2022-01-11 | Nuance Communications | System and method for review of automated clinical documentation from recorded audio |
US11515020B2 (en) | 2018-03-05 | 2022-11-29 | Nuance Communications, Inc. | Automated clinical documentation system and method |
US11216480B2 (en) | 2019-06-14 | 2022-01-04 | Nuance Communications, Inc. | System and method for querying data points from graph data structures |
US11043207B2 (en) | 2019-06-14 | 2021-06-22 | Nuance Communications, Inc. | System and method for array data simulation and customized acoustic modeling for ambient ASR |
US11227679B2 (en) | 2019-06-14 | 2022-01-18 | Nuance Communications, Inc. | Ambient clinical intelligence system and method |
US11531807B2 (en) | 2019-06-28 | 2022-12-20 | Nuance Communications, Inc. | System and method for customized text macros |
US11670408B2 (en) | 2019-09-30 | 2023-06-06 | Nuance Communications, Inc. | System and method for review of automated clinical documentation |
US11222103B1 (en) | 2020-10-29 | 2022-01-11 | Nuance Communications, Inc. | Ambient cooperative intelligence system and method |
CN112711366A (zh) * | 2020-12-23 | 2021-04-27 | 维沃移动通信(杭州)有限公司 | 图像生成方法、装置和电子设备 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2687712B2 (ja) * | 1990-07-26 | 1997-12-08 | 三菱電機株式会社 | 一体型ビデオカメラ |
JP3707096B2 (ja) * | 1995-05-10 | 2005-10-19 | カシオ計算機株式会社 | 画像制御装置および画像制御方法 |
JP3711418B2 (ja) * | 1996-02-21 | 2005-11-02 | カシオ計算機株式会社 | 顔画像表示装置及び顔画像通信システム |
US6690419B1 (en) * | 1997-07-15 | 2004-02-10 | Silverbrook Research Pty Ltd | Utilising eye detection methods for image processing in a digital image camera |
JP3757565B2 (ja) * | 1997-08-04 | 2006-03-22 | カシオ計算機株式会社 | 音声認識画像処理装置 |
JP2002057930A (ja) * | 2000-05-30 | 2002-02-22 | Fuji Photo Film Co Ltd | ディジタル・スチル・カメラおよびその動作制御方法 |
JP3784289B2 (ja) * | 2000-09-12 | 2006-06-07 | 松下電器産業株式会社 | メディア編集方法及びその装置 |
US20030200078A1 (en) * | 2002-04-19 | 2003-10-23 | Huitao Luo | System and method for language translation of character strings occurring in captured image data |
US7760248B2 (en) * | 2002-07-27 | 2010-07-20 | Sony Computer Entertainment Inc. | Selective sound source listening in conjunction with computer interactive processing |
JP2005101931A (ja) * | 2003-09-25 | 2005-04-14 | Fuji Photo Film Co Ltd | 画像プリント装置 |
US20050206751A1 (en) * | 2004-03-19 | 2005-09-22 | East Kodak Company | Digital video system for assembling video sequences |
US7587136B2 (en) * | 2005-02-25 | 2009-09-08 | Fujifilm Corporation | Image capturing apparatus, image capturing method, output apparatus, output method and program |
JP2006238220A (ja) * | 2005-02-25 | 2006-09-07 | Fuji Photo Film Co Ltd | 撮像装置、撮像方法、及びプログラム |
JP4599244B2 (ja) * | 2005-07-13 | 2010-12-15 | キヤノン株式会社 | 動画データから字幕を作成する装置及び方法、プログラム、並びに記憶媒体 |
US7636450B1 (en) * | 2006-01-26 | 2009-12-22 | Adobe Systems Incorporated | Displaying detected objects to indicate grouping |
JP4775066B2 (ja) * | 2006-03-28 | 2011-09-21 | カシオ計算機株式会社 | 画像加工装置 |
US20070250526A1 (en) * | 2006-04-24 | 2007-10-25 | Hanna Michael S | Using speech to text functionality to create specific user generated content metadata for digital content files (eg images) during capture, review, and/or playback process |
JP4803147B2 (ja) * | 2007-09-27 | 2011-10-26 | カシオ計算機株式会社 | 撮像装置、画像生成方法、およびプログラム |
JP5209510B2 (ja) * | 2009-01-07 | 2013-06-12 | オリンパスイメージング株式会社 | 音声表示装置及びカメラ |
CN102047652B (zh) * | 2009-03-31 | 2014-05-28 | 松下电器产业株式会社 | 摄像装置、集成电路及摄像方法 |
-
2009
- 2009-03-23 US US12/408,866 patent/US20100238323A1/en not_active Abandoned
- 2009-08-25 WO PCT/IB2009/053734 patent/WO2010109274A1/en active Application Filing
- 2009-08-25 JP JP2012501398A patent/JP5331936B2/ja not_active Expired - Fee Related
- 2009-08-25 EP EP09787021.6A patent/EP2411980B1/en not_active Not-in-force
Also Published As
Publication number | Publication date |
---|---|
JP2012521705A (ja) | 2012-09-13 |
US20100238323A1 (en) | 2010-09-23 |
EP2411980B1 (en) | 2019-03-06 |
EP2411980A1 (en) | 2012-02-01 |
WO2010109274A1 (en) | 2010-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5331936B2 (ja) | 音声制御画像編集 | |
KR101917648B1 (ko) | 단말 및 그 제어 방법 | |
US8144939B2 (en) | Automatic identifying | |
US9298704B2 (en) | Language translation of visual and audio input | |
CN110475069B (zh) | 图像的拍摄方法及装置 | |
US11527242B2 (en) | Lip-language identification method and apparatus, and augmented reality (AR) device and storage medium which identifies an object based on an azimuth angle associated with the AR field of view | |
US10245732B2 (en) | Reception system and reception method | |
CN101919234A (zh) | 利用捕获的背景图像拍照 | |
JP2010181461A (ja) | デジタルフォトフレーム、情報処理システム、プログラム及び情報記憶媒体 | |
JP6350285B2 (ja) | 携帯端末 | |
CN114401417B (zh) | 直播流对象跟踪方法及其装置、设备、介质 | |
WO2005094437A2 (en) | System and method for automatically cataloguing data by utilizing speech recognition procedures | |
JPWO2018155116A1 (ja) | 情報処理装置、情報処理方法及びコンピュータプログラム | |
CN109756770A (zh) | 视频播放过程实现单词或语句复读的方法及电子设备 | |
US11922689B2 (en) | Device and method for augmenting images of an incident scene with object description | |
US20120242860A1 (en) | Arrangement and method relating to audio recognition | |
KR101862128B1 (ko) | 얼굴을 포함하는 영상 처리 방법 및 장치 | |
CN111739528A (zh) | 一种交互方法、装置和耳机 | |
JP2017059121A (ja) | 画像管理装置、画像管理方法及びプログラム | |
CN115394283A (zh) | 语音合成方法、装置、电子设备及存储介质 | |
US20070284450A1 (en) | Image handling | |
KR101142955B1 (ko) | 단어와 연관시켜 피사체의 화상을 촬영하는 단어 학습 방법 | |
JP2011160285A (ja) | 画像表示装置、携帯端末装置、および画像表示方法 | |
CN114254659A (zh) | 翻译方法及装置、计算机可读存储介质和电子设备 | |
KR101608674B1 (ko) | 원격 제어 방법 및 시스템, 이를 수행하기 위한 기록매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130628 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130708 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130729 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5331936 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |