CN117336596A - 摄像设备及其控制方法和存储介质 - Google Patents
摄像设备及其控制方法和存储介质 Download PDFInfo
- Publication number
- CN117336596A CN117336596A CN202310789685.1A CN202310789685A CN117336596A CN 117336596 A CN117336596 A CN 117336596A CN 202310789685 A CN202310789685 A CN 202310789685A CN 117336596 A CN117336596 A CN 117336596A
- Authority
- CN
- China
- Prior art keywords
- image
- pickup apparatus
- audio
- indicating
- specific person
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000003860 storage Methods 0.000 title claims abstract description 23
- 230000005540 biological transmission Effects 0.000 claims abstract description 36
- 230000014509 gene expression Effects 0.000 claims abstract description 32
- 238000004519 manufacturing process Methods 0.000 claims abstract description 11
- 230000004044 response Effects 0.000 claims description 25
- 238000000605 extraction Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 25
- 230000008569 process Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 13
- 238000011161 development Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/66—Remote control of cameras or camera parts, e.g. by remote control devices
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
- H04N23/611—Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/63—Control of cameras or camera modules by using electronic viewfinders
- H04N23/633—Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/80—Camera processing pipelines; Components thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/144—Movement detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/92—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N5/9201—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal
- H04N5/9202—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal the additional signal being a sound signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Studio Devices (AREA)
- Indication In Cameras, And Counting Of Exposures (AREA)
Abstract
本发明涉及摄像设备及其控制方法和存储介质。摄像设备获得在摄像设备附近发生的发声的音频并拍摄图像。该设备控制图像发送,使得在发声的音频中包括用于指示特定人物的表达的情况下,该设备将所拍摄的图像中的与发声的音频的获得相关的第一图像发送到与用于指示特定人物的表达相关联的外部设备。该设备从外部设备接收在外部设备中所拍摄的与第一图像的播放相关的第二图像。
Description
技术领域
本发明涉及摄像设备及其控制方法和存储介质。
背景技术
近年来,通过在使用通信设备将诸如图像等的内容发送给朋友或亲属之后进行观看来欣赏该内容。在这种情况下,当进行尝试以向朋友或亲属发送图像时,需要在选择了发送目的地和图像之后将要发送的图像附到电子邮件等,因此这是麻烦的。
日本特开2006-003411提出了如下的技术:通过将语音识别应用于所输入的语音来识别对方的简称,并且对与所识别的简称相对应的目的地进行呼叫。在这样的技术中,可以减少选择所期望的对方的负担。
顺便提及,已开发出在用户未给出摄像指令的情况下定期地且连续地进行摄像的照相机。例如,已知能够通过将照相机设置在房间中的任意位置并自动摄像来将日常的普通场景记录为图像的生活记录照相机。当与朋友或亲属共享这样的照相机所记录的图像时,共享的喜悦和快乐可能根据图像的接收者的状态而增加。
发明内容
本发明是鉴于上述问题而做出的,并且其目的是实现用于使得能够促进与所期望的对方的图像共享以及图像的接收者的状态共享的技术。
为了解决上述问题,本公开的一方面提供了一种摄像设备,包括:音频获得单元,其被配置为获得在所述摄像设备附近发生的发声的音频;摄像单元,其被配置为拍摄图像;控制单元,其被配置为控制图像发送,使得在所述发声的音频中包括用于指示特定人物的表达的情况下,所述控制单元将所拍摄的图像中的与所述发声的音频的获得相关的第一图像发送到与用于指示所述特定人物的表达相关联的外部设备;以及接收单元,其被配置为从所述外部设备接收在所述外部设备中所拍摄的与所述第一图像的播放相关的第二图像。
本公开的另一方面提供了一种摄像设备,包括:接收单元,其被配置为接收从外部设备发送到与用于指示特定人物的表达相关联的所述摄像设备的第一图像,所述第一图像是与包括用于指示所述特定人物的表达的发声的音频的获得相关联的图像;输出单元,其被配置为将所述第一图像输出到显示单元,使得播放所述第一图像;以及控制单元,其被配置为响应于所述第一图像的播放而拍摄第二图像,并且控制图像发送以将所拍摄的第二图像发送到所述外部设备。
本公开的又一方面提供了一种摄像设备的控制方法,所述控制方法包括:获得在所述摄像设备附近发生的发声的音频;拍摄图像;控制图像发送,使得在所述发声的音频中包括用于指示特定人物的表达的情况下,将所拍摄的图像中的与所述发声的音频的获得相关的第一图像发送到与用于指示所述特定人物的表达相关联的外部设备;以及从所述外部设备接收在所述外部设备中所拍摄的与所述第一图像的播放相关的第二图像。
本公开的又一方面提供了一种摄像设备的控制方法,所述控制方法包括:接收从外部设备发送到与用于指示特定人物的表达相关联的所述摄像设备的第一图像,所述第一图像是与包括用于指示所述特定人物的表达的发声的音频的获得相关联的图像;将所述第一图像输出到显示单元,使得播放所述第一图像;以及响应于所述第一图像的播放而拍摄第二图像,并且控制图像发送以将所拍摄的第二图像发送到所述外部设备。
本公开的又一方面提供了一种计算机可读存储介质,其包括指令,所述指令用于进行摄像设备的控制方法,所述控制方法包括:获得在所述摄像设备附近发生的发声的音频;拍摄图像;控制图像发送,使得在所述发声的音频中包括用于指示特定人物的表达的情况下,将所拍摄的图像中的与所述发声的音频的获得相关的第一图像发送到与用于指示所述特定人物的表达相关联的外部设备;以及从所述外部设备接收在所述外部设备中所拍摄的与所述第一图像的播放相关的第二图像。
根据本发明,可以促进与所期望的对方的图像共享以及图像的接收者的状态共享。
通过(参考附图)对以下示例性实施例的描述,本发明的进一步特征将变得明显。
附图说明
图1A和图1B是示出根据第一实施例的摄像系统1的配置的示例的框图。
图2是用于说明根据第一实施例的摄像设备100中的与运动图像的拍摄和发送相关的一系列操作的流程图。
图3是用于说明根据第一实施例的摄像设备200中的从运动图像的播放到所拍摄的运动图像的发送的一系列操作的流程图。
图4是示出根据第一实施例的摄像系统1的使用的示例的图。
图5是示出根据第二实施例的摄像系统1的使用的示例的图。
图6是用于说明根据第二实施例的摄像设备200中的从运动图像的播放到所拍摄的运动图像的发送的一系列操作的流程图。
图7是用于说明摄像系统1的另一示例的图。
具体实施方式
(第一实施例)
在下文中,将参考附图详细描述实施例。注意,以下实施例不旨在限制所要求保护的发明的范围。在实施例中描述了多个特征,但是不限制为需要全部这样的特征的发明,并且可以适当地组合多个这样的特征。此外,在附图中,相同的附图标记被赋予相同或类似的配置,并且省略其冗余描述。
(摄像系统的配置示例)
将参考图1A和图1B描述根据第一实施例的摄像系统1。摄像系统1包括摄像设备100和200。在本实施例的描述中,将使用在摄像设备100和摄像设备200之间发送运动图像的情况作为示例进行描述;然而,本实施例还适用于在摄像设备100与摄像设备200之间发送图像(即静止图像或运动图像)的情况。还将描述摄像设备100和摄像设备200是便携式数字照相机的情况作为示例。
首先,将描述摄像设备100的功能配置的示例。透镜1001是包括变焦透镜和调焦透镜的透镜组。透镜1001可以包括在可更换镜头中。镜头控制单元1002具有基于识别单元1011所提取的被摄体信息来控制透镜1001的焦距和光圈的状态的功能。
CPU 1003例如包括一个或多于一个处理器并且例如是中央处理单元。CPU 1003例如通过将存储单元1016或(未示出的)非易失性存储器中所存储的程序展开在稍后将描述的随机存取存储器(RAM)1006中并执行该程序来控制整个摄像设备100的操作。CPU 1003还执行稍后将参考图2描述的摄像设备100的操作。CPU总线1004控制CPU 1003和各个功能块之间的通信。以下将描述的摄像设备100的各个单元(例如,识别单元1011、运动图像编码单元1013和人物提取单元1040等)的配置可以通过CPU 1003执行程序来实现。
RAM控制单元1007基于来自各个功能块的RAM访问请求来控制对RAM 1006的访问。RAM总线1005控制RAM控制单元1007和各个功能块之间的通信。RAM总线1005还具有用于调停从各个功能块对RAM 1006的访问的功能。
摄像单元1008包括用于将通过透镜1001入射的光转换为电信号的摄像元件。通过摄像元件以预定间隔顺次输出图像信号来形成运动图像数据。摄像单元1008包括用于校正所获得的运动图像数据的透镜像差的功能、以及用于对图像传感器的缺陷像素进行插值的功能。
显像单元1009通过对摄像单元1008所生成的运动图像数据进行去拜耳处理,来将该运动图像数据转换为由亮度信号和色差信号所构成的信号,并且进行显像处理,诸如各个信号中所包括的噪声的去除、光学失真的校正、以及图像的优化等。评价单元1010基于摄像单元1008所生成的运动图像数据来进行用于计算聚焦状态或曝光状态等的评价值的评价值计算处理。
识别单元1011进行识别处理,该识别处理用于检测并识别由显像单元1009进行了显像处理的运动图像数据中的被摄体信息并且生成被摄体信息。例如,识别单元1011执行用于检测运动图像数据中的面部的处理,并且当检测到面部时,输出用于指示面部的位置的信息。识别单元1011还基于诸如面部等的特征信息来进行特定人物等的认证。
控制单元1012在对由显像单元1009进行了显像处理的运动图像数据进行了预定的显示处理(例如,根据显示单元1015的显示面板的特性的转换和图形叠加等)之后,将该运动图像数据输出到显示单元1015。显示单元1015例如由液晶面板配置,并且显示再现的运动图像数据。显示单元1015例如包含在摄像设备100中。然而,显示单元1015可以被配置为布置在摄像设备100的外部,并且例如经由线连接到摄像设备100。
运动图像编码单元1013通过使用诸如MPEG4视频等的预定的运动图像压缩编码方法对由显像单元1009进行了显像处理的运动图像数据进行压缩和编码,来进行用于将该运动图像数据转换为信息量已被压缩的运动图像文件的处理。除了用于通过压缩来将运动图像数据转换为运动图像文件的处理之外,运动图像编码单元1013还可以具有用于当经由通信单元2022从外部接收到运动图像文件时对运动图像文件进行解码的功能。
存储控制单元1014进行用于将由显像单元1009进行了显像处理的运动图像数据存储在存储单元1016中的存储控制处理。存储单元1016例如包括非易失性存储介质,并且例如可以包括存储卡或硬盘。存储单元1016例如包含在摄像设备100中。然而,存储单元1016还可以被配置为能够附接到摄像设备100和从摄像设备100拆卸。
麦克风1017将音频转换为音频信号。麦克风1017例如可以被配置为能够附接到摄像设备100和从摄像设备100拆卸。然而,麦克风1017可以包含在摄像设备100中。麦克风控制单元1018连接到麦克风1017,并且进行麦克风1017的控制、音频收集的开始和停止、以及所收集的音频数据的获得等。麦克风1017的控制例如是增益调整和状态获得等。
音频编码/解码单元1019获得从麦克风1017输入的音频信号,并且利用诸如MPEG4音频AAC等的预定编码方法对音频信号进行编码或解码。扬声器1020播放音频编码/解码单元1019所解码的音频信号。扬声器1020例如被配置为能够附接到摄像设备100和从摄像设备100拆卸,但是可以包含在摄像设备100中。
人物提取单元1040从麦克风1017所收集的音频数据中提取人物名称。例如,当获得在摄像设备100附近发生的用户的发声的音频作为音频数据时,人物提取单元1040例如利用使用了机器学习模型的已知语音识别技术,来从用户的发声的音频中提取用于指示人物的表达。这里所提取的用于指示人物的表达可以包括:诸如“人物A”等的人物的名称;诸如“祖母”等的称呼或昵称;等等。
通信单元1022是用于无线地或有线地将摄像设备100连接到其他设备并发送和接收运动图像文件等的通信接口,并且可以连接到网络,诸如无线局域网(LAN)或因特网等。通信单元1022可以将摄像设备100所获得的运动图像文件以及存储单元1016中所存储的运动图像文件发送到外部设备,并且可以从外部设备接收运动图像文件和各种类型的信息。
操作单元1023从用户(例如,摄像设备100的所有者)接收用于进行摄像设备100的各种设置的各种操作。
所有者登记单元1024将运动图像文件的发送目的地(例如,诸如摄像设备200等的外部设备的所有者)登记在RAM 1006中。所有者登记单元1024例如可以将诸如“祖母”等的用于指示特定人物的表达登记为外部设备的所有者的信息。所有者登记单元1024将用于将运动图像发送到外部设备的发送目的地的信息与用于指示特定人物的表达相关联地登记。用于将运动图像发送到外部设备的发送目的地的信息可以是各种信息,诸如与特定的人物相对应的电子邮件地址、预定服务的账户、以及外部设备的IP地址等。根据这样的信息,当通过人物提取单元1040从发声的音频中提取用于指示特定人物的表达时,摄像设备100可以将运动图像发送到与所提取的用于指示特定人物的表达(例如,“祖母”)相关联的发送目的地。
接下来,将描述摄像设备200。摄像设备200包括从透镜2001到所有者登记单元2024的单元。透镜2001至所有者登记单元2024分别与摄像设备100的透镜1001至所有者登记单元1024类似。
所有者检测单元2050检测在相对于摄像设备200的预定范围内的特定人物(例如,摄像设备200的所有者)。所有者检测单元2050例如使用摄像单元2008来进行摄像并且从拍摄图像中检测特定人物。
(摄像设备100中的用于拍摄和发送运动图像的一系列操作)
接下来,将参考图2描述摄像系统1的摄像设备100中的与运动图像的拍摄和发送相关的一系列操作(摄像设备100拍摄运动图像然后将所拍摄的运动图像发送到摄像设备200的操作)。例如,通过CPU 1003将存储单元1016或(未示出的)非易失性存储器中所存储的程序展开在RAM 1006中并执行该程序,来实现在图2所示的一系列操作。此外,当摄像设备100的(未示出的)电源开关处于接通状态时进行一系列操作。
例如,该一系列操作例如适用于在摄像设备100中拍摄运动图像时,作为摄像设备100的用户或所有者的“人物A”发出“我也想把这个示出给祖母”等的情况。在这种情况下,摄像设备100例如可以将在包括人物A进行发声的时间点的预定时间段内拍摄的运动图像发送到用户或所有者是“人物B”(其是人物A的祖母并被称为“祖母”)的摄像设备200。
在步骤S201中,CPU 1003根据用户(例如,所有者)对操作单元1023的摄像开始指令操作来开始运动图像的拍摄和音频的获得。
在步骤S202中,CPU 1003开始运动图像记录处理和音频获得处理。在运动图像记录处理中,通过摄像单元1008以所设置的帧频来连续地拍摄图像,并且所获得的图像信号由运动图像编码单元1013编码,并且经由RAM总线1005和RAM控制单元1007作为运动图像数据存储在RAM 1006中。并行地,CPU 1003通过麦克风控制单元1018从麦克风1017获得音频数据,通过音频编码/解码单元1019对所获得的音频数据进行编码,并将该音频数据作为与运动图像数据相关联的音频数据存储在RAM 1006中。CPU 1003将存储在RAM 1006中的运动图像数据和音频数据作为诸如MPEG4等的单个运动图像文件经由存储控制单元1014存储在存储单元1016中。连续执行该一系列的运动图像记录处理和音频获得处理,直到存在摄像设备100的用户(例如,所有者)的摄像结束指令操作为止。当CPU 1003接收到用户(例如,所有者)对操作单元1023的运动图像拍摄结束指令操作时,处理从步骤S202进入到步骤S203。
在步骤S203中,CPU 1003结束运动图像记录处理和音频获得处理。CPU 1003还结束运动图像和音频的获得。在步骤S204中,人物提取单元1040通过对音频执行语音识别处理来提取用于指示该音频中所包括的人物的表达(例如,人物名称)。在步骤S205中,CPU1003判断用于指示在步骤S204中所提取的人物的表达(例如,人物名称)是否与用于指示特定人物的预先登记的表达(例如,诸如“祖母”等的人物名称)一致。例如,CPU 1003判断用于指示所有者登记单元1024预先登记在RAM 1006中作为运动图像文件的发送目的地的特定人物的表达是否与所提取的用于指示人物的表达一致。当CPU 1003判断为所提取的信息与所登记的信息一致时,处理进入到步骤S206;否则,一系列操作结束。
在步骤S206中,将运动图像文件经由通信单元1022发送到摄像设备200。更具体地,CPU 1003通过参考所有者登记单元1024中所登记的信息,向与用于指示特定人物的表达相关联的发送目的地发送运动图像文件。此时,CPU 1003将在包括提取用于指示特定人物的表达的时间点的预定时间段内拍摄的运动图像发送到摄像设备200作为与发声的音频相关的运动图像。CPU 1003可以将多个运动图像发送到摄像设备200作为在预定时间段内拍摄的运动图像。
因此,在上述一系列操作中,在进行摄像设备100的运动图像拍摄处理时,在从发声的音频中提取用于指示特定人物的表达的情况下,可以将运动图像文件发送到摄像设备200。
在上述一系列操作中,CPU 1003在向摄像设备200发送所拍摄的运动图像之前,例如可以通过显示或音频向摄像设备100的用户询问是否向摄像设备200发送运动图像。在这种情况下,CPU 1003响应于接收到来自用户的用于指示向摄像设备200发送所拍摄的运动图像的响应,向摄像设备200发送所拍摄的运动图像。CPU 1003可以经由操作单元1023接收来自用户的响应,或者经由麦克风1017以音频接收该响应。当CPU 1003接收到来自用户的用于指示不进行发送的响应时,可以在不发送运动图像文件的情况下终止处理。
(摄像设备200中的从运动图像的播放到所拍摄的运动图像的发送的一系列操作)
接下来,将参考图3描述摄像系统1的摄像设备200中的从运动图像的播放到所拍摄的运动图像的发送的一系列操作(用于从摄像设备100接收运动图像文件并播放该运动图像文件、并进一步向摄像设备100发送运动图像的操作)。图3所示的一系列操作例如通过CPU 2003将存储单元2016或(未示出的)非易失性存储器中所存储的程序展开到RAM 2006中并执行该程序来实现。此外,当摄像设备200的(未示出的)电源开关处于接通状态时,进行该一系列操作。此外,该一系列操作例如适用于摄像设备200播放从摄像设备100接收到的运动图像、然后拍摄作为摄像设备200的用户或所有者的“人物B”(“祖母”)的状态、并将所拍摄的运动图像发送到摄像设备100的情况。
在步骤S301中,CPU 2003经由通信单元2022接收从摄像设备100发送的运动图像文件。在步骤S302中,CPU 2003再现在步骤S301中接收到的运动图像文件,并将该运动图像文件输出到显示单元2015和扬声器2020。此时,例如,根据CPU 2003的指令,通过摄像设备200的运动图像编码单元2013和音频编码/解码单元2019来对运动图像文件的运动图像数据和音频数据进行解码。
当CPU 2003输出运动图像文件使得运动图像文件被播放时,CPU 2003可以将用于指示运动图像文件已被播放的信息发送到作为运动图像文件的发送源的摄像设备100。摄像设备100的用户可以识别出在摄像设备200中已播放所发送的运动图像文件。
在步骤S303中,CPU 2003在从步骤S302中的重放开始起经过了预定时间段之后,在摄像设备200中开始运动图像的拍摄和音频的获得。通过由此在摄像设备200中进行运动图像的拍摄和音频的获得,可以拍摄包括摄像设备200的用户(例如,所有者)的运动图像,从而可以拍摄该用户观看正在播放的运动图像时的该用户的状态的图像。
运动图像的拍摄和音频的获得可以在其他定时开始。例如,CPU 2003可以在从运动图像文件的播放结束起的预定时间段之后开始运动图像的拍摄。可替换地,CPU 2003可以使所有者检测单元2050检测在摄像设备200的预定范围内的特定人物(与运动图像的发送目的地相关的用户),并且当检测到用户时拍摄运动图像。这使得可以更可靠地拍摄正观看运动图像的人物的状态的图像。
另外,CPU 2003例如可以通过显示或音频来询问是否拍摄运动图像,并响应于接收到来自用户的用于指示拍摄运动图像的响应而拍摄运动图像。来自用户的响应可以是经由操作单元2023的输入或者可以是通过音频的输入。当用户不希望在图像中被拍摄时,可以防止用户的状态被共享。当CPU 2003接收到来自用户的用于指示不拍摄运动图像的响应或者在预定时间段内没有接收到来自用户的用于指示拍摄运动图像的响应时,可以在不开始运动图像的拍摄的情况下终止处理。
在步骤S304中,CPU 2003开始运动图像记录处理和音频获得处理。可以与作为摄像设备100的操作的上述步骤S202中的操作类似地进行运动图像记录处理和音频获得处理。由此,CPU 2003将所获得的运动图像和音频作为诸如MPEG4等的单个运动图像文件经由存储控制单元2014存储在存储单元2016中。连续执行该一系列的运动图像记录处理和音频获得处理,直到存在摄像设备200的用户(例如,所有者)的摄像结束指令操作为止。当CPU2003接收到用户(例如,所有者)对操作单元2023的运动图像拍摄结束指令操作时,处理从步骤S304进入到步骤S305。在步骤S305中,CPU 2003结束运动图像的拍摄和音频的获得。另外,CPU 2003结束运动图像记录处理和音频获得处理。
在步骤S306中,CPU 2003将运动图像文件经由通信单元2022发送到摄像设备100。在这里所指示的示例中,当CPU 2003将运动图像文件发送到摄像设备100时,无条件发送该运动图像文件;然而,本发明不限于此。例如,CPU 2003询问是否向摄像设备100(作为所播放的运动图像的发送源的设备)发送所拍摄的运动图像。CPU 2003可以响应于接收到来自用户的用于指示发送所拍摄的运动图像的响应,向摄像设备100发送运动图像文件。来自用户的响应可以是经由操作单元2023的输入或者可以是通过音频的输入。当CPU 2003接收到来自用户的用于指示不进行发送的响应时,在没有发送运动图像文件的情况下终止处理。
如上所述,摄像设备200响应于从摄像设备100发送的运动图像文件的播放而开始运动图像的拍摄,并且向摄像设备100发送所拍摄的运动图像的文件。以这种方式,摄像设备200的用户可以通过容易的操作来将该用户观看摄像设备100所拍摄的运动图像时的该用户的状态发送到摄像设备100的用户。换句话说,摄像设备200可以在不费力的情况下发送对所接收到的运动图像的反应的运动图像。
当从摄像设备200发送了运动图像文件时,摄像设备100接收从摄像设备200发送的运动图像文件并播放该运动图像文件。
图4示出本实施例的摄像系统1的使用的示例。在图4所示的摄像系统1中,人物110在摄像设备100中被登记为用户(例如,所有者),并且人物210在摄像设备200中被登记为用户(例如,所有者)。例如,在“人物A”和“祖母”的上述示例中,人物110例如可以对应于“人物A”,并且人物210可以对应于“祖母”。首先,将摄像设备100所拍摄的运动图像文件从摄像设备100发送到摄像设备200,并在摄像设备200中播放该运动图像文件。此时,在摄像设备200中,通过播放运动图像来开始运动图像的拍摄,因此,可以对拍摄“祖母”正在观看运动图像的状态的运动图像进行拍摄。然后,所拍摄的运动图像被发送到“人物A”的摄像设备100。因此,“人物A”可以观看“祖母”正在观看“人物A”发送的运动图像的状态。以这种方式,人物110和人物210可以实现经由摄像设备100和200向彼此发送运动图像的通信。也就是说,可以促进来自摄像设备100的运动图像的共享以及运动图像的接收者的状态的共享(摄像设备200所拍摄的运动图像的共享)。
(第二实施例)
在第一实施例中,已经描述了显示单元2015是摄像设备200的一部分的情况。在本实施例中,将描述显示单元500存在于摄像设备200的外部的情况。例如,摄像设备200的外部的显示单元500可以是独立的显示设备,诸如电视机或监视器等。在以下描述中,将使用显示单元500是能够进行有线或无线通信的设备的情况作为示例进行描述。根据本实施例的摄像设备100和摄像设备200的配置可以与第一实施例中的配置类似。因此,对于与第一实施例中的上述配置相同或大致相同的配置,将分配相同的附图标记并将省略描述,并且将主要对不同点进行描述。
将参考图5描述根据第二实施例的摄像系统。如图5所示,在本实施例的示例中,显示单元500安装在摄像设备200的外部,并且在通过有线或无线通信从摄像设备200接收到运动图像之后,将该运动图像显示在显示面板上。
(摄像设备200中的从运动图像的播放到所拍摄的运动图像的发送的一系列操作)
接下来,将参考图6描述摄像系统1的摄像设备200中的从运动图像的播放到所拍摄的运动图像的发送的一系列操作(用于从摄像设备100接收运动图像文件并播放该运动图像文件、并进一步向摄像设备100发送运动图像的操作)。例如,通过CPU 2003将存储单元2016或(未示出的)非易失性存储器中所存储的程序展开在RAM 2006中并且执行该程序,来实现图6所示的一系列操作。
与第一实施例类似,摄像设备200的CPU 2003通过执行步骤S301来接收从摄像设备100发送的运动图像文件。
在步骤S601中,CPU 2003向显示单元500发送(输出)运动图像文件。在本实施例中,例如可以通过在显示单元500侧对运动图像文件进行解码来显示该运动图像文件。虽然使用CPU 2003将步骤S301中接收到的运动图像文件发送到显示单元500的情况作为示例进行了描述,但是可以采取配置,使得在摄像设备200侧对运动图像文件进行解码,并且将经解码的运动图像数据发送(输出)到显示单元500。
在步骤S602中,CPU 2003在从步骤S601中的运动图像文件的发送起经过了预定时间段之后,开始摄像设备200中的运动图像的拍摄和音频的获得。
此外,与第一实施例类似,CPU 2003通过执行从步骤S304到步骤S306的处理,将所拍摄的运动图像的文件发送到摄像设备100。然后CPU 2003终止该一系列操作。
即使以这种方式,摄像设备200的用户也可以通过容易的操作将该用户观看摄像设备100所拍摄的运动图像时的该用户的状态发送到摄像设备100的用户。换句话说,摄像设备200可以在不费力的情况下发送对所接收到的运动图像的反应的运动图像。在本实施例中,摄像设备200的用户可以在更适于观看的显示设备中播放运动图像。
在上述实施例中,已经使用将数字照相机用作摄像设备的示例的情况作为示例进行了描述。然而,例如可以是至少一个是如图7所示的智能电话700那样的形式。此外,这些设备中的至少一个设备可以是固定照相机或者可以是智能电话、游戏控制台、个人计算机、平板终端或显示设备等。
此外,在上述实施例中,已经使用记录运动图像的情况作为示例进行了描述;然而,对于记录静止图像的情况也可以进行类似的处理。当要处理静止图像时,在图2的步骤S202中获得的音频数据例如可以是来自静止图像的拍摄之前和之后的预定时间段的音频数据。
其他实施例
本发明的实施例还可以通过如下的方法来实现,即,通过网络或者各种存储介质将执行上述实施例的功能的软件(程序)提供给系统或装置,该系统或装置的计算机或是中央处理单元(CPU)、微处理单元(MPU)读出并执行程序的方法。
尽管已经参考示例性实施例描述了本发明,但是应当理解,本发明不限于所公开的示例性实施例。所附权利要求书的范围应符合最广泛的解释,以涵盖所有这样的修改以及等同的结构和功能。
Claims (17)
1.一种摄像设备,包括:
音频获得单元,其被配置为获得在所述摄像设备附近发生的发声的音频;
摄像单元,其被配置为拍摄图像;
控制单元,其被配置为控制图像发送,使得在所述发声的音频中包括用于指示特定人物的表达的情况下,所述控制单元将所拍摄的图像中的与所述发声的音频的获得相关的第一图像发送到与用于指示所述特定人物的表达相关联的外部设备;以及
接收单元,其被配置为从所述外部设备接收在所述外部设备中所拍摄的与所述第一图像的播放相关的第二图像。
2.根据权利要求1所述的摄像设备,还包括:
登记单元,其被配置为将用于指示所述特定人物的表达和用于将图像发送到所述外部设备的发送目的地的信息相关联地登记;以及
提取单元,其被配置为从所获得的发声的音频中提取用于指示人物的表达,
其中,在所述提取单元从所述发声的音频中提取了用于指示所述特定人物的表达的情况下,所述控制单元控制图像发送以将所述第一图像发送到与用于指示所述特定人物的表达相关联的所述发送目的地。
3.根据权利要求1所述的摄像设备,其中,
所述控制单元向所述摄像设备的用户询问是否将所述第一图像发送到所述外部设备,并且响应于接收到来自用户的用于指示将所述第一图像发送到所述外部设备的响应,所述控制单元控制图像发送以将所述第一图像发送到所述外部设备。
4.根据权利要求1所述的摄像设备,其中,
所述控制单元将在预定时间段内拍摄的一个或多于一个图像中的至少一个图像作为所述第一图像发送到所述外部设备,其中所述预定时间段包括判断为在所述发声的音频中包括用于指示所述特定人物的表达的时间点。
5.根据权利要求1所述的摄像设备,其中,
所述第二图像包括在图像中包含有所述特定人物的运动图像。
6.一种摄像设备,包括:
接收单元,其被配置为接收从外部设备发送到与用于指示特定人物的表达相关联的所述摄像设备的第一图像,所述第一图像是与包括用于指示所述特定人物的表达的发声的音频的获得相关联的图像;
输出单元,其被配置为将所述第一图像输出到显示单元,使得播放所述第一图像;以及
控制单元,其被配置为响应于所述第一图像的播放而拍摄第二图像,并且控制图像发送以将所拍摄的第二图像发送到所述外部设备。
7.根据权利要求6所述的摄像设备,其中,
所述输出单元将所述第一图像发送到所述摄像设备的外部的显示设备,使得所述第一图像显示在所述显示设备中。
8.根据权利要求6所述的摄像设备,其中,
在所述控制单元输出所述第一图像使得所述第一图像被播放的情况下,所述控制单元将用于指示所述第一图像被播放的信息发送到发送了所述第一图像的所述外部设备。
9.根据权利要求6所述的摄像设备,还包括:
检测单元,其被配置为检测在相对于所述摄像设备的预定范围中的所述特定人物,
其中,在检测到所述特定人物的情况下,所述控制单元拍摄所述第二图像。
10.根据权利要求6所述的摄像设备,其中,
所述控制单元询问是否拍摄所述第二图像,并且响应于接收到来自所述特定人物的用于指示拍摄所述第二图像的响应,所述控制单元拍摄所述第二图像。
11.根据权利要求6所述的摄像设备,其中,
所述控制单元在从所述第一图像的输出开始的时间点起的预定时间段之后拍摄所述第二图像。
12.根据权利要求6所述的摄像设备,其中,
所述控制单元在从所述第一图像的输出结束的时间点起的预定时间段之后拍摄所述第二图像。
13.根据权利要求6所述的摄像设备,其中,
所述控制单元询问是否将所拍摄的第二图像发送到发送了所述第一图像的所述外部设备,并且响应于接收到来自所述特定人物的用于指示发送所述第二图像的响应,所述控制单元将所述第二图像发送到所述外部设备。
14.根据权利要求6所述的摄像设备,其中,
所述第二图像包括在图像中包含有所述特定人物的运动图像。
15.一种摄像设备的控制方法,所述控制方法包括:
获得在所述摄像设备附近发生的发声的音频;
拍摄图像;
控制图像发送,使得在所述发声的音频中包括用于指示特定人物的表达的情况下,将所拍摄的图像中的与所述发声的音频的获得相关的第一图像发送到与用于指示所述特定人物的表达相关联的外部设备;以及
从所述外部设备接收在所述外部设备中所拍摄的与所述第一图像的播放相关的第二图像。
16.一种摄像设备的控制方法,所述控制方法包括:
接收从外部设备发送到与用于指示特定人物的表达相关联的所述摄像设备的第一图像,所述第一图像是与包括用于指示所述特定人物的表达的发声的音频的获得相关联的图像;
将所述第一图像输出到显示单元,使得播放所述第一图像;以及
响应于所述第一图像的播放而拍摄第二图像,并且控制图像发送以将所拍摄的第二图像发送到所述外部设备。
17.一种计算机可读存储介质,其包括指令,所述指令用于进行摄像设备的控制方法,所述控制方法包括:
获得在所述摄像设备附近发生的发声的音频;
拍摄图像;
控制图像发送,使得在所述发声的音频中包括用于指示特定人物的表达的情况下,将所拍摄的图像中的与所述发声的音频的获得相关的第一图像发送到与用于指示所述特定人物的表达相关联的外部设备;以及
从所述外部设备接收在所述外部设备中所拍摄的与所述第一图像的播放相关的第二图像。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022106439A JP2024005948A (ja) | 2022-06-30 | 2022-06-30 | 撮像装置、その制御方法及びプログラム |
JP2022-106439 | 2022-06-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117336596A true CN117336596A (zh) | 2024-01-02 |
Family
ID=86760292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310789685.1A Pending CN117336596A (zh) | 2022-06-30 | 2023-06-30 | 摄像设备及其控制方法和存储介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20240007742A1 (zh) |
EP (1) | EP4300288A1 (zh) |
JP (1) | JP2024005948A (zh) |
KR (1) | KR20240002919A (zh) |
CN (1) | CN117336596A (zh) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006003411A (ja) | 2004-06-15 | 2006-01-05 | Canon Inc | 情報処理装置 |
US9311525B2 (en) * | 2014-03-19 | 2016-04-12 | Qualcomm Incorporated | Method and apparatus for establishing connection between electronic devices |
KR20170091913A (ko) * | 2016-02-02 | 2017-08-10 | 삼성전자주식회사 | 영상 서비스 제공 방법 및 장치 |
-
2022
- 2022-06-30 JP JP2022106439A patent/JP2024005948A/ja active Pending
-
2023
- 2023-06-12 EP EP23178666.6A patent/EP4300288A1/en active Pending
- 2023-06-14 KR KR1020230075898A patent/KR20240002919A/ko active Search and Examination
- 2023-06-21 US US18/212,284 patent/US20240007742A1/en active Pending
- 2023-06-30 CN CN202310789685.1A patent/CN117336596A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2024005948A (ja) | 2024-01-17 |
US20240007742A1 (en) | 2024-01-04 |
EP4300288A1 (en) | 2024-01-03 |
KR20240002919A (ko) | 2024-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6240642B2 (ja) | イメージ撮影装置のイメージを提供する方法及びその装置 | |
KR101075826B1 (ko) | 촬상 장치 및 기억 장치 | |
JP5401420B2 (ja) | 撮像装置 | |
US8525886B2 (en) | Image processing apparatus and image processing method | |
JP2006270263A (ja) | 撮影システム | |
JP5838852B2 (ja) | 撮像システム、撮像装置、撮像方法及びプログラム | |
JP2009200621A (ja) | 画像送受信機能付き撮像装置 | |
JP5724592B2 (ja) | 撮像装置、撮像データ共有システム、及びプログラム | |
JP6319491B2 (ja) | 撮像装置及び制御方法 | |
JP2007228453A (ja) | 撮像装置、再生装置、プログラム、および記憶媒体 | |
JP2012151544A (ja) | 撮像装置及びプログラム | |
JP6583458B2 (ja) | 撮像装置及び制御方法 | |
CN117336596A (zh) | 摄像设备及其控制方法和存储介质 | |
JP2013118518A (ja) | 撮像装置 | |
JP5023932B2 (ja) | 撮像装置、シナリオによる画像撮影方法、およびプログラム | |
JP2006211570A (ja) | 撮影装置 | |
JP6583457B2 (ja) | 撮像装置及び制御方法 | |
JP7525222B2 (ja) | 遠隔会議システム、方法及びプログラム | |
JP6282136B2 (ja) | 撮像装置及びその制御方法 | |
KR20130101707A (ko) | 촬영장치, 전자 장치, 동영상 생성 방법 및 썸네일 표시 방법 | |
JP5561044B2 (ja) | 撮像装置、撮像方法及びプログラム | |
JP2014072642A (ja) | 動画像データ処理システム、動画像データ送信装置、及び動画像データ受信装置 | |
JP2023162709A (ja) | 撮像装置 | |
JP2008278351A (ja) | 撮影装置、被写体選択方法及び被写体選択プログラム | |
JP2012044267A (ja) | 撮像装置、被写体探索方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |