KR20240002919A - 촬상장치, 그 제어방법, 및 기억매체 - Google Patents

촬상장치, 그 제어방법, 및 기억매체 Download PDF

Info

Publication number
KR20240002919A
KR20240002919A KR1020230075898A KR20230075898A KR20240002919A KR 20240002919 A KR20240002919 A KR 20240002919A KR 1020230075898 A KR1020230075898 A KR 1020230075898A KR 20230075898 A KR20230075898 A KR 20230075898A KR 20240002919 A KR20240002919 A KR 20240002919A
Authority
KR
South Korea
Prior art keywords
image
imaging device
specific person
external device
voice
Prior art date
Application number
KR1020230075898A
Other languages
English (en)
Inventor
아키타카 요시자와
아야카 키노시타
Original Assignee
캐논 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 캐논 가부시끼가이샤 filed Critical 캐논 가부시끼가이샤
Publication of KR20240002919A publication Critical patent/KR20240002919A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/633Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/9201Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal
    • H04N5/9202Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal the additional signal being a sound signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Studio Devices (AREA)
  • Indication In Cameras, And Counting Of Exposures (AREA)

Abstract

촬상장치는 촬상장치의 주위에서 생기는 발화의 음성을 취득하고 촬영을 행한다. 이 장치는, 발화의 음성에 특정한 인물을 나타내는 표현이 포함되는 경우, 이 특정한 인물을 나타내는 표현과 관련된 외부 장치에, 촬영된 화상 중 발화의 음성의 취득과 관련되는 제1 화상을 송신하도록, 화상의 송신을 제어한다. 이 장치는, 외부 장치에서 촬영되고 제1 화상의 재생과 관련되는 제2 화상을, 외부 장치로부터 수신한다.

Description

촬상장치, 그 제어방법, 및 기억매체{IMAGE CAPTURING APPARATUS, CONTROL METHOD THEREOF, AND STORAGE MEDIUM}
본 발명은, 촬상장치, 그 제어방법 및 기억매체에 관한 것이다.
최근, 화상 등의 콘텐츠를 통신장치를 사용해서 친구나 친족에게 송신한 후 보고 즐긴다. 이러한 경우, 친구나 친족에게 화상을 송신하려고 시도할 때에는, 송신처와 화상을 선택한 후, 송신할 화상을 전자 메일 등에 첨부할 필요가 있어, 번거롭다.
일본국 특개 2006-003411호 공보에는, 입력된 음성에 음성 인식을 적용해서 상대편의 약칭을 인식하고, 인식한 약칭에 대응하는 목적지에 통화를 발신하는 기술이 제안되어 있다. 이러한 기술에서는, 원하는 상대편을 선택하는 수고가 경감될 수 있다.
그런데, 유저가 촬영 지시를 내리지 않고 정기적 및 계속적으로 촬영을 행하는 카메라가 개발되었다. 예를 들면, 실내의 임의의 장소에 카메라를 설치해서 자동으로 촬영함으로써, 일상의 평범한 풍경을 화상으로서 기록가능한 라이프로깅(lifelogging) 카메라가 알려져 있다. 이러한 카메라에 의해 기록된 화상을 친구나 친족과 공유하는 경우, 화상의 수취인의 상태에 따라 공유의 기쁨과 즐거움이 증대하는 경우가 있다.
본 발명은, 상기 과제를 감안해서 이루어진 것으로, 그 목적은, 원하는 상대와의 화상의 공유와 화상의 수취인의 상태의 공유를 용이하게 행할 수 있게 하는 기술을 실현하는 것이다.
상기한 과제를 해소하기 위해, 본 개시의 일면은, 촬상장치로서, 상기 촬상장치의 주위에서 생기는 발화의 음성을 취득하도록 구성된 음성 취득부와, 화상을 촬영하도록 구성된 촬상부과, 상기 발화의 음성에 특정한 인물을 나타내는 표현이 포함되는 경우, 상기 특정한 인물을 나타내는 표현과 관련된 외부 장치에, 촬영된 화상 중 상기 발화의 음성의 취득과 관련되는 제1 화상을 송신하도록, 화상의 송신을 제어하도록 구성된 제어부와, 상기 외부 장치에서 촬영되고 상기 제1 화상의 재생과 관련되는 제2 화상을, 상기 외부 장치로부터 수신하도록 구성된 수신부를 구비한 촬상장치를 제공한다.
본 개시의 또 다른 일면은, 촬상장치로서, 외부 장치로부터 특정한 인물을 나타내는 표현과 관련된 상기 촬상장치에 송신된 제1 화상으로서, 상기 특정한 인물을 나타내는 표현을 포함하는 발화의 음성의 취득과 관련되는 화상인 상기 제1 화상을 수신하도록 구성된 수신부와, 상기 제1 화상이 재생되도록 상기 제1 화상을 표시부에 출력하도록 구성된 출력부와, 상기 제1 화상의 재생에 따라 제2 화상을 촬영하고, 촬영한 상기 제2 화상을 상기 외부 장치에 송신하도록 화상의 송신을 제어하도록 구성된 제어부를 구비한 촬상장치를 제공한다.
본 개시의 또 다른 일면은, 촬상장치의 제어방법으로서, 상기 촬상장치의 주위에서 생기는 발화의 음성을 취득하는 단계와, 화상을 촬영하는 단계와, 상기 발화의 음성에 특정한 인물을 나타내는 표현이 포함되는 경우, 상기 특정한 인물을 나타내는 표현과 관련된 외부 장치에, 촬영된 화상 중 상기 발화의 음성의 취득과 관련되는 제1 화상이 송신되도록, 화상의 송신을 제어하는 단계와, 상기 외부 장치에서 촬영되고 상기 제1 화상의 재생과 관련되는 제2 화상을, 상기 외부 장치로부터 수신하는 단계를 포함하는 제어방법을 제공한다.
본 개시의 또 다른 일면은, 촬상장치의 제어방법으로서, 외부 장치로부터 특정한 인물을 나타내는 표현과 관련된 상기 촬상장치에 송신된 제1 화상으로서, 상기 특정한 인물을 나타내는 표현을 포함하는 발화의 음성의 취득과 관련되는 화상인 상기 제1 화상을 수신하는 단계와, 상기 제1 화상이 재생되도록 상기 제1 화상을 표시부에 출력하는 단계와, 상기 제1 화상의 재생에 따라 제2 화상을 촬영하고, 촬영한 상기 제2 화상을 상기 외부 장치에 송신하도록, 화상의 송신을 제어하는 단계를 포함하는 제어방법을 제공한다.
본 개시의 또 다른 일면은, 촬상장치의 주위에서 생기는 발화의 음성을 취득하는 단계와, 화상을 촬영하는 단계와, 상기 발화의 음성에 특정한 인물을 나타내는 표현이 포함되는 경우, 상기 특정한 인물을 나타내는 표현과 관련된 외부 장치에, 촬영된 화상 중 상기 발화의 음성의 취득과 관련되는 제1 화상이 송신되도록, 화상의 송신을 제어하는 단계와, 상기 외부 장치에서 촬영되고 상기 제1 화상의 재생과 관련되는 제2 화상을, 상기 외부 장치로부터 수신하는 단계를 포함하는 상기 촬상장치의 제어방법을 행하기 위한 명령들을 포함하는 컴퓨터 판독가능한 기억매체를 제공한다.
본 발명에 따르면, 원하는 상대와의 화상의 공유와 화상의 수취인의 상태의 공유를 용이하게 행하는 것이 가능해진다.
본 발명의 또 다른 특징은 (첨부도면을 참조하는) 이하의 실시형태의 설명으로부터 명백해질 것이다.
도1a 및 도1b는 실시형태 1에 따른 촬상 시스템(1)의 구성예를 나타낸 블록도이다.
도2는 실시형태 1에 따른 촬상장치 100에 있어서의 동화상의 촬영 및 송신에 관한 일련의 동작을 나타내는 플로우차트이다.
도3은 실시형태 1에 따른 촬상장치 200의 동화상 재생으로부터 촬영 동화상의 송신의 일련의 동작을 나타내는 플로우차트이다.
도4는 실시형태 1에 따른 촬상 시스템(1)의 사용예를 설명하는 도면이다.
도5는 실시형태 2에 따른 촬상 시스템(1)의 사용예를 설명하는 도면이다.
도6은 실시형태 2에 따른 촬상장치 200의 동화상 재생으로부터 촬영 동화상의 송신의 일련의 동작을 나타내는 플로우차트이다.
도7은 촬상 시스템(1)의 다른 예를 설명하는 도면이다.
(실시형태1)
이하, 첨부도면을 참조해서 실시형태를 상세히 설명한다. 이때, 이하의 실시형태는 청구범위에 관한 발명을 한정하는 것은 아니다. 실시형태에는 복수의 특징이 기재되어 있지만, 이들 복수의 특징의 모두가 발명에 필수적인 것은 아니고, 또한, 복수의 특징은 임의로 조합되어도 된다. 더구나, 첨부도면에 있어서는, 동일 혹은 유사한 구성에 동일한 참조번호를 붙이고, 중복한 설명은 생략한다.
(촬상 시스템의 구성예)
도1a 및 도1b를 참조하여, 실시형태 1에 따른 촬상 시스템(1)에 대해 설명한다. 촬상 시스템(1)은, 촬상장치 100과 200을 포함한다. 본 실시형태의 설명에서는, 촬상장치 100과 촬상장치 200 사이에서 동화상을 송신하는 경우를 예로 들어 설명하지만, 본 실시형태는, 촬상장치 100과 촬상장치 200 사이에서 화상(즉 정지 화상 또는 동화상)을 송신하는 경우에도 적용가능하다. 또한, 일례로서, 촬상장치 100 및 촬상장치 200이 휴대가능한 디지털 카메라인 경우를 설명한다.
우선, 촬상장치 100의 기능 구성예에 대해 설명한다. 렌즈 1001은, 줌 렌즈 및 포커스 렌즈를 포함하는 렌즈 군이다. 렌즈 1001은, 교환 렌즈에 포함되어도 된다. 렌즈 제어부 1002는, 인식부 1011에 의해 추출된 피사체 정보에 근거하여, 렌즈 1001의 초점거리와 조리개의 상태를 제어하는 기능을 갖는다.
CPU 1003은, 예를 들면, 1개 이상의 프로세서를 포함하고, 예를 들면, 중앙연산처리장치다. CPU 1003은, 예를 들면, 기록부 1016 또는 불휘발성 메모리(미도시)에 기록되어 있는 프로그램을 후술하는 랜덤 액세스 메모리(RAM) 1006에 전개하고 이 프로그램을 실행함으로써, 촬상장치 100 전체의 동작을 제어한다. 또한, CPU 1003은, 도2를 참조해서 후술하는 촬상장치 100의 동작을 실행한다. CPU 버스 1004는 CPU 1003과 각 기능 블록 사이의 통신을 제어한다. 이하에서 설명하는 촬상장치 100의 각 부의 구성(예를 들면, 인식부 1011, 동화상 부호화부 1013, 인물 추출부(1040) 등)은, CPU 1003이 프로그램을 실행함으로써 실현되어도 된다.
RAM 제어부 1007은, 각 기능 블록으로부터의 RAM 액세스 요구에 근거하여, RAM 1006에 액세스하는 제어를 행한다. RAM 버스 1005는, RAM 제어부 1007과 각 기능 블록 사이의 통신을 제어한다. RAM 버스 1005는 각 기능 블록으로부터 RAM 1006에의 액세스를 조정하는 기능도 갖는다.
촬상부 1008은, 렌즈 1001을 통해 입사한 빛을 전기신호로 변환하는 촬상 소자를 포함한다. 촬상 소자가 소정의 간격으로 순차 화상신호를 출력함으로써 동화상 데이터가 형성된다. 촬상부 1008은, 얻어진 동화상 데이터에 대하여 렌즈 수차를 보정하는 기능과, 촬영 센서의 결함 화소를 보간하는 기능을 포함한다.
현상부 1009는, 촬상부 1008에서 생성한 동화상 데이터에 대해 디베이어(DeBayer) 처리를 실시하여, 휘도신호와 색차신호로 이루어진 신호로 동화상 데이터를 변환하고, 각 신호에 포함되는 노이즈 제거, 광학적인 왜곡의 보정과, 화상의 적정화 등의 현상 처리를 행한다. 평가부 1010은, 촬상부 1008에서 생성한 동화상 데이터에 근거하여, 포커스 상태, 노출 상태 등의 평가값을 산출하는 평가값 산출처리를 행한다.
인식부 1011은, 현상부 1009에 의해 현상 처리가 행해진 동화상 데이터 내의 피사체 정보를 검출 및 인식하여 피사체 정보를 생성하는 인식 처리를 행한다. 예를 들면, 인식부 1011은, 동화상 데이터 내의 얼굴을 검출하는 처리를 실행하고, 얼굴을 검출한 경우에는, 얼굴의 위치를 나타내는 정보를 출력한다. 인식부 1011은, 얼굴 등의 특징정보에 근거해서 특정한 인물의 인증 등을 더 행한다.
제어부 1012는, 현상부 1009에 의해 현상 처리가 행해진 동화상 데이터를, 소정의 표시 처리(예를 들면, 표시부 1015의 표시 패널의 특성에 따른 변환, 그래픽스의 중첩 등)를 행한 후, 표시부 1015에 출력한다. 표시부 1015는, 예를 들면, 액정 패널로 구성되고, 재생된 동화상 데이터를 표시한다. 표시부 1015는, 예를 들면, 촬상장치 100에 내장된다. 그러나, 표시부 1015는, 촬상장치 100의 외부에 배치되어, 촬상장치 100에 예를 들면 유선을 거쳐 접속되도록 구성되어도 된다.
동화상 부호화부 1013은, 현상부 1009에 의해 현상 처리가 행해진 동화상 데이터를 MPEG4 Video 등의 소정의 동화상 압축 부호화 방식을 사용해서 압축 부호화하여, 정보량이 압축된 동화상 파일로 변환하는 처리를 행한다. 동화상 부호화부 1013은, 동화상 데이터를 압축해서 동화상 파일로 변환하는 처리 이외에, 통신부 2022를 거쳐 외부에서 동화상 파일을 수신한 경우에 이 동화상 파일을 복호화하는 기능을 겸비해도 된다.
기록 제어부 1014는, 현상부 1009에 의해 현상 처리가 행해진 동화상 데이터를 기록부 1016에 기록하는 기록 제어 처리를 행한다. 기록부 1016은, 예를 들면, 불휘발성의 기억매체를 포함하고, 예를 들면, 메모리 카드나 하드 디스크를 포함하여도 된다. 기록부 1016은, 예를 들면, 촬상장치 100에 내장된다. 그러나, 기록부 1016은 촬상장치 100에 대해 착탈 가능하게 구성되어도 된다.
마이크 1017은, 음성을 음성신호로 변환한다. 마이크 1017은, 예를 들면, 촬상장치 100에 대해 착탈 가능하게 구성되어도 된다. 그러나, 마이크 1017은 촬상장치 100에 내장되어도 된다. 마이크 제어부 1018은, 마이크 1017과 접속하여, 마이크 1017의 제어, 수음의 개시 및 정지, 수음된 음성 데이터의 취득 등을 행한다. 마이크 1017의 제어는, 예를 들면 게인 조정, 상태 취득 등이다.
음성 부호/복호화부 1019는, 마이크 1017에서 입력된 음성신호를 취득하고, MPEG4 Audio AAC 등의 소정의 부호화 방식으로 음성신호를 부호화 혹은 복호화한다. 스피커 1020은, 음성 부호/복호화부 1019에 의해 복호화된 음성신호를 재생한다. 스피커 1020은, 예를 들면, 촬상장치 100에 대해 착탈 가능하게 구성되지만, 촬상장치 100에 내장되어도 된다.
인물 추출부(1040)는, 마이크 1017에 의해 수음한 음성 데이터로부터 인물명을 추출한다. 예를 들면, 인물 추출부(1040)는, 촬상장치 100의 주위에서 생기는 유저의 발화의 음성을 음성 데이터로서 취득하면, 예를 들면, 기계학습 모델을 사용하는 공지의 음성인식 기술에 의해, 유저의 발화의 음성으로부터 인물을 나타내는 표현을 추출한다. 여기에서 추출되는 인물을 나타내는 표현은, "인물 A" 등의 인물의 이름, "할머니" 등의 호칭이나 닉네임 등을 포함하여도 된다.
통신부 1022는, 유선 또는 무선에 의해 촬상장치 100과 다른 장치를 접속하여, 동화상 파일 등을 송수신하는 통신 인터페이스이며, 무선 로컬 에어리어 네트워크(LAN)나 인터넷 등의 네트워크에 접속할 수 있다. 통신부 1022는 촬상장치 100에서 취득된 동화상 파일과 기록부 1016에 기록되어 있는 동화상 파일을 외부 장치에 송신할 수 있고, 외부 장치로부터 동화상 파일 및 각종 정보를 수신할 수 있다.
조작부 1023은, 촬상장치 100의 각종 설정을 행하기 위한, 유저(예를 들면, 촬상장치 100의 소유자)로부터의 다양한 조작을 접수한다.
소유자 등록부 1024는, 동화상 파일의 송신처(예를 들면, 촬상장치 200 등의 외부 장치의 소유자)를 RAM 1006에 등록한다. 소유자 등록부 1024는, 외부 장치의 소유자의 정보로서, 예를 들면, "할머니" 등의 특정한 인물을 나타내는 표현을 등록해도 된다. 소유자 등록부 1024는, 동화상을 외부 장치에 송신하기 위한 송신처의 정보를 특정한 인물을 나타내는 표현과 관련시켜 등록한다. 동화상을 외부 장치에 송신하기 위한 송신처의 정보는, 특정한 인물에 대응하는 e-메일 어드레스, 소정의 서비스의 어카운트, 및 외부 장치의 IP 어드레스 등, 다양한 정보이어도 된다. 이러한 정보에 따라, 촬상장치 100은, 인물 추출부(1040)에 의해 발화의 음성으로부터 특정한 인물을 나타내는 표현이 추출된 경우에, 추출된 특정한 인물을 나타내는 표현(예를 들면, "할머니")과 관련된 송신처에 동화상을 송신할 수 있다.
다음에, 촬상장치 200에 대해 설명한다. 촬상장치 200은 렌즈 2001 내지 소유자 등록부 2024를 구비한다. 렌즈 2001 내지 소유자 등록부 2024는, 각각 촬상장치 100의 렌즈 1001 내지 소유자 등록부 1024와 유사하다.
소유자 검출부(2050)는, 촬상장치 200으로부터 소정의 범위 내에 있는 특정한 인물(예를 들면, 촬상장치 200의 소유자)을 검출한다. 소유자 검출부(2050)는, 예를 들면, 촬상부 2008을 사용해서 화상을 촬영하고, 촬영한 화상으로부터 특정한 인물을 검출한다.
(촬상장치 100에 있어서의 동화상의 촬영 및 송신에 대한 일련의 동작)
다음에, 도2를 참조하여, 촬상 시스템(1)의 촬상장치 100에 있어서의 동화상의 촬영 및 송신에 관한 일련의 동작(촬상장치 100이 동화상을 촬영한 후 촬상장치 200에 촬영한 동화상을 송신하는 동작)에 대해 설명한다. 도2에 나타내는 일련의 동작은, CPU 1003이, 예를 들면, 기록부 1016 또는 불휘발성 메모리(미도시)에 기록되어 있는 프로그램을 RAM 1006에 전개하고, 이 프로그램을 실행함으로써 실현된다. 또한, 일련의 동작은, 촬상장치 100의 전원 스위치(미도시)가 on 상태일 때에 실행된다.
이 일련의 동작은, 예를 들면, 촬상장치 100에 있어서의 동화상의 촬영시에, 촬상장치 100의 유저 또는 소유자인 "인물 A"가 "할머니에게도 보여 주고 싶네" 등을 발화한 경우에 적용된다. 이러한 경우에, 촬상장치 100은, 예를 들면, "인물 B"(인물 A의 조모이며 "할머니"로 불린다)가 유저 또는 소유자인 촬상장치 200에, 인물 A가 발화한 시점을 포함하는 소정의 시간 내에 촬영된 동화상을 송신할 수 있다.
스텝 S201에서는, CPU 1003은, 조작부 1023에 대한 유저(예를 들면, 소유자)의 촬영 개시 지시 조작에 따라 동화상의 촬영과 음성의 취득을 개시한다.
스텝 S202에서는, CPU 1003은, 동화상 기록 처리 및 음성 취득 처리를 개시한다. 동화상 기록 처리에서는, 설정된 프레임 레이트에서 촬상부 1008에 의해 연속적으로 촬영을 행하고, 취득한 화상신호를 동화상 부호화부 1013에 의해 부호화하고, 동화상 데이터로서 RAM 버스 1005 및 RAM 제어부 1007을 거쳐 RAM 1006에 기록한다. 이와 병행하여, CPU 1003은, 마이크 제어부 1018에 의해 마이크 1017로부터의 음성 데이터의 취득을 행하고, 취득한 음성 데이터를 음성 부호/복호화부 1019에 의해 부호화하여, 이 음성 데이터를 동화상 데이터와 관련된 음성 데이터로서 RAM 1006에 기록한다. CPU 1003은, RAM 1006에 기록된 동화상 데이터 및 음성 데이터를, MPEG4 등의 1개의 동화상 파일로서 기록 제어부 1014를 통해 기록부 1016에 기록한다. 이 일련의 동화상 기록 처리 및 음성 취득 처리는, 촬상장치 100의 유저(예를 들면, 소유자)에 의한 촬영 종료 지시 조작이 있을 때까지 계속해서 실행된다. CPU 1003이 조작부 1023에 대한 유저(예를 들면, 소유자)의 동화상 촬영 종료 지시 조작을 접수하면, 스텝 S202로부터 스텝 S203으로 처리를 진행한다.
스텝 S203에서는, CPU 1003은, 동화상 기록 처리 및 음성 취득 처리를 종료한다. 또한, CPU 1003은, 동화상 및 음성의 취득도 종료한다. 스텝 S204에서는, 인물 추출부(1040)가 음성에 대한 음성 인식 처리를 실행하여, 이 음성에 포함되는 인물을 나타내는 표현(예를 들면, 인물명)을 추출한다. 스텝 S205에서는, CPU 1003은, 스텝 S204에서 추출한 인물을 표현하는 표현(예를 들면, 인물명)이 미리 등록되어 있는, 특정한 인물을 나타내는 표현(예를 들면, "할머니" 등의 인물명)과 일치하는지를 판정한다. 예를 들면, CPU 1003은, 소유자 등록부 1024에 의해 동화상 파일의 송신처로서 사전에 RAM 1006에 등록되어 있는 특정한 인물을 나타내는 표현이 추출된 인물을 나타내는 표현과 일치하는지를 판정한다. CPU 1003이, 이들 추출한 정보가 등록되어 있는 정보와 일치한다고 판정한 경우에는 스텝 S206으로 처리를 진행하고, 그렇지 않을 경우에는, 이 일련의 동작을 종료한다.
스텝 S206에서는, 동화상 파일을 촬상장치 200에 통신부 1022를 거쳐 송신한다. 더욱 구체적으로는, CPU 1003은, 소유자 등록부 1024에서 등록된 정보를 참조하여, 특정한 인물을 나타내는 표현과 관련된 송신처에, 동화상 파일을 송신한다. 이때, CPU 1003은, 특정한 인물을 나타내는 표현이 추출된 시점을 포함하는 소정의 시간 내에 촬영된 동화상을, 발화의 음성과 관련된 동화상으로서 촬상장치 200에 송신한다. CPU 1003은, 이 소정의 시간 내에 촬영된 동화상으로서, 복수의 동화상을 촬상장치 200에 송신해도 된다.
이와 같이, 상기한 일련의 동작에서는, 촬상장치 100의 동화상의 촬영 처리시에는, 발화의 음성으로부터 특정한 인물을 나타내는 표현이 추출된 경우에 촬상장치 200에 동화상 파일을 송신할 수 있다.
전술한 일련의 동작에 있어서, CPU 1003은, 촬상장치 200에 동화상 파일을 송신하기 전에, 촬영한 동화상을 촬상장치 200에 송신할 것인가 아닌가에 대해, 예를 들면, 표시나 음성에 의해, 촬상장치 100의 유저에게 문의해도 된다. 이 경우, CPU 1003은, 촬영한 동화상을 촬상장치 200에 송신할 것을 나타내는 유저로부터의 응답에 따라, 촬영한 동화상을 촬상장치 200에 송신한다. CPU 1003은, 이 유저로부터의 응답을, 조작부 1023을 거쳐 접수하거나, 마이크 1017을 통해 음성으로 접수해도 된다. CPU 1003이, 송신을 행하지 않을 것을 나타내는 유저로부터의 응답을 접수한 경우, 동화상 파일을 송신하지 않고 처리를 종료해도 된다.
(촬상장치 200에 있어서의 동화상 재생으로부터 촬영된 동화상의 송신에 대한 일련의 동작)
다음에, 도3을 참조하여, 촬상 시스템(1)의 촬상장치 200에 있어서의 동화상 재생으로부터 촬영된 동화상의 송신에 대한 일련의 동작(촬상장치 100으로부터 동화상 파일을 수신해서 이 동화상 파일을 재생하고, 더구나 촬상장치 100에 동화상을 송신하는 동작)에 대해 설명한다. 도3에 나타내는 일련의 동작은, CPU 2003이, 예를 들면, 기록부 2016 또는 불휘발성 메모리(미도시)에 기록되어 있는 프로그램을 RAM 2006에 전개하고, 이 프로그램을 실행함으로써 실현된다. 또한, 이 일련의 동작은, 촬상장치 200의 전원 스위치(미도시)가 on 상태일 때에 실행된다. 또한, 이 일련의 동작은, 예를 들면, 촬상장치 200이 촬상장치 100으로부터 수신한 동화상을 재생한 후에, 촬상장치 200의 유저 또는 소유자인 "인물 B"("할머니")의 상태를 촬영하고, 촬영한 동화상을 촬상장치 100에 송신하는 경우에 적용된다.
스텝 S301에서는, CPU 2003은, 촬상장치 100으로부터 송신된 동화상 파일을 통신부 2022를 통해 수신한다. 스텝 S302에서는, CPU 2003은, 스텝 S301에서 수신한 동화상 파일을 재생하고, 표시부 2015 및 스피커 2020에 동화상 파일을 출력한다. 이때, 예를 들면, CPU 2003의 지시에 따라, 촬상장치 200의 동화상 부호화부 2013 및 음성 부호/복호화부 2019에 의해 동화상 파일의 동화상 데이터 및 음성 데이터의 복호화가 행해진다.
CPU 2003이 동화상 파일이 재생되도록 동화상 파일을 출력한 경우에, CPU 2003은 이 동화상 파일이 재생된 것을 나타내는 정보를, 동화상 파일의 송신원인 촬상장치 100에 송신해도 된다. 촬상장치 100의 유저는, 송신한 동화상 파일이 촬상장치 200에서 재생된 것을 인식할 수 있다.
스텝 S303에서, CPU 2003은, 스텝 S302의 재생 개시로부터 소정 시간이 경과한 후에 촬상장치 200에 있어서 동화상의 촬영과 음성의 취득을 개시한다. 이와 같이 촬상장치 200에 있어서 동화상의 촬영과 음성의 취득을 행함으로써, 촬상장치 200의 유저(예를 들면, 소유자)가 포함되는 동화상을 촬영할 수 있고, 이에 따라, 유저가 재생되고 있는 동화상을 시청할 때의 유저의 상태를 촬영할 수 있다.
동화상의 촬영과 음성의 취득의 개시는 다른 타이밍에 행해져도 된다. 예를 들면, CPU 2003은, 동화상 파일의 재생 종료로부터 소정 시간 후에 동화상의 촬영을 개시해도 된다. 이와 달리, CPU 2003은, 촬상장치 200의 소정의 범위 내에 있는 특정한 인물(동화상의 송신처에 관련된 유저)을 소유자 검출부(2050)에게 검출하게 하고, 유저가 검출된 경우에, 동화상을 촬영하여도 된다. 이에 따라, 이 동화상을 시청하는 인물의 상태를 더욱 확실하게 촬영할 수 있다.
또한, CPU 2003은, 동화상을 촬영할 것인지 아닌지를, 예를 들면, 표시나 음성에 의해 문의하고, 동화상을 촬영할 것을 나타내는 유저로부터의 응답의 수신에 따라, 동화상을 촬영하여도 된다. 유저로부터의 응답은 조작부 2023을 통한 입력이어도 되고, 또는 음성에 의한 입력이어도 된다. 유저가 촬영되는 것을 원하지 않는 경우에, 유저의 상태가 공유되는 것을 방지할 수 있다. CPU 2003이 동화상을 촬영하지 않는 것을 나타내는 유저로부터의 응답을 접수하거나, 또는 동화상을 촬영하는 것을 나타내는 유저로부터의 응답을 소정 시간 이내에 접수하지 않은 경우, 동화상의 촬영을 개시하지 않고 처리를 종료해도 된다.
스텝 S304에서는, CPU 2003은, 동화상 기록 처리 및 음성 취득 처리를 개시한다. 이 동화상 기록 처리 및 음성 취득 처리는, 촬상장치 100의 동작으로서 전술한 스텝 S202에 있어서의 동작과 마찬가지로 행해져도 된다. 이에 따라, CPU 2003은, 취득한 동화상 및 음성을, MPEG4 등의 1개의 동화상 파일로서 기록 제어부 2014를 거쳐 기록부 2016에 기록한다. 이 일련의 동화상 기록 처리 및 음성 취득 처리는, 촬상장치 200의 유저(예를 들면, 소유자)에 의한 촬영 종료 지시 조작이 있을 때까지 계속해서 실행된다. CPU 2003이, 조작부 2023에 대한 유저(예를 들면, 소유자)의 동화상 촬영 종료 지시 조작을 접수하면, 스텝 S304로부터 스텝 S305로 처리가 진행한다. 스텝 S305에서, CPU 2003은, 동화상의 촬영 및 음성의 취득을 종료한다. 또한, CPU 2003은 동화상 기록 처리 및 음성 취득 처리를 종료한다.
스텝 S306에서, CPU 2003은, 촬상장치 100에 통신부 2022를 거쳐 동화상 파일을 송신한다. 여기에서 나타내는 예에서는, CPU 2003이 촬상장치 100에 동화상 파일을 송신할 때, 동화상 파일이 무조건 송신되지만, 본 발명은 이것에 한정되지 않는다. 예를 들면, CPU 2003은, 촬영한 동화상을 촬상장치 100(재생한 동화상의 송신원인 장치)에 송신할 것인지에 대해 문의한다. CPU 2003은, 촬영한 동화상을 송신할 것을 나타내는 유저로부터의 응답을 접수한 것에 따라, 동화상 파일을 촬상장치 100에 송신하여도 된다. 유저로부터의 응답은, 조작부 2023을 거친 입력이거나, 또는 음성에 의한 입력이어도 된다. CPU 2003이, 송신을 행하지 않을 것을 나타내는 유저로부터의 응답을 접수한 경우에는, 동화상 파일을 송신하지 않고 처리가 종료한다.
이와 같이, 촬상장치 200은, 촬상장치 100으로부터 송신된 동화상 파일의 재생에 따라 동화상의 촬영을 개시하고, 촬영한 동화상 파일을 촬상장치 100에 송신한다. 이와 같이, 촬상장치 200의 유저는, 용이한 조작에 의해 유저가 촬상장치 100에 의해 촬영된 동화상을 볼 때의 상태를, 촬상장치 100의 유저에게 송신할 수 있다. 바꾸어 말하면, 촬상장치 200은, 수신한 동화상에 대한 반응의 동화상을 힘들이지 않고 송신할 수 있다.
촬상장치 200으로부터 동화상 파일이 송신되면, 촬상장치 100은, 촬상장치 200으로부터 송신된 동화상 파일을 수신하여, 이 동화상 파일을 재생한다.
도4는, 본 실시형태의 촬상 시스템(1)의 사용예를 나타내고 있다. 도4에 나타내는 촬상 시스템(1)에서는, 촬상장치 100에 있어서 인물 110이 유저(예를 들면, 소유자)로서 등록되어 있고, 촬상장치 200에 있어서 인물 210이 유저(예를 들면, 소유자)로서 등록되어 있다. 예를 들면, 전술한 "인물 A"와 "할머니"의 예에서는, 예를 들면, 인물 110이 "인물 A"에 대응하고, 인물 210이 "할머니"에 대응할 수 있다. 우선, 촬상장치 100에서 촬영된 동화상 파일이 촬상장치 100으로부터 촬상장치 200에 송신되고, 촬상장치 200에 있어서 재생된다. 이때, 촬상장치 200에서는, 동화상이 재생됨으로써 동화상의 촬영이 개시되므로, "할머니"가 동화상을 보는 상태를 촬영한 동화상을 촬영할 수 있다. 촬영된 동화상은, 그후, "인물 A"의 촬상장치 100에 송신된다. 이 때문에, "인물 A"는, "인물 A"가 송신한 동화상을 시청하는 "할머니"의 상태를 볼 수 있다. 이와 같이 함으로써, 인물 110과 인물 210은, 촬상장치 100과 200을 통해 서로 동화상을 보내는 커뮤니케이션을 실현할 수 있다. 즉, 촬상장치 100으로부터의 동화상의 공유와, 이 동화상의 수취인의 상태의 공유(촬상장치 200에 의해 촬영된 동화상의 공유)를 용이하게 행할 수 있다.
(실시형태2)
실시형태 1에서는, 표시부 2015가 촬상장치 200의 일부인 경우를 설명하였다. 본 실시형태에서는, 촬상장치 200의 외부에 표시부(500)가 존재하는 경우에 대해 설명한다. 촬상장치 200의 외부의 표시부(500)는, 예를 들면, 텔레비전이나 모니터 등의 독립된 표시장치이어도 된다. 이하의 설명에서는, 표시부(500)가 유선 또는 무선통신이 가능한 장치인 경우를 예로 들어 설명한다. 본 실시형태에 따른 촬상장치 100과 촬상장치 200의 구성은, 실시형태 1의 구성과 유사할 수 있다. 따라서, 실시형태 1에서 전술한 구성과 동일 또는 실질적으로 동일한 구성에 대해서는 동일한 참조번호를 붙이고 그 설명을 생략하고, 차이점에 대해 중점적으로 설명한다.
도5를 참조하여, 실시형태 2에 따른 촬상 시스템에 대해 설명한다. 도5에 나타낸 것과 같이, 본 실시형태의 예에서는, 표시부(500)는 촬상장치 200의 외부에 설치되고, 유선 혹은 무선통신에 의해 촬상장치 200으로부터 동화상을 수신한 후 표시 패널에 표시한다.
(촬상장치 200에 있어서의 동화상 재생으로부터 촬영 동화상의 송신에 대한 일련의 동작)
도6을 참조하여, 촬상 시스템(1)의 촬상장치 200에 있어서의 동화상 재생으로부터 촬영된 동화상의 송신에 대한 일련의 동작(촬상장치 100으로부터 동화상 파일을 수신해서 이 동화상 파일을 재생하고, 더구나 촬상장치 100에 동화상을 송신하는 동작)에 대해 설명한다. 도6에 나타내는 일련의 동작은, CPU 2003이, 예를 들면, 기록부 2016 또는 불휘발성 메모리(미도시)에 기록되어 있는 프로그램을 RAM 2006에 전개하고, 이 프로그램을 실행함으로써 실현된다.
실시형태 1과 마찬가지로, 촬상장치 200의 CPU 2003은 스텝 S301을 실행하여 촬상장치 100으로부터 송신된 동화상 파일을 수신한다.
스텝 S601에서, CPU 2003은, 표시부(500)에 동화상 파일을 송신한다(출력한다). 본 실시형태에서는, 예를 들면, 동화상 파일은, 표시부(500)측에서 디코드되어 표시되어도 된다. CPU 2003이 스텝 S301에서 수신한 동화상 파일을 표시부(500)에 송신하는 경우를 예로 들어 설명하고 있지만, 촬상장치 200측에서 동화상 파일을 디코드하고, 디코드된 동화상 데이터를 표시부(500)에 송신(출력)하는 구성을 취해도 된다.
스텝 S602에서, CPU 2003은, 스텝 S601에 있어서의 동화상 파일의 송신으로부터 소정 시간이 경과한 후에, 촬상장치 200에 있어서의 동화상의 촬영과 음성의 취득을 개시한다.
또한, CPU 2003은, 실시형태 1과 마찬가지로, 스텝 S304 내지 S306의 처리를 실행하여, 촬상장치 100에 촬영된 동화상 파일을 송신한다. CPU 2003은, 그후, 본 일련의 동작을 종료한다.
이와 같이 하여도, 촬상장치 200의 유저는, 용이한 조작에 의해, 유저가 촬상장치 100에 의해 촬영된 동화상을 볼 때의 상태를 촬상장치 100의 유저에게 송신할 수 있다. 바꾸어 말하면, 촬상장치 200은, 수신된 동화상에 대한 반응의 동화상을 힘들이지 않고 송신할 수 있다. 본 실시형태에서는, 촬상장치 200의 유저는 보다 시청에 적합한 표시장치에서 동화상을 재생할 수 있다.
전술한 실시형태에서는, 촬상장치의 예로서 디지털 카메라를 사용하는 경우를 예로 들어 설명하였다. 그러나, 예를 들면, 도7에 나타낸 것과 같이 적어도 한쪽이 스마트폰(700)인 형태이어도 된다. 또한, 이들 장치의 적어도 한쪽이 거치형의 카메라이거나, 스마트폰, 게임기, 퍼스널컴퓨터, 태블릿 단말, 디스플레이 기기 등이어도 된다.
또한, 전술한 실시형태에서는, 동화상을 기록하는 경우를 예로 들어 설명하였지만, 정지 화상을 기록하는 경우에 있어서도 유사한 처리를 행할 수 있다. 정지 화상을 처리하는 경우, 도2의 스텝 S202에 있어서 취득하는 음성 데이터는, 예를 들면, 정지 화상의 촬영 전후의 소정 시간으로부터의 음성 데이터이어도 된다.
기타 실시형태
본 발명의 실시형태는, 본 발명의 전술한 실시형태(들)의 1개 이상의 기능을 수행하기 위해 기억매체('비일시적인 컴퓨터 판독가능한 기억매체'로서 더 상세히 언급해도 된다)에 기록된 컴퓨터 실행가능한 명령(예를 들어, 1개 이상의 프로그램)을 판독하여 실행하거나 및/또는 전술한 실시예(들)의 1개 이상의 기능을 수행하는 1개 이상의 회로(예를 들어, 주문형 반도체 회로(ASIC)를 포함하는 시스템 또는 장치의 컴퓨터나, 예를 들면, 전술한 실시형태(들)의 1개 이상의 기능을 수행하기 위해 기억매체로부터 컴퓨터 실행가능한 명령을 판독하여 실행함으로써, 시스템 또는 장치의 컴퓨터에 의해 수행되는 방법에 의해 구현될 수도 있다. 컴퓨터는, 1개 이상의 중앙처리장치(CPU), 마이크로 처리장치(MPU) 또는 기타 회로를 구비하고, 별개의 컴퓨터들의 네트워크 또는 별개의 컴퓨터 프로세서들을 구비해도 된다. 컴퓨터 실행가능한 명령은, 예를 들어, 기억매체의 네트워크로부터 컴퓨터로 주어져도 된다. 기록매체는, 예를 들면, 1개 이상의 하드디스크, 랜덤 액세스 메모리(RAM), 판독 전용 메모리(ROM), 분산 컴퓨팅 시스템의 스토리지, 광 디스크(콤팩트 디스크(CD), 디지털 다기능 디스크(DVD), 또는 블루레이 디스크(BD)TM 등), 플래시 메모리소자, 메모리 카드 등을 구비해도 된다.
본 발명은, 상기한 실시형태의 1개 이상의 기능을 실현하는 프로그램을, 네트워크 또는 기억매체를 개입하여 시스템 혹은 장치에 공급하고, 그 시스템 혹은 장치의 컴퓨터에 있어서 1개 이상의 프로세서가 프로그램을 읽어 실행하는 처리에서도 실행가능하다. 또한, 1개 이상의 기능을 실현하는 회로(예를 들어, ASIC)에 의해서도 실행가능하다.
예시적인 실시형태들을 참조하여 본 발명을 설명하였지만, 본 발명이 이러한 실시형태에 한정되지 않는다는 것은 자명하다. 이하의 청구범위의 보호범위는 가장 넓게 해석되어 모든 변형, 동등물 구조 및 기능을 포괄하여야 한다.

Claims (17)

  1. 촬상장치로서,
    상기 촬상장치의 주위에서 생기는 발화의 음성을 취득하도록 구성된 음성 취득부와,
    화상을 촬영하도록 구성된 촬상부과,
    상기 발화의 음성에 특정한 인물을 나타내는 표현이 포함되는 경우, 상기 특정한 인물을 나타내는 표현과 관련된 외부 장치에, 촬영된 화상 중 상기 발화의 음성의 취득과 관련되는 제1 화상을 송신하도록, 화상의 송신을 제어하도록 구성된 제어부와,
    상기 외부 장치에서 촬영되고 상기 제1 화상의 재생과 관련되는 제2 화상을, 상기 외부 장치로부터 수신하도록 구성된 수신부를 구비한 촬상장치.
  2. 제 1항에 있어서,
    상기 특정한 인물을 나타내는 표현과, 화상을 상기 외부 장치에 송신하기 위한 송신처의 정보를 관련시켜 등록하도록 구성된 등록부와,
    취득된 상기 발화의 음성으로부터 인물을 나타내는 표현을 추출하도록 구성된 추출부를 더 구비하고,
    상기 추출부에 의해 상기 발화의 음성으로부터 상기 특정한 인물을 나타내는 표현이 추출된 경우에, 상기 제어부는, 상기 특정한 인물을 나타내는 표현과 관련된 상기 송신처에 상기 제1 화상을 송신하도록 화상의 송신을 제어하는 촬상장치.
  3. 제 1항에 있어서,
    상기 제어부는 상기 제1 화상을 상기 외부 장치에 송신할 것인지 여부에 대해 상기 촬상장치의 유저에게 문의하고, 상기 제1 화상을 상기 외부 장치에 송신할 것을 나타내는 상기 유저로부터의 응답의 접수에 따라, 상기 제어부는 상기 제1 화상을 상기 외부 장치에 송신하도록 화상의 송신을 제어하는 촬상장치.
  4. 제 1항에 있어서,
    상기 제어부는, 상기 발화의 음성에 상기 특정한 인물을 나타내는 표현이 포함되는 것으로 판정한 시점을 포함하는 소정의 시간 내에 촬영된 1개 이상의 화상 중 적어도 1개를 상기 제1 화상으로서 상기 외부 장치에 송신하는 촬상장치.
  5. 제 1항에 있어서,
    상기 제2 화상은, 상기 특정한 인물이 화상 내에 포함되는 동화상을 포함하는 촬상장치.
  6. 촬상장치로서,
    외부 장치로부터 특정한 인물을 나타내는 표현과 관련된 상기 촬상장치에 송신된 제1 화상으로서, 상기 특정한 인물을 나타내는 표현을 포함하는 발화의 음성의 취득과 관련되는 화상인 상기 제1 화상을 수신하도록 구성된 수신부와,
    상기 제1 화상이 재생되도록 상기 제1 화상을 표시부에 출력하도록 구성된 출력부와,
    상기 제1 화상의 재생에 따라 제2 화상을 촬영하고, 촬영한 상기 제2 화상을 상기 외부 장치에 송신하도록 화상의 송신을 제어하도록 구성된 제어부를 구비한 촬상장치.
  7. 제 6항에 있어서,
    상기 출력부는, 상기 제1 화상이 상기 촬상장치의 외부의 표시장치에 표시되도록 상기 제1 화상을 상기 표시장치에 송신하는 촬상장치.
  8. 제 6항에 있어서,
    상기 제어부가 상기 제1 화상이 재생되도록 상기 제1 화상을 출력한 경우에, 상기 제어부는, 상기 제1 화상이 재생되는 것을 나타내는 정보를, 상기 제1 화상을 송신한 상기 외부 장치에 송신하는 촬상장치.
  9. 제 6항에 있어서,
    상기 촬상장치로부터 소정의 범위 내에 있는 상기 특정한 인물을 검출하도록 구성된 검출부를 더 구비하고,
    상기 특정한 인물이 검출된 경우에, 상기 제어부는 상기 제2 화상을 촬영하는 촬상장치.
  10. 제 6항에 있어서,
    상기 제어부는 상기 제2 화상을 촬영할 것인지 여부에 대해 문의하고, 상기 제2 화상을 촬영할 것을 나타내는 상기 특정한 인물로부터의 응답의 접수에 따라, 상기 제어부가 상기 제2 화상을 촬영하는 촬상장치.
  11. 제 6항에 있어서,
    상기 제어부는, 상기 제1 화상의 출력을 개시한 시점으로부터 소정 시간 후에 상기 제2 화상을 촬영하는 촬상장치.
  12. 제 6항에 있어서,
    상기 제어부는, 상기 제1 화상의 출력을 종료한 시점으로부터 소정 시간 후에 상기 제2 화상을 촬영하는 촬상장치.
  13. 제 6항에 있어서,
    상기 제어부는 촬영된 상기 제2 화상을 상기 제1 화상을 송신한 상기 외부 장치에 송신할 것인지 여부에 대해 문의하고, 상기 제2 화상을 송신할 것을 나타내는 상기 특정한 인물로부터의 응답의 접수에 따라, 상기 제어부는 상기 제2 화상을 상기 외부 장치에 송신하는 촬상장치.
  14. 제 6항에 있어서,
    상기 제2 화상은, 상기 특정한 인물이 화상 내에 포함되는 동화상을 포함하는 촬상장치.
  15. 촬상장치의 제어방법으로서,
    상기 촬상장치의 주위에서 생기는 발화의 음성을 취득하는 단계와,
    화상을 촬영하는 단계와,
    상기 발화의 음성에 특정한 인물을 나타내는 표현이 포함되는 경우, 상기 특정한 인물을 나타내는 표현과 관련된 외부 장치에, 촬영된 화상 중 상기 발화의 음성의 취득과 관련되는 제1 화상이 송신되도록, 화상의 송신을 제어하는 단계와,
    상기 외부 장치에서 촬영되고 상기 제1 화상의 재생과 관련되는 제2 화상을, 상기 외부 장치로부터 수신하는 단계를 포함하는 제어방법.
  16. 촬상장치의 제어방법으로서,
    외부 장치로부터 특정한 인물을 나타내는 표현과 관련된 상기 촬상장치에 송신된 제1 화상으로서, 상기 특정한 인물을 나타내는 표현을 포함하는 발화의 음성의 취득과 관련되는 화상인 상기 제1 화상을 수신하는 단계와,
    상기 제1 화상이 재생되도록 상기 제1 화상을 표시부에 출력하는 단계와,
    상기 제1 화상의 재생에 따라 제2 화상을 촬영하고, 촬영한 상기 제2 화상을 상기 외부 장치에 송신하도록, 화상의 송신을 제어하는 단계를 포함하는 제어방법.
  17. 촬상장치의 주위에서 생기는 발화의 음성을 취득하는 단계와,
    화상을 촬영하는 단계와,
    상기 발화의 음성에 특정한 인물을 나타내는 표현이 포함되는 경우, 상기 특정한 인물을 나타내는 표현과 관련된 외부 장치에, 촬영된 화상 중 상기 발화의 음성의 취득과 관련되는 제1 화상이 송신되도록, 화상의 송신을 제어하는 단계와,
    상기 외부 장치에서 촬영되고 상기 제1 화상의 재생과 관련되는 제2 화상을, 상기 외부 장치로부터 수신하는 단계를 포함하는 상기 촬상장치의 제어방법을 행하기 위한 명령들을 포함하는 컴퓨터 판독가능한 기억매체.
KR1020230075898A 2022-06-30 2023-06-14 촬상장치, 그 제어방법, 및 기억매체 KR20240002919A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2022-106439 2022-06-30
JP2022106439A JP2024005948A (ja) 2022-06-30 2022-06-30 撮像装置、その制御方法及びプログラム

Publications (1)

Publication Number Publication Date
KR20240002919A true KR20240002919A (ko) 2024-01-08

Family

ID=86760292

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230075898A KR20240002919A (ko) 2022-06-30 2023-06-14 촬상장치, 그 제어방법, 및 기억매체

Country Status (5)

Country Link
US (1) US20240007742A1 (ko)
EP (1) EP4300288A1 (ko)
JP (1) JP2024005948A (ko)
KR (1) KR20240002919A (ko)
CN (1) CN117336596A (ko)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006003411A (ja) 2004-06-15 2006-01-05 Canon Inc 情報処理装置
US9311525B2 (en) * 2014-03-19 2016-04-12 Qualcomm Incorporated Method and apparatus for establishing connection between electronic devices
KR20170091913A (ko) * 2016-02-02 2017-08-10 삼성전자주식회사 영상 서비스 제공 방법 및 장치

Also Published As

Publication number Publication date
CN117336596A (zh) 2024-01-02
JP2024005948A (ja) 2024-01-17
EP4300288A1 (en) 2024-01-03
US20240007742A1 (en) 2024-01-04

Similar Documents

Publication Publication Date Title
JP4768028B2 (ja) 画像キャプチャの方法およびデバイス
JP5401420B2 (ja) 撮像装置
JP4978324B2 (ja) 画像記録装置、画像記録システム、画像再生方法
US9357194B2 (en) Imaging apparatus for minimizing repetitive recording of moving image data of a similar scene on a recording medium
JP2012100216A (ja) カメラおよび動画撮影プログラム
CN112004046A (zh) 一种基于视频会议的图像处理方法和装置
US9350935B2 (en) Moving image data recording apparatus
JP5600405B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2007228453A (ja) 撮像装置、再生装置、プログラム、および記憶媒体
KR20240002919A (ko) 촬상장치, 그 제어방법, 및 기억매체
JP2013118518A (ja) 撮像装置
JP2006211570A (ja) 撮影装置
JP6544209B2 (ja) 情報処理装置、会議システム、情報処理方法およびプログラム
US20220329732A1 (en) Imaging apparatus, sound processing method, and program
JP2013183280A (ja) 情報処理装置、撮像装置、及びプログラム
JP2007104405A (ja) 音声付き映像データ処理装置、音声付き映像データ処理方法及び音声付き映像データ処理用プログラム
JP2007266661A (ja) 撮像装置、情報処理装置、撮像表示システム
JP2011041144A (ja) 画像処理装置、画像処理プログラム
JP2023162709A (ja) 撮像装置
JP5561044B2 (ja) 撮像装置、撮像方法及びプログラム
JP6282136B2 (ja) 撮像装置及びその制御方法
JP4699715B2 (ja) 画像音声記録装置及び再生装置
JP2021097331A (ja) 情報処理装置およびその制御方法
JP2020065219A (ja) 撮像装置および撮像装置の制御方法
JP2014131150A (ja) 画像表示装置および画像表示方法

Legal Events

Date Code Title Description
A201 Request for examination