KR102653751B1 - 전자 기기, 시스템, 보존 제어 방법 및 프로그램 - Google Patents

전자 기기, 시스템, 보존 제어 방법 및 프로그램 Download PDF

Info

Publication number
KR102653751B1
KR102653751B1 KR1020160112639A KR20160112639A KR102653751B1 KR 102653751 B1 KR102653751 B1 KR 102653751B1 KR 1020160112639 A KR1020160112639 A KR 1020160112639A KR 20160112639 A KR20160112639 A KR 20160112639A KR 102653751 B1 KR102653751 B1 KR 102653751B1
Authority
KR
South Korea
Prior art keywords
voice
image
predetermined
terminal
unit
Prior art date
Application number
KR1020160112639A
Other languages
English (en)
Other versions
KR20170034315A (ko
Inventor
다케시 오카다
Original Assignee
가시오게산키 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가시오게산키 가부시키가이샤 filed Critical 가시오게산키 가부시키가이샤
Publication of KR20170034315A publication Critical patent/KR20170034315A/ko
Application granted granted Critical
Publication of KR102653751B1 publication Critical patent/KR102653751B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B17/00Details of cameras or camera bodies; Accessories therefor
    • G03B17/56Accessories
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/27Server based end-user applications
    • H04N21/274Storing end-user multimedia data in response to end-user request, e.g. network recorder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • H04N23/661Transmitting camera control signals through networks, e.g. control via the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/9201Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal
    • H04N5/9202Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal the additional signal being a sound signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/188Capturing isolated or intermittent images triggered by the occurrence of a predetermined event, e.g. an object reaching a predetermined position
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Business, Economics & Management (AREA)
  • Telephone Function (AREA)
  • Studio Devices (AREA)
  • Telephonic Communication Services (AREA)
  • Tourism & Hospitality (AREA)
  • Information Transfer Between Computers (AREA)
  • Marketing (AREA)
  • Exposure Control For Cameras (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Details Of Cameras Including Film Mechanisms (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • User Interface Of Digital Computer (AREA)
  • Computing Systems (AREA)

Abstract

본 발명은, 번거로운 작업없이, 촬영된 사진을 간단하게 적절한 장소로 업로드할 수 있는 것이다. 촬영 단말기(2)는, 촬영 제어부(133)와, 입력 검출부(132)와, 촬영 제어부(133)와, 통신 제어부(134)를 구비한다. 촬영 제어부(133)는, 화상을 취득한다. 입력 검출부(132)는, 사용자로부터 발해지는 소정의 음성을 취득한다. 촬영 제어부(133)는, 입력 검출부(132)에 의해 취득된 소정의 음성과 동일한 음성에 기초하여, 화상을 취득하도록 제어한다. 통신 제어부(134)는, 입력 검출부(132)에 의해 취득된 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 화상을 보존시키는 제어를 행한다.

Description

전자 기기, 시스템, 보존 제어 방법 및 프로그램{ELECTRONIC APPARATUS, SYSTEM, STORAGE CONTROL METHOD, AND STORAGE MEDIUM}
본 출원에 대해서는, 2015년 9월 18일자에 출원된 일본특허출원 제2015-185867호를 기초로 하는 우선권을 주장하며, 상기 기초 출원의 내용은 모두 본원에 포함되는 것으로 한다.
본 발명은, 전자 기기, 시스템, 보존 제어 방법 및 프로그램에 관한 것이다.
종래부터, 예를 들면, 일본 공개특허 제2012-100214호 공보, 일본 공개특허 제2009-10987호와 같이 촬영 제어를 손 조작이 아니고, 음성으로 행하는 카메라의 기술이 개시되어 있다. 또한, 일본 공개특허 제2002-189723호 공보와 같이 촬영한 사진을 웹 상의 소정 서버에 업로드하는 기술이 개시되어 있다. 이를 이용한 SNS 등의 서비스도 개시되어 있다.
일본 공개특허 제2012-100214호 일본 공개특허 제2009-10987호 일본 공개특허 제2002-189723호
SNS 등의 웹 상의 서버에 사진을 업로드할 때는, 사진 촬영이 완료된 후, 촬영 장치 또는 사진이 보존되어 있는 메모리를 가지는 장치에 의해 전용(專用) 어플리케이션을 기동시켜, 보존된 사진 중에서 목적으로 하는 사진을 선택하여, 업로드처를 선택하여, 사진을 웹 상에 업로드한다는 번거로운 작업을 필요로 한다.
본 발명은, 이와 같은 문제점을 해결하기 위해 이루어진 것이며, 번거로운 작업없이, 사진을 촬영하여, 그 촬영된 사진을 간단하게 적절한 장소에 업로드할 수 있는 것을 목적으로 한다.
본 발명의 전자 기기는,
화상(image)을 취득하는 화상 취득 수단;
사용자로부터 발해지는 소정의 음성을 취득하는 음성(sound) 취득 수단;
상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여, 상기 화상을 취득하도록 상기 화상 취득 수단을 제어하는 화상 취득 제어 수단; 및
상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처(storage destination)에, 상기 화상을 보존(storage)시키는 제어를 행하는 보존 제어 수단;을 포함하는 것을 특징으로 한다.
또한, 본 발명의 시스템은,
제1 장치와 제2 장치로 이루어지는 시스템으로서,
상기 제1 장치는,
사용자로부터 발해지는 소정의 음성을 취득하는 음성 취득 수단;
상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여 피사체를 촬영하는 촬영 지시를 상기 제2 장치로 송신하는 제1 송신 수단;
상기 촬영 지시에 기초하여 상기 제2 장치에 의해 촬영된 화상 데이터를 상기 제2 장치로부터 수신하는 제1 수신 수단; 및
상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 상기 화상을 보존시키는 제어를 행하는 보존 제어 수단;을 포함하고,
상기 제2 장치는,
촬영 수단;
상기 제1 장치의 상기 제1 송신 수단으로부터 송신되는 상기 촬영 지시를 수신하는 제2 수신 수단;
상기 제2 수신 수단에 의해 수신된 상기 촬영 지시에 기초하여, 피사체를 촬영하도록 상기 촬영 수단을 제어하는 촬영 제어 수단; 및
상기 화상 데이터를 상기 제1 장치로 송신하는 제2 송신 수단;을 포함하는 것을 특징으로 한다.
또한, 보존 제어 방법은,
화상을 취득하는 화상 취득 단계;
사용자로부터 발해지는 소정의 음성을 취득하는 음성 취득 단계;
상기 음성 취득 단계에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여, 상기 화상을 취득하도록 상기 화상 취득 단계를 제어하는 화상 취득 제어 단계; 및
상기 음성 취득 단계에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 상기 화상을 보존시키는 제어를 행하는 보존 제어 단계;를 포함하는 것을 특징으로 한다.
또한, 본 발명의 기록 매체에 기록된 프로그램은,
컴퓨터로 하여금,
화상을 취득하는 화상 취득 수단;
사용자로부터 발해지는 소정의 음성을 취득하는 음성 취득 수단;
상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여, 상기 화상을 취득하도록 상기 화상 취득 수단을 제어하는 화상 취득 제어 수단; 및
상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 상기 화상을 보존시키는 제어를 행하는 보존 제어 수단;으로서 기능하도록 하는 것을 특징으로 한다.
본 명세서에 통합되고 또한 본 명세서의 일 부분을 구성하는 도면에 따라, 본 발명의 실시예를 설명하며, 또한 위에서 주어진 일반적인 설명과 함께, 본 발명의 구체적인 실시예에 대하여 아래에서 설명하되, 이는 본 발명의 원칙을 설명하기 위한 것이다.
본 발명에 의하면, 번거로운 작업없이, 촬영된 사진을 간단하게 적절한 장소에 업로드할 수 있다.
도 1은 본 발명의 일 실시형태에 관한 투고 시스템(posting system)의 시스템 구성을 나타낸 시스템 구성도이다.
도 2는 본 실시형태의 투고 시스템에 의해 실행되는 음성 투고를 설명하기 위한 모식도이다.
도 3은 본 실시형태의 음성 투고의 이용 장면을 나타낸 모식도이다.
도 4는 본 실시형태의 투고 시스템의 리스트 단말기(wrist terminal)의 하드웨어의 구성을 나타낸 블록도이다.
도 5는 본 실시형태의 투고 시스템의 촬영 단말기의 하드웨어의 구성을 나타낸 블록도이다.
도 6은 본 실시형태의 투고 시스템의 휴대 단말기의 하드웨어의 구성을 나타낸 블록도이다.
도 7은 도 4의 리스트 단말기의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다.
도 8은 도 5의 촬영 단말기의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다.
도 9는 도 6의 휴대 단말기의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다.
도 10은 도 7 내지 도 9의 기능적 구성을 가지는 도 4의 리스트 단말기(1), 도 5의 촬영 단말기 및 도 6의 휴대 단말기가 실행하는 음성 투고 처리의 흐름을 설명하는 플로우차트이다.
도 11은 제2 실시형태에 관한 투고 시스템의 시스템 구성을 나타낸 시스템 도면이다.
도 12는 본 실시형태의 투고 시스템에 의해 실행되는 음성 투고를 설명하기 위한 모식도이다.
도 13은 도 7 및 도 8의 기능적 구성을 가지는 도 4의 리스트 단말기(1) 및 도 5의 촬영 단말기가 실행하는 음성 투고 처리의 흐름을 설명하는 플로우차트이다.
도 14는 본 실시형태의 촬영 단말기의 하드웨어의 구성을 나타낸 블록도이다.
도 15는 도 14의 촬영 단말기의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다.
도 16은 도 15의 기능적 구성을 가지는 도 14의 촬영 단말기가 실행하는 음성 투고 처리의 흐름을 설명하는 플로우차트이다.
이하, 본 발명의 실시형태에 대하여, 도면을 참조하여 설명한다.
<제1 실시형태>
도 1은, 본 발명의 일 실시형태에 관한 투고 시스템의 시스템 구성을 나타낸 시스템 구성도이다.
본 실시형태의 투고 시스템(S)은, 도 1에 나타낸 바와 같이, 리스트 단말기(1)와, 촬영 단말기(2)와, 휴대 단말기(3)를 포함한다.
본 실시형태의 투고 시스템(S)에서는, 1(one)의 음성 입력에 의해, 투고 지시와 투고 내용의 입력과 촬영 지시를 행하여, 작성한 투고 내용의 텍스트와, 촬영한 화상을, SNS(Social Networking Service) 서버에 송신하여 투고를 행한다.
투고 시스템(S)을 구성하는 리스트 단말기(1)는, 사용자의 팔에 장착하여 사용되고, 음성 입력 기능과, 화면 표시 기능과, 통신 기능을 가진다.
리스트 단말기(1)는, 음성 입력을 행하여, 촬영과 입력된 음성의 음성 인식의 지시와, 음성 인식 결과에 따른 투고처(posting destination)에 대한 투고 지시를 휴대 단말기(3)에 행한다. 그리고, 투고 내용은, 음성 인식 결과의 문자열과, 촬영 지시에 의해 취득한 화상이다.
또한, 투고 시스템(S)을 구성하는 촬영 단말기(2)는, 사용자의 가방, 의복, 모자 등에 장착하여 사용되고, 통신 기능과, 촬영 기능을 가진다. 촬영 단말기(2)는, 리스트 단말기(1)로부터의 촬영 지시에 기초하여 촬영을 행하여, 화상을 리스트 단말기(1)에 송신한다.
또한, 투고 시스템(S)을 구성하는 휴대 단말기(3)는, 사용자가 휴대하고 있고, 통신 기능을 가진다. 휴대 단말기(3)에서는, 리스트 단말기(1)로부터 음성 인식 지시에 기초하여, 외부의 음성 인식 서버로부터 입력된 음성의 음성 인식 결과를 취득하여 리스트 단말기(1)에 송신한다. 또한, 휴대 단말기(3)에서는, 리스트 단말기(1)로부터의 투고 지시에 기초하여, 지정된 투고처로 되는 SNS 서버에 투고 내용을 송신하여, 투고를 행한다.
투고 내용의 화상과 문자열을 작성하기 위한 촬영 지시 및 음성 인식 지시와, 투고처를 결정하기 위한 음성 내용은, 임의의 내용 후에 계속되는 음성 내용 전체의 말미(末尾; end)의 내용이다. 즉, 음성 내용 전체는, 「임의의 음성 내용」+「말미: 특정한 음성 내용」으로 구성되어 있고, 투고처를 결정하는 음성 내용은 「말미: 특정한 음성 내용」이다. 입력되는 음성 내용 전체로부터 판단하지 않고, 말미 부분의 음성 내용으로 판단하게 된다. 본 실시형태에 있어서는, 음성 내용을 문자열로서 취급하여, 입력된 음성에 대응하는 문자열의 말미의 문자열이 특정한 문자열인 경우(입력된 음성=「임의의 문자열+말미가 특정한 문자열」)에, 본 기능이 동작하게 된다.
말미의 특정한 문자열은, 사용자가 임의로 설정하는 것이 가능하지만, 본 실시형태에 있어서는, 기억처(storage destination)로 되는 투고처를 직접적으로 또는 간접적으로 상기(想起)시키는 것과 같은 투고처에 관련된 키워드가 설정된다. 또한, 투고처에서 관용적(慣用的), 또는 공식적으로 사용되고 있는 워드를 사용하도록 구성한다.
구체적으로는, Twitter(등록상표)의 경우에는, 투고하고 싶은 내용과, Twitter에 있어서 관용되고 있는 현재 무엇을 하고 있는 것인지를 나타내는 「나우(now)」의 문언을 마지막으로 발해 음성 입력하면, 투고 내용의 텍스트와, 음성 입력했을 때 촬영한 화상이 Twitter의 자신의 어카운트(account)에 투고된다.
즉, 입력한 음성이 「○○○나우」의 경우에 자신의 어카운트(특정한 투고처)에, 음성 입력 시에 촬영한 화상과 함께 「○○○나우」의 텍스트가 자신의 Twitter의 어카운트에 투고되게 된다.
또한, Facebook(등록상표)의 경우에는, 투고하고 싶은 내용과, Facebook이 공식적으로 설치하고 있는 상대를 칭찬할 때 누르는 버튼의 문언인 「좋아요(like)」의 문언을 마지막으로 발하여 음성 입력하면, 투고 내용의 텍스트와, 음성 입력했을 때 촬영한 화상이 Facebook의 자신의 어카운트에 투고된다.
즉, 입력한 음성이 「○○○좋아요」의 경우에 자신의 어카운트(특정한 투고처)에, 음성 입력 시에 촬영한 화상과 함께 「○○○좋아요」의 텍스트가 자신의 Facebook의 어카운트에 투고되게 된다.
이와 같이, 음성의 말미에 투고처를 상기시키는 키워드를 투고·투고처의 지정 등을 판단하는 워드로 함으로써, 음성 입력을 하는 사용자는, 기분이나 감상 등의 문언을 발한 마지막에 특정한 워드를 발하면 되고, 투고·투고처의 지정 등을 의식해 기분이나 감상 등의 사고를 방해하지 않고 직감적으로 음성을 입력할 수 있다.
또한, 투고처를 지정하여, 투고를 지시하는 워드를 발하고 나서, 투고 내용을 발하도록 한 경우, 투고 내용을 발할 때까지 지루할 가능성이 있지만, 이 경우와 비교하여, 투고 내용을 먼저 발함으로써, 준비하기 위해 힘들이지 않고 직감적으로 발하기 용이해져 리얼타임감(real-time feeling)도 손상되지 않는다. 또한, 투고처와 관련되어 있고, 또한 관용적 또는 공식적으로 사용되고 있는 워드를 사용함으로써, 특정한 문언을 기억할 필요가 없어진다.
또한, 직감적으로 투고 내용만 발하고, 후에, 투고 내용에 따라 투고처를 선택하는 워드를 발하여, 투고처를 조정하는 것도 가능해진다.
도 2는, 본 실시형태의 투고 시스템(S)에 의해 실행되는 음성 투고를 설명하기 위한 모식도이다.
본 실시형태의 투고 시스템(S)에서는, 도 2의 예에 나타낸 바와 같이, 예를 들면, 「정상 나우(on the top of the mountain now)」라고 하는 음성을 리스트 단말기(1)에 입력(중얼거림; saying)함으로써, 상기 음성을 트리거로 하여, 촬영 단말기(2)에 의해 셀프타이머 촬영이 행해지고, 휴대 단말기(3)에 있어서 입력한 음성의 음성 인식이 된다. 그 후, 중얼댐(words said)은 텍스트화되어 촬영한 화상과 함께 리스트 단말기(1)의 화면에 표시된다. 그리고, 셀프타이머 시에 리스트 단말기(1)를 조작(터치 조작)함으로써, 촬영을 일시 정지시키거나, 투고를 중지시키거나 하는 것이 가능하게 구성된다. 또한, 셀프타이머의 시간 설정도 임의로 변경할 수 있도록 구성된다.
최종적으로, 리스트 단말기(1)의 화면에 표시된 중얼댐(words said)과 화상이 SNS 서버에 업로드되어 투고되어, 자신의 트이트(tweet)로서 공개된다.
도 3은, 본 실시형태의 음성 투고의 이용 장면을 나타낸 모식도이다.
본 실시형태의 음성 투고의 이용 장면은, 도 3에 나타낸 바와 같이, 다방면에 걸쳐 있고, 「산(mountain), 「캠프」, 「사이클링」, 「스키·스노보드」등의 단말기 등을 입력 조작할 수 없는 것과 같은 장면이나 구별 동작을 따르도록 한 장면에서 더욱 효과적으로 기능한다.
예를 들면, 등산하고 있는 것과 같은 경우에는, 입력·촬영 등의 단말기 조작은, 행하기 힘들다. 정상에 도착했을 때, 정상에 도착한 취지를 고지(告知)하는 「정상 도착 나우(on the top of the mountain now)」라는 음성 입력을 행함으로써, 정상 부근의 화상과, 「정상 도착 나우(on the top of the mountain now)」의 텍스트가 Twitter에 투고되게 된다.
또한, 캠프에서 식사를 하고 있는 것과 같은 경우에는, 입력·촬영 등의 단말기 조작을 행하고 있으면 식사의 감상(感想)의 리얼타임감이 없어져 버린다. 먹자 마자 식사의 감상을 고지하는 「맛있는 식사 나우(having a delicious meal now)」라는 음성 입력을 행함으로써, 식사 풍경의 화상과, 「맛있는 식사 나우」의 텍스트가 Twitter에 투고되게 된다.
또한, 사이클링하고 있는 것과 같은 경우에는, 입력·촬영 등의 단말기 조작은, 행하기 힘들다. 특정한 장소에 도착했을 때, 현재 지점(地点)의 명칭을 고지하는 「시마나미 왔네 좋아요!」의 음성 입력을 행함으로써, 주위의 풍경의 화상과, 「시마나미 왔네 좋아요!」의 텍스트가 Facebook에 투고되게 된다.
또한, 스키나 스노보드를 하고 있는 경우에는, 입력·촬영 등의 단말기 조작은, 행하기 힘들다. 달리고 있는 등의 특정한 장면을 만났을 때, 감상을 고지하는 「여러번 넘어짐, 좋아요!(I fell so many times, like!)」의 음성 입력을 행함으로써, 특정한 장면을 촬영한 화상과, 「여러번 넘어짐, 좋아요!」의 텍스트가 Facebook에 투고되게 된다.
도 4는, 본 실시형태의 투고 시스템(S)의 리스트 단말기(1)의 하드웨어의 구성을 나타낸 블록도이다.
리스트 단말기(1)는, 예를 들면, 스마트 시계로서 구성된다.
리스트 단말기(1)는, CPU(Central Processing Unit)(11-1)와, ROM(Read Only Memory)(12-1)과, RAM(Random Access Memory)(13-1)과, 버스(14-1)와, 입출력 인터페이스(15-1)와, 입력부(16-1)와, 출력부(17-1)와, 기억부(18-1)와, 통신부(19-1)와, 드라이브(20-1)를 구비하고 있다.
CPU(11-1)는, ROM(12-1)에 기록되어 있는 프로그램, 또는 기억부(18-1)로부터 RAM(13-1)에 로드된 프로그램에 따라 각종 처리를 실행한다.
RAM(13-1)에는, CPU(11-1)가 각종 처리를 실행하는 데 있어서 필요한 데이터 등도 적절히 기억된다.
CPU(11-1), ROM(12-1) 및 RAM(13-1)은, 버스(14-1)를 통하여 서로 접속되어 있다. 이 버스(14-1)에는 또한, 입출력 인터페이스(15-1)도 접속되어 있다. 입출력 인터페이스(15-1)에는, 입력부(16-1), 출력부(17-1), 기억부(18-1), 통신부(19-1) 및 드라이브(20-1)가 접속되어 있다.
입력부(16-1)는, 터치 패널로 구성되며, 사용자의 지시 조작에 따라 각종 정보를 입력한다.
또한, 입력부(16-1)는, 마이크로 구성되며, 사용자가 발하는 음성을 입력한다.
출력부(17-1)는, 디스플레이나 스피커 등으로 구성되며, 화상이나 음성을 출력한다.
기억부(18-1)는, 하드디스크 또는 DRAM(Dynamic Random Access Memory) 등으로 구성되며, 각종 화상의 데이터를 기억한다.
통신부(19-1)는, 인터넷을 포함하는 네트워크를 통하여 다른 장치(도시하지 않음)와의 사이에서 행하는 통신을 제어한다. 또한, 통신부(19-1)는, 다른 단말기와, 블루투스 통신(블루투스 Legacy 통신), Wi-Fi 통신 가능하게 구성된다.
또한, 통신부(19-1)는, 휴대 전화기의 통신 규격인 LTE(Long Term Evolution), 3G(제3 세대 이동 통신 시스템)의 방식으로, 인터넷을 통하여 각종 서버와 통신 가능하게 구성된다.
드라이브(20-1)에는, 자기(磁氣) 디스크, 광디스크, 광자기 디스크, 또는 반도체 메모리 등으로 이루어지는, 착탈 가능 매체(removable medium)(31-1)가 적절히 장착된다. 드라이브(20-1)에 따라서 착탈 가능 매체(31-1)로부터 판독된 프로그램은, 필요에 따라 기억부(18-1)에 인스톨된다. 또한, 착탈 가능 매체(31-1)는, 기억부(18-1)에 기억되어 있는 화상의 데이터 등의 각종 데이터도, 기억부(18-1)와 마찬가지로 기억할 수 있다.
도 5는, 본 실시형태의 투고 시스템(S)의 촬영 단말기(2)의 하드웨어의 구성을 나타낸 블록도이다. 촬영 단말기(2)는, 예를 들면, 디지털 카메라로서 구성된다.
촬영 단말기(2)는, 도 5에 나타낸 바와 같이, CPU(11-2) 내지 촬상부(撮像部)(21-2)를 구비하고 있다.
촬영 단말기(2)는, 리스트 단말기(1)의 출력부(17-1)에 상당하는 하드웨어 구성을 구비하지 않고, 촬상부(21-2)의 하드웨어 구성을 구비하고 있는 것이 상이하다. 리스트 단말기(1)와 마찬가지의 하드웨어 구성인 CPU(11-2) 내지 드라이브(20-2)의 설명은 생략한다.
촬상부(21-2)는, 도시하지 않지만, 광학 렌즈부와, 이미지 센서를 구비하고 있다.
광학 렌즈부는, 피사체를 촬영하기 위해, 광을 집광하는 렌즈, 예를 들면, 포커스 렌즈나 줌 렌즈 등으로 구성된다.
포커스 렌즈는, 이미지 센서의 수광면에 피사체상을 결상(結像)시키는 렌즈이다. 줌 렌즈는, 초점 거리를 일정한 범위에서 자유롭게 변화시키는 렌즈이다. 광학 렌즈부에는 또한, 필요에 따라 초점, 노출, 화이트 밸런스 등의 설정 파라미터를 조정하는 주변 회로가 설치된다.
이미지 센서는, 광전 변환 소자나, AFE(Analog Front End) 등으로 구성된다.
광전 변환 소자는, 예를 들면, CMOS(Complementary Metal Oxide Semiconductor)형의 광전 변환 소자 등으로 구성된다. 광전 변환 소자에는, 광학 렌즈부로부터 피사체상이 입사된다. 그래서, 광전 변환 소자는, 피사체상을 광전 변환[촬상(撮像)]하여 화상 신호를 일정 시간 축적하고, 축적된 화상 신호를 아날로그 신호로서 AFE에 순차적으로 공급한다.
AFE는, 이 아날로그의 화상 신호에 대하여, A/D(Analog/Digital) 변환 처리 등의 각종 신호 처리를 실행한다. 각종 신호 처리에 의해, 디지털 신호가 생성되고, 촬상부(21-2)의 출력 신호로서 출력된다.
이와 같은 촬상부(21-2)의 출력 신호를, 이하, 「촬상 화상의 데이터」라고 한다. 촬상 화상의 데이터는, CPU(11-2)나 도시하지 않은 화상 처리부 등에 적절히 공급된다.
도 6은, 본 실시형태의 투고 시스템(S)의 휴대 단말기(3)의 하드웨어의 구성을 나타낸 블록도이다.
휴대 단말기(3)는, 예를 들면, 스마트 폰으로서 구성된다.
휴대 단말기(3)의 하드웨어 구성[CPU(11-3) 내지 촬상부(21-3)]은, 전술한 리스트 단말기(1) 및 촬영 단말기(2)의 각각의 하드웨어 구성이 동일하므로, 설명을 생략한다.
도 7은, 도 4의 리스트 단말기(1)의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다.
음성 투고 처리란, 1번의 음성 입력에 의해, 문자 정보와 음성 입력 시점(時点)의 화상을, 특정한 SNS에 투고시키는 일련의 처리를 말한다.
그리고, 본 실시형태의 구성은, 리스트 단말기(1)에 SIM(Subscriber Identity Module) 카드가 없도록 한 경우에 보다 유효적으로 기능한다.
리스트 단말기(1) 측의 음성 투고 처리를 실행하는 경우에는, 도 7에 나타낸 바와 같이, CPU(11-1)에 있어서, 투고처 설정부(51)와, 입력 검출부(52)와, 통신 제어부(53)와, 문자열 해석부(54)와, 투고처 결정부(55)와, 표시 제어부(56)가 기능한다.
또한, 기억부(18-1)의 한 영역에는, 투고처 기억부(71)와, 투고 내용 정보 기억부(72)가 설정된다.
투고처 기억부(71)에는, 투고처 워드와 투고처가 대응되어 기억되어 있고, 투고처에 대한 투고에 필요한 투고 정보(개인 어카운트 또는 투고용 메일 어드레스 등)가 기억된다. 구체적으로는, 본 실시형태에 있어서는, 투고처 기억부(71)에는, 투고처 워드 「나우(now)」의 경우에는, 투고처를 Twitter로 하고, 투고처 워드 「좋아요」의 경우에는, 투고처를 Facebook으로 하여 기억되어 있다. 그리고, 투고처 워드는, 사용자가 임의로 설정 가능하게 구성된다.
투고 내용 정보 기억부(72)에는, 투고 내용의 문자열 및 화상 데이터가 기억된다.
투고처 설정부(51)는, 사용자의 입력부(16-1)등에 의한 설정 조작에 의해, 투고처 워드와, 투고처를 대응시켜, 투고처 기억부(71)에 기억시켜, 투고처를 설정한다.
입력 검출부(52)는, 입력부(16-1)에 대한 사용자가 발하는 음성의 입력을 검출한다.
구체적으로는, 입력 검출부(52)는, 사용자로부터 입력부(16-1)를 통하여, 음성의 입력이 검출되었는지의 여부를 판정한다.
통신 제어부(53)는, 촬영 단말기(2) 및 휴대 단말기(3)와 통신을 행하도록 통신부(19-1)를 제어한다.
구체적으로는, 통신 제어부(53)는, 촬영 지시를 촬영 단말기(2)에 송신하고, 음성 인식 지시 및 음성 입력에 의해 입력된 음성 데이터를 휴대 단말기(3)에 송신하도록 통신부(19-1)를 제어한다. 또한, 통신 제어부(53)는, 촬영 단말기(2)로부터 촬영 지시에 따라 촬영된 화상을 수신하고, 휴대 단말기(3)로부터 음성 인식 결과 (본 실시형태에 있어서는, 문자열 데이터)를 수신하도록 통신부(19-1)를 제어한다. 또한, 통신 제어부(53)는, 휴대 단말기(3)에 대하여, 투고처 워드에 대응하는 투고처 및 투고 내용[출력부(17-1)에 표시한 화상과 문자열]을 포함하는 투고 지시와, 화상 데이터 및 문자열 데이터를 송신하도록 통신부(19-1)를 제어한다.
문자열 해석부(54)는, 음성 인식 결과인 문자열을 해석한다.
구체적으로는, 문자열 해석부(54)는, 음성 인식 결과의 문자열을 해석하여, 투고 워드로 되는 문자열의 말미에 투고처 워드가 포함되는지의 여부를 판정한다.
투고처 결정부(55)는, 투고처 기억부(71)를 참조하고, 음성 인식 결과의 문자열의 말미에 포함되는 투고처 워드에 대응하는 투고처를 결정한다.
표시 제어부(56)는, 투고 워드로 되는 문자열이나 투고 화상으로 되는 촬영 화상을 표시하도록 출력부(17-1)를 제어한다. 출력부(17-1)에는, 투고 워드나 투고 화상이 표시되어, 사용자가 투고 내용을 파악할 수 있다.
도 8은, 도 5의 촬영 단말기(2)의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다.
촬영 단말기(2) 측의 음성 투고 처리를 실행하는 경우에는, 도 8에 나타낸 바와 같이, CPU(11-2)에 있어서, 통신 제어부(91)와, 촬영 제어부(92)가 기능한다.
통신 제어부(91)는, 리스트 단말기(1)와 통신을 행하도록 통신부(19-2)를 제어한다.
구체적으로는, 통신 제어부(91)는, 리스트 단말기(1)로부터 촬영 지시를 수신하도록 통신부(19-2)를 제어한다. 또한, 촬영 처리의 결과, 촬영된 화상을 리스트 단말기(1)에 송신하도록 통신부(19-2)를 제어한다.
촬영 제어부(92)는, 촬상 처리를 행하도록 촬상부(21-2)를 제어한다. 그 결과, 촬영 제어부(92)는, 촬상부(21-2)에 의해 촬영된 화상을 취득한다.
도 9는, 도 6의 휴대 단말기(3)의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다.
휴대 단말기(3) 측의 음성 투고 처리를 실행하는 경우에는, 도 9에 나타낸 바와 같이, CPU(11-3)에 있어서, 통신 제어부(111)가 기능한다.
통신 제어부(111)는, 리스트 단말기(1), 음성 인식 서버 및 SNS 서버와 통신을 행하도록 통신부(19-3)를 제어한다.
구체적으로는, 통신 제어부(111)는, 음성 인식 지시 및 음성 인식용의 음성 데이터를 수신하도록 통신부(19-3)를 제어한다. 또한, 통신 제어부(111)는, 외부의 음성 인식 서버에 대하여, 음성 인식 지시 및 음성 인식용의 음성 데이터를 송신하도록 통신부(19-3)를 제어한다. 또한, 통신 제어부(111)는, 외부의 음성 인식 서버로부터, 음성 인식 결과를 수신하도록 통신부(19-3)를 제어한다. 또한, 통신 제어부(111)는, 리스트 단말기(1)에 대하여, 음성 인식 결과를 송신하도록 통신부(19-3)를 제어한다. 또한, 통신 제어부(111)는, 리스트 단말기(1)로부터, 투고 지시와, 화상 데이터 및 문자열 데이터를 수신으로 하도록 통신부(19-3)를 제어한다. 또한, 통신 제어부(111)는, 투고처의 SNS 서버에, 투고 내용인 화상 데이터 및 문자열 데이터를 송신하도록 통신부(19-3)를 제어한다.
도 10은, 도 7 내지 도 9의 기능적 구성을 가지는 도 4의 리스트 단말기(1), 도 5의 촬영 단말기(2) 및 도 6의 휴대 단말기(3)가 실행하는 음성 투고 처리의 흐름을 설명하는 플로우차트이다. 음성 투고 처리의 개시에 있어서, 투고처 설정부(51)에 의해, 투고처 워드가 사용자에 의해 사전에 등록되어 있는 상태, 즉 투고처 기억부(71)에 개인 어카운트 설정을 포함하는 투고처의 정보와 투고처 워드가 등록되어 있는 상태로 되어 있다. 또한, 각각의 단말기[리스트 단말기(1), 촬영 단말기(2), 휴대 단말기(3)]의 사이에서는, 서로 통신 가능하게 접속이 완료되어 있는 상태로 되어 있다. 또한, 음성 투고용의 어플리케이션을 사용자의 조작 등으로 기동하여, 음성 입력이 가능한 상태로 되므로, 음성 투고 처리가 개시된다.
그리고, 음성 투고용의 어플리케이션을 기동하여, 음성 입력이 가능한 상태로 함으로써, 음성 투고 처리를 개시하도록 구성하였지만, 이에 한정되지 않고, 모든 동작을 음성 입력으로 행하도록 구성해도 된다. 예를 들면, 음성 입력에 따라 음성 투고용의 어플리케이션을 자동 기동시켜, 음성 입력이 가능한 상태로 하고 나서, 음성 투고 처리를 개시하도록 구성해도 된다.
[리스트 단말기(1) 측의 음성 투고 처리]
스텝 S11-1에 있어서, 입력 검출부(52)는, 사용자로부터 입력부(16-1)를 통하여, 음성의 입력이 검출되었는지의 여부를 판정한다.
음성의 입력이 검출되어 있지 않은 경우에는, 스텝 S11-1에 있어서 NO라고 판정되어, 대기 상태로 된다.
음성의 입력이 검출된 경우에는, 스텝 S11-1에 있어서 YES라고 판정되어, 처리는 스텝 S12-1로 진행한다.
스텝 S12-1에 있어서, 통신 제어부(53)는, 촬영 지시를 촬영 단말기(2)에 송신하고, 음성 인식 지시 및 음성 입력에 의해 입력된 음성 데이터를 휴대 단말기(3)에 송신하도록 통신부(19-1)를 제어한다.
그 후, 촬영 단말기(2)에서는, 촬영 지시를 받아, 촬영 처리가 실행된다. 또한, 휴대 단말기(3)에서는, 음성 인식 지시를 받아, 인터넷 등을 통하여, 외부의 음성 인식 서버에 음성 데이터를 송신하여, 음성 인식을 실행시킨다.
스텝 S13-1에 있어서, 통신 제어부(53)는, 촬영 단말기(2)로부터 촬영 지시에 따라 촬영된 화상을 수신하고, 휴대 단말기(3)로부터 음성 인식 결과 (본 실시형태에 있어서는, 문자열 데이터)를 수신하도록 통신부(19-1)를 제어한다.
스텝 S14-1에 있어서, 문자열 해석부(54)는, 휴대 단말기(3)로부터 수신한 문자열 데이터를 해석하여, 투고처 기억부(71)를 참조하고, 투고처 워드를 문자열의 말미에 포함하고 있는지의 여부를 판정한다. 구체적으로는, 예를 들면, 투고 워드의 말미에 「나우(now)」나 「좋아요(like)」의 투고처 워드가 포함되는지의 여부를 판정한다. 문자열이 「정상 나우」였던 경우에는, 투고처 워드를 말미에 포함하고, 「정상」또는 「나우 정상」의 경우에는, 말미에 투고처 워드를 포함하지 않는 것으로 판정된다.
투고처 워드를 문자열의 말미에 포함하지 않는 경우에는, 스텝 S14-1에 있어서 NO라고 판정되어, 리스트 단말기(1) 측의 음성 투고 처리는 종료한다.
투고처 워드를 문자열의 말미에 포함하고 있는 경우에는, 스텝 S14-1에 있어서 YES라고 판정되어, 처리는 스텝 S15-1로 진행한다.
스텝 S15-1에 있어서, 투고처 결정부(55)는, 투고처 기억부(71)를 참조하고, 말미에 포함되는 투고처 워드에 대응하는 투고처를 결정한다.
구체적으로는, 투고처 워드가 「나우」였던 경우에는, 투고처 기억부(71)를 참조한 결과, 설정되어 있는 Twitter를 투고처로 결정하고, 「좋아요」였던 경우에는, Facebook를 투고처로서 결정한다.
스텝 S16-1에 있어서, 표시 제어부(56)는, 촬영 단말기(2)로부터 수신한 화상과, 휴대 단말기(3)로부터 수신한 문자열을 표시 출력하도록 출력부(17-1)를 제어한다.
스텝 S17-1에 있어서, 통신 제어부(53)는, 휴대 단말기(3)에 대하여, 투고처 워드에 대응하는 투고처 및 투고 내용[출력부(17-1)에 표시한 화상과 문자열]을 포함하는 투고 지시와, 화상 데이터 및 문자열 데이터를 송신하도록 통신부(19-1)를 제어한다. 휴대 단말기(3)에서는, 투고 지시를 받아, 투고처 워드에 대응하는 투고처로 되는 SNS 서버에 대하여, 수신한 화상 데이터와 문자열 데이터를 송신하여, 투고 처리를 행한다. 또한, 송신에 있어서, 투고 내용인 문자열 및 화상 데이터가 투고 내용 정보 기억부(72)에 기억된다.
그 후, 리스트 단말기(1) 측의 음성 투고 처리는 종료한다.
[촬영 단말기(2) 측의 음성 투고 처리]
스텝 S11-2에 있어서, 통신 제어부(91)는, 리스트 단말기(1)로부터 촬영 지시를 수신하도록 통신부(19-2)를 제어한다.
스텝 S12-2에 있어서, 촬영 제어부(92)는, 촬영 처리를 실행한다. 본 실시형태의 촬영 처리에서는, 셀프타이머 기능에 의해 소정 시간 경과 후에 촬영이 행해진다. 그리고, 셀프타이머가 동작하는 동안, 라이브 뷰 화상을 리스트 단말기(1)에 송신하도록 구성해도 된다.
스텝 S13-2에 있어서, 통신 제어부(91)는, 촬영 처리의 결과, 촬영된 화상을 리스트 단말기(1)에 송신하도록 통신부(19-2)를 제어한다. 그 후, 촬영 단말기(2) 측의 음성 투고 처리는 종료한다.
[휴대 단말기(3) 측의 음성 투고 처리]
스텝 S11-3에 있어서, 통신 제어부(111)는, 음성 인식 지시 및 음성 인식용의 음성 데이터를 수신하도록 통신부(19-3)를 제어한다.
스텝 S12-3에 있어서, 통신 제어부(111)는, 외부의 음성 인식 서버에 대하여, 음성 인식 지시 및 음성 인식용의 음성 데이터를 송신하도록 통신부(19-3)를 제어한다.
스텝 S13-3에 있어서, 통신 제어부(111)는, 외부의 음성 인식 서버로부터, 음성 인식 결과를 수신하도록 통신부(19-3)를 제어한다.
스텝 S14-3에 있어서, 통신 제어부(111)는, 리스트 단말기(1)에 대하여, 음성 인식 결과를 송신하도록 통신부(19-3)를 제어한다.
스텝 S15-3에 있어서, 통신 제어부(111)는, 리스트 단말기(1)로부터, 투고 지시와, 화상 데이터 및 문자열 데이터를 수신으로 하도록 통신부(19-3)를 제어한다.
스텝 S16-3에 있어서, 통신 제어부(111)는, 투고처의 SNS 서버에, 투고 내용인 화상 데이터 및 문자열 데이터를 송신하도록 통신부(19-3)를 제어한다.
그 후, 휴대 단말기(3) 측의 음성 투고 처리는 종료한다.
<제2 실시형태>
도 11은, 제2 실시형태에 관한 투고 시스템(S)의 시스템 구성을 나타낸 시스템 도면이다.
본 실시형태의 투고 시스템(S)은, 제1 실시형태와는 달리, 도 11에 나타낸 바와 같이, 음성 입력 기능과 투고 기능을 가지는 리스트 단말기(1)와, 촬영 기능을 가지는 촬영 단말기(2)로 구성된다. 그리고, 기능 블록에 대해서는, 제1 실시형태의 도 7에 나타낸 리스트 단말기(1) 및 도 8에 나타낸 촬영 단말기(2)와 동일하므로 설명 및 도시를 생략한다.
그리고, 본 실시형태의 구성은, 리스트 단말기(1)에 SIM 카드가 있는 것과 같은 경우에 보다 유효적으로 기능한다.
도 12는, 제2 실시형태의 투고 시스템(S)에 의해 실행되는 음성 투고를 설명하기 위한 모식도이다.
본 실시형태의 투고 시스템(S)에서는, 도 12의 예에 나타낸 바와 같이, 예를 들면, 「정상 나우(on top of a mountain now)」)라고 하는 음성을 리스트 단말기(1)에 입력(중얼거림; saying)함으로써, 상기 음성을 트리거로 하여, 촬영 단말기(2)와 셀프타이머 촬영이 행해지고, 휴대 단말기(3)에 있어서 입력한 음성의 음성 인식이 된다.
그 후, 음성 인식된 문자열이 촬영된 화상과 함께 리스트 단말기(1)의 화면에 표시된다. 그리고, 라이브 뷰 화상을 리스트 단말기(1)의 화면에 표시시켜, 소정 시간 경과 후에 타이머 표시를 행하여 촬영하도록 구성해도 된다. 또한, 셀프타이머 시에 리스트 단말기(1)를 조작(터치 조작)함으로써, 촬영을 일시 정지시키는 것이 가능하게 구성된다. 또한, 셀프타이머의 시간 설정도 임의로 변경할 수 있도록 구성된다.
최종적으로, 리스트 단말기(1)의 화면에 표시된 중얼댐(words said)과 화상이 SNS에 업로드되어 투고되고, 자신의 트이트로서 공개된다. 그리고, 투고 데이터의 송신 중에, 리스트 단말기(1)를 조작(터치 조작)해 투고를 중지시키거나 하도록 구성해도 된다.
도 13은, 도 7 및 도 8의 기능적 구성을 가지는 도 4의 리스트 단말기(1) 및 도 5의 촬영 단말기(2)가 실행하는 음성 투고 처리의 흐름을 설명하는 플로우차트이다. 음성 투고 처리의 개시에 있어서, 투고처 설정부(51)에 의해 투고처 워드가 사용자에 의해 사전에 등록되어 있는 상태, 즉 투고처 기억부(71)에 개인 어카운트 설정을 포함하는 투고처의 정보와 투고처 워드가 등록되어 있는 상태로 되어 있다. 또한, 리스트 단말기(1) 및 촬영 단말기(2)의 사이에서는, 서로 통신 가능하게 접속이 완료되어 있는 상태로 되어 있다. 또한, 음성 투고용의 어플리케이션을 사용자의 조작 등으로 기동하여, 음성 입력이 가능한 상태로 되므로, 음성 투고 처리가 개시된다.
그리고, 음성 투고용의 어플리케이션을 기동하여, 음성 입력이 가능한 상태로 함으로써, 음성 투고 처리를 개시하도록 구성하였지만, 이에 한정되지 않고, 모든 동작을 음성 입력으로 행하도록 구성해도 된다. 예를 들면, 음성 입력에 따라 음성 투고용의 어플리케이션을 자동 기동시켜, 음성 입력이 가능한 상태로 하고 나서, 음성 투고 처리를 개시하도록 구성해도 된다.
[리스트 단말기(1) 측의 음성 투고 처리]
스텝 S31-1에 있어서, 입력 검출부(52)는, 사용자로부터 입력부(16-1)를 통하여, 음성의 입력이 검출되었는지의 여부를 판정한다.
음성의 입력이 검출되어 있지 않은 경우에는, 스텝 S31-1에 있어서 NO라고 판정되어, 대기 상태로 된다.
음성의 입력이 검출된 경우에는, 스텝 S31-1에 있어서 YES라고 판정되고, 처리는 스텝 S32-1로 진행한다.
스텝 S32-1에 있어서, 통신 제어부(53)는, 촬영 지시를 촬영 단말기(2)에 송신하고, 음성 입력에 의해 입력된 음성 데이터를 외부의 음성 인식 서버에 송신하도록 통신부(19-1)를 제어한다.
그 후, 촬영 단말기(2)에서는, 촬영 지시를 받아, 촬영 처리가 실행된다. 또한, 외부의 음성 인식 서버에서는, 음성 인식이 실행된다.
스텝 S33-1에 있어서, 통신 제어부(53)는, 촬영 단말기(2)로부터 촬영 지시에 따라 촬영된 화상을 수신하고, 외부의 음성 인식 서버로부터 음성 인식 결과 (본 실시형태에 있어서는, 문자열 데이터)를 수신하도록 통신부(19-1)를 제어한다.
스텝 S34-1에 있어서, 문자열 해석부(54)는, 외부의 음성 인식 서버로부터 수신한 문자열 데이터를 해석하여, 투고처 워드를 문자열의 말미에 포함하고 있는지의 여부를 판정한다.
투고처 워드를 문자열의 말미에 포함하지 않을 경우에는, 스텝 S34-1에 있어서 NO라고 판정되어, 리스트 단말기(1) 측의 음성 투고 처리는 종료한다.
투고처 워드를 문자열의 말미에 포함하고 있는 경우에는, 스텝 S34-1에 있어서 YES라고 판정되어, 처리는 스텝 S35-1로 진행한다.
스텝 S35-1에 있어서, 투고처 결정부(55)는, 투고처 기억부(71)를 참조하고, 말미에 포함되는 투고처 워드에 대응하는 투고처를 결정한다.
스텝 S36-1에 있어서, 표시 제어부(56)는, 촬영 단말기(2)로부터 수신한 화상과, 외부의 음성 인식 서버로부터 수신한 문자열을 표시 출력하도록 출력부(17-1)를 제어한다.
스텝 S37-1에 있어서, 통신 제어부(53)는, 투고처 워드에 대응하는 투고처로 되는 SNS 서버에 대하여, 화상 데이터와 문자열 데이터를 송신하도록 통신부(19-1)를 제어하여, 투고 처리를 행한다. 또한, 송신에 있어서, 투고 내용인 문자열 및 화상 데이터가 투고 내용 정보 기억부(72)에 기억된다.
그 후, 리스트 단말기(1) 측의 음성 투고 처리는 종료한다.
[촬영 단말기(2) 측의 음성 투고 처리]
스텝 S31-2)에 있어서, 통신 제어부(91)는, 리스트 단말기(1)로부터 촬영 지시를 수신하도록 통신부(19-2)를 제어한다.
스텝 S32-2에 있어서, 촬영 제어부(92)는, 촬영 처리를 실행한다. 본 실시형태의 촬영 처리에서는, 셀프타이머 기능에 의해 소정 시간 경과 후에 촬영이 행해진다. 그리고, 셀프타이머가 동작하는 동안, 라이브 뷰 화상을 리스트 단말기(1)에 송신하도록 구성해도 된다.
스텝 S33-2에 있어서, 통신 제어부(91)는, 촬영 처리의 결과, 촬영된 화상을 리스트 단말기(1)에 송신하도록 통신부(19-2)를 제어한다. 그 후, 촬영 단말기(2) 측의 음성 투고 처리는 종료한다.
<제3 실시형태>
전술한 실시형태에서는, 복수의 단말기에 의해, 음성 투고 처리를 실행하도록 구성하였지만, 본 실시형태에서는, 촬영 기능과, 음성 입력 기능과, 투고 기능을 구비한 단체(單體)의 단말기에 의해 음성 투고 처리를 실행하도록 구성한다. 본 실시형태에 있어서는, 디지털 카메라로서 구성한 촬영 단말기(2)에, 촬영 기능에 더하여, 음성 입력 기능 및 투고 기능을 구비하여 스탠드얼론기(stand-alone device)로서 구성하여, 음성 투고 처리를 실행한다.
도 14는, 본 실시형태의 촬영 단말기(2)의 하드웨어의 구성을 나타낸 블록도이다. 그리고, 본 실시형태에 있어서 추가된 하드웨어 구성에 대해서는, 전술한 리스트 단말기(1) 및 휴대 단말기(3)와 동일하므로, 설명을 생략한다.
도 15는, 도 14의 촬영 단말기(2)의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다. 그리고, 본 실시형태에 있어서 재구성된 기능 블록[투고처 설정부(131) 내지 표시 제어부(137), 투고처 기억부(151), 투고 내용 정보 기억부(152)]는, 전술한 리스트 단말기(1)의 투고처 설정부(51), 입력 검출부(52), 통신 제어부(53), 문자열 해석부(54), 투고처 결정부(55), 표시 제어부(56), 투고처 기억부(71), 투고 내용 정보 기억부(72) 및 휴대 단말기(3)의 통신 제어부(91), 촬영 제어부(92)와 동일하므로 설명을 생략한다.
도 16은, 도 15의 기능적 구성을 가지는 도 14의 촬영 단말기(2)가 실행하는 음성 투고 처리의 흐름을 설명하는 플로우차트이다. 음성 투고 처리의 개시에 있어서, 투고처 설정부(131)에 의해, 투고처 워드가 사용자에 의해 사전에 등록되어 있는 상태, 즉 투고처 기억부(71)에 개인 어카운트 설정을 포함하는 투고처의 정보와 투고처 워드가 등록되어 있는 상태로 되어 있다. 또한, 음성 투고용의 어플리케이션을 사용자의 조작 등으로 기동하여, 음성 입력이 가능한 상태로 되므로, 음성 투고 처리가 개시된다.
그리고, 음성 투고용의 어플리케이션을 기동하여, 음성 입력이 가능한 상태로 함으로써, 음성 투고 처리를 개시하도록 구성하였지만, 이에 한정되지 않고, 모든 동작을 음성 입력으로 행하도록 구성해도 된다. 예를 들면, 음성 입력에 따라 음성 투고용의 어플리케이션을 자동 기동시켜, 음성 입력이 가능한 상태로 하고 나서, 음성 투고 처리를 개시하도록 구성해도 된다.
스텝 S51에 있어서, 입력 검출부(132)는, 사용자로부터 입력부(16-2)를 통하여, 음성의 입력이 검출되었는지의 여부를 판정한다.
음성의 입력이 검출되어 있지 않은 경우에는, 스텝 S51에 있어서 NO라고 판정되어, 대기 상태로 된다.
음성의 입력이 검출된 경우에는, 스텝 S51에 있어서 YES라고 판정되어, 처리는 스텝 S52로 진행한다.
스텝 S52에 있어서, 촬영 제어부(133)는, 촬영 처리를 실행한다. 본 실시형태의 촬영 처리에서는, 셀프타이머 기능에 의해 소정 시간 경과 후에 촬영이 행해진다. 그리고, 셀프타이머가 동작하는 동안, 표시 제어부(137)는, 라이브 뷰 화상을 표시하도록 출력부(17-2)를 제어해도 된다.
스텝 S53에 있어서, 통신 제어부(134)는, 음성 입력에 의해 입력된 음성 데이터를 외부의 음성 인식 서버에 송신하도록 통신부(19-2)를 제어한다.
그 후, 외부의 음성 인식 서버에서는, 음성 인식이 실행된다.
스텝 S54에 있어서, 통신 제어부(134)는, 외부의 음성 인식 서버로부터 음성 인식 결과(본 실시형태에 있어서는, 문자열 데이터)를 수신하도록 통신부(19-2)를 제어한다.
스텝 S55에 있어서, 문자열 해석부(135)는, 외부의 음성 인식 서버로부터 수신한 문자열 데이터를 해석하여, 투고처 워드를 문자열의 말미에 포함하고 있는지의 여부를 판정한다.
투고처 워드를 문자열의 말미에 포함하지 않을 경우에는, 스텝 S55에 있어서 NO라고 판정되어, 음성 투고 처리는 종료한다.
투고처 워드를 문자열의 말미에 포함하고 있는 경우에는, 스텝 S55에 있어서 YES라고 판정되어, 처리는 스텝 S56으로 진행한다.
스텝 S56에 있어서, 투고처 결정부(136)는, 투고처 기억부(71)를 참조하고, 말미에 포함되는 투고처 워드에 대응하는 투고처를 결정한다.
스텝 S57에 있어서, 표시 제어부(137)는, 촬영한 화상과, 외부의 음성 인식 서버로부터 수신한 문자열을 표시 출력하도록 출력부(17-2)를 제어한다.
스텝 S58에 있어서, 통신 제어부(134)는, 투고처 워드에 대응하는 투고처로 되는 SNS 서버에 대하여, 화상 데이터와 문자열 데이터를 송신하여, 투고 처리를 행한다. 또한, 송신에 있어서, 투고 내용인 문자열 및 화상 데이터가 투고 내용 정보 기억부(152)에 기억된다.
그 후, 음성 투고 처리는 종료한다.
종래에는, 아웃 도어에서는, SNS로의 투고가 자주 행해지지만, 수순으로서는, 예를 들면, (1) 단말기를 인출하고, (2) SNS 어플리케이션을 기동하고, (3) 문자 입력하고, (4) 카메라 어플리케이션을 기동하고, (5) 촬영하고, (6) 투고 버튼을 누르는 등의 조작에 의해 행해지고 있고, 많은 조작 등을 필요로 하는 것이었다.
본 기능에 있어서는, 리스트 단말기(1)에 음성 입력하는 것만으로, 신속하게, 촬영, 문자 입력, 투고가 일체로 하여 행해지도록 한 본 기능을 실장(實裝)함으로써, 「보다 간단하게, 보다 신속하게」투고할 수 있어, 새로운 사용자 체험으로 연결할 수 있다.
이상과 같이 구성되는 촬영 단말기(2)는, 촬영 제어부(133)와, 입력 검출부(132)와, 촬영 제어부(133)와, 통신 제어부(134)를 구비한다.
촬영 제어부(133)는, 화상을 취득한다.
입력 검출부(132)는, 사용자로부터 발해지는 소정의 음성을 취득한다.
촬영 제어부(133)는, 입력 검출부(132)에 의해 취득된 소정의 음성과 동일한 음성에 기초하여, 화상을 취득하도록 제어한다.
통신 제어부(134)는, 입력 검출부(132)에 의해 취득된 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 화상을 보존시키는 제어를 행한다.
이로써, 촬영 단말기(2)에 있어서는, 음성의 입력에 의해 화상을 취득하여, 입력된 소정의 음성과 동일한 음성의 내용에 따른 기억처에, 상기 화상을 보존하는 제어를 행하기 위해, 번거로운 작업없이, 촬영된 사진을 간단하게 적절한 장소에 업로드할 수 있다.
통신 제어부(134)는, 소정의 음성과 동일한 음성을 문자 정보로 변환하는 제어를 행하는 지시를 송신하도록 통신부(19-3)를 제어한다.
통신 제어부(134)는, 화상과 함께 문자 정보를 보존하는 제어를 행한다.
이로써, 촬영 단말기(2)에 있어서는, 1의 음성 입력으로 화상과 문자 정보를 보존할 수 있어, 번거로운 작업없이, 간단하게 적절한 장소에 업로드할 수 있다.
또한, 촬영 단말기(2)는, 투고처 설정부(131)를 더 구비한다.
투고처 설정부(131)는, 입력 검출부(132)에 의해 취득되는 소정의 음성과 동일한 음성의 내용과, 기억처를 대응시켜 설정한다.
통신 제어부(134)는, 입력 검출부(132)에 의해 취득된 소정의 음성과 동일한 음성의 내용에 대응한 투고처 설정부(131)에 의해 설정된 기억처에 보존시키는 지시를 송신하도록 통신부(19-3)를 제어한다.
이로써, 촬영 단말기(2)에 있어서는, 사용자에 의해 미리 소정의 음성과 동일한 음성의 내용에 대응한 기억처를 임의로 설정할 수 있다.
기억처에 대응되는 소정의 음성과 동일한 음성의 내용은, 기억처와 관련된 키워드이다.
이로써, 촬영 단말기(2)에 있어서는, 소정의 음성과 동일한 음성의 내용이 기억처와 관련된 키워드이므로, 기억처를 상기하기 쉽고, 간단하게 의도한 기억처를 지정할 수 있다.
기억처에 대응되는 소정의 음성과 동일한 음성의 내용은, 소정의 음성과 동일한 음성의 말미의 내용이다.
이로써, 촬영 단말기(2)에 있어서는, 소정의 음성과 동일한 음성의 내용이 음성의 말미의 내용이므로, 음성을 입력하는 사용자는, 기억처를 지정하는 사고(思考)로 이미지나 감상을 방해하기 어려워져, 보다 직감적으로 음성을 발하기 용이해진다.
또한, 촬영 단말기(2)는, 촬상부(21-2)를 더 구비한다.
촬영 제어부(133)는, 입력 검출부(132)에 의해 취득된 특정한 음성의 내용으로 촬영을 행하도록 촬상부(21-2)를 제어하고, 촬상부(21-2)에 의해 촬영된 화상을 취득한다.
이로써, 촬영 단말기(2)에 있어서는, 번거로운 작업없이, 촬영된 사진을 간단하게 적절한 장소에 업로드할 수 있다.
촬영 제어부(133)는, 셀프타이머 촬영을 행하도록 촬상부(21-2)를 제어한다.
이로써, 촬영 단말기(2)에 있어서는, 셀프타이머 촬영에 의해, 음성 입력으로부터 소정 시간 후에 촬영이 행해지는 것이 보증되므로, 사용자가 촬영의 타이밍을 인식하기 용이해진다.
또한, 촬영 단말기(2)는, 사용자의 음성을 입력하는 입력부(16-2)를 더 구비한다.
입력 검출부(132)는, 입력부(16-2)에 의해 입력된 음성을 취득한다.
이로써, 촬영 단말기(2)에 있어서는, 자체의 마이크 등의 입력부(16-2)에 음성을 입력시킬 수 있어, 보다 간단하게 조작을 행할 수 있다.
기억처는, 상기 전자 기기의 외부에 설치된다. 이로써, 촬영 단말기(2)에 있어서는, 외부의 기억처에 간단하게 화상 등을 기억시킬 수 있다.
기억처는, 웹 상의 스토리지 서버 또는 SNS가 제공하는 서버이다. 이로써, 촬영 단말기(2)에 있어서는, 웹 상의 스토리지 서버 또는 SNS가 제공하는 서버에 간단하게 업로드할 수 있다.
이상과 같이 구성되는 투고 시스템(S)은, 리스트 단말기(1)와 촬영 단말기(2)로 이루어진다. 리스트 단말기(1)는, 입력 검출부(52)와, 통신부(19-1)와, 통신 제어부(53)를 구비한다.
입력 검출부(52)는, 사용자로부터 발해지는 음성을 취득한다. 통신부(19-1)는, 입력 검출부(52)에 의해 취득된 음성에 기초하여 피사체를 촬영하는 촬영 지시를 촬영 단말기(2)에 송신한다. 통신부(19-1)는, 촬영 지시에 기초하여 촬영 단말기(2)에 의해 촬영된 화상 데이터를 촬영 단말기(2)로부터 수신한다.
통신 제어부(53)는, 입력 검출부(52)에 의해 취득된 음성의 내용에 따라 미리 설정된 기억처에, 화상을 보존시키는 제어를 행한다.
촬영 단말기(2)는, 촬상부(21-2)와, 통신부(19-2)를 구비한다.
통신부(19-2)는, 리스트 단말기(1)의 통신부(19-1)로부터 송신되는 촬영 지시를 수신한다.
촬영 제어부(133)는, 통신부(19-2)에 의해 수신된 촬영 지시에 기초하여, 피사체를 촬영하도록 촬상부(21-2)를 제어한다.
통신부(19-2)는, 화상 데이터를 리스트 단말기(1)에 송신한다.
이로써, 촬영 단말기(2)에 있어서는, 음성의 입력에 의해 화상을 취득하여, 입력된 음성의 내용에 따른 기억처에, 상기 화상을 보존하는 제어를 행하기 위해, 번거로운 작업없이, 촬영된 사진을 간단하게 적절한 장소에 업로드할 수 있다.
그리고, 본 발명은, 전술한 실시형태에 한정되지 않고, 본 발명의 목적을 달성할 수 있는 범위에서의 변형, 개량 등은 본 발명에 포함되는 것이다.
전술한 실시형태에서는, 음성 인식을 외부의 음성 인식 서버에 의해 행하고 있었지만, 음성 인식 기능을 탑재하여, 자기(自機; user's own device)에 의해 음성 인식에 관한 처리를 행하도록 구성해도 된다. 또한, 음성 인식 결과에 특정한 문자열이 포함되어 있었을 경우에, 촬영을 행하도록 구성해도 된다. 이로써, 음성이 입력된 것을 계기로 촬영하는 경우와 비교하여, 즉시성은 저하되지만, 특정한 문자열이 포함되어 있지 않은 경우에는 촬영은 행해지지 않으므로, 불필요한 촬영을 실시하지 않아도 되게 된다.
또한, 전술한 실시형태에서는, 상이한 외부의 기억처에 기억시키도록 구성하고자 하지만, 또한 미세하게, 내부/외부에 관계없이 상이한 기억 장소(폴더 등)와 하는 제어를 행하도록 구성해도 된다.
또한, 전술한 실시형태에서는, 특정한 문자열인 말미의 음성 내용도 투고 내용에 포함하였지만, 말미의 음성 내용을 제외한 부분을 투고 내용으로 해도 된다. 또한, 특정한 문자열을 말미로 하였으나, 이에 한정되지 않고, 선두(先頭; top), 의미가 있는 음성 내용(예를 들면, 단어) 간, 임의의 특정한 장소, 단지 음성 내용에 일부에 포함되어 있도록 구성해도 된다.
또한, 전술한 실시형태에서는, 말미의 특정한 문자열은 기억처로 되는 투고처를 직접적으로 또는 간접적으로 상기시키는 것과 같은 투고처에 관련된 키워드, 즉 「나우(now)」나 「좋아요(like)」가 설정되어 있지만, 사용자가 이들 문자열을 자유롭게 설정할 수 있도록 해도 된다.
또한, 전술한 실시형태에서는, 음성 내용이 임의의 문자열+말미에 특정한 문자열이라는 구성으로 화상과 텍스트의 투고가 행해지도록 구성하였지만, 예를 들면, 「나우(now)」나 「좋아요(like)」의 특정한 문자열뿐이었던 경우에는, 화상만으로 투고를 행하도록(대응하는 기억처에 기억시키도록) 구성해도 된다. 이 경우에 있어서, 특정한 문자열도 화상과 함께 투고시키도록(대응하는 기억처에 기억시키도록) 구성해도 된다.
또한, 전술한 실시형태에서는, 입력된 음성의 모두를 사용하여 판단하도록 구성하였지만, 입력된 음성의 일부를 사용하도록 구성해도 된다. 예를 들면, 특정한 문자열이 말미에 있는 경우에는, 말미의 직전의 문자열만을 사용하도록 구성해도 된다.
또한, 전술한 실시형태에서는, 음성 인식을 행하여 텍스트 레벨로 음성 내용을 비교 판단하도록 구성하였지만, 예를 들면, 입력된 음성과, 미리 기억되어 있는 음성 데이터를 비교하여 판단하도록 구성해도 된다. 이 경우, 단순하게 음성 내용의 일치 불일치를 판단해도 되고, 시큐리티의 향상을 목적으로 하여, 음성 내용과 성문 레벨(voiceprint level)에서의 일치 불일치를 판단해도 된다. 또한, 투고 내용을 텍스트 대신에, 음성 파일로 행하도록 구성해도 된다.
또한, 전술한 실시형태에서는, 본 발명이 적용되는 리스트 단말기(1), 촬영 단말기(2) 및 휴대 단말기(3)는, 스마트 시계, 디지털 카메라, 스마트 폰을 예로서 설명하였으나, 특별히 이에 한정되지 않는다.
예를 들면, 본 발명은, 음성 투고 처리 기능을 가지는 전자 기기 일반에 적용할 수 있다.
구체적으로는, 예를 들면, 본 발명은, 노트북형의 퍼스널 컴퓨터, 프린터, 텔레비전 수상기, 비디오 카메라, 휴대형 네비게이션 장치, 휴대 전화기, 휴대용 게임기 등에 적용할 수 있다.
전술한 일련의 처리는, 하드웨어에 의해 실행시킬 수도 있고, 소프트웨어에 의해 실행시킬 수도 있다.
바꾸어 말하면, 도 7, 도 8, 도 9 및 도 15의 기능적 구성은 예시에 지나지 않고, 특별히 한정되지 않는다.
즉, 전술한 일련의 처리를 전체로서 실행할 수 있는 기능이 리스트 단말기(1), 촬영 단말기(2) 및 휴대 단말기(3)에 구비되어 있으면 되고, 이 기능을 실현하기 위해 어떠한 기능 블록을 사용할 것인지는 특히 도 7, 도 8, 도 9 및 도 15의 예에 한정되지 않는다.
또한, 1개의 기능 블록은, 하드웨어 단체로 구성해도 되고, 소프트웨어 단체로 구성해도 되고, 이들의 조합에 의해 구성해도 된다.
일련의 처리를 소프트웨어에 의해 실행시키는 경우에는, 그 소프트웨어를 구성하는 프로그램이, 컴퓨터 등에 네트워크나 기록 매체로부터 인스톨된다.
컴퓨터는, 전용의 하드웨어에 내장되어 있는 컴퓨터라도 된다. 또한, 컴퓨터는, 각종 프로그램을 인스톨함으로써, 각종 기능을 실행할 수 있는 컴퓨터, 예를 들면, 범용의 퍼스널 컴퓨터라도 된다.
이와 같은 프로그램을 포함하는 기록 매체는, 사용자에게 프로그램을 제공하기 위해 장치 본체와는 별도로 배포되는 도 4, 도 5, 도 6 및 도 14의 착탈 가능 매체(31-1), (31-2), (31-3)에 의해 구성될뿐아니라, 장치 본체에 미리 내장된 상태로 사용자에게 제공되는 기록 매체 등으로 구성된다. 착탈 가능 매체(31-1), (31-2), (31-3)는, 예를 들면, 자기 디스크(플로피 디스크를 포함함), 광디스크, 또는 광자기 디스크 등에 의해 구성된다. 광디스크는, 예를 들면, CD-ROM(Compact Disk-Read Only Memory), DVD(Digital Versatile Disk), Blu-ray(등록상표) disc[블루 레이 디스크] 등에 의해 구성된다. 광자기 디스크는, MD(Mini-Disk) 등에 의해 구성된다. 또한, 장치 본체에 미리 내장된 상태로 사용자에게 제공되는 기록 매체는, 예를 들면, 프로그램이 기록되어 있는 도 4, 도 5, 도 6 및 도 14의 ROM(12-1), (12-2), (12-3)이나, 도 4, 도 5, 도 6 및 14의 기억부(18-1), (18-2), (18-3)에 포함되는 하드디스크 등으로 구성된다.
그리고, 본 명세서에 있어서, 기록 매체에 기록되는 프로그램을 기술(記述)하는 스텝은, 그 순서에 따라 시계열적으로 행해지는 처리는 물론, 반드시 시계열적으로 처리되지 않아도, 병렬적 또는 개별적으로 실행되는 처리도 포함하는 것이다.
또한, 본 명세서에 있어서, 시스템의 용어는, 복수의 장치나 복수의 수단 등으로 구성되는 전체적인 장치를 의미하는 것으로 한다.
이상, 본 발명의 몇 가지의 실시형태에 대하여 설명하였으나, 이들 실시형태는, 예시에 지나지 않고, 본 발명의 기술적 범위를 한정되는 것은 아니다. 본 발명은 그 외의 다양한 실시형태를 취하는 것이 가능하고, 또한 본 발명의 요지를 벗어나지 않는 범위에서, 생략이나 치환 등 각종 변경을 행할 수 있다. 이들 실시형태나 그 변형은, 본 명세서 등에 기재된 발명의 범위나 요지에 포함되는 동시에, 특허 청구의 범위에 기재된 발명과 그 균등한 범위에 포함된다.

Claims (14)

  1. 화상(image)을 취득하는 화상 취득 수단;
    사용자로부터 발해지는 소정의 음성을 취득하는 음성(sound) 취득 수단;
    상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여, 상기 화상을 취득하도록 상기 화상 취득 수단을 제어하는 화상 취득 제어 수단;
    상기 소정의 음성과 동일한 음성을 문자 정보로 변환하는 제어를 행하는 음성 변환 제어 수단; 및
    상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처(storage destination)에, 상기 화상 및 상기 문자 정보를 보존(storage)시키는 제어를 행하는 보존 제어 수단;
    을 포함하고,
    상기 기억처에 보존시키는 상기 문자 정보는 미리 정해진 키워드를 포함하는, 전자 기기.
  2. 삭제
  3. 제1항에 있어서,
    상기 음성 취득 수단에 의해 취득되는 상기 소정의 음성과 동일한 음성의 내용을, 상기 기억처에 대응시켜 설정하는 기억처 설정 수단을 더 포함하고,
    상기 보존 제어 수단은, 상기 기억처 설정 수단에 의해 설정된 상기 기억처에 화상을 보존시키는, 전자 기기.
  4. 제1항에 있어서,
    상기 기억처에 대응되는 상기 소정의 음성과 동일한 음성의 내용은, 상기 기억처와 관련된 키워드인, 전자 기기.
  5. 제1항에 있어서,
    상기 기억처에 대응되는 상기 소정의 음성과 동일한 음성의 내용은, 상기 소정의 음성과 동일한 음성의 말미(末尾; end)의 내용인, 전자 기기.
  6. 제1항에 있어서,
    촬영 수단; 및
    상기 촬영 수단을 제어하는 촬영 제어 수단;을 더 포함하고,
    상기 촬영 제어 수단은, 상기 음성 취득 수단에 의해 취득된 소정의 음성과 동일한 음성에 기초하여 촬영을 행하도록 상기 촬영 수단을 제어하고,
    상기 화상 취득 수단은, 상기 촬영 수단에 의해 촬영된 화상을 취득하는, 전자 기기.
  7. 제6항에 있어서,
    상기 촬영 제어 수단은, 셀프타이머 촬영을 행하도록 상기 촬영 수단을 제어하는, 전자 기기.
  8. 제1항에 있어서,
    사용자의 소정의 음성을 입력하는 음성 입력 수단을 더 포함하고,
    상기 음성 취득 수단은, 상기 음성 입력 수단에 의해 입력된 소정의 음성을 취득하는, 전자 기기.
  9. 제1항에 있어서,
    상기 기억처는, 상기 전자 기기의 외부에 설치되는, 전자 기기.
  10. 제1항에 있어서,
    상기 기억처는, 웹 상의 스토리지 서버 또는 SNS(Social Networking Service)가 제공하는 서버인, 전자 기기.
  11. 제1 장치와 제2 장치로 이루어지는 시스템으로서,
    상기 제1 장치는,
    사용자로부터 발해지는 소정의 음성을 취득하는 음성 취득 수단;
    상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여 피사체를 촬영하는 촬영 지시를 상기 제2 장치로 송신하는 제1 송신 수단;
    상기 촬영 지시에 기초하여 상기 제2 장치에 의해 촬영된 화상 데이터를 상기 제2 장치로부터 수신하는 제1 수신 수단;
    상기 소정의 음성과 동일한 음성을 문자 정보로 변환하는 제어를 행하는 음성 변환 제어 수단; 및
    상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 상기 화상 및 상기 문자 정보를 보존시키는 제어를 행하는 보존 제어 수단
    포함하고, 상기 기억처에 보존시키는 상기 문자 정보는 미리 정해진 키워드를 포함하며,
    상기 제2 장치는,
    촬영 수단;
    상기 제1 장치의 상기 제1 송신 수단으로부터 송신되는 상기 촬영 지시를 수신하는 제2 수신 수단;
    상기 제2 수신 수단에 의해 수신된 상기 촬영 지시에 기초하여, 피사체를 촬영하도록 상기 촬영 수단을 제어하는 촬영 제어 수단; 및
    상기 화상 데이터를 상기 제1 장치로 송신하는 제2 송신 수단;을 포함하는,
    시스템.
  12. 화상을 취득하는 화상 취득 단계;
    사용자로부터 발해지는 소정의 음성을 취득하는 음성 취득 단계;
    상기 음성 취득 단계에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여, 상기 화상을 취득하도록 상기 화상 취득 단계를 제어하는 화상 취득 제어 단계;
    상기 소정의 음성과 동일한 음성을 문자 정보로 변환하는 제어를 행하는 음성 변환 제어 단계; 및
    상기 음성 취득 단계에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 상기 화상 및 상기 문자 정보를 보존시키는 제어를 행하는 보존 제어 단계;
    를 포함하고,
    상기 기억처에 보존시키는 상기 문자 정보는 미리 정해진 키워드를 포함하는, 보존 제어 방법.
  13. 컴퓨터로 하여금,
    화상을 취득하는 화상 취득 수단;
    사용자로부터 발해지는 소정의 음성을 취득하는 음성 취득 수단;
    상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여, 상기 화상을 취득하도록 상기 화상 취득 수단을 제어하는 화상 취득 제어 수단;
    상기 소정의 음성과 동일한 음성을 문자 정보로 변환하는 제어를 행하는 음성 변환 제어 수단; 및
    상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 상기 화상 및 상기 문자 정보를 보존시키는 제어를 행하는 보존 제어 수단;
    으로서 기능하게 하고,
    상기 기억처에 보존시키는 상기 문자 정보는 미리 정해진 키워드를 포함하는,
    기록 매체에 기록된 프로그램.
  14. 촬상 수단을 가진 외부 기기와 통신을 행하는 통신 수단;
    사용자로부터 발해지는 음성을 취득하는 음성 취득 수단; 및
    취득한 상기 음성에 미리 정해진 키워드가 포함되어 있다고 판정한 경우, 상기 외부 기기의 촬상 수단에 화상을 촬영하게 하고, 상기 음성을 문자 정보로 변환하며, 상기 키워드에 응하여 미리 설정된 기억처에 상기 화상 및 상기 문자 정보를 보존시키는 제어 수단
    을 포함하는 전자 기기.
KR1020160112639A 2015-09-18 2016-09-01 전자 기기, 시스템, 보존 제어 방법 및 프로그램 KR102653751B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2015-185867 2015-09-18
JP2015185867A JP6634755B2 (ja) 2015-09-18 2015-09-18 電子機器、システム、保存制御方法及びプログラム

Publications (2)

Publication Number Publication Date
KR20170034315A KR20170034315A (ko) 2017-03-28
KR102653751B1 true KR102653751B1 (ko) 2024-04-01

Family

ID=58283583

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160112639A KR102653751B1 (ko) 2015-09-18 2016-09-01 전자 기기, 시스템, 보존 제어 방법 및 프로그램

Country Status (4)

Country Link
US (1) US10230884B2 (ko)
JP (1) JP6634755B2 (ko)
KR (1) KR102653751B1 (ko)
CN (1) CN107065400B (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6822941B2 (ja) * 2017-12-19 2021-01-27 Kddi株式会社 通信端末、端末制御プログラム、端末制御方法及び通信システム
US11902656B2 (en) * 2022-06-29 2024-02-13 Western Digital Technologies, Inc. Audio sensors for controlling surveillance video data capture
WO2024116848A1 (ja) * 2022-12-02 2024-06-06 ソニーグループ株式会社 プログラム、情報処理装置、情報処理システム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009027626A (ja) * 2007-07-23 2009-02-05 Canon Inc マイクロフォン装置、撮影装置、及びリモート撮影システム
US20130124207A1 (en) * 2011-11-15 2013-05-16 Microsoft Corporation Voice-controlled camera operations
US20140160316A1 (en) * 2012-12-12 2014-06-12 Lg Electronics Inc. Mobile terminal and control method thereof
JP2015115911A (ja) * 2013-12-16 2015-06-22 株式会社日立システムズ 行動記録装置、入出力装置、行動記録プログラムおよび行動記録方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189723A (ja) 2000-12-20 2002-07-05 Plaza Create Co Ltd デジタルフォトサービスシステム
US7343289B2 (en) * 2003-06-25 2008-03-11 Microsoft Corp. System and method for audio/video speaker detection
GB2405949A (en) * 2003-09-12 2005-03-16 Canon Kk Voice activated device with periodicity determination
GB2405948B (en) * 2003-09-12 2006-06-28 Canon Res Ct Europ Ltd Voice activated device
WO2006064170A1 (en) * 2004-12-14 2006-06-22 Nokia Corporation Improvements in or relating to electronic headset devices and associated electronic devices
US7697827B2 (en) * 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US8958848B2 (en) * 2008-04-08 2015-02-17 Lg Electronics Inc. Mobile terminal and menu control method thereof
US20090262205A1 (en) * 2008-04-21 2009-10-22 Dana Stephen Smith Voice activated headset imaging system
JP5053950B2 (ja) * 2008-07-29 2012-10-24 キヤノン株式会社 情報処理方法、情報処理装置、プログラムおよび記憶媒体
JP4449082B2 (ja) 2008-08-22 2010-04-14 富士フイルム株式会社 電子カメラ
US8635066B2 (en) * 2010-04-14 2014-01-21 T-Mobile Usa, Inc. Camera-assisted noise cancellation and speech recognition
US8700392B1 (en) * 2010-09-10 2014-04-15 Amazon Technologies, Inc. Speech-inclusive device interfaces
JP2012100214A (ja) 2010-11-05 2012-05-24 Nikon Corp 撮像装置、補正プログラム及び記録媒体
JP2014026642A (ja) * 2012-06-19 2014-02-06 Seiko Epson Corp 駐車場システム
CN104429049B (zh) * 2012-07-18 2016-11-16 华为技术有限公司 具有用于立体声录音的麦克风的便携式电子装置
KR101992676B1 (ko) * 2012-07-26 2019-06-25 삼성전자주식회사 영상 인식을 이용하여 음성 인식을 하는 방법 및 장치
JP6100263B2 (ja) * 2012-08-10 2017-03-22 株式会社ホンダアクセス 音声認識方法及び音声認識装置
US20140267742A1 (en) * 2013-03-15 2014-09-18 William F. Tapia Camera with remote watch
US9747900B2 (en) * 2013-05-24 2017-08-29 Google Technology Holdings LLC Method and apparatus for using image data to aid voice recognition
EP2899609B1 (en) * 2014-01-24 2019-04-17 Sony Corporation System and method for name recollection
KR20160034065A (ko) * 2014-09-19 2016-03-29 엘지전자 주식회사 이동 단말기 및 그 제어 방법
CN104853101A (zh) * 2015-05-18 2015-08-19 牟肇健 基于语音的智能化即时命名拍照技术

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009027626A (ja) * 2007-07-23 2009-02-05 Canon Inc マイクロフォン装置、撮影装置、及びリモート撮影システム
US20130124207A1 (en) * 2011-11-15 2013-05-16 Microsoft Corporation Voice-controlled camera operations
US20140160316A1 (en) * 2012-12-12 2014-06-12 Lg Electronics Inc. Mobile terminal and control method thereof
JP2015115911A (ja) * 2013-12-16 2015-06-22 株式会社日立システムズ 行動記録装置、入出力装置、行動記録プログラムおよび行動記録方法

Also Published As

Publication number Publication date
JP2017060127A (ja) 2017-03-23
KR20170034315A (ko) 2017-03-28
US20170085772A1 (en) 2017-03-23
CN107065400A (zh) 2017-08-18
CN107065400B (zh) 2019-12-03
US10230884B2 (en) 2019-03-12
JP6634755B2 (ja) 2020-01-22

Similar Documents

Publication Publication Date Title
KR101743194B1 (ko) 동영상 촬영 방법, 그 장치, 프로그램 및 기록매체
CN110035141B (zh) 一种拍摄方法及设备
TWI464513B (zh) 無線通訊系統、可攜式電子裝置以及遠端閃光源控制方法
US9456138B2 (en) Image processing apparatus, image processing method and computer readable recording medium having program for generating time-lapse moving image
RU2665304C2 (ru) Способ и устройство для установки параметра фотосъемки
JP2013110551A (ja) 情報処理装置、撮像装置、情報処理方法およびプログラム
WO2017047012A1 (ja) 撮像装置および撮像装置とサーバとを含むシステム
KR102653751B1 (ko) 전자 기기, 시스템, 보존 제어 방법 및 프로그램
CN103780843A (zh) 一种图像处理方法及电子设备
EP3062513A1 (en) Video apparatus and photography method thereof
WO2023284591A1 (zh) 视频拍摄方法及装置、电子设备和存储介质
US20140285679A1 (en) Image capture apparatus that photographs a specific subject, a communication method, a storage medium and a communication system
JP2014122978A (ja) 撮像装置、音声認識方法、及びプログラム
JP2017059121A (ja) 画像管理装置、画像管理方法及びプログラム
JP5023932B2 (ja) 撮像装置、シナリオによる画像撮影方法、およびプログラム
CN115700847A (zh) 绘本阅读方法及相关设备
JP7365793B2 (ja) 撮像装置およびその制御方法、プログラム
WO2023246711A1 (zh) 视频处理方法及相关设备
JP2018056776A (ja) 撮像装置、撮影システム、電源管理方法及びプログラム
WO2020066316A1 (ja) 撮影装置、撮影方法、及びプログラム
JP5746105B2 (ja) 情報機器及び情報表示方法
JP6354377B2 (ja) 撮像装置およびその制御方法とプログラム
JP2024005948A (ja) 撮像装置、その制御方法及びプログラム
JP2016010085A (ja) 撮像装置
JP2013179616A (ja) 撮像装置、撮像装置制御プログラム及び撮像制御方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant