KR102653751B1

KR102653751B1 - 전자 기기, 시스템, 보존 제어 방법 및 프로그램

Info

Publication number: KR102653751B1
Application number: KR1020160112639A
Authority: KR
Inventors: 다케시 오카다
Original assignee: 가시오게산키 가부시키가이샤
Priority date: 2015-09-18
Filing date: 2016-09-01
Publication date: 2024-04-01
Also published as: JP2017060127A; KR20170034315A; US20170085772A1; CN107065400A; CN107065400B; US10230884B2; JP6634755B2

Abstract

본 발명은, 번거로운 작업없이, 촬영된 사진을 간단하게 적절한 장소로 업로드할 수 있는 것이다. 촬영 단말기(2)는, 촬영 제어부(133)와, 입력 검출부(132)와, 촬영 제어부(133)와, 통신 제어부(134)를 구비한다. 촬영 제어부(133)는, 화상을 취득한다. 입력 검출부(132)는, 사용자로부터 발해지는 소정의 음성을 취득한다. 촬영 제어부(133)는, 입력 검출부(132)에 의해 취득된 소정의 음성과 동일한 음성에 기초하여, 화상을 취득하도록 제어한다. 통신 제어부(134)는, 입력 검출부(132)에 의해 취득된 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 화상을 보존시키는 제어를 행한다.

Description

전자 기기, 시스템, 보존 제어 방법 및 프로그램{ELECTRONIC APPARATUS, SYSTEM, STORAGE CONTROL METHOD, AND STORAGE MEDIUM}

본 출원에 대해서는, 2015년 9월 18일자에 출원된 일본특허출원 제2015-185867호를 기초로 하는 우선권을 주장하며, 상기 기초 출원의 내용은 모두 본원에 포함되는 것으로 한다.

본 발명은, 전자 기기, 시스템, 보존 제어 방법 및 프로그램에 관한 것이다.

종래부터, 예를 들면, 일본 공개특허 제2012-100214호 공보, 일본 공개특허 제2009-10987호와 같이 촬영 제어를 손 조작이 아니고, 음성으로 행하는 카메라의 기술이 개시되어 있다. 또한, 일본 공개특허 제2002-189723호 공보와 같이 촬영한 사진을 웹 상의 소정 서버에 업로드하는 기술이 개시되어 있다. 이를 이용한 SNS 등의 서비스도 개시되어 있다.

일본 공개특허 제2012-100214호 일본 공개특허 제2009-10987호 일본 공개특허 제2002-189723호

SNS 등의 웹 상의 서버에 사진을 업로드할 때는, 사진 촬영이 완료된 후, 촬영 장치 또는 사진이 보존되어 있는 메모리를 가지는 장치에 의해 전용(專用) 어플리케이션을 기동시켜, 보존된 사진 중에서 목적으로 하는 사진을 선택하여, 업로드처를 선택하여, 사진을 웹 상에 업로드한다는 번거로운 작업을 필요로 한다.

본 발명은, 이와 같은 문제점을 해결하기 위해 이루어진 것이며, 번거로운 작업없이, 사진을 촬영하여, 그 촬영된 사진을 간단하게 적절한 장소에 업로드할 수 있는 것을 목적으로 한다.

본 발명의 전자 기기는,

화상(image)을 취득하는 화상 취득 수단;

사용자로부터 발해지는 소정의 음성을 취득하는 음성(sound) 취득 수단;

상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여, 상기 화상을 취득하도록 상기 화상 취득 수단을 제어하는 화상 취득 제어 수단; 및

상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처(storage destination)에, 상기 화상을 보존(storage)시키는 제어를 행하는 보존 제어 수단;을 포함하는 것을 특징으로 한다.

또한, 본 발명의 시스템은,

제1 장치와 제2 장치로 이루어지는 시스템으로서,

상기 제1 장치는,

사용자로부터 발해지는 소정의 음성을 취득하는 음성 취득 수단;

상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여 피사체를 촬영하는 촬영 지시를 상기 제2 장치로 송신하는 제1 송신 수단;

상기 촬영 지시에 기초하여 상기 제2 장치에 의해 촬영된 화상 데이터를 상기 제2 장치로부터 수신하는 제1 수신 수단; 및

상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 상기 화상을 보존시키는 제어를 행하는 보존 제어 수단;을 포함하고,

상기 제2 장치는,

촬영 수단;

상기 제1 장치의 상기 제1 송신 수단으로부터 송신되는 상기 촬영 지시를 수신하는 제2 수신 수단;

상기 제2 수신 수단에 의해 수신된 상기 촬영 지시에 기초하여, 피사체를 촬영하도록 상기 촬영 수단을 제어하는 촬영 제어 수단; 및

상기 화상 데이터를 상기 제1 장치로 송신하는 제2 송신 수단;을 포함하는 것을 특징으로 한다.

또한, 보존 제어 방법은,

화상을 취득하는 화상 취득 단계;

사용자로부터 발해지는 소정의 음성을 취득하는 음성 취득 단계;

상기 음성 취득 단계에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여, 상기 화상을 취득하도록 상기 화상 취득 단계를 제어하는 화상 취득 제어 단계; 및

상기 음성 취득 단계에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 상기 화상을 보존시키는 제어를 행하는 보존 제어 단계;를 포함하는 것을 특징으로 한다.

또한, 본 발명의 기록 매체에 기록된 프로그램은,

컴퓨터로 하여금,

화상을 취득하는 화상 취득 수단;

상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 상기 화상을 보존시키는 제어를 행하는 보존 제어 수단;으로서 기능하도록 하는 것을 특징으로 한다.

본 명세서에 통합되고 또한 본 명세서의 일 부분을 구성하는 도면에 따라, 본 발명의 실시예를 설명하며, 또한 위에서 주어진 일반적인 설명과 함께, 본 발명의 구체적인 실시예에 대하여 아래에서 설명하되, 이는 본 발명의 원칙을 설명하기 위한 것이다.

본 발명에 의하면, 번거로운 작업없이, 촬영된 사진을 간단하게 적절한 장소에 업로드할 수 있다.

도 1은 본 발명의 일 실시형태에 관한 투고 시스템(posting system)의 시스템 구성을 나타낸 시스템 구성도이다.
도 2는 본 실시형태의 투고 시스템에 의해 실행되는 음성 투고를 설명하기 위한 모식도이다.
도 3은 본 실시형태의 음성 투고의 이용 장면을 나타낸 모식도이다.
도 4는 본 실시형태의 투고 시스템의 리스트 단말기(wrist terminal)의 하드웨어의 구성을 나타낸 블록도이다.
도 5는 본 실시형태의 투고 시스템의 촬영 단말기의 하드웨어의 구성을 나타낸 블록도이다.
도 6은 본 실시형태의 투고 시스템의 휴대 단말기의 하드웨어의 구성을 나타낸 블록도이다.
도 7은 도 4의 리스트 단말기의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다.
도 8은 도 5의 촬영 단말기의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다.
도 9는 도 6의 휴대 단말기의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다.
도 10은 도 7 내지 도 9의 기능적 구성을 가지는 도 4의 리스트 단말기(1), 도 5의 촬영 단말기 및 도 6의 휴대 단말기가 실행하는 음성 투고 처리의 흐름을 설명하는 플로우차트이다.
도 11은 제2 실시형태에 관한 투고 시스템의 시스템 구성을 나타낸 시스템 도면이다.
도 12는 본 실시형태의 투고 시스템에 의해 실행되는 음성 투고를 설명하기 위한 모식도이다.
도 13은 도 7 및 도 8의 기능적 구성을 가지는 도 4의 리스트 단말기(1) 및 도 5의 촬영 단말기가 실행하는 음성 투고 처리의 흐름을 설명하는 플로우차트이다.
도 14는 본 실시형태의 촬영 단말기의 하드웨어의 구성을 나타낸 블록도이다.
도 15는 도 14의 촬영 단말기의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다.
도 16은 도 15의 기능적 구성을 가지는 도 14의 촬영 단말기가 실행하는 음성 투고 처리의 흐름을 설명하는 플로우차트이다.

이하, 본 발명의 실시형태에 대하여, 도면을 참조하여 설명한다.

<제1 실시형태>

도 1은, 본 발명의 일 실시형태에 관한 투고 시스템의 시스템 구성을 나타낸 시스템 구성도이다.

본 실시형태의 투고 시스템(S)은, 도 1에 나타낸 바와 같이, 리스트 단말기(1)와, 촬영 단말기(2)와, 휴대 단말기(3)를 포함한다.

본 실시형태의 투고 시스템(S)에서는, 1(one)의 음성 입력에 의해, 투고 지시와 투고 내용의 입력과 촬영 지시를 행하여, 작성한 투고 내용의 텍스트와, 촬영한 화상을, SNS(Social Networking Service) 서버에 송신하여 투고를 행한다.

투고 시스템(S)을 구성하는 리스트 단말기(1)는, 사용자의 팔에 장착하여 사용되고, 음성 입력 기능과, 화면 표시 기능과, 통신 기능을 가진다.

리스트 단말기(1)는, 음성 입력을 행하여, 촬영과 입력된 음성의 음성 인식의 지시와, 음성 인식 결과에 따른 투고처(posting destination)에 대한 투고 지시를 휴대 단말기(3)에 행한다. 그리고, 투고 내용은, 음성 인식 결과의 문자열과, 촬영 지시에 의해 취득한 화상이다.

또한, 투고 시스템(S)을 구성하는 촬영 단말기(2)는, 사용자의 가방, 의복, 모자 등에 장착하여 사용되고, 통신 기능과, 촬영 기능을 가진다. 촬영 단말기(2)는, 리스트 단말기(1)로부터의 촬영 지시에 기초하여 촬영을 행하여, 화상을 리스트 단말기(1)에 송신한다.

또한, 투고 시스템(S)을 구성하는 휴대 단말기(3)는, 사용자가 휴대하고 있고, 통신 기능을 가진다. 휴대 단말기(3)에서는, 리스트 단말기(1)로부터 음성 인식 지시에 기초하여, 외부의 음성 인식 서버로부터 입력된 음성의 음성 인식 결과를 취득하여 리스트 단말기(1)에 송신한다. 또한, 휴대 단말기(3)에서는, 리스트 단말기(1)로부터의 투고 지시에 기초하여, 지정된 투고처로 되는 SNS 서버에 투고 내용을 송신하여, 투고를 행한다.

투고 내용의 화상과 문자열을 작성하기 위한 촬영 지시 및 음성 인식 지시와, 투고처를 결정하기 위한 음성 내용은, 임의의 내용 후에 계속되는 음성 내용 전체의 말미(末尾; end)의 내용이다. 즉, 음성 내용 전체는, 「임의의 음성 내용」＋「말미: 특정한 음성 내용」으로 구성되어 있고, 투고처를 결정하는 음성 내용은 「말미: 특정한 음성 내용」이다. 입력되는 음성 내용 전체로부터 판단하지 않고, 말미 부분의 음성 내용으로 판단하게 된다. 본 실시형태에 있어서는, 음성 내용을 문자열로서 취급하여, 입력된 음성에 대응하는 문자열의 말미의 문자열이 특정한 문자열인 경우(입력된 음성=「임의의 문자열＋말미가 특정한 문자열」)에, 본 기능이 동작하게 된다.

말미의 특정한 문자열은, 사용자가 임의로 설정하는 것이 가능하지만, 본 실시형태에 있어서는, 기억처(storage destination)로 되는 투고처를 직접적으로 또는 간접적으로 상기(想起)시키는 것과 같은 투고처에 관련된 키워드가 설정된다. 또한, 투고처에서 관용적(慣用的), 또는 공식적으로 사용되고 있는 워드를 사용하도록 구성한다.

구체적으로는, Twitter(등록상표)의 경우에는, 투고하고 싶은 내용과, Twitter에 있어서 관용되고 있는 현재 무엇을 하고 있는 것인지를 나타내는 「나우(now)」의 문언을 마지막으로 발해 음성 입력하면, 투고 내용의 텍스트와, 음성 입력했을 때 촬영한 화상이 Twitter의 자신의 어카운트(account)에 투고된다.

즉, 입력한 음성이 「○○○나우」의 경우에 자신의 어카운트(특정한 투고처)에, 음성 입력 시에 촬영한 화상과 함께 「○○○나우」의 텍스트가 자신의 Twitter의 어카운트에 투고되게 된다.

또한, Facebook(등록상표)의 경우에는, 투고하고 싶은 내용과, Facebook이 공식적으로 설치하고 있는 상대를 칭찬할 때 누르는 버튼의 문언인 「좋아요(like)」의 문언을 마지막으로 발하여 음성 입력하면, 투고 내용의 텍스트와, 음성 입력했을 때 촬영한 화상이 Facebook의 자신의 어카운트에 투고된다.

즉, 입력한 음성이 「○○○좋아요」의 경우에 자신의 어카운트(특정한 투고처)에, 음성 입력 시에 촬영한 화상과 함께 「○○○좋아요」의 텍스트가 자신의 Facebook의 어카운트에 투고되게 된다.

이와 같이, 음성의 말미에 투고처를 상기시키는 키워드를 투고·투고처의 지정 등을 판단하는 워드로 함으로써, 음성 입력을 하는 사용자는, 기분이나 감상 등의 문언을 발한 마지막에 특정한 워드를 발하면 되고, 투고·투고처의 지정 등을 의식해 기분이나 감상 등의 사고를 방해하지 않고 직감적으로 음성을 입력할 수 있다.

또한, 투고처를 지정하여, 투고를 지시하는 워드를 발하고 나서, 투고 내용을 발하도록 한 경우, 투고 내용을 발할 때까지 지루할 가능성이 있지만, 이 경우와 비교하여, 투고 내용을 먼저 발함으로써, 준비하기 위해 힘들이지 않고 직감적으로 발하기 용이해져 리얼타임감(real-time feeling)도 손상되지 않는다. 또한, 투고처와 관련되어 있고, 또한 관용적 또는 공식적으로 사용되고 있는 워드를 사용함으로써, 특정한 문언을 기억할 필요가 없어진다.

또한, 직감적으로 투고 내용만 발하고, 후에, 투고 내용에 따라 투고처를 선택하는 워드를 발하여, 투고처를 조정하는 것도 가능해진다.

도 2는, 본 실시형태의 투고 시스템(S)에 의해 실행되는 음성 투고를 설명하기 위한 모식도이다.

본 실시형태의 투고 시스템(S)에서는, 도 2의 예에 나타낸 바와 같이, 예를 들면, 「정상 나우(on the top of the mountain now)」라고 하는 음성을 리스트 단말기(1)에 입력(중얼거림; saying)함으로써, 상기 음성을 트리거로 하여, 촬영 단말기(2)에 의해 셀프타이머 촬영이 행해지고, 휴대 단말기(3)에 있어서 입력한 음성의 음성 인식이 된다. 그 후, 중얼댐(words said)은 텍스트화되어 촬영한 화상과 함께 리스트 단말기(1)의 화면에 표시된다. 그리고, 셀프타이머 시에 리스트 단말기(1)를 조작(터치 조작)함으로써, 촬영을 일시 정지시키거나, 투고를 중지시키거나 하는 것이 가능하게 구성된다. 또한, 셀프타이머의 시간 설정도 임의로 변경할 수 있도록 구성된다.

최종적으로, 리스트 단말기(1)의 화면에 표시된 중얼댐(words said)과 화상이 SNS 서버에 업로드되어 투고되어, 자신의 트이트(tweet)로서 공개된다.

도 3은, 본 실시형태의 음성 투고의 이용 장면을 나타낸 모식도이다.

본 실시형태의 음성 투고의 이용 장면은, 도 3에 나타낸 바와 같이, 다방면에 걸쳐 있고, 「산(mountain), 「캠프」, 「사이클링」, 「스키·스노보드」등의 단말기 등을 입력 조작할 수 없는 것과 같은 장면이나 구별 동작을 따르도록 한 장면에서 더욱 효과적으로 기능한다.

예를 들면, 등산하고 있는 것과 같은 경우에는, 입력·촬영 등의 단말기 조작은, 행하기 힘들다. 정상에 도착했을 때, 정상에 도착한 취지를 고지(告知)하는 「정상 도착 나우(on the top of the mountain now)」라는 음성 입력을 행함으로써, 정상 부근의 화상과, 「정상 도착 나우(on the top of the mountain now)」의 텍스트가 Twitter에 투고되게 된다.

또한, 캠프에서 식사를 하고 있는 것과 같은 경우에는, 입력·촬영 등의 단말기 조작을 행하고 있으면 식사의 감상(感想)의 리얼타임감이 없어져 버린다. 먹자 마자 식사의 감상을 고지하는 「맛있는 식사 나우(having a delicious meal now)」라는 음성 입력을 행함으로써, 식사 풍경의 화상과, 「맛있는 식사 나우」의 텍스트가 Twitter에 투고되게 된다.

또한, 사이클링하고 있는 것과 같은 경우에는, 입력·촬영 등의 단말기 조작은, 행하기 힘들다. 특정한 장소에 도착했을 때, 현재 지점(地点)의 명칭을 고지하는 「시마나미 왔네 좋아요!」의 음성 입력을 행함으로써, 주위의 풍경의 화상과, 「시마나미 왔네 좋아요!」의 텍스트가 Facebook에 투고되게 된다.

또한, 스키나 스노보드를 하고 있는 경우에는, 입력·촬영 등의 단말기 조작은, 행하기 힘들다. 달리고 있는 등의 특정한 장면을 만났을 때, 감상을 고지하는 「여러번 넘어짐, 좋아요!(I fell so many times, like!)」의 음성 입력을 행함으로써, 특정한 장면을 촬영한 화상과, 「여러번 넘어짐, 좋아요!」의 텍스트가 Facebook에 투고되게 된다.

도 4는, 본 실시형태의 투고 시스템(S)의 리스트 단말기(1)의 하드웨어의 구성을 나타낸 블록도이다.

리스트 단말기(1)는, 예를 들면, 스마트 시계로서 구성된다.

리스트 단말기(1)는, CPU(Central Processing Unit)(11-1)와, ROM(Read Only Memory)(12-1)과, RAM(Random Access Memory)(13-1)과, 버스(14-1)와, 입출력 인터페이스(15-1)와, 입력부(16-1)와, 출력부(17-1)와, 기억부(18-1)와, 통신부(19-1)와, 드라이브(20-1)를 구비하고 있다.

CPU(11-1)는, ROM(12-1)에 기록되어 있는 프로그램, 또는 기억부(18-1)로부터 RAM(13-1)에 로드된 프로그램에 따라 각종 처리를 실행한다.

RAM(13-1)에는, CPU(11-1)가 각종 처리를 실행하는 데 있어서 필요한 데이터 등도 적절히 기억된다.

CPU(11-1), ROM(12-1) 및 RAM(13-1)은, 버스(14-1)를 통하여 서로 접속되어 있다. 이 버스(14-1)에는 또한, 입출력 인터페이스(15-1)도 접속되어 있다. 입출력 인터페이스(15-1)에는, 입력부(16-1), 출력부(17-1), 기억부(18-1), 통신부(19-1) 및 드라이브(20-1)가 접속되어 있다.

입력부(16-1)는, 터치 패널로 구성되며, 사용자의 지시 조작에 따라 각종 정보를 입력한다.

또한, 입력부(16-1)는, 마이크로 구성되며, 사용자가 발하는 음성을 입력한다.

출력부(17-1)는, 디스플레이나 스피커 등으로 구성되며, 화상이나 음성을 출력한다.

기억부(18-1)는, 하드디스크 또는 DRAM(Dynamic Random Access Memory) 등으로 구성되며, 각종 화상의 데이터를 기억한다.

통신부(19-1)는, 인터넷을 포함하는 네트워크를 통하여 다른 장치(도시하지 않음)와의 사이에서 행하는 통신을 제어한다. 또한, 통신부(19-1)는, 다른 단말기와, 블루투스 통신(블루투스 Legacy 통신), Wi-Fi 통신 가능하게 구성된다.

또한, 통신부(19-1)는, 휴대 전화기의 통신 규격인 LTE(Long Term Evolution), 3G(제3 세대 이동 통신 시스템)의 방식으로, 인터넷을 통하여 각종 서버와 통신 가능하게 구성된다.

드라이브(20-1)에는, 자기(磁氣) 디스크, 광디스크, 광자기 디스크, 또는 반도체 메모리 등으로 이루어지는, 착탈 가능 매체(removable medium)(31-1)가 적절히 장착된다. 드라이브(20-1)에 따라서 착탈 가능 매체(31-1)로부터 판독된 프로그램은, 필요에 따라 기억부(18-1)에 인스톨된다. 또한, 착탈 가능 매체(31-1)는, 기억부(18-1)에 기억되어 있는 화상의 데이터 등의 각종 데이터도, 기억부(18-1)와 마찬가지로 기억할 수 있다.

도 5는, 본 실시형태의 투고 시스템(S)의 촬영 단말기(2)의 하드웨어의 구성을 나타낸 블록도이다. 촬영 단말기(2)는, 예를 들면, 디지털 카메라로서 구성된다.

촬영 단말기(2)는, 도 5에 나타낸 바와 같이, CPU(11-2) 내지 촬상부(撮像部)(21-2)를 구비하고 있다.

촬영 단말기(2)는, 리스트 단말기(1)의 출력부(17-1)에 상당하는 하드웨어 구성을 구비하지 않고, 촬상부(21-2)의 하드웨어 구성을 구비하고 있는 것이 상이하다. 리스트 단말기(1)와 마찬가지의 하드웨어 구성인 CPU(11-2) 내지 드라이브(20-2)의 설명은 생략한다.

촬상부(21-2)는, 도시하지 않지만, 광학 렌즈부와, 이미지 센서를 구비하고 있다.

광학 렌즈부는, 피사체를 촬영하기 위해, 광을 집광하는 렌즈, 예를 들면, 포커스 렌즈나 줌 렌즈 등으로 구성된다.

포커스 렌즈는, 이미지 센서의 수광면에 피사체상을 결상(結像)시키는 렌즈이다. 줌 렌즈는, 초점 거리를 일정한 범위에서 자유롭게 변화시키는 렌즈이다. 광학 렌즈부에는 또한, 필요에 따라 초점, 노출, 화이트 밸런스 등의 설정 파라미터를 조정하는 주변 회로가 설치된다.

이미지 센서는, 광전 변환 소자나, AFE(Analog Front End) 등으로 구성된다.

광전 변환 소자는, 예를 들면, CMOS(Complementary Metal Oxide Semiconductor)형의 광전 변환 소자 등으로 구성된다. 광전 변환 소자에는, 광학 렌즈부로부터 피사체상이 입사된다. 그래서, 광전 변환 소자는, 피사체상을 광전 변환[촬상(撮像)]하여 화상 신호를 일정 시간 축적하고, 축적된 화상 신호를 아날로그 신호로서 AFE에 순차적으로 공급한다.

AFE는, 이 아날로그의 화상 신호에 대하여, A/D(Analog/Digital) 변환 처리 등의 각종 신호 처리를 실행한다. 각종 신호 처리에 의해, 디지털 신호가 생성되고, 촬상부(21-2)의 출력 신호로서 출력된다.

이와 같은 촬상부(21-2)의 출력 신호를, 이하, 「촬상 화상의 데이터」라고 한다. 촬상 화상의 데이터는, CPU(11-2)나 도시하지 않은 화상 처리부 등에 적절히 공급된다.

도 6은, 본 실시형태의 투고 시스템(S)의 휴대 단말기(3)의 하드웨어의 구성을 나타낸 블록도이다.

휴대 단말기(3)는, 예를 들면, 스마트 폰으로서 구성된다.

휴대 단말기(3)의 하드웨어 구성[CPU(11-3) 내지 촬상부(21-3)]은, 전술한 리스트 단말기(1) 및 촬영 단말기(2)의 각각의 하드웨어 구성이 동일하므로, 설명을 생략한다.

도 7은, 도 4의 리스트 단말기(1)의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다.

음성 투고 처리란, 1번의 음성 입력에 의해, 문자 정보와 음성 입력 시점(時点)의 화상을, 특정한 SNS에 투고시키는 일련의 처리를 말한다.

그리고, 본 실시형태의 구성은, 리스트 단말기(1)에 SIM(Subscriber Identity Module) 카드가 없도록 한 경우에 보다 유효적으로 기능한다.

리스트 단말기(1) 측의 음성 투고 처리를 실행하는 경우에는, 도 7에 나타낸 바와 같이, CPU(11-1)에 있어서, 투고처 설정부(51)와, 입력 검출부(52)와, 통신 제어부(53)와, 문자열 해석부(54)와, 투고처 결정부(55)와, 표시 제어부(56)가 기능한다.

또한, 기억부(18-1)의 한 영역에는, 투고처 기억부(71)와, 투고 내용 정보 기억부(72)가 설정된다.

투고처 기억부(71)에는, 투고처 워드와 투고처가 대응되어 기억되어 있고, 투고처에 대한 투고에 필요한 투고 정보(개인 어카운트 또는 투고용 메일 어드레스 등)가 기억된다. 구체적으로는, 본 실시형태에 있어서는, 투고처 기억부(71)에는, 투고처 워드 「나우(now)」의 경우에는, 투고처를 Twitter로 하고, 투고처 워드 「좋아요」의 경우에는, 투고처를 Facebook으로 하여 기억되어 있다. 그리고, 투고처 워드는, 사용자가 임의로 설정 가능하게 구성된다.

투고 내용 정보 기억부(72)에는, 투고 내용의 문자열 및 화상 데이터가 기억된다.

투고처 설정부(51)는, 사용자의 입력부(16-1)등에 의한 설정 조작에 의해, 투고처 워드와, 투고처를 대응시켜, 투고처 기억부(71)에 기억시켜, 투고처를 설정한다.

입력 검출부(52)는, 입력부(16-1)에 대한 사용자가 발하는 음성의 입력을 검출한다.

구체적으로는, 입력 검출부(52)는, 사용자로부터 입력부(16-1)를 통하여, 음성의 입력이 검출되었는지의 여부를 판정한다.

통신 제어부(53)는, 촬영 단말기(2) 및 휴대 단말기(3)와 통신을 행하도록 통신부(19-1)를 제어한다.

구체적으로는, 통신 제어부(53)는, 촬영 지시를 촬영 단말기(2)에 송신하고, 음성 인식 지시 및 음성 입력에 의해 입력된 음성 데이터를 휴대 단말기(3)에 송신하도록 통신부(19-1)를 제어한다. 또한, 통신 제어부(53)는, 촬영 단말기(2)로부터 촬영 지시에 따라 촬영된 화상을 수신하고, 휴대 단말기(3)로부터 음성 인식 결과 (본 실시형태에 있어서는, 문자열 데이터)를 수신하도록 통신부(19-1)를 제어한다. 또한, 통신 제어부(53)는, 휴대 단말기(3)에 대하여, 투고처 워드에 대응하는 투고처 및 투고 내용[출력부(17-1)에 표시한 화상과 문자열]을 포함하는 투고 지시와, 화상 데이터 및 문자열 데이터를 송신하도록 통신부(19-1)를 제어한다.

문자열 해석부(54)는, 음성 인식 결과인 문자열을 해석한다.

구체적으로는, 문자열 해석부(54)는, 음성 인식 결과의 문자열을 해석하여, 투고 워드로 되는 문자열의 말미에 투고처 워드가 포함되는지의 여부를 판정한다.

투고처 결정부(55)는, 투고처 기억부(71)를 참조하고, 음성 인식 결과의 문자열의 말미에 포함되는 투고처 워드에 대응하는 투고처를 결정한다.

표시 제어부(56)는, 투고 워드로 되는 문자열이나 투고 화상으로 되는 촬영 화상을 표시하도록 출력부(17-1)를 제어한다. 출력부(17-1)에는, 투고 워드나 투고 화상이 표시되어, 사용자가 투고 내용을 파악할 수 있다.

도 8은, 도 5의 촬영 단말기(2)의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다.

촬영 단말기(2) 측의 음성 투고 처리를 실행하는 경우에는, 도 8에 나타낸 바와 같이, CPU(11-2)에 있어서, 통신 제어부(91)와, 촬영 제어부(92)가 기능한다.

통신 제어부(91)는, 리스트 단말기(1)와 통신을 행하도록 통신부(19-2)를 제어한다.

구체적으로는, 통신 제어부(91)는, 리스트 단말기(1)로부터 촬영 지시를 수신하도록 통신부(19-2)를 제어한다. 또한, 촬영 처리의 결과, 촬영된 화상을 리스트 단말기(1)에 송신하도록 통신부(19-2)를 제어한다.

촬영 제어부(92)는, 촬상 처리를 행하도록 촬상부(21-2)를 제어한다. 그 결과, 촬영 제어부(92)는, 촬상부(21-2)에 의해 촬영된 화상을 취득한다.

도 9는, 도 6의 휴대 단말기(3)의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다.

휴대 단말기(3) 측의 음성 투고 처리를 실행하는 경우에는, 도 9에 나타낸 바와 같이, CPU(11-3)에 있어서, 통신 제어부(111)가 기능한다.

통신 제어부(111)는, 리스트 단말기(1), 음성 인식 서버 및 SNS 서버와 통신을 행하도록 통신부(19-3)를 제어한다.

구체적으로는, 통신 제어부(111)는, 음성 인식 지시 및 음성 인식용의 음성 데이터를 수신하도록 통신부(19-3)를 제어한다. 또한, 통신 제어부(111)는, 외부의 음성 인식 서버에 대하여, 음성 인식 지시 및 음성 인식용의 음성 데이터를 송신하도록 통신부(19-3)를 제어한다. 또한, 통신 제어부(111)는, 외부의 음성 인식 서버로부터, 음성 인식 결과를 수신하도록 통신부(19-3)를 제어한다. 또한, 통신 제어부(111)는, 리스트 단말기(1)에 대하여, 음성 인식 결과를 송신하도록 통신부(19-3)를 제어한다. 또한, 통신 제어부(111)는, 리스트 단말기(1)로부터, 투고 지시와, 화상 데이터 및 문자열 데이터를 수신으로 하도록 통신부(19-3)를 제어한다. 또한, 통신 제어부(111)는, 투고처의 SNS 서버에, 투고 내용인 화상 데이터 및 문자열 데이터를 송신하도록 통신부(19-3)를 제어한다.

도 10은, 도 7 내지 도 9의 기능적 구성을 가지는 도 4의 리스트 단말기(1), 도 5의 촬영 단말기(2) 및 도 6의 휴대 단말기(3)가 실행하는 음성 투고 처리의 흐름을 설명하는 플로우차트이다. 음성 투고 처리의 개시에 있어서, 투고처 설정부(51)에 의해, 투고처 워드가 사용자에 의해 사전에 등록되어 있는 상태, 즉 투고처 기억부(71)에 개인 어카운트 설정을 포함하는 투고처의 정보와 투고처 워드가 등록되어 있는 상태로 되어 있다. 또한, 각각의 단말기[리스트 단말기(1), 촬영 단말기(2), 휴대 단말기(3)]의 사이에서는, 서로 통신 가능하게 접속이 완료되어 있는 상태로 되어 있다. 또한, 음성 투고용의 어플리케이션을 사용자의 조작 등으로 기동하여, 음성 입력이 가능한 상태로 되므로, 음성 투고 처리가 개시된다.

그리고, 음성 투고용의 어플리케이션을 기동하여, 음성 입력이 가능한 상태로 함으로써, 음성 투고 처리를 개시하도록 구성하였지만, 이에 한정되지 않고, 모든 동작을 음성 입력으로 행하도록 구성해도 된다. 예를 들면, 음성 입력에 따라 음성 투고용의 어플리케이션을 자동 기동시켜, 음성 입력이 가능한 상태로 하고 나서, 음성 투고 처리를 개시하도록 구성해도 된다.

[리스트 단말기(1) 측의 음성 투고 처리]

스텝 S11-1에 있어서, 입력 검출부(52)는, 사용자로부터 입력부(16-1)를 통하여, 음성의 입력이 검출되었는지의 여부를 판정한다.

음성의 입력이 검출되어 있지 않은 경우에는, 스텝 S11-1에 있어서 NO라고 판정되어, 대기 상태로 된다.

음성의 입력이 검출된 경우에는, 스텝 S11-1에 있어서 YES라고 판정되어, 처리는 스텝 S12-1로 진행한다.

스텝 S12-1에 있어서, 통신 제어부(53)는, 촬영 지시를 촬영 단말기(2)에 송신하고, 음성 인식 지시 및 음성 입력에 의해 입력된 음성 데이터를 휴대 단말기(3)에 송신하도록 통신부(19-1)를 제어한다.

그 후, 촬영 단말기(2)에서는, 촬영 지시를 받아, 촬영 처리가 실행된다. 또한, 휴대 단말기(3)에서는, 음성 인식 지시를 받아, 인터넷 등을 통하여, 외부의 음성 인식 서버에 음성 데이터를 송신하여, 음성 인식을 실행시킨다.

스텝 S13-1에 있어서, 통신 제어부(53)는, 촬영 단말기(2)로부터 촬영 지시에 따라 촬영된 화상을 수신하고, 휴대 단말기(3)로부터 음성 인식 결과 (본 실시형태에 있어서는, 문자열 데이터)를 수신하도록 통신부(19-1)를 제어한다.

스텝 S14-1에 있어서, 문자열 해석부(54)는, 휴대 단말기(3)로부터 수신한 문자열 데이터를 해석하여, 투고처 기억부(71)를 참조하고, 투고처 워드를 문자열의 말미에 포함하고 있는지의 여부를 판정한다. 구체적으로는, 예를 들면, 투고 워드의 말미에 「나우(now)」나 「좋아요(like)」의 투고처 워드가 포함되는지의 여부를 판정한다. 문자열이 「정상 나우」였던 경우에는, 투고처 워드를 말미에 포함하고, 「정상」또는 「나우 정상」의 경우에는, 말미에 투고처 워드를 포함하지 않는 것으로 판정된다.

투고처 워드를 문자열의 말미에 포함하지 않는 경우에는, 스텝 S14-1에 있어서 NO라고 판정되어, 리스트 단말기(1) 측의 음성 투고 처리는 종료한다.

투고처 워드를 문자열의 말미에 포함하고 있는 경우에는, 스텝 S14-1에 있어서 YES라고 판정되어, 처리는 스텝 S15-1로 진행한다.

스텝 S15-1에 있어서, 투고처 결정부(55)는, 투고처 기억부(71)를 참조하고, 말미에 포함되는 투고처 워드에 대응하는 투고처를 결정한다.

구체적으로는, 투고처 워드가 「나우」였던 경우에는, 투고처 기억부(71)를 참조한 결과, 설정되어 있는 Twitter를 투고처로 결정하고, 「좋아요」였던 경우에는, Facebook를 투고처로서 결정한다.

스텝 S16-1에 있어서, 표시 제어부(56)는, 촬영 단말기(2)로부터 수신한 화상과, 휴대 단말기(3)로부터 수신한 문자열을 표시 출력하도록 출력부(17-1)를 제어한다.

스텝 S17-1에 있어서, 통신 제어부(53)는, 휴대 단말기(3)에 대하여, 투고처 워드에 대응하는 투고처 및 투고 내용[출력부(17-1)에 표시한 화상과 문자열]을 포함하는 투고 지시와, 화상 데이터 및 문자열 데이터를 송신하도록 통신부(19-1)를 제어한다. 휴대 단말기(3)에서는, 투고 지시를 받아, 투고처 워드에 대응하는 투고처로 되는 SNS 서버에 대하여, 수신한 화상 데이터와 문자열 데이터를 송신하여, 투고 처리를 행한다. 또한, 송신에 있어서, 투고 내용인 문자열 및 화상 데이터가 투고 내용 정보 기억부(72)에 기억된다.

그 후, 리스트 단말기(1) 측의 음성 투고 처리는 종료한다.

[촬영 단말기(2) 측의 음성 투고 처리]

스텝 S11-2에 있어서, 통신 제어부(91)는, 리스트 단말기(1)로부터 촬영 지시를 수신하도록 통신부(19-2)를 제어한다.

스텝 S12-2에 있어서, 촬영 제어부(92)는, 촬영 처리를 실행한다. 본 실시형태의 촬영 처리에서는, 셀프타이머 기능에 의해 소정 시간 경과 후에 촬영이 행해진다. 그리고, 셀프타이머가 동작하는 동안, 라이브 뷰 화상을 리스트 단말기(1)에 송신하도록 구성해도 된다.

스텝 S13-2에 있어서, 통신 제어부(91)는, 촬영 처리의 결과, 촬영된 화상을 리스트 단말기(1)에 송신하도록 통신부(19-2)를 제어한다. 그 후, 촬영 단말기(2) 측의 음성 투고 처리는 종료한다.

[휴대 단말기(3) 측의 음성 투고 처리]

스텝 S11-3에 있어서, 통신 제어부(111)는, 음성 인식 지시 및 음성 인식용의 음성 데이터를 수신하도록 통신부(19-3)를 제어한다.

스텝 S12-3에 있어서, 통신 제어부(111)는, 외부의 음성 인식 서버에 대하여, 음성 인식 지시 및 음성 인식용의 음성 데이터를 송신하도록 통신부(19-3)를 제어한다.

스텝 S13-3에 있어서, 통신 제어부(111)는, 외부의 음성 인식 서버로부터, 음성 인식 결과를 수신하도록 통신부(19-3)를 제어한다.

스텝 S14-3에 있어서, 통신 제어부(111)는, 리스트 단말기(1)에 대하여, 음성 인식 결과를 송신하도록 통신부(19-3)를 제어한다.

스텝 S15-3에 있어서, 통신 제어부(111)는, 리스트 단말기(1)로부터, 투고 지시와, 화상 데이터 및 문자열 데이터를 수신으로 하도록 통신부(19-3)를 제어한다.

스텝 S16-3에 있어서, 통신 제어부(111)는, 투고처의 SNS 서버에, 투고 내용인 화상 데이터 및 문자열 데이터를 송신하도록 통신부(19-3)를 제어한다.

그 후, 휴대 단말기(3) 측의 음성 투고 처리는 종료한다.

<제2 실시형태>

도 11은, 제2 실시형태에 관한 투고 시스템(S)의 시스템 구성을 나타낸 시스템 도면이다.

본 실시형태의 투고 시스템(S)은, 제1 실시형태와는 달리, 도 11에 나타낸 바와 같이, 음성 입력 기능과 투고 기능을 가지는 리스트 단말기(1)와, 촬영 기능을 가지는 촬영 단말기(2)로 구성된다. 그리고, 기능 블록에 대해서는, 제1 실시형태의 도 7에 나타낸 리스트 단말기(1) 및 도 8에 나타낸 촬영 단말기(2)와 동일하므로 설명 및 도시를 생략한다.

그리고, 본 실시형태의 구성은, 리스트 단말기(1)에 SIM 카드가 있는 것과 같은 경우에 보다 유효적으로 기능한다.

도 12는, 제2 실시형태의 투고 시스템(S)에 의해 실행되는 음성 투고를 설명하기 위한 모식도이다.

본 실시형태의 투고 시스템(S)에서는, 도 12의 예에 나타낸 바와 같이, 예를 들면, 「정상 나우(on top of a mountain now)」)라고 하는 음성을 리스트 단말기(1)에 입력(중얼거림; saying)함으로써, 상기 음성을 트리거로 하여, 촬영 단말기(2)와 셀프타이머 촬영이 행해지고, 휴대 단말기(3)에 있어서 입력한 음성의 음성 인식이 된다.

그 후, 음성 인식된 문자열이 촬영된 화상과 함께 리스트 단말기(1)의 화면에 표시된다. 그리고, 라이브 뷰 화상을 리스트 단말기(1)의 화면에 표시시켜, 소정 시간 경과 후에 타이머 표시를 행하여 촬영하도록 구성해도 된다. 또한, 셀프타이머 시에 리스트 단말기(1)를 조작(터치 조작)함으로써, 촬영을 일시 정지시키는 것이 가능하게 구성된다. 또한, 셀프타이머의 시간 설정도 임의로 변경할 수 있도록 구성된다.

최종적으로, 리스트 단말기(1)의 화면에 표시된 중얼댐(words said)과 화상이 SNS에 업로드되어 투고되고, 자신의 트이트로서 공개된다. 그리고, 투고 데이터의 송신 중에, 리스트 단말기(1)를 조작(터치 조작)해 투고를 중지시키거나 하도록 구성해도 된다.

도 13은, 도 7 및 도 8의 기능적 구성을 가지는 도 4의 리스트 단말기(1) 및 도 5의 촬영 단말기(2)가 실행하는 음성 투고 처리의 흐름을 설명하는 플로우차트이다. 음성 투고 처리의 개시에 있어서, 투고처 설정부(51)에 의해 투고처 워드가 사용자에 의해 사전에 등록되어 있는 상태, 즉 투고처 기억부(71)에 개인 어카운트 설정을 포함하는 투고처의 정보와 투고처 워드가 등록되어 있는 상태로 되어 있다. 또한, 리스트 단말기(1) 및 촬영 단말기(2)의 사이에서는, 서로 통신 가능하게 접속이 완료되어 있는 상태로 되어 있다. 또한, 음성 투고용의 어플리케이션을 사용자의 조작 등으로 기동하여, 음성 입력이 가능한 상태로 되므로, 음성 투고 처리가 개시된다.

[리스트 단말기(1) 측의 음성 투고 처리]

스텝 S31-1에 있어서, 입력 검출부(52)는, 사용자로부터 입력부(16-1)를 통하여, 음성의 입력이 검출되었는지의 여부를 판정한다.

음성의 입력이 검출되어 있지 않은 경우에는, 스텝 S31-1에 있어서 NO라고 판정되어, 대기 상태로 된다.

음성의 입력이 검출된 경우에는, 스텝 S31-1에 있어서 YES라고 판정되고, 처리는 스텝 S32-1로 진행한다.

스텝 S32-1에 있어서, 통신 제어부(53)는, 촬영 지시를 촬영 단말기(2)에 송신하고, 음성 입력에 의해 입력된 음성 데이터를 외부의 음성 인식 서버에 송신하도록 통신부(19-1)를 제어한다.

그 후, 촬영 단말기(2)에서는, 촬영 지시를 받아, 촬영 처리가 실행된다. 또한, 외부의 음성 인식 서버에서는, 음성 인식이 실행된다.

스텝 S33-1에 있어서, 통신 제어부(53)는, 촬영 단말기(2)로부터 촬영 지시에 따라 촬영된 화상을 수신하고, 외부의 음성 인식 서버로부터 음성 인식 결과 (본 실시형태에 있어서는, 문자열 데이터)를 수신하도록 통신부(19-1)를 제어한다.

스텝 S34-1에 있어서, 문자열 해석부(54)는, 외부의 음성 인식 서버로부터 수신한 문자열 데이터를 해석하여, 투고처 워드를 문자열의 말미에 포함하고 있는지의 여부를 판정한다.

투고처 워드를 문자열의 말미에 포함하지 않을 경우에는, 스텝 S34-1에 있어서 NO라고 판정되어, 리스트 단말기(1) 측의 음성 투고 처리는 종료한다.

투고처 워드를 문자열의 말미에 포함하고 있는 경우에는, 스텝 S34-1에 있어서 YES라고 판정되어, 처리는 스텝 S35-1로 진행한다.

스텝 S35-1에 있어서, 투고처 결정부(55)는, 투고처 기억부(71)를 참조하고, 말미에 포함되는 투고처 워드에 대응하는 투고처를 결정한다.

스텝 S36-1에 있어서, 표시 제어부(56)는, 촬영 단말기(2)로부터 수신한 화상과, 외부의 음성 인식 서버로부터 수신한 문자열을 표시 출력하도록 출력부(17-1)를 제어한다.

스텝 S37-1에 있어서, 통신 제어부(53)는, 투고처 워드에 대응하는 투고처로 되는 SNS 서버에 대하여, 화상 데이터와 문자열 데이터를 송신하도록 통신부(19-1)를 제어하여, 투고 처리를 행한다. 또한, 송신에 있어서, 투고 내용인 문자열 및 화상 데이터가 투고 내용 정보 기억부(72)에 기억된다.

그 후, 리스트 단말기(1) 측의 음성 투고 처리는 종료한다.

[촬영 단말기(2) 측의 음성 투고 처리]

스텝 S31-2)에 있어서, 통신 제어부(91)는, 리스트 단말기(1)로부터 촬영 지시를 수신하도록 통신부(19-2)를 제어한다.

스텝 S32-2에 있어서, 촬영 제어부(92)는, 촬영 처리를 실행한다. 본 실시형태의 촬영 처리에서는, 셀프타이머 기능에 의해 소정 시간 경과 후에 촬영이 행해진다. 그리고, 셀프타이머가 동작하는 동안, 라이브 뷰 화상을 리스트 단말기(1)에 송신하도록 구성해도 된다.

스텝 S33-2에 있어서, 통신 제어부(91)는, 촬영 처리의 결과, 촬영된 화상을 리스트 단말기(1)에 송신하도록 통신부(19-2)를 제어한다. 그 후, 촬영 단말기(2) 측의 음성 투고 처리는 종료한다.

<제3 실시형태>

전술한 실시형태에서는, 복수의 단말기에 의해, 음성 투고 처리를 실행하도록 구성하였지만, 본 실시형태에서는, 촬영 기능과, 음성 입력 기능과, 투고 기능을 구비한 단체(單體)의 단말기에 의해 음성 투고 처리를 실행하도록 구성한다. 본 실시형태에 있어서는, 디지털 카메라로서 구성한 촬영 단말기(2)에, 촬영 기능에 더하여, 음성 입력 기능 및 투고 기능을 구비하여 스탠드얼론기(stand-alone device)로서 구성하여, 음성 투고 처리를 실행한다.

도 14는, 본 실시형태의 촬영 단말기(2)의 하드웨어의 구성을 나타낸 블록도이다. 그리고, 본 실시형태에 있어서 추가된 하드웨어 구성에 대해서는, 전술한 리스트 단말기(1) 및 휴대 단말기(3)와 동일하므로, 설명을 생략한다.

도 15는, 도 14의 촬영 단말기(2)의 기능적 구성 중, 음성 투고 처리를 실행하기 위한 기능적 구성을 나타낸 기능 블록도이다. 그리고, 본 실시형태에 있어서 재구성된 기능 블록[투고처 설정부(131) 내지 표시 제어부(137), 투고처 기억부(151), 투고 내용 정보 기억부(152)]는, 전술한 리스트 단말기(1)의 투고처 설정부(51), 입력 검출부(52), 통신 제어부(53), 문자열 해석부(54), 투고처 결정부(55), 표시 제어부(56), 투고처 기억부(71), 투고 내용 정보 기억부(72) 및 휴대 단말기(3)의 통신 제어부(91), 촬영 제어부(92)와 동일하므로 설명을 생략한다.

도 16은, 도 15의 기능적 구성을 가지는 도 14의 촬영 단말기(2)가 실행하는 음성 투고 처리의 흐름을 설명하는 플로우차트이다. 음성 투고 처리의 개시에 있어서, 투고처 설정부(131)에 의해, 투고처 워드가 사용자에 의해 사전에 등록되어 있는 상태, 즉 투고처 기억부(71)에 개인 어카운트 설정을 포함하는 투고처의 정보와 투고처 워드가 등록되어 있는 상태로 되어 있다. 또한, 음성 투고용의 어플리케이션을 사용자의 조작 등으로 기동하여, 음성 입력이 가능한 상태로 되므로, 음성 투고 처리가 개시된다.

스텝 S51에 있어서, 입력 검출부(132)는, 사용자로부터 입력부(16-2)를 통하여, 음성의 입력이 검출되었는지의 여부를 판정한다.

음성의 입력이 검출되어 있지 않은 경우에는, 스텝 S51에 있어서 NO라고 판정되어, 대기 상태로 된다.

음성의 입력이 검출된 경우에는, 스텝 S51에 있어서 YES라고 판정되어, 처리는 스텝 S52로 진행한다.

스텝 S52에 있어서, 촬영 제어부(133)는, 촬영 처리를 실행한다. 본 실시형태의 촬영 처리에서는, 셀프타이머 기능에 의해 소정 시간 경과 후에 촬영이 행해진다. 그리고, 셀프타이머가 동작하는 동안, 표시 제어부(137)는, 라이브 뷰 화상을 표시하도록 출력부(17-2)를 제어해도 된다.

스텝 S53에 있어서, 통신 제어부(134)는, 음성 입력에 의해 입력된 음성 데이터를 외부의 음성 인식 서버에 송신하도록 통신부(19-2)를 제어한다.

그 후, 외부의 음성 인식 서버에서는, 음성 인식이 실행된다.

스텝 S54에 있어서, 통신 제어부(134)는, 외부의 음성 인식 서버로부터 음성 인식 결과(본 실시형태에 있어서는, 문자열 데이터)를 수신하도록 통신부(19-2)를 제어한다.

스텝 S55에 있어서, 문자열 해석부(135)는, 외부의 음성 인식 서버로부터 수신한 문자열 데이터를 해석하여, 투고처 워드를 문자열의 말미에 포함하고 있는지의 여부를 판정한다.

투고처 워드를 문자열의 말미에 포함하지 않을 경우에는, 스텝 S55에 있어서 NO라고 판정되어, 음성 투고 처리는 종료한다.

투고처 워드를 문자열의 말미에 포함하고 있는 경우에는, 스텝 S55에 있어서 YES라고 판정되어, 처리는 스텝 S56으로 진행한다.

스텝 S56에 있어서, 투고처 결정부(136)는, 투고처 기억부(71)를 참조하고, 말미에 포함되는 투고처 워드에 대응하는 투고처를 결정한다.

스텝 S57에 있어서, 표시 제어부(137)는, 촬영한 화상과, 외부의 음성 인식 서버로부터 수신한 문자열을 표시 출력하도록 출력부(17-2)를 제어한다.

스텝 S58에 있어서, 통신 제어부(134)는, 투고처 워드에 대응하는 투고처로 되는 SNS 서버에 대하여, 화상 데이터와 문자열 데이터를 송신하여, 투고 처리를 행한다. 또한, 송신에 있어서, 투고 내용인 문자열 및 화상 데이터가 투고 내용 정보 기억부(152)에 기억된다.

그 후, 음성 투고 처리는 종료한다.

종래에는, 아웃 도어에서는, SNS로의 투고가 자주 행해지지만, 수순으로서는, 예를 들면, (1) 단말기를 인출하고, (2) SNS 어플리케이션을 기동하고, (3) 문자 입력하고, (4) 카메라 어플리케이션을 기동하고, (5) 촬영하고, (6) 투고 버튼을 누르는 등의 조작에 의해 행해지고 있고, 많은 조작 등을 필요로 하는 것이었다.

본 기능에 있어서는, 리스트 단말기(1)에 음성 입력하는 것만으로, 신속하게, 촬영, 문자 입력, 투고가 일체로 하여 행해지도록 한 본 기능을 실장(實裝)함으로써, 「보다 간단하게, 보다 신속하게」투고할 수 있어, 새로운 사용자 체험으로 연결할 수 있다.

이상과 같이 구성되는 촬영 단말기(2)는, 촬영 제어부(133)와, 입력 검출부(132)와, 촬영 제어부(133)와, 통신 제어부(134)를 구비한다.

촬영 제어부(133)는, 화상을 취득한다.

입력 검출부(132)는, 사용자로부터 발해지는 소정의 음성을 취득한다.

촬영 제어부(133)는, 입력 검출부(132)에 의해 취득된 소정의 음성과 동일한 음성에 기초하여, 화상을 취득하도록 제어한다.

통신 제어부(134)는, 입력 검출부(132)에 의해 취득된 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 화상을 보존시키는 제어를 행한다.

이로써, 촬영 단말기(2)에 있어서는, 음성의 입력에 의해 화상을 취득하여, 입력된 소정의 음성과 동일한 음성의 내용에 따른 기억처에, 상기 화상을 보존하는 제어를 행하기 위해, 번거로운 작업없이, 촬영된 사진을 간단하게 적절한 장소에 업로드할 수 있다.

통신 제어부(134)는, 소정의 음성과 동일한 음성을 문자 정보로 변환하는 제어를 행하는 지시를 송신하도록 통신부(19-3)를 제어한다.

통신 제어부(134)는, 화상과 함께 문자 정보를 보존하는 제어를 행한다.

이로써, 촬영 단말기(2)에 있어서는, 1의 음성 입력으로 화상과 문자 정보를 보존할 수 있어, 번거로운 작업없이, 간단하게 적절한 장소에 업로드할 수 있다.

또한, 촬영 단말기(2)는, 투고처 설정부(131)를 더 구비한다.

투고처 설정부(131)는, 입력 검출부(132)에 의해 취득되는 소정의 음성과 동일한 음성의 내용과, 기억처를 대응시켜 설정한다.

통신 제어부(134)는, 입력 검출부(132)에 의해 취득된 소정의 음성과 동일한 음성의 내용에 대응한 투고처 설정부(131)에 의해 설정된 기억처에 보존시키는 지시를 송신하도록 통신부(19-3)를 제어한다.

이로써, 촬영 단말기(2)에 있어서는, 사용자에 의해 미리 소정의 음성과 동일한 음성의 내용에 대응한 기억처를 임의로 설정할 수 있다.

기억처에 대응되는 소정의 음성과 동일한 음성의 내용은, 기억처와 관련된 키워드이다.

이로써, 촬영 단말기(2)에 있어서는, 소정의 음성과 동일한 음성의 내용이 기억처와 관련된 키워드이므로, 기억처를 상기하기 쉽고, 간단하게 의도한 기억처를 지정할 수 있다.

기억처에 대응되는 소정의 음성과 동일한 음성의 내용은, 소정의 음성과 동일한 음성의 말미의 내용이다.

이로써, 촬영 단말기(2)에 있어서는, 소정의 음성과 동일한 음성의 내용이 음성의 말미의 내용이므로, 음성을 입력하는 사용자는, 기억처를 지정하는 사고(思考)로 이미지나 감상을 방해하기 어려워져, 보다 직감적으로 음성을 발하기 용이해진다.

또한, 촬영 단말기(2)는, 촬상부(21-2)를 더 구비한다.

촬영 제어부(133)는, 입력 검출부(132)에 의해 취득된 특정한 음성의 내용으로 촬영을 행하도록 촬상부(21-2)를 제어하고, 촬상부(21-2)에 의해 촬영된 화상을 취득한다.

이로써, 촬영 단말기(2)에 있어서는, 번거로운 작업없이, 촬영된 사진을 간단하게 적절한 장소에 업로드할 수 있다.

촬영 제어부(133)는, 셀프타이머 촬영을 행하도록 촬상부(21-2)를 제어한다.

이로써, 촬영 단말기(2)에 있어서는, 셀프타이머 촬영에 의해, 음성 입력으로부터 소정 시간 후에 촬영이 행해지는 것이 보증되므로, 사용자가 촬영의 타이밍을 인식하기 용이해진다.

또한, 촬영 단말기(2)는, 사용자의 음성을 입력하는 입력부(16-2)를 더 구비한다.

입력 검출부(132)는, 입력부(16-2)에 의해 입력된 음성을 취득한다.

이로써, 촬영 단말기(2)에 있어서는, 자체의 마이크 등의 입력부(16-2)에 음성을 입력시킬 수 있어, 보다 간단하게 조작을 행할 수 있다.

기억처는, 상기 전자 기기의 외부에 설치된다. 이로써, 촬영 단말기(2)에 있어서는, 외부의 기억처에 간단하게 화상 등을 기억시킬 수 있다.

기억처는, 웹 상의 스토리지 서버 또는 SNS가 제공하는 서버이다. 이로써, 촬영 단말기(2)에 있어서는, 웹 상의 스토리지 서버 또는 SNS가 제공하는 서버에 간단하게 업로드할 수 있다.

이상과 같이 구성되는 투고 시스템(S)은, 리스트 단말기(1)와 촬영 단말기(2)로 이루어진다. 리스트 단말기(1)는, 입력 검출부(52)와, 통신부(19-1)와, 통신 제어부(53)를 구비한다.

입력 검출부(52)는, 사용자로부터 발해지는 음성을 취득한다. 통신부(19-1)는, 입력 검출부(52)에 의해 취득된 음성에 기초하여 피사체를 촬영하는 촬영 지시를 촬영 단말기(2)에 송신한다. 통신부(19-1)는, 촬영 지시에 기초하여 촬영 단말기(2)에 의해 촬영된 화상 데이터를 촬영 단말기(2)로부터 수신한다.

통신 제어부(53)는, 입력 검출부(52)에 의해 취득된 음성의 내용에 따라 미리 설정된 기억처에, 화상을 보존시키는 제어를 행한다.

촬영 단말기(2)는, 촬상부(21-2)와, 통신부(19-2)를 구비한다.

통신부(19-2)는, 리스트 단말기(1)의 통신부(19-1)로부터 송신되는 촬영 지시를 수신한다.

촬영 제어부(133)는, 통신부(19-2)에 의해 수신된 촬영 지시에 기초하여, 피사체를 촬영하도록 촬상부(21-2)를 제어한다.

통신부(19-2)는, 화상 데이터를 리스트 단말기(1)에 송신한다.

이로써, 촬영 단말기(2)에 있어서는, 음성의 입력에 의해 화상을 취득하여, 입력된 음성의 내용에 따른 기억처에, 상기 화상을 보존하는 제어를 행하기 위해, 번거로운 작업없이, 촬영된 사진을 간단하게 적절한 장소에 업로드할 수 있다.

그리고, 본 발명은, 전술한 실시형태에 한정되지 않고, 본 발명의 목적을 달성할 수 있는 범위에서의 변형, 개량 등은 본 발명에 포함되는 것이다.

전술한 실시형태에서는, 음성 인식을 외부의 음성 인식 서버에 의해 행하고 있었지만, 음성 인식 기능을 탑재하여, 자기(自機; user's own device)에 의해 음성 인식에 관한 처리를 행하도록 구성해도 된다. 또한, 음성 인식 결과에 특정한 문자열이 포함되어 있었을 경우에, 촬영을 행하도록 구성해도 된다. 이로써, 음성이 입력된 것을 계기로 촬영하는 경우와 비교하여, 즉시성은 저하되지만, 특정한 문자열이 포함되어 있지 않은 경우에는 촬영은 행해지지 않으므로, 불필요한 촬영을 실시하지 않아도 되게 된다.

또한, 전술한 실시형태에서는, 상이한 외부의 기억처에 기억시키도록 구성하고자 하지만, 또한 미세하게, 내부/외부에 관계없이 상이한 기억 장소(폴더 등)와 하는 제어를 행하도록 구성해도 된다.

또한, 전술한 실시형태에서는, 특정한 문자열인 말미의 음성 내용도 투고 내용에 포함하였지만, 말미의 음성 내용을 제외한 부분을 투고 내용으로 해도 된다. 또한, 특정한 문자열을 말미로 하였으나, 이에 한정되지 않고, 선두(先頭; top), 의미가 있는 음성 내용(예를 들면, 단어) 간, 임의의 특정한 장소, 단지 음성 내용에 일부에 포함되어 있도록 구성해도 된다.

또한, 전술한 실시형태에서는, 말미의 특정한 문자열은 기억처로 되는 투고처를 직접적으로 또는 간접적으로 상기시키는 것과 같은 투고처에 관련된 키워드, 즉 「나우(now)」나 「좋아요(like)」가 설정되어 있지만, 사용자가 이들 문자열을 자유롭게 설정할 수 있도록 해도 된다.

또한, 전술한 실시형태에서는, 음성 내용이 임의의 문자열＋말미에 특정한 문자열이라는 구성으로 화상과 텍스트의 투고가 행해지도록 구성하였지만, 예를 들면, 「나우(now)」나 「좋아요(like)」의 특정한 문자열뿐이었던 경우에는, 화상만으로 투고를 행하도록(대응하는 기억처에 기억시키도록) 구성해도 된다. 이 경우에 있어서, 특정한 문자열도 화상과 함께 투고시키도록(대응하는 기억처에 기억시키도록) 구성해도 된다.

또한, 전술한 실시형태에서는, 입력된 음성의 모두를 사용하여 판단하도록 구성하였지만, 입력된 음성의 일부를 사용하도록 구성해도 된다. 예를 들면, 특정한 문자열이 말미에 있는 경우에는, 말미의 직전의 문자열만을 사용하도록 구성해도 된다.

또한, 전술한 실시형태에서는, 음성 인식을 행하여 텍스트 레벨로 음성 내용을 비교 판단하도록 구성하였지만, 예를 들면, 입력된 음성과, 미리 기억되어 있는 음성 데이터를 비교하여 판단하도록 구성해도 된다. 이 경우, 단순하게 음성 내용의 일치 불일치를 판단해도 되고, 시큐리티의 향상을 목적으로 하여, 음성 내용과 성문 레벨(voiceprint level)에서의 일치 불일치를 판단해도 된다. 또한, 투고 내용을 텍스트 대신에, 음성 파일로 행하도록 구성해도 된다.

또한, 전술한 실시형태에서는, 본 발명이 적용되는 리스트 단말기(1), 촬영 단말기(2) 및 휴대 단말기(3)는, 스마트 시계, 디지털 카메라, 스마트 폰을 예로서 설명하였으나, 특별히 이에 한정되지 않는다.

예를 들면, 본 발명은, 음성 투고 처리 기능을 가지는 전자 기기 일반에 적용할 수 있다.

구체적으로는, 예를 들면, 본 발명은, 노트북형의 퍼스널 컴퓨터, 프린터, 텔레비전 수상기, 비디오 카메라, 휴대형 네비게이션 장치, 휴대 전화기, 휴대용 게임기 등에 적용할 수 있다.

전술한 일련의 처리는, 하드웨어에 의해 실행시킬 수도 있고, 소프트웨어에 의해 실행시킬 수도 있다.

바꾸어 말하면, 도 7, 도 8, 도 9 및 도 15의 기능적 구성은 예시에 지나지 않고, 특별히 한정되지 않는다.

즉, 전술한 일련의 처리를 전체로서 실행할 수 있는 기능이 리스트 단말기(1), 촬영 단말기(2) 및 휴대 단말기(3)에 구비되어 있으면 되고, 이 기능을 실현하기 위해 어떠한 기능 블록을 사용할 것인지는 특히 도 7, 도 8, 도 9 및 도 15의 예에 한정되지 않는다.

또한, 1개의 기능 블록은, 하드웨어 단체로 구성해도 되고, 소프트웨어 단체로 구성해도 되고, 이들의 조합에 의해 구성해도 된다.

일련의 처리를 소프트웨어에 의해 실행시키는 경우에는, 그 소프트웨어를 구성하는 프로그램이, 컴퓨터 등에 네트워크나 기록 매체로부터 인스톨된다.

컴퓨터는, 전용의 하드웨어에 내장되어 있는 컴퓨터라도 된다. 또한, 컴퓨터는, 각종 프로그램을 인스톨함으로써, 각종 기능을 실행할 수 있는 컴퓨터, 예를 들면, 범용의 퍼스널 컴퓨터라도 된다.

이와 같은 프로그램을 포함하는 기록 매체는, 사용자에게 프로그램을 제공하기 위해 장치 본체와는 별도로 배포되는 도 4, 도 5, 도 6 및 도 14의 착탈 가능 매체(31-1), (31-2), (31-3)에 의해 구성될뿐아니라, 장치 본체에 미리 내장된 상태로 사용자에게 제공되는 기록 매체 등으로 구성된다. 착탈 가능 매체(31-1), (31-2), (31-3)는, 예를 들면, 자기 디스크(플로피 디스크를 포함함), 광디스크, 또는 광자기 디스크 등에 의해 구성된다. 광디스크는, 예를 들면, CD-ROM(Compact Disk-Read Only Memory), DVD(Digital Versatile Disk), Blu-ray(등록상표) disc[블루 레이 디스크] 등에 의해 구성된다. 광자기 디스크는, MD(Mini-Disk) 등에 의해 구성된다. 또한, 장치 본체에 미리 내장된 상태로 사용자에게 제공되는 기록 매체는, 예를 들면, 프로그램이 기록되어 있는 도 4, 도 5, 도 6 및 도 14의 ROM(12-1), (12-2), (12-3)이나, 도 4, 도 5, 도 6 및 14의 기억부(18-1), (18-2), (18-3)에 포함되는 하드디스크 등으로 구성된다.

그리고, 본 명세서에 있어서, 기록 매체에 기록되는 프로그램을 기술(記述)하는 스텝은, 그 순서에 따라 시계열적으로 행해지는 처리는 물론, 반드시 시계열적으로 처리되지 않아도, 병렬적 또는 개별적으로 실행되는 처리도 포함하는 것이다.

또한, 본 명세서에 있어서, 시스템의 용어는, 복수의 장치나 복수의 수단 등으로 구성되는 전체적인 장치를 의미하는 것으로 한다.

이상, 본 발명의 몇 가지의 실시형태에 대하여 설명하였으나, 이들 실시형태는, 예시에 지나지 않고, 본 발명의 기술적 범위를 한정되는 것은 아니다. 본 발명은 그 외의 다양한 실시형태를 취하는 것이 가능하고, 또한 본 발명의 요지를 벗어나지 않는 범위에서, 생략이나 치환 등 각종 변경을 행할 수 있다. 이들 실시형태나 그 변형은, 본 명세서 등에 기재된 발명의 범위나 요지에 포함되는 동시에, 특허 청구의 범위에 기재된 발명과 그 균등한 범위에 포함된다.

Claims

화상(image)을 취득하는 화상 취득 수단;
사용자로부터 발해지는 소정의 음성을 취득하는 음성(sound) 취득 수단;
상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여, 상기 화상을 취득하도록 상기 화상 취득 수단을 제어하는 화상 취득 제어 수단;
상기 소정의 음성과 동일한 음성을 문자 정보로 변환하는 제어를 행하는 음성 변환 제어 수단; 및
상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처(storage destination)에, 상기 화상 및 상기 문자 정보를 보존(storage)시키는 제어를 행하는 보존 제어 수단;
을 포함하고,
상기 기억처에 보존시키는 상기 문자 정보는 미리 정해진 키워드를 포함하는, 전자 기기.
삭제
제1항에 있어서,
상기 음성 취득 수단에 의해 취득되는 상기 소정의 음성과 동일한 음성의 내용을, 상기 기억처에 대응시켜 설정하는 기억처 설정 수단을 더 포함하고,
상기 보존 제어 수단은, 상기 기억처 설정 수단에 의해 설정된 상기 기억처에 화상을 보존시키는, 전자 기기.
제1항에 있어서,
상기 기억처에 대응되는 상기 소정의 음성과 동일한 음성의 내용은, 상기 기억처와 관련된 키워드인, 전자 기기.
제1항에 있어서,
상기 기억처에 대응되는 상기 소정의 음성과 동일한 음성의 내용은, 상기 소정의 음성과 동일한 음성의 말미(末尾; end)의 내용인, 전자 기기.
제1항에 있어서,
촬영 수단; 및
상기 촬영 수단을 제어하는 촬영 제어 수단;을 더 포함하고,
상기 촬영 제어 수단은, 상기 음성 취득 수단에 의해 취득된 소정의 음성과 동일한 음성에 기초하여 촬영을 행하도록 상기 촬영 수단을 제어하고,
상기 화상 취득 수단은, 상기 촬영 수단에 의해 촬영된 화상을 취득하는, 전자 기기.
제6항에 있어서,
상기 촬영 제어 수단은, 셀프타이머 촬영을 행하도록 상기 촬영 수단을 제어하는, 전자 기기.
제1항에 있어서,
사용자의 소정의 음성을 입력하는 음성 입력 수단을 더 포함하고,
상기 음성 취득 수단은, 상기 음성 입력 수단에 의해 입력된 소정의 음성을 취득하는, 전자 기기.
제1항에 있어서,
상기 기억처는, 상기 전자 기기의 외부에 설치되는, 전자 기기.
제1항에 있어서,
상기 기억처는, 웹 상의 스토리지 서버 또는 SNS(Social Networking Service)가 제공하는 서버인, 전자 기기.
제1 장치와 제2 장치로 이루어지는 시스템으로서,
상기 제1 장치는,
사용자로부터 발해지는 소정의 음성을 취득하는 음성 취득 수단;
상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여 피사체를 촬영하는 촬영 지시를 상기 제2 장치로 송신하는 제1 송신 수단;
상기 촬영 지시에 기초하여 상기 제2 장치에 의해 촬영된 화상 데이터를 상기 제2 장치로부터 수신하는 제1 수신 수단;
상기 소정의 음성과 동일한 음성을 문자 정보로 변환하는 제어를 행하는 음성 변환 제어 수단; 및
상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 상기 화상 및 상기 문자 정보를 보존시키는 제어를 행하는 보존 제어 수단
포함하고, 상기 기억처에 보존시키는 상기 문자 정보는 미리 정해진 키워드를 포함하며,
상기 제2 장치는,
촬영 수단;
상기 제1 장치의 상기 제1 송신 수단으로부터 송신되는 상기 촬영 지시를 수신하는 제2 수신 수단;
상기 제2 수신 수단에 의해 수신된 상기 촬영 지시에 기초하여, 피사체를 촬영하도록 상기 촬영 수단을 제어하는 촬영 제어 수단; 및
상기 화상 데이터를 상기 제1 장치로 송신하는 제2 송신 수단;을 포함하는,
시스템.
화상을 취득하는 화상 취득 단계;
사용자로부터 발해지는 소정의 음성을 취득하는 음성 취득 단계;
상기 음성 취득 단계에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여, 상기 화상을 취득하도록 상기 화상 취득 단계를 제어하는 화상 취득 제어 단계;
상기 소정의 음성과 동일한 음성을 문자 정보로 변환하는 제어를 행하는 음성 변환 제어 단계; 및
상기 음성 취득 단계에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 상기 화상 및 상기 문자 정보를 보존시키는 제어를 행하는 보존 제어 단계;
를 포함하고,
상기 기억처에 보존시키는 상기 문자 정보는 미리 정해진 키워드를 포함하는, 보존 제어 방법.
컴퓨터로 하여금,
화상을 취득하는 화상 취득 수단;
사용자로부터 발해지는 소정의 음성을 취득하는 음성 취득 수단;
상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성에 기초하여, 상기 화상을 취득하도록 상기 화상 취득 수단을 제어하는 화상 취득 제어 수단;
상기 소정의 음성과 동일한 음성을 문자 정보로 변환하는 제어를 행하는 음성 변환 제어 수단; 및
상기 음성 취득 수단에 의해 취득된 상기 소정의 음성과 동일한 음성의 내용에 따라 미리 설정된 기억처에, 상기 화상 및 상기 문자 정보를 보존시키는 제어를 행하는 보존 제어 수단;
으로서 기능하게 하고,
상기 기억처에 보존시키는 상기 문자 정보는 미리 정해진 키워드를 포함하는,
기록 매체에 기록된 프로그램.
촬상 수단을 가진 외부 기기와 통신을 행하는 통신 수단;
사용자로부터 발해지는 음성을 취득하는 음성 취득 수단; 및
취득한 상기 음성에 미리 정해진 키워드가 포함되어 있다고 판정한 경우, 상기 외부 기기의 촬상 수단에 화상을 촬영하게 하고, 상기 음성을 문자 정보로 변환하며, 상기 키워드에 응하여 미리 설정된 기억처에 상기 화상 및 상기 문자 정보를 보존시키는 제어 수단
을 포함하는 전자 기기.