KR20200097444A

KR20200097444A - 음성을 기반으로 그래픽 데이터를 제공하는 전자 장치 및 그의 동작 방법

Info

Publication number: KR20200097444A
Application number: KR1020190014834A
Authority: KR
Inventors: 박미지
Original assignee: 삼성전자주식회사
Priority date: 2019-02-08
Filing date: 2019-02-08
Publication date: 2020-08-19
Also published as: KR102657519B1; WO2020162709A1; US11705120B2; EP3906553A4; EP3906553A1; US20200258517A1

Abstract

본 발명의 다양한 실시예들은 음성을 기반으로 그래픽 데이터를 제공하는 전자 장치 및 그의 동작 방법에 관한 것이다. 이때 전자 장치는, 디스플레이, 및 프로세서를 포함하며, 상기 프로세서는, 복수의 이미지들에 관련된 음성 신호로부터 적어도 하나의 키워드를 획득하고, 상기 적어도 하나의 키워드에 대응되는 적어도 하나의 그래픽 데이터를 결정하고, 상기 결정된 그래픽 데이터에 대응되는 키워드의 음성이 발화된 시점에 기초하여, 상기 복수의 이미지들 중 적어도 하나의 이미지를 선택하고, 상기 선택된 적어도 하나의 이미지에 상기 결정된 그래픽 데이터가 적용되도록 제어할 수 있다. 다른 실시예들도 가능할 수 있다.

Description

음성을 기반으로 그래픽 데이터를 제공하는 전자 장치 및 그의 동작 방법{ELECTRONIC DEVICE FOR PROVIDING GRAPHIC DATA BASED ON VOICE AND OPERATING METHOD THEREOF}

본 발명의 다양한 실시예들은 음성을 기반으로 그래픽 데이터를 제공하는 전자 장치 및 그의 동작 방법에 관한 것이다.

기술의 발전으로 인해, 전자 장치들(예: 이동 단말기, 스마트 폰, 착용형(wearable) 장치 등)은 다양한 기능을 제공할 수 있다. 예를 들어, 전자 장치는 음성 통신 기능, 데이터 통신 기능, 근거리 무선 통신(예: 블루투스(bluetooth), NFC (near field communication) 등) 기능, 이동 통신(3G(generation), 4G, 5G 등) 기능, 음악 또는 동영상 재생 기능, 사진 또는 동영상 촬영 기능, 또는 네비게이션 기능 등과 같은 다양한 기능을 제공할 수 있다.

특히, 전자 장치는 음성 인식 기술을 이용하여 다양한 서비스를 제공하고 있다.

전자 장치는 동영상의 음성을 인식 및 분석하여 텍스트로 변환하고, 변환된 텍스트를 동영상의 자막으로 제공해주는 기술을 제공하고 있다. 그러나, 이와 같이 음성을 텍스트로 변환하여 제공해주는 방식만으로는, 사용자의 다양한 욕구를 충족시키는데 한계가 있다.

따라서, 본 발명의 다양한 실시예들은 전자 장치에서 음성을 기반으로 그래픽 데이터를 제공하는 방법 및 장치를 제공하기 위한 것이다.

본 문서에서 이루고자 하는 기술적 과제는 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

본 발명의 다양한 실시예들에 따르면, 전자 장치는, 디스플레이, 및 프로세서를 포함하며, 상기 프로세서는, 복수의 이미지들에 관련된 음성 신호로부터 적어도 하나의 키워드를 획득하고, 상기 적어도 하나의 키워드에 대응되는 적어도 하나의 그래픽 데이터를 결정하고, 상기 결정된 그래픽 데이터에 대응되는 키워드의 음성이 발화된 시점에 기초하여, 상기 복수의 이미지들 중 적어도 하나의 이미지를 선택하고, 상기 선택된 적어도 하나의 이미지에 상기 결정된 그래픽 데이터가 적용되도록 제어할 수 있다.

본 발명의 다양한 실시예들에 따르면, 전자 장치의 동작 방법은, 복수의 이미지들에 관련된 음성 신호로부터 적어도 하나의 키워드를 획득하는 동작, 상기 적어도 하나의 키워드에 대응되는 적어도 하나의 그래픽 데이터를 결정하는 동작, 상기 결정된 그래픽 데이터에 대응되는 키워드의 음성이 발화된 시점에 기초하여, 상기 복수의 이미지들 중 적어도 하나의 이미지를 선택하는 동작, 및 상기 선택된 적어도 하나의 이미지에 상기 결정된 그래픽 데이터가 적용되도록 제어하는 동작을 포함할 수 있다.

본 발명의 다양한 실시예에 따른 전자 장치는 동영상 컨텐츠의 음성을 기반으로 적어도 하나의 그래픽 데이터를 추천 및 적용함으로써, 사용자가 동영상 컨텐츠에 적용할 그래픽 데이터를 직접 검색 및 선택해야 하는 불편함을 해소하면서, 동영상 컨텐츠의 음성에 어울리는 그래픽 데이터를 제공할 수 있다. 또한, 본 발명의 다양한 실시예에 따른 전자 장치는 그래픽 데이터가 적용될 시점을 자동으로 결정함으로써, 사용자가 그래픽 데이터의 적용 시점을 직접 설정해야 하는 불편함을 해소할 수 있다.

도 1은 다양한 실시예들에 따른, 네트워크 환경 내의 전자 장치의 블럭도이다.
도 2는 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠의 음성 신호에 기반하여 그래픽 데이터를 적용하는 흐름도이다.
도 3은 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠의 음성 신호로부터 키워드를 획득하는 흐름도이다.
도 4는 다양한 실시예들에 따른 전자 장치에서 음성 신호의 키워드를 기반으로 그래픽 데이터를 결정하는 흐름도이다.
도 5a 내지 도 5c는 다양한 실시예들에 따른 전자 장치에서 음성 신호에 대응되는 그래픽 데이터를 추천 및 결정하는 화면 구성에 대한 예시도이다.
도 6은 다양한 실시예들에 따른 전자 장치에서 그래픽 데이터가 적용될 적어도 하나의 이미지를 결정하는 흐름도이다.
도 7은 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠에 그래픽 데이터를 적용하는 흐름도이다.
도 8a 내지 도 8c는 다양한 실시예들에 따른 전자 장치에서 그래픽 데이터를 적용하는 화면 구성에 대한 예시도이다.
도 8d 및 도 8e는 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠의 타임라인에 그래픽 데이터가 적용되었음을 나타내는 인디케이터를 표시하는 화면 구성에 대한 예시도이다.
도 9는 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠에 적용된 그래픽 데이터를 편집하는 흐름도이다.
도 10a 및 도 10b는 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠에 적용된 그래픽 데이터를 편집하는 화면 구성에 대한 예시도이다.
도 11은 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠의 음성 신호에 기반하여 그래픽 데이터 및 음향 효과를 제공하는 흐름도이다.
도 12는 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠의 재생 시, 인디케이터를 이용한 그래픽 데이터를 제공하는 흐름도이다.
도 13a 및 도 13b는 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠의 인디케이터를 이용한 그래픽 데이터를 제공하는 화면 구성에 대한 예시도이다.

이하, 본 문서의 다양한 실시예들이 첨부된 도면을 참조하여 기재된다. 실시예 및 이에 사용된 용어들은 본 문서에 기재된 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 및/또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다.

도 1은, 다양한 실시예들에 따른, 네트워크 환경(100) 내의 전자 장치(101)의 블럭도이다. 도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 장치(150), 음향 출력 장치(155), 표시 장치(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 표시 장치(160) 또는 카메라 모듈(180))가 생략되거나, 하나 이상의 다른 구성 요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들은 하나의 통합된 회로로 구현될 수 있다. 예를 들면, 센서 모듈(176)(예: 지문 센서, 홍채 센서, 또는 조도 센서)은 표시 장치(160)(예: 디스플레이)에 임베디드된 채 구현될 수 있다

프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)을 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 로드하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(134)에 저장할 수 있다. 일실시예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 어플리케이션 프로세서), 및 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 추가적으로 또는 대체적으로, 보조 프로세서(123)은 메인 프로세서(121)보다 저전력을 사용하거나, 또는 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.

보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 표시 장치(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성 요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다.

메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비휘발성 메모리(134)를 포함할 수 있다.

프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다.

입력 장치(150)는, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 장치(150)은, 예를 들면, 마이크, 마우스, 키보드, 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.

음향 출력 장치(155)는 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 장치(155)는, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있고, 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.

표시 장치(160)는 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 표시 장치(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일실시예에 따르면, 표시 장치(160)는 터치를 감지하도록 설정된 터치 회로(touch circuitry), 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 센서 회로(예: 압력 센서)를 포함할 수 있다.

오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일실시예에 따르면, 오디오 모듈(170)은, 입력 장치(150)를 통해 소리를 획득하거나, 음향 출력 장치(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102))(예: 스피커 또는 헤드폰))를 통해 소리를 출력할 수 있다.

센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일실시예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.

인터페이스(177)는 전자 장치(101)이 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일실시예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.

연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일실시예에 따르면, 연결 단자(178)은, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.

햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일실시예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.

카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일실시예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.

전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일실시예에 따르면, 전력 관리 모듈(388)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.

배터리(189)는 전자 장치(101)의 적어도 하나의 구성 요소에 전력을 공급할 수 있다. 일실시예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.

통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108))간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일실시예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제1 네트워크(198)(예: 블루투스, WiFi direct 또는 IrDA(infrared data association) 같은 근거리 통신 네트워크) 또는 제2 네트워크(199)(예: 셀룰러 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부 전자 장치와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성 요소(예: 단일 칩)으로 통합되거나, 또는 서로 별도의 복수의 구성 요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제1 네트워크(198) 또는 제2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 및 인증할 수 있다.

안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일실시예에 따르면, 안테나 모듈은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 하나의 안테나를 포함할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 복수의 안테나들을 포함할 수 있다. 이런 경우, 제1 네트워크(198) 또는 제2 네트워크(199)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC)이 추가로 안테나 모듈(197)의 일부로 형성될 수 있다.

상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))를 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.

일실시예에 따르면, 명령 또는 데이터는 제2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104) 간에 송신 또는 수신될 수 있다. 전자 장치(102, 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 일실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부 전자 장치들(102, 104, or 108) 중 하나 이상의 외부 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다.

다양한 실시예들에 따르면, 프로세서(120)는 동영상 컨텐츠의 음성 신호로부터 그래픽 데이터 제공을 위한 적어도 하나의 키워드를 획득할 수 있다. 동영상 컨텐츠는, 복수의 이미지들 및 음성 신호를 포함하는 컨텐츠를 의미할 수 있다. 예를 들어, 동영상 컨텐츠는, 카메라를 통해 녹화가 완료된 동영상, 전자 장치에 저장된 동영상, 실시간 방송 동영상, 또는 전자 장치의 영상 통화시에 발생되는 동영상 중 적어도 하나를 포함할 수 있다. 일실시예에 따르면, 프로세서(120)는 동영상 컨텐츠에 그래픽 데이터를 적용하기 위한 이벤트가 발생되는 경우, 동영상 컨텐츠의 음성 신호를 텍스트로 변환하고, 변환된 텍스트로부터 적어도 하나의 키워드를 획득할 수 있다. 동영상 컨텐츠에 그래픽 데이터를 적용하기 위한 이벤트는, 녹화된 동영상에 대한 편집 요청 이벤트, 실시간 동영상 방송 시작 이벤트, 영상 통화 시작 이벤트, 실시간 방송 중인 동영상에 대한 그래픽 효과 추천을 요청하는 메뉴 선택 이벤트, 또는 진행 중인 영상 통화에 대한 그래픽 효과 추천을 요청하는 메뉴 선택 이벤트 중 적어도 하나를 포함할 수 있다. 음성 신호는, 동영상 컨텐츠에 함께 레코딩된 음성 신호, 또는 마이크로부터 실시간으로 입력되는 음성 신호일 수 있다. 프로세서(120)는 STT(speech to text)와 같이 당업자에게 공지된 음성 인식 기술을 이용하여, 음성 신호를 텍스트 문자로 변환할 수 있다. 프로세서(120)는 변환된 텍스트로부터 의미가 있는 적어도 하나의 단어를 추출하고, 추출된 적어도 하나의 단어를 적어도 하나의 키워드로 결정할 수 있다. 예를 들어, 프로세서(120)는 텍스트에 포함된 명사, 및/또는 대명사를 적어도 하나의 키워드로 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 획득된 음성 및/또는 텍스트를 분석하여 문맥을 파악하고, 파악된 문맥에 기초하여 적어도 하나의 키워드를 결정할 수 있다. 예컨대, 프로세서(120)는 획득된 텍스트에 지시대명사가 포함된 경우, 문맥에 기초하여 지시대명사의 의미를 파악하고, 파악된 의미를 키워드로 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 서로 연관 관계가 있는 복수 개의 단어들을 하나의 키워드로 결정할 수 있다. 예를 들어, 프로세서(120)는 "저녁 7시"와 같은 두 개의 단어는 서로 연관관계가 있으므로, 하나의 키워드로 결정할 수 있다.

다양한 실시예들에 따르면, 프로세서(120)는 음성 신호로부터 획득된 적어도 하나의 키워드에 대응되는 그래픽 데이터를 결정할 수 있다. 그래픽 데이터는, 시각적으로 표현 가능한 다양한 타입의 컨텐츠를 포함할 수 있다. 예를 들어, 그래픽 데이터는, 적어도 하나의 이미지, 사진, 동영상, 아이콘, 이모티콘, 사진, 지도, 웹페이지, 쇼핑 컨텐츠, 그래픽 효과(예: 지정된 객체가 움직이는 효과, 화면 밝기 변경 효과, 화면 색상 변경 효과 등) 중 적어도 하나를 포함할 수 있다. 나열된 그래픽 데이터들은 본 발명의 이해를 돕기 위한 예시적인 것일 뿐, 본 발명의 다양한 실시예들은 이에 한정되지 않을 것이다. 프로세서(120)는 적어도 하나의 키워드에 대응되는 적어도 하나의 그래픽 데이터를 검색하고, 검색된 적어도 하나의 그래픽 데이터를 추천 그래픽 데이터로 결정할 수 있다. 예를 들어, 프로세서(120)는 음성 신호로부터 복수 개의 키워드가 획득된 경우, 복수 개의 키워드 각각에 대응되는 복수 개의 그래픽 데이터들을 검색하고, 검색된 복수 개의 그래픽 데이터들을 추천 그래픽 데이터로 결정할 수 있다. 다른 예로, 프로세서(120)는 음성 신호로부터 하나의 키워드가 획득된 경우, 하나의 키워드에 대응되는 복수 개의 그래픽 데이터를 검색하고, 검색된 복수 개의 그래픽 데이터들을 추천 그래픽 데이터로 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 메모리(130)에 기 저장된 그래픽 데이터 DB, 및/또는 외부 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108))를 이용하여 그래픽 데이터에 대응되는 그래픽 데이터를 검색할 수 있다. 일실시예에 따르면, 프로세서(120)는 추천 그래픽 데이터들 중에서 적어도 이미지에 적용할 그래픽 데이터의 선택이 가능한 제1 사용자 인터페이스를 제공할 수 있다. 예를 들어, 프로세서(120)는 표시 장치(160)를 이용하여 음성에 대응되는 적어도 하나의 추천 그래픽 데이터를 전자 장치(101)의 디스플레이에 표시함으로써, 적어도 하나의 추천 그래픽 데이터 중 이미지에 적용될 그래픽 데이터를 선택하도록 사용자에게 요구할 수 있다. 프로세서(120)는 사용자 입력에 기초하여 적어도 하나의 추천 그래픽 데이터 중에서 하나의 추천 그래픽 데이터를 선택하고, 선택된 추천 그래픽 데이터를 이미지에 적용될 그래픽 데이터로 결정할 수 있다. 사용자 입력은, 예를 들어, 터치 입력, 드래그 입력, 사용자의 제스처, 또는 음성 명령 중 적어도 하나를 포함할 수 있다. 예컨대, 프로세서(120)는 디스플레이에 표시된 그래픽 데이터에 대한 터치 입력, 디스플레이의 제1 영역에 표시된 그래픽 데이터를 이미지가 표시된 제2 영역으로 이동시키는 드래그 입력, 지정된 제스처, 또는 지정된 음성 명령 중 적어도 하나에 기초하여, 이미지에 적용될 그래픽 데이터를 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 지정된 시간 이내에 그래픽 데이터를 선택하기 위한 사용자 입력이 감지되지 않는 경우, 이미지에 적용될 그래픽 데이터를 자동으로 결정할 수 있다. 예를 들어, 프로세서(120)는 적어도 하나의 추천 그래픽 데이터를 표시한 시점으로부터 지정된 시간 이내에 사용자 입력이 감지되지 않는 경우, 사용자 선호도, 키워드 우선순위, 또는 그래픽 데이터의 우선순위 중 적어도 하나에 기초하여, 적어도 하나의 추천 그래픽 데이터 중에서 이미지에 적용될 그래픽 데이터를 자동으로 결정할 수 있다. 일실시예에 따르면, 사용자 선호도는, 이전(과거)의 추천 그래픽 데이터에 대한 사용자 선택 이력에 기초하여 결정될 수 있다. 일실시예에 따르면, 키워드 우선순위, 및/또는 그래픽 데이터의 우선순위는, 사업자 및/또는 사용자에 의해 결정 및/또는 변경될 수 있다. 일실시예에 따르면, 키워드 우선순위 및/또는 그래픽 데이터의 우선순위는 사용자의 선호도 및/또는 다른 사용자의 선호도를 반영하여 결정 및 변경될 수 있다. 일실시예에 따르면, 프로세서(120)는 그래픽 데이터에 대한 자동 합성 기능이 활성화된 경우, 제1 사용자 인터페이스를 제공하는 동작을 생략하고, 적어도 하나의 추천 그래픽 데이터 중에서 하나의 그래픽 추천 그래픽 데이터를 자동으로 선택하고, 선택된 추천 그래픽 데이터를 이미지에 적용될 그래픽 데이터로 결정할 수 있다. 프로세서(120)는 자동 합성 기능이 활성화된 경우, 사용자 선호도, 키워드 우선순위, 그래픽 데이터의 우선순위, 또는 문맥 중 적어도 하나에 기초하여, 적어도 하나의 추천 그래픽 데이터를 자동으로 선택하고, 선택된 그래픽 데이터를 해당 이미지에 합성할 수 있다. 자동 합성 기능은, 사용자 입력에 의해 활성화되거나 비활성화될 수 있다. 예를 들어, 프로세서(120)는 그래픽 데이터에 대한 자동 합성 기능의 활성 상태 제어를 위한 별도의 메뉴를 포함하는 제2 사용자 인터페이스를 제공할 수 있다. 일실시예에 따르면, 프로세서(120)는 그래픽 데이터에 대한 자동 합성 기능이 비활성화된 경우, 상술한 바와 같이, 추천 그래픽 데이터에 대한 선택을 요구하는 제1 사용자 인터페이스를 제공할 수 있다.

다양한 실시예들에 따르면, 프로세서(120)는 키워드의 음성 발화 시점에 기초하여, 동영상 컨텐츠에 포함되는 복수의 이미지들 중에서 그래픽 데이터가 적용될 적어도 하나의 이미지를 선택할 수 있다. 일실시예에 따르면, 프로세서(120)는 결정된 그래픽 데이터에 대응되는 키워드를 식별하고, 식별된 키워드의 음성이 발화된 시점에 대응되는 적어도 하나의 이미지를 선택할 수 있다. 예를 들어, 프로세서(120)는 결정된 그래픽 데이터에 대응되는 키워드가 "저녁 7시"인 경우, "저녁 7시"의 음성이 발화되는 동안에 획득된 적어도 하나의 이미지를 선택할 수 있다. 일실시예에 따르면, 프로세서(120)는 결정된 그래픽 데이터에 대응되는 키워드를 포함하는 어구, 어절, 또는 문장을 식별하고, 식별된 어구, 어절, 또는 문장의 음성이 발화된 시점에 대응되는 적어도 하나의 이미지를 선택할 수 있다. 예를 들어, 프로세서(120)는 결정된 그래픽 데이터에 대응되는 키워드가 "저녁 7시"인 경우, "저녁 7시"를 포함하는 문장(예: "오늘 저녁 7시에 파크 에비뉴에서 파티가 있는데.."와 같은 문장)의 음성이 발화된 시점 동안에 획득된 적어도 하나의 이미지를 선택할 수 있다.

다양한 실시예들에 따르면, 프로세서(120)는 선택된 적어도 하나의 이미지에 결정된 그래픽 데이터를 적용할 수 있다. 일실시예에 따르면, 프로세서(120)는 지정된 조건에 기초하여, 이미지의 전체 영역 중 그래픽 데이터가 적용될 제1 영역을 결정하고, 적어도 하나의 이미지 각각의 제1 영역에 그래픽 데이터를 합성할 수 있다. 지정된 조건은, 예를 들어, 얼굴이 표시된 영역을 제외한 영역들 중에서 제1 영역을 결정하는 조건, 발화자의 얼굴 주변 영역들 중에서 제1 영역을 결정하는 조건, 사용자에 의해 미리 지정된 영역 내에서 제1 영역을 결정하는 조건, 또는 사용자 선호 영역 내에서 제1 영역을 결정하는 조건 중 적어도 하나를 포함할 수 있다. 사용자 선호 영역은, 그래픽 데이터에 대한 사용자의 편집 이력에 기초하여 결정될 수 있다. 예를 들어, 사용자 선호 영역은, 현재 시점 이전에 사용자 입력에 기초하여 다른 그래픽 데이터들이 이동된 영역들에 기초하여 결정될 수 있다. 상술한 지정된 조건들은 본 발명의 이해를 돕기 위한 예시적인 것으로서, 본 발명의 다양한 실시예들은 이에 한정되지 않는다. 일실시예에 따르면, 프로세서(120)는 선택된 적어도 하나의 이미지에 복수의 사용자들이 존재하는지 여부를 결정하고, 복수의 사용자들이 존재하는 경우, 복수의 사용자들 중에서 결정된 그래픽 데이터에 대응되는 키워드의 음성을 발화한 사용자를 식별할 수 있다. 프로세서(120)는 식별된 사용자의 위치 및 지정된 조건에 기초하여 그래픽 데이터가 적용될 제1 영역을 결정하고, 적어도 하나의 이미지 각각의 제1 영역에 그래픽 데이터를 합성할 수 있다. 일실시예에 따르면, 그래픽 데이터가 적용될 제1 영역은, 선택된 모든 이미지들에 대해 동일하게 결정될 수도 있고, 선택된 이미지들 각각에 대해 상이하게 결정될 수도 있다. 예를 들어, 프로세서(120)는 선택된 제1 이미지의 A 영역, 제2 이미지의 A 영역, 제3 이미지의 A 영역을 그래픽 데이터가 적용될 제1 영역으로 결정할 수 있다. 다른 예로, 프로세서(120)는 선택된 제1 이미지의 A 영역, 제2 이미지의 B 영역, 제3 이미지의 C 영역을 그래픽 데이터가 적용될 제1 영역으로 결정할 수 있다. B 영역 및 C 영역은 A 영역과 적어도 일부가 중복되지 않고, C 영역은 B 영역과 적어도 일부가 중복되지 않을 수 있다. 일실시예에 따르면, 프로세서(120)는 사용자 입력에 기초하여, 그래픽 데이터의 적용 영역을 변경할 수 있다. 예를 들어, 프로세서(120)는 제1 영역에 적용된 그래픽 데이터에 대한 사용자의 드래그 입력이 감지되면, 드래그 입력에 따라 그래픽 데이터를 이동시킬 수 있다.

다양한 실시예들에 따르면, 프로세서(120)는 그래픽 데이터가 적용된 적어도 하나의 이미지를 저장하거나, 외부 장치(예: 전자 장치(102), 전자 장치(104), 서버(108))에 전송할 수 있다. 예를 들어, 프로세서(120)는 녹화된 동영상 컨텐츠의 편집 시, 그래픽 데이터가 적용된 적어도 하나의 이미지를 동영상 컨텐츠의 적어도 일부로 저장할 수 있다. 다른 예로, 프로세서(120)는 실시간 방송 중에 그래픽 데이터가 적용된 적어도 하나의 이미지를 해당 시점의 음성 신호와 함께 외부 장치로 실시간으로 전송할 수 있다.

다양한 실시예들에 따르면, 프로세서(120)는 동영상 컨텐츠의 타임 라인 중 선택된 적어도 하나의 이미지에 대응되는 시점에 그래픽 데이터에 관련된 인디케이터를 추가하고, 추가된 인디케이터가 표시되도록 제어할 수 있다. 일실시예에 따르면, 인디케이터는 해당 시점에 대응되는 적어도 하나의 이미지에 적용된 그래픽 데이터의 타입을 나타낼 수 있다. 예를 들어, 프로세서(120)는 동영상 컨텐츠의 제n 이미지부터 제n+m 이미지에 적용된 그래픽 데이터가 특정 장소를 나타내는 지도 데이터인 경우, 제n 이미지부터 제n+m 이미지의 재생 시점에 대응되는 타임 라인의 위치에 지도 모양의 아이콘을 인디케이터로 추가할 수 있다. 다른 예로, 프로세서(120)는 동영상 컨텐츠의 제n 이미지부터 제n+m 이미지에 적용된 그래픽 데이터가 비속어에 관련된 그래픽 효과인 경우, 제n 이미지부터 제n+m 이미지의 재생 시점에 대응되는 타임 라인의 위치에 비속어에 관련된 아이콘을 인디케이터로 추가할 수 있다. 일 실시예들에 따르면, 인디케이터는 그래픽 데이터가 적용되는 시점, 또는 타임 라인이 생성되는 시점에 추가될 수 있다. 예를 들어, 녹화된 동영상을 편집하는 경우, 동영상 컨텐츠에 대한 타임 라인이 존재하므로, 프로세서(120)는 그래픽 데이터가 적용되는 시점마다 타임 라인의 해당 시점에 그래픽 데이터에 관련된 인디케이터를 추가할 수 있다. 다른 예로, 실시간 방송 또는 실시간 영상 통화의 경우, 방송 또는 영상 통화가 종료되는 시점에 타임 라인이 생성되므로, 프로세서(120)는 방송 또는 영상 통화가 종료되는 시점에 적어도 하나의 그래픽 데이터에 대한 적어도 하나의 인디케이터를 타임 라인에 추가할 수 있다. 일실시예에 따르면, 프로세서(120)는 타임 라인에 추가된 인디케이터의 위치를 조절하는 사용자 입력에 기초하여, 해당 인디케이터에 관련된 그래픽 데이터가 적어도 하나의 다른 이미지에 적용되도록 제어할 수 있다. 예를 들어, 프로세서(120)는 타임 라인의 제1 시점에 추가된 제1 인디케이터가 제1 시점의 위치에서 제2 시점의 위치로 변경되도록 요청하는 사용자 입력(예: 드래그 입력)이 감지되면, 제1 시점에 대응되는 적어도 하나의 이미지에서 제1 인디케이터에 관련된 그래픽 데이터를 삭제하고, 제1 인디케이터에 관련된 그래픽 데이터를 제2 시점에 대응되는 적어도 하나의 이미지에 적용 및/또는 합성할 수 있다.

다양한 실시예에들에 따르면, 프로세서(120)는 획득된 키워드가 지정된 키워드이거나 지정된 분류에 해당하는 키워드인 경우, 음향 효과를 제공할 수 있다. 지정된 키워드 및/또는 지정된 분류는 설계자 및/또는 사용자에 의해 설정 및 변경될 수 있다. 예를 들어, 프로세서(120)는 획득된 키워드가 비속어에 해당하는 경우, 해당 키워드의 음성 발화 시점에 비속어에 관련된 음향 효과가 제공되도록 제어할 수 있다. 다른 예로, 프로세서(120)는 획득된 키워드가 사용자에 의해 지정된 키워드인 경우, 해당 키워드의 음성 발화 시점에 지정된 키워드에 관련된 음향 효과가 제공되도록 제어할 수 있다. 예컨대, 프로세서(120)는 동영상 편집 시, 해당 키워드의 음성이 녹음된 구간에 해당 음향 효과가 녹음 및 저장되도록 제어할 수 있다. 다른 예로, 프로세서(120)는 실시간 방송, 또는 영상 통화 시, 해당 키워드의 음성이 외부 장치로 전송되는 시점에 해당 음향 효과가 함께 전송되도록 제어할 수 있다.

다양한 실시예들에 따르면, 프로세서(120)는 녹화된 동영상 컨텐츠의 재생 이벤트 감지 시, 동영상 컨텐츠를 재생하여 복수의 이미지들을 연속적으로 디스플레이에 표시하면서 동영상 컨텐츠의 타임 라인을 함께 표시할 수 있다. 타임 라인은, 예를 들어, 동영상 컨텐츠의 전체 시간에 대한 정보, 재생 중인 시점을 나타내는 정보, 또는 그래픽 데이터가 적용된 시점을 나타내는 인디케이터 중 적어도 하나를 포함할 수 있다. 일실시예에 따르면, 프로세서(120)는 동영상 컨텐츠의 재생 중에 제1 인디케이터가 표시된 타임 라인의 특정 시점에 대한 사용자 입력이 감지되는 경우, 동영상 컨텐츠의 재생 시점을 사용자 입력이 감지된 특정 시점으로 변경함으로써, 제1 인디케이터에 대응되는 그래픽 효과가 적용된 이미지들 및/또는 해당 음향 효과가 출력되도록 할 수 있다. 일실시예에 따르면, 프로세서(120)는 동영상 컨텐츠의 재생 중에 타임 라인에 표시된 제1 인디케이터에 대한 사용자 입력이 감지되는 경우, 제1 인디케이터에 관련된 그래픽 데이터를 표시할 수 있다. 예를 들어, 프로세서(120)는 동영상 컨텐츠의 재생 중에 타임 라인에 표시된 제1 인디케이터에 대한 사용자 입력이 감지되는 경우, 동영상 컨텐츠의 재생 시점을 변경하지 않고 계속 재생하면서, 제1 인디케이터에 관련된 그래픽 데이터를 디스플레이의 적어도 일부 영역에 표시할 수 있다. 제1 인디케이터에 관련된 그래픽 데이터는 지정된 영역(예: 채팅 데이터 표시 영역, 발화자 주변 영역, 타임 라인에 인접한 영역, 또는 제1 인디케이터에 인접한 영역)에 표시될 수 있다.

상술한 설명에서, 적어도 일부 동작은 외부 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108))에서 수행될 수 있다. 예를 들어, 상술한 설명에서는, 전자 장치(101)의 프로세서(120)가 동영상 컨텐츠의 음성으로부터 키워드를 획득하고 키워드에 대응되는 그래픽 데이터를 검색하였으나, 키워드를 획득하는 동작 및 그래픽 데이터를 검색하는 동작 중 적어도 하나의 동작은 서버(108)에서 수행될 수 있다. 예컨대, 프로세서(120)는 동영상 컨텐츠의 음성 신호를 서버(108)로 전송하고, 서버(108)로부터 음성 신호에 대한 적어도 하나의 키워드를 수신하고, 수신된 키워드에 대응되는 적어도 하나의 그래픽 데이터를 검색할 수 있다. 다른 예로, 프로세서(120)는 동영상 컨텐츠의 음성 신호를 서버(108)로 전송하고, 서버(108)로부터 음성 신호의 키워드에 대응되는 적어도 하나의 그래픽 데이터를 수신할 수 있다.

다양한 실시예들에 따르면, 전자 장치(101)는, 디스플레이(예: 도 1의 표시 장치(160), 및 프로세서(예: 도 1의 프로세서(120))를 포함하며, 상기 프로세서(120), 복수의 이미지들에 관련된 음성 신호로부터 적어도 하나의 키워드를 획득하고, 상기 적어도 하나의 키워드에 대응되는 적어도 하나의 그래픽 데이터를 결정하고, 상기 결정된 그래픽 데이터에 대응되는 키워드의 음성이 발화된 시점에 기초하여, 상기 복수의 이미지들 중 적어도 하나의 이미지를 선택하고, 상기 선택된 적어도 하나의 이미지에 상기 결정된 그래픽 데이터가 적용되도록 제어할 수 있다.

다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 복수의 이미지들을 포함하는 동영상 컨텐츠에 상기 그래픽 데이터가 적용된 적어도 하나의 이미지의 재생 시점을 나타내는 인디케이터를 추가하도록 제어할 수 있다.

다양한 실시예들에 따르면, 상기 인디케이터는, 상기 동영상 컨텐츠의 타임 라인 상에 표시될 수 있다.

다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 선택된 적어도 하나의 이미지에 상기 그래픽 데이터가 적용되는 시점, 또는 상기 복수의 이미지들에 대한 동영상 컨텐츠가 저장되는 시점에 상기 인디케이터를 상기 타임 라인에 추가할 수 있다.

다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 타임 라인 상에 표시된 인디케이터에 대한 드래그 입력이 감지되면, 상기 드래그 입력에 기초하여, 상기 타임 라인 상에서 상기 인디케이터가 나타내는 재생 시점을 제1 시점에서 제2 시점으로 변경하고, 상기 제1 시점에 대응되는 적어도 하나의 이미지에서 상기 인디케이터에 연관된 그래픽 데이터를 삭제하고, 상기 제2 시점에 대응되는 적어도 하나의 다른 이미지에 상기 인디케이터에 연관된 그래픽 데이터를 적용할 수 있다.

다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 적어도 하나의 키워드에 대응되는 적어도 하나의 추천 그래픽 데이터를 결정하고, 상기 결정된 적어도 하나의 추천 그래픽 데이터를 포함하는 사용자 인터페이스를 제공하고, 입력에 기초하여, 상기 적어도 하나의 추천 그래픽 데이터 중에서 상기 선택된 적어도 하나의 이미지에 적용될 그래픽 데이터를 결정할 수 있다.

다양한 실시예들에 따르면, 상기 입력은, 터치 입력, 제스처 입력, 또는 음성 입력 중 적어도 하나를 포함할 수 있다.

다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 사용자 인터페이스를 제공한 시점부터 임계 시간 이내에 상기 입력이 감지되는지 여부를 결정하고, 상기 임계 시간 이내에 상기 입력이 감지되지 않는 경우, 사용자 선호도, 상기 적어도 하나의 키워드의 우선순위, 상기 적어도 하나의 추천 그래픽 데이터의 우선순위, 또는 상기 음성 신호에 기초한 문맥 중 적어도 하나에 기초하여, 상기 적어도 하나의 추천 그래픽 데이터 중에서 상기 선택된 적어도 하나의 이미지에 적용될 그래픽 데이터를 자동으로 결정할 수 있다.

다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 적어도 하나의 키워드가 지정된 분류에 대응되는지 여부를 결정하고, 상기 적어도 하나의 키워드가 지정된 분류에 대응되는 경우, 상기 적어도 하나의 키워드에 대응되는 음향 효과를 결정하고, 상기 적어도 하나의 키워드에 대응되는 음성 신호의 출력 시점에 상기 음향 효과가 적용되도록 제어할 수 있다.

다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 선택된 적어도 하나의 이미지에 복수의 사용자들이 존재하는지 여부를 결정하고, 상기 복수의 사용자들이 존재하는 경우, 상기 복수의 사용자들 중에서 상기 결정된 그래픽 데이터에 대응되는 키워드의 음성을 발화한 사용자를 식별하고, 상기 선택된 적어도 하나의 이미지 내에서 상기 식별된 사용자가 위치한 영역에 적어도 기초하여, 상기 결정된 그래픽 데이터가 적용될 합성 영역을 결정하고, 상기 선택된 적어도 하나의 이미지의 합성 영역에 상기 결정된 그래픽 데이터를 합성할 수 있다.

다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 합성된 그래픽 데이터에 대한 드래그 입력에 기초하여, 상기 선택된 적어도 하나의 이미지의 영역 내에서 상기 그래픽 데이터의 합성 영역을 변경할 수 있다.

다양한 실시예들에 따르면, 메모리(예: 도 1의 메모리(130))를 더 포함하며,상기 프로세서(120)는, 상기 메모리(130)로부터 동영상 컨텐츠를 획득하고, 상기 획득된 동영상 컨텐츠로부터 상기 복수의 이미지들에 관련된 음성 신호를 획득할 수 있다.

다양한 실시예들에 따르면, 카메라(예: 도 1의 카메라 모듈(180)), 및 입력 장치(예:도 1의 입력 장치(150))를 더 포함하며, 상기 프로세서는, 상기 카메라로부터 상기 복수의 이미지들을 획득하고, 상기 입력 장치로부터 상기 복수의 이미지들에 관련된 음성 신호를 획득할 수 있다.

도 2는 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠의 음성 신호에 기반하여 그래픽 데이터를 적용하는 흐름도(200)이다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다. 여기에서, 전자 장치는 도 1의 전자 장치(101)일 수 있다.

도 2를 참조하면, 다양한 실시예들에 따른 전자 장치(예: 도 1의 프로세서(120))는 동작 201에서 동영상 컨텐츠의 음성 신호로부터 적어도 하나의 키워드를 획득할 수 있다. 일실시예에 따르면, 프로세서(120)는 동영상 컨텐츠에 그래픽 데이터를 적용하기 위한 이벤트가 발생되는 경우, 동영상 컨텐츠의 음성 신호를 텍스트로 변환하고, 변환된 텍스트로부터 적어도 하나의 키워드를 획득할 수 있다. 음성 신호는, 동영상 컨텐츠에 함께 레코딩된 음성 신호, 또는 마이크로부터 실시간으로 입력되는 음성 신호일 수 있다. 일실시예에 따르면, 프로세서(120)는 STT(speech to text)와 같이 당업자에게 공지된 음성 인식 기술을 이용하여, 음성 신호를 텍스트 문자로 변환할 수 있다. 프로세서(120)는 변환된 텍스트로부터 적어도 하나의 단어를 추출하고, 추출된 적어도 하나의 단어를 적어도 하나의 키워드로 획득할 수 있다. 일실시예에 따르면, 프로세서(120)는 전체 문맥에 기초하여 변환된 텍스트 내에서 적어도 하나의 키워드를 획득할 수 있다. 일실시예에 따르면, 프로세서(120)는 외부 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108))와의 통신을 통해 동영상 컨텐츠의 음성 신호에 대응되는 적어도 하나의 키워드를 획득할 수 있다. 예를 들어, 프로세서(120)는 서버(108)로 음성 신호를 전송하고, 서버(108)로부터 음성 신호에 대응되는 적어도 하나의 키워드를 포함하는 신호를 수신할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 도 1의 프로세서(120))는 동작 203에서 적어도 하나의 키워드에 대응되는 그래픽 데이터를 결정할 수 있다. 그래픽 데이터는, 시각적으로 표현 가능한 다양한 타입의 컨텐츠를 포함할 수 있다. 예를 들어, 그래픽 데이터는, 적어도 하나의 이미지, 사진, 동영상, 아이콘, 이모티콘, 사진, 지도, 웹페이지, 쇼핑 컨텐츠, 그래픽 효과(예: 지정된 객체가 움직이는 효과, 화면 밝기 변경 효과, 화면 색상 변경 효과 등) 중 적어도 하나를 포함할 수 있다. 나열된 그래픽 데이터들은 본 발명의 이해를 돕기 위한 예시적인 것일 뿐, 본 발명의 다양한 실시예들은 이에 한정되지 않을 것이다. 일실시예에 따르면, 프로세서(120)는 적어도 하나의 키워드에 대응되는(또는 연관된) 적어도 하나의 그래픽 데이터를 검색하고, 검색된 적어도 하나의 그래픽 데이터를 이미지에 적용될 그래픽 데이터로 결정할 수 있다. 프로세서(120)는 메모리(예: 도 1의 메모리(130))로부터 적어도 하나의 키워드에 대응되는 그래픽 데이터를 검색하거나, 외부 장치(예: 도 1의 전자 장치(102), 전자 장치(104), 또는 서버(108))로 적어도 하나의 키워드에 대응되는 그래픽 데이터를 요청하는 신호를 전송하고, 요청에 대한 응답으로 적어도 하나의 키워드에 대응되는 그래픽 데이터를 포함하는 신호를 획득할 수 있다. 일실시예에 따르면, 프로세서(120)는 적어도 하나의 키워드에 대응되는 그래픽 데이터가 복수인 경우, 사용자 입력, 사용자 선호도, 또는 우선순위 중 적어도 하나에 기초하여 복수의 그래픽 데이터 중에서 이미지에 적용될 그래픽 데이터를 결정할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 도 1의 프로세서(120))는 동작 205에서 결정된 그래픽 데이터에 대응되는 키워드의 음성 발화 시점에 기초하여 적어도 하나의 이미지를 선택할 수 있다. 일실시예에 따르면, 프로세서(120)는 결정된 그래픽 데이터에 대응되는 키워드를 식별하고, 식별된 키워드의 음성이 발화된 시점에 대응되는 적어도 하나의 이미지를 선택할 수 있다. 예를 들어, 프로세서(120)는 결정된 그래픽 데이터에 대응되는 키워드가 "오늘"인 경우, "오늘"의 음성이 발화되는 동안에 획득된 복수의 이미지들 중 적어도 하나를 선택할 수 있다. 일실시예에 따르면, 프로세서(120)는 결정된 그래픽 데이터에 대응되는 키워드를 포함하는 어구, 어절, 또는 문장을 식별하고, 식별된 어구, 어절, 또는 문장의 음성이 발화된 시점에 대응되는 적어도 하나의 이미지를 선택할 수 있다. 예를 들어, 프로세서(120)는 결정된 그래픽 데이터에 대응되는 키워드가 "오늘"인 경우, "오늘"를 포함하는 문장(예: "오늘 저녁 7시에 파크 에비뉴에서 파티가 있는데.."와 같은 문장)의 음성이 발화된 시점 동안에 획득된 복수의 이미지들 중 적어도 하나를 선택할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 도 1의 프로세서(120), 및/또는 표시 장치(160))는 동작 207에서 선택된 적어도 하나의 이미지에 결정된 그래픽 데이터를 적용할 수 있다. 일실시예에 따르면, 프로세서(120)는 지정된 조건에 기초하여, 이미지의 전체 영역 중 그래픽 데이터가 적용될 제1 영역을 결정하고, 적어도 하나의 이미지 각각의 제1 영역에 결정된 그래픽 데이터를 합성(또는 적용)하여 표시할 수 있다. 지정된 조건은, 예를 들어, 얼굴이 표시된 영역을 제외한 영역들 중에서 제1 영역을 결정하는 조건, 발화자의 얼굴 주변 영역들 중에서 제1 영역을 결정하는 조건, 사용자에 의해 미리 지정된 영역 내에서 제1 영역을 결정하는 조건, 또는 사용자 선호 영역 내에서 제1 영역을 결정하는 조건 중 적어도 하나를 포함할 수 있다. 사용자 선호 영역은, 그래픽 데이터에 대한 사용자의 편집 이력에 기초하여 결정될 수 있다. 예를 들어, 사용자 선호 영역은, 현재 시점 이전에 사용자 입력에 기초하여 다른 그래픽 데이터들이 이동된 영역들에 기초하여 결정될 수 있다. 상술한 지정된 조건들은 본 발명의 이해를 돕기 위한 예시적인 것으로서, 본 발명의 다양한 실시예들은 이에 한정되지 않는다. 일실시예에 따르면, 그래픽 데이터가 적용될 제1 영역은, 선택된 모든 이미지들에 대해 동일하게 결정될 수도 있고, 선택된 이미지들 각각에 대해 상이하게 결정될 수도 있다. 예를 들어, 프로세서(120)는 선택된 제1 이미지의 A 영역, 제2 이미지의 A 영역, 제3 이미지의 A 영역을 그래픽 데이터가 적용될 제1 영역으로 결정할 수 있다. 다른 예로, 프로세서(120)는 선택된 제1 이미지의 A 영역, 제2 이미지의 B 영역, 제3 이미지의 C 영역을 그래픽 데이터가 적용될 제1 영역으로 결정할 수 있다. B 영역 및 C 영역은 A 영역과 적어도 일부가 중복되지 않고, C 영역은 B 영역과 적어도 일부가 중복되지 않을 수 있다.

도 3은 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠의 음성 신호로부터 키워드를 획득하는 흐름도이다. 이하 설명되는 도 3의 동작들은 도 2의 동작 201의 상세한 동작 중 적어도 일부일 수 있다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다. 여기에서, 전자 장치는 도 1의 전자 장치(101)일 수 있다.

도 3을 참조하면, 다양한 실시예들에 따른 전자 장치(예: 도 1의 프로세서(120))는 동작 301에서 그래픽 추천 이벤트를 감지할 수 있다. 그래픽 추천 이벤트는 동영상 컨텐츠의 음성 신호를 이용하여 동영상 컨텐츠에 그래픽 데이터를 적용하기 위한 이벤트를 포함할 수 있다. 일실시예에 따르면, 프로세서(120)는 녹화된 동영상에 대한 편집 요청 이벤트, 실시간 동영상 방송 시작 이벤트, 영상 통화 시작 이벤트, 실시간 방송 중인 동영상에 대한 그래픽 효과 추천을 요청하는 메뉴 선택 이벤트, 또는 진행 중인 영상 통화에 대한 그래픽 효과 추천을 요청하는 메뉴 선택 이벤트 중 적어도 하나가 감지된 경우, 그래픽 추천 이벤트가 발생된 것으로 결정할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 303에서 복수의 이미지들에 관련된 음성 신호를 획득할 수 있다. 일실시예에 따르면, 프로세서(120)는 메모리(예: 도 1의 메모리(130))에 저장된 동영상 컨텐츠로부터 동영상 컨텐츠에 포함된 복수의 이미지들에 관련된 음성 신호를 획득할 수 있다. 예를 들어, 프로세서(120)는 녹화된 동영상에 대한 편집 요청 이벤트 감지 시, 메모리(130)로부터 편집이 요청된 동영상 컨텐츠를 획득하고, 획득된 동영상 컨텐츠에 포함된 음성 신호를 획득할 수 있다. 일실시예에 따르면, 프로세서(120)는 마이크(예: 도 1의 입력 장치(150))로부터 복수의 이미지들에 관련된 음성 신호를 실시간으로 획득할 수 있다. 예를 들어, 프로세서(120)는 실시간 동영상 방송 시작 이벤트 감지 시, 또는 영상 통화 시작 이벤트 감지 시에, 카메라(예: 도 1의 카메라 모듈(180))로부터 복수의 이미지들을 획득하면서 마이크(예: 입력 장치(150))로부터 복수의 이미지들에 관련된 음성 신호를 실시간으로 획득할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 305에서 음성 신호를 텍스트로 변환할 수 있다. 일실시예에 따르면, 프로세서(120)는 당업자에게 공지된 음성 인식 기술을 이용하여 음성 신호를 텍스트로 변환할 수 있다. 예를 들어, 프로세서(120)는 STT(speech to text)와 같은 기술을 이용할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 307에서 변환된 텍스트로부터 적어도 하나의 키워드를 획득할 수 있다. 일실시예에 따르면, 프로세서(120)는 텍스트로부터 의미가 있는 적어도 하나의 단어를 추출하고, 추출된 적어도 하나의 단어를 적어도 하나의 키워드로 결정할 수 있다. 예를 들어, 프로세서(120)는 텍스트에 포함된 명사, 및/또는 대명사를 추출하고, 추출된 명사, 및/또는 대명사를 적어도 하나의 키워드로 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 획득된 음성 및/또는 텍스트를 분석하여 문맥을 파악하고, 파악된 문맥에 기초하여 적어도 하나의 키워드를 결정할 수 있다. 예컨대, 프로세서(120)는 획득된 텍스트에 지시대명사가 포함된 경우, 문맥에 기초하여 지시대명사의 의미를 파악하고, 파악된 의미를 키워드로 결정할 수 있다. 예를 들어, 획득된 텍스트에 지시대명사 "거기"이 포함된 경우, 문맥에 기초하여 "거기"가 가리키는 장소를 파악하고, 파악된 장소를 키워드로 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 서로 연관 관계가 있는 복수 개의 단어들을 하나의 키워드로 결정할 수 있다. 예를 들어, 프로세서(120)는 "저녁 7시"와 같은 두 개의 단어는 시간적인 연관 관계를 갖는 단어들이므로, 하나의 키워드로 결정할 수 있다.

도 4는 다양한 실시예들에 따른 전자 장치에서 음성 신호의 키워드를 기반으로 그래픽 데이터를 결정하는 흐름도(400)이다. 이하 설명되는 도 4의 동작들은 도 2의 동작 203의 상세한 동작 중 적어도 일부일 수 있다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다. 여기에서, 전자 장치는 도 1의 전자 장치(101)일 수 있다. 이하에서 도 4의 적어도 일부 동작은 도 5a 내지 도 5c를 참조하여 설명할 것이다. 도 5a 내지 도 5c는 다양한 실시예들에 따른 전자 장치에서 음성 신호에 대응되는 그래픽 데이터를 추천 및 결정하는 화면 구성에 대한 예시도이다.

도 4를 참조하면, 다양한 실시예들에 따른, 전자 장치(예: 도 1의 프로세서(120))는 동작 401에서 복수 개의 키워드들이 획득되었는지 여부를 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 동작 201 및/또는 도 3에서 설명한 바와 같이 적어도 하나의 키워드를 획득하고, 획득된 키워드가 복수 개인지, 또는 한 개인지 여부를 결정할 수 있다. 예를 들어, 프로세서(120)는 지정된 길이, 및/또는 지정된 조건의 음성 신호로부터 획득된 키워드가 복수 개인지, 또는 한 개인지 여부를 결정할 수 있다. 지정된 길이는, 지정된 시간 구간을 의미할 수 있다. 지정된 조건은, 어구, 어절, 및/또는 문장에 대한 조건일 수 있다. 예를 들어, 프로세서(120)는 하나의 문장을 포함하는 음성 신호로부터 획득된 키워드가 복수 개인지, 또는 한 개인지 여부를 결정할 수 있다. 다른 예로, 프로세서(120)는 n초 길이를 갖는 음성 신호로부터 획득된 키워드가 복수 개인지, 또는 한 개인지 여부를 결정할 수 있다. 지정된 길이, 및/또는 지정된 조건에 대해 나열된 예시들은, 본 발명의 실시예들에 대한 이해를 돕기 위한 것으로서, 본 발명은 나열된 예시들에 한정되지 않을 것이다.

다양한 실시예들에 따르면, 복수 개의 키워드들이 획득된 경우, 전자 장치(예: 프로세서(120))는 동작 403에서 복수 개의 키워드 각각에 대응되는 복수 개의 추천 그래픽 데이터를 검색할 수 있다. 예를 들어, 프로세서(120)는 두 개의 키워드가 획득된 경우, 제1 키워드에 대응되는 적어도 하나의 제1 그래픽 데이터를 검색하고, 제2 키워드에 대응되는 적어도 하나의 제2 그래픽 데이터를 검색할 수 있다. 프로세서(120)는 두 개의 키워드 각각에 대해 검색된 제1 및 제2 그래픽 데이터를 추천 그래픽 데이터로 결정할 수 있다.

다양한 실시예들에 따르면, 복수 개의 키워드들이 획득되지 않은 경우(한 개의 키워드만 획득된 경우), 전자 장치(예: 프로세서(120))는 동작 417에서 한 개의 키워드에 대응되는 복수 개의 추천 그래픽 데이터를 검색할 수 있다. 일실시예에 따르면, 프로세서(120)는 획득된 한 개의 키워드에 대응되는 복수 개의 그래픽 데이터를 검색하고, 검색된 그래픽 데이터를 추천 그래픽 데이터로 결정할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 405에서 자동 합성 기능이 활성화된 상태인지 여부를 결정할 수 있다. 자동 합성 기능은, 예를 들어, 사용자 선택 없이, 사용자 선호도, 키워드 우선순위, 그래픽 데이터의 우선순위, 또는 문맥 중 적어도 하나에 기초하여, 추천 그래픽 데이터들 중에서 하나를 자동으로 선택하여 해당 이미지에 합성하기 위한 기능일 수 있다. 자동 합성 기능은, 사용자 입력에 기초하여 활성화되거나 비활성화될 수 있다. 예를 들어, 프로세서(120)는 자동 합성 기능의 활성 여부에 대한 설정 메뉴를 포함하는 제2 사용자 인터페이스를 제공할 수 있다.

다양한 실시예들에 따르면, 자동 합성 기능이 활성화되지 않은 경우, 전자 장치(예: 프로세서(120), 및/또는 도 1의 표시 장치(160))는 동작 407에서 복수 개의 추천 그래픽 데이터를 출력할 수 있다. 일실시예에 따르면, 프로세서(120)는 검색된 추천 그래픽 데이터를 포함하는 제1 사용자 인터페이스를 제공하여, 복수 개의 추천 그래픽 데이터 중에서 해당 이미지에 적용할 그래픽 데이터의 선택을 요구할 수 있다. 일실시예에 따르면, 제1 사용자 인터페이스는, 추천 그래픽 데이터에 대응되는 음성 신호의 스크립트를 추가로 포함할 수 있다. 음성 신호의 스크립트는 음성 신호로부터 변환된 텍스트에 기초하여 생성될 수 있다. 예를 들어, 프로세서(120)는 음성 신호에 대한 텍스트 및 해당 텍스트의 키워드에 대응되는 적어도 하나의 추천 그래픽 데이터를 전자 장치(101)의 디스플레이의 적어도 일부 영역에 표시함으로써, 적어도 하나의 추천 그래픽 데이터 중 해당 이미지에 적용될 그래픽 데이터를 선택하도록 사용자에게 요구할 수 있다. 예컨대, 도 5a에 도시된 바와 같이, 프로세서(120)는 프리뷰 영역(501), 타임 라인 영역(502), 및 재생 시점 표시 영역(503)을 포함하는 동영상 편집 화면이 표시된 상태에서, 적어도 일부 영역에 음성 신호의 스크립트(512), 및 추천 그래픽 데이터(513)를 포함하는 제1 사용자 인터페이스(511)가 추가적으로 표시되도록 디스플레이(예: 도 1의 표시 장치(160))를 제어할 수 있다. 제1 사용자 인터페이스(511)가 표시되는 영역은, 프리뷰 영역(501), 타임 라인 영역(502), 및 재생 시점 표시 영역(503)과 중복되지 않도록 설정될 수 있다. 일실시예에 따르면, 프리뷰 영역(501)은 동영상 컨텐츠의 재생 및/또는 편집에 따른 복수의 이미지들이 연속적으로 표시되는 영역일 수 있다. 타임 라인 영역(502)은, 동영상 컨텐츠의 특정 재생 시간 구간(또는 특정 재생 단락)에 대응되는 적어도 하나의 이미지가 표시되는 영역일 수 있다. 재생 시점 표시 영역(503)은 동영상 컨텐츠의 전체 시간 구간들 중에서 현재 재생 및/또는 편집 중인 시간 구간(또는 단락)이 표시되는 영역일 수 있다. 제1 사용자 인터페이스(511)는 제1 사용자 인터페이스(511) 내에 포함된 추천 그래픽 데이터(513)와 음성 신호의 스크립트(512)에 연관된 시간 구간(또는 단락)을 나타내도록 구성될 수 있다. 예를 들어, 제1 사용자 인터페이스(511)는 연관된 시간 구간으로부터 파생된 말풍선 형태로 표시되도록 구성될 수 있다. 다른 예로, 도 5b 및 도 5c에 도시된 바와 같이, 프로세서(120)는 실시간 방송 이미지 표시 영역(531, 561), 방송 청취 사용자 정보 표시 영역(532, 562), 및 채팅 정보 표시 영역(533, 563)을 포함하는 실시간 방송 화면이 표시된 상태에서, 적어도 일부 영역에 음성 신호의 스크립트(542, 572), 및 추천 그래픽 데이터(543, 573)를 포함하는 제1 사용자 인터페이스(541, 571가 추가적으로 표시되도록 디스플레이(예: 표시 장치(160))를 제어할 수 있다. 제1 사용자 인터페이스(541, 571)가 표시되는 영역은, 실시간 방송 이미지 표시 영역(531, 561), 방송 청취 사용자 정보 표시 영역(562), 또는 채팅 정보 표시 영역(563) 중 적어도 하나의 영역과 적어도 일부가 중복되도록 설정될 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 409에서 임계 시간 이내에 그래픽 데이터의 선택을 위한 입력이 감지되는지 여부를 결정할 수 있다. 임계 시간은, 추천 그래픽 데이터를 출력한(또는 표시한) 시점으로부터 지정된 시간일 수 있다. 임계 시간은, 사업자 및/또는 사용자에 의해 설정 및/또는 변경될 수 있다. 그래픽 데이터의 선택을 위한 입력은, 터치 입력, 드래그 입력, 사용자의 제스처, 또는 음성 명령 중 적어도 하나를 포함할 수 있다. 예를 들어, 그래픽 데이터의 선택을 위한 입력은, 표시된 추천 그래픽 데이터 중 어느 하나를 터치하는 입력, 표시된 추천 그래픽 데이터 중 어느 하나를 드래그한 후 이미지가 표시된 영역(예: 프리뷰 영역(501), 실시간 방송 이미지 표시 영역(531, 561))에서 드롭(drop)하는 드래그 입력, 1번째 순서부터 n번째 순서 중 어느 하나의 순서를 나타내는 사용자 제스처(예: 손가락 제스처), 선택하고자 하는 그래픽 데이터의 순서를 포함하는 음성 명령, 또는 선택하고자 하는 그래픽 데이터의 의미를 포함하는 음성 명령 중 적어도 하나를 포함할 수 있다.

다양한 실시예들에 따르면, 임계 시간 이내에 그래픽 데이터의 선택을 위한 입력이 감지되는 경우, 전자 장치(예: 프로세서(120))는 동작 411에서 사용자 선택에 기초하여 합성될 그래픽 데이터를 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 추천 그래픽 데이터 중 사용자 입력에 의해 선택된 추천 그래픽 데이터를 표시하고, 선택된 추천 그래픽 데이터를 해당 이미지에 합성될 그래픽 데이터로 결정할 수 있다. 예를 들어, 도 5a에 도시된 바와 같이, 제1 사용자 인터페이스(511)에 포함된 추천 그래픽 데이터 중에서 첫 번째 그래픽 데이터에 대한 터치 입력(514)이 감지된 경우, 첫 번째 그래픽 데이터가 선택되었음을 표시(521)할 수 있다. 다른 예로, 도 5b에 도시된 바와 같이, 제1 사용자 인터페이스(541)에 포함된 추천 그래픽 데이터 중에서 두 번째 그래픽 데이터를 선택하기 위한 음성 명령(예: 두 번째 그래픽, 또는 두 번째 스티커)이 감지된 경우, 두 번째 그래픽 데이터가 선택되었음을 표시(551)할 수 있다. 다른 예로, 도 5c에 도시된 바와 같이, 제1 사용자 인터페이스(571)에 포함된 추천 그래픽 데이터 중에서 두 번째 그래픽 데이터를 선택하기 위한 제스처(예: 두 개의 손가락을 핀 제스처)이 감지된 경우, 두 번째 그래픽 데이터가 선택되었음을 표시(581)할 수 있다. 일실시예에 따라, 프로세서(120)는 선택된 추천 그래픽 데이터의 표시 크기를 변경함으로써, 해당 추천 그래픽 데이터가 선택되었음을 나타낼 수 있다. 이는 예시적인 것으로서, 프로세서(120)는 선택된 추천 그래픽 데이터의 색상, 굵기, 선명도를 조절하여 해당 추천 그래픽 데이터가 선택되었음을 나타낼 수 있다.

다양한 실시예들에 따르면, 임계 시간 이내에 그래픽 데이터의 선택을 위한 입력이 감지되지 않는 경우, 전자 장치(예: 프로세서(120))는 동작 413에서 자동 선택 기능이 활성화된 상태인지 여부를 결정할 수 있다. 자동 선택 기능은, 임계 시간 이내에 사용자 입력이 감지되지 않은 경우에, 사용자 선호도, 키워드 우선순위, 그래픽 데이터의 우선순위, 또는 문맥 중 적어도 하나에 기초하여, 추천 그래픽 데이터들 중에서 하나를 자동으로 선택하여 해당 이미지에 합성하기 위한 기능일 수 있다. 자동 선택 기능은, 사용자 입력에 기초하여 활성화되거나 비활성화될 수 있다. 예를 들어, 프로세서(120)는 자동 선택 기능의 활성 여부에 대한 설정 메뉴를 포함하는 사용자 인터페이스를 제공할 수 있다.

다양한 실시예들에 따르면, 자동 선택 기능이 활성화된 상태인 경우 또는 자동 합성 기능이 활성화된 상태인 경우, 전자 장치(예: 프로세서(120))는 동작 415에서 복수 개의 추천 그래픽 데이터 중에서 이미지에 합성될 그래픽 데이터를 자동으로 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 사용자 선호도, 키워드 우선순위, 그래픽 데이터의 우선순위, 또는 문맥 중 적어도 하나에 기초하여, 추천 그래픽 데이터들 중에서 하나를 자동으로 선택하고, 선택된 그래픽 데이터를 합성될 데이터로 결정할 수 있다. 사용자 선호도는, 이전(과거)의 추천 그래픽 데이터에 대한 사용자 선택 이력에 기초하여 결정 및 갱신될 수 있다. 일실시예에 따르면, 키워드 우선순위, 및/또는 그래픽 데이터의 우선순위는, 사업자 및/또는 사용자에 의해 결정 및/또는 변경될 수 있다. 일실시예에 따르면, 키워드 우선순위 및/또는 그래픽 데이터의 우선순위는 사용자의 선호도 및/또는 다른 사용자의 선호도를 반영하여 결정 및 변경될 수 있다. 예를 들어, 프로세서(120)는 사용자 선호도를 분석한 결과, 사용자가 현재 시점 이전까지 장소 관련 그래픽 데이터를 가장 많이 선택하여 이미지에 합성한 경우, 추천 그래픽 데이터 중에서 장소 관련 그래픽 데이터를 합성될 그래픽 데이터로 결정할 수 있다. 다른 예로, 프로세서(120)는 추천 그래픽 데이터 각각의 타입을 확인하고, 확인된 타입들 중 사용자 선호도가 가장 높은 타입의 추천 그래픽 데이터를 합성된 그래픽 데이터로 결정할 수 있다. 다른 예로, 프로세서(120)는 문맥에 기초하여, 사용자가 강조하고자 하는 단어와 관련된 키워드를 결정하고, 결정된 키워드에 대응되는 추천 그래픽 데이터를 합성될 그래픽 데이터로 결정할 수 있다.

다양한 실시예들에 따르면, 자동 선택 기능이 활성화되지 않은 상태인 경우, 전자 장치(예: 프로세서(120), 및/또는 도 1의 표시 장치(160))는 복수 개의 추천 그래픽 데이터를 디스플레이에서 제거하고, 동작 401로 되돌아갈 수 있다. 예를 들어, 프로세서(120)는 복수 개의 추천 그래픽 데이터 중 이미지에 합성될 그래픽 데이터를 선택하기 위한 사용자 입력이 임계 시간 동안 감지되지 않고, 자동 선택 기능이 비활성화된 상태인 경우, 사용자가 해당 추천 그래픽 데이터를 이미지에 합성하지 않기를 원하는 것으로 결정하고, 다음 음성 신호에 대응되는 그래픽 데이터를 추천 및/또는 결정하기 위해, 동작 401로 되돌아가 이하 동작들을 재수행할 수 있다.

도 6은 다양한 실시예들에 따른 전자 장치에서 그래픽 데이터가 적용될 적어도 하나의 이미지를 결정하는 흐름도(600)이다. 이하 설명되는 도 6의 동작들은 도 2의 동작 205의 상세한 동작 중 적어도 일부일 수 있다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다. 여기에서, 전자 장치는 도 1의 전자 장치(101)일 수 있다.

도 6을 참조하면, 다양한 실시예들에 따른, 전자 장치(예: 도 1의 프로세서(120))는 동작 601에서 결정된 그래픽 데이터에 대응되는 키워드를 식별할 수 있다. 일실시예에 따르면, 프로세서(120)는 도 2의 동작 203 및/또는 도 4에서 설명한 바와 같이, 결정된 그래픽 데이터에 대응되는 키워드를 식별할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 603에서 식별된 키워드에 대응되는 음성 발화 시점을 확인할 수 있다. 일실시예에 따르면, 프로세서(120)는 동영상 컨텐츠의 편집 시, 식별된 키워드에 대응되는 음성이 발화된 시간 구간에 대응되는 동영상 컨텐츠의 재생 시간 구간을 확인할 수 있다. 일실시예에 따르면, 프로세서(120)는 실시간 방송 시, 식별된 키워드에 대응되는 음성이 발화되어 마이크(예: 도 1의 입력 장치(150))를 통해 입력된 시점(또는 시간 구간)을 확인할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 605에서 복수의 이미지들 중에서 음성 발화 시점에 대응되는 적어도 하나의 이미지를 선택할 수 있다. 복수의 이미지들은, 녹화된 동영상 컨텐츠에 포함되는 복수의 이미지들, 또는 실시간 방송되는 동영상 컨텐츠에 포함되는 복수의 이미지들일 수 있다. 일실시예에 따르면, 프로세서(120)는 결정된 그래픽에 대응되는 키워드의 음성 발화 시점에 기초하여, 동영상 컨텐츠에 포함되는 복수의 이미지들 중에서 그래픽 데이터가 적용될 적어도 하나의 이미지를 선택할 수 있다. 예를 들어, 프로세서(120)는 동영상 컨텐츠 편집 시, 결정된 그래픽 데이터에 대응되는 키워드가 "저녁 7시"이고, "저녁 7시"의 음성 발화 시점이 00:00:07-00:00:09로 확인된 경우, 동영상 컨텐츠의 00:00:07-00:00:09 구간에 대응되는 복수의 이미지들 중에서 적어도 하나의 이미지를 선택할 수 있다. 다른 예로, 프로세서(120)는 실시간 방송 시, 결정된 그래픽 데이터에 대응되는 키워드가 "오늘"이고, "오늘"의 음성 발화 시점이 01:00:06-01:00:07로 확인된 경우, 01:00:06-01:00:07에 카메라(예: 도 1의 카메라 모듈(180))을 통해 획득된 복수의 이미지들 중에서 적어도 하나의 이미지를 선택할 수 있다. 일실시예에 따르면, 프로세서(120)는 결정된 그래픽 데이터에 대응되는 키워드를 포함하는 어구, 어절, 또는 문장을 식별하고, 식별된 어구, 어절, 또는 문장의 음성이 발화된 시점에 대응되는 적어도 하나의 이미지를 선택할 수 있다. 예를 들어, 프로세서(120)는 결정된 그래픽 데이터에 대응되는 키워드가 "저녁 7시"인 경우, "저녁 7시"를 포함하는 문장(예: "오늘 저녁 7시에 파크 에비뉴에서 파티가 있는데.."와 같은 문장)의 음성 발화 시점에 대응되는 복수의 이미지들 중에서 적어도 하나의 이미지를 선택할 수 있다.

도 7은 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠에 그래픽 데이터를 적용하는 흐름도(700)이다. 이하 설명되는 도 7의 동작들은 도 2의 동작 207의 상세한 동작 중 적어도 일부일 수 있다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다. 이하에서 점선으로 표시된 동작은 실시예에 따라 생략될 수 있다. 여기에서, 전자 장치는 도 1의 전자 장치(101)일 수 있다. 이하에서 도 6의 적어도 일부 동작은 도 8a 내지 도 8e를 참조하여 설명할 것이다. 도 8a 내지 도 8c는 다양한 실시예들에 따른 전자 장치에서 그래픽 데이터를 적용하는 화면 구성에 대한 예시도이다. 도 8d 및 도 8e는 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠의 타임라인에 그래픽 데이터가 적용되었음을 나타내는 인디케이터를 표시하는 화면 구성에 대한 예시도이다.

도 7을 참조하면, 다양한 실시예들에 따른, 전자 장치(예: 도 1의 프로세서(120))는 동작 701에서 선택된 적어도 하나의 이미지 내에 다수의 사용자가 존재하는지 여부를 결정할 수 있다. 예를 들어, 프로세서(120)는 도 2의 동작 205 및/또는 도 6에서 선택된 적어도 하나의 이미지 내에 다수의 사용자가 존재하는지 여부를 결정할 수 있다.

다양한 실시예들에 따르면, 적어도 하나의 이미지 내에 다수의 사용자가 존재하는 경우, 전자 장치(예: 프로세서(120))는 동작 703에서 사용자들 중 발화자를 선택할 수 있다. 일실시예에 따르면, 프로세서(120)는 이미지 내 사용자들의 움직임을 분석하여, 다수의 사용자들 중에서 결정된 그래픽 데이터에 대응되는 키워드의 음성을 발화한 사용자를 식별하고, 식별된 사용자를 발화자로 선택할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 705에서 발화자의 위치 및 지정된 조건에 기초하여 합성 영역을 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 이미지의 전체 영역 중에서 발화자 위치 및 지정된 조건에 기초하여, 그래픽 데이터가 합성될 합성 영역(또는 제1 영역)을 결정할 수 있다. 발화자의 위치는, 예를 들어, 이미지 내 영역 중에서 식별된 발화자가 존재하는 영역을 포함할 수 있다. 지정된 조건은, 예를 들어, 얼굴이 표시된 영역을 제외한 영역들 중에서 합성 영역을 결정하는 조건, 발화자의 얼굴 주변 영역들 중에서 합성 영역을 결정하는 조건, 사용자에 의해 미리 지정된 영역 내에서 합성 영역을 결정하는 조건, 또는 사용자 선호 영역 내에서 합성 영역을 결정하는 조건 중 적어도 하나를 포함할 수 있다. 사용자 선호 영역은, 그래픽 데이터에 대한 사용자의 편집 이력에 기초하여 결정될 수 있다. 예를 들어, 사용자 선호 영역은, 현재 시점 이전에 사용자 입력에 기초하여 다른 그래픽 데이터들이 이동된 영역들에 기초하여 결정될 수 있다. 상술한 지정된 조건들은 본 발명의 이해를 돕기 위한 예시적인 것으로서, 본 발명의 다양한 실시예들은 이에 한정되지 않는다. 일실시예에 따르면, 그래픽 데이터가 합성될 합성 영역은, 선택된 모든 이미지들에 대해 동일하게 결정될 수도 있고, 선택된 이미지들 각각에 대해 상이하게 결정될 수도 있다. 예를 들어, 프로세서(120)는 선택된 제1 이미지의 A 영역, 제2 이미지의 A 영역, 제3 이미지의 A 영역을 그래픽 데이터가 합성될 영역으로 결정할 수 있다. 다른 예로, 프로세서(120)는 선택된 제1 이미지의 A 영역, 제2 이미지의 B 영역, 제3 이미지의 C 영역을 그래픽 데이터가 합성될 영역으로 결정할 수 있다. B 영역 및 C 영역은 A 영역과 적어도 일부가 중복되지 않고, C 영역은 B 영역과 적어도 일부가 중복되지 않을 수 있다.

다양한 실시예들에 따르면, 적어도 하나의 이미지 내에 다수의 사용자가 존재하지 않는 경우, 전자 장치(예: 프로세서(120))는 동작 707에서 지정된 조건에 기초하여 합성 영역을 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 적어도 하나의 이미지 내에 하나의 사용자가 존재하거나, 또는 사용자가 존재하지 않는 경우, 지정된 조건에 기초하여 합성 영역을 결정할 수 있다. 지정된 조건은 동작 705에서 설명한 바와 동일할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120), 및/또는 도 1의 표시 장치(160))는 동작 709에서 결정된 합성 영역에 그래픽 데이터를 합성하여(또는 적용하여) 표시할 수 있다. 일실시예에 따르면, 프로세서(120)는 선택된 적어도 하나의 이미지의 합성 영역에 결정된 그래픽 데이터를 합성하여 표시할 수 있다. 예를 들어, 도 8a 내지 도 8c에 도시된 바와 같이, 프로세서(120)는 선택된 적어도 하나의 이미지 내의 결정된 합성 영역에 그래픽 데이터(801, 811, 821)를 합성하여 표시할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120), 및/또는 표시 장치(160))는 동작 711에서 타임 라인 상에 그래픽 데이터에 대한 인디케이터를 추가할 수 있다. 일실시예에 따르면, 프로세서(120)는 동영상 컨텐츠 편집 시, 동영상 컨텐츠의 타임 라인 중 그래픽 데이터가 적용된 적어도 하나의 이미지에 대응되는 시점에 그래픽 데이터가 합성되었음을 나타내는 인디케이터를 추가하고, 추가된 인디케이터가 표시되도록 제어할 수 있다. 일실시예에 따르면, 인디케이터는 해당 시점에 대응되는 적어도 하나의 이미지에 적용된 그래픽 데이터의 타입을 나타낼 수 있다. 예를 들어, 프로세서(120)는 도 8d에 도시된 바와 같이, 서로 다른 형태의 인디케이터들을 동영상 컨텐츠의 타임 라인(831)에 추가함으로써, 해당 시점에 대응되는 적어도 하나의 이미지에 합성된 그래픽 데이터의 타입을 나타낼 수 있다. 예컨대, 프로세서(120)는 달력 모양 아이콘, 시계 모양 아이콘, 전화 모양 아이콘, 또는 지도 모양 아이콘과 같이, 합성된 그래픽 데이터의 타입에 연관된 인디케이터들을 타임 라인에 추가할 수 있다. 일실시예에 따르면, 인디케이터는 해당 시점에 대응되는 적어도 하나의 이미지에 적용된 그래픽 데이터의 타입에 관계 없이, 모두 동일할 수 있다. 예를 들어, 프로세서(120)는 도 8e에 도시된 바와 같이, 합성된 그래픽 데이터의 타입에 관계없이, 동일한 형태의 인디케이터들을 동영상 컨텐츠의 타임 라인(831)에 추가할 수 있다. 일 실시예들에 따르면, 인디케이터는 그래픽 데이터가 합성되는 시점이 아닌 타임 라인이 생성되는 시점에 추가될 수 있다. 이 경우, 동작 711은 생략되고, 후술되는 동작 715의 일부 동작으로 인디케이터 추가 동작이 수행될 수 있다. 예를 들어, 녹화된 동영상을 편집하는 경우, 동영상 컨텐츠에 대한 타임 라인이 존재하므로, 프로세서(120)는 그래픽 데이터가 적용되는 시점마다 타임 라인의 해당 시점에 그래픽 데이터에 관련된 인디케이터를 추가할 수 있다. 다른 예로, 실시간 방송 또는 실시간 영상 통화의 경우, 방송 또는 영상 통화가 종료되는 시점에 타임 라인이 생성되므로, 프로세서(120)는 방송 또는 영상 통화의 종료되어 방송 또는 영상 통화에 대한 동영상 컨텐츠를 저장하는 시점에, 적어도 하나의 그래픽 데이터에 대한 적어도 하나의 인디케이터를 타임 라인에 추가할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 713에서 저장 이벤트가 발생되는지 여부를 결정할 수 있다. 예를 들어, 프로세서(120)는 편집된 동영상 저장 이벤트, 실시간 방송 종료 이벤트, 또는 영상 통화 종료 이벤트가 발생되는지 여부를 결정할 수 있다. 실시간 방송 종료 이벤트, 및/또는 영상 통화 종료 이벤트는 관련 동영상 컨텐츠를 저장하는 이벤트를 포함할 수 있다.

다양한 실시예들에 따르면, 저장 이벤트가 발생된 경우, 전자 장치(예: 프로세서(120), 및/또는 메모리(예: 도 1의 메모리(130))는 동작 715에서 그래픽 데이터가 합성된 이미지를 포함하는 동영상 컨텐츠를 저장할 수 있다. 예를 들어, 프로세서(120)는 편집된 동영상 컨텐츠를 저장하거나, 실시간 방송 또는 영상 통화 동안에 획득된 동영상 컨텐츠를 저장할 수 있다. 일실시예에 따르면, 프로세서(120)는 동영상 컨텐츠 저장 시에 동작 711을 수행할 수 있다. 예를 들어, 프로세서(120)는 실시간 방송 또는 영상 통화 종료 시, 실시간 방송 또는 영상 통화 동안에 획득된 복수의 이미지들 및 음성 신호들을 포함하는 동영상 컨텐츠를 생성하면서, 동영상 컨텐츠에 대한 타임 라인을 생성하고, 동작 711과 같이 타임 라인 상에 그래픽 데이터에 대한 인디케이터를 추가할 수 있다. 프로세서(120)는 인디케이터가 추가된 타임 라인을 포함하는 동영상 컨텐츠를 저장할 수 있다.

도 9는 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠에 적용된 그래픽 데이터를 편집하는 흐름도(900)이다. 이하 설명되는 도 9의 동작들은 도 2의 동작 207의 상세한 동작 중 적어도 일부이거나, 도 7에 추가적으로 포함되는 동작들일 수 있다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다. 여기에서, 전자 장치는 도 1의 전자 장치(101)일 수 있다. 이하에서 도 9의 적어도 일부 동작은 도 10a 및 도 10b를 참조하여 설명할 것이다. 도 10a 및 도 10b는 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠에 적용된 그래픽 데이터를 편집하는 화면 구성에 대한 예시도이다.

도 9를 참조하면, 다양한 실시예들에 따른, 전자 장치(예: 도 1의 프로세서(120))는 동작 901에서 합성된 그래픽 데이터에 대한 사용자 입력이 감지되는지 여부를 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 도 7의 동작 709와 같이, 적어도 하나의 이미지의 합성 영역에 그래픽 데이터가 합성된 후, 합성된 그래픽 데이터에 대한 사용자 입력이 감지되는지 여부를 결정할 수 있다. 예를 들어, 프로세서(120)는 그래픽 데이터가 합성된 영역에서 다른 영역으로 이동되는 사용자 입력이 감지되는지 여부를 결정할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 903에서 감지된 사용자 입력이 이미지 내 다른 영역으로 드래그되는지 여부를 결정할 수 있다. 예를 들어, 프로세서(120)는 사용자 입력이 재생 또는 편집 중인 적어도 하나의 이미지가 표시되는 영역 내에서 이동되는지, 또는 재생 또는 편집 중인 적어도 하나의 이미지가 표시되는 영역 이외의 다른 영역으로 이동되는지 여부를 결정할 수 있다. 재생 또는 편집 중인 적어도 하나의 이미지가 표시되는 영역 이외의 다른 영역은, 채팅 정보 표시 영역, 상태 정보 표시 영역, 또는 메뉴 표시 영역 중 적어도 하나를 포함할 수 있다. 이는 예시적인 것으로서, 본 발명은 이에 한정되지 않을 것이다.

다양한 실시예들에 따르면, 감지된 사용자 입력이 이미지 내 다른 영역으로 드래그되는 경우, 전자 장치(예: 프로세서(120))는 동작 905에서 사용자 입력의 드래그에 기초하여 다른 영역으로 그래픽 데이터를 이동시킬 수 있다. 예를 들어, 프로세서(120)는 도 10a에 도시된 바와 같이, 녹화된 동영상 컨텐츠 편집 시, 적어도 하나의 이미지에 합성 영역에 표시된 그래픽 데이터(1001)에 대한 사용자 입력이 감지된 후, 프리뷰 영역(501) 내의 다른 영역으로 드래그되는 경우, 드래그된 다른 영역으로 그래픽 데이터를 이동(1003)시켜 표시할 수 있다.

다양한 실시예들에 따르면, 감지된 사용자 입력이 이미지 내 다른 영역으로 드래그되지 않는 경우(이미지 밖의 영역으로 드래그되는 경우), 전자 장치(예: 프로세서(120))는 동작 907에서 사용자 입력이 감지된 합성된 그래픽 데이터를 해당하는 적어도 하나의 이미지에서 삭제할 수 있다. 예를 들어, 프로세서(120)는 도 10a에 도시된 바와 같이, 녹화된 동영상 컨텐츠 편집 시, 적어도 하나의 이미지에 합성 영역에 표시된 그래픽 데이터에 대한 사용자 입력(1001)이 감지된 후, 프리뷰 영역(501) 밖의 다른 영역으로 드래그되는 경우, 적어도 하나의 이미지에 합성된 그래픽 데이터(1001)를 적어도 하나의 이미지에서 삭제(또는 제거)할 수 있다. 일실시예에 따르면, 프로세서(120)는 제1 그래픽 데이터가 적용된 연속적인 복수의 이미지들에 합성된 상태에서, 제1 그래픽 데이터에 대한 사용자 입력이 프리뷰 영역 밖의 다른 영역으로 드래그된 경우, 연속적인 복수의 이미지들로부터 제1 그래픽 데이터를 삭제할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 909에서 삭제된 그래픽 데이터에 대응되는 인디케이터를 타임 라인에서 삭제할 수 있다. 예를 들어, 프로세서(120)는 삭제된 그래픽 데이터에 대응되는 인디케이터를 타임 라인에서 삭제함으로써, 해당 시점의 적어도 하나의 이미지에 합성된 그래픽 데이터가 존재하지 않음을 나타낼 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 911에서 타임 라인 상의 제1 시점의 위치에 표시된 인디케이터에 대한 사용자 입력이 감지되는지 여부를 결정할 수 있다. 예를 들어, 프로세서(120)는 타임 라인 상의 제1 시점의 위치에 표시된 인디케이터에 대한 터치 입력이 감지되는지 여부를 결정할 수 있다.

다양한 실시예들에 따르면, 제1 시점의 위치에 표시된 인디케이터에 대한 사용자 입력이 감지되는 경우, 전자 장치(예: 프로세서(120))는 동작 913에서 사용자 입력이 제1 시점의 위치에서 제2 시점의 위치로 드래그되는지 여부를 결정할 수 있다. 예를 들어, 프로세서(120)는 타임 라인 상의 제1 시점의 위치에 표시된 인디케이터에 대한 터치 입력이 감지된 후, 감지된 터치 입력이 유지된 상태에서 타임 라인 상의 제2 시점의 위치로 이동되는지 여부를 결정할 수 있다.

다양한 실시예들에 따르면, 사용자 입력이 제1 시점의 위치에서 제2 시점의 위치로 드래그되는 경우, 전자 장치(예: 프로세서(120))는 동작 915에서 제2 시점의 위치로 인디케이터를 이동시킬 수 있다. 예를 들어, 프로세서(120)는 도 10b에 도시된 바와 같이, 타임 라인의 제1 시점에 표시된 인디케이터(1011)에 대한 터치가 감지된 후 제2 시점의 위치로 드래그되는 경우, 제2 시점의 위치로 인디케이터를 이동(1021)시켜 표시할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 917에서 제1 시점의 이미지에서 합성된 그래픽 데이터를 삭제하고, 동작 919에서 제2 시점의 이미지에 그래픽 데이터를 합성할 수 있다. 일실시예에 따르면, 프로세서(120)는 인디케이터가 이동된 시점에 기초하여, 인디케이터에 대응되는 그래픽 데이터의 합성 이미지를 제1 시점의 적어도 하나의 이미지에서 제2 시점의 적어도 하나의 이미지로 변경할 수 있다. 예를 들어, 프로세서(120)는 도 10b에 도시된 바와 같이, 제1 시점에 대응되는 적어도 하나의 이미지에서 인디케이터(1011)에 대응되는 그래픽 데이터(1013)를 삭제하고, 제2 시점에 대응되는 적어도 하나의 이미지에 이동된 인디케이터(1021)에 대응되는 그래픽 데이터(1023)를 합성할 수 있다.

도 11은 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠의 음성 신호에 기반하여 그래픽 데이터 및 음향 효과를 제공하는 흐름도(1100)이다. 이하 설명되는 도 11의 동작들은 도 2의 동작들 203, 205, 및 207의 상세한 동작 중 적어도 일부일 수 있다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다. 여기에서, 전자 장치는 도 1의 전자 장치(101)일 수 있다.

도 11을 참조하면, 다양한 실시예들에 따른 전자 장치(예: 도 1의 프로세서(120))는 동작 1101에서 획득된 키워드가 지정된 분류에 해당하는 키워드인지 여부를 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 도 2의 동작 201 또는 도 3에서 설명한 바와 같이 키워드를 획득할 수 있다. 예를 들어, 프로세서(120)는 획득된 키워드가 비속어로 지정된 분류에 해당하는 키워드인지 여부를 결정할 수 있다. 지정된 분류는 사업자 및/또는 사용자에 의해 설정 및 변경될 수 있다.

다양한 실시예들에 따르면, 획득된 키워드가 지정된 분류에 해당하는 키워드인 경우, 전자 장치(예: 프로세서(120))는 동작 1103에서 음향 효과를 검색 및/또는 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 메모리(예: 도 1의 메모리(130))에 미리 저장된 음향 효과들 중에서 지정된 분류에 대응되는 음향 효과를 검색할 수 있다. 예를 들어, 프로세서(120)는 획득된 키워드가 비속어에 해당하는 경우, 비속어에 관련된 음향 효과를 검색할 수 있다. 일실시예에 따르면, 프로세서(120)는 외부 장치(예: 도 1의 전자 장치(102), 전자 장치(104), 또는 서버(104)) 중 어느 하나와 통신하여 지정된 분류에 대응되는 음향 효과를 검색 및/또는 결정할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 1105에서 키워드에 대응되는 그래픽 데이터를 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 지정된 분류의 키워드에 대응되는 추천 그래픽 데이터를 검색하고, 검색된 추천 그래픽 데이터를 합성될 그래픽 데이터로 자동으로 결정할 수 있다. 일실시예에 따르면, 프로세서(120)는 도 2의 동작 203 및/또는 도 4에서 설명한 바와 같이 키워드에 대응되는 그래픽 데이터를 결정할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 1107에서 키워드의 음성 발화 시점에 기초하여 적어도 하나의 이미지를 선택할 수 있다. 일실시예에 따르면, 프로세서(120)는 지정된 분류의 키워드에 대응되는 음성이 발화된 시점에 기초하여 적어도 하나의 이미지를 선택할 수 있다. 일실시예에 따르면, 프로세서(120)는 도 2의 동작 205 및/또는 도 6에서 설명한 바와 같이 적어도 하나의 이미지를 선택할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120), 도 1의 표시 장치(160), 및/또는 도 1의 음향 출력 장치(155))는 동작 1109에서 선택된 이미지에 그래픽 데이터를 합성하고 음향 효과를 적용할 수 있다. 일실시예에 따르면, 프로세서(120)는 도 2의 동작 207 및/또는 도 7에서 설명한 바와 같이 그래픽 데이터를 합성하여 표시하면서, 동작 1103에서 결정된 음향 효과가 적용되도록 제어할 수 있다. 예를 들어, 프로세서(120)는 획득된 키워드가 비속어에 해당하는 경우, 비속어가 발화된 시점에 비속어에 관련된 음향 효과가 출력되도록 제어할 수 있다. 일실시예에 따르면, 프로세서(120)는 녹화된 동영상 편집 시, 비속어의 적어도 일부 레코딩된 위치에 음향 효과를 레코딩할 수 있다. 일실시예에 따르면, 프로세서(120)는 실시간 방송, 또는 영상 통화 시, 비속어의 적어도 일부가 외부 장치로 전송되지 않고, 비속어의 적어도 일부 대신에 음향 효과가 외부 장치로 전송되도록 제어할 수 있다.

도 12는 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠의 재생 시, 인디케이터를 이용한 그래픽 데이터를 제공하는 흐름도(1200)이다. 이하 설명되는 도 12의 동작들은 도 2의 동작 207 이후에 수행되는 동작들일 수 있다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다. 여기에서, 전자 장치는 도 1의 전자 장치(101)일 수 있다. 이하에서 도 12의 적어도 일부 동작은 도 13a 및 도 13b를 참조하여 설명할 것이다. 도 13a 및 도 13b는 다양한 실시예들에 따른 전자 장치에서 동영상 컨텐츠의 인디케이터를 이용한 그래픽 데이터를 제공하는 화면 구성에 대한 예시도이다.

도 12를 참조하면, 다양한 실시예들에 따른, 전자 장치(예: 도 1의 프로세서(120))는 동작 1201에서 동영상 컨텐츠의 재생 이벤트를 감지할 수 있다. 동영상 컨텐츠는, 녹화된 동영상 컨텐츠, 편집된 동영상 컨텐츠, 실시간 방송 후 저장된 컨텐츠, 또는 영상 통화 후 저장된 컨텐츠 중 적어도 하나를 포함할 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120), 및/또는 표시 장치(160))는 동작 1203에서 동영상 컨텐츠의 재생에 따라 복수의 이미지들을 연속적으로 표시하면서, 동영상 컨텐츠의 재생 시점을 나타내는 타임라인 상에 적어도 하나의 인디케이터를 표시할 수 있다. 일실시예에 따르면, 복수의 이미지들 중 적어도 하나의 이미지는 그래픽 데이터가 합성된 이미지일 수 있다. 일실시예에 따르면, 인디케이터는 그래픽 데이터가 합성된 적어도 하나의 이미지의 재생 위치(또는 재생 시점)을 나타내는 인디케이터일 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 1205에서 인디케이터가 표시된 시점에 대한 입력이 감지되는지 여부를 결정할 수 있다. 예를 들어, 프로세서(120)는 동영상 컨텐츠의 재생 중에 적어도 하나의 인디케이터가 표시된 타임 라인의 특징 시점에 대한 터치 입력이 감지되는지 여부를 결정할 수 있다.

다양한 실시예들에 따르면, 인디케이터가 표시된 시점에 대한 입력이 감지되지 않는 경우, 전자 장치(예: 프로세서(120))는 동작 1209에서 동영상 컨텐츠의 재생 중에 타임 라인 상에 표시된 인디케이터에 대한 사용자 터치 입력이 감지되는지 여부를 결정할 수 있다.

다양한 실시예들에 따르면, 인디케이터에 대한 사용자 터치 입력이 감지되는 경우, 전자 장치(예: 프로세서(120), 및/또는 표시 장치(160))는 동작 1211에서 사용자 터치 입력이 감지된 인디케이터에 대응되는 그래픽 데이터를 표시할 수 있다. 예를 들어, 프로세서(120)는 도 13a에 도시된 바와 같이, 제1 인디케이터(1301)에 대한 사용자 터치 입력이 감지된 경우, 동영상 컨텐츠를 계속 재생하면서 디스플레이의 적어도 일부 영역에 제1 인디케이터(1301)에 대응되는 그래픽 데이터(1311)를 표시할 수 있다.

다양한 실시예들에 따르면, 인디케이터가 표시된 시점에 대한 입력이 감지된 경우, 전자 장치(예: 프로세서(120))는 동작 1207에서 동영상 컨텐츠의 재생 위치(또는 재생 시점)를 입력이 감지된 시점으로 변경할 수 있다. 예를 들어, 프로세서(120)는 도 13b에 도시된 바와 같이, 제2 인디케이터가 표시된 타임 라인의 제1 시점(1321)에 대한 터치 입력이 감지된 경우, 동영상 컨텐츠의 재생 시점을 제1 시점(1321)으로 변경하여, 변경된 재생 시점에 대응되는 복수의 이미지들을 연속적으로 표시할 수 있다. 변경된 재생 시점에 대응되는 복수의 이미지들 중에서 적어도 하나의 이미지는 제2 인디케이터에 대응되는 그래픽 데이터(1331)가 적용된 이미지일 수 있다.

다양한 실시예들에 따르면, 전자 장치(예: 프로세서(120))는 동작 1213에서 동영상 컨텐츠의 재생 종료 이벤트가 발생되는지 여부를 결정할 수 있다. 동영상 컨텐츠의 재생 종료 이벤트는, 사용자 입력에 의한 재생 종료 이벤트, 또는 동영상 컨텐츠의 재생 완료 이벤트를 포함할 수 있다. 일실시예에 따르면, 프로세서(120)는 동영상 컨텐츠의 재생 종료 이벤트가 발생되지 않을 경우, 동작 1203으로 되돌아가 동영상 컨텐츠의 재생을 계속 유지할 수 있다.

다양한 실시예들에 따르면, 전자 장치(101)의 동작 방법은, 복수의 이미지들에 관련된 음성 신호로부터 적어도 하나의 키워드를 획득하는 동작, 상기 적어도 하나의 키워드에 대응되는 적어도 하나의 그래픽 데이터를 결정하는 동작, 상기 결정된 그래픽 데이터에 대응되는 키워드의 음성이 발화된 시점에 기초하여, 상기 복수의 이미지들 중 적어도 하나의 이미지를 선택하는 동작, 및 상기 선택된 적어도 하나의 이미지에 상기 결정된 그래픽 데이터가 적용되도록 제어하는 동작을 포함할 수 있다.

다양한 실시예들에 따르면, 상기 전자 장치(101)의 동작 방법은, 상기 복수의 이미지들을 포함하는 동영상 컨텐츠에 상기 그래픽 데이터가 적용된 적어도 하나의 이미지의 재생 시점을 나타내는 인디케이터를 추가하는 동작을 더 포함하며, 상기 인디케이터는, 상기 동영상 컨텐츠의 타임 라인 상에 표시될 수 있다.

다양한 실시예들에 따르면, 상기 적어도 하나의 그래픽 데이터를 결정하는 동작은, 상기 적어도 하나의 키워드에 대응되는 적어도 하나의 추천 그래픽 데이터를 결정하는 동작, 상기 결정된 적어도 하나의 추천 그래픽 데이터를 포함하는 사용자 인터페이스를 제공하는 동작, 및 입력에 기초하여, 상기 적어도 하나의 추천 그래픽 데이터 중에서 상기 선택된 적어도 하나의 이미지에 적용될 그래픽 데이터를 결정하는 동작을 포함하며, 상기 입력은, 터치 입력, 제스처 입력, 또는 음성 입력 중 적어도 하나를 포함할 수 있다.

다양한 실시예들에 따르면, 상기 입력에 기초하여 상기 그래픽 데이터를 결정하는 동작은, 상기 사용자 인터페이스를 제공한 시점부터 임계 시간 이내에 상기 입력이 감지되는지 여부를 결정하는 동작, 및 상기 임계 시간 이내에 상기 입력이 감지되지 않는 경우, 사용자 선호도, 상기 적어도 하나의 키워드의 우선순위, 상기 적어도 하나의 추천 그래픽 데이터의 우선순위, 또는 상기 음성 신호에 기초한 문맥 중 적어도 하나에 기초하여, 상기 적어도 하나의 추천 그래픽 데이터 중에서 상기 선택된 적어도 하나의 이미지에 적용될 그래픽 데이터를 자동으로 결정하는 동작을 포함할 수 있다.

다양한 실시예들에 따르면, 상기 전자 장치의 동작 방법은, 상기 적어도 하나의 키워드가 지정된 분류에 대응되는지 여부를 결정하는 동작, 상기 적어도 하나의 키워드가 지정된 분류에 대응되는 경우, 상기 적어도 하나의 키워드에 대응되는 음향 효과를 결정하는 동작, 및 상기 적어도 하나의 키워드에 대응되는 음성 신호의 출력 시점에 상기 음향 효과가 적용되도록 제어하는 동작을 더 포함할 수 있다.

다양한 실시예들에 따르면, 상기 결정된 그래픽 데이터가 적용되도록 제어하는 동작은, 상기 선택된 적어도 하나의 이미지에 복수의 사용자들이 존재하는지 여부를 결정하는 동작, 상기 복수의 사용자들이 존재하는 경우, 상기 복수의 사용자들 중에서 상기 결정된 그래픽 데이터에 대응되는 키워드의 음성을 발화한 사용자를 식별하는 동작, 상기 선택된 적어도 하나의 이미지 내에서 상기 식별된 사용자가 위치한 영역에 적어도 기초하여, 상기 결정된 그래픽 데이터가 적용될 합성 영역을 결정하는 동작, 및 상기 선택된 적어도 하나의 이미지의 합성 영역에 상기 결정된 그래픽 데이터를 합성하는 동작을 포함할 수 있다.

다양한 실시예들에 따르면, 상기 결정된 그래픽 데이터가 적용되도록 제어하는 동작은, 상기 합성된 그래픽 데이터에 대한 드래그 입력에 기초하여, 상기 선택된 적어도 하나의 이미지의 영역 내에서 상기 그래픽 데이터의 합성 영역을 변경하는 동작을 더 포함할 수 있다.

본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치 (예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.

본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나","A 또는 B 중 적어도 하나,""A, B 또는 C," "A, B 및 C 중 적어도 하나,"및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제1", "제2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제1) 구성요소가 다른(예: 제2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.

본 문서에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로 등의 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.

본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(101)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(136) 또는 외장 메모리(138))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(140))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(101))의 프로세서(예: 프로세서(120))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장매체 는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, ‘비일시적’은 저장매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.

일실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어^TM)를 통해 또는 두개의 사용자 장치들(예: 스마트폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.

다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.

Claims

전자 장치에 있어서,
디스플레이; 및
프로세서를 포함하며, 상기 프로세서는,
복수의 이미지들에 관련된 음성 신호로부터 적어도 하나의 키워드를 획득하고,
상기 적어도 하나의 키워드에 대응되는 적어도 하나의 그래픽 데이터를 결정하고,
상기 결정된 그래픽 데이터에 대응되는 키워드의 음성이 발화된 시점에 기초하여, 상기 복수의 이미지들 중 적어도 하나의 이미지를 선택하고,
상기 선택된 적어도 하나의 이미지에 상기 결정된 그래픽 데이터가 적용되도록 제어하는 전자 장치.
제1항에 있어서,
상기 프로세서는, 상기 복수의 이미지들을 포함하는 동영상 컨텐츠에 상기 그래픽 데이터가 적용된 적어도 하나의 이미지의 재생 시점을 나타내는 인디케이터를 추가하도록 제어하는 전자 장치.
제2항에 있어서,
상기 인디케이터는, 상기 동영상 컨텐츠의 타임 라인 상에 표시되는 전자 장치.
제3항에 있어서,
상기 프로세서는, 상기 선택된 적어도 하나의 이미지에 상기 그래픽 데이터가 적용되는 시점, 또는 상기 복수의 이미지들에 대한 동영상 컨텐츠가 저장되는 시점에 상기 인디케이터를 상기 타임 라인에 추가하는 전자 장치.
제3항에 있어서,
상기 프로세서는, 상기 타임 라인 상에 표시된 인디케이터에 대한 드래그 입력이 감지되면, 상기 드래그 입력에 기초하여, 상기 타임 라인 상에서 상기 인디케이터가 나타내는 재생 시점을 제1 시점에서 제2 시점으로 변경하고,
상기 제1 시점에 대응되는 적어도 하나의 이미지에서 상기 인디케이터에 연관된 그래픽 데이터를 삭제하고,
상기 제2 시점에 대응되는 적어도 하나의 다른 이미지에 상기 인디케이터에 연관된 그래픽 데이터를 적용하는 전자 장치.
제1항에 있어서,
상기 프로세서는, 상기 적어도 하나의 키워드에 대응되는 적어도 하나의 추천 그래픽 데이터를 결정하고,
상기 결정된 적어도 하나의 추천 그래픽 데이터를 포함하는 사용자 인터페이스를 제공하고,
입력에 기초하여, 상기 적어도 하나의 추천 그래픽 데이터 중에서 상기 선택된 적어도 하나의 이미지에 적용될 그래픽 데이터를 결정하는 전자 장치.
제6항에 있어서,
상기 입력은, 터치 입력, 제스처 입력, 또는 음성 입력 중 적어도 하나를 포함하는 전자 장치.
제6항에 있어서,
상기 프로세서는, 상기 사용자 인터페이스를 제공한 시점부터 임계 시간 이내에 상기 입력이 감지되는지 여부를 결정하고,
상기 임계 시간 이내에 상기 입력이 감지되지 않는 경우, 사용자 선호도, 상기 적어도 하나의 키워드의 우선순위, 상기 적어도 하나의 추천 그래픽 데이터의 우선순위, 또는 상기 음성 신호에 기초한 문맥 중 적어도 하나에 기초하여, 상기 적어도 하나의 추천 그래픽 데이터 중에서 상기 선택된 적어도 하나의 이미지에 적용될 그래픽 데이터를 자동으로 결정하는 전자 장치.
제1항에 있어서,
상기 프로세서는, 상기 적어도 하나의 키워드가 지정된 분류에 대응되는지 여부를 결정하고,
상기 적어도 하나의 키워드가 지정된 분류에 대응되는 경우, 상기 적어도 하나의 키워드에 대응되는 음향 효과를 결정하고,
상기 적어도 하나의 키워드에 대응되는 음성 신호의 출력 시점에 상기 음향 효과가 적용되도록 제어하는 전자 장치.
제1항에 있어서,
상기 프로세서는, 상기 선택된 적어도 하나의 이미지에 복수의 사용자들이 존재하는지 여부를 결정하고,
상기 복수의 사용자들이 존재하는 경우, 상기 복수의 사용자들 중에서 상기 결정된 그래픽 데이터에 대응되는 키워드의 음성을 발화한 사용자를 식별하고,
상기 선택된 적어도 하나의 이미지 내에서 상기 식별된 사용자가 위치한 영역에 적어도 기초하여, 상기 결정된 그래픽 데이터가 적용될 합성 영역을 결정하고,
상기 선택된 적어도 하나의 이미지의 합성 영역에 상기 결정된 그래픽 데이터를 합성하는 전자 장치.
제10항에 있어서,
상기 프로세서는, 상기 합성된 그래픽 데이터에 대한 드래그 입력에 기초하여, 상기 선택된 적어도 하나의 이미지의 영역 내에서 상기 그래픽 데이터의 합성 영역을 변경하는 전자 장치.
제1항에 있어서,
메모리를 더 포함하며,
상기 프로세서는, 상기 메모리로부터 동영상 컨텐츠를 획득하고,
상기 획득된 동영상 컨텐츠로부터 상기 복수의 이미지들에 관련된 음성 신호를 획득하는 전자 장치.
제1항에 있어서,
카메라; 및
입력 장치를 더 포함하며,
상기 프로세서는, 상기 카메라로부터 상기 복수의 이미지들을 획득하고,
상기 입력 장치로부터 상기 복수의 이미지들에 관련된 음성 신호를 획득하는 전자 장치.
전자 장치의 동작 방법에 있어서,
복수의 이미지들에 관련된 음성 신호로부터 적어도 하나의 키워드를 획득하는 동작;
상기 적어도 하나의 키워드에 대응되는 적어도 하나의 그래픽 데이터를 결정하는 동작;
상기 결정된 그래픽 데이터에 대응되는 키워드의 음성이 발화된 시점에 기초하여, 상기 복수의 이미지들 중 적어도 하나의 이미지를 선택하는 동작; 및
상기 선택된 적어도 하나의 이미지에 상기 결정된 그래픽 데이터가 적용되도록 제어하는 동작을 포함하는 방법.
제14항에 있어서,
상기 복수의 이미지들을 포함하는 동영상 컨텐츠에 상기 그래픽 데이터가 적용된 적어도 하나의 이미지의 재생 시점을 나타내는 인디케이터를 추가하는 동작을 더 포함하며,
상기 인디케이터는, 상기 동영상 컨텐츠의 타임 라인 상에 표시되는 방법.
제14항에 있어서,
상기 적어도 하나의 그래픽 데이터를 결정하는 동작은,
상기 적어도 하나의 키워드에 대응되는 적어도 하나의 추천 그래픽 데이터를 결정하는 동작;
상기 결정된 적어도 하나의 추천 그래픽 데이터를 포함하는 사용자 인터페이스를 제공하는 동작; 및
입력에 기초하여, 상기 적어도 하나의 추천 그래픽 데이터 중에서 상기 선택된 적어도 하나의 이미지에 적용될 그래픽 데이터를 결정하는 동작을 포함하며,
상기 입력은, 터치 입력, 제스처 입력, 또는 음성 입력 중 적어도 하나를 포함하는 방법.
제 16항에 있어서,
상기 입력에 기초하여 상기 그래픽 데이터를 결정하는 동작은,
상기 사용자 인터페이스를 제공한 시점부터 임계 시간 이내에 상기 입력이 감지되는지 여부를 결정하는 동작; 및
상기 임계 시간 이내에 상기 입력이 감지되지 않는 경우, 사용자 선호도, 상기 적어도 하나의 키워드의 우선순위, 상기 적어도 하나의 추천 그래픽 데이터의 우선순위, 또는 상기 음성 신호에 기초한 문맥 중 적어도 하나에 기초하여, 상기 적어도 하나의 추천 그래픽 데이터 중에서 상기 선택된 적어도 하나의 이미지에 적용될 그래픽 데이터를 자동으로 결정하는 동작을 포함하는 방법.
제14항에 있어서,
상기 적어도 하나의 키워드가 지정된 분류에 대응되는지 여부를 결정하는 동작;
상기 적어도 하나의 키워드가 지정된 분류에 대응되는 경우, 상기 적어도 하나의 키워드에 대응되는 음향 효과를 결정하는 동작; 및
상기 적어도 하나의 키워드에 대응되는 음성 신호의 출력 시점에 상기 음향 효과가 적용되도록 제어하는 동작을 더 포함하는 방법.
제14항에 있어서,
상기 결정된 그래픽 데이터가 적용되도록 제어하는 동작은,
상기 선택된 적어도 하나의 이미지에 복수의 사용자들이 존재하는지 여부를 결정하는 동작;
상기 복수의 사용자들이 존재하는 경우, 상기 복수의 사용자들 중에서 상기 결정된 그래픽 데이터에 대응되는 키워드의 음성을 발화한 사용자를 식별하는 동작;
상기 선택된 적어도 하나의 이미지 내에서 상기 식별된 사용자가 위치한 영역에 적어도 기초하여, 상기 결정된 그래픽 데이터가 적용될 합성 영역을 결정하는 동작; 및
상기 선택된 적어도 하나의 이미지의 합성 영역에 상기 결정된 그래픽 데이터를 합성하는 동작을 포함하는 방법.
제19항에 있어서,
상기 합성된 그래픽 데이터에 대한 드래그 입력에 기초하여, 상기 선택된 적어도 하나의 이미지의 영역 내에서 상기 그래픽 데이터의 합성 영역을 변경하는 동작을 더 포함하는 방법.