KR20100134022A - 실사 토킹 헤드 생성, 콘텐트 생성, 분배 시스템 및 방법 - Google Patents

실사 토킹 헤드 생성, 콘텐트 생성, 분배 시스템 및 방법 Download PDF

Info

Publication number
KR20100134022A
KR20100134022A KR1020107022657A KR20107022657A KR20100134022A KR 20100134022 A KR20100134022 A KR 20100134022A KR 1020107022657 A KR1020107022657 A KR 1020107022657A KR 20107022657 A KR20107022657 A KR 20107022657A KR 20100134022 A KR20100134022 A KR 20100134022A
Authority
KR
South Korea
Prior art keywords
live
talking head
content
library
head
Prior art date
Application number
KR1020107022657A
Other languages
English (en)
Inventor
피터 게틀리
로버터 진 스미스
숀 에이. 스미스
니콜라스 앤트잭
Original Assignee
아바웍스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to US3502208P priority Critical
Priority to US61/035,022 priority
Application filed by 아바웍스 인코포레이티드 filed Critical 아바웍스 인코포레이티드
Publication of KR20100134022A publication Critical patent/KR20100134022A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • G10L21/10Transforming into visible information
    • G10L2021/105Synthesis of the lips movements from speech, e.g. for talking heads

Abstract

본 발명은 서버와 다양한 통신 장치(가령, 셀 폰 및 그외 다른 휴대형 무선 장치), 그리고 소프트웨어들을 포함하는 네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법을 지향하며, 이러한 소프트웨어는 사용자로 하여금 멀티미디어 콘텐트의 생성, 이용, 공유를 통해 서로 통신할 수 있게 하고, 텍스트, 오디오, 사진, 비디오 콘텐트와 결합된 실사 토킹 헤드 애니메이션을 포함한다. 콘텐트는 한개 이상의 원격 서버에 업로드되고, 셀 폰, 데스크탑 컴퓨터, 랩탑 컴퓨터, PDA, 셀룰러 스마트폰같은 다양한 장치를 통해 액세스될 수 있다. 콘텐트를 포함하는 쇼는 다양한 환경에서 미디어 플레이어로 관찰/재생될 수 있어야 하며, 이때, 다양한 환경이라 함은, 가령, 웹 브라우저 애플리케이션을 이용한 채팅방 및 인터넷 소셜 네트워킹 사이트, 또는, 디지털 장치의 운영 체제에 통합되어 인터넷, 셀룰러 무선 통신망, 그리고 그외 다른 적절한 통신망을 통해 분배되는 애플리케이션들을 그 예로 들 수 있다.

Description

실사 토킹 헤드 생성, 콘텐트 생성, 분배 시스템 및 방법{PHOTO REALISTIC TALKING HEAD CREATION, CONTENT CREATION, AND DISTRIBUTION SYSTEM AND METHOD}

본 출원은 2008년 3월 9일자 미국특허가출원 제61/035,022호를 기반으로 우선권을 주장하며, 그 기재 내용은 본 발명에서 참고자료로 사용된다.

본 발명은 토킹 헤드(talking head)에 관한 발명으로서, 특히, 실사 토킹 헤드, 실사 헤드 쇼, 그리고 실사 헤드 쇼용 콘텐트를 생성, 분배, 그리고 관찰하는 시스템 및 방법에 관한 발명이다.

디지털 통신은 오늘날 일상에서 중요한 부분을 차지하고 있다. 개인 및 기업들은 모든 종류의 통신망을 이용하여 서로 통신하고 있다. 가령, 무선 셀룰러 통신망이나 인터넷 등을 이용하여 서로 통신하고 있다. 이러한 각 통신망의 대역폭은 제한적인 것이 일반적이다. PC, 핸드헬드 장치, PDA, 웹-구현 셀폰, 이메일, 인스턴트 메시징 서비스, PC 폰, 화상 회의, 그리고 그외 다른 적절한 수단이 사용자간 정보 전달에 사용되고 있고, 무선 및 유선 통신망을 통해 통신 수요를 충족시키고 있다.

정보가 비디오 및 오디오 콘텐트를 가진 애니메이션 기반 포맷과 텍스트 기반 포맷으로 전달되고 있다. 그 경향은 살아있는 사람을 지향하는 것으로서, 신원을 전달하고 대화의 포인트를 강조하며, 감정적인 콘텐트를 추가하고 있다.

토킹 헤드의 애니메이션 이미지를 생성하기 위해 다양한 방법들이 사용되고 있고, 이는 뉴스캐스터의 좀더 개인화된 외양을 생성하고 있다. 가령, 이러한 애니메이션 이미지들은 신원 전달, 대화 포인트 강조, 감동적 콘텐츠 부가 등에 요구되는 실사 품질이 결여되어 있는 것이 일반적이다. 또한 이러한 이미지들은 가끔씩 불분명하게 흐려지는 경우가 있고, 입술 모양의 동기화가 부적절하기도 하며, 현재의 통신망이나 인터넷 등에서 일반적으로 가용한 대역폭에 비해 훨씬 넓은 대역폭을 요구하기도 하고, 이미지 생성 자차게 어렵고 시간도 많이 걸린다. 대부분의 경우에, 움직이고 있는 실제 사람의 실사 이미지는 제한적이고 품질이 불량하다. 이는 파일 크기를 줄이고자 압축될 때 그리고 다운로드 시간을 줄이고자 스트리밍될 때 비디오 이미지를 흐리게 하는 부작용의 결과로 나타난다.

뉴스 방송은 전자 통신 매체의 기본적인 요소로서, 뉴스캐스터 포맷은 뉴스 커버리지와 관련하여 그래픽 및 사진에 의해 증강되고, 실사 품질을 가지면서 개인화된 외양을 나타내는 토킹 헤드들의 애니메이션화된 이미지들을 이용할 경우, 뉴스 방송은 토킹 헤드들이 사용될 수 있는 여러 분야 중 하나다.

사람의 머리, 머리 구성 기술, 또는 신체와 관련된 전자 이미지를 생성 및 조작하는 방법 및 장치가 여러가지 제시되고 있다. 그러나, 어떠한 방법 및 장치도 핸드헬드 장치, 셀폰, PDA, 스마트폰, 등등에 사용하기 위해 앞서 언급한 수요를 적절히 충족시키지 못하고 있다.

미국 특허 제6,919,892호(발명자: Cheiky, 외)에서는 실사 토킹 헤드 생성 시스템 및 방법을 개시하고 있으며, 이 시스템은, 템플릿과, 대상의 이미지 출력 신호를 가진 비디오 카메라와, 템플릿과 이미지 출력 신호를 복합 이미지로 믹싱하기 위한 믹서로서, 이때, 상기 복합 이미지가 출력 신호로 나타나는 것을 특징으로 하는 상기 믹서와, 비디오 카메라와 대상 간에 부분-반사 미러를 가진 프람프터와, 복합 이미지를 나타내는 믹서의 출력 신호를 수신하기 위한 입력부로서, 상기 부분-반사 미러는 대상의 이미지를 비디오 카메라로 하여금 수집하게 하여 대상으로 하여금 복합 이미지를 볼 수 있게 하며, 대상의 이미지를 템플릿과 정렬시키는 것을 특징으로 하는 상기 입력부와, 대상의 수집된 이미지를 나타내는 비디오 카메라의 출력 이미지 신호를 수신하는 입력부를 구비하면서, 템플릿과 정렬된 대상의 이미지를 저장하는 저장 수단을 포함한다.

미국 특허 제7,027,054호(발명자: Cheiky, 외)에서는 자체적인 실사 토킹 헤드 생성 시스템 및 방법을 개시하고 있으며, 이 시스템은, 템플릿과, 대상의 이미지 출력 신호를 가진 비디오 카메라와, 대상의 이미지 출력 신호를 템플릿과 믹싱하여 복합 이미지를 만드는 믹서 프로그램을 탑재한 컴퓨터와, 복합 신호를 나타내는 출력 신호와, 복합 이미지 신호를 통신전달하도록 구성된 컴퓨터와, 대상을 복합 이미지로 디스플레이하기 위한 모니터로서, 상기 모니터와 비디오 카메라는 대상의 이미지를 비디오 카메라로 하여금 수집하게 하여 대상으로 하여금 복합 이미지를 볼 수 있게 하고 대상의 이미지를 템플릿과 정렬시키도록 하는 것을 특징으로 하는 상기 모니터와, 대상의 수집된 이미지를 나타내는 비디오 카메라의 출력 신호를 수신하기 위한 입력부 및 템플릿과 정렬된 대상의 이미지를 저장하기 위한 저장 수단을 포함한다.

그러나 오늘날의 세계에서는 통신 장치들이 계속 소형화되고 있고 휴대성이 높아지고 있어서, 평균적인 오늘날의 사람들이 서로 세계적으로(즉, 글로벌하게) 통신할 수 있게 되었다. 따라서, 소형의 휴대형 장치(가령, 셀폰이나 그외 다른 무선 장치)를 이용하여 실사 토킹 헤드 라이브러리를 생성하는 데 사용될 수 있는 실사 토킹 헤드 라이브러리 기반의 멀티미디어 콘텐트를 네트워크를 통해 생성, 분배, 그리고 관찰하는 시스템 및 방법이 필요하다.

네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법과, 특히, 실사 토킹 헤드, 실사 토킹 헤드 쇼, 그리고 실사 토킹 헤드 쇼를 위한 콘텐트를 생성, 분배 , 관찰하는 시스템 및 방법이 필요하다. 네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법은 서버와 다양한 통신 장치들(가령, 셀 폰 및 그외 다른 휴대형 무선 장치), 그리고 소프트웨어들을 포함한다. 이러한 소프트웨어는 사용자로 하여금 멀티미디어 콘텐트의 생성, 이용, 공유를 통해 서로 통신할 수 있도록 하며, 가령, 텍스트, 오디오, 사진, 비디오 콘텐트와 결합된 실사 토킹 헤드 애니메이션을 포함한다. 콘텐트는 한개 이상의 원격 서버에 업로드될 수 있어야 하고, 셀 폰, 데스크탑 컴퓨터, 랩탑 컴퓨터, PDA, 셀룰러 스마트폰, 등과 같은 넓은 범위의 장치들을 이용하여 액세스될 수 있어야 한다. 콘텐트를 포함하는 쇼는 다양한 환경에서 미디어 플레이어로 재생/관찰될 수 있어야 한다. 다양한 환경이라 함은, 가령, 웹 브라우저 애플리케이션을 이용한 채팅방 및 인터넷 소셜 네트워킹 사이트, 또는, 디지털 장치의 운영 체제에 통합되어 인터넷, 셀룰러 무선 통신망, 그리고 그외 다른 적절한 통신망을 통해 분배되는 애플리케이션들을 그 예로 들 수 있다.

따라서, 네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법이 필요하다. 특히, 실사 토킹 헤드와, 실사 토킹 헤드 쇼와, 실사 토킹 헤드 쇼용 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법이 필요하며, 이는 사용자로 하여금 토킹 헤드의 실사 애니메이션 이미지를, 토킹 헤드 쇼를, 그리고, 토킹 헤드 쇼 콘텐트를 쉽고 빠르게, 그리고, 편리하게 발생시킬 수 있게 한다. 네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법에 따라 제공되는 이미지들의 경우, 개인 신원을 확인할 수 있을 정도의 실사 품질과, 대화의 포인트를 강조할 수 있는 실사 품질과, 감정적 콘텐트를 부가할 수 있는 품질과, 애니메이션 실사 이미지를 명확하고 깔끔하게 보여줄 수 있는 품질을 고도의 립싱크 수준과 함께 제공할 수 있어야 한다. 그리고, 오늘날의 대부분의 통신망 및 인터넷에서 통상적으로 가용한 것보다 적은 대역폭이 요구되어야 할 것이며, 다양한 핸드헬드 및 휴대형 장치와 함께 사용될 수 있어야 한다.

네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법은 무선 셀룰러 네트워크, 인터넷, WiFi 네트워크, WiMax 네트워크, 인트라넷, 그리고 그외 다른 적절한 네트워크 등과 같은 다양한 네트워크를 통해 사용될 수 있어야 한다.

네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법은 실제 사람의 프레임을 캡처할 수 있어야 하고, 여러 각도에서 실사 토킹 헤드의 라이브러리를 생성할 수 있어야 한다. 실사 토킹 헤드의 라이브러리는, 실사 토킹 헤드 쇼 및 쇼 콘텐트 생성을 위해 네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법의 툴을 이용하여, 실제 사람이나 사용자에 의해 애니메이션 성능을 생성하는 데 사용될 수 있다.

사람이나 사용자는 개인 신원의 전달, 대화 포인트의 강조, 감정적 콘텐트의 추가를 행하는데 요구되는 실사 품질을 가진 자신의 실사 토킹 헤드 요소를 발전시킬 수 있어야 한다. 애니메이션화된 실사 이미지는 애니메이션 토킹 헤드를 명확하고 깔끔하게 제시하며, 고도의 립싱크가 요구된다. 또한, 오늘날 대부분의 네트워크나 인터넷에서 통상적으로 가용한 대역폭보다 적은 대역폭에서 이루어져야 한다.

실사 토킹 헤드의 라이브러리는 평범한 컴퓨터 숙련도를 가진 개인에 의해 쉽고 빠르게, 그리고 효율적으로 구성될 수 있어야 하며, 여러 각도에 있는 사람의 이미지와 믹싱 및 정렬을 위해 템플릿으로 사용될 수 있는 마커나 가이드를 이용하여 제작 시간을 최소화시켜야 한다.

마커 라이브러리나 가이드 라이브러리가 제공되어야 한다. 각각의 마커 라이브러리와 각각의 가이드 라이브러리는 서로 다른 마커나 서로 다른 가이드를 포함하며, 각각의 마커나 가이드는 서로 다른 각도에 대한 것이다. 각각의 마커 라이브러리나 가이드 라이브러리는 사용자의 서로 다른 각도에 대한 얼굴 특징과 상관되어야 하며, 서로 달라야 한다. 따라서, 사용자의 얼굴 특징 및 형태에 가장 가까운 얼굴 특징 및 형태를 가진 마커 라이브러리나 가이드 라이브러리를 사용자가 선택할 수 있게 된다.

토킹 헤드는 뉴스 커버리지와 상관된 뉴스캐스터 포맷으로 사용될 수 있어야 한다. 실사 품질 및 개인 외양을 나타내는 토킹 헤드의 애니메이션화된 이미지가 다양한 분야에 사용될 수 있다.

네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법은 실제 사람으로부터 찍은 디지털 비디오테이프 장면으로부터 컴퓨터 라이브러리 기반의 2차원 이미지를 생성할 수 있어야 할 것이다. 사용자는 PC 소프트웨어를 이용하여 믹싱된 3차원 렌더링 가이드 이미지나 템플릿들의 라이브러리 또는 마커의 라이브러리를 조작할 수 있어야 하고, 정돈된 헤드 모션에 대한 템플릿을 제공하기에 적합한 장치나 컴퓨터 모니터에 디스플레이될 수 있어야 한다. 대상자나 뉴스캐스터는 마커나 가이드를 이용하여 정확한 포즈 정렬을 유지할 수 있어야 하고, 이때, 일련의 얼굴 표정을 완성하면서, 눈을 깜박이고, 눈썹을 치켜올리며, 타겟 음소나 입 모양을 포함하는 구문을 말할 수 있어야 한다. 세션은 고화질 디지털 비디오테이프에 연속적으로 레코딩될 수 있어야 한다. 사용자는 대상자의 기준 소스 비디오 프레임에 필적할만한 프레임 단위로 개별적인 헤드 위치, 얼굴 표정, 그리고 입 모양의 어레이를 지닌 선택된 개별 비디오 프레임들을 이용하여, 이미지 편집 소프트웨어로 토킹 헤드 라이브러리를 조합할 수 있어야 한다. 네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법에 따라 발생되는 출력은, PC, PDA, 셀폰 등에서의 다양한 프레젠테이션 및 응용분야에 실제 영상을 대신하여 사용될 수 있어야 한다. 자체식 실사 토킹 헤드 생성 시스템은 스크립트 명령으로부터 토킹 헤드 프레젠테이션을 구성할 수 있어야 한다.

네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법은 휴대형 장치 및 휴대형 무선 장치와 함께 사용될 수 있어야 한다. 이러한 휴대형 장치 및 휴대형 무선 장치는 디지털 통신 장치, PDA, 셀 폰, 노트북 컴퓨터, 비디오폰, 비디오 카메라 및 비디오 디스플레이를 구비한 디지털 통신 장치, 또는 그외 다른 적절한 장치를 포함하여야 한다.

휴대형 장치 및 휴대형 무선 장치는 핸드헬드 장치여야 하며, 휴대형 무선 장치는 신호를 무선으로 송신 및 수신할 수 있어야 한다.

대상자는 이러한 장치의 비디오 카메라를 이용하여 자신의 이미지를 캡처할 수 있어야 하고, 이 장치의 비디오 디스플레이에서 캡처된 이미지의 라이브 영상을 볼 수 있어야 한다.

대상자의 마커나 가이드 이미지들은 자체식 실사 토킹 헤드 생성 시스템의 휴대형 장치나 휴대형 무선 장치의 디스플레이 상에서 겹쳐질 수 있어야 한다.

이러한 장치에서의 각각의 디스플레이는 대상자의 수집된 이미지와 선택된 정렬 템플릿 간의 복합 이미지를 디스플레이할 수 있어야 한다. 디스플레이 및 비디오 카메라의 경우, 비디오 카메라가 대상자의 이미지를 수집할 수 있고, 특정 정렬 템플릿 헤드 각도와 실질적으로 동일한 각도에서 정렬 템플릿 헤드와 자신의 이미지를 정렬할 수 있다.

이러한 휴대형 장치나 휴대형 무선 장치는 유선 또는 무선 연결을 통해 PC에 연결될 수 있어야 하고, 또는, 실시간 비디오 스트리밍이나 적절한 신호 전송을 지원하는 데 충분한 대역폭의 네트워크를 통해 원격 서버에 연결될 수 있어야 한다.

전형적인 네트워크로는 셀룰러 네트워크와, 무선 네트워크와, 무선 디지털 네트워크와, 분배형 네트워크(가령, 인터넷, WAN, MAN, LAN), 그리고 그외 다른 적절한 네트워크가 있다.

두명 이상의 사용자가 임의의 시간에 한개의 원격 서버에 연결될 수 있어야 한다. 캡처된 비디오 스트림이나 정지 이미지가 컴퓨터나 서버에 전달되어 실사 토킹 헤드 라이브러리로 처리될 수 있어야 하고, 또는, 장치 자체에서 처리가 이루어져야 한다.

소프트웨어 애플리케이션이나 하드웨어는 이러한 장치, 컴퓨터, 또는 원격 서버에 배치되어, 대상자의 수집된 이미지와 정렬 템플릿의 복합 신호를 분석할 수 있어야 하고, 마커나 가이드 이미지에 대한 정렬 정확도를 결정할 수 있어야 한다.

네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법은 음성 프람프트를 이용할 수 있어야 한다. 음성 프람프트는 합성을 통해 발생된 음성으로, 또는, 실제 레코딩된 사람의 음성으로, 또는 라이브 음향 기술 감독관을 통해 생성되며, 실시간으로 대상자에게 전달되어 정렬 과정 중 사용자를 돕게 되고, 부가적으로 비디오 프람프트를 이용할 수도 있다. 대상자는 그후 프람프트의 정보에 따라 자신의 헤드 위치를 조정할 수 있고, 적절히 정렬되었을 때, 캡처 프로세스의 구술 구문부를 개시할 수 있다. 음성이나 영상 프람프트를 사용하여 대상자의 다른 작업을 도울 수도 있다. 가령, 시퀀스를 반복하거나 적절한 정렬이 캡처나 정렬 과정 중 소실되었을 때, 또는, 세션을 시작하거나 중지할 때 프람프트가 사용될 수 있다.

특히 사람의 헤드(즉, 머리), 헤드 구성 기술, 또는 사람의 신체에 상관된 전자 이미지를 제조, 생성, 조작하는 방법 및 장치가 여러가지 제안된 바 있다. 그러나, 이 중 어떤 방법 및 장치도 앞서 언급한 필요성을 적절하게 충족시키지 못하고 있다.

한개의 디스플레이에 두개 이상의 이미지를 동시에 디스플레이하여, 이미지 믹싱하고, 결합하며, 오버레이를 실시하고, 블렌딩을 실시하며, 병합하는 장치 및 방법이 여러가지 알려져 있다. 그러나 이 중 어떤 방법 및 장치도 앞서 언급한 필요성을 적절하게 충족시키지 못하고 있다.

콘텐트의 제작, 생성, 분배 방법 및 장치가 여러가지 알려져 있다. 그러나 이 중 어떤 것도 앞서 언급한 필요성을 적절하게 충족시키지 못하고 있다.

이와 같은 이유로, 토킹 헤드의 실사 애니메이션 이미지를 사용자가 쉽고 빠르게, 그리고 효율적으로 발생시킬 있도록 하는, 네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법이 필요하다. 네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법은 개인 신원 잔달, 대화의 포인트 강조, 감정적 콘텐트 추가, 애니메이션 실사 이미지의 명확하고 깔끔한 전달, 이와 동시에 고품질의 립싱크 제공, 통상적인 네트워크나 인터넷에 비해 더 적은 대역폭 요구 등을 이행하는데 필요한 실사 품질을 가진 이미지들을 생산하여야 한다.

네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법은 서버와 다양한 무선 장치(가령, 셀 폰 및 그외 다른 휴대형 무선 장치), 그리고 소프트웨어들을 포함할 수 있다. 상기 소프트웨어는 사용자로 하여금 콘텐트의 생성, 이용, 공유를 통해 서로 통신할 수 있게 하고, 텍스트, 오디오, 사진, 비디오 콘텐트 등과 결합된 실사 토킹 헤드 애니메이션을 포함한다. 콘텐트는 한개 이상의 원격 서버에 업로드될 수 있어야 하고, 셀 폰, 데스크탑 컴퓨터, 랩탑 컴퓨터, PDA, 셀룰러 스마트폰, 등과 같은 다양한 장치를 통해 액세스될 수 있어야 한다. 콘텐트를 포함하는 쇼는 다양한 환경에서 미디어 플레이어로 관찰/재생될 수 있어야 하며, 이때, 다양한 환경이라 함은, 가령, 웹 브라우저 애플리케이션을 이용한 채팅방 및 인터넷 소셜 네트워킹 사이트, 또는, 디지털 장치의 운영 체제에 통합되어 인터넷, 셀룰러 무선 통신망, 그리고 그외 다른 적절한 통신망을 통해 분배되는 애플리케이션들을 그 예로 들 수 있다.

본 발명은 서버와 다양한 통신 장치(가령, 셀 폰 및 그외 다른 휴대형 무선 장치), 그리고 소프트웨어들을 포함하는 네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법을 지향하며, 이러한 소프트웨어는 사용자로 하여금 멀티미디어 콘텐트의 생성, 이용, 공유를 통해 서로 통신할 수 있게 하고, 텍스트, 오디오, 사진, 비디오 콘텐트와 결합된 실사 토킹 헤드 애니메이션을 포함한다. 콘텐트는 한개 이상의 원격 서버에 업로드되고, 셀 폰, 데스크탑 컴퓨터, 랩탑 컴퓨터, PDA, 셀룰러 스마트폰같은 다양한 장치를 통해 액세스될 수 있다. 콘텐트를 포함하는 쇼는 다양한 환경에서 미디어 플레이어로 관찰/재생될 수 있어야 하며, 이때, 다양한 환경이라 함은, 가령, 웹 브라우저 애플리케이션을 이용한 채팅방 및 인터넷 소셜 네트워킹 사이트, 또는, 디지털 장치의 운영 체제에 통합되어 인터넷, 셀룰러 무선 통신망, 그리고 그외 다른 적절한 통신망을 통해 분배되는 애플리케이션들을 그 예로 들 수 있다.

다양한 환경이라 함은, 가령, 웹 브라우저 애플리케이션을 이용한 채팅방 및 인터넷 소셜 네트워킹 사이트, 또는, 디지털 장치의 운영 체제에 통합되어 인터넷, 셀룰러 무선 통신망, 그리고 그외 다른 적절한 통신망을 통해 분배되는 애플리케이션들을 그 예로 들 수 있다.

네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법에서는 사용자가 토킹 헤드의 실사 애니메이션 이미지를 쉽고 빠르게, 그리고 효율적으로 발생시킬 수 있다. 네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법에서 도출되는 이미지는 개인 신원 전달, 대화 중 포인트 강조, 감정적 콘텐트 추가, 애니메이션 실사 이미지의 명확하고 깔끔한 전달, 그러면서도 고품질의 립싱크 보장, 통상의 네트워크나 인터넷에 비해 적은 대역폭의 요구 등등의 요건들을 이행하는데 필요한 실사 품질을 가진다.

네트워크 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 시스템 및 방법은 셀 폰, PDA, 스마트폰, 핸드헬드 장치, 그리고 그외 다른 무선 장치 등등과 같은 휴대형 무선 장치를 이용하여 실사 토킹 헤드 라이브러리를 생성하는 데 사용될 수 있고, 무선 셀룰러 네트워크, 인터넷, WiFi 네트워크, WiMax 네트워크, VOIP 네트워크, 인트라넷, 그리고 그외 다른 적절한 네트워크 등등과 같은 다양한 네트워크에서 사용될 수 있다.

사람이나 사용자는 자신의 실사 토킹 헤드 쇼(가령, 쇼 콘텐트)를 발전시킬 수 있어야 한다. 즉, 개인 신원 전달, 대화 포인트 강조, 감정적 콘텐트 추가 등등을 수행하는 데 요구되는 실사 품질을 가진 쇼 콘텐트를 스스로 개발시킬 수 있어야 한다. 애니메이션화된 실사 이미지들은 애니메이션 토킹 헤드를 명확하고 깔끔하게 보여주며, 고품질의 립싱크를 동반하며, 오늘날의 네트워크나 인터넷 등에서의 일반적 대역폭보다 적은 대역폭을 요구하게 된다.

실사 토킹 헤드의 라이브러리는 통상적 컴퓨터 숙련도를 가진 자에 의해 쉽고 빠르게, 그리고 효율적으로 구성될 수 있다. 이 경우, 여러가지 각도의 실제 사람의 이미지에 대한 믹싱 및 정렬용 템플릿으로 사용될 수 있는 마커나 가이드를 이용하여 제작 시간을 최소화시킬 수 있다. 대상자의 마커나 가이드 이미지는 휴대형 장치나 휴대형 무선 장치의 디스플레이에 겹쳐질 수 있다.

마커 라이브러리나 가이드 라이브러리가 제공된다. 각각의 마커 라이브러리나 가이드 라이브러리는 서로 다른 마커나 가이드를 가지며, 각각의 마커나 가이드는 서로 다른 각도에 대해 표시된다. 각각의 마커 라이브러리나 가이드 라이브러리는 사용자의 서로 다른 각도에 대한 얼굴 특징과 상관되어 있고, 서로 다른 것이어서, 사용자 얼굴 특징 및 형태에 가까운 얼굴 특징 및 형태를 가진 마커 라이브러리나 가이드 라이브러리로부터 특정 마커 라이브러리나 가이드 라이브러리를 사용자가 선택할 수 있게 한다.

핸드헬드 장치 및 그외 다른 적절한 장치의 각각의 디스플레이는 대상자의 수집된 이미지와 선택된 마커나 선택된 정렬 템플릿 간의 복합 이미지를 디스플레이할 수 있다. 디스플레이와 비디오 카메라의 경우, 비디오 카메라는 대상자의 이미지를 수집할 수 있고, 대상자가 복합 이미지를 볼 수 있게 하며, 자신의 이미지를 마커나 정렬 템플릿에 정렬되게 할 수 있다. 마커나 가이드는 정렬 과정 중 원격 서버로부터 불러들여질 수 있으나, 무선 핸드헬드 장치나 그외 다른 적절한 장치 내에 배치될 수도 있다.

실사 헤드 쇼 및 관련 콘텐트가 무선 핸드헬드 장치를 이용하여 생성될 수 있다.

토킹 헤드는 뉴스 커버리지에 관련된 뉴스캐스터 포맷에 사용될 수 있다. 실사 품질을 가지면서 개인별 외양을 제시하는 토킹 헤드의 애니메이션 이미지들을 이용하기 때문에 다양한 분야에서 활용될 수 있다.

대상자나 사용자가 이러한 장치의 비디오 카메라로 자신의 이미지를 캡처할 수 있고, 이 장치의 비디오 디스플레이에서 캡처 이미지의 라이브 영상을 볼 수 있다. 대상자나 사용자는 실사 토킹 헤드 쇼를 구성할 수 있고, 가령, 실사 토킹 헤드 쇼에 상관된 콘텐트를 포함하는 실사 토킹 헤드 쇼를 구성할 수 있다.

도 1은 본 발명에 따라 네트워크를 통해 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 그리고 관찰하는 방법의 단계들에 대한 순서도다.
도 2는 실사 토킹 헤드 라이브러리의 개략적 도면이다.
도 3은 정렬 템플릿으로 사용되는 가이드의 모습이다.
도 4는 도 2의 실사 토킹 헤드 라이브러리에 채용될 수 있는 대상의 모습이다.
도 5는 도 3의 가이드와 정렬된 도 4의 대상의 복합 이미지다.
도 6A는 도 3의 가이드로부터 수평방향으로 변위된 도 4의 대상의 복합 이미지다.
도 6B는 도 3의 가이드로부터 수직 방향으로 변위된 도 4의 대상의 복합 이미지다.
도 6C는 매우 가깝게 정렬되는 도 3의 가이드와 도 4의 대상의 복합 이미지다.
도 7은 특정 각도에서 도 2의 실사 토킹 헤드 라이브러리의 선택된 이미지의 확대 이미지로서, 선택된 이미지의 특정 각도에서 여러가지 입모양과 여러가지 눈모양을 나타내며, 각각의 이미지는 도 2의 실사 토킹 헤드 라이브러리에 역시 해당한다.
도 8은 도 7의 특정 각도에서 도 2의 실사 토킹 헤드 라이브러리의 선택된 이미지들 중 전형적인 이미지를 도시하고 있고, 도 7의 특정 각 위치에서 눈을 감은 모습과 눈을 넓게 뜬 모습을 한 대상으로부터 얻을 수 있는 여러가지 눈 특징의 대표적인 이미지들을 나타내며, 선택된 소리를 입으로 내고 있는 대상에 의해 얻어지는 도 7의 특정 각 위치에서의 여럭가지 입 특징들의 대표적인 이미지들을 나타낸다.
도 9는 도 8의 여러가지 입모양 특징 중 대표적인 것들과 여러가지 눈모양 특징들 중 대표적인 것들을 획득하기 위해 대상의 전형적인 눈 영역과 전형적인 입 영역을 도시한다.
도 10은 틸트(tilt), 스위벨(swivel), 노드(nod) 벡터를 가진 좌표계를 도시한다.
도 11은 부가적인 라벨에 사용될 수 있는 부가적인 명칭 규약을 제시한다.
도 12는 가이드 라이브러리의 개략적 이미지다.
도 13A는 가이드 라이브러리의 와이어 메시 모델 이미지다.
도 13B는 펑 음영법(phong shading)에 따른 도 13A의 가이드의 와이어 메시 모델 이미지다.
도 13C는 요망하는 토킹 헤드 또는 선호되는 뉴스캐스터의 사진과 실사 매핑된 펑 음영법에 따른 도 13B의 가이드의 이미지다.
도 14A는 전형적인 얼굴 특징부들을 나타내는 또다른 가이드의 이미지다.
도 14B는 전형적인 얼굴 특징부들을 나타내는 또다른 가이드의 이미지다.
도 14C는 전형적인 얼굴 특징부들을 나타내는 또다른 가이드의 이미지다.
도 14D는 전형적인 얼굴 특징부들을 나타내는 또다른 가이드의 이미지다.
도 14E는 전형적인 얼굴 특징부들을 나타내는 도 3의 가이드의 또다른 이미지다.
도 14F는 전형적인 얼굴 특징부들을 나타내는 또다른 가이드의 이미지다.
도 15는 도 14A-F의 가이드들과 관련된 가이드 라이브러리들 중 일 라이브러리의 개략적 도면이다.
도 16은 본 발명의 실사 토킹 헤드를 구성하는 방법의 순서도다.
도 17은 도 14의 실사 토킹 헤드를 구성하는 방법의 추가적인 단계들의 순서도다.
도 18A는 도 3의 가이드 또는 정렬 템플릿에 대한 대안으로 정렬에 사용될 수 있는 마커들을 나타내는 또다른 대상의 이미지로서, 대상의 정렬을 표현하고 있다.
도 18B는 대상의 정렬이 불완전한 상태일 때 마커의 모습을 나타낸, 도 18A의 정렬-오프 상태의 대상 이미지다.
도 18C는 도 18A의 각도로부터 각도를 따라 변위된 도 18A의 대상의 이미지로서, 대상이 정렬된 상태를 도시한다.
도 19는 본 발명에 따라 구성된 자체식 실사 토킹 헤드 생성 시스템의 개략도다.
도 20은 자체식 실사 토킹 헤드 생성 시스템의 일 실시예의 개략도다.
도 21은 도 19의 자체식 실사 토킹 헤드 생성 시스템의 서버와 무선으로 통신하는 도 19의 자체 실사 토킹 헤드 생성 시스템의 개략도다.
도 22는 도 20의 자체식 실사 토킹 헤드 생성 시스템의 서버와 무선으로 통신하는 도 20의 자체식 실사 토킹 헤드 생성 시스템의 개략적 도면이다.
도 23은 도 21의 자체식 실사 토킹 헤드 생성 시스템과 무선으로 통신하는 복수의 셀 폰을 가진 자체식 실사 토킹 헤드 생성 시스템의 개략적 도면이다.
도 24는 도 22의 자체식 실사 토킹 헤드 생성 시스템과 무선으로 통신하는 복수의 셀 폰을 가진 자체식 실사 토킹 헤드 생성 시스템의 개략적 도면이다.
도 25는 도 21의 자체식 실사 토킹 헤드 생성 시스템의 서버와 무선으로 통신하는 복수의 PDA를 가진 자체식 실사 토킹 헤드 생성 시스템의 개략적 도면이다.
도 26은 인터넷을 통해 서버와 통신하는 복수의 셀 폰을 가진 자체식 실사 토킹 헤드 생성 시스템의 개략적 도면이다.
도 27은 무선 셀룰러 통신망을 이용하여 인터넷을 통해 도 21의 자체식 실사 토킹 헤드 생성 시스템의 서버와 무선으로 통신하는 복수의 셀 폰들을 가진 자체식 실사 토킹 헤드 생성 시스템의 개략적 도면이다.
도 28은 무선 셀룰러 통신망을 이용하여 인터넷을 통해 도 22의 자체식 실사 토킹 헤드 생성 시스템의 서버와 무선으로 통신하는 복수의 셀 폰들을 가진 자체식 실사 토킹 헤드 생성 시스템의 개략적 도면이다.
도 29는 인터넷이나 구형 전화 시스템에 연결된 셀룰러 네트워크를 통해 자체식 실사 토킹 헤드 생성 시스템의 서버와 무선으로 통신하는 자체식 실사 토킹 헤드 생성 시스템의 개략적 도면이다.
도 30은 서버에 각각 연결된 인터넷과 무선 셀룰러 통신망에 무선으로 연결된 자체식 실사 토킹 헤드 생성 시스템의 개략적 도면이다.
도 31은 본 발명의 실사 토킹 헤드를 구성하기 위한 대안의 방법의 개략도다.
도 32는 도 31의 실사 토킹 헤드 구성 방법의 추가적인 부가 단계들의 개략도다.
도 33은 도 31의 실사 토킹 헤드 구성 방법의 추가적인 부가 단계들의 개략도다.
도 34는 비디오 캡처 장치의 블록도표다.
도 35는 본 발명에 따라 구성된, 자체식 실사 토킹 헤드 생성 시스템의 일 실시예의 블록도표다.
도 36은 본 발명에 따라 구성된, 자체식 실사 토킹 헤드 생성 시스템의 일 실시예의 블록도표다.
도 37은 콘텐트 생성 및 업로드 방법의 개략도다.
도 38은 실사 토킹 헤드 분야에 사용될 수 있는 장치 플랫폼의 개략도다.
도 39는 발신자 개인 브랜드 배치를 위한 프로세스의 개략도다.
도 40은 쇼 콘텐트 생성 방법을 나타내는 개략도다.
도 41은 채팅, 블록, 또는 멀티미디어 프로그램을 위한 실사 토킹 헤드 콘텐트를 생성하는 프로세스의 개략도다.
도 42는 전화 또는 보이스메일 프로그램용 실사 토킹 헤드 콘텐트의 생성 프로세스의 개략도다.
도 43은 실사 토킹 헤드 전화 애플리케이션의 개략도다.
도 44는 실사 토킹 헤드 보이스메일 애플리케이션의 개략도다.
도 45는 립 싱크 데이터를 임베딩하는 프로세스의 개략도다.
도 46은 사용자의 파라미터 및 선호도와 수신자의 파라미터 및 선호도에 관련된 단어들을 일치시킴으로써 브랜드를 입력하는 프로세스의 개략도다.
도 47은 분배형 웹 애플리케이션 네트워크의 개략도다.
도 48은 분배형 웹 애플리케이션 네트워크의 개략도다.
도 49는 임베딩된 립 싱크 시스템 및 방법의 개략도다.
도 50은 실사 토킹 헤드 전화의 개략도다.
도 51은 모바일 정보 장치 상에서의 임베딩된 립 싱크 시스템 및 방법의 개략도다.
도 52는 스피치-구동형 개인 브랜드 배치 시스템의 개략도다.
도 53은 실사 토킹 헤드 보이스메일의 개략도다.
도 54는 실사 토킹 헤드 웹 애플리케이션이라고 불리는 장치 플랫폼 및 원격 서버 시스템의 개략도다.
도 55는 쇼 세그먼트 에디터 애플리케이션의 개략도다.
도 56은 쇼 컴파일 에디터 애플리케이션의 개략도다.
도 57은 로컬 자산 라이브러리(local asset library)의 디렉토리 구조에 관한 개략도다.
도 58은 암호화된 자산 라이브러리의 디렉토리 구조의 개략도다.
도 59는 로컬 자산 라이브러리의 그래픽 자산 부분의 디렉토리 구조의 개략도다.
도 60은 로컬 자산 라이브러리의 사운드 라이브러리 부분의 디렉토리 구조의 개략도다.
도 61은 음성 분석 및 립 싱크 애플리케이션의 개략도다.
도 62는 실사 토킹 헤드 콘텐트 제작 시스템으로 불리는 로컬 컴퓨터(풀-버전) 시스템의 개략도다.
도 63은 음성 분석 및 립 싱크 애플리케이션의 그래픽 사용자 인터페이스의 개략도다.
도 64는 제작 세그먼트 에디터 애플리케이션의 그래픽 사용자 인터페이스의 개략도다.
도 65는 쇼 컴파일 에디터 애플리케이션의 그래픽 사용자 인터페이스의 개략도다.
도 66은 채팅 프로그램의 그래픽 사용자 인터페이스의 개략도다.
도 67은 블로그 애플리케이션의 그래픽 사용자 인터페이스의 개략도다.
도 68은 보이스메일 애플리케이션의 그래픽 사용자 인터페이스의 개략도다.
도 69는 보이스메일 애플리케이션의 그래픽 사용자 인터페이스의 개략도다.
도 70은 멀티미디오/텔레비전/방송 애플리케이션의 그래픽 사용자 인터페이스의 개략도다.
도 71은 사용자의 장치에 대한 멀티미디어 보조 애플리케이션의 그래픽 사용자 인터페이스의 개략도다.
도 72는 개인 뱅킹용 멀티미디어 개인 금융 센터의 그래픽 사용자 인터페이스의 개략도다.
도 73은 개인 금융 센터 내 가상 ATM을 구비한, 개인 금융 센터의 멀티미디어 서브카테고리의 그래픽 사용자 인터페이스의 개략도다.
도 74는 멀티미디어 메시지 센터의 그래픽 사용자 인터페이스의 개략도다.
도 75는 멀티미디어 게임 시작 메뉴의 그래픽 사용자 인터페이스의 개략도다.
도 76은 멀티미디어 게임에서 플레이 모드에서의 그래픽 사용자 인터페이스의 개략도다.
도 77은 멀티미디어 일반 상식 게임의 그래픽 사용자 인터페이스의 개략도다.
도 78은 멀티미디어 비평가 리뷰의 그래픽 사용자 인터페이스의 개략도다.
도 79는 멀티미디어 개인용 내비게이터의 그래픽 사용자 인터페이스의 개략도다.
도 80은 개인용 내비게이터의 멀티미디어 주유소 위치 서브카테고리의 그래픽 사용자 인터페이스의 개략도다.
도 81은 멀티미디어 비평가 리뷰의 그래픽 사용자 인터페이스의 개략도다.
도 82는 비평가 리뷰의 멀티미디어 영화 리뷰 서브카테고리의 그래픽 사용자 인터페이스의 개략도다.

본 발명의 실시예들은 첨부된 도면, 즉, 도 1-82를 참고하여 설명될 것이다.

I. 개요

도 1은 본 발명에 따라 네트워크(10) 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 그리고 관찰하는 방법의 단계들에 대한 순서도다.

네트워크(10) 상에서 실사 토킹 헤드 기반 멀티미디어 콘텐트를 생성, 분배, 관찰하는 방법은, 단계 100으로부터 시작하여, 실사 토킹 헤드 라이브러리를 생성하여 본 발명의 실사 토킹 헤드 시스템에 실사 토킹 헤드 라이브러리를 저장하는 단계(단계 200)와, 콘텐트를 생성하여 이 콘텐트를 실사 토킹 헤드 시스템에 업로드하는 단계(단계 300)와, 브랜딩을 위한 프로파일 생성 단계(단계 350)와, 실사 토킹 헤드 시스템에 콘텐트 및 프로파일을 저장하는 단계(단계 750)와, 실사 토킹 헤드 시스템으로 하여금 콘텐트를 수신자에게 보내줄 것을 요청하는 요청을 수신하는 단계(단계 760)와, 실사 토킹 헤드 시스템에 의해 브랜드를 입력하여 콘텐트를 수신자에게 발송하는 단계(단계 800)와, 단계 1000의 종료 단계로 구성된다.

II . 실사 토킹 헤드 라이브러리 생성

단계 200에서 실사 토킹 헤드 라이브러리(12)가 생성된다. 실사 토킹 헤드 라이브러리(12)와, 이 라이브러리(12)를 생성하는 방법들이 도 2-36에 제시되어 있다. 도 19-36은 실사 토킹 헤드 생성을 위한 대안의 실시예들을 제시하고 있다.

실사 토킹 헤드들은 다양한 무선 휴대 장치에 사용되고 있다. 가령, 셀 폰, 핸드헬드 장치, 등등은 비디오 카메라와 디스플레이를 내장하며, 이러한 비디오 카메라와 디스플레이는 실사 토킹 헤드 라이브러리(12)의 생성 중 대상자 자신을 마커(marker)나 가이드(guide)와 정렬시키는 데 사용될 수 있고, 실시간 토킹 헤드를 디스플레이하는 데 사용될 수 있다.

도 2는 각각의 각도(44)에서 서로 다른 눈 모양(46)과 서로 다른 입 모양(48)을 가진 대상자(26)의 다양한 선택 이미지(42)들로 구성된 실사 토킹 헤드 라이브러리(12)를 도시하고 있다.

도 3은 도 4에 도시된 대상자(26)를 도 5에 도시된 복합 출력 이미지(38)와 정렬시키기 위한 정렬 템플릿으로 사용되는 가이드(20)를 도시하고 있다.

도 6A-6C는 대상자(26)를 가이드(20)와 정렬시킬 때의 여러 단계에서의 복합 출력 이미지(38)를 도시하고 있다. 도 6A는 가이드(20)로부터 수평방향으로 변위된 대상자(26)를 도시하고 있고, 도 6B는 가이드(20)로부터 수직방향으로 변위된 대상자(26)를 도시하고 있으며, 도 6C는 대상자(26)와 가이드(20)가 더 근접하게 정렬된 상태를 도시하고 있다. 도 5는 가이드(20)와 정렬된 대상자(26)를 도시하고 있다.

실사 토킹 헤드 라이브러리(12)는 도 10에 도시된 좌표계 및 도 11에 도시된 명칭법에 따라, 도 2에 도시된 각각의 각도(44)에서 서로 다른 눈 모양(46)과 서로 다른 입 모양(48)을 가진 선택 이미지(42)들로 구성된다. 도 7은 도 2의 특정 각도에서의 선택 이미지(42)들의 확대도로서, 각각의 이미지는 특정 각도에서 서로 다른 눈 모양(46)과 서로 다른 입 모양(48)을 가진다. 도 8은 도 7의 특정 각도에서의 선택 이미지(42)들 중 전형적인 이미지를 도시하고 있으며, 도 7의 특정 각도에서 눈이 감긴 모습과 눈을 뜬 모습의 대상자(26)로부터 얻은 서로 다른 눈 모양(46)과, 선택된 소리를 발음하고 있는 대상자(26)로부터 얻은 특정 각도에서의 서로 다른 입 모양(48) 중에서 나타나는 전형적인 이미지를 도시하고 있다. 대상자(26)가 자산을 특정 각도에서 가이드(20)와 정렬시키면, 대상자(26)는 눈을 감고 뜨는 동작을 행하고, 평범한 문장을 발음하게 된다. 이러한 발음에는 선택된 음소들이 포함될 수 있다. 부가적으로, 대상자(26)가 웃거나 얼굴을 찡그리는 등의 얼굴 표정을 지을 수도 있다. 도 9는 도 7의 특정 각도에서 눈을 감은 모습과 눈을 뜬 모습을 한 대상자(26)로부터 얻은 여러가지 눈 모양(46)과, 도 7의 특정 각 위치에서 여러가지 입 모양(48) 중에서 얻은 대상자(26)의 전형적인 눈 영역(50) 및 전형적인 입 영역(52)을 도시하고 있다.

도 10은 실사 토킹 헤드 라이브러리(12)의 선택 이미지(42)들에 관련된 눈 모양(46)들과 입 모양(48)들, 선택된 이미지(42), 가이드(20), 그리고 대상자(26)의 여러 각도(44)에 대한 틸트(tilt)(56), 스위벨(swivel)(58), 그리고 노드(nod)(60) 벡터들을 가진 좌표계(54)를 도시하고 있다. 틸트(56), 스위벨(58), 그리고 노드(60) 벡터들 각각은 도 10에 도시된 전형적인 각도 및 방향들과 같은 방향 및 각도를 표시한다. 하지만 그외 다른 적절한 각도 및 방향도 사용될 수 있다. 스위벨(58) 벡터는 방위각 위치를 이용하며, 노드(60) 벡터는 상하의 각도를 이용한다. 즉, 틸트(56) 벡터는 좌우로 얼굴을 기울이는 각도를, 스위벨(58) 벡터는 좌우로 얼굴을 돌리는 각도를, 노드(60) 벡터는 상하로 얼굴을 기울이는 각도를 나타낸다.

도 11은 실사 토킹 헤드 라이브러리(12)의 선택 이미지(42)들과 관련된 눈 모양(46) 및 입 모양(48)들과 선택된 이미지(42), 가이드(20), 그리고 대상자(26)에 대한 틸트(56), 스위벨(58), 그리고 노드(60) 벡터들에 관련된 명칭법(64)을 제시한다. 그외 다른 적절한 명칭법이 사용될 수도 있고 실제 벡터 방향이나 각도가 사용될 수도 있다. 이러한 명칭법(64)은 마이너스 방향으로부터 플러스 방향까지 지정 방향 및 각도 각각에 대해 01로부터 상향으로 증가하는 틸트 벡터를 가진 일련 번호 기법을 이용한다. 따라서, 틸트(56)의 경우 -2.5도, 0도, +2.5도의 전형적인 각도에 대해 명칭법(64)은 각각 01, 02, 03의 표시법을 이용한다. 명칭법(64)은 마이너스 방향으로부터 플러스 방향까지 지정 방향 및 각도 각각에 대해 00으로부터 상향으로 증가하는 스위벨(58) 및 노드(60) 벡터를 가지는 일련 번호 기법을 이용한다. 따라서, 스위벨(58) 및 노드(60)에 대해 전형적인 -10도, -5도, 0도, +5도, +10도의 전형적인 각도의 경우, 00, 01, 02, 03, 04를 이용할 수 있다. 물론 -10도, -5도, 0도, +5도, +10도의 전형적인 각도 대신에 다른 각도가 사용될 수 있지만, 틸트에 대해 01부터, 스위벨 및 노드에 대해 00부터 시작되는 기법에는 변함이 없다. 명칭(66)은 머리(Head), 입(Mouth), 눈(Eyes)을 부가적인 라벨 및 표시자로 이용하며, 선택된 이미지(42), 대상자(26), 또는 가이드(20)의 머리를, 눈 모양(46)의 눈을, 그리고 입 모양(48)의 입을 라벨 및 표시자로 이용한다. 따라서, Head020301은 0도의 틸트, +5도의 스위벨, -5도의 노드을 나타내는 선택 이미지(42)를 나타낸다.

도 12는 도 10의 좌표계에 따라, 그리고 도 11의 명칭법(64)에 따라 나타나는 여러 각도(70)에서의 가이드(20)들을 포함하는 가이드 라이브러리(68)를 도시하고 있다. 도 11의 가이드(20) 각각은 가이드 라이브러리(68) 내 각 가이드(20)의 각도(70)에 대응하는 각도(44)에서의 눈 모양(46)과 입 모양(48) 및 각도(44)에서의 선택 이미지(42)를 구성하는 데 사용된다. 따라서, 대상자(26)는 선택 이미지(42)들 각각을 구성하는 각각의 각도(70)에서 복합 출력 이미지(38)의 가이드(20)와 자신을 정렬시키게 되고, 정렬된 선택 이미지(42) 각각의 특정 각도에서의 서로 다른 눈 모양(46) 각각을 구성하도록 자신의 눈을 뜨고 감으며, 각각의 각도(70)에 대응하는 선택 이미지(42) 각각의 특정 각도에서의 각기 다른 입 모양(48)을 반복적으로 행하게 된다.

도 13A-C는 가이드(2)의 전형적인 발전 단계를 도시하고 있다. 그러나, 이와는 다른 적절한 기술이 가이드(2)를 발전시키는데 사용될 수도 있다. 각각의 가이드(20)는 중간 해상도로 모델링된 헤드인 것이 일반적이며, 서로 다른 각도에서의 요망하는 토킹 헤드, 선호되는 뉴스캐스터, 또는 일반적인 토킹 헤드나 뉴스캐스터일 수 있으며, 각각의 가이드(20)는 서로 다른 각 위치에서의 선택 이미지에 대상자(26)를 정렬시키기 위한 템플릿으로 사용된다. 각각의 가이드(20)는 레이저 스캐닝, 예술적 모델링, 또는 그외 다른 적절한 기술을 이용하여 구성될 수 있다. 이에 따라 가이드는 대략 5000개의 다각형들로 구성된 3차원 모델 헤드가 된다. 3차원 모델링 소프트웨어나 그외 다른 적절한 모델링 소프트웨어가 가이드(20) 생성에 사용될 수 있다. 가이드 생성용으로 적합한 시판 중인 3차원 모델링 소프트웨어 패키지로는 3D Studio Max, Lightwave, Maya, SoftImage, 등이 있고, 하지만 그외 다른 적절한 모델링 소프트웨어가 사용될 수도 있다. 먼저, 도 13A에 제시되는 바와 같이, 와이어 메시 모델(72)이 아래에 배치된다. 와이어 메시 모델(72)에 펑 음영법(phong shading)을 부가하여, 음영처리된 모델(74)을 생성한다(도 13B 참조: 솔리드한 외양을 보임). 음영처리된 모델(74)은 그후 요망 토킹 헤드, 선호 뉴스 캐스터, 또는 범용 토킹 헤드나 뉴스캐스터의 사진과 실사 매핑되어 도 13C의 가이드(20)를 생성한다. 이 가이드(20)는 요망하는 토킹 헤드, 선호하는 뉴스캐스터, 또는 범용 토킹 헤드나 뉴스캐스터와 닮은 모습을 보인다. 가이드(20)는 구체적인 헤드 포즈(head pose)로 렌더링되며, 실사 토킹 헤드 라이브러리(12)의 선택 이미지(42)들의 요망 토킹 헤드 라이브러리 포즈에 해당하는 좌우, 상하, 측면간 회전의 어레이와 함께 렌더링된다. 이는 서로 다른 각도에서 본 가이드(20)들을 포함하는 가이드 라이브러리(68)로 나타나게 되며, 각각의 가이드는 서로 다른 각도에서의 정렬 템플릿으로 사용된다. 각각의 가이드(20)는 도 10의 좌표계에 따라, 그리고, 도 11의 명칭법에 따라, 일반적으로 투명한 배경 바탕 위에 가시적인 표시물로 인덱싱된 512x384 화소 또는 그 이하 갯수의 비트맵 이미지로 저장되는 것이 일반적이다.

대상자(26)는 모니터(39)에서 자신의 이미지와 가이드(20)의 이미지가 중첩되는 것을 볼 수 있고, 자신의 이미지를 가이드(20)의 이미지와 정렬시키게 된다. 이와 관련하여, 도 5, 6A, 6B, 6C를 참조할 수 있다.

이제 다시, 가이드(20)는 특정 헤드 포즈로 렌더링된다. 이때, 실사 토킹 헤드 라이브러리(12)의 선택 이미지(42)들의 요망하는 토킹 헤드 라이브러리 포즈에 해당하는 좌우, 상하, 측면간 회전의 어레이와 함께 렌더링된다. 이는 서로 다른 각도에서 본 가이드(20)들을 포함하는 가이드 라이브러리(68)로 나타난다. 각각의 가이드(20)는 서로 다른 각도에서의 정렬 템플릿으로 사용된다.

실사 토킹 헤드 라이브러리(12)는 보통 수준의 컴퓨터 조작 능력을 가진 자에 의해 쉽고 빠르게 그리고 효율적으로 구성될 수 있고, 가이드(2)를 이용하여 제작 시간을 최소화시킬 수 있다. 이러한 가이드(20)들은 서로 다른 각도에 놓인 실제 사람의 이미지와 믹싱 및 정렬을 위한 템플릿으로 사용될 수 있다.

여러가지 가이드 라이브러리(68)들을 구비한 라이브러리(75)가 제공된다. 각각의 가이드 라이브러리(68)는 여러가지 가이드(20)들을 가지며, 각각의 가이드(20)는 서로 다른 각도에서 본 모습을 포함한다. 각각의 가이드 라이브러리(68)는 서로 다른 얼굴 모양을 가지며, 따라서, 사용자의 얼굴 모양 및 특징에 가장 가까운 얼굴 모양 및 특징을 가진 가이드 라이브러리(68)를 라이브러리(75)로부터 사용자가 선택할 수 있게 된다.

도 14A-F는 여러가지 얼굴 모양을 가진 가이드(20)들을 도시하고 있다. 다양한 핵심 얼굴 모양 및 어깨 모양이 정렬을 돕는데 사용될 때 대상자(26)를 가이드(20)에 적절히 정렬시킬 수 있다. 대상자(26)는 도 15에 도시된 가이드 라이브러리(68)들의 라이브러리(75)로부터 적당한 것을 선택하여 자신의 얼굴 모양에 가장 부합하는 것을 선택할 수 있다.

안구(77) 간의 거리(76), 코(79)의 길이(78), 입(81)의 길이, 헤어(83) 스타일(82), 머리(85) 꼭대기로부터 턱(86)까지의 거리(84), 어깨(88) 형태(87), 그리고 부가적인 안경류(89) 등이 대상자(26)를 가이드(20)와 정렬시킴에 있어 대상자(26)의 타겟을 제공하는 전형적인 정렬 특징들이다. 가이드(20)의 크기, 외양, 비율, 얼굴 모양, 그리고 어깨 모양이 대상자(26)에 가까워질수록 정렬이 우수해지며, 따라서, 결과적인 실사 토킹 헤드 라이브러리(12)에 가까워질 것이다.

도 16은 실사 토킹 헤드를 구성하는 방법(단계 90)의 단계들을 제시하고 있다. 이 방법은, 대상자의 이미지를 비디오 카메라나 그외 다른 장치를 이용하여 수집하는 단계(단계 91)와, 대상자의 수집된 이미지를 가이드/템플릿 이미지와 믹싱하여, 대상자와 가이드/템플릿의 복합 이미지를 생성하는 단계(단계 92)와, 가이드/템플릿 이미지에 대한 대상자의 이미지 정렬을 돕기 위해 제공되는 모니터나 텔레비전에 복합 이미지를 전달하여(단계 93) 대상자가 복합 이미지를 볼 수 있도록 하는 단계와, 대상자의 이미지를 가이드/템플릿 이미지에 정렬시키는 단계(단계 94)와, 정렬된 대상자의 이미지를 저장하는 단계(단계 95)를 포함한다. 대상자의 수집된 이미지를 가이드/템플릿 이미지와 믹싱하여 대상자와 가이드/템플릿의 복합 이미지를 생성하는 단계(단계 92)는 믹서 프로그램을 구비한 컴퓨터에서 수행되는 것이 바람직하며, 이때, 상기 믹서 프로그램은 수집된 이미지와 템플릿 이미지로부터 복합 이미지를 생성하도록 구성된다. 물론 그외 다른 적절한 기술이 사용될 수도 있다. 실사 토킹 헤드를 구성하는 방법(단계 90)은 도 17에 도시되는 부가적인 단계들을 포함할 수도 있다. 즉, 얼굴 모양을 캡처하는 단계(단계 96)와, 입 모양을 캡처하는 단계(단계 97)와, 눈 모양을 캡처하는 단계(단계 98)와, 그외 다른 얼굴 특징을 캡처하는 단계(99)를 포함할 수 있다.

도 18A, 18B, 18C는 도 13의 가이드 또는 정렬 템플릿을 이용하는 방식에 대한 대안으로 정렬을 위해 마커(104, 106, 108, 110, 112)를 이용하여 대상(102)을 정렬시키는 방법을 제시하고 있다.

마커(104, 106, 108, 110, 112)들은 양 눈, 코끝, 입의 양 가장자리 등과 같은 핵심적인 얼굴 특징들을 정렬시키는데 사용된다. 하지만 그외 다른 적절한 얼굴 특징들이 사용될 수 있다. 마커(104, 106, 108, 110, 112)가 도 3의 가이드(20)에 대한 대안으로 사용되는 것이 일반적이지만, 가이드(20)와 조합하여 부가적으로 사용될 수도 있다.

도 18A는 각각 2도에 해당하는 틸트, 스위벨, 노드 각에 대해 마커(104, 106, 108, 110, 112)로 정렬된 대상자(102)를 도시하고 있다.

도 18B는 각각 2도에 해당하는 틸트, 스위벨, 노드 각에 대해 마커(104, 106, 108, 110, 112)와 정렬되지 않은 대상자(102)를 도시하고 있다.

도 18C는 도 18A에 도시된 각각 2도에 해당하는 틸트, 스위벨, 노드 각도로부터 회전 변위된 대상자를 가진 도 18A의 대상자의 화면으로서, 정렬된 대상자를 도시하고 있다.

도 19-30은 휴대형 장치와 휴대형 무선 장치를 이용하는 자체식 실사 토킹 헤드 생성 시스템의 일 실시예를 제시하고 있다. 이러한 휴대형 장치 및 휴대형 무선 장치들은 디지털 통신 장치와, PDA와, 셀폰, 노트북 컴퓨터, 비디오 폰, 핸드헬드 장치, 및 그외 다른 적절한 장치들을 포함한다. 휴대형 장치 및 휴대형 무선 장치에는 (특히 내장형의) 비디오 카메라와 비디오 디스플레이를 구비한 디지털 통신 장치들도 포함된다.

대상자는 가령, 이러한 장치의 비디오 카메라로 자신의 이미지를 캡처할 수 있고, 비디오 디스플레이 상에 캡처된 이미지의 라이브 비디오를 볼 수 있다.

마커 및 대상자의 가이드 이미지가 휴대형 장치나 휴대형 무선 장치의 디스플레이 상에 겹쳐진다.

이러한 장치의 각각의 디스플레이는 마커나 가이드를 포함하는 선택된 정렬 템플릿과 대상자의 수집된 이미지에 대한 복합 이미지를 디스플레이하게 되며, 비디오 카메라는 대상자의 이미지를 수집하여 디스플레이를 통해 대상자가 복합 이미지를 볼 수 있게 하고, 대상자가 대상자의 헤드 이미지를 정렬 템플릿 헤드와 실질적으로 동일한 각도로 정렬시킬 수 있게 한다.

이러한 휴대형 장치나 휴대형 무선 장치들은, 예를 들어, 적절한 신호의 실시간 비디오 스트리밍이나 전송을 지원하기 위해 충분한 대역폭의 네트워크를 통해 원격 서버에 전달될 수 있고, 또는 유선이나 무선 통신을 통해 서버에 전달될 수 있다. 전형적인 네트워크의 예로는 셀룰러 네트워크와, 분배형 네트워크(가령, 인터넷, 글로벌 네트워크, WAN, MAN, LAN, WiFi, WiMax, VOIP), 등등이 있다.

임의의 특정 시간에 두명 이상의 사용자가 한개의 원격 서버에 연결될 수 있다. 캡처된 비디오 스트림과 스틸 이미지가 서버에 전달되어 서버에서 실사 토킹 헤드 라이브러리로 처리될 수 있고, 또는, 장치 자체에서 처리가 이루어질 수도 있다.

이러한 장치나 컴퓨터, 또는 원격 서버에 소프트웨어 애플리케이션이나 하드웨어가 배치되어 대상자의 수집 이미지와 정렬 템플릿들의 복합 신호를 분석하고, 마커나 가이드 이미지의 정렬 정확도를 결정할 수 있다.

합성을 통해 발생된 음성, 실제 레코딩된 음성, 또는, 실시간 기술자를 거친 음성에 의해 음성 프람프트가 생성될 수 있고, 이러한 음성 프람프트가 정렬 과정 중 사용자를 돕기 위해 실시간으로 대상자에게 전달될 수 있다. 비디오 프람프트가 어떠한 대안의 형태로, 또는 추가적인 방식으로 사용될 수도 있다. 그후 대상자는 자신의 헤드 위치를 조정하기 위해 프람프트의 정보를 따르게 되고, 적절하게 정렬되었을 때, 캡처 과정의 구술 어휘 부분을 개시할 수 있다. 캡처 또는 정렬 과정 중 적절한 정렬이 이루어지지 않아 시퀀스를 반복할 때, 또는, 세션 시작이나 중지시와 같이 다른 작업에서도 대상자를 돕기 위해 음성 또는 비디오 프람프트가 사용될 수 있다.

휴대형 장치 또는 휴대형 무선 장치는, 비디오 카메라 및 디스플레이, 또는 그외 다른 적절한 카메라 및 디스플레이를 구비한, 셀 폰, PDA, 웹-이네이블 폰, 휴대형 폰, PC, 랩탑 컴퓨터, 태블릿 컴퓨터, 비디오 폰, 텔레비전, 핸드헬드 텔레비전, 무선 디지털 카메라, 무선 캠코더, 이메일 장치, 인스턴트 메시징 장치, PC 폰, 화상 회의 장치, 모바일 폰, 핸드헬드 장치, 무선 장치, 무선 핸드헬드 장치, 및 그외 다른 적절한 장치일 수 있다.

도 19 및 도 20은 일 실시예에 따른 자체식 실사 토킹 헤드 생성 시스템(120)과 일 실시예에 따른 자체식 실사 토킹 헤드 생성 시스템(130)을 각각 도시하고 있다. 자체식 실사 토킹 헤드 생성 시스템(120)과 자체식 실사 토킹 헤드 생성 시스템(130) 각각은 셀 폰(132)을 포함하며, 각각의 셀 폰(132)은 비디오 카메라(134)와 디스플레이(136)를 포함한다.

도 19의 자체식 실사 토킹 헤드 생성 시스템(120)은 일반적으로 원격 서버에 해당하는 서버(142)를 포함하며, 상기 서버(142)는 소프트웨어 믹서(144), 저장 수단(146), 마커(150)를 포함한다. 이 마커(150)들은 앞서 언급한 마커(104, 106, 108, 110, 112)와 실질적으로 동일한 것이다. 하지만 다른 마커들이 사용될 수도 있다.

도 20의 자체식 실사 토킹 헤드 생성 시스템(130)은 통상적으로 원격 서버에 해당하는 서버(152)를 포함하며, 상기 서버(152)는 소프트웨어 믹서(154), 저장 수단(156), 그리고 가이드(158)를 포함한다.

마커(150)는 가이드(158)에 비해 일반적으로 선호된다. 왜냐하면, 마커(104, 106, 108, 110, 112) 및 그외 다른 적절한 마커들이 셀 폰, 소형 무선 장치, 또는 핸드헬드 장치같은 소형의 장치 상에서 가이드(158)나 가이드(20)보다는 정렬에 이용하기 용이하고, 대상자로부터 구별하기 쉬우며, 보기에도 편하기 때문이다.

가이드(158)는 가이드(20)와 실질적으로 동일하다. 도 5에 도시되는 복합 출력 이미지(38)를 이용하여 대상자를 정렬시키기 위해 가이드(158)나 가이드(20)를 정렬 템플릿으로 이용할 경우, 셀 폰이나 그외 다른 소형 무선 장치 또는 핸드헬드장치같은 소형의 장치에서 이용이 불편하다. 그러나, 복합 이미지의 특징들을 용이하게 구별할 수 있을만큼 충분히 큰 디스플레이를 가진 대형 디스플레이, 모니터를 가진 컴퓨터나 랩탑 컴퓨터의 경우와 같이 대형 장치에 있어서는 충분히 이용할 수 있다. 마커(104, 106, 108, 110, 112)를 이용할 경우, 가이드(20) 이용시보다 정렬 과정 중 눈 피로를 감소시킬 수 있을 것으로 예상된다.

대상자(160)의 이미지가 도 19의 실시예에 따른 셀 폰(132)의 비디오 카메라(134)에 의해 수집된다. 서버(142)의 소프트웨어 믹서(144)는 대상자(160)의 수집된 이미지와 디스플레이(136) 상에 디스플레이되는 마커(150)들과의 복합 이미지를 생성한다. 대상자(160)는 자신의 핵심적인 얼굴 특징(가령, 양 눈, 코끝, 입의 양 가장자리, 등)을 마커(150)와 정렬시키고, 저장 수단(146)이 선택 이미지들을 저장하는 데 사용될 수 있다.

또는, 도 20의 자체식 실사 토킹 헤드 생성 시스템(130) 내 셀 폰(132)의 비디오 카메라(134)에 의해 대상자(160)의 이미지가 수집될 수 있다. 서버(152)의 소프트웨어 믹서(154)는 대상자(160)의 수집 이미지와 디스플레이(136) 상에 디스플레이되는 가이드(158) 간의 복합 이미지를 생성하며, 대상자(16)는 이미지들을 정렬시키고, 저장 수단(156)은 선택 이미지들을 저장하는 데 사용될 수 있다.

비디오 카메라(134)는 고화질 디지털 비디오 카메라인 것이 바람직하다. 디지털 정지화상 카메라에 비교할 때 품질 및 해상도 측면에서 필적가능한 디지털 비디오 프레임 정지화상을 생성할 수 있는 고화질 디지털 비디오 카메라인 것이 바람직하다. 하지만 다른 적절한 카메라나 전자 이미지 수집 장치가 사용될 수도 있다.

저장 수단(146, 156)은 광학식 저장 매체일 수도 있고 자기식 저장 매체일 수도 있다. 그러나 다른 적절한 수단이 사용될 수도 있다.

마커(150), 가이드(158), 소프트웨어 믹서(154)가 컴퓨터 프로그램일 수 있다. 즉, 서버(142)나 서버(152)에서 로딩/저장되는 컴퓨터 프로그램일 수 있다. 하지만 그외 다른 적절한 마커, 가이드, 믹서가 사용될 수도 있다.

도 19의 자체식 실사 토킹 헤드 생성 시스템(120)은 다음과 같은 실사 토킹 헤드 구성 장치로 설명될 수 있다.

즉, 실사 토킹 헤드 구성 장치는 핸드헬드 장치, 네트워크, 서버, 정렬 템플릿들의 라이브러리, 컨트롤러, 비디오 카메라, 디스플레이, 저장 수단을 포함하고,

상기 핸드헬드 장치와 서버는 네트워크를 통해 서로 통신하고,

상기 서버에 구성되는 상기 정렬 템플릿들의 라이브러리에서, 각각의 정렬 템플릿은 서로 다른 것으로서, 헤드 틸트, 헤드 노드, 헤드 스위벨 컴포넌트를 포함하는 특정 헤드 각도에 대해 대상자의 얼굴 특징에 관련된 복수의 마커를 포함하며, 각각의 정렬 템플릿 헤드 각도는 서로 다르며,

상기 서버에 구성되는 상기 컨트롤러는 특정 정렬 템플릿 헤드 각도에 대응하는 정렬 템플릿의 라이브러리로부터 정렬 템플릿을 선택하고, 정렬 템플릿을 나타내는 이미지 출력 신호를 가지며,

상기 핸드헬드 장치에 구성되는 상기 비디오 카메라는 대상자 헤드 각도를 구비한 대상자의 이미지를 수집하고, 상기 대상자 헤드 각도는 대상자 헤드 틸트, 대상자 헤드 노드, 대상자 헤드 스위벨 컴포넌트를 포함하며,

상기 비디오 카메라는 대상자의 수집 이미지를 나타내는 출력 신호를 포함하고, 상기 핸드헬드 장치는 대상자의 수집된 이미지를 나타내는 비디오 카메라의 출력 신호를 네트워크를 통해 상기 서버에 전달하며,

상기 서버는 대상자의 수집 이미지를 나타내는 비디오 카메라의 출력 신호를 수신하는 입력을 가지며,

상기 서버는 믹서를 포함하며,

상기 서버는 컨트롤러로부터 선택된 정렬 템플릿 이미지 출력 신호를 수신하여, 선택된 정렬 템플릿 이미지 출력 신호와 대상자의 수신한 수집 이미지 신호를 믹서에 전달하며,

상기 믹서는 정렬 템플릿 이미지 출력 신호와, 전달받은 대상자의 수집 이미지 신호를 수신하여 대상자의 수집 이미지와 선택된 정렬 템플릿 간의 복합 이미지를 나타내는 복합 이미지 신호로 믹싱하여, 복합 이미지 신호를 서버에 전달하고,

상기 서버는 믹서로부터 상기 복합 이미지 신호를 나타내는 출력 신호를 가지며,

상기 서버는 상기 복합 이미지 신호를 나타내는 출력 신호를 네트워크를 통해 핸드헬드 장치에 전달하며,

상기 핸드헬드 장치에 구성된 상기 디스플레이는 상기 복합 이미지 신호를 나타내는 출력 신호를 수신하는 입력을 가지며,

상기 디스플레이와 상기 비디오 카메라는 비디오 카메라로 하여금 대상자의 이미지를 수집하게 하고 대상자가 복합 이미지를 볼 수 있게 하며, 대상자가 대상자의 헤드 이미지를 정렬 템플릿의 마커와 정렬시킬 수 있도록 하고,

상기 저장 수단은 대상자의 수집된 이미지들과 여러가지 대상자 헤드 각도에서의 대상자의 헤드와의 라이브러리를 저장하고,

상기 저장 수단은 상기 서버에 구성되고,

상기 서버는 수신한 대상자의 수집 이미지 신호를 저장 수단에 전달하며,

상기 저장 수단은 대상자의 수집 이미지 신호를 수신하여, 대상자가 대상자의 헤드를 정렬 템플릿의 마커와 정렬시킬 때 수신한 수집 이미지 신호를 대상자의 저장 이미지로 저장하며,

대상자의 저장 이미지에서는 대상자 헤드 각도가 특정 정렬 템플릿 헤드 각도와 실질적으로 동일하고,

수집 이미지들의 라이브러리 내 각각의 저장 이미지는 서로 다르며,

각각의 저장 이미지에서 대상자 헤드 각도는 서로 다르며,

수집 이미지들의 라이브러리 내 각각의 저장 이미지의 대상자 헤드 각도가 정렬 템플릿들의 라이브러리 내 선택된 정렬 템플릿과 실질적으로 동일하고 상기 선택된 정렬 템플릿에 대해 정렬되며,

각각의 저장 이미지는 실사 토킹 헤드의 서로 다른 프레임을 나타낸다.

도 20의 자체식 실사 토킹 헤드 생성 시스템에 따른 실사 토킹 헤드 구성 장치는, 핸드헬드 장치, 네트워크, 서버, 정렬 템플릿들의 라이브러리, 컨트롤러, 비디오 카메라, 디스플레이, 저장 수단을 포함하고,

상기 핸드헬드 장치와 서버는 네트워크를 통해 서로 통신하고,

정렬 템플릿들의 라이브러리는 상기 서버에 구성되며,

각각의 정렬 템플릿은 서로 다른 것으로서, 정렬 템플릿 헤드 각도를 구비한 실사 토킹 헤드의 정렬 템플릿 프레임을 나타내고, 정렬 템플릿 헤드 각도는 템플릿 헤드 틸트, 템플릿 헤드 노드, 그리고 템플릿 헤드 스위벨 컴포넌트를 포함하고며,

각각의 정렬 템플릿 프레임은 서로 다르고,

각각의 정렬 템플릿 헤드 각도는 서로 다르며,

상기 컨트롤러는 상기 서버에 구성되고,

상기 컨트롤러는 특정 정렬 템플릿 헤드 각도에 대응하는 정렬 템플릿들의 라이브러리로부터 정렬 템플릿을 선택하고, 정렬 템플릿을 나타내는 이미지 출력 신호를 가지며,

상기 핸드헬드 장치에 구성되는 비디오 카메라는 대상자 헤드 각도를 가진 헤드를 가지는 대상자의 이미지를 수집하고, 상기 대상자 헤드 각도는 헤드 틸트, 헤드 노드, 헤드 스위벨 컴포넌트를 포함하며,

상기 비디오 카메라는 대상자의 수집된 이미지를 나타내는 출력 신호를 가지고,

상기 핸드헬드 장치는 대상자의 수집된 이미지를 나타내는 비디오 카메라의 출력 신호를 네트워크를 통해 서버에 전달하며,

상기 서버는 대상자의 수집된 이미지를 나타내는 비디오 카메라의 출력 신호를 수신하는 입력을 가지고,

상기 서버는 상기 컨트롤러로부터 선택된 정렬 템플릿 이미지 출력 신호를 수신하여, 선택된 정렬 템플릿 이미지 출력 신호와 수신한 대상자의 수집 이미지 신호를 상기 서버에 구성된 믹서에 전달하며,

상기 믹서는 선택된 정렬 템플릿 이미지 출력 신호와 전달받은 대상자의 수집 이미지 신호를 수신하여, 대상자의 수집 이미지와 선택된 정렬 템플릿 간의 복합 이미지를 나타내는 출력 신호로 믹싱하며, 이어서 상기 복합 이미지 신호를 서버에 전달하고,

상기 서버는 상기 복합 이미지 신호를 나타내는 출력 신호를 가지고,

상기 서버는 상기 복합 이미지 신호를 나타내는 출력 신호를 네트워크를 통해 핸드헬드 장치에 전달하며,

상기 핸드헬드 장치에 구성된 상기 디스플레이는 대상자의 수집 이미지와 선택된 정렬 템플릿의 복합 이미지 신호를 나타내는 출력 신호를 수신하는 입력을 가지며,

상기 디스플레이와 비디오 카메라는 비디오 카메라로 하여금 대상자의 이미지를 수집할 수 있게 하고 대상자가 복합 이미지를 볼 수 있게 하며 대상자가 특정 정렬 템플릿 헤드 각도와 동일한 각도로 자신의 헤드의 이미지를 정렬 템플릿 헤드에 정렬시킬 수 있게 하고,

상기 저장 수단은 여러가지의 대상자 헤드 각도에서의 대상자 헤드와 대상자의 수집된 이미지들의 라이브러리를 저장하고,

상기 저장 수단은 상기 서버에 구성되고,

상기 서버는 대상자의 수신한 수집 이미지 신호를 저장 수단에 전달하며,

대상자의 헤드가 정렬 템플릿 헤드와 일치할 때 저장 수단은 대상자의 저장된 이미지로 대상자의 수신한 수집 이미지 신호를 저장하며,

대상자의 저장된 이미지에서는 대상자의 헤드 각도가 특정 정렬 템플릿 헤드 각도와 실질적으로 동일하며,

저장된 각각의 이미지는 서로 다른 것이고,

저장된 각각의 이미지에서의 대상자 헤드 각도는 서로 다르며,

수집된 이미지들로 구성된 라이브러리 중 저장된 각각의 이미지에서 대상자 헤드 각도는 정렬 템플릿들의 라이브러리에서의 선택된 정렬 템플릿 헤드 각도와 실질적으로 동일하고, 또한 정렬 상태를 유지하며,

저장된 각각의 이미지는 실사 토킹 헤드의 서로 다른 프레임을 나타낸다.

도 21 및 도 22는 서버(142, 152)와 무선으로 통신하는 자체식 실사 토킹 헤드 생성 시스템(120, 130)의 셀 폰(132)을 도시하고 있다. 셀 폰(132)들은 한개 이상의 무선 셀룰러 네트워크 또는 그외 다른 적절한 네트워크 상에 놓일 수 있는 서버(142, 152)와 안테나(170)를 통해 무선으로 통신하는 것이 일반적이다.

도 23 및 도 24는 자체식 실사 토킹 헤드 생성 시스템(120, 130)과 실질적으로 동일한 자체식 실사 토킹 헤드 생성 시스템(172, 174)을 도시하고 있다. 다만, 자체식 실사 토킹 헤드 생성 시스템(172, 174)의 경우 셀룰러 네트워크(176)를 통해 서버(142, 152)와 통신하는 셀 폰(132)이 복수개라는 점에 차이가 있다. 각각의 셀 폰(132)은 안테나(170)를 통해 셀룰러 네트워크(176)와 무선으로 통신한다.

도 25는 자체식 실사 토킹 헤드 생성 시스템(172)과 실질적으로 동일한 자체식 실사 토킹 헤드 생성 시스템(178)을 도시하고 있다. 다만, 자체식 실사 토킹 헤드 생성 시스템(178)의 경우, 비디오 카메라(182)와 디스플레이(184)를 구비한 복수의 PDA(180)가 구성되어 있다는 점에 차이가 있다.

도 26은 자체식 실사 토킹 헤드 생성 시스템(120)과 실질적으로 동일한 자체식 실사 토킹 헤드 생성 시스템(186)을 도시하고 있다. 다만, 자체식 실사 토킹 헤드 생성 시스템(186)의 경우, 서버(190)에 연결된 인터넷(188)에 연결되는 점에 차이가 있다. 서버(190)는 소프트웨어 믹서(144), 마커(150), 저장 수단(146)을 포함하며, 또는, 서버(190)가 소프트웨어 믹서(154), 가이드(158), 저장 수단(156)을 포함할 수도 있다.

도 27 및 도 28은 자체식 실사 토킹 헤드 생성 시스템(172, 174)과 실질적으로 동일한 자체식 실사 토킹 헤드 생성 시스템(192, 194)을 도시하고 있다. 다만, 자체식 실사 토킹 헤드 생성 시스템(192, 194)의 경우, 무선 셀룰러 네트워크(196)와 셀룰러 네트워크 하드웨어(198)를 통해 인터넷(188)에 연결되는 점에 차이가 있다.

도 29는 자체식 실사 토킹 헤드 생성 시스템(192)과 실질적으로 동일한 자체식 실사 토킹 헤드 생성 시스템(210)을 도시하고 있다. 다만, 자체식 실사 토킹 헤드 생성 시스템(210)의 경우, 안테나(170)를 통해 무선 셀룰러 네트워크(196)에 무선으로 연결된다는 점에 차이가 있다. 무선 셀룰러 네트워크(196)와 구형 전화 시시스템(POTS: plain old telephone system)(214) 각각이 인터넷(188)에 연결되고, 인터넷(188)이 서버(142)에 연결된다. 휴대형 무선 장치(216)가 사용될 수 있는데, 그 예로는 셀 폰, PDA, 핸드헬드 무선 장치, 또는 그외 다른 적절한 휴대형 무선 장치, 또는, 랩탑 컴퓨터, PC, 등등이 있다.

도 30은 자체식 실사 토킹 헤드 생성 시스템(172)와 실질적으로 동일한 자체식 실사 토킹 헤드 생성 시스템(218)을 도시하고 있다. 다만, 자체식 실사 토킹 헤드 생성 시스템(218)의 경우, 인터넷(188)과 무선 셀룰러 네트워크(196)에 연결되고, 인터넷(188)과 무선 셀룰러 네트워크(196)가 서버(142)에 연결되는 점에 차이가 있다.

도 31은 도 19-30에 도시된 자체식 실사 토킹 헤드 생성 시스템들 중 한가지 이상을 이용하여 실사 토킹 헤드를 구성하는 방법(220)을 단계별로 제시한다. 이 방법은 네트워크를 통해 서버에 무선 장치를 무선으로 연결하는 단계(단계 222)와, 정렬된 대상자의 이미지를 서버로 전달하는 단계(226)와, 정렬된 대상의 이미지를 서버에 저장하는 단계(단계 238)와, 이미지를 다시 대상자에게 전달하는 단계(단계 240)를 포함한다.

구체적으로 말하자면, 실사 토킹 헤드 구성 방법(220)은 무선 장치를 네트워크를 통해 서버에 무선으로 연결하는 단계(단계 222)와, 대상자의 이미지를 휴대형 무선 장치(가령, 셀폰 비디오 카메라, PDA 비디오 카메라, 등)로 수집하는 단계(단계 224)와, 수집된 이미지를 서버에 전달하는 단계(단계 226)와, 대상자의 수집된 이미지를 서버에 전달하는 단계(단계 226)와, 대상자의 수집된 이미지를 마커, 또는 템플릿 이미지와 믹싱하는 단계(단계 228)와, 복합 이미지를 휴대형 무선 장치에, 특히, 휴대형 무선 장치의 디스플레이에 전달하는 단계(단계 230)와, 대상자의 이미지를 마커 이미지나 대안의 이미지에 정렬시키는 단계(단계 232)와, 정렬된 대상자의 이미지를 서버에 전달하는 단계(단계 234)와, 정렬된 대상자의 이미지를 서버에 저장하는 단계(단계 238)와, 정렬된 대상자의 이미지를 대상자에게 전달하는 단계(단계 240)를 포함한다.

도 32는 실사 토킹 헤드 구성 방법(220)의 부가적인 단계들을 제시한다. 즉, 정렬에서의 불일치와 관련하여 정렬된 대상자의 이미지를 분석하는 단계(단계 24)와, 오디오, 음성 프람프트, 비디오 프람프트, 등의 프람프트를 이용하여, 좀더 정확한 정렬을 달성하도록 대상자를 돕는 단계(단계 246)를 포함한다.

실사 토킹 헤드 구성 방법(220)은 아래의 부가적인 단계들을 포함할 수 있다. 즉, 단계 240 또는 단계 246 이후에, 얼굴 특징을 캡처하는 단계(단계 248)를 포함할 수 있다. 이는 도 17에 도시된 부가 단계와 실질적으로 동일하며, 이해를 돕기 위해 도 33에서 반복되는 것이다.

실사 토킹 헤드 구성 방법(22)은 도 33에 도시된 부가 단계를 포함할 수 있다. 즉, 얼굴 특징을 캡처하는 단계(단계 248)로서, 입 모양을 캡처하는 단계(단계 250)와 양 눈의 모양을 캡처하는 단계(단계 252)와, 그외 다른 얼굴 특징을 캡처하는 단계(단계 254)를 포함한다.

도 34는 본 발명의 다양한 실시예들과 연계하여 사용될 수 있는, 비디오 카메라(258), 디스플레이(260), 저장 수단(262), 마이크(264), 스피커(268)를 지닌 PDA같은 비디오 캡처 장치(256)의 블록도표다.

도 35는 자체식 실사 토킹 헤드 생성 시스템(270)의 대안의 실시예의 블록도표로서, 비디오 카메라(272), 디스플레이(260), 소프트웨어 믹서(276), 마커(27), 저장 수단(280), 마이크(282), 스피커(284)를 포함한다.

도 35의 자체식 실사 토킹 헤드 생성 시스템(270)은 단일 휴대형 장치에 패키징된 자체식 실사 토킹 헤드 생성 시스템에 필요한 모든 장비를 실질적으로 포함한다.

자체식 실사 토킹 헤드 생성 시스템(270)은 비디오 카메라(272), 디스플레이(260), 소프트웨어 믹서(276), 마커(27) 또는 가이드, 저장 수단(280), 마이크(282), 스피커(284)를 포함하는 PDA이거나 또는 그외 다른 적절한 장치일 수 있다.

대상자의 이미지가 비디오 카메라(272)에 의해 캡처될 수 있다. 소프트웨어 믹서(276)는 대상자의 수집된 이미지와 마커(27), 디스플레이(260)에 디스플레이되는 마커(278) 또는 가이드의 복합 이미지를 생성한다. 이러한 마커나 가이드는 대상자가 자신을 정렬시키는 데 사용될 수 있고, 저장 수단(280)은 도 19-30에 도시된 자체식 실사 토킹 헤드 생성 시스템들에 대해 앞서 설명한 바와 실질적으로 동일하게 선택된 이미지들을 저장한다.

도 36은 자체식 실사 토킹 헤드 생성 시스템(270)과 실질적으로 동일한 자체식 실사 토킹 헤드 생성 시스템(286)의 실시예를 제시한다. 다만, 자체식 실사 토킹 헤드 생성 시스템(286)의 경우 마커 제어 소프트웨어(290)를 포함하고, 상기 마커 제어 소프트웨어는 마커(292)를 개별적으로 제어하거나 마커 라이브러리(294)를 제어하는 데 사용될 수 있다. 자체식 실사 토킹 헤드 생성 시스템(286)이 가이드 제어 소프트웨어를 가질 수도 있으며, 이는 가이드를 개별적으로 제거하거나 가이드 라이브러리를 제어하는 데 사용될 수 있다.

도 36의 자체식 실사 토킹 헤드 생성 시스템(286)은 단일 휴대형 장치에 패키징된 자체식 실사 토킹 헤드 생성 시스템의 모든 장비를 실질적으로 포함한다.

III . 실사 토킹 헤드 콘텐트의 생성 및 브랜드를 실사 토킹 헤드 콘텐트에 통합

도 2-29는 실사 토킹 헤드 콘텐트를 생성 및 브랜드를 실사 토킹 헤드 콘텐트에 통합시키는 시스템 및 방법을 제시하고 있다.

브랜드는 제품, 서비스, 사람, 프로필, 특징, 속성, 또는 그외 다른 실체 등등에 관련된/연결된 관계, 심벌, 선호도, 또는 경험의 집합체로 간주될 수 있다. 브랜드는 오늘날 상회 환경, 문화, 경제의 중요한 부분이 되고 있으며, "개인적인 철학"이나 "문화 악세사리" 등등으로 불리기도 한다.

브랜드는 사람들의 정신세계 속에 생성된 심벌 형태의 구성물일 수 있고, 제품, 개인, 실체, 또는 서비스에 관련된 모든 정보 및 기대사항을 포함할 수 있다.

브랜드는 "개인 철학", 좋아함, 싫어함, 선호도, 인구통계, 관계, 또는, 개인, 기업, 실체의 그외 다른 특성을 브랜드에 연계시키는 속성, 특성, 설명, 프로필과 연계될 수 있다.

브랜드화(branding)는 개인, 기업, 실체에 전달되는 실사 토킹 헤드 콘텐트같은 정보나 콘텐트에 광고를 채택하는 데 사용될 수 있다.

A. 실사 토킹 헤드 콘텐트 생성

본 발명의 실사 토킹 헤드 시스템은 실사 토킹 헤드 라이브러리 생성 장치와, 실사 토킹 헤드 라이브러리 생성 서버 장치와, 실사 토킹 헤드 콘텐트 생성 장치와, 실사 토킹 헤드 콘텐트 생성 서버 장치와, 브랜드 상관 서버 장치와, 콘텐트 분배 서버 장치를 포함한다.

실사 토킹 헤드 라이브러리 생성 장치와 실사 토킹 헤드 라이브러리 생성 서버 장치는 실사 토킹 헤드 서버로 불릴 수 있으며, 실사 토킹 헤드 라이브러리의 생성을 지향한다.

콘텐트 분배 서버 장치는 쇼 서버로 언급될 수 있으며, 브랜드화된 콘텐트를 수신자에게 배포하는 것을 지향한다.

도 37, 38, 40-65는 실사 콘텐트 생성의 여러가지 형태를 제시한다.

도 37은 쇼 콘텐트 생성 및 업로딩을 보여주는 콘텐트 생성 및 업로드 방법(300)의 개략도다. 사용자가 장치 플랫폼을 선택한다(단계 320). 사용자는 자신의 선호 브랜드를 선택하고(단계 320), 콘텐트 생성 방법을 선택하며(단계 400), 실사 토킹 헤드 채팅을 이용하거나(단계 510), 실사 토킹 헤드 블로그를 이용하거나(단계 520), 실사 토킹 헤드 멀티-미디어를 이용하거나(단계 530), 실사 토킹 헤드 폰을 이용하거나(단계 560), 실사 토킹 헤드 보이스메일 애플리케이션을 이용하여(단계 570), 실사 토킹 헤드 쇼를 생성한다. 사용자는 쇼를 수동으로 조정하고(단계 650), 실사 토킹 헤드 채팅 룸 서버(단계 700), 실사 토킹 헤드 블로그 서버(단계 710), 실사 토킹 헤드 구현 소셜-네트워킹 서버(720)같은 적절한 서버에 포스팅한다. 실사 토킹 헤드 폰 또는 보이스 메일 애플리케이션을 이용할 경우, 소프트웨어 프로그램에 의해 조정이 이루어지며(단계 675), 그후 콘텐트가 통신 네트워크 서버(730)나 보이스 메일 서버(740)같은 적절한 서버에 조정없이 전달된다.

도 38은 실사 토킹 헤드 애플리케이션에 사용될 수 있는 선택된 소자 플랫폼들의 개략도로서, 셀폰(325), 인터넷 컴퓨터(330), 전용 애플리케이션 장치(335) 또는 통합 기기(converged device)(340)같은 실사 토킹 헤드 애플리케이션을 위한 장치 플랫폼들을 도시한다. 전용 애플리케이션 장치는 소비자나 기업 장치인지 여부에 관계없이 특정 작업에 사용될 수 있는 임의의 장치다. 전용 애플리케이션 장치의 예로는 서버에 대한 무선 액세스 기능을 갖춘 핸드헬드 품목 추적 장치가 있다. 통합 기기의 예로는 셀룰러 액세스, WiFi/WiMax 타입 액세스, 풀 또는 qwerty 키보드, 이메일 액세스, 멀티미디어 플레이어, 비디오 카메라, 카메라, 또는 그외 다른 적절한 장치들이 있다.

도 39는 발신자 개인 브랜드 배치의 프로세스(단계 350)의 개략도로서, 발신자 개인 브랜드 배치가 도시되고 있다. 파라미터 및 선호도가 초기화되었는 지를 사용자에게 묻는다(단계 355). 파라미터들은 사용자들이 설정하는 개인 브랜드 파라미터들을 의미한다. 선호도는 사용자가 그룹이나 개인에제 제시하는 식별자다. 답이 부정적일 경우, 사용자에게 파라미터 및 선호도를 수정하고 싶은지를 묻는다(단계 360). 단계 355나 단계 360에서의 답변이 긍정적일 경우, 사용자는 파라미터 및 선호도 중 한개 이상을 생성하거나 변경한다(단계 365). 단계 365를 완료하거나 단계 360에 대한 답변이 부정적일 경우, 사용자는 자신과 관련된 특정 이벤트에 대한 선호 브랜드 프로파일을 선택한다(단계 370). 그후 사용자는 변경사항, 생성사항, 그리고 이벤트 프로파일(370)을 서버에 저장한다.

도 40은 쇼 콘텐트 생성 방법(400)의 개략도다. 사용자는 임의의 장치로 콘텐트를 제작할 수 있고(단계 320), 원격 서버 시스템을 통해 창조적인 보조기기를 이용하여 콘텐트를 제작할 수도 있으며(단계 410), 또는 로컬 컴퓨터 시스템(풀-버전)을 이용하여 콘텐트를 제작할 수도 있다(단계 420).

도 41은 채팅, 블록, 또는 멀티미디어 애플리케이션용 실사 토킹 헤드 콘텐트 생성 방법(500)의 개략도다. 사용자가 실사 토킹 헤드 애플리케이션 중 하나(502, 504, 506)를 선택하여 시작한 후(단계 450), 사용자는 자신의 개인 실사 토킹 헤드 또는 그외 다른 캐릭터를 자신의 아바타로 선택하고(단계 510), 음성 오디오 파일을 레코딩하며(단계 520), 부가적으로, 애니메이션화된 거동을 할당한다(단계 530). 이러한 거동은 스크립팅된 저장 모션이며 실사 토킹 헤드 라이브러리와 연계되어 있다. 그리고 배경 이미지를 부가적으로 할당하게 되고(단계 535), 텍스트나 이미지를 할당하게 되며(단계 540), 슬라이드쇼나 사운드트랙 음악을 또한 할당할 수 있다(단계 545).

도 42는 전화 또는 보이스메일 애플리케이션용 실사 토킹 헤드 콘텐트 생성 방법(550)의 개략도다. 사용자는 아바타로 이용할 실사 토킹 헤드 라이브러리를 선택하고(단계 552), 전화 통화를 개시한다(단계 554). 전화 통화가 이루어지면 수신자가 전화 통화에 답하는 지에 따라 분리된 절차가 이루어진다(단계 556). 수신자가 전화를 받으면 전화 애플리케이션이 시작되고, 전화를 받지 않으면 보이스메일 애플리케이션이 시작된다.

도 43은 실사 토킹 헤드 전화 애플리케이션(560)의 개략도다. 사용자가 말하고(단계 561), 사용자 음성 데이터가 음성 데이터로 서버에게 전달된다(단계 562). 애플리케이션은 실사 토킹 헤드 및 음성 데이터를 동기화하여(단계 563), 쇼에 대한 임의의 조정을 행하게 되고(단계 564), 선호도 및 파라미터에 기초한 광고를 삽입하고(단계 565), 모든 데이터를 수신자에게 전송한다(단계 567). 통화가 종료(단계 567)될 때까지 이 루프 내에서 전화 통화가 계속된다.

도 44는 실사 토킹 헤드 보이스메일 애플리케이션(570)의 개략도다. 사용자가 말하고(단계 571), 사용자 음성 데이터가 음성 데이터로 서버에게 전송된다(단계 573). 애플리케이션은 실사 토킹 헤드와 음성 데이터를 동기화시키고(단계 575), 실사 토킹 헤드 음성 데이터가 서버에 저장되어(단계 577), 차후 수신자가 확인할 수 있게 하고 전화 통화가 종료된다(단계 579).

도 45는 립싱크 데이터를 임베딩하기 위한 방법(단계 520)의 개략도다. 음성 오디오가 레코딩된 후, 사용자는 오디오 파일을 인터넷 연결을 통해 제작 서버에 전송한다(단계 522). 제작 서버 상의 음성 분석 및 립싱크 애플리케이션은 오디오 파일을 분석하고 음소 타이밍 정보를 오디오 파일에 임베딩한다(단계 524). 립싱크에 의해 개선된 오디오 파일은 그후 제작 서버 자산 라이브러리에 저장되고(단계 526), 다시 인터넷을 통해 사용자에게 전송된다(단계 528). 사용자는 임베딩된 음소 타이밍 정보로 립싱크된 실사 토킹 헤드 애니메이션을 구동할 수 있다(단계 529).

도 46은 사용자의 파라미터 및 선호도와 수신자의 파라미터 및 선호도에 관련된 단어들을 일치시킴으로써 브랜드를 삽입하는 방법(800)의 개략도로서, 광고나 개인 브랜드 등의 브랜드를 삽입하는 과정을 묘사하고 있다. 사용자의 음성 채널 신호가 스피치 인지 애플리케이션을 이용하여 서버에서 분석된다(단계 810). 스피치-텍스트 결과가 키워드 매칭 알고리즘에 공급된다(단계 812). 애플리케이션은 단어들이 남아있는 지를 판단한다(단계 813). 남아있을 경우, 애플리케이션은 단어가 키워드 데이터베이스 내에 있는 지를 확인한다(단계 814). 남아있지 않을 경우, 단어를 폐기하게 된다(단계 816). 사용자와 수신자 파라미터들은 키워드를 브랜드와 일치시키는 데 사용된다(단계 818). 브랜드 데이터는 수신기 장치 상의 브랜드 큐에 전달된다(단계 820). 브랜드 히스토리가 사용자의 연락 정보 및 대화에 연계되어 있다(단계 824). 수신자가 브랜드 큐를 클릭하여 대화에 문맥상 관련된 브랜드 정보를 볼 수 있다(단계 824). 스피치-텍스트 결과가 더 있을 경우 애플리케이션은 다음 브랜드를 다운로드한다(단계 826).

도 47은 분배형 웹 애플리케이션 네트워크(1400)의 개략도다. 다양한 장치(320), 가령, 셀룰러폰(360), 인터넷 컴퓨터(370), 전용 애플리케이션 장치(380), 그리고 통합 기기(390)가 인터넷이나 다른 네트워크(1402)를 통해 서버 시스템(1405)에 네트워크-연결된다. 서버 시스템(1405)의 예로는 웹 페이지(1430)를 가진 쇼 서버(1410)와, 사용자 자산(1455) 및 웹 애플리케이션(1450)의 가상화 인스턴스를 가진 제작 서버(1460)와, 실사 토킹 헤드 애플리케이션(1475)을 지닌 실사 토킹 헤드 서버(1470)가 있다. 사용자는 웹페이지(1490)에 임베딩된 웹 브라우저(1485)-기반 경량 프론트 엔드 웹 툴 클라이언트(1492)를 이용하여, 제작 서버, 쇼 서버, 실사 토킹 헤드 서버와 인터페이싱한다.

도 48은 또하나의 분배형 웹 애플리케이션 네트워크(1401)의 개략도다. 다양한 장치(320), 가령, 셀룰러폰(360), 인터넷 컴퓨터(370), 전용 애플리케이션 장치(380), 그리고 통합 기기(390)가 인터넷(1402)이나 셀폰 네트워크(3500)를 통해 서버 시스템(1405)에 네트워크-연결된다. 서버 시스템(1405)의 예로는 웹 페이지(1430)를 가진 쇼 서버(1410)와, 사용자 자산(1455) 및 웹 애플리케이션(1450)의 가상화 인스턴스를 가진 제작 서버(1460)와, 실사 토킹 헤드 애플리케이션(1475)을 지닌 실사 토킹 헤드 서버(1470)가 있다. 사용자는 웹페이지(1490)에 임베딩된 웹 브라우저(1485)-기반 경량 프론트 엔드 웹 툴 클라이언트(1492)를 이용하여, 제작 서버, 쇼 서버, 실사 토킹 헤드 서버와 인터페이싱한다.

본 발명의 실사 토킹 헤드 시스템은 실사 토킹 헤드 라이브러리 생성 장치, 실사 토킹 헤드 라이브러리 생성 서버 장치, 실사 토킹 헤드 콘텐트 생성 장치, 실사 토킹 헤드 콘텐트 생성 서버 장치, 브랜드 상관 서버 장치, 그리고 콘텐트 분배 서버 장치를 포함한다.

실사 토킹 헤드 라이브러리 생성 장치와 실사 토킹 헤드 라이브러리 생성 서버 장치는 실사 토킹 헤드 서버로도 불리며, 실사 토킹 헤드 라이브러리의 생성을 지향한다.

실사 토킹 헤드 콘텐트 생성 장치와 실사 토킹 헤드 콘텐트 생성 서버 장치는 제작 서버라고도 불리며, 실사 토킹 헤드 콘텐트의 생성을 지향한다.

콘텐트 분배 서버 장치는 쇼 서버라고도 불리며, 브랜드화된 콘텐트를 수신자에게 배분하는 것을 지향한다.

도 49는 임베딩된 립싱크 시스템 및 방법(1700)의 개략도다. 사용자가 마이크(1740)를 이용하여 자신의 음성을 쇼 생성 툴(1730)로 레코딩한다. 오디오 데이터(1750)가 인터넷(1402)을 통해 제작 서버(1770) 상의 자동화 음성 분석 및 립싱크 애플리케이션(1780)에 전달된다. 오디오 데이터는 스피치 인지 소프트웨어를 이용하여 분석되고, 추출된 음소/시간구간 정보가 오디오 파일의 메타데이터 섹션에서 병합되어, 하나의 멀티 립싱크 매핑 오디오 파일(1785)에 음소/시간구간 데이터, 음소-비짐(viseme) 매핑 표, 그리고 오디오 데이터를 지닌 파일 포맷을 생성하게 된다. 멀티 립싱크 매핑 오디오 파일은 플레이어(1798) 상에서 나타나는 립싱크를 구동하기 위해 사용자 컴퓨터(1795)에 다시 전송되기 전에, 제작 서버 자산 라이브러리(1790)에 저장된다.

도 50은 실사 토킹 헤드 전화(2200)의 개략도다. 발신자 및 수신자로부터의 오디오(2230)가 통신 네트워크의 일부분인 제작 서버(2200) 상에 위치한 음성 분석 및 립싱크 애플리케이션(2260)에 의해 분석된다. 쇼 컴파일러(2310)에 의해 쇼가 컴파일되고, 스피치-텍스트 분석(2340)의 출력이 데이터 채널을 통해 쇼 자산(2350)과 함께 전송되며, 그후, 각 플레이어에서 발신자의 립싱크와 수신자의 실사 토킹 헤드들의 립싱크를 위해 사용된다.

도 51은 모바일 정보 장치에서의 임베딩된 립싱크 시스템 및 방법(1800)의 개략도다. 사용자는 마이크로폰(1810)을 이용하여 쇼 생성 툴(1830)로 음성을 레코딩한다. 오디오 데이터(1850)가 통신 네트워크(1860)를 통해 제작 서버(1870) 상에 위치한 음성 분석 및 립싱크 애플리케이션(1880)에 전달된다. 오디오 데이터가 스피치 인지 소프트웨어로 분석되고, 추출된 음소/시간구간 정보는 오디오 파일의 메타데이터 섹션과 병합되어, 한개의 멀티 립싱크 매핑 오디오 파일(1885)에 음소/시간구간 데이터, 음소-비짐(viseme) 매핑 표와, 오디오 데이터를 지닌 파일 포맷을 생성하게 된다. 멀티 립싱크 매핑 오디오 파일은 플레이어(1894) 상에서 나타나는 쇼를 위란 립동기화를 위해 사용자의 웹브라우저에 다시 전달되기 전에 제작 서버 자산 라이브러리(1890)에 저장된다.

도 52는 스피치-구동 개인 브랜드 배치 시스템(1900)의 개략도다. 발신자가 자신의 장치를 이용하여 일련의 개인 브랜드 파라미터들과 수신자의선호도를 제작 서버(1980) 상의 데이터베이스(2030)에 설정한다. 이러한 정보는 다양한 브랜드 카테고리에서 일반적인 구매 선호도를 나타낸다. 사용자가 음성 전화를 걸 경우, 그 음성이 제작 서버 상에 위치한 음성 분석 및 립싱크 애플리케이션(1990)에 의해 분석된다. 제작 서버는 통신 네트워크의 일부분이거나 호스트 회사의 일부분이다. 스피치-텍스트 분석(2000)의 출력이 키워드(2020) 리스트와 비교되고, 이러한 키워드들은 서버 상의 브랜드 데이터베이스(2050)의 광고와 연계되어 있다. 키워드 리스트의 입력사항과 일치하지 않는 단어들은 버려져서, 브랜드 키워드(2040)들의 리스트를 남기게 된다. 발신자의 개인 브랜드 파라미터들이 그후 키워드와 함께 사용되어, 수신자 장치(2060)로 전송을 위한 특정 브랜드(1970)를 선택할 수 있게 한다. 이 브랜드의 제목이나 태그 라인이 실사 토킹 헤드 플레이어(1960) 아래의 브랜드 큐(1940) 윈도에 디스플레이된다. 브랜드 리스트가 연락 리스트(1950)에 저장되고, 발신자 프로파일에 관련된다. 언제라도 수신자는 광고 큐를 클릭하여 브랜드 리스트를 볼 수 있고 플레이어에 나타날 브랜드를 선택할 수 있다.

도 53은 실사 토킹 헤드 보이스메일(2100)의 개략도다. 장치를 이용하는 사용자가 수신자의 보이스메일에 메시지를 레코딩한다. 메시지는 음성 분석 및 립싱크 애플리케이션(1990)에 의해 분석된다. 이 애플리케이션(1990)은 통신망 또는 내부 통신망, 또는 인터넷의 일부분인 제작 서버(1980) 상에 위치한다. 스피치-텍스트 분석의 출력이 오디오 파일의 메타데이터에 부가되어, 발신자의 실사 토킹 헤드 립싱크에 사용된다. 수신자가 보이스 메일 리스트(2145)에서 메시지를 클릭하면, 플레이어(2120)는 레코딩된 보이스 메시지를 재생하고, 발신자의 실사 토킹 헤드가 애니메이션화되어 메시지 립싱크를 행한다.

도 54는 실사 토킹 헤드 웹 애플리케이션(1500)이라 불리는 장치 플랫폼 및 원격 서버 시스템의 개략도다. 웹 콘텐트 제작자가 콘텐트 생성 프로세스를 통해 웹 콘텐트 제작자를 안내하는, 웹콘텐트 제작자의 컴퓨터(1520)를 통해 인터넷 브라우저 기반 웹 애플리케이션(1510)을 구동시킨다. 웹 콘텐트 제작자는 비디오 레코더(1530)를 이용하여, 단어 "army u.f.o's"를 발음하면서 깜박이고, 눈썹을 치켜뜨며, 다양한 감정을 나타내는 자신의 모습을 어깨 부분부터 윗쪽으로 스크린에 나타나게 레코딩한다. 3차원 사람 캐릭터로부터 렌더링되어 기구성된 가이드들의 라이브러리가 헤드 정렬시 웹 콘텐트 제작자를 돕는데 사용된다. 비디오 데이터가 저장되어 인터넷을 통해 제작 서버(1670)에 전달된다. 제작 서버(1670)에서는 비디오 데이터가 실사 토킹 헤드 콘텐트 생성 시스템(1660)의 비디오 인지 애플리케이션(1690)에 의해 분석된다. 선택된 비짐(viseme)들을 나타내는 개별 비디오 프레임들이 비디오 인지 애플리케이션으로부터 음소 및 타이밍 데이터를 통해 식별되고, 비디오 파일로부터 추출되며, 화소 데이터 비교 알고리즘을 이용하여 서로 정렬되고, 눈, 입, 헤드 등과 같은 위치의 모션 극값을 나타내는 부분들(가령, 입의 가장자리, 양 눈)만을 포함하도록 크라핑(cropping)된다. 결과적인 실사 토킹 헤드 라이브러리 파일(1740)들이 제작 서버 자산 라이브러리(1730)에 저장된다. 웹 콘텐트 제작자(1740)는 자신의 음성 메시지를 오디오 레코더(1540)를 통해 레코딩한다. 오디오 레코더로부터의 오디오 데이터(1590)는 저장되어 인터넷을 통해 제작 서버에 전송되며, 제작 서버에서 스피치 인지 엔진을 이용하여 음성 분석 및 립싱크 애플리케이션(1680)에 의해 오디오 데이터가 분석된다. 결과적인 음소 타이밍은 적절한 립 형태 매핑 정보와 함께 오디오 파일의 메타 섹션으로 복제되며, 제작 서버 자산 라이브러리 내에 립싱크 매핑 오디오 파일(1720)로 저장된다. 웹 콘텐트 제작자는 텍스트 에디터(1550)를 이용하여 텍스트나 제목 그래픽을 쇼에 추가한다. 텍스트 에디터 출력은 텍스트 데이터(1600)로서, 인터넷을 통해 제작 서버에 전달되며, 제작 서버에서는 제작 서버 자산 라이브러리에 텍스트 파일 형태로 저장된다. 제작 서버 자산은 텍스트 파일, 오디오 파일, 립싱크 매핑 오디오 파일, (실사 토킹 헤드 생성 시스템에 의해 생성된) 실사 토킹 헤드 파일, 또는 (그외 다른 캐릭터 생성 시스템(1650)에 의해 생성된) 그외 다른 원본 또는 라이센스형 캐릭터 파일(1610) 등일 수 있다. 쇼 중 사용되는 실사 토킹 헤드나 그외 다른 캐릭터를 프레이밍하도록 설계된 배경 이미지, 영화, 세트, 또는 그외 다른 환경같은 이미지 파일(1620)을 생성하는 데 사용되는 외부 이미지 생성 시스템(1570)도 그 예로 취급될 수 있다. 이러한 제작 서버 자산은 쇼 제작을 위한 순수한 자료로서, 쇼 제작 과정 중 여러 지점에서 액세스될 수 있고, 쇼 컴파일러(1700)에 의해 쇼에 포함될 수 있다. 쇼 스크립트(1790)에 사용되는 자산들을 지정 및 애니메이션화하기 위해 세그먼트 에디터(1640)가 사용된다. 다양한 자산(1770)들이 로컬 자산 라이브러리(1650)로 내보내져서, 장면 및 애니메이션을 규정하기 위한 일련의 명령들 및 스크립팅된 객체 거동들을 이용하여 시간표에 따라 애니메이션화된다.이러한 쇼 정보는 쇼 세그먼트 에디터로부터 쇼 컴파일러로 전달되며, 쇼 컴파일러는 쇼 스크립트를 생성하고, 이를 암호화하여 쇼를 웹 콘텐트 제작자의 웹 페이지에 포함시키게 된다. 완성된 쇼는 쇼 서버(1800)의 쇼 콘텐트 라이브러리(1810)에 저장된다. 쇼 스크립트는 다른 사용자의 장치(1820)에 의해 인터넷을 통해 액세스될 수 있고, 운영체제(1835)에 임베딩되거나 웹 브라우저(1830)를 통해 플레이어(1840)로 볼 수 있다.

도 55는 쇼 세그먼트 에디터 애플리케이션(2400)의 개략도다. 실사 토킹 헤드 라이브러리, 음성 오디오 파일, 배경 이미지, 소품, 등과 같은 쇼 자산(2420)은 쇼 자산 리스트(2430)에 들어가게 된다. 개별 쇼 자산(2450)들은 시간표 에디터(2510)의 트랙 ID 부분으로 드래깅된다. 쇼 자산 거동(2460)은 미리 규정된, 재사용가능한 애니메이션 시퀀스로서, 헤드 모션, 눈 모션, 팔 모션, 몸 모션, 또는 이러한 모션들의 다른 조합들을 포함하고, 쇼 애니메이션을 구성하기 위해 일렬 순서로 시간표를 따라 배치된다. 쇼 자산 성질 "수정" 인터페이스(2490)는 위치, 적층 순서 등과 같은 쇼 자산의 파라미터들을 조정하기 위한 방법과, 특정 거동이나 음성 파일을 미리 보기 위한 방법을 제공한다. 쇼는 그후 로컬 자산 라이브러리(2410) 내에 쇼 세그먼트(2440)의 형태로 저장된다.

도 56은 쇼 컴파일 에디터 애플리케이션(2600)의 개략도다. 쇼 컴파일 에디터(2610) 내로부터, 쇼 익스플로러(2635)가 쇼 세그먼트(2640)를 쇼 컴포저(2660)로 드랙-앤-드롭하는 데 사용되어, 더 길고 완전한 쇼 스크립트(2670)를 생성할 수 있다. 쇼는 프리뷰 플레이어에서 머리 볼 수 있다. 제작자가 쇼의 콘텐트에 만족할 경우, 완성된 쇼 스크립트는 쇼 인크립터(2680)를 이용하여 암호화되어, 플레이어로만 쇼를 볼 수 있게 되고, 또는 영화 제작자(2690)에게 보내져서, 표준 디지털 미디어 플레이어로 보기 위한 영화를 제작하는 데 사용될 수 있다. 쇼는 로컬 자산 라이브러리(2730)에 저장되고, 인터넷(2740)을 통해 ftp 업로드 마술사(2710)로 원격 웹 서버에 업로드될 수 있다. 어드레스 북(2720)이 가용 쇼 서버(2760)에 대한 URL, 로그인 및 패스워드 정보를 저장한다.

도 57은 로컬 자산 라이브러리(2800)의 디렉토리 구조의 개략도다. 로컬 자산 라이브러리는 쇼 스크립트(2810), 그래픽(2820), 사운드(2830), 다운로드받은 자산(2840), 웹페이지 컴포넌트 자산(2850)(가령, 아이콘, 버튼 이미지, 웹페이지 배경 이미지, 등)을 지닌 폴더들을 포함한다. 로컬 자산 라이브러리의 전체 콘텐트가 암호화된 형태로 로컬 자산 라이브러리 내 암호화 자산 라이브러리(2860)에 또한 저장된다.

도 58은 암호화 자산 라이브러리(2860)의 디렉토리 구조의 개략도다. 암호화된 자산 라이브러리는 암호화된 쇼 스크립트(2870), 암호화된 그래픽(2880), 암호화된 사운드(2890), 암호화된 다운로드 자산(2900), 그리고 웹페이지 컴포넌트 자산(2910)들을 지닌 폴더들을 포함한다.

도 59는 로컬 자산 라이브러리의 그래픽 자산 부분(3000)의 디렉토리 구조도다. 그래픽 자산 라이브러리는 실사 토킹 헤드 라이브러리(3010), 그외 다른 토킹 헤드 라이브러리(3020), 배경 이미지(3030), 소품(3040), 세트(3050), 스마트 그래픽(3060), 인트로/아웃트로 그래픽(3070), 그리고 에러 메시지 그래픽(3080)을 지닌 폴더들을 포함한다.

도 60은 로컬 자산 라이브러리(3100)의 사운드 라이브러리 부분(3100)의 디렉토리 구조도다. 사운드 라이브러리는 음성 오디오 파일(3110), 립싱크 타이밍 파일(3120), 컴퓨터에 의해 발생된 음성 모델(3130), MIDI 파일(3140), 그리고 레코딩된 사운드 효과(3150)를 지닌 폴더들을 포함한다.

도 61은 음성 분석 및 립싱크 애플리케이션(900)의 개략도다. 제작자는 적절한 오디오 레코딩 애플리케이션(930)을 이용하여 음성을 레코딩하고 이를 오디오 파일(970)로 저장하며, 대응하는 단어를 적절한 텍스트 에디터(920)에 입력하고, 이를 텍스트 파일(960)로 저장한다. 테긋트는 기존 저장된 텍스트 파일로부터, 또는 새로 타이핑된 스크래치 패드(1000)의 텍스트로부터 텍스트 인터페이스(990)에 들어간다. 그후 텍스트 데이터가 텍스트-스피치 엔진(940)에 전송되며, 이 엔진(940)에서 피치, 음소, 시간구간 데이터(1010)에 대해 분석이 이루어진다. 대응하는 음성 오디오 파일(970)이 시간구간/피치 그래프 인터페이스로 역시 들어간다. 피치/음소/시간구간 값들은 시간표에 따라 이동가능한 노드들의 스트링으로 표현된다. 수직 값들은 피치 변화를, 수평 값들은 음소 간 시간구간 차이를 나타낸다. 음성 파일에 대한 음소 동기화의 정확도는 피치/음소/시간구간 데이터로부터 생성된 컴퓨터-발생 음성과, 사람 음성 파일을 동시에 청취함으로서 테스트될 수 있다. 두 파일의 시각적 비교가 오디오/비주얼 파형 비교기(1040)에서 이루어질 수 있다. 제작자가 컴퓨터 음성 및 사람 음성 간의 동기화에 만족할 경우, 피치 및 시간구간 값들이 출력 스크립트 에디터(1090)로 전달되며, 여기서, 각각의 개별 구문들이 함께 엮여져서 완전한 음성 스크립트(1100)를 형성하게 된다. 음성 스크립트는 그후 개별 구문들로 나누어지며, 이 구문 내 단어들에 기초하여 명칭이 주어지고, 순차적으로 번호가 붙여진다. 컴퓨터 음성 에디터(1070)를 사용하여, 새로운 고유 사운드 컴퓨터 발생 캐릭터 음성을 생성할 수 있다. 이는 가령, 성별, 헤드 크기, 호흡, 단어 속도, 억양 등등의 음성 품질을 제어하는 다양한 파라미터들을 조정함으로써 실현될 수 있다. 새로 생성된 컴퓨터-발생 캐릭터 음성들이 기존 컴퓨터 캐릭터 음성 리스트(1080)에 추가될 수 있다. 피치 윤곽 에디터(1020)를 사용하여, 컴퓨터-발생 캐릭터 음성 대화에 표현 및 음조 변화를 추가하기 위한 개별적 피치 시퀀스를 생성할 수 있다. 이러한 개별적 피치 윤곽이나 기본 윤곽들은 재사용을 위해 기본 윤곽 리스트(1050)에 저장될 수 있다. 음소 리스트(1060)는 참고용으로 청취될 수 있는 단어의 대표적 활용예 및 가용 음소의 샘플들을 지닌다.

도 62는 실사 토킹 헤드 콘텐트 제작 시스템(1200)으로 불리는 로컬 컴퓨터(풀-버전) 시스템의 개략도다. 제작자는 툴 사용자로서, 툴을 이용하여 콘텐트를 생성하고 자신의 음성 메시지를 오디오 레코더(1210)를 통해 레코딩한다. 오디오 레코더로부터의 오디오 파일(1220)이 저장되어 로컬 자산 라이브러리(1310)에 전달된다. 로컬 자산 라이브러리(1310)는 쇼 생성에 사용되며 플레이어에 의해 스크립트에서 호출되는 모든 파일들을 지닌 최종 사용자 또는 제작자의 컴퓨터 상에 위치하는 저장 수단이다. 음성 메시지를 생성할 때 입으로부터 나오는 단어들의 시퀀스를 지닌 제작자의 메시지 스크립트는 텍스트 에디터(1230)에 입력된다. 텍스트 에디터 출력은 로컬 자산 라이브러리에 저장되는 텍스트 파일(1270)이다. 음성 분석 및 립싱크 애플리케이션(1320) 내로부터, 메시지 스크립트 텍스트 파일이 나와서 텍스트-스피치 엔진을 이용하여 분석되어, 기록된 단어들에 대응하는 텍스트-음소 변환 및 관련 시간구간 값의 변환을 행한다. 음소 타이밍 정보는 제작자의 원본 레코딩된 음성 파일에 수동으로 또는 자동으로 동기화되며, 로컬 자산 라이브러리에 립싱크 타이밍 파일(1325)로 저장된다. 로컬 자산 라이브러리는 제작자의 컴퓨터 상에 위치한 파일들을 지니며, 쇼 생성 과정 중 다양한 지점에서 액세스될 수 있다. 로컬 자산들은 가령, 텍스트 파일, 오디오 파일, 립싱크 타이밍 파일, (본 발명의 실사 토킹 헤드 생성 시스템(1240)에 의해 발생된) 실사 토킹 헤드 파일(1280), 또는 (다른 캐릭터 생성 시스템(1250)에 의해 발생된) 그외 다른 원본 또는 라이센스형 캐릭터 파일(1290), 외부적으로 생성된 이미지 자산(1300)(가령, 배경 이미지, 영화, 세트, 또는 쇼 중 사용되는 실사 토킹 헤드나 그외 다른 캐릭터를 프레이밍하도록 설계된 다른 환경) 등등이 있다. 이러한 쇼 자산(1330)들은 쇼 생성을 위한 순수한 자료다.쇼 세그먼트 에디터(1340)를 이용하여, 쇼 세그먼트(1350)를 생성하게 된다. 자산 파일들은 로컬 자산 라이브러리로부터 세그먼트 에디터로 전달되며, 장면 및 애니메이션 구성을 위한 일련의 명령 및 스크립팅된 객체 거동들을 이용하여 애니메이션화된다. 쇼 컴파일 에디터(1370)는 재사용가능한 인트로, 아웃트로, 새로 생성된 고유 세그먼트 등과 같은 쇼 세그먼트를, 더 길고 완전한 쇼 스크립트(1380)로 조합하는 데 사용되는 애플리케이션이다. 완성된 쇼는 로컬 자산 라이브러리에 저장되어, 프리뷰 플레이어(1360)로 볼 수 있다. 프리뷰 플레이어(1360)는 제작자 컴퓨터 상의 세그먼트 에디터 및 쇼 컴파일 에디터에 내장된, 아직 암호화되지 않은 쇼를 디스플레이할 수 있고 스크립트를 판독할 수 있는 버전의 플레이어다. 세그먼트 에디터가 플레이어(1394)를 이용하여 원격 사용자 컴퓨터(1392) 상에서만 볼 수 있도록 쇼 스크립트를 암호화할 수 있다. 이 플레이어(1394)는 쇼 컴파일 에디터에 의해 암호화된 쇼를 판독만 할 수 있는 플레이어다. 제작자는 업로드 마법사(1390)를 이용할 수 있고, 이 마법사(1390)는 지시에 따라 지정된 원격 웹 서버(1340)의 쇼 콘텐트 라이브러리(1330) 상에 쇼 스크립트 및 쇼 자산을 인터넷(1320)을 통해 자동적으로 또는 수동으로 업로드하는 툴이다.

도 63은 음성 분석 및 립싱크 애플리케이션의 그래픽 사용자 인터페이스(3200)의 개략도다. 이 그래픽 사용자 인터페이스는 소스 텍스트 에디터(990), 스크래치 패드(1000), 음소 시퀀스(1010), 피치 윤곽 에디터(1020), 시간구간/피치 에디터(1030), 오디오/비주얼 파형 비교기(1040), 컴퓨터-발생 캐릭터 보이스 리스트(1080), 그리고 음소 샘플 리스트(1060)과 연계하여 사용될 수 있다.

도 64는 제작 세그먼트 에디터 애플리케이션의 그래픽 사용자 인터페이스(3300)의 개략도다. 이 그래픽 사용자 인터페이스는 쇼 자산 리스트(2430), 쇼 자산(2450), 자산 거동(2460), 프리뷰 플레이어(2500), 시간표 에디터(2510), 음성 타이밍 파일 컨버터(3310), 그리고 거동 아이콘 리스트(3320)와 연계하여 사용될 수 있다.

도 65는 쇼 컴파일 에디터 애플리케이션의 그래픽 사용자 인터페이스(3400)의 개략도다. 이 그래픽 사용자 인터페이스는 쇼 프리뷰 플레이어(2650), 쇼 컴포저(2660), 쇼 익스플로러, 그리고 어드레스 북과 연계하여 사용될 수 있다.

B. 실사 헤드 콘텐트에 브랜드 통합

도 37, 39, 43, 46-48, 50, 52, 54, 62는 실사 헤드 콘텐트에 브랜드를 통합하는 것과 관련한 다양한 형태를 제시하고 있다. 이와 관련하여 앞서 설명한 바 있다.

IV . 실사 토킹 헤드 콘텐트 분배

도 37, 43, 47-54, 56, 62는 실사 토킹 헤드 콘텐트를 분해함과 관련한 다양한 형태들을 도시하고 있다. 이와 관련하여 앞서 설명한 바 있다.

V. 실사 토킹 헤드 콘텐트 관찰

도 47-54, 62, 66, 82는 실사 토킹 헤드 콘텐트를 관찰함과 관련한 다양한 형태를 도시하고 있다. 이와 관련하여 앞서 설명한 바 있다.

VI . 추가적인 세부사항

실사 토킹 헤드 생성, 콘텐트 생성, 분배 시스템 및 방법이 아래와 같이 고려될 수 있다.

본 발명의 일 실시예에 따르면, 실사 토킹 헤드 라이브러리를 생성하고, 실사 토킹 헤드 콘텐트를 생성하며, 콘텐트에 브랜드를 삽입하고, 분배형 네트워크 상의 브랜드를 포함하는 콘텐트를 한개 이상의 통신 장치로부터 한개 이상의 다른 통신 장치에게로 배분하는 실사 토킹 헤드 시스템을 포함하는 하드웨어 장치에서 실행되는 방법에 있어서,

상기 실사 토킹 헤드 시스템은 실사 토킹 헤드 라이브러리 생성 장치와, 실사 토킹 헤드 라이브러리 생성 서버 장치와, 실사 토킹 헤드 콘텐트 생성 장치와, 실사 토킹 헤드 콘텐트 생성 서버 장치와, 브랜드 상관 서버 장치와, 콘텐트 분배 서버 장치를 포함하며, 상기 방법은,

a) 실사 토킹 헤드 라이브러리 생성 장치에서 실사 토킹 헤드의 라이브러리를 생성하는 단계와,

b) 실사 토킹 헤드 라이브러리 생성 서버 장치에서 실사 토킹 헤드의 라이브러리를 저장하는 단계와,

c) 실사 토킹 헤드 콘텐트 생성 장치에서 실사 토킹 헤드 콘텐트를 생성하는 단계와,

d) 실사 토킹 헤드 콘텐트 생성 서버 장치에서 실사 토킹 헤드 콘텐트를 저장하는 단계와,

e) 실사 토킹 헤드 콘텐트 생성 장치에서 한개 이상의 프로파일을 생성하는 단계와,

f) 브랜드 상관 서버 장치에서 상기 한개 이상의 프로파일을 실사 토킹 헤드 콘텐트와 서로 상관시키는 단계와,

g) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일과, 상기 한개 이상의 프로파일과 실사 토킹 헤드 콘텐트 간의 상관 관계를 식별하는 식별 정보를 저장하는 단계와,

h) 저장된 실사 토킹 헤드 콘텐트를 상기 한개 이상의 다른 통신 장치로 전달하도록 상기 한개 이상의 통신 장치로부터의 한개 이상의 명령을 실사 토킹 헤드 시스템에서 수신하는 단계와,

i) 실사 토킹 헤드 콘텐트 생성 서버 장치에서 실사 토킹 헤드 콘텐트를 불러들이는 단계와,

j) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일과 상기 식별 정보를 불러들이는 단계와,

k) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 불러들이는 단계와,

l) 실사 토킹 헤드 콘텐트 생성 서버 장치에서, 실사 토킹 헤드 콘텐트 및 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 실사 토킹 헤드 콘텐트에 통합시키는 단계와,

m) 실사 토킹 헤드 콘텐트 분배 서버 장치에서, 실사 토킹 헤드 콘텐트 및 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 포함하는 실사 토킹 헤드 콘텐트를 상기 한개 이상의 다른 통신 장치로 전달하는 단계

를 포함하는 것을 특징으로 한다.

상기 한개 이상의 프로파일이 상기 한개 이상의 통신 장치의 사용자와 상관된 한개 이상의 프로파일을 포함할 수 있고, 또는, 상기 한개 이상의 프로파일이 상기 한개 이상의 다른 통신 장치의 사용자와 상관된 한개 이상의 프로파일을 포함할 수 있다.

상기 한개 이상의 프로파일은 상기 한개 이상의 통신 장치의 사용자와 상관된 한개 이상의 제 1 프로파일과, 상기 한개 이상의 다른 통신 장치의 사용자와 상관된 한개 이상의 제 2 프로파일을 포함할 수 있다.

실사 토킹 헤드 콘텐트 및 상기 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드는 상기 한개 이상의 프로파일에 상관된 한개 이상의 광고를 포함할 수 있다.

실사 토킹 헤드 콘텐트 및 상기 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드는 상기 한개 이상의 제 1 프로파일과 한개 이상의 제 2 프로파일에 상관된 한개 이상의 광고를 포함할 수 있다.

브랜드 상관 서버 장치는 상기 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 포함하는 데이터베이스를 포함할 수 있다.

실사 토킹 헤드 라이브러리 생성 장치에서 실사 토킹 헤드의 라이브러리를 생성하는 단계 a)는,

정렬 템플릿들의 라이브러리로부터 한개의 정렬 템플릿을 컨트롤러에 의해 선택하는 단계로서, 상기 실사 토킹 헤드 라이브러리 생성 장치는 상기 컨트롤러를 포함하고, 각각의 정렬 템플릿은 서로 다른 것으로서 정렬 템플릿 헤드 각도를 가진 실사 토킹 헤드의 정렬 템플릿 프레임을 나타내며, 상기 정렬 템플릿 헤드 각도는 템플릿 헤드 틸트와, 템플릿 헤드 노드와, 템플릿 헤드 스위벨 컴포넌트를 포함하고, 각각의 정렬 템플릿 프레임은 서로 다르고, 각각의 정렬 템플릿 헤드 각도는 서로 다른 것을 특징으로 하는 단계와,

대상자의 이미지를 비디오 카메라로 수집하는 단계로서, 이때, 핸드헬드 장치가 상기 비디오 카메라를 포함하고, 상기 실사 토킹 헤드 라이브러리 생성 장치는 비디오 카메라를 포함하는 핸드헬드 장치를 포함하는 것을 특징으로 하는 단계와,

대상자의 수집된 이미지를 핸드헬드 장치에 의해 믹서에 전달하는 단계로서, 이때, 상기 실사 토킹 헤드 라이브러리 생성 장치가 상기 믹서를 포함하는 것을 특징으로 하는 단계와,

믹서에 의해, 대상자의 수집된 이미지를 믹서 내 선택된 정렬 템플릿의 이미지와 믹싱하여, 대상자와 선택된 정렬 템플릿의 복합 이미지를 생성하는 것을 특징으로 하는 단계와,

믹서로부터 복합 이미지를 핸드헬드 장치에 전달하는 단계로서, 상기 핸드헬드 장치는 대상자에게 디스플레이할 디스플레이 수단을 포함하고, 상기 디스플레이 수단은 대상자가 대상자 헤드의 이미지를 선택된 정렬 템플릿의 이미지와 정렬시키는 것을 돕도록 구성되는 것을 특징으로 하는 단계와,

대상자 헤드 각도를 가진 대상자의 헤드를 정렬시키는 단계로서, 이때, 상기 대상자 헤드 각도는 대상자 헤드 틸트와, 대상자 헤드 노드와, 대상자 헤드 스위벨 컴포넌트를 포함하고, 선택된 정렬 템플릿의 이미지의 각도는 선택된 정렬 템플릿 헤드 각도와 동일한 것을 특징으로 하는 단계와,

정렬된 대상자의 이미지를 핸드헬드 장치에 의해 수집하는 단계와,

핸드헬드 장치에 의해, 정렬된 대상자의 이미지를 실사 토킹 헤드 라이브러리 생성 서버 장치로 전달하는 단계

를 포함하고,

실사 토킹 헤드 라이브러리 생성 서버 장치에서, 실사 토킹 헤드의 라이브러리를 저장하는 단계 b)는,

실사 토킹 헤드 라이브러리 생성 서버 장치에서, 수집된 이미지들의 라이브러리 내 정렬된 대상자의 이미지를 저장하는 단계로서, 이때, 각각의 수집된 이미지는 서로 다른 대상자 헤드 각도를 가지며, 이 각도는 선택된 정렬 템플릿 헤드 각도와 동일하고, 각각의 저장된 이미지는 실사 토킹 헤드의 서로 다른 프레임을 나타내는 것을 특징으로 하는 단계

를 포함한다.

실사 토킹 헤드 콘텐트는 실사 토킹 헤드 콘텐트와, 대상자의 구술 음성에 동기화된 실사 토킹 헤드와, 실사 토킹 헤드와, 실사 토킹 헤드의 일부분과, 대상자의 애니메이션화된 거동을 나타내는 실사 토킹 헤드와,대상자의 이미지의 한개 이상의 프레임과, 대상자의 이미지의 한개 이상의 프레임의 일부분과, 대상자의 이미지들의 복수의 프레임과, 대상자의 이미지의 한개 이상의 프레임의 복수의 부분과, 대상자의 복수의 이미지의 복수의 프레임의 복수의 부분과, 애니메이션화된 실사 토킹 헤드를 나타내는 대상자의 복수의 이미지의 복수의 프레임과, 애니메이션화된 실사 토킹 헤드를 나타내는 실사 토킹 헤드 라이브러리의 복수의 프레임과, 텍스트와, 한개 이상의 이미지와, 복수의 이미지와, 한개 이상의 배경 이미지와, 복수의 배경 이미지와, 한개 이상의 비디오와, 복수의 비디오와, 오디오, 음악, 멀티미디어 콘텐트, 또는 이들 중 한가지 이상의 조합 중에서 선택된다.

실사 토킹 헤드 라이브러리는 복수의 저장된 이미지를 포함하고, 각각의 저장된 이미지는 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내며, 실사 토킹 헤드 라이브러리 생성 장치에서 실사 토킹 헤드의 라이브러리를 생성하는 단계 a)는,

실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 저장된 이미지를 서로 다른 음소와 상관시키는 단계

를 포함하고,

실사 토킹 헤드 라이브러리 생성 서버 장치에서, 실사 토킹 헤드의 라이브러리를 저장하는 단계 b)는,

실사 토킹 헤드 라이브러리 생성 서버 장치에서, 서로 다른 음소에 상관된 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 저장 및 상관된 이미지의 상관 관계를 식별하는 식별 정보를 저장하고, 서로 다른 음소를 저장하는 단계

를 포함하는 것을 특징으로 한다.

실사 토킹 헤드 라이브러리 생성 서버 장치에서, 서로 다른 음소에 상관된 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 저장 및 상관된 이미지의 상관 관계를 식별하는 식별 정보를 저장하는 단계는,

한개 이상의 데이터베이스 내 서로 다른 음소에 상관된 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 상관된 이미지의 상관 관계를 식별하는 식별 정보를 저장하는 단계

를 포함하는 것을 특징으로 한다.

실사 토킹 헤드 콘텐트 생성 장치에서 실사 토킹 헤드 콘텐트를 생성하는 단계 c)는,

실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 한개 이상의 음소를 수신하는 단계와,

실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 한개 이상의 음소와 실질적으로 일치하는 실사 토킹 헤드 콘텐트 생성 장치에 저장된 복수의 서로 다른 음소들 중 한개 이상의 가장 가깝게 일치하는 음소를 결정하는 단계와,

실사 토킹 헤드 콘텐트 생성 장치에서, 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 저장 및 상관된 이미지와, 상기 한개 이상의 가장 가깝게 일치하는 음소에 대응하는 한개 이상의 음소 간의 상관 관계를 식별하는 식별 정보를 불러들이는 단계와,

한개 이상의 가장 가깝게 일치하는 음소에 대응하는 한개 이상의 음소에 대응하는 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 실사 토킹 헤드 콘텐트에 통합하는 단계

를 포함할 수 있다.

실사 토킹 헤드 콘텐트 생성 장치에서, 실사 토킹 헤드 콘텐트를 생성하는 단계 c)는,

실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 두개 이상의 음소를 수신하는 단계와,

실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 두개 이상의 음소와 일치하는 실사 토킹 헤드 콘텐트 생성 장치에 저장된 복수의 음소 중 두개 이상의 가장 가깝게 일치하는 음소를 결정하는 단계와,

실사 토킹 헤드 콘텐트 생성 장치에서, 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임들을 나타내는 복수의 저장된 이미지의 두개 이상의 저장 및 상관된 이미지와, 두개 이상의 가장 가깝게 일치하는 음소에 대응하는 두개 이상의 음소 간의 상관 관계를 식별하는 식별 정보를 불러들이는 단계와,

실사 토킹 헤드 콘텐트 생성 장치에서, 두개 이상의 가장 가깝게 일치하는 음소에 대응하는 두개 이상의 음소에 대응하는 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임들을 실사 토킹 헤드 콘텐트에 통합하는 단계

를 포함할 수 있다.

두개 이상의 음소는 복수의 음소들의 시퀀스를 포함할 수 있다.

실사 토킹 헤드 라이브러리는 복수의 저장된 이미지를 포함하고, 각각의 저장된 이미지는 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내며, 실사 토킹 헤드 라이브러리 생성 장치에서 실사 토킹 헤드의 라이브러리를 생성하는 단계 a)는,

실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 저장된 이미지를, 서로 다른 음소와 상관시키는 단계

를 포함하고,

실사 토킹 헤드 라이브러리 생성 서버 장치에서, 실사 토킹 헤드의 라이브러리를 저장하는 단계 b)는,

실사 토킹 헤드 라이브러리 생성 서버 장치에서, 복수의 서로 다른 음소에 상관된 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 저장 및 상관된 이미지의 상관 관계를 식별하는 식별 정보를 저장하고, 서로 다른 음소를 저장하는 단계

를 포함할 수 있다.

실사 토킹 헤드 콘텐트 생성 장치에서, 실사 토킹 헤드 콘텐트를 생성하는 단계 c)는,

실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 한개 이상의 음소를 수신하는 단계와,

실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 한개 이상의 음소와 일치하는, 실사 토킹 헤드 콘텐트 생성 장치에 저장된 복수의 음소 중 한개 이상의 가장 가깝게 일치하는 음소를 결정하는 단계와,

실사 토킹 헤드 콘텐트 생성 장치에서, 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 저장 및 상관된 이미지와 한개 이상의 가장 가깝게 일치하는 음소에 대응하는 한개 이상의 음소 간의 상관 관계를 식별하는 식별 정보를 불러들이는 단계와,

실사 토킹 헤드 콘텐트 생성 장치에서, 한개 이상의 가장 가깝게 일치하는 음소에 대응하는 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 실사 토킹 헤드 콘텐트에 통합하는 단계

를 포함할 수 있다.

한개 이상의 프로파일은 상기 한개 이상의 통신 장치의 사용자에 상관된 한개 이상의 프로파일을 포함할 수 있다.

한개 이상의 프로파일은 상기 한개 이상의 다른 통신 장치의 사용자에 상관된 한개 이상의 프로파일을 포함할 수 있다.

한개 이상의 프로파일은 상기 한개 이상의 통신 장치의 사용자와 상관된 한개 이상의 제 1 프로파일과, 상기 한개 이상의 다른 통신 장치의 사용자에 상관된 한개 이상의 제 2 프로파일을 포함할 수 있다.

실사 토킹 헤드 콘텐트 및 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드는, 한개 이상의 프로파일에 상관된 한개 이상의 광고를 포함할 수 있다.

실사 토킹 헤드 콘텐트 및 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드는, 한개 이상의 제 1 프로파일과 한개 이상의 제 2 프로파일과 상관된 한개 이상의 광고를 포함할 수 있다.

브랜드 상관 서버 장치는 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 포함하는 한개 이상의 데이터베이스를 포함할 수 있다.

실사 토킹 헤드 콘텐트 생성 장치에서, 실사 토킹 헤드 콘텐트를 생성하는 단계 c)는,

실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 두개 이상의 음소를 수신하는 단계와,

실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 두개 이상의 음소와 일치하는, 실사 토킹 헤드 콘텐트 생성 장치에 저장된 복수의 음소 중 두개 이상의 가장 가깝게 일치하는 음소를 결정하는 단계와,

실사 토킹 헤드 콘텐트 생성 장치에서, 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 두개 이상의 저장 및 상관된 이미지와 두개 이상의 가장 가깝게 일치하는 음소에 대응하는 두개 이상의 음소 간의 상관 관계를 식별하는 식별 정보를 불러들이는 단계와,

실사 토킹 헤드 콘텐트 생성 장치에서, 두개 이상의 가장 가깝게 일치하는 음소에 대응하는 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 실사 토킹 헤드 콘텐트에 통합하는 단계

를 포함할 수 있다.

본 발명이 선호 실시예를 참고하여 설명되었으나, 본 발명의 범위 및 사상이 이러한 선호 실시예로 국한되어서는 안될 것이다.

Claims (26)

  1. 실사 토킹 헤드 라이브러리를 생성하고, 실사 토킹 헤드 콘텐트를 생성하며, 콘텐트에 브랜드를 삽입하고, 분배형 네트워크 상의 브랜드를 포함하는 콘텐트를 한개 이상의 통신 장치로부터 한개 이상의 다른 통신 장치에게로 배분하는 실사 토킹 헤드 시스템을 포함하는 하드웨어 장치에서 실행되는 방법에 있어서,
    상기 실사 토킹 헤드 시스템은 실사 토킹 헤드 라이브러리 생성 장치와, 실사 토킹 헤드 라이브러리 생성 서버 장치와, 실사 토킹 헤드 콘텐트 생성 장치와, 실사 토킹 헤드 콘텐트 생성 서버 장치와, 브랜드 상관 서버 장치와, 콘텐트 분배 서버 장치를 포함하며, 상기 방법은,
    a) 실사 토킹 헤드 라이브러리 생성 장치에서 실사 토킹 헤드의 라이브러리를 생성하는 단계와,
    b) 실사 토킹 헤드 라이브러리 생성 서버 장치에서 실사 토킹 헤드의 라이브러리를 저장하는 단계와,
    c) 실사 토킹 헤드 콘텐트 생성 장치에서 실사 토킹 헤드 콘텐트를 생성하는 단계와,
    d) 실사 토킹 헤드 콘텐트 생성 서버 장치에서 실사 토킹 헤드 콘텐트를 저장하는 단계와,
    e) 실사 토킹 헤드 콘텐트 생성 장치에서 한개 이상의 프로파일을 생성하는 단계와,
    f) 브랜드 상관 서버 장치에서 상기 한개 이상의 프로파일을 실사 토킹 헤드 콘텐트와 서로 상관시키는 단계와,
    g) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일과, 상기 한개 이상의 프로파일과 실사 토킹 헤드 콘텐트 간의 상관 관계를 식별하는 식별 정보를 저장하는 단계와,
    h) 저장된 실사 토킹 헤드 콘텐트를 상기 한개 이상의 다른 통신 장치로 전달하도록 상기 한개 이상의 통신 장치로부터의 한개 이상의 명령을 실사 토킹 헤드 시스템에서 수신하는 단계와,
    i) 실사 토킹 헤드 콘텐트 생성 서버 장치에서 실사 토킹 헤드 콘텐트를 불러들이는 단계와,
    j) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일과 상기 식별 정보를 불러들이는 단계와,
    k) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 불러들이는 단계와,
    l) 실사 토킹 헤드 콘텐트 생성 서버 장치에서, 실사 토킹 헤드 콘텐트 및 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 실사 토킹 헤드 콘텐트에 통합시키는 단계와,
    m) 실사 토킹 헤드 콘텐트 분배 서버 장치에서, 실사 토킹 헤드 콘텐트 및 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 포함하는 실사 토킹 헤드 콘텐트를 상기 한개 이상의 다른 통신 장치로 전달하는 단계
    를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  2. 제 1 항에 있어서, 상기 한개 이상의 프로파일이 상기 한개 이상의 통신 장치의 사용자와 상관된 한개 이상의 프로파일을 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  3. 제 1 항에 있어서, 상기 한개 이상의 프로파일이 상기 한개 이상의 다른 통신 장치의 사용자와 상관된 한개 이상의 프로파일을 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  4. 제 1 항에 있어서, 상기 한개 이상의 프로파일은 상기 한개 이상의 통신 장치의 사용자와 상관된 한개 이상의 제 1 프로파일과, 상기 한개 이상의 다른 통신 장치의 사용자와 상관된 한개 이상의 제 2 프로파일을 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  5. 제 1 항에 있어서, 실사 토킹 헤드 콘텐트 및 상기 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드는 상기 한개 이상의 프로파일에 상관된 한개 이상의 광고를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  6. 제 4 항에 있어서, 실사 토킹 헤드 콘텐트 및 상기 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드는 상기 한개 이상의 제 1 프로파일과 한개 이상의 제 2 프로파일에 상관된 한개 이상의 광고를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  7. 제 1 항에 있어서, 브랜드 상관 서버 장치는 상기 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 포함하는 데이터베이스를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  8. 제 1 항에 있어서, 실사 토킹 헤드 라이브러리 생성 장치에서 실사 토킹 헤드의 라이브러리를 생성하는 단계 a)는,
    정렬 템플릿들의 라이브러리로부터 한개의 정렬 템플릿을 컨트롤러에 의해 선택하는 단계로서, 상기 실사 토킹 헤드 라이브러리 생성 장치는 상기 컨트롤러를 포함하고, 각각의 정렬 템플릿은 서로 다른 것으로서 정렬 템플릿 헤드 각도를 가진 실사 토킹 헤드의 정렬 템플릿 프레임을 나타내며, 상기 정렬 템플릿 헤드 각도는 템플릿 헤드 틸트와, 템플릿 헤드 노드와, 템플릿 헤드 스위벨 컴포넌트를 포함하고, 각각의 정렬 템플릿 프레임은 서로 다르고, 각각의 정렬 템플릿 헤드 각도는 서로 다른 것을 특징으로 하는 단계와,
    대상자의 이미지를 비디오 카메라로 수집하는 단계로서, 이때, 핸드헬드 장치가 상기 비디오 카메라를 포함하고, 상기 실사 토킹 헤드 라이브러리 생성 장치는 비디오 카메라를 포함하는 핸드헬드 장치를 포함하는 것을 특징으로 하는 단계와,
    대상자의 수집된 이미지를 핸드헬드 장치에 의해 믹서에 전달하는 단계로서, 이때, 상기 실사 토킹 헤드 라이브러리 생성 장치가 상기 믹서를 포함하는 것을 특징으로 하는 단계와,
    믹서에 의해, 대상자의 수집된 이미지를 믹서 내 선택된 정렬 템플릿의 이미지와 믹싱하여, 대상자와 선택된 정렬 템플릿의 복합 이미지를 생성하는 것을 특징으로 하는 단계와,
    믹서로부터 복합 이미지를 핸드헬드 장치에 전달하는 단계로서, 상기 핸드헬드 장치는 대상자에게 디스플레이할 디스플레이 수단을 포함하고, 상기 디스플레이 수단은 대상자가 대상자 헤드의 이미지를 선택된 정렬 템플릿의 이미지와 정렬시키는 것을 돕도록 구성되는 것을 특징으로 하는 단계와,
    대상자 헤드 각도를 가진 대상자의 헤드를 정렬시키는 단계로서, 이때, 상기 대상자 헤드 각도는 대상자 헤드 틸트와, 대상자 헤드 노드와, 대상자 헤드 스위벨 컴포넌트를 포함하고, 선택된 정렬 템플릿의 이미지의 각도는 선택된 정렬 템플릿 헤드 각도와 동일한 것을 특징으로 하는 단계와,
    정렬된 대상자의 이미지를 핸드헬드 장치에 의해 수집하는 단계와,
    핸드헬드 장치에 의해, 정렬된 대상자의 이미지를 실사 토킹 헤드 라이브러리 생성 서버 장치로 전달하는 단계
    를 포함하고,
    실사 토킹 헤드 라이브러리 생성 서버 장치에서, 실사 토킹 헤드의 라이브러리를 저장하는 단계 b)는,
    실사 토킹 헤드 라이브러리 생성 서버 장치에서, 수집된 이미지들의 라이브러리 내 정렬된 대상자의 이미지를 저장하는 단계로서, 이때, 각각의 수집된 이미지는 서로 다른 대상자 헤드 각도를 가지며, 이 각도는 선택된 정렬 템플릿 헤드 각도와 동일하고, 각각의 저장된 이미지는 실사 토킹 헤드의 서로 다른 프레임을 나타내는 것을 특징으로 하는 단계
    를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  9. 제 1 항에 있어서, 실사 토킹 헤드 콘텐트는 실사 토킹 헤드 콘텐트와, 대상자의 구술 음성에 동기화된 실사 토킹 헤드와, 실사 토킹 헤드와, 실사 토킹 헤드의 일부분과, 대상자의 애니메이션화된 거동을 나타내는 실사 토킹 헤드와,대상자의 이미지의 한개 이상의 프레임과, 대상자의 이미지의 한개 이상의 프레임의 일부분과, 대상자의 이미지들의 복수의 프레임과, 대상자의 이미지의 한개 이상의 프레임의 복수의 부분과, 대상자의 복수의 이미지의 복수의 프레임의 복수의 부분과, 애니메이션화된 실사 토킹 헤드를 나타내는 대상자의 복수의 이미지의 복수의 프레임과, 애니메이션화된 실사 토킹 헤드를 나타내는 실사 토킹 헤드 라이브러리의 복수의 프레임과, 텍스트와, 한개 이상의 이미지와, 복수의 이미지와, 한개 이상의 배경 이미지와, 복수의 배경 이미지와, 한개 이상의 비디오와, 복수의 비디오와, 오디오, 음악, 멀티미디어 콘텐트, 또는 이들 중 한가지 이상의 조합 중에서 선택되는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  10. 제 1 항에 있어서, 실사 토킹 헤드 라이브러리는 복수의 저장된 이미지를 포함하고, 각각의 저장된 이미지는 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내며, 실사 토킹 헤드 라이브러리 생성 장치에서 실사 토킹 헤드의 라이브러리를 생성하는 단계 a)는,
    실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 저장된 이미지를 서로 다른 음소와 상관시키는 단계
    를 포함하고,
    실사 토킹 헤드 라이브러리 생성 서버 장치에서, 실사 토킹 헤드의 라이브러리를 저장하는 단계 b)는,
    실사 토킹 헤드 라이브러리 생성 서버 장치에서, 서로 다른 음소에 상관된 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 저장 및 상관된 이미지의 상관 관계를 식별하는 식별 정보를 저장하고, 서로 다른 음소를 저장하는 단계
    를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  11. 제 10 항에 있어서, 실사 토킹 헤드 라이브러리 생성 서버 장치에서, 서로 다른 음소에 상관된 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 저장 및 상관된 이미지의 상관 관계를 식별하는 식별 정보를 저장하는 단계는,
    한개 이상의 데이터베이스 내 서로 다른 음소에 상관된 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 상관된 이미지의 상관 관계를 식별하는 식별 정보를 저장하는 단계
    를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  12. 제 10 항에 있어서, 실사 토킹 헤드 콘텐트 생성 장치에서 실사 토킹 헤드 콘텐트를 생성하는 단계 c)는,
    실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 한개 이상의 음소를 수신하는 단계와,
    실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 한개 이상의 음소와 실질적으로 일치하는 실사 토킹 헤드 콘텐트 생성 장치에 저장된 복수의 서로 다른 음소들 중 한개 이상의 가장 가깝게 일치하는 음소를 결정하는 단계와,
    실사 토킹 헤드 콘텐트 생성 장치에서, 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 저장 및 상관된 이미지와, 상기 한개 이상의 가장 가깝게 일치하는 음소에 대응하는 한개 이상의 음소 간의 상관 관계를 식별하는 식별 정보를 불러들이는 단계와,
    한개 이상의 가장 가깝게 일치하는 음소에 대응하는 한개 이상의 음소에 대응하는 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 실사 토킹 헤드 콘텐트에 통합하는 단계
    를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  13. 제 10 항에 있어서, 실사 토킹 헤드 콘텐트 생성 장치에서, 실사 토킹 헤드 콘텐트를 생성하는 단계 c)는,
    실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 두개 이상의 음소를 수신하는 단계와,
    실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 두개 이상의 음소와 일치하는 실사 토킹 헤드 콘텐트 생성 장치에 저장된 복수의 음소 중 두개 이상의 가장 가깝게 일치하는 음소를 결정하는 단계와,
    실사 토킹 헤드 콘텐트 생성 장치에서, 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임들을 나타내는 복수의 저장된 이미지의 두개 이상의 저장 및 상관된 이미지와, 두개 이상의 가장 가깝게 일치하는 음소에 대응하는 두개 이상의 음소 간의 상관 관계를 식별하는 식별 정보를 불러들이는 단계와,
    실사 토킹 헤드 콘텐트 생성 장치에서, 두개 이상의 가장 가깝게 일치하는 음소에 대응하는 두개 이상의 음소에 대응하는 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임들을 실사 토킹 헤드 콘텐트에 통합하는 단계
    를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  14. 제 13 항에 있어서, 두개 이상의 음소는 복수의 음소들의 시퀀스를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  15. 제 8 항에 있어서, 실사 토킹 헤드 라이브러리는 복수의 저장된 이미지를 포함하고, 각각의 저장된 이미지는 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내며, 실사 토킹 헤드 라이브러리 생성 장치에서 실사 토킹 헤드의 라이브러리를 생성하는 단계 a)는,
    실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 저장된 이미지를, 서로 다른 음소와 상관시키는 단계
    를 포함하고,
    실사 토킹 헤드 라이브러리 생성 서버 장치에서, 실사 토킹 헤드의 라이브러리를 저장하는 단계 b)는,
    실사 토킹 헤드 라이브러리 생성 서버 장치에서, 복수의 서로 다른 음소에 상관된 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 저장 및 상관된 이미지의 상관 관계를 식별하는 식별 정보를 저장하고, 서로 다른 음소를 저장하는 단계
    를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  16. 제 15 항에 있어서, 실사 토킹 헤드 콘텐트 생성 장치에서, 실사 토킹 헤드 콘텐트를 생성하는 단계 c)는,
    실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 한개 이상의 음소를 수신하는 단계와,
    실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 한개 이상의 음소와 일치하는, 실사 토킹 헤드 콘텐트 생성 장치에 저장된 복수의 음소 중 한개 이상의 가장 가깝게 일치하는 음소를 결정하는 단계와,
    실사 토킹 헤드 콘텐트 생성 장치에서, 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 각각의 저장 및 상관된 이미지와 한개 이상의 가장 가깝게 일치하는 음소에 대응하는 한개 이상의 음소 간의 상관 관계를 식별하는 식별 정보를 불러들이는 단계와,
    실사 토킹 헤드 콘텐트 생성 장치에서, 한개 이상의 가장 가깝게 일치하는 음소에 대응하는 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 실사 토킹 헤드 콘텐트에 통합하는 단계
    를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  17. 제 16 항에 있어서, 한개 이상의 프로파일은 상기 한개 이상의 통신 장치의 사용자에 상관된 한개 이상의 프로파일을 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  18. 제 16 항에 있어서, 한개 이상의 프로파일은 상기 한개 이상의 다른 통신 장치의 사용자에 상관된 한개 이상의 프로파일을 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  19. 제 16 항에 있어서, 한개 이상의 프로파일은 상기 한개 이상의 통신 장치의 사용자와 상관된 한개 이상의 제 1 프로파일과, 상기 한개 이상의 다른 통신 장치의 사용자에 상관된 한개 이상의 제 2 프로파일을 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  20. 제 16 항에 있어서, 실사 토킹 헤드 콘텐트 및 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드는, 한개 이상의 프로파일에 상관된 한개 이상의 광고를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  21. 제 19 항에 있어서, 실사 토킹 헤드 콘텐트 및 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드는, 한개 이상의 제 1 프로파일과 한개 이상의 제 2 프로파일과 상관된 한개 이상의 광고를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  22. 제 16 항에 있어서, 브랜드 상관 서버 장치는 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 포함하는 한개 이상의 데이터베이스를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  23. 제 15 항에 있어서, 실사 토킹 헤드 콘텐트 생성 장치에서, 실사 토킹 헤드 콘텐트를 생성하는 단계 c)는,
    실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 두개 이상의 음소를 수신하는 단계와,
    실사 토킹 헤드 콘텐트 생성 장치에서, 대상자의 음성을 나타내는 두개 이상의 음소와 일치하는, 실사 토킹 헤드 콘텐트 생성 장치에 저장된 복수의 음소 중 두개 이상의 가장 가깝게 일치하는 음소를 결정하는 단계와,
    실사 토킹 헤드 콘텐트 생성 장치에서, 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 나타내는 두개 이상의 저장 및 상관된 이미지와 두개 이상의 가장 가깝게 일치하는 음소에 대응하는 두개 이상의 음소 간의 상관 관계를 식별하는 식별 정보를 불러들이는 단계와,
    실사 토킹 헤드 콘텐트 생성 장치에서, 두개 이상의 가장 가깝게 일치하는 음소에 대응하는 실사 토킹 헤드의 라이브러리의 대상자 이미지의 서로 다른 프레임을 실사 토킹 헤드 콘텐트에 통합하는 단계
    를 포함하는 것을 특징으로 하는 실사 토킹 헤드 시스템 실행 방법.
  24. 실사 토킹 헤드 라이브러리를 생성하고, 실사 토킹 헤드 콘텐트를 생성하며, 콘텐트에 브랜드를 삽입하고, 분배형 네트워크 상의 브랜드를 포함하는 콘텐트를 한개 이상의 통신 장치로부터 한개 이상의 다른 통신 장치에게로 배분하는 실사 토킹 헤드 시스템을 포함하는 하드웨어 시스템에 있어서,
    상기 실사 토킹 헤드 시스템은 실사 토킹 헤드 라이브러리 생성 장치와, 실사 토킹 헤드 라이브러리 생성 서버 장치와, 실사 토킹 헤드 콘텐트 생성 장치와, 실사 토킹 헤드 콘텐트 생성 서버 장치와, 브랜드 상관 서버 장치와, 콘텐트 분배 서버 장치를 포함하며, 상기 실사 토킹 헤드 시스템은,
    a) 실사 토킹 헤드 라이브러리 생성 장치에서 실사 토킹 헤드의 라이브러리를 생성하는 수단과,
    b) 실사 토킹 헤드 라이브러리 생성 서버 장치에서 실사 토킹 헤드의 라이브러리를 저장하는 수단과,
    c) 실사 토킹 헤드 콘텐트 생성 장치에서 실사 토킹 헤드 콘텐트를 생성하는 수단과,
    d) 실사 토킹 헤드 콘텐트 생성 서버 장치에서 실사 토킹 헤드 콘텐트를 저장하는 수단과,
    e) 실사 토킹 헤드 콘텐트 생성 장치에서 한개 이상의 프로파일을 생성하는 수단과,
    f) 브랜드 상관 서버 장치에서 상기 한개 이상의 프로파일을 실사 토킹 헤드 콘텐트와 서로 상관시키는 수단과,
    g) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일과, 상기 한개 이상의 프로파일과 실사 토킹 헤드 콘텐트 간의 상관 관계를 식별하는 식별 정보를 저장하는 수단과,
    h) 저장된 실사 토킹 헤드 콘텐트를 상기 한개 이상의 다른 통신 장치로 전달하도록 상기 한개 이상의 통신 장치로부터의 명령을 실사 토킹 헤드 시스템에서 수신하는 수단과,
    i) 실사 토킹 헤드 콘텐트 생성 서버 장치에서 실사 토킹 헤드 콘텐트를 불러들이는 수단과,
    j) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일과 상기 식별 정보를 불러들이는 수단과,
    k) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 불러들이는 수단과,
    l) 실사 토킹 헤드 콘텐트 생성 서버 장치에서, 실사 토킹 헤드 콘텐트 및 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 실사 토킹 헤드 콘텐트에 통합시키는 수단과,
    m) 실사 토킹 헤드 콘텐트 분배 서버 장치에서, 실사 토킹 헤드 콘텐트 및 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 포함하는 실사 토킹 헤드 콘텐트를 상기 한개 이상의 다른 통신 장치로 전달하는 수단
    을 포함하는 것을 특징으로 하는 하드웨어 시스템.
  25. 실사 토킹 헤드 라이브러리를 생성하고, 실사 토킹 헤드 콘텐트를 생성하며, 콘텐트에 브랜드를 삽입하고, 분배형 네트워크 상의 브랜드를 포함하는 콘텐트를 한개 이상의 통신 장치로부터 한개 이상의 다른 통신 장치에게로 배분하는 컴퓨터-실행 명령들을 기록한 실사 토킹 헤드 시스템 구현을 위한 컴퓨터-판독형 기록 매체에 있어서,
    상기 실사 토킹 헤드 시스템은 실사 토킹 헤드 라이브러리 생성 장치와, 실사 토킹 헤드 라이브러리 생성 서버 장치와, 실사 토킹 헤드 콘텐트 생성 장치와, 실사 토킹 헤드 콘텐트 생성 서버 장치와, 브랜드 상관 서버 장치와, 콘텐트 분배 서버 장치를 포함하며, 컴퓨터는,
    a) 실사 토킹 헤드 라이브러리 생성 장치에서 실사 토킹 헤드의 라이브러리를 생성하는 단계와,
    b) 실사 토킹 헤드 라이브러리 생성 서버 장치에서 실사 토킹 헤드의 라이브러리를 저장하는 단계와,
    c) 실사 토킹 헤드 콘텐트 생성 장치에서 실사 토킹 헤드 콘텐트를 생성하는 단계와,
    d) 실사 토킹 헤드 콘텐트 생성 서버 장치에서 실사 토킹 헤드 콘텐트를 저장하는 단계와,
    e) 실사 토킹 헤드 콘텐트 생성 장치에서 한개 이상의 프로파일을 생성하는 단계와,
    f) 브랜드 상관 서버 장치에서 상기 한개 이상의 프로파일을 실사 토킹 헤드 콘텐트와 서로 상관시키는 단계와,
    g) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일과, 상기 한개 이상의 프로파일과 실사 토킹 헤드 콘텐트 간의 상관 관계를 식별하는 식별 정보를 저장하는 단계와,
    h) 저장된 실사 토킹 헤드 콘텐트를 상기 한개 이상의 다른 통신 장치로 전달하도록 상기 한개 이상의 통신 장치로부터의 한개 이상의 명령을 실사 토킹 헤드 시스템에서 수신하는 단계와,
    i) 실사 토킹 헤드 콘텐트 생성 서버 장치에서 실사 토킹 헤드 콘텐트를 불러들이는 단계와,
    j) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일과 상기 식별 정보를 불러들이는 단계와,
    k) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 불러들이는 단계와,
    l) 실사 토킹 헤드 콘텐트 생성 서버 장치에서, 실사 토킹 헤드 콘텐트 및 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 실사 토킹 헤드 콘텐트에 통합시키는 단계와,
    m) 실사 토킹 헤드 콘텐트 분배 서버 장치에서, 실사 토킹 헤드 콘텐트 및 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 포함하는 실사 토킹 헤드 콘텐트를 상기 한개 이상의 다른 통신 장치로 전달하는 단계
    를 수행하는 것을 특징으로 하는 컴퓨터-판독형 기록 매체.
  26. 실사 토킹 헤드 라이브러리를 생성하고, 실사 토킹 헤드 콘텐트를 생성하며, 콘텐트에 브랜드를 삽입하고, 분배형 네트워크 상의 브랜드를 포함하는 콘텐트를 한개 이상의 통신 장치로부터 한개 이상의 다른 통신 장치에게로 배분하는 실사 토킹 헤드 시스템을 포함하는 하드웨어 장치에 있어서,
    상기 실사 토킹 헤드 시스템은 실사 토킹 헤드 라이브러리 생성 장치와, 실사 토킹 헤드 라이브러리 생성 서버 장치와, 실사 토킹 헤드 콘텐트 생성 장치와, 실사 토킹 헤드 콘텐트 생성 서버 장치와, 브랜드 상관 서버 장치와, 콘텐트 분배 서버 장치를 포함하며, 상기 방법은,
    a) 실사 토킹 헤드 라이브러리 생성 장치에서 실사 토킹 헤드의 라이브러리를 생성하는 실사 토킹 헤드 라이브러리 크리에이터(creator)와,
    b) 실사 토킹 헤드 라이브러리 생성 서버 장치에서 실사 토킹 헤드의 라이브러리를 저장하는 실사 토킹 헤드 라이브러리 스토러(storer)와,
    c) 실사 토킹 헤드 콘텐트 생성 장치에서 실사 토킹 헤드 콘텐트를 생성하는 실사 토킹 헤드 콘텐트 크리에이터와,
    d) 실사 토킹 헤드 콘텐트 생성 서버 장치에서 실사 토킹 헤드 콘텐트를 저장하는 실사 토킹 헤드 콘텐트 스토러와,
    e) 실사 토킹 헤드 콘텐트 생성 장치에서 한개 이상의 프로파일을 생성하는 실사 토킹 헤드 프로파일 크리에이터와,
    f) 브랜드 상관 서버 장치에서 상기 한개 이상의 프로파일을 실사 토킹 헤드 콘텐트와 서로 상관시키는 상관기(associator)와,
    g) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일과, 상기 한개 이상의 프로파일과 실사 토킹 헤드 콘텐트 간의 상관 관계를 식별하는 식별 정보를 저장하는 브랜드 삽입 스토러와,
    h) 저장된 실사 토킹 헤드 콘텐트를 상기 한개 이상의 다른 통신 장치로 전달하도록 상기 한개 이상의 통신 장치로부터의 한개 이상의 명령을 실사 토킹 헤드 시스템에서 수신하는 수신기와,
    i) 실사 토킹 헤드 콘텐트 생성 서버 장치에서 실사 토킹 헤드 콘텐트를 불러들이는 실사 토킹 헤드 콘텐트 리트리버(retriever)와,
    j) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일과 상기 식별 정보를 불러들이는 브랜드 상관 리트리버(retriever)와,
    k) 브랜드 상관 서버 장치에서, 상기 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 불러들이는 브랜드 리트리버와,
    l) 실사 토킹 헤드 콘텐트 생성 서버 장치에서, 실사 토킹 헤드 콘텐트 및 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 실사 토킹 헤드 콘텐트에 통합시키는 인코퍼레이터(incorporator)와,
    m) 실사 토킹 헤드 콘텐트 분배 서버 장치에서, 실사 토킹 헤드 콘텐트 및 한개 이상의 프로파일에 상관된 한개 이상의 저장된 브랜드를 포함하는 실사 토킹 헤드 콘텐트를 상기 한개 이상의 다른 통신 장치로 전달하는 통신기(communicator)
    를 포함하는 것을 특징으로 하는 하드웨어 장치.


KR1020107022657A 2008-03-09 2009-03-09 실사 토킹 헤드 생성, 콘텐트 생성, 분배 시스템 및 방법 KR20100134022A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US3502208P true 2008-03-09 2008-03-09
US61/035,022 2008-03-09

Publications (1)

Publication Number Publication Date
KR20100134022A true KR20100134022A (ko) 2010-12-22

Family

ID=41065543

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107022657A KR20100134022A (ko) 2008-03-09 2009-03-09 실사 토킹 헤드 생성, 콘텐트 생성, 분배 시스템 및 방법

Country Status (7)

Country Link
EP (1) EP2263212A1 (ko)
JP (1) JP2011519079A (ko)
KR (1) KR20100134022A (ko)
CN (1) CN102037496A (ko)
AU (1) AU2009223616A1 (ko)
CA (1) CA2717555A1 (ko)
WO (1) WO2009114488A1 (ko)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6826540B1 (en) * 1999-12-29 2004-11-30 Virtual Personalities, Inc. Virtual human interface for conducting surveys
ES2239564T3 (es) * 2000-03-01 2005-10-01 Sony International (Europe) Gmbh Gestion de datos de perfiles de usuarios.
US6919892B1 (en) * 2002-08-14 2005-07-19 Avaworks, Incorporated Photo realistic talking head creation system and method
US7027054B1 (en) * 2002-08-14 2006-04-11 Avaworks, Incorporated Do-it-yourself photo realistic talking head creation system and method
JP4008954B2 (ja) * 2004-10-29 2007-11-14 松下電器産業株式会社 情報検索装置
US8421805B2 (en) * 2006-02-09 2013-04-16 Dialogic Corporation Smooth morphing between personal video calling avatars
US7809740B2 (en) * 2006-03-29 2010-10-05 Yahoo! Inc. Model for generating user profiles in a behavioral targeting system

Also Published As

Publication number Publication date
WO2009114488A1 (en) 2009-09-17
CA2717555A1 (en) 2009-09-17
CN102037496A (zh) 2011-04-27
JP2011519079A (ja) 2011-06-30
AU2009223616A1 (en) 2009-09-17
EP2263212A1 (en) 2010-12-22

Similar Documents

Publication Publication Date Title
US9584571B2 (en) System and method for capturing, editing, searching, and delivering multi-media content with local and global time
US8988436B2 (en) Training system and methods for dynamically injecting expression information into an animated facial mesh
US9870636B2 (en) Method for sharing emotions through the creation of three dimensional avatars and their interaction
TWI581128B (zh) 基於媒體反應來控制媒體節目的方法、系統及電腦可讀取儲存記憶體
US8645121B2 (en) Language translation of visual and audio input
EP2891119B1 (en) Mobile video conferencing with digital annotation
US8818175B2 (en) Generation of composited video programming
US9368102B2 (en) Method and system for text-to-speech synthesis with personalized voice
US8341525B1 (en) System and methods for collaborative online multimedia production
US10346001B2 (en) System and method for describing a scene for a piece of media
US20160198125A1 (en) Dynamic facial feature substitution for video conferencing
US20160004911A1 (en) Recognizing salient video events through learning-based multimodal analysis of visual features and audio-based analytics
US9715899B2 (en) Intellimarks universal parallel processes and devices for user controlled presentation customizations of content playback intervals, skips, sequencing, loops, rates, zooms, warpings, distortions, and synchronized fusions
US7974493B2 (en) Personalizing a video
US8791977B2 (en) Method and system for presenting metadata during a videoconference
WO2017157272A1 (zh) 一种信息处理方法及终端
Evers From the past into the future. How technological developments change our ways of data collection, transcription and analysis
Rowe et al. ACM SIGMM retreat report on future directions in multimedia research
US5623587A (en) Method and apparatus for producing an electronic image
US8553037B2 (en) Do-It-Yourself photo realistic talking head creation system and method
JP4310916B2 (ja) 映像表示装置
US8044989B2 (en) Mute function for video applications
CN1200537C (zh) 媒体编辑方法及其装置
US6948131B1 (en) Communication system and method including rich media tools
CN105765990B (zh) 通过分布式网络分布视频内容的方法、系统及计算机介质

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination