KR20100016107A - 인물 기반의 장치 - Google Patents

인물 기반의 장치 Download PDF

Info

Publication number
KR20100016107A
KR20100016107A KR1020097022807A KR20097022807A KR20100016107A KR 20100016107 A KR20100016107 A KR 20100016107A KR 1020097022807 A KR1020097022807 A KR 1020097022807A KR 20097022807 A KR20097022807 A KR 20097022807A KR 20100016107 A KR20100016107 A KR 20100016107A
Authority
KR
South Korea
Prior art keywords
person
prompt
voice
predetermined
voice font
Prior art date
Application number
KR1020097022807A
Other languages
English (en)
Other versions
KR101376954B1 (ko
Inventor
휴 에이. 티간
에릭 엔. 배드저
드류 이. 라인루드
Original Assignee
마이크로소프트 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마이크로소프트 코포레이션 filed Critical 마이크로소프트 코포레이션
Publication of KR20100016107A publication Critical patent/KR20100016107A/ko
Application granted granted Critical
Publication of KR101376954B1 publication Critical patent/KR101376954B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • G10L2021/0135Voice conversion or morphing

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Transfer Between Computers (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Digital Computer Display Output (AREA)

Abstract

인물 기반의 테마가 제공될 수 있다. 애플리케이션 프로그램은 인물에 대응하는 프롬프트를 찾기 위해 인물 리소스 파일을 쿼리할 수 있다. 그 다음, 프롬프트는 음성 합성 엔진에서 수신될 수 있다. 다음에, 음성 합성 엔진은 인물에 대응하는 음성 폰트를 찾기 위해 인물 음성 폰트 데이터베이스를 쿼리할 수 있다. 그 다음, 음성 합성 엔진은 음성 폰트를 프롬프트에 적용할 수 있다. 그 다음, 음성 폰트 적용 프롬프트는 출력 장치에서 생성될 수 있다.
인물 리소스 파일, 프롬프트, 음성 합성 엔진, 음성 폰트, 오디오 콘텐트, 비디오 콘텐트

Description

인물 기반의 장치{PERSONALITY-BASED DEVICE}
본 발명은 인물 기반의 테마를 제공하는 방법과 시스템에 관한 것이다.
모바일 장치는 다양한 활동을 위한 주 컴퓨팅 장치로서 사용될 수 있다. 예를 들어, 모바일 장치는 연락처, 약속 및 작업을 관리하는 핸드헬드 컴퓨터를 포함할 수 있다. 모바일 장치는 통상적으로 이름 및 주소 데이터베이스, 달력, 할 일 목록 및 노트 테이커(note taker)를 포함할 수 있는데, 이들 기능을 개인 정보 관리자(personal information manager) 내에 포함할 수 있다. 무선 모바일 장치는 또한 이메일, 웹 브라우징 및 휴대 전화 서비스(예를 들어, 스마트폰)를 제공할 수 있다. 데이터는 케이블 접속 또는 무선 접속을 통해 모바일 장치와 데스크톱 컴퓨터 사이에서 동기화될 수 있다.
이 요약은 아래의 상세한 설명에서 더욱 설명되는 개념들의 선택된 개념을 단순화된 형태로 소개하기 위해 제공된다. 이 요약은 청구된 주제의 중요한 특징이나 본질적인 특징을 식별하고자 하는 것이 아니다. 또한, 이 요약은 청구된 주제의 범위를 제한하는데 사용하고자 하는 것도 아니다.
인물 기반의 테마가 제공될 수 있다. 애플리케이션 프로그램은 인물에 대응하는 프롬프트를 찾기 위해 인물 리소스 파일을 쿼리할 수 있다. 그 다음, 프롬프트는 음성 합성 엔진에서 수신될 수 있다. 다음에, 음성 합성 엔진은 인물에 대응하는 음성 폰트를 찾기 위해 인물 음성 폰트 데이터베이스를 쿼리할 수 있다. 그 다음, 음성 합성 엔진은 음성 폰트를 프롬프트에 적용할 수 있다. 그 다음, 음성 폰트 적용 프롬프트는 출력 장치에서 생성될 수 있다.
상기 일반적인 설명 및 다음의 상세한 설명은 예를 제공하고, 단지 설명하기 위한 것일 뿐이다. 따라서, 상기 일반적인 설명 및 다음의 상세한 설명은 제한적인 것으로 생각되어서는 안 된다. 더욱이, 여기에서 설명된 것들 이외의 특징 또는 변형이 제공될 수 있다. 예를 들어, 실시예는 상세한 설명에서 설명된 다양한 특징의 조합 및 서브-조합에 관한 것일 수 있다.
이 명세서에 포함되고 그 일부를 구성하는 첨부 도면은 본 발명의 다양한 실시예를 나타낸다.
도 1은 운영 환경의 블록도.
도 2는 다른 운영 환경의 블록도.
도 3은 인물 기반 테마를 제공하는 방법의 순서도.
도 4는 컴퓨팅 장치를 포함하는 시스템의 블록도.
다음의 상세한 설명은 첨부 도면을 참조한다. 가능한 곳이면 어디나, 동일한 참조 번호는 동일하거나 유사한 요소를 나타내기 도면 및 다음 설명에서 사용된 다. 본 발명의 실시예가 설명될 수 있지만, 변경, 개조 및 그외 다른 구현도 가능하다. 예를 들어, 도면에 도시된 요소에 대체, 추가 또는 변경이 행해질 수 있고, 여기에 설명된 방법은 개시된 방법에 대해 단계를 대체, 재순서화 또는 추가함으로써 변경될 수 있다. 따라서, 다음의 상세한 설명은 본 발명을 제한하지 않는다. 그 대신에, 본 발명의 적절한 범위는 첨부된 청구범위에 의해 정의된다.
본 발명의 실시예는 인물 테마 편입을 통해 장치(예를 들어, 모바일 장치 또는 포함된 장치)의 매력을 증가시킬 수 있다. 인물은 개인의 인물일 수 있고, 유명 인사의 인물일 수 있다. 이 인물 테마를 제공하기 위해, 본 발명의 실시예는 합성된 음성, 음악 및 시각적 요소를 사용할 수 있다. 더구나, 본 발명의 실시예는 단일 인물 또는 심지어 다수의 인물을 묘사하는 장치를 제공할 수 있다.
본 발명의 실시예에 따르면, 음성 합성은, 예를 들어 타깃 개인 또는 개인들에 의해 행해진 녹음으로부터 생성된 "음성 폰트(voice font)"의 사용을 통해 타깃 개인(예를 들어, 인물)을 묘사할 수 있다. 이 음성 폰트는 장치가 "말할 때" 장치가 특정 개인과 같은 소리를 낼 수 있게 할 수 있다. 달리 말하면, 음성 폰트는 장치가 사용자 지정 음성을 생성할 수 있게 할 수 있다. 사용자 지정 음성 이외에, 메시지 프롬프트는 타깃 개인의 문법 스타일을 반영하도록 사용자 지정될 수 있다. 게다가, 합성된 음성은 또한 타깃 개인으로부터 녹음된 어구나 메시지에 의해 증가될 수 있다.
더욱이, 음악은 타깃 개인을 묘사하기 위해 장치에 의해 사용될 수 있다. 타깃 개인이 예를 들어, 음악가인 경우에, 타깃 개인에 의한 노래는 예를 들어, 벨 소리, 알림 등을 위해 사용될 수 있다. 타깃 개인에 의한 노래는 또한 미디어 기능을 갖춘 장치를 위해 인물 테마와 함께 포함될 수 있다. 타깃 개인으로서 배우를 묘사하는 장치는 배우가 출연한 영화 또는 TV 쇼로부터의 테마 음악을 사용할 수 있다.
인물 테마 내의 시각적 요소는 예를 들어, 타깃 개인 이미지, 타깃 개인과 관련된 물건, 및 최종 사용자가 타깃 개인 또는 타깃 개인의 작품과 동일시할 수 있는 컬러 테마를 포함할 수 있다. 한 예로는 "숀 알렉산더(Shawn Alexander) 폰"을 위한 풋볼 이미지가 있을 수 있다. 시각적 요소는 모바일 장치 화면의 배경에, 창 테두리에, 일부 아이콘에, 또는 전화기 외관 상에(어쩌면, 이동식 페이스플레이트 상에) 프린트된 이벤트에 나타날 수 있다.
따라서, 본 발명의 실시예는 인물 테마를 전달하는데 사용된 "인물 스킨 패키지"를 제공하기 위해 하나 이상의 인물, 어쩌면 유명 인사("인물 스킨")에 관해 장치를 위한 인물 테마를 사용자 지정할 수 있다. 예를 들어, 본 발명의 실시예는 타깃 개인의 말하는 스타일에 맞추도록 표준 프롬프트를 문법적으로 변경할 수 있다. 더구나, 본 발명의 실시예는 예를 들어, 사용자가 인물 스킨 사이에서 전환할 수 있게 하고, 인물 스킨 패키지를 제거할 수 있게 하며, 또는 새로운 인물 스킨 패키지를 다운로드할 수 있게 하는 "인물 스킨 매니저"를 포함할 수 있다.
"인물 스킨"은 예를 들어, i) 타깃 개인으로부터의 녹음에서 생성된 사용자 지정 음성 폰트; ii) 타깃 개인의 말하는 스타일에 맞추도록 사용자 지정된 음성 프롬프트; iii) 인물-특정 오디오 클립 또는 파일; 및 iv) 인물-특정 이미지 또는 기타 시각적 요소를 포함할 수 있다. 이들 요소(또는 기타 요소)가 단일 패키지 내에 함께 전달되는 경우에, 이들은 인물 스킨 패키지라 칭해질 수 있다.
도 1은 인물 기반의 테마 시스템(100)을 도시한 것이다. 도 1에 도시된 바와 같이, 시스템(100)은 제1 애플리케이션 프로그램(105), 제2 애플리케이션 프로그램(110), 제3 애플리케이션 프로그램(115), 제1 인물 리소스 파일(120), 제1 기본 리소스 파일(125), 제2 인물 리소스 파일(130) 및 제3 기본 리소스 파일(135)을 포함할 수 있다. 게다가, 시스템(100)은 음성 합성 엔진(140), 인물 음성 폰트 데이터베이스(150), 기본 음성 폰트 데이터베이스(155) 및 출력 장치(160)를 포함할 수 있다. 제1 애플리케이션 프로그램(105), 제2 애플리케이션 프로그램(110) 또는 제3 애플리케이션 프로그램(115) 중의 임의의 애플리케이션 프로그램은 전자 메일 및 연락처 애플리케이션, 워드 프로세싱 애플리케이션, 스프레드시트 애플리케이션, 데이터베이스 애플리케이션, 슬라이드 프레젠테이션 애플리케이션, 드로잉 또는 컴퓨터 지원 애플리케이션 프로그램 등 중의 어느 것을 포함할 수 있는데, 이에 제한되는 것은 아니다. 출력 장치(160)는, 예를 들어 도 4와 관련하여 아래에 더욱 상세하게 설명되는 임의의 출력 장치(414)를 포함할 수 있다. 도 4와 관련하여 더욱 상세하게 설명되는 바와 같이, 시스템(100)은 시스템(400)을 사용하여 구현될 수 있다. 더욱이, 아래에 더욱 상세하게 설명되는 바와 같이, 시스템(100)은 도 3과 관련하여 아래에 더욱 상세하게 설명되는 하나 이상의 방법(300)의 단계를 구현하기 위해 사용될 수 있다.
게다가, 시스템(100)은 모바일 장치를 구성하거나, 모바일 장치 내에 달리 구현될 수 있다. 모바일 장치는 이동 전화, 휴대 전화, 무선 전화, 무선 장치, 핸드헬드 퍼스널 컴퓨터, 핸드헬드 컴퓨팅 장치, 멀티 프로세서 시스템, 마이크로 프로세서 기반 또는 프로그램가능 소비자 전자 장치, 개인용 정보 단말기(PDA), 전화기, 페이저(pager), 또는 정보를 수신하고 처리하며 송신하도록 구성된 임의의 다른 장치를 포함할 수 있는데, 이에 제한되는 것은 아니다. 예를 들어, 모바일 장치는 사용자가 전자 장치를 용이하게 휴대할 수 있을 만큼 충분히 작고 무선으로 통신하도록 구성된 전자 장치를 포함할 수 있다. 달리 말하면, 모바일 장치는 노트북 컴퓨터보다 작을 수 있고, 예를 들어, 이동 전화 또는 PDA를 포함할 수 있다.
도 2는 인물 기반 테마 관리 시스템(200)을 도시한 것이다. 도 2에 도시된 바와 같이, 시스템(200)은 제1 애플리케이션 프로그램(105), 제2 애플리케이션 프로그램(110), 인물 매니저(205), 인터페이스(210) 및 레지스트리(215)를 포함할 수 있는데, 이에 제한되는 것은 아니다. 도 4와 관련하여 아래에 더욱 상세하게 설명된 바와 같이, 시스템(200)은 시스템(400)을 사용하여 구현될 수 있다. 도 2의 동작은 아래에 더욱 상세하게 설명될 것이다.
도 3은 인물 기반 테마를 제공하는 본 발명의 실시예에 따른 방법(300)에 관련된 일반적인 단계들을 설명하는 순서도이다. 방법(300)은 도 4와 관련하여 아래에 더욱 상세하게 설명되는 컴퓨팅 장치(400)를 사용하여 구현될 수 있다. 방법(300)의 단계들을 구현하는 방식은 아래에서 더욱 상세하게 설명될 것이다. 방법(300)은 시작 블록(305)에서 시작되어 단계(310)로 진행될 수 있는데, 단계(310)에서는 컴퓨팅 장치(400)가 인물에 대응하는 프롬프트를 찾기 위해 제1 인물 리소 스 파일(120)을 (예를 들어, 사용자 시작 입력에 응답하여 제1 애플리케이션 프로그램(105)에 의해) 쿼리할 수 있다. 예를 들어, 제1 애플리케이션 프로그램(105) 프롬프트는 제1 인물 리소스 파일(120) 내에 저장될 수 있다. 각각의 음성 애플리케이션(예를 들어, 제1 애플리케이션 프로그램(105), 제2 애플리케이션 프로그램(110), 제3 애플리케이션 프로그램(115) 등)은 각각의 인물 스킨에 대한 인물 특정 리소스 파일을 제공할 수 있다. 음성 애플리케이션이, 주어진 인물에 대한 인물 특정 리소스 파일을 제공하지 않는 것을 선택하는 경우, 기본 리소스 파일(예를 들어, 제1 기본 리소스 파일(125), 제3 기본 리소스 파일(135))이 사용될 수 있다. 인물 특정 리소스 파일에는 각각의 인물 스킨 패키지가 갖추어질 수 있다. 설치시에, 인물 스킨 패키지는 각 애플리케이션에 대해 새로운 리소스 파일을 설치할 수 있다.
컴퓨팅 장치(400)가 제1 인물 리소스 파일(120)을 쿼리하는 단계(310)로부터, 방법(300)은 컴퓨팅 장치(400)가 음성 합성 엔진(140)에서 프롬프트를 수신할 수 있는 단계(320)로 진행할 수 있다. 예를 들어, 제1 애플리케이션 프로그램(105), 제2 애플리케이션 프로그램(110) 또는 제3 애플리케이션 프로그램(115)은 음성 서비스(145)를 통해 음성 합성 엔진(140)에 프롬프트를 제공할 수 있다.
일단 컴퓨팅 장치(400)가 음성 합성 엔진(140)에서 프롬프트를 수신하면(단계(320)), 방법(300)은 컴퓨팅 장치(400)(예를 들어, 음성 합성 엔진(140))가 인물에 대응하는 음성 폰트를 찾기 위해 인물 음성 폰트 데이터베이스(150)를 쿼리할 수 있는 단계(330)로 계속될 수 있다. 예를 들어, 음성 폰트는 인물의 음성 녹음 에 기초하여 생성될 수 있다. 게다가, 음성 폰트는 프롬프트가 생성시에 그 인물처럼 소리 나게 하도록 구성될 수 있다. 인물 스킨의 사용자 지정 음성 특징을 구현하기 위해, 음성 합성(또는 텍스트에서 음성으로의) 엔진(140)이 사용될 수 있다. 음성 폰트는 타깃 개인에 의해 행해진 일련의 녹음을 처리함으로써 타깃 개인에 대해 생성될 수 있다. 일단 폰트가 생성되었으면, 폰트는 원하는 타깃 개인처럼 소리 나는 음성을 생성하기 위해 합성 엔진(140)에 의해 사용될 수 있다.
컴퓨팅 장치(400)가 인물 음성 폰트 데이터베이스(150)를 쿼리한 후(단계(330)), 방법(300)은 컴퓨팅 장치(400)(예를 들어, 음성 합성 엔진(140))가 음성 폰트를 프롬프트에 적용할 수 있는 단계(340)로 진행할 수 있다. 예를 들어, 음성 폰트를 프롬프트에 적용하는 것은 인물(예를 들어, 타깃 개인)의 녹음된 어구로 음성 폰트 적용 프롬프트를 증가시키는 단계를 더 포함할 수 있다. 게다가, 프롬프트는 인물(예를 들어, 타깃 개인)의 문법 스타일에 따르도록 변경될 수 있다.
합성된 음성이 음향학적으로 타깃 개인처럼 소리가 날 수 있지만, 대화 또는 알림을 위해 시스템(100)에 의해 사용된 말은 타깃 개인의 말하는 스타일을 정확하게 반영하지 않을 수 있다. 타깃 개인의 말하는 스타일에 더욱 가깝게 일치시키기 위해, 애플리케이션(예를 들어, 제1 애플리케이션 프로그램(105), 제2 애플리케이션 프로그램(110), 제3 애플리케이션 프로그램(115) 등)은 장치 사용자가 타깃 개인이 사용하리라 예상할 수 있는 단어 및 운율 특징을 사용하도록, 음성 출력될 특정 메시지(예를 들어, 프롬프트)를 변경하는 것을 또한 선택할 수 있다. 이들 변경은 (운율 태그를 포함하여) 음성 출력될 어구를 변경함으로써 행해질 수 있다. 각각의 음성 애플리케이션은 각자의 음성으로 된 프롬프트에 대해 이러한 변경을 할 필요가 있을 수 있다.
일단 컴퓨팅 장치(400)가 음성 폰트를 프롬프트에 적용하면(단계(340)), 방법(300)은 컴퓨팅 장치(400)가 음성 폰트 적용 프롬프트를 출력 장치(160)에서 생성할 수 있는 단계(350)로 진행할 수 있다. 예를 들어, 출력 장치(160)는 모바일 장치 내에 배치될 수 있다. 출력 장치(160)는 예를 들어, 도 4와 관련하여 아래에 더욱 상세하게 설명되는 임의의 출력 장치(414)를 포함할 수 있다. 일단 컴퓨팅 장치(400)가 출력 장치(160)에서 음성 폰트 적용 프롬프트를 생성하면(단계(350)), 방법(300)은 단계(360)에서 종료될 수 있다.
인물 스킨 패키지를 지원할 수 있는 시스템은 "인물 스킨 매니저"를 포함할 수 있다. 위에서 설명된 바와 같이, 도 2는 인물 기반 테마 관리 시스템(200)을 도시한 것이다. 인물 기반 테마 관리 시스템(200)은 사용자가 설치된 인물 스킨 패키지를 제거하고, 새로운 인물 스킨 패키지를 구매하여 다운로드하기 위해, 예를 들어 인물 스킨 사이에서 전환할 수 있게 하는 인터페이스(210)를 제공할 수 있다.
제1 애플리케이션(105) 및 제2 애플리케이션(110)은 현재의 음성 폰트에 의존하여 적절한 리소스 파일을 로드할 수 있다. 현재의 음성 폰트는 레지스트리 키를 통해 런 타임 시에 제1 애플리케이션(105) 또는 제2 애플리케이션(110)에 사용 가능하게 될 수 있다. 게다가, 인물 매니저(205)는 현재의 스킨(및 이것에 의해, 현재의 음성 폰트)이 업데이트될 때 제1 애플리케이션(105) 또는 제2 애플리케이션(110)에 통지할 수 있다. 이 통지를 수신하면, 제1 애플리케이션(105) 또는 제2 애플리케이션(110)은 그들의 리소스를 적절하게 다시 로드할 수 있다.
프롬프트의 사용자 지정 이외에, 애플리케이션 설계자는 최종 사용자가 타깃 개인의 말하는 스타일의 음성 명령을 내릴 수 있도록 음성 인식(SR) 문법을 사용자 지정하기를 원할 수 있고, 또는 개인의 이름에 의해 장치를 부르기를 원할 수 있다. 이러한 문법 업데이트는 위에서 설명된 사용자 지정 프롬프트와 유사한 방식으로 리소스 파일 내에 저장되고 전달될 수 있다. 이들 문법 업데이트는 아래에서 설명된 다수의 인물 시나리오에서 특히 중요할 수 있다.
인물 스킨 패키지의 음성 컴포넌트(음성 폰트, 프롬프트 및 어쩌면 문법)의 관리 이외에, 인물 매니저(205)는 사용자가 상이한 인물 스킨으로 전환했을 때, 장치의 모양 및 소리가 그 음성과 함께 업데이트될 수 있도록, 인물 스킨의 비주얼 및 오디오 컴포넌트를 또한 관리할 수 있다. 몇 가지 가능한 동작은 장치상의 배경 이미지의 업데이트 및 기본 벨소리 설정을 포함할 수 있는데, 이에 제한되는 것은 아니다.
본 발명의 실시예에 따라, 인물 개념은 또한 단일 장치가 다수의 인물을 묘사할 수 있도록 확장될 수 있다. 따라서, 한 번에 다수의 인물을 지원하는 것은 추가 RAM, ROM 또는 프로세서 리소스를 필요로 할 수 있다. 다수의 인물은 인물 기반 장치의 개념을 여러 방식으로 확장할 수 있다. 위에서 설명된 바와 같이, 다수의 인물 스킨은 장치상에 저장될 수 있고, 최종 사용자에 의해 런 타임 시에 선택될 수 있고, 또는 생성되거나 사용자 정의된 스케줄에 기초하여 인물 매니저(205)에 의해 자동으로 변경될 수 있다. 이 시나리오에서, 유일한 추가 ROM은 비활성 음성 폰트 데이터베이스 및 애플리케이션 리소스를 저장하기 위해 요구될 수 있다. 이 방법은 또한 개인의 특별한 기분이 기분-특정 인물 스킨을 통해 묘사될 수 있기 때문에 장치가 기분을 변경할 수 있게 하기 위해 사용될 수 있다. 장치 인물에 기분을 적용하는 것은 장치를 더욱 재미있게 할 수 있고, 또한 최종 사용자에게 정보를 전달하기 위해 사용될 수 있다(예를 들어, 인물 스킨 매니저는 장치 배터리가 부족하게 될 때 "졸리는 듯한(sleepy)" 기분으로 전환할 수 있다).
본 발명의 다수의 인물 실시예에 따라, 둘 이상의 인물이 동시에 활성화될 수 있다. 예를 들어, 각 인물은 장치상의 특징 또는 특징 집합과 관련될 수 있다. 그 다음, 최종 사용자는 관련된 인물과 상호작용함으로써 특징(예를 들어 이메일) 또는 특징 집합(예를 들어, 통신)과 상호작용할 수 있다. 이 방법은 또한, 사용자가 자신이 상호작용하기를 원하는 기능과 관련된 인물의 이름에 의해 장치를 부르는 경우에(예를 들어, "숀, 내 배터리 수준은 어때?", "지나, 나의 다음 약속은 뭐야?") 문법을 억제하는 것을 도울 수 있다. 더욱이, 사용자가 장치로부터 통지를 받을 때, 사용된 음성은 메시지가 어떤 기능 영역에 속하는지 사용자에게 나타낼 수 있다. 예를 들어, 사용자는 자신이 음성을 이메일 통지와 관련된 인물에 속하는 것으로 인식하기 때문에 통지가 이메일에 관련된다는 것을 식별할 수 있다. 시스템 아키텍처는 애플리케이션이 장치의 통지를 위해 사용될 음성을 지정할 수 있기 때문에 이러한 상황에서 약간 변경될 수 있다. 인물 매니저(205)는 각 애플리케이션이 사용할 수 있는 음성을 할당할 수 있고, 애플리케이션은 적절한 엔진 인스턴스를 사용하여 말할 필요가 있을 수 있다.
본 발명에 따른 실시예는 인물 기반 테마를 제공하는 시스템을 포함할 수 있다. 시스템은 메모리 저장 장치 및 이 메모리 저장 장치에 결합된 처리 장치를 포함할 수 있다. 처리 장치는 인물에 대응하는 프롬프트를 찾기 위해 인물 리소스 파일을 애플리케이션 프로그램에 의해 조회하고, 음성 합성 엔진에서 프롬프트를 수신하도록 동작할 수 있다. 게다가, 처리 장치는 인물에 대응하는 음성 폰트를 찾기 위해 인물 음성 폰트 데이터베이스를 음성 합성 엔진에 의해 쿼리하도록 동작할 수 있다. 더구나, 처리 장치는 음성 합성 엔진에 의해 음성 폰트를 프롬프트에 적용하고, 음성 폰트 적용 프롬프트를 출력 장치에서 생성하도록 동작할 수 있다.
본 발명에 따른 다른 실시예는 인물 기반 테마를 제공하는 시스템을 포함할 수 있다. 시스템은 메모리 저장 장치 및 이 메모리 저장 장치에 결합된 처리 장치를 포함할 수 있다. 처리 장치는 미리 결정된 인물에 대응하는 최소한 하나의 오디오 콘텐트를 생성하고, 미리 결정된 인물에 대응하는 최소한 하나의 비디오 콘텐트를 생성하도록 동작할 수 있다.
본 발명에 따른 또 다른 실시예는 인물 기반 테마를 제공하는 시스템을 포함할 수 있다. 시스템은 메모리 저장 장치 및 이 메모리 저장 장치에 결합된 처리 장치를 포함할 수 있다. 처리 장치는 인물을 나타내는 사용자 시작 입력을 인물 매니저에서 수신하고, 최소한 하나의 애플리케이션에 인물을 통지하도록 동작할 수 있다. 더구나, 처리 장치는 최소한 하나의 애플리케이션이 인물을 통지받은 것에 응답하여 최소한 하나의 애플리케이션이 인물 리소스 파일을 요청하고, 그 요청에 응답하여 인물 리소스 파일을 수신하도록 동작할 수 있다.
도 4는 컴퓨팅 장치(400)를 포함하는 시스템의 블록도이다. 본 발명의 실시예에 따라, 상기 설명된 메모리 저장 장치 및 처리 장치는 도 4의 컴퓨팅 장치(400)와 같은 컴퓨팅 장치에 구현될 수 있다. 하드웨어, 소프트웨어 또는 펌웨어의 임의의 적합한 조합은 메모리 저장 장치 및 처리 장치를 구현하기 위해 사용될 수 있다. 예를 들어, 메모리 저장 장치 및 처리 장치는 컴퓨팅 장치(400)로 또는 이 컴퓨팅 장치(400)와 결합한 임의의 다른 컴퓨팅 장치(418)로 구현될 수 있다. 상기 설명된 시스템, 장치 및 프로세서는 예이고, 그 밖의 다른 시스템, 장치 및 프로세서가 본 발명의 실시예에 따라 상기 설명된 메모리 저장 장치 및 처리 장치를 포함할 수 있다. 더욱이, 컴퓨팅 장치(400)는 위에서 설명된 시스템(100 및 200)을 위한 운영 환경을 포함할 수 있다. 시스템(100 및 200)은 그 밖의 다른 환경에서 동작할 수 있고, 컴퓨팅 장치(400)에 제한되지 않는다.
도 4와 관련하여, 본 발명의 실시예에 따른 시스템은 컴퓨팅 장치(400)와 같은 컴퓨팅 장치를 포함할 수 있다. 기본 구성에서, 컴퓨팅 장치(400)는 최소한 하나의 처리 장치(402) 및 시스템 메모리(404)를 포함할 수 있다. 컴퓨팅 장치의 구성 및 유형에 의존하여, 시스템 메모리(404)는 휘발성(예를 들어, 랜덤 액세스 메모리(RAM)), 비휘발성(예를 들어, 판독 전용 메모리(ROM)), 플래시 메모리 또는 임의의 조합을 포함할 수 있는데, 이에 제한되는 것은 아니다. 시스템 메모리(404)는 운영 체제(405), 하나 이상의 프로그래밍 모듈(406)을 포함할 수 있고, 제1 인물 리소스 파일(120), 제1 기본 리소스 파일(125), 제2 인물 리소스 파일(130), 제3 기본 리소스 파일(135) 및 인물 음성 폰트 데이터베이스(150)와 같은 프로그램 데이터를 포함할 수 있다. 예를 들어, 운영 체제(405)는 컴퓨팅 장치(400)의 동작 제어에 적합할 수 있다. 한 실시예에서, 프로그래밍 모듈(406)은 제1 애플리케이션 프로그램(105), 제2 애플리케이션 프로그램(110), 제3 애플리케이션 프로그램(115) 및 음성 합성 엔진(140)을 포함할 수 있다. 더욱이, 본 발명의 실시예는 그래픽 라이브러리, 기타 운영 체제 또는 임의의 다른 애플리케이션 프로그램과 함께 실시될 수 있고, 임의의 특정 애플리케이션 또는 시스템에 제한되지 않는다. 이 기본 구성은 점선(408) 내의 컴포넌트들에 의해 도 4에 도시된다.
컴퓨팅 장치(400)는 추가 특징 또는 기능을 가질 수 있다. 예를 들어, 컴퓨팅 장치(400)는 또한, 예를 들어 자기 디스크, 광 디스크 또는 테이프와 같은 추가 데이터 저장 장치(이동식 및/또는 비이동식)를 포함할 수 있다. 이러한 추가 저장 장치는 이동식 저장 장치(409) 및 비이동식 저장 장치(410)로 도 4에 도시된다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 이동식 및 비이동식 매체를 포함할 수 있다. 시스템 메모리(404), 이동식 저장 장치(409) 및 비이동식 저장 장치(410)는 모두 컴퓨터 저장 매체 예(즉, 메모리 저장 장치)이다. 컴퓨터 저장 매체는 RAM, ROM, EEPROM(electrically erasable read-only memory), 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital versatile disks) 또는 기타 광 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치 또는 기타 자기 저장 장치, 또는 정보를 저장하기 위해 사용될 수 있고 컴퓨팅 장치(400)에 의해 액세스될 수 있는 임의의 기타 매체를 포 함할 수 있는데, 이에 제한되는 것은 아니다. 임의의 이러한 컴퓨터 저장 매체는 장치(400)의 일부일 수 있다. 컴퓨팅 장치(400)는 또한, 키보드, 마우스, 펜, 사운드 입력 장치, 터치 입력 장치 등과 같은 입력 장치(들)(412)를 가질 수 있다. 디스플레이, 스피커, 프린터 등과 같은 출력 장치(들)(414)가 또한 포함될 수 있다. 상기 설명된 장치는 예이고, 그외 다른 것이 사용될 수 있다.
컴퓨팅 장치(400)는 이를테면 분산 컴퓨팅 환경에서의 네트워크를 통해, 예를 들어 인트라넷 또는 인터넷을 통해, 장치(400)가 다른 컴퓨팅 장치(418)와 통신할 수 있게 하는 통신 접속(416)을 또한 포함할 수 있다. 통신 접속(416)은 통신 매체의 한 예이다. 통신 매체는 통상적으로 반송파 또는 기타 전송 메카니즘과 같은 피변조 데이터 신호 내의 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터에 의해 구현될 수 있고, 모든 정보 전달 매체를 포함한다. "피변조 데이터 신호"라는 용어는 신호 내에 정보를 인코딩하는 방식으로 그 신호의 특성들 중 하나 이상을 설정 또는 변경시킨 신호를 나타낼 수 있다. 예로서, 통신 매체는 유선 네트워크 또는 직접 배선 접속과 같은 유선 매체, 그리고 음향, RF(radio frequency), 적외선 및 기타 무선 매체와 같은 무선 매체를 포함할 수 있는데, 이에 제한되는 것은 아니다. 여기에서 사용된 컴퓨터 판독가능 매체라는 용어는 저장 매체 및 통신 매체 둘 다를 포함할 수 있다.
상기 설명된 바와 같이, 운영 체제(405)를 포함하여 다수의 프로그램 모듈 및 데이터 파일은 시스템 메모리(404) 내에 저장될 수 있다. 처리 장치(402)에서 실행되는 동안, 프로그래밍 모듈(406)(예를 들어, 제1 애플리케이션 프로그 램(105), 제2 애플리케이션 프로그램(110), 제3 애플리케이션 프로그램(115) 및 음성 합성 엔진(140))은 예를 들어, 위에서 설명된 하나 이상의 방법(300)의 단계들을 포함하는 프로세스를 실행할 수 있다. 상기 설명된 프로세스는 한 예이고, 처리 장치(402)는 그외 다른 프로세스를 실행할 수 있다. 본 발명의 실시예에 따라 사용될 수 있는 기타 프로그래밍 모듈은 전자 메일 및 연락처 애플리케이션, 워드 프로세싱 애플리케이션, 스프레드시트 애플리케이션, 데이터베이스 애플리케이션, 슬라이드 프레젠테이션 애플리케이션, 드로잉 또는 컴퓨터 지원 애플리케이션 프로그램 등을 포함할 수 있다.
일반적으로, 본 발명의 실시예에 따르면, 프로그램 모듈은 특정 작업을 실행할 수 있거나 특정 추상 데이터 유형을 구현할 수 있는 루틴, 프로그램, 컴포넌트, 데이터 구조 및 기타 유형의 구조를 포함할 수 있다. 더구나, 본 발명의 실시예는 핸드헬드 장치, 멀티프로세서 시스템, 마이크로프로세서 기반 또는 프로그램가능 소비자 전자제품, 미니컴퓨터, 메인프레임 컴퓨터 등을 포함하는 기타 컴퓨터 시스템 구성에서 실시될 수 있다. 본 발명의 실시예는 또한 통신 네트워크를 통해 연결되어 있는 원격 처리 장치들에 의해 작업이 실행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치 둘 다에 위치할 수 있다.
더욱이, 본 발명의 실시예는 이산 전자 소자를 포함하는 전기 회로, 논리 게이트를 포함하는 패키지되거나 집적된 전자 칩, 또는 마이크로프로세서를 이용하는 회로 내에서 실시되거나, 전자 소자 또는 마이크로프로세서를 포함하는 단일 칩 상 에서 실시될 수 있다. 본 발명의 실시예는 또한 기계, 광, 유체 및 양자 기술을 포함하여(이에 제한되지 않음), 예를 들어 AND, OR 및 NOT과 같은 논리 연산을 실행할 수 있는 기타 기술을 사용하여 실시될 수 있다. 게다가, 본 발명의 실시예는 범용 컴퓨터 내에서, 또는 임의의 다른 회로 또는 시스템 내에서 실시될 수 있다. 더구나, 본 발명의 실시예는 또한 IM(Instant Messaging), SMS, 캘린더, 미디어 플레이어 및 전화(발신 번호 표시)와 같은 기술과 관련하여 실시될 수 있다.
본 발명의 실시예는 예를 들어, 컴퓨터 프로세스(방법)나 컴퓨팅 시스템으로서 구현될 수 있고, 또는 컴퓨터 프로그램 제품 또는 컴퓨터 판독가능 매체와 같은 제조품으로서 구현될 수 있다. 컴퓨터 프로그램 제품은 컴퓨터 시스템에 의해 판독가능하고, 컴퓨터 프로세스를 실행하는 명령어의 컴퓨터 프로그램을 인코딩한 컴퓨터 저장 매체일 수 있다. 컴퓨터 프로그램 제품은 또한 컴퓨팅 시스템에 의해 판독가능하고, 컴퓨터 프로세스를 실행하는 명령어의 컴퓨터 프로그램을 인코딩한 반송파 상의 전파 신호일 수 있다. 따라서, 본 발명은 하드웨어 및/또는 소프트웨어(펌웨어, 상주 소프트웨어, 마이크로-코드 등을 포함)로 구현될 수 있다. 달리 말하면, 본 발명의 실시예는 명령어 실행 시스템에 의해 또는 이 시스템과 관련하여 사용하기 위한 컴퓨터 사용 가능 또는 컴퓨터 판독가능 프로그램 코드가 매체 내에 구현되어 있는 컴퓨터 사용 가능 또는 컴퓨터 판독가능 저장 매체에 관한 컴퓨터 프로그램 제품의 형태를 취할 수 있다. 컴퓨터 사용 가능 또는 컴퓨터 판독가능 매체는 명령어 실행 시스템, 장비 또는 장치에 의해 또는 이와 관련하여 사용하기 위한 프로그램을 포함하거나, 저장하거나, 통신하거나, 전파하거나, 전송할 수 있는 임의의 매체일 수 있다.
컴퓨터 사용 가능 또는 컴퓨터 판독가능 매체는 예를 들어, 전자, 자기, 광, 전자기, 적외선, 또는 반도체 시스템, 장비, 장치 또는 전파 매체일 수 있는데, 이에 제한되는 것은 아니다. 더욱 구체적인 컴퓨터 판독가능 매체의 예(비한정적 열거)와 관련하여, 컴퓨터 판독가능 매체는 다음을 포함할 수 있다: 하나 이상의 배선을 갖는 전기 접속, 휴대용 컴퓨터 디스켓, 랜덤 액세스 메모리(RAM), 판독 전용 메모리(ROM), 소거가능 프로그램가능 판독 전용 메모리(EPROM 또는 플래시 메모리), 광 섬유, 및 휴대용 콤팩트 디스크 판독 전용 메모리(CD-ROM). 주의할 점은 프로그램이, 예를 들어 종이 또는 기타 매체의 스캐닝을 통해, 전자적으로 캡처된 다음에, 컴파일되거나, 해석되거나, 그 밖에 필요한 경우에 적합한 방식으로 처리되고, 그 다음에 컴퓨터 메모리에 저장될 수 있기 때문에, 컴퓨터 사용 가능 또는 판독가능 매체는 심지어 프로그램이 인쇄되는 종이 또는 다른 적합한 매체일 수 있다는 것이다.
예를 들어, 본 발명의 실시예는 본 발명의 실시예에 따른 방법, 시스템 및 컴퓨터 프로그램 제품의 블록도 및/또는 조작도와 관련하여 위에서 설명된다. 블록에 명시된 기능/동작은 임의의 순서도에 나타낸 순서를 벗어나 행해질 수 있다. 예를 들어, 연속하여 도시된 2개의 블록은 실제로 거의 동시에 실행될 수 있고, 또는 블록들은 관련된 기능/동작에 의존하여, 때때로 역순으로 실행될 수 있다.
본 발명의 소정의 실시예가 설명되었지만, 그외 다른 실시예가 존재할 수 있다. 더욱이, 본 발명의 실시예가 메모리 및 기타 저장 매체에 저장된 데이터와 관 련되는 것으로 설명되었지만, 데이터는 또한, 하드 디스크, 플로피 디스크 또는 CD-ROM과 같은 보조 저장 장치, 인터넷으로부터의 반송파, 또는 그외 다른 형태의 RAM 또는 ROM과 같은 기타 유형의 컴퓨터 판독가능 매체 상에 저장되거나 그러한 매체로부터 판독될 수 있다. 더욱이, 개시된 방법의 단계는 본 발명의 범위를 벗어나지 않고서, 단계의 재순서화 및/또는 단계의 삽입 또는 삭제에 의한 것을 포함하여 모든 방식으로 변경될 수 있다.
여기에 포함된 코드의 저작권을 포함한 모든 권리는 출원인에게 귀속되어 출원인 소유 재산이 된다. 출원인은 여기에 포함된 코드의 모든 권리를 보유하고 소유하며, 부여된 특허의 재생과 관련해서만(그외 다른 용도는 금지) 매체를 재생할 권한을 부여한다.
명세서가 예를 포함하고 있지만, 본 발명의 범위는 다음의 청구범위에 의해 나타내진다. 더욱이, 명세서가 구조적 특징 및/또는 방법적 동작에 특정된 언어로 설명되었지만, 청구범위는 상기 설명된 특징 또는 동작에 제한되지 않는다. 오히려, 상기 설명된 특정의 특징 및 동작은 본 발명의 실시예를 위한 예로서 개시된다.

Claims (20)

  1. 인물 기반의 테마(personality-based theme)를 제공하는 방법에 있어서,
    인물에 대응하는 프롬프트를 찾기 위해 인물 리소스 파일을 애플리케이션 프로그램에 의해 쿼리(query)하는 단계;
    상기 프롬프트를 음성 합성 엔진에서 수신하는 단계;
    상기 인물에 대응하는 음성 폰트(voice font)를 찾기 위해 인물 음성 폰트 데이터베이스를 상기 음성 합성 엔진에 의해 쿼리하는 단계;
    상기 음성 합성 엔진에 의해 상기 음성 폰트를 상기 프롬프트에 적용하는 단계; 및
    상기 음성 폰트가 적용된 프롬프트를 출력 장치에서 생성하는 단계
    를 포함하는 인물 기반 테마 제공 방법.
  2. 제1항에 있어서, 상기 인물에 대응하는 프롬프트를 찾기 위해 인물 리소스 파일을 쿼리하는 단계는 사용자에 의해 미리 결정되는 인물에 대응하는 프롬프트를 찾기 위해 인물 리소스 파일을 쿼리하는 단계를 포함하는 인물 기반 테마 제공 방법.
  3. 제1항에 있어서, 상기 음성 폰트를 찾기 위해 인물 음성 폰트 데이터베이스를 쿼리하는 단계는 상기 인물의 음성 녹음에 기초하여 생성되는 음성 폰트를 찾기 위해 인물 음성 폰트 데이터베이스를 쿼리하는 단계를 포함하는 인물 기반 테마 제공 방법.
  4. 제1항에 있어서, 상기 음성 폰트를 찾기 위해 인물 음성 폰트 데이터베이스를 쿼리하는 단계는 상기 프롬프트가 생성시에 상기 인물처럼 소리 나게 하도록 구성된 음성 폰트를 찾기 위해 인물 음성 폰트 데이터베이스를 쿼리하는 단계를 포함하는 인물 기반 테마 제공 방법.
  5. 제1항에 있어서, 상기 음성 폰트를 상기 프롬프트에 적용하는 단계는 상기 인물의 녹음된 어구들(phrases)로 상기 음성 폰트가 적용된 프롬프트를 증가시키는 단계를 더 포함하는 인물 기반 테마 제공 방법.
  6. 제1항에 있어서, 상기 음성 폰트가 적용된 프롬프트를 출력 장치에서 생성하는 단계는 모바일 장치 내에 배치된 상기 출력 장치에서 상기 음성 폰트가 적용된 프롬프트를 생성하는 단계를 포함하는 인물 기반 테마 제공 방법.
  7. 제1항에 있어서, 상기 음성 폰트가 적용된 프롬프트를 출력 장치에서 생성하는 단계는 이동 전화, 휴대 전화, 무선 전화, 무선 장치, 핸드헬드 퍼스널 컴퓨터, 핸드헬드 컴퓨팅 장치, 멀티프로세서 시스템, 마이크로프로세서 기반 또는 프로그램가능 소비자 전자 장치, 개인용 정보 단말기(PDA), 전화기 및 페이저(pager) 중 의 하나 내에 배치된 출력 장치에서 상기 음성 폰트가 적용된 프롬프트를 생성하는 단계를 포함하는 인물 기반 테마 제공 방법.
  8. 제1항에 있어서, 상기 인물의 문법 스타일에 따르도록 상기 프롬프트를 변경하는 단계를 더 포함하는 인물 기반 테마 제공 방법.
  9. 인물 기반의 테마를 제공하는 시스템에 있어서,
    메모리 저장 장치; 및
    상기 메모리 저장 장치에 결합된 처리 장치
    를 포함하고, 상기 처리 장치는
    미리 결정된 인물에 대응하는 적어도 하나의 오디오 콘텐트를 생성하고;
    미리 결정된 인물에 대응하는 적어도 하나의 비디오 콘텐트를 생성하도록
    동작하는 인물 기반 테마 제공 시스템.
  10. 제9항에 있어서, 상기 적어도 하나의 오디오 콘텐트는 벨소리(ring tone)를포함하는 인물 기반 테마 제공 시스템.
  11. 제9항에 있어서, 상기 적어도 하나의 오디오 콘텐트는 상기 미리 결정된 인물로부터 녹음된 콘텐트를 포함하는 인물 기반 테마 제공 시스템.
  12. 제9항에 있어서, 상기 적어도 하나의 오디오 콘텐트는 상기 미리 결정된 인물처럼 소리 나도록 구성된 합성 음성을 포함하는 인물 기반 테마 제공 시스템.
  13. 제9항에 있어서, 상기 적어도 하나의 오디오 콘텐트는 상기 미리 결정된 인물처럼 소리 나도록 구성된 합성 음성을 포함하고, 상기 합성 음성은 상기 미리 결정된 인물의 문법 스타일에 따르도록 변경되는 인물 기반 테마 제공 시스템.
  14. 제9항에 있어서, 상기 적어도 하나의 오디오 콘텐트는 상기 미리 결정된 인물에 의해 공연된 사운드 콘텐트, 상기 미리 결정된 인물에 의해 작곡된 사운드 콘텐트, 상기 미리 결정된 인물에 의해 쓰여진 사운드 콘텐트, 상기 미리 결정된 인물에 의해 녹음된 사운드 콘텐트, 상기 미리 결정된 인물과 관련된 영화와 관련된 사운드 콘텐트, 및 상기 미리 결정된 인물과 관련된 TV 프로그램과 관련된 사운드 콘텐트 중의 적어도 하나를 포함하는 인물 기반 테마 제공 시스템.
  15. 제9항에 있어서, 상기 적어도 하나의 비디오 콘텐트는 상기 미리 결정된 인물과 관련된 이미지 및 상기 미리 결정된 인물과 관련된 비디오 클립 중의 적어도 하나를 포함하는 인물 기반 테마 제공 시스템.
  16. 제9항에 있어서, 상기 적어도 하나의 비디오 콘텐트는 상기 미리 결정된 인물과 관련된 물건(object), 상기 미리 결정된 인물의 초상(likeness) 및 상기 미리 결정된 인물과 관련된 색채 배합(color scheme) 중의 적어도 하나를 포함하는 인물 기반 테마 제공 시스템.
  17. 제9항에 있어서, 상기 적어도 하나의 비디오 콘텐트는 상기 미리 결정된 인물에 의해 공연된 비디오 콘텐트, 상기 미리 결정된 인물에 의해 작곡된 비디오 콘텐트, 상기 미리 결정된 인물에 의해 쓰여진 비디오 콘텐트, 상기 미리 결정된 인물에 의해 녹화된 비디오 콘텐트, 상기 미리 결정된 인물과 관련된 영화와 관련된 비디오 콘텐트, 및 상기 미리 결정된 인물과 관련된 TV 프로그램과 관련된 비디오 콘텐트 중의 적어도 하나를 포함하는 인물 기반 테마 제공 시스템.
  18. 제9항에 있어서, 상기 시스템의 외관의 적어도 일부는 상기 미리 결정된 인물과 관련된 커버(cover)를 포함하는 인물 기반 테마 제공 시스템.
  19. 제9항에 있어서, 상기 처리 장치는 또한,
    다른 인물에 대응하는 적어도 하나의 오디오 콘텐트를 생성하고;
    상기 다른 인물에 대응하는 적어도 하나의 비디오 콘텐트를 생성하도록
    동작하는 인물 기반 테마 제공 시스템.
  20. 실행시에 인물 기반의 테마를 제공하는 방법을 실행하는 명령어 집합을 저장하는 컴퓨터 판독가능 매체에 있어서, 상기 명령어 집합에 의해 실행된 방법은,
    인물을 나타내는 사용자 시작 입력을 인물 매니저에서 수신하는 단계;
    적어도 하나의 애플리케이션에 상기 인물을 통지하는 단계; 및
    상기 적어도 하나의 애플리케이션이 상기 인물을 통지받은 것에 응답하여 상기 적어도 하나의 애플리케이션이 인물 리소스 파일을 요청하고, 그 요청에 응답하여 인물 리소스 파일을 수신하는 단계
    를 포함하는 컴퓨터 판독가능 매체.
KR1020097022807A 2007-05-24 2008-05-19 인물 기반의 장치 KR101376954B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/752,989 US8131549B2 (en) 2007-05-24 2007-05-24 Personality-based device
US11/752,989 2007-05-24

Publications (2)

Publication Number Publication Date
KR20100016107A true KR20100016107A (ko) 2010-02-12
KR101376954B1 KR101376954B1 (ko) 2014-03-20

Family

ID=40072030

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097022807A KR101376954B1 (ko) 2007-05-24 2008-05-19 인물 기반의 장치

Country Status (12)

Country Link
US (2) US8131549B2 (ko)
EP (1) EP2147429B1 (ko)
JP (2) JP2010528372A (ko)
KR (1) KR101376954B1 (ko)
CN (1) CN101681620A (ko)
AU (1) AU2008256989B2 (ko)
BR (1) BRPI0810906B1 (ko)
CA (2) CA2903536C (ko)
IL (1) IL201652A (ko)
RU (1) RU2471251C2 (ko)
TW (1) TWI446336B (ko)
WO (1) WO2008147755A1 (ko)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100699050B1 (ko) * 2006-06-30 2007-03-28 삼성전자주식회사 문자정보를 음성정보로 출력하는 이동통신 단말기 및 그방법
US8131549B2 (en) 2007-05-24 2012-03-06 Microsoft Corporation Personality-based device
EP3296992B1 (en) * 2008-03-20 2021-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for modifying a parameterized representation
US8655660B2 (en) * 2008-12-11 2014-02-18 International Business Machines Corporation Method for dynamic learning of individual voice patterns
US20100153116A1 (en) * 2008-12-12 2010-06-17 Zsolt Szalai Method for storing and retrieving voice fonts
US20100324895A1 (en) * 2009-01-15 2010-12-23 K-Nfb Reading Technology, Inc. Synchronization for document narration
US8370151B2 (en) * 2009-01-15 2013-02-05 K-Nfb Reading Technology, Inc. Systems and methods for multiple voice document narration
US10088976B2 (en) * 2009-01-15 2018-10-02 Em Acquisition Corp., Inc. Systems and methods for multiple voice document narration
US8645140B2 (en) * 2009-02-25 2014-02-04 Blackberry Limited Electronic device and method of associating a voice font with a contact for text-to-speech conversion at the electronic device
US20110025816A1 (en) * 2009-07-31 2011-02-03 Microsoft Corporation Advertising as a real-time video call
US8782556B2 (en) 2010-02-12 2014-07-15 Microsoft Corporation User-centric soft keyboard predictive technologies
US9253306B2 (en) 2010-02-23 2016-02-02 Avaya Inc. Device skins for user role, context, and function and supporting system mashups
US9009040B2 (en) * 2010-05-05 2015-04-14 Cisco Technology, Inc. Training a transcription system
US9564120B2 (en) * 2010-05-14 2017-02-07 General Motors Llc Speech adaptation in speech synthesis
US8392186B2 (en) 2010-05-18 2013-03-05 K-Nfb Reading Technology, Inc. Audio synchronization for document narration with user-selected playback
US20120046948A1 (en) * 2010-08-23 2012-02-23 Leddy Patrick J Method and apparatus for generating and distributing custom voice recordings of printed text
US20120226500A1 (en) * 2011-03-02 2012-09-06 Sony Corporation System and method for content rendering including synthetic narration
US9077813B2 (en) * 2012-02-29 2015-07-07 International Business Machines Corporation Masking mobile message content
US9356904B1 (en) * 2012-05-14 2016-05-31 Google Inc. Event invitations having cinemagraphs
JP2014021136A (ja) * 2012-07-12 2014-02-03 Yahoo Japan Corp 音声合成システム
US9570066B2 (en) * 2012-07-16 2017-02-14 General Motors Llc Sender-responsive text-to-speech processing
US8700396B1 (en) * 2012-09-11 2014-04-15 Google Inc. Generating speech data collection prompts
US9698999B2 (en) * 2013-12-02 2017-07-04 Amazon Technologies, Inc. Natural language control of secondary device
US9472182B2 (en) 2014-02-26 2016-10-18 Microsoft Technology Licensing, Llc Voice font speaker and prosody interpolation
CN103888611B (zh) * 2014-03-20 2016-01-27 联想(北京)有限公司 一种输出方法及通信设备
EP2933070A1 (en) * 2014-04-17 2015-10-21 Aldebaran Robotics Methods and systems of handling a dialog with a robot
US9412358B2 (en) 2014-05-13 2016-08-09 At&T Intellectual Property I, L.P. System and method for data-driven socially customized models for language generation
US9390706B2 (en) 2014-06-19 2016-07-12 Mattersight Corporation Personality-based intelligent personal assistant system and methods
US9715873B2 (en) 2014-08-26 2017-07-25 Clearone, Inc. Method for adding realism to synthetic speech
CN104464716B (zh) * 2014-11-20 2018-01-12 北京云知声信息技术有限公司 一种语音播报系统和方法
CN104714826B (zh) * 2015-03-23 2018-10-26 小米科技有限责任公司 应用主题的加载方法及装置
US20160336003A1 (en) * 2015-05-13 2016-11-17 Google Inc. Devices and Methods for a Speech-Based User Interface
RU2591640C1 (ru) * 2015-05-27 2016-07-20 Александр Юрьевич Бредихин Способ модификации голоса и устройство для его осуществления (варианты)
RU2617918C2 (ru) * 2015-06-19 2017-04-28 Иосиф Исаакович Лившиц Способ формирования образа человека с учетом характеристик его психологического портрета, полученных под контролем полиграфа
US20170017987A1 (en) * 2015-07-14 2017-01-19 Quasar Blu, LLC Promotional video competition systems and methods
US9965837B1 (en) 2015-12-03 2018-05-08 Quasar Blu, LLC Systems and methods for three dimensional environmental modeling
US10607328B2 (en) 2015-12-03 2020-03-31 Quasar Blu, LLC Systems and methods for three-dimensional environmental modeling of a particular location such as a commercial or residential property
US11087445B2 (en) 2015-12-03 2021-08-10 Quasar Blu, LLC Systems and methods for three-dimensional environmental modeling of a particular location such as a commercial or residential property
CN106487900B (zh) * 2016-10-18 2019-04-09 北京博瑞彤芸文化传播股份有限公司 用户终端个性化主页面的首次配置方法
CN107665259A (zh) * 2017-10-23 2018-02-06 四川虹慧云商科技有限公司 一种界面自动换肤方法及系统
CN108231059B (zh) * 2017-11-27 2021-06-22 北京搜狗科技发展有限公司 处理方法和装置、用于处理的装置
US11830485B2 (en) * 2018-12-11 2023-11-28 Amazon Technologies, Inc. Multiple speech processing system with synthesized speech styles
US11094311B2 (en) 2019-05-14 2021-08-17 Sony Corporation Speech synthesizing devices and methods for mimicking voices of public figures
US11141669B2 (en) 2019-06-05 2021-10-12 Sony Corporation Speech synthesizing dolls for mimicking voices of parents and guardians of children
US11380094B2 (en) 2019-12-12 2022-07-05 At&T Intellectual Property I, L.P. Systems and methods for applied machine cognition
US11228682B2 (en) * 2019-12-30 2022-01-18 Genesys Telecommunications Laboratories, Inc. Technologies for incorporating an augmented voice communication into a communication routing configuration
US11140360B1 (en) 2020-11-10 2021-10-05 Know Systems Corp. System and method for an interactive digitally rendered avatar of a subject person
US11582424B1 (en) 2020-11-10 2023-02-14 Know Systems Corp. System and method for an interactive digitally rendered avatar of a subject person
US11463657B1 (en) 2020-11-10 2022-10-04 Know Systems Corp. System and method for an interactive digitally rendered avatar of a subject person
US11594226B2 (en) * 2020-12-22 2023-02-28 International Business Machines Corporation Automatic synthesis of translated speech using speaker-specific phonemes
US11922938B1 (en) 2021-11-22 2024-03-05 Amazon Technologies, Inc. Access to multiple virtual assistants

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7006881B1 (en) * 1991-12-23 2006-02-28 Steven Hoffberg Media recording device with remote graphic user interface
WO1993018505A1 (en) * 1992-03-02 1993-09-16 The Walt Disney Company Voice transformation system
JP3299797B2 (ja) * 1992-11-20 2002-07-08 富士通株式会社 合成画像表示システム
ATE277405T1 (de) * 1997-01-27 2004-10-15 Microsoft Corp Stimmumwandlung
US6336092B1 (en) * 1997-04-28 2002-01-01 Ivl Technologies Ltd Targeted vocal transformation
JP3224760B2 (ja) * 1997-07-10 2001-11-05 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声メールシステム、音声合成装置およびこれらの方法
TW430778B (en) * 1998-06-15 2001-04-21 Yamaha Corp Voice converter with extraction and modification of attribute data
US7137126B1 (en) * 1998-10-02 2006-11-14 International Business Machines Corporation Conversational computing via conversational virtual machine
US20030028380A1 (en) * 2000-02-02 2003-02-06 Freeland Warwick Peter Speech system
US20020010584A1 (en) * 2000-05-24 2002-01-24 Schultz Mitchell Jay Interactive voice communication method and system for information and entertainment
JP2002108378A (ja) * 2000-10-02 2002-04-10 Nippon Telegraph & Telephone East Corp 文書読み上げ装置
JP4531962B2 (ja) * 2000-10-25 2010-08-25 シャープ株式会社 電子メールシステム並びに電子メール出力処理方法およびそのプログラムが記録された記録媒体
US6934756B2 (en) * 2000-11-01 2005-08-23 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
US6964023B2 (en) * 2001-02-05 2005-11-08 International Business Machines Corporation System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input
US6970820B2 (en) * 2001-02-26 2005-11-29 Matsushita Electric Industrial Co., Ltd. Voice personalization of speech synthesizer
JP2002271512A (ja) * 2001-03-14 2002-09-20 Hitachi Kokusai Electric Inc 携帯電話端末
US20040018863A1 (en) * 2001-05-17 2004-01-29 Engstrom G. Eric Personalization of mobile electronic devices using smart accessory covers
JP2002358092A (ja) * 2001-06-01 2002-12-13 Sony Corp 音声合成システム
GB0113587D0 (en) * 2001-06-04 2001-07-25 Hewlett Packard Co Speech synthesis apparatus
DE10127558A1 (de) * 2001-06-06 2002-12-12 Philips Corp Intellectual Pty Verfahren zur Verarbeitung einer Text-, Gestik-, Mimik- und/oder Verhaltensbeschreibung mit Überprüfung der Benutzungsberechtigung von Sprach-, Gestik-, Mimik- und/oder Verhaltensprofilen zur Synthese
EP1271469A1 (en) * 2001-06-22 2003-01-02 Sony International (Europe) GmbH Method for generating personality patterns and for synthesizing speech
US6810378B2 (en) * 2001-08-22 2004-10-26 Lucent Technologies Inc. Method and apparatus for controlling a speech synthesis system to provide multiple styles of speech
US7483832B2 (en) * 2001-12-10 2009-01-27 At&T Intellectual Property I, L.P. Method and system for customizing voice translation of text to speech
US20060069567A1 (en) * 2001-12-10 2006-03-30 Tischer Steven N Methods, systems, and products for translating text to speech
JP2003337592A (ja) 2002-05-21 2003-11-28 Toshiba Corp 音声合成方法及び音声合成装置及び音声合成プログラム
JP2006501509A (ja) 2002-10-04 2006-01-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 個人適応音声セグメントを備える音声合成装置
US20040098266A1 (en) * 2002-11-14 2004-05-20 International Business Machines Corporation Personal speech font
JP4345314B2 (ja) * 2003-01-31 2009-10-14 株式会社日立製作所 情報処理装置
RU2251149C2 (ru) * 2003-02-18 2005-04-27 Вергильев Олег Михайлович Способ вергильева о.м. по созданию и использованию системы информационного поиска и обеспечения специалистов сферы материального производства
US6999763B2 (en) * 2003-08-14 2006-02-14 Cisco Technology, Inc. Multiple personality telephony devices
US20050086328A1 (en) * 2003-10-17 2005-04-21 Landram Fredrick J. Self configuring mobile device and system
EP1719337A1 (en) * 2004-02-17 2006-11-08 Voice Signal Technologies Inc. Methods and apparatus for replaceable customization of multimodal embedded interfaces
WO2006053256A2 (en) * 2004-11-10 2006-05-18 Voxonic, Inc. Speech conversion system and method
US7571189B2 (en) * 2005-02-02 2009-08-04 Lightsurf Technologies, Inc. Method and apparatus to implement themes for a handheld device
US20070011009A1 (en) * 2005-07-08 2007-01-11 Nokia Corporation Supporting a concatenative text-to-speech synthesis
US20070213987A1 (en) * 2006-03-08 2007-09-13 Voxonic, Inc. Codebook-less speech conversion method and system
US7693717B2 (en) * 2006-04-12 2010-04-06 Custom Speech Usa, Inc. Session file modification with annotation using speech recognition or text to speech
US20080082320A1 (en) * 2006-09-29 2008-04-03 Nokia Corporation Apparatus, method and computer program product for advanced voice conversion
US8131549B2 (en) 2007-05-24 2012-03-06 Microsoft Corporation Personality-based device

Also Published As

Publication number Publication date
CA2685602C (en) 2016-11-01
AU2008256989B2 (en) 2012-07-19
US8285549B2 (en) 2012-10-09
JP2014057312A (ja) 2014-03-27
TWI446336B (zh) 2014-07-21
CA2903536A1 (en) 2008-12-04
JP5782490B2 (ja) 2015-09-24
US20080291325A1 (en) 2008-11-27
KR101376954B1 (ko) 2014-03-20
TW200905668A (en) 2009-02-01
RU2471251C2 (ru) 2012-12-27
RU2009143358A (ru) 2011-05-27
WO2008147755A1 (en) 2008-12-04
AU2008256989A1 (en) 2008-12-04
IL201652A0 (en) 2010-05-31
US20120150543A1 (en) 2012-06-14
JP2010528372A (ja) 2010-08-19
BRPI0810906B1 (pt) 2020-02-18
BRPI0810906A2 (pt) 2014-10-29
EP2147429A1 (en) 2010-01-27
CA2903536C (en) 2019-11-26
EP2147429B1 (en) 2014-01-01
EP2147429A4 (en) 2011-10-19
US8131549B2 (en) 2012-03-06
IL201652A (en) 2014-01-30
CA2685602A1 (en) 2008-12-04
CN101681620A (zh) 2010-03-24

Similar Documents

Publication Publication Date Title
KR101376954B1 (ko) 인물 기반의 장치
US11915696B2 (en) Digital assistant voice input integration
US10276157B2 (en) Systems and methods for providing a voice agent user interface
US20140095172A1 (en) Systems and methods for providing a voice agent user interface
US20140095171A1 (en) Systems and methods for providing a voice agent user interface
US7458080B2 (en) System and method for optimizing user notifications for small computer devices
US7024363B1 (en) Methods and apparatus for contingent transfer and execution of spoken language interfaces
JP6087899B2 (ja) 会話ダイアログ学習および会話ダイアログ訂正
US7616131B2 (en) Method and apparatus for allowing runtime creation of a user experience for a wireless device
US9794400B2 (en) Mobile terminal and ringtone playing method thereof
JP2011527045A (ja) モバイルデバイスにおけるマルチタスキングをサポートするための方法
US20140095167A1 (en) Systems and methods for providing a voice agent user interface
CN108804070B (zh) 音乐播放方法、装置、存储介质及电子设备
WO2014055181A1 (en) Systems and methods for providing a voice agent user interface
US20090164207A1 (en) User device having sequential multimodal output user interace
AU2012244080B2 (en) Personality-based Device
US20140095168A1 (en) Systems and methods for providing a voice agent user interface

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170220

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180219

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20200218

Year of fee payment: 7