KR20040003798A

KR20040003798A - 대화형 디지털 액자

Info

Publication number: KR20040003798A
Application number: KR1020020038609A
Authority: KR
Inventors: 강세호; 임은순
Original assignee: 유니실버(주)
Priority date: 2002-07-04
Filing date: 2002-07-04
Publication date: 2004-01-13

Abstract

개시된 본 발명은 대화형 디지털액자에 관한것이다. 더욱 상세하게는, 사용자와 대화를 수행할 대상 인물의 영상 이미지를 출력하며, 사용자의 질문이 있는 경우, 질문에 대한 응답을 출력할 수 있도록 하는 대화형 디지털 액자에 관한 것이다.

상술한 대화형 디지털액자는 음성, 오디오, 사진, 동영상 등의 기초데이터를 입력받는 기초데이터입력부와; 상기 기초데이터로부터 입력받은 데이터를 분석하여 가공하는 디지털액자데이터생성부; 및, 상기 디지털액자데이터생성부에서 출력되는 각종 신호를 출력하는 디지털액자데이터출력부;를 포함하여 구성되는 것을 특징으로 한다.

상술한 구성을 가지는 본원 발명의 대화형 디지털 액자는 사용자가 액자내에서 출력되는 대상인물과 대화를 수행할 수 있도록 하는 효과를 제공한다.

Description

대화형 디지털 액자{A digital picture frame}

본 발명은 대화형 디지털액자에 관한것이다. 더욱 상세하게는, 사용자의 입력음성에 대응하여, 액자내의 영상이, 사용자 입력음성에 반응하여 응답을 수행하여 출력함으로서 사용자가 액자내에 삽입된 디지털 영상 인물과 대화를 수행할 수 있도록 하는 대화형 디지털 액자에 관한 것이다.

종래기술에 있어서, 상술한 바와 같은 대화형 디지털 액자와 유사한 제품으로서, RadioShack에서 판매하고 있는 "Talking Photo Album"있다. 상술한 제품은, 20장의 사진을 보관할 수 있으며, 매 사진 당 9초의 음성 메시지를 저장할 수 있게 되어있으며, 5*7, 4*6, 3*5 인치의 사진을 저장하고 재생할 수 있다. 또한, 상술한 제품과는 달리, 디지털 사진을 순차적으로 디스플레이하는 디지털 전자액자가 보급되어 있으나, 단지 저장된 내용의 출력에만 그칠 뿐, 사용자가 제품내의 사진 인물과 상호작용을 하여 대화를 수행할 수 있도록 제공되지 못하고 있는 것이 사실이다.

따라서, 상기 문제점을 극복하기 위한 본원 발명은, 출력 대상 인물의 음성 및 영상이미지를 입력받아, 대상 인물의 음성 및 영상이미지가 사용자 질문에 따라 출력될 수 있도록 대상 인물의 음성, 사진, 동영상으로부터 음성특성, 이미지 특성 및, 쌍방향 대화패턴을 생성하여 저장한 후, 사용자의 질문이 있는 경우, 사용자 질문에 대응되는 대상 인물의 응답 음성과 응답 음성에 대응되는 이미지를 스피커와 모니터 및/또는 LCD 등의 영상출력수단을 포함하는 출력부를 통해 출력할 수 있도록 하는 대화형 디지털액자를 제공하는 것을 그 목적으로 한다.

도1은, 본원 발명의 바람직한 일 실시예로서의 대화형 디지털 액자의 구성을 나타내는 도면이다.

*도면의 주요 부호에 대한 설명*

100 : 대화형 디지털 액자

10 : 기초데이터입력부

20 : 디지털액자데이터생성부

21 : 특성파라미터추출부

22 : 질의처리부

221 : 문자생성부222 : 응답메시지생성부

23 : 디지털액자데이터베이스24 : 이미지데이터생성부

30 : 디지털액자데이터출력부

상기 목적을 달성하기 위한 대화형 디지털 액자는,

음성, 오디오, 사진, 동영상 등의 기초데이터를 입력받는 기초데이터입력부와; 상기 기초데이터입력부로부터 입력받은 데이터를 분석, 가공하는 디지털액자데이터생성부와; 상기 디지털액자데이터생성부에서 출력되는 각종 신호를 출력하는 디지털 액자데이터 출력부;를 포함하여 구성되는 것을 특징으로 한다.

상기 기초데이터입력부는 사용자가 저장하고자 하는 인물의 사진, 동영상, 음성 등을 입력받는 액자데이터입력부와 사용자의 음성을 입력받는 음성데이터입력부로 구성되는 바, 상기 액자데이터입력부는 사용자가 선택입력할 수 있게 하는 사용자 제어패널 및 하나 이상의 데이터 포트로 구성된다. 상기 데이터 포트는 마이크로폰, 디짙털 카메라, 스캐너, 비디오카메라 등을 비롯한 오디오 및 비디오 입력장치가 연결되어 데이터를 입력받는 USB 포트, 직렬 포트, 병렬 포트 등의 데이터포트, 랜카드, 적외선 포트 및 마이크 등의 직접입력장치이다. 또한 음성데이터 입력부는 사용자의 음성을 입력받을 수 있는 직접입력장치로서 상기 액자데이터 입력부의 마이크 등을 사용할 수 있고, 별도의 장치로 구성될 수도 있다.

상기 디지털액자데이터생성부는 상기 기초데이터입력부의 액자데이터입력부에서 입력받은 사진, 동영상, 음성 등의 기초 입력 데이터를 분석하는 특성 파라미터 추출부와 상기 입력된 기초 데이터와 상기 분석, 가공된 데이터를 저장하는 디지털액자데이터베이스와 상기 기초데이터 입력부의 음성데이터 입력부로부터 입력된 사용자의 질문내용을 인식하고 질문내용에 따른 적절한 응답메시지를 생성하는 질의처리부로 구성된다.

상기 디지털 액자 데이터 생성부는 상기 질의처리부에서 생성된 응답 메시지에 따라 상기 입력된 기초데이터 중 사진, 동영상 등의 이미지 데이터를 적절하게 변형하여 응답 메시지에 대응되는 이미지 데이터를 생성하는 이미지데이터생성부를 더욱 포함할 수 있다.

상기 특성파라미터추출부는 입력된 인물의 음성신호에서 상기 인물의 음성특성을 추출하며, 선택적으로 입력된 인물의 성격특성, 행동특성, 표현특성 등을 사용자로부터 입력받아 그 특성을 추출할 수 있다. 특성의 추출은 입력된 패턴에 따라 가능한 바, 구체적으로는 예컨대 사람의 성격특성, 행동특성 등을 세분화하여 분류한 인물특성데이터베이스와 상기 사용자로부터 입력받은 성격특성, 행동특성, 표현특성 등을 비교하여 그 중 가장 접근된 인물특성패턴에 따라 그 특성이 추출될 수 있다.

상기 질의처리부는 상기 기초 데이터 입력부의 음성데이터 입력부에서 입력된 사용자의 질의를 인식하여 대응되는 응답 메시지를 생성하는 것으로서, 구체적으로는 사용자의 질의가 입력되며 공지의 음성인식방법을 통해 문자열로 변환하고 변환된 문자열의 주제어를 파악한 후, 그 주제어에 따라 적절한 응답 메시지를 생성한다. 응답메시지의 생성은 저장된 몇가지 답변을 하는 방식일 수도 있고 선택적으로는 상기 인물특성데이터베이스로부터 도출된 응답패턴에 따라 답변을 하는 방식일 수도 있다.

상술한 구성을 가지는 본원 발명의 디지털액자는 대상인물의 영상이미지로서 기 지정된 사진, 비디오, 디지털 카메라에 의해 생성된 대상인물의 동영상이 별도의 처리과정 없이 화면에 출력되어 있고, 사용자의 음성이 입력되는 경우, 입력된 사용자 음성에 대응되는 응답메시지만을 출력하도록 구성될 수 있으며, 이와 달리, 출력대상 인물의 영상이미지가 출력되는 응답메시지에 따라 변환되도록 구성될 수 있다.

본원 발명의 바람직한 일 실시 예에서는 사용자 입력 음성에 대응하는 응답메시지가 출력되며, 또한 응답메시지에 대응하여 출력대상 인물의 영상이미지가 변형되어 출력될 수 있도록 구성된 디지털액자를 가정하였다.

이하, 본원 발명의 바람직한 일 실시 예를 나타내는 첨부도면을 참조하여 본원 발명을 더욱 상세히 설명한다.

도1은, 본원 발명에 따르는 대화형 디지털 액자의 내부 구성을 나타내는 블록도이고, 도2는, 도1의 디지털액자데이터생성부를 나타내는 도면이며, 도3은, 도1의 액자데이터출력부를 나타내는 도면이다.

도1에 도시된 바와같이, 상술한 대화형 디지털액자(100)는, 외부로부터 대상인물의 기초데이터로서 사진, 동영상 이미지 등의 이미지 데이터 및 사용자의 음성신호를 입력받는 기초데이터입력부(10)와 기초데이터입력부(10)로부터 입력된 데이터를 가공하여 사용자의 질문에 대응할 응답메시지와, 응답메시지에 대응하여 변형되는 이미지데이터를 생성하는 디지털액자데이터생성부(20)와 상기 디지털액자데이터생성부(20)로부터 출력되는 신호를 출력하는 디지털액자데이터출력부(30)를 포함하여 구성된다.

상기 기초데이터입력부(10)는 사용자가 저장하고자 하는 인물의 사진, 동영상, 음성 등을 입력받는 액자데이터입력부(11)와 사용자의 음성을 입력받는 음성데이터입력부(12)로 구성된다. 상술한 액자데이터입력부(11)는 카세트레코더, 디지털 카메라, 스캐너, 비디오카메라, 마이크 등을 비롯한 오디오 및 비디오 입력장치가 연결되는 다수의 USB 포트, 직렬 포트, 병렬 포트 등의 데이터포트로서의 직접입력장치를 포함하여 구성된다. 또한, 선택적으로 사용자의 제어명령을 입력받는 다수의 키버튼이 구비된 제어패널(도면에 미도시)이 더 포함되어 구성될 수 있다.

상술한 액자데이터입력부(11)는, 또한, 외부의 컴퓨터에 기 저장된 디지털화된 음성, 사진, 동영상 데이터를 입력받고, 디지털액자(100) 내부에 저장된 데이터를 외부의 컴퓨터로 전송할 수 있도록 하는 랜카드, 적외선 포트 등의 네트워크 통신 장치를 더 포함하여 구성될 수 있다. 네트워크통신장치는 디지털액자(100)가 외부의 컴퓨터장치에 저장된 기초데이터 및/또는 외부의 컴퓨터상에서 구동되는 특정 소프트웨어에 의하여 미리 생성된 데이터를 디지털액자(100)에서 출할 수 있도록 력될 수 있도록 외부의 컴퓨터로부터 전송받을 수 있으며, 디지털액자(100)내에 저장된 기초데이터 및 가공된 데이터를 외부의 컴퓨터로 전송함으로서 외부의 컴퓨터에서 기초데이터의 편집 및 가공된 데이터를 수정할 수 있도록 함으로서, 데이터의 이용효율 및/또는 출력데이터의 가공효율을 높일 수 있다.

상술한 음성데이터입력부(12)는 사용자의 음성을 입력받을 수 있는 직접입력장치로서 상기 액자데이터입력부(11)의 마이크 등을 사용할 수 있고, 별도의 장치로 구성될 수도 있다. 음성데이터입력부(12)는 내부에 아날로그/디지털컨버터가 구성되어 입력된 아날로그 음성신호를 디지털 신호로 변환하여 질의처리부(22)로 전송한다. 질의처리부(22)는 음성데이터 입력부에서 입력된 디지털 신호를 입력받아 상술한 음성신호에 답변으로서 적합한 응답을 생성할 수 있도록 하는 것으로서, 하기에서 더욱 상세히 설명한다.

기초데이터입력부(10)는 액자데이터입력부(11) 및 음성데이터입력부(12)에서 입력된 데이터를 디지털액자데이터생성부(20)로 전송한다.

상술한 디지털액자데이터생성부(20)는 도2에 도시된 바와같이, 출력대상 인물의 특성파라미터추출부(21), 디지털액자데이터베이스(23), 질의처리부(22)를 포함하여 구성된다. 또한, 상술한 디지털액자데이터생성부(20)는 질의처리부(22)에서 생성된 대상 인물의 응답 음성의 출력과 대응되어 대상인물의 영상이미지가 변환되어 출력될 수 있도록 대상 인물의 기준이미지 데이터를 변환하는 이미지데이터생성부(24)를 더 포함하여 구성될 수 있다.

본원 발명의 특성파라미터추출부(21)는 액자데이터입력부(11)를 통해 입력된 출력대상 인물의 인물의 성격특성, 행동특성, 표현특성, 음성특성을 분석하여 정량화된 값으로 표시한다. 특성파리미터추출부(21)에서 추출된 인물의 성격특성, 행동특성, 표현특성, 음성특성 정보는 출력대상 인물의 음성합성, 표정합성에 사용된다.

본원 발명의 실시 예에서 상술한 특성파라미터는 사용자 질문에 대응되는 대상 인물의 다수의 응답메시지와 질문에 대한 응답으로 선택된 응답메시지를 대상인물의 음성신호로 합성하여 출력하기 위한 음색파라미터와, 출력되는 음성신호에 대응하는 대상인물의 영상이미지를 합성하여 출력하기 위한 이미지파라미터를 말한다.

구체적으로 음색파라미터와 이미지파라미터를 생성하는 상술한 특성파라미터추출부(21)는 출력대상 인물의 음성신호에서 음색파라미터를 추출하는 음색분석부와 출력대상 인물의 사진, 동영상 등의 영상이미지 신호에서 대상 인물의 음성변화에 따르는 영상이미지의 변화 값을 추출하는 이미지분석부를 포함하여 구성된다. 또한, 사용자의 인물특성으로서 행동특성, 성격특성 등을 저장하는 인물특성데이터베이스를 더 포함하여 구성될 수 있다.

음색분석부는 기초데이터입력부(10)로부터 입력된 대상 인물의 음성 오디오 신호를 분석하여 음성특성 정보로서의 음색파라미터를 생성하여 디지털액자데이터베이스(23)에 저장한다. 음석분석부를 더욱상세하게 설명하면, 상술한 음색분석부는 수신된 디지털음성신호에 대하여 푸리에변환을 수행함으로서 음성신호를 이루는 주파수군을 생성하는 푸리에변환모듈과, 푸리에변환모듈에 의하여 생성된 주파수군에서 기저음주파수, 배음주파수, 음파의 인벨롭, 피치정보, 길이정보, 스펙트럼 정보 등의 음성 특성 정보를 추출하여 음성의 특징을 나타내는 음색파라미터를 생성하는 음색분석모듈을 포함하여 구성된다. 본원 발명의 일 실시 예에서 푸리에변환으로서 어답티브푸리에변환(adaptive furier transform) 기법을 사용하였다.

상술한 이미지분석부는 기초데이터입력부(10)로부터 입력된 대상 인물의 사진, 동영상 데이터를 분석하여 음성신호의 특성으로서의 음색파라미터를 이용하여 이미지파라미터를 생성하여 디지털액자데이터베이스(23)에 저장하는 동작을 수행한다. 상술한 이미지파라미터는 음성파라미터에 따라 대상인물의 동작, 표정, 입모양의 특성 정보를 검출하여 특정화함으로서, 차후 대상인물의 음성이 디지털액자데이터출력부(30)에서 출력되는 경우, 대상 인물의 영상이미지를 음성 신호에 맞게 변화시켜 출력할 수 있도 할 수 있다.

이미지분석부에 의하여 이미지파라미터가 생성되는 처리과정은, 먼저 기초데이터입력부(10)로부터 입력된 대상 인물의 사진, 및/또는, 동영상 신호를 입력받아서, 각각의 영상이미지에 특징점을 가지는 마스크를 부여하여, 대상 인물의 음성신호에 따라 변환되는 대상 이미지의 특징점들의 이동방향 및 길이(벡터변위)를 추출하고, 상술한 음색분석부에서 추출된 음색파라미터를 각각의 특징점들의 벡터변위를 가지는 이미지파라미터를 생성하여 디지털액자데이터베이스(23)에 저장한다.

또한, 상술한 디지털액자데이터생성부(20)는 질의처리부(22)에서 생성된 대상 인물의 응답 음성의 출력과 대응되어 대상인물의 영상이미지가 변환되어 출력될 수 있도록 대상 인물의 기준이미지 데이터를 변환하여 출력될 영상이미지데이터를 생성하여 디지털액자데이터베이스(23)에 저장하는 이미지데이터생성부(24)를 더 포함하여 구성될 수 있다. 상술한 영상이미지데이터는 디지털액자내의 인물 음성이 출력되는 경우 출력되는 음성에 따라 대상인물의 입모양, 얼굴표정 등이 변하여 출력되도록 응답메시지 각각에 따라 정해진 연속적으로 출력되는 다수의 이미지프레임 데이터이다.

상술한 이미지데이터생성부(24)는 특성파라미터추출부(21)에서 추출된 특성파라미터를 이용하여 디지털액자(100)에서 출력될 대상인물의 사용자 입력음성에 대응되는 응답메시지 데이터 및 상술한 응답메시지와 대응되어 변화되는 대상인물의 영상이미지데이터를 생성한 후, 디지털액자데이터베이스(23)에 저장한다.

상술한 영상이미지데이터는, 출력될 응답메시지의 각각의 문자구성요소에 각각 음색파라미터에 대응되는 벡터변위 값으로서의 이미지파라미터를 이용하여 기준이미지의 특징점을 이동시켜 각각의 음성에 맞는 이미지프레임을 생성하여 응답메시지가 출력되면, 디지털액자에 출력되어 있는 대상인물의 영상이미지가 출력되는 응답메시지에 따라 각각 서로다른 입모양 얼굴표정 등을 가지고 음성출력되는 기 지정된 시간 동안 각각 대응되어 출력되는 다수의 이미지프레임으로 구성된 영상이미지를 말한다.

또한, 상술한 영상이미지데이터는 자음, 모음, 초성, 중성, 종성별로 구별된 기 지정된 출력대상인물의 이미지데이터프레임으로 구성될 수 있으며, 이러한 경우, 응답메시지의 문자열에 대응되는 각각의 영상이미지를 기 지정된 시간동안, 출력되는 음성신호와 동기되어 출력되도록 구성될 수 있다.

본원 발명의 실시 예에서 디지털액자데이터베이스(23)에 저장된 응답메시지 대응 출력대상 인물의 영상이미지 데이터는 사용자 음성이 입력되는 경우 질의처리부(22)에 의하여 대응되는 응답메시지와 함께 호출되어 디지털액자데이터출력부(30)로 전송됨으로써, 차후 출력대상 인물의 응답음성과 동기되어 출력되도록 구성되었다.

상술한 바와는 달리, 본원 발명의 또 다른 선택적 일 실시 예로서, 이미지데이터생성부(24)는 질의처리부(22)의 응답메시생성부(222)와 연동되어 생성되는 응답메시지의 음성신호에 따라 디지털액자데이터베이스(23)에 구성된 출력대상 인물의 기준영상미지 및 음성 신호의 음색파라미터 각각에 대응되는 이미지파라미터를 이용하여 실시간으로 기준영상이미지를 변환하여 출력하도록 구성될 수 있다.

상술한 디지털액자데이터베이스(23)는 기초데이터입력부(10)를 통해 입력된출력 대상 인물의 사진, 동영상을 저장하는 출력대상인물데이터와, 사용자 입력 음성에 대응되는 응답을 가지는 응답메시지데이터와, 각각의 문자열을 음성신호로 변환하기 위한 문자별 발음기호 등의 데이터를 저장하며, 상술한 음색분석부()에서 추출된 대상인물의 음색파리미터를 적용하여 대상인물의 음성으로 출력될 수 있도록 문자-음성 변환을 수행하기 위한 , 음성특성정보, 이미지특성정보 데이터를 각각 분류 저장하는 데이터베이스이다. 또한, 선택적으로 상술한 디지털액자데이터베이스(23)는 이미지데이터생성부(24)에서 응답메시지에 따라 변화되도록 응답메시지 각각에 지정된 다수의 대상인물의 영상이미지를 저장할 수 있다.

상술한 질의처리부(22)는 상술한 기초데이터입력부(10)에 구성된 음성데이터입력부(12)에서 디지털 신호로 변환된 사용자 음성신호를 입력받아 문자열을 생성하는 문자생성부(221)와 상술한 문자생성부(221)에서 생성된 문자에 대응되는 응답메시지를 생성하여 출력하는 응답메시지생성부(222)를 포함하여 구성된다.

상술한 문자생성부(221)는 음성데이터입력부(12)를 통해 입력된 디지털화된 사용자의 음성신호를 신호처리하여 문자열을 생성한다.

상술한 문자생성부(221)는 입력된 음성 디지털신호를 푸리에 변환하여 음성신호를 이루는 주파수군을 생성하는 푸리에변환모듈(도면에 미도시)과, 푸리에변환모듈에 의해서 생성된 주파수군에서 음성특성값들을 검출하는 음성특성검출모듈(도면에 미도시)과, 음성특성검출모듈에 의해 검출된 음성특성정보를 이용하여 기 지정된 음성특성정보에 따르는 문자를 디지털액자데이터베이스(23)로부터 추출하여조합함으로서 문자열을 생성하는 문자조합모듈(도면에 미도시)을 포함하여 구성될 수 있다.

상술한 푸리에변환모듈은 음성데이터입력부(12)의 아날로그/디지털컨버터에 의하여 디지털신호로 변환된 사용자 음성신호가 입력되면, 입력된 디지털 음성신호를 푸리에 변환하여 음성신호를 이루는 주파수 군을 생성한다. 이후 주파수분석모듈은 상술한 주파수군에서 문자와 대응되는 주파수특성 값들을 검출하여 문자조합모듈로 전송한다. 문자조합모듈(도면에 미도시)은 주파수 특성값에 대응되는 문자를 호출 조합함으로서 사용자 음성에 대응되는 문자열을 생성하여 응답메시지생성부(222)로 전송한다.

또한, 상술한 문자생성부(221)는 패턴합치 또는 패턴분류라 불리는 공지의 음성인식방법이 사용될 수 있으며, 이는 공지 기술로 상세한 설명은 생략한다.

상술한 음답메시지생성부(222)는 문자생성부(221)로부터 입력된 문자열을 분석하여 문자의 특징을 검출하는 문자열분석모듈(도면에 미도시)과, 문자열분석모듈(도면에 미도시)에 의하여 분석된 문자의 특징값을 이용하여 디지털액자데이터베이스(23)에 기 저장된 응답메시지의 질문문자열과 가장 유사하거나 일치되는 질문문자열을 검출하고 검출된 질문문자열에 지정된 다수의 응답메시지 중 하나를 선택하여 음성신호로 변환한 후 액자데이터출력부(30)로 출력하는 응답메시지생성모듈(도면에 미도시)을 포함하여 구성된다. 상술한 바와 같이 본원 발명의 선택적 구성요소로서 이미지데이터생성부(24)가 추가 구성된 경우, 본원 발명의 응답메시지생성모듈은 상술한 응답메시지와 함께 이미지데이터생성부(24)에서 생성된 응답메시지 대응 영상이미지를 디지털액자데이터베이스(23)로부터 검출하여 디지털액자출력부로 출력하도록 구성될 수 있다.

본원 발명의 일 실시 예에서 상술한 응답메시지생성모듈(222)에서 사용자의 질문에 대응되는 응답메시지를 추출하기 위하여 디지털액자데이터베이스(23)에 저장되는 응답메시지의 데이터구조는, 사용자가 한 동일 질문 내용에 대하여 각각 서로 다른 응답이 출력될 수 있도록, 질문내용으로 통상적인 대화패턴 30개에 각각의 패턴 구문별 가능한 응답메시지 30개를 지정함으로서 사용자의 질문문자열과 가장 유사하거나 동일한 질문문자열에 대응되는 30개의 응답메시지 중 기 지정된 순서, 또는, 랜덤하게 하나의 응답메시지를 선택하여 출력하도록 구성하였다.

응답메시지생성모듈(도면에 미도시)에서 선택된 응답메시지를 출력대상 인물의 음성신호를 변환하는 음성합성 처리 방법은, 상술한 출력대상 인물의 음색파라미터를 이용한 연쇄합성(Synthesis by comctenation)방식, 포먼트합성(Formant Synthesis)방식, 및 조음 모델(Articulatory Model)방식 등이 사용될 수 있으며, 이에 한정되지 않는다.

상술한 바와 같은 사용자 질문 내용을 분석하고 대응되는 응답메시지를 출력하는 질의처리부(22)는 불특정 다수의 음성을 인식할 수 있도록 하기 위하여 가변어 화자독립 음성인식기가 사용될 수도 있다.

상술한 디지털액자데이터출력부(30)는 디지털액자데이터생성부(20)에 의하여 생성된 사용자 입력 음성에 대응되는 출력대상 인물의 응답메시지 및 응답메시지에 대응되는 출력대상 인물의 영상이미지 데이터를 출력하는 것으로서, 오디오 신호를 출력하는 스피커 등의 오디오출력부(31), 이미지, 동영상 신호를 출력하는 LCD, 음극선관 등을 포함하는 비디오출력부(32)로 구성된다.

상술한 오디오출력부(31)는 디지털액자데이터생성부(20)에서 출력되는 사용자 입력음성에 대한 답변으로서의 대상 인물의 음성신호를 출력하며, 상술한 비디오출력부(32)는 기지정된 대상인물의 사진이미지 또는 동영상을 출력한다. 또한, 선택적으로는 출력되는 대상인물의 음성과 동기되어 대상인물의 이미지의 입모양, 얼굴표정 등이 변환되어 출력된다.

상술한 본 발명의 대화형 디지털 액자는 종래기술에서, 녹음된 음성신호를 출력하며, 기 지정된 영상이미지를 순차적으로 출력하는 전자앨범의 한계를 극복하고, 출력 대상 인물과 사용자가 쌍방향으로 대화를 수행할 수 있도록 하는 효과를 제공한다.

상술한 본원 발명은 또한, 자손들이 고인과 대화를 나눌 수 있도록 함으로서, 고인에 대한 그리움을 달랠 수 있도록 하며, 고령화 시대에 가정과 떨어져 생활하는 노인들이 자식의 데이터를 가지는 대화형 대화형 디지털 액자를 이용하여 대화를 수행할 수 있도록 하므로서 외로움과 소외감이라는 노인문제를 해결할 수있는 효과를 제공한다.

Claims

음성, 오디오, 사진, 동영상 등의 기초데이터를 입력받는 기초데이터입력부와;

상기 기초데이터로부터 입력받은 데이터를 분석하여 가공하는 디지털액자데이터생성부; 및,

상기 디지털액자데이터생성부에서 출력되는 각종 신호를 출력하는 디지털액자데이터출력부;를 포함하여 구성되는 것을 특징으로 하는 대화형 디지털 액자.
제1항에 있어서, 상기 기초데이터입력부는

사용자가 저장하고자 하는 인물의 사진, 동영상, 음성 등을 입력받는 액자데이터입력부; 및,

상기 사용자의 음성을 입력받는 음성데이터입력부;로 구성되는 것을 특징으로 하는 대화형 디지털 액자.
제1항에 있어서, 디지털액자데이터생성부는,

상기 기초데이터입력부로부터 입력된 데이터를 분석하여, 입력된 인물의 특성 파라미터를 추출하는 특성 파라미터 추출부;

상기 기초데이터입력부로부터 입력된 데이터와 상기 디지털액자데이터생성부에서 처리된 데이터를 저장하는 디지털액자데이터베이스; 및,

상기 기초데이터입력부로부터 입력된 상기 사용자의 음성신호를 인식하여 대응되는 응답메시지를 생성하여 출력하는 질의처리부;로 구성되는 것을 특징으로 하는 대화형 디지털 액자.
제3항에 있어서, 상기 디지털액자데이터생서부가,

상기 질의처리부에서 출력되는 응답메시지에 대응되도록 상기 인물의 영상이미지를 변환하여 영상이미지데이터를 생성하는 이미지데티어생성부;를 더 포함하여 구성되는 것을 특징으로 하는 대화형 디지털 액자.
제3항에 있어서 상기 특성파라미터추출부는

상기 기초데이터입력부로부터 입력된 대상 인물의 음성신호에서 음색파라미터를 추출하는 음색분석부; 및,

상기 기초데이터입력부로부터 입력된 이미지, 동영상 등의 영상데이터에서 이미지파라미터를 추출하는 이미지분석부;로 구성된 것을 특징으로 하는 대화형 디지털 액자.
제4항에 있어서, 상기 이미지분석부가,

상기 기초데이터입력부를 통해 입력된 상기 출력대상 인물의 사진, 동영상 데이터 중 상기 출력대상 얼굴이미지의 윤곽을 나타내는 다수의 특징점을 지정하고 상기 음성파라임터추출부에서 추출된 음색파라미터 값에 대응되는 표정 및 입모양 변화에 따른 특징점의 이동값을 추출하여 이미지파라미터를 생성하는 것을 특징으로 하는 대화형 디지털 액자.