KR20060084455A

KR20060084455A - 정보처리장치, 전자페트장치 및 정보처리방법

Info

Publication number: KR20060084455A
Application number: KR1020067013437A
Authority: KR
Inventors: 사토시 후지무라; 나오히로 요코오; 야스히코 가토
Original assignee: 소니 가부시끼 가이샤
Priority date: 1998-12-24
Filing date: 1999-12-24
Publication date: 2006-07-24
Also published as: CN1551047A; EP1748421A3; EP1750252A2; EP1748421A2; CN1291112A; DE69935909D1; EP1072297A4; EP1750252A3; CN1549201A; EP1072297B1; CN1549199A; CN1253810C; CN1202511C; KR100702645B1; DE69935909T2; WO2000038808A1; KR100751957B1; EP1748421B1; JP2000187435A; CN1252620C

Abstract

정보처리장치, 휴대기기, 전자페트장치, 정보처리수순을 기록한 기록매체 및 정보처리방법에 있어서, 네트워크에 접속하여 여러가지의 데이터를 송수(送受)하고, 또 음성에 의해 단어를 등록할 수 있도록 하고, 또 사용자 인증에 의해 응답을 상이하게 하고, 또 음성 입력과 응답을 분류하여 이 분류에 의해 응답을 생성하고, 또한 과거의 이력에 의해 감정을 변화시키도록 했다.

정보처리장치, 타이머, 음성인식부, 등록부, 인식데이터.

Description

정보처리장치, 전자페트장치 및 정보처리방법 {INFORMATION PROCESSOR, ELECTRONIC PET DEVICE AND INFORMATION PROCESSING METHOD}

도 1은 본 발명의 실시형태에 관한 전자페트장치를 나타내는 기능 블록도이다.

도 2는 전자페트장치를 나타내는 평면도이다.

도 3은 도 1의 전자페트장치의 블록도이다.

도 4는 신체상태 데이터를 나타낸 도표이다.

도 5는 현재의 감정 데이터를 나타낸 도표이다.

도 6은 성격 데이터를 나타낸 도표이다.

도 7은 감정 데이터의 변화를 나타낸 도표이다.

도 8은 패턴 데이터를 나타낸 도표이다.

도 9는 음성 데이터를 나타낸 도표이다.

도 10은 화상 데이터를 나타낸 도표이다.

도 11은 네트워크와의 접속처리수순을 나타낸 플로 차트이다.

도 12는 네트워크에 송출하는 데이터의 형식을 나타낸 도표이다.

도 13은 인식데이터의 등록에 관해 전자페트장치를 상세히 나타낸 기능 블록도이다.

도 14는 음성인식처리의 설명에 제공되는 약선도이다.

도 15는 인식데이터의 등록처리수순을 나타낸 플로 차트이다.

도 16은 사용자 인증에 관해 전자페트장치를 상세히 나타낸 기능 블록도이다.

도 17은 패턴 데이터를 나타낸 도표이다.

도 18은 사용자 인증의 설명에 제공되는 도표이다.

도 19는 도 18의 질문에 의해 취득된 단어를 기준으로 한 사용자 인증의 설명에 제공되는 도표이다.

도 20은 대화의 분류처리에 관해 전자페트장치를 상세히 나타낸 기능 블록도이다.

도 21은 도 20의 분류처리에 대응하는 패턴 데이터를 나타낸 도표이다.

도 22는 대화(對話)이력을 나타낸 도표이다.

도 23은 대화이력의 다른 예를 나타낸 도표이다.

도 24는 감정의 제어에 관해 전자페트장치를 상세히 나타낸 기능 블록도이다.

도 25는 감정변화 이력을 나타낸 도표이다.

도 26은 도 25의 감정변화 이력에 의해 변화된 성격 데이터를 나타낸 도표이다.

도 27은 성격 데이터의 다른 변경예를 나타낸 도표이다.

도 28은 다른 실시형태에 관한 전자페트장치를 나타낸 블록도이다.

도 29는 휴대전화를 나타낸 평면도이다.

<도면의 주요 부분에 대한 부호의 설명>

1: 전자페트장치, 11A: 음성인식부, 11B: 타이머, 11C: 신체상태 변경부, 11D: 감정변경부, 11E: 응답문 작성부, 11F: 음성합성부, 11G: 화상합성부, 11I: 등록부, 11J: 음성인증부, 11M: 발화분류부, 16A: 인식 데이터, 16B: 신체상태 데이터, 16C: 감정 데이터, 16D: 성격 데이터, 16E: 패턴 데이터, 16F: 대화이력, 16G: 지식, 16H: 음성 데이터, 16I: 화상 데이터, 16J: 인증상태, 16K: 인증 데이터, 16M: 분류 룰, 16N: 감정변경이력, 17: 네트워크 접속부.

본 발명은 정보처리장치, 휴대기기, 전자페트장치, 정보처리수순을 기록한 기록매체 및 정보처리방법에 관한 것이며, 예를 들면 휴대전화, 퍼스널 컴퓨터 등의 각종 정보기기에 적용할 수 있다. 본 발명은 응답의 생성에 필요한 각종 데이터를 네트워크를 통해 교환함으로써, 또 음성으로 단어 등을 등록할 수 있도록 하는 것 등에 의해, 한층 신변에 친밀해지기 쉬운 전자페트장치, 전자페트를 가지는 정보처리장치, 휴대기기, 정보처리수순을 기록한 기록매체 및 정보처리방법을 제안한다.

종래, 퍼스널 컴퓨터에 있어서는, 이른바 육성(育成) 시뮬레이션 게임 소프 트웨어가 제안되어 있다. 이 육성 시뮬레이션 게임은 컴퓨터에 의한 가상 현실공간에서 페트(pet)(이른바 전자페트임)를 사육하는 게임이며, 실제로 동물인 페트를 사육하는 경우에 비해 간단히 페트와의 교류를 도모할 수 있다.

그런데, 실제의 페트에 있어서는, 그 날의 신체상태, 주위의 환경 등에 의해 여러가지로 상이한 거동을 나타낸다. 또, 사육주 자체에 대해서도 이를 인식하여, 사육주와 사육주 이외에서는 상이한 거동을 나타낸다. 또한, 학습에 의해 거동이 변화하는 일도 있다.

이들 실제의 페트에서의 각종 거동을 전자페트에서도 재현할 수 있다면, 전자페트를 한층 신변에 친밀해지기 쉬운 것으로 할 수 있다고 생각된다.

본 발명은 이상의 점을 고려하여 이루어진 것이며, 더 한층 신변에 친밀해지기 쉬운 것으로 할 수 있는 전자페트장치, 전자페트를 가지는 정보처리장치, 휴대기기, 정보처리수순을 기록한 기록매체 및 정보처리방법을 제안하려고 하는 것이다.

이러한 과제를 해결하기 위해 본 발명에서는, 정보처리장치, 휴대기기 또는 전자페트장치에 적용하여, 소정의 인식 룰에 따라 음성인식결과를 출력하는 음성인식수단과, 소정의 감정 파라미터 생성 룰에 따라, 최소한 음성인식결과와 시간 경과에 따라 변화되는, 의사적(擬似的)으로 감정을 나타내는 감정 파라미터를 생성하는 감정생성수단과, 최소한 감정 파라미터를 기준으로 한 소정의 응답생성 룰에 따라, 음성인식결과에 대응하는 응답을 생성하는 응답생성수단에 관한 것이며, 소정 의 네트워크에 접속하여, 인식 룰, 감정 파라미터 생성 룰 또는 응답생성 룰의 갱신처리를 실행하는 통신수단, 또는 인식 룰, 감정 파라미터 생성 룰 또는 응답생성 룰에 필요한 데이터의 갱신처리를 실행하는 통신수단을 가지도록 한다.

또, 정보처리장치, 휴대기기 또는 전자페트장치에 적용하여, 소정의 네트워크에 접속하고 최소한 감정 파라미터, 또는 감정 파라미터의 생성에 필요한 데이터를 취득하는 통신수단을 가지도록 하고, 응답생성수단이 이 통신수단에 의해 취득한 감정파라미터에 의한 응답, 또는 통신수단에 의해 취득한 데이터로부터 생성된 감정파라미터에 의한 응답을 출력하도록 한다.

또, 정보처리수순을 기록한 기록매체에 적용하여, 소정의 네트워크에 접속하고, 인식 룰, 감정 파라미터 생성 룰 또는 응답생성 룰의 갱신처리를 실행하는 통신처리, 또는 인식 룰, 감정 파라미터 생성 룰 또는 응답생성 룰에 필요한 데이터의 갱신처리를 실행하는 통신처리가 기록되어 이루어지도록 한다.

또, 정보처리수순을 기록한 기록매체에 적용하여, 소정의 네트워크에 접속하고, 최소한 감정 파라미터 또는 감정 파라미터의 생성에 필요한 데이터를 취득하는 통신처리가 기록되고, 응답생성처리가, 통신처리에 의해 취득된 감정 파라미터에 의한 응답, 또는 통신처리에 의해 취득된 데이터로부터 생성된 감정 파라미터에 의한 응답을 출력하는 처리이도록 한다.

또, 정보처리방법에 적용하여, 소정의 네트워크에 접속하고, 인식 룰, 감정 파라미터 생성 룰 또는 응답생성 룰의 갱신처리를 실행하는 통신처리, 또는 인식 룰, 감정 파라미터 생성 룰 또는 응답 생성 룰에 필요한 데이터의 갱신처리를 실행 하는 통신처리를 가지도록 한다.

또, 정보처리방법에 적용하여, 소정의 네트워크에 접속하고, 최소한 감정 파라미터 또는 감정 파라미터의 생성에 필요한 데이터를 취득하는 통신처리를 가지도록 하고, 응답생성처리가 통신처리에 의해 취득된 감정 파라미터에 의한 응답, 또는 통신처리에 의해 취득된 데이터로부터 생성된 감정 파라미터에 의한 응답을 출력하는 처리이도록 한다.

또, 정보처리장치, 휴대기기 또는 전자페트장치에 적용하여, 등록의 동작 모드에 있어서, 음성인식결과에 따라 최소한 데이터 베이스에 단어의 음성인식결과를 등록함으로써, 음성에 의해 데이터 베이스를 변경 가능한 등록수단을 구비하도록 한다.

또, 정보처리수순을 기록한 기록매체에 적용하여, 등록의 동작 모드에 있어서, 음성인식결과에 따라 최소한 데이터 베이스에 단어의 음성인식결과를 등록함으로써, 음성에 의해 데이터 베이스를 변경 가능한 등록처리를 기록하도록 한다.

또, 정보처리방법에 적용하여, 등록의 동작 모드에 있어서, 음성인식결과에 따라 최소한 데이터 베이스에 단어의 음성인식결과를 등록함으로써, 음성에 의해 데이터 베이스를 변경 가능한 등록처리를 가지도록 한다.

또, 정보처리장치, 휴대기기 또는 전자페트장치에 적용하여, 음성에 따라 사용자를 인증하는 사용자인증수단을 구비하도록 하고, 응답생성수단은 사용자인증수단의 인증결과에 의거하여, 음성입력자에 따라 응답을 상이하게 하도록 한다.

또, 정보처리수순을 기록한 기록매체에 적용하여, 음성에 따라 사용자를 인 증하는 사용자인증처리가 기록되고, 응답생성처리는 사용자인증처리의 인증결과에 의거하여, 음성입력자에 따라 응답을 상이하게 하도록 한다.

또, 정보처리방법에 적용하여, 음성에 따라 사용자를 인증하는 사용자인증처리를 가지도록 하고, 응답생성처리가 사용자인증처리의 인증결과에 의거하여, 음성입력자에 따라 응답을 상이하게 하도록 한다.

또, 정보처리장치, 휴대기기 또는 전자페트장치에 적용하여, 소정의 응답생성 룰에 따라, 음성인식결과에 대응하는 응답을 생성하는 데 대하여, 음성에 따라 음성에 의한 입력의 종류를 식별하는 발화(發話)분류수단을 구비하도록 하고, 응답생성 룰이 입력의 종류에 따르며 입력의 종류에 대응하는 응답의 분류에 따라, 소정 종류의 응답을 제외하는 응답을 생성하는 룰 이도록 한다.

또, 정보처리수순을 기록한 기록매체에 적용하여, 소정의 응답생성 룰에 따라, 음성인식결과에 대응하는 응답을 생성하는 데 대하여, 음성에 따라 음성에 의한 입력의 종류를 식별하는 발화분류처리를 기록하도록 하고, 응답생성 룰은 입력의 종류에 따라 입력의 종류에 대응하는 응답의 분류에 따라, 소정 종류의 응답을 제외하는 응답을 생성하는 룰 이도록 한다.

또, 정보처리방법에 적용하여, 소정의 응답생성 룰에 따라, 음성인식결과에 대응하는 응답을 생성하는 정보처리수순에 대하여, 음성에 따라 음성에 의한 입력의 종류를 식별하도록 하고, 응답생성 룰이 입력의 종류에 따르며 입력의 종류에 대응하는 응답의 분류에 따라, 소정 종류의 응답을 제외하는 응답을 생성하는 룰이도록 한다.

또, 정보처리장치, 휴대기기 또는 전자페트장치에 적용하여, 최소한 음성인식결과와 대응하는 감정 파라미터에 의한 이력을 기록하는 이력기록수단을 가지도록 하고, 음성인식결과에 대한 감정 파라미터의 변화를 이력에 따라 변화시키도록 한다.

또, 정보처리수순을 기록한 기록매체에 적용하여, 최소한 음성인식결과와 대응하는 감정 파라미터에 의한 이력을 기록하는 이력기록처리가 기록되어 이루어지도록 하고, 음성인식결과에 대한 감정 파라미터의 변화를 이력에 따라 변화시키도록 한다.

또, 정보처리방법에 적용하여, 최소한 음성인식결과와 대응하는 감정 파라미터에 의한 이력을 기록하는 이력기록수단을 가지도록 하고, 음성인식결과에 대한 감정 파라미터의 변화를 이력에 따라 변화시키도록 한다.

정보처리장치, 휴대기기 또는 전자페트장치에 적용하여, 소정의 인식 룰에 따라 음성인식결과를 출력하는 음성인식수단과, 소정의 감정 파라미터 생성 룰에 따라, 최소한 음성인식결과와 시간경과에 의해 변화되는, 의사적으로 감정을 나타내는 감정 파라미터를 생성하는 감정생성수단과, 최소한 감정 파라미터를 기준으로 한 소정의 응답생성 룰에 따라, 음성인식결과에 대응하는 응답을 생성하는 응답생성수단에 관한 것이며, 소정의 네트워크에 접속하여, 인식 룰, 감정 파라미터 생성 룰 또는 응답생성 룰의 갱신처리를 실행하는 통신수단, 또는 인식 룰, 감정 파라미터 생성 룰 또는 응답생성 룰에 필요한 데이터의 갱신처리를 실행하는 통신수단을 가지도록 하면, 이 통신수단에 의해 응답의 생성에 필요한 각종 데이터를 송출할 수 있다. 따라서, 이 네트워크에 접속된 동종의 기기(機器)에 있어서, 이 정보처리장치 등에서의 음성입력에 대한 응답과 거의 동일한 응답을 생성할 수 있고, 이에 따라 마치 전자페트를 외부의 기기로 데리고 나간 것 같이 취급할 수 있어, 동물의 페트를 실제로 사육하고 있는 경우와 같이 전자페트를 친밀해지기 쉬운 것으로 할 수 있다.

또, 정보처리장치, 휴대기기 또는 전자페트장치에 적용하여, 소정의 네트워크에 접속하여, 최소한 감정 파라미터 또는 감정 파라미터의 생성에 필요한 데이터를 취득하는 통신수단을 가지도록 하고, 응답생성수단이 이 통신수단에 의해 취득한 감정 파라미터에 의한 응답, 또는 통신수단에 의해 취득한 데이터로부터 생성된 감정파라미터에 의한 응답을 출력하면, 네트워크에 접속된 동종의 기기에서의 응답과 거의 동일한 응답을 생성할 수 있고, 이에 따라 마치 이 네트워크에 접속된 동종의 기기로부터 전자페트를 데리고 나간 것같이 취급할 수 있어, 동물의 페트를 실제로 사육하고 있는 경우와 같이 전자페트를 친밀해지기 쉬운 것으로 할 수 있다. 또, 필요에 따라 판별 가능한 단어를 증대시키는 등에 의해 지식을 증대시킬 수도 있다.

또, 정보처리수순을 기록한 기록매체에 적용하여, 소정의 네트워크에 접속하고, 인식 룰, 감정 파라미터 생성 룰 또는 응답생성 룰의 갱신처리를 실행하는 통신처리, 또는 인식 룰, 감정 파라미터 생성 룰 또는 응답생성 룰에 필요한 데이터의 갱신처리를 실행하는 통신처리가 기록되어 이루어지도록 하면, 네트워크에 접속된 동종의 기기에서, 이 기록매체에 의한 처리수순을 실행하는 장치의 음성입력에 대한 응답과 거의 동일한 응답을 생성할 수 있고, 이에 따라 마치 전자페트를 외부의 기기로 데리고 나간 것 같이 취급할 수 있어, 동물의 페트를 실제로 사육하고 있는 경우와 같이 전자페트를 친밀해지기 쉬운 것으로 할 수 있다.

또, 정보처리수순을 기록한 기록매체에 적용하여, 소정의 네트워크에 접속하고, 최소한 감정 파라미터 또는 감정 파라미터의 생성에 필요한 데이터를 취득하는 통신처리가 기록되고, 응답생성처리가, 통신처리에 의해 취득된 감정 파라미터에 의한 응답, 또는 통신처리에 의해 취득된 데이터로부터 생성된 감정 파라미터에 의한 응답을 출력하는 처리이도록 하면, 이 기록매체에 의한 처리수순을 실행하는 장치에서, 네트워크에 접속된 동종 기기의 응답과 거의 동일한 응답을 생성할 수 있고, 이에 따라 동물의 페트를 실제로 사육하고 있는 경우와 같이, 마치 이 네트워크에 접속된 동종의 기기로부터 전자페트를 데리고 나간 것 같이 취급할 수 있어, 전자페트를 친밀해지기 쉬운 것으로 할 수 있다. 또, 필요에 따라 판별 가능한 단어를 증대시키는 등에 의해 지식을 증대시킬 수도 있다.

또, 정보처리방법에 적용하여, 소정의 네트워크에 접속하고, 인식 룰, 감정 파라미터 생성 룰 또는 응답생성 룰의 갱신처리를 실행하는 통신처리, 또는 인식 룰, 감정 파라미터 생성 룰 또는 응답 생성 룰에 필요한 데이터의 갱신처리를 실행하는 통신처리를 가지도록 하면, 네트워크에 접속된 기기에서, 이 정보처리방법을 실행하는 장치의 음성입력에 대한 응답과 거의 동일한 응답을 생성할 수 있고, 이에 따라 동물의 페트를 실제로 사육하고 있는 경우와 같이, 마치 전자페트를 외부의 기기로 데리고 나간 것 같이 취급할 수 있어, 전자페트를 친밀해지기 쉬운 것으 로 할 수 있다.

또, 정보처리방법에 적용하여, 소정의 네트워크에 접속하고, 최소한 감정 파라미터 또는 감정 파라미터의 생성에 필요한 데이터를 취득하는 통신처리를 가지도록 하고, 응답생성처리가 통신처리에 의해 취득된 감정 파라미터에 의한 응답, 또는 통신처리에 의해 취득된 데이터로부터 생성된 감정 파라미터에 의한 응답을 출력하는 처리이도록 하면, 이 정보처리방법을 실행하는 장치에서, 네트워크에 접속된 동종 기기의 응답과 거의 동일한 응답을 생성할 수 있고, 이에 따라 동물의 페트를 실제로 사육하고 있는 경우와 같이, 마치 이 네트워크에 접속된 동종의 기기로부터 전자페트를 데리고 나간 것 같이 취급할 수 있다. 또, 필요에 따라 판별 가능한 단어의 증대 등에 의해 지식을 증대시킬 수도 있다.

또, 정보처리장치, 휴대기기 또는 전자페트장치에 적용하여, 등록의 동작 모드에 있어서, 음성인식결과에 따라 최소한 데이터 베이스에 단어의 음성인식결과를 등록함으로써, 음성에 의해 데이터 베이스를 변경 가능한 등록수단을 구비하도록 하면, 음성에 의해 전자페트가 인식 가능한 어휘를 간단히 늘릴 수 있다. 이에 따라, 실제로 사육하고 있는 동물의 페트에게 예의 범절을 가르치도록 전자페트를 취급할 수 있어, 전자페트를 친밀해지기 쉬운 것으로 할 수 있다.

또, 정보처리수순을 기록한 기록매체에 적용하여, 등록의 동작 모드에 있어서, 음성인식결과에 따라 최소한 데이터 베이스에 단어의 음성인식결과를 등록함으로써, 음성에 의해 데이터 베이스를 변경 가능한 등록처리를 기록하도록 하면, 이 기록매체에 의한 처리수순을 실행하는 장치에서, 전자페트가 인식 가능한 어휘를 음성에 의해 간단히 늘릴 수 있다. 이에 따라, 실제로 사육하고 있는 동물의 페트에게 예의 범절을 가르치도록 전자페트를 취급할 수 있어, 전자페트를 친밀해지기 쉬운 것으로 할 수 있다.

또, 정보처리방법에 적용하여, 등록의 동작 모드에서, 음성인식결과에 따라 최소한 데이터 베이스에 단어의 음성인식결과를 등록함으로써, 최소한 음성에 의해 데이터 베이스를 변경 가능한 등록처리를 가지도록 하면, 이 정보처리방법의 실행에 의해, 전자페트가 인식 가능한 어휘를 음성에 의해 간단히 늘릴 수 있다. 이에 따라, 실제로 사육하고 있는 동물의 페트에게 예의 범절을 가르치도록 전자페트를 취급할 수 있어, 전자페트를 친밀해지기 쉬운 것으로 할 수 있다.

또, 정보처리장치, 휴대기기 또는 전자페트장치에 적용하여, 음성에 따라 사용자를 인증하는 사용자인증수단을 구비하도록 하고, 응답생성수단이 사용자인증수단의 인증결과에 의거하여, 음성입력자에 따라 응답을 상이하게 하도록 하면, 전자페트의 응답을, 예를 들면 사육주와 그 이외의 사람으로 상이하게 하도록 할 수 있다. 이에 따라, 동물의 페트와 같은 거동을 실현하여, 전자페트를 한층 신변에 친밀해지 쉬운 것으로 할 수 있다.

또, 정보처리수순을 기록한 기록매체에 적용하여, 음성에 따라 사용자를 인증하는 사용자인증처리가 기록되고, 응답생성처리가 사용자인증처리의 인증결과에 의거하여, 음성입력자에 따라 응답을 상이하게 하도록 하면, 전자페트의 응답을, 예를 들면 사육주와 그 이외의 사람으로 상이하게 하도록 할 수 있고, 이에 따라, 동물의 페트와 같은 거동을 실현하여, 전자페트를 한층 신변에 친밀해지 쉬운 것으 로 할 수 있다.

또, 정보처리방법에 적용하여, 음성에 따라 사용자를 인증하는 사용자인증처리를 가지도록 하고, 응답생성처리가 사용자인증처리의 인증결과에 의거하여, 음성입력자에 따라 응답을 상이하게 하도록 하면, 전자페트의 응답을, 예를 들면 사육주와 그 이외의 사람으로 상이하게 하도록 할 수 있고, 이에 따라, 동물의 페트와 같은 거동을 실현할 수 있어, 전자페트를 한층 신변에 친밀해지 쉬운 것으로 할 수 있다.

또, 정보처리장치, 휴대기기 또는 전자페트장치에 적용하여, 소정의 응답생성 룰에 따라, 음성인식결과에 대응하는 응답을 생성하는 데 대하여, 음성에 따라 음성에 의한 입력의 종류를 식별하는 발화분류수단을 구비하도록 하고, 응답생성 룰이 입력의 종류에 따르며 입력의 종류에 대응하는 응답의 분류에 따라, 소정 종류의 응답을 제외하는 응답을 생성하는 룰 이도록 하면, 예를 들면 질문에 대하여 되묻는 것 같은 부자연스러운 응답을 방지할 수 있다. 이에 따라 전자페트의 응답을 자연스러운 생생한 것으로 할 수 있고, 이에 따라서도 전자페트를 한층 신변에 친밀해지기 쉬운 것으로 할 수 있다.

또, 정보처리수순을 기록한 기록매체에 적용하여, 소정의 응답생성 룰에 따라, 음성인식결과에 대응하는 응답을 생성하는 정보처리수순에 대하여, 음성에 따라 음성에 의한 입력의 종류를 식별하는 발화분류수단을 기록하도록 하고, 응답생성 룰이 입력의 종류에 따르며 입력의 종류에 대응하는 응답의 분류에 따라, 소정 종류의 응답을 제외하는 응답을 생성하는 룰이도록 하면, 예를 들면 질문에 대하여 되묻는 것 같은 부자연스러운 응답을 방지할 수 있다. 이에 따라 전자페트의 응답을 자연스러운 생생한 것으로 할 수 있고, 이에 따라서도 전자페트를 한층 신변에 친밀해지기 쉬운 것으로 할 수 있다.

또, 정보처리방법에 적용하여, 소정의 응답생성 룰에 따라, 음성인식결과에 대응하는 응답을 생성하는 정보처리하는 데 대하여, 음성에 따라 음성에 의한 입력의 종류를 식별하도록 하고, 응답생성 룰이 입력의 종류에 따르며 입력의 종류에 대응하는 응답의 분류에 따라, 소정 종류의 응답을 제외하는 응답을 생성하는 룰이도록 하면, 예를 들면 질문에 대하여 되묻는 것 같은 부자연스러운 응답을 방지할 수 있다. 이에 따라 전자페트의 응답을 자연스러운 생생한 것으로 할 수 있고, 이에 따라서도 전자페트를 한층 신변에 친밀해지기 쉬운 것으로 할 수 있다.

또, 정보처리장치, 휴대기기 또는 전자페트장치에 적용하여, 최소한 음성인식결과와 대응하는 감정 파라미터에 의한 이력을 기록하는 이력기록수단을 가지도록 하고, 음성인식결과에 대한 감정 파라미터의 변화를 이력에 따라 변화시키도록 하면, 예를 들면 빈번하게 발생되는 음성에 대하여 익숙해져, 친밀감 등의 감정이 깃든 응답을 형성할 수 있다. 이에 따라, 전자페트의 응답을 자연스러운 생생한 것으로 할 수 있고, 이에 따라서도 전자페트를 한층 신변에 친밀해지기 쉬운 것으로 할 수 있다.

또, 정보처리수순을 기록한 기록매체에 적용하여, 최소한 음성인식결과와 대응하는 감정 파라미터에 의한 이력을 기록하는 이력기록처리가 기록되어 이루어지도록 하고, 음성인식결과에 대한 감정 파라미터의 변화를 이력에 따라 변화시키도 록 하면, 예를 들면 빈번하게 발생되는 음성에 대하여 익숙해져, 친밀감 등의 감정이 깃든 응답을 형성할 수 있다. 이에 따라, 전자페트의 응답을 자연스러운 생생한 것으로 할 수 있고, 이에 따라서도 전자페트를 한층 신변에 친밀해지기 쉬운 것으로 할 수 있다.

또, 정보처리방법에 적용하여, 최소한 음성인식결과와 대응하는 감정 파라미터에 의한 이력을 기록하는 이력기록수단을 가지도록 하고, 음성인식결과에 대한 감정 파라미터의 변화를 이력에 따라 변화시키도록 해도, 예를 들면 빈번하게 발생되는 음성에 대하여 익숙해져, 친밀감 등의 감정이 깃든 응답을 형성할 수 있다. 이에 따라, 전자페트의 응답을 자연스러운 생생한 것으로 할 수 있고, 이에 따라서도 전자페트를 한층 신변에 친밀해지기 쉬운 것으로 할 수 있다.

[실시예]

이하, 도면에 대하여, 본 발명의 한 실시형태를 상술한다.

(1) 제1 실시형태

(1-1) 제1 실시형태의 전체 구성

도 2는 본 발명의 제1 실시형태에 관한 전자페트장치를 나타낸 평면도이다. 이 전자페트장치(1)는 상단면에 인출 가능하게 안테나(2)가 배치되고, 정면 상부에 액정표시패널(3)이 배치된다. 전자페트장치(1)는 이 액정표시패널(3)에 전자페트의 모습, 전자페트로부터의 메시지가 표시되도록 되어 있다. 또, 전자페트장치(1)는 이 액정표시패널(3)의 하측에, 결정, 캔슬(cancel)의 조작자(4A 및 4B), 커서의 조작자(5)가 배치되고, 이들의 조작에 의해 동작 모드 등을 변환할 수 있도록 되어 있다.

또한, 전자페트장치(1)는 결정, 캔슬의 조작자(4A 및 4B)의 하측에, 스피커(6) 및 마이크(7)가 배치되고, 스피커(6) 및 마이크(7)를 사용하여 전자페트와 회화할 수 있도록 되어 있다. 또한, 전자페트장치(1)는 IC 카드(8)를 장착할 수 있도록 배면측에 소켓이 배치된다.

도 3은 이 전자페트장치(1)를 나타내는 블록도이다. 전자페트장치(1)에서, 아날로그디지털 변환회로(A/D)(10)는 도시하지 않은 증폭회로를 통해 마이크(7)로부터 얻어지는 음성신호를 입력하고, 이 음성신호를 아날로그디지털 변환처리하여 음성 데이터(DA)를 생성한다. 아날로그디지털 변환회로(10)는 이 음성 데이터(DA)를 중앙처리유닛(CPU)(11)으로 출력한다. 이에 따라, 전자페트장치(1)에서는 사용자의 음성을 중앙처리유닛(11)에 의해 해석할 수 있도록 되어 있다.

디지털아날로그 변환회로(D/A)(12)는 중앙처리유닛(11)으로부터 출력되는 음성 데이터(DB)를 디지털아날로그 변환회로처리하여 음성신호를 생성하고, 이 음성신호를 스피커(6)로부터 출력한다. 이에 따라, 전자페트장치(1)에서는 전자페트의 응답 등을 음성에 의해 확인할 수 있도록 되어 있다.

모니터 인터페이스(모니터 I/F)(13)는 중앙처리유닛(11)의 제어에 의해 버스를 통해 입력되는 화상 데이터(DV)에 의해 액정표시패널(3)을 구동하고, 이에 따라, 액정표시패널(3)에 전자페트의 화상을 표시한다.

키 인터페이스(키 I/F)(14)는 조작자(4A, 4B, 5)의 조작을 검출하여 중앙처리유닛(11)에 통지한다. 리드온리 메모리(read-only memory)(ROM)(15)는 중앙처리 유닛(11)의 처리 프로그램, 마이크(7)로부터 취득되는 음성의 해석에 필요한 각종 데이터 등을 격납하고, 중앙처리유닛(11)의 제어에 의해 이들 유지된 데이터를 출력한다. 랜덤액세스 메모리(random-access memory)(RAM)(16)는 중앙처리유닛(11)의 워크 에어리어를 구성하여, 중앙처리유닛(11)의 처리에 필요한 각종 데이터를 일시 유지한다.

네트워크 접속부(17)는 중앙처리유닛(11)의 제어에 의해 전화회선을 통해 소정의 네트워크(18)에 접속되고, 이 네트워크(18)와의 사이에서 여러가지의 데이터(DT)를 교환함으로써 필요에 따라 랜덤액세스 메모리(16)의 내용 등을 갱신하고, 또한 이 랜덤액세스 메모리(16)에 격납한 데이터를 네트워크를 통해 원하는 단말로 송출한다. 이에 따라, 전자페트장치(1)에서는 전자페트의 사육, 교육에 필요한 각종 데이터를 필요에 따라 취득할 수 있도록 되고, 또한 전자페트를 여러가지의 환경으로 데리고 나가고, 또 이와는 거꾸로 외부 기기의 전자페트를 사육할 수 있도록 되어 있다.

IC 카드(8)는 착탈 가능한 외부기억장치이며, 필요에 따라 랜덤액세스 메모리(16)의 내용 등을 갱신하고, 또한 이 랜덤액세스 메모리(16)에 격납한 데이터를 기록한다. 이에 따라, 전자페트장치(1)에서는, IC 카드(8)를 다른 기기 간에 교환하여 각종 데이터를 주고 받음으로써, 전자페트의 사육, 교육에 필요한 각종 데이터를 필요에 따라 취득할 수 있도록 되고, 또한 전자페트를 여러가지의 환경으로 데리고 나가고, 또 이와는 거꾸로 외부 기기의 전자페트를 사육할 수 있도록 되어 있다.

도 1은 이들 전자페트장치(1)에 관한 기본적인 구성을 기능 블록에 의해 나타낸 블록도이다. 그리고, 이 도 1에 나타낸 기능 블록에서, 직사각형 형상에 의해 에워싸고 나타낸 기능 블록은 중앙처리유닛(11)이 리드온리 메모리(15)에 기록된 처리 프로그램을 실행하여 형성되는 기능 블록이며, 자기 디스크의 심볼에 의해 나타낸 기능 블록은 리드온리 메모리(15), 랜덤액세스 메모리(16), IC 카드(8)에 의해 형성되는 기능 블록이다.

이 전자페트장치(1)에서, 음성인식부(11A)는 소정의 인식 룰에 따라 음성 데이터(DA)를 음성인식 처리하고, 그 음성인식결과를 출력한다. 즉, 음성인식부(11A)는 HMM(Hidden Marcov Model)법에 의해 순차 입력되는 음성 데이터(DA)에 의한 음성을 음운에 의해 구획하고, 이 음운의 열에 의해 인식 데이터(16A)를 참조한다. 음성인식부(11A)는 이 참조 결과에 따라 음성데이터(DA)에 의한 단어, 문언(文言)이 사전(事前)에 등록된 단어, 문언의 경우, 이들 단어, 문언에 의한 텍스트 데이터를 인식 결과로서 출력한다. 이렇게 하는 데 대하여, 인식 데이터(16A)는 단어, 문언의 텍스트 데이터와 대응하는 음운의 열이 쌍을 형성하도록 하여 기록된 데이터 베이스이다. 이에 따라, 전자페트장치(1)는, 예를 들면, 사용자가 「좋은 아이구나」라고 마이크(7)로 향해 말했을 때, 이 음성을 인식하여 「좋은 아이구나」라고 하는 내용의 텍스트 문자열로 변환하고, 이들에 의해 음성에 의한 입력을 문자열에 의한 입력으로 변환하여 처리하도록 되어 있다.

타이머(11B)는 일정한 시간 간격에 의해 신체상태 변경부(11C) 및 감정변경부(11D) 등을 기동한다.

신체상태 변경부(11C)는 음성인식결과에 의해, 또 이 타이머(11B)의 기동에 의해, 신체상태 데이터(16B)를 갱신한다. 여기에서, 신체상태 데이터(16B)에는 현재의 전자페트의 신체상태를 나타내는 변수가 기록되도록 되어 있다. 그리고, 이 실시형태에서, 신체상태(16B)에는 도 4에 나타낸 바와 같이, 현재의 신체상태를 「피로」, 「허기」, 「갈증」, 「병」, 「졸음」의 5개 요소에 의해 분류하고, 각 요소에 할당한 값이 클수록, 신체상태에 차지하는 각 요소가 커지도록 되어 있다. 따라서, 도 4에 나타낸 예에서는, 현재 피로해 있고, 허기도 심하게 된다.

신체상태 변경부(11C)는 타이머(11B)의 기동에 의해 신체상태 데이터(16B)를 갱신하는 경우, 실제의 페트를 사용하는 경우의 일반적인 예에 따른 소정의 룰에 의해, 예를 들면, 「허기」, 「갈증」, 「졸음」의 변수를 순차 증대시키고, 이에 따라 시간이 경과하면 전자페트가 공복이 되도록 한다. 또, 음성인식결과에 의해 신체상태 데이터(16B)를 갱신하는 경우, 예를 들면 음성인식결과에 의해 음식물이 주어진 경우, 「허기」의 변수를 저감시키고, 또 음성인식결과에 의해 음료가 주어진 경우,「갈증」의 변수를 저감시킨다. 또한, 음성인식결과에 의해 사용자와 노는 경우에는, 서서히 「피로」의 변수를 증대시키고, 사용자에 의해 수면이 지시되면 타이머와의 연동에 의해 「졸음」의 변수를 서서히 저감한다.

감정변경부(11D)는 음성인식결과에 의해, 또 타이머(11B)의 기동에 의해, 현재의 감정 데이터(16C)를 갱신한다. 여기에서, 현재의 감정 데이터(16C)에는, 현재의 전자페트에 대하여, 의사적으로 감정을 나타내는 변수(의사감정 파라미터)가 기록되도록 되어 있다. 그리고, 이 실시형태에서는, 도 5에 나타낸 바와 같이, 현재 의 감정을 「분노」, 「슬픔」, 「기쁨」, 「두려움」, 「놀람」, 「혐오」의 6개 요소에 의해 나타내고, 각 요소에 할당한 값이 클수록, 현재의 감정을 나타내도록 되어 있다. 따라서, 도 5에 나타낸 예에서는, 현재 전자페트는 기쁨과 분노에 넘쳐있게 된다.

감정변경부(11D)는 실제의 페트를 사육하는 경우의 일반적인 예에 따른 감정 파라미터 생성 룰에 따라 이 감정 데이터(16C)를 갱신한다. 즉, 감정변경부(11D)는 타이머(11B)의 기동에 의해 감정 데이터(16C)를 갱신하는 경우, 이들 「분노」, 「슬픔」, 「기쁨」, 「두려움」, 「놀람」, 「혐오」의 6개 요소가 서서히 소정의 기준값에 근접하도록 각 요소의 변수를 갱신하고, 이에 따라 도 5에 나타낸 경우에서는, 「분노」, 「슬픔」 등의 감정이 서서히 수습되도록 한다.

이에 대하여, 감정변경부(11D)는 음성인식결과에 의해 감정 데이터(16C)를 갱신하는 경우, 음성인식결과에 의해 성격 데이터(16D)를 검색하고, 이 검색 결과에 따라 감정 데이터(16C)를 갱신한다.

여기에서, 성격 데이터(16D)는 도 6에 나타낸 바와 같이, 음성인식결과에 포함되는 문언을 키워드로 하여 감정 데이터(16C)의 값을 변경하는 데이터가 할당되어 형성되도록 되어 있다. 그리고, 도 6에서는, 예를 들면 사용자가 발생한 음성에 「좋다」라고 말하는 문언이 포함되어 있는 경우, 「분노」, 「슬픔」, 「기쁨」, 「두려움」, 「놀람」, 「혐오」의 각 변수를 값 -1, +2, +20, -5, +5, -1만큼 변경하는 취지, 「좋다」의 키워드에 대하여 감정 데이터(16C)의 값을 변경하는 데이터가 할당되어 있게 된다.

이에 따라, 감정변경부(11D)는, 예를 들면 사용자가 「좋은 아이구나」라고 발성한 경우, 도 5에 대하여 전술한 감정 데이터를 도 7에 나타내도록 갱신하게 된다. 이에 따라, 감정변경부(11D)는 소정의 감정 파라미터 생성 룰에 따라, 최소한 음성인식결과와 시간 경과에 따라 변화되는, 의사적으로 감정을 나타내는 의사감정 파라미터를 생성하는 감정생성수단을 구성한다.

응답문 작성부(11E)는 감정 데이터를 기준으로 한 소정의 응답생성 룰에 따라, 음성인식결과에 대응하는 응답을 생성한다. 패턴 데이터(16E)는 이 응답을 생성하는 룰의 집합이다. 여기에서, 이들의 룰은 도 8에 나타낸 바와 같이, 각각 음성인식결과에 포함되는 단어를 키 프레이즈에 대하여, 각 키 프레이즈가 음성 입력된 경우에는 어떠한 응답을 나타내는가가 각각 기술되어 형성된다. 또, 이 때 키 프레이즈에 따라서는, 감정 데이터(16C), 신체상태 데이터(16B)에 따라 상이한 응답을 나타내도록 기술된다. 그리고, 이 도 8에서는, 설명을 간략화하기 위해, 필요 최저한도의 룰을 나타내고, 실제의 룰에서는, 이 도 8에 나타낸 조건 이외(후술하는 속성 등)의 조건이 기술된다. 그리고, 신체상태 데이터(16B)에 대해서도, 이 도 8의 룰 2와 같이 신체상태 데이터(16B)만의 조건에 의해, 또 감정 데이터(16C)와의 조합에 의해 룰이 기술된다. 즉, 도 8에서의 룰 1에서는, 「사랑하고 있어」 또는 「네가 좋아」라는 문언이 입력된 경우에는, 사용자 인증된 음성입력에 대해서는 「나도 사랑하고 있어」 또는 「와, 나, 나는 수컷인데」의 문언을 무작위로 출력하는 것을, 또 사용자 인증되어 있지 않은 음성입력에 대해서는 「이상한 사람」 또는 「당신은 누구?」의 문언을 무작위로 출력하는 것을 나타내고 있다. 또, 룰 2 에서는, 「안녕하세요」 또는 「헬로」라는 문언이 입력된 경우에는, 감정 데이터의 각 요소 「분노」, 「슬픔」, 「기쁨」, 「두려움」, 「놀람」, 「혐오」에 따라 각각 할당된 「시끄럽구나」, 「뭐라고?」, 「안녕」, 「와아 놀랐다」, 「어머 참」, 「불렀어?」의 문언 중에서, 가장 값이 큰 변수가 일정값을 초과하고 있는 경우에, 이 변수에 대응하는 문언을 선택적으로 출력하는 것을 나타내고 있다.

그리고, 여기에서 도 8에 나타낸 「authenticated (A) ; (B)」는 후술하는 사용자 인증 등에 의해 「TRUE」가 세트되어 있는 경우에는 (A)를, 「TRUE」가 세트되어 있지 않은 경우에는 (B)를 실행하는 뜻이며, 「random(“A ”, “B ”)」는 무작위로 A 또는 B를 실행하는 뜻이다.

이와 관련하여, 도 7에 대하여 전술한 감정 데이터에서는, 「기쁨」의 변수가 가장 값이 큼에 따라, 룰 2에서는 기쁨에 대응하는 응답 「안녕」이 선택되게 된다.

또한, 응답문 작성부(11E)는 이와 같은 감정 데이터(16C)에 의한 응답과 동일하게 하여, 키 프레이즈에 따라서는 신체상태 데이터(16B)에 따라, 또한 감정 데이터(16C) 및 신체상태 데이터(16B)에 따라 응답을 생성하고, 이에 따라 예를 들면 전자페트의 신체상태가 바람직하지 않은 경우에는, 상당한 응답을 생성하도록 되어 있다.

또, 응답문 작성부(11E)는 이와 같은 음성인식결과에 대한 응답을 대화이력(16F)에 기록하고, 필요에 따라 이 대화이력(16F)을 참고하여 응답을 생성하고, 이에 따라 사용자와의 사이의 부자연스러운 회화를 방지하도록 되어 있다. 또, 동 일하게 하여 지식(16G)을 참고로 해서 응답을 생성하고, 이에 따라 예를 들면 사용자에 의해 응답을 변환하여, 사용자 인증 등의 처리를 실행할 수 있도록 되어 있다.

음성합성부(11F)는 응답문 작성부(11E)로부터 출력되는 응답에 따라, 음성 데이터(16H)를 검색하고, 검색 결과로부터 응답에 대응하는 음색 데이터(DB)를 출력한다. 여기에서, 도 9에 나타낸 바와 같이, 음성 데이터(16H)는 각 응답에 대응하는 음성 파일이며, 예를 들면 「안녕」이라고 하는 응답문이 작성되었다고 하면 「voice0005.wav」라고 하는 음성 파일을 선택하고, 이 음성 파일에 의한 음성 데이터(DB)를 출력한다.

화상합성부(11G)는 응답문 작성부(11E)로부터 출력되는 응답에 따라, 화상 데이터(16I)를 검색하고, 검색 결과로부터 응답에 대응하는 음색 데이터(DV)를 출력한다. 여기에서, 도 10에 나타낸 바와 같이, 화상 데이터(16I)는 각 응답에 대응하는 화상 파일이며, 예를 들면 「안녕」이라고 하는 응답문이 작성되었다고 하면 「fig0005.bmp」라고 하는 비트 맵(bit map) 형성의 화상 파일을 선택하고, 이 화상 파일에 의한 화상 데이터(DV)를 출력한다.

(1-2) 네트워크와의 접속

중앙처리유닛(11)은 도 11에 나타낸 처리수순을 실행함으로써 네트워크 접속부(17)를 통해 네트워크(18)에 접속하고, 신체상태 데이터(16B), 감정 데이터(16C), 대화이력(16F)을 원하는 기기로 송출한다. 이에 따라, 이 전자페트장치(1)에서는, 이들의 데이터를 송출한 기기에서, 이 전자페트장치(1)에서의 전자페 트를 재현할 수 있도록 되어, 전자페트를 여러가지의 환경으로 데리고 나갈 수 있도록 되어 있다.

또, 이와는 거꾸로, 중앙 유닛(11)은 네트워크(18)로부터 신체상태 데이터(16B), 감정 데이터(16C), 대화이력(16F)을 취득하고, 이에 따라 다른 전자페트장치로 사유되고 있는 전자페트를 이 전자페트장치(1)로 데리고 나갈 수 있도록 되어 있다. 이 경우, 전자페트장치(1)에서, 이와 같이 하여 취득한 신체상태 데이터(16B), 감정 데이터(16C), 대화이력(16F)에 의한 처리에서는, 전술한 각 기능 블록이 각각 이 전자페트장치(1)에서 사육되고 있는 전자페트와, 외부의 기기에서 사육되고 있는 전자페트에 대하여, 동시 병렬적으로 전술한 처리를 실행함으로써, 마치 이 전자페트장치(1)에 외부로부터 다른 전자페트가 방문한 것처럼 응답을 작성한다. 그리고, 도 1에 나타낸 기능 블록에서는, 이와 같이 하여 취득한 신체상태 데이터(16B), 감정 데이터(16C), 대화이력(16F)에 의한 처리에 대해서는, 데이터의 흐름을 생략하고 나타냈다.

또한, 전자페트장치(1)는 인식 데이터(16A), 패턴 데이터(16E), 지식(16G), 음성 데이터(16H), 화상 데이터(16I)를 네트워크(18)로부터 취득하고, 이에 따라 음성인식 가능한 어휘를 증강하고, 또한 응답의 종류를 증대할 수 있도록 되어 있다. 이에 따라, 전자페트장치(1)는 이른바 전자페트를 양육하여 학습시킬 수 있도록 되어 있다.

즉, 중앙처리유닛(11)은 접속요구에 응동(應動)하여 스텝 SP1로부터 스텝 SP2로 이동하여, 이 접속요구를 접수한다. 그리고, 여기에서 접속요구는 타이 머(11B)에 의해 일정시간마다 정기적으로 발생되고, 또 사용자에 의한 조작자의 조작에 의해, 또한 네트워크(18)로부터의 부름에 의해 발생한다.

중앙처리유닛(11)은 계속해서 스텝 SP3으로 옮겨지고, 여기에서 소정의 회선접속처리를 실행하여 통신을 확립한다. 계속해서 중앙처리유닛(11)은 스텝 SP4로 이동하여, 접속요구의 내용에 따라 대응하는 각종 데이터를 송수한다. 계속해서 중앙처리유닛(11)은 스텝 SP5로 이동하여, 통신을 절단한 후, 스텝 SP6으로 이동하여 이 처리수순을 종료한다.

도 12는 이 데이터 전송의 포맷을 나타낸 도표이다. 전자페트장치(1)에서는 네트워크 접속부(17)에 배치된 인터페이스에 의해, 또 통화대상의 인터페이스에 의해, 이 포맷에 의해 전송에 기여하는 데이터가 송수된다. 여기에서 각 데이터(DT)에는, 헤더가 배치되고, 이 헤더 내에 각 데이터의 어드레스, 종류 등이 기술되고, 계속하여 전송에 기여하는 패턴 데이터(16E), 인식 데이터(16A), 음성 데이터(16H), 화상 데이터(16I) 등이 순차 필요에 따라 할당된다.

(1-3) 인식 데이터의 등록

도 13은 인식 데이터의 등록에 관해 전자페트장치(1)를 더욱 상세히 나타낸 기능 블록도이다. 이 기능 블록도에서, 등록부(11I)는 음성인식결과로부터 인식 데이터(16A)를 등록하고, 이에 따라 키 보드 등에 의해 단어를 입력하지 않아도 음성에 의해 여러가지의 단어를 전자페트에게 완전히 익히게 할 수 있도록 되어 있다.

그러므로, 음성인식부(11A)에서는 전술한 바와 같이, HMM법에 의해 음성 데이터(DA)를 처리하고, 이에 따라 음운열에 의한 인식결과를 출력한다. 즉, 음성인 식부(11A)는 일본어에 의한 음성을 음운에 의해 식별하고, 각 음운을 나타내는 식별자의 열에 의해 일본어의 발음을 기술한다. 여기에서 이들 식별자는, 「b」, 「d」, 「g」, 「p」, 「t」, 「k」, 「m」, 「n」, 「r」, 「z」, 「ch」, 「ts」, 「y」, 「w」, 「h」, 「i」, 「e」, 「a」, 「o」, 「u」, 「N」, 「ei」, 「ou」, 「s」, 「sh」, 「xy」, 「j」, 「f」, 「sil」에 의해 구성되고, 「sil」은 무음이다.

이에 따라 음성인식부(11A)는, 예를 들면 사용자가 「미캉(귤)」이라고 입력하면, 「sil m i k a N sil」의 식별자로 기술되는 음운열에 의해 음성입력을 인식한다. 그러므로, 음성인식부(11A)는 순차 입력되는 음성 데이터(DA)를 순차 처리하여 음운을 식별하는 동시에, 이 식별결과를 도 14에 나타낸 문법에 의해 처리하고, 이에 따라 식별자의 연속해서 이루어지는 음운열을 검출한다. 그리고, 이 도 14는 전술한 모든 음운의 접속을 허용하는 문법이다.

음운인식부(11A)는 보통의 동작 모드에서는, 이와 같이 하여 검출한 식별자의 열에 의해 인식 데이터(16A)를 검색하고, 이 검색결과로부터 단어, 문언의 텍스트 데이터에 의해 인식결과를 출력한다. 이에 따라 이 실시형태에서, 인식데이터(16A)에 미등록의 단어가 음성 입력된 경우, 대응하는 텍스트 데이터를 생성하는 것이 곤란하게 되어, 사용자의 질문에 바르게 응답하는 것이 곤란하게 된다.

그러므로, 이 실시형태에서, 전자페트장치(1)는 네트워크 접속부(17)를 통해 네트워크에 접속하여, 네트워크로부터 인식 데이터(16A)를 다운 로드하고, 이에 따라 전자페트를 학습시켜 사용자로부터의 여러가지의 질문에 응답할 수 있도록 되어 있다.

또한, 이 실시형태에서, 중앙처리유닛(11)은 조작자(4A, 4B)의 조작에 의해 등록 모드가 선택되면, 도 15에 나타낸 처리수순을 실행하고, 이에 따라 사용자가 음성에 의해 입력된 단어를 인식 데이터(16A)에 등록한다.

즉, 중앙처리유닛(11)은 조작자의 조작에 응동(應動)하여 스텝 SP11로부터 스텝 SP12로 이동하여 등록 모드로 들어간다. 계속해서, 중앙처리유닛(11)은 스텝 SP12로 이동하고, 화상합성부(11G)를 구동하여 액정표시패널(3)에 소정의 메시지를 표시하고, 이에 따라 사용자에게 단어의 발성을 독촉한다.

계속해서, 중앙처리유닛(11)은 스텝 SP14으로 이동하여, 순차 입력되는 음성 데이터(DA)를 순차 음운열에 의해 식별하여 음성 인식하고, 사용자가 소정의 조작자를 조작하여 음성입력의 종료를 지시하면 스텝 SP15로 이동한다.

여기에서 중앙처리유닛(11)은 음성인식결과인 음운열에 의해 음성합성부(11F)를 구동하여 사용자가 입력한 음성을 발성하고, 이에 따라 사용자에게 인식결과를 제시한다. 즉, 중앙처리유닛(11)은, 예를 들면 사용자가 「미캉」의 단어를 발생하고, 인식결과로서 「sil m i k a N sil」이 얻어지면, 이 경우 「미캉입니까?」라는 음성을 발생한다. 계속해서, 중앙처리유닛(11)은 스텝 SP16으로 이동하여, 확인의 조작자(4A) 또는 캔슬의 조작자(4B)의 조작을 검출함으로써, 확인의 입력을 접수한다.

계속해서, 중앙처리유닛(11)은 스텝 SP17로 이동하여, 캔슬의 조작자(4B)가 조작된 경우, 제시한 인식결과가 사용자에 의해 부정되었다고 판단하여 스텝 SP13 으로 되돌아가, 다시 음성입력을 접수한다. 이에 대하여 확인의 조작자(4A)가 사용자에 의해 조작된 경우, 사용자에 의해 인식결과가 긍정되었다고 판단하고, 스텝 SP18로 이동한다.

여기에서, 중앙처리유닛(11)은 계속해서 화상합성부(11G)를 구동하여 액정표시패널(3)에 소정의 메시지를 표시하고, 이에 따라 사용자에게 음성입력된 단어에 대하여, 속성(屬性)의 발성을 독촉한다. 여기에서, 속성은 단어에 의해 특정되는 대상을 분류하기 위한, 이 대상의 성질을 나타내는 키워드이며, 이 실시형태에서, 예를 들면 「미킹」은 속성이 「과일」로 분류된다.

계속해서, 중앙처리유닛(11)은 스텝 SP19로 이동하여, 순차 입력되는 음성 데이터(DA)를 순차 음운열에 의해 식별하여 음성인식하고, 사용자가 소정의 조작자를 조작하여 음성입력의 종료를 지시하면 스텝 SP20으로 이동한다.

여기에서 중앙처리유닛(11)은 음성인식결과인 음운열에 의해 음성합성부(11F)를 구동하여 사용자가 입력한 음성을 발성하고, 이에 따라 사용자에게 인식결과를 제시한다. 즉, 중앙처리유닛(11)은, 예를 들면 사용자가 「미캉」의 단어를 발생한 후, 속성으로서 「과일」을 입력하면, 이 경우 「과일입니까?」라는 음성을 발생한다. 계속해서, 중앙처리유닛(11)은 스텝 SP21로 이동하여, 확인의 조작자(4A) 또는 캔슬의 조작자(4B)의 조작을 검출함으로써, 확인의 입력을 접수한다.

계속해서, 중앙처리유닛(11)은 스텝 SP22로 이동하여, 캔슬의 조작자(4B)가 조작된 경우, 제시한 인식결과가 사용자에 의해 부정되었다고 판단하여 스텝 SP18으로 되돌아가, 속성에 대하여 다시 음성입력을 접수한다. 이에 대하여 확인의 조 작자(4A)가 사용자에 의해 조작된 경우, 사용자에 의해 인식결과가 긍정되었다고 판단하고, 스텝 SP23으로 이동한다.

여기에서, 중앙처리유닛(11)은 단어에 대해서는 인식데이터(16A)에 등록하고, 속성에 대해서는 지식(16G)에 등록한 후, 스텝 SP24로 이동하여 이 처리수순을 종료한다.

여기에서, 지식(16G)은 지식 데이터(16A)에 등록된 각 단어, 문언에 대하여, 과일, 음료 등의 분류를 나타내는 속성의 데이터가 기록되도록 되어 있다. 이에 따라, 중앙처리유닛(11)에서는, 패턴 데이터(16E)에 속성의 기술을 포함함으로써, 예를 들면 사용자에 대하여 「좋아하는 음식은 무엇입니까?」라고 질문하고, 이 질문에 대한 사용자로부터의 「미캉이 좋아」의 회답에 대하여, 「나는 미캉이 싫습니다」라는 응답을 발생할 수 있도록 되어 있다.

그리고, 지식(16G)은 이들 속성 외에, 전자페트장치(1)의 소유주인 사육주의 이름, 취미, 네트워크(18)로부터 가져오는 일기예보 등의 각종 데이터가 기록되고, 필요에 따라 이들 정보를 사용자와의 대화에 이용할 수 있도록 되어 있다. 즉, 예를 들면 사용자가 「오늘의 날씨는?」라고 질문한 경우, 「오늘」, 「날씨」를 키 프레이즈로 한 룰에 의해 「맑습니다」 등의 응답을 발생할 수 있도록 되어 있다.

또, 전자페트장치(1)에서는 이와 같이 하여 음성입력에 의해 인식 데이터(16A)를 등록한 후, 이 음성입력에 대응하는 올바른 텍스트(전술한 예에서는 「미캉」을 기술한 텍스트)가 존재하지 않음으로써, 인증결과인 텍스트 데이터에서, 대응하는 단어, 문언에 대해서는 음운열의 식별자인 알파벳의 표기(전술한 예에서 는 「sil m i k a N sil」의 표기)에 의해 이들 인식 데이터(16A)의 단어, 문언을 기술하여 처리하도록 되어 있다. 또, 네트워크(18)로부터의 다운로드에 의해 필요에 따라 이 텍스트를 보충하고, 보충한 후에는 음운열의 식별자에 대신하여 본래의 텍스트에 의해 인증결과를 처리하도록 되어 있다.

이에 따라, 전자페트장치(1)에서는 음성입력에 의해 등록된 단어, 문언에 의한 인식 데이터(16A)에 대해서도, 네트워크(18)로부터 다운로드한 단어, 문언에 의한 인식 데이터(16A), 사전에 등록되어 있는 단어, 문언에 의한 인식 데이터(16A)와 동일하게 처리하여 사용자와 대화할 수 있도록 되어 있다.

(1-4) 사용자 인증

도 16은 사용자 인증에 관해 전자페트장치(1)를 더욱 상세히 나타낸 기능 블록도이다. 이 기능 블록도에서, 인증 데이터(16K)는 사전의 설정에 의해 사용자명이 기록된다. 그리고, 이 기록은 음성인식결과에 의해, 또는 구입 시에 실행되는 초기설정처리에서의 외부기기로부터의 키보드 입력 등에 의해 실행된다.

응답문 작성부(11E)는, 예를 들면 도 17에 나타낸 패턴 데이터(16E)의 룰 1에 따라, 「어흥-」의 음성이 입력된 경우, 「당신은 정말 주인님?」이란 응답을 돌려준다.

음성인증부(11J)는 룰 2에 따라 「$USER」에 의해 정의되는 사전에 등록된 사용자명이 음성입력된 경우이며(myLast-Utter), 직전의 응답문 작성부(11E)에 의해 「당신은 정말 주인?」의 문언을 포함하는 응답이 이루어지고 있는 경우, 함수 「authenticated」에 의한 변수를 「TRUE」에 세트한다(set authenticated(TRUE)).

이렇게 하는 데 대하여 음성인증부(11J)는 음성인식결과로부터 인증 데이터(16K)를 검색하여, 이와 같은 조건이 만족되는 경우에, 음성입력한 사람이 사용자라고 인증하고, 인증상태(16J)를 사용자 인증한 상태로 세트한다. 또, 전술한 조건이 만족되지 않은 경우에는 인증상태(16J)를 사용자 인증되어 있지 않은 상태로 세트한다. 그리고, 이 경우에 있어서, 사용자 인증된 경우에는 룰 2에 따라 응답문 작성부(11E)에 의해 「아하, 주인님」이라는 응답이 발생되게 된다.

이에 따라, 전자페트장치(1)에서는, 음성에 따라, 사용자를 인증하는 동시에, 도 8에 대하여 전술한 룰 1과 같이 하여, 사육주와 그 이외의 사람에서 응답을 상이하게 할 수 있도록 되어, 예를 들면 사육주에게 특유의 거동을 나타내 실제의 페트에 가까운 거동을 나타내도록 되어 있다.

또, 이 음성에 의한 사용자 인증에 있어서, 사전에 등록한 단어의 유무에 의해, 음성에 따라 사용자를 인증하도록 되어 있다.

또한, 음성인증부(11J)는 도 18에 나타낸 바와 같이, 사용자 인증한 음성입력자와의 대화 중에서, 지식(16G)에 기록한 사용자의 기호(嗜好), 취미 등을 질문하는 응답의 출력을 응답문 작성부(11E)에 지시한다. 그리고, 도 18에서는, 「주인님이 좋아하는 음식은?」이라는 질문에 의해 사용자 인증한 음성입력자의 기호를 질문하고 있게 된다.

음성인증부(11J)는 도 17에 대하여 설명한 룰 2와 동일한 처리에 의해, 계속해서 사용자의 음성입력으로부터 기호의 질문에 대한 응답을 판단하고, 이 응답의 음성인식결과로부터 이 경우 「피넛」의 단어를 인증 데이터(16K)에 등록한다.

응답문 작성부(11E)는 음성입력자와의 대화 중에서, 타이머(11B)의 기동에 의해, 예를 들면 도 19에 나타낸 바와 같이, 인증 데이터(16K)에 등록한 기호, 취미 등에 관한 질문을 발생한다. 그리고, 이 도 19에 나타낸 예에서는, 도 18에 대하여 전술한 기호의 질문에 대응하여, 「당신 정말 주인님? 좋아하는 음식은」이라고 질문한 경우이다.

음성인증부(11J)에서는, 도 17에 대하여 설명한 룰 2와 동일한 처리에 의해, 계속해서 사용자의 음성입력으로부터 기호의 질문에 대한 응답을 판단하고, 이 경우 사육주에 있어서는 「피넛」의 응답이 얻어짐으로써, 이 응답의 음성인식결과로부터 인증상태를 「TRUE」로 세트한다. 또, 응답문 작성부(11E)에 있어서는, 「정말 주인님이다」라는 응답을 발생한다.

이에 따라, 전자페트장치(1)는 과거의 음성인식결과를 기준으로하여 음성인식결과를 판정함으로써, 음성에 따라 사용자를 인증하도록 되고, 더욱 상세하게는 과거의 음성인식결과에 대응하는 질문을 응답으로서 출력하고, 이 응답에 대한 음성인식결과를 판정하여 사용자 인증하도록 되어 있다.

또한, 음성인증부(11J)는 타이머(11B)에 의해 일정시간 이상 음성이 입력되지 않은 경우, 이 경우 사용자가 떠난 경우 등이므로, 인증상태를 리세트한다.

(1-5) 대화의 분류처리

도 20은 대화의 분류처리에 관해 전자페트장치(1)를 더욱 상세히 나타낸 기능 블록도이다. 이 기능 블록도에서, 발화분류부(11M)는 소정의 분류 룰(16M)에 따라, 음성인식결과를 식별함으로써, 음성입력에 의한 회화를 분류하고, 그 분류결과 인 분류 코드를 응답문 작성부(11E)에 출력한다.

여기에서, 발화분류부(11M)는, 예를 들면 「안녕하세요(아침 인사)」, 「안녕하세요(낮 인사)」등의 인사 일반의 음성입력에 대해서는, 「인사」로 분류한다. 또, 「컨디션은 어때」, 「 …는 좋아」 등 질문의 음성입력에 대해서는, 「질문」으로 분류하고, 「건강해」, 「시시해」등의 감상을 기술한 음성입력에 대해서는, 「감상」으로 분류한다.

응답문 작성부(11E)는 패턴 데이터(16E)에 따라 응답문을 작성할 때, 패턴(16E)에 기록된 응답문의 분류와, 이 발화분류부(11M)로 분류된 분류 패턴에 따라 응답을 작성한다. 또한, 이 때 필요에 따라 대화이력(16F)에 기록된 과거의 대화기록에 따라, 응답을 작성한다.

즉, 패턴 데이터(16E)에 있어서, 룰에 따라서는 도 8과의 대비에 의해 도 21에 나타낸 바와 같이, 각 응답문의 분류가 설정되도록 되어 있다. 그리고, 이 분류는 발화분류부(11M)에서의 분류에 대응하도록 설정된다.

이와 관련하여, 도 21의 룰 1에 있어서는, 「나도 사랑하고 있어」, 「와, 나, 나는 수컷인데」의 응답문에는 「상태」의 분류가 설정되고, 「이상한 사람」에는 「감상」, 「당신은 누구?」에는 「질문」의 분류가 설정되도록 되어 있다. 또, 룰 2에서는, 「시끄럽구나」에는 「감상」, 「뭐라고?」에는 「질문」, 「안녕」에는, 「인사」, 「아 놀랐다」에는 「감상」, 「어머 참」에는 「인사」, 「불렀어?」에는 「질문」의 분류가 설정되도록 되어 있다.

또한, 패턴 데이터(16E)에는 특정의 분류에 의한 회화의 연속을 금지하는 종 별 제약이 규정되도록 되어 있다. 구체적으로는, 사용자로부터의 질문에 대해서는 질문을 돌려주지 않도록, 종별 제약이 설정된다. 또, 「인사」, 「인사」의 주고받가가 계속된 경우에는, 계속해서 「인사」의 응답을 하지 않도록 종별 제약이 설정되도록 되어 있다(도 21의 경우).

이에 대하여, 대화이력(16F)은 도 22 및 도 23에 나타낸 바와 같이, 응답문 작성부(11E)에 의해 사용자와 전자페트와의 대화가 기록되도록 되어 있다. 여기에서 이 기록은 음성을 발생한 행위자, 그 음성의 분류, 음성의 내용이 기록되도록 되어 있다. 도 22의 예에서는, 사용자에 의한 분류 「인사」의 「안녕하세요(곤니치와)」의 음성입력에 계속해서, 전자페트의 분류 「인사」의 「안녕하세요(도모)」의 응답을 하고, 계속해서 사용자에 의한 분류 「질문」의 「컨디션은 어때」, 전자페트에 의한 분류 「상태」의 「건강해」가 계속된 것이 기록되게 된다.

응답문 작성부(11E)는 패턴 데이터(16E)에 따라 감정 데이터(16C)에 의해 응답을 작성할 때, 이 제약조건에 따라 대화이력(16F)을 참조하여, 대화이력(16F)에 따라 응답을 작성한다. 즉, 응답문 작성부(11E)는 종별 제약에 해당하는 경우, 즉 도 21에서는, 직전에 「인사」의 주고받기가 계속된 경우, 예를 들면 기쁨의 변수가 가장 큰 경우라도 이 룰 2를 적용하지 않도록 한다. 또, 동일하게 하여 「질문」에는 「질문」을 돌려주지 않도록 한다.

이에 따라, 전자페트장치(1)에서는 「인사」에 대하여 「인사」를 돌려주는 제1 룰과, 여러가지의 질문에 대하여 「인사」를 돌려주는 제2 룰이 규정되어 있는 경우라도, 제2 및 제1 룰의 반복 적용에 의해, 사용자와의 사이에서 「인사」를 몇 번이나 반복하는 부자연스런운 회화를 방지하도록 되어 있다.

(1-6) 감정의 제어

도 24는 감정의 제어에 관해 전자페트장치(1)를 더욱 상세히 나타낸 기능 블록도이다. 이 기능 블록도에서, 감정변경부(11D)는 전술한 바와 같이 타이머(11B)의 기동에 의해, 또 음성인식결과에 포함되는 문언을 키워드로 한 성격 데이터(16D)의 검색에 의해 감정 데이터(16C)를 갱신한다.

이 처리에서 감정변경부(11D)는 도 25에 나타낸 바와 같이, 감정변화이력(16N)으로서, 감정 데이터(16C)를 구성하는 각 변수의 변화량, 음성인식결과로부터 검출하여 각 변수의 변화에 사용한 키워드, 음성인식결과에 의한 텍스트 데이터를 기록한다. 또한, 예를 들면 응답을 출력한 후 등의 소정의 타이밍으로, 이 감정변화이력(16N)을 검색하여, 특정의 키워드와 쌍으로 되는 소정의 단어가 빈번하게 사용되고 있는 경우, 도 6과의 대비에 의해 도 26에 나타낸 바와 같이, 이 단어를 키워드로서 성격 데이터(16D)에 등록하고, 이 단어가 단독으로 입력된 경우 등에 있어도, 동일하게 각 변수를 변화시킬 수 있도록 한다.

즉, 감정변경부(11D)는, 예를 들면 변수를 변화시키는 키워드인 「더럽다」의 단어와, 「카레빵」의 단어가 쌍으로 되어 빈번하게 사용되고, 그 사용빈도가 소정값 이상으로 되면, 「카레빵」의 단어을 키워드로서 성격 데이터(16D)에 등록한다. 또, 이 때 이 「카레빵」에 의해, 「더럽다」의 단어가 입력된 경우와 동일하게 각 변수를 변화시키도록, 각 변수의 변화량을 설정한다.

이에 따라, 전자페트장치(1)는 이른바 연상(聯想)에 의해 특정의 감정이 생 기도록 설정되고, 이 감정에 의한 응답을 발생할 수 있도록 되어 있다.

또한, 감정변경부(11D)는 이와 같이 하여 소정의 타이밍으로 감정변화이력을 검색할 때, 아울러 변수의 변화에 사용하는 각 키워드의 사용빈도를 검출한다. 여기에서, 일정한 빈도 이상으로 특정의 키워드가 사용되고 있는 경우, 감정변경부(11D)는 도 6과의 대비에 의해 도 27에 나타낸 바와 같이, 이 키워드에 의한 변수의 변화량을 저감한다. 그리고, 도 27에서는 「더럽다」의 키워드가 빈번하게 사용된 결과, 이 「더럽다」의 키워드에 의한 변수의 변화량을 저감한 경우이며, 「분노」, 「슬픔」, 「기쁨」, 「두려움」, 「놀람」, 「혐오」의 6개 요소에 대하여, 각각 변화량을 -1, -1, +2, +1, -1, -4만큼 변화시킨 경우이다.

이에 따라, 전자페트장치(1)에서는 이른바 익숙해짐의 감각을 형성할 수 있도록 되어 있다.

또한, 감정변경부(11D)는 이와 같이 하여 성격 데이터(16D)에 가한 단어의 음성입력빈도가 저하된 경우, 이 단어를 성격 데이터(16D)로부터 소거한다. 또, 마찬가지로, 변수의 변화량을 변경한 단어에 대하여, 음성입력빈도가 저하된 경우 서서히 원래의 변화량으로 되돌아간다.

이에 따라, 전자페트장치(1)에서는, 이른바 망각상황을 만들어 낼 수 있도록 되어 있다.

(1-7) 제1 실시형태의 동작

이상의 구성에 있어서, 전자페트장치(1)는(도 1~도 3) 사용자가 마이크(7)로부터 음성을 입력하면, 중앙처리유닛(11)의 처리에 의해 구성되는 기능 블록인 음 성인식부(11A)에서, HMM법에 의해 이 음성이 음성인식처리된다. 이 음성인식처리에서, 음성은 음운열로 변환된 후, 인식 데이터(16A)와의 조합(照合)에 의해 텍스트 데이터로 변환된다.

전자페트장치(1)에서는, 이와 같이 하여 생성된 음성인식결과인 텍스트 데이터가 신체상태 변경부(11C)에 입력되고, 여기에서 이 신체상태 변경부(11C)에 의해 현재의 신체상태를 나타내는 5개의 요소 「피로」, 「허기」, 「갈증」, 「병」, 「졸음」(도 4)에 의해 구성되는 신체상태 데이터(16B)가 음성에 포함되는 단어에 따라 변경된다. 즉, 예를 들면 음성인식결과에 의해 음식물이 주어진 경우, 「허기」의 변수가 저감되고, 또 음성인식결과에 의해 음료가 주어진 경우, 「갈증」의 변수가 저감된다.

이에 따라, 전자페트장치(1)에서는 사용자의 음성입력에 의해 신체상태가 변화되도록 되어 있다. 또한, 타이머(11B)를 기준으로 한 신체상태 변경부(11C)의 처리에 따라서도, 이들 5개의 요소에 서서히 변경이 가해진다. 이에 따라, 전자페트장치(1)에서는, 이들 5개의 요소에 의한 신체상태가 사용자로부터의 음성입력에 의해, 또 시간 경과에 따라 변화하고, 이 5개의 요소를 기준으로 하여 음성입력에 대하여 응답을 생성함으로써, 사용자의 음성에 대한 응답에 전자페트의 신체상태가 반영되도록 되어 있다.

이와는 별도로, 음성인식결과는 감정변경부(11D)에 주어지고, 여기에서 이 음성인식결과에 포함되는 단어에 따라 현재의 감정 데이터(16C)가 변경된다(도 5). 여기에서 이 감정 데이터(16C)의 변경에 있어서는, 감정을 변화시키는 키워드와, 이 키워드에 대하여 감정의 변화를 기술한 성격 데이터(16D)에 따라(도 6), 감정을 나타내는 6개의 요소 「분노」,「슬픔」, 「기쁨」, 「두려움」, 「놀람」, 「혐오」에 의한 변수가 음성에 포함되는 감정을 변화시키는 단어에 따라 갱신되고, 이에 따라 이들 6개의 변수에 의해 감정이 표시되고, 이 감정이 사용자의 질문에 따라 변화된다.

이에 따라, 전자페트장치(1)에서는 사용자의 음성입력에 따라 전자페트의 감정이 변화하도록 되어 있다. 또, 전자페트장치(1)에서는 앞의 신체상태 데이터(16B), 이 감정 데이터(16C)를 참고로 하여 음성인식결과에 따라 응답을 작성함으로써, 전자페트의 반응에 전자페트의 신체상태, 감정이 반영된다.

즉, 전자페트장치(1)에서 음성인식결과는 응답문 작성부(11E)에 입력되고, 이 응답문 작성부(11E)에서 패턴 데이터(16E)에 기술된 룰에 따라 음성인식결과에 대응하는 응답문이 작성된다(도 8). 즉, 전자페트장치(1)에서는 음성에 포함되는 키 프레이즈에 대하여 각각 응답문이 기술되어 패턴 데이터(16E)가 생성되어 있고, 응답문 작성부(11E)에서는 음성인식결과에 의해 패턴 데이터(16E)를 검색하여 대응하는 응답문을 출력한다.

전자페트장치(1)에서는, 이 응답문에 의한 응답에 대하여, 대응하는 음성에 의한 응답이 음성합성부(11F)에 의해 생성되어 스피커(6)로부터 출력되고(도 9), 또 동일하게 응답에 대응하는 화상이 화상합성부(11G)에 의해 작성되어 액정표시패널(3)에 표시되고(도 10), 이에 따라 사용자의 음성입력에 의한 응답이 음성 및 화상에 의해 제공된다.

이와 같이 하여 패턴 데이터(16E)에 의해 응답을 작성할 때, 패턴 데이터(16E)에서는 신체상태 데이터(16B), 감정 데이터(16C)에 따라 상이한 응답을 발생하도록 룰이 기술되고, 전자페트장치(1)에서는 이 룰에 따라 응답을 생성하고, 이에 따라 사용자에의 응답에 전자페트의 신체상태, 감정이 반영된다.

이와 같은 일련의 처리에 있어서, 전자페트장치(1)는 사용자가 소정의 조작자를 조작하면, 등록의 동작 모드로 변환되어, 인식 데이터(16A)에 의해 음성인식 가능한 단어, 문언이 음성입력에 의해 등록 가능하게 된다.

즉, 이 등록의 모드에 있어서, 전자페트장치(1)는(도 13 및 도 15) 사용자가 등록하는 단어 등의 음성을 음성입력하면, 보통의 동작 모드에서의 처리와 동일하게 하여 이 음성입력이 음운열로 변환되고(도 14), 이 음운열에 의한 음성이 음성합성부(11F)로부터 발성되고, 이 발성에 의해 사용자로부터의 확인이 얻어지면, 계속해서 앞서 입력된 단어 등의 속성에 대하여 음성입력이 접수된다.

이 속성의 음성입력에 있어서도, 전자페트장치(1)에서는 음성입력이 음운열로 변환되고, 이 음운열의 발성에 의해 사용자로부터의 확인이 얻어지면, 앞서 입력된 단어 등의 음운열이 인식 데이터(16A)에 등록되는 데 대하여, 이 인식 데이터(16A)에 대응하도록 하여 속성의 데이터가 지식(16G)으로서 등록된다.

이에 따라, 전자페트장치(1)에서는 키보드 등의 번잡한 조작에 의하지 않고도 음성에 의해 단어 등을 등록할 수 있어, 그만큼 사용하기 편리함을 향상시킬 수 있도록 되어 있다. 또, 실제로 동물의 페트에게 예의 범절을 가르치도록 전자페트를 취급하여 어휘를 증대시킬 수 있어, 그만큼 전자페트를 신변에 친밀해지기 쉬운 것으로 할 수 있도록 되어 있다.

이렇게 하는 데 대하여, 이와 같이 하여 등록된 단어 등에 있어서는, 보통의 음성인식처리에서는, 음성인식처리에서의 음운열에 의해 인식데이터(16A)가 검색되어 대응하는 텍스트 데이터에 의해 음성인식결과가 출력되는 데 대하여, 이 텍스트 데이터에 대신하여 음운열에 의해 표기된 텍스트 데이터가 출력되어 동일하게 응답문이 작성되고, 이 때, 지식(16G)에 기록된 속성에 따라 응답문이 작성되고, 이에 따라, 예를 들면 신체상태 데이터(16B)에 의한 공복 시, 음식물의 속성에 의한 질문에 대하여, 「먹는다」, 「원한다」 등의 응답을 발생하는 것이 가능하게 된다.

또, 이와 같이 하여 단어와 속성을 음성입력에 의해 등록하는 데 대하여, 단어와 속성을 구획하고, 각각 음성인식결과를 발성하여 확인을 얻음으로써, 간단히 또한 확실하게 음성입력에 의해 단어를 등록할 수 있다.

이에 대하여, 소정의 키워드(어흥-)를 사용자가 음성입력하면, 전자페트장치(1)에서는(도 16 및 도 17), 사전에 등록된 예를 들면, 사용자 등의 입력을 촉구하는 룰(1)에 의해 음성이 발성되고, 이 음성에 응답하는 사용자의 음성입력이 음성인식처리된다. 전자페트장치(1)에서는, 이 음성인식결과가 음성인증부(11J)에서 사전에 등록된, 예를 들면 사용자 등에 의한 인증 데이터(16K)와 조합(照合)되고, 여기에서 사용자로 인증되면 인증상태(16J)에 음성입력자가 사용자인 취지가 세트된다.

이에 따라, 전자페트장치(1)에서는 음성입력자가 사용자인 경우와 사용자가 아닌 경우로 구별되는 패턴 데이터(16E)에서의 룰의 기술에 따라(도 8, 룰 1), 응 답문 작성부(11E)에서 응답문을 작성할 때, 이 인증상태(16J)가 참조되고, 인증상태(16J)의 설정에 따라 상이한 응답이 작성된다.

이에 따라, 전자페트장치(1)에서는 동물의 페트와 같이, 사육주에 대해서만 특정의 거동을 나타내도록 응답하는 것이 가능하게 되어, 그만큼 전자페트를 친밀해지기 쉬운 것으로 할 수 있도록 되어 있다.

또한, 전자페트장치(1)에서는 타이머(11B)에 의해 음성인증부(11J)가 기동되어, 일정한 시간간격으로 사용자인증처리가 실행된다. 이 일정한 시간간격에 의한 사용자인증처리에서는, 지식(16G)에 기록한 사용자의 기호, 취미 등의 질문에 대한 응답에 의해 사용자인지 여부가 판단되고, 이에 따라 사용자 인증의 처리가 실행된다(도 18 및 도 19).

이에 따라, 전자페트장치(1)에서는 회화의 도중이라도 필요에 따라 회화의 상대를 확인하여 사육주에 대해서만 특정의 거동을 나타내도록 응답을 작성하는 것이 가능하게 된다.

이와 같이 하여 사용자와 회화하는 데 대하여, 전자페트장치(1)에서는(도 20, 도 22 및 도 23) 발화분류 룰(16M)에 따라 발화분류부(11M)에 의해 음성입력에 의한 회화가 「인사」, 「질문」 등으로 분류된다. 또한, 사용자에 의한 음성입력에 대하여 응답을 작성할 때, 패턴 데이터(16E)에 기술된 종별 제약(도 21)에 의해, 예를 들면 사용자의 음성입력이 「질문」인 경우에는, 특정의 키 프레이즈에 의해 응답으로서 「질문」이 룰에 의해 특정되는 경우라도, 이 룰에 따라서는 응답을 생성하지 않도록 된다.

이에 따라, 전자페트장치(1)에서는 「질문」에 「질문」을 돌려주는 듯한 부자연스러운 회화가 방지된다.

또, 전자페트장치(1)에서는 연속되는 회화이 분류가 차례로 대화이력(16F)에 기록되고, 사용자에 의한 음성입력에 대하여 응답을 작성할 때, 이 대화이력(16F)에 기록된 분류를 참조하여 패턴 데이터(16E)에 기술된 종별 제약(도 21)에 따라 응답을 작성함으로써, 「인사」에 대하여 「인사」를 돌려주도록 룰이 설정되어 있는 경우라도, 예를 들면 전자페트장치에 의한 「인사」, 사용자에 의한 「인사」가 계속된 경우에는, 이 「인사」에 대하여 「인사」를 돌려주는 룰에 의해서는 응답을 생성하지 않도록 된다.

이에 따라서도 몇번이나 「인사」를 주고 받는 듯한 부자연스러운 회화가 방지되어, 전자페트를 친밀한 것으로 할 수 있다.

또한, 전자페트장치(1)에서는(도 24 및 도 25), 감정을 변화시키는 키워드가 동시에 사용된 단어, 키워드에 의한 감정의 변화와 함께 감정변화이력(16N)에 순차 기록된다. 전자페트장치(1)에서는, 일정한 시간간격 등에 의해 이 감정변화이력(16N)이 검사되고, 각 키워드에 대하여 동시에 사용되는 빈도가 높은 단어에 대해서는, 이 단어에 의해서도 감정이 변화하도록 성격 데이터(16D)에 이 단어가 기록된다(도 26).

이에 따라, 전자페트장치(1)에서는, 예를 들면 「더러운 카레빵」이란 프레이즈가 반복된 경우에는, 「카레빵」의 문언의 음성입력만으로, 「더러운」의 문언에 의한 음성이 입력된 경우와 동일하게 감정을 변화시켜 응답을 생성하게 된다.

이에 따라, 전자페트장치(1)에서는, 동물에 예를 들면 조건반사하도록, 또 인간에게 예를 들면 연상에 의해, 여러 가지로 감정을 변화시킬 수 있고, 또 이 감정의 변화를 응답에 변화시킬 수 있도록 되어 있다.

또한, 전자페트장치(1)에서는, 동일한 감정변화이력(16N)의 검사에 의해, 빈번하게 사용되고 있는 감정을 변화시키는 키워드에 대해서는, 감정의 변화량이 저감되도록(도 27), 성격 데이터(16D)가 갱신된다. 이에 따라, 이른바 익숙해짐의 상태를 형성하고, 이 익숙해짐의 상태를 응답에 반영시키는 것이 가능하게 된다.

이와 같이 하여 사용되는 전자페트장치(1)에서는, 사용자의 조작에 의해 네트워크 접속부(17)(도 1 및 도 2)를 통해, 네트워크(18)에 접속되어, 인식 데이터(16A), 지식(16G), 패턴 데이터(16E) 등의 음성인식처리, 응답생성처리에 필요한 룰인 이들의 데이터, 지식을 다운로드하는 것이 가능하게 된다. 이에 따라, 이들 인식 데이터(16A), 지식(16G)을 갱신하여, 한층 고도의 회화를 즐기는 것이 가능하게 된다. 또, 응답의 구체적인 출력인 음성 데이터(16H), 화상 데이터(16I)를 다운로드하여, 동일하게 응답의 표현을 향상할 수 있다.

또, 동일하게 하여 네트워크(18)를 통해 신체상태 데이터(16B), 감정 데이터(16C), 대화이력(16F)을 원하는 기기에 송출할 수 있도록 되고, 이에 따라 이들의 데이터를 송출한 기기에서, 이 전자페트장치(1)에서의 전자페트를 재현할 수 있도록 되어, 전자페트를 여러가지의 환경으로 데리고 나가는 것이 가능하게 된다.

또, 이와는 거꾸로, 네트워크(18)로부터 신체상태 데이터(16B), 감정 데이터(16C), 대화이력(16F)을 취득하고, 이에 따라 마치 이 전자페트장치(1)에 외부로 부터 다른 전자페트가 방문한 것처럼 응답을 작성하여, 다른 전자페트장치에서 사육되고 있는 전자페트를 이 전자페트장치(1)로 데리고 나갈 수 있도록 되어 있다.

1. 제1 실시형태의 효과

이상의 구성에 의하면, 음성인식처리의 룰인 인식 데이터, 응답생성의 룰인 패턴 데이터, 감정생성의 룰인 감정 데이터, 신체상태 데이터, 음성 데이터, 화상 데이터를 네트워크를 통해 갱신할 수 있도록 함으로써, 네트위크에 접속된 동종의 기기에서의 응답과 거의 동일한 응답을 생성할 수 있고, 이에 따라 마치 이 네트워크에 접속된 동종의 기기로부터 전자페트를 데리고 나간 것처럼 취급할 수 있어, 동물의 페트를 실제로 사육하고 있는 경우와 같이 전자페트를 친밀해지기 쉬운 것으로 할 수 있다. 또, 필요에 따라 판별 가능한 단어를 증대시키는 등에 의해 지식을 지식을 증대시킬 수도 있다.

또, 정기적으로 네트워크에 접속하여 인식 데이터 등을 갱신함으로써, 사용자를 하등 번거롭게 하지 않고, 지식을 증대시킬 수 있다.

또, 이와는 거꾸로, 신체상태 데이터, 감정 데이터, 대화이력을 네트워크에 의해 송출함으로써, 이 네트워크에 접속된 동종의 기기에서, 이 정보처리장치 등에서의 음성입력에 대한 응답과 거의 동일한 응답을 생성할 수 있고, 이에 따라 마치 전자페트를 외부의 기기로 데리고 나간 것처럼 취급할 수 있어, 동물의 페트를 실제로 사육하고 있는 경우와 같이 전자페트를 친밀해지기 쉬운 것으로 할 수 있다.

또, 이들 데이터의 갱신, 데이터의 송출을 교환 가능한 기록매체인 IC 카드 를 통해 실행할 수 있도록 함으로써, 통신기능을 구비하지 않은 여러가지의 기기와의 사이에서도 이들의 처리를 실행할 수 있다.

또, 등록의 동작 모드에 있어서, 음성인식결과에 따라, 단어의 음성인식결과와 단어의 분류를 등록함으로써, 전자페트가 인식 가능한 어휘를 음성에 의해 간단히 늘릴 수 있다. 이에 따라, 실제로 사육하고 있는 동물의 페트에 예의 범절을 가르치도록 전자페트를 취급할 수 있어, 전자페트를 친밀해지기 쉬운 것으로 할 수 있다.

또, 이 때, 음성의 음운열에 의한 음성인식결과에 따라 단어의 음성인식결과와 분류를 기록함으로써, 단지 음성을 입력할 뿐으로 다른 조작을 조금도 필요로 하지 않고 등록할 수 있다.

또, 이 때, 보통의 처리에 있어서는, 음성인식결과를 텍스트 데이터로서 출력하고, 등록에 있어서는 음운열의 기술(記述)에 의해 등록함으로써, 룰 들의 기술을 간략화할 수 있다.

또, 단어와 속성을 구획하여 입력하고 등록을 접수함으로써, 간단히 이들의 등록처리를 실행할 수 있다.

또한 음성에 따른 사용자 인증의 인증결과에 의거하여, 음성입력자에 따라 응답을 상이하게 함으로써, 전자페트의 응답을 예를 들면 사육주와 그 이외의 사람으로 다르게 하도록 할 수 있다. 이에 따라, 동물의 페트와 같은 거동을 실현할 수 있어, 전자페트를 한층 신변에 친밀해지기 쉬운 것으로 할 수 있다.

또, 이 때, 과거의 음성인식결과를 기준으로 하여 음성인식결과를 판정하여 사용자를 인증함으로써, 예를 들면 패스워드 등의 입력을 요구하지 않고, 회화를 통해 사용자를 인증할 수 있어, 그만큼 사용하기 편리함을 향상할 수 있다.

또한, 이 때, 과거의 음성인식결과를 기준으로 한 질문에 대한 대답을 판정하여 사용자를 인증함에 따라서도, 또 소정의 단어의 발성에 의해 사용자를 인증함에 따라서도, 또 소정 단어의 발성에 의해 사용자를 인증함에 따라서도, 자연스러운 회화를 통해 사용자를 인증할 수 있어, 그만큼 사용하기 편리함을 향상할 수 있다.

또, 음성입력의 종류를 식별하는 동시에 입력의 종류에 대응하는 응답의 분류에 따라, 소정의 종류의 응답을 제외하는 응답을 생성함으로써, 예를 들면 질문에 대하여 질문을 돌려주는 부자연스러운 회화를 방지할 수 있다. 이에 따라, 전자페트의 응답을 자연스러운 생생한 것으로 할 수 있고, 이에 따라서도 전자페트를 한층 신변에 친밀해지기 쉬운 것으로 할 수 있다.

또, 이 때, 이 입력의 종류와 응답의 분류에 의한 이력을 참조하여 응답을 생성함으로써, 인사를 반복해서 주고받기하는 부자연스러운 회화를 방지할 수 있다. 이에 따라, 전자페트의 응답을 자연스러운 생생한 것으로 할 수 있고, 이에 따라서도 전자페트를 한층 신변에 친밀해지기 쉬운 것으로 할 수 있다.

또한, 음성인식결과와 대응하는 감정 파라미터에 의한 이력에 따라 감정 파라미터의 변화량을 변화시킴으로써, 예를 들면 빈번히 발생되는 음성에 대하여 익숙해짐, 친밀감 등의 감정이 깃든 응답을 형성할 수 있다. 이에 따라 전자페트의 응답을 자연스러운 생생한 것으로 할 수 있고, 이에 따라서도 전자페트를 한층 신 변에 친밀해지기 쉬운 것으로 할 수 있다.

즉, 감정을 자극하는 단어 이외의 단어가, 이 감정을 자극하는 단어를 동시에 빈번하게 사용하는 경우, 이 단어에 의해서도 감정 파라미터를 변화시킴으로써, 반복해서 쌍에 의해 사용되는 단어에도 감정을 변화시켜 응답할 수 있다.

또, 감정을 자극하는 단어 중의 소정 단어가 빈번하게 사용되는 경우,이 감정을 자극하는 단어에 의해 감정 파라미터의 변화량을 저감함으로써, 이른바 익숙해짐의 감정을 생성할 수 있다.

2. 다른 실시형태의 효과

그리고, 전술한 실시형태에서는, 네트워크에 접속하여 전자페트를 외출시키고, 또 외부기기의 전자페트의 응답을 출력하고, 또한 각종 룰 들을 학습시키는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 필요에 따라 이들 중 어느 하나의 처리만 실행하도록 해도 된다. 또, 정기적인 액세스, 사용자의 조작에 의한 액세스, 외부기기로부터의 호출에 의한 액세스 중 어느 하나에 의해 네트워크에 액세스하도록 해도 된다.

또, 전술한 실시형태에서는, 전화회선에 의해 네트워크에 접속하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 모뎀, 퍼스널 컴퓨터 등 다른 기기를 통해 네트워크에 접속하는 경우에도 널리 적용할 수 있다.

또한, 전술한 실시형태에서는, 인식 데이터, 패턴 데이터, 음성 데이터, 화상 데이터의 다운로드에 의해 이른바 전자페트를 학습시키는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 필요에 따라 이들 중 어느 하나의 데이터의 다운로드에 의해 학습시키도록 해도 된다. 또, 음성인식처리의 수법, 음성 데이터의 생성수법, 화상 데이터의 생성수법인 제어 프로그램 자체의 다운로드에 의해 이들의 생성수법 자체를 변경하도록 해도 되고, 또한 감정 데이터의 생성수법, 응답문 작성부의 처리 등에 대해서도 변경하도록 해도 된다.

또, 전술한 실시형태에서는, 전자페트를 외부의 기기로 데리고 나가는 데 대하여, 신체상태 데이터, 감정 데이터, 대화이력을 송출하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 필요에 따라 이들 중 어느 하나의 데이터의 송출에 의해 이 처리를 실행해도 되고, 또한 이들의 데이터에 더하여 예를 들면 지식 등을 송출하도록 해도 된다. 또, 이와 같은 데이터의 송출에 대신하여, 외부기기로부터의 음성인식결과의 입력에 대하여 응답을 송출하도록 해도 된다.

또, 전술한 실시형태에서는, 외부기기의 전자페트를 이 전자페트장치(1)로 데리고 나가는 데 대하여, 각종 데이터를 입력하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 전술한 각종 데이터 중 어느 하나의 데이터의 수신에 의해 이 처리를 실행해도 되고, 또한 이들 데이터에 더하여 예를 들면 지식 등을 수신하고 이들의 처리를 실행해도 된다. 또, 이와 같은 데이터를 수신한 내부처리에 대신하여, 외부기기에 대하여 음성인식결과를 출력하고, 외부기기로부터 응답을 입력하도록 해도 된다.

또, 전술한 실시형태에서는, 음성을 음운열에 의해 판정하여 음성을 인식하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 필요에 따라 여러가지의 음성인식수법을 널리 적용할 수 있다.

또, 전술한 실시형태에서는, 단어와 함께 속성에 대해서도 음성입력에 의해 등록하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 속성에 대해서는 조작자의 조작에 의해 선택 입력하도록 해도 된다. 이 경우, 사용자에게 메뉴의 선택을 촉구하는 방법 등이 고려된다.

또, 전술한 실시형태에서는, 음성입력에 의해 등록된 인증 데이터에 대해서는, 음운열에 의해 음성을 표기한 텍스트 데이터에 의해 음성인식결과를 출력하고, 일반의 음성인식결과에 대해서는 보통의 텍스트 데이터를 출력하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 일반의 음성인식결과에서도, 음운열에 의해 음성인식결과를 표시하도록 해도 된다.

또, 전술한 실시형태에서는, 사용자명, 사용자의 기호에 따라 사용자를 인증하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 예를 들면 말, 과거에 회화를 나눈 일시 등을 확인하여 사용자를 인증하는 경우 등, 과거의 음성인식결과에 의해 사용자를 인증하는 경우에 널리 적용할 수 있다.

또, 전술한 실시형태에서는, 사용자가 특정의 문언을 발성한 경우와, 일정한 주기로 사용자를 인증하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 필요에 따라 이들 중 어느 하나에 의해 사용자를 인증하도록 해도 된다.

또, 전술한 실시형태에서는, 음운열에 의한 음성인식처리에 있어서, 특정 단어의 발성을 확인하여 사용자를 인증하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 예를 들면 음성의 고저, 주파수 스펙트럼 등 음성의 특징을 나타내는 여러 가지의 특징량에 의해 사용자를 인증하여 전술한 실시형태와 동일한 효과를 얻을 수 있다.

또, 전술한 실시형태에서는, 전자페트의 응답을 예를 들면 사육주와 그 이외의 사람으로 상이하게 하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 더욱 상세하게 음성입력자를 식별하여, 예를 들면 가족과 가족 이외에 응답을 상이하게 하도록 해도 되고, 또한 가족의 개인이라도 응답을 상이하게 해도 된다.

또, 전술한 실시형태에서는, 입력의 종류와 응답의 분류에 의해, 단순히 질문에 대해서는 질문을 돌려주지 않도록 하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 예를 들면 감정에 따라서는 질문에 대하여 질문을 돌려주도록 해도 된다. 이 경우, 전자페트가 성질이 비뚤어져 있는 상황이 형성된다.

또, 전술한 실시형태에서는, 감정의 제어에 있어서, 성격 데이터를 조작하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고 성격 데이터의 조작에 대신하여 직접 감정 데이터를 조작하도록 해도 된다.

또, 전술한 실시형태에서는, 음성 데이터, 화상 데이터를 출력하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 음성합성, 화상합성에 의해 음성, 화상을 출력하도록 해도 된다.

또, 전술한 실시형태에서는, 중앙처리유닛의 처리에 의해 음성인식처리, 화상합성처리하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 도 3과의 대비에 의해 도 28에 나타낸 바와 같이, 음성인식처리, 화상합성처리를 전용의 처리회로에 의해 구성해도 된다.

또, 전술한 실시형태에서는, 응답으로서 음성 및 화상을 출력하는 전자페트장치에 본 발명을 적용하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 예를 들면 동물의 동작을 하는 로봇에 적용하여 울음소리와 동작에 의해 응답을 출력하는 전자페트장치 등, 여러가지의 형태에 의해 응답을 출력하는 전자페트장치에 널리 적용할 수 있다.

또, 전술한 실시형태에서는, 전자페트의 전용장치인 전자페트장치에 본 발명을 적용하는 경우에 대하여 설명했지만, 본 발명은 이에 한정되지 않고, 도 2와의 대비에 의해 도 28에 나타낸 바와 같이, 휴대전화에 적용해도 되고, 또한 GPS, 휴대형의 테이프레코더, 광디스크장치 등, 여러가지의 휴대기기에 널리 적용할 수 있다. 또, 휴대기기에 한정되지 않고, 예를 들면 퍼스널 컴퓨터 등의 정보처리장치, 또한 이 퍼스널 컴퓨터 상에서 동작하는 각종 캐릭터 등에 적용할 수 있다.

본 발명은 엔터테인먼트 로봇에 이용할 수 있다.

Claims

사용자의 음성을 입력하는 음성입력수단과,

상기 음성입력수단으로부터 입력된 음성을 음성인식 처리하여 음성인식결과를 출력하는 음성인식수단과,

소정의 응답생성 룰에 따라, 상기 음성인식결과에 대응하는 응답을 생성하는 응답생성수단과,

상기 응답을 출력하는 응답출력수단과,

상기 음성에 따라, 상기 사용자를 인증하는 사용자 인증수단을 구비하고,

상기 응답생성수단은,

상기 사용자 인증수단의 인증결과에 의거하여, 음성입력자에 따라 상기 응답을 상이하게 하는

것을 특징으로 하는 정보처리장치.
제1항에 있어서,

상기 사용자 인증수단은 과거의 음성인식결과를 기준으로 하여 상기 음성인식결과를 판정함으로써, 상기 음성에 따라 상기 사용자를 인증하는 것을 특징으로 하는 정보처리장치.
제2항에 있어서,

상기 응답생성수단은 과거의 음성인식결과에 대응하는 질문을 상기 응답으로 하여 출력하고,

상기 사용자 인증수단은 상기 질문의 응답에 대한 음성인식결과를 판정하여 사용자를 인증하는 것을 특징으로 하는 정보처리장치.
제2항에 있어서,

상기 과거의 음성인식결과가 소정의 단어인 것을 특징으로 하는 정보처리장치.
제1항에 있어서,

상기 사용자 인증수단은 상기 음성인식결과로부터 상기 음성의 특징을 나타내는 특징량을 검출하고, 상기 특징량에 따라 상기 사용자를 인증함으로써, 상기 음성에 따라 상기 사용자를 인증하는 것을 특징으로 하는 정보처리장치.
제1항에 있어서,

소정의 의사감정 파라미터 생성 룰에 따라, 최소한 상기 음성인식결과와 시간경과에 의해 변화되는, 의사적으로 감정을 나타내는 의사감정 파라미터를 생성하는 감정생성수단을 가지고,

상기 응답생성수단은,

최소한 상기 의사감정 파라미터를 기준으로 하여 상기 응답생성 룰에 따라, 상기 음성인식결과에 대응하는 응답을 생성하는 것을 특징으로 하는 정보처리장치.
사용자의 음성을 입력하는 음성입력수단과,

상기 음성입력수단으로부터 입력된 음성을 음성인식 처리하여 음성인식결과를 출력하는 음성인식수단과,

소정의 응답생성 룰에 따라, 상기 음성인식결과에 대응하는 응답을 생성하는 응답생성수단과,

상기 응답을 출력하는 응답출력수단과,

상기 음성에 따라, 상기 사용자를 인증하는 사용자 인증수단을 구비하고,

상기 응답생성수단은,

상기 사용자 인증수단의 인증결과에 의거하여, 음성입력자에 따라 상기 응답을 상이하게 하는

것을 특징으로 하는 전자페트장치.
제7항에 있어서,

상기 사용자 인증수단은 과거의 음성인식결과를 기준으로 하여 상기 음성인식결과를 판정함으로써, 상기 음성에 따라 상기 사용자를 인증하는 것을 특징으로 하는 전자페트장치.
제8항에 있어서,

상기 응답생성수단은 과거의 음성인식결과에 대응하는 질문을 상기 응답으로 하여 출력하고,

상기 사용자 인증수단은 상기 질문의 응답에 대한 음성인식결과를 판정하여 사용자를 인증하는 것을 특징으로 하는 전자페트장치.
제8항에 있어서,

상기 과거의 음성인식결과가 소정의 단어인 것을 특징으로 하는 전자페트장치.
제7항에 있어서,

상기 사용자 인증수단은 상기 음성인식결과로부터 상기 음성의 특징을 나타내는 특징량을 검출하고, 상기 특징량에 따라 상기 사용자를 인증함으로써, 상기 음성에 따라 상기 사용자를 인증하는 것을 특징으로 하는 전자페트장치.
제7항에 있어서,

소정의 의사감정 파라미터 생성 룰에 따라, 최소한 상기 음성인식결과와 시간경과에 의해 변화되는, 의사적으로 감정을 나타내는 의사감정 파라미터를 생성하는 감정생성수단을 가지고,

상기 응답생성수단은,

최소한 상기 의사감정 파라미터를 기준으로 하여 상기 응답생성 룰에 따라, 상기 음성인식결과에 대응하는 응답을 생성하는 것을 특징으로 하는 전자페트장치.
사용자의 음성을 입력하는 음성입력처리와,

상기 음성입력처리로부터 입력된 음성을 음성인식 처리하여 음성인식결과를 출력하는 음성인식처리와,

소정의 응답생성 룰에 따라, 상기 음성인식결과에 대응하는 응답을 생성하는 응답생성처리와,

상기 응답을 출력하는 응답출력처리와,

상기 음성에 따라, 상기 사용자를 인증하는 사용자 인증처리를 가지고,

상기 응답생성처리는,

상기 사용자 인증처리의 인증결과에 의거하여, 음성입력자에 따라 상기 응답을 상이하게 하는

것을 특징으로 하는 정보처리방법.