KR100651527B1

KR100651527B1 - 음성 재생 프로그램, 음성 재생 방법 및 음성 재생 장치

Info

Publication number: KR100651527B1
Application number: KR1020057020554A
Authority: KR
Inventors: 타카히토 우에니시; 마코토 야마카와
Original assignee: 고나미 가부시끼가이샤
Priority date: 2003-05-02
Filing date: 2004-04-20
Publication date: 2006-11-30
Also published as: CN100399421C; HK1088109A1; WO2004097800A1; KR20050122280A; CN1784718A; EP1650747B1; DE602004025578D1; JP2004333679A; TWI257821B; EP1650747A4; US20070032894A1; TW200507676A; JP4133559B2; EP1650747A1

Abstract

음성 데이터를 이용하여 음성을 재생하기 위한 음성 재생 프로그램에 있어서, 소정의 음성을 복수의 다른 재생 속도로 재생하기 위하여 미리 준비되어 각 재생 속도에 대응하는 복수의 각 음성 데이터(a1, a2)를 기억하는 음성 기억 수단(102)과, 음성 데이터(a1, a2)를 출력 가능한 상태로 하는 재생 수단(112)과, 상기 각 재생 속도 중 어느 한 속도로 음성을 출력하는 경우에 당해 재생 속도에 대응하는 음성 데이터에 의한 음성을 출력하는 음성 출력 수단(101)으로서 컴퓨터를 기능시킨다.

음성 재생 프로그램, 음성 재생 방법, 음성 재생 장치, 음성 데이터, 음성 출력 수단

Description

음성 재생 프로그램, 음성 재생 방법 및 음성 재생 장치{AUDIO REPRODUCING PROGRAM, AUDIO REPRODUCING METHOD AND AUDIO REPRODUCING APPARATUS}

본 발명은 음성 데이터를 이용하여 음성을 재생하기 위한 음성 재생 프로그램, 음성 재생 방법 및 음성 재생 장치에 관한 것이다.

종래의 음성 재생 장치로서는 예를 들어, 카세트 테이프 레코더 등이 있고, 카세트 테이프 레코더 등의 아날로그 음성을 재생하는 기기에서는 카세트 테이프 등의 기록 매체를 소정 속도 (기록 시의 속도)로 구동하여 카세트 테이프에 기록된 음성 신호를 재생하는 것에 의하여 표준 속도 (1배속)로 음성을 재생한다. 또한, 상기의 카세트 테이프의 구동 속도를 변화시켜 표준 속도보다 빠른 속도나 늦은 속도로 음성을 재생하는 것도 행하여지고 있다.

한편, 상기와 같은 아날로그 음성이 아니라, 디지털 음성을 재생하는 기기로서 CD 플레이어, DVD 플레이어 등이 있고, 이들 기기에서는 CD 등에 기록된 음성 데이터를 소정의 재생 주파수로 재생하는 것에 의하여 표준 속도로 음성을 재생할 수 있고, 또한 재생 주파수를 변화시키는 것에 의하여 표준 속도보다 빠른 속도나 늦은 속도로 음성을 재생할 수도 있다. 또한, CD, DVD 등의 컴퓨터로 읽기 가능한 기록 매체를 이용하는 가정용 비디오 게임기 등의 비디오 게임 장치도 상기의 CD 드라이브 등의 재생 원리와 같은 재생 원리를 이용하여, 표준 속도, 당해 속도보다 빠른 속도 또는 늦은 속도로 디지털 음성을 재생하고 있다.

그렇지만, 종래의 음성 재생 장치에서는 표준 속도로 기록되어 있는 아날로그 음성 또는 디지털 음성을 표준 속도 이외의 속도로 재생하는 경우, 재생되는 음성의 주파수가 원래의 음성 주파수인 기본 주파수와 상위(相違)하게 된다. 예를 들어, 표준 속도에 대하여 2배 빠른 속도인 빨리 듣기 속도로 음성을 재생하면, 빨리 듣기 속도로 재생된 음성은 상기의 기본 주파수의 배(倍)가 되어 버린다. 따라서, 음성의 음정이 통상의 음성보다 1옥타브 높아져 버려, 유저에게 있어서 듣기 어렵거나, 또는 알아들을 수 없는 경우가 있었다.

이 때문에, 재생 속도의 변환에 의한 음성의 주파수의 변동을 아날로그 신호 처리에 의하여 기본 주파수와 같은 재생 주파수로, 또한 빨리 듣기 속도로 재생되는 음성으로 되도록 수정하는 것이 행하여지고 있지만, 자연스러운 음성으로 수정하는 것은 곤란하였다. 또한, 소프트웨어 등을 이용한 디지털 처리에 의하여 보다 자연스러운 음성으로 수정하는 것도 행하여지고 있지만, CPU (중앙 연산 처리 장치) 등의 처리 능력에 따라서는 시청자인 유저의 조작에 순간적으로 응답하여 위화감 없이 재생 속도를 변환할 수 없었다. 특히, 음성 처리뿐만 아니라, 화상 처리를 주체로 하는 비디오 게임 장치에서는 복잡한 화상 처리에 CPU의 처리 능력을 배분할 필요가 있고, 시청자인 유저의 조작에 순간적으로 응답하여 위화감 없이 재생 속도를 변환할 수 없었다.

본 발명은 상기의 과제를 해결하기 위하여 이루어진 것으로, CPU 등의 하드웨어에 과도한 부담을 주는 일 없이, 음성의 재생 속도를 순간적으로 위화감 없이 변환할 수 있는 것과 함께 보다 자연스러운 음성을 변환 전후 모두에 출력할 수 있는 음성 재생 프로그램, 음성 재생 방법 및 음성 재생 장치를 제공하는 것을 목적으로 하는 것이다.

청구항 1에 기재된 본 발명은, 음성 데이터를 이용하여 음성을 재생하기 위한 음성 재생 프로그램에 있어서,

소정의 음성을 복수의 다른 재생 속도로 재생하기 위하여 미리 준비되어 각 재생 속도에 각각 대응하는 복수의 음성 데이터를 기억하는 음성 기억 수단과,

상기 음성 데이터를 출력 가능한 상태로 하는 재생 수단과,

상기 각 재생 속도 중 어느 한 속도로 음성을 출력하는 경우에 당해 재생 속도에 대응하는 음성 데이터에 의한 음성을 출력하는 음성 출력 수단으로서 컴퓨터를 기능시키는 것을 특징으로 한다.

청구항 1에 기재된 본 발명에 따르면, 음성 데이터를 이용하여 음성을 재생하기 위한 음성 재생 프로그램에 있어서, 음성 재생 프로그램은 소정의 음성을 복수의 다른 재생 속도로 재생하기 위하여 미리 준비되어 각 재생 속도에 각각 대응하는 복수의 음성 데이터를 기억하는 음성 기억 수단과, 음성 데이터를 출력 가능한 상태로 하는 재생 수단과, 각 재생 속도 중 어느 한 속도로 음성을 출력하는 경우에 재생 속도에 대응하는 음성 데이터에 의한 음성을 출력하는 음성 출력 수단으로서 컴퓨터를 기능시킨다.

즉, 음성 기억 수단은 소정의 음성을 복수의 다른 재생 속도로 재생하기 위하여 미리 준비되어 각 재생 속도에 각각 대응하는 복수의 음성 데이터가 기억된다. 음성 출력 수단은 각 재생 속도 중 어느 한 속도로 음성을 출력하는 경우에 당해 재생 속도에 대응하는 음성 데이터에 의한 음성이 재생되어 출력된다. 이것에 의하여, 재생 속도 변경 시에 다른 재생 속도에 대응하는 음성 데이터를 작성하는 등의 음성 처리가 불필요하게 된다.

청구항 2에 기재된 본 발명은, 상기 음성 기억 수단은 소정의 음성을 제1 재생 속도로 재생하기 위하여 미리 준비된 제1 음성 데이터와, 상기 소정의 음성을 상기 제1 재생 속도와 다른 제2 재생 속도로 재생하기 위하여 미리 준비된 제2 음성 데이터를 기억하고,

상기 재생 수단은 상기 음성 기억 수단으로부터 읽어낸 제1 및 제2 음성 데이터의 재생 위치를 대응시켜 제1 및 제2 음성 데이터를 재생하여, 상기 제1 및 제2 음성 데이터에 의한 음성을 출력 가능한 상태로 하며,

상기 음성 출력 수단은 상기 제1 재생 속도로 음성을 출력하는 경우에 상기 재생 수단에 의하여 재생되고 있는 제1 음성 데이터에 의한 제1 음성을 출력하고, 상기 제2 재생 속도로 음성을 출력하는 경우에 상기 재생 수단에 의하여 재생되고 있는 상기 제2 음성 데이터에 의한 제2 음성을 출력하는 것을 특징으로 한다.

청구항 2에 기재된 발명에 따르면, 음성 기억 수단은 소정의 음성을 제1 재생 속도로 재생하기 위하여 미리 준비된 제1 음성 데이터와, 상기 소정의 음성을 제1 재생 속도와 다른 제2 재생 속도로 재생하기 위하여 미리 준비된 제2 음성 데이터를 기억한다. 재생 수단은 음성 기억 수단으로부터 읽어낸 제1 및 제2 음성 데이터의 재생 위치를 대응시켜 제1 및 제2 음성 데이터를 재생하고, 제1 및 제2 음성 데이터에 의한 음성을 출력 가능한 상태로 한다. 음성 출력 수단은 제1 재생 속도로 음성을 출력하는 경우에 재생 수단에 의하여 재생되고 있는 제1 음성 데이터에 의한 제1 음성을 출력하고, 제2 재생 속도로 음성을 출력하는 경우에 재생 수단에 의하여 재생되고 있는 제2 음성 데이터에 의한 제2 음성을 출력한다.

즉, 제1 재생 속도로 음성을 출력하는 경우에는 제1 재생 속도로 재생하기 위하여 미리 준비된 제1 음성 데이터를 재생한 제1 음성이 재생 수단에 의하여 출력된다. 제2 재생 속도로 음성을 출력하는 경우에는 제2 재생 속도로 재생하기 위하여 미리 준비된 제2 음성 데이터를 재생한 제2 음성이 재생 수단에 의하여 출력된다. 따라서, 제2 재생 속도로 음성을 출력하는 경우에는 제2 음성 데이터는 제2 재생 속도로 재생하기 위하여 미리 준비되어 있기 때문에, 제1 음성 데이터의 기본 주파수를 변경하여 제2 음성 데이터를 작성하는 등의 음성 처리가 불필요하게 된다.

또한, 소정의 음성을 제1 재생 속도로 재생하기 위하여 미리 준비된 제1 음성 데이터와, 소정의 음성을 제1 재생 속도와 다른 제2 재생 속도로 재생하기 위하여 미리 준비된 제2 음성 데이터가 동기(同期)하여 재생되기 때문에, 음성의 재생 속도를 변환하여도 같은 소정의 음성 (같은 내용의 음성)을 출력할 수 있다.

청구항 3에 기재된 본 발명은, 상기 음성 출력 수단에 의한 음성의 출력을 상기 제1 재생 속도로 재생하기 위한 제1 재생 속도 모드와, 상기 음성 출력 수단에 의한 음성의 출력을 상기 제2 재생 속도로 재생하기 위한 제2 재생 속도 모드의 어느 일방(一方)을 유저가 선택하는 조작을 접수하는 조작 수단으로서 상기 컴퓨터를 더 기능시키고,

상기 음성 출력 수단은 상기 조작 수단에 의하여 접수된 재생 속도 모드에 따라 상기 제1 및 제2 음성 데이터에 의한 음성 중의 어느 일방을 출력하는 것을 특징으로 한다.

청구항 3에 기재된 본 발명에 따르면, 조작 수단은 음성 출력 수단에 의한 음성의 출력을 제1 재생 속도로 재생하기 위한 제1 재생 속도 모드와 음성 출력 수단에 의한 음성의 출력을 제2 재생 속도로 재생하기 위한 제2 재생 속도 모드의 어느 일방을 유저가 선택하였을 때의 조작을 접수한다. 음성 출력 수단은 조작 수단에 의하여 접수된 재생 속도 모드에 따라 제1 및 제2 음성 데이터에 의한 음성 중의 어느 일방을 출력한다.

즉, 유저가 제1 음성 속도 모드와 제2 음성 속도 모드의 어느 일방을 선택하였을 때의 조작이 조작 수단에 접수되고, 조작 수단에 접수된 재생 속도 모드에 따라 제1 및 제2 음성 중의 일방이 음성 출력 수단에 의하여 출력된다. 이것에 의하여, 유저는 소망하는 재생 속도로 음성을 들을 수 있는 것과 함께, 일방의 음성의 출력 도중에 타방(他方)의 음성으로 변환할 수 있다.

청구항 4에 기재된 본 발명은, 상기 음성 기억 수단은 상기 제1 음성 데이터로서 소정의 음성을 표준 속도로 재생하기 위하여 미리 준비된 통상 음성 데이터를 기억하는 것과 함께, 상기 제2 음성 데이터로서 상기 통상 음성 데이터를 이용하여 재생되는 음성과 같은 음성을 표준 속도보다 빠른 재생 속도로 재생하기 위하여 미리 준비된 고속 음성 데이터를 기억하며,

상기 음성 출력 수단은 표준 속도로 음성을 출력하는 경우에 상기 통상 음성 데이터에 의한 표준 속도의 음성을 출력하고, 고속으로 음성을 출력하는 경우에 상기 고속 음성 데이터에 의한 고속의 음성을 출력하는 것을 특징으로 한다.

청구항 4에 기재된 본 발명에 따르면, 음성 기억 수단은 제1 음성 데이터로서 소정의 음성을 표준 속도로 재생하기 위하여 미리 준비된 통상 음성 데이터를 기억하는 것과 함께, 제2 음성 데이터로서 통상 음성 데이터를 이용하여 재생되는 음성과 같은 음성을 표준 속도보다 빠른 재생 속도로 재생하기 위하여 미리 준비된 고속 음성 데이터를 기억한다. 이때, 음성 출력 수단은 표준 속도로 음성을 출력하는 경우에 통상 음성 데이터에 의한 표준 속도의 음성을 출력하고, 고속으로 음성을 출력하는 경우에 고속 음성 데이터에 의한 고속의 음성을 출력한다.

즉, 표준 속도로 음성을 출력하는 경우에는, 표준 속도로 재생하기 위하여 미리 준비된 통상 음성 데이터를 재생한 표준 속도의 음성이 출력된다. 고속으로 음성을 출력하는 경우에는 고속으로 재생하기 위하여 미리 준비된 고속 음성 데이터를 재생한 고속의 음성이 출력된다. 이것에 의하여, 표준 속도 또는 고속의 각 재생 속도에 따라 미리 작성된 음성 데이터를 이용하여 음성을 출력할 수 있어, 유저는 표준 속도 및 고속 중 소망하는 속도로 자연스러운 음성을 들을 수 있다.

청구항 5에 기재된 본 발명은, 상기 재생 수단은 상기 제1 및 제2 음성 데이터의 재생이 끝난 시간 또는 나머지 재생 시간에 기초하여 상기 제1 및 제2 음성 데이터의 재생 위치를 대응시켜 제1 및 제2 음성 데이터를 재생하는 것을 특징으로 한다.

청구항 5에 기재된 본 발명에 따르면, 재생 수단은 제1 및 제2 음성 데이터의 재생이 끝난 시간 또는 나머지 재생 시간에 기초하여 제1 및 제2 음성 데이터의 재생 위치를 대응시켜 상기 제1 및 제2 음성 데이터를 재생한다.

즉, 재생이 끝난 시간 또는 나머지 재생 시간이 같아지도록 제1 및 제2 음성 데이터를 재생하는 것에 의하여 제1 및 제2 음성 데이터의 재생 위치를 대응시키고 있다. 이것에 의하여, 체크 플래그 등의 동기 처리 전용의 데이터를 음성 데이터에 부가하는 일 없이 제1 및 제2 음성 데이터의 동기 처리를 행할 수 있다.

청구항 6에 기재된 본 발명은, 상기 음성 기억 수단은 재생되는 음성의 소정의 구간마다 체크 플래그가 삽입된 상기 제1 및 제2 음성 데이터를 기억하고,

상기 재생 수단은 상기 제1 및 제2 음성 데이터의 체크 플래그의 재생 타이밍에 기초하여 상기 제1 및 제2 음성 데이터의 재생 위치를 대응시켜 상기 제1 및 제2 음성 데이터를 재생하는 것을 특징으로 한다.

청구항 6에 기재된 본 발명에 따르면, 음성 기억 수단은 재생되는 음성의 소정의 구간마다 체크 플래그가 삽입된 제1 및 제2 음성 데이터를 기억한다. 재생 수단은 제1 및 제2 음성 데이터의 체크 플래그의 재생 타이밍에 기초하여 제1 및 제2 음성 데이터의 재생 위치를 대응시켜 제1 및 제2 음성 데이터를 재생한다.

즉, 음성의 소정의 구간마다 삽입된 체크 플래그의 재생 타이밍을 기준으로 제1 및 제2 음성 데이터를 동기시키고 있기 때문에, 제1 및 제2 음성 데이터를 재생되는 음성의 소정의 구간마다 고정도(高精度)로 동기시켜 재생할 수 있다.

청구항 7에 기재된 본 발명은, 상기 재생 수단은 상기 제1 및 제2 음성 데이터의 재생 위치가 어긋난 경우에 있어서, 상기 제1 재생 속도로 음성이 출력되고 있을 때에는 상기 제1 음성 데이터의 재생 위치와 대응하도록 상기 제2 음성 데이터의 재생 속도를 조정하고, 상기 제2 재생 속도로 음성이 출력되고 있을 때에는 상기 제2 음성 데이터의 재생 위치와 대응하도록 상기 제1 음성 데이터의 재생 속도를 조정하는 것을 특징으로 한다.

청구항 7에 기재된 본 발명에 따르면, 재생 수단은 제1 및 제2 음성 데이터의 재생 위치가 어긋난 경우에 있어서, 제1 재생 속도로 음성이 출력되고 있을 때에는 제1 음성 데이터의 재생 위치와 대응하도록 제2 음성 데이터의 재생 속도를 조정하고, 제2 재생 속도로 음성이 출력되고 있을 때에는 제2 음성 데이터의 재생 위치와 대응하도록 제1 음성 데이터의 재생 속도를 조정한다.

즉, 제1 및 제2 음성 데이터의 재생 위치가 어긋난 경우에, 현재 출력되고 있는 음성의 재생에 이용되는 음성 데이터를 기준으로 하여 타방의 음성 데이터의 재생 속도를 조정한다. 이것에 의하여, 현재 출력되고 있는 음성에 영향을 주는 일 없이 동기 차이를 보정할 수 있다.

청구항 8에 기재된 본 발명은, 상기 제1 및 제2 음성 데이터에 의하여 재생되는 음성을 표기하는 문자를 생성하기 위한 문자 데이터를 기억하는 문자 기억 수단과,

상기 문자 기억 수단으로부터 읽어낸 문자 데이터에 의하여 나타내지는 문자를 상기 음성 출력 수단에 의하여 출력되고 있는 제1 및 제2 음성 중 적어도 어느 일방에 동기시켜 표시하는 표시 수단으로서 상기 컴퓨터를 더 기능시키는 것을 특징으로 한다.

청구항 8에 기재된 본 발명에 따르면, 문자 기억 수단은 제1 및 제2 음성 데이터에 의하여 재생되는 음성을 표기하는 문자를 생성하기 위한 문자 데이터를 기억한다. 표시 수단은 문자 기억 수단으로부터 읽어낸 문자 데이터에 의하여 나타내지는 문자를 음성 출력 수단에 의하여 출력되고 있는 제1 및 제2 음성 중 적어도 어느 일방에 동기시켜 표시한다.

즉, 문자 기억 수단으로부터 읽어낸 문자 데이터에 의하여 나타내지는 문자가 음성 출력 수단에 의하여 출력되고 있는 음성에 동기하여 표시되기 때문에, 재생되고 있는 음성에 동기시켜 표시 화면 상에 문자를 표시할 수 있다.

청구항 9에 기재된 본 발명은, 상기 표시 수단은 상기 문자 데이터에 의하여 나타내지는 문자에 대응하는 상기 제1 또는 제2 음성 데이터의 재생 시간에 기초하여 상기 문자 기억 수단으로부터 읽어낸 문자 데이터에 의하여 나타내지는 문자를 상기 음성 출력 수단에 의하여 출력되고 있는 제1 및 제2 음성 중 적어도 어느 일방에 동기시켜 표시하는 것을 특징으로 한다.

청구항 9에 기재된 본 발명에 따르면, 표시 수단은 문자 데이터에 의하여 나타내지는 문자에 대응하는 제1 또는 제2 음성 데이터의 재생 시간에 기초하여 문자 기억 수단으로부터 읽어낸 문자 데이터에 의하여 나타내지는 문자를 음성 출력 수단에 의하여 출력되고 있는 제1 및 제2 음성 중 적어도 어느 일방에 동기시켜 표시한다.

즉, 문자에 대응하는 음성 데이터의 재생 시간을 기초로 문자를 음성에 동기시켜 표시하고 있기 때문에, 체크 플래그 등의 동기 처리 전용의 데이터를 문자 데이터에 부가하는 일 없이 문자와 음성의 동기 처리를 행할 수 있다.

청구항 10에 기재된 본 발명은, 상기 표시 수단은 상기 재생 시간을 문자마다 미리 기억하고, 표시되는 문자에 대하여 기억되어 있는 재생 시간을 참조하여 당해 문자를 음성에 동기시켜 표시하는 것을 특징으로 한다.

청구항 10에 기재된 본 발명에 따르면, 표시 수단은 재생 시간을 문자마다 미리 기억하고, 표시되는 문자에 대하여 기억되어 있는 재생 시간을 참조하여 당해 문자를 음성에 동기시켜 표시한다.

즉, 표시되는 문자에 대하여 기억되어 있는 재생 시간을 참조하여 당해 문자를 음성에 동기시켜 표시하고 있기 때문에, 재생 시간을 계산하는 일 없이 문자와 음성의 동기 처리를 행할 수 있다.

청구항 11에 기재된 본 발명은, 상기 표시 수단은 상기 문자 데이터에 의하여 나타내지는 문자에 대응하는 상기 제1 또는 제2 음성 데이터의 데이터량에 기초하여 상기 문자 기억 수단으로부터 읽어낸 문자 데이터에 의하여 나타내지는 문자를 상기 음성 출력 수단에 의하여 출력되고 있는 제1 및 제2 음성 중 적어도 어느 일방에 동기시켜 표시하는 것을 특징으로 한다.

청구항 11에 기재된 본 발명에 따르면, 표시 수단은 문자 데이터에 의하여 나타내지는 문자에 대응하는 제1 또는 제2 음성 데이터의 데이터량에 기초하여 문자 기억 수단으로부터 읽어낸 문자 데이터에 의하여 나타내지는 문자를 음성 출력 수단에 의하여 출력되고 있는 제1 및 제2 음성 중 적어도 어느 일방에 동기시켜 표시한다.

즉, 문자에 대응하는 음성 데이터의 데이터량을 기초로 문자를 음성에 동기시켜 표시하고 있기 때문에, 체크 플래그 등의 동기 처리 전용의 데이터를 문자 데이터에 부가하는 일 없이 문자와 음성의 동기 처리를 행할 수 있다.

청구항 12에 기재된 본 발명은, 음성 데이터를 이용하여 컴퓨터에 의하여 음성을 재생하는 음성 재생 방법에 있어서,

소정의 음성을 복수의 다른 재생 속도로 재생하기 위하여 미리 준비되어 각 재생 속도에 각각 대응하는 복수의 음성 데이터에 의한 음성을 출력 가능한 상태로 하는 스텝과,

상기 각 재생 속도 중 어느 한 속도로 음성을 출력하는 경우에 당해 재생 속도에 대응하는 음성 데이터에 의한 음성을 출력하는 스텝을 포함하는 것을 특징으로 한다.

청구항 12에 기재된 본 발명에 따르면, 음성 데이터를 이용하여 컴퓨터에 의하여 음성을 재생하는 음성 재생 방법에 있어서, 음성 재생 방법은 소정의 음성을 복수의 다른 재생 속도로 재생하기 위하여 미리 준비되어 각 재생 속도에 각각 대응하는 복수의 음성 데이터에 의한 음성을 출력 가능한 상태로 하는 스텝과, 상기 각 재생 속도 중 어느 한 속도로 음성을 출력하는 경우에 당해 재생 속도에 대응하는 음성 데이터에 의한 음성을 출력하는 스텝을 포함한다.

즉, 제1 스텝은 소정의 음성을 복수의 다른 재생 속도로 재생하기 위하여 미리 준비되어 각 재생 속도에 각각 대응하는 복수의 음성 데이터에 의한 음성을 출력 가능한 상태로 한다. 제2 스텝은 상기 각 재생 속도 중 어느 한 속도로 음성을 출력하는 경우에 당해 재생 속도에 대응하는 음성 데이터에 의한 음성을 출력한다.

청구항 13에 기재된 본 발명은, 음성 데이터를 이용하여 음성을 재생하는 음성 재생 장치에 있어서,

상기 음성 데이터를 출력 가능한 상태로 하는 재생 수단과,

상기 각 재생 속도 중 어느 한 속도로 음성을 출력하는 경우에 당해 재생 속도에 대응하는 음성 데이터에 의한 음성을 출력하는 음성 출력 수단을 구비하는 것을 특징으로 한다.

청구항 13에 기재된 본 발명에 따르면, 음성 데이터를 이용하여 음성을 재생하는 음성 재생 장치에 있어서, 음성 기억 수단은 소정의 음성을 복수의 다른 재생 속도로 재생하기 위하여 미리 준비되어 각 재생 속도에 각각 대응하는 복수의 음성 데이터를 기억한다. 재생 수단은 음성 데이터를 출력 가능한 상태로 한다. 음성 출력 수단은 각 재생 속도 중 어느 한 속도로 음성을 출력하는 경우에 당해 재생 속도에 대응하는 음성 데이터에 의한 음성을 출력한다.

즉, 음성 기억 수단에는 소정의 음성을 복수의 다른 재생 속도로 재생하기 위하여, 미리 준비된 당해 재생 속도에 대응하는 복수의 같은 내용의 음성 데이터가 기억된다. 재생 수단 및 음성 출력 수단에서는 각 재생 속도 중 어느 한 속도로 음성을 출력하는 경우에 당해 재생 속도에 대응하는 음성 데이터에 의한 음성이 출력 가능한 상태로 재생되어 출력된다. 이것에 의하여, 재생 속도 변경 시에 기본 주파수와 같은 재생 주파수로 당해 재생 속도에 대응하는 음성 데이터를 작성하는 등의 음성 처리가 불필요하게 된다.

도 1은 본 발명의 제1 실시예의 비디오 게임 장치의 구성을 나타내는 블록도이다.

도 2는 도 1에 도시하는 비디오 게임 장치의 주요 기능을 나타내는 기능 블록도이다.

도 3은 1배속용 음성 데이터(a1)를 이용하여 1배속으로 재생되는 1배속용 음성 신호(V1)와 2배속용 음성 데이터(a2)를 이용하여 2배속으로 재생되는 2배속용 음성 신호(V2)를 도시하는 파형도이다.

도 4는 도 2에 도시하는 비디오 게임 장치가 실행하는 음성 재생 처리의 일례를 나타내는 플로차트이다.

도 5는 표준 속도 재생 모드 및 배속 재생 모드에서 재생되는 음성을 설명하기 위한 모식도이다.

도 6은 도 4에 나타내는 동기 보정 처리의 일례를 나타내는 플로차트이다.

도 7은 제2 실시예에 따른 비디오 게임 장치의 주요 기능을 나타내는 기능 블록도이다.

도 8은 도 7에 나타내는 비디오 게임 장치가 실행하는 음성 재생 처리의 일례를 나타내는 플로차트이다.

도 9는 재생 시간 테이블의 데이터 구조의 일례를 나타내는 모식도이다.

도 10은 음성 데이터량 테이블의 데이터 구조의 일례를 나타내는 모식도이다.

도 11은 본 발명의 제3 실시예에 따른 음성 재생 장치의 구성을 나타내는 블록도이다.

(제1 실시예)

이하, 본 발명의 제1 실시예에 따른 비디오 게임 장치에 대하여 도면을 참조하면서 설명한다.

도 1은 본 발명의 제1 실시예의 비디오 게임 장치의 구성을 나타내는 블록도이다. 덧붙여, 이하의 설명에서는 비디오 게임 장치의 일례로서 가정용 비디오 게임기를 가정용 텔레비전에 접속하는 것에 의하여 구성되는 가정용 비디오 게임 장치에 대하여 설명하지만, 본 발명은 이 예에 특별히 한정되지 않고, 모니터가 일체로 구성된 업무용 비디오 게임 장치, 비디오 게임 프로그램을 실행하는 것에 의하여 비디오 게임 장치로서 기능하는 퍼스널 컴퓨터 등에도 마찬가지로 적용할 수 있다.

도 1에 나타내는 비디오 게임 장치는 가정용 게임기(100) 및 가정용 텔레비전(200)을 구비한다. 가정용 게임기(100)에는 비디오 게임 프로그램 및 게임 데이 터가 기록된 컴퓨터로 읽기 가능한 기록 매체(300)가 장전(裝塡)되고, 비디오 게임 프로그램 및 게임 데이터가 적당히 읽어내져 게임이 실행된다.

가정용 게임기(100)는 CPU(Central Processing Unit, 1), 버스 라인(2), 그래픽스 데이터 생성 프로세서(3), 인터페이스 회로(I/F, 4), 메인 메모리(5), ROM(6), 신장 회로(7), 패러렐 포트(8), 시리얼 포트(9), 묘화 프로세서(10), 음성 프로세서(11), I/O 프로세서(12), 버퍼(13 ~ 15), 기록 매체 드라이브(16), 메모리(17) 및 컨트롤러(18)를 포함한다. 가정용 텔레비전(200)은 텔레비전 모니터(21), 증폭 회로(22) 및 스피커(23)를 포함한다.

CPU(1)는 버스 라인(2) 및 그래픽스 데이터 생성 프로세서(3)에 접속되어 있다. 버스 라인(2)은 어드레스 버스, 데이터 버스 및 컨트롤 버스 등을 포함하고, CPU(1), 인터페이스 회로(4), 메인 메모리(5), ROM(6), 신장 회로(7), 패러렐 포트(8), 시리얼 포트(9), 묘화 프로세서(10), 음성 프로세서(11) 및 I/O 프로세서(12)를 서로 접속하고 있다.

묘화 프로세서(10)는 버퍼(13)에 접속된다. 음성 프로세서(11)는 버퍼(14) 및 증폭 회로(22)에 접속된다. I/O 프로세서(12)는 버퍼(15), 기록 매체 드라이브(16), 메모리(17) 및 컨트롤러(18)에 접속된다.

가정용 텔레비전(200)의 텔레비전 모니터(21)는 묘화 프로세서(10)에 접속된다. 스피커(23)는 증폭 회로(22)에 접속된다. 덧붙여, 업무용 비디오 게임 장치의 경우, 텔레비전 모니터(21), 증폭 회로(22) 및 스피커(23)는 가정용 게임기(100)를 구성하는 각 블록과 함께 1개의 상자체에 수납되는 경우가 있다.

또한, 비디오 게임 장치가 퍼스널 컴퓨터나 워크스테이션 등을 중심으로 하여 구성되어 있는 경우, 텔레비전 모니터(21) 등은 컴퓨터용의 디스플레이에 대응한다. 또한, 신장 회로(7), 묘화 프로세서(10), 음성 프로세서(11) 및 I/O 프로세서(12) 등은 각각 기록 매체(300)에 기록되어 있는 프로그램 데이터의 일부 또는 컴퓨터의 확장 슬롯에 탑재되는 확장 보드 상의 하드웨어에 대응한다.

또한, 인터페이스 회로(4), 패러렐 포트(8) 및 시리얼 포트(9)는 컴퓨터의 확장 슬롯에 탑재되는 확장 보드 상의 하드웨어에 대응한다. 또한, 버퍼(13 ~ 15)는 각각 메인 메모리 또는 확장 메모리의 각 기억 영역에 대응한다.

다음으로, 도 1에 나타내는 각 구성 요소에 대하여 설명한다. 그래픽스 데이터 생성 프로세서(3)는 CPU(1)의 이를 테면 코프로세서(coprocessor)로서의 역할을 수행한다. 즉, 그래픽스 데이터 생성 프로세서(3)는 좌표 변환이나 광원 계산, 예를 들어, 고정 소수점 형식의 행렬이나 벡터의 연산을 병렬 처리에 의하여 행한다.

그래픽스 데이터 생성 프로세서(3)가 행하는 주된 처리로는 CPU(1)로부터 공급되는 화상 데이터의 2차원 또는 가상 3차원 공간 내에서의 각 정점(頂點)의 좌표 데이터, 이동량 데이터, 회전량 데이터 등에 기초하여 소정의 표시 영역 상에서의 처리 대상 화상의 어드레스 데이터를 구하여 CPU(1)로 되돌리는 처리, 가상적으로 설정된 광원으로부터의 거리에 따라 화상의 휘도를 계산하는 처리 등이 있다.

인터페이스 회로(4)는 주변 디바이스 예를 들어, 마우스나 트랙볼 등의 포인팅 디바이스 등의 인터페이스용으로 이용된다. 메인 메모리(5)는 RAM(Random Access Memory) 등으로 구성된다. ROM(6)에는 비디오 게임 장치의 오퍼레이팅 시스템으로 이루어지는 프로그램 데이터가 기억되어 있다. 이 프로그램은 퍼스널 컴퓨터의 BIOS(Basic Input Output System)에 상당한다.

신장 회로(7)는 동영상에 대한 MPEG(Moving Picture Experts Group) 규격이나 정지면(靜止面)에 대한 JPEG(Joint Photographic Experts Group) 규격에 준거한 인트라 부호화에 의하여 압축된 압축 화상에 대하여 신장 처리를 시행한다. 신장 처리는 디코드 처리(VLC：Variable Length Code에 의하여 인코드된 데이터의 디코드), 역양자화 처리, IDCT(Inverse Discrete Cosine Transform) 처리, 인트라 화상의 복원 처리 등을 포함한다.

묘화 프로세서(10)는 소정 시간 T (예를 들어, 1프레임에서 T = 1/60초)마다 CPU(1)가 발행하는 묘화 명령에 기초하여 버퍼(13)에 대한 묘화 처리를 행한다.

버퍼(13)는 예를 들어, RAM로 구성되고, 표시 영역 (프레임 버퍼)과 비표시 영역으로 나누어진다. 표시 영역은 텔레비전 모니터(21)의 표시면 상에 표시하는 데이터의 전개 영역으로 구성된다. 비표시 영역은 스켈레톤(skeleton)을 정의하는 데이터, 폴리곤(polygon, 3차원 컴퓨터 그래픽을 구성하는 단위)을 정의하는 모델 데이터, 모델에 움직임을 행하게 하는 애니메이션 데이터, 각 애니메이션의 내용을 나타내는 패턴 데이터, 텍스처 데이터 및 컬러 팔레트 데이터 등의 기억 영역으로 구성된다.

여기서, 텍스처 데이터는 2차원의 화상 데이터이다. 컬러 팔레트 데이터는 텍스처 데이터 등의 색을 지정하기 위한 데이터이다. CPU(1)는 이들 데이터를 기 록 매체(300)로부터 한 번 또는 게임의 진행 상황에 따라 복수회로 나누어 미리 버퍼(13)의 비표시 영역에 기록한다.

또한, 묘화 명령으로는 폴리곤을 이용하여 입체적인 화상을 묘화하기 위한 묘화 명령, 통상의 2차원 화상을 묘화하기 위한 묘화 명령이 있다. 여기서, 폴리곤은 다각형의 2차원 가상 도형이며, 예를 들어, 삼각형이나 사각형이 이용된다.

폴리곤을 이용하여 입체적인 화상을 묘화하기 위한 묘화 명령은 폴리곤 정점 좌표 데이터의 버퍼(13)의 표시 영역 상에서의 기억 위치를 나타내는 폴리곤 정점 어드레스 데이터, 폴리곤에 붙이는 텍스처의 버퍼(13) 상에서의 기억 위치를 나타내는 텍스처 어드레스 데이터, 텍스처의 색을 나타내는 컬러 팔레트 데이터의 버퍼(13) 상에서의 기억 위치를 나타내는 컬러 팔레트 어드레스 데이터 및 텍스처의 휘도를 나타내는 휘도 데이터의 각각에 대하여 행하여지는 것이다.

상기의 데이터 중 표시 영역 상의 폴리곤 정점 어드레스 데이터는 그래픽스 데이터 생성 프로세서(3)가 CPU(1)로부터의 가상 3차원 공간 상에서의 폴리곤 정점 좌표 데이터를 이동량 데이터 및 회전량 데이터에 기초하여 좌표 변환하는 것에 의하여 2차원 상에서의 폴리곤 정점 좌표 데이터로 치환된 것이다. 휘도 데이터는 CPU(1)로부터의 상기 좌표 변환 후의 폴리곤 정점 좌표 데이터에 의하여 나타내지는 위치로부터 가상적으로 배치된 광원까지의 거리에 기초하여 그래픽스 데이터 생성 프로세서(3)에 의하여 결정된다.

폴리곤 정점 어드레스 데이터는 버퍼(13)의 표시 영역 상의 어드레스를 나타낸다. 묘화 프로세서(10)는 3개의 폴리곤 정점 어드레스 데이터로 나타내지는 버 퍼(13)의 표시 영역의 범위에 대응하는 텍스처 데이터를 쓰는 처리를 행한다.

게임 공간 내에서의 캐릭터 등의 물체는 복수의 폴리곤으로 구성된다. CPU(1)는 각 폴리곤의 가상 3차원 공간 상의 좌표 데이터를 대응하는 스켈레톤의 벡터 데이터와 관련시켜 버퍼(13)에 기억한다. 그리고 컨트롤러(18, 후술)의 조작에 의하여 텔레비전 모니터(21)의 표시 화면 상에서 캐릭터를 이동시키는 등의 경우에 있어서, 캐릭터의 움직임을 표현하거나 캐릭터를 보고 있는 시점 위치를 바꿀 때에 이하의 처리가 행하여진다.

즉, CPU(1)는 그래픽스 데이터 생성 프로세서(3)에 대하여 버퍼(13)의 비표시 영역 내에 유지하고 있는 각 폴리곤의 정점의 3차원 좌표 데이터와, 스켈레톤의 좌표 및 그 회전량의 데이터로부터 구하여진 각 폴리곤의 이동량 데이터 및 회전량 데이터를 준다.

그래픽스 데이터 생성 프로세서(3)는 각 폴리곤의 정점의 3차원 좌표 데이터와 각 폴리곤의 이동량 데이터 및 회전량 데이터에 기초하여 각 다각형의 이동 후 및 회전 후의 3차원 좌표 데이터를 순차로 구한다.

이와 같이 하여 구하여진 각 폴리곤의 3차원 좌표 데이터 중 수평 및 수직 방향의 좌표 데이터는 버퍼(13)의 표시 영역 상의 어드레스 데이터, 즉, 폴리곤 정점 어드레스 데이터로서 묘화 프로세서(10)로 공급된다.

묘화 프로세서(10)는 3개의 폴리곤 정점 어드레스 데이터에 의하여 나타내지는 버퍼(13)의 표시 영역 상에 미리 할당되어 있는 텍스처 어드레스 데이터에 의하여 나타내지는 텍스처 데이터를 쓴다. 이것에 의하여, 텔레비전 모니터(21)의 표 시 화면 상에는 다수의 폴리곤에 텍스처가 붙여진 물체가 표시된다.

통상의 2차원 화상을 묘화하기 위한 묘화 명령은 정점 어드레스 데이터, 텍스처 어드레스 데이터, 텍스처 데이터의 색을 나타내는 컬러 팔레트 데이터의 버퍼(13) 상에서의 기억 위치를 나타내는 컬러 팔레트 어드레스 데이터 및 텍스처의 휘도를 나타내는 휘도 데이터에 대하여 행하여진다. 이들 데이터 중 정점 어드레스 데이터는 CPU(1)로부터의 2차원 평면 상에서의 정점 좌표 데이터를 CPU(1)로부터의 이동량 데이터 및 회전량 데이터에 기초하여 그래픽스 데이터 생성 프로세서(3)가 좌표 변환하는 것에 의하여 얻어진다.

음성 프로세서(11)는 기록 매체(300)로부터 읽어내진 ADPCM(Adaptive Differential Pulse Code Modulation) 데이터를 버퍼(14)에 기억시키고, 버퍼(14)에 기억된 ADPCM 데이터가 음원으로 된다. 또한, 음성 프로세서(11)는 예를 들어, 주파수 44.1kHz의 클럭 신호에 기초하여 버퍼(14)로부터 ADPCM 데이터를 읽어낸다.

음성 프로세서(11)는 읽어낸 ADPCM 데이터에 대하여 노이즈의 부가, 포락선의 설정, 레벨의 설정 및 리버브(reverb, 공명 울림 현상)의 부가 등의 처리를 시행한다. 이때, 음성 프로세서(11)는 읽어낸 ADPCM 데이터를 원래의 음성 데이터로 복호화하고, 후술하는 바와 같이 I/O 프로세서에 의하여 설정된 음량 및 재생 주파수로 음성 데이터를 음성 신호로 변환하여 증폭 회로(22)로 출력한다. 그 후, 증폭 회로(22)는 음성 신호를 증폭하여 스피커(23)로 출력하고, 스피커(23)는 재생된 음성을 출력한다.

기록 매체(300)로부터 읽어내지는 음성 데이터가 CD-DA(Compact Disk Digital Audio) 등의 PCM(Pulse Code Modulation) 데이터인 경우, 음성 프로세서(11)는 이 음성 데이터를 ADPCM 데이터로 변환한다. 또한, PCM 데이터에 대한 프로그램에 의한 처리는 메인 메모리(5) 상에서 직접 행하여진다. 메인 메모리(5) 상에서 처리된 PCM 데이터는 음성 프로세서(11)로 공급되어 ADPCM 데이터로 변환된다. 그 후, 상술한 각종 처리가 시행되어 음성이 재생된다.

I/O 프로세서(12)는 입출력 제어뿐만 아니라 디코더로서도 기능하고, 기록 매체 드라이브(16)에 의하여 송신된 화상 데이터, 음성 데이터 및 프로그램 데이터 등의 각종 데이터를 작업 영역인 버퍼(15)에 격납(格納)하며, 버퍼(15)로부터 읽어낸 각종 데이터에 대하여 ECC(Error Correction Code)에 의한 에러 정정 처리를 시행하여, 에러 정정 처리를 시행한 각종 데이터를 메인 메모리(5) 또는 음성 프로세서(11)로 공급한다.

메인 메모리(5) 또는 음성 프로세서(11)는 공급된 음성 데이터를 버퍼(14)에 격납한다. 또한, I/O 프로세서(12)는 컨트롤러(18)를 통하여 유저에 의하여 지시된 재생 모드 등에 따라 버퍼(14)로부터 읽어낸 당해 음성 데이터가 재생되도록 음성 프로세서(11)에 대하여 음량 및 재생 주파수의 설정을 행한다.

기록 매체 드라이브(16)는 기록 매체(300)로부터 화상 데이터, 음성 데이터 및 프로그램 데이터를 읽어내고, 읽어낸 데이터를 I/O 프로세서(12)로 공급한다. 기록 매체 드라이브(16)로는 예를 들어, DVD-ROM 드라이브, CD-ROM 드라이브, 하드 디스크 드라이브, 광디스크 드라이브, 플랙서블 디스크 드라이브, 실리콘 디스크 드라이브, 카세트 매체 판독기 등이 이용된다. 이 경우, 기록 매체(300)로는 DVD- ROM, CD-ROM, 하드 디스크, 광디스크, 플랙서블 디스크, 반도체 메모리 등이 이용된다.

메모리(17)로는 예를 들어, 카드형의 메모리가 이용된다. 카드형의 메모리는 예를 들어, 게임을 중단하였을 경우에 있어서 중단 시점에서의 상태를 유지하는 등과 같이 중단 시점에서의 각종 게임 파라미터를 유지하기 위함 등에 이용된다.

컨트롤러(18)는 유저가 여러 가지 조작 지령을 입력하기 위하여 사용하는 조작 장치이고, 유저의 조작에 따른 조작 신호를 CPU(1)로 송출한다. 컨트롤러(18)에는 제1 버튼(18a), 제2 버튼(18b), 제3 버튼(18c), 제4 버튼(18d), 상방향 키(18U), 하방향 키(18D), 좌방향 키(18L), 우방향 키(18R), L1 버튼(18L1), L2 버튼(18L2), R1 버튼(18R1), R2 버튼(18R2), 스타트 버튼(18e), 셀렉트 버튼(18f), 좌스틱(18SL) 및 우스틱(18SR)이 설치되어 있다.

상방향 키(18U), 하방향 키(18D), 좌방향 키(18L) 및 우방향 키(18R)는 예를 들어, 캐릭터나 커서를 텔레비전 모니터(21)의 화면 상에서 상하 좌우로 이동시키는 커멘드(command)를 CPU(1)에 주기 위하여 사용된다.

스타트 버튼(18e)은 기록 매체(300)로부터 게임 프로그램을 로드(load)하도록 CPU(1)에 지시하기 위함 등에 사용된다. 셀렉트 버튼(18f)은 기록 매체(300)로부터 메인 메모리(5)에 로드되는 게임 프로그램에 관한 각종 선택을 CPU(1)에 지시하기 위함 등에 사용된다.

좌스틱(18SL) 및 우스틱(18SR)를 제외하는 컨트롤러(18)의 각 버튼 및 각 키는 외부로부터의 압압력(押壓力)에 의하여 중립 위치로부터 압압되면 온(on)이 되 고, 압압력이 해제되면 상기 중립 위치로 복귀하여 오프(off)가 되는 온 오프 스위치로 구성된다.

좌스틱(18SL) 및 우스틱(18SR)은 이를 테면 조이스틱과 거의 동일한 구성의 스틱형 컨트롤이러이다. 이 스틱형 컨트롤러는 직립한 스틱을 가지며, 이 스틱의 소정 위치를 지점(支點)으로 하여 전후 좌우를 포함하는 360°방향에 걸쳐 경도(傾倒) 가능한 구성으로 되어 있다. 좌스틱(18SL) 및 우스틱(18SR)은 스틱의 경도 방향 및 경도 각도에 따라 직립 위치를 원점으로 하는 좌우 방향의 x 좌표 및 전후 방향의 y 좌표의 값을 조작 신호로서 I/O 프로세서(12)를 통하여 CPU(1)로 송출한다.

덧붙여, 제1 버튼(18a), 제2 버튼(18b), 제3 버튼(18c), 제4 버튼(18d), L1 버튼(18L1), L2 버튼(18L2), R1 버튼(18R1) 및 R2 버튼(18R2)은 기록 매체(300)로부터 로드되는 게임 프로그램에 따라 여러 가지 기능으로 사용된다.

다음으로, 상기의 비디오 게임 장치의 개략 동작에 대하여 설명한다. 기록 매체(300)가 기록 매체 드라이브(16)에 장전되어 있는 경우, 전원 스위치 (도시 생략)가 온되어 비디오 게임 장치에 전원이 투입된다. 그렇게 하면, CPU(1)는 ROM(6)에 기억되어 있는 오퍼레이팅 시스템에 기초하여 기록 매체(300)로부터 게임 프로그램을 읽어내도록 기록 매체 드라이브(16)에 지시한다. 이 지시에 의하여, 기록 매체 드라이브(16)는 기록 매체(300)로부터 화상 데이터, 음성 데이터 및 프로그램 데이터를 읽어낸다. 읽어내진 화상 데이터, 음성 데이터 및 프로그램 데이터는 I/O 프로세서(12)로 공급되고, I/O 프로세서(12)에 의하여 에러 정정 처리가 각 데이터에 시행된다.

I/O 프로세서(12)에 의하여 에러 정정 처리가 시행된 화상 데이터는 버스 라인(2)을 통하여 신장 회로(7)로 공급된다. 신장 회로(7)에 의하여 상술한 신장 처리가 행하여진 화상 데이터는 묘화 프로세서(10)로 공급되고, 묘화 프로세서(10)에 의하여 버퍼(13)의 비표시 영역에 쓰기된다. I/O 프로세서(12)에 의하여 에러 정정 처리가 시행된 음성 데이터는 메인 메모리(5) 또는 음성 프로세서(11)를 통하여 버퍼(14)에 쓰기된다. 또한, I/O 프로세서(12)에 의하여 에러 정정 처리가 시행된 프로그램 데이터는 메인 메모리(5)에 쓰기된다.

이후, CPU(1)는 메인 메모리(5)에 기억되어 있는 게임 프로그램 및 유저가 컨트롤러(18)를 이용하여 지시하는 내용에 기초하여 비디오 게임을 진행시킨다. 즉, 유저가 컨트롤러(18)를 이용하여 지시하는 내용에 기초하여 CPU(1)는 화상 처리의 제어, 음성 처리의 제어 및 내부 처리의 제어 등을 적당히 행한다.

화상 처리의 제어로서 예를 들어, 캐릭터에 지시되는 애니메이션에 해당하는 패턴 데이터로부터 각 스켈레톤의 좌표의 계산 또는 폴리곤의 정점 좌표 데이터의 계산, 얻어진 3차원 좌표 데이터나 시점 위치 데이터의 그래픽스 데이터 생성 프로세서(3)로의 공급, 그래픽스 데이터 생성 프로세서(3)가 구한 버퍼(13)의 표시 영역 상의 어드레스 데이터나 휘도 데이터를 포함하는 묘화 명령의 발행 등이 행하여진다.

음성 처리의 제어로서 예를 들어, 음성 프로세서(11)에 대한 음성 출력 커멘드의 발행, 레벨, 리버브 등의 지정이 있다. 내부 처리의 제어로서 예를 들어, 컨 트롤러(18)의 조작에 따른 연산 등이 행하여진다.

도 2는 도 1에 나타내는 비디오 게임 장치의 주요 기능을 나타내는 기능 블록도이다. 비디오 게임 장치는 음성 출력부(101), 기억부(102), 조작부(103), 프로그램 실행부(104) 및 프로그램 기억부(105)를 가진다. 음성 출력부(101)는 도 1에 나타내는 증폭 회로(22)나 스피커(23) 등에 의하여 실현된다. 기억부(102)는 도 1에 나타내는 메인 메모리(5)나 버퍼(13 ~ 15)에 의하여 실현된다.

기억부(102)는 소정의 음성을 복수의 다른 재생 속도로 재생하기 위하여 미리 준비되어 각 음성 속도에 각각 대응하는 복수의 음성 데이터를 격납한다 (여기에서는, 기록 매체(300)로부터 읽어내진 1배속용 음성 데이터(a1)를 제1 채널용의 음성 데이터로서 격납하고, 2배속용 음성 데이터(a2)를 제2 채널용의 음성 데이터로서 격납한다). 여기서, 1배속용 음성 데이터(a1)는 소정의 음성 (기록 시의 속도)을 표준 속도, 즉 1배속으로 재생하기 위하여 미리 준비된 음성 데이터이며, 2배속용 음성 데이터(a2)는 소정의 음성 (표준 속도로 재생되는 음성과 같은 내용을 나타내는 음성)을 빨리 듣기 속도로 재생하기 위하여 미리 준비된 음성 데이터이다. 빨리 듣기 속도란 표준 속도보다 고속의 속도인 것이며, 여기에서는 2배의 속도인 것이다. 덧붙여, 표준 음성이란 표준 속도로 재생된 음성이며, 빨리 듣기 음성이란 빨리 듣기 속도로 재생된 음성인 것이다. 「소정의 음성」은 표현 내용, 전달 내용이 동일한 음성이며, 예를 들어, 각 데이터에 기초하여 재생되는 단어 (말)는 일언일구(一言一句) 다르지 않다.

조작부(103)는 도 1에 나타내는 컨트롤러(18) 등에 의하여 실현되고, 유저로 부터의 음성 재생 속도 모드 지시 커멘드를 접수한다. 음성 재생 속도 모드 지시 커멘드란, 비디오 게임 장치에 유저가 소망하는 재생 속도로 음성을 재생시키는 커멘드이다. 음성 재생 속도 모드 지시 커멘드에는 표준 속도 재생 모드 지시 커멘드와 빨리 듣기 속도 재생 모드 커멘드가 있다. 표준 속도 재생 모드 지시 커멘드가 조작부(103)에 접수된 경우에는 1배속용 음성 데이터(a1)를 표준 속도로 재생한 음성이 출력되어, 유저는 표준 속도로 재생된 음성을 들을 수 있다. 한편, 빨리 듣기 속도 재생 모드 지시 커멘드가 조작부(103)에 접수된 경우에는 2배속용 음성 데이터(a2)를 빨리 듣기 속도로 재생한 음성이 출력되어, 유저는 빨리 듣기 속도로 재생된 음성을 들을 수 있다.

프로그램 실행부(104)는 CPU(1), 묘화 프로세서(10), 음성 프로세서(11) 및 I/O 프로세서(12) 등에 의하여 실현된다. 프로그램 실행부(104)는 재생 조건 결정부(111) 및 음성 재생부(112)를 포함한다.

재생 조건 결정부(111)는 주로 I/O 프로세서(12) 등에 의하여 실현되고, 조작부(103)에 의하여 접수된 음성 재생 속도 모드 지시 커멘드에 따른 속도로 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)가 동기하여 재생되도록, 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)의 재생 주파수를 음성 재생부(112)에 설정한다. 또한, 재생 조건 결정부(111)는 상기의 1배속용 음성 데이터(a1)에 기초하는 1배속용 음성 및 2배속용 음성 데이터(a2)에 기초하는 2배속용 음성 중 음성 재생 속도 모드에 따른 일방만을 유저가 청취 가능하도록, 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)의 음량을 음성 재생부(112)에 설정한다.

음성 재생부(112)는 주로 음성 프로세서(11) 등에 의하여 실현되고, 재생 조건 결정부(111)에 의하여 설정된 재생 주파수 및 음량으로 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)를 동기시켜 출력 가능한 상태로 한다. 즉, 음성 재생부(112)는 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)의 재생 위치를 대응시켜 재생하여, 출력 가능한 상태로 한다. 이때, 음성 재생부(112)는 1배속용 음성 및 2배속용 음성 중 음성 재생 속도 모드 지시 커멘드에 따른 일방만을 유저가 청취 가능하도록, 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)의 음량을 설정하고 있다. 이것에 의하여, 유저는 일방의 음성만을 들을 수 있다.

프로그램 기억부(105)는 컴퓨터로 읽기 가능한 기록 매체(300)가 장전된 기록 매체 드라이브(16) 등으로 실현되고, 기록 매체(300)에는 음성 재생 프로그램을 포함하는 비디오 게임 프로그램이 기록되어 있다. 덧붙여, 기록 매체(300)로부터 음성 재생 프로그램이 읽어내지고, 당해 프로그램이 메인 메모리(5)에 기억되어 있는 경우, 메인 메모리(5)가 프로그램 기억부(105)로서 기능한다.

다음으로, 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)에 대하여 상세히 설명한다. 도 3은 1배속용 음성 데이터(a1)를 이용하여 표준 속도로 재생되는 1배속용 음성 신호(V1)와 2배속용 음성 데이터(a2)를 이용하여 빨리 듣기 속도로 재생되는 2배속용 음성 신호(V2)를 도시하는 파형도이다. 덧붙여, 도 3에서는 세로축은 진폭(振幅), 가로축은 시간을 나타내고 있다.

1배속용 음성 데이터(a1)는 표준 속도의 음성으로서 유저에게 청취시키는 음성을 기록한 음성 데이터이며, 예를 들어, 비디오 게임에 관한 설명 등을 행하는 나레이터 등의 실제 사람이 발성한 음성을 그대로 기록한 음성 데이터를 이용할 수 있다. 한편, 2배속용 음성 데이터(a2)는 빨리 듣기 속도로 재생한 경우에 표준 속도와 같은 음정으로 자연스러운 음성을 재생할 수 있도록 1배속용 음성 데이터(a1)에 대하여 음정 변환 처리 등의 음성 변환 처리를 시행한 음성 데이터이다.

즉, 2배속용 음성 데이터(a2)는 빨리 듣기 속도로 재생한 경우에 1배속용 음성 데이터(a1)와 같은 피치로 재생되도록 1배속용 음성 데이터(a1)를 편집하여 미리 작성된 음성 데이터이며, 예를 들어, Berkley Integrated Audio Sofwear사의 파형 편집 소프트인 「Peak」에서의 「Change Duration」이라고 하는 기능을 이용하는 등 하여, 1배속용 음성 데이터(a1)를 음정을 유지한 채 재생 시간을 1/2로 하여 생성된다. 덧붙여, 「Peak」 이외에도 Avid Technology사의 「Protools softwere」 에서의 「Time Compression/Expansion」을 이용하여, 상기의 2배속용 음성 데이터(a2)를 생성할 수도 있다.

덧붙여, 2배속용 음성 데이터는 상기에 한정되지 않고, 1배속용 음성 데이터와 같은 단어를 빠른 말로 별도 녹음한 것이어도 무방하고, 같은 악곡을 빠르게 연주하여 별도 녹음한 것이어도 무방하다.

예를 들어, 상기의 1배속용 음성 데이터(a1)를 표준 속도로 재생한 경우, 1배속용 음성 신호(V1)는 도 3의 상단에 도시하는 파형을 가진다. 한편, 1배속용 음성 데이터(a1)와 같은 내용을 나타내는 2배속용 음성 데이터(a2)를 빨리 듣기 속도로 재생한 경우, 2배속용 음성 신호(V2)는 도 3의 하단에 도시하는 파형을 가지고, 1배속용 음성 신호(V1)를 시간축 상에서 2분의 1로 압축한 것과 같은 파형을 가진다.

이때, 2배속용 음성 데이터(a2)를 빨리 듣기 속도로 재생한 경우의 재생 시간(X2)은 1배속용 음성 데이터(a1)를 표준 속도로 재생한 경우의 재생 시간(X1)의 2분의 1로 되지만, 상기의 피치 변환 처리 등이 시행되어 있기 때문에 음정은 변화하지 않고, 1배속용 음성 신호(V1)의 음성과 마찬가지로 매우 알아듣기 쉬운 음성을 재생할 수 있다.

다음으로, 도 2에 나타내는 비디오 게임 장치가 기록 매체(300)에 격납되는 음성 재생 프로그램을 실행하는 것에 의하여 실현되는 음성 재생 처리를 설명한다. 도 4는 도 2에 나타내는 비디오 게임 장치가 실행하는 음성 재생 처리의 일례를 나타내는 플로차트이다.

우선, 스텝 1에서 재생 조건 결정부(111)는 기록 매체(300)에 기억되어 있는 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)를 읽어내어 기억부(102)에 격납시킨다.

다음으로, 스텝 2에서 재생 조건 결정부(111)는 음성 재생 속도 모드 지시 커멘드에 기초하여 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)의 재생 주파수 및 음량을 음성 재생부(112)에 설정한다. 이 경우의 음성 재생 속도 모드 지시 커멘드는 미리 정해져 있는 초기 설정 시의 음성 재생 속도 모드 지시 커멘드, 또는 유저가 조작부(103)를 이용하여 이미 설정한 음성 재생 속도 모드 지시 커멘드이다.

구체적으로는, 표준 속도 재생 모드 지시 커멘드가 접수되어 표준 속도 재생 모드로 설정되어 있는 경우, 재생 조건 결정부(111)는 1배속용 음성 데이터(a1)의 재생 주파수 및 음량을 1배속용 음성 데이터(a1)의 기본 주파수와 같은 재생 주파수 및 표준 음량 (예를 들어, 음량 조정 범위의 중간량)으로 설정하는 것과 함께, 2배속용 음성 데이터(a2)의 재생 주파수 및 음량을 2배속용 음성 데이터(a2)의 기본 주파수의 절반의 재생 주파수 및 무음량 (음량 0)으로 설정한다. 덧붙여, 기본 주파수는 재생 속도를 변경하기 위하여 재생 주파수를 조정하는 일 없이 각 음성 데이터(a1, a2)를 재생한 경우의 재생 주파수이다.

한편, 빨리 듣기 속도 재생 모드 지시 커멘드가 접수되어 빨리 듣기 속도 재생 모드로 설정되어 있는 경우, 재생 조건 결정부(111)는 1배속용 음성 데이터(a1)의 재생 주파수 및 음량을 1배속용 음성 데이터(a1)의 기본 주파수의 배의 재생 주파수 및 무음량으로 설정하는 것과 함께, 2배속용 음성 데이터(a2)의 재생 주파수 및 음량을 2배속용 음성 데이터(a2)의 기본 주파수와 같은 재생 주파수 및 표준 음량으로 설정한다.

다음으로, 스텝 S3에서 음성 재생부(112)는 기억부(102)로부터 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)를 읽어내고, 스텝 S2에서 설정된 재생 주파수 및 음량으로 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)를 재생하며, 음성 출력부(101)는 재생된 음성을 출력한다.

구체적으로는, 표준 속도 재생 모드인 경우, 음성 재생부(112)는 1배속용 음성 데이터(a1)를 1배속용 음성 데이터(a1)의 기본 주파수와 같은 재생 주파수 및 표준 음량으로 재생하는 것과 함께, 2배속용 음성 데이터(a2)를 2배속용 음성 데이 터(a2)의 기본 주파수의 절반의 재생 주파수 및 무음량으로 재생하고, 음성 출력부(101)는 1배속용 음성 데이터(a1)를 이용하여 재생된 1배속용 음성만을 출력한다.

한편, 빨리 듣기 속도 재생 모드인 경우, 음성 재생부(112)는 1배속용 음성 데이터(a1)를 1배속용 음성 데이터(a1)의 기본 주파수의 배의 재생 주파수 및 무음량으로 재생하는 것과 함께, 2배속용 음성 데이터(a2)를 2배속용 음성 데이터(a2)의 기본 주파수와 같은 재생 주파수 및 표준 음량으로 재생하고, 음성 출력부(101)는 2배속용 음성 데이터(a2)를 이용하여 재생된 2배속용 음성만을 출력한다. 여기서, 표준 속도 재생 모드 및 빨리 듣기 속도 재생 모드에서 재생되는 음성에 대하여 상세히 설명한다. 도 5는 표준 속도 재생 모드 및 빨리 듣기 속도 재생 모드에서 재생되는 음성을 설명하기 위한 모식도이다.

덧붙여, 도 5에서는 설명을 용이하게 하기 위하여 1배속용 음성 데이터(a1)의 일례로서 1배속용 음성 데이터(A1 ~ J1)로부터 음성 「안녕하세요」를 출력하기 위한 1배속용 음성 데이터가 구성되며, 1배속용 음성 데이터(A1, B1)가 재생되면 음성 「안」이 출력되고, 1배속용 음성 데이터(C1, D1)가 재생되면 음성 「녕」이 출력되며, 1배속용 음성 데이터(E1, F1)가 재생되면 음성 「하」가 출력되고, 1배속용 음성 데이터(G1, H1)가 재생되면 음성 「세」가 출력되며, 1배속용 음성 데이터(I1, J1)가 재생되면 음성 「요」가 출력되는 것으로 한다.

또한, 2배속용 음성 데이터(a2)의 일례로서 2배속용 음성 데이터(A2 ~ E2)로부터 음성 「안녕하세요」를 출력하기 위한 2배속용 음성 데이터가 구성되며, 2배속용 음성 데이터(A2)가 재생되면 음성 「안」이 출력되고, 음성 데이터(B2)가 재 생되면 음성 「녕」이 출력되며, 2배속용 음성 데이터(C2)가 재생되면 음성 「하」가 출력되고, 2배속용 음성 데이터(D2)가 재생되면 음성 「세」가 출력되며, 2배속용 음성 데이터(E2)가 재생되면 음성 「요」가 출력되는 것으로 하여 설명한다.

우선, 표준 속도 재생 모드인 경우, 도 5의 (a)에 도시하는 바와 같이, 1배속용 음성 데이터(A1 ~ J1)가 재생 주기 t1 (1배속용 음성 데이터(a1)의 기본 주파수의 역수)으로 순차로 재생되고, 재생 시간 T1에서 음성 「안녕하세요」가 통상의 음정으로 또한 표준 음량으로 출력된다. 한편, 도 5의 (b)에 도시하는 바와 같이, 2배속용 음성 데이터(A2 ~ E2)가 재생 주기 2×t1 (2배속용 음성 데이터(a2)의 기본 주파수의 절반의 역수)으로 동기하여 순차로 재생되고, 재생 시간 T1에서 음성 「안녕하세요」가 통상의 음정보다 1옥타브 낮은 음정으로 또한 무음량으로 출력된다.

이와 같이, 표준 속도 재생 모드에서는 1배속용 음성 데이터(A1 ~ J1) 및 2배속용 음성 데이터(A2 ~ E2)가 동기하여 재생되지만, 2배속용 음성 데이터(A2 ~ E2)에 의한 1옥타브 낮은 음정으로 재생되는 2배속용 음성은 무음량으로 출력되기 때문에 유저에게는 들리지 않고, 1배속용 음성 데이터(A1 ~ J1)에 의한 통상의 음정의 음성만을 유저는 통상의 속도로 들을 수 있다.

다음으로, 빨리 듣기 속도 재생 모드인 경우, 도 5의 (c)에 도시하는 바와 같이, 2배속용 음성 데이터(A2 ~ E2)가 재생 주기 t1 (2배속용 음성 데이터(a2)의 기본 주파수의 역수)으로 순차로 재생되, 재생 시간 T1/2에서 음성 「안녕하세요」가 통상의 음정으로 또한 표준 음량으로 출력된다. 한편, 도 5의 (d)에 도시하는 바와 같이, 1배속용 음성 데이터(A1 ~ J1)가 재생 주기 t1/2 (1배속용 음성 데이터(a1)의 기본 주파수의 배의 역수)으로 동기하여 순차로 재생되고, 재생 시간 T1/2에서 음성 「안녕하세요」가 통상의 피치보다 1옥타브 높은 음정으로 또한 무음량으로 출력된다.

이와 같이, 빨리 듣기 속도 재생 모드에서는 1배속용 음성 데이터(A1 ~ J1) 및 2배속용 음성 데이터(A2 ~ E2)가 동기하여 재생되지만, 1배속용 음성 데이터(A1 ~ J1)에 의한 1옥타브 높은 음성은 무음량으로 출력되기 때문에 유저에게는 들리지 않고, 2배속용 음성 데이터(A2 ~ E2)에 의한 통상의 음정의 음성만을 유저는 배속으로 들을 수 있다.

다시, 도 4를 참조하여, 스텝 S4에서 음성 재생부(112)는 동기 보정 처리 (후술)를 행한다. 이 동기 보정 처리는 동기하여 재생되어야 할 1배속용 음성 데이터(a1)와 2배속용 음성 데이터(a2)의 재생 타이밍 (재생 위치)이 어긋난 경우에 스텝 S2에서 설정된 재생 주파수를 보정하여 1배속용 음성 데이터(a1)와 2배속용 음성 데이터(a2)의 재생 타이밍을 다시 동기시키기 위한 처리이다.

도 6은 도 4에 나타내는 동기 보정 처리의 일례를 나타내는 플로차트이다. 우선, 스텝 S11에서 음성 재생부(112)는 1배속용 음성 데이터(a1)와 2배속용 음성 데이터(a2)의 재생 타이밍이 어긋나 있는지 여부를 판단한다. 재생 타이밍이 어긋나 있지 않다고 판단되지 않는 경우에는 (스텝 S11에서 NO), 음성 재생부(112)는 스텝 S2에서 설정된 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)의 재생 주파수를 변경하는 일 없이 도 4에 나타내는 스텝 5로 되돌아온다.

한편, 재생 타이밍이 어긋나 있다고 판단되었을 경우 (스텝 S11에서 YES), 스텝 S12에서 음성 재생부(112)는 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2) 중 재생 위치가 선행하고 있는 음성 데이터가 통상의 음량으로 출력되고 있는지 여부를 판단한다 (S12).

선행하고 있는 음성 데이터가 통상의 음량으로 출력되고 있다고 판단되었을 경우 (스텝 S12에서 YES), 스텝 S13에서 음성 재생부(112)는 재생 위치가 뒤쳐져 있는 음성 데이터 (무음량으로 출력되고 있는 음성 데이터)가 선행하고 있는 음성 데이터를 따라잡도록, 뒤쳐져 있는 음성 데이터의 재생 주파수를 기설정의 재생 주파수보다 높아지도록 변경하고, 도 4에 나타내는 스텝 5로 되돌아온다.

한편, 선행하고 있는 음성 데이터가 통상의 음량으로 출력되어 있지 않은, 즉 뒤쳐져 있는 음성 데이터가 통상의 음량으로 출력되고 있다고 판단되었을 경우 (스텝 S12에서 NO), 스텝 S14에서 음성 재생부(112)는 선행하고 있는 음성 데이터 (무음량으로 출력되고 있는 음성 데이터)가 뒤쳐져 있는 음성 데이터에 맞도록, 선행하고 있는 음성 데이터의 재생 주파수를 기설정의 재생 주파수보다 낮아지도록 변경하고, 도 4에 나타내는 스텝 5로 되돌아온다.

상기의 동기 보정 처리에 의하여 동기하여 재생되어야 할 1배속용 음성 데이터(a1)와 2배속용 음성 데이터(a2)의 재생 타이밍이 어긋난 경우에, 스텝 S2에서 설정된 재생 주파수를 보정하여 1배속용 음성 데이터(a1)와 2배속용 음성 데이터(a2)의 재생 타이밍을 다시 동기시킬 수 있다.

덧붙여, 상기의 예에서는, 재생 주파수를 변경하여 동기 보정 처리를 행하고 있지만, 이 예에 특별히 한정되지 않고, 스텝 S13에서 뒤쳐져 있는 음성 데이터의 재생 위치가 선행하고 있는 음성 데이터의 재생 위치에 일치하도록 뒤쳐져 있는 음성 데이터의 재생 위치를 변경하거나, 스텝 S14에서 선행하고 있는 음성 데이터의 재생 위치가 뒤쳐져 있는 음성 데이터의 재생 위치에 일치하도록 선행하고 있는 음성 데이터의 재생 위치를 변경하여도 무방하다.

다시, 도 4를 참조하여, 스텝 S5에서 재생 조건 결정부(111)는 재생되고 있지 않은 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)가 기억부(102)에 존재하는지 여부를 판단한다. 재생되고 있지 않은 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)가 존재하지 않는다고 판단되었을 경우 (스텝 S5에서 NO), 음성 재생 처리를 종료한다.

한편, 재생되고 있지 않은 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)가 존재한다고 판단되었을 경우 (스텝 S5에서 YES), 스텝 S6에서 재생 조건 결정부(111)는 조작부(103)가 유저에 의한 음성 재생 속도 모드 지시 커멘드를 새롭게 접수하였는지 여부를 판단한다. 음성 재생 속도 모드 지시 커멘드를 새롭게 접수하고 있지 않다고 판단되었을 경우 (스텝 S6에서 NO), 스텝 S3으로 되돌아와 이후의 처리를 계속한다.

음성 재생 속도 모드 지시 커멘드를 새롭게 접수하였다고 판단되었을 경우 (스텝 S6에서 YES), 스텝 7에서 재생 조건 결정부(111)는 접수된 음성 재생 속도 모드 지시 커멘드에 따른 재생 주파수 및 음량을 음성 재생부(112)에 설정하고, 그 후 스텝 S3으로 되돌아와 이후의 처리를 계속한다. 이와 같이, 음성 재생 속도 모 드가 변환된 경우, 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)의 재생 주파수 및 음량이 음성 재생 속도 모드에 따른 재생 주파수 및 음량으로 변경된다.

예를 들어, 표준 속도 재생 모드로부터 빨리 듣기 속도 재생 모드로 변환된 경우, 재생 조건 결정부(111)는 음성 재생부(112)에서의 1배속용 음성 데이터(a1)의 재생 주파수 및 음량을 1배속용 음성 데이터(a1)의 기본 주파수와 같은 재생 주파수 및 표준 음량으로부터 1배속용 음성 데이터(a1)의 기본 주파수의 배의 재생 주파수 및 무음량으로 변경한다. 그리고 재생 조건 결정부(111)는 음성 재생부(112)에서의 2배속용 음성 데이터(a2)의 재생 주파수 및 음량을 2배속용 음성 데이터(a2)의 기본 주파수의 절반의 재생 주파수 및 무음량으로부터 2배속용 음성 데이터(a2)의 기본 주파수와 같은 재생 주파수 및 표준 음량으로 변경한다. 이 결과, 1배속용 음성이 표준 속도로 출력되고 있는 도중에 음성 재생 속도 모드가 변환되면, 음정이 변경되는 일 없이 2배속용 음성이 빨리 듣기 속도로 출력되는 것으로 된다.

한편, 빨리 듣기 속도 재생 모드로부터 표준 속도 재생 모드로 변환된 경우, 재생 조건 결정부(111)는 음성 재생부(112)에서의 1배속용 음성 데이터(a1)의 재생 주파수 및 음량을 1배속용 음성 데이터(a1)의 기본 주파수의 배의 재생 주파수 및 무음량으로부터 1배속용 음성 데이터(a1)의 기본 주파수와 같은 재생 주파수 및 표준 음량으로 변경한다. 그리고 재생 조건 결정부(111)는 음성 재생부(112)에서의 2배속용 음성 데이터(a2)의 재생 주파수 및 음량을 2배속용 음성 데이터(a2)의 기본 주파수와 같은 재생 주파수 및 표준 음량으로부터 2배속용 음성 데이터(a2)의 기본 주파수의 절반의 재생 주파수 및 무음량으로 변경한다. 이 결과, 2배속용 음성이 빨리 듣기 속도로 출력되고 있는 도중에 음성 재생 속도 모드가 변환되면, 음정이 변경되는 일 없이 1배속용 음성이 표준 속도로 출력되는 것으로 된다.

상기와 같이, 본 실시예에서는 빨리 듣기 속도용의 음성 데이터인 2배속용 음성 데이터(a2)를 기록 매체(300)에 미리 격납하여 두고, 빨리 듣기 속도 재생 모드에서 2배속용 음성 데이터(a2)를 재생하여 출력하고 있다. 이것에 의하여, 음정이 통상의 음성보다 1옥타브 높아지는 일 없이 유저가 청취 가능한 빨리 듣기 음성을 자연스럽게 재생할 수 있다. 또한, 1배속용 음성 데이터(a1)와 2배속용 음성 데이터(a2)는 항상 동기하여 재생되고 있다. 이 때문에, 표준 음성 또는 빨리 듣기 음성이 출력되고 있는 도중에도, 유저는 음성 재생 속도 모드를 변환하는 것에 의하여 위화감을 느끼는 일 없이 소망하는 속도로 재생되는 음성을 청취할 수 있다. 이것에 의하여, 유저는 듣고 싶지 않은 음성을 배속으로 재생하고, 듣고 싶은 음성만을 등속(等速)으로 재생하는 것 등이 가능하다.

상기의 설명에서는 표준 음성 및 빨리 듣기 음성을 변환하기 위하여 재생 속도가 같은 2개의 음성 데이터를 동기하여 재생하는 경우에 대하여 설명하였지만, 본 발명이 적용되는 재생 속도는 이 예에 특별히 한정되지 않고, 재생 속도가 다른 여러 가지 음성 데이터를 동기하여 재생할 수도 있다.

이하에 재생 속도가 다른 2개의 음성 데이터를 동기하여 재생하는 방법에 대하여 설명한다. 예를 들어, 각 음성 데이터의 재생 총시간에 대한 재생이 끝난 시간의 비가 양 음성 데이터에서 같아지도록 양 음성 데이터를 재생하거나, 양 음성 데이터의 재생이 끝난 시간의 재생 총시간부터의 비율을 비교하여 양 음성 데이터를 재생하는 것에 의하여, 재생 속도가 다른 2개의 음성 데이터를 동기하여 재생할 수 있다.

또는, 각 음성 데이터의 재생 총시간에 대한 나머지 재생 시간 (재생 총시간에서 재생이 끝난 시간을 감산한 시간)의 비가 양 음성 데이터에서 같아지도록 양 음성 데이터를 재생하거나, 양 음성 데이터의 나머지 재생 시간의 재생 총시간의 비율을 비교하여 양 음성 데이터를 재생하는 것에 의해서도 재생 속도가 다른 2개의 음성 데이터를 동기하여 재생할 수 있다.

혹은, 소정 데이터량마다 예를 들어, 단위 시간마다, 음절마다, 단어마다, 또는 한 글자마다, 음성 데이터와 구별 가능한 소정의 체크 플래그를 양 음성 데이터에 삽입한 체크 플래그 첨부 음성 데이터를 이용하여, 양 음성 데이터의 체크 플래그의 재생 타이밍을 비교하여 양 음성 데이터를 재생하는 것에 의해서도 재생 속도가 다른 2개의 음성 데이터를 동기하여 재생할 수 있다.

상기와 같은 재생 방법에 의하여, 여러 가지 재생 속도의 음성 데이터에 본 발명을 마찬가지로 적용할 수 있고, 예를 들어, 2배속용 음성 데이터 대신에 혹은 이것에 더하여, 슬로우 재생하기 위한 1/2배속용 음성 데이터, 나아가 고속 재생하기 위한 3배속용 음성 데이터 등의 F배속 재생 (F는 실수)하기 위한 F배속용 음성 데이터에도 마찬가지로 적용할 수 있다. 또한, 상기와 같은 F배속용 음성 데이터는 그대로 F배속 재생에 이용되는 것이 바람직하지만, 반드시 이것에는 한정되지 않고, F배속과 근사한 F1배속, 예를 들어, 0.8×F ~ 1.2×F배속에 F배속 음성 데이 터를 이용하여도 무방하다. 이 경우, 재생 주파수는 F배속용 음성 데이터의 재생 주파수×F÷F1로 구한 값 등으로 설정된다.

(제2 실시예)

다음으로, 본 발명의 제2 실시예에 따른 비디오 게임 장치에 대하여 설명한다. 본 실시예는 제1 실시예에서의 1배속용 음성 및 2배속용 음성의 동기 재생에 더하여, 출력되는 음성에 당해 음성을 나타내는 문자 등을 동기시켜 표시하는 것이다. 여기에서는, 기록 매체(300)에 기록되는 음성 재생 프로그램을 포함하는 게임 프로그램은 변경되지만, 비디오 게임 장치의 구성은 도 1에 나타낸 것과 같기 때문에, 하드웨어 구성의 도시 및 설명은 생략하는 것으로 한다.

도 7은 본 발명의 제2 실시예에 따른 비디오 게임 장치의 주요 기능을 나타내는 기능 블록도이다. 덧붙여, 도 7에 나타내는 비디오 게임 장치에서는 도 2에 나타내는 비디오 게임 장치와 같은 기능을 가지는 부분에 대해서는 동일 부호를 붙이고 상세한 설명을 생략하며, 이하 본 실시예의 특징적 부분에 대하여 설명한다.

도 7에 나타내는 비디오 게임 장치는 문자를 표시하기 위한 표시부(106)를 더 구비하고, 프로그램 실행부(104a)는 문자 표시 제어부(113)를 더 포함하며, 기억부(102a)는 문자 데이터(a3)를 더 격납한다. 문자 표시 제어부(113)는 표시부(106)에 표시하는 문자를 기억부(102a)에 기억되는 문자 데이터(a3)에 기초하여 생성하고, 이 생성한 문자를 상술의 1배속용 음성 및 2배속용 음성의 재생에 동기시켜 표시부(106)에 표시한다.

다음으로, 도 7에 나타내는 비디오 게임 장치가 기록 매체(300a)에 격납되는 음성 재생 프로그램을 실행하는 것에 의하여 실현되는 음성 재생 처리를 설명한다. 도 8은 도 7에 나타내는 비디오 게임 장치가 실행하는 음성 재생 처리의 일례를 나타내는 플로차트이다. 덧붙여, 도 8에 나타내는 플로차트의 각 스텝 중 도 4에 나타내는 플로차트의 각 스텝과 같은 처리가 실행되는 스텝에 대해서는 동일 부호를 붙이고 상세한 설명을 생략한다.

우선, 스텝 21에서 재생 조건 결정부(111)는 기록 매체(300a)에 기억되어 있는 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)를 기록 매체(300a)로부터 읽어내어 기억부(102a)에 격납한다. 또한, 문자 표시 제어부(113)는 재생 조건 결정부(111)에 의하여 읽어들인 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)에 대응하는 문자 데이터(a3)를 기록 매체(300a)로부터 읽어들여 기억부(102a)에 격납한다. 여기서, 문자 데이터(a3)는 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)를 이용하여 재생되는 음성을 표기한 문자열을 묘화하기 위한 데이터이다. 본 실시예에서는, 1배속용 음성 데이터(a1), 2배속용 음성 데이터(a2) 및 문자 데이터(a3)는 1문절(文節)을 1단위로 하는 데이터로 구성되어 있다.

다음으로, 제1 실시예와 마찬가지로 스텝 S2, S3의 처리가 실행된 후, 스텝 S22에서 문자 표시 제어부(113)는 스텝 S3에서 재생되고 있는 1배속용 음성 데이터(a1) 또는 2배속용 음성 데이터(a2)의 재생 시간을 1문절에 포함되는 문자수로 제산하여 1문자당의 묘화 시간을 산출한다.

다음으로, 스텝 23에서 문자 표시 제어부(113)는 기억부(102a)로부터 문자 데이터(a3)를 읽어내고, 스텝 S22에서 산출된 묘화 시간에 따라 문자를 순차로 표 시부(106)에 표시시킨다. 그 후, 제1 실시예와 마찬가지로 스텝 S4 ~ S7의 처리가 실행된 후에 스텝 S3으로 되돌아와 처리가 계속된다.

이와 같이, 본 실시예에서는 문자 데이터(a3)를 이용하여 묘화되는 문자가 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)를 이용하여 출력되는 음성 중 적어도 어느 일방에 동기하여 순차로 표시된다. 이것에 의하여, 음성의 출력과 문자의 표시를 동기시킬 수 있어 유저는 시각과 청각의 쌍방에서 정보를 받을 수 있다.

덧붙여, 상기의 설명에서는 1문자당의 묘화 시간을 산출하였지만, 이 예에 특별히 한정되지 않고, 1분절(分節)을 구성하는 문자수를 1어절에 대응하는 1배속용 음성 데이터(a1) 또는 2배속용 음성 데이터(a2)의 재생 시간으로 제산하여 단위 시간당의 묘화 문자수, 즉 묘화 속도를 구하고, 이 묘화 속도에 따라 문자를 소정 방향 예를 들어, 왼쪽에서 오른쪽으로 또는 위에서 아래로 묘화하도록 하여도 무방하다.

또한, 이하에 설명하는 재생 시간 테이블 또는 음성 데이터량 테이블을 미리 작성하여 기억부(102a)에 미리 기억시키고, 이들 테이블을 이용하여 문자를 음성에 동기시켜 표시하도록 하여도 무방하다.

도 9는 재생 시간 테이블의 데이터 구조의 일례를 나타내는 모식도이다. 도 9에 나타내는 재생 시간 테이블(131)에는 1분절 (「안녕하세요」)을 구성하는 문자 데이터(a3)의 각 문자마다 표준 속도 시의 재생 시간 Q1 ~ Q6(sec)이 설정되어 기억되어 있다. 예를 들어, 표준 속도 시, 즉 표준 속도 재생 모드인 경우, 문자 표 시 제어부(113)는 기억부(102a)에 기억되어 있는 재생 시간 테이블(131)을 참조한다. 그리고 문자 표시 제어부(113)는 문자 「안」에 대응하는 1배속용 음성 데이터(a1)가 재생 시간 Q1으로 재생되고 있을 때, 문자 「안」에 대응하는 문자 데이터(a3)를 이용하는 것에 의하여, 문자 「안」을 재생 시간 Q1 동안 표시부(106)에 표시한다. 마찬가지로 하여, 문자 표시 제어부(113)는 문자 「녕」, 「하」, 「세」, 「요」, 「.」를 재생 시간 Q2, Q3, Q4, Q5, Q6 동안 순차로 표시부(106)에 표시시킨다. 한편, 빨리 듣기 속도로 재생 시, 즉 빨리 듣기 속도 재생 모드인 경우, 문자 표시 제어부(113)는 재생 시간 Q1 ~ Q6를 2분의 1로 하고, 상기와 같이 하여 각 문자를 순차로 표시부(106)에 표시한다.

덧붙여, 상기의 예에서는 표준 속도 시의 재생 시간을 기준으로 하여 재생 시간 테이블을 설정하였지만, 이 예에 특별히 한정되지 않고, 빨리 듣기 속도 시의 재생 시간을 기준으로 하여 재생 시간 테이블을 설정하거나 표준 속도 시 및 빨리 듣기 속도 시마다 재생 시간을 기준으로 하여 재생 시간 테이블을 설정하도록 하여도 무방하다. 또한, 상기의 각 경우에서 각 재생 시간 내에 표시 가능한 묘화 속도에 따라 문자를 소정 방향 예를 들어, 왼쪽에서 오른쪽으로 또는 위에서 아래로 묘화하도록 하여도 무방하다.

도 10은 음성 데이터량 테이블의 데이터 구조의 일례를 나타내는 모식도이다. 도 10에 나타내는 음성 데이터량 테이블(141)은 1분절 (「안녕하세요」)을 구성하는 문자 데이터(a3)의 각 문자마다 대응하는 1배속용 음성 데이터(a1)의 음성 데이터량 R1 ~ R6(bit)를 기억하고 있다. 예를 들어, 문자 표시 제어부(113)는 기 억부(102a)에 기억되어 있는 음성 데이터량 테이블(141)을 참조한다. 그리고 문자 표시 제어부(113)는 현재 재생되고 있는 1배속용 음성 데이터(a1)의 음성 데이터량이 음성 데이터량 R1 내인 경우, 문자 「안」에 대응하는 문자 데이터(a3)를 이용하는 것에 의하여 문자 「안」을 표시부(106)에 표시한다. 마찬가지로 하여, 문자 표시 제어부(113)는 현재 재생되고 있는 1배속용 음성 데이터(a1)의 음성 데이터량과 각 음성 데이터량 R2, R3, R4, R5, R6과 비교하여 문자 「녕」, 「하」, 「세」, 「요」, 「.」를 순차로 표시부(106)에 표시한다. 한편, 빨리 듣기 속도 시, 즉 빨리 듣기 재생 모드인 경우, 문자 표시 제어부(113)는 음성 데이터량 R1 ~ R6을 2배속용 음성 데이터(a2)의 음성 데이터량으로 환산하고, 상기와 같이 하여 각 문자를 순차로 표시부(106)에 표시한다.

덧붙여, 상기의 예에서는 1배속용 음성 데이터(a1)의 음성 데이터량을 기준으로 하여 음성 데이터량 테이블을 설정하였지만, 이 예에 특별히 한정되지 않고, 2배속용 음성 데이터(a2)의 음성 데이터량을 기준으로 하여 음성 데이터량 테이블을 설정하거나, 각 음성 데이터마다의 음성 데이터량을 기준으로 하여 음성 데이터량 테이블을 설정하도록 하여도 무방하다. 또한, 상기의 각 경우에서 각 음성 데이터량에 대응하는 재생 시간 내에서 표시 가능한 묘화 속도에 따라 문자를 소정 방향 예를 들어, 왼쪽에서 오른쪽으로 또는 위에서 아래로 묘화하도록 하여도 무방하다.

(실시예 3)

다음으로, 본 발명의 제3 실시예에 따른 음성 재생 장치에 대하여 설명한다. 도 11은 본 발명의 제3 실시예에 따른 음성 재생 장치의 구성을 나타내는 블록도이다. 덧붙여, 본 실시예에 따른 음성 재생 장치로는 예를 들어, CD(Compact Disc) 플레이어, MD(Mini-Disc) 플레이어, DVD(Digital Versatile Disc) 플레이어 등이 해당하고, 주로 하드웨어에 의하여 음성 재생 처리가 실행된다.

도 11에 나타내는 음성 재생 장치는 조작부(201), 재생 조건 결정부(202), 기억부(203), 음성 재생부(204), 음성 선택부(205) 및 스피커(206)를 구비한다.

기억부(203)는 CD 등의 기억 매체 구동 장치 등으로 구성되고, 음성 재생부(204)의 지시에 따라 기억 매체에 기억되어 있는 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)를 음성 재생부(204)로 출력한다. 조작부(201)는 유저로부터의 음성 재생 속도 모드 지시 커멘드를 접수한다. 덧붙여, 음성 재생 속도 모드 지시 커멘드는 제1 실시예와 같다. 또한, 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)의 데이터 형식은 특별히 한정되지 않고, 예를 들어, 도 3에 나타내는 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)를 이용할 수 있다.

재생 조건 결정부(202)는 조작부(201)에 의하여 접수된 음성 재생 속도 모드 지시 커멘드에 따른 속도로 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)가 동기하여 재생되도록 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)의 재생 주파수를 음성 재생부(204)에 설정한다. 또한, 재생 조건 결정부(202)는 1배속용 음성 및 2배속용 음성 중 음성 재생 속도 모드 지시 커멘드에 따른 일방만을 유저가 청취 가능하게 되도록 음성 선택부(205)를 제어한다.

음성 재생부(204)는 재생 조건 결정부(202)에 의하여 설정된 재생 주파수로 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)를 동기시켜 재생하고, 1배속용 음성 신호 및 2배속용 음성 신호를 음성 선택부(205)로 출력한다. 음성 선택부(205)는 재생 조건 결정부(202)의 지시에 따라 1배속용 음성 신호 및 2배속용 음성 신호 중의 일방을 스피커(206)로 출력한다. 스피커(206)는 입력된 음성 신호에 따른 음성을 출력한다.

상기의 구성에 의하여, 유저가 조작부(201)를 이용하여 표준 속도 재생 모드를 선택하였을 경우, 음성 재생부(204)는 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)를 기억부(203)로부터 읽어내어, 1배속용 음성 데이터(a1)를 1배속용 음성 데이터(a1)의 기본 주파수와 같은 재생 주파수로 순차로 재생하여 표준 속도의 1배속용 음성 신호를 출력한다. 그리고 음성 재생부(204)는 2배속용 음성 데이터(a2)를 2배속용 음성 데이터(a2)의 절반의 재생 주파수로 1배속용 음성 데이터(a1)에 동기하여 순차로 재생하여 표준 속도의 2배속용 음성 신호를 출력한다. 이때, 음성 선택부(205)는 1배속용 음성 신호만을 스피커(206)로 출력하고, 유저는 1배속용 음성 데이터(a1)에 의한 통상의 음정의 음성만을 표준 속도로 들을 수 있다.

한편, 유저가 조작부(201)를 이용하여 빨리 듣기 속도 재생 모드를 선택한 경우, 음성 재생부(204)는 1배속용 음성 데이터(a1) 및 2배속용 음성 데이터(a2)를 기억부(203)로부터 읽어내어, 2배속용 음성 데이터(a2)를 당해 2배속용 음성 데이터(a2)와 같은 재생 주파수로 순차로 재생하여 빨리 듣기 속도의 2배속용 음성 신호를 출력한다. 그리고 음성 재생부(204)는 1배속용 음성 데이터(a1)를 당해 1배 속용 음성 데이터(a1)의 배의 재생 주파수로 2배속용 음성 데이터(a2)에 동기하여 순차로 재생하여 2배속의 1배속용 음성 신호를 출력한다. 이때, 음성 선택부(205)는 2배속용 음성 신호만을 스피커(206)로 출력하고, 유저는 2배속용 음성 데이터(a2)에 의한 통상의 음정의 음성만을 배속으로 들을 수 있다.

덧붙여, 상기의 각 실시예에서는 음성을 재생하기 위한 데이터로서 1배속용 음성 데이터 및 2배속용 음성 데이터를 설명하였지만, 이 예에 특별히 한정되지 않고, 음악을 재생하기 위한 음성 데이터 등에도 본 발명을 마찬가지로 적용할 수 있다.

또한, 상기의 각 실시예에서는 1배속용 음성 데이터와 2배속용 음성 데이터가 미리 기록 매체 등에 격납되는 경우에 대하여 설명하였지만, 이 예에 한정되지 않고, 인터넷이나 인트라넷 등을 이용한 네트워크 배신(配信, 정보를 수신국으로 송신)에 의하여 배신되도록 하여도 무방하다.

청구항 1에 기재된 본 발명에 의하면, 재생 속도 변경 시에 당해 재생 속도에 대응하는 음성 데이터를 작성하는 등의 음성 처리가 불필요하게 되기 때문에, 재생 속도를 순간적으로 위화감 없이 변환할 수 있다. 또한, 사전에 충분한 처리 시간을 들여 재생 속도에 대응한 음성 데이터를 작성할 수 있기 때문에, 재생 속도를 변경한 경우에 음정 등의 변동이 없는 자연스러운 음성을 출력할 수 있다.

청구항 2에 기재된 본 발명에 의하면, 각 재생 속도에 따라 미리 작성된 음성 데이터를 이용하여 음성을 출력할 수 있다. 이때, 음성의 재생 속도를 변환하 여도 같은 내용의 음성을 출력할 수 있다. 또한, 제1 음성 데이터로부터 제2 음성 데이터를 작성하는 등의 음성 처리가 불필요하게 되고, 제2 재생 속도로 재생한 경우, 제2 음성 데이터를 이용하여 음정 등의 변동이 없는 자연스러운 음성을 재생할 수 있다. 이들로부터 CPU 등의 하드웨어에 과도한 부담을 주는 일 없이 음성의 재생 속도를 위화감 없이 변환할 수 있다.

특히, 음성 처리뿐만 아니라 화상 처리를 주체로 하는 비디오 게임 장치에 본 발명을 이용한 경우에는, 복잡한 화상 처리에 CPU의 처리 능력을 충분히 배분할 수 있기 때문에, 여러 가지 재생 속도로 자연스러운 음성을 재생하면서 여러 가지 화상을 리얼 타임으로 표시할 수 있다.

청구항 3에 기재된 본 발명에 의하면, 유저는 소망하는 재생 속도로 음성을 들을 수 있는 것과 함께, 일방의 음성의 출력 도중에 타방의 음성으로 변환할 수 있다. 이때, 음성의 출력 도중에 음성을 변환한 경우에도, 제1 음성 속도 모드로 출력되는 음성과 제2 음성 속도 모드로 출력되는 음성에서는 피치 등의 변동이 없기 때문에, 변환 전후로 위화감이 없는 듣기 쉬운 자연스러운 음성을 재생할 수 있다.

청구항 4에 기재된 본 발명에 의하면, 유저는 표준 속도 및 고속 중 소망하는 속도로 자연스러운 음성을 들을 수 있기 때문에, 듣고 싶은 음성만을 표준 속도로 재생시켜 듣거나, 듣고 싶지 않은 음성을 고속으로 재생하여 넘기거나, 또는 시간이 없는 경우 등에서 고속으로 음성을 듣는 등 할 수 있어 여러 가지 사용 방법으로 음성을 들을 수 있다.

청구항 5에 기재된 본 발명에 의하면, 체크 플래그 등의 동기 처리 전용의 데이터를 제1 및 제2 음성 데이터에 부가하는 일 없이, 제1 및 제2 음성 데이터의 동기 처리를 행할 수 있다. 이것에 의하여, 음성 데이터의 데이터량을 필요 최저한으로 억제할 수 있는 것과 함께, 여러 가지 형식의 음성 데이터를 가공하는 일 없이 제1 및 제2 음성 데이터로서 직접적으로 이용할 수 있다.

청구항 6에 기재된 본 발명에 의하면, 제1 및 제2 음성 데이터를 재생되는 음성의 소정의 구간마다 고정도로 동기시켜 재생할 수 있기 때문에, 재생되는 음성이 알아듣기 쉬운 상태로 2개의 음성을 고정도로 동기시켜 재생할 수 있다.

청구항 7에 기재된 본 발명에 의하면, 출력되고 있는 음성에 영향을 주는 일 없이, 동기 차이를 보정할 수 있기 때문에, 변환 전후로 위화감이 없는 듣기 쉬운 자연스러운 음성을 안정되게 재생할 수 있다.

청구항 8에 기재된 본 발명에 의하면, 재생되고 있는 음성에 동기시켜 표시 화면 상에 문자를 표시시킬 수 있기 때문에, 시각과 청각에 의하여 유저에게 전달할 수 있어 알기 쉬운 연출을 행할 수 있다.

청구항 9에 기재된 본 발명에 의하면, 체크 플래그 등의 동기 처리 전용의 데이터를 문자 데이터에 부가하는 일 없이 문자와 음성의 동기 처리를 행할 수 있기 때문에, 문자 데이터의 데이터량을 필요 최저한으로 억제할 수 있는 것과 함께, 여러 가지 형식의 문자 데이터를 가공하는 일 없이 문자 데이터로서 직접적으로 이용할 수 있다.

청구항 10에 기재된 본 발명에 의하면, 재생 시간을 계산하는 일 없이 문자 와 음성의 동기 처리를 행할 수 있기 때문에, CPU 등의 하드웨어에 과도한 부담을 주는 일 없이 동기 처리를 고속으로 행할 수 있다.

청구항 11에 기재된 본 발명에 의하면, 체크 플래그 등의 동기 처리 전용의 데이터를 문자 데이터에 부가하는 일 없이 문자와 음성의 동기 처리를 행할 수 있기 때문에, 문자 데이터의 데이터량을 필요 최저한으로 삭감할 수 있는 것과 함께, 문자 데이터로서 여러 가지 형식의 문자 데이터를 그대로 이용할 수 있다.

청구항 12에 기재된 본 발명에 의하면, 재생 속도 변경 시에 당해 재생 속도에 대응하는 음성 데이터를 작성하는 등의 음성 처리가 불필요하게 되어, 음성의 재생 속도를 순간적으로 위화감 없이 바꿀 수 있다. 또한, 사전에 충분한 처리 시간을 들여 재생 속도에 대응한 음성 데이터를 작성할 수 있다. 이들로부터, 재생 속도를 변경하는 경우, CPU 등의 하드웨어는 비교적 작은 처리 부담으로 음정 등의 변동이 없는 자연스러운 음성을 출력할 수 있다.

청구항 13에 기재된 본 발명에 의하면, 재생 속도 변경 시에 당해 재생 속도에 대응하는 음성 데이터를 작성하는 등의 음성 처리가 불필요하게 되어, 음성의 재생 속도를 순간적으로 위화감 없게 바꿀 수 있다. 또한, 사전에 충분한 처리 시간을 들여 재생 속도에 대응한 음성 데이터를 작성할 수 있다. 이들로부터, 재생 속도를 변경한 경우, CPU 등의 하드웨어는 비교적 작은 처리 부담으로 음정 등의 변동이 없는 자연스러운 음성을 출력할 수 있다.

Claims

음성 데이터를 이용하여 음성을 재생하기 위한 음성 재생 프로그램에 있어서,

소정의 음성을 복수의 다른 재생 속도로 재생하기 위하여 미리 준비되어 각 재생 속도에 각각 대응하는 복수의 음성 데이터를 기억하는 음성 기억 수단과,

상기 음성 데이터를 출력 가능한 상태로 하는 재생 수단과,

상기 각 재생 속도 중 어느 한 속도로 음성을 출력하는 경우에 당해 재생 속도에 대응하는 음성 데이터에 의한 음성을 출력하는 음성 출력 수단으로서 컴퓨터를 기능시키는 것을 특징으로 하는 음성 재생 프로그램.
제1항에 있어서,

상기 음성 기억 수단은 소정의 음성을 제1 재생 속도로 재생하기 위하여 미리 준비된 제1 음성 데이터와, 상기 소정의 음성을 상기 제1 재생 속도와 다른 제2 재생 속도로 재생하기 위하여 미리 준비된 제2 음성 데이터를 기억하고,

상기 재생 수단은 음성 기억 수단으로부터 읽어낸 제1 및 제2 음성 데이터의 재생 위치를 대응시켜 상기 제1 및 제2 음성 데이터를 재생하여, 상기 제1 및 제2 음성 데이터에 의한 음성을 출력 가능한 상태로 하며,

상기 음성 출력 수단은 상기 제1 재생 속도로 음성을 출력하는 경우에 상기 재생 수단에 의하여 재생되고 있는 제1 음성 데이터에 의한 제1 음성을 출력하고, 상기 제2 재생 속도로 음성을 출력하는 경우에 상기 재생 수단에 의하여 재생되고 있는 상기 제2 음성 데이터에 의한 제2 음성을 출력하는 것을 특징으로 하는 음성 재생 프로그램.
제2항에 있어서,

상기 음성 출력 수단에 의한 음성의 출력을 상기 제1 재생 속도로 재생하기 위한 제1 재생 속도 모드와, 상기 음성 출력 수단에 의한 음성의 출력을 상기 제2 재생 속도로 재생하기 위한 제2 재생 속도 모드의 어느 일방(一方)을 유저가 선택하는 조작을 접수하는 조작 수단으로서 상기 컴퓨터를 더 기능시키고,

상기 음성 출력 수단은 상기 조작 수단에 의하여 접수된 재생 속도 모드에 따라 상기 제1 및 제2 음성 데이터에 의한 음성 중의 어느 일방을 출력하는 것을 특징으로 하는 음성 재생 프로그램.
제2항 또는 제3항에 있어서,

상기 음성 기억 수단은 상기 제1 음성 데이터로서 소정의 음성을 표준 속도로 재생하기 위하여 미리 준비된 통상 음성 데이터를 기억하는 것과 함께, 상기 제2 음성 데이터로서 상기 통상 음성 데이터를 이용하여 재생되는 음성과 같은 내용의 음성을 표준 속도보다 빠른 재생 속도로 재생하기 위하여 미리 준비된 고속 음성 데이터를 기억하며,

상기 음성 출력 수단은 표준 속도로 음성을 출력하는 경우에 상기 통상 음성 데이터에 의한 표준 속도의 음성을 출력하고, 고속으로 음성을 출력하는 경우에 상기 고속 음성 데이터에 의한 고속의 음성을 출력하는 것을 특징으로 하는 음성 재생 프로그램.
제2항 내지 제3항 중 어느 한 항에 있어서,

상기 재생 수단은 상기 제1 및 제2 음성 데이터의 재생이 끝난 시간 또는 나머지 재생 시간에 기초하여 상기 제1 및 제2 음성 데이터의 재생 위치를 대응시켜 상기 제1 및 제2 음성 데이터를 재생하는 것을 특징으로 하는 음성 재생 프로그램.
제2항 내지 제3항 중 어느 한 항에 있어서,

상기 음성 기억 수단은 재생되는 음성의 소정의 구간마다 체크 플래그가 삽입된 상기 제1 및 제2 음성 데이터를 기억하고,

상기 재생 수단은 상기 제1 및 제2 음성 데이터의 체크 플래그의 재생 타이밍에 기초하여 상기 제1 및 제2 음성 데이터의 재생 위치를 대응시켜 재생하는 것을 특징으로 하는 음성 재생 프로그램.
제2항 내지 제3항 중 어느 한 항에 있어서,

상기 재생 수단은 상기 제1 및 제2 음성 데이터의 재생 위치가 어긋난 경우에 있어서, 상기 제1 재생 속도로 음성이 출력되고 있을 때에는 상기 제1 음성 데이터의 재생 위치와 대응하도록 상기 제2 음성 데이터의 재생 속도를 조정하고, 상기 제2 재생 속도로 음성이 출력되고 있을 때에는 상기 제2 음성 데이터의 재생 위치와 대응하도록 상기 제1 음성 데이터의 재생 속도를 조정하는 것을 특징으로 하는 음성 재생 프로그램.
제2항 내지 제3항 중 어느 한 항에 있어서,

상기 제1 및 제2 음성 데이터에 의하여 재생되는 음성의 내용을 표기하는 문자를 생성하기 위한 문자 데이터를 기억하는 문자 기억 수단과,

상기 문자 기억 수단으로부터 읽어낸 문자 데이터에 의하여 나타내지는 문자를 상기 음성 출력 수단에 의하여 출력되고 있는 제1 및 제2 음성 중 적어도 어느 일방에 동기(同期)시켜 표시하는 표시 수단으로서 상기 컴퓨터를 더 기능시키는 것을 특징으로 하는 음성 재생 프로그램.
제8항에 있어서,

상기 표시 수단은 상기 문자 데이터에 의하여 나타내지는 문자에 대응하는 상기 제1 또는 제2 음성 데이터의 재생 시간에 기초하여 상기 문자 기억 수단으로부터 읽어낸 문자 데이터에 의하여 나타내지는 문자를 상기 음성 출력 수단에 의하여 출력되고 있는 제1 및 제2 음성 중 적어도 어느 일방에 동기시켜 표시하는 것을 특징으로 하는 음성 재생 프로그램.
제9항에 있어서,

상기 표시 수단은 상기 재생 시간을 문자마다 미리 기억하고, 표시되는 문자에 대하여 기억되어 있는 재생 시간을 참조하여 당해 문자를 음성에 동기시켜 표시하는 것을 특징으로 하는 음성 재생 프로그램.
제8항에 있어서,

상기 표시 수단은 상기 문자 데이터에 의하여 나타내지는 문자에 대응하는 상기 제1 또는 제2 음성 데이터의 데이터량에 기초하여 상기 문자 기억 수단으로부터 읽어낸 문자 데이터에 의하여 나타내지는 문자를 상기 음성 출력 수단에 의하여 출력되고 있는 제1 및 제2 음성 중 적어도 어느 일방에 동기시켜 표시하는 것을 특징으로 하는 음성 재생 프로그램.
음성 데이터를 이용하여 컴퓨터에 의하여 음성을 재생하는 음성 재생 방법에 있어서,

소정의 음성을 복수의 다른 재생 속도로 재생하기 위하여 미리 준비되어 각 재생 속도에 각각 대응하는 복수의 음성 데이터에 의한 음성을 출력 가능한 상태로 하는 스텝과,

상기 각 재생 속도 중 어느 한 속도로 음성을 출력하는 경우에 당해 재생 속도에 대응하는 음성 데이터에 의한 음성을 출력하는 스텝을 포함하는 것을 특징으로 하는 음성 재생 방법.
음성 데이터를 이용하여 음성을 재생하는 음성 재생 장치에 있어서,

소정의 음성을 복수의 다른 재생 속도로 재생하기 위하여 미리 준비되어 각 재생 속도에 각각 대응하는 복수의 음성 데이터를 기억하는 음성 기억 수단과,

상기 음성 데이터를 출력 가능한 상태로 하는 재생 수단과,

상기 각 재생 속도 중 어느 한 속도로 음성을 출력하는 경우에 당해 재생 속도에 대응하는 음성 데이터에 의한 음성을 출력하는 음성 출력 수단을 구비하는 것을 특징으로 하는 음성 재생 장치.