KR19990044544A - 음성 인식 장치, 음성 인식 방법 및 이것을 이용한 게임기 - Google Patents
음성 인식 장치, 음성 인식 방법 및 이것을 이용한 게임기 Download PDFInfo
- Publication number
- KR19990044544A KR19990044544A KR1019980701792A KR19980701792A KR19990044544A KR 19990044544 A KR19990044544 A KR 19990044544A KR 1019980701792 A KR1019980701792 A KR 1019980701792A KR 19980701792 A KR19980701792 A KR 19980701792A KR 19990044544 A KR19990044544 A KR 19990044544A
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- speech recognition
- speech
- recognition
- game
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000002093 peripheral effect Effects 0.000 claims abstract description 14
- 238000012545 processing Methods 0.000 claims description 22
- 238000011156 evaluation Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 31
- 241001465754 Metazoa Species 0.000 description 18
- 230000008859 change Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 241000282693 Cercopithecidae Species 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 241000282472 Canis lupus familiaris Species 0.000 description 4
- 206010011469 Crying Diseases 0.000 description 4
- 241000286209 Phasianidae Species 0.000 description 4
- 241000251468 Actinopterygii Species 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 241001494479 Pecora Species 0.000 description 2
- 238000009395 breeding Methods 0.000 description 2
- 230000001488 breeding effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005281 excited state Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 238000004080 punching Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 235000000536 Brassica rapa subsp pekinensis Nutrition 0.000 description 1
- 241000499436 Brassica rapa subsp. pekinensis Species 0.000 description 1
- 241000252233 Cyprinus carpio Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 206010039740 Screaming Diseases 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/40—Processing input control signals of video game devices, e.g. signals generated by the player or derived from the environment
- A63F13/42—Processing input control signals of video game devices, e.g. signals generated by the player or derived from the environment by mapping the input signals into game commands, e.g. mapping the displacement of a stylus on a touch screen to the steering angle of a virtual vehicle
- A63F13/424—Processing input control signals of video game devices, e.g. signals generated by the player or derived from the environment by mapping the input signals into game commands, e.g. mapping the displacement of a stylus on a touch screen to the steering angle of a virtual vehicle involving acoustic input signals, e.g. by using the results of pitch or rhythm extraction or voice recognition
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/20—Input arrangements for video game devices
- A63F13/23—Input arrangements for video game devices for interfacing with the game device, e.g. specific interfaces between game controller and console
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/20—Input arrangements for video game devices
- A63F13/21—Input arrangements for video game devices characterised by their sensors, purposes or types
- A63F13/215—Input arrangements for video game devices characterised by their sensors, purposes or types comprising means for detecting acoustic signals, e.g. using a microphone
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/10—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by input arrangements for converting player-generated signals into game device control signals
- A63F2300/1025—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by input arrangements for converting player-generated signals into game device control signals details of the interface with the game device, e.g. USB version detection
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/10—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by input arrangements for converting player-generated signals into game device control signals
- A63F2300/1081—Input via voice recognition
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/60—Methods for processing data by generating or executing the game program
- A63F2300/6063—Methods for processing data by generating or executing the game program for sound processing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Pinball Game Machines (AREA)
- User Interface Of Digital Computer (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
음성에 의해 게임을 즐기기 위해, 주변 기기로서 이용되는 음성 인식 장치 및 음성 인식 방법을 제공한다. 음성 입력 수단(7)과, 게임기용 제어부(2b)와, 음성 입력 수단(7)의 음성 신호 출력과 미리 정해진 음성 인식용 사전(61b, 61c)의 데이타를 비교함으로써 플레이어의 음성을 인식함과 동시에, 인식 결과와 제어부(2b)의 출력 신호에 기초하여 게임에 관한 제어 신호를 생성하는 음성 인식부(61)를 구비한다.
Description
최근 컴퓨터 기술의 진보에 따라 컴퓨터 그래픽스 기술을 이용한 비디오 게임기가 널리 이용되어져 왔다. 최근 다종 다양한 게임 소프트웨어가 개발되어 있기 때문에, 이 종류의 가정용의 비디오 게임 장치는 오락으로서 매우 인기가 높다. 이 종류의 비디오 게임기에서는 컨트롤러의 버튼을 조작함으로써, 캐릭터를 움직이거나, 게임 화면을 전환하거나 하고 있다.
이와 같이 종래의 비디오 게임기에 있어서, 게임의 지시는 전부 플레이어가 컨트롤러의 스위치를 조작하여 행하도록 되어 있었다.
그런데, 인간에게 있어서 가장 자연스러운 커뮤니케이션 수단은 음성이다. 이 때문에, 인간의 음성을 인식하고, 이 인식 결과에 기초하여 기계를 제어하고자 하는 시도가 각종 행해지고 있다. 예를 들면, 차나 로보트 등을 인간의 음성에 의해 제어하려고 하거나, 음성에 의한 지시에 의해 각종 전자 장치를 제어하려고 하고 있었다.
그러나, 종래의 음성 인식 장치를 비디오 게임기에 적용하려고 한 경우, 일반적인 전자 장치의 경우와 달리 게임기의 특성에 있던 장치가 아니면 안되어, 그대로의 적용은 불가능하다. 예를 들면, 게임기의 컨트롤러의 버튼을 누를 때에, 단순히 1회 누룰 뿐만 아니라, 길게 누르거나 반복하여 누름으로써 캐릭터의 동작의 정도를 바꾸거나, 다른 버튼과 동시에 누름으로써 특별한 동작을 시켜야만 한다. 또한, 응답이 좋은 점도 중요하다. 한편, 게임의 종류에 따라서는 인식의 정밀도는 그다지 중요하지 않고, 오히려 좀처럼 인식할 수 없는 것 자체가 게임의 재미로 통하는 경우도 있다.
결국, 플레이어가 게임을 즐기기 위해서는, 종래의 음성 인식 장치의 경우와는 다른 특유의 성능·기능을 구비할 필요가 있다. 이 종류의 요구를 만족하는 음성 인식 장치는 종래에는 알려져 있지 않았다.
본 발명은 이러한 과제를 해결하기 위해 이루어진 것으로, 게임에 알맞는 음성 인식 장치 및 음성 인식 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 상기 음성 인식 장치 또는 음성 인식 방법을 이용한 게임기를 제공하는 것을 목적으로 한다.
〈발명의 개시〉
본 발명에 따른 음성 인식 장치는, 게임기의 주변 장치로서 이용되는 음성 인식 장치에 있어서, 음성 입력 수단과, 상기 음성 입력 수단의 음성 신호 출력과 미리 정해진 음성 인식용 사전(辭典) 데이타를 비교함으로써 플레이어의 음성을 인식함과 동시에, 인식 결과에 기초하여 게임에 관한 제어 신호를 생성하는 음성 인식부를 구비하는 것이다.
본 발명에 따른 음성 인식 장치는, 상기 음성 인식부는 상기 음성 인식용 사전으로서, 불특정 화자(話者)용으로 미리 설정된 불특정 화자 음성 인식용 사전 및 플레이어에 의해 설정되는 특정 화자 음성 인식용 사전을 구비하고, 동작의 초기 상태에서 상기 불특정 화자 음성 인식용 사전을 선택하는 것이다.
본 발명에 따른 음성 인식 장치는, 상기 음성 인식부는 복수의 플레이어 각각에 대응하는 복수의 특정 화자 음성 인식용 사전을 구비하고, 플레이어의 조작에 의해 이들 특정 화자 음성 인식용 사전으로부터 인식 처리에 사용하는 사전을 선택하는 것이다.
본 발명에 따른 음성 인식 장치는, 상기 음성 인식부에 접속되는 게임기용 제어부를 구비하고, 상기 음성 인식부는 음성의 인식 결과와 상기 제어부의 제어 신호를 조합시켜 게임에 관한 제어 신호를 생성하는 것이다.
본 발명에 따른 음성 인식 장치는, 상기 제어부는 통상의 동작을 시키는 제어 신호를 출력하고, 상기 음성 인식부는 특수한 동작을 시키는 제어 신호를 생성하는 것이다.
통상의 동작이란, 플레이어가 통상 행하는 게임에서의 동작(예를 들면, 킥한다, 점프한다 등)이다. 특수한 동작이란, 상기 제어부의 신호와 상기 음성 신호와의 조합에 의해 가능하게 되는 특유의 동작이다. 예를 들면, 격투기 게임에 있어서, 큰 소리 + A 버튼 조작에 의해, 그 때의 동일한 무예를 반복하는 동작이나, 복수의 버튼을 동시에 누른 경우에만 나오게 하는 특정의 치명적인 타격이다.
본 발명에 따른 음성 인식 장치는, 상기 음성 인식부는 상기 음성 입력 수단의 음성 신호 출력과 상기 음성 인식용 사전의 내용과의 유사 정도를 나타내는 유사도 및 상기 음성 신호의 상태를 나타낸 값을 출력함과 동시에, 상기 음성 인식부는 게임에서의 동작의 종류를 선택하기 위해 상기 유사도에 기초하여 음성 인식을 행하는 제1 동작 모드와, 동작의 상태를 설정하기 위해 음성 인식을 행하지 않고 상기 음성 신호의 상태를 측정하는 제2 동작 모드를 구비하는 것이다.
본 발명에 따른 음성 인식 장치는, 상기 제2 모드에서 상기 음성 신호의 상태를 신호의 일부 또는 전체의 평균 음량 레벨로 하고, 이 평균 음량 레벨에 기초하여 동작의 상태를 설정하는 것이다.
본 발명에 따른 음성 인식 장치는, 상기 제2 모드에서 상기 음성 신호의 상태를 신호의 피크 음량 레벨로 하고, 이 피크 음량 레벨에 기초하여 동작의 상태를 설정하는 것이다.
본 발명에 따른 음성 인식 장치는, 상기 제2 모드에서 상기 음성 신호의 상태를 신호의 상승 시간으로 하고, 이 상승 시간에 기초하여 동작의 상태를 설정하는 것이다.
본 발명에 따른 음성 인식 장치는, 상기 제2 모드에서, 상기 음성 신호의 상태를 신호의 지속 시간으로 하고, 이 지속 시간에 기초하여 동작의 상태를 설정하는 것이다.
본 발명에 따른 음성 인식 장치는, 상기 제2 모드에서 상기 음성 신호의 상태를 음성의 종류로 하고, 이 음성의 종류에 기초하여 동작의 상태를 설정하는 것이다.
본 발명에 따른 음성 인식 장치는, 상기 음성 인식부는 상기 음성 입력 수단의 음성 신호 출력과 상기 음성 인식용 사전의 내용과의 유사 정도를 나타내는 유사도 및 그 음량 레벨을 출력하고, 이 음량 레벨을 미리 정해진 리젝트 레벨에 기초하여 평가하고, 평가 결과에 기초하여 상기 음성 인식부의 인식 결과를 리젝트하는 것이다.
본 발명에 따른 음성 인식 장치는, 상기 리젝트 레벨을 게임의 종류 또는 게임 스테이지별로 설정하는 것이다.
본 발명에 따른 음성 인식 장치는, 상기 음성 인식부는 상기 음성 입력 수단의 음성 신호 출력과 상기 음성 인식용 사전의 내용과의 유사 정도를 나타내는 유사도에 기초하여 인식함과 동시에, 인식 결과에 기초하여 생성된 제어 신호에 의한 게임에서의 동작의 상태를 상기 유사도에 따라 변화시키는 것이다.
본 발명에 따른 게임기는, 제어용 주변 기기로서 상기 음성 인식 장치를 구비하는 것이다.
본 발명에 따른 음성 인식 방법은, 음성 신호를 수신하는 제1 스텝과, 상기 음성 신호와 미리 정해진 음성 인식용 사전의 데이타를 비교함으로써 플레이어의 음성을 인식하는 제2 스텝과, 상기 제2 스텝의 인식 결과에 기초하여 게임에 관한 제어 신호를 생성하는 제3 스텝을 구비하는 것이다.
본 발명에 따른 음성 인식 방법은, 게임기용 제어부로부터 제어 신호를 수신하는 제4 스텝을 구비하고, 상기 제3 스텝에서, 상기 제2 스텝에 의한 음성의 인식 결과와 상기 제4 스텝에 의한 제어 신호를 조합시켜 게임에 관한 제어 신호를 생성하는 것이다.
본 발명은 입력된 음성을 인식하는 음성 인식 장치, 음성 인식 방법 및 이것을 이용한 게임기에 관한 것이다.
도 1은 본 발명의 실시 형태 1에 따른 비디오 게임기를 이용한 게임 시스템의 외관도
도 2는 본 발명의 실시 형태 1에 따른 비디오 게임기의 기능 블럭도.
도 3은 본 발명의 실시 형태 1에 따른 음성 인식부의 기능 블럭도.
도 4는 본 발명의 실시 형태 1에 따른 비디오 게임기를 이용한 게임 시스템의 사용 상태의 설명도.
도 5는 본 발명의 실시 형태 1에 따른 음성 인식부의 동작을 설명하기 위한 플로우차트.
도 6은 본 발명의 실시 형태 1에 따른 음성 인식부의 동작을 설명하기 위한 음성 파형의 개략도.
도 7은 본 발명의 실시 형태 1에 따른 음성 인식부의 동작을 설명하기 위한 음성 파형의 개략도.
〈발명을 실시하기 위한 최선의 형태〉
(형태 1.)
도 1은 본 발명의 실시 형태에 따른 음성 인식 장치를 이용한 비디오 게임기의 외관도이다. 이 도면에서, 비디오 게임기 본체(1)는 대체로 상자형을 이루고, 그 내부에는 게임 처리용 기판 등이 설치되어 있다. 또한, 비디오 게임기 본체(1)의 전면(前面)에는, 2개의 커넥터(2a)가 설치되어 있고, 이들 중 한쪽 커넥터(2a)에는 게임 조작용의 PAD(2b)가 케이블(2c)을 통해 접속되어 있다. 다른쪽의 커넥터(2a)에는 음성 인식부(6)가 접속되어 있다. 음성 인식부(6)에는 PAD(2b)와 함께 플레이어의 음성을 청취하기 위한 마이크(7)가 접속되어 있다. 2명의 플레이어가 게임을 즐기는 경우에는 2개의 PAD(2b)가 사용된다. 도 1의 마이크(7)는 헤드셋트형이지만, 다른 형식의 마이크여도 상관없다. 또, 2개의 커넥터(2a)의 양쪽에 음성 인식부(6)를 접속하는 것도 가능하다.
비디오 게임기 본체(1)의 상부에는 게임 프로그램, 음성 인식 동작이 기억된 기억 매체로서의 ROM 카트리지 접속용의 카트리지 I/F(1a), CD-ROM 판독용의 CD-ROM 드라이브(1b)가 설치되어 있다. 비디오 게임기 본체(1)의 배면에는, 도시되어 있지 않지만, 비디오 출력 단자 및 오디오 출력 단자가 설치되어 있다. 이 비디오 출력 단자는 케이블(4a)을 통해 TV 수상기(5)의 비디오 입력 단자에 접속됨과 동시에, 오디오 출력 단자는 케이블(4b)을 통해 TV 수상기(5)의 오디오 입력 단자에 접속되어 있다. 이와 같은 비디오 게임기에 있어서, 사용자가 PAD(2b)를 조작함으로써 TV 수상기(5)에 투영된 화면을 보면서 게임을 행할 수 있다.
도 2는 본 실시 형태에 따른 TV 게임기의 개요를 나타낸 블럭도이다. 또, 도 2에서 음성 인식부(6) 및 마이크(7)의 표시는 생략하고 있다. 이 화상 처리 장치는 장치 전체의 제어를 행하는 CPU 블럭(10), 게임 화면의 표시 제어를 행하는 비디오 블럭(11), 효과음 등을 생성하는 사운드 블럭(12), CD-ROM의 판독을 행하는 서브 시스템(13) 등으로 구성되어 있다.
CPU 블럭(10)은 SCU(System Control Unit: 100), 메인 CPU(101), RAM(102), ROM(103), 카트리지 I/F(1a), 서브 CPU(104), CPU 버스(103) 등으로 구성되어 있다. 메인 CPU(101)는 장치 전체의 제어를 행하는 것이다. 이 메인 CPU(101)는 내부에 DSP(Digital Signal Processor)와 마찬가지의 연산 기능을 구비하고, 어플리케이션 소프트를 고속으로 실행할 수 있다. RAM(102)은 메인 CPU(101)의 워크 영역으로서 사용되는 것이다. ROM(103)에는 초기화 처리용의 이니셜 프로그램 등이 기록되어 있다. SCU(100)는 버스(105, 106, 107)를 제어함으로써 메인 CPU(101), VDP(120, 130), DSP(140), CPU(141) 등의 사이에서의 데이타 입출력을 원활하게 행하는 것이다. 또한, SCU(100)는 내부에 DMA 컨트롤러를 구비하고, 게임 중의 스프라이트 데이타(Sprite Data)를 비디오 블럭(11) 내의 VRAM으로 전송할 수 있다. 이에 따라, 게임 등의 어플리케이션 소프트를 고속으로 실행하는 것이 가능하다. 카트리지 I/F(1a)는 ROM 카트리지의 형태로 공급되는 어플리케이션 소프트를 입력하기 위한 것이다.
서브 CPU(104)는 SMPC(System Manager & Peripheral Control)라고 불리는 것으로, 메인 CPU(101)으로부터의 요구에 따라 PAD(2b)로부터 페리페럴(peripheral) 데이타를 커넥터(2a)를 통해 수집하는 기능 등을 구비하고 있다. 메인 CPU(101)는 서브 CPU(104)로부터 수신한 페리페럴 데이터에 기초하여, 예를 들면 게임 화면 중의 야수를 이동시키는 등의 처리를 행하는 것이다. 커넥터(2a)에는 PAD, 조이스틱, 키보드 등 중 임의의 페리페럴이 접속 가능하다. 서브 CPU(104)는 커넥터(2a: 본체측 단자)에 접속된 페리페럴의 종류를 자동적으로 인식하고, 페리페럴의 종류에 따른 통신 방식에 따라 페리페럴 데이타 등을 수집하는 기능을 구비하고 있다.
비디오 블럭(11)은 비디오 게임의 폴리건(polygon) 데이타로 이루어지는 캐릭터 등의 묘화를 행하는 VDP(Video Display Processor: 120), 배경 화면의 묘화, 폴리건 화상 데이타 및 배경 화상의 합성, 클리핑 처리 등을 행하는 VDP(130)를 구비하고 있다. VDP(120)는 VRAM(121) 및 프레임 버퍼(122, 123)에 접속되어 있다. 비디오 게임기의 캐릭터를 나타내는 폴리건의 묘화 데이타는 메인 CPU(101)로부터 SCU(100)를 통해 VDP(120)로 전송되고, VRAM(121)에 기록된다. VRAM(121)에 기록된 묘화 데이타는 예를 들면, 16 또는 8비트/pixel의 형식으로 묘화용 프레임 버퍼(122 또는 123)에 묘화된다. 묘화된 프레임 버퍼(122 또는 123)의 데이타는 VDP(130)로 전송된다. 묘화를 제어하는 정보는 메인 CPU(101)로부터 SCI(100)를 통해 VDP(120)에 제공된다. 그리고, VDP(120)는 이 지시에 따라 묘화 처리를 실행한다.
VDP(130)는 VRAM(131)에 접속되고, VDP(130)로부터 출력된 화상 데이타는 메모리(132)를 통해 인코더(160)로 출력되는 구성으로 되어 있다. 인코더(160)는 이 화상 데이타에 동기 신호 등을 부가함으로써 영상 신호를 생성하고, TV 수상기(5)로 출력한다. 이에 따라, TV 수상기(5)에 소정의 게임 화면이 표시된다.
사운드 블럭(12)은 PCM 방식 또는 FM 방식에 따라서 음성 합성을 행하는 DSP(140)와, 이 DSP(140)의 제어 등을 행하는 CPU(141)로 구성되어 있다. DSP(140)에 의해 생성된 음성 데이타는 D/A 컨버터(170)에 의해 2채널의 신호로 변환된 후에 스피커(5b)로 출력된다.
서브 시스템(13)은 CD-ROM 드라이브(1b), CD I/F(180), CPU(181), MPEG AUDIO(182), MPEG VIDEO(183) 등으로 구성되어 있다. 이 서브 시스템(13)은 CD-ROM의 형태로 공급되는 어플리케이션 소프트의 판독, 동화상의 재생 등을 행하는 기능을 구비하고 있다. CD-ROM 드라이브(1b)는 CD-ROM으로부터 데이타를 판독하는 것이다. CPU(181)는 CD-ROM 드라이브(1b)의 제어, 판독된 데이타의 오류 정정 등의 처리를 행하는 것이다. CD-ROM으로부터 판독된 데이타는, CD I/F(180), 버스(106), SCU(100)를 통해 메인 CPU(101)에 공급되고, 어플리케이션 소프트로서 이용된다. 또한, MPEG AUDIO(182), MPEG VIDEO(183)는 MPEG 규격(Motion Picture Expert Group)에 의해 압축된 데이타를 복원하는 디바이스이다. 이들 MPEG AUDIO(182), MPEG VIDEO(183)를 이용하여 CD-ROM에 기록된 MPEG 압축 데이타의 복원을 행함으로써, 동화상의 재생을 행할 수 있게 된다.
도 3은 음성 인식부(6)의 내부 구성을 나타낸 블럭도이다. 음성 인식부(6)는 자기의 소리의 등록이 필요 없이, 누구의 소리라도 인식할 수 있는 불특정 화자용에 대응한 워드 스포팅 기능을 갖는 이산 단어(태양, 바다 등 단독으로 이용하는 단어)의 음성 인식서브 시스템이다. 이 도면에서, 커넥터(62)는 케이블(2c)을 통해 도 2의 커넥터(2a)에 접속된다. 또한, 커넥터(63, 64)에는 각각 PAD(2b), 마이크(7)가 접속된다. 커넥터(62 ∼ 64)는 음성 인식용 LSI(61: 모델명 RL5C288, 주식회사 리코 제조)에 접속되어 있다. 음성 인식용 LSI(61)는 마이크(7)로부터 입력되는 음성 신호에 기초하여 음성 인식 처리를 행함과 동시에, PAD(2b)로부터의 데이타를 본체측의 CPU 블럭(10)에 전달한다. 또한, PAD(2b)의 제어 데이타와 음성 인식 결과를 융합하는 처리도 행한다. 또한, 확장 포트(커넥터: 63)에 대응 페리페럴을 접속함으로써 음성과 메뉴얼의 동시 조작이 가능해진다. 음성 인식용 LSI(61)는 음성 인식 처리의 파라메터 데이타 등을 기억하는 데이타 레지스터(61a), 음성 인식을 위한 표준 패턴이 기억되는 표준 패턴 메모리(61b) 및 특정 화자의 음성 인식을 위한 특정 패턴 메모리(61c)를 구비한다.
음성 인식부(6)는 미리 각 단어별로 다수 화자의 스펙트럼 계열을 분류(클러스터화)하여, 각 클러스터의 중심, 또는 각 클러스터에 속하는 음성의 평균 스펙트럼계열을 표준 패턴(멀티 템플릿)으로서 가지고 있다. 입력 음성에 대해 모든 표준 패턴과 매칭을 행하고, 유사도를 계산한다. 유사도란, 인식 결과에 포함되는 데이타로서, 사용자가 발성한 음성과 인식 결과의 단어와의 거리를 나타낸다. 값이 클수록 유사하다. 유사도가 높은 표준 패턴의 단어를 인식 결과로서 출력한다. 또, 표준 패턴의 사전 데이타는 게임기(1)측으로부터 다운 로드된다. 또한, 인식 결과로서 단어의 유사도와 함께 음량 취득치도 출력된다. 음량 취득치는 입력 음성의 레벨을 나타내는 값이고, 이에 따라 사용자가 발성한 음성의 크기를 계측할 수 있다. 값이 클수록 음량이 큰 것을 나타낸다.
음성 인식부(6)는 다음과 같은 특징을 갖는다.
인식 타입: 이산 발성 단어, 화자 타입: 불특정 화자, 특징량: 메르켑스트럼, 인식 방식 : DST 모델, 인식 단어수: 불특정 화자에 대해 표준 30단어(단, 총 모라수에 따라서 인식 단어수가 변화), 인식 처리 시간 : 발성 종료 후 0. 2초 이상(어플리케이션에 의해 변경 가능), 단어 발성 길이 : 0. 15 ∼ 2. 00초(불필요어를 포함한다), 클러스터링 방식 : 비트 할당 방식, 클러스터수 : 최대 16, 리젝트 레벨 : 8단계[0(저레벨) ∼ 7(고레벨)], 워드 커넥션: 최소 30가지(단, 모라수에 따라서는 조합수는 변화한다), 마이크 증폭기 게인 : 가변.
도 4는 이 게임기(1)와 음성 인식부(6)를 사용한 시스템의 구성예이다. 상세는 후술하지만, 플레이어(PLAYER)는 TV 수상기(5)의 화면을 보면서 PAD(2b)를 조작하거나, 마이크(7)를 향해 커맨드를 보냄으로써 여러가지 조작을 행한다.
도 5는 음성 인식의 기본 처리의 플로우차트이다. 또, 이하의 설명에서, 「단어」란 문법적으로 엄격한 의미에서의 단어를 나타내는 것이 아니라, 사람의 이름이나 숫자 등의 짧은 것이나, 글이나 문장 등의 긴 것을 포함해 음성 인식시의 한 단위를 「단어」라고 표기한다.
우선, 인식 커맨드를 데이타 레지스터(61a)에 셋트한다(스텝 S10).
다음에, 음성 인식용 LSI(61)로부터 인식 결과가 출력될 때까지 기다린다(스텝 S11).
인식 커맨드를 수신한 음성 인식용 LSI(61)는 소정 레벨 이상의 음량의 음성이 일정 시간 계속하면, 인식 결과를 데이타 레지스터(61a)에 저장함과 동시에, 인식 결과가 출력된 것을 게임기 본체(10)에 알린다.
인식 결과가 출력되면, 데이타 레지스터(61a)로부터 복수의 표준 패턴 중에 가장 근접한 인식 순위 1위의 단어와 인식 득점을 판독한다(스텝 S12). 인식 득점은 입력 음성과 인식 순위 1위의 단어와의 유사도를 득점에 의해 나타낸 것이다. 인식 득점이 높을수록 입력 음성과 유사하다는 것을 나타내고 있다.
다음에, 더욱 상세한 데이타가 필요한지의 여부를 판단하고(스텝 S13), 데이타가 필요하지 않으면 스텝 S10으로 복귀한다.
데이타가 필요하면, 넥스트 커맨드를 데이타 레지스터(61a)에 셋트한다(스텝 S14). 넥스트 커맨드에 의해 음성 인식용 LSI(61)는 인식 단어 발성시의 음량 데이타를 데이타 레지스터(61a)에 저장한다. 게임기 본체(10)는 데이타 레지스터(61a)로부터 음량 데이타를 판독한다(스텝 S15).
다음에, 더욱 상세한 데이타가 필요한지의 여부를 판단하고(스텝 S16), 데이타가 필요하지 않으면 스텝 S10으로 복귀한다.
데이타가 필요하면, 넥스트 커맨드를 데이타 레지스터(61a)에 셋트한다(스텝 S17). 넥스트 커맨드에 의해 음성 인식용 LSI(61)는 인식 순위 2위의 단어와 인식 득점을 데이타 레지스터(61a)에 저장한다. 게임기 본체(10)는 데이타 레지스터(61a)로부터 인식 순위 2위의 단어와 인식 득점을 판독한다(스텝 S18).
다음에, 더욱 상세한 데이타가 필요한지의 여부를 판단하고(스텝 S19), 데이타가 필요하지 않으면 스텝 S10으로 복귀한다.
데이타가 필요하면, 넥스트 커맨드를 데이타 레지스터(61a)에 셋트한다(스텝 S20). 넥스트 커맨드에 의해 음성 인식용 LSI(61)는 인식 순위 3위의 단어와 인식 득점을 데이타 레지스터(61a)에 저장한다. 게임기 본체(10)는 데이타 레지스터(61a)로부터 인식 순위 3위의 단어와 인식 득점을 판독한다(스텝 S21).
이와 같이 하여, 음성 인식용 LSI(61)로부터 인식 결과로서 인식 순위 1위의 단어와 인식 득점을 얻을 수 있어, 필요에 따라서 넥스트 커맨드에 의해 더욱 상세한 인식 결과의 데이타를 얻을 수 있다.
이상의 음성 인식 처리에 의해, 음성 인식부(6)는 다음과 같은 기능을 갖는다.
·디폴트 불특정 화자 음성 인식 기능
음성 인식부(6)는 소정의 시퀀스로 디폴트 인식 모드와 노멀 인식 모드(후술)를 전환한다. 디폴트 인식 모드는 장치의 전원 투입 직후에 표시되는 CD-ROM 등을 조작하기 위한 초기 화면을 음성에 의해 조작하는 것을 목적으로 한 모드이다. 음성 인식용 LSI(61)에 내장되는 도시하지 않은 ROM에 PAD(2b)의 각 버튼에 대응한 단어 사전을 갖고, 대응한 단어가 인식된 경우에는 각 버튼에 대응한 비트를 액티브(0)로 한다. 이 모드에 의해, 전원 투입 직후 등에 초기 설정하거나, CD-ROM을 이용한 게임 스타트 등을 음성을 통해 행할 수 있다.
단어 사전과 대응 버튼의 관계를 이하에 나타낸다.
디폴트 단어 사전과 대응 버튼의 관계
패드 버튼 단어 사전
Right 없음
Left 없음
Down 없음
Start 「게임 스타트」
A 버튼 「결정」
C 버튼 「C 버튼」
B 버튼 「취소」
R 버튼 「전진」
X 버튼 「반복」
Y 버튼 「정지」
Z 버튼 「재생」
L 버튼 「후진]
·노멀 불특정 화자 음성 인식 기능
사전을 게임기(1)의 CD-ROM으로 로드하고, 인식을 행하는 게임에서의 사용을 목적으로 한 모드이다. 사전 데이타 로드 커맨드를 발행하고, 사전을 CD-ROM으로 음성 인식용 LSI(61) 내의 도시하지 않은 RAM에 로드하고, 인식 개시 커맨드를 발행하는 것(후술의 리젝트 레벨과 사용 클러스터의 설정이 필요)에 의해 인식 동작을 개시한다. 인식 정지 커맨드를 발행함으로써 인식 동작을 정지시킬 수 있다.
이 경우, 사전 데이타의 다운 로드는 파워온 또는 리셋트시에 자동적으로 행할 수 있다. 음성 인식부(6)에 파워온 리셋트가 걸리면, CD-ROM으로부터 시스템 내장 RAM에 데이타를 자동으로 전송한다. 그 후, 표준 패드 데이타와의 치환을 행한다. 이와 같이 다운 로드를 자동적으로 행하면, 외부 조작이 불필요하기 때문에, 미대응의 어플리케이션을 사용할 때도 표준 데이타를 어플리케이션으로 사용할 수 있다. 또한, 표준 데이타를 미리 시스템에 구비하여 공용함으로써 각종어플리케이션의 데이타량 삭감 및 어플리케이션 작성자의 부담의 경감을 꾀할 수 있다.
·워드 스포팅 기능
음성 인식부(6)는 워드 스포팅 기능을 갖고, 「앗 펀치」의 「앗」 등의 불필요어를 포함한 단어로부터 사전에 있는 단어를 분리할 수 있다.
·캣치업 기능
음성 인식부(6)는 표준 패턴 메모리(61b)에 기초하여 불특정 화자 음성 인식을 채용하고 있다. 그러나, 개성이 강한 발음을 하는 사용자 또는 특정한 단어에 따라서는 인식하기 어려운 경우가 있을지도 모른다. 그래서, 인식하기 어려운 단어를 사용자 개별의 음성 등록으로 치환함으로써, 인식율의 향상을 꾀할 수도 있다. 이 경우, 특정 화자 음성 인식으로 된다.
구체적 순서는 다음과 같이 행한다. 데이타 레지스터(61a)로 음성 데이타 전송 커맨드를 발행한다. 다음에, 마이크(7)에 원하는 음성을 입력한다. 그리고, 입력된 음성을 특정 패턴 메모리(61c)에 저장한다.
·마이크 게인 변경 기능
마이크(7)의 게인을 변경할 수 있다. 데이타 레지스터(61a)로 게인 설정 커맨드를 발행함으로써 설정을 행한다. 이 기능에 의해, 화자의 발성 음량, 주위의 소음 등에 따라 적절한 인식을 행할 수 있다.
·리얼 타임 음량 출력 기능
노멀 인식 모드에는, 음성 레벨을 리얼 타임(20㎳마다)으로 출력하는 음 스위치 모드와 통상의 음성 인식을 행하는 인식 모드의 2개가 있다. 전자의 리얼 타임 음량 출력 모드에서는, 단순히 음성 레벨을 출력할 뿐이므로, 고속의 처리가 가능하다. 모드 음량 출력 커맨드를 발행함으로써, 8bit(0 ∼ 255)의 음성 레벨 신호를 출력한다.
이 모드의 용도로서, 다음과 같은 것이 고려된다.
마이크(7) 또는 PAD(2b)로부터의 커맨드 입력 후에, 그 커맨드에 의한 조작의 정도를 음성 레벨 신호로 결정한다. 예를 들면, 화면 상의 캐릭터에 「전진」을 명령한 후에, 그 이동 속도를 빨리 하기 위해 플레이어에게 「빨리, 빨리 」라고 외치도록 한다. 또는, 화면 상의 캐릭터의 울고 웃는 등의 표정을 짓게 할 때, 어느 정도 심한 표정으로 하는지를 플레이어의 「앗」하는 외침 소리의 크기로 결정하도록 한다. 또는, 화면 상의 캐릭터가 위험 지대를 걷고 있을 때에, 적 캐릭터의 돌연의 출현 등의 돌발적인 위험 상태가 발생될 때, 플레이어가 「위험하다」든지 「꺅」등의 외침 소리를 지를 때에는 그 크기에 따라, 캐릭터가 움직이는 스피드를 느리게 하거나, 태세를 취하게 하거나, 자세를 낮게 하거나, 기절시키거나 한다.
또한, 음성 레벨에 따라 정도를 바꿀 뿐만 아니라, 동작의 종류를 바꾸도록 할 수도 있다. 예를 들면, 화면 상의 캐릭터에 「전진」이라고 명령한 후에 「가라」라고 작은 소리로 명령할 때에는 캐릭터는 걷기 시작하고, 한편, 「걸어!!」라고 외칠 때에는 캐릭터는 점프하거나, 비행 능력이 있으면 하늘을 날거나 할 수도 있다.
결국, 음성 레벨에 의해 동작의 정도를 증가 또는 감소시키도록 제어하거나, 어떤 임계치를 초과하였는지의 여부에 따라 동작의 종류를 바꾸도록 하는 것이 고려된다.
·리젝트 기능
음성 인식시에 음성 인식용 LSI(61)로부터 유사도와 동시에 출력되는 득점(레벨)이 일정 레벨 이하일 때에, 그 인식 결과를 기각하는 기능이다. 예를 들면, 득점 < (리젝트 레벨+1)*8일 때, 그 인식 순위 1위인 유사도의 결과는 출력되지 않는다. 리젝트 레벨은 예를 들면 2정도이다. 이 기능에 의해, 예를 들면 화자 이외의 사람의 소리나 노이즈 등에 의해 잘못 인식하는 것을 방지할 수 있다.
·클러스터 기능
이것은 한 장면의 30단어를 최대 16의 그룹으로 나누고, 임의의 그룹(복수 선택 가능)을 선택하여 인식을 행함으로써 인식율 및 인식 속도를 향상시키는 기능이다.
예를 들면, 롤 플레잉 게임(RPG)의 전투 장면에서 잘 이용되는 주문 등을 인식하기 위해, 주문 각각의 종류별로 공격 마법(클러스터 1), 회복 마법(클러스터 2), 직접 공격(클러스터 3), 기타 (클러스터 4), 직종(클러스터 5)이라는 클러스터를 만든다. 그리고, 전투 장면의 경과별로 순서대로 적절하게 클러스터를 선택해 간다.
전투를 개시하기 전에는, 직종(클러스터 5) 중의 언어 중 어느 하나라고 인식한다. 인식 결과가 「전사」이면, 다음은 당연히 무기를 갖고 직접 공격하는 것으로 되기 때문에, 직접 공격(클러스터 3)부터 인식한다. 한편, 직종의 인식 결과가 「마법사」일 때에는, 공격 마법(클러스터 1)부터 인식한다.
이와 같이, 전회의 인식 결과에 기초하여, 장면별로 관련이 깊은 적당한 클러스터를 선택하고, 음성 신호가 이 선택된 클러스터의 언어 중 어느 하나라고 판정한다. 이 방법에 의하면, 정말로 무관한 언어라고 오인할 우려가 적어져서, 인식의 신뢰성이 높아짐과 동시에, 유사도를 구하는 인식 처리를 행하는 대상이 그 선택된 클러스터 내에 한정되므로 처리 연산 횟수가 감소하고, 따라서 처리 속도의 점에서도 유리하다.
·워드 커넥션 기능
연속으로 발성한 2단어를 1조로서 인식 결과를 출력하는 기능이다. 1단어째의 유사도와 2단어째의 유사도의 합계가 높은 것을 출력한다. 이 경우, 미리 2단어의 결합 데이타를 사전에 넣어 둘 필요가 있다.
예를 들면, 사전에, 원숭이, 공격, 꿩, 방어, 개, 마법, 도깨비, 도피한다, 모모타로(momotaro)의 어휘가 존재하고, 또한 결합 데이타로서 원숭이-공격, 원숭이-방어, 원숭이- 도피한다, 꿩-공격, 꿩-방어, 꿩- 도피한다, 개-공격, 개-방어, 개- 도피한다, 가 저장되어 있게 한다. 이와 같이, 사전 내에 단어와 이들 결합 데이타가 저장되어 있다.
이 경우, 사용자가 「원숭이, 공격」 (사이를 약간 두는 것)이라고 발성하였다고 한다면, 이 때의 음성 인식부(6)의 동작은 (9어로부터 3어를 선택한 순열 *2가지 중의) 예를 들면 다음 케이스와 같이 된다.
케이스 1
1단어째 유사도 2단어째 유사도 인식 결과
1위 원숭이 1위 공격
2위 꿩 2위 마법 원숭이- 공격
3위 도깨비 3위 도피한다
케이스 2
1단어째 유사도 2단어째 유사도 인식 결과
1위 꿩 1위 공격
2위 원숭이 2위 마법 꿩- 공격
3위 도깨비 3위 도피한다
케이스 3
1단어째 유사도 2단어째 유사도 인식 결과
1위 도깨비 1위 공격
2위 원숭이 2위 마법 원숭이- 공격
3위 개 3위 도피한다
케이스 4
1단어째 유사도 2단어째 유사도 인식 결과
1위 도깨비 1위 마법
2위 원숭이 2위 공격 원숭이-공격
3위 개 3위 도피한다
이상의 워드 커넥션 기능 사용시, 음성 인식부(6)는 유사도 1 ∼ 3위의 후보 중에서 출력을 선택한다. 1단어째 유사도 1, 2, 3위의 단어와 2단어째 유사도 1, 2, 3위의 조합에서 합계의 유사도가 큰 것이 선택된다. 그러나, 케이스 3, 4와 같이 유사도 1위에 결합 데이타를 갖지 않는 단어가 올 때에는, 이것을 기각하여 결합 데이타를 우선적으로 출력한다.
다음에, 음성 인식부를 이용한 게임기의 동작에 대해 설명한다.
이 종류의 게임기는 통상, 패드(2b)의 버튼에 의해 조작되지만, 이것에 대신하거나 또는 이것과 겸해서 음성 인식 장치를 이용함으로써 새로운 사용 방법이 가능하게 된다. 음량차의 요인을 식별할 수 있으면, 이것과 음성 인식을 조합함으로써, 새로운 플레이가 가능하게 된다.
보통의 음성 인식이라고 발음된 음성이 인식 데이타와 일치했는지 여부의 판단을 행하고, 그 결과를 출력할 뿐이지만, 이것에 더욱 발음된 음성이 어느 기준보다 컸는지, 그렇지 않으면 작았는지의 판단 결과를 부가함으로써 응용 범위를 넓힐 수 있다. 이 구체예에 대해서는 후술한다.
발생된 소리는, 마이크로폰(7)을 통해 음성 및 음량을 인식하는 음성 인식부(6)로 전송되고, 여기서 인식 데이타의 비교 및 음량 기준치의 비교를 행하고, 그 결과를 게임기 본체(1)로 전송한다. 게임기 본체(1)에서는 그 결과에 따라 여러가지의 동작을 행한다. 또, 게임기 본체(1)로부터 음성 인식부(6)에 대해, 음량 기준치의 셋트를 할 수 있다. 또한, 음량 기준치는 조정 가능한 디폴트치를 가지고 있다.
다음에, 음성 인식과 음량치와의 조합에 의한 동작의 구체예에 대해, 게임기의 경우를 예로 들어 설명한다.
<음성 레벨에 의해 동작의 정도를 제어>
예를 들면, 화면 상의 캐릭터에 「전진」을 명령한 후에, 그 이동 속도를 빨리 하기 위해 플레이어에게 「빨리, 빨리」라고 외치게 한다. 또는, 화면 상의 캐릭터의 울고 웃는 등의 표정을 짓게 할 때, 어느 정도 격렬한 표정으로 하는지를 플레이어의 「앗」하는 외침 소리의 크기로 결정하도록 한다. 또는, 화면 상의 캐릭터가 위험 지대를 걷고 있을 때에, 적 캐릭터의 돌연의 출현 등의 돌발적인 위험 상태가 발생될 때, 플레이어가 「위험하다」든지 「꺅」 등의 외침 소리를 지를 때에, 그 크기에 따라서, 캐릭터가 움직이는 스피드를 느리게 하거나, 태세를 취하게 하거나, 자세를 낮게 하거나, 기절시키거나 한다. 또는 음량에 의해 강한 킥을 내보내거나, 그렇지 않으면 약한 킥을 내보내는 것을 선택한다.
그런데, 음량 레벨의 의미로서 상호 다른 몇개의 취할 수 있는 방법이 가능하다. 플레이어가 소리내는 방법은 다양하지만, 개념적으로 취할 수 있는 도 6 및 도 7과 같은 예가 고려된다. 이들 도면의 종축은 음량 레벨이고, 횡축은 시간이다. 도 6에서, 최초의 음량이 가장 크고, 서서히 내려 가고 있다. 「꺅」이라는 비명과 같은 흥분 상태의 소리는 이와 같이 변화한다고 생각된다. 이것에 대해, 도 7에서 서서히 음량이 커져 이윽고 피크를 맞이하고, 그 후 서서히 음량이 작아지고 있다. 통상의 음성은 이와 같이 변화한다고 생각된다.
음량 레벨을 다음과 같이 정의한다.
(1) 평균 음량
도 6 및 도 7의 신호 전체에 대한 평균을 구하고, 이것을 (평균) 음량으로 한다.
구체적으로는, 마이크의 입력 신호에 대해 적분 회로를 적용할 수 있다. 평균 음량은 소리가 통상의 상태인지 흥분 상태인지에 관계없이 소리 전체(음량× 지속 시간)의 값을 나타내므로, 캐릭터가 움직이는 스피드와 같이, 생각보다도 단순한 동작의 정도를 제어하는 용도에 적절하다.
(2) 피크 음량
신호의 피크치(도 6 및 도 7의 점 P)의 레벨 Δy를 구하고, 이것을 피크 음량으로 한다. 구체적으로는, 샘플 홀드 회로를 이용하여 신호를 샘플링하면서, 최대치를 계속해서 유지할 수 있다. 피크 음량은 최대의 음량을 나타내기 때문에, 복수의 플레이어 사이에서 소리의 크기를 판단하는 등의 용도에 적절하다.
(3) 상승 시간
신호의 피크까지의 시간(도 6 및 도 7의 Δt)을 구하고, 이것을 상승 시간으로 한다. 상술한 피크 홀드 회로의 홀드 시각을 알게 됨으로써 간단히 구할 수 있다. 또는, 상승의 각도θ, Δy/Δt에서 상승 시간을 정의하도록 할 수도 있다. 이것은 미분 회로에 의해 실현된다. 상승 시간은, 말하자면 소리의 긴박도에 대응한다고 생각되기 때문에, 예를 들면 상승이 급한 때에는 캐릭터에 태세를 취하도록 하거나 후퇴 행동을 시키거나 하고, 상승이 급하지 않을 때에는 캐릭터를 빠르게 걷게 하도록 하는 것이 고려된다.
(4) 지속 시간
신호의 지속 시간(도 6 및 도 7의 T)을 구하고, 이것을 지속 시간으로 한다. 구체적으로는, 도시하지 않은 타이머에 의해, 음성 신호 중에 미리 정해진 임계치 이상의 레벨의 계속 시간을 계측한다. 지속 시간은 단순히 소리의 길이를 판단하는 경우에 적용할 수 있다.
<음성 레벨에 의해 동작의 종류를 제어>
또한, 음성 레벨에 의해 정도를 바꿀 뿐만 아니라, 동작의 종류를 바꾸도록 할 수도 있다. 예를 들면, 화면 상의 캐릭터에 「전진」이라고 명령한 후에 「가라」라고 작은 소리로 명령할 때에는, 캐릭터는 걷기 시작하고, 한편 「가-!!」라고 외칠 때에는, 캐릭터는 점프하거나, 비행 능력이 있으면 하늘을 날거나 할 수도 있다.
결국, 음성 레벨에 의해 동작의 정도를 증가 또는 감소시키도록 제어하거나, 어떤 임계치를 초과했는지의 여부에 따라 동작의 종류를 바꾸도록 하는 것이 생각된다.
<음성의 종류에 의해 동작의 종류를 제어>
아이의 소리와 어른의 소리, 또는 남성의 소리와 여성의 소리를 구별하여, 이 결과에 기초하여 조작을 바꿀 수도 있다. 예를 들면, 아이의 캐릭터와 어른의 캐릭터가 혼재하고 있을 때, 소리의 종류에 따라서 아이 또는 어른의 캐릭터만을 조작한다. 남성과 여성의 경우도 마찬가지이다. 이와 같이 제어하면, 복수의 플레이어가 동시에 소리를 낼 때라도 플레이가 가능해져서, 게임에 융통성이 넓어진다.
그런데, 아이의 소리와 어른의 소리는 그 주파수 분포의 점에서 다르기 때문에 식별 가능하다. 예를 들면, 푸리에 변환하여 주파수 분포를 구함으로써, 또는 간단하게 복수의 필터의 출력을 비교함으로써 식별할 수 있다. 남성의 소리와 여성의 소리도 주파수 분포의 점에서 다르기 때문에 마찬가지의 수단으로 식별할 수 있다.
<기타>
상술한 음성 레벨 또는/및 음성의 종류와, 조작 패드(2b)의 버튼 조작과의 조합에 의해 특유의 동작을 시킬 수 있다. 예를 들면, 큰 소리 + A 버튼 조작에 의해, 그 때의 동일한 무예를 반복하도록 제어하는 것이 고려된다. 또한, 복수의 버튼을 동시에 누른 경우에 어떤 치명적인 타격이 나오게 하는 격투 게임과 같은 경우, 어떤 버튼에는 음성 입력을, 그 밖의 버튼에는 통상의 패드 입력을 할당하면, 음성과 패드 입력의 조합에 의해서, 패드만을 사용한 키 입력에 비해, 보다 간단한 입력으로 마찬가지의 키 입력을 행할 수 있다.
또, 상기한 음성 레벨을 이용하는 경우에 있어서, 상술한 리얼 타임 음량 출력 기능을 이용할 수도 있다. 즉, 음성 인식 모드와 리얼 타임 음량 출력 모드를 조합시킨다. 우선, 음성 인식을 행하여 대응하는 동작을 시킨 후, 리얼 타임 음량 출력 모드로 들어 가, 음성 레벨만을 출력한다. 이와 같이 하면 응답이 매우 좋게 된다.
이상과 같이, 본 발명의 실시 형태에 의하면, 작게 발생된 말에 대해서는 적은 움직임, 크게 발생된 말에 대해서는 큰 움직임과 같이, 발성 음량에 기초하여 움직임의 정도를 제어할 수 있다. 또한, 발성 음량에 기초하여 동작의 종류를 제어할 수 있다. 또한, 음성의 종류에 기초하여 동작의 종류를 제어할 수 있다.
형태 2.
상기 발명의 실시 형태 1의 장치는 종래의 제어 장치인 패드외에, 음성 인식 장치를 조합시킴으로써 조작에 깊이를 갖게 한 것이다. 이것에 대해, 패드를 음성 인식 장치로 치환할 수도 있다.
도 3의 음성 인식부(6)는 상술한 바와 같이, 디폴트 불특정 화자 음성 인식 기능 및 노멀 불특정 화자 음성 인식 기능을 가지고 있다. 따라서, 전원을 투입한 직후의 디폴트 상태에서도 소정의 음성과 패드의 버튼이 대응하기 때문에, 음성 인식에 대응하지 않은 소프트에서도 음성 인식 장치를 이용할 수 있다. 또한, 노멀 불특정 화자 음성 인식 기능의 사전 데이타 로드 커맨드를 발행하여 사전을 CD-ROM으로부터 다운 로드함으로써, 패드의 버튼과 음성 인식 결과와의 관계에 대해, 그 소프트 특유의 대응을 취할 수 있다.
다음에, 노멀 특정 화자 음성 인식 기능을 이용할 때의 처리 동작에 대해 설명한다.
우선, 음성 인식부(6)는 사전 데이타 로드 커맨드를 발행함으로써, CD-ROM으로부터 사전 데이타를 다운 로드한다.
다음에, 사전 데이타에 기초하여 패드(2b)의 버튼과 소정의 음성의 대응 관계를 정한다. 우선, 최초로 본체의 키 스위치에 대응시키는 음성을 음성 데이타 RAM에 정의한다. 예를 들면, 「전진」이라는 음성이 입력되면, 「위」를 나타내는 키 데이타를 출력하도록 정의된다. 이와 같은 상태에서, 도 1의 구성의 마이크로폰으로「전진」의 음성이 입력되면, 그 데이타를 디지탈 데이타로서 음성 비교부에 저장한 후에, 음성 데이타 RAM 중에 동일한 데이타가 존재하는지의 여부를 판정한다. 만일, 마이크로폰으로 입력된 음성과, 음성 데이타 RAM 중에 동일한 데이타가 존재하면, 그 데이타에 따라서 「위」를 나타내는 키 데이타가 게임기 본체(1)로 송신된다.
음성 신호가 입력되면, 음성 인식부(6)는 음성을 인식하고, 상기한 대응 관계에 기초하여, 통상의 게임 패드 조작에 대응하는 키 데이타를 게임기 본체(1)로 출력한다. 예를 들면, 「게임 스타트」라고 말하면, 스타트 버튼이 눌러질 때와 동일한 신호를 출력한다. 또, 패드 상의 각 버튼에 대해 플레이어가 좋아하는 음성을 등록하는 것도 가능하다. 예를 들면, 그것을 위한 전용의 커맨드를 입력하고, 패드데이타의 각각 원하는 단어를 선택 또는 입력하여 등록할 수 있다. 이 때, TV 화면 상에서 문자를 선택하면 불특정 화자 음성 인식이 가능하게 되고, 마이크(7)로부터 원하는 단어를 입력하면 특정 화자 인식이 가능하게 된다(캣치업 기능).
지금까지의 게임기로의 데이타 입력 장치에서는 손이나 손가락 등을 사용하여 게임 패드에 부착된 스위치를 누름으로써, 게임기 본체로의 데이타 입력을 행하고 있었지만, 이상의 방법에 의하면, 음성에 의한 입력이라도 마찬가지로 게임을 제어할 수 있다.
또한, 음성 인식부(6)를 이용하면, 게임 패드를 이용한 경우와는 다른 플레이 방법이 가능하다. 통상, 격투 게임 등에서 난도가 높은 무예가 나올 때, 고도한 패드 조작이 요구되지만, 음성 인식부(6)를 이용한 경우, 고도한 음성 입력(말이 빠르거나 어려운 발음 등)을 하지 않으면 무예가 나오지 않게 한다. 또한, 상술의 음성 레벨이나 음성 종류의 식별을 조합시킬 수도 있다.
이와 같이, 음성을 사용하여 키 입력을 행함으로써, 보다 게임에 친밀감을 갖게 할 수 있게 된다. 예를 들면, 권투 게임 등에서 A 버튼이 좌측 펀치, B 버튼이 우측 펀치라고 하는 키 할당으로 되어 있을 때, A, B 버튼을 사용하여 펀치가 나오는 것보다도, 「좌측, 우측」이라고 하는 음성으로 펀치를 나오게 하는 쪽이 게임이 백열한다.
발명의 실시 형태 3.
음성 인식부(6)는 음성 인식 후에 인식 단어 번호와 유사도를 출력한다. 그런데, 인식 개시 커맨드 발행시에 리젝트 레벨이 설정되어 있는 경우, 인식 결과의 유사도가 설정치보다 낮을 때는 결과를 출력하지 않는 것이 가능하다. 이 기능에 의해, 예를 들면 말하는 사람 이외의 사람의 소리나 노이즈 등에 의해 잘못 인식하는 것을 방지할 수 있다.
오인식을 방지하는 것 외에도, 리젝트 레벨에는 다음과 같은 응용 방법이 있다.
장면의 상황에 따라 리젝트 레벨을 바꾼다.
예를 들면, 어드벤쳐 게임에서 어떤 오인식이 발생되면 플레이어가 죽게 되는 게임 오버가 된다라는 장면에서는, 리젝트 레벨을 높게 설정한다. 이와 같이 하면, 응답 속도를 희생으로 하더라도 출력 결과의 확실성이 향상된다.
한편, 게임의 진행에 별로 관계없는 부분은 리젝트 레벨을 내림으로써, 출력결과의 확실성은 저하하지만, 응답을 좋게 할 수 있다.
이러한 설정 방법을 게임 개발자가 임의로 행할 수 있으므로, 패드를 이용하는 경우와 비교하여 여러가지 제어가 가능하게 된다.
발명의 실시 형태 4.
음성 인식부(6)는 음성 인식 후에 인식 단어 번호와 유사도를 출력한다. 따라서, 유사도를 이용하여 동작의 정도나 동작의 종류를 제어할 수도 있다.
예를 들면, 어떤 단어가 인식될 때, 음성 인식부(6)가 출력하는 유사도의 크기에 기초하여, 응답에 차를 둔다. 예를 들면, 유사도 80점의 펀치의 위력은 강력하게 하고, 한편 10점의 펀치의 위력은 약하게 한다. 이와 같이, 유사도에 의해 펀치의 위력은 다르게 한다. 그렇게 하면, 불특정 화자 음성 인식을 행하는 경우, 플레이어의 발음에 의해 캐릭터의 동작, 게임의 진행이 다르게 되어, 플레이어는 표준 데이타의 음성에 맞춘 쪽이 유리해진다. 이러한 관점(누가 가장 표준 발음을 할 수 있는지, 음성 인식에 적절한 발음을 할 수 있는지 등)으로부터 게임을 즐기는 것도 가능하게 된다. 따라서, 게임을 즐기는 방법에 깊이가 더해진다.
또, 발명의 실시 형태 1에서 설명한 음성 레벨의 관계에서 설명한 구체예에 대해, 이 실시 형태 4의 유사도에 의한 제어의 사고 방식을 적용하는 것도 가능하다.
발명의 실시 형태 5.
이상의 실시 형태에서 음성 인식부를 중심으로 설명하였지만, 이 음성 인식부를 이용하여 행하는 게임에 대해 설명한다.
(1) 동물 조교 어시스트 액션 게임
음성 인식을 사용하여, 개, 고양이, 말 등의 동물들과의 커뮤니케이션을 즐기는 게임이다.
하나의 캐릭터뿐만 아니라, 복수의 캐릭터를 직접 또는 간접적으로 조작할 수 있다고 하는 음성 인식이 아니고는 할 수 없는 게임이다. 이 종류의 게임을 버튼 조작으로 행하면 시시하고, 실제와 마찬가지로 「말을 건다」라는 조작이 적절하다.
또한, 실제의 조교에 있어서 동물이 좀처럼 말하는 것을 듣지 못하는 경우가 있다. 음성 인식이 잘 되지 않는 경우가 있어도, 이 때의 안타까움 자체도 게임성에 포함되므로, 재미가 오히려 증가한다. 말을 걸 때의 캐릭터의 리액션의 다채로움이 재미있다.
또는, 플레이어가 수행하고 있는 원숭이, 꿩, 개 등의 동물들이 멋대로 돌아다니는 액션 게임도 고려된다. 모모타로 동화와 같이, 플레이어는 필드 상에 있는 동물들에게 실제로 말을 거는 것으로 친구가 될 수 있다. 예를 들면, 동물을 친구로 하기 위해서는 친구로 하고 싶은 동물이 플레이어의 캐릭터를 보고 있을 때에 아무것이나 좋으니까 말을 건다. 예를 들면, 개라면 「멍멍아! 멍멍아! 멍멍아! 」와 같이 몇번이나 말을 걸고 있으면 그 소리에 반응하게 된다. 그래서, 먹이를 주면 그 동물은 플레이어의 친구가 되어 준다.
플레이어가 걸어가면 동물은 뒤에서 따라 오지만, 무엇인가 흥미가 있는 것을 찾아내면 멈춰 서거나, 그 쪽으로 행하거나 한다. 그러한 경우에는, 「멍멍아! 빨리 와! 」 등의 소리를 질러 돌아오게 한다.
동물들은 항상 여러가지의 움직임을 하고 있다. 플레이어가 동물이 있는 동작에 대해 몇번이나 동일한 말을 걸면 동물은 그 말에 대해서는 어느 동작을 반드시 하도록 된다. 이것을 거듭하여 플레이어는 차차 동물을 조종할 수 있게 되어 간다.
또는, 트랩, 적을 클리어해 가는 액션 게임도 고려된다. 양 기르기가 양들을 몰아내는 것과 같은 게임이다.
이 게임에서는 여러가지 트랩이 준비되어 있지만, 플레이어는 동물을 조종함에 따라, 트랩을 클리어해 간다. 플레이어가 간단히 알아차리는 트랩이라도 동물은 걸려 버리므로 그것을 가르친다. 동료의 동물이 증가할수록 어렵다. 트랩을 클리어하여 앞으로 진행하기 때문에, 어떤 동물을 어떻게 하여 사용하는지를 플레이어에게 생각케 한다.
또는, 열대어 사육 게임, 비단 잉어 사육 게임 등이다. 소리에만 한하지 않고 손을 두드리는 등의 동작을 통해 물고기들을 모은다. 손을 두드리는 방법을 고안함으로써, 물고기가 여러가지 동작을 하도록 프로그램해 놓으면 재미를 즐기는 방법이 가능해진다.
(2) 다수인 빨리 맞추기 퀴즈
퀴즈 게임기로 행하는 퀴즈 프로그램이다. 복수의 참가자가 있어, 게임기가 순서대로 문제를 내서 참가자 사이에서 득점을 겨루는 게임이다. 이 경우, 대답의 어휘가 (1) (2) ···이거나 (가) (나) ···등으로 한정되기 때문에, 처리 속도의 점에서 유리하다.
(3) 아이의 교육 게임
아이의 캐릭터에 말을 기억시키거나, 예의 범절을 가르치거나 한다. 이 종류의 게임은 커뮤니케이션이 목적이고, 음성을 사용하면 보다 재미가 증대된다.
(4) 플라이트 시뮬레이션 게임
무기 등의 장비의 선택, 서브파일럿으로의 명령에 음성 인식부를 이용하면 보다 실감적이다.
(5) 마작 게임
치, 론, 파핀 등을 발성하여 손을 선택한다.
(6) 기타
장기 게임(투료, 말의 위치 결정 등), 테이블 게임, 파티 게임(마우스 대신의 대화식 게임), 남파(헌팅) 게임(그녀, 차한지 마시지 않을래요? OK 등), 드라이브 게임(무선의 교환), RPG (롤 플레잉 게임)의 쇼트컷트, 대화식 가상 가족 게임(노인용), 전국(戰國) 시뮬레이션 등이 고려된다.
또한, 기억 매체는 얼마간의 물리적 수단에 의해 정보(주로 디지탈 데이타, 프로그램)가 기록되어 있는 이미 기술한 CD-ROM, 카트리지 등으로서, 컴퓨터, 전용 프로세서 등의 처리 장치에 소정의 기능을 행하게 할 수 있는 것이다. 결국, 얼마간의 수단으로 컴퓨터에 프로그램을 다운 로드하고, 소정의 기능을 실행시킬 수 있다.
예를 들면, 플로피 디스크, 하드 디스크, 자기 테이프, 광자기 디스크, CD-ROM, DVD, ROM 카트리지, 배터리 백업 기능을 갖는 RAM 메모리 카트리지, 플래쉬 메모리 카트리지, 불휘발성 RAM 카트리지 등을 포함한다.
또한, 전화 회선 등의 유선 통신 매체, 마이크로파 회선 등의 무선 통신 매체등의 통신 매체, 인터넷 등의 통신 매체 기억 매체에 포함된다.
이상과 같이 본 발명에 의하면 게임기의 주변 장치로서 이용되는 음성 인식 장치로서, 음성 입력 수단과, 상기 음성 입력 수단의 음성 신호 출력과 미리 정해진 음성 인식용 사전의 데이타를 비교함으로써 플레이어의 음성을 인식함과 동시에, 인식 결과에 기초하여 게임에 관한 제어 신호를 생성하는 음성 인식부를 구비하므로, 게임의 플레이어는 음성에 의한 플레이가 가능하게 된다.
또한, 본 발명에 의하면, 상기 음성 인식부는 상기 음성 인식용 사전으로서, 불특정 화자용으로 미리 설정된 불특정 화자 음성 인식용 사전 및 플레이어에 의해 설정되는 특정 화자 음성 인식용 사전을 구비하고, 동작의 초기 상태에서 상기 불특정 화자 음성 인식용 사전을 선택하므로, 특정 화자에 대응할 수 없는 게임 소프트에 대해서도 불특정 화자 음성 인식에 의해 음성에 의한 플레이가 가능하게 된다. 전용 소프트웨어에 한하지 않고 많은 소프트웨어에 대응할 수 있어, 본 장치의 적용 범위가 넓어진다.
또한, 본 발명에 의하면, 상기 음성 인식부는 복수의 플레이어 각각에 대응하는 복수의 특정 화자 음성 인식용 사전을 구비하고, 플레이어의 조작에 의해 이들 특정 화자 음성 인식용 사전으로부터 인식 처리에 사용하는 사전을 선택하므로, 적당한 사전에 의해 특정 화자 음성 인식을 할 수 있어, 음성 인식의 정밀도가 향상된다.
또한, 본 발명에 의하면, 상기 음성 인식부에 접속되는 게임기용 제어부를 구비하고, 상기 음성 인식부는 음성의 인식 결과와 상기 제어부의 제어 신호를 조합하여 게임에 관한 제어 신호를 생성하므로, 통상의 패드 등과 음성 인식을 조합하여 여러가지 조작이 가능해져서, 재미에 깊이가 더해진다.
또한, 본 발명에 의하면, 상기 제어부는 통상의 동작을 시키는 제어 신호를 출력하고, 상기 음성 인식부는 특수한 동작을 시키는 제어 신호를 생성하므로, 통상의 패드 등에서는 어렵던 특수한 동작을 실행시키기 쉬어진다.
또한, 본 발명에 의하면, 상기 음성 인식부는 상기 음성 입력 수단의 음성 신호 출력과 상기 음성 인식용 사전의 내용과의 유사 정도를 나타내는 유사도 및 상기 음성 신호의 상태를 나타낸 값을 출력함과 동시에, 상기 음성 인식부는 게임에서의 동작의 종류를 선택하기 위해 상기 유사도에 기초하여 음성 인식을 행하는 제1 동작 모드와, 동작의 상태를 설정하기 위해 음성 인식을 행하지 않고 상기 음성 신호의 상태를 측정하는 제2 동작 모드를 구비하고, 제2 동작 모드의 처리를 고속으로 행할 수 있으므로, 응답이 신속하게 되어 게임 조작에 있어서 유리하다.
또한, 본 발명에 의하면, 상기 음성 인식부는 상기 음성 입력 수단의 음성 신호 출력과 상기 음성 인식용 사전의 내용과의 유사 정도를 나타내는 유사도 및 그 음량 레벨을 출력하고, 이 음량 레벨을 미리 정해진 리젝트 레벨에 기초하여 평가하고, 평가 결과에 기초하여 상기 음성 인식부의 인식 결과를 리젝트하므로, 적절하게 인식할 수 없는 경우의 인식을 회피하여 잘못된 인식을 감소시킬 수 있다.
또한, 본 발명에 의하면, 상기 리젝트 레벨을 게임의 종류 또는 게임 스테이지별로 설정하므로, 장면에 따라서 적당한 리젝트 레벨을 설정할 수 있어 게임 플레이에 있어 편리하다.
또한, 본 발명에 의하면, 상기 음성 인식부는 상기 음성 입력 수단의 음성 신호 출력과 상기 음성 인식용 사전의 내용과의 유사 정도를 나타내는 유사도에 기초하여 인식함과 동시에, 인식 결과에 기초하여 생성된 제어 신호에 의한 게임에서의 동작의 상태를 상기 유사도에 따라서 변화시키므로, 플레이어의 발음에 의해 캐릭터의 동작, 게임의 진행이 다르게 되어, 게임을 즐기는 방법에 깊이가 가해진다.
Claims (17)
- 게임기의 주변 장치로서 이용되는 음성 인식 장치에 있어서,음성 입력 수단, 및상기 음성 입력 수단의 음성 신호 출력과 미리 정해진 음성 인식용 사전의 데이타를 비교함으로써 플레이어의 음성을 인식함과 동시에, 인식 결과에 기초하여 게임에 관한 제어 신호를 생성하는 음성 인식부를 구비하고,상기 음성 인식부는 상기 음성 인식용 사전으로서, 불특정 화자(話者)용으로 미리 설정된 불특정 화자 음성 인식용 사전 및 플레이어에 의해 설정되는 특정 화자 음성 인식용 사전을 구비하고, 동작의 초기 상태에서 상기 불특정 화자 음성 인식용 사전을 선택하는 것을 특징으로 하는 음성 인식 장치.
- 제1항에 있어서, 상기 음성 인식부는 복수의 플레이어 각각에 대응하는 복수의 특정 화자 음성 인식용 사전을 구비하고, 플레이어의 조작에 의해 이들 특정 화자 음성 인식용 사전으로부터 인식 처리에 사용하는 사전을 선택하는 것을 특징으로 하는 음성 인식 장치.
- 제1항 또는 제2항에 있어서, 상기 음성 인식부에 접속되는 게임기용 제어부를 구비하고, 상기 음성 인식부는 음성의 인식 결과와 상기 제어부의 제어 신호를 조합하여 게임에 관한 제어 신호를 생성하는 것을 특징으로 하는 음성 인식 장치.
- 제2항에 있어서, 상기 제어부는 통상의 동작을 시키는 제어 신호를 출력하고, 상기 음성 인식부는 특수한 동작을 시키는 제어 신호를 생성하는 것을 특징으로 하는 음성 인식 장치.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 음성 인식부는 상기 음성 입력 수단의 음성 신호 출력과 상기 음성 인식용 사전의 내용과의 유사 정도를 나타내는 유사도 및 상기 음성 신호의 상태를 나타내는 값을 출력함과 동시에, 상기 음성 인식부는 게임에서의 동작의 종류를 선택하기 위해 상기 유사도에 기초하여 음성 인식을 행하는 제1 동작 모드와, 동작의 상태를 설정하기 위해서 음성 인식을 행하지 않고 상기 음성 신호의 상태를 측정하는 제2 동작 모드를 구비하는 것을 특징으로 하는 음성 인식 장치.
- 제5항에 있어서, 상기 제2 모드에서 상기 음성 신호의 상태를 신호의 일부 또는 전체의 평균 음량 레벨로 하고, 이 평균 음량 레벨에 기초하여 동작의 상태를 설정하는 것을 특징으로 하는 음성 인식 장치.
- 제5항에 있어서, 상기 제2 모드에서 상기 음성 신호의 상태를 신호의 피크 음량 레벨로 하고, 이 피크 음량 레벨에 기초하여 동작의 상태를 설정하는 것을 특징으로 하는 음성 인식 장치.
- 제5항에 있어서, 상기 제2 모드에서 상기 음성 신호의 상태를 신호의 상승 시간으로 하고, 이 상승 시간에 기초하여 동작의 상태를 설정하는 것을 특징으로 하는 음성 인식 장치.
- 제5항에 있어서, 상기 제2 모드에서 상기 음성 신호의 상태를 신호의 지속 시간으로 하고, 이 지속 시간에 기초하여 동작의 상태를 설정하는 것을 특징으로 하는 음성 인식 장치.
- 제5항에 있어서, 상기 제2 모드에서 상기 음성 신호의 상태를 음성의 종류로 하고, 이 음성의 종류에 기초하여 동작의 상태를 설정하는 것을 특징으로 하는 음성 인식 장치.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 음성 인식부는 상기 음성 입력 수단의 음성 신호 출력과 상기 음성 인식용 사전의 내용과의 유사 정도를 나타내는 유사도 및 그 음량 레벨을 출력하고, 이 음량 레벨을 미리 정해진 리젝트 레벨에 기초하여 평가하고, 평가 결과에 기초하여 상기 음성 인식부의 인식 결과를 리젝트하는 것을 특징으로 하는 음성 인식 장치.
- 제11항에 있어서, 상기 리젝트 레벨을 게임의 종류 또는 게임 스테이지별로 설정하는 것을 특징으로 하는 음성 인식 장치.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 음성 인식부는 상기 음성 입력 수단의 음성 신호 출력과 상기 음성 인식용 사전의 내용과의 유사 정도를 나타내는 유사도에 기초하여 인식함과 동시에, 인식 결과에 기초하여 생성된 제어 신호에 의한 게임에서의 동작의 상태를 상기 유사도에 따라 변화시키는 것을 특징으로 하는 음성 인식 장치.
- 제어용 주변 기기로서, 청구항 제1항 내지 제13항 중 어느 한 항에 기재된 음성 인식 장치를 구비하는 게임기.
- 음성 신호를 수신하는 제1 스텝,상기 음성 신호와 미리 정해진 음성 인식용 사전의 데이타를 비교함으로써 플레이어의 음성을 인식하는 제2 스텝, 및상기 제2 스텝의 인식 결과에 기초하여 게임에 관한 제어 신호를 생성하는 제3 스텝을 구비하는 음성 인식 방법.
- 제15항에 있어서, 게임기용 제어부로부터 제어 신호를 수신하는 제4 스텝을 구비하고, 상기 제3 스텝에 있어서, 상기 제2 스텝에 의한 음성의 인식 결과와 상기 제4 스텝에 의한 제어 신호를 조합하여 게임에 관한 제어 신호를 생성하는 것을 특징으로 하는 음성 인식 방법.
- 상기 음성 인식부의 음성 인식 동작을 실현하는 프로그램이 기억된 매체.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP96-182495 | 1996-07-11 | ||
JP18249596 | 1996-07-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR19990044544A true KR19990044544A (ko) | 1999-06-25 |
KR100534502B1 KR100534502B1 (ko) | 2006-11-10 |
Family
ID=16119296
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019980701792A KR100534502B1 (ko) | 1996-07-11 | 1997-07-11 | 음성인식장치,음성인식방법및이것을이용한게임기 |
Country Status (8)
Country | Link |
---|---|
US (1) | US6529875B1 (ko) |
EP (1) | EP0850673B1 (ko) |
JP (1) | JP3933698B2 (ko) |
KR (1) | KR100534502B1 (ko) |
CN (1) | CN1171650C (ko) |
DE (1) | DE69725270D1 (ko) |
TW (1) | TW356548B (ko) |
WO (1) | WO1998002223A1 (ko) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100505281B1 (ko) * | 2000-02-18 | 2005-08-04 | (주)아이콤 소프트 | 비디오게임 론칭 서버와 이를 이용한 네트워크를 통한비디오게임 시스템 및 방법 |
KR100701132B1 (ko) * | 2004-06-01 | 2007-03-29 | 캐논 가부시끼가이샤 | 정보처리장치 및 정보처리방법 |
KR100769516B1 (ko) * | 2002-09-13 | 2007-10-23 | 고나미 가부시끼가이샤 | 게임 장치, 게임 장치의 제어방법, 프로그램 분배 장치 및 정보 기억 매체 |
KR20160079367A (ko) | 2014-12-26 | 2016-07-06 | 에릭슨엘지엔터프라이즈 주식회사 | 스마트 기기의 제어 방법 및 장치 |
KR20190027564A (ko) * | 2017-09-07 | 2019-03-15 | 주식회사 엔씨소프트 | 사용자 음성 정보 기반 온라인 게임 내 유저 인터페이스 제어 방법 및 장치 |
US11580972B2 (en) * | 2019-04-26 | 2023-02-14 | Fanuc Corporation | Robot teaching device |
KR20230108599A (ko) * | 2022-01-11 | 2023-07-18 | 한국과학기술연구원 | 사용자 명령에 기초한 캐릭터 행동 생성 시스템 및 방법과 이를 위한 컴퓨터 프로그램 |
Families Citing this family (201)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3899498B2 (ja) * | 1997-11-12 | 2007-03-28 | 株式会社セガ | ゲーム機 |
JP4035652B2 (ja) * | 1998-07-02 | 2008-01-23 | 株式会社セガ | ゲームを実行する方法及び、これを実施するゲーム装置 |
US20060058848A1 (en) * | 1998-11-20 | 2006-03-16 | Medtronic Emergency Response Systems, Inc. | AED with user inputs in response to prompts |
WO2000030712A1 (en) * | 1998-11-20 | 2000-06-02 | Medtronic Physio-Control Manufacturing Corp. | Visual and aural user interface for an automated external defibrillator |
US7168086B1 (en) * | 1998-11-30 | 2007-01-23 | Microsoft Corporation | Proxy for video on demand server control |
US6804825B1 (en) * | 1998-11-30 | 2004-10-12 | Microsoft Corporation | Video on demand methods and systems |
JP4513143B2 (ja) * | 1999-07-16 | 2010-07-28 | 株式会社セガ | 映像表示システム |
JP2001195593A (ja) | 1999-10-22 | 2001-07-19 | Sony Computer Entertainment Inc | エンタテインメントシステム、エンタテインメント装置、記録媒体及びプログラム |
KR20010073718A (ko) * | 2000-01-19 | 2001-08-01 | 정우협 | 네트워크게임의 음성인식 동작(조절작동)방법 |
KR20010073719A (ko) * | 2000-01-19 | 2001-08-01 | 정우협 | 머드게임의 음성인식 동작(조절작동)방법 |
US7240093B1 (en) * | 2000-02-29 | 2007-07-03 | Microsoft Corporation | Use of online messaging to facilitate selection of participants in game play |
WO2002009093A1 (en) * | 2000-07-20 | 2002-01-31 | Koninklijke Philips Electronics N.V. | Feedback of recognized command confidence level |
JP3419754B2 (ja) * | 2000-10-30 | 2003-06-23 | 株式会社ソニー・コンピュータエンタテインメント | 入力音声をキャラクタの動作に反映させるエンタテインメント装置、方法および記憶媒体 |
JP2002177642A (ja) * | 2000-12-12 | 2002-06-25 | Taito Corp | 麻雀ゲームにおける音声やり取り方式 |
JP2002248261A (ja) * | 2000-12-22 | 2002-09-03 | Sony Computer Entertainment Inc | オブジェクト表示プログラム、オブジェクト表示プログラムを記憶したコンピュータ読み取り可能な記憶媒体、オブジェクト表示プログラムを実行するプログラム実行装置、キャラクタ戦闘表示プログラム、キャラクタ戦闘表示プログラムを記憶したコンピュータ読み取り可能な記憶媒体、キャラクタ戦闘表示プログラムを実行するプログラム実行装置 |
JP2002282538A (ja) | 2001-01-19 | 2002-10-02 | Sony Computer Entertainment Inc | 音声制御プログラム、音声制御プログラムを記録したコンピュータ読み取り可能な記憶媒体、音声制御プログラムを実行するプログラム実行装置、音声制御装置及び音声制御方法 |
US7085722B2 (en) * | 2001-05-14 | 2006-08-01 | Sony Computer Entertainment America Inc. | System and method for menu-driven voice control of characters in a game environment |
KR100762588B1 (ko) * | 2001-06-26 | 2007-10-01 | 엘지전자 주식회사 | 화자적응과 오입력 거절을 결합한 음성인식 방법 |
US7452273B2 (en) | 2001-12-12 | 2008-11-18 | Cantor Index, Llc | Method and apparatus for providing advice regarding gaming strategies |
US8734226B2 (en) | 2001-12-12 | 2014-05-27 | Bgc Partners, Inc. | Systems and methods for assisting in game play and wagering |
NZ520069A (en) * | 2002-07-09 | 2004-04-30 | Canterbury Distr Health Board | Symbols-scanning test and symbols-and-tracking dual-task test |
US20040116969A1 (en) | 2002-08-26 | 2004-06-17 | Owen James M. | Pulse detection using patient physiological signals |
US7133831B2 (en) | 2002-10-23 | 2006-11-07 | International Business Machines Corporation | System and method for processing personal telephony recorder commands |
US7003286B2 (en) * | 2002-10-23 | 2006-02-21 | International Business Machines Corporation | System and method for conference call line drop recovery |
US20040203621A1 (en) * | 2002-10-23 | 2004-10-14 | International Business Machines Corporation | System and method for queuing and bookmarking tekephony conversations |
US7191129B2 (en) * | 2002-10-23 | 2007-03-13 | International Business Machines Corporation | System and method for data mining of contextual conversations |
US7391763B2 (en) * | 2002-10-23 | 2008-06-24 | International Business Machines Corporation | Providing telephony services using proxies |
US6993120B2 (en) * | 2002-10-23 | 2006-01-31 | International Business Machines Corporation | System and method for copying and transmitting telephony conversations |
US7065198B2 (en) * | 2002-10-23 | 2006-06-20 | International Business Machines Corporation | System and method for volume control management in a personal telephony recorder |
US7371175B2 (en) | 2003-01-13 | 2008-05-13 | At&T Corp. | Method and system for enhanced audio communications in an interactive environment |
US20040254794A1 (en) * | 2003-05-08 | 2004-12-16 | Carl Padula | Interactive eyes-free and hands-free device |
US7303474B2 (en) * | 2003-06-24 | 2007-12-04 | At&T Bls Intellectual Property, Inc. | Methods and systems for establishing games with automation using verbal communication |
US20050009604A1 (en) * | 2003-07-11 | 2005-01-13 | Hsien-Ta Huang | Monotone voice activation device |
EP1498163A1 (en) * | 2003-07-16 | 2005-01-19 | Hsien-Ta Huang | Device for game control using voice recognition |
JP4206015B2 (ja) | 2003-09-12 | 2009-01-07 | 任天堂株式会社 | ゲーム機用操作装置 |
JP4206332B2 (ja) | 2003-09-12 | 2009-01-07 | 株式会社バンダイナムコゲームス | 入力装置、ゲームシステム、プログラムおよび情報記憶媒体 |
US8133115B2 (en) | 2003-10-22 | 2012-03-13 | Sony Computer Entertainment America Llc | System and method for recording and displaying a graphical path in a video game |
US20050169252A1 (en) * | 2004-02-03 | 2005-08-04 | Andrew Riggs | Game controller including an integrated communicator |
FR2869436B1 (fr) * | 2004-04-27 | 2006-07-14 | Xkapad Sa | Systeme informatique comprenant une pluralite d'accessoires de commande, notamment pour les jeux video |
WO2006019987A2 (en) * | 2004-07-15 | 2006-02-23 | Mad Doc Software, Llc | Audio visual games and computer programs embodying interactive speech recognition and methods related thereto |
US20060046845A1 (en) * | 2004-08-26 | 2006-03-02 | Alexandre Armand | Device for the acoustic control of a game system and application |
US20060071933A1 (en) | 2004-10-06 | 2006-04-06 | Sony Computer Entertainment Inc. | Application binary interface for multi-pass shaders |
US20060095257A1 (en) * | 2004-11-03 | 2006-05-04 | Yuan-Horng Tsai | Method of generating program parameters according to decibel levels of voice signals |
JP3734823B1 (ja) * | 2005-01-26 | 2006-01-11 | 任天堂株式会社 | ゲームプログラムおよびゲーム装置 |
JP4406615B2 (ja) * | 2005-02-23 | 2010-02-03 | 任天堂株式会社 | コマンド処理装置およびコマンド処理プログラム |
US7925022B2 (en) | 2005-05-23 | 2011-04-12 | The Invention Science Fund I, Llc | Device pairing via device to device contact |
US8699944B2 (en) * | 2005-06-10 | 2014-04-15 | The Invention Science Fund I, Llc | Device pairing using device generated sound |
US7865140B2 (en) | 2005-06-14 | 2011-01-04 | The Invention Science Fund I, Llc | Device pairing via intermediary device |
US9743266B2 (en) | 2005-05-23 | 2017-08-22 | Invention Science Fund I, Llc | Device pairing via device to device contact |
US7636126B2 (en) * | 2005-06-22 | 2009-12-22 | Sony Computer Entertainment Inc. | Delay matching in audio/video systems |
US20070055528A1 (en) * | 2005-08-30 | 2007-03-08 | Dmitry Malyshev | Teaching aid and voice game system |
US7965859B2 (en) | 2006-05-04 | 2011-06-21 | Sony Computer Entertainment Inc. | Lighting control of a user environment via a display device |
US7880746B2 (en) * | 2006-05-04 | 2011-02-01 | Sony Computer Entertainment Inc. | Bandwidth management through lighting control of a user environment via a display device |
US8279171B2 (en) * | 2006-07-06 | 2012-10-02 | Panasonic Corporation | Voice input device |
US7706499B2 (en) * | 2006-08-30 | 2010-04-27 | General Electric Company | Acquisition and reconstruction of projection data using a stationary CT geometry |
JP5088050B2 (ja) * | 2007-08-29 | 2012-12-05 | ヤマハ株式会社 | 音声処理装置およびプログラム |
US9126116B2 (en) | 2007-09-05 | 2015-09-08 | Sony Computer Entertainment America Llc | Ranking of user-generated game play advice |
US9108108B2 (en) | 2007-09-05 | 2015-08-18 | Sony Computer Entertainment America Llc | Real-time, contextual display of ranked, user-generated game play advice |
US20090098920A1 (en) * | 2007-10-10 | 2009-04-16 | Waterleaf Limited | Method and System for Auditing and Verifying User Spoken Instructions for an Electronic Casino Game |
CN101648077A (zh) * | 2008-08-11 | 2010-02-17 | 巍世科技有限公司 | 语音指令游戏控制装置及其方法 |
EP2154678A1 (en) * | 2008-08-13 | 2010-02-17 | Weistech Technology Co., Ltd. | Voice command game controlling apparatus and method of the same |
US20100041479A1 (en) * | 2008-08-15 | 2010-02-18 | Wei Hsu | Voice command game controlling apparatus and method of the same |
GB2463121A (en) * | 2008-09-09 | 2010-03-10 | Skype Ltd | Communications system with game playing facility |
CN101377797A (zh) * | 2008-09-28 | 2009-03-04 | 腾讯科技(深圳)有限公司 | 一种应用语音控制游戏系统的方法和游戏系统 |
FR2940497B1 (fr) * | 2008-12-23 | 2011-06-24 | Voxler | Procede de pilotage d'une application a partir d'un signal de voix et dispositif associe pour sa mise en oeuvre. |
JP5399966B2 (ja) * | 2010-03-30 | 2014-01-29 | 株式会社コナミデジタルエンタテインメント | ゲーム装置、ゲーム装置の制御方法、及びプログラム |
US10786736B2 (en) | 2010-05-11 | 2020-09-29 | Sony Interactive Entertainment LLC | Placement of user information in a game space |
US8384770B2 (en) | 2010-06-02 | 2013-02-26 | Nintendo Co., Ltd. | Image display system, image display apparatus, and image display method |
EP2395767B1 (en) | 2010-06-11 | 2014-11-12 | Nintendo Co., Ltd. | Image display program, image display system, and image display method |
CN101961553B (zh) * | 2010-08-23 | 2013-06-05 | 福建捷联电子有限公司 | 一种用于发泄情绪的装置 |
JP2012050791A (ja) * | 2010-09-03 | 2012-03-15 | Konami Digital Entertainment Co Ltd | キャラクター表示装置、キャラクター表示方法、ならびに、プログラム |
JP5739674B2 (ja) | 2010-09-27 | 2015-06-24 | 任天堂株式会社 | 情報処理プログラム、情報処理装置、情報処理システム、および、情報処理方法 |
US8854356B2 (en) * | 2010-09-28 | 2014-10-07 | Nintendo Co., Ltd. | Storage medium having stored therein image processing program, image processing apparatus, image processing system, and image processing method |
US8775190B2 (en) * | 2011-02-04 | 2014-07-08 | Ryohei Tanaka | Voice-operated control circuit and method for using same |
US9317729B2 (en) | 2011-02-09 | 2016-04-19 | West Affum Holdings Corp. | RFID-based sensing of changed condition |
US9237858B2 (en) | 2011-02-09 | 2016-01-19 | West Affum Holdings Corp. | Detecting loss of full skin contact in patient electrodes |
CN102671383A (zh) * | 2011-03-08 | 2012-09-19 | 德信互动科技(北京)有限公司 | 基于声控的游戏实现装置和方法 |
US9342817B2 (en) | 2011-07-07 | 2016-05-17 | Sony Interactive Entertainment LLC | Auto-creating groups for sharing photos |
US9132354B2 (en) * | 2011-12-22 | 2015-09-15 | Microsoft Technology Licensing, Llc | Game having a plurality of engines |
KR20130133629A (ko) | 2012-05-29 | 2013-12-09 | 삼성전자주식회사 | 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 |
CN102799408A (zh) * | 2012-07-09 | 2012-11-28 | 上海斐讯数据通信技术有限公司 | 具有声控解锁功能的移动终端及移动终端声控解锁的方法 |
US8838235B2 (en) | 2012-08-10 | 2014-09-16 | Physio-Control. Inc. | Wearable defibrillator system communicating via mobile communication device |
US10155110B2 (en) | 2012-08-10 | 2018-12-18 | West Affum Holdings Corp. | Controlling functions of wearable cardiac defibrillation system |
US9155903B2 (en) | 2012-09-24 | 2015-10-13 | West Affum Holdings Corp. | Wearable cardiac defibrillator receiving inputs by being deliberately tapped and methods |
US9087402B2 (en) | 2013-03-13 | 2015-07-21 | Microsoft Technology Licensing, Llc | Augmenting images with higher resolution data |
US9604070B2 (en) | 2012-10-10 | 2017-03-28 | West Affum Holdings Corp. | External defibrillation with automatic post-shock anti-tachycardia (APSAT) pacing |
US9833707B2 (en) | 2012-10-29 | 2017-12-05 | Sony Interactive Entertainment Inc. | Ambient light control and calibration via a console |
US8918406B2 (en) | 2012-12-14 | 2014-12-23 | Second Wind Consulting Llc | Intelligent analysis queue construction |
US9345898B2 (en) | 2013-01-23 | 2016-05-24 | West Affum Holdings Corp. | Wearable cardiac defibrillator system controlling conductive fluid deployment |
US9895548B2 (en) | 2013-01-23 | 2018-02-20 | West Affum Holdings Corp. | Wearable cardiac defibrillator (WCD) system controlling conductive fluid deployment per impedance settling at terminal value |
TWI469814B (zh) * | 2013-02-07 | 2015-01-21 | Univ Southern Taiwan Sci & Tec | Voice - based and brain waves, supplemented by the role of video game control system Methods and methods |
US9757579B2 (en) | 2013-02-25 | 2017-09-12 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system informing patient that it is validating just-detected cardiac arrhythmia |
US12097379B2 (en) | 2013-02-25 | 2024-09-24 | West Affum Holdings Dac | Wearable cardioverter defibrillator (WCD) system making shock/no shock determinations from multiple patient parameters |
US20150328472A1 (en) | 2014-05-13 | 2015-11-19 | Physio-Control, Inc. | Wearable cardioverter defibrillator components discarding ecg signals prior to making shock/no shock determination |
US9592403B2 (en) | 2013-02-25 | 2017-03-14 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system making shock/no shock determinations from multiple patient parameters |
US10500403B2 (en) | 2013-02-25 | 2019-12-10 | West Affum Holdings Corp. | WCD system validating detected cardiac arrhythmias thoroughly so as to not sound loudly due to some quickly self-terminating cardiac arrhythmias |
US10543377B2 (en) | 2013-02-25 | 2020-01-28 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system making shock/no shock determinations by aggregating aspects of patient parameters |
US9827431B2 (en) | 2013-04-02 | 2017-11-28 | West Affum Holdings Corp. | Wearable defibrillator with no long-term ECG monitoring |
US10016613B2 (en) | 2013-04-02 | 2018-07-10 | West Affum Holdings Corp. | Wearable cardiac defibrillator system long-term monitoring alternating patient parameters other than ECG |
CN103458287A (zh) * | 2013-09-02 | 2013-12-18 | 四川长虹电器股份有限公司 | 基于数字电视遥控技术实现对游戏语音控制的系统及方法 |
KR102274317B1 (ko) | 2013-10-08 | 2021-07-07 | 삼성전자주식회사 | 디바이스 정보에 기초하여 음성 인식을 수행하는 방법 및 장치 |
US9757576B2 (en) | 2014-03-18 | 2017-09-12 | West Affum Holdings Corp. | Reliable readiness indication for a wearable defibrillator |
US9352166B2 (en) | 2014-03-19 | 2016-05-31 | West Affum Holdings Corp. | Wearable cardiac defibrillator system sounding to bystanders in patient's own voice |
US9393437B2 (en) | 2014-04-02 | 2016-07-19 | West Affum Holdings Corp. | Pressure resistant conductive fluid containment |
US9402988B2 (en) | 2014-05-06 | 2016-08-02 | West Affum Holdings Corp. | Wearable medical system with stretch-cable assembly |
US10449370B2 (en) | 2014-05-13 | 2019-10-22 | West Affum Holdings Corp. | Network-accessible data about patient with wearable cardiac defibrillator system |
CN105204749A (zh) * | 2014-06-18 | 2015-12-30 | 腾讯科技(深圳)有限公司 | 一种应用的操控方法及终端设备 |
USD764670S1 (en) | 2014-12-22 | 2016-08-23 | West Affum Holdings Corp. | Portable defibrillator |
CN104219382B (zh) * | 2014-08-18 | 2016-09-14 | 上海卓易科技股份有限公司 | 一种解锁控制处理方法、终端及系统 |
US9833607B2 (en) | 2014-10-30 | 2017-12-05 | West Affum Holdings Corp. | Wearable cardiac defibrillation system with flexible electrodes |
US11540762B2 (en) | 2014-10-30 | 2023-01-03 | West Affum Holdings Dac | Wearable cardioverter defibrtillator with improved ECG electrodes |
US9901741B2 (en) | 2015-05-11 | 2018-02-27 | Physio-Control, Inc. | Wearable cardioverter defibrillator (WCD) system using sensor modules with reassurance code for confirmation before shock |
US10293260B1 (en) * | 2015-06-05 | 2019-05-21 | Amazon Technologies, Inc. | Player audio analysis in online gaming environments |
US10105547B2 (en) | 2015-11-02 | 2018-10-23 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) causing patient's QRS width to be plotted against the heart rate |
CN105405273A (zh) * | 2015-11-30 | 2016-03-16 | 无锡觅睿恪科技有限公司 | 无人机用声控遥控器 |
US10179246B2 (en) | 2015-12-04 | 2019-01-15 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system using security NFC tag for uploading configuration data |
US10322291B2 (en) | 2015-12-04 | 2019-06-18 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system with isolated patient parameter component |
EP3182737B1 (en) * | 2015-12-15 | 2017-11-29 | Axis AB | Method, stationary device, and system for determining a position |
CN106056989B (zh) * | 2016-06-23 | 2018-10-16 | 广东小天才科技有限公司 | 一种语言学习方法及装置、终端设备 |
US11077310B1 (en) | 2016-10-04 | 2021-08-03 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system detecting QRS complexes in ECG signal by matched difference filter |
US10940323B2 (en) | 2016-10-04 | 2021-03-09 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) with power-saving function |
EP3312832A1 (en) * | 2016-10-19 | 2018-04-25 | Mastercard International Incorporated | Voice catergorisation |
US11052241B2 (en) | 2016-11-03 | 2021-07-06 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system measuring patient's respiration |
CN106599110A (zh) * | 2016-11-29 | 2017-04-26 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音搜索方法及装置 |
JP6877995B2 (ja) | 2016-12-27 | 2021-05-26 | 任天堂株式会社 | 振動制御システム、振動制御装置、振動制御プログラムおよび振動制御方法 |
US11938333B2 (en) | 2017-01-05 | 2024-03-26 | West Affum Holdings Dac | Detecting walking in a wearable cardioverter defibrillator system |
US11083906B2 (en) | 2017-01-05 | 2021-08-10 | West Affum Holdings Corp. | Wearable cardioverter defibrillator having adjustable alarm time |
US11154230B2 (en) | 2017-01-05 | 2021-10-26 | West Affum Holdings Corp. | Wearable cardioverter defibrillator having reduced noise prompts |
US11400303B2 (en) | 2018-01-05 | 2022-08-02 | West Affum Holdings Corp. | Detecting walking in a wearable cardioverter defibrillator system |
US10926080B2 (en) | 2017-01-07 | 2021-02-23 | West Affum Holdings Corp. | Wearable cardioverter defibrillator with breast support |
US10967193B2 (en) | 2017-02-03 | 2021-04-06 | West Affum Holdings Corp. | WCD with pacing analgesia |
US11235143B2 (en) | 2017-02-03 | 2022-02-01 | West Affum Holdings Corp. | Wearable cardiac defibrillator systems and methods and software for contacting non-witnessing responders |
JP6594920B2 (ja) | 2017-03-01 | 2019-10-23 | 任天堂株式会社 | ゲームシステム、ゲーム装置、ゲームプログラム、およびゲーム処理方法 |
US10960220B2 (en) | 2017-03-16 | 2021-03-30 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system evaluating its ECG signals for noise according to tall peak counts |
US10589109B2 (en) | 2017-04-10 | 2020-03-17 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system computing patient heart rate by multiplying ECG signals from different channels |
US10940324B2 (en) | 2017-05-03 | 2021-03-09 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system computing heart rate from noisy ECG signal |
US10561942B2 (en) | 2017-05-15 | 2020-02-18 | Sony Interactive Entertainment America Llc | Metronome for competitive gaming headset |
US10946207B2 (en) | 2017-05-27 | 2021-03-16 | West Affum Holdings Corp. | Defibrillation waveforms for a wearable cardiac defibrillator |
CN107360440B (zh) * | 2017-06-16 | 2020-08-21 | 北京米可世界科技有限公司 | 基于直播流中引入游戏进程的深度交互系统及交互方法 |
US10283117B2 (en) * | 2017-06-19 | 2019-05-07 | Lenovo (Singapore) Pte. Ltd. | Systems and methods for identification of response cue at peripheral device |
US11364387B2 (en) | 2017-07-28 | 2022-06-21 | West Affum Holdings Corp. | Heart rate calculator with reduced overcounting |
US11103717B2 (en) | 2017-07-28 | 2021-08-31 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system reacting to high-frequency ECG noise |
US10918879B2 (en) | 2017-07-28 | 2021-02-16 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system reacting to high-amplitude ECG noise |
US10737104B2 (en) | 2017-07-28 | 2020-08-11 | West Affum Holdings Corp. | WCD system outputting human-visible indication and proximate programming device with screen reproducing the human-visible indication in real time |
US10128914B1 (en) | 2017-09-06 | 2018-11-13 | Sony Interactive Entertainment LLC | Smart tags with multiple interactions |
US11207538B2 (en) | 2017-09-12 | 2021-12-28 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system warning ambulatory patient by weak alerting shock |
US11844954B2 (en) | 2017-11-09 | 2023-12-19 | West Affum Holdings Dac | WCD monitor supporting serviceability and reprocessing |
US11260237B1 (en) | 2017-11-09 | 2022-03-01 | West Affum Holdings Corp. | Wearable defibrillator with output stage having diverting resistance |
US11065463B2 (en) | 2017-11-10 | 2021-07-20 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system having WCD mode and also AED mode |
US11058885B2 (en) | 2017-11-29 | 2021-07-13 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system detecting ventricular tachycardia and/or ventricular fibrillation using variable heart rate decision threshold |
US11278730B2 (en) | 2017-12-04 | 2022-03-22 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system making shock/no shock determinations from patient's rotational motion |
US11471693B1 (en) | 2018-02-14 | 2022-10-18 | West Affum Holdings Dac | Wearable cardioverter defibrillator (WCD) system choosing to consider ECG signals from different channels per QRS complex widths of the ECG signals |
US11865354B1 (en) | 2018-02-14 | 2024-01-09 | West Affum Holdings Dac | Methods and systems for distinguishing VT from VF |
US11160990B1 (en) | 2018-02-14 | 2021-11-02 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) alarms |
US11724116B2 (en) | 2018-02-15 | 2023-08-15 | West Affum Holdings Dac | Wearable cardioverter defibrillator latching connector |
US20190247671A1 (en) | 2018-02-15 | 2019-08-15 | West Affum Holdings Corp. | Wearable cardioverter defibrillator latching connector |
US11040214B2 (en) | 2018-03-01 | 2021-06-22 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system having main UI that conveys message and peripheral device that amplifies the message |
US11000691B2 (en) | 2018-04-24 | 2021-05-11 | West Affum Holdings Corp. | Substantially-median-based determination of long-term heart rates from ECG data of wearable cardioverter defibrillator (WCD) system |
US11298556B2 (en) | 2018-04-25 | 2022-04-12 | West Affum Holdings Corp. | WCD user interface response to a change in device orientation |
US11331508B1 (en) | 2018-04-25 | 2022-05-17 | West Affum Holdings Corp. | Wearable cardioverter defibrillator with a non-invasive blood pressure monitor |
US11260238B2 (en) | 2018-04-26 | 2022-03-01 | West Affum Holdings Corp. | Wearable medical device (WMD) implementing adaptive techniques to save power |
US11324960B2 (en) | 2018-04-26 | 2022-05-10 | West Affum Holdings Corp. | Permission-based control of interfacing components with a medical device |
US11198015B2 (en) | 2018-04-26 | 2021-12-14 | West Affum Holdings Corp. | Multi-sensory alarm for a wearable cardiac defibrillator |
US11058884B2 (en) | 2018-04-26 | 2021-07-13 | West Affum Holding Corp | Wearable medical (WM) system monitoring ECG signal of ambulatory patient for heart condition |
US11534615B2 (en) | 2018-04-26 | 2022-12-27 | West Affum Holdings Dac | Wearable Cardioverter Defibrillator (WCD) system logging events and broadcasting state changes and system status information to external clients |
US11698927B2 (en) | 2018-05-16 | 2023-07-11 | Sony Interactive Entertainment LLC | Contextual digital media processing systems and methods |
JP6953354B2 (ja) * | 2018-05-24 | 2021-10-27 | グリー株式会社 | ゲーム処理プログラム、ゲーム処理方法、および、ゲーム処理装置 |
US11833360B2 (en) | 2018-05-29 | 2023-12-05 | West Affum Holdings Dac | Carry pack for a wearable cardioverter defibrillator |
US11804222B2 (en) * | 2018-07-19 | 2023-10-31 | Black & Decker Inc. | System and method for controlling jobsite products |
US11247041B2 (en) | 2018-08-10 | 2022-02-15 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) with ECG preamp having active input capacitance balancing |
CN110838211A (zh) * | 2018-08-14 | 2020-02-25 | 阿里巴巴集团控股有限公司 | 语音抢答方法、装置和系统 |
JP7116398B2 (ja) | 2018-09-11 | 2022-08-10 | 国立研究開発法人農業・食品産業技術総合研究機構 | 落花生の脱莢機構および自走式拾い上げ脱莢機 |
KR101935585B1 (ko) * | 2018-10-02 | 2019-04-05 | 넷마블 주식회사 | 게임 커맨드 인식 방법 및 장치 |
CN109324561A (zh) * | 2018-11-29 | 2019-02-12 | 奥克斯空调股份有限公司 | 厨房电器的监控方法、监控系统及厨房系统 |
US11334826B2 (en) | 2019-01-18 | 2022-05-17 | West Affum Holdings Corp. | WCD system prioritization of alerts based on severity and/or required timeliness of user response |
US11191971B2 (en) | 2019-03-07 | 2021-12-07 | West Affum Holdings Corp. | Wearable cardioverter defibrillator (WCD) system with active ECG cable shielding |
US11063378B2 (en) | 2019-03-07 | 2021-07-13 | West Affum Holdings Corp. | Printed circuit board cable clip for signal sensitive applications |
US12121329B2 (en) | 2019-03-08 | 2024-10-22 | West Affum Holdings Dac | Wearable vital signs monitor with selective signal acquisition |
CN110099333B (zh) * | 2019-05-24 | 2021-08-10 | 北京字节跳动网络技术有限公司 | 音频信号的处理方法、装置、终端及存储介质 |
US11672996B2 (en) | 2019-06-24 | 2023-06-13 | West Affum Holdings Dac | Wearable cardioverter defibrillator with AI-based features |
US11793440B2 (en) | 2019-08-09 | 2023-10-24 | West Affum Holdings Dac | Method to detect noise in a wearable cardioverter defibrillator |
US10957453B2 (en) | 2019-08-15 | 2021-03-23 | West Affum Holdings Corp. | WCD system alert issuance and resolution |
US11484271B2 (en) | 2019-08-20 | 2022-11-01 | West Affum Holdings Dac | Alert presentation based on ancillary device conditions |
US11730418B2 (en) | 2019-08-22 | 2023-08-22 | West Affum Holdings Dac | Cardiac monitoring system with supraventricular tachycardia (SVT) classifications |
US11771360B2 (en) | 2019-08-22 | 2023-10-03 | West Affum Holdings Dac | Cardiac monitoring system with normally conducted QRS complex identification |
US11344718B2 (en) | 2019-12-12 | 2022-05-31 | West Affum Holdings Corp. | Multichannel posture dependent template based rhythm discrimination in a wearable cardioverter defibrillator |
US11717687B2 (en) | 2020-01-06 | 2023-08-08 | West Affum Holdings Dac | Asystole and complete heart block detection |
US11904176B1 (en) | 2020-01-27 | 2024-02-20 | West Affum Holdings Dac | Wearable defibrillator system forwarding patient information based on recipient profile and/or event type |
US11679253B2 (en) | 2020-02-16 | 2023-06-20 | West Affum Holdings Dac | Wearable medical device with integrated blood oxygen saturation level device |
US11819704B2 (en) | 2020-08-21 | 2023-11-21 | West Affum Holdings Dac | Positive system alerts |
US11819703B2 (en) | 2020-09-17 | 2023-11-21 | West Affum Holdings Dac | Electrocardiogram (ECG) electrode with deposited ink resistive element |
US12121737B2 (en) | 2020-09-23 | 2024-10-22 | West Affum Holdings Dac | Wearable cardioverter defibrillator system with remote alerts based on proximity |
US11974855B2 (en) | 2020-11-04 | 2024-05-07 | West Affum Holdings Dac | Method for detecting noise levels in ECG signals using a channel consistency threshold |
US12036416B2 (en) | 2020-11-09 | 2024-07-16 | West Affum Holdings Dac | Wearable cardioverter defibrillator (WCD) system with wireless battery charging |
US11698385B2 (en) | 2020-11-11 | 2023-07-11 | West Affum Holdings Dac | Walking intensity detection and trending in a wearable cardioverter defibrillator |
US11793469B2 (en) | 2020-11-17 | 2023-10-24 | West Affum Holdings Dac | Identifying reliable vectors |
US11950174B2 (en) | 2020-12-02 | 2024-04-02 | West Affum Holdings Dac | Detailed alarm messages and support |
US11730968B2 (en) | 2020-12-14 | 2023-08-22 | West Affum Holdings Dac | Wearable medical device with temperature managed electrodes |
US11712573B2 (en) | 2020-12-16 | 2023-08-01 | West Affum Holdings Dac | Managing alerts in a WCD system |
US12127860B2 (en) | 2021-01-21 | 2024-10-29 | West Affum Holdings Dac | Wearable device network system |
CN114931747B (zh) * | 2022-07-25 | 2022-10-14 | 深圳市景创科技电子股份有限公司 | 一种游戏控制器和智能语音控制方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4569026A (en) * | 1979-02-05 | 1986-02-04 | Best Robert M | TV Movies that talk back |
US4357488A (en) * | 1980-01-04 | 1982-11-02 | California R & D Center | Voice discriminating system |
US4704696A (en) * | 1984-01-26 | 1987-11-03 | Texas Instruments Incorporated | Method and apparatus for voice control of a computer |
DE3819178A1 (de) * | 1987-06-04 | 1988-12-22 | Ricoh Kk | Spracherkennungsverfahren und -einrichtung |
JP2804265B2 (ja) * | 1987-07-17 | 1998-09-24 | 株式会社リコー | 音声認識方式 |
JPH0751433B2 (ja) | 1988-06-30 | 1995-06-05 | 株式会社日立ビルシステムサービス | 併設エレベータの改造工法 |
JPH0213587U (ko) * | 1988-07-08 | 1990-01-29 | ||
US5149104A (en) * | 1991-02-06 | 1992-09-22 | Elissa Edelstein | Video game having audio player interation with real time video synchronization |
JPH04276280A (ja) * | 1991-03-04 | 1992-10-01 | Sony Corp | 音声信号の処理装置 |
JP3179626B2 (ja) * | 1993-05-07 | 2001-06-25 | 株式会社リコー | 音声ゲーム機 |
JPH07175567A (ja) * | 1993-12-17 | 1995-07-14 | Nippon Steel Corp | 入力装置 |
JP3407382B2 (ja) * | 1994-02-16 | 2003-05-19 | 株式会社セガ | 入出力装置 |
WO1995031264A1 (en) * | 1994-05-16 | 1995-11-23 | Lazer-Tron Corporation | Speech enhanced game apparatus and method therefor |
GB9416463D0 (en) * | 1994-08-15 | 1994-10-05 | Farrington Jonathan S | Sound control device |
US5583965A (en) * | 1994-09-12 | 1996-12-10 | Sony Corporation | Methods and apparatus for training and operating voice recognition systems |
JPH08123448A (ja) * | 1994-10-18 | 1996-05-17 | Sega Enterp Ltd | 音声信号の波形解析を用いた画像処理装置 |
US5842168A (en) * | 1995-08-21 | 1998-11-24 | Seiko Epson Corporation | Cartridge-based, interactive speech recognition device with response-creation capability |
US5893064A (en) * | 1997-05-14 | 1999-04-06 | K2 Interactive Llc | Speech recognition method and apparatus with voice commands and associated keystrokes |
US6038534A (en) * | 1997-09-11 | 2000-03-14 | Cowboy Software, Inc. | Mimicking voice commands as keyboard signals |
US6175820B1 (en) * | 1999-01-28 | 2001-01-16 | International Business Machines Corporation | Capture and application of sender voice dynamics to enhance communication in a speech-to-text environment |
-
1997
- 1997-07-11 CN CNB971908834A patent/CN1171650C/zh not_active Expired - Fee Related
- 1997-07-11 WO PCT/JP1997/002421 patent/WO1998002223A1/ja active IP Right Grant
- 1997-07-11 KR KR1019980701792A patent/KR100534502B1/ko not_active IP Right Cessation
- 1997-07-11 EP EP97930773A patent/EP0850673B1/en not_active Expired - Lifetime
- 1997-07-11 US US09/029,561 patent/US6529875B1/en not_active Expired - Lifetime
- 1997-07-11 JP JP50399598A patent/JP3933698B2/ja not_active Expired - Fee Related
- 1997-07-11 DE DE69725270T patent/DE69725270D1/de not_active Expired - Lifetime
- 1997-07-11 TW TW086109880A patent/TW356548B/zh not_active IP Right Cessation
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100505281B1 (ko) * | 2000-02-18 | 2005-08-04 | (주)아이콤 소프트 | 비디오게임 론칭 서버와 이를 이용한 네트워크를 통한비디오게임 시스템 및 방법 |
KR100769516B1 (ko) * | 2002-09-13 | 2007-10-23 | 고나미 가부시끼가이샤 | 게임 장치, 게임 장치의 제어방법, 프로그램 분배 장치 및 정보 기억 매체 |
KR100701132B1 (ko) * | 2004-06-01 | 2007-03-29 | 캐논 가부시끼가이샤 | 정보처리장치 및 정보처리방법 |
KR20160079367A (ko) | 2014-12-26 | 2016-07-06 | 에릭슨엘지엔터프라이즈 주식회사 | 스마트 기기의 제어 방법 및 장치 |
KR20190027564A (ko) * | 2017-09-07 | 2019-03-15 | 주식회사 엔씨소프트 | 사용자 음성 정보 기반 온라인 게임 내 유저 인터페이스 제어 방법 및 장치 |
US11580972B2 (en) * | 2019-04-26 | 2023-02-14 | Fanuc Corporation | Robot teaching device |
KR20230108599A (ko) * | 2022-01-11 | 2023-07-18 | 한국과학기술연구원 | 사용자 명령에 기초한 캐릭터 행동 생성 시스템 및 방법과 이를 위한 컴퓨터 프로그램 |
Also Published As
Publication number | Publication date |
---|---|
CN1171650C (zh) | 2004-10-20 |
EP0850673B1 (en) | 2003-10-01 |
WO1998002223A1 (fr) | 1998-01-22 |
TW356548B (en) | 1999-04-21 |
CN1197404A (zh) | 1998-10-28 |
EP0850673A4 (en) | 2000-02-23 |
KR100534502B1 (ko) | 2006-11-10 |
EP0850673A1 (en) | 1998-07-01 |
US6529875B1 (en) | 2003-03-04 |
JP3933698B2 (ja) | 2007-06-20 |
DE69725270D1 (de) | 2003-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100534502B1 (ko) | 음성인식장치,음성인식방법및이것을이용한게임기 | |
US7785197B2 (en) | Voice-to-text chat conversion for remote video game play | |
AU730470B2 (en) | Competitive video game apparatus, method of playing video game, and computer-readable recording medium | |
US6705945B2 (en) | Providing game information via characters in a game environment | |
US7147562B2 (en) | Input character processing method | |
EP1262955B1 (en) | System and method for menu-driven voice contol of characters in a game environment | |
US6538666B1 (en) | Image processing device using speech recognition to control a displayed object | |
EP1078661A1 (en) | Image processing device, electronic playing device, and storage medium for tv game machine | |
CN101410158A (zh) | 游戏装置、游戏处理方法、信息存储媒介以及程序 | |
JP2002351489A (ja) | ゲーム情報、情報記憶媒体、及びゲーム装置 | |
JP7564453B2 (ja) | コンピュータシステム | |
US11975268B2 (en) | User input method and apparatus | |
KR100630801B1 (ko) | 음성채팅 및 음성제어가 가능한 아케이드 게임 시스템 및그 제어방법 | |
US6973430B2 (en) | Method for outputting voice of object and device used therefor | |
CN107729983A (zh) | 一种利用机器视觉实现人机对弈的方法、装置及电子设备 | |
JP4993592B2 (ja) | ゲーム装置、ゲームの進行方法、およびゲーム進行プログラム | |
JP2000084253A (ja) | ゲーム装置及び情報記憶媒体 | |
JP2003135845A (ja) | ゲームプログラム及びこれを記憶した記憶媒体 | |
GB2621873A (en) | Content display system and method | |
JPH1147444A (ja) | 通信型ゲーム装置 | |
JP3996174B2 (ja) | ゲーム装置、ゲームの進行方法、およびゲーム進行プログラム | |
JPS59228880A (ja) | 音声認識ゲ−ム装置 | |
JP4812923B2 (ja) | 音声認識遊技装置、音声認識率処理方法及び記録媒体 | |
JP2003053028A (ja) | 音声入力を用いて表示画面上のキャラクタを動作させるプログラム及びこれを記憶した外部記憶媒体 | |
JP2005111091A (ja) | 麻雀ゲーム機及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20101123 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |