JP2002333898A - Sound-recognizing system for electronic pet - Google Patents

Sound-recognizing system for electronic pet

Info

Publication number
JP2002333898A
JP2002333898A JP2001136758A JP2001136758A JP2002333898A JP 2002333898 A JP2002333898 A JP 2002333898A JP 2001136758 A JP2001136758 A JP 2001136758A JP 2001136758 A JP2001136758 A JP 2001136758A JP 2002333898 A JP2002333898 A JP 2002333898A
Authority
JP
Japan
Prior art keywords
candidate
recognition
electronic pet
voice recognition
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001136758A
Other languages
Japanese (ja)
Inventor
Yutaka Saito
裕 斉藤
Seiichi Ito
成一 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
VIVARIUM Inc
Original Assignee
VIVARIUM Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by VIVARIUM Inc filed Critical VIVARIUM Inc
Priority to JP2001136758A priority Critical patent/JP2002333898A/en
Publication of JP2002333898A publication Critical patent/JP2002333898A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To perform efficient sound recognition without misrecognitions especially by comparing the difference in the recognition rates of respective candidates. SOLUTION: In the sound recognizing system for electronic pet, using an electronic pet such as human faced fish 'Seaman', in terminal equipment for storing the program of the electronic pet, in the case of conversation between the 'Seaman' and an operator, the voice of the answer of the operator is recognized and a plurality of candidates having different recognition rates are presented. When there is a difference of recognition rates more than a prescribed value between first and second candidates, the first candidate is defined as being recognized result. When there is no difference of recognition rates more than the prescribed value between the first and second candidates, confirmation processing is applied on the first candidate, the misrecognition is eliminated, and efficient sound recognition is enabled.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、電子ペットの音声
認識システム、及びその方法に関する。
[0001] 1. Field of the Invention [0002] The present invention relates to an electronic pet voice recognition system and method.

【0002】[0002]

【従来の技術】近年のエレクトロニクス技術の進歩に伴
い、操作者の個性に関する情報を知識として蓄積し、該
蓄積した各種データに基づいてその操作者に合致した対
応を実現する電子ペットプログラムがある。例えば、水
槽の中を泳ぎ回る電子ペットと会話し、操作者とコニュ
ケーションをとるシステムなどである。
2. Description of the Related Art With the recent advance in electronics technology, there is an electronic pet program that accumulates information regarding the personality of an operator as knowledge and realizes a response suitable for the operator based on the accumulated various data. For example, there is a system that talks with an electronic pet swimming in a water tank and communicates with an operator.

【0003】[0003]

【発明が解決しようとする課題】このような電子ペット
とのコミニュケーションシステムにおいて、電子ペット
とユーザとの会話によってコミニュケーションが進行す
る。この際、音声認識エンジンや音声合成エンジンを使
用して電子ペット及びユーザの音声認識、及び音声合成
が行われる。
In such a communication system with an electronic pet, communication proceeds by conversation between the electronic pet and a user. At this time, voice recognition and voice synthesis of the electronic pet and the user are performed using a voice recognition engine and a voice synthesis engine.

【0004】しかしながら、従来の音声認識において
は、必ずしも確実な認識を行っているとは言えなかっ
た。例えば、人面魚「シーマン」の質問に対する回答を
認識する場合、最も認識率の高い認識結果を回答として
いた。このため、それほど認識率自体が高くない場合で
も回答であると判断し、誤認識を行う危険があった。
However, in the conventional speech recognition, it cannot be said that reliable recognition is always performed. For example, when recognizing the answer to the question of the mermaid "Seaman", the recognition result with the highest recognition rate was used as the answer. For this reason, even when the recognition rate itself is not so high, it is determined that the answer is given, and there is a risk of erroneous recognition.

【0005】また、必ず認識結果をユーザに確認する処
理を含めるシステムもある。しかし、この場合には極め
て効率の悪い音声認識方法となる。本発明は上記課題に
鑑み、認識率の差を比較することによってより正確な音
声認識を行うことを目的とするものである。
[0005] Some systems always include a process for confirming the recognition result to the user. However, this is a very inefficient speech recognition method. The present invention has been made in view of the above problems, and has as its object to perform more accurate voice recognition by comparing differences in recognition rates.

【0006】[0006]

【課題を解決するための手段】上記課題は請求項1記載
の発明によれば、複数の端末機器と、ネットワーク回線
網を介して接続されデータ通信可能に接続されたサーバ
コンピュータとを備えた電子ペットの音声認識システム
であって、電子ペットの質問に対して認識率の異なる複
数の候補を出力する音声認識手段と、該音声認識によっ
て得られる第1の候補と第2の候補間の認識率の差を比
較する比較手段と、該比較手段による比較結果が所定値
を越えるとき、前記第1の候補を前記音声認識の結果と
認定する認定手段と、前記比較手段による比較結果が所
定値を越えないとき、前記第1の候補に対する確認処理
を行う確認手段とを有する電子ペットの音声認識システ
ムを提供することによって達成できる。
According to the first aspect of the present invention, there is provided an electronic apparatus comprising: a plurality of terminal devices; and a server computer connected via a network and connected to enable data communication. A voice recognition system for a pet, comprising: voice recognition means for outputting a plurality of candidates having different recognition rates for an electronic pet question; and a recognition rate between a first candidate and a second candidate obtained by the voice recognition. Comparing means for comparing the difference between the first candidate and the speech recognition result when the comparison result by the comparing means exceeds a predetermined value. If not, it can be achieved by providing a voice recognition system for an electronic pet having a confirmation means for performing a confirmation process on the first candidate.

【0007】このように構成することによって、第1候
補と第2候補に大きな認識率の差があるとき、第1候補
を正しい回答であると判断して音声認識し、効率良い音
声認識処理を行うものである。
With this configuration, when there is a large difference between the first candidate and the second candidate in the recognition rate, the first candidate is determined to be a correct answer and speech recognition is performed, and efficient speech recognition processing is performed. Is what you do.

【0008】請求項2の記載は、上記請求項1記載の発
明において、前記第1の候補に対する確認処理におい
て、肯定的な回答を受けた場合、該第1候補を前記音声
認識の結果と認定する構成である。
According to a second aspect of the present invention, in the invention according to the first aspect, when a positive answer is received in the confirmation processing for the first candidate, the first candidate is recognized as the result of the speech recognition. It is a configuration to do.

【0009】このように構成することによって、前記第
1候補を音声認識の結果と判断することができ、誤認識
を防止することができる。請求項3の記載は、上記請求
項1記載の発明において、前記第1の候補に対する確認
処理において、否定的な応答を受けた場合、更に前記第
2候補に対する確認処理を行う構成である。
With this configuration, the first candidate can be determined as a result of speech recognition, and erroneous recognition can be prevented. According to a third aspect of the present invention, in the invention according to the first aspect, in the confirmation processing for the first candidate, if a negative response is received, the confirmation processing for the second candidate is further performed.

【0010】このように構成することによって、第2候
補以下についても効率良く、且つ誤認識を行うことな
く、音声認識処理を行うことが可能となる。請求項4の
記載は、上記請求項3の記載において、前記第2の候補
に対する確認処理において、肯定的な応答を受けた場
合、該第2の候補を前記音声認識の結果と認定する構成
である。
[0010] With this configuration, it is possible to efficiently perform the speech recognition processing for the second candidate and the subsequent candidates without erroneous recognition. According to a fourth aspect of the present invention, in the configuration of the third aspect, when a positive response is received in the confirmation processing for the second candidate, the second candidate is recognized as the result of the speech recognition. is there.

【0011】このように構成することによっても、第2
候補以下についても効率良く、且つ誤認識を行うことな
く、音声認識処理を行うことが可能となる。請求項5の
記載は、上記請求項3の記載において、前記第2の候補
に対する確認処理において、否定的な応答を受けた場
合、第3の候補に対する確認処理を行う構成である。
With this configuration, the second
Speech recognition processing can be performed efficiently for candidates and below without erroneous recognition. According to a fifth aspect of the present invention, in the third aspect, when a negative response is received in the confirmation processing for the second candidate, the confirmation processing for the third candidate is performed.

【0012】請求項6の記載は、上記請求項1乃至5の
記載において、前記第1の候補の認識率は一定値以上で
ある。このように構成することにより、例えば第1の候
補が低い認識率であり、しかも第2の候補との間に所定
値以上の認識率の差がある場合、低い認識率の第1候補
が回答であると判断されることを防止する。
According to a sixth aspect of the present invention, in the first to fifth aspects, the recognition rate of the first candidate is a certain value or more. With such a configuration, for example, when the first candidate has a low recognition rate and a difference between the second candidate and the second candidate is equal to or more than a predetermined value, the first candidate having the low recognition rate Is prevented from being determined.

【0013】上記課題は請求項7記載の発明によれば、
複数の端末機器と、ネットワーク回線網を介して接続さ
れデータ通信可能に接続されたサーバコンピュータとを
備えた電子ペットの音声認識方法であって、電子ペット
の質問に対する回答を音声認識する処理と、該音声認識
によって複数の認識候補が得られた場合、第1の候補と
第2の候補間の認識率の差を比較する比較処理と、該処
理による比較結果が所定値を越えるとき、前記第1の候
補を前記音声認識の結果と認定する認定処理と、前記処
理による比較結果が所定値を越えないとき、前記第1の
候補に対する確認処理を行う確認処理とを行う電子ペッ
トの音声認識方法を提供することによって達成できる。
[0013] The above object is attained according to a seventh aspect of the present invention.
A plurality of terminal devices, a voice recognition method of an electronic pet including a server computer connected via a network network and communicably connected, the processing for voice recognition of the answer to the question of the electronic pet, When a plurality of recognition candidates are obtained by the voice recognition, a comparison process of comparing the difference in the recognition rate between the first candidate and the second candidate, and when the comparison result by the process exceeds a predetermined value, A voice recognition method for an electronic pet, comprising: a certification process for recognizing a first candidate as a result of the voice recognition; and a confirmation process for performing a confirmation process on the first candidate when a comparison result by the process does not exceed a predetermined value. Can be achieved by providing

【0014】本発明は方法の発明であり、このように構
成することによっても、第1候補と第2候補に大きな認
識率の差があるとき、第1候補を正しい回答であると判
断し、音声認識することができる。
The present invention is an invention of a method. With such a configuration, when there is a large difference between the first candidate and the second candidate in the recognition rate, the first candidate is determined to be a correct answer, Can recognize voice.

【0015】請求項8の記載は、上記請求項7記載の発
明において、前記第1の候補の認識率は一定値以上であ
る。上記課題は請求項9記載の発明によれば、複数の端
末機器と、ネットワーク回線網を介して接続されデータ
通信可能に接続されたサーバコンピュータとを備えた電
子ペットの音声認識プログラムであって、電子ペットの
質問に対する回答を音声認識する機能と、該音声認識に
よって複数の認識候補が得られた場合、第1の候補と第
2の候補間の認識率の差を比較する比較機能と、該比較
機能による比較結果が所定値を越えるとき、前記第1の
候補を前記音声認識の結果と認定する認定機能と、前記
機能による比較結果が所定値を越えないとき、前記第1
の候補に対する確認処理を行う確認機能とを有する電子
ペットの音声認識プログラムを提供することによって達
成できる。
According to an eighth aspect of the present invention, in the above-mentioned seventh aspect, the recognition rate of the first candidate is equal to or more than a predetermined value. According to the ninth aspect of the present invention, there is provided a voice recognition program for an electronic pet, comprising: a plurality of terminal devices; and a server computer connected via a network and connected to enable data communication. A function of recognizing the answer to the question of the electronic pet by voice, and a comparing function of comparing a difference in recognition rate between the first candidate and the second candidate when a plurality of recognition candidates are obtained by the voice recognition; A certifying function for certifying the first candidate as a result of the speech recognition when the comparison result by the comparison function exceeds a predetermined value; and a certifying function when the comparison result by the function does not exceed a predetermined value.
This can be achieved by providing a voice recognition program for an electronic pet having a confirmation function of performing a confirmation process for a candidate.

【0016】本発明はプログラムの発明であり、このよ
うに構成することによっても、第1候補と第2候補に大
きな認識率の差があるとき、第1候補を正しい回答であ
ると判断し、音声認識することができる。
The present invention is an invention of a program. With this configuration, when there is a large difference in recognition rate between the first candidate and the second candidate, the first candidate is determined to be a correct answer, Can recognize voice.

【0017】請求項10の記載は、上記請求項9記載の
発明において、前記第1の候補の認識率は一定値以上で
ある。
According to a tenth aspect, in the invention of the ninth aspect, the recognition rate of the first candidate is equal to or more than a predetermined value.

【0018】[0018]

【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。図1は、本発明の電子ペットを利用
する音声認識システムのシステム構成図である。本例の
システムは、同図に示すように、利用者が所有する複数
のプラットホームであるパーソナルコンピュータ1a、
及び1bと、コンピュータゲーム機6と、携帯電話7
と、電子ペットである人面魚「シーマン」の提供サービ
スを行うサービス事業者が所有するサーバコンピュータ
3とから構成されている。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a system configuration diagram of a voice recognition system using an electronic pet according to the present invention. As shown in FIG. 1, the system of the present embodiment includes a plurality of personal computers 1a,
And 1b, a computer game machine 6, and a mobile phone 7
And a server computer 3 owned by a service provider that provides a service for providing a mermaid "Seaman" as an electronic pet.

【0019】上記パーソナルコンピュータ1a、1b、
並びにゲーム機6は各通信装置2a、2b、及び5を介
してそれぞれインターネット21に接続され、また携帯
電話7は図示しない中継局や中央制御局を介して、イン
ターネット21に接続されている。
The personal computers 1a, 1b,
The game machine 6 is connected to the Internet 21 via each of the communication devices 2a, 2b, and 5, and the mobile phone 7 is connected to the Internet 21 via a not-shown relay station or central control station.

【0020】また、インターネット21に接続されたパ
ーソナルコンピュータは1a、1bで示すが、上記2台
のコンピュータ以外に、多数のコンピュータがインター
ネット21に接続されている。尚、パーソナルコンピュ
ータ1aは、例えばOSとしてウインドウズを使用し、
パーソナルコンピュータ1bは、OSとして例えばマッ
キントッシュを使用する。
Although personal computers connected to the Internet 21 are indicated by 1a and 1b, many computers are connected to the Internet 21 in addition to the above two computers. The personal computer 1a uses, for example, Windows as the OS,
The personal computer 1b uses, for example, a Macintosh as the OS.

【0021】先ず、本例において受信者並びに発信者が
使用するパ−ソナルコンピュータ1の構成を図2に示
す。尚、パーソナルコンピュータ1の構成説明におい
て、代表してパーソナルコンピュータ1aの例で説明す
る。
First, the configuration of the personal computer 1 used by the receiver and the sender in this embodiment is shown in FIG. In the description of the configuration of the personal computer 1, the personal computer 1a will be representatively described.

【0022】図2に示すように、パーソナルコンピュー
タ1aの内部には、データの送受を行うデータバス10
が配設され、このデータバス10に中央処理装置(以
下、CPUで示す)11や、RAM12、リアルタイム
クロック(RTC)17等が接続されている。
As shown in FIG. 2, a data bus 10 for transmitting and receiving data is provided inside the personal computer 1a.
The data bus 10 is connected to a central processing unit (hereinafter, referred to as a CPU) 11, a RAM 12, a real-time clock (RTC) 17, and the like.

【0023】CPU11は後述する利用者への質問の出
題や回答の受付を音声合成により表示装置に表示される
電子ペットの言葉として出力する出題処理や、利用者の
回答を音声認識して予め登録されている複数の回答候補
から該当する項目を選出登録して利用者の個性情報とし
て蓄積する回答受付処理等を実施する。この処理の際、
ワークエリアとしてRAM12を使用する。
The CPU 11 outputs a question to the user and accepts an answer, which will be described later, as words of an electronic pet displayed on the display device by speech synthesis, and recognizes and pre-registers the answer of the user by voice recognition. A response receiving process for selecting and registering a corresponding item from a plurality of answer candidates set as above and storing the selected item as personality information of the user is performed. During this process,
The RAM 12 is used as a work area.

【0024】また、リアルタイムクロック(RTC)1
7は、例えばデータ更新の日時情報に使用される現在の
時刻情報や、任意の年月日の曜日等のカレンダー情報を
出力する。また、入力装置16はキーボードやマウス等
であり、キーボードやマウス等の操作情報をCPU11
に通知する。
A real-time clock (RTC) 1
Reference numeral 7 outputs, for example, current time information used for date and time information of data update, and calendar information such as an arbitrary day of the week. The input device 16 is a keyboard, a mouse, and the like.
Notify.

【0025】表示装置14はCRT又はLCD等のディ
スプレイであり、後述するシーマンの表示を行う。ま
た、通信インターフェイス13は前述の通信装置2(2
a)に接続され、通信装置2(2a)及びインターネッ
ト21を介してサーバコンピュータ3との間でデータの
送受信を行う。
The display device 14 is a display such as a CRT or an LCD, and displays a Seaman described later. The communication interface 13 is connected to the communication device 2 (2
a) and transmits / receives data to / from the server computer 3 via the communication device 2 (2a) and the Internet 21.

【0026】また、音声入出力装置18には外部機器で
あるスピーカ19やマイク20に接続され、A/D・D
/Aコンバータを有する。音声入出力装置18は、後述
する音声合成プログラムにより生成された音声データを
アナログの音声と変換(D/A変換)し、上記スピーカ
19に出力すると共に、上記マイク20から入力された
音声をデジタルデータに変換(A/D変換)して出力す
る。
The audio input / output device 18 is connected to a speaker 19 and a microphone 20 as external devices, and A / D / D
/ A converter. The voice input / output device 18 converts (D / A converts) voice data generated by a voice synthesis program to be described later into analog voice, outputs the voice data to the speaker 19, and converts the voice input from the microphone 20 into a digital voice. The data is converted (A / D converted) and output.

【0027】記憶装置15は、磁気ディスクや光磁気デ
ィスクから成り、上記CPU11の制御に従ってデータ
やプログラムの書き込み、読み出し処理が行われる。こ
の記憶装置15には前述の表示装置14に表示される電
子ペットである人面魚「シーマン」の画像や動作処理等
が記述された電子ペットプログラムや、前記人面魚「シ
ーマン」の声をテキストデータに基づいて音声出力する
ための音声合成プログラムや、発信者或いは受信者の入
力音声をテキストデータに変換するための音声認識プロ
グラム等が記憶されている。
The storage device 15 is composed of a magnetic disk or a magneto-optical disk. Data and programs are written and read under the control of the CPU 11. The storage device 15 stores an electronic pet program in which an image and an operation process of a mermaid fish "Seaman", which is an electronic pet displayed on the display device 14, and a voice of the mermaid fish "Seaman" are stored. A speech synthesis program for outputting speech based on text data, a speech recognition program for converting input speech of a sender or a recipient into text data, and the like are stored.

【0028】また、記憶装置15には人面魚「シーマ
ン」がアプリケーションにおいて使用し、理解する単語
群が「辞書」として登録されている。図3はこの辞書の
構成を示す図であり、カテゴリー毎に登録されている。
In the storage device 15, a group of words used and understood by the mermaid "Seaman" in the application is registered as a "dictionary". FIG. 3 is a diagram showing the structure of this dictionary, which is registered for each category.

【0029】例えば、項目番号1には人面魚「シーマ
ン」の質問「おまえは男」、及び当該質問に対する回答
a、bが登録されている。また、項目番号2には人面魚
「シーマン」の質問「おまえの歳は」、及び当該質問に
対する回答a、b・・・が登録されている。以下、同図
に示す通りであり、人面魚「シーマン」の質問、及びそ
の回答が複数単語辞書として登録されている。そして、
後述する認識処理の際、ユーザの回答に対して各単語毎
に比較処理を行い、各単語毎に認識率を出力する。
For example, in item number 1, the question "You are a man" of the mermaid "Seaman" and the answers a and b to the question are registered. In item number 2, a question "Your age" of the mermaid "Seaman" and answers a, b,... To the question are registered. Hereinafter, as shown in the figure, the question of the mermaid "Seaman" and its answer are registered as a multi-word dictionary. And
At the time of a recognition process described later, a comparison process is performed for each word for the user's answer, and a recognition rate is output for each word.

【0030】上記構成の音声認識システムにおいて、以
下に処理動作を説明する。図4は本例の処理動作を説明
するフローチャートである。先ず、人面魚「シーマンか
らの質問が行われる(ステップ(以下、STで示す)1
がYES)。この質問は前述のデータベースに記憶され
たデータ順に行われ、この質問は上記パーソナルコンピ
ュータ1aのスピーカ19aから流れる(ST2)。例
えば、人面魚「シーマン」が行う質問が、前述の図3に
示す項目番号2の場合、「おまえの歳は」の質問であ
る。この質問はスピーカ19aから流れ、ユーザは質問
を理解する。
The processing operation of the above-structured speech recognition system will be described below. FIG. 4 is a flowchart illustrating the processing operation of this example. First, a question is asked from the mermaid "Seaman" (step (hereinafter referred to as ST) 1
Is YES). This question is made in the order of the data stored in the above-mentioned database, and this question flows from the speaker 19a of the personal computer 1a (ST2). For example, if the question asked by the mermaid "Seaman" is the item number 2 shown in FIG. This question flows from the speaker 19a, and the user understands the question.

【0031】次に、ユーザは上記質問に答えて、マイク
20aに向かって回答を行う(ST3がYES)。CP
U11は上記回答から音声認識を行い、複数の候補を選
択する(ST4)。例えば、ユーザの回答が「27歳」
である場合、図5に示す候補が選択される。すなわち、
この場合の回答は上記項目番号2に対応する回答a、
b、c、・・・の中から選択され、各単語に対する音声
比較、例えば積分値の比較等から認識率の高い順に出力
される。例えば、図5に示すように、第1候補として
「じゅうななさい」、第2候補として「にじゅうななさ
い」、第3候補として「ごじゅうななさい」、・・・が
出力される。
Next, the user answers the above-mentioned question and answers the microphone 20a (YES in ST3). CP
U11 performs voice recognition from the above answer and selects a plurality of candidates (ST4). For example, the user's answer is “27 years old”
, The candidate shown in FIG. 5 is selected. That is,
The answer in this case is answer a corresponding to item number 2 above,
are selected from b, c,..., and are output in descending order of recognition rate based on a speech comparison for each word, for example, a comparison of integration values. For example, as shown in FIG. 5, "Juneha" is output as a first candidate, "Junea" as a second candidate, "Junea" as a third candidate, and so on.

【0032】また、同時に各候補の認識率も表示され
る。例えば、第1候補が60%であり、第2候補が55
%であり、第3候補が45%である。次に、CPU11
は上記第1候補と第2候補の認識率の差がnポイント以
下か判断する(ST5)。このnポイントは予め設定さ
れており、例えば経験上誤認識を起こさない値である。
ここで、例えば上記nポイントが「20」に設定されて
いれば、上記図5の例ではYESである。
At the same time, the recognition rate of each candidate is also displayed. For example, the first candidate is 60% and the second candidate is 55%.
%, And the third candidate is 45%. Next, the CPU 11
Determines whether the difference between the recognition rates of the first candidate and the second candidate is n points or less (ST5). The n points are set in advance, and are values that do not cause erroneous recognition, for example, through experience.
Here, for example, if the n point is set to “20”, the result is YES in the example of FIG.

【0033】このように、第1候補と第2候補の認識率
の差がnポイント以下であれば(ST5がYES)、第
1候補をユーザに提示する(ST6)。すなわち、この
場合認識結果が確実ではないので、ユーザに確認を促
す。例えば、上記例では「今、17歳って言った」とい
う確認を促す(図6参照)。一方、前述の判断(ST
5)において、第1候補と第2候補との差がnポイント
以上であれば(ST5がNO)、第1候補に確定し、回
答取得を行うと共に、上記確認処理を行うことなく、例
えば人面魚「シーマン」はスピーカ19aから「17歳
か」と言う(図7参照)。
As described above, if the difference between the recognition rates of the first candidate and the second candidate is n points or less (YES in ST5), the first candidate is presented to the user (ST6). That is, in this case, since the recognition result is not reliable, the user is urged to confirm. For example, in the above example, the user is prompted to confirm that he is now 17 years old (see FIG. 6). On the other hand, the aforementioned judgment (ST
In 5), if the difference between the first candidate and the second candidate is n points or more (NO in ST5), the first candidate is determined, the answer is obtained, and the above-described confirmation processing is not performed. The face fish “Seaman” says “17 years old” from the speaker 19a (see FIG. 7).

【0034】次に、上記第1候補の確認処理(ST6)
を行い、スピーカ19aからの報音と図6に示す表示を
行った結果、ユーザから肯定的な回答があれば、この場
合にも第1候補を回答として確定する(ST8がYE
S、ST9)。例えば、ユーザがマイク20aに向かっ
て「はい」、「うん」、「そう」等の答えを返してきた
場合、第1候補を回答として確定する。
Next, the first candidate confirmation processing (ST6)
As a result of performing the notification from the speaker 19a and the display shown in FIG. 6, if there is a positive answer from the user, also in this case, the first candidate is determined as the answer (ST8 is YE).
S, ST9). For example, when the user returns an answer such as “Yes”, “Yes”, “Yes”, etc., toward the microphone 20a, the first candidate is determined as the answer.

【0035】一方、ユーザが「ちがう」、「いいえ」等
の否定的な回答を行った場合、人面魚「シーマン」は次
の候補があるか判断し、第2候補がある場合、第2候補
を提示する(ST10がYES、ST11)。例えば、
図5に示す例の場合、第2候補である「にじゅうななさ
い」の提示を行う。すなわち、人面魚「シーマン」は
「じゃ、27歳って言った」という質問をする。
On the other hand, if the user makes a negative answer such as "No" or "No", the mermaid "Seaman" determines whether there is a next candidate, and if there is a second candidate, The candidates are presented (YES in ST10, ST11). For example,
In the case of the example shown in FIG. 5, the second candidate “Ninare” is presented. In other words, the mermaid "Seaman" asks a question, "Well, I said 27 years old."

【0036】以下、同様に処理を行い、第2候補以降の
提示に対して肯定的な回答があれば、当該回答を回答取
得とする。例えば、第2候補の27歳の提示に対してユ
ーザから肯定的な答えがあれば、ユーザの年齢は27歳
であると分かり、第3候補の57歳の提示に対して肯定
的な答えがあれば、ユーザの年齢は57歳であると分か
る。
Thereafter, the same processing is performed, and if there is a positive answer to the presentation of the second and subsequent candidates, the answer is regarded as answer acquisition. For example, if the user has a positive answer to the second candidate presentation at the age of 27, the user is known to be 27 years old, and a positive answer is to the third candidate presentation at the age of 57. If so, it can be understood that the age of the user is 57 years old.

【0037】以上の処理を繰り返すことによって、人面
魚「シーマン」はユーザの正確な年齢を知ることができ
る。尚、全ての候補がユーザによって否定された場合、
最初の質問に会話を戻す。
By repeating the above processing, the mermaid "Seaman" can know the correct age of the user. If all candidates are denied by the user,
Return the conversation to the first question.

【0038】以上のように制御することによって、人面
魚「シーマン」の質問に対して音声認識の認識率を出力
し、該認識率に基づいて音声認識処理を進め、ストレス
のないユーザとの対話を実現するものである。
By performing the above control, the recognition rate of speech recognition is output in response to the question of the mermaid "Seaman", and the speech recognition process is performed based on the recognition rate, and the user can be stress-free. A dialogue is realized.

【0039】尚、人面魚「シーマン」の質問はユーザに
対する年齢に対する質問であったが、年齢以外の質問で
あっても同様の処理によって、ユーザからの正確な情報
を得ることができる。
Although the question about the mermaid "Seaman" was a question about the age for the user, accurate information from the user can be obtained by the same processing for a question other than the age.

【0040】また、第1候補の認識率が一定値以下の場
合、例え第1候補と第2候補間に所定値以上の認識率の
差があったとしても、音声認識結果とすることなく、か
かる場合には両候補について確認処理を行う等の手続き
を行い、誤認識のないシステムとする。
When the recognition rate of the first candidate is equal to or less than a predetermined value, even if there is a difference in the recognition rate between the first candidate and the second candidate equal to or more than a predetermined value, the recognition result is not obtained as a speech recognition result. In such a case, a procedure such as performing a confirmation process for both candidates is performed to provide a system that does not cause erroneous recognition.

【0041】尚、上記処理において、使用する端末機器
はパーソナルコンピュータ1aであったが、他のパーソ
ナルコンピュータ1bであってもよく、又はゲーム機6
や携帯電話7であっても良い。
In the above processing, the terminal device used is the personal computer 1a, but may be another personal computer 1b or the game machine 6b.
Or the mobile phone 7.

【0042】また、パーソナルコンピュータ等はサーバ
に接続されていない状態であってもよく、対応する機能
を回路やプログラムによって単独に保有する構成であれ
ばよい。
The personal computer or the like may not be connected to the server, and may have a configuration in which the corresponding function is independently held by a circuit or a program.

【0043】[0043]

【発明の効果】以上説明したように、本発明の電子ペッ
トの音声認識システムによれば、誤認識を無くすと共
に、効率良い音声認識を可能とするものである。
As described above, according to the electronic pet voice recognition system of the present invention, erroneous recognition is eliminated and efficient voice recognition is enabled.

【0044】また、第1候補の認識率が一定値以下の場
合、両候補について確認処理を行う等の処理により、よ
り正確な音声認識システムとすることができる。
Further, when the recognition rate of the first candidate is equal to or less than a certain value, a more accurate voice recognition system can be realized by performing processing such as confirmation processing for both candidates.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の電子ペットの音声認識システムのシス
テム図である。
FIG. 1 is a system diagram of an electronic pet voice recognition system of the present invention.

【図2】本発明の実施例において用いた利用者が所有す
るコンピュータをす示すブロック図である。
FIG. 2 is a block diagram showing a computer owned by a user used in the embodiment of the present invention.

【図3】記憶装置に登録されたデータベースの構成を示
す図である。
FIG. 3 is a diagram showing a configuration of a database registered in a storage device.

【図4】本例における処理動作を説明するフローチャー
トである。
FIG. 4 is a flowchart illustrating a processing operation in the present example.

【図5】第1候補、第2候補、第3候補の認識率を示す
図である。
FIG. 5 is a diagram showing recognition rates of a first candidate, a second candidate, and a third candidate.

【図6】人面魚「シーマン」の発音状態を表示する図で
ある。
FIG. 6 is a diagram showing a sounding state of a mermaid “Seaman”.

【図7】人面魚「シーマン」の発音状態を表示する図で
ある。
FIG. 7 is a diagram showing a sounding state of a mermaid “Seaman”;

【符号の説明】[Explanation of symbols]

1 パーソナルコンピュータ(利用者) 2 通信装置 3 サーバコンピュータ 4 通信装置 5 通信装置 6 コンピュータゲーム機 7 携帯電話 8 テレビ 9 マイク 10 データバス 11 中央精算処理装置(CPU) 12 RAM 13 通信インターフェイス 14 表示装置 15 記憶装置 19 スピーカ 20 マイク 21 インターネット網 DESCRIPTION OF SYMBOLS 1 Personal computer (user) 2 Communication device 3 Server computer 4 Communication device 5 Communication device 6 Computer game machine 7 Cellular phone 8 Television 9 Microphone 10 Data bus 11 Central payment processing device (CPU) 12 RAM 13 Communication interface 14 Display device 15 Storage device 19 Speaker 20 Microphone 21 Internet network

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 3/00 571U 561E Fターム(参考) 2C001 AA00 AA11 BA00 BA06 BA07 CA00 CA07 CB01 CB04 CB08 CC01 CC08 5D015 KK02 LL04 LL05 ──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) G10L 3/00 571U 561E F-term (Reference) 2C001 AA00 AA11 BA00 BA06 BA07 CA00 CA07 CB01 CB04 CB08 CC01 CC08 5D015 KK02 LL04 LL05

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】 複数の端末機器と、ネットワーク回線網
を介して接続されデータ通信可能に接続されたサーバコ
ンピュータとを備えた電子ペットの音声認識システムで
あって、 電子ペットの質問に対して認識率の異なる複数の候補を
出力する音声認識手段と、 該音声認識によって得られる第1の候補と第2の候補間
の認識率の差を比較する比較手段と、 該比較手段による比較結果が所定値を越えるとき、前記
第1の候補を前記音声認識の結果と認定する認定手段
と、 前記比較手段による比較結果が所定値を越えないとき、
前記第1の候補に対する確認処理を行う確認手段と、 を有することを特徴とする電子ペットの音声認識システ
ム。
1. An electronic pet voice recognition system comprising a plurality of terminal devices and a server computer connected via a network and connected to enable data communication, wherein the voice recognition system recognizes a question from the electronic pet. Speech recognition means for outputting a plurality of candidates having different rates, comparison means for comparing the difference in recognition rate between a first candidate and a second candidate obtained by the speech recognition, and a comparison result by the comparison means being a predetermined value When the value exceeds the value, the certifying means for certifying the first candidate as the result of the speech recognition, and when the comparison result by the comparing means does not exceed a predetermined value,
And a confirmation means for performing a confirmation process on the first candidate.
【請求項2】 前記第1の候補に対する確認処理におい
て、肯定的な応答を受けた場合、該第2候補を前記音声
認識の結果と認定することを特徴とする請求項1記載の
電子ペットの音声認識システム。
2. The electronic pet according to claim 1, wherein in the confirmation processing for the first candidate, when a positive response is received, the second candidate is recognized as a result of the voice recognition. Voice recognition system.
【請求項3】 前記第1の候補に対する確認処理におい
て、否定的な応答を受けた場合、更に前記第2候補に対
する確認処理を行うことを特徴とする請求項1記載の電
子ペットの音声認識システム。
3. The voice recognition system for an electronic pet according to claim 1, wherein in the confirmation processing for the first candidate, if a negative response is received, the confirmation processing for the second candidate is further performed. .
【請求項4】 前記第2の候補に対する確認処理におい
て、肯定的な応答を受けた場合、該第2の候補を前記音
声認識の結果と認定することを特徴とする請求項3記載
の電子ペットの音声認識システム。
4. The electronic pet according to claim 3, wherein in the confirmation processing for the second candidate, if a positive response is received, the second candidate is recognized as the result of the voice recognition. Voice recognition system.
【請求項5】 前記第2の候補に対する確認処理におい
て、否定的な応答を受けた場合、第3の候補に対する確
認処理を行うことを特徴とする請求項3記載の電子ペッ
トの音声認識システム。
5. The voice recognition system for an electronic pet according to claim 3, wherein a confirmation process is performed on the third candidate when a negative response is received in the confirmation process on the second candidate.
【請求項6】 前記第1の候補の認識率は一定値以上で
あることを特徴とする請求項1、2、3、4、又は5記
載の電子ペットの音声認識システム。
6. The voice recognition system for an electronic pet according to claim 1, wherein the recognition rate of the first candidate is equal to or higher than a predetermined value.
【請求項7】 複数の端末機器と、ネットワーク回線網
を介して接続されデータ通信可能に接続されたサーバコ
ンピュータとを備えた電子ペットの音声認識方法であっ
て、 電子ペットの質問に対する回答を音声認識する処理と、 該音声認識によって複数の認識候補が得られた場合、第
1の候補と第2の候補間の認識率の差を比較する比較処
理と、 該処理による比較結果が所定値を越えるとき、前記第1
の候補を前記音声認識の結果と認定する認定処理と、 前記処理による比較結果が所定値を越えないとき、前記
第1の候補に対する確認処理を行う確認処理と、 を行うことを特徴とする電子ペットの音声認識方法。
7. A method for recognizing a voice of an electronic pet, comprising a plurality of terminal devices and a server computer connected via a network and connected to enable data communication, wherein a response to an electronic pet question is voiced. Recognition processing; and when a plurality of recognition candidates are obtained by the voice recognition, a comparison processing of comparing a difference in recognition rate between the first candidate and the second candidate; When exceeding, the first
A certification process for recognizing the candidate as a result of the speech recognition; and a confirmation process for performing a confirmation process on the first candidate when a comparison result by the process does not exceed a predetermined value. Pet voice recognition method.
【請求項8】 前記第1の候補の認識率は一定値以上で
あることを特徴とする請求項7記載の電子ペットの音声
認識方法。
8. The method according to claim 7, wherein the recognition rate of the first candidate is equal to or higher than a predetermined value.
【請求項9】 複数の端末機器と、ネットワーク回線網
を介して接続されデータ通信可能に接続されたサーバコ
ンピュータとを備えた電子ペットの 音声認識プログラ
ムであって、 電子ペットの質問に対する回答を音声認識する機能と、 該音声認識によって複数の認識候補が得られた場合、第
1の候補と第2の候補間の認識率の差を比較する比較機
能と、 該比較機能による比較結果が所定値を越えるとき、前記
第1の候補を前記音声認識の結果と認定する認定機能
と、 前記機能による比較結果が所定値を越えないとき、前記
第1の候補に対する確認処理を行う確認機能と、 を有することを特徴とする電子ペットの音声認識プログ
ラム。
9. A voice recognition program for an electronic pet, comprising: a plurality of terminal devices; and a server computer connected via a network and connected to enable data communication, wherein a voice response to a question of the electronic pet is provided. A recognition function; a plurality of recognition candidates obtained by the voice recognition; a comparison function of comparing a difference in recognition rate between the first candidate and the second candidate; and a comparison result obtained by the comparison function being a predetermined value. A certification function for certifying the first candidate as a result of the speech recognition when the number exceeds the threshold, and a confirmation function for performing a confirmation process on the first candidate when a comparison result by the function does not exceed a predetermined value. A voice recognition program for an electronic pet, comprising:
【請求項10】 前記第1の候補の認識率は一定値以上
であることを特徴とする請求項9記載の電子ペットの音
声認識プログラム。
10. The computer-readable storage medium according to claim 9, wherein a recognition rate of the first candidate is equal to or greater than a predetermined value.
JP2001136758A 2001-05-07 2001-05-07 Sound-recognizing system for electronic pet Pending JP2002333898A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001136758A JP2002333898A (en) 2001-05-07 2001-05-07 Sound-recognizing system for electronic pet

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001136758A JP2002333898A (en) 2001-05-07 2001-05-07 Sound-recognizing system for electronic pet

Publications (1)

Publication Number Publication Date
JP2002333898A true JP2002333898A (en) 2002-11-22

Family

ID=18983967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001136758A Pending JP2002333898A (en) 2001-05-07 2001-05-07 Sound-recognizing system for electronic pet

Country Status (1)

Country Link
JP (1) JP2002333898A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004084183A1 (en) * 2003-03-20 2004-09-30 Sony Corporation Audio conversation device, method, and robot device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004084183A1 (en) * 2003-03-20 2004-09-30 Sony Corporation Audio conversation device, method, and robot device

Similar Documents

Publication Publication Date Title
US10832686B2 (en) Method and apparatus for pushing information
CN107393541B (en) Information verification method and device
JP6633153B2 (en) Method and apparatus for extracting information
US8527263B2 (en) Method and system for automatically generating reminders in response to detecting key terms within a communication
CN111261162B (en) Speech recognition method, speech recognition apparatus, and storage medium
CN106713111B (en) Processing method for adding friends, terminal and server
CN111063355A (en) Conference record generation method and recording terminal
CN110223694B (en) Voice processing method, system and device
CN111105797A (en) Voice interaction method and device and electronic equipment
US20050256710A1 (en) Text message generation
CN112306560B (en) Method and apparatus for waking up an electronic device
JP2002333898A (en) Sound-recognizing system for electronic pet
CN112712793A (en) ASR (error correction) method based on pre-training model under voice interaction and related equipment
CN113449197A (en) Information processing method, information processing apparatus, electronic device, and storage medium
CN112969000A (en) Control method and device of network conference, electronic equipment and storage medium
CN110931014A (en) Speech recognition method and device based on regular matching rule
JP2009086207A (en) Minute information generation system, minute information generation method, and minute information generation program
CN110705275A (en) Theme word extraction method and device, storage medium and electronic equipment
KR20200109995A (en) A phising analysis apparatus and method thereof
CN114078478B (en) Voice interaction method and device, electronic equipment and storage medium
CN114221940B (en) Audio data processing method, system, device, equipment and storage medium
CN114678019A (en) Intelligent device interaction method and device, storage medium and electronic device
CN113961688A (en) Conversation method, conversation device, electronic equipment and storage medium
JP2002333899A (en) Sound-recognizing system for electronic pet
KR20230055070A (en) Electronic apparatus and control method thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050422

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070703

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070724

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071120