JP4724943B2 - Voice recognition device - Google Patents
Voice recognition device Download PDFInfo
- Publication number
- JP4724943B2 JP4724943B2 JP2001107756A JP2001107756A JP4724943B2 JP 4724943 B2 JP4724943 B2 JP 4724943B2 JP 2001107756 A JP2001107756 A JP 2001107756A JP 2001107756 A JP2001107756 A JP 2001107756A JP 4724943 B2 JP4724943 B2 JP 4724943B2
- Authority
- JP
- Japan
- Prior art keywords
- disk
- voice
- voice recognition
- rotation
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Rotational Drive Of Disk (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、ユーザが発声した音声を認識し、トークバック音声を発声させる音声認識装置に関する。
【0002】
【従来の技術および発明が解決しようとする課題】
従来、この種の音声認識装置として、例えばカーナビゲーションシステムに用いられる音声認識など種々のものが提案されている。
【0003】
このような音声認識装置において、認識結果をユーザに通知するための音声データがDVD等の大容量のディスクに格納されている。ディスクに格納されたデータは、ディスクドライバを用いて読み出される。ディスクドライバは、ディスクを高速で回転させ、ヘッドを回転方向と垂直に移動させて、データの読み出しを行う。また、ディスクドライバは、その耐久性向上および消費電力低減のために、ディスクに対するアクセスが一定時間以上ない場合に、ディスクの回転を停止させるようになっている。
【0004】
ディスクが停止状態にあるときに、音声データの読み出し要求があると、ディスクの回転が安定し、読み出し用ヘッドの焦点が合うまでに、約1〜2秒の時間がかかってしまう。このため、音声認識装置における認識時間が長くなってしまう。すなわち、認識時間を、ユーザの発話完了から認識結果を得てトークバック音声が発生するまでの時間と定義した場合、認識結果を得てトークバック音声が発生するまでの時間が長くなるため、認識時間が長くなってしまう。
【0005】
本発明は上記問題に鑑みたもので、ディスクからの音声データの読み出しにかかる時間を短くして認識時間を短くすることを目的とする。
【0006】
【課題を解決するための手段】
上記目的を達成するため、請求項1に記載の発明では、音声認識を開始させるためのスイッチをユーザが操作した後にユーザが発声した音声の音声信号をマイクから取り込んで、音声認識処理を行い、認識結果に応じた音声データをディスクから取得して、トークバック音声をスピーカから発声させる音声認識装置において、前記ディスクが停止状態にある場合に、前記スイッチが操作された後、前記音声認識処理を開始するまでの間の所定タイミングにおいて、前記ディスクの回転を開始させるための処理を行う手段を備えたことを特徴としている。
【0007】
この発明によれば、先にディスクの回転を開始させておき、その後に認識結果に応じた音声データをディスクから取得するようにしているから、ディスクからの音声データの読み出しにかかる時間を短くして認識時間を短くすることができる。
【0008】
【発明の実施の形態】
以下、本発明を図に示す実施形態について説明する。図1に、音声認識システムの全体構成を示す。音声認識システムは、PTT(pusu to talk)スイッチ1と、マイク2と、スピーカ3と、音声認識装置4と、ディスクドライバ5とからなる。このディスクドライバ5には、トークバックデータなどのデータが格納されたディスク6が装備される。
【0009】
PTTスイッチ1は、音声認識を開始するときにユーザによって操作される。音声認識装置4は、PTTスイッチ1が操作された後にユーザが発声した音声の音声信号をマイク2から取り込んで、音声認識処理を行い、ディスクドライバ5を制御して認識結果に応じた音声データ(トークバックデータ)をディスク6から取得し、トークバック音声をスピーカ3から発声させる。この音声認識装置4は、単独の装置のみならず、例えば車両用のナビゲーション装置の制御装置において実現することもできる。この場合、ナビゲーション装置における制御装置は、コンピュータを用いて構成され、ナビゲーションとしての機能を実行するための種々の機能を備えるとともに、音声認識を行う機能も備えている。
【0010】
以下、この実施形態における音声認識装置4の具体的な作動を、図2に示す処理に従って説明する。
【0011】
音声認識装置4は、図2に示す処理を繰り返し実行している。まず、PTTスイッチ1が操作されたか否かを判定する(ステップ101)。PTTスイッチ1が操作されたことを判定すると、ユーザの発声を促すためにビープ音をスピーカ3から発生させる(ステップ102)。そして、ディスク6の回転を開始させる指令をディスクドライバ5に出力する(ステップ103)。
【0012】
次に、ユーザが発声した音声の音声信号をマイク2から取り込んで、音声認識処理を行う(ステップ104)。すなわち、マイク2から取り込んだ音声信号により、解析・辞書照を行って認識結果を求める。このとき、認識処理時間に対して、音声認識装置4のCPUの処理能力が十分でなければ、音声信号をバッファリングし、ユーザの発声が完了した後も、引き続き、バッファリングされた音声信号に基づいて音声認識処理を行うようにする。
【0013】
そして、認識結果が得られると、ディスクドライバ5を制御して認識結果に応じたトークバックデータをディスク6から取得し、トークバック音声をスピーカ3から発声させる(ステップ105)。この場合、ステップ103において、ディスク6の回転を先に開始させるようにしているから、ディスク6がそれまで停止していても、トークバックデータを読み出すまでにディスク6の回転が安定しているため、トークバックデータの読み出し時間を短くすることができる。
【0014】
なお、上記した実施形態では、ディスク6の回転を開始させるための処理を、ディスク6が回転しているか停止しているかに係わらず回転開始させるものを示したが、ディスク6が回転しているか否かを判定し、停止しているときにのみ回転を開始させるようにしてもよい。
【0015】
また、上記した実施形態では、PTTスイッチ1が操作されことを判定し、ビープを発生させた後に、ディスク6の回転を開始させるものを示したが、その回転開始のタイミングは、PTTスイッチ1が操作された後、音声認識処理を開始するまでの間であれば、他のタイミングであってもよい。但し、認識する音声が非常に短いような場合を想定すると、PTTスイッチ1が操作された直後(ビープ音の発生前、あるいは発生後)が好ましい。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る音声認識システムの全体構成を示す図である。
【図2】図1中の音声認識装置4の処理を示すフローチャートである。
【符号の説明】
1…PTTスイッチ、2…マイク、3…スピーカ、4…音声認識装置、
5…ディスクドライバ、6…ディスク。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a speech recognition apparatus that recognizes speech uttered by a user and utters talkback speech.
[0002]
[Background Art and Problems to be Solved by the Invention]
Conventionally, as this type of speech recognition device, various devices such as speech recognition used in a car navigation system have been proposed.
[0003]
In such a voice recognition apparatus, voice data for notifying the user of the recognition result is stored in a large-capacity disk such as a DVD. Data stored on the disk is read using a disk driver. The disk driver reads the data by rotating the disk at high speed and moving the head perpendicular to the rotation direction. Further, in order to improve the durability and reduce the power consumption, the disk driver stops the rotation of the disk when there is no access to the disk for a certain time.
[0004]
If there is a request to read audio data while the disk is in a stopped state, the disk rotation is stabilized, and it takes about 1 to 2 seconds for the read head to focus. For this reason, the recognition time in the speech recognition apparatus becomes long. In other words, if the recognition time is defined as the time from the completion of the user's utterance until the recognition result is obtained until the talkback sound is generated, the time until the recognition result is obtained and the talkback sound is generated becomes longer. The time will be longer.
[0005]
The present invention has been made in view of the above problems, and an object of the present invention is to shorten the recognition time by shortening the time required to read out audio data from a disc.
[0006]
[Means for Solving the Problems]
In order to achieve the above object, according to the first aspect of the present invention, the voice signal of the voice uttered by the user after the user operates the switch for starting the voice recognition is taken from the microphone, and the voice recognition process is performed. In a voice recognition device that acquires voice data according to a recognition result from a disk and utters a talkback voice from a speaker, the voice recognition process is performed after the switch is operated when the disk is in a stopped state. It is characterized by comprising means for performing a process for starting the rotation of the disk at a predetermined timing until the start.
[0007]
According to this invention, the rotation of the disk is started first, and then the sound data corresponding to the recognition result is acquired from the disk. Therefore, the time required for reading the sound data from the disk is shortened. Recognition time can be shortened.
[0008]
DETAILED DESCRIPTION OF THE INVENTION
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments shown in the drawings will be described below. FIG. 1 shows the overall configuration of the voice recognition system. The voice recognition system includes a PTT (pusu to talk) switch 1, a
[0009]
The PTT switch 1 is operated by the user when voice recognition is started. The voice recognition device 4 takes in the voice signal of the voice uttered by the user after the PTT switch 1 is operated from the
[0010]
Hereinafter, the specific operation of the speech recognition apparatus 4 in this embodiment will be described according to the processing shown in FIG.
[0011]
The voice recognition device 4 repeatedly executes the process shown in FIG. First, it is determined whether or not the PTT switch 1 has been operated (step 101). If it is determined that the PTT switch 1 has been operated, a beep sound is generated from the speaker 3 to prompt the user to speak (step 102). Then, a command for starting the rotation of the
[0012]
Next, the voice signal of the voice uttered by the user is taken from the
[0013]
When the recognition result is obtained, the
[0014]
In the above-described embodiment, the process for starting the rotation of the
[0015]
In the above-described embodiment, it is determined that the PTT switch 1 is operated and a beep is generated, and then the
[Brief description of the drawings]
FIG. 1 is a diagram showing an overall configuration of a speech recognition system according to an embodiment of the present invention.
FIG. 2 is a flowchart showing processing of the speech recognition apparatus 4 in FIG.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 ... PTT switch, 2 ... Microphone, 3 ... Speaker, 4 ... Voice recognition apparatus,
5 ... disk driver, 6 ... disk.
Claims (3)
前記ディスクが停止状態にある場合に、前記スイッチが操作された後、前記音声認識処理を開始するまでの間の所定タイミングにおいて、前記ディスクの回転を開始させるための処理を行う手段を備えたことを特徴とする音声認識装置。After the user operates the switch to start voice recognition, the voice signal of the voice uttered by the user is taken from the microphone, voice recognition processing is performed, voice data corresponding to the recognition result is acquired from the disk, and talkback is performed. In a voice recognition device that utters voice from a speaker,
Means for performing a process for starting the rotation of the disk at a predetermined timing after the switch is operated and before the voice recognition process is started when the disk is in a stopped state; A voice recognition device characterized by the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001107756A JP4724943B2 (en) | 2001-04-05 | 2001-04-05 | Voice recognition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001107756A JP4724943B2 (en) | 2001-04-05 | 2001-04-05 | Voice recognition device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002304192A JP2002304192A (en) | 2002-10-18 |
JP4724943B2 true JP4724943B2 (en) | 2011-07-13 |
Family
ID=18960022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001107756A Expired - Fee Related JP4724943B2 (en) | 2001-04-05 | 2001-04-05 | Voice recognition device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4724943B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008130101A (en) * | 2006-11-16 | 2008-06-05 | Kenwood Corp | Optical disk reproducing device, standby state setting method, and standby state setting program |
CN106550286A (en) * | 2016-11-07 | 2017-03-29 | 武汉卡比特信息有限公司 | Based on the real-time intercommunication method under driving environment, terminal, server and system |
CN111081236B (en) * | 2018-10-22 | 2024-06-21 | 中兴通讯股份有限公司 | Voice processing method, terminal and computer storage medium |
JP7216621B2 (en) * | 2019-07-11 | 2023-02-01 | Tvs Regza株式会社 | Electronic devices, programs and speech recognition methods |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01292668A (en) * | 1988-05-20 | 1989-11-24 | Fuji Photo Film Co Ltd | Recording/reproducing device |
JPH02264551A (en) * | 1989-04-05 | 1990-10-29 | Oki Electric Ind Co Ltd | Voice reply recognition device |
JPH0541020A (en) * | 1991-12-20 | 1993-02-19 | Teac Corp | Disk driving device |
JPH06274190A (en) * | 1993-03-18 | 1994-09-30 | Sony Corp | Navigation system and speech recognition device |
JPH0934488A (en) * | 1995-07-18 | 1997-02-07 | Mazda Motor Corp | Voice operating device for car on-board apparatus |
JPH11506845A (en) * | 1995-09-11 | 1999-06-15 | ダイムラー−ベンツ エーロスペイス アクチエンゲゼルシャフト | Automatic control method of one or more devices by voice dialogue or voice command in real-time operation and device for implementing the method |
JP2000181500A (en) * | 1998-12-15 | 2000-06-30 | Equos Research Co Ltd | Speech recognition apparatus and agent apparatus |
JP2000221049A (en) * | 1999-01-29 | 2000-08-11 | Equos Research Co Ltd | Vehicle situation grasping system, agent device, and vehicle controller |
JP2000314635A (en) * | 1999-04-28 | 2000-11-14 | Equos Research Co Ltd | Agent device |
JP2001022384A (en) * | 1999-07-09 | 2001-01-26 | Nissan Motor Co Ltd | Voice interactive device |
JP2001034289A (en) * | 1999-07-16 | 2001-02-09 | Nec Corp | Interactive system using natural language |
JP2001042891A (en) * | 1999-07-27 | 2001-02-16 | Suzuki Motor Corp | Speech recognition apparatus, speech recognition mounting device, speech recognition mounting system, speech recognition method, and memory medium |
JP2001067091A (en) * | 1999-08-25 | 2001-03-16 | Sony Corp | Voice recognition device |
JP2001083981A (en) * | 1999-09-08 | 2001-03-30 | Mitsubishi Electric Corp | Speech recognition system and method and recording medium readable by computer having recorded voice recognition program therein |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59218582A (en) * | 1983-05-27 | 1984-12-08 | 株式会社日立製作所 | Automatic transactor |
JP3225356B2 (en) * | 1989-11-29 | 2001-11-05 | コニカ株式会社 | Still video camera |
JPH07176174A (en) * | 1992-12-25 | 1995-07-14 | Mitsubishi Electric Corp | Disk device |
JPH0721669A (en) * | 1993-07-02 | 1995-01-24 | Fujitsu Ltd | Control system for large capacity optical disk |
JPH11110956A (en) * | 1997-09-30 | 1999-04-23 | Sony Corp | Device and method for reproducing signal, device and method for recording/reproducing signal |
-
2001
- 2001-04-05 JP JP2001107756A patent/JP4724943B2/en not_active Expired - Fee Related
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01292668A (en) * | 1988-05-20 | 1989-11-24 | Fuji Photo Film Co Ltd | Recording/reproducing device |
JPH02264551A (en) * | 1989-04-05 | 1990-10-29 | Oki Electric Ind Co Ltd | Voice reply recognition device |
JPH0541020A (en) * | 1991-12-20 | 1993-02-19 | Teac Corp | Disk driving device |
JPH06274190A (en) * | 1993-03-18 | 1994-09-30 | Sony Corp | Navigation system and speech recognition device |
JPH0934488A (en) * | 1995-07-18 | 1997-02-07 | Mazda Motor Corp | Voice operating device for car on-board apparatus |
JPH11506845A (en) * | 1995-09-11 | 1999-06-15 | ダイムラー−ベンツ エーロスペイス アクチエンゲゼルシャフト | Automatic control method of one or more devices by voice dialogue or voice command in real-time operation and device for implementing the method |
JP2000181500A (en) * | 1998-12-15 | 2000-06-30 | Equos Research Co Ltd | Speech recognition apparatus and agent apparatus |
JP2000221049A (en) * | 1999-01-29 | 2000-08-11 | Equos Research Co Ltd | Vehicle situation grasping system, agent device, and vehicle controller |
JP2000314635A (en) * | 1999-04-28 | 2000-11-14 | Equos Research Co Ltd | Agent device |
JP2001022384A (en) * | 1999-07-09 | 2001-01-26 | Nissan Motor Co Ltd | Voice interactive device |
JP2001034289A (en) * | 1999-07-16 | 2001-02-09 | Nec Corp | Interactive system using natural language |
JP2001042891A (en) * | 1999-07-27 | 2001-02-16 | Suzuki Motor Corp | Speech recognition apparatus, speech recognition mounting device, speech recognition mounting system, speech recognition method, and memory medium |
JP2001067091A (en) * | 1999-08-25 | 2001-03-16 | Sony Corp | Voice recognition device |
JP2001083981A (en) * | 1999-09-08 | 2001-03-30 | Mitsubishi Electric Corp | Speech recognition system and method and recording medium readable by computer having recorded voice recognition program therein |
Also Published As
Publication number | Publication date |
---|---|
JP2002304192A (en) | 2002-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8214219B2 (en) | Speech communications system for a vehicle and method of operating a speech communications system for a vehicle | |
US20050216271A1 (en) | Speech dialogue system for controlling an electronic device | |
JP2008256802A (en) | Voice recognition device and voice recognition method | |
JP3000999B1 (en) | Speech recognition method, speech recognition device, and recording medium recording speech recognition processing program | |
JPH10187198A (en) | Hands free speech memo system and method | |
US7349844B2 (en) | Minimizing resource consumption for speech recognition processing with dual access buffering | |
JP4724943B2 (en) | Voice recognition device | |
JP2009175179A (en) | Speech recognition device, program and utterance signal extraction method | |
JPH11119792A (en) | Equipment controller with voice recognizing function, and voice recognizing device | |
US11740865B2 (en) | Agent coordination device, agent coordination method and recording medium | |
JP2001042891A (en) | Speech recognition apparatus, speech recognition mounting device, speech recognition mounting system, speech recognition method, and memory medium | |
JP2002091489A (en) | Voice recognition device | |
WO2019202351A1 (en) | Device control apparatus, and control method for controlling devices | |
JP5074759B2 (en) | Dialog control apparatus, dialog control method, and dialog control program | |
JP4810343B2 (en) | Speech processing apparatus and control method thereof | |
US10127910B2 (en) | Speech recognition apparatus and computer program product for speech recognition | |
JPH09134193A (en) | Speech recognition device | |
JP2000089789A (en) | Voice recognition device and recording medium | |
JP4060237B2 (en) | Voice dialogue system, voice dialogue method and voice dialogue program | |
JP7035979B2 (en) | Speech recognition device | |
JP2004184803A (en) | Speech recognition device for vehicle | |
JP2008051950A (en) | Information processing apparatus | |
JP7258007B2 (en) | Voice recognition method, voice wake-up device, voice recognition device, and terminal | |
CN113689850A (en) | Agent cooperation apparatus, method of operating the same, and storage medium | |
JP3050232B2 (en) | Speech recognition method, speech recognition device, and recording medium recording speech recognition processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100608 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100806 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101019 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101213 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110315 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110328 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140422 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |