JP2000260170A - Speech input device and speech recognition system - Google Patents

Speech input device and speech recognition system

Info

Publication number
JP2000260170A
JP2000260170A JP11061490A JP6149099A JP2000260170A JP 2000260170 A JP2000260170 A JP 2000260170A JP 11061490 A JP11061490 A JP 11061490A JP 6149099 A JP6149099 A JP 6149099A JP 2000260170 A JP2000260170 A JP 2000260170A
Authority
JP
Japan
Prior art keywords
voice
input
speech
voice recognition
input device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11061490A
Other languages
Japanese (ja)
Inventor
Yuichi Tomii
雄一 冨井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP11061490A priority Critical patent/JP2000260170A/en
Publication of JP2000260170A publication Critical patent/JP2000260170A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To make it possible to easily recognize a speech to be in an enrolling mode by displaying as prescribed presenting that enrollment is being operated on a display means, when the speech is inputted for making an external device operate data registration for improvement in accuracy of speech recognition processing. SOLUTION: When a SEL-button is inputted two times and inputted further, PC-LINK processing is performed. In an enrollment mode as one of PC-LINK modes, an operator inputs a speech via a microphone and transmits this speech data to a PC. At the same time, to let the operator know that the speech is being inputted, a counter is operated to increment a counter in a display area of a display part 14. In the enrollment mode, the operator can easily recognize that the speech is being inputted in the enrollment mode, by displaying 'EN ROLL' and then operating the counter to increment the counter.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は音声入力装置及び音
声認識システムに関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice input device and a voice recognition system.

【0002】[0002]

【従来の技術】デジタルレコーダなどの音声入力装置を
用いて音声入力を行ない、パソコンなどの外部装置に転
送してエンロール処理(音声認識処理の精度を向上させ
るために音声認識に先立って操作者の音声の特徴をデー
タ登録する処理)や音声認識ソフトウェアによる音声認
識処理を行なう音声認識システムが従来より知られてい
る。
2. Description of the Related Art Voice input is performed using a voice input device such as a digital recorder, and is transferred to an external device such as a personal computer to perform enrollment processing. 2. Description of the Related Art A speech recognition system that performs speech recognition processing using speech recognition software and a process of registering speech characteristics data has been known.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、従来の
音声認識システムにおいては、音声入力装置にエンロー
ル動作中であることを示す専用の表示機能が設けられて
いなかったので、エンロール動作状態であることを容易
に認識することができなかった。
However, in the conventional voice recognition system, the voice input device is not provided with a dedicated display function for indicating that the enrolling operation is being performed. It could not be easily recognized.

【0004】本発明はこのような課題に着目してなされ
たものであり、その目的とするところは、エンロールモ
ードであることを容易に認識することが可能な音声入力
装置及び音声認識システムを提供することにある。
The present invention has been made in view of such a problem, and an object thereof is to provide a voice input device and a voice recognition system capable of easily recognizing an enroll mode. Is to do.

【0005】[0005]

【課題を解決するための手段】上記の目的を達成するた
めに、第1の発明に係る音声入力装置は、単独で録音可
能であり外部装置とのデータ通信が可能な音声入力装置
であって、表示手段と、外部装置に音声認識処理の精度
向上のためのデータ登録を行なわせるために音声が入力
されるときは、上記表示手段にエンロール動作中である
ことを示す所定の表示を行なわせる制御手段とを具備す
る。
In order to achieve the above object, a voice input device according to a first aspect of the present invention is a voice input device capable of recording independently and capable of data communication with an external device. When a voice is input to the display means and an external device to register data for improving the accuracy of the voice recognition processing, the display means performs a predetermined display indicating that the enrolling operation is being performed. Control means.

【0006】また、第2の発明に係る音声認識システム
は、表示手段を備え、単独で録音可能であり外部装置と
のデータ通信が可能な音声入力装置と、音声入力装置か
ら送信された音声データを受信し、受信した音声データ
を音声認識処理させる音声認識処理装置とを有する音声
認識システムであって、上記音声認識処理装置は、音声
認識処理の精度向上のためのデータを登録させるエンロ
ール機能を有しており、上記音声入力装置に音声が入力
され、入力された音声情報が上記音声認識処理装置に送
信されて、上記音声認識処理装置でエンロール動作が行
なわれている間は、上記音声入力装置の表示手段にエン
ロール動作中であることを示す所定の表示を行なわせ
る。
A voice recognition system according to a second aspect of the present invention includes a voice input device including a display unit, which can be independently recorded and can perform data communication with an external device, and a voice data transmitted from the voice input device. And a voice recognition processing device for performing voice recognition processing on the received voice data, wherein the voice recognition processing device has an enroll function for registering data for improving the accuracy of voice recognition processing. While the voice is input to the voice input device, the input voice information is transmitted to the voice recognition processing device, and while the enrollment operation is performed in the voice recognition processing device, the voice input is performed. A predetermined display indicating that the enrolling operation is being performed is displayed on the display means of the apparatus.

【0007】また、第3の発明に係る音声入力装置は、
第1の発明に係る音声入力装置において、上記エンロー
ル動作中であることを示す表示は、カウンタを動作させ
ることにより行なう。
[0007] Further, a voice input device according to a third aspect of the present invention comprises:
In the voice input device according to the first invention, the display indicating that the enrolling operation is being performed is performed by operating a counter.

【0008】すなわち、第1の発明においては、単独で
録音可能かつ外部装置とのデータ通信が可能な音声入力
装置を用い、外部装置に音声認識処理の精度向上のため
のデータ登録を行なわせるために音声が入力されるとき
は、表示手段にエンロール動作中であることを示す所定
の表示を行なわせるようにする。
[0008] That is, in the first invention, a voice input device capable of recording independently and capable of data communication with an external device is used, and the external device registers data for improving the accuracy of voice recognition processing. When a voice is input to the device, a predetermined display indicating that the enrolling operation is being performed is displayed on the display means.

【0009】また、第2の発明においては、単独で録音
可能かつ外部装置とのデータ通信が可能であって、表示
手段を備えた音声入力装置と、この音声入力装置から受
信した音声データを音声認識処理させる音声認識処理装
置とにより音声認識システムを構成し、受信した音声情
報に対する音声認識処理の精度向上のためのデータを登
録させるエンロール動作が上記音声認識処理装置により
行なわれている間は、上記音声入力装置の表示手段にエ
ンロール動作中であることを示す所定の表示を行なわせ
るようにする。
According to the second aspect of the present invention, there is provided a voice input device provided with a display means, capable of recording data independently and communicating with an external device, and transmitting voice data received from the voice input device in voice. A speech recognition system is configured with the speech recognition processing device for performing the recognition process, and while the enrollment operation for registering data for improving the accuracy of the speech recognition process for the received speech information is performed by the speech recognition processing device, The display means of the voice input device is caused to perform a predetermined display indicating that the enrolling operation is being performed.

【0010】また、第3の発明に係る音声入力装置は、
第1の発明に係る音声入力装置において、カウントを動
作させることにより上記エンロール動作中であることを
示す表示を行なわせるようにする。
[0010] The voice input device according to a third aspect of the present invention includes:
In the voice input device according to the first invention, a display indicating that the enrolling operation is being performed is performed by operating a count.

【0011】[0011]

【発明の実施の形態】以下、図面を参照して本発明の実
施形態を詳細に説明する。図1は本発明の音声入力装置
を適用したデジタルレコーダの構成を示す図である。図
1において、マイク1は増幅器(AMP)2を介してロ
ーパスフィルタ(LPF)3に接続されている。このロ
ーパスフィルタ3は増幅器17を介してオーディオ出力
端子18に接続されるとともに、アナログデジタルコン
バータ(A/D)4を介してデジタル信号処理部(DS
P)5のT1端子に接続されている。このDSP5のT
2端子にはデジタルアナログコンバータ(D/A)9と
ローパスフィルタ(LPF)10と増幅器(AMP)1
1とを介してスピーカ12が接続されている。
Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 1 is a diagram showing a configuration of a digital recorder to which a voice input device according to the present invention is applied. In FIG. 1, a microphone 1 is connected to a low-pass filter (LPF) 3 via an amplifier (AMP) 2. The low-pass filter 3 is connected to an audio output terminal 18 via an amplifier 17 and a digital signal processor (DS) via an analog / digital converter (A / D) 4.
P) 5 is connected to the T1 terminal. T of this DSP5
A digital-analog converter (D / A) 9, a low-pass filter (LPF) 10, and an amplifier (AMP) 1 are connected to two terminals.
1 is connected to the speaker 12.

【0012】DSP5のT3端子はシステム制御部(C
PU)6のT4端子に接続されている。CPU6のT5
端子にはPC接続端子16が接続され、T6端子には駆
動回路13を介して表示部(表示手段)14が接続さ
れ、T7端子には電源制御部15が接続され、T8端子
には内蔵された記録媒体7が接続されている。この記録
媒体7は着脱自在なものであってもよい。
The T3 terminal of the DSP 5 is connected to the system control unit (C
PU) 6 is connected to the T4 terminal. T5 of CPU6
A PC connection terminal 16 is connected to the terminal, a display unit (display means) 14 is connected to the T6 terminal via the drive circuit 13, a power control unit 15 is connected to the T7 terminal, and a built-in is built in the T8 terminal. Recording medium 7 is connected. This recording medium 7 may be removable.

【0013】さらにCPU6には各種の操作釦(録音釦
REC、再生釦PLAY、停止釦STOP、スキップ釦
SKIP、セレクト釦SEL)を備えた操作入力部8が
接続されている。
Further, the CPU 6 is connected to an operation input unit 8 having various operation buttons (recording button REC, reproduction button PLAY, stop button STOP, skip button SKIP, select button SEL).

【0014】本実施形態のデジタルレコーダは、外部装
置あるいは音声認識処理装置としてのパーソナルコンピ
ュータ(以下、PCと呼ぶ)と接続されて音声認識シス
テムを構成し、エンロール処理や音声認識処理などの種
々の処理をPCに行なわせるPC−LINKモードを備
えている。ここではデジタルレコーダをリモコンマイク
として用いてエンロール作業を行なうことを想定する。
すなわち、まず、オーディオ出力端子18をケーブルな
どによりPCのオーディオ入力端子に接続した後、エン
ロールモードを設定する。次に、PCの画面に表示され
たエンロール用の文章を読み上げることによりマイク1
から音声を入力し、増幅器2で増幅した後、ローパスフ
ィルタ3で不要成分を除去する。次に増幅器17により
送信可能な信号レベルに増幅しアナログ信号のままオー
ディオ出力端子18からPCに送信する。なお、赤外線
などの無線による方法を用いても良い。
The digital recorder of this embodiment is connected to an external device or a personal computer (hereinafter, referred to as a PC) as a speech recognition processing device to constitute a speech recognition system, and performs various processes such as enroll processing and speech recognition processing. A PC-LINK mode is provided for causing the PC to perform processing. Here, it is assumed that enroll work is performed using a digital recorder as a remote control microphone.
That is, first, the audio output terminal 18 is connected to the audio input terminal of the PC by a cable or the like, and then the enroll mode is set. Next, by reading out the text for enrollment displayed on the screen of the PC, the microphone 1 is read.
After the audio is input from the amplifier 2 and amplified by the amplifier 2, unnecessary components are removed by the low-pass filter 3. Next, the signal is amplified to a transmittable signal level by the amplifier 17 and transmitted as an analog signal from the audio output terminal 18 to the PC. Note that a wireless method such as infrared rays may be used.

【0015】また、アナログ信号の形態でPCに送信す
る代わりに、マイク1から入力した音声をアナログデジ
タルコンバータ4でデジタル信号に変換した後、デジタ
ル信号処理部5で圧縮して符号化音声データとしてPC
に送信するようにしてもよい。この場合はPC側が受信
した符号化音声データを復号する機能を備えていること
が前提となる。
Also, instead of transmitting the signal to the PC in the form of an analog signal, the sound input from the microphone 1 is converted into a digital signal by the analog-to-digital converter 4 and then compressed by the digital signal processing unit 5 to generate encoded sound data. PC
May be transmitted. In this case, it is assumed that the PC has a function of decoding the encoded audio data received.

【0016】以下に、上記したデジタルレコーダの一般
的な録音再生動作を説明する。操作者がREC釦を押す
と録音モードとなり、マイク1から入力された音声が電
気信号に変換された後、増幅器2により増幅され、LP
F3によりその不要成分が除去される。その後アナログ
デジタルコンバータ4によりデジタル信号に変換されて
DSP5に入力される。このDSP5でデジタル音声信
号に対する圧縮処理が施された後、CPU6の制御のも
とに音声データとして記録媒体7に記録される。
The general recording / reproducing operation of the above-mentioned digital recorder will be described below. When the operator presses the REC button, a recording mode is set, and the sound input from the microphone 1 is converted into an electric signal, which is then amplified by the amplifier 2, and
The unnecessary components are removed by F3. Thereafter, the signal is converted into a digital signal by the analog-digital converter 4 and input to the DSP 5. After the DSP 5 performs a compression process on the digital audio signal, the digital audio signal is recorded on the recording medium 7 as audio data under the control of the CPU 6.

【0017】また、操作者がPLAY釦を押すと再生モ
ードとなり、CPU6の制御のもとに記録媒体7から音
声データが読み出された後、DSP5において伸長処理
が施される。伸長された音声信号はデジタルアナログコ
ンバータ9でアナログ信号に変換された後、ローパスフ
ィルタ10でその不要成分が除去され、増幅器11で増
幅された後、スピーカ12から音声として出力される。
When the operator presses the PLAY button, the reproduction mode is set. After the audio data is read from the recording medium 7 under the control of the CPU 6, the DSP 5 performs an expansion process. The expanded audio signal is converted into an analog signal by a digital-to-analog converter 9, its unnecessary components are removed by a low-pass filter 10, amplified by an amplifier 11, and then output as audio from a speaker 12.

【0018】上記した音声の録音動作中あるいは再生動
作中にSTOP釦が押された場合にはそのときの動作が
停止される。また、表示部14にはモードに応じて各種
の情報が表示される。また、電源制御部15は装置内の
各部に供給される電源を制御したり、省電力の制御を行
なうものである。
If the STOP button is pressed during the above-described sound recording or reproduction operation, the operation at that time is stopped. Various kinds of information are displayed on the display unit 14 according to the mode. The power control unit 15 controls power supplied to each unit in the apparatus and controls power saving.

【0019】図2は上記したデジタルレコーダの外観を
示す図であり、操作入力部8としてのREC釦、PLA
Y釦、STOP釦、SKIP釦、SEL釦の他に、マイ
ク1、表示部14、スピーカ12、PC接続端子16、
オーディオ出力端子18が所定の位置に配置されてい
る。
FIG. 2 is a view showing the external appearance of the above-mentioned digital recorder.
In addition to the Y button, STOP button, SKIP button, and SEL button, a microphone 1, a display unit 14, a speaker 12, a PC connection terminal 16,
An audio output terminal 18 is arranged at a predetermined position.

【0020】図3は操作者からの操作入力に基づいたC
PUの処理の詳細を説明するためのフローチャートであ
る。電池を装填することで本フローがスタートし、まず
ステップS1でメモリチェックなどの動作のための初期
設定を行なった後、レコーダモードになって図5(A)
に示すような情報が表示部14に表示される(ステップ
S2)。表示部14の表示領域Aに表示されている“N
o.1”はファイルNo.を示し、表示領域Bに表示さ
れている“0001”はカウンタによるカウント値を示
している。カウンタのカウント値は各ファイルごとに0
〜nまで用意されている。表示領域Cに表示されている
“REC”はモード表示であり、現在、記録モードであ
ることを示している。再生モード時は“PLAY”が表
示され、停止モード時は何も表示されない。
FIG. 3 shows C based on an operation input from the operator.
It is a flowchart for demonstrating the detail of a process of PU. This flow starts when a battery is loaded. First, in step S1, initial settings for an operation such as a memory check are performed, and then the recorder mode is set, and FIG.
Is displayed on the display unit 14 (step S2). “N” displayed in the display area A of the display unit 14
o. "1" indicates the file number, and "0001" displayed in the display area B indicates the count value of the counter.The count value of the counter is 0 for each file.
To n. “REC” displayed in the display area C is a mode display, and indicates that the current mode is the recording mode. “PLAY” is displayed in the reproduction mode, and nothing is displayed in the stop mode.

【0021】次にSEL釦が入力されたかどうかを判断
し(ステップS3)、NOの場合にはステップS4に進
んでREC釦が入力されたかどうかを判断する。ここで
YESの場合にはステップS8に移行して録音処理(R
EC処理)を行なってステップS3に戻る。また、ステ
ップS4の判断がNOの場合にはステップS5に進んで
PLAY釦が入力されたかどうかを判断する。ここでY
ESの場合にはステップS9に移行して再生処理(PL
AY処理)を行なってステップS3に戻る。
Next, it is determined whether or not the SEL button has been input (step S3). If NO, the process proceeds to step S4 to determine whether or not the REC button has been input. If YES here, the process shifts to step S8 to perform the recording process (R
EC processing) and returns to step S3. If the determination in step S4 is NO, the process proceeds to step S5 to determine whether the PLAY button has been input. Where Y
In the case of ES, the process proceeds to step S9, and the reproduction process (PL
AY processing) and returns to step S3.

【0022】また、ステップS5の判断がNOの場合に
はステップS6に進んでSKIP釦が入力されたかどう
かを判断し、YESの場合にはステップS10に移行し
てSKIP処理を行なってステップS3に戻る。SKI
P処理はファイルNo.を変更する処理であり、SKI
P釦が押されるごとに表示されるファイルNo.が変更
される。
If the determination in step S5 is NO, the flow advances to step S6 to determine whether the SKIP button has been pressed. If the determination is YES, the flow shifts to step S10 to perform SKIP processing and then to step S3. Return. SKI
P processing is performed for the file No. Is the process of changing the SKI
File No. displayed every time the P button is pressed. Is changed.

【0023】また、ステップS6の判断がNOの場合に
はステップS7に進んで、操作入力が5分以上なかった
かどうかを判断し、NOの場合にはステップS3に戻
り、YESの場合にはステップS20に移行して省電力
モードの設定を行なう。その後は何らかの操作入力があ
ったかどうかを判断(ステップS21)しながら省電力
モードを維持する。何らかの操作入力があったときにス
テップS21の判断がYESとなってステップS1に戻
る。
If the determination in step S6 is NO, the process proceeds to step S7 to determine whether there has been no operation input for 5 minutes or more. If NO, the process returns to step S3, and if YES, the process returns to step S3. The process proceeds to S20 to set the power saving mode. After that, the power saving mode is maintained while determining whether or not any operation input has been made (step S21). If there is any operation input, the determination in step S21 becomes YES and the process returns to step S1.

【0024】一方、ステップS3でYESの場合にはス
テップS11に移行して消去モード(ERASEモー
ド)の表示を行なう。このERASEモード時は図5
(B)に示すように表示領域AにファイルNo.が表示
されるとともに、表示領域Cには“ERASE”が表示
される。次にSEL釦が入力されたかどうかを判断し
(ステップS12)、NOの場合にはステップS13に
進んで、操作入力が5分以上なかったかどうかを判断
し、NOの場合にはステップS14に進んで消去すべき
ファイルを選択する。ファイルの選択はSKIP釦を逐
次押すことで行なわれる。ファイルNo.は非選択時に
点滅し、選択時においては点灯状態になる。次にREC
釦が押されたかどうかにより選択されたファイルを消去
すべきかどうかの確認(ステップS15)を行なった
後、選択ファイルを消去する(ステップS16)。消去
中は表示領域Cの“ERASE”が点滅する。
On the other hand, if YES in the step S3, the process shifts to a step S11 to display an erase mode (ERASE mode). In this ERASE mode,
As shown in FIG. Is displayed, and “ERASE” is displayed in the display area C. Next, it is determined whether or not the SEL button has been input (step S12). If NO, the process proceeds to step S13, and it is determined whether or not the operation input has been performed for 5 minutes or more. If NO, the process proceeds to step S14. Use to select the file to be deleted. The file is selected by sequentially pressing the SKIP button. File No. Flashes when not selected, and is lit when selected. Next, REC
After confirming whether the selected file should be deleted based on whether the button is pressed (step S15), the selected file is deleted (step S16). During erasing, “ERASE” in the display area C blinks.

【0025】また、ステップS13の判断がYESの場
合にはステップS20に移行して省電力モードを設定
し、その後は何らかの操作入力があったかどうかを判断
(ステップS21)しながら省電力モードを維持する。
何らかの操作入力があったときにステップS21の判断
がYESとなってステップS1に戻る。
If the determination in step S13 is YES, the process shifts to step S20 to set the power saving mode. Thereafter, it is determined whether or not there is any operation input (step S21), and the power saving mode is maintained. .
If there is any operation input, the determination in step S21 becomes YES and the process returns to step S1.

【0026】また、ステップS12の判断がYESの場
合にはステップS17に移行してPC−LINKモード
の表示を行なう。PC−LINKモードでは図5(C)
に示すように、表示領域CにはPC−LINKモードで
あることを示す“PC−LINK”が表示される。
If the determination in step S12 is YES, the process shifts to step S17 to display the PC-LINK mode. FIG. 5C in the PC-LINK mode.
"PC-LINK" indicating the PC-LINK mode is displayed in the display area C as shown in FIG.

【0027】次に、ステップS18に進んでSEL釦が
入力されたかどうかを判断し、NOの場合はステップS
2に戻り、YESの場合はステップS19に進んでPC
−LINK処理を行なってステップS17に戻る。
Next, the process proceeds to step S18, where it is determined whether or not the SEL button has been pressed.
2 and in the case of YES, the process proceeds to step S19 and the PC
A LINK process is performed, and the process returns to step S17.

【0028】上記したことからわかるように、本実施形
態では、SEL釦が2回入力されたときにPC−LIN
Kモードの表示を行ない、さらにSEL釦が入力された
場合にPC−LINK処理を行なうようになっている。
As can be seen from the above description, in this embodiment, when the SEL button is input twice, the PC-LIN
A K-mode display is performed, and a PC-LINK process is performed when the SEL button is pressed.

【0029】図4は上記したPC−LINKモードの1
つとしてのエンロールモードにおいて、使用者の音声の
特徴を予め登録するときの詳細を示すフローチャートで
ある。エンロールモードを設定すると図5(D)に示す
ように、表示領域Cには“ENROLL”が表示され
る。ステップS50でPC−レコーダ間の接続を確認
し、接続が正常になされているかどうかを判断する(ス
テップS51)。ここでNOの場合には接続が正常状態
になるまで待機する。接続が正常であることが確認され
た場合にデジタルレコーダとPCとの間のデータ通信が
可能になる。この場合はステップS51の判断がYES
となり次のステップS52に進んでPC上にエンロール
用の文章を表示する。ここでは図6に示すように、用意
されている300の文章のうちの1番目の文章として
“この文章を読み上げて下さい。”のメッセージが表示
されるとともに、エンロール処理を開始させるための
“開始”釦と、エンロール処理を停止させるための“停
止”釦が表示される。
FIG. 4 shows one example of the PC-LINK mode.
9 is a flowchart showing details when a feature of a user's voice is registered in advance in one enroll mode. When the enroll mode is set, “ENROLL” is displayed in the display area C as shown in FIG. In step S50, the connection between the PC and the recorder is confirmed, and it is determined whether or not the connection is normally made (step S51). In the case of NO here, the process stands by until the connection becomes normal. When the connection is confirmed to be normal, data communication between the digital recorder and the PC becomes possible. In this case, the determination in step S51 is YES
Then, the flow advances to the next step S52 to display a text for enrollment on the PC. Here, as shown in FIG. 6, a message "Please read this sentence." Is displayed as the first sentence of the 300 sentences prepared, and "Start" for starting the enrollment process is performed. A "button" and a "stop" button for stopping the enrollment process are displayed.

【0030】次に操作者からの入力開始の指示があった
かどうかを判断する(ステップS53)。ここではRE
C釦の入力があったかどうかにより判断する。REC釦
の入力があった場合には入力開始を示す制御信号がPC
に送信される。次にステップS54において操作者がP
Cの画面に表示されている文章を読み上げることにより
マイク1を介して音声の入力が開始され、入力された音
声データはオーディオ出力端子18を介してPCへ送信
される。これと同時に、音声入力中であることを操作者
に知らせるためにカウンタを動作させて表示部14の表
示領域Bのカウント値をインクリメントする(ステップ
S55)。カウンタを動作させる代わりに、表示領域C
の“ENROLL”を点滅させるようにしてもよい。次
にこの音声の入力中にエラーが発生したかどうかを判断
する(ステップS56)。ここでは、音声入力中に背景
雑音などの、操作者の音声からかけ離れた音が入力され
た場合にエラーとして処理される。また、操作者が音声
入力を中断するべくSTOP釦を入力した場合にも入力
エラーとして処理される。入力エラーの場合にはカウン
タのカウント動作を停止して(ステップS57)、表示
部14に図5(E)に示すようなエラー表示を行なって
(ステップS58)、ステップS52に戻り同じ文章を
読み上げることで音声入力を再度行なう。
Next, it is determined whether or not an input start instruction has been received from the operator (step S53). Here, RE
Judgment is made based on whether the C button is input. When the REC button is input, the control signal indicating the start of the input
Sent to. Next, in step S54, the operator sets P
By reading out the text displayed on the screen of C, the input of voice through the microphone 1 is started, and the input voice data is transmitted to the PC through the audio output terminal 18. At the same time, the counter is operated to notify the operator that voice input is being performed, and the count value of the display area B of the display unit 14 is incremented (step S55). Instead of operating the counter, display area C
"ENROLL" may be blinked. Next, it is determined whether or not an error has occurred during the input of the voice (step S56). Here, if a sound such as background noise that is far from the operator's voice is input during voice input, it is processed as an error. Also, when the operator presses the STOP button to interrupt the voice input, it is processed as an input error. In the case of an input error, the counting operation of the counter is stopped (step S57), an error display as shown in FIG. 5E is made on the display unit 14 (step S58), and the process returns to step S52 to read out the same sentence. Then, voice input is performed again.

【0031】また、ステップS56の判断がNOの場合
には次のステップS59で1つの文章の音声入力が終了
したかどうかを判断する。ここでNOの場合にはステッ
プS55に戻る。入力エラーがなく1つの文章の音声入
力がされている間はカウント動作が継続して行なわれ、
1つの文章の音声入力が終了したときにステップS59
の判断がYESとなって次にステップS60でカウンタ
のカウント動作を停止する。
If the determination in step S56 is NO, it is determined in next step S59 whether the voice input of one sentence has been completed. Here, in the case of NO, the process returns to step S55. While there is no input error and the voice input of one sentence is being performed, the counting operation is continuously performed.
When the voice input of one sentence is completed, step S59
Is YES, and then the counting operation of the counter is stopped in step S60.

【0032】次にエンロール動作が終了かどうかを判断
し(ステップS61)、終了の場合にはリターンし、ま
だエンロールすべき文章が残っている場合には次の文章
をPCの画面に表示(ステップS62)した後、ステッ
プS54に戻って音声入力を継続する。このようにして
所定の数(ここでは例えば300)の文章の読み上げが
終了したときにステップS61の判断がYESとなって
エンロールモードからぬける。
Next, it is determined whether or not the enroll operation is completed (step S61). If the enroll operation is completed, the process returns. If there is still a document to be enrolled, the next document is displayed on the PC screen (step S61). After S62), the process returns to step S54 to continue the voice input. When a predetermined number of sentences (here, for example, 300) have been read aloud in this way, the determination in step S61 becomes YES, and the process exits the enrollment mode.

【0033】上記した実施形態によれば、エンロールモ
ード時は、図5(D)に示すような“ENROLL”の
表示を行なった上で、カウンタを動作させてカウント値
をインクリメントするようにしたので操作者はエンロー
ルモードで音声入力中であることを容易に認識すること
ができる。また、カウンタは、録音や再生などの進行状
況を表すものとしてデジタルレコーダに通常備わってい
るものであるが、本実施形態ではこれを音声入力中であ
ることを示す標識として兼用しているので、そのための
専用の表示スペースを設ける必要がない。
According to the above-described embodiment, in the enroll mode, "ENROLL" is displayed as shown in FIG. 5D, and then the counter is operated to increment the count value. The operator can easily recognize that voice input is being performed in the enroll mode. In addition, the counter is normally provided in the digital recorder as an indicator of the progress of recording or playback, but in the present embodiment, this is also used as a sign indicating that voice input is being performed. There is no need to provide a dedicated display space for that.

【0034】また、単独で録音可能な音声入力装置とし
てのデジタルレコーダの操作部に設けられた操作釦(こ
こではREC釦、STOP釦)を用いてエンロール処理
を行なうようにしたので、PCの画面に表示された開始
釦や停止釦をマウスなどでクリックすることなしにエン
ロール処理を行なうことができる。また、デジタルレコ
ーダが単独で用いられるときにモードを設定するために
用いられるREC釦やSTOP釦などの操作釦を、音声
認識用の操作釦として兼用することで音声認識専用の操
作釦を新たに設ける必要がなくなる。
Further, the enrollment process is performed using operation buttons (here, REC button, STOP button) provided on the operation unit of the digital recorder as a voice input device capable of recording independently. The enrollment process can be performed without clicking the start button or the stop button displayed in (2) with a mouse or the like. Also, an operation button such as a REC button or a STOP button used for setting a mode when the digital recorder is used alone is also used as an operation button for voice recognition, thereby newly providing an operation button dedicated to voice recognition. There is no need to provide them.

【0035】なお、上記した具体的実施形態には以下の
構成を有する発明が含まれている。 (1) 表示手段を備え、単独で録音可能であり外部装
置とのデータ通信が可能な音声入力装置と、音声入力装
置から送信された音声データを受信し、受信した音声デ
ータを音声認識処理させる音声認識処理装置と、を有す
る音声認識システムであって、上記音声認識処理装置
は、音声認識処理の精度向上のためのデータを登録させ
るエンロール機能を有しており、上記音声入力装置に音
声が入力され、入力された音声情報が上記音声認識処理
装置に送信されて、上記音声認識処理装置でエンロール
動作が行なわれている間は、上記音声入力装置の表示手
段にエンロール動作中であることを示す所定の表示を行
なわせることを特徴とする請求項1記載の音声認識シス
テム。
The specific embodiments described above include inventions having the following configurations. (1) An audio input device that includes a display unit, is capable of recording independently, and can perform data communication with an external device, receives audio data transmitted from the audio input device, and performs a voice recognition process on the received audio data. And a voice recognition processing device, wherein the voice recognition processing device has an enroll function for registering data for improving the accuracy of voice recognition processing, and a voice is input to the voice input device. While the input voice information is transmitted to the voice recognition processing device and the enrollment operation is being performed in the voice recognition processing device, the display means of the voice input device indicates that the enrollment operation is being performed. 2. The voice recognition system according to claim 1, wherein a predetermined display is performed.

【0036】(2) 上記エンロール動作中であること
を示す表示は、カウンタを動作させることにより行なう
ことを特徴とする(1)に記載の音声認識システム。
(2) The speech recognition system according to (1), wherein the display indicating that the enrolling operation is being performed is performed by operating a counter.

【0037】上記した(1)に記載の発明によれば、エ
ンロールモードであることを容易に認識することができ
るという効果を奏する。
According to the invention described in the above (1), it is possible to easily recognize the enroll mode.

【0038】また、(2)に記載の発明によれば、
(1)に記載の発明の効果に加えて、音声入力中である
ことを表示するための専用のスペースを設ける必要がな
いという効果を奏する。
According to the invention described in (2),
In addition to the effect of the invention described in (1), there is an effect that it is not necessary to provide a dedicated space for displaying that voice input is being performed.

【0039】[0039]

【発明の効果】請求項1または2に記載の発明によれ
ば、エンロールモードであることを容易に認識すること
ができるという効果を奏する。
According to the first or second aspect of the present invention, it is possible to easily recognize the enroll mode.

【0040】また、請求項3に記載の発明によれば、請
求項1に記載の発明の効果に加えて、音声入力中である
ことを表示するための専用のスペースを設ける必要がな
いという効果を奏する。
According to the third aspect of the present invention, in addition to the effect of the first aspect, it is not necessary to provide a dedicated space for displaying that voice input is being performed. To play.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の音声入力装置を適用したデジタルレコ
ーダの構成を示す図である。
FIG. 1 is a diagram showing a configuration of a digital recorder to which a voice input device according to the present invention is applied.

【図2】デジタルレコーダの外観を示す図である。FIG. 2 is a diagram illustrating an appearance of a digital recorder.

【図3】操作者からの操作入力に基づいたCPUの処理
の詳細を説明するためのフローチャートである。
FIG. 3 is a flowchart illustrating details of processing by a CPU based on an operation input from an operator.

【図4】PC−LINKモードの1つとしてのエンロー
ルモードにおいて使用者の音声を予め登録するときの詳
細を示すフローチャートである。
FIG. 4 is a flowchart showing details when a user's voice is registered in advance in an enroll mode as one of the PC-LINK modes.

【図5】各モードにおける表示部の表示を示す図であ
る。
FIG. 5 is a diagram showing a display on a display unit in each mode.

【図6】エンロール時におけるPCの画面表示を示す図
である。
FIG. 6 is a diagram showing a screen display of a PC at the time of enrollment.

【符号の説明】[Explanation of symbols]

1…マイク、 2…増幅器(AMP)、 3…ローパスフィルタ(LPF)、 4…アナログデジタルコンバータ(A/D)、 5…DSP、 6…制御部(CPU)、 7…記録媒体、 8…操作入力部、 9…デジタルアナログコンバータ(D/A)、 10…ローパスフィルタ(LPF)、 11…増幅器(AMP)、 12…スピーカ、 13…駆動回路、 14…表示部、 15…電源制御部、 16…PC接続端子、 17…増幅器(AMP) 18…オーディオ出力端子。 DESCRIPTION OF SYMBOLS 1 ... Microphone, 2 ... Amplifier (AMP), 3 ... Low-pass filter (LPF), 4 ... Analog-digital converter (A / D), 5 ... DSP, 6 ... Control part (CPU), 7 ... Recording medium, 8 ... Operation Input unit, 9: Digital-to-analog converter (D / A), 10: Low-pass filter (LPF), 11: Amplifier (AMP), 12: Speaker, 13: Drive circuit, 14: Display unit, 15: Power supply control unit, 16 ... PC connection terminal 17 ... Amplifier (AMP) 18 ... Audio output terminal

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 単独で録音可能であり外部装置とのデー
タ通信が可能な音声入力装置であって、 表示手段と、 外部装置に音声認識処理の精度向上のためのデータ登録
を行なわせるために音声が入力されるときは、上記表示
手段にエンロール動作中であることを示す所定の表示を
行なわせる制御手段と、 を具備したことを特徴とする音声入力装置。
An audio input device capable of recording independently and capable of data communication with an external device, comprising: a display means; and an external device for registering data for improving accuracy of voice recognition processing. Control means for causing the display means to perform a predetermined display indicating that an enrolling operation is being performed when a sound is input, the sound input apparatus comprising:
【請求項2】 表示手段を備え、単独で録音可能であり
外部装置とのデータ通信が可能な音声入力装置と、 音声入力装置から送信された音声データを受信し、受信
した音声データを音声認識処理させる音声認識処理装置
と、 を有する音声認識システムであって、 上記音声認識処理装置は、音声認識処理の精度向上のた
めのデータを登録させるエンロール機能を有しており、
上記音声入力装置に音声が入力され、入力された音声情
報が上記音声認識処理装置に送信されて、上記音声認識
処理装置でエンロール動作が行なわれている間は、上記
音声入力装置の表示手段にエンロール動作中であること
を示す所定の表示を行なわせることを特徴とする請求項
1記載の音声認識システム。
2. A voice input device comprising a display means, capable of recording independently and capable of data communication with an external device, receiving voice data transmitted from the voice input device, and performing voice recognition on the received voice data. A voice recognition processing device to be processed, and a voice recognition system comprising: the voice recognition processing device has an enroll function for registering data for improving the accuracy of voice recognition processing;
A voice is input to the voice input device, and the input voice information is transmitted to the voice recognition processing device, and while the enrollment operation is being performed in the voice recognition processing device, a display unit of the voice input device is displayed. 2. The voice recognition system according to claim 1, wherein a predetermined display indicating that an enroll operation is being performed is performed.
【請求項3】 上記エンロール動作中であることを示す
表示は、カウンタを動作させることにより行なうことを
特徴とする請求項1記載の音声入力装置。
3. The voice input device according to claim 1, wherein the display indicating that the enrolling operation is being performed is performed by operating a counter.
JP11061490A 1999-03-09 1999-03-09 Speech input device and speech recognition system Withdrawn JP2000260170A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11061490A JP2000260170A (en) 1999-03-09 1999-03-09 Speech input device and speech recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11061490A JP2000260170A (en) 1999-03-09 1999-03-09 Speech input device and speech recognition system

Publications (1)

Publication Number Publication Date
JP2000260170A true JP2000260170A (en) 2000-09-22

Family

ID=13172599

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11061490A Withdrawn JP2000260170A (en) 1999-03-09 1999-03-09 Speech input device and speech recognition system

Country Status (1)

Country Link
JP (1) JP2000260170A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008257668A (en) * 2007-03-31 2008-10-23 Yasushi Nakamoto Voice input type language-specific personal computer, word processor, and document forming software
US8504373B2 (en) 2009-07-02 2013-08-06 Nuance Communications, Inc. Processing verbal feedback and updating digital video recorder (DVR) recording patterns

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008257668A (en) * 2007-03-31 2008-10-23 Yasushi Nakamoto Voice input type language-specific personal computer, word processor, and document forming software
US8504373B2 (en) 2009-07-02 2013-08-06 Nuance Communications, Inc. Processing verbal feedback and updating digital video recorder (DVR) recording patterns

Similar Documents

Publication Publication Date Title
WO2019033986A1 (en) Sound playback device detection method, apparatus, storage medium, and terminal
JP2002149428A (en) Audio signal processor, and method for rewriting inside data of the audio signal processor
JP2000020278A (en) Voice control computer and timepiece
JP2000260170A (en) Speech input device and speech recognition system
JP2001215997A (en) Audio recorder, information processor and recording medium recording information processing program
CN101242440A (en) A mobile phone with voice repeating function
JP2000259189A (en) Voice input device and voice processing system
JP2002041093A (en) Digital recording and reproducing device
KR910000147B1 (en) Recording and reproducing method of audio signal accoring to instructing of personal computer
JP2003131698A (en) Voice recording and reproducing device
US20050240405A1 (en) Transcription apparatus and dictation system
JP2007140063A (en) Device for sound recording and reproducing
JP4273821B2 (en) Audio data processing program
JP4998051B2 (en) File name acquisition device, file name acquisition method, and program
JP3114560B2 (en) Audio memory playback device
WO2002049032A1 (en) Digital recording/reproducing apparatus
JP3873513B2 (en) Information recording device
JP2002507772A (en) Device for information reproduction or function execution
CN201044492Y (en) Mobile phone with sound repeating function
US20050233738A1 (en) Apparatus and software program for controlling terminal
JP2553881Y2 (en) Player equipment
JP2021039386A (en) Reproduction control device, reproduction control system, reproduction control method, program, and recording medium
KR20040024432A (en) Portable accompaniment apparatus
JPH05108608A (en) Information signal processor
CN113727122A (en) Control method, system and equipment for live broadcast software

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060509