JPS5876890A - Voice recognition equipment - Google Patents

Voice recognition equipment

Info

Publication number
JPS5876890A
JPS5876890A JP56173059A JP17305981A JPS5876890A JP S5876890 A JPS5876890 A JP S5876890A JP 56173059 A JP56173059 A JP 56173059A JP 17305981 A JP17305981 A JP 17305981A JP S5876890 A JPS5876890 A JP S5876890A
Authority
JP
Japan
Prior art keywords
voice
voice recognition
center machine
recognition
telephone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56173059A
Other languages
Japanese (ja)
Inventor
吉明 北爪
遠藤 武之
栄二 大平
末広 明雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP56173059A priority Critical patent/JPS5876890A/en
Publication of JPS5876890A publication Critical patent/JPS5876890A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 本発明は、音声認識装置に係り、特に電話回線を介して
、センタマシンとの情報交侠を人間o4声した音声によ
シ行なうととt−OT能とする端末に好適な音声認識装
置に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a voice recognition device, and particularly to a terminal capable of communicating with a center machine via a telephone line using a human voice. The present invention relates to a speech recognition device suitable for.

従来の電話回線を介した音声大刀端末〔たとえばSRシ
リーズ音声認識装置(出典:大型プロジェクトパターン
情報処理システム講演論文果p135〜P143))に
おいては、センタマシンの中に音声認識装at−設けて
、人間の発声した音声を電話回線にのせ、センタ側で、
認識する形態をとっており、以下に示す欠点があった。
In a conventional voice recognition terminal via a telephone line (for example, SR series voice recognition device (source: large project pattern information processing system lecture paper results, pages 135 to 143)), a voice recognition device is installed in the center machine, The voice uttered by a human is put on the telephone line, and the center side
It takes the form of recognition, and has the following drawbacks.

■ 使用する一話回一への雑音(漏話)、回線における
傷号歪、使用ごとに切換えられる回線の差によるS/N
の変動によシ、センタ側の音声認識装置での音声入力の
品質が悪く、充分な認識性能をうる丸めに、標準パター
ンの作成その他のソフト的処理内谷が多く、その丸め価
格が高くなっている。
■ S/N due to noise (crosstalk) in each episode used, signal distortion in the line, and differences in the line that is switched each time it is used.
Due to fluctuations in the number, the quality of voice input to the voice recognition device at the center is poor, and rounding to achieve sufficient recognition performance requires creation of standard patterns and other software processing, which increases the price of rounding. ing.

■ 電話口−を用い、センタマシンで認識するためには
、不特定話者とすることも必須で、そのために高度なg
m技術を用いることが必要になるので11ffi格が高
くなっている。
■ In order for the center machine to recognize the person using the telephone, it is essential that the speaker is unspecified.
Since it is necessary to use m technology, the 11ffi rating is high.

したがって、本発明は、公知の音声認識装置での上記問
題点すなわち、電話口−を介してセンタマシン側で認識
する場合に存在する回−の影曽および不特定話者lii
!!識における問題点の双方を解決することを目的とす
る。
Therefore, the present invention solves the above-mentioned problems with known speech recognition devices, namely, the influence of the voice that exists when recognition is performed on the center machine side through a telephone and the unspecified speaker.
! ! The aim is to solve both problems in knowledge.

本発明は、センタマシンに音声認識装置を設ける場合に
避けられない上記の問題点について検討した結果、L8
1W術の進歩2よび、システムの運用の方法を考慮した
ことにより生まれたものであり、美本的には、端末側に
非婦形時間軸照合部(入力蛭声のIIF縮を吸収してパ
ターンマツチングを行なう。)LSi中心とする超小型
音声認識トrItを設けて、端末側すなわち電話機で音
声人力を行ない、さらに認J!fitにより該入力を認
識することにより、i1g鐵結釆コードをセンタtil
lに転送することt−可能にする構成にした点に特徴か
りる。
The present invention was developed as a result of studying the above-mentioned problems that are unavoidable when installing a voice recognition device in a center machine.
This was born out of consideration of the progress of the 1W technique2 and the method of system operation, and in Bihon's opinion, a non-gynecological time axis collation unit (absorbing the IIF contraction of the input leech voice) is installed on the terminal side. (Pattern matching is performed.) An ultra-compact voice recognition system mainly based on LSi is installed, voice input is performed on the terminal side, that is, a telephone, and further recognition J! By recognizing the input by fit, the i1g iron connection code is sent to the center til
The feature is that the configuration is such that it is possible to transfer data to 1 and t.

以下、実施例にもとづき本発明の詳細な説明する。Hereinafter, the present invention will be described in detail based on Examples.

第1図(A)は本発明の第1の実施例のブロック図ヲ示
す。第1図でセンタマシン1と、端末2とは回線3を介
して、データの転送上行なう。回線3は、ディジタル回
線でりるとする。/ステムの動きとしては、1詰機20
よりの廿声入力全受け、繭処理部21で、rナログ信号
At−ディジタル信号Bに変侠し、音声認識部22で、
内部する標準パターンとの照合金おこなって、最適照合
したものをIII!IIl&結果とする。
FIG. 1(A) shows a block diagram of a first embodiment of the present invention. In FIG. 1, data is transferred between a center machine 1 and a terminal 2 via a line 3. It is assumed that line 3 is a digital line. /The movement of the stem is 1 stuffing machine 20
After receiving all the voice inputs, the cocoon processing unit 21 changes the r analog signal At to the digital signal B, and the voice recognition unit 22 converts it into a digital signal B.
Verify the internal standard pattern and find the best match! IIl & result.

その認識結果Ct回姻インタフェース24全経て、回線
3に転送することにより、話者が発声した音声の内存に
対応する認識結果C(コード化する)全センタマシンl
に送ることができる。たとえば、従来ブツシュホンでキ
ーボード入力を行っていた、新幹線の座席予約とか商品
発注システムなどに2いて本発明を用いれば、音声入力
を行なえ、かつ端末側で音声認識を行なえるため、回線
の結審による認識のむずかしさを回避できる。
By transmitting the recognition result Ct to the line 3 through the communication interface 24, the recognition result C (coded) corresponding to the internal nature of the voice uttered by the speaker is obtained from all center machines l.
can be sent to. For example, if the present invention is used in systems such as Shinkansen seat reservations and product ordering systems, which conventionally required keyboard input using a butsuhon, voice input can be performed and voice recognition can be performed on the terminal side, so it is possible to Difficulties in recognition can be avoided.

第2図に、電話機への音声認識部22の爽装例を示す。FIG. 2 shows an example of installing the voice recognition section 22 in a telephone.

これは第1図(A)に示した実施例に対応するものであ
る。
This corresponds to the embodiment shown in FIG. 1(A).

LSI′f!i術の進歩は非常に着るしく1年に2@の
巣積匿の向上がちり、現状でも、音声認識部22に含ま
れるwrft安素たとえば特徴抽出、距離計算などの部
分は各々ワンチップLSIで実現可能であり、セラミッ
ク基板上にハイブリッドLS I’!I−構成すること
により音声−m、部を1セラミツク基板で実現すること
は容易でるる。
LSI'f! The progress of i-techniques is very impressive, and the number of nests is only increasing by 2 per year.Even at present, the WRFT technology included in the speech recognition unit 22, for example, features extraction, distance calculation, etc., are each implemented on one-chip LSI. It is possible to create a hybrid LS I'! on a ceramic substrate. By using the I-configuration, it is easy to realize the audio-m section on one ceramic substrate.

第2図(A)で、セラミック基板4上に特徴抽出チップ
221、距離計算チップ222、非線形照合チップ22
3、制御チップ231t−搭載し、配線41で相互結線
して、第1図(A)の音声認識部22と制御部23とを
含んだ部分を実現する。
In FIG. 2(A), a feature extraction chip 221, a distance calculation chip 222, and a nonlinear matching chip 22 are mounted on the ceramic substrate 4.
3. A control chip 231t is mounted and interconnected with wiring 41 to realize a portion including the voice recognition section 22 and control section 23 shown in FIG. 1(A).

したがって、第2図(B)のように電話機20の内部に
、第1図全体のシステムt−実現することが可能となり
1フイルム状基板5に、繭処理部21、インタフェース
24などを構成する汎用LSI7゜8・・・全搭載し、
前記屈ラミック基板4に搭載されるハイブリッドL8I
6も搭載する。ここで、本発明の前処理部21はアナロ
グ回路などでその技術的困罐さのために同一の/%イブ
リッドLSIとすることヲ避けている。
Therefore, as shown in FIG. 2(B), it is possible to realize the entire system shown in FIG. Fully equipped with LSI7゜8...
Hybrid L8I mounted on the flexible lamic board 4
6 will also be installed. Here, the preprocessing section 21 of the present invention is an analog circuit or the like, and it is avoided to use the same hybrid LSI due to the technical difficulty thereof.

回路への電源の供給は、電話機20への電源を用いれば
よい。
The power to the telephone 20 may be used to supply power to the circuit.

第1図では音声認識部22の詳細を示していないが、内
部に第2図(A)に示したような各部をもっており、さ
らに標準パターンを格納するメモ1−有する。(音声認
識装置の構成については、央願昭54−83773号を
参照のこと。)’ML話回綜を介した音声入力では、電
話機を利用するのか不特定な話者でるるから、不%足話
者認講が必須となるため、標準パターン格粕用メモリに
FL U M k用いて不特定話者向けのパターンtm
定する。
Although the details of the speech recognition section 22 are not shown in FIG. 1, it has internal sections as shown in FIG. 2(A), and also has a memo 1 for storing standard patterns. (For the configuration of the voice recognition device, please refer to Ogan No. 54-83773.) 'In voice input via ML speech synthesis, there are no specific speakers who may be using telephones, so Since a speaker certification course is required, a pattern for unspecified speakers is created by using FLU M k in the memory for the standard pattern kakukasu.
Set.

次に、第2の実施例について説明する。Next, a second example will be described.

これは、第11M+ (B )に示したシステムであり
音声合成sを付加してその出力により認識結果を確認す
る機能を設けた点に特徴がある。
This is the system shown in No. 11M+ (B), and is characterized by the addition of speech synthesis s and the provision of a function to confirm the recognition result by its output.

第1の実施例では図示にしないがセンタマシンから送ら
tてくる音声ガイタンスにしたがい、1史川場が音声に
より、各部の悄轍な入力していくから、センタマシンへ
転送する前に、tgmb米の確認ができない、確認する
とすれは、再ひセンタマシン力・らの確認の音声を送り
〃・え丁ためにオーバヘットか大モくなる。
In the first embodiment, although it is not shown in the drawings, in accordance with the voice guidance sent from the center machine, the first person Kawaba enters a tedious input into each part by voice, so before transferring it to the center machine, the tgmb If the confirmation cannot be made, the confirmation voice will be sent again by the central machine and the overhead will be large.

こfLIIL均して、&42の実施例では、背声合成部
25の出力により1LH1!M果會確略して力・ら転送
できるために、センタマシン側の負%’に減少できる。
In the example of &42, the output of the back voice synthesizer 25 is 1LH1! Since the M effect can be ensured and the force can be transferred, it can be reduced to a negative percentage on the center machine side.

音声上“fJ!i、825は、坊状でもLSI化されて
おシ、小型化が谷易なため、第2図にボす美装に問題は
ない。
Audio wise, "fJ!i, 825, even though it has a bow shape, is made into an LSI and is easy to miniaturize, so there is no problem with the aesthetics shown in Figure 2.

第2図1B)において音声登球用梱助メモリ10會リー
ド組9と平山助メモリインタフェース2b會介して音声
認識部22に接続しているが、こfl、U軸定酷堝の電
話回線を弁した誉声認−を可能とすることケ目的とする
もので、当面情景の多い少数給い(数飴〃・ら100[
りのシステムにおいて、南効となる。センタマシン側に
Mfllfi(in設fffc場合に、物足話者とする
ことは、標準パターンの登録および切侠えに笑貴上無理
がめる。それは、センタマシンをアクセスする話者の欽
たけの大容量メモリヶセンタマシン側に設灯なけれはな
らないことと、竪足話名°のパターンを作成する場合に
センタマシンを占南するeJ能性がめゐことなどのため
でめる。したがってセンタマシン9411に略瞳装置i
1’?おく場合には不特建話名餡眞が必須となる。
In Fig. 2 (1B), the voice climbing auxiliary memory 10 is connected to the voice recognition section 22 via the lead set 9 and the Hirayama assistant memory interface 2b, but in this case, the telephone line of the U-axis station is connected to the voice recognition unit 22. The purpose is to make it possible to receive praise and praise for the person who spoke, and for the time being, there will be a small number of salaries (Sakuame, et al. 100 [
In this system, it becomes a southern effect. If Mfllfi (inffc) is installed on the center machine side, it will be difficult to register a standard pattern and to be a reasonable speaker. This is because the memory must be equipped with a light on the center machine side, and when creating a pattern of vertical words, the eJ ability to illuminate the center machine is desirable.Therefore, the center machine 9411 Approximately pupil device i
1'? If you are going to write a story, it is essential to use the futokukenwa name anshin.

本先明では、電話機20の外部に廿声曾鰍用袖助メモリ
10を設けて、端末側で、使用者が自分の電詰憬を用い
て楠準パターン?登録できるので、°センタマシンのオ
ーバヘットニナい。前述のよう“に少数給いのγプリケ
ーションでは、音坤登録用補助メモリ10は磁気カート
などの簡易補助メモリでよく、−和登録しためとは、1
史用堝ごとのさしかえで済む。
In the present invention, the telephone 20 is provided with an external storage memory 10, so that the user can use his/her own electronic device to record the Kusunoki pattern on the terminal side. Since it can be registered, the overhead of the center machine is reduced. As mentioned above, in the γ application where a small amount of money is paid, the auxiliary memory 10 for registering the sound may be a simple auxiliary memory such as a magnetic cart.
All you have to do is replace each historical pot.

話者が標準パターンを登録するために、脇2図に示すよ
うに、リード線9と補助メモリインタフェース26が必
要で、具体的には、話堝が発崗した音声が)詰機20、
前処理部21會介して、テイジタル′@号に変換もれ、
音声認識部22に導かれる。
In order for the speaker to register the standard pattern, as shown in Figure 2, a lead wire 9 and an auxiliary memory interface 26 are required.
Through the pre-processing unit 21, it is converted into a digital '@ number,
It is guided to the speech recognition section 22.

音声認識部22の内部の特徴抽出テップ221で、その
音声にa色する%徴が抽出δしる。%像抽出チップ22
1は、たとえはフィルタパンクなどで構成され、入力音
声の各時点で、七の音声に灼応する%徴パラメータ出力
會出す。
In a feature extraction step 221 inside the speech recognition unit 22, the percentage features that are a-colored in the speech are extracted δ. % image extraction chip 22
1 is composed of, for example, a filter puncture, and at each point in time of the input voice, outputs a percentage parameter corresponding to the voice of 7.

したがって、話者が兄声した音声は、最終的には、%像
抽出チップ221より出力される特徴パラメータとなり
補助配憶メモリに記憔され該当話者に対する標準パター
ンとなる。
Therefore, the voice voiced by the speaker eventually becomes a feature parameter output from the image extraction chip 221, and is stored in the auxiliary storage memory and becomes a standard pattern for the corresponding speaker.

本発明の他の実施汐りとし又、第11汐(1−1)にお
ける音脚合成部25または音声登録用補助メモリ10と
補助メモリインタフェース2byあわせた部分のいずれ
か’km絖しない構成にすることも可能でおる。
In accordance with another embodiment of the present invention, either the sound leg synthesis unit 25 in the 11th station (1-1) or the combination of the auxiliary memory 10 for voice registration and the auxiliary memory interface 2by is configured to have a configuration in which there is no difference in length. It is also possible.

本兄ψ」は、センタマシン音吐ひ出す時に、通常のダイ
ヤルあるいはプッシュボ′タンによシ行なってもよいし
、音声誌RWIi来をコード化した一例としてダイヤル
出力あるいはプッンユホンの多周波出力を送出した音声
ダイヤル方式としてもよい。
When emitting the sound of the center machine, you can use a normal dial or push button, or as an example of encoding the audio magazine RWIi, you can send out the dial output or the multi-frequency output of Punyuhon. A voice dialing method may also be used.

また他のh法たとえは、認識結末コードを用いセンタマ
シンとの転送規則(プロトコル)7に決めることにより
、センタマシンとのテ゛−タ転送の回/11111を形
成してもよい。以上説明したように、木兄1」によれは
、端末側で認識して、センタマシンへは、ル6識結来コ
ート全転送すtしはよいから、回線の影響がなく安仙1
な絡識装(至)が実現できる。
In another example of the H method, the data transfer cycle/11111 with the center machine may be formed by determining the transfer rule (protocol) 7 with the center machine using the recognition result code. As explained above, it is possible to recognize the error on the terminal side and transfer the entire code to the center machine, so there is no influence on the line and Ansen 1
It is possible to realize a very sophisticated system.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は、本蛇明の一実施例の構成図、第2図は木兜明
の一実施例の実装図を示す。 代址人 弁理士 渾田判幸・、・す、=B“−;−13
″て−・4
FIG. 1 shows a configuration diagram of one embodiment of Honjamei, and FIG. 2 shows an implementation diagram of one embodiment of Motojamei. Representative Patent Attorney Hajiyuki Hachita...=B"-;-13
``Te-・4

Claims (1)

【特許請求の範囲】[Claims] 4話機の入力音声に対応した出方信号をディジタル化す
る前処理手段と、前処j!された信号から特徴を抽出し
て標準ペターンとの照会を2こなう音声認識手段と、認
識結果を示すコード信号を発生ず不コード発生手段とを
電話機側に配置し、コード信号を電話回線を通してセン
タマシンに転送することt−特徴とする音声IIgA!
!装置。
A preprocessing means for digitizing the output signal corresponding to the input audio of the 4-phone machine, and a preprocessing j! A voice recognition means that extracts features from the received signal and performs two inquiries with the standard pattern, and a non-code generation means that does not generate a code signal indicating the recognition result are placed on the telephone side, and the code signal is transmitted to the telephone line. Transferring to the center machine through the t-featured audio IIgA!
! Device.
JP56173059A 1981-10-30 1981-10-30 Voice recognition equipment Pending JPS5876890A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56173059A JPS5876890A (en) 1981-10-30 1981-10-30 Voice recognition equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56173059A JPS5876890A (en) 1981-10-30 1981-10-30 Voice recognition equipment

Publications (1)

Publication Number Publication Date
JPS5876890A true JPS5876890A (en) 1983-05-10

Family

ID=15953450

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56173059A Pending JPS5876890A (en) 1981-10-30 1981-10-30 Voice recognition equipment

Country Status (1)

Country Link
JP (1) JPS5876890A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6522725B2 (en) 1997-12-05 2003-02-18 Nec Corporation Speech recognition system capable of flexibly changing speech recognizing function without deteriorating quality of recognition result

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6522725B2 (en) 1997-12-05 2003-02-18 Nec Corporation Speech recognition system capable of flexibly changing speech recognizing function without deteriorating quality of recognition result

Similar Documents

Publication Publication Date Title
JPH07191690A (en) Minutes generation device and multispot minutes generation system
JPS5876890A (en) Voice recognition equipment
ATE122171T1 (en) VOICE RECOGNITION.
US6845356B1 (en) Processing dual tone multi-frequency signals for use with a natural language understanding system
US20020049597A1 (en) Audio recognition method and device for sequence of numbers
US5497446A (en) Speech information processing method and apparatus connectable to a public line
JP2002101203A (en) Speech processing system, speech processing method and storage medium storing the method
JPS61144157A (en) Sound dial device
JPS61239358A (en) Documentation system by voice input
JPS59148095A (en) Error recovery system for voice processing system
JPS638798A (en) Voice recognition equipment
JPS613241A (en) Speech recognition system
JPS5977499A (en) Voice recognition equipment
JPS63253480A (en) Card system for confirmation of voiceprint
JPH04287558A (en) Voice communication system for physically handicapped person
JPS59226397A (en) Voice responder
JPS6428698A (en) Personal voice standardization card system
JPH0535441A (en) Automatic document preparing device
JPS6410080B2 (en)
JPH03147052A (en) Sound japanese input system
JPS6227719B2 (en)
JPS61262967A (en) Voice word processor
JPS63306748A (en) Voice dialer
JPH03188500A (en) Speech recognizing device
JPS63292196A (en) Voice recognition equipment for specified speaker