JPH07303053A - Area discriminator and speech recognizing device - Google Patents

Area discriminator and speech recognizing device

Info

Publication number
JPH07303053A
JPH07303053A JP9327594A JP9327594A JPH07303053A JP H07303053 A JPH07303053 A JP H07303053A JP 9327594 A JP9327594 A JP 9327594A JP 9327594 A JP9327594 A JP 9327594A JP H07303053 A JPH07303053 A JP H07303053A
Authority
JP
Japan
Prior art keywords
area
carrier frequency
pattern
standard pattern
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9327594A
Other languages
Japanese (ja)
Inventor
Kenichi Hirayama
健一 平山
勝美 ▲高▼橋
Katsumi Takahashi
Youko Mitsutsune
陽子 光恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP9327594A priority Critical patent/JPH07303053A/en
Publication of JPH07303053A publication Critical patent/JPH07303053A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To provide a high speech recognition ratio in spite of a working area without applying operating burden on a user. CONSTITUTION:This discriminator is provided with a carrier frequency storage means 110 which stores the carrier frequency of prescribed radio or television broadcasting at every area, and a broadcasting wave decision means 111 which judges the existence of a broadcasting wave of stored carrier frequency by the presence/absence of a power. Moreover, the discriminator is provided with an area estimating means 109 which estimates an area to be used corresponding to the broadcasting wave of carrier frequency whose existence is judged, and every area reference pattern storage means 107, 108 which store a reference pattern at every area and output the reference pattern at every area estimated by the area estimating means 109. Speech recognition using the reference pattern in accordance with the working area can be conducted.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、地域判定装置及び音声
認識装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an area determination device and a voice recognition device.

【0002】[0002]

【従来の技術】各種装置の中には、その機能や処理精度
が地域性に影響されるものがある。例えば、音声認識装
置は人間による発声音声を処理対象とするものであり、
発声音声は地域毎の方言やアクセントの影響を受けてい
るものであるので、結局、音声認識装置は、その認識精
度が地域性に影響を受けている。
2. Description of the Related Art Among various devices, their functions and processing accuracy are affected by regional characteristics. For example, the voice recognition device is intended to process human voiced speech,
Since the voiced speech is affected by the dialect and accent of each region, the recognition accuracy of the speech recognition device is ultimately affected by the regional characteristics.

【0003】そのため、音声認識装置として、地域性の
影響を考慮したものが既に提案されている(例えば、特
開昭60−73595号公報や特開昭61−70594
号公報)。
Therefore, as a voice recognition device, a device considering the influence of regional characteristics has already been proposed (for example, Japanese Patent Laid-Open No. 60-73595 and Japanese Patent Laid-Open No. 61-70594).
Issue).

【0004】地域性の影響を考慮した従来の音声認識装
置の一例を、図2を参照しながら説明する。図2におい
て、音声認識装置は、制御部201、音声入力のための
マイク202、音声の周波数帯域のみを通過させるフイ
ルタ等でなる前処理部203、音声をデジタル値に変換
するアナログ/デジタル変換部(A/D変換部)20
4、変換されたデータから音声の特徴を抽出する分析部
205、予め作成された標準パターン207、入力音声
の特徴パラメータと標準パターンとでパターンマッチン
グを行なうマッチング部206より構成されている。
An example of a conventional speech recognition apparatus considering the influence of regional characteristics will be described with reference to FIG. In FIG. 2, the voice recognition device includes a control unit 201, a microphone 202 for voice input, a pre-processing unit 203 including a filter that passes only the frequency band of voice, and an analog / digital conversion unit that converts voice into a digital value. (A / D converter) 20
4. An analysis unit 205 for extracting a voice feature from the converted data, a standard pattern 207 created in advance, and a matching unit 206 for performing pattern matching with the feature parameter of the input voice and the standard pattern.

【0005】このような構成で、まずマイクロフォン2
02より入力された音声は、前処理203で音声の周波
数帯域のみの信号に限定される。その信号は、制御部2
01からのアナログ/デジタル変換開始信号によりアナ
ログ/デジタル変換部204によってアナログ/デジタ
ル変換される。分析部205では、そのデジタルデータ
を基に、例えばパワースペクトルやLPCケプストラル
等の特徴量パラメータの演算を行なう。そして、マッチ
ング部206が、予め同様の方法で国内のあらゆる方言
を基に作成された標準パターン207と特徴量パラメー
タとを比較し、パターンの類似度を求めることにより入
力音声を認識する。
With such a configuration, first, the microphone 2
The voice input from 02 is limited to the signal of only the voice frequency band in the pre-processing 203. The signal is sent to the control unit 2
The analog / digital conversion start signal from 01 causes the analog / digital conversion unit 204 to perform analog / digital conversion. The analysis unit 205 calculates characteristic amount parameters such as a power spectrum and LPC cepstral based on the digital data. Then, the matching unit 206 recognizes the input voice by comparing the standard pattern 207 created based on all domestic dialects with the feature amount parameter in advance by the same method and obtaining the pattern similarity.

【0006】[0006]

【発明が解決しようとする課題】ところで、この音声認
識装置の場合、作成された標準パターン207は、どの
方言の特徴量パラメータとでも類似度が最大となるパタ
ーンに選定されている。しかし、例えば関西では母音が
はつきりしているのに対して関東では母音が消去される
などのように、方言の差は大きく、方言によっては適切
なパターンになっているとは言えなかつた。言い換える
と、このように各地の方言のアクセント、イントネーシ
ョンの違いを全て反映させた標準パターンを使用する場
合には、一つの方言だけに限定すると、その特徴をぼや
かしたパターンとなつており、方言の強い言葉の場合、
誤認識される確率が高いという問題があつた。
By the way, in the case of this speech recognition apparatus, the created standard pattern 207 is selected as the pattern having the maximum similarity with the feature amount parameter of any dialect. However, there is a large difference between dialects, such as vowels being erased in the Kansai region while vowels are erased in the Kanto region, and it cannot be said that some dialects have an appropriate pattern. . In other words, when using a standard pattern that reflects all the differences in accents and intonations of dialects in this way, if you limit it to only one dialect, it will be a pattern that blurs its characteristics. For strong words,
There was a problem that there was a high probability that it would be misrecognized.

【0007】そのため、各地域毎(方言毎)に標準パタ
ーンを作成して格納しておき、キー入力によって指示さ
れた地域の標準パターンを用いて認識する音声認識装置
も既に提案されている。しかし、利用者が地域を指定し
なければならず、操作性上改善の余地があり、地域を自
動的に判定する装置が求められている。
Therefore, a voice recognition device has already been proposed in which a standard pattern is created and stored for each region (for each dialect) and the standard pattern of the region designated by key input is used for recognition. However, since the user has to specify the area, there is room for improvement in operability, and a device for automatically determining the area is required.

【0008】また、音声認識装置について言えば、全て
又は一部の認識された単語の地域属性を検出して地域を
自動的に特定するものもあったが、東京において、関西
の地名等を話題にすることもあって地域の特定精度は低
い。
As for the voice recognition device, there is one that automatically identifies the region by detecting the region attribute of all or a part of the recognized words. Because of this, the accuracy of identifying the area is low.

【0009】[0009]

【課題を解決するための手段】かかる課題を解決するた
め、第1の本発明は、(1) 各地域毎の所定のラジオ放送
又はテレビジョン放送のキャリア周波数を記憶するキャ
リア周波数記憶手段と、(2) このキャリア周波数記憶手
段に記憶されているキャリア周波数の放送波の存在を、
パワーの有無で判定する放送波判定手段と、(3) この放
送波判定手段により存在が判定されたキャリア周波数の
放送波に応じて、地域を推定する地域推定手段とを備え
た地域判定装置を提供する。
In order to solve such a problem, the first present invention provides (1) carrier frequency storage means for storing a carrier frequency of a predetermined radio broadcast or television broadcast for each region, (2) The existence of the broadcast wave of the carrier frequency stored in this carrier frequency storage means
An area determination device comprising a broadcast wave determination means for determining whether or not there is power, and (3) an area estimation means for estimating an area according to a broadcast wave of a carrier frequency whose presence is determined by this broadcast wave determination means. provide.

【0010】また、第2の本発明においては、音声に含
まれる言語的特徴に関する標準パターンを予め記憶し、
入力音声と上記標準パターンの類似性に基づいて音声を
認識する音声認識装置に、以下の各手段を設けるように
した。
In the second aspect of the present invention, standard patterns relating to linguistic features included in voice are stored in advance,
The following means are provided in a voice recognition device that recognizes a voice based on the similarity between the input voice and the standard pattern.

【0011】すなわち、(1) 各地域毎の所定のラジオ放
送又はテレビジョン放送のキャリア周波数を記憶するキ
ャリア周波数記憶手段と、(2) このキャリア周波数記憶
手段に記憶されているキャリア周波数の放送波の存在
を、パワーの有無で判定する放送波判定手段と、(3) こ
の放送波判定手段により存在が判定されたキャリア周波
数の放送波に応じて、使用される地域を推定する地域推
定手段と、(4) 各地域毎の標準パターンを格納してお
り、地域推定手段が推定した地域の標準パターンを出力
する地域毎標準パターン格納手段とを備える。
That is, (1) carrier frequency storage means for storing a carrier frequency of a predetermined radio broadcast or television broadcast for each region, and (2) a broadcast wave of a carrier frequency stored in the carrier frequency storage means. The presence of the broadcast wave determining means to determine the presence or absence of power, (3) in accordance with the broadcast wave of the carrier frequency of the presence is determined by the broadcast wave determining means, the area estimation means to estimate the area used (4) A standard pattern for each area is stored, and the area standard pattern storage means outputs the standard pattern of the area estimated by the area estimation means.

【0012】[0012]

【作用】第1及び第2の本発明は共に、各地域毎に放送
されているラジオ放送やテレビジョン放送のキャリア周
波数(テレビジョンについてはチャネル周波数)が異な
っていることに基づいてなされたものであり、放送され
ているキャリア周波数を検出し、検出されたキャリア周
波数(又はその組合せ)に基づいて、地域を推定するも
のである。
Both the first and second aspects of the present invention are based on the fact that the carrier frequencies (channel frequencies for television) of radio broadcasts and television broadcasts that are broadcast in each region are different. That is, the carrier frequency being broadcast is detected, and the region is estimated based on the detected carrier frequency (or a combination thereof).

【0013】第2の本発明においては、このようにして
推定された地域に応じてマッチングに用いる標準パター
ンを自動的に変更して音声認識精度を高めようとしたも
のである。
In the second aspect of the present invention, the standard pattern used for matching is automatically changed in accordance with the region thus estimated to improve the voice recognition accuracy.

【0014】[0014]

【実施例】以下、図面を参照しながら、本発明の第1実
施例を詳述する。図1は、第1実施例に係る音声認識装
置を示している。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A first embodiment of the present invention will be described in detail below with reference to the drawings. FIG. 1 shows a voice recognition device according to the first embodiment.

【0015】図1において、この実施例の音声認識装置
は、従来の音声認識装置と同様な制御部101、音声入
力のためのマイクロフォン102、音声の周波数帯域の
みを通過させるフイルタ等でなる前処理部103、音声
信号をデジタル値に変換するアナログ/デジタル変換部
104、変換されたデータから音声の特徴パラメータを
抽出する分析部105、再書き込み可能な例えばEEP
ROM等に格納された標準パターン107を備えてい
る。
In FIG. 1, the voice recognition apparatus of this embodiment has a pre-processing unit including a control unit 101 similar to a conventional voice recognition apparatus, a microphone 102 for voice input, a filter for passing only a voice frequency band, and the like. Unit 103, analog / digital conversion unit 104 for converting a voice signal into a digital value, analysis unit 105 for extracting a characteristic parameter of voice from the converted data, rewritable eg EEP
A standard pattern 107 stored in a ROM or the like is provided.

【0016】さらに、この実施例の音声認識装置は、入
力音声の特徴パラメータと標準パターンとでパターンマ
ッチングを行なうマッチング部106、標準パターンに
対して各地域で異なるパターン(変更パターンと呼ぶ)
が情報圧縮されて格納された変更パターン格納部10
8、全国のFM放送局のキャリア周波数を記憶している
キャリア周波数記憶部110、キャリア周波数において
パワーの有無を判定するキャリア信号有無判定部11
1、放送電波を受信するアンテナ112、キャリア信号
有無判定部111の結果より当該音声認識装置が使用さ
れる地域を推定する使用地域推定部109を備えてい
る。
Further, in the voice recognition apparatus of this embodiment, a matching unit 106 that performs pattern matching between the characteristic parameter of the input voice and the standard pattern, a pattern different from the standard pattern in each region (called a change pattern).
Change pattern storage unit 10 in which information is compressed and stored
8. Carrier frequency storage unit 110 for storing carrier frequencies of FM broadcasting stations nationwide, carrier signal presence / absence determination unit 11 for determining presence / absence of power at carrier frequencies
1, an antenna 112 for receiving broadcast waves, and a use area estimation unit 109 for estimating an area where the voice recognition device is used based on the results of the carrier signal presence / absence determination unit 111.

【0017】以上の構成において、音声認識装置を起動
させると、まず制御部101はキャリア信号有無判定部
111に判定スタート信号を送信する。
In the above configuration, when the voice recognition device is activated, the control unit 101 first transmits a determination start signal to the carrier signal presence / absence determination unit 111.

【0018】これにより、キャリア信号有無判定部11
1は、キャリア周波数記憶部110よりFM放送局のキ
ャリア周波数を共振周波数として、図3に示すように、
1局毎にパワーの有無を判定する。このパワーの有無の
判定結果は、使用地域推定部109に送られて使用地域
が推定される。
As a result, the carrier signal presence / absence determining unit 11
1 indicates that the carrier frequency of the FM broadcasting station is set as the resonance frequency from the carrier frequency storage unit 110, as shown in FIG.
The presence or absence of power is determined for each station. The determination result of the presence or absence of the power is sent to the usage area estimation unit 109 and the usage area is estimated.

【0019】図3では、例えばFM放送局として「FM
群馬」のパワーが5段階、「ナツクフアイブ」が2段階
ということで、使用地域推定部109は群馬県で使用さ
れていると推定する。使用地域推定部109は、例えば
図4に示すような標準パターンに対する変更パターンが
用意されている地域と、その地域と判定するための標準
的なキャリア周波数及びパワー段階の組合せとを対応付
けたテーブルデータを内蔵しており、キャリア信号有無
判定部111からのパワー有無の判定結果とのマッチン
グにより地域を推定する。
In FIG. 3, for example, "FM
Since the power of “Gunma” has five levels and the power of “Natsukhuive” has two levels, the use area estimation unit 109 estimates that the area is used in Gunma prefecture. The use area estimation unit 109 associates, for example, an area in which a change pattern for the standard pattern as shown in FIG. 4 is prepared with a combination of standard carrier frequencies and power stages for determining the area. Data is built in, and the region is estimated by matching with the determination result of the power presence / absence from the carrier signal presence / absence determining unit 111.

【0020】使用地域推定部109は変更パターン格納
部108に対して、群馬県用変更パターンのデータ圧縮
解凍信号を送る。この結果、変更パターン格納部108
は群馬県用変更パターンについて、データを解凍し標準
パターン107中の変更パターンの変更パターンの転送
を行なう。
The use area estimation unit 109 sends a data compression / decompression signal of the Gunma prefecture change pattern to the change pattern storage unit 108. As a result, the change pattern storage unit 108
Decompresses the change pattern for Gunma prefecture and transfers the change pattern of the change pattern in the standard pattern 107.

【0021】次に、使用地域推定部109は標準パター
ン変更終了信号を制御部101に送信し、これにより、
音声入力可能状態となる。
Next, the use area estimation unit 109 transmits a standard pattern change end signal to the control unit 101, which
Voice input is enabled.

【0022】音声入力後は、従来と同様に、マイクロフ
ォン102より入力された音声は前処理部103で音声
の周波数帯域のみの信号に限定される。その信号は制御
部101からのアナログ/デジタル変換開始信号により
アナログ/デジタル変換部104によりアナログ/デジ
タル変換される。分析部105では、そのデジタルデー
タをもとに特徴量、例えばパワースペクトルやLPCケ
プストラム等の特徴量を演算する。マッチング部106
では、上述した群馬県用標準パターンと比較して、パタ
ーンの類似度を例えばDPマッチング等で求めることに
より入力された音声の認識を行なう。
After the voice is input, the voice input from the microphone 102 is limited to the signal of only the frequency band of the voice by the preprocessing unit 103, as in the conventional case. The signal is analog / digital converted by the analog / digital converter 104 in response to an analog / digital conversion start signal from the controller 101. The analysis unit 105 calculates a characteristic amount, for example, a characteristic amount such as a power spectrum or an LPC cepstrum, based on the digital data. Matching unit 106
Then, the input voice is recognized by comparing the above-mentioned Gunma prefecture standard pattern with the pattern similarity by, for example, DP matching.

【0023】なお、現在、FM放送局は各県に1局ぐら
いずつ開局しており、上述したようにキャリア周波数記
憶部110に全国のFM放送局のキャリア周波数を記憶
することで、自動的に装置が使用される地域を推定でき
る。
At present, there are about one FM broadcasting station in each prefecture, and by storing the carrier frequencies of FM broadcasting stations nationwide in the carrier frequency storage section 110 as described above, The area where the device is used can be estimated.

【0024】上記第1実施例によれば、全国のFM放送
局のキャリア周波数を記憶し、FM放送局のキャリア周
波数の有無により使用される地域を推定し、その地域毎
に標準パターンを変更して最適化するようにしたことに
より、方言の強い地域の話者の場合でも高精度で音声を
認識し得る。
According to the first embodiment, the carrier frequencies of FM broadcasting stations nationwide are stored, the area used is estimated based on the presence or absence of the carrier frequency of the FM broadcasting stations, and the standard pattern is changed for each area. With this optimization, even a speaker in an area with a strong dialect can recognize speech with high accuracy.

【0025】また、上記第1実施例によれば、自動的に
地域を推定するようにしたので、地域を指定するキー入
力が不要となり、使い勝手が向上する。例えば、当該音
声認識装置を部分構成として備えた装置が異なる地域に
移動されても、地域指定のキー入力を再度行なう必要は
ない。
Further, according to the first embodiment, since the area is automatically estimated, the key input for designating the area is not necessary and the usability is improved. For example, even if a device provided with the voice recognition device as a partial configuration is moved to a different area, it is not necessary to perform the key input for specifying the area again.

【0026】さらに、上記第1実施例によれば、各地域
毎に標準パターンを格納させるのではなく、各地域に共
通な標準パターンとは異なる部分だけを変更パターンで
用意して各地域毎の標準パターンを実現するようにした
ので、また、変更パターンをデータ圧縮して格納させる
ようにしたので、各地域毎で標準パターンを切り替える
とは言え、記憶容量の増大をわずかなものに押さえるこ
とができる。
Further, according to the first embodiment, instead of storing the standard pattern for each area, only a portion different from the standard pattern common to each area is prepared as a change pattern and each area is prepared. Since the standard pattern is realized and the changed pattern is compressed and stored, the standard pattern can be switched for each region, but the increase in storage capacity can be suppressed to a slight one. it can.

【0027】次に、本発明の第2実施例を図5を参照し
ながら説明する。図5は、この第2実施例の音声認識装
置を示すものであり、上述した第1実施例との同一、対
応部分には同一符号を付して示している。
Next, a second embodiment of the present invention will be described with reference to FIG. FIG. 5 shows the voice recognition apparatus of the second embodiment, and the same or corresponding parts as those of the first embodiment described above are designated by the same reference numerals.

【0028】この第2実施例の音声認識装置は、音声認
識結果の意味を解析して得る構成が第1実施例の構成に
追加されたものである。すなわち、意味解析部120、
意味解析用標準データ121及び変更データ格納部12
2が追加されている。ここで、意味解析部120は、音
声認識結果に対して、意味解析用標準データ121を用
いて、例えば形態素解析や構文解析等を行なって、その
意味を得るものである。意味解析用標準データ121に
は、単語情報やその品詞情報等の意味解析に用いられる
標準的なデータが格納されており、一方、変更データ格
納部122には、地域毎の特有な単語情報やその品詞情
報等の意味解析に用いられる標準的なデータが圧縮され
て格納されており、推定された地域の変更データが標準
データに代わって用いられるようになされている。
In the voice recognition device of the second embodiment, a configuration obtained by analyzing the meaning of the voice recognition result is added to the configuration of the first embodiment. That is, the semantic analysis unit 120,
Standard data 121 for semantic analysis and change data storage unit 12
2 has been added. Here, the semantic analysis unit 120 obtains the meaning by performing, for example, morphological analysis or syntactic analysis on the speech recognition result using the standard data 121 for semantic analysis. The standard data 121 for semantic analysis stores standard data used for semantic analysis such as word information and its part-of-speech information. Standard data used for semantic analysis such as part-of-speech information is stored in a compressed form, and the estimated change data of the area is used in place of the standard data.

【0029】以上のような新たな構成要素が追加された
第2実施例の音声認識装置も、起動されたときには、詳
述は避けるが、第1実施例と同様に、まず地域推定動作
を実行する。
The speech recognition apparatus of the second embodiment, to which the above-mentioned new components are added, will not be described in detail when it is activated, but like the first embodiment, first the area estimation operation is executed. To do.

【0030】使用地域推定部109は、当該音声認識装
置の使用地域(例えば群馬県)を推定すると、変更パタ
ーン格納部108や変更データ格納部122に対してそ
れぞれ、群馬県用変更パターン、群馬県用変更データの
データ圧縮解凍信号を送信する。この結果、変更パター
ン格納部108は群馬県用変更パターンについて、デー
タ圧縮を解凍し標準パターン107中の変更パターンの
転送先のデータを不使用領域に退避して変更パターンの
転送を行ない、変更データ格納部122は群馬県用変更
データについて、データ圧縮を解凍し標準データ121
中の変更データの転送先のデータを不使用領域に退避し
て変更データの転送を行なう。
When the use area estimation unit 109 estimates the use area (for example, Gunma prefecture) of the voice recognition device, the change pattern storage unit 108 and the change data storage unit 122 respectively set the change pattern for Gunma prefecture and Gunma prefecture. The data compression / decompression signal of the modification data is transmitted. As a result, the change pattern storage unit 108 decompresses the data about the Gunma prefecture change pattern, saves the transfer destination data of the change pattern in the standard pattern 107 to the unused area, and transfers the change pattern. The storage unit 122 decompresses the data compression for the Gunma prefecture modified data and decompresses the standard data 121.
The transfer destination data of the change data therein is saved in an unused area and the change data is transferred.

【0031】次に、使用地域推定部109は変更終了信
号を制御部101に送信し、これにより、音声入力可能
状態となる。
Next, the use area estimation unit 109 transmits a change end signal to the control unit 101, whereby the voice input is possible.

【0032】音声認識動作自体は第1実施例と同様であ
るので、その説明は省略する。音声認識結果が得られる
と、意味解析部120は、一部が群馬県用変更データに
置き換えられた意味解析用標準データ121に基づい
て、その音声認識結果に対して例えば形態素解析や構文
解析等を行なって、その意味を得る。
Since the voice recognition operation itself is the same as that of the first embodiment, its explanation is omitted. When the speech recognition result is obtained, the semantic analysis unit 120 performs, for example, morphological analysis or syntactic analysis on the speech recognition result based on the semantic analysis standard data 121, a part of which is replaced with the Gunma prefecture change data. And get the meaning.

【0033】従って、第2実施例によれば、第1実施例
と同様な効果を得ることができると共に、さらに、入力
音声の意味を高精度に理解することができる。
Therefore, according to the second embodiment, the same effect as that of the first embodiment can be obtained, and further, the meaning of the input voice can be understood with high accuracy.

【0034】例えば、「ワイ」という発音音声(音声認
識結果)の場合、大阪弁では「私」という意味になり鹿
児島弁では「あなた」という意味になる。また、「オ
イ」という発音音声(音声認識結果)の場合、大阪弁で
は「おまえ」という意味になり鹿児島弁では「私」とい
う意味になる。この実施例の装置では地域を推定でき、
推定地域に応じて意味解析用標準データ(データベー
ス)を変更して最適化できるので、意味理解の正解率も
向上できる。
For example, in the case of the pronunciation sound "voice" (voice recognition result), it means "I" in the Osaka dialect and "you" in the Kagoshima dialect. Further, in the case of the pronunciation sound "voice" (speech recognition result), it means "you" in the Osaka dialect and "I" in the Kagoshima dialect. The device of this embodiment can estimate the area,
Since the standard data for semantic analysis (database) can be changed and optimized according to the estimated area, the accuracy rate of semantic understanding can be improved.

【0035】なお、上記実施例においては、FM放送の
キャリア周波数に基づいて、地域を推定するものを示し
たが、他のラジオ放送のキャリア周波数に基づいて地域
を推定するものであっても良く、また、テレビジョン放
送のキャリア周波数に基づいて地域を推定するものであ
っても良く、両者のキャリア周波数を総合的に判断して
地域を推定するものであっても良い。
In the above embodiment, the area is estimated based on the carrier frequency of FM broadcasting. However, the area may be estimated based on the carrier frequency of other radio broadcasting. Also, the region may be estimated based on the carrier frequency of the television broadcast, or the region may be estimated by comprehensively judging both carrier frequencies.

【0036】また、上記実施例における地域推定構成
は、音声認識装置だけでなく、地域弁別が必要な他の装
置にも適用できる。例えば、自動車のナビゲーションシ
ステムに適用し、その起動時に、推定した地域の地図を
最初に表示させるような形態で利用させることもでき
る。
Further, the area estimation configuration in the above embodiment can be applied not only to the voice recognition apparatus but also to other apparatuses that require area discrimination. For example, it can be applied to a car navigation system, and can be used in such a form that a map of an estimated area is displayed first when the system is started.

【0037】[0037]

【発明の効果】以上のように、第1の本発明の地域判定
装置によれば、各地域毎に放送されているラジオ放送や
テレビジョン放送のキャリア周波数が異なっていること
に基づいて、地域を推定するようにしたので、高精度に
地域を推定させることができ、地域情報を必要とする装
置やシステムに組み込まれた場合にその装置やシステム
の処理精度を向上させることができる。
As described above, according to the area determining apparatus of the first aspect of the present invention, the area is based on the fact that the carrier frequencies of the radio broadcasts and the television broadcasts broadcast in each area are different. Since the area is estimated, the area can be estimated with high accuracy, and when incorporated into an apparatus or system that requires area information, the processing accuracy of the apparatus or system can be improved.

【0038】第2の本発明の音声認識装置によれば、各
地域毎に放送されているラジオ放送やテレビジョン放送
のキャリア周波数が異なっていることに基づいて、地域
を推定し、マッチング用の標準データを推定地域に応じ
て自動的に最適化するようにしたので、利用者に操作負
担を掛けることなく、従来に比して認識率を向上させる
ことができる。
According to the voice recognition device of the second aspect of the present invention, the region is estimated and matching is performed based on the fact that the carrier frequency of the radio broadcast or the television broadcast which is broadcast in each region is different. Since the standard data is automatically optimized according to the estimated area, it is possible to improve the recognition rate as compared with the conventional method without imposing an operation burden on the user.

【図面の簡単な説明】[Brief description of drawings]

【図1】第1実施例の音声認識装置の構成を示すブロツ
ク図である。
FIG. 1 is a block diagram showing a configuration of a voice recognition device according to a first embodiment.

【図2】従来の音声認識装置を示すブロツク図である。FIG. 2 is a block diagram showing a conventional voice recognition device.

【図3】第1実施例の地域推定動作の説明用の特性曲線
図である。
FIG. 3 is a characteristic curve diagram for explaining an area estimation operation according to the first embodiment.

【図4】第1実施例の地域推定動作に必要な格納データ
の説明図である。
FIG. 4 is an explanatory diagram of stored data necessary for an area estimation operation according to the first embodiment.

【図5】第2実施例の音声認識装置の構成を示すブロツ
ク図である。
FIG. 5 is a block diagram showing a configuration of a voice recognition device in a second embodiment.

【符号の説明】[Explanation of symbols]

101…制御部、105…分析部、106…マッチング
部、107…標準パターン、108…変換パターン格納
部、109…使用地域推定部、110…キャリア周波数
記憶部、111…キャリア信号有無判定部、120…意
味解析部、121…意味解析用標準データ、122…変
更データ格納部。
101 ... Control unit, 105 ... Analysis unit, 106 ... Matching unit, 107 ... Standard pattern, 108 ... Conversion pattern storage unit, 109 ... Use area estimation unit, 110 ... Carrier frequency storage unit, 111 ... Carrier signal presence / absence determination unit, 120 ... Semantic analysis unit 121 ... Standard data for semantic analysis 122 ... Change data storage unit.

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 各地域毎の所定のラジオ放送又はテレビ
ジョン放送のキャリア周波数を記憶するキャリア周波数
記憶手段と、 このキャリア周波数記憶手段に記憶されているキャリア
周波数の放送波の存在を、パワーの有無で判定する放送
波判定手段と、 この放送波判定手段により存在が判定されたキャリア周
波数の放送波に応じて、地域を推定する地域推定手段と
を備えたことを特徴とする地域判定装置。
1. A carrier frequency storage means for storing a carrier frequency of a predetermined radio broadcast or television broadcast for each area, and the existence of a broadcast wave having a carrier frequency stored in the carrier frequency storage means, An area determination device comprising: a broadcast wave determination means for determining whether the area is present or not; and an area estimation means for estimating an area according to a broadcast wave having a carrier frequency of which presence is determined by the broadcast wave determination means.
【請求項2】 音声に含まれる言語的特徴に関する標準
パターンを予め記憶し、入力音声と上記標準パターンの
類似性に基づいて音声を認識する音声認識装置におい
て、 各地域毎の所定のラジオ放送又はテレビジョン放送のキ
ャリア周波数を記憶するキャリア周波数記憶手段と、 このキャリア周波数記憶手段に記憶されているキャリア
周波数の放送波の存在を、パワーの有無で判定する放送
波判定手段と、 この放送波判定手段により存在が判定されたキャリア周
波数の放送波に応じて、使用される地域を推定する地域
推定手段と、 各地域毎の標準パターンを格納しており、上記地域推定
手段が推定した地域の標準パターンを出力する地域毎標
準パターン格納手段とを備えることを特徴とする音声認
識装置。
2. A voice recognition device for pre-storing a standard pattern relating to linguistic features contained in a voice and recognizing a voice based on the similarity between the input voice and the standard pattern, in a predetermined radio broadcast for each region or Carrier frequency storage means for storing the carrier frequency of television broadcasting, broadcast wave determination means for determining the presence of a broadcast wave of the carrier frequency stored in the carrier frequency storage means by the presence or absence of power, and this broadcast wave determination Area estimation means that estimates the area to be used according to the broadcast wave of the carrier frequency whose presence is determined by the means, and the standard pattern for each area are stored, and the area standard estimated by the area estimation means is stored. A voice recognition device comprising: a regional standard pattern storage unit that outputs a pattern.
【請求項3】 上記地域毎標準パターン格納手段が、 各地域に共通な標準パターンを格納している共通標準パ
ターン格納部と、 各地域毎に特異な標準パターンに対する変更パターンを
格納している変更パターン格納部と、 上記地域推定手段で推定された地域に応じて、上記変更
パターン格納部に格納されている上記変更パターンを読
み出し、当該変更パターンに応じて上記共通標準パター
ンを変更する共通標準パターン変更部とでなることを特
徴とする請求項2に記載の音声認識装置。
3. A change in which the area standard pattern storage means stores a common standard pattern storage section that stores a standard pattern that is common to each area, and a change pattern that stores a change pattern for a standard pattern that is unique to each area. A common standard pattern that reads the change pattern stored in the change pattern storage unit according to the pattern storage unit and the area estimated by the area estimation unit, and changes the common standard pattern according to the change pattern. The voice recognition device according to claim 2, wherein the voice recognition device comprises a changing unit.
【請求項4】 請求項2又は3に記載の音声認識装置に
おいて、 意味解析用データに基づいて、音声認識結果に対して意
味解析を行なう意味解析手段と、 各地域毎の上記意味解析用データを格納しており、上記
地域推定手段が推定した地域の上記意味解析用データを
上記意味解析手段に出力する地域毎意味解析用データ格
納手段とを備えることを特徴とする音声認識装置。
4. The speech recognition apparatus according to claim 2, wherein the semantic analysis means performs a semantic analysis on the speech recognition result based on the semantic analysis data, and the semantic analysis data for each region. A voice recognition device, which stores the meaning analysis data for each area that stores the meaning analysis data of the area estimated by the area estimation means to the meaning analysis means.
JP9327594A 1994-05-02 1994-05-02 Area discriminator and speech recognizing device Pending JPH07303053A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9327594A JPH07303053A (en) 1994-05-02 1994-05-02 Area discriminator and speech recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9327594A JPH07303053A (en) 1994-05-02 1994-05-02 Area discriminator and speech recognizing device

Publications (1)

Publication Number Publication Date
JPH07303053A true JPH07303053A (en) 1995-11-14

Family

ID=14077895

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9327594A Pending JPH07303053A (en) 1994-05-02 1994-05-02 Area discriminator and speech recognizing device

Country Status (1)

Country Link
JP (1) JPH07303053A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015509618A (en) * 2012-03-06 2015-03-30 アップル インコーポレイテッド Automatic input signal recognition using position-based language modeling
JP2016520879A (en) * 2013-12-19 2016-07-14 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド Speech data recognition method, device and server for distinguishing local rounds

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015509618A (en) * 2012-03-06 2015-03-30 アップル インコーポレイテッド Automatic input signal recognition using position-based language modeling
JP2016520879A (en) * 2013-12-19 2016-07-14 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド Speech data recognition method, device and server for distinguishing local rounds

Similar Documents

Publication Publication Date Title
KR100574594B1 (en) System and method for noise-compensated speech recognition
US5146504A (en) Speech selective automatic gain control
US7089184B2 (en) Speech recognition for recognizing speaker-independent, continuous speech
US20040002867A1 (en) Speech recognition apparatus and method
US20070156405A1 (en) Speech recognition system
KR20010093334A (en) Endpointing of speech in a noisy signal
US9911408B2 (en) Dynamic speech system tuning
US5307442A (en) Method and apparatus for speaker individuality conversion
KR100201256B1 (en) Starting control system using voice for a vehicle
KR100698811B1 (en) Voice recognition rejection scheme
US20090083038A1 (en) Mobile radio terminal, speech conversion method and program for the same
JP2004325936A (en) Speech recognition device, speech recognition method, and speech recognition program, and recording medium recorded with its program
US7328159B2 (en) Interactive speech recognition apparatus and method with conditioned voice prompts
JPH0431898A (en) Voice/noise separating device
JP3900691B2 (en) Noise suppression apparatus and speech recognition system using the apparatus
JP2001272991A (en) Voice interacting method and voice interacting device
JPH07303053A (en) Area discriminator and speech recognizing device
JP3296783B2 (en) In-vehicle navigation device and voice recognition method
JPH06214596A (en) Voice recognition device and speaker adaptive method
JP3106543B2 (en) Audio signal processing device
JP2007183516A (en) Voice interactive apparatus and speech recognition method
US6934680B2 (en) Method for generating a statistic for phone lengths and method for determining the length of individual phones for speech synthesis
JP3671636B2 (en) Voice recognition device
JPH11327593A (en) Voice recognition system
Itoh et al. Automatic labeling and digesting for lecture speech utilizing repeated speech by shift CDP