JPH03257499A - Character data input device - Google Patents

Character data input device

Info

Publication number
JPH03257499A
JPH03257499A JP2057136A JP5713690A JPH03257499A JP H03257499 A JPH03257499 A JP H03257499A JP 2057136 A JP2057136 A JP 2057136A JP 5713690 A JP5713690 A JP 5713690A JP H03257499 A JPH03257499 A JP H03257499A
Authority
JP
Japan
Prior art keywords
data
phoneme
word
voice
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2057136A
Other languages
Japanese (ja)
Inventor
Mikio Ogisu
荻須 幹雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2057136A priority Critical patent/JPH03257499A/en
Publication of JPH03257499A publication Critical patent/JPH03257499A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To reduce deterioration of phonetic features of a synthesized sound due to the influence of time-directional distortion by performing shifting, compression, and expansion in finite N kinds of time directions which are given previously and generating N deformed phoneme matrixes, and inputting them to a range finder calculating device. CONSTITUTION:When a phoneme vector which is a variable constant representing spectrum envelope information on an input voice is inputted to an input terminal 1, a phoneme matrix generating device 2 stores the phoneme vector by constant (L+2P) frames and outputs the phoneme matrix consisting of (L+2P) phoneme vectors at intervals of L frames. The matrix is inputted from the device 2 to a restrained time-direction deforming device 8. The device 8 performs the shifting, compression, and expansion of the input phoneme matrix in N finite kinds of time directions to generate N deformed phoneme matrixes. Consequently, transmission in a fixed frame period becomes possible and the deterioration of phonetic features of the synthesized sound due to the influence of the time-directional distortion is reducible.

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声データから文字データに自動的に変換す
る文字データ入力装置に関するものである。
DETAILED DESCRIPTION OF THE INVENTION Field of the Invention The present invention relates to a character data input device that automatically converts voice data into character data.

従来の技術 従来、文字データ装置の入力形態の一つとして音声入力
方法が考案されている。音声データに対し、音声分析を
行ない、標準的な単語パターンや単語辞書を用いて、音
声データに対応する文字データを検索し、音声認識を行
なうという手段がとられている。
2. Description of the Related Art Conventionally, a voice input method has been devised as one of the input forms for character data devices. A method is used to perform voice analysis on voice data, search for character data corresponding to the voice data using standard word patterns and word dictionaries, and perform voice recognition.

発明が解決しようとする課題 しかしながら、音声入力速度が高速であるため、リアル
タイムで音声データを文字データに変換するのは困難で
あった。また、音声データは音声情報が定量的てないた
め、音声分析が正しく行なわれず、誤認識することもあ
った。
Problems to be Solved by the Invention However, since the voice input speed is high, it has been difficult to convert voice data into character data in real time. Furthermore, since voice data does not contain quantitative voice information, voice analysis may not be performed correctly, resulting in erroneous recognition.

これらの理由により、音声入力速度がキーボード入力に
比べ2数倍、高速であるにもかかわらず市販の文字デー
タ装置はキーボーI・入力方法がほとんどであった。
For these reasons, most commercially available character data devices use the keyboard I input method, even though the voice input speed is several times faster than keyboard input.

本発明は上記従来の課題を解決するもので、音声データ
から文字データへの変換を正確に行なう、音声入力可能
な文字データ入力装置を提供することを目的としている
The present invention has been made to solve the above-mentioned conventional problems, and an object of the present invention is to provide a character data input device capable of voice input, which accurately converts voice data into character data.

課題を解決するための手段 この課題を解決するために本発明の文字データ入力装置
は、音声入力装置の手段として、音声記録装置を持ち、
音声データを一度、音声記録し、音声記録データに対し
文字データへの変換を行ない文字データへの変換が間に
合わない場合、音声記録データからの入力を停止するこ
とにより、入力データを制限するように構成されている
Means for Solving the Problem In order to solve this problem, the character data input device of the present invention has a voice recording device as a voice input device,
The voice data is recorded once, and the voice recorded data is converted to character data. If the conversion to character data cannot be completed in time, the input data is limited by stopping input from the voice recorded data. It is configured.

作用 この構成により、音声データを文字データに自動的に変
換することができ、キーボード入力のように文字データ
入力装置に則する知識がなくても、文章を作成できる装
置を実現できる。
Effect: With this configuration, it is possible to automatically convert voice data into character data, and it is possible to realize a device that can create sentences even without knowledge of character data input devices such as keyboard input.

実施例 以下本発明の実施例について説明する。Example Examples of the present invention will be described below.

第1図は本発明の文字データ入力装置の構成を示した図
である。音声記録装置■は音声入力されたデータを音声
データ2として記録する。記録された音声データ2は音
声記録装置1で再生され音声認識装置3て音声解析され
単語パターン或いは単語辞書(図示せず)デジタルデー
タである2値データとしてテンポラリメモリ4に格納さ
れる。
FIG. 1 is a diagram showing the configuration of a character data input device of the present invention. The audio recording device (2) records the audio input data as audio data 2. The recorded voice data 2 is reproduced by the voice recording device 1, voice analyzed by the voice recognition device 3, and stored in the temporary memory 4 as binary data, which is word pattern or word dictionary (not shown) digital data.

2値データ(テンポラリメモリ〉4は単語・文章変換装
置5により、単語文章データ6に変換される。音声記録
装置1で記録された音声データ2はアナログデータであ
り、音声認識袋N3で音声のスペクトル解析がされた後
、標準的な単語パターンや、単語辞書を用いて次々とデ
ジタルデータに変換しテンポラリメモリ4に格納してい
く。テンポラリメモリ4には音声記録装置1から音声認
識装置3へのデータロードの開始情報を格納するロード
ポインタ7と単語・文章変換装置5がテンポラリメモリ
4のどこまでを変換したかを示すノルリントポインタ8
があり、変換スタート時のまだ変換が行なわれていない
状態に発生ずるロードポインタ7の値とカレントポイン
タ8の値が一致する場合を除いて、ロードポインタ7と
カレントポインタ8の値が一致するまで音声認識装置3
はテンポラリメモリ4の2値データのロードを続ける。
The binary data (temporary memory) 4 is converted into word/sentence data 6 by the word/sentence conversion device 5.The audio data 2 recorded by the audio recording device 1 is analog data, and the audio recognition bag N3 converts the audio data into word/sentence data 6. After the spectrum analysis, standard word patterns and word dictionaries are used to convert the data into digital data one after another and store it in the temporary memory 4. a load pointer 7 that stores data load start information; and a norlint pointer 8 that indicates how much of the temporary memory 4 has been converted by the word/sentence conversion device 5.
, and the value of load pointer 7 and current pointer 8 match, which occurs when the conversion starts and the value of current pointer 8 matches, until the value of load pointer 7 and current pointer 8 match. Voice recognition device 3
continues loading the binary data in the temporary memory 4.

従って、2値データのローディング中、音声記録装置1
は音声データ2を再生を続けると共にロードポインタ7
の更新を行なう。ロードポインタ7とカレントポインタ
8の値を入力とする比較器9がロードポインタ7の更新
によりロードポインタ7とカレントポインタ8の値が一
致したことを検出すると、ロード停止信号10を音声記
録装置1と音声認識装置3に伝送し、音声記録装置1に
対しては音声データ2の再生の停止を、音声認識装置3
に対しては音声データの変換を停止する。単語・文章変
換装置5はテンポラリメモリ4内の2値データを文脈解
析し、かな漢字変換をし、単語・文章データ6を作成す
ると共に、カレントポインタ8に対し、ポインタ値の更
新をする。カレントポインタ8の更新によりロードポイ
ンタ7とカレントポインタ8の値が比較器9により一致
したと判定されると単語・文章変換装置5に対し、変換
停止信号11が出力され、テンポラリメモリ4内の2値
データから単語文章データ6への変換が停止される。比
較器9からのロード停止信号10はカレントポインタ8
が更新されることにより、また、変換停止信号11はロ
ードポインタ7が更新されることにより解除され、動作
が再開される。音声認識スピードが間に合わない場合、
音声記録装置からの再生データ量を、一定量再生すれば
、音声記録装置を停止し、音声認識終了信号(図示せず
)により再生を再開することもでき、かつ音声認識と単
語・文章変換の間にテンポラリメモリ4を介することで
、単語・文章変換スピードの問題を解決することができ
る。
Therefore, while loading binary data, the audio recording device 1
continues playing audio data 2 and moves the load pointer 7
Update. When the comparator 9 which inputs the values of the load pointer 7 and the current pointer 8 detects that the values of the load pointer 7 and the current pointer 8 match due to updating of the load pointer 7, a load stop signal 10 is sent to the audio recording device 1. The voice recognition device 3 instructs the voice recording device 1 to stop playing the voice data 2.
, the conversion of audio data is stopped. The word/sentence conversion device 5 analyzes the context of the binary data in the temporary memory 4, performs kana-kanji conversion, creates word/sentence data 6, and updates the pointer value of the current pointer 8. When the comparator 9 determines that the values of the load pointer 7 and the current pointer 8 match by updating the current pointer 8, a conversion stop signal 11 is output to the word/sentence conversion device 5, and the Conversion from value data to word sentence data 6 is stopped. The load stop signal 10 from the comparator 9 is the current pointer 8
By updating , the conversion stop signal 11 is canceled by updating the load pointer 7, and the operation is restarted. If the voice recognition speed is not fast enough,
Once a certain amount of data has been reproduced from the voice recording device, the voice recording device can be stopped and playback can be resumed using a voice recognition end signal (not shown). By interposing the temporary memory 4 in between, the problem of word/sentence conversion speed can be solved.

第2図は本発明の校正機能の構成について示した図であ
る。かなデータ(かな漢字変換される前のデータ)や−
旦かな漢字変換等処理されたデータであるが音声の誤認
識により、文章が整っていないデータである単語文章デ
ータ6に対し、文脈解析及び、校正機能を有する単語・
文章変換装置5を介して、単純な2値データに変換され
テンポラリメモリ4に格納される。単語・文章変換装置
5ては文脈上、音声誤認識のために文章が整っていない
と判断すると2値データ変換の際に単語辞書(図示せず
)から最適な単語を取り出し置き換えを実行する。2値
データが格納されたテンポラリメモリ4は単語・文章変
換装置5により再度、単語文章データ6に変換され、か
な漢字変換等の処理がされる。ロードポインタ7は単語
文章データ6のどこまてが2値データに再変換され、テ
ンポラリメモリ4に格納されたかを示すポインタで、ま
た、カレントポインタ8は2値データが格納されたテン
ポラリメモリ4のどこまでが単語・文章データに変換さ
れたかを示すポインタである。校正開始時を除いて、ロ
ードポインタ7とカレントポインタ8の値が一致するま
で単語文章データ6の2値データへの変換は実行され、
ロードポインタ7の更新を行ない、ロードポインタ7の
値の更新によりロードポインタ7とカレントポインタ8
の値が一致すると比較器9によりロード停止信号12が
単語文章データ6に出力され、データのロードが停止さ
れる。一方、単語文章変換装置5は2値データの格納さ
れたテンポラリメモリ4内のデータを単語・文章データ
に変換を行ない。カレントポインタ8の更新を行なう。
FIG. 2 is a diagram showing the configuration of the calibration function of the present invention. Kana data (data before kana-kanji conversion) and -
Word text data 6, which is data that has been processed such as simple kanji conversion, but the text is not well-organized due to misrecognition of the voice, is processed using word/sentence data that has context analysis and proofreading functions.
It is converted into simple binary data via the text conversion device 5 and stored in the temporary memory 4. If the word/sentence conversion device 5 determines that the sentence is not in order due to speech misrecognition due to the context, it extracts the most suitable word from a word dictionary (not shown) and executes replacement during binary data conversion. The temporary memory 4 in which the binary data is stored is again converted into word/sentence data 6 by the word/sentence conversion device 5, and subjected to processing such as kana/kanji conversion. The load pointer 7 is a pointer indicating which part of the word sentence data 6 has been reconverted to binary data and stored in the temporary memory 4, and the current pointer 8 is a pointer indicating which part of the word sentence data 6 has been reconverted to binary data and stored in the temporary memory 4. This is a pointer indicating how far the data has been converted into word/sentence data. Except at the start of proofreading, conversion of word sentence data 6 to binary data is executed until the values of load pointer 7 and current pointer 8 match,
Load pointer 7 is updated, and by updating the value of load pointer 7, load pointer 7 and current pointer 8 are updated.
When the values match, the comparator 9 outputs a load stop signal 12 to the word sentence data 6, and the data loading is stopped. On the other hand, the word/sentence conversion device 5 converts the data in the temporary memory 4 in which binary data is stored into word/sentence data. The current pointer 8 is updated.

カレントポインタ8の値の更新によりカレントポインタ
8とロードポインタ7の値が一致すると比較器9より変
換停止信号11が単語・文章変換装置5に入力され変換
が停止される。ロード停止信号12の停止解除はカレン
トポインタ8の値の更新によって、変換停止信号11の
停止解除はロードポインタ7の値の更新によって解除さ
れる。音声入力データを誤認識したデータ等に対して校
正することができ、より正確に文章を作成することがで
きる。
When the values of the current pointer 8 and the load pointer 7 match by updating the value of the current pointer 8, a conversion stop signal 11 is input from the comparator 9 to the word/sentence conversion device 5, and the conversion is stopped. The stop of the load stop signal 12 is canceled by updating the value of the current pointer 8, and the stop of the conversion stop signal 11 is canceled by updating the value of the load pointer 7. It is possible to proofread voice input data for misrecognized data, etc., and it is possible to create sentences more accurately.

発明の効果 以上のように本発明によれば、音声データを文字データ
に自動的に変更するシステムを校正することができ、音
声誤認識に対する構成機能により、完成度の高い文章を
文字データ入力装置に対する知識がなくても作成するこ
とがてきる。
Effects of the Invention As described above, according to the present invention, it is possible to calibrate a system that automatically changes voice data to text data, and by using the configuration function to prevent speech misrecognition, highly complete sentences can be input into a text data input device. It can be created without any knowledge of.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の文字データ入力装置の構成を示した図
、第2図は本発明の校正機能の構成について示した図で
ある。 1・・・・・・音声記録装置、2・・・・・・音声デー
タ、3・・・・・・音声記録装置、4・・・・・・2値
データ(テンポラリメモリ〉、5・・・・・・単語・文
章変換装置、6・・・・・・単語・文章データ、7・・
・・・・ロードポインタ、8・・・・・・カレントポイ
ンタ、9・・・・・・比較器、10.12・・・・・・
ロード停止信号、11・・・・・・変換停止信号。
FIG. 1 is a diagram showing the configuration of a character data input device of the present invention, and FIG. 2 is a diagram showing the configuration of a proofreading function of the present invention. 1...Audio recording device, 2...Audio data, 3...Audio recording device, 4...Binary data (temporary memory), 5... ...Word/sentence conversion device, 6...Word/sentence data, 7...
...Load pointer, 8...Current pointer, 9...Comparator, 10.12...
Load stop signal, 11... Conversion stop signal.

Claims (2)

【特許請求の範囲】[Claims] (1)音声入力方法として音声記録装置を持ち、かつ、
音声認識装置を備えた文字データ入力装置で、音声記録
装置からの音声データをバンドパスフィルターを介して
2値化し、2値化したデータを一時ワーキングデータと
して貯えるテンポラリメモリを持ち、2値データから単
語或いは文章データに変換するシステムに於いて、2値
データから単語或いは文章データに変換が済んだテンポ
ラリメモリへの音声記録装置からのデータロード許可信
号が単語・文章変換装置から音声記録装置に出され、音
声データをバンドパスフィルターを介して2値化し、2
値化したデータをテンポラリメモリにロードし、テンポ
ラリメモリエリアが一杯になった時点で音声記録装置へ
のロード停止信号が単語・文章変換装置から出力される
ことにより音声記録装置の音声データから自動的に単語
・文章を作成することを特徴とする文字データ入力装置
(1) Have a voice recording device as a voice input method, and
A character data input device equipped with a voice recognition device, which converts voice data from a voice recording device into binary data through a band-pass filter, and has a temporary memory that stores the binary data as temporary working data. In a system for converting into word or sentence data, a data load permission signal from the voice recording device to the temporary memory that has been converted from binary data to word or sentence data is output from the word/sentence conversion device to the voice recording device. The audio data is binarized through a bandpass filter, and
The converted data is loaded into the temporary memory, and when the temporary memory area is full, the word/sentence conversion device outputs a signal to stop loading the audio data into the audio recording device. A character data input device characterized by creating words and sentences.
(2)単語・文章に変換したデータを再度単語・文章変
換装置に入力し、単語・文章を校正することができるこ
とを特徴とする特許請求の範囲第1項記載の文字データ
入力装置。
(2) The character data input device according to claim 1, wherein the data converted into words and sentences can be inputted again into the word and sentence conversion device to proofread the words and sentences.
JP2057136A 1990-03-08 1990-03-08 Character data input device Pending JPH03257499A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2057136A JPH03257499A (en) 1990-03-08 1990-03-08 Character data input device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2057136A JPH03257499A (en) 1990-03-08 1990-03-08 Character data input device

Publications (1)

Publication Number Publication Date
JPH03257499A true JPH03257499A (en) 1991-11-15

Family

ID=13047147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2057136A Pending JPH03257499A (en) 1990-03-08 1990-03-08 Character data input device

Country Status (1)

Country Link
JP (1) JPH03257499A (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5748798A (en) * 1980-09-08 1982-03-20 Mitsubishi Electric Corp Word voice recognizing device
JPS5962949A (en) * 1982-09-30 1984-04-10 Sharp Corp Voice input type japanese document processor
JPS61281298A (en) * 1985-05-20 1986-12-11 三洋電機株式会社 Voice recognition equipment
JPS61296424A (en) * 1985-06-20 1986-12-27 テキサス インスツルメンツインコ−ポレイテツド Method and apparatus for determining state of shift registermemory

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5748798A (en) * 1980-09-08 1982-03-20 Mitsubishi Electric Corp Word voice recognizing device
JPS5962949A (en) * 1982-09-30 1984-04-10 Sharp Corp Voice input type japanese document processor
JPS61281298A (en) * 1985-05-20 1986-12-11 三洋電機株式会社 Voice recognition equipment
JPS61296424A (en) * 1985-06-20 1986-12-27 テキサス インスツルメンツインコ−ポレイテツド Method and apparatus for determining state of shift registermemory

Similar Documents

Publication Publication Date Title
US4720863A (en) Method and apparatus for text-independent speaker recognition
US6801892B2 (en) Method and system for the reduction of processing time in a speech recognition system using the hidden markov model
JP5874640B2 (en) Voice conversion device, mobile phone terminal, voice conversion method and program
US4962535A (en) Voice recognition system
US6662159B2 (en) Recognizing speech data using a state transition model
KR19990071605A (en) Oral Text Recognition Method and System
US5715368A (en) Speech synthesis system and method utilizing phenome information and rhythm imformation
EP0876660B1 (en) Method, device and system for generating segment durations in a text-to-speech system
CN112908308B (en) Audio processing method, device, equipment and medium
CN111933116A (en) Speech recognition model training method, system, mobile terminal and storage medium
JPH03257499A (en) Character data input device
US8260614B1 (en) Method and system for expanding a word graph to a phone graph based on a cross-word acoustical model to improve continuous speech recognition
US6934680B2 (en) Method for generating a statistic for phone lengths and method for determining the length of individual phones for speech synthesis
JPH0313597B2 (en)
Juang From speech recognition to understanding: Shifting paradigm to achieve natural human-machine communication
KR19980037321A (en) Text speech synthesis device and method
JPH05233625A (en) Sentence reading-out device and voice dictionary preparing method
JPH04253098A (en) Language processing method for number and special symbol used for voice synthesis
JPH01241671A (en) Alphabet/kana converting system
KR940005044B1 (en) Voice recognizing apparatus and voice recording method
JPH07160685A (en) Device for reading out sentence
JP2712586B2 (en) Pattern matching method for word speech recognition device
JPS59123891A (en) Voice processor
JPS62299898A (en) Character generator
JPH0576657B2 (en)