JP2723214B2 - Voice document creation device - Google Patents

Voice document creation device

Info

Publication number
JP2723214B2
JP2723214B2 JP60253206A JP25320685A JP2723214B2 JP 2723214 B2 JP2723214 B2 JP 2723214B2 JP 60253206 A JP60253206 A JP 60253206A JP 25320685 A JP25320685 A JP 25320685A JP 2723214 B2 JP2723214 B2 JP 2723214B2
Authority
JP
Japan
Prior art keywords
voice
input
recognition result
recognition
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60253206A
Other languages
Japanese (ja)
Other versions
JPS62113264A (en
Inventor
洋一 竹林
宏之 坪井
博史 金沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60253206A priority Critical patent/JP2723214B2/en
Publication of JPS62113264A publication Critical patent/JPS62113264A/en
Application granted granted Critical
Publication of JP2723214B2 publication Critical patent/JP2723214B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は音声入力による文書作成を効率良く行うこと
のできる音声文書作成装置に関する。 〔発明の技術的背景とその問題点〕 文書の作成は、専ら筆記具を用いて原稿用紙に筆記す
ることにより行われる。 一方、多忙な文書作成者にあっては、速記者を利用し
て口述筆記によって文書作成したり、作成文書情報をテ
ープレコーダ等に音声入力し、これを秘書により書面化
させる等して文書作成が行われる。 これに対して最近では、日本語ワードプロセッサの普
及に伴い、例えばキーボード操作による文書情報の一括
入力方式で、簡易に文書作成が行われるようになってき
ている。 ところが文書情報の最も自然な入力手段は音声入力で
あり、キーボード等の煩わしい操作が全く不要である。
そこで、音声入力による文書作成装置、つまり音声ワー
ドプロセッサの開発が種々試みられている。 さて、この種の音声ワードプロセッサは、情報処理技
術および半導体製造技術の発展を背景として、その実用
化の研究が進められているものである。 ところが音声認識技術は、例えば工場の製品管理工程
で特定話者認識技術として、また電話サービス等におけ
る限られた認識対象に対する不特定話者認識技術として
実用化されているに過ぎない。つまり音声認識は、入力
音声の種々の変動要因を考慮して認識処理する必要があ
る。この為、その認識性能の向上を図るべく、認識処理
方式に対する種々の工夫が試みられ、その認識性能が徐
々に高められつつある。 しかし人間にとっても会話において誤認識が生じるよ
うに、音声認識装置において、100%完全な認識率を達
成することは到底困難である。これ故、音声入力によっ
て文書作成した場合、筆記による文書作成時にも増し
て、作成文書情報の厳密なチェックが必要となる。 〔発明の目的〕 本発明はこのような事情を考慮してなされたもので、
その目的とするところは、音声入力により効果的に文書
作成し、且つその作成文書の編集チェックを簡易に、且
つ効率良く行うことのできる音声文書作成装置を提供す
ることにある。 〔発明の概要〕 本発明に係る音声文書作成装置は、所定の言語単位で
発声入力された音声を分析する手段と、この音声の分析
結果を音声辞書と照合して所定の音声処理単位に対する
認識候補を求める手段と、この認識候補の系列を言語辞
書と照合して前記所定の言語単位の入力音声に対する認
識結果を求める手段と、この認識結果を記憶する第1の
記憶手段と、上記認識結果に対応する入力音声データを
記憶する第2の記憶手段と、前記第1の記憶手段に記憶
された前記認識結果と前記第2の記憶手段に記憶された
前記入力音声データとを所定の言語処理単位で対応付け
て管理する対応管理手段と、前記第1の記憶手段に記憶
された前記認識結果を表示する表示手段と、この表示手
段により表示された認識結果のうち入力音声の参照を行
うべき所望の部分を所定の言語処理単位で指示するため
の音声出力指示手段と、この音声出力指示手段により指
示された前記認識結果の部分に対応付けられて前記第2
の記憶手段に記憶されている入力音声データを選択的に
読出して音声出力する手段とを具備したことを特徴とす
る。 〔発明の効果〕 かくして本発明によれば、認識結果に応じて、その認
識結果を得た入力音声を再生し、これをモニタして上記
認識結果をチェックすることができるので、音声入力に
より作成された文書情報のチェック処理、およびその修
正処理等を簡易に、且つ効率良く行うことが可能とな
る。しかも入力音声が、その認識結果に対応して記憶さ
れ、適宜これを再生することができるので、音声入力に
よる文書作成を一括して行うことができ、その文書作成
効率の向上を図ることが可能となる等の実用上多大なる
効果が奏せられる。 〔発明の実施例〕 以下、図面を参照して発明の一実施例装置につき説明
する。 図は実施例装置の概略構成図であり、1はマイクロフ
ォンや増幅器等からなる音声入力部である。この音声入
力部1から入力される音声情報は、音声検出部2にて音
声区間検出される。制御部3はこの音声区間検出情報に
従って以下に説明する音声認識処理の実行等を制御す
る。 音声入力部1から認識対象とする音声が入力される
と、例えば複数チャンネルのバンドパスフィルタ群から
なる音声分析部4は、その入力音声のスペクトル成分を
検出する等して該入力音声の特徴パラメータを求めてい
る。音声認識部5は、上記特徴パラメータの時系列から
その特徴ベクトルを検出し、その特徴ベクトルと音声辞
書6とを照合して各認識対象カテゴリに対する類似度を
計算する等して、該入力音声を認識処理している。 言語処理部7は、このようにして求められる入力音声
の認識結果の系列を、言語辞書8を参照して言語的に検
定し、例えば複数の認識候補の組合せから言語的に成立
する認識結果系列を、前記入力音声によって示される作
成文書情報として得ている。 このようにして認識処理された認識結果が、ファイル
管理部9の管理の下で文書ファイル10に順に格納され
る。 一方、入力音声に対する認識結果が文書ファイル10に
格納されるとき、その認識結果を得た前記入力音声、或
いはこの入力音声を分析処理してなる音声データが上記
認識結果に対応して音声ファイル11に格納される。この
音声ファイル11は、例えば入力音声データをディジタル
化して記憶し、その記憶音声データを選択的に読出して
再生出力するものである。 しかして、文書作成に供する音声を一括入力し、その
入力音声に対する認識処理が終了すると、オペレータと
の対話形インターフェース部を形成する表示部12にて前
記文書ファイル10に格納された認識結果(作成された文
書情報)を表示し、そのチェックが行われる。 ここで、その表示された認識結果に対して、その認識
結果を得た入力音声を参照したい場合には、音声出力指
示部13から入力音声の参照を行うべき認識結果の特定
と、その入力音声の参照指示が与えられる。この指示情
報は、前記制御部3に与えられると共に、前記音声ファ
イル11に与えられる。この結果、前記ファイル管理部9
の制御の下で、前記音声ファイル11から上記指定された
認識結果に対応する入力音声データが音声出力部14に読
出され、該入力音声が再生出力される。この再生出力さ
れた音声によって、オペレータは認識結果の合否を判定
して適宜その修正を行うことになる。この認識結果の修
正は、例えば正しい認識カテゴリをキーボード入力する
等して行われ、この入力データによって前記文書ファイ
ル11に格納された該当認識結果が修正されることにな
る。 尚、音声出力部14から出力された音声に従って、前記
文書ファイル10に格納された文書情報(認識結果)編集
処理が必要な場合には、その編集情報が編集情報入力部
15から入力される。この入力された編集情報に従って前
記ファイル管理部9の制御の下で、前記文書ファイル10
に格納された文書情報の編集が行われる。この場合、文
書ファイル10に格納された認識結果の編集作業に伴っ
て、音声ファイル11に格納された音声データも、その認
識結果に対応して編集処理される。 ところで本装置にあっては、必要に応じて前記文書フ
ァイル10に格納された認識結果を規則合成部16に読出
し、該認識結果を規則合成処理してその音声データが求
められるようになっている。そしてその規則合成された
音声データを音声出力部17を介して音声出力し得るもの
となっている。 この機能は、認識処理した結果を音声によってチェッ
クする場合に用いられるもので、例えば文書ファイル10
に格納された認識結果の系列が言語処理単位で順に規則
合成されて出力されるようになっている。この場合、制
御部3は、規則合成して音声出力した認識結果に対して
その認識結果を得た入力音声の参照が指示されると、上
記認識結果の規則合成による音声出力を打切る。そして
その打切られた音声の言語処理単位の数単位前の入力音
声データからの再生を開始する。 つまり、ファイル管理部9の制御の下で文書ファイル
10からの認識結果を所定の言語単位毎に読出し、これを
規則合成して音声出力している時点で入力音声の参照が
指示されると、上記文書ファイル10からの認識結果の読
出しに代えて、前記音声ファイル11からの入力音声デー
タの読出しを開始する。この音声ファイル11からの音声
データの読出しは、上記認識結果の読出しの中止が指示
されて言語処理単位の数単位前の言語処理単位から行わ
れる。 この結果、オペレータは、認識結果の音声出力を得た
後、その認識結果を得た入力音声を繰返し得ることが可
能となり、これによってその照合が行われる。 このように本装置によれば、入力音声を認識処理し、
その認識結果を順次文書ファイル10に格納する際に、同
時にその認識結果を得た入力音声データを音声ファイル
11に格納し、これらを所定の言語処理単位で相互に対応
させて管理しているので、認識結果をチェック時に、そ
の認識結果を得た入力音声を容易に参照することが可能
となる。しかも所定の言語処理単位で、任意に入力音声
を参照することが可能となる。 故に、文書作成に供する音声データを一括入力し、そ
の認識処理を行わせた後、入力音声を適宜参照して認識
結果のチェックを簡易に、且つ効果的に行うことが可能
となる。従って、音声の発声入力者が自ら認識結果のチ
ェックを行うことが可能なことはもとより、秘書等の第
3者によって作成文書のチェックを行うことが可能とな
る等、実用上多大なる効果が奏せられる。 尚、前記音声ファイル11に分析処理された入力音声デ
ータを格納する場合には、その分析音声データに従って
入力音声を再合成する処理が必要となることは云うまで
もない。また入力音声の認識処理方式や、入力音声デー
タの記憶形態等は、装置の仕様に応じて定めれば良いも
のである。要するに本発明は、その要旨を逸脱しない範
囲で種々変形して実施することができる。
Description: TECHNICAL FIELD [0001] The present invention relates to a voice document creation device capable of efficiently creating a document by voice input. [Technical Background of the Invention and Problems Thereof] A document is created by writing on a manuscript paper exclusively using a writing instrument. On the other hand, a busy document creator can use a stenographer to create a document by dictation, or input the created document information by voice into a tape recorder or the like, and write the document by a secretary, etc. Is performed. On the other hand, recently, with the spread of Japanese word processors, documents have been easily created by a batch input method of document information by, for example, keyboard operation. However, the most natural means of inputting document information is voice input, and no cumbersome operation such as a keyboard is required.
Therefore, various attempts have been made to develop a document creation device using voice input, that is, a voice word processor. Now, research on the practical use of this type of voice word processor is being promoted with the development of information processing technology and semiconductor manufacturing technology. However, the speech recognition technology has only been put to practical use, for example, as a specific speaker recognition technology in a product management process in a factory, or as an unspecified speaker recognition technology for a limited recognition target in a telephone service or the like. In other words, the voice recognition needs to perform a recognition process in consideration of various fluctuation factors of the input voice. Therefore, in order to improve the recognition performance, various devices for the recognition processing method have been tried, and the recognition performance has been gradually improved. However, it is very difficult for human beings to achieve a 100% perfect recognition rate in a speech recognition device so that false recognition occurs in conversation. For this reason, when a document is created by voice input, strict checking of created document information is required more than when a document is created by handwriting. [Object of the Invention] The present invention has been made in view of such circumstances,
It is an object of the present invention to provide a voice document creating apparatus capable of effectively creating a document by voice input and performing an editing check of the created document easily and efficiently. [Summary of the Invention] A speech document creating apparatus according to the present invention includes a means for analyzing a speech uttered and input in a predetermined language unit, and a method for recognizing a predetermined speech processing unit by comparing the analysis result of the speech with a speech dictionary. Means for obtaining a candidate, means for comparing the sequence of recognition candidates with a language dictionary to obtain a recognition result for the input speech in the predetermined linguistic unit, first storage means for storing the recognition result, A second storage means for storing input voice data corresponding to the input voice data, and a predetermined language processing of the recognition result stored in the first storage means and the input voice data stored in the second storage means. Correspondence management means for managing in association with each other, display means for displaying the recognition result stored in the first storage means, and input speech among the recognition results displayed by the display means. Voice output instructing means for instructing a desired part in a predetermined language processing unit, and the second
Means for selectively reading out the input voice data stored in the storage means and outputting the voice. [Effects of the Invention] Thus, according to the present invention, according to the recognition result, it is possible to play back the input voice that has obtained the recognition result, and monitor and check the recognition result. It is possible to easily and efficiently perform the check processing of the document information thus corrected and the correction processing thereof. Moreover, since the input voice is stored in correspondence with the recognition result and can be reproduced as appropriate, it is possible to collectively create a document by voice input, thereby improving the document creation efficiency. Thus, a great effect can be obtained in practical use. [Embodiment of the Invention] An embodiment of the invention will be described below with reference to the drawings. FIG. 1 is a schematic configuration diagram of the apparatus according to the embodiment. Reference numeral 1 denotes an audio input unit including a microphone, an amplifier, and the like. The voice information input from the voice input unit 1 is detected by the voice detection unit 2 in a voice section. The control unit 3 controls the execution of a speech recognition process described below in accordance with the speech section detection information. When a speech to be recognized is input from the speech input unit 1, the speech analysis unit 4 including a group of band-pass filters of a plurality of channels detects the spectral components of the input speech and performs other processing on the characteristic parameters of the input speech. Seeking. The speech recognition unit 5 detects the feature vector from the time series of the feature parameters, compares the feature vector with the speech dictionary 6, calculates the similarity for each recognition target category, and the like, and converts the input speech. Recognition processing is in progress. The language processing unit 7 verifies the sequence of the recognition results of the input speech obtained in this manner linguistically with reference to the language dictionary 8 and, for example, recognizes a recognition result sequence linguistically established from a combination of a plurality of recognition candidates. Is obtained as created document information indicated by the input voice. The recognition results thus recognized are sequentially stored in the document file 10 under the management of the file management unit 9. On the other hand, when the recognition result for the input voice is stored in the document file 10, the input voice that obtained the recognition result or the voice data obtained by analyzing the input voice is stored in the voice file 11 corresponding to the recognition result. Is stored in The audio file 11 is for digitizing and storing input audio data, for example, and selectively reading out the stored audio data for reproduction and output. Then, when the speech to be used for document creation is input collectively and the recognition process for the input speech is completed, the recognition result (the creation result) stored in the document file 10 is displayed on the display unit 12 which forms an interactive interface with the operator. Document information), and the check is performed. Here, when the user wants to refer to the input speech obtained from the recognition result with respect to the displayed recognition result, the user specifies the recognition result to refer to the input speech from the speech output instructing unit 13 and the input speech. Is given. This instruction information is provided to the control unit 3 and also to the audio file 11. As a result, the file management unit 9
Under the control described above, input voice data corresponding to the specified recognition result is read out from the voice file 11 to the voice output unit 14, and the input voice is reproduced and output. Based on the reproduced voice, the operator determines whether the recognition result is acceptable or not and appropriately corrects the result. The correction of the recognition result is performed, for example, by inputting the correct recognition category using a keyboard, and the input data corrects the corresponding recognition result stored in the document file 11. If the document information (recognition result) stored in the document file 10 needs to be edited in accordance with the voice output from the voice output unit 14, the edit information is sent to the edit information input unit.
Entered from 15. Under the control of the file management unit 9 according to the input editing information, the document file 10
The document information stored in the file is edited. In this case, along with the editing operation of the recognition result stored in the document file 10, the audio data stored in the audio file 11 is also edited according to the recognition result. By the way, in the present apparatus, the recognition result stored in the document file 10 is read out to the rule synthesizing unit 16 as necessary, and the recognition result is subjected to rule synthesizing processing to obtain its speech data. . Then, the voice data that has been rule-synthesized can be output as voice via the voice output unit 17. This function is used when checking the result of recognition processing by voice.
The sequence of recognition results stored in is sequentially synthesized and output in units of language processing. In this case, when the control unit 3 is instructed to refer to the input speech for which the recognition result has been obtained with respect to the recognition result that has been rule-synthesized and output as speech, the control unit 3 terminates the speech output by the rule synthesis of the recognition result. Then, the reproduction of the cut-off sound from the input sound data several units before the language processing unit is started. That is, a document file is controlled under the control of the file management unit 9.
The recognition result from the document file 10 is read out for each predetermined language unit, and when the reference to the input voice is instructed at the time of performing the rule synthesis and outputting the voice, the reading of the recognition result from the document file 10 is performed instead. Then, the reading of the input voice data from the voice file 11 is started. The reading of the voice data from the voice file 11 is performed from the language processing unit several units before the language processing unit when the stop of the reading of the recognition result is instructed. As a result, after obtaining the voice output of the recognition result, the operator can repeat the input voice having obtained the recognition result, whereby the matching is performed. As described above, according to the present apparatus, the input voice is recognized and processed.
When the recognition results are sequentially stored in the document file 10, the input voice data obtained at the
Since these are stored in the memory 11 and managed in correspondence with each other in a predetermined language processing unit, it is possible to easily refer to the input speech obtained from the recognition result when checking the recognition result. In addition, it is possible to arbitrarily refer to the input voice in a predetermined language processing unit. Therefore, it is possible to easily and effectively check the recognition result by inputting voice data to be used for document creation at once and causing the recognition process to be performed, and then appropriately referring to the input voice. Therefore, not only the voice utterer can check the recognition result by himself, but also a third party such as a secretary can check the created document. Can be done. It is needless to say that, when storing the analyzed input voice data in the voice file 11, a process of resynthesizing the input voice according to the analyzed voice data is required. The recognition processing method of the input voice, the storage form of the input voice data, and the like may be determined according to the specifications of the device. In short, the present invention can be variously modified and implemented without departing from the gist thereof.

【図面の簡単な説明】 図は本発明の一実施例装置の概略構成図である。 1…音声入力部、2…音声検出部、3…制御部、4…音
声分析部、5…音声認識部、6…音声辞書、7…言語処
理部、8…言語辞書、9…ファイル管理部、10…文書フ
ァイル、11…音声ファイル、12…表示部、13…音声出力
指示部、14…音声出力部、15…編集情報入力部、16…規
則合成部、17…音声出力部。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a schematic configuration diagram of an apparatus according to an embodiment of the present invention. REFERENCE SIGNS LIST 1 voice input unit 2 voice detection unit 3 control unit 4 voice analysis unit 5 voice recognition unit 6 voice dictionary 7 language processing unit 8 language dictionary 9 file management unit , 10 ... document file, 11 ... audio file, 12 ... display unit, 13 ... audio output instruction unit, 14 ... audio output unit, 15 ... edit information input unit, 16 ... rule synthesizing unit, 17 ... audio output unit.

Claims (1)

(57)【特許請求の範囲】 1.所定の言語単位で発声入力された音声を分析する手
段と、 この音声の分析結果を音声辞書と照合して所定の音声処
理単位に対する認識候補を求める手段と、 この認識候補の系列を言語辞書と照合して前記所定の言
語単位の入力音声に対する認識結果を求める手段と、 この認識結果を記憶する第1の記憶手段と、 上記認識結果に対応する入力音声データを記憶する第2
の記憶手段と、 前記第1の記憶手段に記憶された前記認識結果と前記第
2の記憶手段に記憶された前記入力音声データとを所定
の言語処理単位で対応付けて管理する対応管理手段と、 前記第1の記憶手段に記憶された前記認識結果を表示す
る表示手段と、 この表示手段により表示された認識結果のうち入力音声
の参照を行うべき所望の部分を所定の言語処理単位で指
示するための音声出力指示手段と、 この音声出力指示手段により指示された前記認識結果の
部分に対応付けられて前記第2の記憶手段に記憶されて
いる入力音声データを選択的に読出して音声出力する手
段とを具備したことを特徴とする音声文書作成装置。 2.音声入力される所定の言語単位は、単語、文節、句
または文等からなるものである特許請求の範囲第1項記
載の音声文書作成装置。 3.対応管理手段は、前記第1の記憶手段に記憶された
認識結果が編集処理された場合、これに伴って前記第2
の記憶手段に記憶された入力音声データも、その認識結
果に対応して編集処理するものである特許請求の範囲第
1項記載の音声文書作成装置。
(57) [Claims] Means for analyzing a voice uttered and input in a predetermined language unit; means for comparing the analysis result of the voice with a voice dictionary to obtain a recognition candidate for a predetermined voice processing unit; Means for comparing to obtain a recognition result for the input speech in the predetermined language unit; first storage means for storing the recognition result; and second means for storing input speech data corresponding to the recognition result.
Storage means; and correspondence management means for managing the recognition result stored in the first storage means and the input voice data stored in the second storage means in association with each other in a predetermined language processing unit. Display means for displaying the recognition result stored in the first storage means; and a desired part of the recognition result displayed by the display means to which input speech should be referred to in a predetermined language processing unit And voice output instruction means for selectively reading input voice data stored in the second storage means in association with a part of the recognition result specified by the voice output instruction means. And a means for creating a voice document. 2. 2. The voice document creation device according to claim 1, wherein the predetermined language unit input by voice is a word, a phrase, a phrase, a sentence, or the like. 3. The correspondence managing means, when the recognition result stored in the first storage means is edited, causes the second
2. The voice document creating apparatus according to claim 1, wherein the input voice data stored in said storage means is also edited according to the recognition result.
JP60253206A 1985-11-12 1985-11-12 Voice document creation device Expired - Lifetime JP2723214B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60253206A JP2723214B2 (en) 1985-11-12 1985-11-12 Voice document creation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60253206A JP2723214B2 (en) 1985-11-12 1985-11-12 Voice document creation device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP9086476A Division JP2835320B2 (en) 1997-04-04 1997-04-04 Voice document creation device

Publications (2)

Publication Number Publication Date
JPS62113264A JPS62113264A (en) 1987-05-25
JP2723214B2 true JP2723214B2 (en) 1998-03-09

Family

ID=17248027

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60253206A Expired - Lifetime JP2723214B2 (en) 1985-11-12 1985-11-12 Voice document creation device

Country Status (1)

Country Link
JP (1) JP2723214B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63317874A (en) * 1987-06-19 1988-12-26 Sanyo Electric Co Ltd Dictating machine
JP2647873B2 (en) * 1987-12-17 1997-08-27 三洋電機株式会社 Writing system
JPH02289026A (en) * 1989-03-20 1990-11-29 Fujitsu Ltd Voice word processor

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54136134A (en) * 1978-04-13 1979-10-23 Toshiba Corp Aural typewriter
JPS59180629A (en) * 1983-03-30 1984-10-13 Comput Basic Mach Technol Res Assoc Voice inputting device of japanese
JPS59206238A (en) * 1983-05-09 1984-11-22 Tokai Rika Co Ltd Vehicle room mirror
JPH0625988B2 (en) * 1983-09-12 1994-04-06 株式会社東芝 Japanese information input method

Also Published As

Publication number Publication date
JPS62113264A (en) 1987-05-25

Similar Documents

Publication Publication Date Title
JP3610083B2 (en) Multimedia presentation apparatus and method
EP0887788B1 (en) Voice recognition apparatus for converting voice data present on a recording medium into text data
US8150687B2 (en) Recognizing speech, and processing data
US6601027B1 (en) Position manipulation in speech recognition
US6704709B1 (en) System and method for improving the accuracy of a speech recognition program
JP3459712B2 (en) Speech recognition method and device and computer control device
KR20000057795A (en) Speech recognition enrollment for non-readers and displayless devices
JPH10274997A (en) Document reading-aloud device
ZA200200904B (en) System and method for improving the accuracy of a speech recognition program.
JP2001282277A (en) Voice information processor, and its method and storage medium
JP3104661B2 (en) Japanese writing system
JP2723214B2 (en) Voice document creation device
JP2001272990A (en) Interaction recording and editing device
JP2835320B2 (en) Voice document creation device
JP2004020739A (en) Device, method and program for preparing minutes
KR102107447B1 (en) Text to speech conversion apparatus for providing a translation function based on application of an optional speech model and operating method thereof
KR100707727B1 (en) A portable file player
AU776890B2 (en) System and method for improving the accuracy of a speech recognition program
KR102274275B1 (en) Application and method for generating text link
JPH06175698A (en) Voice retrieving device
JP2003173196A (en) Method and apparatus for synthesizing voice
JP2008107641A (en) Voice data retrieving apparatus
JPH11212590A (en) Voice processor, recording medium with voice recognition program recorded, and recording medium with processing program recorded
KR20220050342A (en) Apparatus, terminal and method for providing speech synthesizer service
JP3363636B2 (en) Accent control device and method related to speech synthesis

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term