JPS60205594A - Recognition results display system - Google Patents
Recognition results display systemInfo
- Publication number
- JPS60205594A JPS60205594A JP59064398A JP6439884A JPS60205594A JP S60205594 A JPS60205594 A JP S60205594A JP 59064398 A JP59064398 A JP 59064398A JP 6439884 A JP6439884 A JP 6439884A JP S60205594 A JPS60205594 A JP S60205594A
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- candidate
- uttered
- units
- displayed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 235000016496 Panda oleosa Nutrition 0.000 description 2
- 240000000220 Panda oleosa Species 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】
〈発明の技術分野〉
本発明は文節単位で発声された音声を音節単位に認識し
、この認識された音節候補の組合せによって文節単位の
候補列を作成して表示する音声入力装置における認識結
果表示方式に関するものである0
↓ 〈発明の技術的背景とその問題点〉一般に文節単位
で発声された音声を音節単位に防衛ル1 イす自古尚イ
i’r a)4古烏右η11をり腎虚してタリテ七1ト
ヌ、音声入力装置にあっては、キーボード等からの入力
と異なり、いわゆる6確からしさ”を含んで入力される
。しかし、現状レベルの認識装置では、発声された文節
がそのまま入力されることは稀である。その結果、音節
候補列、更に文節候補列という形に展開する処理を行な
い、°′確からしい″候補から順番に画面上に表示する
ように成されており、またこのときの表示は最も“確か
らしい”一つの文節候補を表示し、この表示された文節
が発声された文節と違った場合には、オペレータがキー
ボード等を操作して次の候補を画面上に表示するように
成されている。[Detailed Description of the Invention] <Technical Field of the Invention> The present invention recognizes speech uttered in units of phrases in units of syllables, and creates and displays a candidate string in units of phrases based on combinations of recognized syllable candidates. 0 ↓ <Technical background of the invention and its problems> Generally speaking, speech uttered in phrases can be defended in units of syllables. With voice input devices, unlike input from a keyboard, input includes so-called 6-likelihood.However, the current level of recognition devices. , it is rare that the uttered phrase is input as is.As a result, a process is performed to develop it into a string of syllable candidates and then a string of phrase candidates, which are then displayed on the screen in order of ``most likely'' candidates. At this time, the display displays the most likely phrase candidate, and if the displayed phrase is different from the phrase that was uttered, the operator operates the keyboard etc. The next candidate is displayed on the screen.
しかし、従来のこのような認識結果の表示方式では、発
声した文節が候補列の下位にある場合には、その文節を
探し出すのに時間がかかり、またその文節が候補列にな
かった場合には、せっかく最後まで候補を探しに行って
も無駄になってしまう等の問題点があった。However, with this conventional method of displaying recognition results, if the uttered phrase is located at the bottom of the candidate column, it takes time to find the phrase, and if the phrase is not in the candidate column, the phrase is not found in the candidate column. , there were problems such as even if you went to the end to search for candidates, it would be in vain.
〈発明の目的〉
本発明は上記従来の問題点を除去することを目的として
成されたものであり、この目的を達成するため、本発明
の認識結果表示方式は文節単位で発声された音声を音節
単位に認識し、文節単位の候補列を作成して表示する音
声入力装置において、認識結果の不確実さを伴なう複数
の文節候補列をメニュ一方式で画面上に表示せしめるよ
うに成されている。<Objective of the Invention> The present invention was made with the purpose of eliminating the above-mentioned conventional problems, and in order to achieve this purpose, the recognition result display method of the present invention displays the speech uttered in units of phrases. A speech input device that recognizes syllables and creates and displays candidate strings for each phrase has been designed to display multiple phrase candidate strings on the screen using a menu-only method, which involves uncertainty in the recognition results. has been done.
〈発明の実施例〉
以下、図面を参照して本発明の一実施例を詳細に説明す
る。<Embodiment of the Invention> Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.
第1図は本発明の実施される音声入力装置の一構成例を
示すブロック図である。FIG. 1 is a block diagram showing an example of the configuration of a voice input device in which the present invention is implemented.
第1図において、lは音声入力をピックアップするマイ
クロホンであり、このマイクロホン1によシ検出された
音声は単音節認識部2に入力される。この単音節認識部
2は従来公知のものであり、マイクロホン1を介して入
力された文節単位の音声が音節単位に区分されて単音節
毎の特徴抽出が行なわれる。一方メモリ8には各単音節
毎の標準パターンが記憶されており、単音節認識部2に
おいて入力音声の特徴パターンと標準パターンとのマツ
チング計算処理が行なわれ、このマツチング計算処理の
結果、最も近似したものが第1候補として、また順次近
似したものが次候補として選出され、その結果が近似度
(確からしさ)を示す距離差情報と共にメモリ4に音節
ラティスとして記憶される。In FIG. 1, l is a microphone that picks up voice input, and the voice detected by this microphone 1 is input to a monosyllable recognition section 2. This monosyllable recognition unit 2 is conventionally known, and classifies speech in units of phrases input through the microphone 1 into units of syllables, and extracts features for each monosyllable. On the other hand, the memory 8 stores a standard pattern for each monosyllable, and the monosyllable recognition unit 2 performs a matching calculation process between the characteristic pattern of the input speech and the standard pattern, and as a result of this matching calculation process, the most approximate The selected candidate is selected as the first candidate, and the sequentially approximated ones are selected as the next candidates, and the results are stored as a syllable lattice in the memory 4 together with distance difference information indicating the degree of approximation (certainty).
上記単音節認識部2にお″いて認識され、音節ラティス
としてメモリ4に記憶された内容は候補列作成部5に入
力されて近似度(確からしさ)を示す距離差情報を用い
て確度の高い順に文節候補(かな文字列)が作成されて
文節候補メモ゛す6に記憶される。The content recognized by the monosyllable recognition unit 2 and stored in the memory 4 as a syllable lattice is input to the candidate sequence creation unit 5 and is highly accurate using distance difference information indicating the degree of approximation (likelihood). Clause candidates (kana character strings) are created in order and stored in the clause candidate memory 6.
上記候補列作成部5において作成され、メモリ6内に記
憶された複数の候補列は後述するように本発明にしたが
って表示装置7の画面上にメニュー表示されるように構
成されている。The plurality of candidate columns created in the candidate column creation section 5 and stored in the memory 6 are configured to be displayed as a menu on the screen of the display device 7 according to the present invention, as will be described later.
なおβは仮名キー、ファンクションキー等を有する入力
装置、9は仮名漢字変換処理部、1oは上記各装置を制
御するコントローラ(CPU)である0
次に上記の如く構成された装置の動作を第2図に示す処
理フローに従って説明する。Note that β is an input device having kana keys, function keys, etc., 9 is a kana-kanji conversion processing unit, and 1o is a controller (CPU) that controls each of the above devices.Next, the operation of the device configured as described above will be explained below. This will be explained according to the processing flow shown in FIG.
文節単位に発声された音声はマイクロホン1によって検
出されて単音節認識部2により、音響分析によって単音
節単位に認識され(nO〜n3)、その認識結果が音節
ラティスメモリ4に入力記憶される。The speech uttered in units of phrases is detected by the microphone 1 and recognized by the monosyllable recognition unit 2 in units of monosyllables by acoustic analysis (nO to n3), and the recognition results are input and stored in the syllable lattice memory 4.
例えば入力音声「/こ/</み/ん/は/」に対する単
音節認識結果として第1表に示すような音節ラティスが
形成される。For example, a syllable lattice as shown in Table 1 is formed as a monosyllable recognition result for the input speech "/ko/</mi/n/ha/".
第1表
認識では、あいまいさを含むため、上記第1表に示した
ように音節の候補として出力される。In Table 1 recognition, since ambiguity is included, the words are output as syllable candidates as shown in Table 1 above.
上記単音節認識部2において認識され、音節ラテノスJ
−1でメモリ4に記憶された音節単位の各候補は候補列
作成部5に入力される。Recognized by the monosyllable recognition unit 2, the syllable latenos J
Each syllable unit candidate stored in the memory 4 at -1 is input to the candidate string creation section 5.
候補列作成部5は音節ラティスメモリ4に記憶された音
節・単位の認識結果の組み合せを考えて文節の候補列へ
と展開しくステップn4)、作成さ □れた文節の候補
列の確度順にメモリ6に記憶する0上記第1表に示した
例では24個の候補列が第2表の如く作成されてメモリ
6に記憶される。このとき、発声された入力音声の文節
は候補列の12番目である。The candidate sequence creation unit 5 considers the combination of syllable/unit recognition results stored in the syllable lattice memory 4 and develops it into a phrase candidate sequence (step n4), and stores the created phrase candidate sequence in the order of accuracy. In the example shown in Table 1 above, 24 candidate columns are created and stored in the memory 6 as shown in Table 2. At this time, the phrase of the input speech that was uttered is the 12th phrase in the candidate string.
第2表
従来は、このような複数の候補列の最上位の文節候補が
画面上に表示され、オペレータの指示により順番に次の
文節候補を表示していた。また(このときの表示は常に
一つの文節候補に限られていた。Table 2 Conventionally, the highest phrase candidate of such a plurality of candidate columns was displayed on the screen, and the next phrase candidate was displayed in order according to an operator's instruction. Also, (at this time, the display was always limited to one phrase candidate.
本発明方式では、第8図に示すように表示装置7の画面
71上に表示されている入力文章と共に、文節候補列の
上位から、いくつかの文節候補(実ニ一式に表示する(
ステップn5)。即ち、入力文章に続いて文節候補列の
一部がマルチウィンドウ表示(文節メニュー)72され
ることになる。In the method of the present invention, along with the input sentence displayed on the screen 71 of the display device 7 as shown in FIG.
Step n5). That is, following the input sentence, a part of the clause candidate string is displayed in a multi-window (clause menu) 72.
オペレータは、表示された1文節メニュー”72の中に
発声した文節があるか否かを判断しくステップn6)、
発声した文節が無ければ、入力装置8の例えばカーソル
キーで次の°′文節メニュー”へ表示を切シ換える(ス
テップn7)。The operator determines whether or not there is a phrase that has been uttered in the displayed one phrase menu "72" (step n6).
If there is no phrase that has been uttered, the display is switched to the next clause menu by using, for example, the cursor key on the input device 8 (step n7).
このようにして表示された0文節メニュー”の中に発声
した文節があった場合には、6文節メニュー”と共に表
示されている番号を指示することにより(ステップn8
)、発声した文節が決定されることになる。第8図に示
した例では3番目の“文節メニュー”の2番目となって
いる。If there is a uttered phrase in the ``0 phrase menu'' displayed in this way, by indicating the number displayed together with the ``6 phrase menu'' (step n8
), the uttered phrase is determined. In the example shown in FIG. 8, it is the second of the third "Phrase Menu".
文節の決定後、例えば変換キーの操作によって仮名漢字
変換処理部9によって漢字混シ文に変換され、その結果
が表示される(ステップn9)。After determining the phrase, it is converted into a kanji-mixed sentence by the kana-kanji conversion processing section 9, for example, by operating a conversion key, and the result is displayed (step n9).
また、発声した文節が文節候補列にない場合にも、少な
い操作でこれを知ることが出来る。Furthermore, even if the uttered phrase is not in the phrase candidate column, this can be known with a few operations.
また、本発明によれば、発声した文節が文節候補列の下
位にあるときほど、文節決定に要する時間が短くて済む
ことになる。Furthermore, according to the present invention, the lower the uttered phrase is in the phrase candidate string, the shorter the time required to determine the phrase.
なお、上記実施例においては第4図に示すように表示画
面71中の入力文章に続いて6文節メニュー″の表示7
2を行なうようにしているため、1文節メニュー”が画
面からはみ出る場合が考えられるが、この場合は画面を
上等にスクロールさせて、゛文節メニュー”が表示でき
るスペースを確保するように成せばよい。In the above embodiment, as shown in FIG.
Since we are performing step 2, there may be cases where the ``1 Bunsetsu Menu'' extends off the screen, but in this case, you can scroll the screen upwards to ensure space for the ``Bunsetsu Menu'' to be displayed. good.
また、上記実施例においては1文節メニュー”を入力文
章と一緒に表示する方式について説明したが、本発明は
これに限定されるものではなく、常時”文節メニュー表
示エリア#72に割シ当てておいて、文節が決定されて
から、その決定された文節を入力文章中へ表示するよう
に成しても良いO
〈発明の効果〉
以上のように本発明によれば、文節単位で発声された音
声を音節単位に認識し、文節単位の候補列を作成、して
表示する音声入力装置において、認識結果の不確実さを
伴なう複数の文節候補列をメニュ一方式で画面上に表示
せしめるように成しているため、文節候補例が多くなっ
た場合、発声した文節の決定に要する時間を短縮するこ
とが出来る。まだ発声された文節が、候補列に含まれて
いるか否かの確認を少ない操作によって行なうことが出
来る。Furthermore, in the above embodiment, a method was described in which a "one phrase menu" is displayed together with the input text, but the present invention is not limited to this, and the "one phrase menu" is always allocated to the phrase menu display area #72. After the phrase is determined, the determined phrase may be displayed in the input sentence. <Effect of the Invention> As described above, according to the present invention, the phrase is uttered in units of phrases. In a voice input device that recognizes speech in units of syllables and creates and displays candidate sequences in units of phrases, multiple phrase candidate sequences with uncertain recognition results are displayed on the screen using a menu-only method. Since the phrase is configured so as to force the user to speak the phrase, when the number of phrase candidates increases, the time required to determine the phrase to be uttered can be shortened. It is possible to check with a few operations whether or not the phrase that has yet to be uttered is included in the candidate string.
第1図は本発明を実施した音声入力装置の一構成例を示
すブロック図、第2図はその動作説明にトr′ロ日、ト
ス、4に/5n)lis’l !+11iSQi4n
:fKIIYIrtJ−M 調ドf1−Ji−発明を実
施した装置の表示の例を示す図である。
1・・・マイクロホン、 2・・・単音節認識部、。
3・・・標準パターンメモリ、
4・・・音節ラティスメモリ、5・・・候補列作成図、
6・・・文節候補メモリ、 7・・・表示装置、8・・
・入力装置、 71・・・表示画面、72・・・文節メ
ニュー表示画面。
代理人 弁理士 福 士 愛 彦(他2名)第1図FIG. 1 is a block diagram showing an example of the configuration of a voice input device embodying the present invention, and FIG. 2 shows an explanation of its operation. +11iSQi4n
:fKIIYIrtJ-M key de f1-Ji- FIG. 1... Microphone, 2... Monosyllable recognition unit. 3... Standard pattern memory, 4... Syllable lattice memory, 5... Candidate sequence creation diagram,
6... Clause candidate memory, 7... Display device, 8...
- Input device, 71... Display screen, 72... Clause menu display screen. Agent Patent attorney Aihiko Fukushi (and 2 others) Figure 1
Claims (1)
節単位の候補列を作成して表示する音声入力装置におい
て、 認識結果の不確実さを伴なう複数の文節候補列をメニュ
一方式で画面上に表示せしめるように成したことを特徴
とする認識結果表示方式。[Claims] 1. In a speech input device that recognizes speech uttered in units of phrases in units of syllables and creates and displays a candidate string in units of phrases, A recognition result display method characterized in that a phrase candidate string is displayed on a screen using a menu.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59064398A JPS60205594A (en) | 1984-03-30 | 1984-03-30 | Recognition results display system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59064398A JPS60205594A (en) | 1984-03-30 | 1984-03-30 | Recognition results display system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60205594A true JPS60205594A (en) | 1985-10-17 |
Family
ID=13257169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59064398A Pending JPS60205594A (en) | 1984-03-30 | 1984-03-30 | Recognition results display system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60205594A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0446399A (en) * | 1990-06-14 | 1992-02-17 | Sharp Corp | Voice recognizer |
JPH06274193A (en) * | 1993-03-17 | 1994-09-30 | Nippon Steel Corp | Data base retrieval system |
-
1984
- 1984-03-30 JP JP59064398A patent/JPS60205594A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0446399A (en) * | 1990-06-14 | 1992-02-17 | Sharp Corp | Voice recognizer |
JPH06274193A (en) * | 1993-03-17 | 1994-09-30 | Nippon Steel Corp | Data base retrieval system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4829901B2 (en) | Method and apparatus for confirming manually entered indeterminate text input using speech input | |
RU2377664C2 (en) | Text input method | |
CN105117376B (en) | Multi-mode input method editor | |
JP3476007B2 (en) | Recognition word registration method, speech recognition method, speech recognition device, storage medium storing software product for registration of recognition word, storage medium storing software product for speech recognition | |
US5995934A (en) | Method for recognizing alpha-numeric strings in a Chinese speech recognition system | |
US20020007275A1 (en) | Speech complementing apparatus, method and recording medium | |
JP3762191B2 (en) | Information input method, information input device, and storage medium | |
JPS60205594A (en) | Recognition results display system | |
JP3762300B2 (en) | Text input processing apparatus and method, and program | |
JPH05119793A (en) | Method and device for speech recognition | |
JPS58123129A (en) | Converting device of japanese syllabary to chinese character | |
JPH086940A (en) | Voice input method and information processing apparatus using the same | |
JPH0630052B2 (en) | Voice recognition display | |
KR101777141B1 (en) | Apparatus and method for inputting chinese and foreign languages based on hun min jeong eum using korean input keyboard | |
JPS61184683A (en) | Recognition-result selecting system | |
JP2001229155A (en) | Device and method for chinese input conversion processing, and recording medium | |
JPH04232997A (en) | System for displaying result of recognition in speech recognition device | |
JPH049320B2 (en) | ||
JP4797307B2 (en) | Speech recognition apparatus and speech recognition method | |
JPS62117060A (en) | Character/voice input conversion system | |
JPS61122781A (en) | audio word processor | |
JPH0380363A (en) | Document processor | |
JPH0195323A (en) | Voice input device | |
JPS60176167A (en) | Voice input type dictionary retrieving device | |
JPS6275760A (en) | Kana-kanji conversion device |