JPS60205594A - Recognition results display system - Google Patents

Recognition results display system

Info

Publication number
JPS60205594A
JPS60205594A JP59064398A JP6439884A JPS60205594A JP S60205594 A JPS60205594 A JP S60205594A JP 59064398 A JP59064398 A JP 59064398A JP 6439884 A JP6439884 A JP 6439884A JP S60205594 A JPS60205594 A JP S60205594A
Authority
JP
Japan
Prior art keywords
phrase
candidate
uttered
units
displayed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59064398A
Other languages
Japanese (ja)
Inventor
岩橋 弘幸
西岡 芳樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP59064398A priority Critical patent/JPS60205594A/en
Publication of JPS60205594A publication Critical patent/JPS60205594A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〈発明の技術分野〉 本発明は文節単位で発声された音声を音節単位に認識し
、この認識された音節候補の組合せによって文節単位の
候補列を作成して表示する音声入力装置における認識結
果表示方式に関するものである0 ↓ 〈発明の技術的背景とその問題点〉一般に文節単位
で発声された音声を音節単位に防衛ル1 イす自古尚イ
i’r a)4古烏右η11をり腎虚してタリテ七1ト
ヌ、音声入力装置にあっては、キーボード等からの入力
と異なり、いわゆる6確からしさ”を含んで入力される
。しかし、現状レベルの認識装置では、発声された文節
がそのまま入力されることは稀である。その結果、音節
候補列、更に文節候補列という形に展開する処理を行な
い、°′確からしい″候補から順番に画面上に表示する
ように成されており、またこのときの表示は最も“確か
らしい”一つの文節候補を表示し、この表示された文節
が発声された文節と違った場合には、オペレータがキー
ボード等を操作して次の候補を画面上に表示するように
成されている。
[Detailed Description of the Invention] <Technical Field of the Invention> The present invention recognizes speech uttered in units of phrases in units of syllables, and creates and displays a candidate string in units of phrases based on combinations of recognized syllable candidates. 0 ↓ <Technical background of the invention and its problems> Generally speaking, speech uttered in phrases can be defended in units of syllables. With voice input devices, unlike input from a keyboard, input includes so-called 6-likelihood.However, the current level of recognition devices. , it is rare that the uttered phrase is input as is.As a result, a process is performed to develop it into a string of syllable candidates and then a string of phrase candidates, which are then displayed on the screen in order of ``most likely'' candidates. At this time, the display displays the most likely phrase candidate, and if the displayed phrase is different from the phrase that was uttered, the operator operates the keyboard etc. The next candidate is displayed on the screen.

しかし、従来のこのような認識結果の表示方式では、発
声した文節が候補列の下位にある場合には、その文節を
探し出すのに時間がかかり、またその文節が候補列にな
かった場合には、せっかく最後まで候補を探しに行って
も無駄になってしまう等の問題点があった。
However, with this conventional method of displaying recognition results, if the uttered phrase is located at the bottom of the candidate column, it takes time to find the phrase, and if the phrase is not in the candidate column, the phrase is not found in the candidate column. , there were problems such as even if you went to the end to search for candidates, it would be in vain.

〈発明の目的〉 本発明は上記従来の問題点を除去することを目的として
成されたものであり、この目的を達成するため、本発明
の認識結果表示方式は文節単位で発声された音声を音節
単位に認識し、文節単位の候補列を作成して表示する音
声入力装置において、認識結果の不確実さを伴なう複数
の文節候補列をメニュ一方式で画面上に表示せしめるよ
うに成されている。
<Objective of the Invention> The present invention was made with the purpose of eliminating the above-mentioned conventional problems, and in order to achieve this purpose, the recognition result display method of the present invention displays the speech uttered in units of phrases. A speech input device that recognizes syllables and creates and displays candidate strings for each phrase has been designed to display multiple phrase candidate strings on the screen using a menu-only method, which involves uncertainty in the recognition results. has been done.

〈発明の実施例〉 以下、図面を参照して本発明の一実施例を詳細に説明す
る。
<Embodiment of the Invention> Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.

第1図は本発明の実施される音声入力装置の一構成例を
示すブロック図である。
FIG. 1 is a block diagram showing an example of the configuration of a voice input device in which the present invention is implemented.

第1図において、lは音声入力をピックアップするマイ
クロホンであり、このマイクロホン1によシ検出された
音声は単音節認識部2に入力される。この単音節認識部
2は従来公知のものであり、マイクロホン1を介して入
力された文節単位の音声が音節単位に区分されて単音節
毎の特徴抽出が行なわれる。一方メモリ8には各単音節
毎の標準パターンが記憶されており、単音節認識部2に
おいて入力音声の特徴パターンと標準パターンとのマツ
チング計算処理が行なわれ、このマツチング計算処理の
結果、最も近似したものが第1候補として、また順次近
似したものが次候補として選出され、その結果が近似度
(確からしさ)を示す距離差情報と共にメモリ4に音節
ラティスとして記憶される。
In FIG. 1, l is a microphone that picks up voice input, and the voice detected by this microphone 1 is input to a monosyllable recognition section 2. This monosyllable recognition unit 2 is conventionally known, and classifies speech in units of phrases input through the microphone 1 into units of syllables, and extracts features for each monosyllable. On the other hand, the memory 8 stores a standard pattern for each monosyllable, and the monosyllable recognition unit 2 performs a matching calculation process between the characteristic pattern of the input speech and the standard pattern, and as a result of this matching calculation process, the most approximate The selected candidate is selected as the first candidate, and the sequentially approximated ones are selected as the next candidates, and the results are stored as a syllable lattice in the memory 4 together with distance difference information indicating the degree of approximation (certainty).

上記単音節認識部2にお″いて認識され、音節ラティス
としてメモリ4に記憶された内容は候補列作成部5に入
力されて近似度(確からしさ)を示す距離差情報を用い
て確度の高い順に文節候補(かな文字列)が作成されて
文節候補メモ゛す6に記憶される。
The content recognized by the monosyllable recognition unit 2 and stored in the memory 4 as a syllable lattice is input to the candidate sequence creation unit 5 and is highly accurate using distance difference information indicating the degree of approximation (likelihood). Clause candidates (kana character strings) are created in order and stored in the clause candidate memory 6.

上記候補列作成部5において作成され、メモリ6内に記
憶された複数の候補列は後述するように本発明にしたが
って表示装置7の画面上にメニュー表示されるように構
成されている。
The plurality of candidate columns created in the candidate column creation section 5 and stored in the memory 6 are configured to be displayed as a menu on the screen of the display device 7 according to the present invention, as will be described later.

なおβは仮名キー、ファンクションキー等を有する入力
装置、9は仮名漢字変換処理部、1oは上記各装置を制
御するコントローラ(CPU)である0 次に上記の如く構成された装置の動作を第2図に示す処
理フローに従って説明する。
Note that β is an input device having kana keys, function keys, etc., 9 is a kana-kanji conversion processing unit, and 1o is a controller (CPU) that controls each of the above devices.Next, the operation of the device configured as described above will be explained below. This will be explained according to the processing flow shown in FIG.

文節単位に発声された音声はマイクロホン1によって検
出されて単音節認識部2により、音響分析によって単音
節単位に認識され(nO〜n3)、その認識結果が音節
ラティスメモリ4に入力記憶される。
The speech uttered in units of phrases is detected by the microphone 1 and recognized by the monosyllable recognition unit 2 in units of monosyllables by acoustic analysis (nO to n3), and the recognition results are input and stored in the syllable lattice memory 4.

例えば入力音声「/こ/</み/ん/は/」に対する単
音節認識結果として第1表に示すような音節ラティスが
形成される。
For example, a syllable lattice as shown in Table 1 is formed as a monosyllable recognition result for the input speech "/ko/</mi/n/ha/".

第1表 認識では、あいまいさを含むため、上記第1表に示した
ように音節の候補として出力される。
In Table 1 recognition, since ambiguity is included, the words are output as syllable candidates as shown in Table 1 above.

上記単音節認識部2において認識され、音節ラテノスJ
−1でメモリ4に記憶された音節単位の各候補は候補列
作成部5に入力される。
Recognized by the monosyllable recognition unit 2, the syllable latenos J
Each syllable unit candidate stored in the memory 4 at -1 is input to the candidate string creation section 5.

候補列作成部5は音節ラティスメモリ4に記憶された音
節・単位の認識結果の組み合せを考えて文節の候補列へ
と展開しくステップn4)、作成さ □れた文節の候補
列の確度順にメモリ6に記憶する0上記第1表に示した
例では24個の候補列が第2表の如く作成されてメモリ
6に記憶される。このとき、発声された入力音声の文節
は候補列の12番目である。
The candidate sequence creation unit 5 considers the combination of syllable/unit recognition results stored in the syllable lattice memory 4 and develops it into a phrase candidate sequence (step n4), and stores the created phrase candidate sequence in the order of accuracy. In the example shown in Table 1 above, 24 candidate columns are created and stored in the memory 6 as shown in Table 2. At this time, the phrase of the input speech that was uttered is the 12th phrase in the candidate string.

第2表 従来は、このような複数の候補列の最上位の文節候補が
画面上に表示され、オペレータの指示により順番に次の
文節候補を表示していた。また(このときの表示は常に
一つの文節候補に限られていた。
Table 2 Conventionally, the highest phrase candidate of such a plurality of candidate columns was displayed on the screen, and the next phrase candidate was displayed in order according to an operator's instruction. Also, (at this time, the display was always limited to one phrase candidate.

本発明方式では、第8図に示すように表示装置7の画面
71上に表示されている入力文章と共に、文節候補列の
上位から、いくつかの文節候補(実ニ一式に表示する(
ステップn5)。即ち、入力文章に続いて文節候補列の
一部がマルチウィンドウ表示(文節メニュー)72され
ることになる。
In the method of the present invention, along with the input sentence displayed on the screen 71 of the display device 7 as shown in FIG.
Step n5). That is, following the input sentence, a part of the clause candidate string is displayed in a multi-window (clause menu) 72.

オペレータは、表示された1文節メニュー”72の中に
発声した文節があるか否かを判断しくステップn6)、
発声した文節が無ければ、入力装置8の例えばカーソル
キーで次の°′文節メニュー”へ表示を切シ換える(ス
テップn7)。
The operator determines whether or not there is a phrase that has been uttered in the displayed one phrase menu "72" (step n6).
If there is no phrase that has been uttered, the display is switched to the next clause menu by using, for example, the cursor key on the input device 8 (step n7).

このようにして表示された0文節メニュー”の中に発声
した文節があった場合には、6文節メニュー”と共に表
示されている番号を指示することにより(ステップn8
)、発声した文節が決定されることになる。第8図に示
した例では3番目の“文節メニュー”の2番目となって
いる。
If there is a uttered phrase in the ``0 phrase menu'' displayed in this way, by indicating the number displayed together with the ``6 phrase menu'' (step n8
), the uttered phrase is determined. In the example shown in FIG. 8, it is the second of the third "Phrase Menu".

文節の決定後、例えば変換キーの操作によって仮名漢字
変換処理部9によって漢字混シ文に変換され、その結果
が表示される(ステップn9)。
After determining the phrase, it is converted into a kanji-mixed sentence by the kana-kanji conversion processing section 9, for example, by operating a conversion key, and the result is displayed (step n9).

また、発声した文節が文節候補列にない場合にも、少な
い操作でこれを知ることが出来る。
Furthermore, even if the uttered phrase is not in the phrase candidate column, this can be known with a few operations.

また、本発明によれば、発声した文節が文節候補列の下
位にあるときほど、文節決定に要する時間が短くて済む
ことになる。
Furthermore, according to the present invention, the lower the uttered phrase is in the phrase candidate string, the shorter the time required to determine the phrase.

なお、上記実施例においては第4図に示すように表示画
面71中の入力文章に続いて6文節メニュー″の表示7
2を行なうようにしているため、1文節メニュー”が画
面からはみ出る場合が考えられるが、この場合は画面を
上等にスクロールさせて、゛文節メニュー”が表示でき
るスペースを確保するように成せばよい。
In the above embodiment, as shown in FIG.
Since we are performing step 2, there may be cases where the ``1 Bunsetsu Menu'' extends off the screen, but in this case, you can scroll the screen upwards to ensure space for the ``Bunsetsu Menu'' to be displayed. good.

また、上記実施例においては1文節メニュー”を入力文
章と一緒に表示する方式について説明したが、本発明は
これに限定されるものではなく、常時”文節メニュー表
示エリア#72に割シ当てておいて、文節が決定されて
から、その決定された文節を入力文章中へ表示するよう
に成しても良いO 〈発明の効果〉 以上のように本発明によれば、文節単位で発声された音
声を音節単位に認識し、文節単位の候補列を作成、して
表示する音声入力装置において、認識結果の不確実さを
伴なう複数の文節候補列をメニュ一方式で画面上に表示
せしめるように成しているため、文節候補例が多くなっ
た場合、発声した文節の決定に要する時間を短縮するこ
とが出来る。まだ発声された文節が、候補列に含まれて
いるか否かの確認を少ない操作によって行なうことが出
来る。
Furthermore, in the above embodiment, a method was described in which a "one phrase menu" is displayed together with the input text, but the present invention is not limited to this, and the "one phrase menu" is always allocated to the phrase menu display area #72. After the phrase is determined, the determined phrase may be displayed in the input sentence. <Effect of the Invention> As described above, according to the present invention, the phrase is uttered in units of phrases. In a voice input device that recognizes speech in units of syllables and creates and displays candidate sequences in units of phrases, multiple phrase candidate sequences with uncertain recognition results are displayed on the screen using a menu-only method. Since the phrase is configured so as to force the user to speak the phrase, when the number of phrase candidates increases, the time required to determine the phrase to be uttered can be shortened. It is possible to check with a few operations whether or not the phrase that has yet to be uttered is included in the candidate string.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明を実施した音声入力装置の一構成例を示
すブロック図、第2図はその動作説明にトr′ロ日、ト
 ス、4に/5n)lis’l !+11iSQi4n
:fKIIYIrtJ−M 調ドf1−Ji−発明を実
施した装置の表示の例を示す図である。 1・・・マイクロホン、 2・・・単音節認識部、。 3・・・標準パターンメモリ、 4・・・音節ラティスメモリ、5・・・候補列作成図、
6・・・文節候補メモリ、 7・・・表示装置、8・・
・入力装置、 71・・・表示画面、72・・・文節メ
ニュー表示画面。 代理人 弁理士 福 士 愛 彦(他2名)第1図
FIG. 1 is a block diagram showing an example of the configuration of a voice input device embodying the present invention, and FIG. 2 shows an explanation of its operation. +11iSQi4n
:fKIIYIrtJ-M key de f1-Ji- FIG. 1... Microphone, 2... Monosyllable recognition unit. 3... Standard pattern memory, 4... Syllable lattice memory, 5... Candidate sequence creation diagram,
6... Clause candidate memory, 7... Display device, 8...
- Input device, 71... Display screen, 72... Clause menu display screen. Agent Patent attorney Aihiko Fukushi (and 2 others) Figure 1

Claims (1)

【特許請求の範囲】 1、文節単位で発声された音声を音節単位に認識し、文
節単位の候補列を作成して表示する音声入力装置におい
て、 認識結果の不確実さを伴なう複数の文節候補列をメニュ
一方式で画面上に表示せしめるように成したことを特徴
とする認識結果表示方式。
[Claims] 1. In a speech input device that recognizes speech uttered in units of phrases in units of syllables and creates and displays a candidate string in units of phrases, A recognition result display method characterized in that a phrase candidate string is displayed on a screen using a menu.
JP59064398A 1984-03-30 1984-03-30 Recognition results display system Pending JPS60205594A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59064398A JPS60205594A (en) 1984-03-30 1984-03-30 Recognition results display system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59064398A JPS60205594A (en) 1984-03-30 1984-03-30 Recognition results display system

Publications (1)

Publication Number Publication Date
JPS60205594A true JPS60205594A (en) 1985-10-17

Family

ID=13257169

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59064398A Pending JPS60205594A (en) 1984-03-30 1984-03-30 Recognition results display system

Country Status (1)

Country Link
JP (1) JPS60205594A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0446399A (en) * 1990-06-14 1992-02-17 Sharp Corp Voice recognizer
JPH06274193A (en) * 1993-03-17 1994-09-30 Nippon Steel Corp Data base retrieval system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0446399A (en) * 1990-06-14 1992-02-17 Sharp Corp Voice recognizer
JPH06274193A (en) * 1993-03-17 1994-09-30 Nippon Steel Corp Data base retrieval system

Similar Documents

Publication Publication Date Title
JP4829901B2 (en) Method and apparatus for confirming manually entered indeterminate text input using speech input
RU2377664C2 (en) Text input method
CN105117376B (en) Multi-mode input method editor
JP3476007B2 (en) Recognition word registration method, speech recognition method, speech recognition device, storage medium storing software product for registration of recognition word, storage medium storing software product for speech recognition
US5995934A (en) Method for recognizing alpha-numeric strings in a Chinese speech recognition system
US20020007275A1 (en) Speech complementing apparatus, method and recording medium
JP3762191B2 (en) Information input method, information input device, and storage medium
JPS60205594A (en) Recognition results display system
JP3762300B2 (en) Text input processing apparatus and method, and program
JPH05119793A (en) Method and device for speech recognition
JPS58123129A (en) Converting device of japanese syllabary to chinese character
JPH086940A (en) Voice input method and information processing apparatus using the same
JPH0630052B2 (en) Voice recognition display
KR101777141B1 (en) Apparatus and method for inputting chinese and foreign languages based on hun min jeong eum using korean input keyboard
JPS61184683A (en) Recognition-result selecting system
JP2001229155A (en) Device and method for chinese input conversion processing, and recording medium
JPH04232997A (en) System for displaying result of recognition in speech recognition device
JPH049320B2 (en)
JP4797307B2 (en) Speech recognition apparatus and speech recognition method
JPS62117060A (en) Character/voice input conversion system
JPS61122781A (en) audio word processor
JPH0380363A (en) Document processor
JPH0195323A (en) Voice input device
JPS60176167A (en) Voice input type dictionary retrieving device
JPS6275760A (en) Kana-kanji conversion device