JPH10143503A - 音声ワードプロセッサ - Google Patents

音声ワードプロセッサ

Info

Publication number
JPH10143503A
JPH10143503A JP8312989A JP31298996A JPH10143503A JP H10143503 A JPH10143503 A JP H10143503A JP 8312989 A JP8312989 A JP 8312989A JP 31298996 A JP31298996 A JP 31298996A JP H10143503 A JPH10143503 A JP H10143503A
Authority
JP
Japan
Prior art keywords
display
candidate
recognition result
displayed
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8312989A
Other languages
English (en)
Inventor
Ryosuke Isotani
亮輔 磯谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP8312989A priority Critical patent/JPH10143503A/ja
Publication of JPH10143503A publication Critical patent/JPH10143503A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】認識結果の修正が容易な音声ワードプロセッサ
の提供。 【解決手段】入力音声から連続した一まとまりの発声を
切り出す音声検出部101と、一まとまりの発声を認識
して1つ以上の認識結果候補を出力する音声認識部10
2と、認識結果候補を記憶する候補記憶部と、候補の確
定を指示する確定指示手段106と、認識結果候補の第
1位文字列および確定後の文字列を順次表示する表示装
置108と、表示装置の表示を制御する表示制御部10
7を有し、表示制御部が、一まとまりの発声ごとに認識
結果候補の第1位文字列に区切り文字を付加し、確定指
示手段により確定が指示されると区切り記号を削除する
よう表示を制御する。連続した一まとまりの発声ごとに
認識結果を区切り記号で区切って表示することにより修
正の単位をわかり易くする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理装置に関
し、特に音声でテキストを入力して文書を作成する音声
文書作成装置(「音声ワードプロセッサ」という)に関
する。
【0002】
【従来の技術】音声によりテキストを入力して文書を作
成する音声ワードプロセッサにおいては、音声認識の性
能が十分でない現状では、音声入力に際して、通常、音
節、単語、文節などに区切って発声を行っている。
【0003】音声ワードプロセッサにおいて、音声入力
の途中、認識誤りが生じた場合には、その都度、修正す
ることも多いが、あるまとまった量のテキストを音声入
力してから、一括して修正した方が便利な場合もある。
また、こうすることにより、文法などの知識を利用し
て、自動的に過去の入力の認識結果も修正できるという
利点もある。
【0004】英文の音声ワードプロセッサでは、単語単
位に区切った発声を順次認識して認識結果を表示し、あ
る範囲内で過去に遡って認識結果を修正できるように構
成されているものが知られている。
【0005】修正の際には、画面上に表示された認識結
果(変換結果)についてユーザが修正したい単語をマウ
スなどで指示すると、2位以下の候補を表示して、その
中から選択することができる。修正の単位は、発声した
単位(すなわち、単語)と一致する。
【0006】英語の場合は、もともと単語と単語の間に
スペースを入れて表記するので、表示の際も単語間にス
ペースが入るため、発声した単位の確認が容易に行え
る。
【0007】
【発明が解決しようとする課題】しかしながら、日本語
の場合には、表記の際、単語間にスペースを入れないた
め、画面表示の際に、通常、単語間を詰めて表示され
る。さらに、日本語の場合、単語という単位が明確でな
いこともあり、過去の入力に遡って修正しようとした場
合、どこからどこまでが1つの修正単位か判別が容易で
ない、という問題もある。また単語の代わりに、文節な
どを、発声の単位とした場合も同様である。
【0008】これに対し、たとえばカーソル移動キーで
カーソルを移動したり、マウス等の指示デバイスでポイ
ンタを移動したりすると、その指示する先の文字を含む
修正単位の範囲を反転表示するなどの方法も考えられる
が、カーソルやポインタを修正したい箇所まで移動する
までは修正単位がわからない、という煩わしさがある。
【0009】また、はじめから発声単位ごとに空白で区
切りながら表示すれば、修正単位は明確であるが、その
ままでは作成された文書に余分な空白がはいることにな
り、好ましくない。
【0010】一方、キーボードによる日本語入力装置で
は、連文節や文章を一括してかな漢字変換する際、文節
や単語の切れ目を表示することにより、利用者が区切り
の情報を編集できるようにするとともに、確定の際に
は、区切り情報を削除するものが知られている。しか
し、キーボードからの入力では、単語や文節の区切り
は、かな漢字変換等の言語処理を行なって自動的に判断
した結果として与えなければならず、また誤りを含む場
合もあるため、それ自体を編集の対象としなければなら
ない。
【0011】これに対し、音声で単語や文節単位に区切
って発声する場合には、発声の区切りをそのまま区切り
として表示すればよいため、言語処理を行なって自動的
に判断する必要はなく、また発声区切り自体を編集でき
る必要はない。
【0012】上記したように、日本語の場合、普通に表
示すると、過去に遡って修正する際に、修正単位がわか
りにくいという問題があった。
【0013】したがって、本発明は、上記事情に鑑みて
なされたものであって、その目的は、認識結果が確定す
る前の段階では認識結果の修正を容易とし、確定後に
は、通常の日本語のテキストとして表示あるいは出力す
る音声ワードプロセッサを提供することにある。
【0014】
【課題を解決するための手段】前記目的を達成するた
め、本発明の音声ワードプロセッサは、連続した一まと
まりの発声毎に、認識結果を区切り記号で区切って表示
し、確定したときに前記区切り記号を削除して表示出力
する、ことを特徴とする。
【0015】本発明は、好ましくは、入力音声から連続
した一まとまりの発声を切り出す音声検出手段と、前記
一まとまりの発声を認識して1つ以上の認識結果候補を
出力する音声認識手段と、前記認識結果候補を記憶する
候補記憶手段と、候補の確定を指示する確定指示手段
と、前記認識結果候補の文字列および確定後の文字列を
順次表示する表示手段と、前記表示装置の表示を制御す
る表示制御手段と、を備え、前記表示制御手段が、前記
一まとまりの発声ごとに前記認識結果候補の文字列に区
切り文字を付加して表示するように制御すると共に、前
記確定指示手段により確定が指示されると前記区切り記
号を削除するよう表示を制御する、ことを特徴とする。
【0016】
【発明の実施の形態】本発明の実施の形態について図面
を参照して以下に説明する。本発明は、その好ましい実
施の形態において、入力音声から連続した一まとまりの
発声を切り出す音声検出手段(図1の101)と、一ま
とまりの発声を認識して1つ以上の認識結果候補を出力
する音声認識手段(図1の102)と、認識結果候補を
記憶する候補記憶手段(図1の103)と、候補の確定
を指示する確定指示手段(図1の106)と、認識結果
候補の第1位の文字列および確定後の文字列を順次表示
する表示手段(図1の108)と、表示手段の表示を制
御する表示制御手段(図1の107)と、を備えてい
る。
【0017】表示制御手段(図1の107)は、一まと
まりの発声ごとに認識結果候補の第1位候補文字列に例
えば単語毎に例えば空白等の所定の区切り記号を付加し
て表示手段に表示する。そして確定指示手段により確定
が指示されると、付加された区切り記号を削除して、確
定した文字列を表示手段に表示する。
【0018】認識候補の確定の方法としては、表示手段
に表示されている認識結果候補の第1位の文字列に誤り
がある場合には、修正箇所指示手段(図1の104)に
より表示されている単語を指示し、指示された単語につ
いて次の認識結果候補が候補記憶手段に格納されている
場合には、これを読み出して、表示手段に表示し、候補
選択手段(図1の105)にて、表示された認識結果候
補の中から選択する。
【0019】
【実施例】上記した本発明の実施の形態について更に詳
細に説明すべく、本発明の実施例について図面を参照し
て以下に説明する。
【0020】図1は、本発明の一実施例の構成を示す図
である。図1を参照すると、入力音声は、単語ごとにポ
ーズで区切って発声される。音声検出部101は、音声
のパワー情報を用いて、入力音声を単語ごとに切り出
し、音声認識部102に順次出力する。
【0021】音声認識部102は、音声検出部101か
らの出力を自動認識して、単語毎に複数個の候補を出力
する。
【0022】候補記憶部103は、各発声に対する認識
結果の候補を保持するとともに、第1位の候補を表示制
御部107に出力する。
【0023】表示制御部107は、各単語の認識結果の
第1位候補を、間に空白を挿入しながら、図2に示すよ
うに、順次、表示装置108に出力する。
【0024】表示されている認識結果に誤りがある場
合、ユーザは、マウス、タッチパネルなどの修正箇所指
示手段104により、表示されている単語の一つを指示
し、指示された単語についての候補を候補記憶部103
から読み出して、表示装置108に表示する。
【0025】ユーザは、表示装置108に表示された候
補中から候補選択手段105により正しい文字列を選択
する。また、候補中に正解がないときには、再度、当該
単語の入力音声を発声したりすることにより、当該単語
の認識結果を修正する。
【0026】ユーザが確定指示手段106により確定を
指示すると、表示制御部107は、表示されている文字
列から空白を取り除き、図3に示すように、表示装置1
08に再表示する。その際、当該部分がすでに確定され
たものであることを示すため、例えば画面上において表
示の文字色を変更するようにしてもよい。
【0027】また、上記実施例に係る音声ワードプロセ
ッサを、通常のワードプロセッサなど他のアプリケーシ
ョンのフロントエンドとして用いることもできる。この
場合、ユーザが確定指示手段106により確定を指示す
ると、表示制御部107は表示されている文字列から空
白を取り除いた文字列を該アプリケーションへ出力する
とともに、表示装置108の表示をクリアする。
【0028】なお、上記実施例においては、発声の単位
を単語としたが、これに限らず、文節やより長い単位を
用いることもできる。また、区切り記号として、空白の
かわりに特別な記号を用いることもできる。
【0029】
【発明の効果】以上説明したように、本発明によれば、
認識結果が確定する前は修正すべき発声の単位がユーザ
にわかりやすく、確定後は通常の日本語のテキストとし
て表示あるいは出力する音声ワードプロセッサを提供す
ることができる。
【図面の簡単な説明】
【図1】本発明の実施例の構成を示すブロック図であ
る。
【図2】本発明の実施例における確定前の表示例を示す
図である。
【図3】本発明の実施例における、確定後の表示例を示
す図である。
【符号の説明】 101 音声検出部 102 音声認識部 103 候補記憶部 104 修正個所指示手段 105 候補選択手段 106 確定指示手段 107 表示制御部 108 表示装置

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】連続した一まとまりの発声毎に、認識結果
    を区切り記号で区切って表示し、確定したときに前記区
    切り記号を削除して表示出力する、ことを特徴とする音
    声ワードプロセッサ。
  2. 【請求項2】入力音声から連続した一まとまりの発声を
    切り出す音声検出手段と、 前記一まとまりの発声を認識して1つ以上の認識結果候
    補を出力する音声認識手段と、 前記認識結果候補を記憶する候補記憶手段と、 候補の確定を指示する確定指示手段と、 前記認識結果候補の文字列および確定後の文字列を順次
    表示する表示手段と、 前記表示装置の表示を制御する表示制御手段と、を備
    え、 前記表示制御手段が、前記一まとまりの発声ごとに前記
    認識結果候補の文字列に区切り文字を付加して表示する
    ように制御すると共に、前記確定指示手段により確定が
    指示されると前記区切り記号を削除するよう表示を制御
    する、 ことを特徴とする音声ワードプロセッサ。
  3. 【請求項3】前記表示されている認識結果候補の第1位
    の文字列に誤りがある場合、修正箇所指示手段により表
    示されている単語を指示し、指示された単語について別
    の認識結果候補が前記候補記憶手段に格納されている場
    合には、これを読み出して、前記表示手段に表示し、表
    示された認識結果候補の中から選択する、ことを特徴と
    する請求項2記載の音声ワードプロセッサ。
  4. 【請求項4】前記確定指示手段により確定が指示される
    と、前記区切り記号を削除して出力するとともに、前記
    表示手段の表示をクリアするように表示を制御する、こ
    とを特徴とする請求項2記載の音声ワードプロセッサ。
JP8312989A 1996-11-08 1996-11-08 音声ワードプロセッサ Pending JPH10143503A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8312989A JPH10143503A (ja) 1996-11-08 1996-11-08 音声ワードプロセッサ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8312989A JPH10143503A (ja) 1996-11-08 1996-11-08 音声ワードプロセッサ

Publications (1)

Publication Number Publication Date
JPH10143503A true JPH10143503A (ja) 1998-05-29

Family

ID=18035904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8312989A Pending JPH10143503A (ja) 1996-11-08 1996-11-08 音声ワードプロセッサ

Country Status (1)

Country Link
JP (1) JPH10143503A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006505002A (ja) * 2002-11-02 2006-02-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識の方法およびシステム
JP2009169139A (ja) * 2008-01-17 2009-07-30 Alpine Electronics Inc 音声認識装置
JP2018180883A (ja) * 2017-04-12 2018-11-15 株式会社アドバンスト・メディア 端末装置及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006505002A (ja) * 2002-11-02 2006-02-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識の方法およびシステム
JP2009169139A (ja) * 2008-01-17 2009-07-30 Alpine Electronics Inc 音声認識装置
JP2018180883A (ja) * 2017-04-12 2018-11-15 株式会社アドバンスト・メディア 端末装置及びプログラム

Similar Documents

Publication Publication Date Title
US9236045B2 (en) Methods and apparatus for proofing of a text input
US7260529B1 (en) Command insertion system and method for voice recognition applications
EP1096472B1 (en) Audio playback of a multi-source written document
JP4829901B2 (ja) マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置
US6490563B2 (en) Proofreading with text to speech feedback
JPS61107430A (ja) 音声情報の編集装置
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JP3723518B2 (ja) 文字処理装置および方法
JP3104661B2 (ja) 日本語文章作成装置
JPH11194793A (ja) 音声ワープロ
JPH0352058A (ja) 音声入力の文書処理装置
JPS634206B2 (ja)
JPH10143503A (ja) 音声ワードプロセッサ
JPH09171392A (ja) 発音情報作成方法およびその装置
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JP2006031725A (ja) 文字処理装置
JP2000276189A (ja) 日本語ディクテーションシステム
JP3069532B2 (ja) かな漢字変換方法およびその装置並びにかな漢字変換方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH06103457B2 (ja) 音声タイプライタ
JPH0195323A (ja) 音声入力装置
JPH04232997A (ja) 音声認識装置における認識結果表示方式
JP2021128222A (ja) 情報処理装置及びプログラム
JP2000010579A (ja) 音声合成装置及びコンピュータ可読記録媒体
JPH0625988B2 (ja) 日本語情報入力方式
JP2002366345A (ja) 文字処理装置および方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000307