JP2000242638A - 文字処理装置および方法 - Google Patents

文字処理装置および方法

Info

Publication number
JP2000242638A
JP2000242638A JP11034934A JP3493499A JP2000242638A JP 2000242638 A JP2000242638 A JP 2000242638A JP 11034934 A JP11034934 A JP 11034934A JP 3493499 A JP3493499 A JP 3493499A JP 2000242638 A JP2000242638 A JP 2000242638A
Authority
JP
Japan
Prior art keywords
character
character string
displayed
voice
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11034934A
Other languages
English (en)
Other versions
JP3795692B2 (ja
Inventor
Hiroaki Kaneki
宏明 鹿子木
Takeshi Fujimura
武志 藤村
Masayoshi Tadano
正義 只埜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Priority to JP03493499A priority Critical patent/JP3795692B2/ja
Publication of JP2000242638A publication Critical patent/JP2000242638A/ja
Priority to JP2002092413A priority patent/JP3723518B2/ja
Application granted granted Critical
Publication of JP3795692B2 publication Critical patent/JP3795692B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 (修正有) 【課題】 文字処理操作労力を低減する。 【解決手段】 表示されている未確定の文字列の文字位
置を指定する文字位置指定手段と、当該指定された文字
を含む所定数の文字列に対する1以上の変換候補を表示
する変換候補表示手段と、当該表示された変換候補を指
定する指定手段と、当該指定された変換候補を前記文字
位置指定手段の指定から定まる文字列と置換する文字処
理手段とを具える。表示画面に表示された未確定文字列
の中の特定の文字列が文字カーソルにより指定される
と、CPUは、自動的に置換候補を表示する。この状態
でENTERキーが表示されると文字カーソルは未確定
文字列の最後尾に位置し、音声入力可能状態となる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力した文字を処
理する文字処理装置および方法に関し、より詳しくは、
音声認識により得られる文字列を処理する文字処理装置
および方法に関する。
【0002】
【従来の技術】従来この種の代表的な文字処理装置の処
理例を図1〜図3を参照して説明する。図1〜図3は音
声入力および入力音声の認識結果を文字処理するための
表示内容を示す。図1(A)において、文書処理画面1
においてユーザはアイコン1Aをマウスにより指定して
文字処理装置を起動する。文字入力装置はパーソナルコ
ンピュータが文字処理プログラムを実行することにより
実現される。
【0003】文字処理装置の起動により表示画面には図
1(B)のように文字入力用画面2が現れる。ユーザが
メニュー項目2Aを操作して音声入力モードに切り替え
ると、第1図(C)に示すように音声入力用のウィンド
ウ(アプレット)3が表示される。ここで、ボタン3A
をユーザがマウスにより操作するとマイクロフォンから
の音声入力が可能となる。たとえば、ユーザがマイクロ
ホンから「これはマイクのテストですと」と音声で入力
すると、コンピュータ内に搭載された音声認識プログラ
ムにより入力音声が音声認識される。最近では連続の音
声を認識することが可能となってきている。
【0004】入力音声信号は音素と呼ばれる音韻よりも
短い非常に短い時間長さに区切られ、信号の特徴成分が
抽出される。この特徴成分と、あらかじめコンピュータ
に用意してある特徴成分(音素の内容が判明している)
とを比較し、特徴成分が類似するものの音素内容を検出
することで、音素の音声認識を行う。認識の結果とし
て、得られた音素を時系列的に結合すると、音韻(母
音,子音)の文字が得られる。この文字を結合し、文法
的に区切られた文字列は音声認識用の辞書、すなわち、
音韻(読みを表す文字列)と、その読みに対応するかな
漢字混じり文字列(漢字のみを含む)を記載した辞書に
基づき、かな漢字混じり単語に変換され、図2(D)の
表示画面1内に表示される。
【0005】なお、音声認識用の辞書に上記音声信号の
特徴成分を単語単位で含め、単語単位で音声認識するよ
うな音声認識方法も提案されている。
【0006】音声認識では誤認識が生じることがあるの
で、通常、文字処理装置は、音声認識結果4内の文字を
削除したり、新しい文字をキーボード入力したり、他の
同音異義語を選択するなどの文字処理を行うことができ
る。
【0007】図2(D)の表示画面1中で、ユーザが文
字カールを文字「を」に合わせ、削除(Del)ボタン
を操作すると、文字カーソルで指示した文字(「を」)
を表示画面1上から削除することができる(図2の
(F)参照)。
【0008】さらに認識結果4の中の文字列「マイク」
を文字カーソルにより指定し、変換ボタンを操作する
と、図2(E)に示すように、指定された文字列と発音
が類似する単語、すなわち、音声認識で、類似度が高か
った1以上の音声認識候補がプルダウンメニュー5の形
態で表示される。ユーザはプルダウンメニュー5の中の
所望の単語を選択すると、これまでに表示されていた単
語が選択された単語と置換される。
【0009】このようにして、不要な文字を削除したり
(文字の挿入もある)、単語の置換を行った上で、図3
(G)のEnterボタン8をユーザが操作すると、音
声入力された文字列が確定し、ワードプロソフト等入力
された文字列を使用して情報処理を行うアプリケーショ
ンに確定した文字列が引き渡される。
【0010】一般的に文字処理される文字列にはアンダ
ーライン等が付されて表示され、確定後の文字列はアン
ダーラインが取り除かれる(図3(H)参照)。
【0011】
【発明が解決しようとする課題】音声入力による文字入
力方法は、ユーザがキーボードで文字入力を行わなくて
もよいという利点あある反面、誤認識結果を修正するた
めにはキーボード、あるいはマウスによるユーザの操作
が不可欠である。このため、キーボードあるいはマウス
の操作をできるだけ、なくすことが望まれている。
【0012】また、音声入力した文字列を音声合成し、
出力することで、合成音声と表示の文字列とを比較する
ことで、音声認識結果の誤りを検出する装置が提案され
ているが、この装置は音だけでは、誤認識部分を検出す
ることができないという解決すべき課題もあった。
【0013】さらに本願出願は本願に先立って、キーボ
ードから入力した文字列と音声で入力した文字列とを一
括して文字処理できるようにした文字処理装置を提案し
ているが、キーボード入力と、音声入力を併用する場合
には、打鍵の音がマイクロホンから混入し、音声の入力
と誤認識されてしまうという改善すべき課題があった。
【0014】そこで、本発明の第1の目的は、従来より
も操作性を改善した文字処理装置および方法を提供する
ことにある。
【0015】本発明の第2の目的は、音だけで音声認識
結果の誤り部分を検出することができる文字処理装置を
提供することにある。
【0016】本発明の第3の目的は、キーの打鍵による
音声の誤認識を阻止することが可能な文字処理装置を提
供することにある。
【0017】
【課題を解決するための手段】このような目的を達成す
るために、請求項1の発明は、入力の音声を音声認識
し、音声認識結果を未確定のかな漢字混じり文字列とし
て表示し、当該表示された文字列を文字処理した後、確
定文字列を出力する文字処理装置において、表示されて
いる未確定の文字列の文字位置を指定する文字位置指定
手段と、当該指定された文字を含む所定数の文字列に対
する1以上の変換候補を表示する変換候補表示手段と、
当該表示された変換候補を指定する指定手段と、当該指
定された変換候補を前記文字位置指定手段の指定から定
まる文字列と置換する文字処理手段とを具えたことを特
徴とする。
【0018】請求項2の発明は、請求項1に記載の文字
処理装置において、前記文字位置指定手段が指定する文
字位置は文字カーソルの形態で表示され、該文字カーソ
ルを、表示の未確定文字列の最後尾へ移動するように指
示する移動指示手段をさらに有し、該移動指示手段によ
る指示が行われた場合には、新たな音声の入力を許可す
ることを特徴とする。
【0019】請求項3の発明は、請求項1に記載の文字
処理装置において、前記1以上の変換候補は音声認識に
より得られる認識候補であることを特徴とする。
【0020】請求項4の発明は、入力の音声を音声認識
し、音声認識結果を未確定のかな混じり漢字文字列とし
て表示し、当該表示された文字列を文字処理した後、確
定文字列を出力する文字処理装置において、変換対象の
未確定文字列を指定する変換対象指定手段と、当該指定
された未確定文字列に対して変換可能な1以上の文字列
候補を表示する表示手段と、当該表示された文字列候補
の1つを選択し、読みの表示を指示する読み表示指示手
段と、当該指示された文字列についての1以上の読みの
候補を表示する読み表示手段とを具えたことを特徴とす
る。
【0021】請求項5の発明は、請求項4に記載の文字
処理装置において、前記読み表示手段により表示された
1以上の読みの候補の1つを選択する第1選択手段と、
当該選択された読みに対応する1以上のかな混じり漢字
文字列を変換候補として表示する変換候補表示手段と、
当該表示された1以上のかな混じり漢字文字列の1つを
選択する第2選択手段と、当該選択されたかな混じり漢
字文字列で、前記変換対象指定手段により指定された未
確定文字列を置換する置換手段とをさらに具えたことを
特徴とする。
【0022】請求項6の発明は、請求項4に記載の文字
処理装置において、前記読み表示手段は1以上の読みに
加えて、前記変換対象指定手段により指定された未確定
文字列をも表示することを特徴とする。
【0023】請求項7の発明は、請求項1〜請求項6の
いずれかに記載の文字処理装置において、前記音声認識
結果が発生する毎に、表示すべき未確定のかな漢字混じ
り文字列の文字数または文節数を計数する計数手段と、
当該計数の結果が特定数を超える場合には、未確定文字
列の先頭部分の所定数の文字列を自動確定する確定手段
とをさらに具えたことを特徴とする。
【0024】請求項8の発明は、請求項1〜請求項7の
いずれかに記載の文字処理装置は再変換後の指定文字列
について他の文字列に変換する機能を有し、前記音声認
識で得られる1以上の認識候補を記憶しておく記憶手段
と、前記指定文字列と対応する1以上の認識候補を前記
記憶手段から読み出し、変換候補として表示する変換候
補表示手段とを具えたことを特徴とする。
【0025】請求項9の発明は、入力の音声を音声認識
し、音声認識結果を未確定のかな漢字混じり文字列とし
て表示し、当該表示された文字列を文字処理した後、確
定文字列を出力する文字処理装置において、前記入力の
音声を記憶する音声記憶手段と、前記表示された文字列
について音声合成する音声合成手段と、読み上げ・プレ
イバックを指示する指示手段と、当該指示に応じて前記
音声記憶手段に記憶された音声と前記音声合成手段によ
り合成された音声とを同時にそれぞれ再生出力する出力
手段とを具えたことを特徴とする。
【0026】請求項10の発明は、入力の音声を音声認
識し、音声認識結果を未確定のかな漢字混じり文字列と
して表示し、当該表示された文字列を文字処理した後、
確定文字列を出力する文字処理装置において、文字入力
を行うキーボードと、当該キーボードから入力された文
字列と前記音声認識結果の文字列とを一括して文字処理
可能な文字処理手段と、前記キーボードから文字入力が
行われている間は、前記音声の入力を禁止する制御手段
とを具えたことを特徴とする。
【0027】請求項11の発明は、入力の音声を音声認
識し、音声認識結果を未確定のかな漢字混じり文字列と
してディスプレイに表示し、当該表示された文字列を文
字処理した後、確定文字列を出力する文字処理方法にお
いて、表示されている未確定の文字列の文字位置を指定
し、当該指定された文字を含む所定数の文字列に対する
1以上の変換候補を表示し、当該表示された変換候補を
指定し、当該指定された変換候補を前記指定の文字から
定まる文字列と置換することを特徴とする。
【0028】請求項12の発明は、請求項11に記載の
文字処理方法において、前記指定する文字位置は文字カ
ーソルの形態で表示され、表示の未確定文字列の最後尾
への前記文字カーソルの移動を指示し、該指示が行われ
た場合には、新たな音声の入力を許可することを特徴と
する。
【0029】請求項13の発明は、請求項11に記載の
文字処理方法において、前記1以上の変換候補は音声認
識により得られる認識候補であることを特徴とする。
【0030】請求項14の発明は、入力の音声を音声認
識し、音声認識結果を未確定のかな混じり漢字文字列と
してディスプレイに表示し、当該表示された文字列を文
字処理した後、確定文字列を出力する文字処理装置にお
いて、変換対象の未確定文字列を指定し、当該指定され
た未確定文字列に対して変換可能な1以上の文字列候補
を表示し、当該表示された文字列候補の1つを選択し、
読みの表示を指示し、当該指示された文字列についての
1以上の読みの候補を表示することを特徴とする。
【0031】請求項15の発明は、請求項14に記載の
文字処理方法において、前記表示された1以上の読みの
候補の1つを選択し、当該選択された読みに対応する1
以上のかな混じり漢字文字列を変換候補として表示し、
当該表示された1以上のかな混じり漢字文字列の1つを
選択し、当該選択されたかな混じり漢字文字列で、前記
指定された未確定文字列を置換することを特徴とする。
【0032】請求項16の発明は、請求項14に記載の
文字処理方法において、前記1以上の読みに加えて、前
記指定された未確定文字列をも表示することを特徴とす
る。
【0033】請求項17の発明は、請求項11〜請求項
16のいずれかに記載の文字処理方法において、前記音
声認識結果が発生する毎に、表示すべき未確定のかな漢
字混じり文字列の文字数または文節数を計数する計数
し、当該計数の結果が特定数を超える場合には、未確定
文字列の所定数の文字列を自動確定することを特徴とす
る。
【0034】請求項18の発明は、請求項11〜請求項
16のいずれかに記載の文字処理方法は再変換後の指定
文字列について他の文字列に変換する機能を有し、前記
音声認識で得られる1以上の認識候補を記憶手段に記憶
しておき、前記指定文字列と対応する1以上の認識候補
を前記記憶手段から読み出し、変換候補として表示する
ことを特徴とする。
【0035】請求項19の発明は、入力の音声を音声認
識し、音声認識結果を未確定のかな漢字混じり文字列と
してディスプレイに表示し、当該表示された文字列を文
字処理した後、確定文字列を出力する文字処理方法にお
いて、前記入力の音声を記憶手段に記憶しておき、読み
上げ・プレイバックを指示する指示し、当該指示に応じ
て前記表示された文字列について音声合成し、前記記憶
手段に記憶された音声と合成された音声とを同時にそれ
ぞれ再生出力することを特徴とする。
【0036】請求項20の発明は、入力の音声を音声認
識し、音声認識結果を未確定のかな漢字混じり文字列と
して表示し、当該表示された文字列を文字処理した後、
確定文字列を出力する文字処理方法において、キーボー
ドから文字列を入力し、当該キーボードから入力された
文字列と前記音声認識結果の文字列とを一括して文字処
理可能となし、前記キーボードから文字入力が行われて
いる間は、前記音声の入力を禁止するを具えたことを特
徴とする。
【0037】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を詳細に説明する。
【0038】最初に本発明に係わる文字処理方法を説明
する。本実施形態の文字処理方法には以下の新規機能を
有するので、各機能について順に説明していく。
【0039】(1)必要に応じて文字処理および確定処
理を行えばよい音声連続入力機能 (2)単語指定するだけで、置換候補を自動表示する機
能 (3)置換候補に対する読みの表示および読みからかな
漢字への逆変換機能 (4)文字列を確定した後、再変換のために読みの類似
候補(音声認識候補)を表示する機能 (5)確定された文章を合成音声で再生出力(読み上げ
と称する)するとともに、合成音声と、入力音声とを一
緒に出力する読み上げ・プレイバック同時機能 (6)音声入力についての許可/禁止処理 (A)音声連続入力機能 従来では、音声認識結果として得られるかな漢字混じり
文については、その音声認識結果が正しいものであって
もユーザは確定の操作を行わなければならない。この操
作を改善したものが音声連続入力機能である。
【0040】ユーザが連続的に音声入力を行っていく
と、表示画面には、音声認識結果が図4(A)のように
表示されていく。本実施形態の特徴は、認識結果が所定
長さを超えようとすると、先に入力された音声の認識結
果、図4の例では、「日本××新聞社は臨時国会閉幕
に」が自動的に確定される。残りの文字列は確定前の文
字処理可能な状態のままとなる(図4(B)参照)。し
たがって、音声認識が正しい限り、ユーザは連続的に音
声入力を続ければよく、最後に、1回だけ、確定操作を
行えばよい。従来では、連続的に音声入力を行うと、そ
の長さ(たとえば、3文節)に制限があるので、たとえ
ば、3文節ごとに確定操作を行わなければならないの対
し、本実施形態では、最後の1回だけとなる。
【0041】また、入力音声をすべて自動確定せず、後
の音声認識結果は未確定としているので、誤認識結果を
修正することも可能となる。
【0042】(B)置換候補自動表示機能 従来では、確定前に音声認識結果の文字列を部分的に置
換する場合には、置換すべき文字列を指定し、置換候補
(いわゆる変換候補)の表示を特定のボタンで指示しな
ければならなかったのに対し、本実施形態では、置換す
べき文字列を図5(C)のように文字カーソル(図中の
|記号)で指定するだけで、自動的に置換候補が表示さ
れる。ユーザが図5(D)のように置換候補を選択し、
置換処理を行うことができる。また、ユーザが、この
後、文字カーソルを図6(E)に示すように認識結果の
最後尾に合わせると、文字処理可能状態から音声入力可
能状態となる。なお、表示画面に表示される文字列は音
声認識において、類似度が高い1以上の音声認識候補の
中のもっとも類似する文字列が使用されるが、類似度が
高い1以上の音声認識候補は保存され、この置換候補表
示機能における表示に使用される (C)読み候補の表示および逆読み機能(上述の(3)
の機能)本実施形態では、音声認識結果を未確定状態と
したまま、キーボードから入力した読みをも上記音声認
識結果とともに確定対象の文字列として扱うことができ
る。このために、本実施形態では、音声入力され、表示
されていて未確定の状態の文字列と、キーボードから入
力した読みの文字列とを一括して文字処理することがで
きる。このように2種の文字列が混在する状態で、か
つ、未確定の状態で任意の文字列を範囲指定し、変換の
指示をユーザが与えると、範囲指定された文字列につい
て、漢字変換用辞書が参照され、範囲指定された文字列
と対応する1以上の文字列が漢字変換用辞書から抽出さ
れ、漢字変換候補として図7の(A−1)の符号5のよ
うに表示される。
【0043】なお、ここで、表示される変換候補は上記
(B)の機能で表示される候補(音声認識の類似度の高
い音声認識候補)とは異なる点に注意されたい。上記漢
字変換用辞書は、よみ、かな漢字混じり文字列について
の変換前の文字列と、この文字列に対応する変換後のか
な漢字文字列を複数組記載した辞書である。変換前の文
字列としては上述のよみを表す文字列、文法的、意味的
にまちがった誤記の文字列が含まれる。また、変換後の
文字列にはその1以上の読みが付加されている。
【0044】文字カーソル指定により表示された図7の
(A−1)のプルダウンメニューの中から図7の音声認
識候補の変換候補「失わ」をユーザが選択すると、表示
画面中の指定文字列がこの文字列と置換されることは述
べたが、本実施形態では確定操作を行わない限り、漢字
変換辞書から得られる他の文字列候補に置換できる。
【0045】確定のためにユーザが未確定の文字列を従
来と同様、文節単位で区切る。区切られた文字列の任意
の文字列を指定して変換キーを操作すると、図7(B)
のようにプルダウンメニュー5−1の形態で、漢字変換
用辞書から得られる置換候補が(この場合には1つ)表
示される。
【0046】ユーザが置換候補を選択した上で、読みの
表示を指示するとこの文字列のすべての文字列と読みと
が図7のプルダウンメニュー5−2に表示される。この
プルダウンメニュー5−2は、ユーザにより選択された
変換候補「失わせて」に対応し、漢字変換用辞書に記載
されている1以上の読みの候補を選択目的で表示する。
なお、このプルダウンメニュー5−2の中に、選択され
た置換候補「失わせて」も含まれていることに注意され
たい。
【0047】プルダウンメニュー5−2は読み(あるい
は置換候補)から、かな混じり漢字文字列を表示させる
ことができる。ユーザがプルダウンメニューの中の所望
の文字列、たとえば、「ひろうせて」を選択すると図7
の(A−2)のようにこの読みを持つかな混じり漢字文
字列が漢字変換用辞書から抽出され、その置換候補も表
示される(図7(A−2)参照、また、プルダウンメニ
ュー5−2の候補「いやおうせて」をユーザが選択する
とその文字列に対応した、読み候補を表示するためのプ
ルダウンメニューが図8の(C)のように表示される。
【0048】以上、説明したように、(C)の機能で
は、表示画面で範囲指定した文字列に対応し、かな漢字
変換用辞書に記載されている文字列をプルダウンメニュ
ー5に表示する。これにより、キーボードがら入力され
た文字列を漢字等に変換して、文字列を確定することが
できる。また、プルダウンメニュー5に所望の文字列が
ない場合は読みについてのプルダウンメニュー5−2を
介して、確定すべき文字列を検索することができる。
【0049】(D)確定後の読みの類似候補の表示機能 確定処理を行うと、確定された文字列は、通常、アプリ
ケーションに引き渡される。なお、音声認識機能を有し
ない従来例においては、確定後の文字列を選択するとか
な漢字変換時に表示された変換候補を再表示して、他の
変換候補と置換する機能を有する文字処理装置が提案さ
れている。
【0050】しかしながら、音声認識機能を有する従来
例では、文字列確定後に変換候補を再表示する機能は有
していない。そこで、本実施形態では、文字変換(置
換)処理に使用された類似単語候補、すなわち、図7の
(A−2)で表示される読みの類似文字列候補で、音声
認識時に音声認識候補として使用された文字列を確定後
の再変換処理においても表示する。図9の表示がこの処
理内容を示す。ユーザにより確定された文字列「失わせ
て」を選択し、再変換を不図示のメニューで指示する
と、文字カーソルの位置指定において表示されたものと
同じプルダウンメニュー6が表示される。
【0051】なお、図9の例では、選択候補は1つであ
るが、複数ある場合には、その複数の文字列が選択のた
めに表示される。このメニュー6においても読みが表示
され、読みの項目を選択すると読みを記載したプルダウ
ンメニューが表示される。
【0052】(E)プレイバック・読み上げ機能 音声認識された文字列を音声合成し、合成音声を出力す
る読み上げ機能を有する装置や、入力音声をそのまま再
生(プレイバック)するプレイバック機能を有する装置
は従来から知られているが、上記双方の機能を有する装
置はいまだない。本実施形態では音声認識された未確定
文字列について読み上げと、プレイバック機能を同時に
起動することができる。この2つの機能により、ユーザ
は目視に頼らず音だけで、音声認識結果の誤り部分を検
出することができる。
【0053】(F)音声入力についての許可/禁止処理 本実施形態では、キーボード12から入力が行われてい
る場合には、マイクロホン10から音声の入力があって
も、その入力を文字認識プログラムでは受け付けない。
これによりキーボード12の打鍵の音をマイクロホン1
0が拾って、音声認識において誤認識を生じるトラブル
を回避する。
【0054】以上の機能を実現するためのシステム構成
を図10および図11を参照して説明する。図10は文
字処理装置を搭載した情報処理処理装置、たとえば、パ
ーソナルコンピュータの外観を示す。
【0055】図10において、10は音声を入力するた
めのマイクロホン、11は音声入力され、音声認識され
た文字列、文字処理された後の確定文字列を表示するた
めのディスプレイである。12は文字処理対象の文字列
を入力するとともに、ディスプレイ11に表示された文
字カーソルを移動し、文字位置を指定するためのカーソ
ルキー(矢印キーとも呼ばれる)を有するキーボードで
ある。
【0056】13は表示画面の位置指定を行うためのポ
インティングデバイスであり、本実施形態ではマウスを
使用する。
【0057】図11は情報処理装置の代表的な内部構成
を示す。図11において、CPU201はHDD(ハー
ドディスク)203に保存されている文字処理プログラ
ムを実行することにより文字処理装置として機能する。
なお、CPU201は装置全体をもオペレーティングシ
ステムにしたがって制御する。
【0058】システムメモリ202はCPU201の演
算処理で使用するデータ、ディスプレイ11に表示する
データ、文字処理に関わるデータの記憶に使用される。
さらに、システム制御に必要なデータをもシステムメモ
リ202に記憶される。
【0059】HDD203には上述のオペレーティング
システム、文字処理プログラムの他、音声認識に使用す
る音声認識用辞書、音声認識プログラム、漢字変換用辞
書を保存する。
【0060】なお、HDD203に保存される上述のデ
ータは不図示のCDROMドライブを介してCDROM
から実装することができる。また、フロッピーディスク
から上記データを実装する場合にはフロッピー(登録商
標)ディスクドライブが使用される。
【0061】204、206、208〜210は後述の
回路とバス211を接続する入出力インターフェース
(I/O)である。I/O204はCPU201から出
力される合成音声信号および音声信号をデジタル/アナ
ログ変換器205に転送する。デジタル信号からアナロ
グ信号に変換された合成音声信号および音声信号が左お
よび右のスピーカから再生される。
【0062】マイクロホン10から入力された音声はア
ナログ音声信号に変換され、アナログデジタル変換器2
07によりデジタル形態の音声信号に変換され、I/O
206を介してCPU201に引き渡される。
【0063】I/O208はキーボード12からの入力
情報をCPU201に転送する。I/O209はディス
プレイ11で表示するイメージデータを転送する。
【0064】以上の回路を有する文字処理システムの動
作説明に先立って、本実施形態の処理データの流れを図
12を参照して説明しておく。
【0065】マイクロホン10から入力された音声は音
声認識プログラム100により音声認識される。また、
入力音声は記憶装置(システムメモリ202)105に
記憶される。本実施形態の音声認識プログラムは隠れマ
ルコフモデルとよばれる音声の特徴を使用して音声認識
を行う。音声認識の結果としては入力音声(たとえば、
文節)に対して類似度が高い1以上のかな漢字混じり文
字列が得られる。この中のもっとも類似度が高い文字列
が文字処理プログラム102を介して表示される。類似
度の高い文字列は音声認識用辞書から従来と同様の音声
認識処理において抽出された後、文字処理プログラム1
02に引き渡される。
【0066】キーボード12から入力された読みの文字
列は文字処理プログラム102に引き渡され、かな混じ
り漢字(漢字のみの文字列、カタカナの文字列をも含
む)に変換される。なお、音声で入力された文字列と、
キー入力された文字列とを結合した文字列をも1つの文
字列としてかな混じり漢字の変換の対象とすることがで
きる。
【0067】文字処理プログラムはユーザの文字カーソ
ル操作、マウス操作、その他、挿入、削除等のキー操作
を受け付け、操作に応じて上述した文字処理方法にした
がって、文字処理を行う。読み上げ・プレイバック機能
が指示された場合には、記憶装置105に記憶された原
音声データ(入力の音声信号)と文字処理プログラムに
より音声合成された合成音声データは左右のスピーカ1
06から別個に同時に再生される。
【0068】文字処理プログラム102により文字処理
(漢字変換、挿入、削除)されて確定された文字列は文
書処理プログラム(ワープロソフト)104等文字列を
入力とするアプリケーションに引き渡される。なお、文
書処理プログラムによる処理中で範囲指定された確定文
字列について再変換の指示がユーザにより行われた場合
には、文字処理プログラム102に再変換の対象の文字
列が引き渡され、変換候補が表示画面に表示される。ユ
ーザの候補選択の後、確定された文字列は文書処理プロ
グラム104に引き渡されて、表示画面に表示される。
【0069】図12の回路の動作、主にCPU201の
処理内容を図13〜図18のフローチャートを参照して
説明する。これらのフローチャートに示す処理手順は文
字処理プログラムとして、CPU201の実行可能なプ
ログラム言語の形態でHDD203にあらかじめ保存さ
れている。CPU201の実行時にはHDD203から
システムメモリ202にロードされる。
【0070】図13は文字処理プログラムのメイン処理
手順を示す。図13の処理手順は入力イベント、すなわ
ち、マイクロホン10からの音声入力、キーボード12
からのキー入力、あるいはマウス13のいずれからか情
報入力があった場合に実行される。
【0071】以下に述べる音声許可フラグは音声の入力
が許可されているときにオン、音声の入力が許可されて
いない(禁止)場合にオフとなる。
【0072】マイクロホン10から音声入力があると、
CPU201は音声許可フラグがオンであることを確認
した上で、音声認識プログラムを起動し、入力の音声デ
ータを引き渡す。これにより、従来と同様の音声認識用
辞書を使用した音声認識処理が行われる(ステップS1
1)。音声の認識結果、この場合、文節単位での発声、
すなわち、読みの類似度の高い1以上のかな混じり漢字
文字列が後述の選択候補の表示のためにシステムメモリ
202に記憶され、もっとも類似度の高いかな混じり漢
字文字列がディスプレイ11に表示される(ステップS
12)。なお、このとき、従来と同様、未確定を表す点
線が表示の文字列に付される。
【0073】一方、キーボード12からの入力があるこ
とがステップS20で検出されると、システムメモリ2
02内の文字処理用の専用領域に入力情報が記憶される
とともに、ディスプレイ11にも表示される(ステップ
S21)。マウス13の操作により、文字処理関連の指
示が行われた場合には、その指示に応じた文字処理が行
われる(ステップS31)。種類ごとの文字処理につい
ては後述する。
【0074】図14は音声連続機能を実現するための処
理手順を示す。音声認識結果をシステムメモリ202に
記憶し、ディスプレイ11に表示する際に(図13のス
テップS11)、図14の処理手順が実行される。CP
U201はシステムメモリ202内の文字処理用専用領
域(以下、ワークエリアと略称する)に記憶されてお
り、未確定の文字数を計数する。
【0075】計数した文字数(あるいは文節数)、(た
だし、音声認識されたばかりの文字列でワークエリアに
記憶されていない文字列を含む)があらかじめ定めた文
字数(あるいは文節数)を超えている場合には、時間的
に早く記憶されている1文節の文字列(あるいは所定文
字数の文字列)、すなわち、先頭部の文字列を未確定か
ら確定に変更する(ステップS100→S101)。本
実施例では上記ワークエリアから表示用の文字記憶領域
に自動確定の文字列を削除する。次にワークエリア内の
未確定の文字数と文字認識された文字列の文字数の合計
を計算し(ステップS102)、再び、あらかじめ定め
た文字数との比較を行う(ステップS100)。以下、
ステップS100〜S102のループ処理を繰り返す。
これにより、今、音声認識された文字列をワークエリア
に記憶しても、オーバーフロー(記憶容量を越えるこ
と)を避けることができる。
【0076】ステップS100の判定がNOとなったと
きに、CPU201は音声認識された文字列をワークエ
リアに記憶するとともに、新たに記憶された文字列をこ
れまでに記憶されている文字列(未確定文字列と確定文
字列)とともに表示する(ステップS110→S12
0)。
【0077】以上の処理をCPU201が実行すること
により、ワークエリア内に記憶される未確定び文字数は
一定の値を超えることはなく、また、図4に示すように
先に音声で入力された文字列は文節単位で確定される。
以上が音声入力の場合の処理であるが、キーボード12
から連続的に文字列が入力された場合にも同様の処理を
行うことができる。
【0078】なお、音声認識結果として得られた1以上
の類似文字列のうち、もっとも類似する文字列がワーク
エリアに記憶され、1以上の類似文字列全体は、ワーク
エリアに記憶されたもっとも類似する文字列と関連付け
られてシステムメモリ202の別領域に記憶される。後
述するが、別領域に記憶された類似文字列は文字カーソ
ルの位置指定に応じた置換候補の表示に使用される。
【0079】図15は文字カーソルにより未確定文字列
の中の特定文字が指定された場合の処理内容を示す。こ
の処理手順は、文字カーソルがキーボード12のカーソ
ルキーもしくはマウス13により移動されたことをCP
U201が検出したときに、CPU201は文字処理関
連の指示ありと判断し、図13の処理手順をステップS
10〜S30→S31へと進め、図15の処理手順を実
行する。図15において、CPU201はカーソルキー
の位置が未確定文字列中に位置したことを検出すると、
指定された文字位置を含む文字列と対応する置換候補を
システムメモリ202から読み出して、図5の(C)の
ようにプルダウンメニューの形態で表示する(ステップ
S200→S210→S220→S230)。ユーザが
置換候補を選択すると、CPU201は選択された候補
と、現在、未確定文字列として表示されている文字列と
を置換する(ステップS250)。
【0080】本実施形態では、文字カーソルキーの位置
指定による置換候補の自動表示と関連させて、次のよう
な機能を用意している。ユーザが、文字カーソルにより
未確定文字列を指定した状態で、キーボード12の特定
のキー(たとえば、ENTERキー)を操作すると、そ
の操作が、ステップS220で検出され、文字カーソル
は未確定文字列の最後尾に移動し、以後、音声を使用し
た文字入力が許可された状態(音声許可フラグオン)と
なる。
【0081】次に、置換候補の読みの表示についての処
理を図16を参照して説明する。
【0082】図16の処理手順は未確定の文字列を確定
するために、未確定の文字列を文節単位に区切り、区切
られた文字列の中の特定の文節をユーザが指定して変換
の指示を行ったときに実行される。図16において、C
PU201はユーザが変換対象の区切り文字列の指定を
受付け、キーボード12の変換キーを操作すると、CP
U201は指定された文字列について関連する1以上の
文字列、すなわち、同音異義語や、カタカナだけの文字
列、文法的に正しい文字列を漢字変換用辞書から取得す
る。このとき、1以上の読みも共に取得される(ステッ
プS300→S310→S320)。
【0083】取得された文字列(置換候補)は図7の
(B)のように表示される(ステップS330)。ユー
ザが候補選択を行った上で読みの表示の指示をマウス1
3により行うと、CPU201は選択された文字列につ
いての読み候補(漢字変換用辞書から取得済み)を図7
(B)の符号5−2のように表示する(ステップS34
0→S350→S370、なお、選択されたかな混じり
漢字を含む)。
【0084】この読み候補をユーザが選択すると、CP
U201は同じ読みを持つ文字列(読みから逆引きの文
字列)を漢字変換用辞書から抽出し、表示する(ステッ
プS374、図7(A−2)参照)。ユーザが表示され
た文字列候補の中から所望の文字列を選択すると選択さ
れた文字列による置換が行われる(ステップS376→
S78)。以上説明したようにこの処理手順では、読み
からかな漢字混じり文字列を選択することも可能とな
る。
【0085】確定後の再変換処理において、漢字変換用
辞書のかわりに、システムメモリ202に記憶しておい
た類似文字列候補(音声認識候補)を使用する点は表示
する候補が異なるだけであり、詳細な処理手順の説明を
要しないであろう。
【0086】次に、プレイバック・読み上げ処理を図1
7を参照して説明する。図17の処理手順は、図1
(C)の音声アプレット3中に新たに設けられたプレイ
バック・読み上げ指示ボタンあるいは従来からあるプレ
イバックまたは読み上げボタンが操作されたときに実行
される。図17において、CPU201は操作ボタンの
種類をステップS400〜S420で判別する。プレイ
バックボタンが操作された場合には手順はステップS4
00→S401へと進み、従来と同様のプレイバック処
理(システムメモリ202に保存されている入力の音声
を再生する処理)。
【0087】また、読み上げボタンが操作された場合に
は、手順はステップS410→S411→S412と進
み、従来と同様、現在、表示されている未確定文字列に
ついて、CPU201は音声合成を行って、合成音声を
スピーカ106から再生出力する。
【0088】一方、プレイバック・再生ボタンが操作さ
れた場合には、読み上げのための音声合成データをたと
えば、左のスピーカ、入力の原音声を右のスピーカから
というように再生出力のスピーカを分けて原音声と、合
成音声を出力する(ステップS420→S430→S4
4)。
【0089】次に音声入力とキーボード入力の制御につ
いて図18を参照して説明する。
【0090】図18の処理手順は一定周期割り込みで実
行される。CPU201はキーボード12用のI/O2
08に保持されているキーコード信号を読み出し、キー
入力の有無を判定する。キー入力がある場合には、キー
コード信号が保持されていないので、これによりステッ
プS500の判定結果はYESとなり、手順はステップ
S501へと進む。
【0091】このステップで、CPU501はタイマー
の計数値をゼロにリセットして、音声許可フラグをオフ
し、音声の入力を禁止する。タイマーは1回のキーの押
下時間よりやや大きい非常に時間でカウントアップする
ものを使用する。連続的にキー入力がある場合には、ス
テップS500→S501→S502の手順が繰り返し
実行され、タイマーはカウントアップする前に再起動さ
れる。
【0092】一方、キー入力がなくなると、ステップS
100の判定結果がYES判定のとなる。したがって、
最後のキー入力で計時を開始したタイマーがカウントア
ップするまでは、音声許可フラグはオフ状態を続け、最
後のキー入力処理が終了するまでは音声入力処理が禁止
される。キー入力がなく、かつ、タイマーがカウントア
ップすると、手順は、ステップS500→S510→S
511へと進み、このステップで、音声許可フラグがオ
ンとなり音声の入力が許可される。この音声許可フラグ
のオンオフにしたがって。CPU201は図13のでの
音声入力、認識処理(ステップS11)を行う。
【0093】上述の実施形態の他に次の形態を実施でき
る。
【0094】1)上述の実施形態では文字カーソルの文
字列指定では、音声認識で得られた1以上の認識候補を
置換候補として表示し、確定のための変換の指示があっ
たときには漢字変換用辞書に記載された変換候補を表示
している。しかしながら、文字カーソルの指定や変換の
指示で表示する候補については、音声認識で得られた認
識候補と、漢字変換用辞書から得られる変換候補を混在
されて表示し、ユーザが選択することも可能である。
【0095】2)上述の実施形態では図9に示すように
読みを表示しているが、この読みは漢字変換用変換辞書
から取得してもよいし、音声認識用辞書から取得するよ
うにしてもよい。さらには双方の辞書から取得するよう
にしてもよいこと勿論である。
【0096】3)本実施形態の漢字変換用辞書は、ワー
プロなどで使用される判事変換用辞書と異なり、読みに
加えて誤記のかな漢字文字列をも変換前の文字列として
いる。このため、本実施形態の漢字変換用辞書は置換用
辞書と考えることができる。置換の対象の文字列として
は、上述の読み、文法的に間違った文字列(誤記、仮名
遣いの異なる文字列、スペルの誤りのある英文字列をい
わゆる置換辞書に記載しておくことができる。
【0097】4)上述の実施形態では、パーソナルコン
ピュータに文字処理装置を搭載する例を説明したが、音
声で文字を入力する各種の装置に対して本発明を適用す
ることができる。
【0098】
【発明の効果】以上、説明したように、請求項1,11
の発明では、文字カーソルのような文字位置指定手段に
よる文字位置指定だけで、変換候補を表示させることが
できるので、上記発明では従来の変換対象の指定、表示
の指示操作の合計2操作ステップを1操作ステップに減
じ、操作者の操作性を改善し、操作労力を低減すること
ができる。
【0099】請求項2,12の発明では加えて、文字位
置指定状態でENTERキーなどの特定のキーによる移
動指示を行うと文字カーソルが未確定文字列の最後尾へ
移動するので、操作者は、従来の音声アプレットを表示
させてこれにより音声の入力の開始を指示しなくても。
文字処理表示画面のままで、音声入力を再開することが
できる。
【0100】請求項3,13の発明では、文字位置指定
で表示される変換候補は音声認識候補であるので、誤認
識が生じた場合には、発声、すなわち、読みに類似した
認識候補の中から正しい文字列を選択することができ
る。
【0101】請求項4,14の発明では、未確定の文字
列を変換する場合に、変換候補の読みを知ることができ
るので、操作者が選択しようとしている文字列が、操作
者自身が望む文字列であるか否かを確認することができ
る。
【0102】請求項5,15の発明では、さらに読みか
らかな混じり漢字文字列を逆引きすることができるの
で、操作者が選択することができる文字列の範囲が多
種、多岐とすることができる。
【0103】請求項6,16の発明では読みに加えて、
変換候補の文字列も表示されるので、読みとかな漢字文
字列の対比が可能となる。
【0104】請求項7,17の発明では、連続で音声入
力を行っても先頭部分から未確定文字列が自動的に確定
されるので、未確定文字列を記憶しておくための記憶領
域をいたずらに増加させることはなく。また、音声認識
結果が正しい場合には、ユーザは、確定操作から開放さ
れる。
【0105】従来の再変換機能では、漢字変換辞書の変
換候補が表示されていたのに対し請求項8,18の発明
では、音声認識候補が表示されるので、入力音声に類似
した文字列を再変換することができる。
【0106】請求項9,19の発明では、入力音声と合
成音声とを同時に再生することで、音声のみで、表示の
目視確認なしで音声認識結果の正否の確認を行うことが
できる。
【0107】請求項10,20の発明では、キーボード
の操作が行われている間は音声入力が禁止されるので、
打鍵による音が、音声認識されず、誤認識が発生するこ
とはない。
【図面の簡単な説明】
【図1】(A)〜(C)は音声入力のための操作の推移
を示す説明図である。
【図2】(D)〜(F)は音声入力のための操作の推移
を示す説明図である。
【図3】(G)および(H)は音声入力のための操作の
推移を示す説明図である。
【図4】(A)および(B)は連続音声についての音声
認識結果の処理の変化を示す説明図である。
【図5】(C)および(D)は置換候補の表示の一例を
示す説明図である。
【図6】(E)は文字カールの移動結果を示す説明図で
ある。
【図7】(A−1)、(A−2)、(B)は置換候補の
表示例を示す説明図である。
【図8】(C)は読みから逆引きした置換候補の表示例
を示す説明図である。
【図9】再変換時の置換候補の表示例を示す説明図であ
る。
【図10】音声処理装置を有する情報処理装置の外観を
示す構成図である。
【図11】図10の情報処理装置の内部構成を示すブロ
ック図である。
【図12】本発明実施例のデータの流れを示すブロック
図である。
【図13】本発明実施形態のメイン処理手順を示すフロ
ーチャートである。
【図14】入力文字の記憶、表示のための処理内容を示
すフローチャートである。
【図15】文字カーソルの指定に伴う置換候補の表示処
理を示すフローチャートである。
【図16】本発明実施形態の文字列置換、読み候補の表
示、読みからの逆引きのための処理を示すフローチャー
トである。
【図17】プレイバック・読み上げの処理内容を示すフ
ローチャートである。
【図18】キー入力に関連した音声入力制御の内容を示
すフローチャートである。
【符号の説明】
11 ディスプレイ 12 キーボード 13 マウス 201 CPU 202 システムメモリ 203 HDD
フロントページの続き (72)発明者 藤村 武志 東京都調布市調布ヶ丘1丁目18番1号 マ イクロソフト株式会社 マイクロソフト調 布技術センター内 (72)発明者 只埜 正義 東京都調布市調布ヶ丘1丁目18番1号 マ イクロソフト株式会社 マイクロソフト調 布技術センター内 Fターム(参考) 5B009 KB01 KB04 MA06 ME17 ME22 MH05 RD03 5D015 KK01 5D045 AB02

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 入力の音声を音声認識し、音声認識結果
    を未確定のかな漢字混じり文字列として表示し、当該表
    示された文字列を文字処理した後、確定文字列を出力す
    る文字処理装置において、 表示されている未確定の文字列の文字位置を指定する文
    字位置指定手段と、 当該指定された文字を含む所定数の文字列に対する1以
    上の変換候補を表示する変換候補表示手段と、 当該表示された変換候補を指定する指定手段と、 当該指定された変換候補を前記文字位置指定手段の指定
    から定まる文字列と置換する文字処理手段とを具えたこ
    とを特徴とする文字処理装置。
  2. 【請求項2】 請求項1に記載の文字処理装置におい
    て、前記文字位置指定手段が指定する文字位置は文字カ
    ーソルの形態で表示され、該文字カーソルを、表示の未
    確定文字列の最後尾へ移動するように指示する移動指示
    手段をさらに有し、該移動指示手段による指示が行われ
    た場合には、新たな音声の入力を許可することを特徴と
    する文字処理装置。
  3. 【請求項3】 請求項1に記載の文字処理装置におい
    て、前記1以上の変換候補は音声認識により得られる認
    識候補であることを特徴とする文字処理装置。
  4. 【請求項4】 入力の音声を音声認識し、音声認識結果
    を未確定のかな混じり漢字文字列として表示し、当該表
    示された文字列を文字処理した後、確定文字列を出力す
    る文字処理装置において、 変換対象の未確定文字列を指定する変換対象指定手段
    と、 当該指定された未確定文字列に対して変換可能な1以上
    の文字列候補を表示する表示手段と、 当該表示された文字列候補の1つを選択し、読みの表示
    を指示する読み表示指示手段と、 当該指示された文字列についての1以上の読みの候補を
    表示する読み表示手段とを具えたことを特徴とする文字
    処理装置。
  5. 【請求項5】 請求項4に記載の文字処理装置におい
    て、前記読み表示手段により表示された1以上の読みの
    候補の1つを選択する第1選択手段と、当該選択された
    読みに対応する1以上のかな混じり漢字文字列を変換候
    補として表示する変換候補表示手段と、当該表示された
    1以上のかな混じり漢字文字列の1つを選択する第2選
    択手段と、当該選択されたかな混じり漢字文字列で、前
    記変換対象指定手段により指定された未確定文字列を置
    換する置換手段とをさらに具えたことを特徴とする文字
    処理装置。
  6. 【請求項6】 請求項4に記載の文字処理装置におい
    て、前記読み表示手段は1以上の読みに加えて、前記変
    換対象指定手段により指定された未確定文字列をも表示
    することを特徴とする文字処理装置。
  7. 【請求項7】 請求項1〜請求項6のいずれかに記載の
    文字処理装置において、前記音声認識結果が発生する毎
    に、表示すべき未確定のかな漢字混じり文字列の文字数
    または文節数を計数する計数手段と、当該計数の結果が
    特定数を超える場合には、未確定文字列の先頭部分の所
    定数の文字列を自動確定する確定手段とをさらに具えた
    ことを特徴とする文字処理装置。
  8. 【請求項8】 請求項1〜請求項7のいずれかに記載の
    文字処理装置は再変換後の指定文字列について他の文字
    列に変換する機能を有し、前記音声認識で得られる1以
    上の認識候補を記憶しておく記憶手段と、前記指定文字
    列と対応する1以上の認識候補を前記記憶手段から読み
    出し、変換候補として表示する変換候補表示手段とを具
    えたことを特徴とする文字処理装置。
  9. 【請求項9】 入力の音声を音声認識し、音声認識結果
    を未確定のかな漢字混じり文字列として表示し、当該表
    示された文字列を文字処理した後、確定文字列を出力す
    る文字処理装置において、 前記入力の音声を記憶する音声記憶手段と、 前記表示された文字列について音声合成する音声合成手
    段と、 読み上げ・プレイバックを指示する指示手段と、 当該指示に応じて前記音声記憶手段に記憶された音声と
    前記音声合成手段により合成された音声とを同時にそれ
    ぞれ再生出力する出力手段とを具えたことを特徴とする
    文字処理装置。
  10. 【請求項10】 入力の音声を音声認識し、音声認識結
    果を未確定のかな漢字混じり文字列として表示し、当該
    表示された文字列を文字処理した後、確定文字列を出力
    する文字処理装置において、 文字入力を行うキーボードと、 当該キーボードから入力された文字列と前記音声認識結
    果の文字列とを一括して文字処理可能な文字処理手段
    と、 前記キーボードから文字入力が行われている間は、前記
    音声の入力を禁止する制御手段とを具えたことを特徴と
    する文字処理装置。
  11. 【請求項11】 入力の音声を音声認識し、音声認識結
    果を未確定のかな漢字混じり文字列としてディスプレイ
    に表示し、当該表示された文字列を文字処理した後、確
    定文字列を出力する文字処理方法において、 表示されている未確定の文字列の文字位置を指定し、 当該指定された文字を含む所定数の文字列に対する1以
    上の変換候補を表示し、 当該表示された変換候補を指定し、 当該指定された変換候補を前記指定の文字から定まる文
    字列と置換することを特徴とする文字処理方法。
  12. 【請求項12】 請求項11に記載の文字処理方法にお
    いて、前記指定する文字位置は文字カーソルの形態で表
    示され、表示の未確定文字列の最後尾への前記文字カー
    ソルの移動を指示し、該指示が行われた場合には、新た
    な音声の入力を許可することを特徴とする文字処理方
    法。
  13. 【請求項13】 請求項11に記載の文字処理方法にお
    いて、前記1以上の変換候補は音声認識により得られる
    認識候補であることを特徴とする文字処理方法。
  14. 【請求項14】 入力の音声を音声認識し、音声認識結
    果を未確定のかな混じり漢字文字列としてディスプレイ
    に表示し、当該表示された文字列を文字処理した後、確
    定文字列を出力する文字処理装置において、 変換対象の未確定文字列を指定し、 当該指定された未確定文字列に対して変換可能な1以上
    の文字列候補を表示し、 当該表示された文字列候補の1つを選択し、 読みの表示を指示し、 当該指示された文字列についての1以上の読みの候補を
    表示することを特徴とする文字処理方法。
  15. 【請求項15】 請求項14に記載の文字処理方法にお
    いて、前記表示された1以上の読みの候補の1つを選択
    し、当該選択された読みに対応する1以上のかな混じり
    漢字文字列を変換候補として表示し、当該表示された1
    以上のかな混じり漢字文字列の1つを選択し、当該選択
    されたかな混じり漢字文字列で、前記指定された未確定
    文字列を置換することを特徴とする文字処理方法。
  16. 【請求項16】 請求項14に記載の文字処理方法にお
    いて、前記1以上の読みに加えて、前記指定された未確
    定文字列をも表示することを特徴とする文字処理方法。
  17. 【請求項17】 請求項11〜請求項16のいずれかに
    記載の文字処理方法において、前記音声認識結果が発生
    する毎に、表示すべき未確定のかな漢字混じり文字列の
    文字数または文節数を計数する計数し、当該計数の結果
    が特定数を超える場合には、未確定文字列の所定数の文
    字列を自動確定することを特徴とする文字処理方法。
  18. 【請求項18】 請求項11〜請求項16のいずれかに
    記載の文字処理方法は再変換後の指定文字列について他
    の文字列に変換する機能を有し、前記音声認識で得られ
    る1以上の認識候補を記憶手段に記憶しておき、前記指
    定文字列と対応する1以上の認識候補を前記記憶手段か
    ら読み出し、変換候補として表示することを特徴とする
    文字処理方法。
  19. 【請求項19】 入力の音声を音声認識し、音声認識結
    果を未確定のかな漢字混じり文字列としてディスプレイ
    に表示し、当該表示された文字列を文字処理した後、確
    定文字列を出力する文字処理方法において、 前記入力の音声を記憶手段に記憶しておき、 読み上げ・プレイバックを指示する指示し、 当該指示に応じて前記表示された文字列について音声合
    成し、前記記憶手段に記憶された音声と合成された音声
    とを同時にそれぞれ再生出力することを特徴とする文字
    処理方法。
  20. 【請求項20】 入力の音声を音声認識し、音声認識結
    果を未確定のかな漢字混じり文字列として表示し、当該
    表示された文字列を文字処理した後、確定文字列を出力
    する文字処理方法において、 キーボードから文字列を入力し、 当該キーボードから入力された文字列と前記音声認識結
    果の文字列とを一括して文字処理可能となし、 前記キーボードから文字入力が行われている間は、前記
    音声の入力を禁止するを具えたことを特徴とする文字処
    理方法。
JP03493499A 1999-02-12 1999-02-12 文字処理装置および方法 Expired - Lifetime JP3795692B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP03493499A JP3795692B2 (ja) 1999-02-12 1999-02-12 文字処理装置および方法
JP2002092413A JP3723518B2 (ja) 1999-02-12 2002-03-28 文字処理装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03493499A JP3795692B2 (ja) 1999-02-12 1999-02-12 文字処理装置および方法

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2002092412A Division JP2002366345A (ja) 2002-03-28 2002-03-28 文字処理装置および方法
JP2002092413A Division JP3723518B2 (ja) 1999-02-12 2002-03-28 文字処理装置および方法

Publications (2)

Publication Number Publication Date
JP2000242638A true JP2000242638A (ja) 2000-09-08
JP3795692B2 JP3795692B2 (ja) 2006-07-12

Family

ID=12428030

Family Applications (2)

Application Number Title Priority Date Filing Date
JP03493499A Expired - Lifetime JP3795692B2 (ja) 1999-02-12 1999-02-12 文字処理装置および方法
JP2002092413A Expired - Fee Related JP3723518B2 (ja) 1999-02-12 2002-03-28 文字処理装置および方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2002092413A Expired - Fee Related JP3723518B2 (ja) 1999-02-12 2002-03-28 文字処理装置および方法

Country Status (1)

Country Link
JP (2) JP3795692B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002156996A (ja) * 2000-11-16 2002-05-31 Toshiba Corp 音声認識装置、認識結果修正方法及び記録媒体
JP2009514020A (ja) * 2005-10-28 2009-04-02 マイクロソフト コーポレーション モバイルデバイスにおける音声および代替入力手法の組み合わせ
JP2009265276A (ja) * 2008-04-23 2009-11-12 Internatl Business Mach Corp <Ibm> 支援装置、プログラムおよび支援方法
JP2016048565A (ja) * 2006-05-25 2016-04-07 エムモーダル アイピー エルエルシー 音声認識方法
WO2018020759A1 (ja) * 2016-07-26 2018-02-01 ソニー株式会社 情報処理装置、および情報処理方法
CN113835669A (zh) * 2020-06-24 2021-12-24 青岛海信移动通信技术股份有限公司 电子设备及其语音播报方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005312758A (ja) 2004-04-30 2005-11-10 Nintendo Co Ltd ゲームシステムおよびゲームプログラム
JP4604178B2 (ja) 2004-11-22 2010-12-22 独立行政法人産業技術総合研究所 音声認識装置及び方法ならびにプログラム
JP2009036998A (ja) * 2007-08-01 2009-02-19 Infocom Corp コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体
US20090070109A1 (en) * 2007-09-12 2009-03-12 Microsoft Corporation Speech-to-Text Transcription for Personal Communication Devices
US9183832B2 (en) * 2011-06-07 2015-11-10 Samsung Electronics Co., Ltd. Display apparatus and method for executing link and method for recognizing voice thereof
JP6018408B2 (ja) * 2012-05-02 2016-11-02 任天堂株式会社 情報処理プログラム、情報処理装置、情報処理システム及び情報処理方法
JP6124047B2 (ja) * 2012-12-05 2017-05-10 株式会社デンソー 制御装置
JP5701327B2 (ja) * 2013-03-15 2015-04-15 ヤフー株式会社 音声認識装置、音声認識方法、およびプログラム
JP6917561B2 (ja) * 2019-11-12 2021-08-11 パナソニックIpマネジメント株式会社 字幕修正装置、字幕修正方法、及び、コンピュータプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002156996A (ja) * 2000-11-16 2002-05-31 Toshiba Corp 音声認識装置、認識結果修正方法及び記録媒体
JP4509361B2 (ja) * 2000-11-16 2010-07-21 株式会社東芝 音声認識装置、認識結果修正方法及び記録媒体
JP2009514020A (ja) * 2005-10-28 2009-04-02 マイクロソフト コーポレーション モバイルデバイスにおける音声および代替入力手法の組み合わせ
JP2016048565A (ja) * 2006-05-25 2016-04-07 エムモーダル アイピー エルエルシー 音声認識方法
JP2009265276A (ja) * 2008-04-23 2009-11-12 Internatl Business Mach Corp <Ibm> 支援装置、プログラムおよび支援方法
WO2018020759A1 (ja) * 2016-07-26 2018-02-01 ソニー株式会社 情報処理装置、および情報処理方法
JPWO2018020759A1 (ja) * 2016-07-26 2019-05-09 ソニー株式会社 情報処理装置、および情報処理方法
JP7107219B2 (ja) 2016-07-26 2022-07-27 ソニーグループ株式会社 情報処理装置、および情報処理方法
CN113835669A (zh) * 2020-06-24 2021-12-24 青岛海信移动通信技术股份有限公司 电子设备及其语音播报方法
CN113835669B (zh) * 2020-06-24 2024-03-29 青岛海信移动通信技术有限公司 电子设备及其语音播报方法

Also Published As

Publication number Publication date
JP3795692B2 (ja) 2006-07-12
JP2003005789A (ja) 2003-01-08
JP3723518B2 (ja) 2005-12-07

Similar Documents

Publication Publication Date Title
JP3795692B2 (ja) 文字処理装置および方法
JP2003513389A (ja) 言語入力ユーザインタフェース
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
JPS61107430A (ja) 音声情報の編集装置
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JPH1125098A (ja) 情報処理装置、リンク先ファイルの取得方法および記憶媒体
JP3483230B2 (ja) 発声情報作成装置
JP2006031725A (ja) 文字処理装置
JPH06195326A (ja) 文書入力方法及び装置
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JP2002366345A (ja) 文字処理装置および方法
JP3284976B2 (ja) 音声合成装置及びコンピュータ可読記録媒体
US6327560B1 (en) Chinese character conversion apparatus with no need to input tone symbols
JPH10143503A (ja) 音声ワードプロセッサ
JP2001014304A (ja) 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体
JP2003288098A (ja) ディクテーション装置、方法及びプログラム
JP3280729B2 (ja) 発音記号作成装置
JP3071760B2 (ja) 表記文字列変換装置および表記文字列変換方法
JPS5818730A (ja) 文字処理装置
JPH11250045A (ja) 文書作成装置、入力処理方法及び記録媒体
JPH08221095A (ja) 文章読み上げ方法
JPH0195323A (ja) 音声入力装置
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JP2001034607A (ja) フロント・エンド・プロセッサ、その処理方法および記録媒体
JP3442197B2 (ja) 文書処理装置および文書処理方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020426

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060125

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20060125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060309

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060413

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090421

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100421

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110421

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120421

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120421

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130421

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130421

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140421

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term