JP2008293109A - テキスト処理装置及びプログラム - Google Patents

テキスト処理装置及びプログラム Download PDF

Info

Publication number
JP2008293109A
JP2008293109A JP2007135598A JP2007135598A JP2008293109A JP 2008293109 A JP2008293109 A JP 2008293109A JP 2007135598 A JP2007135598 A JP 2007135598A JP 2007135598 A JP2007135598 A JP 2007135598A JP 2008293109 A JP2008293109 A JP 2008293109A
Authority
JP
Japan
Prior art keywords
character string
input
text
correction
corrected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007135598A
Other languages
English (en)
Other versions
JP4660504B2 (ja
Inventor
Toshimasa Dobashi
外志正 土橋
Hiroyuki Mizutani
博之 水谷
Akihiro Uda
明弘 宇田
Naoaki Kodaira
直朗 小平
Tomohisa Suzuki
智久 鈴木
Akio Furuhata
彰夫 古畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2007135598A priority Critical patent/JP4660504B2/ja
Publication of JP2008293109A publication Critical patent/JP2008293109A/ja
Application granted granted Critical
Publication of JP4660504B2 publication Critical patent/JP4660504B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】操作者が修正文字列を含む任意の文字列を修正用文字列として入力した場合に、その修正用文字列から修正文字列を自動抽出できるようにする。
【解決手段】被修正文字列指定部16は、入力操作部15を用いた操作者の入力操作に基づき入力テキスト中の修正されるべき文字列を被修正文字列として指定する。修正用文字列入力部17は、操作者の入力操作に基づき文字列の修正に用いられる修正文字列を含む修正用文字列を入力する。修正文字列抽出部20は、被修正文字列指定部16によって指定された被修正文字列と修正用文字列入力部17によって入力された修正用文字列とを比較することにより、当該修正用文字列の中から指定された被修正文字列と最も類似した文字列を修正文字列として抽出する。修正部21は、入力テキスト中の指定された被修正文字列を抽出された修正文字列に置き換えることで当該被修正文字列を修正する。
【選択図】図1

Description

本発明は、操作者による文字列修正作業を支援するテキスト処理装置及びプログラムに関する。
近年、コンピュータの処理能力の高まりと共に文字認識、音声認識が広く用いられるようになっている。これら認識技術の認識性能は年々向上しているが、それでも誤認識が生じることは避けられない。そのため、認識テキストに含まれている誤認識文字列を修正するための操作者による修正作業が必要とされる。
このような修正作業では、漢字1文字のみの修正が多発することがある。この場合、修正文字の入力に用いるインプットメソッド(仮名漢字変換モジュール、音声文字変換モジュールなど)の入力効率が悪くなる。例えば、文字認識において、文字列「晴天」の「天」が「夫」と誤認識されることがある。通常、画面表示されている認識テキスト中の誤認識文字「夫」を操作者が選択すると、当該誤認識文字「夫」の修正候補の一覧が画面表示される。もし、修正候補の一覧に正解文字「天」が含まれているならば、操作者はその「天」を選択すれば良い。しかし、修正候補の一覧が、例えば「1.人 2.未 3.大」であって、正解文字「天」を含んでいない場合、操作者は修正入力フィールドに当該正解文字(修正文字)「天」を入力することによって修正を行うこととなる。
ここで、操作者がインプットメソッドを用いて正解文字(修正文字)「天」を入力するものとする。もし、単漢字の仮名漢字変換により「天」を入力する場合、操作者は仮名文字列「てん」を入力する操作を行う。この入力仮名文字列「てん」が漢字に変換される。しかし、読みが「てん」の漢字は「天」以外に、「点」、「展」、「転」、「典」など様々あるため、操作者が意図した修正文字を効率良く入力することは難しい。
もし、例えば「天気」のように、正解文字「天」を含む変換しやすい単語を入力し、その後余分な文字(この場合「気」)を消去するならば、文字変換効率の問題を解消することが可能となる。しかし、この手法は余分な文字消去の手間を招く。
そこで、例えば特許文献1には、余分な文字の消去を自動的に行うようにした技術(以下、第1の技術と称する)が記載されている。第1の技術では、認識テキスト中の修正されるべき誤認識文字が操作者によって選択される。また、正解文字を含む文字列の読みが操作者によって入力される。入力された読みは、仮名漢字変換手段によって正解文字を含む文字列に変換される。第1の技術では、認識テキスト中の誤認識文字の周辺の文字と、仮名漢字変換手段によって得られた文字列(正解文字を含む文字列)との比較により一致する文字が検索される。そして、一致する文字を除いた残りの文字に基づいて修正文字が決定される。
第1の技術によれば、例えば「晴天」が「晴夫」と誤認識された場合、操作者は「晴夫」中の誤認識文字「夫」を「天」に修正するのに、当該誤認識文字「夫」を選択指定すると共に、「晴天」の読み「せいてん」を入力すれば良い。ここでは、読み「せいてん」が仮名漢字変換手段によって文字列「晴天」に変換される。そして、誤認識文字「夫」の周辺の文字と、仮名漢字変換手段により得られた文字列「晴天」との比較により、一致する文字「晴」が検索される。この場合、文字列「晴天」から一致する文字「晴」を除いた文字、つまり「天」が、誤認識文字「夫」に置き換えられるべき修正文字として決定される。
また、上記特許文献1には、同音異義語が存在するために操作者の意図した文字列に速やかに仮名漢字変換できない場合を考慮して修正文字を決定する技術(以下、第2の技術と称する)も記載されている。この第2の技術の特徴は、例えば「会議」の「会」が「合」と誤認識された場合、操作者が「会議」の読み「かいぎ」を入力すると、「会議」以外の単語である「懐疑」「回議」などに変換される可能性があることから、これを回避するために「会議」の後ろ側に例えば1文字「室」が続く文字列「会議室」の読み「かいぎしつ」を入力した場合の修正文字の決定の手法にある。ここでは、読み「かいぎしつ」は、ほぼ1度で文字列「会議室」に仮名漢字変換される。「会議室」において誤認識文字「合」の周辺の文字「合議」との間で一致しない文字は「会」と「室」の2文字である。この2文字のうち、「議」の後ろの文字である「室」は、一致文字「議」との位置関係に基づき修正文字の対象外とされて、一致文字「議」の前の文字である「会」が修正文字として決定される。
また、上記特許文献1には、修正文字を含む文字列であって複数の文節からなる文字列が入力されることを前提として、入力文字列のうちの予め定められた位置の文字(例えば第2文節の先頭文字)を修正文字として決定する技術(以下、第3の技術と称する)も記載されている。ここでは、第2文節の先頭文字を修正文字とすることが予め定められているものとする。第3の技術によれば、例えば「修士論文」の「修」が誤認識されて「参士論文」になった場合に、操作者が「がくもんをおさめる」と入力するならば、この入力文字列が「学問を修める」に仮名漢字変換された場合に、第2文節の先頭文字「修」が修正文字として決定される。
特開平7−302302号公報(段落0023−0027)
上記したように、第1乃至第3の技術によれば、操作者は認識テキスト中の誤認識文字を指定して、当該誤認識文字の正解文字を含む単語または文節の読みを入力することにより、その読みが仮名漢字変換された文字列から誤認識文字に置き換えられるべき修正文字が自動的に決定される。
但し、修正文字の自動決定のためには、第1の技術では、操作者は、認識テキスト中の、誤認識文字が正解文字に置き換えられた本来あるべき単語または文節の読みを入力する必要がある。例えば、「晴天」が「晴夫」と誤認識された場合であれば、操作者は「晴夫」中の誤認識文字「夫」を「天」に修正するのに、当該「晴天」の読み「せいてん」を入力しなければならない。つまり第1の技術では、例えば「天気」の読み「てんき」と入力しても、「天」を文字列「晴夫」中の「夫」に対する修正文字であると自動決定することはできない。
また、第2の技術では、「会議」の「会」が「合」と誤認識された場合、操作者が「会議」の後ろ側に文字「室」が続く文字列「会議室」の読み「かいぎしつ」を入力することにより、読み「かいぎしつ」を仮名漢字変換して得られる「会議室」に含まれている不一致文字「会」及び「室」のうち、一致文字「議」の前の文字「会」が修正文字と決定される。しかし第2の技術では、操作者が、例えば文字列「早朝会議」は思いついても、「会議」の後ろ側に文字が続く文字列を思いつかなかった場合、修正作業を行うことができなくなる。勿論、仮名漢字変換後の文字列の中から操作者に修正文字の位置を指定させる構成を適用するならば、操作者は正解文字を含む任意の単語または文節を入力することができる。そのためには、操作者は仮名漢字変換後の文字列中で修正文字を指定する作業を必要とする。
次に第3の技術では、操作者は、予め定められた位置に正解文字を含む文節の読みを入力しなければならず、文字修正作業を困難にする。
本発明は上記事情を考慮してなされたものでその目的は、テキスト中に修正されるべき文字(文字列)が含まれているために、操作者が修正文字(修正文字列)を含む任意の文字列を修正用文字列として入力するための操作を行った場合に、その修正用文字列から修正されるべき文字(文字列)の修正に用いる修正文字(修正文字列)を自動抽出することができるテキスト処理装置及びプログラムを提供することにある。
本発明の1つの観点によれば、テキスト処理装置が提供される。このテキスト処理装置は、テキストを入力するためのテキスト入力手段と、前記テキスト入力手段によって入力されたテキストを入力テキストとして格納するためのテキスト記憶手段と、前記テキスト記憶手段に格納された入力テキストの表示に用いられるディスプレイと、操作者の入力操作に用いられる入力操作手段と、前記入力操作手段を用いた操作者の入力操作に基づき前記入力テキスト中の修正されるべき文字列を被修正文字列として指定するための被修正文字列指定手段と、前記入力操作手段を用いた操作者の入力操作に基づき文字列の修正に用いられる修正文字列を含む修正用文字列を入力するための修正用文字列入力手段と、前記被修正文字列指定手段によって指定された被修正文字列と前記修正用文字列入力手段によって入力された修正用文字列とを比較することにより、当該修正用文字列の中から前記指定された被修正文字列の修正に用いられる修正文字列として最も尤もらしい文字列を抽出する修正文字列抽出手段と、前記入力テキスト中の前記指定された被修正文字列を前記抽出された文字列に置き換えることで当該被修正文字列を修正する修正手段とを具備する。
本発明によれば、テキスト中の誤入力、或いは誤認識されたような文字列の修正作業を行う際、修正に用いる文字列(文字)を含みさえすれば、本来の文字列とは無関係の、入力しやすい任意の文字列を修正用文字列として操作者が入力する操作を行っても、当該修正に用いる文字列(文字)が修正用文字列から修正文字列(修正文字)として自動的に抽出される。このため、修正文字列を含む修正用文字列の入力時における仮名漢字変換等インプットメソッドの変換効率向上や、一旦修正用文字列を入力した後で余計な文字列を削除する手間の解消を図ることができ、テキスト修正の効率向上が可能となる。
以下、本発明の実施の形態につき図面を参照して説明する。
[第1の実施形態]
図1は本発明の第1の実施形態に係るテキスト処理装置の構成を示すブロック図である。図1のテキスト処理装置は、テキスト入力部11、テキスト記憶部12、ディスプレイ13、テキスト表示部14、入力操作部15、被修正文字列指定部16、修正用文字列入力部17、仮名漢字変換部18、辞書記憶部19、修正文字列抽出部20、及び修正部21から構成される。
テキスト入力部11は、例えば文字コードで表された漢字混じりのテキスト(テキストデータ)をネットワークから入力する通信インタフェースである。このテキストは、例えば、図1のテキスト処理装置とネットワークを介して接続された文字認識装置または音声認識装置による認識処理(文字認識処理または音声認識処理)によって認識された文字列から構成される文書データであり、当該文字認識装置または音声認識装置からネットワークを介して送信されるものとする。
テキスト入力部11によって入力されるテキスト(ここでは認識結果)は一般に誤認識文字を含む。またテキストは、認識文字毎に認識候補文字群と対応付けられている。認識候補文字群の各認識候補文字には、その文字の認識文字としての確からしさを表すスコア、尤度或いは類似度が付されている。一般には、最も確からしい候補文字が認識文字として選択される。なお、テキスト入力部11が、文字認識装置または音声認識装置による認識結果としてのテキストを格納した例えばリムーバブル記憶媒体から当該テキストを読み込む記憶装置であっても良い。また、テキスト入力部11が、操作者の入力操作に従って文字列(テキスト)を入力するのに用いられるキーボードであっても良い。
テキスト記憶部12は、テキスト入力部11によって入力されたテキスト(及び当該テキストに付随する認識文字毎の認識候補文字群)を格納するのに用いられる。
ディスプレイ13は、テキストの表示等に用いられる。テキスト表示部14は、テキスト記憶部12に格納されたテキスト(入力テキスト)をディスプレイ13に表示するための処理を行う。
入力操作部15は、ディスプレイ13に表示されているテキストに修正されるべき文字列(被修正文字列)が含まれている場合に、その被修正文字列の選択、及び当該被修正文字列に置き換えられるべき文字列(修正文字列)を含む文字列(修正用文字列)の例えば読みの入力に用いられる。入力操作部15は、例えばキーボード及びマウスから構成される。
被修正文字列指定部16は、入力操作部15を用いた操作者の入力操作により任意の文字列が被修正文字列として選択されたことを検出する。被修正文字列指定部16は、この文字列選択の検出により、選択された文字列を被修正文字列として指定(決定)する。修正用文字列入力部17は、入力操作部15を用いて行われる操作者による修正用文字列入力操作に基づき修正用文字列を入力する。
仮名漢字変換部18は、修正用文字列入力部17によって入力された読みを漢字混じりの文字列(修正用文字列)に変換する。ここでの読みは、例えば仮名入力によるものであっても、ローマ字入力によるものであっても構わない。
辞書記憶部19は、言語知識データベース記憶部191、文字パターン辞書記憶部192及び音声パターン辞書記憶部193を含む。言語知識データベース記憶部191は、言語知識データベースを格納する。この言語知識データベースは、種々の文字の組み合わせからなる文字列毎に、その文字列の言語(単語または語句)としての尤もらしさを表す情報を保持する。文字パターン辞書記憶部192は、各文字の標準の文字パターン情報を格納する。音声パターン辞書記憶部193は、各文字を構成する音節の標準の音声パターン情報を格納する。
修正文字列抽出部20は、修正用文字列を、ディスプレイ13に表示されているテキストのうち、被修正文字列指定部16によって指定された被修正文字列と比較することによって、当該修正用文字列から修正文字列を抽出する。
修正部21は、ディスプレイ13に表示されているテキストのうちの被修正文字列を、修正文字列抽出部20によって抽出された修正文字列に置き換えることにより、当該テキスト(中の被修正文字列)を修正する。
図2は、図1のテキスト処理装置を実現する情報処理装置のハードウェア構成を示すブロック図である。図2において、図1と同様の部分には同一符号を付してある。図2に示す情報処理装置は、例えばパーソナルコンピュータのようなコンピュータである。この情報処理装置は、図1に示されるディスプレイ13及び入力操作部15の他に、通信インタフェース31、リムーバブル記憶装置32及びハードディスクドライブ(HDD)33の各入出力機器、CPU34及びメモリ35を含む。メモリ35の記憶領域の一部は、図1に示されるテキスト記憶部12として用いられる。またHDD33の記憶領域の一部は、図1に示される辞書記憶部19として用いられる。
HDD33には、図2の情報処理装置をテキスト処理装置(テキストエディタ)として機能させるためのプログラム330が予め格納されている。CPU34は、HDD33に格納されているプログラム330をメモリ35に読み込んで実行することにより、図2の情報処理装置を図1に示されるテキスト処理装置として機能させる。即ちCPU34は、プログラム330の実行により、図1に示されるテキスト入力部11、テキスト表示部14、被修正文字列指定部16、修正用文字列入力部17、仮名漢字変換部18、修正文字列抽出部20及び修正部21の各機能部(処理部)を実現するものとする。このプログラム330は、コンパクトディスク、或いはROMのような、コンピュータ読み取り可能な記憶媒体に予め格納して頒布可能である。また、このプログラム330が、ネットワークを介して図2の情報処理装置のHDD33にダウンロードされても構わない。
次に、図1のテキスト処理装置における文字列修正処理について、図3に示すフローチャート及び図4に示す画面例を参照して説明する。まず、テキスト入力部11によって、テキスト「本日は晴夫なり。明日は晴れるてしようか。」が入力されたものとする(ステップS1)。このテキスト「本日は晴夫なり。明日は晴れるてしようか。」は、例えば紙の文書「本日は晴天なり。明日は晴れるでしょうか。」をスキャナでスキャンして得られた画像(入力画像)を文字認識装置にて文字認識処理した認識結果であるものとする。ここでは、「晴天」の「天」が「夫」に誤認識されている。また、「晴れるでしょうか」における「で」と「ょ」が誤認識されて「晴れるてしようか」となっている。
テキスト入力部11によって入力されたテキストはテキスト記憶部12に格納される。このテキストには、入力画像が付随している。また、テキストには、当該テキストを構成する認識文字毎に認識候補文字群が付随している。認識文字も認識候補文字の1つである。各認識候補文字には、その文字の認識文字としての確からしさ(認識信頼度)を表す情報が付されている。本実施形態では、「晴天」の「天」に対する認識候補文字として、最も確からしい文字「夫」から順に、「人」、「未」及び「大」の4文字が挙げられているものとする。この場合、文字「夫」がテキスト中の認識文字として用いられ、残りの3文字「人」、「未」及び「大」が修正候補文字として用いられる。
テキスト表示部14は、テキスト記憶部12に格納されたテキスト(入力テキスト)及び当該テキストに付随する入力画像を、それぞれ図4において符号41及び42で示されるように、ディスプレイ13に表示させる(ステップS2)。この際、テキスト表示部14は、テキスト中の各文字(認識文字)の認識信頼度を表す情報に基づき、例えば認識信頼度が一定レベルよりも低い文字を、誤認識の可能性が高い文字(誤認識候補)として操作者が視認可能なように、他の文字とは区別してディスプレイ13に表示させる。図4の例では、網掛け文字として表示されている。これにより操作者は、画面表示されているテキストに含まれている誤認識候補の中から、修正されるべき候補(被修正文字列)を入力操作部15(の例えばマウス、或いはキーボード)で選択することができる。
なお、図1のテキスト処理装置に文法/単語チェック機能を持たせ、当該機能により入力テキストに対して、言語知識データベース記憶部191に格納されている言語知識データベースに基づいて文法/単語チェックを行うことで、文法的に誤っている文字列、或いは単語として尤もらしくない文字列を被修正文字列候補として抽出して、当該被修正文字列候補が他の文字列とは区別して表示されるようにしても良い。
また操作者は、画面表示されている誤認識候補(被修正文字列候補)を被修正文字列として選択する以外に、入力テキスト上の任意の文字列の開始/終了位置を修正開始/終了位置として入力操作部15で指定することで、当該開始/終了位置で示される文字列を被修正文字列として選択することもできる。
ここで、図4に示されるテキスト中に修正されるべき誤認識候補(誤認識文字)が存在するために、操作者が入力操作部15を操作することによって、テキスト中の誤認識候補(誤認識文字)、例えば図4において符号45で示される、文字列「晴夫」の文字「夫」を、被修正文字列(被修正文字)として選択したものとする。この場合、テキスト表示部14は選択された文字「夫」が被修正文字列(被修正文字)として視認可能なように、当該文字「夫」を特別の表示属性でディスプレイ13に表示させると共に、上記修正候補文字「人」、「未」及び「大」を、図4に示される修正候補表示領域43に表示させる。但し本実施形態では、修正候補表示領域43に表示される修正候補文字群には、正解文字「天」が含まれていない。
操作者は、入力操作部15を操作して被修正文字列を選択すると、修正候補表示領域43に表示された修正候補文字群の中に、修正文字(正解文字)が含まれているかを調べる。もし、修正文字が含まれていない場合、操作者は入力操作部15を用いて、図4に示される修正入力フィールド44に修正文字を含む文字列を入力するための操作を行う。
さて被修正文字列指定部16は、操作者によって被修正文字列が選択されたことを検出すると(ステップS3,S4)、その旨を修正用文字列入力部17に通知すると共に、修正文字列抽出部20に対し、選択された文字列を被修正文字列として指定する(ステップS5)。図4において符号45で示される、文字列「晴夫」の文字「夫」が選択された本実施形態では、当該文字「夫」が被修正文字列(被修正文字)として指定される。
修正用文字列入力部17は、被修正文字列指定部16によって被修正文字列が選択されると、修正入力フィールド44への修正文字を含む文字列(修正用文字列)の入力または修正候補表示領域43からの修正候補の選択のいずれが行われるかを判定する(ステップS6)。ここでは、操作者が、入力操作部15を用いて、修正入力フィールド44へ修正用文字列「天気」の読み「てんき」を入力する操作を行ったものとする。この場合、仮名漢字変換部18は、入力された読み「てんき」を「天気」に変換する。これにより修正入力フィールド44には、修正用文字列「天気」が表示される。つまり修正入力フィールド44に修正用文字列「天気」が入力される。
修正用文字列入力部17は、修正入力フィールド44に修正用文字列が入力されると、修正用文字列の入力を判定する(ステップS6)。この場合、修正用文字列入力部17は、修正入力フィールド44に入力された修正用文字列を取り込み、当該修正用文字列を修正文字列抽出部20に渡す(ステップS7)。
修正文字列抽出部20は、修正用文字列入力部17によって取り込まれた修正用文字列の文字数と被修正文字列指定部16によって指定された被修正文字列の文字数とを比較することにより、修正用文字列からの修正文字列の抽出が必要かを判定する(ステップS8)。ここでは、修正用文字列の文字数が指定された被修正文字列の文字数よりも多い場合に、修正文字列の抽出が必要であると判定される。修正用文字列が「天気」であり、被修正文字列が「夫」である本実施形態では、修正文字列の抽出が必要であると判定される。
修正文字列抽出部20は、修正文字列の抽出が必要であると判定した場合、修正用文字列と被修正文字列とを比較することにより、当該修正用文字列から被修正文字列と置き換えるべき修正文字列を抽出する(ステップS9)。この修正文字列抽出部20による修正文字列(修正文字)の抽出には、第1の文字列(修正用文字列)の中から第2の文字列(被修正文字列)に類似した第3の文字列を(修正文字列として)検索する手法が適用される。
修正文字列抽出部20による検索には、文字列や音声などのマッチングによく用いられる周知のDP(Dynamic Programming)マッチングのような手法が適用される。第2の文字列(被修正文字列)を含むテキストが文字認識結果である本実施形態では、このマッチングには、第1の文字列(修正用文字列)を構成する各文字の標準パターン(標準文字パターン)と、第2の文字列(被修正文字列)を構成する各文字の標準文字パターンとが用いられる。これらの文字パターンの情報は、文字パターン辞書記憶部192に格納されている。
修正文字列抽出部20によるマッチング手法を適用した検索により、第1の文字列(修正用文字列)の中から第2の文字列(被修正文字列)に最も一致度(類似度)の高い文字列(第3の文字列)が修正文字列として抽出される。
第1の文字列(修正用文字列)が「天気」、第2の文字列(被修正文字列)が「夫」である本実施形態では、「天気」の「天」と「夫」との文字パターン(字形状)の類似度と「天気」の「気」と「夫」との字形状の類似度とが比較される。ここでは、「天」と「夫」との文字パターンの類似度の方が「気」と「夫」との文字パターンの類似度よりも十分高い、この場合、修正文字列抽出部20は、第1の文字列(修正用文字列)「天気」の中から、第2の文字列(被修正文字列)「夫」に類似した第3の文字列「天」を修正文字列(修正文字)として抽出する。
上記の例は、テキスト入力部11によって入力されたテキストが文字認識結果の場合である。もし、テキスト入力部11によって入力されたテキストが音声認識結果の場合であるならば、修正文字列抽出部20によるマッチング手法を適用した検索には、各文字の標準文字パターンに代えて、その文字の標準音声パターン(例えば、その文字に対応する音声を構成する音節の標準音声パターン)を用いれば良い。これらの音声パターンの情報は、音声パターン辞書記憶部193に格納されている。
また、パターンマッチングを用いた検索に代えて、例えば文字列(単語または語句)の言語としての尤もらしさ(単語または語句としての尤もらしさ)を評価して比較することにより、第1の文字列(修正用文字列)の中から第2の文字列(被修正文字列)の修正に最も適した文字列を修正文字列として検索することも可能である。ここでは修正文字列抽出部20は、入力テキストから第2の文字列(被修正文字列)を含む第4の文字列を取り出す。次に修正文字列抽出部20は取り出された第4の文字列中の被修正文字列を、第1の文字列(修正用文字列)から選択可能な同一文字数の文字列と置き換える処理を繰り返す。修正文字列抽出部20は、この文字列置き換えが行われた第4の文字列の単語(言語)としての尤もらしさを、言語知識データベース記憶部191に格納されている言語知識データベースに基づいて評価する。そして修正文字列抽出部20は、単語(言語)として最も尤もらしいと評価された第4の文字列に含まれている、被修正文字列の置き換えに用いられた文字列(第3の文字列)を、修正文字列として抽出する。この手法は、被修正文字列を含むテキストが、キー入力操作等によって作成されたテキストを編集するために、編集者(操作者)が、例えば誤入力文字を含む編集対象文字列を被修正文字列として指定して修正用文字列を入力する場合に、特に有効である。また、被修正文字列を含むテキストが文字認識結果又は音声認識結果の場合に、この手法を先のマッチングによる検索手法と組み合わせるならば、修正文字列を一層高精度に抽出することができる。
以下、言語としての尤もらしさを利用した修正文字列の抽出の具体例について説明する。ここでは上述のように、第1の文字列(修正用文字列)が「天気」、第2の文字列(被修正文字列)が「夫」、第2の文字列(被修正文字列)「夫」を含む入力テキストが「本日は晴夫なり。明日は晴れるてしようか。」であるものとする。
まず修正文字列抽出部20は、入力テキストから第2の文字列(被修正文字列)「夫」を含む第4の文字列(単語)を抽出する。ここでは、第4の文字列として単語「晴夫」が抽出されたものとする。次に修正文字列抽出部20は、単語「晴夫」中の被修正文字「夫」を、第1の文字列(修正用文字列)「天気」を構成する各文字「天」「気」で置き換える。この置き換え後の単語は、「晴天」及び「晴気」となる。修正文字列抽出部20は、言語知識データベース記憶部191に格納されている言語知識データベースに基づいて、「晴天」及び「晴気」の単語(言語)としての尤もらしさを評価する。この言語知識データベースは、種々の文字の組み合わせから構成される文字列(単語または語句)について、単語または語句(言語)としての尤もらしさを示す情報(例えば尤度)を保持している。例えば、「晴天」及び「晴気」の両単語の場合、「晴天」により高い尤度が付されている。そこで修正文字列抽出部20は、単語としての尤もらしさが最も高い「晴天」を選択して、その「晴天」に含まれている、被修正文字「夫」の置き換えに用いられた文字「天」を、修正文字として抽出する。
修正部21は、入力テキスト中の被修正文字列(被修正文字)を、修正文字列抽出部20によって抽出された修正文字列(修正文字)に置き換える(ステップS10)。また、修正部21は、修正候補表示領域43に表示された修正候補文字群の中から任意の候補文字が選択された場合には(ステップS6)、当該選択された候補文字を修正文字として、入力テキスト中の被修正文字を、当該修正文字に置き換える(ステップS10)。
本実施形態において修正文字列抽出部20は、修正用文字列の文字数が被修正文字列の文字数と同数である場合、修正用文字列からの修正文字列の抽出が不要であると判定する(ステップS8)。この場合、修正部21は、修正用文字列を修正文字列として、入力テキスト中の被修正文字列を、当該修正文字列(修正用文字列)に置き換える(ステップS10)。
以上の文字列修正処理は、操作者によって被修正文字列が選択される限り、繰り返される。そして、入力テキスト中に修正すべき文字列が存在しなくなり、操作者によってテキスト修正の終了が指定されると(ステップS3)、文字列修正処理は終了する。
[第2の実施形態]
次に、本発明の第2の実施形態について説明する。第2の実施形態の特徴は、操作者による文字列選択操作に基づく被修正文字列の指定を不要とすると共に、この被修正文字列が指定されない状態で被修正文字列を決定(推定)してテキスト修正を行うためのモード(第1のテキスト修正モード)と、第1の実施形態と同様に被修正文字列の指定を前提としてテキスト修正を行うためのモード(第2のテキスト修正モード)との切り替え設定を可能とした点にある。
図5は本発明の第2の実施形態に係るテキスト処理装置の構成を示すブロック図である。図5において、図1と同様の要素には同一符号を付してある。図5のテキスト処理装置が、図1のそれと異なる点は、モード設定部22及び被修正文字列検索部23が追加されている点と、修正文字列抽出部20に代えて修正文字列抽出部200が用いられている点である。修正文字列抽出部200は、第2のテキスト修正モードで動作する点で当該修正文字列抽出部20と相違する。修正文字列抽出部200は第2のテキスト修正モードにおいて、修正文字列抽出部20と同様の修正文字列抽出を行う。
モード設定部22は、入力操作部15を用いた操作者の入力操作に基づき、第1のテキスト修正モード及び第2のテキスト修正モードの一方のモードを選択的に設定する。更に具体的に述べるならば、モード設定部22は、被修正文字列指定部16によって被修正文字列が指定されていない状態で、修正用文字列入力部17によって修正用文字列が入力される特定状態の場合に第1のテキスト修正モードを設定し、被修正文字列指定部16によって被修正文字列が指定された場合に第2のテキスト修正モードを設定する。
被修正文字列検索部23は、第1のテキスト修正モードにおいて動作して、修正用文字列入力部17によって入力された(取り込まれた)修正用文字列を入力テキストと比較することにより、当該入力テキストから修正用文字列に類似した文字列を検索する。被修正文字列検索部23は、検索された類似文字列を被修正文字列として決定(推定)する。
図5に示されるテキスト入力部11、テキスト表示部14、被修正文字列指定部16、修正用文字列入力部17、仮名漢字変換部18、修正部21、モード設定部22、被修正文字列検索部23及び修正文字列抽出部200は、図2に示される情報処理装置(コンピュータ)内のCPU34がプログラム330をメモリ35に読み込んで実行することにより実現されるものとする。
次に、図5のテキスト処理装置における文字列修正処理について、図6A及び図6Bに示すフローチャート並びに図7及び図8に示す画面例を参照して説明する。まず上記第1の実施形態と同様に、テキスト入力部11によって、テキスト「本日は晴夫なり。明日は晴れるてしようか。」が入力されたものとする(ステップS11)。このテキスト「本日は晴夫なり。明日は晴れるてしようか。」は、紙の文書「本日は晴天なり。明日は晴れるでしょうか。」をスキャナでスキャンして得られた画像(入力画像)を文字認識装置にて文字認識処理した認識結果である。テキスト入力部11によって入力されたテキストはテキスト記憶部12に格納される。
テキスト表示部14は、テキスト記憶部12に格納されたテキスト(入力テキスト)及び当該テキストに付随する入力画像を、それぞれ図7(a)において符号71及び72で示されるように、ディスプレイ13に表示させる(ステップS12)。
ここで、図7(a)に示されるテキスト中の文字「夫」、つまり誤認識候補(誤認識文字)「夫」を、上記第1の実施形態と同様に、操作者が入力操作部15を用いた操作で被修正文字列として選択したものとする。操作者によって被修正文字列が選択されたことは、被修正文字列指定部16によって検出される(ステップS13,S14)。
すると被修正文字列指定部16は、修正文字列抽出部20に対し、操作者によって選択された文字列を被修正文字列として指定する(ステップS15)。このステップS15において被修正文字列指定部16は、操作者によって被修正文字列が選択されたこと(操作者によって選択された文字列が被修正文字列として指定されたこと)をモード設定部22に通知する。この通知を受けてモード設定部22は、テキスト処理装置を第2のテキスト修正モードに設定する(ステップS16)、即ちモード設定部22は、操作者による被修正文字列の選択操作(被修正文字列指定部16による被修正文字列の指定)に応じて、テキスト修正モードを第2のテキスト修正モードに設定する。
以降のテキスト処理装置における第2のテキスト修正モードでの処理(ステップS17〜S21)は、前記第1の実施形態におけるステップS6〜S10の処理と同様である。
これに対し、操作者が被修正文字列を選択することなく、図7(a)に示される修正入力フィールド44に修正用文字列を入力する操作を開始したものとする。操作者によって修正用文字列を入力する操作が行われたことは、修正用文字列入力部17によって検出される(ステップS22)。
修正用文字列入力部17は、操作者によって修正用文字列を入力する操作が行われたこと(つまり修正用文字列の入力)をモード設定部22に通知する。このときモード設定部22は、被修正文字列の選択(指定)が被修正文字列指定部16によって通知されていない状態(つまり被修正文字列が指定されていない状態)にある。この場合、モード設定部22は、被修正文字列が指定されていない状態で、修正用文字列入力部17から修正用文字列の入力が通知される(つまり修正用文字列が入力される)特定状態を検出する。つまりモード設定部22は、修正用文字列入力部17からの修正用文字列の入力の通知を受けて、被修正文字列が指定されていない状態で修正用文字列が入力される特定状態を検出する。モード設定部22は、この特定状態の検出に応じてテキスト処理装置を第1のテキスト修正モードに設定する(ステップS23)。
修正用文字列入力部17は、第1のテキスト修正モードでは、修正入力フィールド44に入力された修正用文字列を例えば1文字ずつ取り込み、1文字取り込む毎に、当該取り込んだ1文字を被修正文字列検索部23に渡す(ステップS24)。
被修正文字列検索部23は、第1のテキスト修正モードにおいて、修正用文字列入力部17から渡される修正用文字列を、入力テキストと当該テキストの先頭から順次比較することにより、当該テキストから当該修正用文字列に類似した文字列を検索する(ステップS25)。このステップS25において被修正文字列検索部23は、検索された類似文字列を被修正文字列として決定(推定)する。
本実施形態において、ステップS25で実行される検索には、文字列修正のための検索であることを考慮して、必ずしも完全一致しない類似文字列の検索も可能なあいまい性を許容した検索(あいまい検索)手法が適用される。あいまい検索は、DPマッチングのような手法を用いて修正用文字列と入力テキストとのマッチングを行うことで実現可能である。本実施形態では、被修正文字列検索部23によるステップS25の検索に、修正用文字列入力部17によって1文字が取り込まれる毎に候補を絞り込むインクリメンタル検索(インクリメンタルあいまい検索)が用いられる。
今、操作者の入力操作により、例えば図7(b)に示すように、修正入力フィールド44に修正用文字列の先頭文字となる「晴」が入力されたものとする。この場合、被修正文字列検索部23は、文字「晴」を入力テキストと比較することにより、当該テキストから被修正文字の候補となる類似文字を検索する。ここでは、被修正文字列検索部23は、入力テキストにおける「晴夫」の「晴」と、「晴れる」の「晴」とを検索して、両文字「晴」を被修正文字の候補として決定(推定)する。するとテキスト表示部14は、被修正文字列検索部23によって入力テキストから検索された文字が被修正文字の候補として自動決定されていることを明示するために、図7(b)に示すように、当該検索された2つの文字「晴」を他の文字と区別してディスプレイ13に表示させる(図では網掛け表示)。
次に操作者の入力操作により、「晴」に続いて「天」が修正入力フィールド44に入力されたものとする。つまり、修正入力フィールド44に「晴天」が入力されたものとする。すると被修正文字列検索部23は、その時点における修正用文字列「晴天」を、入力テキストにおける現在の被修正文字の候補「晴」を含み且つ「晴天」と文字数が同数の文字列「晴夫」及び「晴れ」と比較して、当該文字列「晴夫」及び「晴れ」の「晴天」に対する類似度(一致度)を取得する。本実施形態では説明を簡略化するために、例えば一致する文字数の割合が類似度として取得され、一定割合(ここでは半数)以上の文字が一致している場合に被修正文字列の候補として決定されるものとする。この例では、文字列「晴夫」及び「晴れ」の「晴天」に対する類似度は0.5であり、両文字列とも被修正文字列の候補となる。
そこで操作者が、被修正文字列の候補を絞るために、入力操作部15を用いて、「晴夫」に続いて「な」を修正入力フィールド44に入力するための操作を行ったものとする。これにより修正入力フィールド44には、図7(c)に示されるように「晴天な」が入力される。すると被修正文字列検索部23は、その時点における修正用文字列「晴天な」を、入力テキストにおける現在の被修正文字列の候補(「晴夫」または「晴れ」)を含み且つ「晴天な」と文字数が同数の文字列「晴夫な」及び「晴れる」と比較して、当該文字列「晴夫な」及び「晴れる」の「晴天な」に対する類似度を取得する。この例では、文字列「晴夫な」及び「晴れる」の「晴天な」に対する類似度は、それぞれ2/3(≒0.67)及び1/3(≒0.33)である。この場合、被修正文字列検索部23は、類似度が0.5以上である文字列「晴夫な」のみを被修正文字列の候補として決定する。つまり、被修正文字列の候補が1つに絞られる。
このように被修正文字列検索部23は、修正入力フィールド44に入力された修正用文字列「晴天な」を入力テキストと比較することにより、当該修正用文字列「晴天な」との類似度が一定レベル以上の文字列「晴夫な」を当該入力テキストから検索して、当該検索された文字列「晴夫な」を被修正文字列の候補として決定する。するとテキスト表示部14は、図7(c)に示すように、被修正文字列検索部23によって検索された入力テキスト中の文字列「晴夫な」が被修正文字列の候補として決定されていることを明示するために、当該文字列「晴夫な」を他の文字列と区別してディスプレイ13に表示させる(図では網掛け表示)。
操作者は、画面上で示されている被修正文字列候補が、修正されるべき目的の文字列に絞られたならば、修正入力フィールド44への修正用文字列の入力操作を停止する。換言するならば、操作者は、被修正文字列候補が目的の文字列に絞られるまで修正用文字列を入力する操作を行う。操作者は、被修正文字列候補が目的の文字列に絞られたならば、入力操作部15を用いて、当該文字列を被修正文字列として確定させるための操作を行う。
修正部21は、操作者の操作によって修正文字列の確定が指示されたことを検出すると(ステップS26)、修正入力フィールド44に入力されている修正用文字列を修正文字列として、その時点において確定されている、入力テキスト中の被修正文字列を、当該修正文字列に置き換える(ステップS27)。図7(c)の例では、「晴夫な」が「晴天な」に置き換えられる。
同様に、操作者が修正入力フィールド44に、図8に示されるように修正用文字列「晴れるでしょうか」を入力すると、被修正文字列検索部23によって入力テキストから、類似度が6/8(=0.75)の類似文字列「晴れるてしようか」が被修正文字列の候補として抽出される。
このように本実施形態のテキスト処理装置は、操作者が、画面表示されている入力テキスト中の修正されるべき箇所(被修正文字列)を指定することなく修正用文字列を入力しても、入力テキストから当該修正用文字列に一定レベル以上類似した文字列を検索することにより操作者が意図した被修正文字列を自動的に決定(推定)して、当該決定された被修正文字列を(修正文字列としての)修正用文字列に置き換える(修正する)ことができる。
なお、被修正文字列検索部23によるインクリメンタルあいまい検索は一例であり、修正入力フィールド44への修正用文字列の入力が完了してから被修正文字列検索部23による検索が開始されても構わない。また、操作者が、修正されるべき箇所(入力テキストが文字認識結果の例では誤認識箇所)をより発見しやすいように、あいまい検索の検索結果から修正用文字列と完全一致する文字列の抽出を除外するモードを設定する機能を図5のテキスト処理装置に備えても良い。また、被修正文字列の候補となる類似文字列が一定数以上存在する場合に、例えば入力テキストから最初に検索された類似文字列のみを被修正文字列の候補とするなど、候補を限定しても良い。
なお、本発明は、上記第1及び第2の実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記第1及び第2の実施形態に開示されている複数の構成要素の適宜な組み合わせにより種々の発明を形成できる。例えば、第1または第2の実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。
本発明の第1の実施形態に係るテキスト処理装置の構成を示すブロック図。 図1に示すテキスト処理装置を実現するのに用いられる情報処理装置のハードウェア構成を示すブロック図。 図1のテキスト処理装置における文字列修正処理の手順を示すフローチャート。 図1のテキスト処理装置における文字列修正処理を説明するための画面例を示す図。 本発明の第2の実施形態に係るテキスト処理装置の構成を示すブロック図。 図5のテキスト処理装置における文字列修正処理の手順を示すフローチャートの一部を示す図。 図5のテキスト処理装置における文字列修正処理の手順を示すフローチャートの残りを示す図。 図5のテキスト処理装置における文字列修正処理を説明するための画面例を示す図。 図5のテキスト処理装置における文字列修正処理を説明するための他の画面例を示す図。
符号の説明
11…テキスト入力部、12…テキスト記憶部、13…ディスプレイ、14…テキスト表示部、15…入力操作部、16…被修正文字列指定部、17…修正用文字列入力部、19…辞書記憶部、20,200…修正文字列抽出部、21…修正部、22…モード設定部、23…被修正文字列検索部、191…言語知識データベース記憶部、192…文字パターン辞書記憶部、193…音声パターン辞書記憶部、330…プログラム。

Claims (8)

  1. テキストを入力するためのテキスト入力手段と、
    前記テキスト入力手段によって入力されたテキストを入力テキストとして格納するためのテキスト記憶手段と、
    前記テキスト記憶手段に格納された入力テキストの表示に用いられるディスプレイと、
    操作者の入力操作に用いられる入力操作手段と、
    前記入力操作手段を用いた操作者の入力操作に基づき前記入力テキスト中の修正されるべき文字列を被修正文字列として指定するための被修正文字列指定手段と、
    前記入力操作手段を用いた操作者の入力操作に基づき文字列の修正に用いられる修正文字列を含む修正用文字列を入力するための修正用文字列入力手段と、
    前記被修正文字列指定手段によって指定された被修正文字列と前記修正用文字列入力手段によって入力された修正用文字列とを比較することにより、当該修正用文字列の中から前記指定された被修正文字列の修正に用いられる修正文字列として最も尤もらしい文字列を抽出する修正文字列抽出手段と、
    前記入力テキスト中の前記指定された被修正文字列を前記抽出された文字列に置き換えることで当該被修正文字列を修正する修正手段と
    を具備することを特徴とするテキスト処理装置。
  2. 前記入力操作手段を用いた操作者の入力操作に基づき、前記被修正文字列の指定を不要とする第1のテキスト修正モード及び前記被修正文字列の指定を前提とする第2のテキスト修正モードの一方のモードを選択的に設定するモード設定手段と、
    前記第1のテキスト修正モードにおいて動作して、前記修正用文字列入力手段によって入力された修正用文字列を前記入力テキストと比較することにより、当該修正用文字列を修正文字列として用いる場合に被修正文字列として最も尤もらしい文字列を前記入力テキストから検索する被修正文字列検索手段とを更に具備し、
    前記修正手段は、前記第1のテキスト修正モードにおいて、前記修正用文字列入力手段によって入力された修正用文字列を前記修正文字列として、前記入力テキスト中の前記検索された文字列を当該修正文字列に置き換えることで前記入力テキスト中の前記検索された文字列を修正し、
    前記修正文字列抽出手段は、前記第2のテキスト修正モードにおいて動作する
    ことを特徴とする請求項1記載のテキスト処理装置。
  3. 前記モード設定手段は、前記被修正文字列指定手段によって被修正文字列が指定されていない状態で、前記修正用文字列入力手段によって修正用文字列が入力される特定状態の場合に前記第1のテキスト修正モードを設定し、前記被修正文字列指定手段によって被修正文字列が指定された場合に前記第2のテキスト修正モードを設定する
    ことを特徴とする請求項2記載のテキスト処理装置。
  4. 前記被修正文字列検索手段は、前記修正用文字列を構成する文字に一致する文字が含まれている割合が一定レベル以上の文字列を検索することを特徴とする請求項2記載のテキスト処理装置。
  5. 前記修正文字列抽出手段は、前記指定された被修正文字列を構成する文字のパターンと最も類似したパターンの文字から構成される文字列を前記入力された修正用文字列から抽出することを特徴とする請求項1記載のテキスト処理装置。
  6. 前記修正文字列抽出手段は、前記入力テキストから前記指定された被修正文字列を含む文字列を取り出し、当該取り出された文字列中の前記被修正文字列を、前記修正用文字列から選択可能な当該被修正文字列と同一文字数の全ての文字列で順次置き換えて、その置き換え後が行われた全ての文字列の中から、言語として最も尤もらしい文字列を選択して、当該選択された文字列に含まれている、前記被修正文字列の置き換えに用いられた文字列を抽出することを特徴とする請求項1記載のテキスト処理装置。
  7. テキストを入力するためのテキスト入力手段と、
    前記テキスト入力手段によって入力されたテキストを入力テキストとして格納するためのテキスト記憶手段と、
    前記テキスト記憶手段に格納された入力テキストの表示に用いられるディスプレイと、
    操作者の入力操作に用いられる入力操作手段と、
    前記入力操作手段を用いた操作者の入力操作に基づき文字列の修正に用いられる修正文字列を含む修正用文字列を入力するための修正用文字列入力手段と、
    前記修正用文字列入力手段によって入力された修正用文字列を前記入力テキストと比較することにより、当該修正用文字列を前記修正文字列として用いる場合に被修正文字列として最も尤もらしい文字列を前記入力テキストから検索被修正文字列検索手段と、
    前記修正用文字列入力手段によって入力された修正用文字列を前記修正文字列として、前記入力テキスト中の前記検索された文字列を当該修正文字列に置き換えることで前記入力テキスト中の前記検索された文字列を修正する修正手段と
    を具備することを特徴とするテキスト処理装置。
  8. テキストを入力するためのテキスト入力手段と、前記テキスト入力手段によって入力されたテキストを入力テキストとして格納するためのテキスト記憶手段と、ディスプレイと、入力操作手段とを有するコンピュータに、
    前記テキスト入力手段によって入力されて前記テキスト記憶手段に格納された入力テキストを前記ディスプレイに表示するステップと、
    前記入力テキストが前記ディスプレイに表示されている状態で、前記入力テキスト中の修正されるべき文字列が前記入力操作手段を用いた操作者の入力操作によって選択された場合に、当該選択された文字列を被修正文字列として決定するステップと、
    前記入力操作手段を用いた操作者の入力操作によって入力される、文字列の修正に用いられる修正文字列を含む修正用文字列を取り込むステップと、
    前記決定された被修正文字列と前記取り込まれた修正用文字列とを比較することにより、当該修正用文字列の中から前記指定された被修正文字列の修正に用いられる修正文字列として最も尤もらしい文字列を抽出するステップと、
    前記入力テキスト中の前記決定された被修正文字列を前記抽出された文字列に置き換えることで当該被修正文字列を修正するステップと
    を実行させるためのプログラム。
JP2007135598A 2007-05-22 2007-05-22 テキスト処理装置及びプログラム Active JP4660504B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007135598A JP4660504B2 (ja) 2007-05-22 2007-05-22 テキスト処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007135598A JP4660504B2 (ja) 2007-05-22 2007-05-22 テキスト処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2008293109A true JP2008293109A (ja) 2008-12-04
JP4660504B2 JP4660504B2 (ja) 2011-03-30

Family

ID=40167792

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007135598A Active JP4660504B2 (ja) 2007-05-22 2007-05-22 テキスト処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4660504B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012043385A (ja) * 2010-08-23 2012-03-01 Toshiba Corp 文字認識装置および文字認識方法
JP2012053779A (ja) * 2010-09-02 2012-03-15 Toshiba Corp 文書処理装置およびプログラム
JP2013225115A (ja) * 2012-03-21 2013-10-31 Denso It Laboratory Inc 音声認識装置、音声認識プログラム、及び、音声認識方法
JP2014081867A (ja) * 2012-10-18 2014-05-08 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2019095644A (ja) * 2017-11-24 2019-06-20 ソリザバ カンパニー リミテッドSorizava Co., Ltd. 音声認識装置およびシステム
CN111462740A (zh) * 2019-01-18 2020-07-28 奥多比公司 非语音字母语言的话音辅助应用原型测试的话音命令匹配

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0373086A (ja) * 1989-04-14 1991-03-28 Nippon Telegr & Teleph Corp <Ntt> 文字認識後処理方式
JPH03160580A (ja) * 1989-11-20 1991-07-10 Fujitsu Ltd 文字認識システムにおける文字修正方法
JPH06348889A (ja) * 1993-06-03 1994-12-22 Toshiba Corp 文字認識装置
JPH11102361A (ja) * 1997-09-29 1999-04-13 Nec Ic Microcomput Syst Ltd 文字入力修正方法及び前記方法手順を記録した記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0373086A (ja) * 1989-04-14 1991-03-28 Nippon Telegr & Teleph Corp <Ntt> 文字認識後処理方式
JPH03160580A (ja) * 1989-11-20 1991-07-10 Fujitsu Ltd 文字認識システムにおける文字修正方法
JPH06348889A (ja) * 1993-06-03 1994-12-22 Toshiba Corp 文字認識装置
JPH11102361A (ja) * 1997-09-29 1999-04-13 Nec Ic Microcomput Syst Ltd 文字入力修正方法及び前記方法手順を記録した記録媒体

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012043385A (ja) * 2010-08-23 2012-03-01 Toshiba Corp 文字認識装置および文字認識方法
JP2012053779A (ja) * 2010-09-02 2012-03-15 Toshiba Corp 文書処理装置およびプログラム
JP2013225115A (ja) * 2012-03-21 2013-10-31 Denso It Laboratory Inc 音声認識装置、音声認識プログラム、及び、音声認識方法
JP2014081867A (ja) * 2012-10-18 2014-05-08 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2019095644A (ja) * 2017-11-24 2019-06-20 ソリザバ カンパニー リミテッドSorizava Co., Ltd. 音声認識装置およびシステム
CN111462740A (zh) * 2019-01-18 2020-07-28 奥多比公司 非语音字母语言的话音辅助应用原型测试的话音命令匹配
JP2020118955A (ja) * 2019-01-18 2020-08-06 アドビ インコーポレイテッド 非表音文字体系を使用する言語のための音声支援型アプリケーションプロトタイプの試験中の音声コマンドマッチング
JP7111682B2 (ja) 2019-01-18 2022-08-02 アドビ インコーポレイテッド 非表音文字体系を使用する言語のための音声支援型アプリケーションプロトタイプの試験中の音声コマンドマッチング

Also Published As

Publication number Publication date
JP4660504B2 (ja) 2011-03-30

Similar Documents

Publication Publication Date Title
US9236045B2 (en) Methods and apparatus for proofing of a text input
KR101300839B1 (ko) 음성 검색어 확장 방법 및 시스템
US8346537B2 (en) Input apparatus, input method and input program
US7706615B2 (en) Information processing method and information processing device
US20050102139A1 (en) Information processing method and apparatus
JP4660504B2 (ja) テキスト処理装置及びプログラム
JP2011018330A (ja) 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法
JP2008216756A (ja) 語句として新たに認識するべき文字列等を取得する技術
JP2011002656A (ja) 音声認識結果修正候補検出装置、音声書き起こし支援装置、方法及びプログラム
JP2008077454A (ja) タイトル抽出装置、画像読取装置、タイトル抽出方法、及びタイトル抽出プログラム
JP2007334429A (ja) キーワード生成方法、文書検索方法、話題範囲推定方法、話題境界推定方法、及びこれらの装置とそのプログラム、その記録媒体
JP5097802B2 (ja) ローマ字変換を用いる日本語自動推薦システムおよび方法
JP2008059389A (ja) 語彙候補出力システム、語彙候補出力方法及び語彙候補出力プログラム
KR100831991B1 (ko) 정보처리방법 및 정보처리장치
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JP2004309928A (ja) 音声認識装置、電子辞書装置、音声認識方法、検索方法、及びプログラム
JP2001109740A (ja) 中国語文書作成装置及び中国語文書作成方法
JP4304146B2 (ja) 辞書登録装置、辞書登録方法および辞書登録プログラム
KR101727953B1 (ko) 문자를 번역하는 방법 및 그 장치
JPH0630052B2 (ja) 音声認識表示装置
JP2007171275A (ja) 言語処理装置及び現後処理方法
JPH07271921A (ja) 文字認識装置および文字認識方法
JPH10143503A (ja) 音声ワードプロセッサ
JP2890241B2 (ja) 光学的文字認識装置
CN115270769A (zh) 文本纠错方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101130

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101228

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4660504

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350