JP2020197592A - テキスト補正装置およびテキスト補正方法 - Google Patents
テキスト補正装置およびテキスト補正方法 Download PDFInfo
- Publication number
- JP2020197592A JP2020197592A JP2019102520A JP2019102520A JP2020197592A JP 2020197592 A JP2020197592 A JP 2020197592A JP 2019102520 A JP2019102520 A JP 2019102520A JP 2019102520 A JP2019102520 A JP 2019102520A JP 2020197592 A JP2020197592 A JP 2020197592A
- Authority
- JP
- Japan
- Prior art keywords
- correction
- text
- character string
- rule
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【課題】ユーザが入力テキストを補正する補正ルールを容易に管理することができるテキスト補正装置およびテキスト補正方法を提供する。【解決手段】入力テキストを補正するテキスト補正装置2は、取得部と、記憶部21と、制御部20と、表示部23と、操作部22とを備える。取得部は、入力テキストを取得する。制御部は、取得された入力テキストに基づき、補正ルールに従う出力テキストを取得する。表示部は、各テキストを表示する。操作部は、出力テキストを修正するユーザ操作を入力する。制御部は、補正処理によって出力テキストにおいて入力テキストから変更された文字列を他の文字列に修正するユーザ操作が入力されたとき、変更前の文字列を変更された文字列に変更した補正ルールを示す情報を表示するように表示部を制御し、補正ルールを修正するユーザ操作を受け付けるように操作部を制御する。【選択図】図2
Description
本開示は、テキスト補正装置およびテキスト補正方法に関する。
特許文献1は、音声認識精度を向上させるとともに翻訳精度の低下を防止することを目的とした音声翻訳装置を開示している。音声翻訳装置は、第1言語の音声認識に用いるデフォルトの音声認識辞書とともに、カスタマイズ用の音声認識辞書であるカスタマイズ辞書を用いて、発話音声を認識して認識文字列を出力する。音声翻訳装置は、出力された認識文字列において誤認識文字列の選択を受け付け、誤認識文字列に発音が類似する単語又は単語列を訂正候補として、訂正候補の中から誤認識文字列の訂正に用いる訂正単語の選択を受け付け、訂正単語をカスタマイズ辞書に登録する。誤認識文字列は、訂正単語で訂正されて第2言語に翻訳される。
本開示は、ユーザが入力テキストを補正する補正ルールを容易に管理することができるテキスト補正装置およびテキスト補正方法を提供する。
本開示に係るテキスト補正装置は、文字列で構成される入力テキストを補正する装置である。テキスト補正装置は、取得部と、記憶部と、制御部と、表示部と、操作部とを備える。取得部は、入力テキストを取得する。記憶部は、補正対象とする文字列を補正先の文字列に変更する補正ルールに関する情報を記憶する。制御部は、取得された入力テキストに基づき、補正ルールに従う補正処理の処理結果を示す出力テキストを取得する。表示部は、入力テキスト及び出力テキストを表示する。操作部は、出力テキストを修正するユーザ操作を入力する。制御部は、補正処理によって出力テキストにおいて入力テキストから変更された文字列を他の文字列に修正するユーザ操作である誤補正の修正操作が入力されたとき、変更前の文字列を変更された文字列に変更した補正ルールを示す情報を表示するように表示部を制御し、表示された情報が示す補正ルールを修正するユーザ操作を受け付けるように操作部を制御する。
本開示に係るテキスト補正方法は、取得部が、文字列で構成される入力テキストを取得するステップを含む。本方法は、補正部が、取得された入力テキストに基づいて、補正対象とする文字列を補正先の文字列に変更する補正ルールに従う補正処理を実行して、補正処理の処理結果を示す出力テキストを生成するステップを含む。本方法は、表示部が、入力テキスト及び出力テキストを表示するステップと、操作部が、出力テキストを修正するユーザ操作を入力するステップとを含む。さらに、本方法は、補正処理によって出力テキストにおいて入力テキストから変更された文字列を他の文字列に修正するユーザ操作が入力されたとき、表示部が、変更前の文字列を変更された文字列に変更する補正ルールを示す情報を表示するステップと、操作部が、表示された情報が示す補正ルールを修正するユーザ操作を受け付けるステップとを含む。
これらの概括的かつ特定の態様は、システム、方法、及びコンピュータプログラム、並びに、それらの組み合わせにより、実現されてもよい。
本開示に係るテキスト補正装置およびテキスト補正方法によると、ユーザが入力テキストを補正する補正ルールを容易に管理することができる。
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、出願人は、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって特許請求の範囲に記載の主題を限定することを意図するものではない。
(実施形態1)
以下、図面を用いて、本開示の実施形態1を説明する。実施形態1では、本開示に係るテキスト補正装置の一例として、音声認識結果のテキストに対する補正を行う音声認識補正装置について説明する。
以下、図面を用いて、本開示の実施形態1を説明する。実施形態1では、本開示に係るテキスト補正装置の一例として、音声認識結果のテキストに対する補正を行う音声認識補正装置について説明する。
1.構成
1−1.システム概要
実施形態1に係る音声認識補正装置を含んだシステムについて、図1を用いて説明する。図1は、本実施形態に係る翻訳システム1の概要を示す図である。
1−1.システム概要
実施形態1に係る音声認識補正装置を含んだシステムについて、図1を用いて説明する。図1は、本実施形態に係る翻訳システム1の概要を示す図である。
本実施形態に係る翻訳システム1は、ユーザ5が利用する音声認識補正装置2と、音声認識サーバ3と、翻訳サーバ11とを備える。ユーザ5は、例えば言語圏の異なるゲストを接客する際などに本システム1を用いる。本システム1は、ユーザ5の発話を音声認識し、認識結果のテキスト情報に対して、ユーザ5が話す言語からゲストが理解可能な言語への機械翻訳を行う。機械翻訳結果の出力は、テキスト表示あるいは音声合成など種々の形態を採用できる。
本実施形態の音声認識補正装置2は、ユーザ5が発話した内容が正しく音声認識されているかを確認したり、誤認識がある場合には修正したりする用途に用いられる。又、本実施形態では、ユーザ5が修正した内容が次回以降の発話時に、自動的に補正するためのルールすなわち補正ルールが用いられる。本システム1は、ユーザ5が容易に補正ルールを管理することができる音声認識補正装置2を提供する。
本システム1において、音声認識補正装置2は、インターネット等の通信ネットワーク10を介して音声認識サーバ3及び翻訳サーバ11とデータ通信を行う。本システム1は、音声認識補正装置2を複数、含んでもよい。この場合、適宜、各音声認識補正装置2が送信するデータに自装置の識別情報を含めて、音声認識サーバ3及び翻訳サーバ11は受信した識別情報が示す音声認識補正装置2にデータを送信できる。
本システム1の音声認識サーバ3及び翻訳サーバ11は、例えばAPSサーバである。音声認識サーバ3は、本実施形態において音声認識処理を実行する音声認識部の一例である。翻訳サーバ11は、音声認識結果などを機械翻訳する機械翻訳機の一例である。本システム1は上記各サーバ3,11に限らず、例えば更に、機械翻訳の結果を音声合成する音声合成サーバを備えてもよい。以下、本システム1の構成の詳細を説明する。
1−2.音声認識補正装置の構成
本実施形態の翻訳システム1における音声認識補正装置2の構成について、図2〜図3を参照して説明する。図2は、音声認識補正装置2の構成を例示するブロック図である。
本実施形態の翻訳システム1における音声認識補正装置2の構成について、図2〜図3を参照して説明する。図2は、音声認識補正装置2の構成を例示するブロック図である。
音声認識補正装置2は、例えばタブレット端末、スマートフォン又はPCなどの情報端末で構成される。音声認識補正装置2は、例えば図2に示すように、制御部20と、記憶部21と、操作部22と、表示部23と、機器インタフェース24と、ネットワークインタフェース25と、マイク26と、スピーカ27とを備える。以下、インタフェースを「I/F」と略記する。
なお、本実施形態のテキスト補正装置としては、特に音声認識補正装置2の構成を全て含む必要はなく、例えばマイク26及びスピーカ27を備えなくてよい。また、音声認識補正装置2は、音声入出力I/Fの端末としない場合、特にスピーカ27を備えなくてよい。
制御部20は、例えばソフトウェアと協働して所定の機能を実現するCPU又はMPUを含み、音声認識補正装置2の全体動作を制御する。制御部20は、記憶部21に格納されたデータ及びプログラムを読み出して種々の演算処理を行い、各種の機能を実現する。例えば、本実施形態の制御部20は、機能的構成として、補正ルールの登録および更新を行う補正ルール登録部201と、補正ルールに従って補正処理を実行する自動補正部202とを備える。上記のプログラムは、音声認識補正装置2の各種機能を実現するための命令群を含む。上記のプログラムは、通信ネットワーク10等から提供されてもよいし、可搬性を有する記録媒体に格納されていてもよい。
なお、制御部20は、所定の機能を実現するように設計された専用の電子回路又は再構成可能な電子回路などのハードウェア回路であってもよい。制御部20は、CPU、MPU、GPU、GPGPU、TPU、マイコン、DSP、FPGA及びASIC等の種々の半導体集積回路で構成されてもよい。
記憶部21は、音声認識補正装置2の機能を実現するために必要なプログラム及びデータを記憶する記憶媒体である。記憶部21は、図2に示すように、格納部21a及び一時記憶部21bを含む。
格納部21aは、所定の機能を実現するためのパラメータ、データ及び制御プログラム等を格納する。格納部21aは、例えばHDD又はSSDで構成される。例えば、格納部21aは、上記のプログラム、及び補正ルールデータベース40などを格納する。以下、データベースを「DB」と略記する場合がある。補正ルールDB40は、補正ルールと、過去に補正対象となったテキスト情報等とを関連付けて管理するデータベースである。
図3は、音声認識補正装置2における補正ルールDB40のデータ構造を説明するための図である。例えば、補正ルールDB40は、補正ルールの登録データ40aを複数、含んで構成される。補正ルールの登録データ40aは、補正ルール毎に登録されるデータである。登録データ40aは、例えば補正ルールにおける補正対象の文字列と、補正先の文字列と、補正元テキストと、例外フラグと、計数値とを関連付けて、補正レコードD1として記録する。
図3では、「ここ」という補正対象の文字列を「五個」という補正先の文字列に変更する補正ルールについての登録データ40aを例示している。補正元テキストは、当該補正ルールに関する過去の入力テキストを示す。例外フラグは、各々入力テキストが、当該補正ルールの適用の例外に指定されたか否かを「ON/OFF」で管理する。計数値は、補正レコードD1毎に各補正元テキストが入力テキスト文と一致し、自動補正が実行された処理回数を示す。このような登録データ40aには、入力テキスト中で補正対象となった文字列の箇所を示す情報が含まれてもよい。又、補正ルールDB40は、図3の例に限らず、例えば補正ルール毎の登録データ40aに分けずに蓄積されてもよい。
図2に戻り、一時記憶部21bは、例えばDRAM又はSRAM等のRAMで構成され、データを一時的に記憶(即ち保持)する。例えば、一時記憶部21bは、後述する登録データ40aの更新案データ40bなどを保持する。また、一時記憶部21bは、制御部20の作業エリアとして機能してもよく、制御部20の内部メモリにおける記憶領域で構成されてもよい。
操作部22は、ユーザが操作を行うユーザインタフェースである。操作部22は、表示部23と共にタッチパネルを構成してもよい。操作部22はタッチパネルに限らず、例えば、キーボード、タッチパッド、ボタン及びスイッチ等であってもよい。操作部22は、取得部と一体的に構成されてもよく、ユーザの操作によって入力される諸情報を取得する
表示部23は、例えば、液晶ディスプレイ又は有機ELディスプレイで構成される。表示部23は、操作部22を操作するための各種ボタン及びテキスト欄、並びに操作部22から入力された情報など、各種の情報を表示する。例えば、表示部23と操作部22の協働により、各種テキスト欄において表示されたテキスト中で一部の範囲の文字列を指定するような操作を入力可能である。
機器I/F24は、音声認識補正装置2に外部機器を接続するための回路である。機器I/F24は、所定の通信規格にしたがい通信を行う通信部の一例である。所定の規格には、USB、HDMI(登録商標)、IEEE1395、WiFi、Bluetooth(登録商標)等が含まれる。機器I/F24は、音声認識補正装置2において外部機器に対し、諸情報を受信する取得部あるいは送信する出力部を構成してもよい。
ネットワークI/F25は、無線または有線の通信回線を介して音声認識補正装置2を通信ネットワーク10に接続するための回路である。ネットワークI/F25は所定の通信規格に準拠した通信を行う通信部の一例である。所定の通信規格には、IEEE802.3,IEEE802.11a/11b/11g/11ac等の通信規格が含まれる。ネットワークI/F25は、音声認識補正装置2において通信ネットワーク10を介して、諸情報を受信する取得部あるいは送信する出力部を構成してもよい。
マイク26は、音声を収音し、音声データを生成する。音声認識補正装置2は、音声認識機能を有してもよく、例えばマイク26によって生成された音声データを音声認識して、テキストデータに変換してもよい。マイク26は、取得部の一例である。
スピーカ27は、音声データを音声出力する。音声認識補正装置2は、音声合成機能を有してもよく、例えば機械翻訳に基づくテキストデータを音声合成して、スピーカ27から音声出力してもよい。
以上のような音声認識補正装置2の構成は一例であり、音声認識補正装置2の構成はこれに限らない。音声認識補正装置2は、情報端末に限らない各種のコンピュータで構成されてもよい。また、音声認識補正装置2における取得部は、制御部20等における各種ソフトウェアとの協働によって実現されてもよい。音声認識補正装置2における取得部は、各種記憶媒体(例えば格納部21a)に格納された諸情報を制御部20の作業エリア(例えば一時記憶部21b)に読み出すことによって、諸情報の取得を行うものであってもよい。
1−3.サーバ構成
本実施形態の翻訳システム1における音声認識サーバ3の構成を、図4を参照して説明する。図4は、本実施形態における音声認識サーバ3の構成を例示するブロック図である。
本実施形態の翻訳システム1における音声認識サーバ3の構成を、図4を参照して説明する。図4は、本実施形態における音声認識サーバ3の構成を例示するブロック図である。
図4に例示する音声認識サーバ3は、演算処理部30と、記憶部31と、通信部32とを備える。音声認識サーバ3は、一つ又は複数のコンピュータで構成される。
演算処理部30は、例えばソフトウェアと協働して所定の機能を実現するCPU及びGPU等を含み、音声認識サーバ3の動作を制御する。演算処理部30は、記憶部31に格納されたデータ及びプログラムを読み出して種々の演算処理を行い、各種の機能を実現する。
演算処理部30は、例えば音声認識モデルに基づくプログラムの実行によって、音声認識処理を実行し、音声データの認識結果として文字列で構成されるテキストデータを生成する。音声認識モデルは、例えば隠れマルコフモデル等の音響モデル、及びn−gram等の言語モデル等を含んで構築される。上記のプログラムは、通信ネットワーク10等から提供されてもよいし、可搬性を有する記録媒体に格納されていてもよい。
なお、演算処理部30は、所定の機能を実現するように設計された専用の電子回路又は再構成可能な電子回路などのハードウェア回路であってもよい。演算処理部30は、CPU、GPU、TPU、MPU、マイコン、DSP、FPGA及びASIC等の種々の半導体集積回路で構成されてもよい。
記憶部31は、音声認識サーバ3の機能を実現するために必要なプログラム及びデータを記憶する記憶媒体であり、例えばHDD又はSSDを含む。また、記憶部31は、例えばDRAM又はSRAM等を含み、演算処理部30の作業エリアとして機能してもよい。記憶部31は、例えば翻訳モデル35のプログラム、及び機械学習に基づき翻訳モデル35を規定する種々のパラメータ群を記憶する。パラメータ群は、例えばニューラルネットワークの各種重みパラメータを含む。
通信部32は、所定の通信規格にしたがい通信を行うためのI/F回路であり、通信ネットワーク10又は外部機器等に音声認識サーバ3を通信接続する。所定の通信規格には、IEEE802.3,IEEE802.11a/11b/11g/11ac、USB、HDMI、IEEE1395、WiFi、Bluetooth等が含まれる。
以上のような音声認識サーバ3と同様の構成において、例えば音声認識モデルの代わりに各種の翻訳モデルといった機械翻訳のためのプログラム等をそれぞれ適宜、導入することにより、翻訳サーバ11が構成できる。翻訳システム1における音声認識サーバ3及び翻訳サーバ11は上記の構成に限定されず、種々の構成を有してもよい。本実施形態の翻訳方法は、クラウドコンピューティングにおいて実行されてもよい。また、音声認識サーバ3及び翻訳サーバ11の機能を実現するハードウェア資源が共用されてもよい。また、本システム1において、音声認識サーバ3及び翻訳サーバ11は適宜、省略されてもよい。
2.動作
以上のように構成される翻訳システム1及び音声認識補正装置2の動作について、以下説明する。
以上のように構成される翻訳システム1及び音声認識補正装置2の動作について、以下説明する。
2−1.システム動作
本実施形態に係る翻訳システム1の全体動作を、図1を用いて説明する。
本実施形態に係る翻訳システム1の全体動作を、図1を用いて説明する。
本システム1において、ユーザ5は、例えば音声認識補正装置2のマイク26に収音されるように、所望の発話を行う。音声認識補正装置2は、発話の音声データを、通信ネットワーク10を介して音声認識サーバ3に送信する。音声認識サーバ3は、音声認識補正装置2からの音声データを受信すると、受信した音声データが示す音声を認識する音声認識処理を実行する。音声認識サーバ3は、音声の認識結果を示すテキストデータを生成して、音声認識補正装置2に送信する。
音声認識補正装置2は、音声認識サーバ3からテキストデータを受信すると、受信したテキストデータを入力テキストT1として表示部23に表示する。又、本実施形態の音声認識補正装置2は、登録済みの補正ルールを自動的に適用して入力テキストT1を補正し、補正結果の出力テキストT2を表示部23に表示する。ユーザ5は、音声認識補正装置2において表示された各テキストT1,T2を確認し、修正等の各種ユーザ操作を入力できる。確認完了のユーザ操作が入力されると、出力テキストT2のデータが翻訳サーバ11に送信される。
翻訳サーバ11は、出力テキストT2のデータを受信すると、出力テキストT2の機械翻訳を実行して、例えば音声認識補正装置2に、翻訳結果のテキストデータを送信する。ユーザ5は、例えば音声認識補正装置2において、翻訳結果のテキストデータを表示部23に表示させたり、同データの音声合成結果をスピーカ27から音声出力させたりすることができる。
以上のように、本実施形態に係る翻訳システム1において、ユーザ5は、発話の音声認識を介して、発話した内容に対する機械翻訳を利用できる。この際、本実施形態の音声認識補正装置2によると、ユーザ5は、機械翻訳の翻訳対象となる音声認識結果を確認でき、必要に応じて修正する操作を行える。例えばユーザ5が慣用表現等を発話する際など、音声認識の誤認識は或る程度の規則性を有することが考えられる。
そこで、本実施形態の音声認識補正装置2は、ユーザ5による上記の修正時に、同様の補正を自動的に行うための補正ルールを登録可能にする。さらに、過去に登録した補正ルールによって誤補正が生じた場合には、当該補正ルールをユーザ5に可視化したり、修正可能にしたりすることにより、ユーザ5の意図に即した補正ルールのメンテナンスを実現することができる。以下、音声認識補正装置2の動作の詳細を説明する。
2−2.音声認識補正装置の動作
本実施形態に係る音声認識補正装置2の動作を、図5〜図8を用いて説明する。
本実施形態に係る音声認識補正装置2の動作を、図5〜図8を用いて説明する。
図5は、本実施形態に係る音声認識補正装置2における処理を例示するフローチャートである。図5に示すフローチャートの各処理は、例えば音声認識補正装置2の制御部20によって実行される。本フローチャートの処理は、例えばユーザ5が発話した際に開始される。
まず、音声認識補正装置2の制御部20は、ユーザ5の発話中にマイク26から収音された音声データを音声認識サーバ3に送信する。音声認識サーバ3は、受信した音声データに対して音声認識処理を実行し、音声認識結果を示す文字列で構成されるテキストデータを生成して、音声認識補正装置2に送信する。音声認識補正装置2のネットワークI/F25は、音声認識サーバ3からのテキストデータを入力テキストT1として受信する。以上の一連の処理により、音声認識補正装置2の制御部20は、音声認識サーバ3の認識結果を示す入力テキストT1を取得する(S1)。
制御部20は、取得した入力テキストT1を表示するように、表示部23を制御する(S2)。又、例えば特に補正ルールが未登録の場合、制御部20は、取得した入力テキストT1に適用可能な補正ルールがないと判断し(S3でNO)、ステップS4に進む。ステップS4の表示例を図6(A)に示す。
図6(A)では、ユーザ5が「5個の内1つ落としたということですか」と発話した際に、音声認識の誤認識が生じた場合を例示している。本例の表示部23は、ステップS1において取得される入力テキストT1として、「ここの内1つ落としたということですか」と認識結果欄61に表示している(S2)。認識結果欄61における入力テキストT1の表示により、ユーザ5は、音声認識の誤認識の有無などを確認することができる。図6(A)では、ユーザ5が操作した箇所を示すポインタ50を示している(以下同様)。
ステップS4において、制御部20は、例えばユーザ5が入力テキストT1中で誤認識された箇所「ここ」を修正するための操作が、操作部22に入力されたか否かを検知する(S4)。制御部20は、入力テキストT1を修正するユーザ操作を検知すると(S4でYES)、手動補正処理を実行する(S5)。手動補正処理は、ユーザ操作に従って入力テキストT1における誤認識箇所のような文字列を補正して、補正結果の出力テキストT2を生成する処理である。ステップS5の表示例を図6(B)に示す。
図6(B)は、図6(A)後の手動補正処理(S5)によって、「五個の内1つ落としたということですか」という出力テキストT2が得られた例を示す。表示部23は、例えば認識結果欄61とは別の補正結果欄62に、出力テキストT2を表示する。本例では、入力テキストT1中の誤認識箇所「ここ」が、出力テキストT2中では「五個」と正しく補正されていることが、各欄61,62の表示により確認できる。
図6(B)の表示例において、表示部23は、各欄61〜63と共に、ユーザ操作を入力可能な補正登録ボタン71および確認完了ボタン70を表示している。本実施形態の手動補正処理(S5)において、ユーザ5は、補正登録ボタン71の操作により、認識結果欄61に表示された入力テキストT1から、補正結果欄62に表示された出力テキストT2に補正された際の補正ルールを登録するか否かを選択できる。手動補正処理(S5)の詳細については後述する。
手動補正処理(S5)後、ユーザ5が確認完了ボタン70を操作すると、制御部20は、補正結果欄62に表示された出力テキストT2を翻訳サーバ11に送信する(S6)。又、ユーザ5が特に入力テキストT1を修正する操作をせずに確認完了ボタン70を操作すると(S4でNO)、制御部20はステップS5の処理を行わず、入力テキストT1と同じ出力テキストT2を翻訳サーバ11に送信する(S6)。
手動補正処理(S5)において登録された補正ルールは、その後のステップS1において、新たに取得される入力テキストT1に適用される。図6で登録された補正ルールが適用される一例を図7に示す。
図7では、「5個の内1つを現金でよろしいですか」というユーザ5の発話に対して、誤認識を含んだ「ここの内1つを現金でよろしいですか」という入力テキストT1が取得された(S1)場合を例示する。本実施形態において、自動補正部202として機能する制御部20は、記憶部21に記憶された補正ルールの登録データ40aにおいて、入力テキストT1に適用可能な補正ルールがあるか否かを判断する(S3)。図7の場合、図6に対応する補正ルールに基づいて、制御部20はステップS3でYESに進み、自動補正処理を実行する(S7)。
自動補正処理(S7)は、登録された補正ルールに従って、特にユーザ5の操作を介さず自動的に入力テキストT1を変更して、出力テキストT2を生成する処理である。図7の例では、自動補正処理の結果として、「五個の内1つを現金でよろしいですか」という出力テキストT2が表示されている。
図7の例では、自動補正処理(S7)によって図6の例と同様に入力テキストT1中の誤認識箇所「ここ」を変更することにより、補正結果として適切な出力テキストT2が得られている。又、本例では、入力テキストT1中で補正対象となった上記箇所および出力テキストT2中で同箇所が変更された補正箇所「五個」が強調表示されたり、補正ルールが適用された補正回数N1が表示されたりしている。自動補正処理(S7)の詳細については後述する。
本実施形態の音声認識補正装置2は、自動補正処理(S7)による出力テキストT2に関しても、ステップS4と同様に操作部22にて修正のユーザ操作を受け付け(S8)、ユーザ5が誤補正の有無を確認できるようにしている。例えば、図7に例示するように適切な補正結果の出力テキストT2に対して、ユーザ5が特に修正する操作を行わずに確認完了ボタン70を操作すると(S8でNO)、制御部20は、出力テキストT2を翻訳サーバ11に送信する(S6)。
図7と同じ補正ルールから生じる誤補正の一例を図8(A)に示す。図8(A)の例では、「ここの布団を使ってください」というユーザ5の発話が、認識結果欄61の入力テキストT1のとおり、正しく音声認識されている。しかしながら、この場合に図7の例と同様の自動補正処理(S7)が行われることで、入力テキストT1中の「ここ」が変更され、生成された出力テキストT2が「五個の布団を使ってください」というように誤補正を含んでいる。
この際、制御部20は、出力テキストT2を修正するユーザ操作を受け付けるように操作部22を制御して、当該ユーザ操作が入力されたか否か検知する(S8)。当該ユーザ操作が入力されると(S8でYES)、制御部20は、再補正処理を実行する(S9)。再補正処理は、ユーザ操作に従って出力テキストT2における誤補正箇所のような文字列を補正する処理である。ステップS9の表示例を図8(B)に示す。
図8(B)は、図8(A)から出力テキストT2中の誤補正箇所「五個」を指定するユーザ操作が入力された場合を例示する。図8(B)では、再補正処理(S12)中で出力テキストT2が修正される前の状態を例示する。
図8(B)の例において、表示部23は、図7と同様の各欄61,62及び各ボタン70,71に加えて、補正内容欄64、補正元の履歴欄65、カウントリセットボタン72、ルール編集ボタン73、及び例外指定ボタン74を表示する(S9)。ユーザ5は、例えば補正内容欄64に表示された「ここ→五個」という補正ルールなど、自動補正処理(S8)で誤補正が生じた原因を確認することができる。さらに、本実施形態の再補正処理(S9)では、補正ルールを修正するようなユーザ操作も受け付ける。再補正処理(S9)の詳細については後述する。
制御部20は、再補正処理(S9)後に更なる修正のユーザ操作が特になければ(S8でNO)、出力テキストT2を翻訳サーバ11に送信する(S6)。
制御部20は、出力テキストT2を送信すると(S6)、本フローチャートによる処理を終了する。
以上の音声認識補正装置2の動作によると、ユーザ5は、発話内容を機械翻訳させる際に(S6)、入力テキストT1の表示により、発話の音声認識結果を確認できる(S1,S2)。ユーザ5は、例えば誤認識を見つけた際、自身の意図する修正内容を入力できる(S4,S5)。このような修正内容を補正ルールとして登録することにより、その後の発話時には自動補正処理によって、同じ内容の補正が自動的に実行される(S3,S7)。さらに、ユーザ5は、自動補正処理による誤補正の有無も確認でき、誤補正の原因となった補正ルールを、自身の意図を反映するように修正可能である(S8,S9)。このように、本実施形態の音声認識補正装置2は、ユーザ5にとって補正ルールを管理し易くすることができる。
2−2−1.手動補正処理
図5のステップS5における手動補正処理の詳細を、図9のフローチャートに沿って説明する。以下では、図3の補正ルールの登録データ40aが、未だ音声認識補正装置2に登録されていない場合の動作例について説明する。
図5のステップS5における手動補正処理の詳細を、図9のフローチャートに沿って説明する。以下では、図3の補正ルールの登録データ40aが、未だ音声認識補正装置2に登録されていない場合の動作例について説明する。
まず、制御部20は、図5のステップS4におけるユーザ操作において、入力テキストT1中で補正対象として指定された文字列を認識する(S21)。例えば図6(A)の例では、入力テキストT1中の誤認識箇所「ここ」が補正対象の文字列として認識される。
また、制御部20は、例えば図6(A)の例で表示される補正入力欄63において、文字列を入力するユーザ操作を操作部22で受け付けて、補正先の文字列を取得する(S22)。
次に、制御部20は、入力テキストT1中で認識した補正対象の文字列を、入力された補正先の文字列に置換して、出力テキストT2を生成する(S23)。
制御部20は、例えば図6(B)に示す補正結果欄62のように、生成した出力テキストT2を表示するように表示部23を制御する(S24)。
制御部20は、例えば補正登録ボタン71の操作に応じて、認識結果欄61に表示中の入力テキストT1を、補正結果欄62に表示中の出力テキストT2に補正するための補正ルールを登録するユーザ操作が入力されたか否かを検知する(S25)。
例えば図6(B)に示すように、補正登録ボタン71が操作されると(S25でYES)、制御部20は、補正ルール登録部201として機能し、認識した補正対象の文字列を補正先の文字列に変更することを規定する補正ルールを新たに登録する(S26)。
ステップS26において、制御部20は、上記の補正ルールの登録データ40aを生成して、記憶部21に記録する。ステップS26における補正ルールの登録データ40aを図10(A)に例示する。補正ルールの登録データ40aには、今回の入力テキストT1が補正元テキストとして含まれ、計数値は初期値「1」に設定される。
また、補正登録のユーザ操作が入力されなかった場合(S25でNO)、制御部20は、特に補正ルールの登録を行わずに(S26)、ステップS27に進む。
制御部20は、生成された出力テキストT2を更に修正するユーザ操作が入力されたか否かを検知する(S27)。更なる修正のユーザ操作が入力されると(S27)、制御部20は、入力されたユーザ操作に従ってステップS21以降の処理を再度、行う。
例えばユーザ5が確認完了ボタン70を操作すると、制御部20は、更なる修正のユーザ操作はないことを検知する(S27でNO)。すると、制御部20は、図5のステップS5の処理を終了して、ステップS6に進む。
以上の手動補正処理によると、ユーザ5は入力テキストT1において音声認識の誤認識を修正しながら、対応する補正ルールを登録するか否か選択することができる。例えば、ユーザ5は、修正した内容が頻出の文言であれば補正ルールを登録する一方、頻度の低い文言であれば敢えて補正ルールを登録しないこともできる。
例えばユーザ5は、発話頻度の低い誤認識の補正に対して、補正ルールの登録は行わずに現在の入力テキストT1の修正のみ行い、確認完了ボタン70を操作して手動補正処理を完了させる。このように、発話頻度の低い発話の誤認識に対する補正ルールは、自動補正処理に組み込まない選択が可能になる。又、同様の補正対象の文字列に対して、発話の頻度が高い場合は補正ルールの登録を選択し、低い場合は都度、手動補正処理を行うことで、補正の場合分けのような複雑な補正ルールの作成を行わずに済む。
上記のステップS22において、補正先の文字列は、ユーザ操作に代えて、又はこれに加えて、音声認識補正装置2が生成してもよい。例えば、音声認識補正装置2は、補正先の文字列の候補となるデータベースを検索したり、共起表現の演算を行ったりしてもよい。
上記のステップS27の対象とするユーザ操作は、補正結果欄62に表示された出力テキストT2の文字列に対する操作に限らず、認識結果欄61の文字列に対して入力されてもよい。また、手動補正処理における処理の順番は、図9に図示した例に特に限らず、例えばステップS27が、ステップS25,S26よりも前に行われてもよい。
2−2−2.自動補正処理
図5のステップS7における自動補正処理の詳細を、図11のフローチャートに沿って説明する。本フローチャートに示す処理は、図5のステップS3でYESに進んだ場合に開始する。
図5のステップS7における自動補正処理の詳細を、図11のフローチャートに沿って説明する。本フローチャートに示す処理は、図5のステップS3でYESに進んだ場合に開始する。
図5のステップS3において、制御部20は、ステップS1で取得された入力テキストT1中の文字列において、補正ルール毎の補正対象の文字列を探索する。探索の結果、少なくとも1つの補正ルールの補正対象の文字列が入力テキストT1中にあった場合、制御部20は、適用可能な補正ルールがあると判断し(S3でYES)、ステップS7に進む。
ステップS7において、制御部20は、図11に示すように、入力テキストT1に適用可能な補正ルールの中で、最も高い優先順位を有する補正ルールを選択する(S31)。補正ルール間の優先順位は、例えば補正対象の文字列の長さ等に応じて予め設定されている。例えば、「ここ→五個」という補正ルールと、「ここの内→五個の内」という補正ルールとが登録されている場合、補正対象の文字列がより長い後者の優先順位が高く設定される。
制御部20は、選択した補正ルールの登録データ40aを参照して、入力テキストT1が、当該補正ルールの例外であるか否かを判断する(S31)。ステップS31において、制御部20は、当該補正ルールの登録データ40aにおいて例外フラグが「ON」である各補正レコードD1の補正元テキストと、入力テキストT1とを比較する。
入力テキストT1が、例外フラグが「ON」の補正元テキストの何れとも合致しない場合、或いは例外フラグが全て「OFF」の場合、制御部20は、入力テキストT1が補正ルールの例外でないと判断する(S31でNO)。この場合、制御部20は、選択した補正ルールに従って、入力テキストT1の中で補正対象の文字列を、補正先の文字列に変更する(S32)。ステップS32の処理によると、選択した補正ルールの原則的な適用により、入力テキストT1が補正されることとなる。
一方、入力テキストT1が、例外フラグが「ON」の補正元テキストの何れかと合致する場合、制御部20は、入力テキストT1が補正ルールの例外であると判断する(S31でYES)。この場合、制御部20は、ステップS32の処理を行わずにステップS33に進む。これにより、当該補正ルールの例外として入力テキストT1を処理する、即ち補正ルールの例外適用を行う例外処理が実現される。
制御部20は、以上のような補正ルールの適用状況を、登録データ40aに対する更新案として一時記憶部21b等に記憶する(S33)。ステップS33における更新案を示す更新案データを、図10(B)に例示する。
図10(B)は、登録データ40aが図10(A)の状態で図7の発話が行われた場合の更新案データ40bを例示する。本例では、制御部20は、ステップS32で適用した補正ルールについての更新案データ40bとして、図10(A)の登録データ40aと同じデータに、今回の入力テキストT1に対応する新たな補正レコードD2を追加する(S33)。この際、新たな補正レコードD2の例外フラグは「OFF」に設定され、計数値は「1」に設定される。
また、制御部20は、原則的又は例外的に適用した補正ルールに関して、今回の入力テキストT1が、登録データ40aに既存の補正元テキストと一致している場合には、更新案データ40bにおいて対応する計数値をインクリメントする。こうした更新案データ40bで更新された情報は、一時記憶部21b等に記憶され(S33)、その後に適宜、登録データ40aに記録される。
図11に戻り、制御部20は、選択した補正ルールが適用された入力テキストに、更に適用可能な補正ルールがあるか否かを判断する(S34)。ステップS34は、上記の入力テキスト中で補正ルールが原則的又は例外的に適用済みの箇所を除くように、補正対象の文字列を探索する範囲を制限して、ステップS3の処理と同様に行われる。
適用可能な補正ルールがある場合(S34でYES)、制御部20は、上記の入力テキストと適用可能な補正ルールに基づき、ステップS30以降の処理を行う。ステップS34により、適用可能な補正ルールがなくなるまで入力テキストT1が補正される。
制御部20は、適用可能な補正ルールがなくなると(S34でNO)、入力テキストT1の補正結果を表示するように表示部23を制御する(S35)。制御部20は、入力テキストT1がステップS30〜S34で処理された補正結果を出力テキストT2として、例えば図7に示すように、表示部23の補正結果欄62に表示させる。
又、表示部23は、制御部20によるステップS30〜S34の処理結果に基づき、各テキストT1,T2中の補正対象又は補正先の文字列を強調表示したり、対応する補正ルールによる補正回数N1を表示したりする(S35)。例えば、制御部20は、対応する補正ルールに関する例外フラグが「OFF」である補正レコードの計数値の総和により、補正回数N1を算出する(図3参照)。強調表示としては、例えば色文字、太字、マーカ、下線、或いは囲み枠など種々の形態を採用できる。
制御部20は、補正結果の表示により(S35)、図5のステップS7を終了し、ステップS8に進む。
以上の自動補正処理によると、入力テキストT1の取得時に登録済みの補正ルールを適用して、自動的に補正結果の出力テキストT2を得ることができる(S31〜S34)。例えば図7に示すように、ユーザ5は、補正箇所等の強調表示により、自動補正処理が実行されたことを把握できる(S35)。又、補正ルールの適用状況の記録に基づいて(S33)、補正ルールの例外フラグが「OFF」となっている計数値の総和である補正回数N1が表示されることで、ユーザ5は、同補正ルールが過去から適用された頻度を確認することもできる。
ステップS35では、入力テキストT1が例外の補正ルール(S31でYES)に関しても、強調表示等がされてもよい。例えば、出力テキストT2中で例外として補正されなかった箇所、即ち補正対象と同じ文字列が強調表示されてもよい。これにより、補正ルールの例外として扱われた箇所をユーザにとって可視化できる。この際、例外として扱われた箇所の強調表示と、補正箇所の強調表示とは、例えば別々の色など、区別可能に表示されてもよい。
又、ステップS35では、補正回数N1と同様に、上記文字列が過去に例外適用として補正されなかった回数すなわち例外適用回数N2のカウント値が表示されてもよい(図14参照)。例えば図3に示すように、制御部20は、例外適用で参照した補正レコードの計数値を、例外適用回数N2として用いる。
また、補正回数値N1及び例外適用回数N2といった補正ルールの適用回数は、カウントリセットボタン72を操作することでリセットされてもよい。例えば、制御部20は、リセットの対象とする適用回数を指定した後、カウントリセットボタン72のユーザ操作が入力されたときに、指定された適用回数を算出した全ての補正レコードの計数値を例えば「0」に置き換える。もしくは、ユーザ5がリセット対象の適用回数を指定した後、制御部20は、その補正ルールに関連する補正レコードの内容を全て表示させ、ユーザ操作に応じて一部の補正レコードの計数値のみを、例えば「0」に置き換えるとしてもよい。
上記のステップS30において、補正ルール間の優先順位は、ユーザ5が新しく補正ルールを登録する場合や、更新する場合に変更できるものとしてもよい。更に入力テキストT1と同時に入力される他のデータに基づいて、動的に優先順位を変えるものとしてもよい。当該他のデータは、発話のパターンを限定可能な各種の情報を利用可能であり、例えば、発話者の認識情報、現在表示している画面の情報、及び対話シーンの情報などを含む。また、自動補正処理をクラウドサーバなどの外部で実行する場合には、端末ID及び設置場所といった端末情報、及び利用用途なども利用可能である。
2−2−3.再補正処理
図5のステップS9における再補正処理の詳細を、図12のフローチャートに沿って説明する。図12のフローチャートに示す各処理は、例えば制御部20が補正ルール登録部201として機能して行われる。
図5のステップS9における再補正処理の詳細を、図12のフローチャートに沿って説明する。図12のフローチャートに示す各処理は、例えば制御部20が補正ルール登録部201として機能して行われる。
まず、制御部20は、ユーザ操作によって出力テキストT2中で修正対象として指定された文字列が、図5のステップS7における自動補正処理によって補正された補正箇所であるか否かを判断する(S41)。本実施形態において、補正箇所を指定するユーザ操作は、自動補正処理で変更された文字列を変更前の文字列に戻す誤補正の修正操作の一例である。
指定された文字列が補正箇所でない場合(S41でNO)、自動補正処理(S7)ではなく音声認識の結果(S1)に対する修正となることから、制御部20は、図5のステップS5と同様に手動補正処理を実行する(S42)。
一方、指定された箇所が補正箇所である場合(S41でYES)、自動補正処理(S7)で適用された現状の補正ルールに起因して、誤補正が生じたと考えられる。このことから、制御部20は、ステップS7で適用された補正ルールに関する情報を、補正ルールの登録データ40aを参照して表示部23に表示させる(S43)。ステップS43において用いる補正ルールの更新案データ40bを図10(C)に例示する。
図10(C)は、補正ルールの登録データ40aが図10(B)と同様の状態で、図8(A)の発話が行われた場合の更新案データ40bを例示する。当該データ40bに基づき、ステップS43において制御部20は、表示部23に、図8(B)に例示するように、補正内容欄64において適用された補正ルールを表示させたり、補正元の履歴欄65に、同補正ルールが適用された過去の入力テキスト、即ち補正元テキストの履歴を、現在の入力テキストT1を含めて表示させたりする。また、制御部20は、例えば過去の補正元テキストに関する計数値を、補正元テキスト毎の適用回数として表示させる。
本実施形態の音声認識補正装置2によると、ステップS43の表示時に、ユーザ5は、誤補正を生じた補正ルールの内容とその補正元テキストの履歴を確認できると共に、補正ルールを修正する方法を選択することができる。本実施形態では、補正ルールを修正する方法として、補正ルールを改定する「ルール編集」(S45〜S49)と、補正ルールの例外として今回の入力テキストT1を指定する「例外指定」(S51〜S53)とを提供する。
制御部20は、ルール編集の処理を実行するためのルール編集ボタン73と、例外指定の処理を実行するための例外指定ボタン74との何れかに対するユーザ操作を受け付けるように操作部22を制御して、こうしたユーザ操作の入力を検知する(S44)。
ルール編集ボタン73のユーザ操作が入力された場合(S44でYES)、制御部20は、改定後の補正ルールの候補となる候補ルールを取得し、表示部23に表示させる(S45)。ステップS45の表示例を図13に示す。
図13は、図8(B)の例で「ルール編集」が選択された場合を例示している。例えば制御部20は、対応する補正ルールの登録データ40aを参照して各補正元テキストの文字列を比較することにより、今回の入力テキストT1が補正適用対象にならずに、かつ、過去の入力テキストが正しく補正されることを保証するような内容の新しい補正ルールを候補ルールとして生成し、表示部23に候補ルールを表示させる(S45)。例えば、制御部20は、候補ルールの補正対象の文字列として、改定前の補正対象の文字列よりも長く、且つ今回以外の履歴の入力テキストT1間で共通する文字列を検索し、検索結果に応じて対応する補正先の文字列を設定する。
図13の例では、補正内容欄64に複数の候補ルールが表示されている。ユーザ5は、例えば補正内容欄64におけるタッチ操作により、表示された候補ルールの中から改定後の新たな補正ルールを選択することができる。制御部20は、操作部22を介して、候補ルールの選択結果を新たな補正ルールとして取得する(S46)。
次に、制御部20は、新たな補正ルールによる補正結果の出力テキストT2を表示部23に表示させる(S47)。例えば、制御部20は、改定前の補正ルールの代わりに新たな補正ルールを用いて、今回の入力テキストT1に対する自動補正処理(S7)を再度、実行する。これにより、図13の例の補正結果欄62には、図8の例の誤補正を解消した出力テキストT2が表示される。
以上のような表示時に、ユーザ5は、例えば補正登録ボタン71を用いて、新たな補正ルールを改定前の補正ルールの代わりに登録する操作を入力できる。制御部20は、補正登録ボタン71の操作に応じて、補正登録のユーザ操作が入力されたか否かを検知する(S48)。
補正登録のユーザ操作が入力されると(S48でYES)、制御部20は、改定前の補正ルールに関する登録データ40aを、新たな補正ルールに関する登録データ40aに更新する(S49)。ステップS49における補正ルールの登録データ40aを図10(D)に例示する。
図10(D)は、図10(C)と同様に更新前の登録データ40aが図10(B)の状態から更新された後の登録データ40aを例示する。本例において、更新後の登録データ40aでは、補正対象及び補正先の文字列が更新前よりも長くなり、且つ今回の入力テキストT1以外の補正元テキスト即ち過去の入力テキストの全てが含まれている。それゆえ、図10(B)の補正ルールによって補正を保証していた過去の入力テキストの全てに対して、図10(D)の更新後の補正ルールのみでも過去の正しい補正が保証される。このため、制御部20が、記憶部21において、更新前の図10(B)の登録データ40aを削除して、図10(D)の更新後の登録データ40aのみを新たに記録するだけで、所望の動作を行う補正ルールの更新が実現される。
一方、補正登録のユーザ操作が入力されなければ(S48でNO)、制御部20は、ステップS49の処理を行わず、リターン状態に遷移する。この際、登録データ40aのデータ更新は行われず、図10(B)のままとなる。又、一時記憶部21bにおける更新案データ40bは適宜、破棄される。
又、ルール編集ボタン73のユーザ操作ではなく例外指定ボタン74のユーザ操作が入力された場合(S44でNO)、制御部20は、例外的に自動補正処理(S7)を解除する処理を行って、処理結果を表示する(S51)。ステップS51の表示例を図14に示す。
図14は、図8(B)の例で「例外指定」が選択された場合を例示している。ステップS51において、制御部20は、例えば図8(B)に示す解除前の出力テキストT2中で指定された補正箇所の文字列を、補正元の入力テキストT1中で対応する文字列に置換し直して、図14に示すように解除後の出力テキストT2を表示する。さらに、制御部20は、補正元の履歴欄65において、今回の入力テキストT1が例外であることを示す例外表示を表示部23に行わせる。例外表示としては、例えば注釈、取り消し線、或いはグレイアウトなど種々の形態を採用できる。
また、「例外指定」においても上述した「ルール編集」と同様に、制御部20は、補正登録のユーザ操作が入力されたか否かを検知する(S52)。ユーザ5は、例えば入力テキストT1が今回のような場合には常に上記の補正ルールの例外であることを登録する意図から、補正登録のユーザ操作を入力できる。
補正登録のユーザ操作が入力されると(S52でYES)、制御部20は、今回の入力テキストT1を例外として指定するように、補正ルールの登録データ40aを更新する(S53)。制御部20は、例えば図10(C)の補正ルールの登録データ40aにおいて、図3に示すように、今回の入力テキストT1の例外フラグを「ON」に変更して記憶する。
制御部20は、図12のリターン状態に遷移すると、図5のステップS9を終了し、ステップS8に戻る。
以上の再補正処理によると、自動補正処理による補正結果の出力テキストT2に対して、ユーザ5は所望の修正を行うことができる。自動補正処理による出力テキストT2の補正箇所に誤りを見つけた場合(S41でYES)、当該箇所を入力テキストT1の対応する文字列に戻すと共に、誤補正の原因となった補正ルール等を確認できる(S43)。さらに、ユーザ5はルール編集又は例外指定といった方法により、上記誤補正の補正ルールを修正することができる。
例えば、ステップS45において、音声認識補正装置2は、今回の入力テキストT1が適用対象でない一方、過去に補正された補正元テキストが適用対象となる候補ルールをユーザ5に提示する。これにより、過去の補正元テキストのような入力テキストT1を補正することを保証しながら補正ルールを改定するルール編集を実現できる。ステップS45において、制御部20は、改定前の補正ルールを基に、正規表現等により、補正範囲を効率的に広げる候補ルールを生成してもよい(図22参照)。
以上の説明では、「ルール編集」と「例外指定」の何れを用いて補正ルールを修正するのか予めユーザ5が選択する例を説明した。これに代えて、例えば制御部20が、「ルール編集」と「例外指定」の双方で補正ルールが修正されるパターンを事前に生成し、表示部23等の表示により、ユーザ5にそれぞれのパターンを確認させ、最終的に何れの修正方法を選択させるようにしてもよい。
また、以上の説明では、誤補正の修正操作の一例として、出力テキストT2中の補正箇所を指定するユーザ操作を説明したが、特にこの操作に限定されない。例えば図8(A)の表示時にルール編集ボタン73又は例外指定ボタン74を操作すると、操作部22が誤補正の修正操作として受け付け、ステップS44以降の処理が開始されてもよい。
3.まとめ
以上のように、本実施形態における音声認識補正装置2は、文字列で構成される入力テキストT1を補正するテキスト補正装置の一例である。テキスト補正装置は、ネットワークI/F25等の取得部と、記憶部21と、制御部20と、表示部23と、操作部22とを備える。取得部は、入力テキストT1を取得する(S1)。記憶部21は、補正対象とする文字列を補正先の文字列に変更する補正ルールに関する情報を記憶する。制御部20は、取得された入力テキストT1に基づき、補正ルールに従う補正処理の一例である自動補正処理の処理結果を示す出力テキストT2を取得する(S7)。表示部23は、入力テキストT1及び出力テキストT2を表示する(S2,S35)。操作部22は、出力テキストT2を修正するユーザ操作を入力する(S8)。制御部20は、自動補正処理によって出力テキストT2において入力テキストT1から変更された文字列を他の文字列に修正するユーザ操作である誤補正の修正操作が入力されたとき(S9,S41でYES)、変更前の文字列を変更された文字列に変更した補正ルールを示す情報を表示するように表示部23を制御する(S43)。このとき、制御部20は、表示された情報が示す補正ルールを修正するユーザ操作を受け付けるように操作部22を制御する(S44)。
以上のように、本実施形態における音声認識補正装置2は、文字列で構成される入力テキストT1を補正するテキスト補正装置の一例である。テキスト補正装置は、ネットワークI/F25等の取得部と、記憶部21と、制御部20と、表示部23と、操作部22とを備える。取得部は、入力テキストT1を取得する(S1)。記憶部21は、補正対象とする文字列を補正先の文字列に変更する補正ルールに関する情報を記憶する。制御部20は、取得された入力テキストT1に基づき、補正ルールに従う補正処理の一例である自動補正処理の処理結果を示す出力テキストT2を取得する(S7)。表示部23は、入力テキストT1及び出力テキストT2を表示する(S2,S35)。操作部22は、出力テキストT2を修正するユーザ操作を入力する(S8)。制御部20は、自動補正処理によって出力テキストT2において入力テキストT1から変更された文字列を他の文字列に修正するユーザ操作である誤補正の修正操作が入力されたとき(S9,S41でYES)、変更前の文字列を変更された文字列に変更した補正ルールを示す情報を表示するように表示部23を制御する(S43)。このとき、制御部20は、表示された情報が示す補正ルールを修正するユーザ操作を受け付けるように操作部22を制御する(S44)。
以上のテキスト補正装置によると、ユーザ5は出力テキストT2において入力テキストT1から誤って変更された誤補正を見つけた際(図8(A)参照)、誤補正の修正操作を入力することにより、誤補正の原因となった補正ルールを表示部23にて確認できる(図8(B)参照)。このとき、ユーザ5は、表示された補正ルールを修正することも可能である。このように、テキスト補正装置によると、ユーザ5が入力テキストを補正する補正ルールを容易に管理することができる。
本実施形態において、誤補正の修正操作は、出力テキストT2において入力テキストT1から変更された文字列を変更前の文字列に戻すユーザ操作を含む。入力テキストT1が正しかったにも拘わらず、自動補正処理によって生じた誤補正を修正する際に、補正ルールが修正可能となり、補正ルールの管理を容易化できる。なお、誤補正の修正操作は、変更前の文字列に戻すだけでなく、変更前後の文字列以外の文字列に変更するユーザ操作を含んでもよい。
本実施形態において、表示部23は、誤補正の修正操作が入力されたとき、例えば図8(B)の補正内容欄64のように補正ルールを表示し、補正元の履歴欄65に同補正ルールが適用された過去の入力テキスト、即ち補正元テキストの履歴を、現在の入力テキストT1を含めて表示する。これにより、ユーザ5は当該補正ルールが適用された履歴を確認しながら、補正ルールの修正を検討でき、補正ルールのメンテナンスが行い易い。
本実施形態において、制御部20は、例えば図13の補正内容欄64に示すように、候補ルールを表示するように表示部23を制御する(S45)。候補ルールは、誤補正の修正操作が入力されたときの入力テキストT1における変更前の文字列が補正対象とはならない一方で、過去の入力テキストT1における文字列が補正対象となる更新された補正ルールの一例である。制御部20は、更新された補正ルールを登録するユーザ操作を受け付けるように操作部22を制御する(S48)。このように、ユーザ5は、補正ルールを修正する1つの方法として、補正ルールを更新するような編集を行うことができる。
本実施形態において、更新された補正ルールは、補正対象の文字列が変更前の文字列よりも長い文字列となるように設定される。補正対象の文字列を長く取る簡単な処理によって、過去に補正ルールが適用された実績を維持した補正ルールの更新を行うことができる。補正ルールの更新は上記に限らず、例えば正規表現などにより補正元テキストにおいて共通の要素を取り出して、過去の実績を維持するように実施可能である。
本実施形態において、操作部22は、誤補正の修正操作が入力されたときの入力テキストT1に関して、例えば例外指定ボタン74において、変更前の文字列を変更された文字列に変更する補正ルールに関する例外として当該入力テキストT1を指定するユーザ操作を受け付ける(図14参照)。これにより、ユーザ5は、補正ルールを修正する別の方法として、補正ルールの適用に例外を設けることができる。
本実施形態において、自動補正処理は、補正ルールの登録データ41a(図3参照)に基づいて、取得部によって取得された入力テキストT1が、例外フラグが「ON」の補正ルールで、かつ補正元の履歴に記録されているテキスト文と合致する場合、取得された入力テキストT1を当該補正ルールで変更しない(S31)。このように、例外として指定された履歴と同様の入力テキストT1が新たに取得されたときの誤補正を回避することができる。
本実施形態において、表示部23は、出力テキストT2において自動補正処理によって入力テキストT1から変更された文字列と、入力テキストT1における変更前の文字列とを強調表示する(図7参照)。上記の強調表示は、入力テキストT1と出力テキストT2とのうちの一方であってもよい。この場合であっても、ユーザ5は例えば各テキストT1,T2を見比べて、誤補正箇所などを確認できる。
本実施形態において、表示部23は、補正ルールが過去に適用された回数を示す情報の一例として補正回数N1及び例外適用回数N2を表示する。補正回数N1及び例外適用回数N2により、ユーザ5は補正ルールが原則的又は例外的に適用された頻度を確認できる。
本実施形態において、操作部22は、入力テキストT1に含まれる文字列を指定して、特定の文字列に変更するユーザ操作が入力されたとき、指定された文字列を特定の文字列に変更する補正ルールを登録するユーザ操作を受け付ける(S4)。ユーザ5は手動補正処理(S5)において、入力テキストT1の誤認識箇所のような誤りを修正し、修正内容を補正ルールとして登録することができる(S26)。
本実施形態において、記憶部21は、補正ルールの内容と過去の入力テキストとを関連付けて記録する補正ルールDB40を格納する。制御部20は、記憶部21に格納された補正ルールDB40を参照して自動補正処理を実行して、出力テキストT2を取得する(S7)。制御部20は、修正された補正ルールに関する情報を記憶部21の補正ルールDB40に記録することができる。
本実施形態において、入力テキストT1は、音声を認識する音声認識処理の結果として得られる文字列で構成される。音声認識のように或る程度の規則性で生じる誤認識を含んだ入力テキストT1が、補正ルールに従って適切に補正できる。
本実施形態において、テキスト補正装置は、出力テキストT2を、機械翻訳を実行する機械翻訳機の一例である翻訳サーバ11に出力する出力部の一例としてのネットワークI/F25を備える。機械翻訳機は翻訳サーバ11に限らず、例えばテキスト補正装置を構成するコンピュータが、機械翻訳機として機能してもよい。この場合、テキスト補正装置中で制御部20が出力テキストT2を読み出して機械翻訳機の入力として処理すること等により出力部が実現される。
本実施形態におけるテキスト補正方法は、取得部が、文字列で構成される入力テキストT1を取得するステップ(S1)を含む。本方法は、自動補正部202即ち補正部が、取得された入力テキストT1に基づいて、補正対象とする文字列を補正先の文字列に変更する補正ルールに従う自動補正処理を実行して、補正処理の処理結果を示す出力テキストT2を生成するステップ(S7)を含む。また、本方法は、表示部23が、入力テキストT1及び出力テキストT2を表示するステップ(S2,S35)と、操作部22が、出力テキストT2を修正するユーザ操作を入力するステップ(S8)とを含む。さらに、本方法は、自動補正処理によって出力テキストT2において入力テキストT1から変更された文字列を他の文字列に修正するユーザ操作が入力されたとき(S9,S41でYES)、表示部23が、変更前の文字列を変更された文字列に変更する補正ルールを示す情報を表示するステップ(S43)と、操作部22が、表示された情報が示す補正ルールを修正するユーザ操作を受け付けるステップ(S44)とを含む。以上のテキスト補正方法によると、ユーザ5は、取得された入力テキストT1に対する補正ルールを容易に管理することができる。
本実施形態において、文字列で構成される入力テキストT1を補正するテキスト補正装置のようなコンピュータの制御部20に実行させるためのプログラムが提供される。本プログラムは、制御部20に、入力テキストT1を取得するステップ(S1)と、取得された入力テキストT1に基づき、補正対象とする文字列を補正先の文字列に変更する補正ルールに従う補正処理の処理結果を示す出力テキストT2を取得するステップ(S7)とを実行させる。さらに、自動補正処理によって出力テキストT2において入力テキストT1から変更された文字列を他の文字列に修正するユーザ操作が入力されたとき(S9,S41でYES)、制御部20に、変更前の文字列を変更された文字列に変更する補正ルールを示す情報を表示するように表示部23を制御するステップ(S43)と、表示された情報が示す補正ルールを修正するユーザ操作を受け付けるように操作部22を制御するステップ(S44)とを実行させる。本プログラムを実行するコンピュータにより、ユーザ5は入力テキストを補正する補正ルールを容易に管理することができる。
(実施形態2)
実施形態1では、テキスト補正装置の制御部20が自動補正処理を実行する例を説明した。実施形態2では、自動補正処理がテキスト補正装置の外部で実行される例について、図15を用いて説明する。
実施形態1では、テキスト補正装置の制御部20が自動補正処理を実行する例を説明した。実施形態2では、自動補正処理がテキスト補正装置の外部で実行される例について、図15を用いて説明する。
図15は、実施形態2に係る翻訳システム1Aの構成を示す図である。本実施形態の翻訳システム1Aは、実施形態1と同様の構成に加えて、テキスト補正装置2aの外部装置の一例である補正サーバ12をさらに備える。本実施形態のテキスト補正装置2aは、例えば実施形態1と同様の構成において、自動補正部202を含めずに構成される。補正サーバ12は、例えば音声認識サーバ3及び翻訳サーバ11と同様のハードウェア構成で構成できる。補正サーバ12の演算処理部は、テキスト補正装置2aの制御部20の代わりに自動補正部202(即ち補正部)として機能する。
又、補正サーバ12の記憶部には、例えば実施形態1と同様の補正ルールDB40が格納される。本実施形態では、テキスト補正装置2aの記憶部21に補正ルールDB40が格納されなくてもよい。テキスト補正装置2aは、例えば一時記憶部21bに、各種表示等の処理において必要となる、補正ルールに関する情報を適宜、記憶することができる。
本実施形態のテキスト補正装置2aは、図5と同様の動作時に、取得した入力テキストT1をネットワークI/F25を介して補正サーバ12に送信する。補正サーバ12は、補正ルールDB40を参照して、ステップS3と同様に適用可能な補正ルールがあるか否かを判断し(S3)、適用可能な補正ルールがない場合(S3でNO)には、例えばその旨を示す通知をテキスト補正装置2aに送信する。この場合、テキスト補正装置2aは、ステップS4以降の処理を行う。
一方、補正サーバ12は、適用可能な補正ルールがあると判断すると(S3でYES)、ステップS7と同様に自動補正処理を実行する。この際、補正サーバ12は、図11のステップS31〜S34と同様の処理を行い、ステップS35の代わりに、出力テキストT2などの補正結果を示す情報をテキスト補正装置2aに送信する。テキスト補正装置2aは、補正サーバ12からネットワークI/F25を介して補正結果の情報を受信し、表示部23に表示して、ステップS8以降の処理を行う。
ここで、再補正処理(S9)は、テキスト補正装置2aにおいて実行することができる。例えば、テキスト補正装置2aは、補正結果の出力テキストT2に適用された補正ルール及び対応する補正元テキストの履歴を、事前に補正サーバ12から取得し、一時記憶部21b等に記憶しておくことで、ルール編集の各処理(図12のS45〜S47)を実行できる。テキスト補正装置2aは、図12のリターンの状態に遷移した際、再補正処理(S9)の処理結果の情報を適宜、補正サーバ12に送信する。これにより、補正サーバ12で管理される補正ルールDB40を更新することができる。なお、再補正処理(S9)中で候補ルールを生成する等の各種処理が適宜、補正サーバ12において行われてもよい。
以上のように、本実施形態のテキスト補正装置2aは、補正サーバ12と通信する通信部として機能するネットワークI/F25を備える。補正サーバ12は、補正ルールの内容と過去の入力テキストとを関連付けて記録する補正ルールDB40を管理し、自動補正処理等の補正処理を実行する。制御部20は、補正サーバ12からネットワークI/F25を介して出力テキストT2を取得する。又、制御部20は、修正された補正ルールを、ネットワークI/F25を介して補正サーバ12に送信する。このように、補正サーバ12を用いて補正処理を実装し、補正ルールの管理を実現することもできる。
(実施形態3)
上記の実施形態1,2では、補正ルールの修正方法として「ルール編集」及び「例外指定」を例示したが、補正ルールの修正方法は特にこれに上記に限定されず、種々の方法を採用できる。実施形態3では、こうした変形例を図16〜図20を用いて説明する。
上記の実施形態1,2では、補正ルールの修正方法として「ルール編集」及び「例外指定」を例示したが、補正ルールの修正方法は特にこれに上記に限定されず、種々の方法を採用できる。実施形態3では、こうした変形例を図16〜図20を用いて説明する。
図16は、実施形態3のテキスト補正装置における手動補正処理の表示例を示す。本例では、補正ルールを登録する種別として2種類の登録種別を採用し、補正ルールの修正方法として「種別変更」を提供する。図16の例では、手動補正処理において新たな補正ルール「くじ→九時」を登録する際の補正登録ボタン71が操作されたときに、表示部23がポップアップ75を表示して、操作部22がユーザ5による登録種別の選択を受け付ける。
図17(A)は、図16の例で登録される登録データ40aを例示する。本例では、上記の補正ルールの登録種別として「単語」が設定されている。登録種別が「単語」の場合、自動補正処理は上記の実施形態1,2と同様に行われる。登録種別はユーザ5の選択に限らず、例えば初期設定として「単語」が自動選択されてもよい。図17(A)の登録データ40aに基づき自動補正処置が実行された際の表示例を図18(A)に例示する。
図18(A)の例では、入力テキストT1中に図17(A)の補正ルールの補正対象の文字列「九時」が2箇所p1,p2、含まれている。出力テキストT2中で、対応する2つの補正箇所q1,q2のうちの前者の補正箇所q1は誤補正である一方、補正箇所q2は適切である。ユーザ5は、例えば「宝九時」のように誤った補正箇所q1を含む範囲の文字列を指定して、再補正処理を行うことができる。図18(B)に、図18(A)後の表示の一例を示す。
図18(B)の例では、種別変更ボタン76の操作により「種別変更」が選択された後の更なるユーザ操作による表示の遷移を例示する。まず、表示部23は、登録種別欄66を表示し、操作部22が登録種別の選択を受け付ける。
図18(B)では、ユーザ5が第1のユーザ操作50aにより登録種別を「文章登録」に変更した場合を例示している。登録種別が「文章登録」の場合の補正ルールは、入力テキストT1が、当該補正ルールの登録データ40aにおける補正元テキストと完全一致するか、完全に含まれる場合にのみ、当該補正ルールを適用するように自動補正処理(図5のS7)等で用いられる。又、表示部23が表示する補正元の履歴欄65には、図中に下線で示すように、過去の入力テキストと、今回の入力テキストとが、補正ルールが適用される文字列の位置を明示する態様で表示される。
図18(B)の第2のユーザ操作50bとして、ユーザ5は、補正結果欄62に表示されているテキストT2に対して、今回誤補正をした、文字列「宝九時」の内の「九時」の箇所q1を指定する。こうした指定は、「文章登録」の補正ルールにおいて、入力テキストT1と同様の文中で対応する箇所p1を、補正対象の文字列から外すような内容変更として扱われる。制御部20は、補正元の履歴欄65に表示されている、今回の入力テキストの「宝くじ」の内の「くじ」の箇所から、補正対象としての下線を消去する(図18(B)では、消去後の状態を図示している)。このように、文中の位置を勘案した補正ルールの修正により、図18(B)の後に補正結果欄62は「宝くじの販売は九時で終了です」といった表記の出力テキストT2に変わる。
以上のように修正した補正ルールで問題ない場合、ユーザ5は補正登録ボタン71の操作により、補正ルールを更新できる。当該操作に応じて、制御部20が補正ルールの登録種別を「単語」から「文章」に変更し、また補正元テキストを、表示部23が表示中の補正元の履歴欄65の内容に変更することで、補正ルールの修正が反映される。図18(B)の修正後の登録データ40aを図17(B)に示す。
図17(B)は、図17(A)の登録データ40aが、補正ルールの修正によって更新された状態を例示する。本例では、上記の補正ルールの補正元テキストに、種別変更が行われた際の入力テキストが追加されると共に、登録種別が「文章」として登録されている。この際、各々の補正元テキストにおいて補正対象となった箇所の情報が、図中に下線で示すように保持される。
登録種別が「文章」の補正ルールに関する自動補正処理は、当該補正ルールの登録データ40aにおける各々の補正元テキストにおいて補正箇所となった箇所の情報を参照して行われる。これにより、補正元テキスト中で補正箇所となった箇所に限定して補正が行われるため、入力テキストT1中に補正対象の文字列が複数存在する場合においても、過去に補正しないように指定された箇所の誤補正を回避することができる。
また、上記の説明では、「宝九時」といった誤補正箇所q1を含んだ文字列を、入力テキストT1と同じ「宝くじ」に戻す、すなわち補正対象外とする文章登録の方法を説明した。一方で、上記誤補正の文字列を、入力テキストT1中の文字列とも、既存の補正ルールの補正先の文字列とも異なる、新たな文字列に変換するように補正ルールを修正することも可能である。図19を用いてこの場合の動作を説明する。
図19では、図18で説明した状況と同じ動作をして、図18(A)の表示が為された後に、図18(B)とは異なるユーザ操作によって為される補正ルールの変更例を説明する。以下では、ユーザ5が発話直後の表示部23が表示する画面に対して、図18(A)に示したように、補正結果欄62において補正内容を変更したい文字列「宝九時」を指定して、種別変更ボタン76の操作により「種別変更」を選択した後について説明する。
図19(A)は、図18(A)の次の表示の別例を示す。本例では、ユーザ5が第1のユーザ操作50aにより登録種別を「文章登録」に変更し、第2のユーザ操作50bにより補正結果欄62の「宝九時」を指定し、第3のユーザ操作50cにより補正内容欄64を指定する。すると、補正結果欄62で指定した誤補正の文字列の補正前に相当する文字列を用いて、補正内容欄64に「宝くじ→__」というように新規の補正内容として補正先の文字列の入力を受け付けるための表示が為される。
そして、ユーザ5が補正先の文字列として、新たに変換したい「宝クジ」といった文字列を指定することにより、制御部20は、当該指定に従った新たな補正ルールを生成する。これにより、図19(B)に示すように、補正結果欄62の表示が、所望の「宝クジの販売は九時で終了です」という表記に変更される。上記操作により、誤補正された文字列「宝くじ」を、新しい文字列「宝クジ」に補正する、新規の補正ルールを生成できる。その後、ユーザ5の補正登録ボタン71の操作により、上記のような新規の補正ルールを含んだ登録データ40aが登録される。このときの登録データ40aを図17(C)に示す。
以上の方法とは更に別の補正ルールの修正方法として、新たな補正ルールを設ける「補正変更」という方法を、図20を用いて説明する。図20(A)は、図18(A)と同様の状況において、ユーザ5が、第1のユーザ操作50aにより誤補正箇所q1を指定した直後の表示部23の表示例を示す。
ユーザ5が誤補正箇所q1を指定した場合に、制御部20は、図20(A)の通り、対応する補正ルールに関して、登録種別欄66、補正内容欄64、補正元の履歴欄65を表示させる。ここで、現状の出力テキストT2中で後者の補正箇所q2の内容は正しいことから、ユーザ5が誤補正箇所q1を含む文字列「宝九時」を指定する第2のユーザ操作50bを行って、その後に補正変更ボタン77を操作する。
上記のユーザ操作を受け付けると、制御部20は、図20(B)に示すように補正内容欄64及び補正元の履歴欄65の表示を変える。すなわち、制御部20は、誤補正として指定された文字列に対応する入力テキストT1中の補正対象の文字列「宝くじ」に基づき、新しい補正ルールの内容として、補正内容欄64に示す「宝くじ→宝くじ」を自動設定する。補正元の履歴欄65には、上記補正対象の文字列が含まれる、今回の入力テキストのみが、補正ルールが適用される文字列の位置を明示する態様で表示される。図20(B)の例では、「宝くじ」のみに下線が引かれて、後者の「くじ」には下線が無くなるような表示が為される。
その後の補正処理では、図20(B)で作成された新しい補正ルールと、図20(A)以前から登録されている「くじ→九時」の補正ルールが適用される。この際、例えば補正対象の文字列の長さに応じた優先順位により、図20(B)の補正ルールが図20(A)よりも高い優先順位で適用される。前述した通り、複数の補正ルールが適用される場合、後で処理される補正ルールは、入力テキスト中で補正ルールが原則的又は例外的に適用済みの箇所を除くように、補正対象の文字列を探索する範囲を制限して補正ルールを適用するため、図20(A)以前から登録されている「くじ→九時」の補正ルールは、新しい補正ルールにより補正済みの「宝くじ」の「くじ」には適用されず、後者の「くじ」にのみ補正が適用される。これにより、図20(B)の後に、補正結果欄62が更新され、正しい補正結果である「宝くじの販売は九時で終了です」という出力テキストT2が表示される。
更にその後、ユーザ5の補正登録ボタン71の操作により、今回生成された補正ルールが補正ルールの登録データ40aに追加され、図17(D)に示した状態に更新される。ここで、図17(D)の2行目の補正レコードD2の補正元テキストに記録されるテキストの「宝くじ」の「くじ」に変換位置を示す下線部がついていない理由は、前述したように、先に「宝くじ」の文字が優先度の高い他の補正ルール「宝くじ→宝くじ」にて例外処理として補正しないという補正処理済みのため、「くじ→九時」の補正ルールが適用されなかったことを示している。また、前述の例のように、「宝くじ」から「宝クジ」へといった表記変換をしたい場合には、補正登録ボタン71の操作の前に、図20(B)の補正内容欄64に表示された補正先の文字列の「宝くじ」を「宝クジ」に書き換える。これにより、所望の表記変換を実現する新しい補正ルールを作成できる。
(実施形態4)
以上の実施形態1〜3では、補正対象の文字列が、一意の補正文字列で指定される補正ルールに関して説明した。一方、同音異義語のように、同じ文字列に対して、場合により複数の補正文字列の候補が存在する場合がある。以下、このような場合の補正ルールの作成及び変更方法について、図21〜図22を用いて説明する。
以上の実施形態1〜3では、補正対象の文字列が、一意の補正文字列で指定される補正ルールに関して説明した。一方、同音異義語のように、同じ文字列に対して、場合により複数の補正文字列の候補が存在する場合がある。以下、このような場合の補正ルールの作成及び変更方法について、図21〜図22を用いて説明する。
図21は、実施形態4のテキスト補正装置の動作を説明するための図である。図22は、本実施形態の再補正処理におけるルール編集の表示例を示す図である
以下では、最初に「テープで留める」という発話に対して認識結果の入力テキストが「テープで止める」と誤認識で表記された場合に、ユーザ5が「止める→留める」という補正ルールを新規に作成し、登録した状態のテキスト補正装置の動作例を説明する。図21(A)はこのときに登録された登録データ40aを例示する。
図22(A)は、上記の状態で、新しく「機械を止める」と発話された際に表示部23が表示する画面の遷移を例示する。本例では、認識結果欄61のとおり正しい認識結果が得られていたにも関わらず、既に登録されている上記の補正ルールにより、補正結果欄62の「機械を留める」というように表記上の誤補正が生じている。まず、ユーザ5が誤補正箇所を指定すると、表示部23は、指定された文字列を誤補正した補正ルールの情報として、補正内容欄64および補正元の履歴欄65を、それぞれ図22(A)に示す内容にて表示する。以下では、ユーザ5がルール編集ボタン73を操作してから、新しい補正ルールを作成する手順を説明する。
今回の例では、新しく正しい補正ルールとしては、過去に補正を必要とした入力テキスト「テープで止める」における「止める」を「留める」に補正すると同時に、今回の入力テキストT1の「機械を止める」における「止める」は補正しないルールを作成する必要がある。そのために、補正が必要な入力テキストに対してのみ補正がかかるような条件付きの補正ルールに、上記の補正ルールを改定することを行う。
具体的には、入力テキストT1において「止める」の文字列を認識した際に、当該文字列よりも前に「テープ」という文字列が含まれている場合にのみ、「止める」を「留める」に補正するといった内容に、ユーザ5が補正内容欄64の内容を書き換える。本実施形態のテキスト補正装置は、例えば正規表現を採用して、こうした書き換えを受け付けることができる。図22(B)では、ユーザ5が、正規表現を用いた表記で、補正対象の文字列を条件付き指定する書き換えを行った例を示す。
補正内容の書き換えのユーザ操作に応じて、制御部20は、補正元の履歴欄65から、補正内容に関係ない今回の発話を削除する。さらに、改定後の補正ルールに従って自動補正された結果として(図12のS47参照)、補正結果欄62の表示は、図22(B)に示すように「機械を止める」という誤補正が解消された、正しい表記の出力テキストT2に置き換わる。こうした条件付きの補正ルールにより、過去の補正元テキストに対する補正を有効に維持したまま、今回の発話による入力テキストT1は補正しないという、両入力テキストに対して正しい補正ルールが作成される。
その後、当該補正ルールで問題なければ、ユーザ5が補正登録ボタン71を操作する。図21(B)は、このときに修正された補正ルールが登録された登録データ40aを例示する。このような補正ルールの変更をユーザ5が実施できるようにすることにより、同音異義語を代表とした同じ文字列を、入力テキストT1に応じて複数の異なる文字列に補正する補正ルールの作成および管理が可能となる。図21(C)は、「とめる」に対する漢字表記について、入力テキストT1の内容により適切に自動補正がかかる登録データ40aの例を示す。
以上では、条件付きの指定に、正規表現を用いる例を説明したが、ユーザ5にとって分かりやすいようなテンプレート等が用いられてもよい。例えば、正規表現を言葉で表現したテンプレートを、図22(B)の補正内容欄65に表示させ、テンプレートの中から好ましいルールを選択した後、具体的な文字列のみを、ユーザ5が設定するようにしてもよい。
例えば、正規表現で(テープ)|.*(止める)という補正ルールを作る際には、「(補正対象文字列)の前に(特定文字列)がある場合にのみ、(補正先の文字列)に補正」といったテンプレートをユーザ5が選択し、補正対象文字列に「止める」、特定文字列に「テープ」、補正先の文字列に「留める」を入力する。こうしたユーザ操作で上述した例と同様の補正ルールを、ユーザ5が直感的に分かりやすく作成することも可能である。又、上記テンプレートの(補正対象文字列)及び(特定文字列)において、例えば図21(C)に示すように、複数の文字列を設定できるようにすれば、より汎用的な補正ルールを作成、管理することが可能となる。
以上では、ユーザ5が補正内容欄64の内容を書き換える例で説明したが、ユーザ5のルール変更を容易にするために、下記の処理が行われてもよい。すなわち、補正元の履歴欄65に表示されているテキストのうち、補正元テキスト(即ち過去の補正履歴)に対しては、補正内容欄64に記載されている内容の補正処理を行い、今回入力された「機械を止める」に対しては補正をかけないルールとなる、正規表現を用いた補正ルール案を、制御部20で作成し、補正内容欄64に表示させてもよい。この際、補正ルール案が複数ある場合には、その中からユーザ5が選択することにより補正内容欄64の内容を変更するようにしてもよい。また上記選択した補正ルール案を必要に応じて加筆、修正して補正内容欄64の内容を変更するようにしてもよい。
さらに、今回入力されたテキスト文の補正対象文字列を例外処理とするのではなく、既に登録されている補正先文字列とは異なる文字列に補正したい場合には、補正対象文字列を新しい補正先文字列へと変換するルールを補正内容欄64に追記することにより所望の補正ルールの作成が可能となる。以後、補正対象文字列を含む様々な入力テキストパターンに対して誤補正が発生する毎に、上記手順を踏んで、補正ルールを更新していけば、図21(C)に示すような補正ルールをユーザ5は容易に作成、管理することが可能となる。
(他の実施形態)
以上のように、本出願において開示する技術の例示として、実施形態1〜4を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置換、付加、省略などを行った実施の形態にも適用可能である。また、上記各実施形態で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。そこで、以下、他の実施形態を例示する。
以上のように、本出願において開示する技術の例示として、実施形態1〜4を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置換、付加、省略などを行った実施の形態にも適用可能である。また、上記各実施形態で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。そこで、以下、他の実施形態を例示する。
上記の実施形態1では、図6(A),(B)等のように表示される手動補正処理について説明した。本実施形態の手動補正処理は、登録される補正ルールがユーザ5に可視化されるように行われてもよい。例えば、表示部23が、図6の補正入力欄63の代わりに、補正ルール表示欄を設けて、図10記載のような登録データ40aの内容を表示してもよい。また、ユーザ5が登録する補正ルールを記述あるいは選択できるようにしてもよい。例えば、実施形態4と同様に登録する補正ルールに正規表現等の形式を採用し、当該形式にて、ユーザ5が直接補正ルールを作成及び更新可能として管理してもよい。
例えば、文字列「遅れる」の前に、「郵便」という文字列が入力テキストT1に含まれている場合には補正対象として、「送れる」に補正を実行するといった自由度の高い補正ルールの作成が可能になる。正規表現の導入により、ITスキルが比較的高いユーザにとって利用し易くすることができる。また、例えばITスキルが高くないユーザのために、正規表現等の複雑なルール化した自動補正内容を別途、同ユーザが理解し易い表現方法にて表示させてもよい。こうした表現方法は、例えば事前に数パターン用意できる。
上記の各実施形態では、補正ルールを適用する自動補正処理を用いたテキスト補正装置について説明した。テキスト補正装置は、自動補正処理には適用されない補正ルールである仮補正ルールを登録可能な動作モードを有してもよい。例えば、仮補正ルールが登録された状態の手動補正処理において仮補正ルールと同じ内容の修正が実施された場合に、テキスト補正装置は、表示部23に仮補正ルールを表示する。又、制御部20は、仮補正ルールの実施回数を計数し、計数結果のカウント値を表示部23に表示させてもよい。さらに、制御部20は、仮補正ルールの実施回数が所定値を超えた場合に、仮補正ルールを補正ルールとして登録するという本登録を自動的に行ってもよい。又、補正ルールの本登録は、自動的に限らず、ユーザ5が所望のタイミングで決定するようにしてもよい。
また、補正ルールDB40における補正ルールの記録を、話者別あるいは発話のシーン別等で個別に管理して、発話時に利用する補正ルールを個別に選択可能にしてもよい。これにより、発話者固有の誤認識、あるいは発話のシーンにより使用頻度が高い同音意義語などに対して、より的確な補正が可能となる。補正ルールの選択には、発話前のユーザ設定、話者識別技術、GPS情報、或いは端末情報を用いた自動判定など種々の方法を採用できる。
また、テキスト補正装置を構成する情報端末等は、図5等の動作を実行する動作モードを補正ルール編集用として有すると共に、別途、通常の動作モードを有してもよい。例えば、通常モードの動作時には、ステップS4,S5,S8,S9が省略され、音声認識結果の取得後に自動補正処理を適宜、実行し、出力テキストが翻訳サーバ11に送信される。これにより、通常モードでは音声認識等の一連の処理を滞りなく進めて、処理期間によるタイムラグを低減できる。又、補正ルール編集用の動作時には、上述したように各テキストT1,T2の確認、並びに補正ルールの確認、追加および修正を行える。動作モードの指定は、例えばユーザ5の発話前に受け付けられる。
又、本実施形態のテキスト補正装置は、音声認識で用いられる辞書に登録されていない未知語といった音声認識では認識され難い単語等を出力テキストT2に含める用途にも適用可能である。例えば、未知語を補正先の文字列とし、辞書に登録済みの特定の認識文字列を補正対象の文字列とする補正ルールを登録しておき、ユーザ5が未知語の代わりに上記特定の認識文字列を発話することで、出力テキストT2に未知語を適切に組み込むことが可能になる。
又、本実施形態のテキスト補正装置は、後段の翻訳サーバ11で用いられる辞書に出力テキストT2を合わせるような用途にも適用可能である。例えば、漢字、かな、アルファベット表記、或いは送り仮名振り表記など、同じ意味であっても表記が異なる単語等に対して、補正ルールを利用することにより、表記の違いによる誤翻訳を解消することができる。
上記の各実施形態では、入力テキストT1が音声認識結果の文字列で構成される例を説明した。本実施形態のテキスト補正装置において、入力テキストT1は、必ずしも音声認識の結果として得られる文字列で構成されなくてもよく、例えばOCR(光学的文字認識)のような文字読み取り装置、機械翻訳、或いは各種の言語処理の結果として得られる文字列で構成されてもよい。又、入力テキストT1は、必ずしも機械的な処理結果として得られる文字列で構成されなくてもよく、種々の観点から得られるテキストであってもよい。これらの場合であっても、テキスト補正装置により、ユーザ5は補正ルールの管理を行うことができる。
以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。
したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
また、上述の実施の形態は、本開示における技術を例示するためのものであるから、特許請求の範囲またはその均等の範囲において、種々の変更、置換、付加、省略などを行うことができる。
本開示は、例えば音声認識処理を行う各種の用途に適用可能であり、例えば音声認識に基づく機械翻訳を用いた翻訳システムに適用可能である。
1 翻訳システム
2 音声認識補正装置
20 制御部
202 自動補正部
21 記憶部
22 操作部
23 表示部
24 機器I/F
25 ネットワークI/F
3 音声認識サーバ
40 補正ルールDB
2 音声認識補正装置
20 制御部
202 自動補正部
21 記憶部
22 操作部
23 表示部
24 機器I/F
25 ネットワークI/F
3 音声認識サーバ
40 補正ルールDB
Claims (16)
- 文字列で構成される入力テキストを補正するテキスト補正装置であって、
前記入力テキストを取得する取得部と、
補正対象とする文字列を補正先の文字列に変更する補正ルールに関する情報を記憶する記憶部と、
取得された入力テキストに基づき、前記補正ルールに従う補正処理の処理結果を示す出力テキストを取得する制御部と、
前記入力テキスト及び前記出力テキストを表示する表示部と、
前記出力テキストを修正するユーザ操作を入力する操作部とを備え、
前記制御部は、前記補正処理によって前記出力テキストにおいて前記入力テキストから変更された文字列を他の文字列に修正するユーザ操作である誤補正の修正操作が入力されたとき、
前記変更前の文字列を前記変更された文字列に変更した補正ルールを示す情報を表示するように前記表示部を制御し、
表示された情報が示す補正ルールを修正するユーザ操作を受け付けるように前記操作部を制御する
テキスト補正装置。 - 前記誤補正の修正操作は、前記出力テキストにおいて前記入力テキストから変更された文字列を変更前の文字列に戻すユーザ操作を含む
請求項1に記載のテキスト補正装置。 - 前記表示部は、前記誤補正の修正操作が入力されたとき、前記補正ルールと、当該補正ルールに従って変更された過去の入力テキストとを表示する
請求項1又は2に記載のテキスト補正装置。 - 前記制御部は、
前記誤補正の修正操作が入力されたときの入力テキストにおける前記変更前の文字列が補正対象とはならない一方で、前記過去の入力テキストにおける文字列が補正対象となるように更新された補正ルールを表示するように前記表示部を制御し、
前記更新された補正ルールを登録するユーザ操作を受け付けるように前記操作部を制御する
請求項3に記載のテキスト補正装置。 - 前記更新された補正ルールは、補正対象の文字列が前記変更前の文字列よりも長い文字列となるように設定される
請求項4に記載のテキスト補正装置。 - 前記操作部は、前記誤補正の修正操作が入力されたときの入力テキストを、前記変更前の文字列を前記変更された文字列に変更する補正ルールに関する例外として指定するユーザ操作を受け付ける
請求項1〜5のいずれか1項に記載のテキスト補正装置。 - 前記補正処理は、前記取得部によって取得された入力テキストが、前記補正ルールに関する例外として指定された入力テキストと合致する場合、前記取得された入力テキストを当該補正ルールで変更しない
請求項6に記載のテキスト補正装置。 - 前記表示部は、前記出力テキストにおいて前記補正処理によって前記入力テキストから変更された文字列と、前記入力テキストにおける変更前の文字列との少なくとも一方を強調表示する
請求項1〜7のいずれか1項に記載のテキスト補正装置。 - 前記表示部は、前記補正ルールが過去に適用された回数を示す情報を表示する
請求項1〜8のいずれか1項に記載のテキスト補正装置。 - 前記操作部は、前記入力テキストに含まれる文字列を指定して、特定の文字列に変更するユーザ操作が入力されたとき、前記指定された文字列を前記特定の文字列に変更する補正ルールを登録するユーザ操作を受け付ける
請求項1〜9のいずれか1項に記載のテキスト補正装置。 - 前記記憶部は、前記補正ルールと過去の入力テキストとを関連付けて記録するデータベースを格納し、
前記制御部は、前記記憶部に格納されたデータベースを参照して前記補正処理を実行して、前記出力テキストを取得する
請求項1〜10のいずれか1項に記載のテキスト補正装置。 - 前記補正ルールと過去の入力テキストとを関連付けて記録するデータベースを管理し、前記補正処理を実行する外部装置と通信する通信部を備え、
前記制御部は、前記外部装置から前記通信部を介して前記出力テキストを取得する
請求項1〜10のいずれか1項に記載のテキスト補正装置。 - 前記入力テキストは、音声を認識する音声認識処理の結果として得られる文字列で構成される
請求項1〜12のいずれか1項に記載のテキスト補正装置。 - 前記出力テキストを、機械翻訳を実行する機械翻訳機に出力する出力部を備える
請求項1〜13のいずれか1項に記載のテキスト補正装置。 - 取得部が、文字列で構成される入力テキストを取得するステップと、
補正部が、取得された入力テキストに基づいて、補正対象とする文字列を補正先の文字列に変更する補正ルールに従う補正処理を実行して、前記補正処理の処理結果を示す出力テキストを生成するステップと、
表示部が、前記入力テキスト及び前記出力テキストを表示するステップと、
操作部が、前記出力テキストを修正するユーザ操作を入力するステップとを含み、さらに、
前記補正処理によって前記出力テキストにおいて前記入力テキストから変更された文字列を他の文字列に修正するユーザ操作が入力されたとき、
前記表示部が、前記変更前の文字列を前記変更された文字列に変更する補正ルールを示す情報を表示するステップと、
前記操作部が、表示された情報が示す補正ルールを修正するユーザ操作を受け付けるステップと
を含むテキスト補正方法。 - 文字列で構成される入力テキストを補正するコンピュータの制御部に実行させるためのプログラムであって、前記制御部に、
前記入力テキストを取得するステップと、
取得された入力テキストに基づき、補正対象とする文字列を補正先の文字列に変更する補正ルールに従う補正処理の処理結果を示す出力テキストを取得するステップとを実行させ、さらに、
前記補正処理によって前記出力テキストにおいて前記入力テキストから変更された文字列を他の文字列に修正するユーザ操作が入力されたとき、
前記変更前の文字列を前記変更された文字列に変更する補正ルールを示す情報を表示するように表示部を制御するステップと、
表示された情報が示す補正ルールを修正するユーザ操作を受け付けるように操作部を制御するステップと
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019102520A JP2020197592A (ja) | 2019-05-31 | 2019-05-31 | テキスト補正装置およびテキスト補正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019102520A JP2020197592A (ja) | 2019-05-31 | 2019-05-31 | テキスト補正装置およびテキスト補正方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020197592A true JP2020197592A (ja) | 2020-12-10 |
Family
ID=73648054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019102520A Pending JP2020197592A (ja) | 2019-05-31 | 2019-05-31 | テキスト補正装置およびテキスト補正方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020197592A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112784612A (zh) * | 2021-01-26 | 2021-05-11 | 浙江香侬慧语科技有限责任公司 | 基于迭代修改的同步机器翻译的方法、装置、介质及设备 |
US20210342524A1 (en) * | 2020-12-25 | 2021-11-04 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for error correction of numerical contents in text, and storage medium |
-
2019
- 2019-05-31 JP JP2019102520A patent/JP2020197592A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210342524A1 (en) * | 2020-12-25 | 2021-11-04 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for error correction of numerical contents in text, and storage medium |
US11526657B2 (en) * | 2020-12-25 | 2022-12-13 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for error correction of numerical contents in text, and storage medium |
CN112784612A (zh) * | 2021-01-26 | 2021-05-11 | 浙江香侬慧语科技有限责任公司 | 基于迭代修改的同步机器翻译的方法、装置、介质及设备 |
CN112784612B (zh) * | 2021-01-26 | 2023-12-22 | 浙江香侬慧语科技有限责任公司 | 基于迭代修改的同步机器翻译的方法、装置、介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103077715B (zh) | 合并语音辨识结果 | |
KR101066741B1 (ko) | 컴퓨터 시스템과 동적으로 상호작용하기 위한 컴퓨터 구현 방법, 시스템, 및 컴퓨터 판독가능 기록 매체 | |
JP6251958B2 (ja) | 発話解析装置、音声対話制御装置、方法、及びプログラム | |
US7389235B2 (en) | Method and system for unified speech and graphic user interfaces | |
KR102191425B1 (ko) | 인터랙티브 캐릭터 기반 외국어 학습 장치 및 방법 | |
KR101042119B1 (ko) | 음성 이해 시스템, 및 컴퓨터 판독가능 기록 매체 | |
JP4516112B2 (ja) | 音声認識プログラム | |
JP2017058673A (ja) | 対話処理装置及び方法と知能型対話処理システム | |
KR20190021143A (ko) | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 | |
US7742924B2 (en) | System and method for updating information for various dialog modalities in a dialog scenario according to a semantic context | |
JP2006349954A (ja) | 対話システム | |
CN108108094A (zh) | 一种信息处理方法、终端及计算机可读介质 | |
US20230223016A1 (en) | User interface linking analyzed segments of transcripts with extracted key points | |
JP2016061855A (ja) | 音声学習装置および制御プログラム | |
JP2020197592A (ja) | テキスト補正装置およびテキスト補正方法 | |
US11615788B2 (en) | Method for executing function based on voice and electronic device supporting the same | |
CN109344374A (zh) | 基于大数据的报表生成方法及装置、电子设备、存储介质 | |
JP5396530B2 (ja) | 音声認識装置および音声認識方法 | |
US10658074B1 (en) | Medical transcription with dynamic language models | |
JP5160594B2 (ja) | 音声認識装置および音声認識方法 | |
WO2017159207A1 (ja) | 処理実行装置、処理実行装置の制御方法、および制御プログラム | |
US20220100959A1 (en) | Conversation support device, conversation support system, conversation support method, and storage medium | |
JP2006236037A (ja) | 音声対話コンテンツ作成方法、装置、プログラム、記録媒体 | |
US20210064640A1 (en) | Information processing apparatus and information processing method | |
WO2021205832A1 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |