JPWO2020065695A1 - 文字入力支援装置、文字入力システム、および文字入力支援方法 - Google Patents

文字入力支援装置、文字入力システム、および文字入力支援方法 Download PDF

Info

Publication number
JPWO2020065695A1
JPWO2020065695A1 JP2020547612A JP2020547612A JPWO2020065695A1 JP WO2020065695 A1 JPWO2020065695 A1 JP WO2020065695A1 JP 2020547612 A JP2020547612 A JP 2020547612A JP 2020547612 A JP2020547612 A JP 2020547612A JP WO2020065695 A1 JPWO2020065695 A1 JP WO2020065695A1
Authority
JP
Japan
Prior art keywords
character
input
character string
user
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020547612A
Other languages
English (en)
Other versions
JP7058749B2 (ja
Inventor
聡 吉川
聡 吉川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2020065695A1 publication Critical patent/JPWO2020065695A1/ja
Application granted granted Critical
Publication of JP7058749B2 publication Critical patent/JP7058749B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Abstract

文字入力支援装置(10)において、手入力文字認識部(11)は、ユーザにより少なくとも一部分が手入力された文字を認識する。予測候補生成部(12)は、ユーザが手入力した文字に基づいて、ユーザが入力しようとしている1文字以上の文字からなる文字列の予測候補を生成する。絞り込み情報取得部(13)は、ユーザが発話した音声から、文字列の手掛かりとなる情報であり、文字列全体の読み以外の情報を含む絞り込み情報を取得する。絞り込み処理部(14)は、絞り込み情報取得部(13)が取得した絞り込み情報に基づいて、予測候補生成部(12)が生成した文字列の予測候補の絞り込みを行う。

Description

本発明は、文字の入力を支援する文字入力支援装置に関するものである。
一般に、電子機器への文字入力は、ユーザがキーボードやタッチパネルを手で操作して行われる。また、手書き文字の認識技術を利用して、ユーザが手でマウスを動かしたりタッチパネルをなぞったりして画面上に文字を綴ることで文字を入力すること(手書き文字入力)を可能にした電子機器も普及している。以下、ユーザが手を使って文字等を入力することを「手入力」という。
ユーザが文字を手入力する際に、入力される文字列を予測し、予測の結果得られた文字列の候補(以下「予測候補」という)をユーザに提示して選択させることで、文字入力の効率化を図る文字入力システムが知られている。例えば下記の特許文献1には、ユーザが文字を手入力するとともに、入力する文字列の読みを音声入力することができ、その読みに基づいて文字列の予測候補の絞り込みを行う文字入力システムが提案されている。
特開昭60−189070号公報
特許文献1の文字入力システムでは、入力される文字列の読みに基づいて文字列の予測候補が絞り込まれるため、より効率的な文字入力を実現できる。しかし、特許文献1の技術は、ユーザが入力する文字列全体の読みを知っていることが前提となっており、ユーザが文字列の読みの一部または全部を知らない場合には適用が困難である。特に、漢字など、複数の読みを持つ文字を有する言語では、ユーザが読み方の分からない文字列を入力したい場面は少なくない。
本発明は以上のような課題を解決するためになされたものであり、ユーザが手入力する文字列全体の読みを知らない場合でも、音声入力を利用した文字列の予測候補の絞り込みを行うことが可能な文字入力支援装置を提供することを目的とする。
本発明に係る文字入力支援装置は、ユーザにより少なくとも一部分が手入力された文字を認識する手入力文字認識部と、手入力された文字に基づいて、ユーザが入力しようとしている1文字以上の文字からなる文字列の予測候補を生成する予測候補生成部と、ユーザが発話した音声から、文字列の手掛かりとなる情報であり、文字列全体の読み以外の情報を含む絞り込み情報を取得する絞り込み情報取得部と、絞り込み情報に基づいて、文字列の予測候補の絞り込みを行う絞り込み処理部と、を備える。
本発明に係る文字入力支援装置によれば、ユーザは、手入力する文字列全体の読み以外の絞り込み情報を音声入力することができ、その絞り込み情報に基づいて文字列の予測候補の絞り込みが行われる。そのため、ユーザが手入力する文字列全体の読みを知らない場合でも、音声入力を利用した文字列の予測候補の絞り込みを行うことが可能である。
本発明の目的、特徴、態様、および利点は、以下の詳細な説明と添付図面とによって、より明白となる。
実施の形態1に係る文字入力システムの構成を示す図である。 実施の形態1に係る文字入力システムの動作の例を説明するための図である。 実施の形態1に係る文字入力システムの動作の例を説明するための図である。 実施の形態1に係る文字入力システムの動作の例を説明するための図である。 実施の形態1に係る文字入力システムの動作の例を説明するための図である。 実施の形態1に係る文字入力システムの動作の例を説明するための図である。 実施の形態1に係る文字入力システムの動作の例を説明するための図である。 実施の形態1に係る文字入力システムの動作の例を説明するための図である。 実施の形態1に係る文字入力システムの動作の例を説明するための図である。 実施の形態1に係る文字入力システムの動作の例を説明するための図である。 実施の形態1に係る文字入力システムの動作の例を説明するための図である。 実施の形態1に係る文字入力システムの動作の例を説明するための図である。 実施の形態1に係る文字入力システムの動作の例を説明するための図である。 実施の形態1に係る文字入力システムの動作の例を説明するための図である。 実施の形態1に係る文字入力支援装置の動作を示すフローチャートである。 実施の形態1に係る文字入力支援装置の絞り込み情報取得部の動作を示すフローチャートである。 文字入力支援装置のハードウェア構成例を示す図である。 文字入力支援装置のハードウェア構成例を示す図である。 実施の形態2に係る文字入力システムの動作の例を説明するための図である。 実施の形態2に係る文字入力システムの動作の例を説明するための図である。 実施の形態2に係る文字入力システムの動作の例を説明するための図である。 実施の形態2に係る文字入力システムの動作の例を説明するための図である。 実施の形態2に係る文字入力システムの動作の例を説明するための図である。 実施の形態2に係る文字入力システムの動作の例を説明するための図である。 実施の形態2に係る文字入力システムの動作の例を説明するための図である。 実施の形態2に係る文字入力システムの動作の例を説明するための図である。
<実施の形態1>
図1は、本発明の実施の形態1に係る文字入力システムの構成を示す図である。図1のように、当該文字入力システムは、文字入力支援装置10と、それに接続された表示装置21、操作入力装置22および音声入力装置23とを備えている。
表示装置21は、文字入力支援装置10が各種の情報を文字や画像でユーザに提示するための手段であり、例えば液晶表示装置などで構成される。操作入力装置22は、ユーザが文字入力支援装置10に対する操作を入力するための手段であり、例えばキーボード、マウス、タッチパッドなどで構成される。音声入力装置23は、ユーザが発話した音声を文字入力支援装置10に入力するための手段であり、一般的にはマイクである。
本実施の形態では、操作入力装置22は、表示装置21の画面上に配置された透明なタッチパッドであり、表示装置21および操作入力装置22は1つのタッチパネル25を構成しているものとする。そのため以下の説明では、例えば、表示装置21の画面を「タッチパネル25の画面」と表現したり、操作入力装置22の操作を「タッチパネル25の操作」と表現したりする場合もある。
図1に示すように、文字入力支援装置10は、手入力文字認識部11、予測候補生成部12、絞り込み情報取得部13、絞り込み処理部14および表示処理部15を備えている。
手入力文字認識部11は、ユーザが操作入力装置22を用いて手入力した文字を認識する。特に、文字の入力が手書き文字入力によって行われる場合、手入力文字認識部11は、一部分だけが手書きされた文字、つまり手書きの途中段階の文字を認識することもできる。
予測候補生成部12は、ユーザが入力可能な文字列の辞書を有しており、手入力文字認識部11によって認識された文字または文字の一部分に基づいて、ユーザが入力しようとしている文字列を予測し、文字列の予測候補を生成する。なお、「文字列」は、複数の文字からなるとは限らず、1つの文字のみからなる場合もある。そのため、予測候補生成部12は、1文字以上の文字からなる文字列の予測候補を生成する。
絞り込み情報取得部13は、音声入力装置23に入力されたユーザの音声から、ユーザが入力しようとしている文字列の手掛かりとなる情報である「絞り込み情報」を取得する。絞り込み情報には文字列全体の読み以外の情報が含まれる。本実施の形態では、絞り込み情報は、
(a)文字列の文字数の情報
(b)文字列における手入力された文字の位置を示す情報
(c)文字列の文字数と、文字列における手入力された文字の位置との組み合わせからなる情報
(d)文字列の一部の読みと、文字列における当該一部の読みに対応する文字の位置との組み合わせからなる情報
(e)手入力された文字の形状に関する情報
のいずれであるものとする。
なお、絞り込み情報には、
(f)文字列全体の読みの情報
が含まれても問題は無い。ただし、情報(f)については、特許文献1の技術と同様にユーザが文字列全体の読みを知っていることが前提となるため、本明細書での説明は省略する。
絞り込み処理部14は、絞り込み情報取得部13が取得した絞り込み情報に基づいて、予測候補生成部12が生成した文字列の予測候補の絞り込みを行う。
表示処理部15は、ユーザが文字を入力するための入力画面(文字入力画面)や、予測候補生成部12が生成した文字列の予測候補(または絞り込み情報取得部13による絞り込み後の予測候補)、入力が確定した文字列、などを表示装置21(タッチパネル25)の画面に表示させ、それによって、ユーザに文字の入力環境を提供する。
なお、図1に示した各要素の機能の一部は、例えば文字入力支援装置10と通信可能なサーバなど、文字入力支援装置10の外部装置上で実現されてもよい。例えば、手入力文字認識部11が手書き文字を認識するための画像認識(手書き文字認識)の処理や、絞り込み情報取得部13が行う音声認識の処理など、演算負荷の高い処理を外部のサーバで行ってもよい。それにより、文字入力支援装置10の演算負荷の低減を図ることができる。また、例えば絞り込み処理部14が予測候補の生成に使用する文字列の辞書をサーバ上に設けてもよい。それにより、文字入力支援装置10に必要とされる記憶容量の低減を図ることができる。
次に、実施の形態1に係る文字入力システムの動作の具体例を示す。実施の形態1に係る文字入力システムは、携帯電話やスマートフォン、パーソナルコンピュータ、ナビゲーション装置など、ユーザによる文字入力が行われるあらゆる電子機器に適用可能であるが、ここでは当該文字入力システムがスマートフォンに適用されたものと仮定し、文字入力支援装置10は、タッチパネル25に、図2のような文字入力画面を表示させるものとする。図2の文字入力画面は、ユーザが文字を手入力するための操作を行う領域である手入力操作領域101と、ユーザが入力する文字の予測候補が表示される領域である予測候補表示領域102と、入力が確定した文字列が表示される領域である確定文字表示領域103とを備えている。またここでは、手入力操作領域101は、ユーザが手書き文字入力を行う領域であるものとする。
例えば、ユーザが「特許」(読み:とっきょ)という文字列を入力する場合を考える。この場合、まず、ユーザは手入力操作領域101をなぞって「特」の文字を書く。図2には、ユーザが「特」の文字の牛偏の部分を書いた状態が示されている。この状態では、手入力文字認識部11は、手入力操作領域101に書かれた牛偏を認識し、予測候補生成部12は、牛偏を持つ文字(漢字)を含む文字列を予測候補として生成する。予測候補生成部12が生成した予測候補は、予測候補表示領域102に表示される。図2の例では、「物」、「特」、「物体」、「生物」、「特別」、「特許」などの予測候補が予測候補表示領域102に表示されている。
ユーザは、予測候補表示領域102に表示された予測候補のうちから、入力する文字列を、タッチ操作で選択することができる。ユーザが予測候補のいずれかを選択すると、選択された文字列が、ユーザが入力する文字列として確定し、図3のように、確定した文字列(ここでは「特許」)が確定文字表示領域103に挿入される。
また、ユーザは、文字を手入力しながら、上記の情報(a)〜(e)のような絞り込み情報を、音声入力装置23を通して文字入力支援装置10に入力できる。例えば図2の状態で、予測候補を2文字の文字列に絞り込みたい場合、ユーザは「2文字」と発話すればよい。ユーザの音声は、音声入力装置23から絞り込み情報取得部13に入力され、絞り込み情報取得部13は、当該音声から、ユーザが入力する文字列は2文字であるという絞り込み情報(情報(a)に相当)を取得する。
絞り込み処理部14は、その絞り込み情報に基づいて、予測候補を、牛偏を持つ文字を含み、且つ、2文字の文字列に絞り込み、表示処理部15は、絞り込み後の予測候補を予測候補表示領域102に表示させる。その結果、図4のように、予測候補表示領域102には、牛偏を持つ文字を含む2文字の予測候補(「物体」、「生物」、「特別」、「特許」など)のみが表示される。このように、予測候補が絞り込まれることで、予測候補表示領域102に表示される予測候補の数が少なくなるため、ユーザは予測候補の中から入力したい文字列(ここでは「特許」)を素早く見つけ出すことができ、文字入力が効率化される。
さらに図4の状態から、ユーザが、予測候補を、手入力した文字を1文字目に含む文字列に絞り込みたい場合、「1文字目」と発話すればよい。絞り込み情報取得部13は、当該音声から、手入力された文字が入力される文字列の1文字目であるという絞り込み情報(情報(b)に相当)を取得する。
絞り込み処理部14は、その絞り込み情報に基づいて、予測候補を、1文字目に牛偏を持つ文字列にさらに絞り込む。その結果、図5のように、予測候補表示領域102には、2文字からなり、且つ、1文字目に牛偏を持つ文字列のみが表示される。このように、ユーザは、複数の絞り込み情報を連続して発話することで、予測候補を段階的に絞り込むことができる。
ここでは、ユーザが、文字を手入力した後に、絞り込み情報の音声入力を行う例を示したがその順番に制約はない。すなわち、ユーザは、先に絞り込み情報の音声入力を行い、その後に文字を手入力してもよい。例えば、ユーザが文字を手入力する前に「2文字」と発話すると、絞り込み処理部14は、絞り込み情報取得部13が生成する予測候補を2文字の文字列に制限する。その後、ユーザが牛偏を手入力すると、絞り込み処理部14は、牛偏を持つ文字を含む2文字の文字列を予測候補として生成し、結果として、図4と同じ状態になる。
また、ユーザは、文字の手入力と、絞り込み情報の音声入力とを、並列あるいは交互に行うこともできる。例えば、ユーザが、図4の状態から「特」の文字を書き上げ、さらに「1文字目」と発話すると、絞り込み処理部14は、予測候補を、1文字目が「特」であり、且つ、2文字の文字列に絞り込む。その結果、図6のように、予測候補表示領域102には、1文字目が「特」の2文字の文字列(「特別」、「特許」など)のみが予測候補として表示される。
図2〜図6では、ユーザが、入力する文字列の1文字目(「特許」の「特」の文字)から入力した例を示したが、ユーザは文字列のどの文字から入力してもよい。例えば、ユーザが1文字目の漢字は書けないが、2文字目や3文字目は書けるような場合もある。
例えば、ユーザが「特許」の2文字目の「許」から入力する場合を考える。ユーザが手入力操作領域101に「許」の文字を書くと、予測候補生成部12は、「許」の文字を含む文字列を予測候補として生成する。そして、ユーザが「2文字目」と発話すると、絞り込み情報取得部13が、手入力された文字が入力される文字列の2文字目であるという絞り込み情報(情報(b)に相当)を取得し、絞り込み処理部14が、図7のように、予測候補を2文字目に「許」を含む文字列に絞り込む。図7の例では、「特許」、「免許」、「特許権」、「免許皆伝」などの予測候補が予測候補表示領域102に表示されている。
また図7の状態で、予測候補を2文字の文字列に絞り込みたい場合、ユーザは「2文字」と発話すればよい。その場合、絞り込み情報取得部13は、当該音声から、ユーザが入力する文字列は2文字であるという絞り込み情報(情報(a)に相当)を取得し、絞り込み処理部14は、予測候補を2文字の文字列にさらに絞り込む。その結果、図8のように、予測候補表示領域102には、2文字からなり、且つ、2文字目に「許」を含む文字列(「特許」、「免許」など)のみが表示される。
ユーザは、音声入力による予測候補の絞り込みを行う際、入力する文字列の文字数の情報と、入力した文字の位置の情報とを同時に発話してもよい。例えば、「特許」の文字列を入力する場合、ユーザが最初に手入力操作領域101に「許」の文字を書くと、予測候補生成部12は「許」の文字を含む文字列を予測候補として生成する。そして、ユーザが「2文字中、2文字目」と発話すると、絞り込み情報取得部13が、入力される文字列は2文字であり、手入力された文字はその文字列の2文字目であるという絞り込み情報(情報(c)に相当)を取得する。この場合、絞り込み処理部14は、図9のように、予測候補を、2文字からなり、且つ、2文字目に「許」を含む文字列に絞り込む。すなわち、図8と同じ状態になる。
また、ユーザは、音声入力による予測候補の絞り込みを行う際、入力する文字列の一部の読みと、文字列における当該一部の読みに対応する文字の位置との組み合わせからなる絞り込み情報(情報(d))を、音声で文字入力支援装置10に入力してもよい。例えば、ユーザが「特許」の文字列を入力するために、手入力操作領域101に「特」の牛偏を書くと、予測候補生成部12は、牛偏を持つ文字を含む文字列を予測候補として生成する。そして、ユーザが「2文字目の読みが『きょ』」と発話すると、絞り込み情報取得部13が、入力される文字列の2文字目は「きょ」と読むという絞り込み情報を取得する。この場合、絞り込み処理部14は、図10のように、予測候補を、牛偏を持つ文字を含み、且つ、2文字目の読みが「きょ」である文字列(「特許」(読み:とっきょ)、「特許権」(読み:とっきょけん)など)に絞り込む。
また、ユーザは、手入力された文字の形状に関する絞り込み情報(情報(e))を、音声で文字入力支援装置10に入力してもよい。例えば図11のように、ユーザが手入力操作領域101に「特」の牛偏の一部までしか書いていない状態では、それが「牛」の形を持つ牛偏の一部なのか、「矢」の形を持つ矢偏の一部なのか区別がつかない。そのため、予測候補生成部12が生成する予測候補には、牛偏を持つ文字を含む文字列だけでなく、矢偏を持つ文字を含む文字列も含まれることになる。よって、図11のように、予測候補表示領域102には、「知」、「短」、「物」、「特」など、牛偏を持つ文字を含む文字列と、矢偏を持つ文字を含む文字列との両方が、予測候補として表示される。
図11の状態で、ユーザが「左部分が『牛』っぽい」と発話すると、絞り込み情報取得部13が、手入力された文字の左部分は「牛」に似た形状であるという絞り込み情報を取得する。この場合、絞り込み処理部14は、図12のように、予測候補を、牛偏を持つ文字を含む文字列(「物」、「特」など)に絞り込む。
また、以上の説明では、ユーザが手書き文字入力によって文字を入力する例を示したが、ユーザが文字を手入力する方法はこれに限られず、例えば、キーボードを用いた文字入力でもよい。図13は、手入力操作領域101がソフトウェアキーボードで構成された例である。ユーザは、ソフトウェアキーボードを用いて「特」の文字を手入力した後、「2文字」と発話すると、図14のように予測候補が「特」の文字を含む2文字の文字列に絞り込まれる。なお、ユーザが文字を手入力するためのキーボードは、ハードウェアのキーボードでもよい。
また、表示処理部15が表示装置21(タッチパネル25)に表示させる文字入力画面の構成は、上に示した例に限られず、ユーザが文字を手入力する際に、入力する文字列の予測候補をユーザに提示できるものであれば、任意の構成でよい。
図15は、文字入力支援装置10の動作を示すフローチャートである。また図16は、文字入力支援装置10の絞り込み情報取得部13の動作を示すフローチャートである。図15のフローは、ユーザが文字の手入力を開始すると起動し、図16のフローは、ユーザの音声が音声入力装置23を通して文字入力支援装置10に入力されると起動し、両フローは並行して実行される。以下、図15および図16のフローチャートを参照しつつ、文字入力支援装置10の動作を説明する。
ユーザが操作入力装置22を用いて文字の手入力を開始すると、図15のフローが起動し、手入力文字認識部11が、ユーザが手入力した文字または文字の一部を認識する(ステップS101)。そして、予測候補生成部12が、手入力文字認識部11の認識結果に基づいて、文字列の予測候補を生成する(ステップS102)。
次に、文字入力支援装置10は、絞り込み情報取得部13が図16の処理で絞り込み情報を取得したか否かを確認する(ステップS103)。絞り込み情報取得部13が絞り込み情報を取得していた場合(ステップS103でYES)、絞り込み処理部14は、その絞り込み情報に基づいて、予測候補の絞り込みを行う(ステップS104)。そして、表示処理部15は、絞り込み処理部14によって絞り込みがなされた後の予測候補を、予測候補表示領域102に表示させる(ステップS105)。絞り込み情報取得部13が絞り込み情報を取得していない場合(ステップS103でNO)は、現状の予測候補が維持されて、予測候補表示領域102に表示される。
その後、文字入力支援装置10は、ユーザによる文字の手入力または絞り込み情報の音声入力が継続中か否かを確認する(ステップS106)。文字入力または音声入力が継続中であれば(ステップS106でYES)、ステップS101へ戻る。
文字入力または音声入力が継続中でなければ(ステップS106でNO)、文字入力支援装置10は、ユーザが予測候補から文字列を選択するのを待ち、ユーザにより選択された文字列を、ユーザが入力する文字列として確定する(ステップS107)。最後に、表示処理部15が、確定した文字列を確定文字表示領域103に挿入し(ステップS108)、図15のフローは終了する。
ここで、図16を用いて、絞り込み情報取得部13が絞り込み情報を取得する処理について説明する。
ユーザの音声が音声入力装置23を通して文字入力支援装置10に入力されると、絞り込み情報取得部13がその音声を認識する(ステップS201)。絞り込み情報取得部13は、認識したユーザの音声から、ユーザが入力する文字列の文字数の情報(ステップS202)、文字列における手入力された文字の位置を示す情報(ステップS203)、文字列の一部の読みと、文字列における当該一部の読みに対応する文字の位置との組み合わせからなる情報(ステップS204)、手入力された文字の形状に関する情報(ステップS205)を抽出する。
そして、絞り込み情報取得部13は、ステップS202〜ステップS205でいずれかの情報が抽出されたか否かを確認する(ステップS206)。いずれかの情報が抽出されていれば(ステップS206でYES)、その情報を絞り込み情報として取得し、取得した絞り込み情報を予測候補生成部12へ入力する(ステップS207)。いずれかの情報が抽出されていなければ(ステップS206でNO)、絞り込み情報取得部13は絞り込み情報を取得せず、図16の処理は終了する。
なお、上記の情報(c)(文字列の文字数と、文字列における手入力された文字の位置との組み合わせからなる情報)は、ステップS202,S203で抽出された情報を組み合わせて作成される。また、図16のフローに、絞り込み情報として上記の情報(f)(文字列全体の読みの情報)を抽出するステップが含まれていてもよい。
図17および図18は、それぞれ文字入力支援装置10のハードウェア構成の例を示す図である。図1に示した文字入力支援装置10の構成要素の各機能は、例えば図17に示す処理回路50により実現される。すなわち、文字入力支援装置10は、ユーザにより少なくとも一部分が手入力された文字を認識し、手入力された文字に基づいて、ユーザが入力しようとしている1文字以上の文字からなる文字列の予測候補を生成し、ユーザが発話した音声から、文字列の手掛かりとなる情報であり、文字列全体の読み以外の情報を含む絞り込み情報を取得し、絞り込み情報に基づいて、文字列の予測候補の絞り込みを行うための処理回路50を備える。処理回路50は、専用のハードウェアであってもよいし、メモリに格納されたプログラムを実行するプロセッサ(中央処理装置(CPU:Central Processing Unit)、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、DSP(Digital Signal Processor)とも呼ばれる)を用いて構成されていてもよい。
処理回路50が専用のハードウェアである場合、処理回路50は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、またはこれらを組み合わせたものなどが該当する。文字入力支援装置10の構成要素の各々の機能が個別の処理回路で実現されてもよいし、それらの機能がまとめて一つの処理回路で実現されてもよい。
図18は、処理回路50がプログラムを実行するプロセッサ51を用いて構成されている場合における文字入力支援装置10のハードウェア構成の例を示している。この場合、文字入力支援装置10の構成要素の機能は、ソフトウェア等(ソフトウェア、ファームウェア、またはソフトウェアとファームウェアとの組み合わせ)により実現される。ソフトウェア等はプログラムとして記述され、メモリ52に格納される。プロセッサ51は、メモリ52に記憶されたプログラムを読み出して実行することにより、各部の機能を実現する。すなわち、文字入力支援装置10は、プロセッサ51により実行されるときに、ユーザにより少なくとも一部分が手入力された文字を認識する処理と、手入力された文字に基づいて、ユーザが入力しようとしている1文字以上の文字からなる文字列の予測候補を生成する処理と、ユーザが発話した音声から、文字列の手掛かりとなる情報であり、文字列全体の読み以外の情報を含む絞り込み情報を取得する処理と、絞り込み情報に基づいて、文字列の予測候補の絞り込みを行う処理と、が結果的に実行されることになるプログラムを格納するためのメモリ52を備える。換言すれば、このプログラムは、文字入力支援装置10の構成要素の動作の手順や方法をコンピュータに実行させるものであるともいえる。
ここで、メモリ52は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリー、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)などの、不揮発性または揮発性の半導体メモリ、HDD(Hard Disk Drive)、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD(Digital Versatile Disc)およびそのドライブ装置等、または、今後使用されるあらゆる記憶媒体であってもよい。
以上、文字入力支援装置10の構成要素の機能が、ハードウェアおよびソフトウェア等のいずれか一方で実現される構成について説明した。しかしこれに限ったものではなく、文字入力支援装置10の一部の構成要素を専用のハードウェアで実現し、別の一部の構成要素をソフトウェア等で実現する構成であってもよい。例えば、一部の構成要素については専用のハードウェアとしての処理回路50でその機能を実現し、他の一部の構成要素についてはプロセッサ51としての処理回路50がメモリ52に格納されたプログラムを読み出して実行することによってその機能を実現することが可能である。
以上のように、文字入力支援装置10は、ハードウェア、ソフトウェア等、またはこれらの組み合わせによって、上述の各機能を実現することができる。
<実施の形態2>
実施の形態1では、文字入力支援装置10による日本語入力の例を示したが、文字入力支援装置10は日本語以外のあらゆる言語(例えば、中国語、韓国語、ゲルマン系言語(例えば英語、ドイツ語等)、ラテン系言語(例えばイタリア語、スペイン語、フランス語等)、スラブ系言語(例えばロシア語等)など)の入力適用可能である。実施の形態2では、文字入力支援装置10を英語入力に適用した例を示す。
実施の形態2でも、文字入力支援装置10の表示処理部15は、表示装置21としてのタッチパネル25の画面に、ユーザが文字を手入力するための操作を行う領域である手入力操作領域101と、ユーザが入力する文字の予測候補が表示される領域である予測候補表示領域102と、入力が確定した文字列が表示される領域である確定文字表示領域103とを含む図19のような文字入力画面を表示させるものとする。また、手入力操作領域101は、ユーザが手書き文字入力を行う領域であるものとする。
例えば、ユーザが「patent」という文字列を入力する場合を考える。この場合、まず、ユーザはタッチパネル25(操作入力装置22)の手入力操作領域101をなぞって「p」の文字を書く。図19には、ユーザが「p」の文字の部分を書いた状態が示されている。この状態では、手入力文字認識部11は、手入力操作領域101に書かれた「p」の文字を認識し、予測候補生成部12は、「p」を含む単語を文字列の予測候補として生成する。予測候補生成部12が生成した予測候補は、予測候補表示領域102に表示される。図19の例では、「paint」、「paper」、「park」、「party」、「pass」、「patent」などの予測候補が予測候補表示領域102に表示されている。
ユーザは、予測候補表示領域102に表示された予測候補のうちから、入力する文字列を、タッチ操作で選択することができる。ユーザが予測候補のいずれかを選択すると、選択された文字列が、ユーザが入力する文字列として確定し、図20のように、確定した文字列(ここでは「patent」)が確定文字表示領域103に挿入される。
また、ユーザは、文字を手入力しながら、絞り込み情報を音声入力装置23を通して文字入力支援装置10に入力できる。例えば図19の状態で、ユーザが予測候補を6文字の単語に絞り込みたい場合、「6文字」と発話すればよい。ユーザの音声は、音声入力装置23から絞り込み情報取得部13に入力され、絞り込み情報取得部13は、当該音声から、ユーザが入力する文字列は6文字であるという絞り込み情報(情報(a)に相当)を取得する。
絞り込み処理部14は、その絞り込み情報に基づいて、予測候補を6文字の文字列に絞り込み、表示処理部15は、絞り込み後の予測候補を予測候補表示領域102に表示させる。その結果、図21のように、予測候補表示領域102には6文字の予測候補(「packet」、「patent」など)のみが表示される。このように、予測候補が絞り込まれることで、予測候補表示領域102に表示される予測候補の数が少なくなるため、ユーザは予測候補の中から入力したい文字列(ここでは「patent」)を素早く見つけ出すことができ、文字入力が効率化される。
上では、ユーザが、入力する文字列の1文字目(「patent」の「p」の文字)から入力した例を示したが、ユーザは文字列のどの文字から入力してもよい。例えば、ユーザが「patent」の5文字目の「n」から入力する場合を考える。ユーザが手入力操作領域101に「n」の文字を書くと、予測候補生成部12は、「n」の文字を含む文字列を予測候補として生成する。そして、ユーザが「5文字目」と発話すると、絞り込み情報取得部13が、手入力された文字が入力される文字列の5文字目であるという絞り込み情報(情報(b)に相当)を取得し、絞り込み処理部14が、図22のように、予測候補を5文字目に「n」を含む単語に絞り込む。図22の例では、「begin」、「ground」、「patent」などの予測候補が予測候補表示領域102に表示されている。
また図22の状態で、予測候補を6文字の文字列に絞り込みたい場合、ユーザは「6文字」と発話すればよい。その場合、絞り込み情報取得部13は、当該音声から、ユーザが入力する文字列は6文字であるという絞り込み情報(情報(a)に相当)を取得し、絞り込み処理部14は、予測候補を6文字の文字列にさらに絞り込む。その結果、図23のように、予測候補表示領域102には、6文字からなり、且つ、5文字目に「n」を含む文字列(「ground」、「patent」など)のみが表示される。このように、ユーザは、複数の絞り込み情報を連続して発話することで、予測候補を段階的に絞り込むことができる。
ユーザは、音声入力による予測候補の絞り込みを行う際、入力する文字列の文字数の情報と、入力した文字の位置の情報とを同時に発話してもよい。例えば、「patent」の文字列を入力する場合、ユーザが最初に手入力操作領域101に「n」の文字を書くと、予測候補生成部12は「n」の文字を含む文字列を予測候補として生成する。そして、ユーザが「6文字中、5文字目」と発話すると、絞り込み情報取得部13が、入力される文字列は6文字であり、手入力された文字はその文字列の5文字目であるという絞り込み情報(情報(c)に相当)を取得する。この場合、絞り込み処理部14は、図24のように、予測候補を、6文字からなり、且つ、5文字目に「n」を含む単語に絞り込む。すなわち、図23と同じ状態になる。
以上では、ユーザが手書き文字入力によって文字を入力する例を示したが、ユーザが文字を手入力する方法はこれに限られず、例えば、キーボードを用いた文字入力でもよい。図25は、手入力操作領域101がソフトウェアキーボードで構成された例である。ユーザは、ソフトウェアキーボードを用いて「p」の文字を手入力した後、「6文字」と発話すると、図26のように予測候補が「p」の文字を含む6文字の文字列に絞り込まれる。なお、ユーザが文字を手入力するためのキーボードは、ハードウェアのキーボードでもよい。
また、表示処理部15が表示装置21(タッチパネル25)に表示させる文字入力画面の構成は、上に示した例に限られず、ユーザが文字を手入力する際に、入力する文字列の予測候補をユーザに提示できるものであれば、任意の構成でよい。
なお、本発明は、その発明の範囲内において、各実施の形態を自由に組み合わせたり、各実施の形態を適宜、変形、省略したりすることが可能である。
本発明は詳細に説明されたが、上記した説明は、すべての態様において、例示であって、この発明がそれに限定されるものではない。例示されていない無数の変形例が、この発明の範囲から外れることなく想定され得るものと解される。
10 文字入力支援装置、11 手入力文字認識部、12 予測候補生成部、13 絞り込み情報取得部、14 絞り込み処理部、15 表示処理部、21 表示装置、22 操作入力装置、23 音声入力装置、25 タッチパネル、101 手入力操作領域、102 予測候補表示領域、103 確定文字表示領域、50 処理回路、51 プロセッサ、52 メモリ。

Claims (10)

  1. ユーザにより少なくとも一部分が手入力された文字を認識する手入力文字認識部と、
    前記手入力された文字に基づいて、前記ユーザが入力しようとしている1文字以上の文字からなる文字列の予測候補を生成する予測候補生成部と、
    前記ユーザが発話した音声から、前記文字列の手掛かりとなる情報であり、前記文字列全体の読み以外の情報を含む絞り込み情報を取得する絞り込み情報取得部と、
    前記絞り込み情報に基づいて、前記文字列の予測候補の絞り込みを行う絞り込み処理部と、
    を備える文字入力支援装置。
  2. 前記絞り込み情報は、前記文字列の文字数の情報を含む、
    請求項1に記載の文字入力支援装置。
  3. 前記絞り込み情報は、前記文字列における前記手入力された文字の位置を示す情報を含む、
    請求項1に記載の文字入力支援装置。
  4. 前記絞り込み情報は、前記文字列の文字数と、前記文字列における前記手入力された文字の位置との組み合わせからなる情報を含む、
    請求項1に記載の文字入力支援装置。
  5. 前記絞り込み情報は、前記文字列の一部の読みと、前記文字列における前記一部の読みに対応する文字の位置との組み合わせからなる情報を含む、
    請求項1に記載の文字入力支援装置。
  6. 前記絞り込み情報は、前記手入力された文字の形状に関する情報を含む、
    請求項1に記載の文字入力支援装置。
  7. 前記文字列の予測候補を表示装置に表示させる表示処理部をさらに備え、
    前記表示処理部は、前記文字列の予測候補の絞り込みが行われると、絞り込み後の予測候補を前記表示装置に表示させる
    請求項1に記載の文字入力支援装置。
  8. 請求項7に記載の文字入力支援装置と、
    前記表示装置と、
    を備える文字入力システム。
  9. 請求項1に記載の文字入力支援装置と、
    手入力の操作を受け付ける操作入力装置と、
    を備える文字入力システム。
  10. 文字入力支援装置の手入力文字認識部が、ユーザにより少なくとも一部分が手入力された文字を認識し、
    前記文字入力支援装置の予測候補生成部が、前記手入力された文字に基づいて、前記ユーザが入力しようとしている1文字以上の文字からなる文字列の予測候補を生成し、
    前記文字入力支援装置の絞り込み情報取得部が、前記ユーザが発話した音声から、前記文字列の手掛かりとなる情報であり、前記文字列全体の読み以外の情報を含む絞り込み情報を取得し、
    前記文字入力支援装置の絞り込み処理部が、前記絞り込み情報に基づいて、前記文字列の予測候補の絞り込みを行う
    文字入力支援方法。
JP2020547612A 2018-09-25 2018-09-25 文字入力支援装置、文字入力システム、および文字入力支援方法 Active JP7058749B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/035263 WO2020065695A1 (ja) 2018-09-25 2018-09-25 文字入力支援装置、文字入力システム、および文字入力支援方法

Publications (2)

Publication Number Publication Date
JPWO2020065695A1 true JPWO2020065695A1 (ja) 2021-03-11
JP7058749B2 JP7058749B2 (ja) 2022-04-22

Family

ID=69950379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020547612A Active JP7058749B2 (ja) 2018-09-25 2018-09-25 文字入力支援装置、文字入力システム、および文字入力支援方法

Country Status (2)

Country Link
JP (1) JP7058749B2 (ja)
WO (1) WO2020065695A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116088692A (zh) * 2021-11-03 2023-05-09 百度国际科技(深圳)有限公司 用于呈现候选字符串和训练判别式模型的方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11110379A (ja) * 1997-09-30 1999-04-23 Sanyo Electric Co Ltd 情報検索方法及びその装置
JPH11167569A (ja) * 1997-12-02 1999-06-22 Sony Corp 文章入力装置及び方法並びに記録媒体
JP2000200269A (ja) * 1998-12-11 2000-07-18 Nedekkusu:Kk 文字検索装置、文字入力装置、熟語検索装置および熟語入力装置
WO2002029620A1 (fr) * 2000-10-02 2002-04-11 Fujitsu Limited Systeme d'extraction de caractere, procede d'extraction de caractere, et support d'enregistrement lisible par ordinateur
JP2005283797A (ja) * 2004-03-29 2005-10-13 Nissan Motor Co Ltd 音声認識装置および音声認識方法
JP2012079252A (ja) * 2010-10-06 2012-04-19 Fujitsu Ltd 情報端末装置、文字入力方法および文字入力プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11110379A (ja) * 1997-09-30 1999-04-23 Sanyo Electric Co Ltd 情報検索方法及びその装置
JPH11167569A (ja) * 1997-12-02 1999-06-22 Sony Corp 文章入力装置及び方法並びに記録媒体
JP2000200269A (ja) * 1998-12-11 2000-07-18 Nedekkusu:Kk 文字検索装置、文字入力装置、熟語検索装置および熟語入力装置
WO2002029620A1 (fr) * 2000-10-02 2002-04-11 Fujitsu Limited Systeme d'extraction de caractere, procede d'extraction de caractere, et support d'enregistrement lisible par ordinateur
JP2005283797A (ja) * 2004-03-29 2005-10-13 Nissan Motor Co Ltd 音声認識装置および音声認識方法
JP2012079252A (ja) * 2010-10-06 2012-04-19 Fujitsu Ltd 情報端末装置、文字入力方法および文字入力プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116088692A (zh) * 2021-11-03 2023-05-09 百度国际科技(深圳)有限公司 用于呈现候选字符串和训练判别式模型的方法和装置
CN116088692B (zh) * 2021-11-03 2024-04-19 百度国际科技(深圳)有限公司 用于呈现候选字符串和训练判别式模型的方法和装置

Also Published As

Publication number Publication date
JP7058749B2 (ja) 2022-04-22
WO2020065695A1 (ja) 2020-04-02

Similar Documents

Publication Publication Date Title
US9053098B2 (en) Insertion of translation in displayed text consisting of grammatical variations pertaining to gender, number and tense
US9519641B2 (en) Photography recognition translation
US8996356B1 (en) Techniques for predictive input method editors
JP5421239B2 (ja) 複数モードの入力メソッドエディタ
US9824085B2 (en) Personal language model for input method editor
US9400775B2 (en) Document data entry suggestions
WO2015169134A1 (en) Method and apparatus for phonetically annotating text
WO2016091095A1 (zh) 基于终端界面触控操作进行搜索的方法及系统
WO2016095689A1 (zh) 基于终端界面多次触控操作进行识别搜索的方法及系统
CN107710191B (zh) 与单个词语音输入的翻译相关的方法和计算装置
KR101474854B1 (ko) 음성인식을 통해 컨트롤 객체를 선택하기 위한 장치 및 방법
CN107346183B (zh) 一种词汇推荐方法和电子设备
CN104808807A (zh) 用于汉字拼音输入的方法和装置
CN110032734B (zh) 近义词扩展及生成对抗网络模型训练方法和装置
CN105573696B (zh) 电子黑板装置及其控制方法
US20170205888A1 (en) Gesture ambiguity determination and resolution
CN103914209A (zh) 一种信息处理方法及电子设备
US9031831B1 (en) Method and system for looking up words on a display screen by OCR comprising a set of base forms of recognized inflected words
JP7058749B2 (ja) 文字入力支援装置、文字入力システム、および文字入力支援方法
KR101334154B1 (ko) 중국어 단어 입력 장치 및 방법
US20140180698A1 (en) Information processing apparatus, information processing method and storage medium
US8386236B2 (en) Method for prompting by suggesting stroke order of chinese character, electronic device, and computer program product
US9501161B2 (en) User interface for facilitating character input
WO2016119549A1 (zh) 一种基于输入的候选文本的加载方法和装置
US10386935B2 (en) Input method editor for inputting names of geographic locations

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200910

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220412

R150 Certificate of patent or registration of utility model

Ref document number: 7058749

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150