JP2011186994A - Character input device and character input method - Google Patents
Character input device and character input method Download PDFInfo
- Publication number
- JP2011186994A JP2011186994A JP2010054277A JP2010054277A JP2011186994A JP 2011186994 A JP2011186994 A JP 2011186994A JP 2010054277 A JP2010054277 A JP 2010054277A JP 2010054277 A JP2010054277 A JP 2010054277A JP 2011186994 A JP2011186994 A JP 2011186994A
- Authority
- JP
- Japan
- Prior art keywords
- input
- mouth shape
- vowel information
- character
- character input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
Description
本発明は、文字入力を行う文字入力装置および文字入力方法に関する。 The present invention relates to a character input device and a character input method for inputting characters.
携帯電話機の普及に伴い、携帯電話機を使って文字を入力して文章を作成する機会が増えており、文字入力の操作性、効率性が求められている。
携帯電話機のような入力キーの少ない機器では、1つのキーを複数回押下することによって、文字を変化させて入力することが一般的に行われている。また、携帯電話機に搭載されているマイクを使って音声を入力し、音声認識により文字を入力するといったことも行われている。
With the widespread use of mobile phones, opportunities to input text using mobile phones and create texts are increasing, and operability and efficiency of character input are required.
In a device having few input keys such as a cellular phone, it is generally performed by changing a character by pressing one key a plurality of times. In addition, voices are input using a microphone mounted on a mobile phone, and characters are input by voice recognition.
上記のような1つのキーを複数回押して文字入力をする場合、キーの数を減らせるので機器を小型化できるが、同一キーを複数回押さないと、希望する文字を入力できないので、操作回数が増大し、ユーザ操作が煩雑になる。 When inputting characters by pressing one key multiple times as described above, the number of keys can be reduced to reduce the size of the device. However, if the same key is not pressed multiple times, the desired character cannot be input. Increases and the user operation becomes complicated.
例えば、「0〜9」のテンキーしかない携帯電話機で、「こ」という文字を入力したい場合、テンキーの「2」を5回押下したりするなど、操作が面倒である。
一方、マイクを使って、音声認識により文字を入力する場合は、キー操作の煩雑さは解消できる。しかし、周りの雑音による認識不良の発生、または音声を発するために、入力しようとする文字が他人に聞こえてしまうなどの不都合があった。
For example, in a mobile phone having only a numeric keypad of “0 to 9”, when it is desired to input the character “ko”, the operation is troublesome, such as pressing “2” of the numeric keypad five times.
On the other hand, when inputting characters by voice recognition using a microphone, the complexity of key operations can be eliminated. However, there have been inconveniences such as the occurrence of poor recognition due to surrounding noise, or the fact that a character to be input can be heard by another person in order to make a voice.
これに対し、近年になって、携帯電話機に搭載されているカメラを用いて、口(口唇)の動きで文字を入力する機器が開発されている。これは、ユーザの口元の画像をカメラで取り込み、口の形状認識により文字入力を行うものである。口の形状認識により文字入力を行う従来技術としては、例えば、特許文献1〜3が提案されている。
On the other hand, in recent years, devices have been developed that input characters by the movement of the mouth (lip) using a camera mounted on a mobile phone. In this method, an image of a user's mouth is captured by a camera, and character input is performed by mouth shape recognition. For example,
口の形状認識により文字入力を行う場合、口の動きから判別できる入力文字は、母音情報になるので、子音情報は、他手段を用いて別途入力することになる。上記の特許文献1、2では、携帯電話機に搭載されているカメラで口形状の画像を入力して、入力文字の母音情報を口の形状で画像解析し、子音情報は、キー操作で入力を行っている。
When character input is performed by mouth shape recognition, the input character that can be discriminated from the movement of the mouth becomes vowel information, so consonant information is input separately using other means. In
しかし、特許文献1、2では、1文字ずつ母音に合わせて子音を入力しているので、1文字入力する度に、口の動きとキーの入力操作とを連動する必要があり、操作タイミングを逸しやすい。このため、正確かつスムーズに文字を入力することが容易ではなく、操作性が良好であるものとはいえない。
However, in
また、特許文献3では、キー操作が難しい人において、眼や顔の動きにより文字の指定を可能としているが、1文字を入力する毎に口と眼や顔の動きとを連動させる必要があるので、この場合も文字入力の操作が煩雑である。 In Japanese Patent Application Laid-Open No. 2004-260260, characters can be designated by eye and face movements for people who have difficulty in key operations. However, it is necessary to link the mouth and eye and face movements every time a character is input. Therefore, the character input operation is also complicated in this case.
本発明はこのような点に鑑みてなされたものであり、口の形状認識による文字入力において操作性の向上を図った文字入力装置を提供することを目的とする。
また、本発明の他の目的は、口の形状認識による文字入力において操作性の向上を図った文字入力方法を提供することである。
The present invention has been made in view of these points, and an object of the present invention is to provide a character input device that improves operability in character input by mouth shape recognition.
Another object of the present invention is to provide a character input method that improves operability in character input by mouth shape recognition.
上記課題を解決するために、文字入力装置が提供される。この文字入力装置は、口の形状の画像を入力して口形状画像データを生成する画像処理部と、母音および撥音を含む母音情報と、個々の前記母音情報に対応する前記口形状画像データとを登録する口形状画像照合データベースと、前記母音情報に関連する単語候補を登録する単語変換辞書データベースと、文字入力制御を行う制御部とを備える。また、前記制御部は、前記口形状画像データを前記母音情報に変換し、変換後の前記母音情報に関連する前記単語候補を検索する。 In order to solve the above problems, a character input device is provided. The character input device includes an image processing unit that inputs a mouth shape image to generate mouth shape image data, vowel information including vowels and sound repellent, and mouth shape image data corresponding to each of the vowel information. A mouth shape image matching database for registering words, a word conversion dictionary database for registering word candidates related to the vowel information, and a control unit for performing character input control. In addition, the control unit converts the mouth shape image data into the vowel information, and searches for the word candidates related to the converted vowel information.
操作性の向上を図ることが可能になる。 It becomes possible to improve operability.
以下、本発明の実施の形態を図面を参照して説明する。図1は文字入力装置の構成例を示す図である。文字入力装置1は、ユーザインタフェース部10、画像処理部20、口形状画像照合データベース31、単語変換辞書データベース32aおよび制御部40を備え、例えば、携帯電話機などの文字入力が行われる通信機器などに該当する。
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram illustrating a configuration example of a character input device. The
ユーザインタフェース部10は、キー操作および画面表示を行う。画像処理部20は、音声を発する際の口の形状の画像を入力して口形状画像データを生成する。口形状画像照合データベース31は、母音および撥音を含む母音情報と、個々の母音情報に対応する口形状画像データとを登録する。単語変換辞書データベース32aは、母音情報に関連する単語候補を登録する。制御部40は、文字入力制御を行う。
The
ここで、制御部40は、画像入力された口形状変化から生成される1つまたは複数の口形状画像データを、口形状画像照合データベース31に登録されている母音情報と照合し、一括して母音情報に変換する。
Here, the
例えば、画像入力された口形状の変化が1つであれば、1つの口形状画像データが生成される。そして、1つの該当口形状画像データを口形状画像照合データベース31に登録されている母音情報と照合して、対応する1つの母音情報に変換する。
For example, if there is only one change in the mouth shape input as an image, one mouth shape image data is generated. Then, the corresponding mouth shape image data is collated with the vowel information registered in the mouth shape
または、画像入力された口形状の変化として、例えば、互いに異なる3つの変化があったとすれば、3つの口形状画像データが生成される。そして、3つの該当口形状画像データを口形状画像照合データベース31に登録されている母音情報とそれぞれ照合して、対応する3つの母音情報にそれぞれ変換する。
Alternatively, for example, if there are three different changes in the mouth shape input as an image, three mouth shape image data are generated. Then, the three corresponding mouth shape image data are collated with the vowel information registered in the mouth shape
口形状画像データを母音情報に変換した後は、変換後の母音情報に関連する単語候補について、単語変換辞書データベース32aを利用して検索して、画面に表示する。
このとき、該当単語候補があればユーザによって確定されるが、変換後の母音情報を含む単語候補の中に該当単語候補がない場合には、ユーザは子音情報を入力し、制御部40は、母音情報と入力された子音情報とから、関連する単語候補を検索する。なお、詳細動作については具体例を挙げて後述する。
After the mouth shape image data is converted into vowel information, word candidates related to the converted vowel information are searched using the word
At this time, if there is a corresponding word candidate, it is determined by the user, but if there is no corresponding word candidate among the word candidates including the converted vowel information, the user inputs consonant information, A related word candidate is searched from the vowel information and the input consonant information. The detailed operation will be described later with a specific example.
次に文字入力装置1を携帯電話機に適用した場合の構成および動作について詳しく説明する。図2は携帯電話機の外観構成を示す図であり、図3は携帯電話機の機能ブロックを示す図である。携帯電話機1aは、ユーザインタフェース部10、画像処理部20、メモリ部30および制御部40を備える。
Next, the configuration and operation when the
ユーザインタフェース部10は、画面表示部(LCD:Liquid Crystal Display(液晶ディスプレイ))11と入力操作部12を含み、入力操作部12は、テンキー12a、選択キー12bおよび確定キー12cを含む。画像処理部20は、カメラ21と画像データ生成部22を含む。
The
メモリ部30は、フラッシュメモリ等に該当し、口形状画像照合データベース(DB)31、単語変換辞書DB32aおよびアルファベット変換辞書DB32bを含む。制御部40は、CPU(Central Processing Unit)41、RAM(Random Access Memory)42およびROM(Read Only Memory)43を含む。
The memory unit 30 corresponds to a flash memory or the like, and includes a mouth shape image collation database (DB) 31, a word
カメラ21は、画像を入力する。口形状認識による文字入力を行う場合は、ユーザの口領域の画像を入力する。画像データ生成部22は、入力画像をデータ化する。口領域の画像が入力された場合には、口形状画像をデータ化して口形状画像データを生成する。
The
口形状画像照合DB31は、母音(「あ」、「い」、「う」、「え」、「お」)および撥音(「ん」)を含む母音情報と、個々の母音情報に対応する口形状画像データとを登録する。
The mouth shape
単語変換辞書DB32aは、母音情報に関連する単語候補を登録する。アルファベット変換辞書DB32bは、母音情報に関連するアルファベット候補を登録する。なお、単語変換辞書DB32aは、日本語(仮名)文字入力モード時に使用され、アルファベット変換辞書DB32bは、アルファベット入力モード時に使用される。
The word
制御部40は、生成された口形状画像データから、口形状画像照合DB31を用いて、単語単位に母音および「ん」の形状を認識する。そして、得られた母音および「ん」の母音情報にもとづき、単語変換辞書DB32aから該当母音情報に関連する単語候補を抽出する。
From the generated mouth shape image data, the
画面表示部11は、抽出された単語候補を表示する。ユーザは、選択キー12bを用いて、表示された単語候補の中から入力したい単語を選ぶ。選択キー12bは、ユーザ操作にもとづいて、複数の単語候補の中から所望の単語を選択するためのキーである。また、確定キー12cは、ユーザ操作によって、選択された単語を確定し、入力したい単語を決定するためのキーである。
The
なお、表示された単語候補の中に、入力したい単語がない場合は、ユーザは、入力したい単語の子音情報の1文字目を、テンキー12aを用いて入力する。テンキー12aは、ユーザ操作にもとづいて、子音情報を入力するためのキーである。
If there is no word to be input among the displayed word candidates, the user inputs the first character of the consonant information of the word to be input using the
制御部40では、単語変換辞書DB32aから、先に抽出した単語候補に対して、1文字目の子音情報を加味して再び検索し、その結果の単語候補を抽出し、画面表示部11は抽出された単語候補を表示する。この状態でも入力したい単語が表示されていない場合は、さらに2文字目の子音情報を入力することで、さらに単語候補を検索していく。
The
次に具体的な例を挙げて携帯電話機1aの文字入力動作について詳しく説明する。最初に日本語文字入力の一例として、「愛(あい)」という単語を入力する場合について説明する。 Next, the character input operation of the mobile phone 1a will be described in detail with a specific example. First, as an example of Japanese character input, a case where the word “love” is input will be described.
図4は文字入力画面の表示例を示す図である。メール本文を作成する際の画面11−1上には、確定した入力文字を表示する確定入力文字表示部11a(メール本文に該当)、ユーザにキー操作をガイダンスするためのキー操作ガイダンス部11bおよび入力文字候補を表示する候補文字表示部11cが表示される。
FIG. 4 is a diagram showing a display example of the character input screen. On the screen 11-1 when creating the mail text, a confirmed input
まず、ユーザは、携帯電話機1aを持ちカメラ21に向かって、「あ」の口を動かして口形状画像を入力する。図5は「あ」の口の画像を取り込んだ状態の画面表示例を示す図である。口形状画像照合DB31から、入力された口形状画像データに該当する母音が照合されて、「a」の母音が入力されたことを認識する。
First, the user holds the mobile phone 1a and moves the mouth of “A” toward the
画面11−2において、候補文字表示部11cには、「あ」の口の画像から認識される文字として、ひらがな大文字の「あ」、カタカナ大文字の「ア」、ひらがな小文字の「あ」、カタカナ小文字の「ア」が表示される。また、確定前の入力文字を表示する確定前入力文字表示部11dには、「あ」が表示される。
In the screen 11-2, the candidate
次にユーザは「い」の口を動かす。図6は単語候補の画面表示例を示す図である。ユーザが「い」の口を動かして、カメラ21に向かって口の動きを止める。すると、口形状画像照合DB31から、入力された口形状画像データに該当する母音が照合されて、「i」の母音が入力されたことを認識する。そして、単語変換辞書DB32aから、「あい」に対する関連する単語候補が抽出される。
Next, the user moves the mouth of “I”. FIG. 6 is a diagram illustrating a screen display example of word candidates. The user moves the mouth of “I” and stops the mouth movement toward the
画面11−3において、抽出された単語が候補文字表示部11cに表示される。図6の場合は6個の単語が抽出されて表示されている。また、確定前入力文字表示部11dには、「あい」が表示される。
On the screen 11-3, the extracted word is displayed on the candidate
図7は入力文字を選択する場合の画面表示を示す図である。ここでは「愛」という文字が画面11−4の候補文字表示部11cに表示されているので、画面11−4において、選択キー12bを下方に2回押下して「愛」という文字を選択する。
FIG. 7 is a diagram showing a screen display when an input character is selected. Here, since the character “love” is displayed on the candidate
図8は入力文字を確定した場合の画面表示を示す図である。図7のようにして入力文字を選択した後、確定キー12cを1回押下することで、画面11−5における確定入力文字表示部11aのメール本文内に「愛」の文字が展開される。
FIG. 8 is a diagram showing a screen display when an input character is confirmed. After selecting the input character as shown in FIG. 7, the character “love” is expanded in the mail text of the confirmed input
次に口形状画像照合DB31と単語変換辞書DB32aについて説明する。図9は口形状画像照合DB31の登録データを示す図である。口形状画像照合DB31は、a(あ)、i(い)、u(う)、e(え)、o(お)の母音およびn(ん)を含む母音情報と、各母音情報に対応する口形状画像データとが登録される。
Next, the mouth shape
また、文字を発音するときの口の形状の画像データである口形状画像データは、システム標準データとユーザ登録データに分けられる。システム標準データは、口形状画像照合DB31にあらかじめ登録設定されているシステム標準の口形状画像データである。ユーザ登録データは、ユーザ個人が自身の口形状をカメラで入力して登録する口形状画像データである。
Mouth shape image data, which is mouth shape image data when a character is pronounced, is divided into system standard data and user registration data. The system standard data is system standard mouth shape image data registered and set in advance in the mouth shape
このように、携帯電話機1aを利用する複数のユーザを想定し、システム標準の他に、ユーザ自身が口形状画像データを登録できるようにして、複数ユーザの各々の口形状画像データを母音情報に対応させて保存する構成とした。これにより、母音情報と口形状画像データとの照合の精度を向上させることが可能になる。 In this way, assuming a plurality of users using the mobile phone 1a, in addition to the system standard, the user himself / herself can register mouth shape image data, and each mouth shape image data of the plurality of users is used as vowel information. It was set as the structure preserve | saved correspondingly. Thereby, it is possible to improve the accuracy of collation between the vowel information and the mouth shape image data.
ここで、カメラ21を通じて画像入力して生成した口形状画像データから、「あ」〜「お」の母音または「ん」の母音情報に変換する際には、入力された口形状画像データと一致する母音情報を口形状画像照合DB31から検出する。そして、口形状画像データを母音情報に変換して、該当母音文字を候補文字表示部11cに表示する。
Here, when the mouth shape image data generated by inputting an image through the
図10は単語変換辞書DB32aの登録データを示す図である。母音および「ん」の母音情報から単語候補(日本語)を表示するための登録データ例を示している。登録項目としては、“母音情報”、“読み”、“キー”、“表示”がある。なお、“キー”の欄に示される数字をテンキー12aで押下することで“表示”に記載されている該当文字が表示される。
FIG. 10 is a diagram showing registration data in the word
次に「下位(かい)」という単語を入力する場合について説明する。ユーザは、携帯電話機1aを持ちカメラ21に向かって、「か」、「い」の口を動かして、口形状画像を入力する。「下位」という単語の母音は、「あい」であるので、「か」の口形状は母音「あ」に変換され、「い」の口形状は母音「い」に変換される。画面の操作については、上述の図6まで同じ画面操作となる。
Next, a case where the word “lower” is input will be described. The user holds the mobile phone 1a, moves the mouths of “ka” and “i” toward the
図6の候補文字表示部11cには、入力したい「下位」という文字が表示されていないので、ユーザは、「下位」の1文字目の子音である「か」の入力を行うため、テンキー12aの「2」のキーを1回押下する。
Since the character “lower” to be input is not displayed in the candidate
図11は単語候補の画面表示例を示す図である。制御部40は、単語変換辞書DB32aから、母音「あい」と1文字目の子音「か」に関連する単語を検索し、画面11−6において、検索した単語候補を候補文字表示部11cに表示する。図の場合、6個の単語候補が表示されている。
FIG. 11 is a diagram illustrating a screen display example of word candidates. The
図12は入力文字を選択する場合の画面表示を示す図である。入力したい「下位」という文字が候補文字表示部11cに存在しているため、画面11−7において、選択キー12bを下方に4回押下して選択する。
FIG. 12 is a diagram showing a screen display when an input character is selected. Since the character “lower” to be input exists in the candidate
図13は入力文字を確定した場合の画面表示を示す図である。図12のようにして入力文字を選択した後、確定キー12cを1回押下することで、画面11−8における確定入力文字表示部11aのメール本文内に「下位」の文字が展開される。
FIG. 13 is a diagram showing a screen display when an input character is confirmed. After selecting an input character as shown in FIG. 12, by pressing the enter key 12c once, a “lower” character is expanded in the mail text of the confirmed input
なお、図11の単語候補が表示される状態のときに、入力したい単語が表示されない場合は、さらに2文字目の子音情報をテンキー12aで入力して単語変換辞書DB32aを検索し、候補文字表示部11cに入力したい文字を表示する。
If the word candidate to be input is not displayed when the word candidate of FIG. 11 is displayed, the second character consonant information is input with the
次に画面表示の変形例について説明する。図14は文字入力画面の表示例を示す図である。図5のように、口の動きを入力している段階において、画面11−2aの空きスペースに、カメラ21で画像入力した口形状画像d1を表示する。このような表示を行うことで、ユーザは、自分の口の動きを確認しながら操作をすることができるため、母音および「ん」の認識率を向上させることが可能になる。
Next, a modified example of the screen display will be described. FIG. 14 is a diagram showing a display example of the character input screen. As shown in FIG. 5, the mouth shape image d <b> 1 input by the
次に文字入力動作についてフローチャートを用いて説明する。図15は日本語文字入力動作のフローチャートを示す図である。
〔S1〕ユーザは、カメラ21を用いて、口の動きを1文字ずつ画像入力する。
Next, a character input operation will be described using a flowchart. FIG. 15 is a flowchart of the Japanese character input operation.
[S1] Using the
〔S2〕入力された口の動きから口形状画像照合DB31を用い、口形状画像データを母音情報に変換する。
〔S3〕口形状が一定時間の間に動いているか否か(変化しているか否か)を判断する。一定時間の間、口の動きがない場合はステップS5へいき、一定時間の間に口が動く場合はステップS4へいく。
[S2] The mouth shape image data is converted into vowel information using the mouth shape
[S3] It is determined whether or not the mouth shape has moved during a certain time (whether or not it has changed). If there is no movement of the mouth for a certain time, the process goes to step S5, and if the mouth moves for a certain time, the process goes to step S4.
〔S4〕カメラ21から次の1文字を入力する。ステップS2へ戻る。
〔S5〕口の動きから解析したm個の母音情報から、単語変換辞書DB32aを用いて、母音または「ん」に関連する単語候補n個を候補文字表示部11cに表示する。
[S4] The next character is input from the
[S5] From the m vowel information analyzed from the mouth movement, n word candidates related to the vowel or “n” are displayed on the candidate
〔S6〕キー入力待ち状態とする。
〔S7〕入力されたキーを認識する。選択キー12bの場合はステップS8aへいき、テンキー12aの場合はステップS8bへいき、確定キー12cの場合はステップS8cへいく。また、文字入力を終了する場合は終了とする。
[S6] Wait for key input.
[S7] The input key is recognized. If it is the selection key 12b, go to step S8a, if it is the
〔S8a〕選択キー12bが入力された場合は、該当の方向にカーソルを移動し、ステップS6へ戻り、キー入力待ち状態となる。
〔S8b〕テンキー12aが入力された場合は、該当単語に対して、入力された子音情報を加味して、単語変換辞書DB32aから関連する単語候補検索し、検索結果を候補文字表示部11cに表示する。ステップS6へ戻って、キー入力待ち状態となる。
[S8a] When the selection key 12b is input, the cursor is moved in the corresponding direction, and the process returns to step S6 to enter a key input waiting state.
[S8b] When the
〔S8c〕確定キー12cが入力された場合は、確定文字を確定入力文字表示部11aに表示する。
〔S8c−1〕単語変換辞書DB32aは、確定される単語の頻度の高い順に画面の上位位置に表示されるように登録順を更新する。
[S8c] When the confirmation key 12c is input, the confirmation character is displayed on the confirmation input
[S8c-1] The word
以上説明したように、文字入力装置1を適用した携帯電話機1aは、日本語入力において、文字または単語レベルで口の動きの画像を取り込み、該当単語の母音および「ん」を解析する。そして、単語変換辞書DB32aから、口の動きで入力された母音および「ん」の母音情報に関連する単語候補を検索してディスプレイに表示する。
As described above, the mobile phone 1a to which the
ディスプレイに表示した母音情報だけの単語候補の中に、入力したい単語が含まれていれば、選択キー12bと確定キー12cにより、入力文字を選択・確定する。また、ディスプレイに表示した単語候補の中に入力したい単語が含まれていない場合は、該当する子音を例えば、「0〜9」のテンキー12aで入力し、候補が出るまで子音を順次追加入力して検索を行う。
If a word to be input is included in the word candidates of only the vowel information displayed on the display, the input character is selected and confirmed by the selection key 12b and the confirmation key 12c. If the word candidate displayed on the display does not include the word to be input, for example, the corresponding consonant is input with the
このように、母音情報だけを単語単位に先に入力して、まず母音情報だけで単語変換辞書DB32aを検索し、該当文字があれば確定し、なければ子音情報をキー操作で入力することになる。
In this way, only the vowel information is input in units of words, and the word
このような構成により、1文字ずつ母音に合わせて子音を入力するといった操作が不要となる。したがって、1文字入力する度に、口形状の画像入力とキーの入力操作とを連動する必要がないため、操作が容易となり、正確かつスムーズに文字を入力することが可能になる。 With such a configuration, an operation of inputting consonants in accordance with the vowels character by character becomes unnecessary. Accordingly, since it is not necessary to link the mouth-shaped image input and the key input operation every time a character is input, the operation is facilitated, and the characters can be input accurately and smoothly.
次にアルファベットの文字入力について説明する。アルファベット入力の一例として、「g」を入力する場合について説明する。
図16は文字入力画面の表示例を示す図である。画面11−1aにおいて、キー操作ガイダンス部11bに示される文字切替キー11b−1を押下することで、文字入力モードをアルファベット入力モードに切り替える。
Next, alphabetic character input will be described. As an example of alphabet input, a case where “g” is input will be described.
FIG. 16 is a diagram showing a display example of a character input screen. On the screen 11-1a, the character input mode is switched to the alphabet input mode by pressing the character switch key 11b-1 shown in the key
ここでは、「g」という文字を入力するため、ユーザは、口の形状を「じー」として、カメラ21から口の動きを入力し、上述の口形状画像照合DB31から、該当口形状画像データに対応する母音情報「i」を得る。
Here, in order to input the letter “g”, the user inputs the movement of the mouth from the
次に「i」に該当するアルファベット情報を得るため、アルファベット変換辞書DB32bを用いて、候補となるアルファベットを抽出して、候補文字表示部11cに表示する。
Next, in order to obtain alphabet information corresponding to “i”, a candidate alphabet is extracted using the alphabet
図17はアルファベット変換辞書DB32bの登録データを示す図である。母音情報からアルファベット候補を表示するための登録データ例を示している。登録項目としては、“母音情報”、“読み”、“キー”、“表示”がある。なお、“表示”には、全小(全角小文字)、全大(全角大文字)、半小(半角小文字)および半大(半角大文字)がある。
FIG. 17 is a diagram showing registration data in the alphabet
図18はアルファベット文字候補の画面表示例を示す図である。画面11−2aにおいて、母音「i」に対応するアルファベットは「b」、「e」、「g」、「p」、「t」、「z」と複数候補が表示されている。 FIG. 18 is a diagram showing a screen display example of alphabet character candidates. On the screen 11-2a, the alphabet corresponding to the vowel “i” is displayed as “b”, “e”, “g”, “p”, “t”, “z” and a plurality of candidates.
図19は入力文字を選択する際の画面表示を示す図である。画面11−3aにおいて、入力したい「g」に該当するテンキー12aの「4」を押下することで、候補文字表示部11cに「g」のみを表示する。または、画面11−2aの状態で選択キー12bを3回押下してカーソルを下方に移動して「g」を選択する。
FIG. 19 is a diagram showing a screen display when an input character is selected. By pressing “4” of the
図20は入力文字を確定する画面表示を示す図である。図19のようにして入力文字を選択した後、確定キー12cを押下することで、画面11−4aにおいて、確定入力文字表示部11aのメール本文内に「g」の文字が展開される。
FIG. 20 is a diagram showing a screen display for confirming an input character. After selecting the input character as shown in FIG. 19, the character “g” is expanded in the mail text of the confirmed input
図21はアルファベットの全角/半角の切替を示す図である。図19の状態で、全半大小ボタン11b−2を押下することで、アルファベット変換辞書DB32bにある“表示”の文字を切替える。これにより、アルファベットの「全角/半角」および「大文字/小文字」の切替えを可能とする。画面11−5aでは、全半大小ボタン11b−2を1度押下した状態の例であり、「g」の文字が「G」となっていることを表している。
FIG. 21 is a diagram illustrating switching between full-width / half-width alphabets. In the state of FIG. 19, the character of “display” in the alphabet
図22は入力文字を確定する画面表示を示す図である。図21のようにして入力文字を選択した後、確定キー12cを押下することで、画面11−6aにおいて、確定入力文字表示部11aのメール本文内に「G」の文字が展開される。
FIG. 22 is a diagram showing a screen display for confirming an input character. By selecting the input character as shown in FIG. 21 and then pressing the confirmation key 12c, the character “G” is expanded in the mail text of the confirmed input
次に文字入力動作についてフローチャートを用いて説明する。図23はアルファベット文字入力動作のフローチャートを示す図である。
〔S11〕ユーザは、カメラ21を用いて、口の動きを1文字ずつ画像入力する。
Next, a character input operation will be described using a flowchart. FIG. 23 is a flowchart of the alphabet character input operation.
[S11] The user uses the
〔S12〕入力された口の動きから口形状画像照合DB31を用い、口形状画像データを母音情報に変換する。
〔S13〕口形状が一定時間の間に動いているか否かを判断する。一定時間の間、口が動かない場合はステップS15へいき、一定時間の間に口が動く場合はステップS14へいく。
[S12] The mouth shape image data is converted into vowel information from the input mouth movement using the mouth shape
[S13] It is determined whether or not the mouth shape moves during a certain time. If the mouth does not move for a certain time, the process goes to step S15. If the mouth moves for a certain time, the process goes to step S14.
〔S14〕カメラ21から次の1文字を入力する。ステップS12へ戻る。
〔S15〕口の動きから解析したm個の母音情報から、アルファベット変換辞書DB32bを用いて、関連するアルファベット候補n個を候補文字表示部11cに表示する。
[S14] The next character is input from the
[S15] From the m vowel information analyzed from the movement of the mouth, n related alphabet candidates are displayed on the candidate
〔S16〕キー入力待ち状態とする。
〔S17〕入力されたキーを認識する。選択キー12bの場合はステップS18aへいき、テンキー12aの場合はステップS18bへいき、確定キー12cの場合はステップS18cへいく。また、文字入力を終了する場合は終了とする。
[S16] It is in a key input waiting state.
[S17] The input key is recognized. In the case of the selection key 12b, the process proceeds to step S18a, in the case of the
〔S18a〕選択キー12bが入力された場合は、該当の方向にカーソルを移動し、ステップS16へ戻り、キー入力待ち状態となる。
〔S18b〕テンキー12aが使用された場合は、キー情報(アルファベット変換辞書DB32bの“キー”に該当)にもとづき、アルファベットの候補を特定して入力して、候補文字表示部11cに表示する。ステップS16へ戻り、キー入力待ち状態となる。
[S18a] When the selection key 12b is input, the cursor is moved in the corresponding direction, and the process returns to step S16 to enter a key input waiting state.
[S18b] When the
〔S18c〕確定キー12cが入力された場合は、確定文字を確定入力文字表示部11aに表示する。
〔S18c−1〕アルファベット変換辞書DB32bは、確定されるアルファベットの頻度の高い順に画面の上位位置に表示されるように登録順を更新する。
[S18c] When the confirmation key 12c is input, the confirmation character is displayed on the confirmation input
[S18c-1] The alphabet
以上説明したように、文字入力装置1を適用した携帯電話機1aは、アルファベット入力モードを有し、1つのアルファベット毎に口の動きの画像を取り込み、該当アルファベットの母音情報を解析する。そして、アルファベット変換辞書DB32bから口の動きで入力された母音情報に関連するアルファベット1文字をディスプレイに表示する。
As described above, the mobile phone 1a to which the
ディスプレイに表示したアルファベットの候補の中に入力したいアルファベットが含まれていれば、選択キー12bと確定キー12cにより、入力文字を確定する(またはテンキー12aでアルファベットを直接特定する)。
If the alphabet to be input is included in the alphabet candidates displayed on the display, the input character is confirmed by the selection key 12b and the confirmation key 12c (or the alphabet is directly specified by the
ディスプレイに表示した候補の中に、入力したいアルファベットが含まれていない場合は、該当するアルファベットを例えば、「0〜9」のテンキー12aで入力することで、アルファベットの候補を特定して入力する。このように、日本語入力だけでなく、アルファベット入力も行うことが可能である。
When the alphabet to be input is not included in the candidates displayed on the display, the alphabet candidate is specified and input by inputting the corresponding alphabet with, for example, the
図24は携帯電話機の外観構成を示す図である。上記の携帯電話機1aでは、入力操作をテンキー等のキーで行ったが、タッチパネル110のような入力手段を有する携帯電話機1bを使用してもよい。基本構成は携帯電話機1aと同じなので説明は省略する。 FIG. 24 is a diagram showing an external configuration of a mobile phone. In the mobile phone 1a, the input operation is performed with a key such as a numeric keypad. However, a mobile phone 1b having an input unit such as the touch panel 110 may be used. Since the basic configuration is the same as that of the mobile phone 1a, the description is omitted.
以上説明したように、文字入力装置1では、個々の母音情報に対応する口形状画像データを登録する口形状画像照合DB31と、母音情報に関連する単語候補を登録する単語変換辞書DB32aとを備えて、口形状画像データを母音情報に変換し、変換後の母音情報に関連する単語候補を検索する構成とした。
As described above, the
従来の口形状認識による文字入力では、1文字単位で、口形状認識による母音入力とキー操作等による子音入力とを連動して文字を入力していたため、操作性が悪く、文字入力の効率性が低かった。 In conventional character input by mouth shape recognition, characters are input in units of character in conjunction with vowel input by mouth shape recognition and consonant input by key operation etc., so operability is poor and character input efficiency Was low.
これに対し、文字入力装置1では、最初に口形状認識によって口形状画像データを母音情報に一括して変換し、母音入力だけを例えば、単語単位に先に入力しておき、単語変換辞書DB32aを用いて、入力した母音情報に関連する単語候補を検索する。そして、所望の単語が存在しない場合には、子音情報をキー操作で入力して、単語候補を再検索して、所望の単語を入力する構成とした。
On the other hand, in the
このように、母音情報だけでは所望の単語が表示されない場合に、子音情報を順次入力して検索精度を高めていくとした構成を有するので、従来のような1文字単位で口の動きとキー操作を行って文字を入力するといった煩わしさがなくなり、従来の文字入力と比べて、操作性を格段に向上させることが可能になる。 As described above, when the desired word is not displayed only by the vowel information, the convolution information is sequentially input to improve the search accuracy. The trouble of inputting characters by performing operations is eliminated, and the operability can be significantly improved compared to conventional character input.
また、「0〜9」のテンキーしかないような携帯端末機器においても、文字入力装置1の口形状認識文字入力機能によって、人混みでも必要最小限のキー操作により、アルファベットも含めた操作性の容易な文字入力が可能になる。
Moreover, even in a portable terminal device having only a numeric keypad of “0-9”, the mouth shape recognition character input function of the
なお、上記の文字入力装置1の処理機能は、コンピュータによって実現することができる。その場合、文字入力装置1が有すべき機能の処理内容を記述したプログラム(文字入力制御プログラム)が提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。
The processing functions of the
コンピュータは、CPUによって装置全体が制御される。CPUには、バスを介してRAM、ハードディスクドライブ(HDD)、通信インタフェース、グラフィック処理装置、および入出力インタフェースが接続される。 The entire computer is controlled by a CPU. A RAM, a hard disk drive (HDD), a communication interface, a graphic processing device, and an input / output interface are connected to the CPU via a bus.
RAMには、CPUに実行させるOS(Operating System)のプログラムや、文字入力制御を行うためのプログラムの少なくとも一部が一時的に格納される。また、RAMには、CPUによる処理に必要な各種データが格納される。HDDメッセージには、OSやアプリケーションプログラムが格納される。 The RAM temporarily stores at least a part of an OS (Operating System) program to be executed by the CPU and a program for performing character input control. The RAM stores various data necessary for processing by the CPU. The HDD message stores the OS and application programs.
通信インタフェースは、ネットワークに接続されている。通信インタフェースは、ネットワークを介して、他のコンピュータとの間でデータの送受信を行う。グラフィック処理装置は、モニタが接続されている。グラフィック処理装置は、CPUからの命令にしたがって画像をモニタの画面に表示させる。 The communication interface is connected to the network. The communication interface transmits / receives data to / from other computers via a network. The graphic processing apparatus is connected to a monitor. The graphic processing device displays an image on a monitor screen in accordance with a command from the CPU.
入出力インタフェースには、キーボードとマウスとが接続されている。入出力インタフェースは、キーボードやマウスから送られてくる信号を、バスを介してCPUに送信する。また、入出力インタフェースは、外部記憶媒体への情報の書き込みおよび外部記憶媒体への情報の読出しが可能な外部記憶媒体インタフェースと接続可能になっている。 A keyboard and a mouse are connected to the input / output interface. The input / output interface transmits signals sent from the keyboard and mouse to the CPU via the bus. The input / output interface can be connected to an external storage medium interface capable of writing information to the external storage medium and reading information from the external storage medium.
文字入力装置1は、各機能の処理内容を記述した文字入力制御プログラムをコンピュータで実行することにより実現することができる。すなわち、図1のユーザインタフェース部10、画像処理部20、口形状画像照合データベース31、単語変換辞書データベース32aおよび制御部40に対応する処理内容をプログラムとして記述する。ここで、記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。
The
コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD、DVD−RAM、CD−ROM/RWなどがある。光磁気記録媒体には、MO(Magneto-Optical disc)などがある。 Examples of the computer-readable recording medium include a magnetic storage device, an optical disk, a magneto-optical recording medium, and a semiconductor memory. Magnetic storage devices include hard disk devices, flexible disks (FD), and magnetic tapes. Optical discs include DVD, DVD-RAM, CD-ROM / RW, and the like. Magneto-optical recording media include MO (Magneto-Optical disc).
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。 When distributing the program, for example, a portable recording medium such as a DVD or a CD-ROM in which the program is recorded is sold. It is also possible to store the program in a storage device of a server computer and transfer the program from the server computer to another computer via a network.
また、上記の処理機能の少なくとも一部を、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)などの電子回路で実現することもできる。 In addition, at least a part of the above processing functions can be realized by an electronic circuit such as a DSP (Digital Signal Processor), an ASIC (Application Specific Integrated Circuit), or a PLD (Programmable Logic Device).
プログラムを実行するコンピュータは、例えば、外部記憶媒体に記録されたプログラムまたはサーバプログラムから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは自己の記憶装置からプログラムを読み取り、プログラムにしたがった処理を実行する。なお、コンピュータは、外部記憶媒体から直接プログラムを読み取り、そのプログラムにしたがった処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次受け取ったプログラムにしたがった処理を実行することもできる。 The computer that executes the program stores, for example, the program recorded in the external storage medium or the program transferred from the server program in its own storage device. Then, the computer reads the program from its own storage device and executes processing according to the program. The computer can also read a program directly from an external storage medium and execute processing according to the program. Further, each time the program is transferred from the server computer, the computer can also execute processing according to the sequentially received program.
以上、実施の形態を例示したが、実施の形態で示した各部の構成は同様の機能を有する他のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。なお、上記では、文字入力装置1を携帯電話機に適用した例を示したが、携帯電話機に限らず、カメラが搭載されて文字入力を行う装置全般に対して適用可能である。
As mentioned above, although embodiment was illustrated, the structure of each part shown by embodiment can be substituted by the other thing which has the same function. Moreover, other arbitrary structures and processes may be added. In addition, although the example which applied the
1 文字入力装置
10 ユーザインタフェース部
20 画像処理部
31 口形状画像照合データベース
32a 単語変換辞書データベース
40 制御部
DESCRIPTION OF
Claims (6)
母音および撥音を含む母音情報と、個々の前記母音情報に対応する前記口形状画像データとを登録する口形状画像照合データベースと、
前記母音情報に関連する単語候補を登録する単語変換辞書データベースと、
文字入力制御を行う制御部とを備え、
前記制御部は、前記口形状画像データを前記母音情報に変換し、変換後の前記母音情報に関連する前記単語候補を検索する、
ことを特徴とする文字入力装置。 An image processing unit for inputting mouth shape images and generating mouth shape image data;
A mouth shape image collation database for registering vowel information including vowels and repellent sounds, and the mouth shape image data corresponding to each vowel information;
A word conversion dictionary database for registering word candidates related to the vowel information;
A control unit for performing character input control,
The control unit converts the mouth shape image data into the vowel information, and searches for the word candidates related to the converted vowel information.
A character input device characterized by that.
前記制御部は、アルファベットの文字入力モードが設定された場合、前記口形状画像データを前記母音情報に変換し、変換後の前記母音情報に関連する前記アルファベット候補を検索する、
ことを特徴とする請求項1記載の文字入力装置。 An alphabet conversion dictionary database for registering alphabet candidates related to the vowel information;
When the alphabet character input mode is set, the control unit converts the mouth shape image data into the vowel information, and searches for the alphabet candidates related to the converted vowel information.
The character input device according to claim 1.
口の形状の画像を入力して口形状画像データを生成し、
母音および撥音を含む母音情報と、個々の前記母音情報に対応する前記口形状画像データとをデータベースに登録し、
前記母音情報に関連する単語候補を前記データベースに登録し、
前記口形状画像データを前記母音情報に変換して、変換後の前記母音情報に関連する前記単語候補を検索する、
ことを特徴とする文字入力方法。 In the character input method,
Mouth shape image data is generated by inputting the mouth shape image,
Register vowel information including vowels and repellent sounds and the mouth shape image data corresponding to each vowel information in a database,
Register word candidates related to the vowel information in the database;
The mouth shape image data is converted into the vowel information, and the word candidates related to the converted vowel information are searched.
Character input method characterized by this.
前記コンピュータに、
口の形状の画像を入力して口形状画像データを生成し、
母音および撥音を含む母音情報と、個々の前記母音情報に対応する前記口形状画像データとをデータベースに登録し、
前記母音情報に関連する単語候補を前記データベースに登録し、
前記口形状画像データを前記母音情報に変換して、変換後の前記母音情報に関連する前記単語候補を検索する、
処理を実行させることを特徴とする文字入力制御プログラム。 In a character input control program for causing a computer to execute character input,
In the computer,
Mouth shape image data is generated by inputting the mouth shape image,
Register vowel information including vowels and repellent sounds and the mouth shape image data corresponding to each vowel information in a database,
Register word candidates related to the vowel information in the database;
The mouth shape image data is converted into the vowel information, and the word candidates related to the converted vowel information are searched.
A character input control program for executing a process.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010054277A JP2011186994A (en) | 2010-03-11 | 2010-03-11 | Character input device and character input method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010054277A JP2011186994A (en) | 2010-03-11 | 2010-03-11 | Character input device and character input method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011186994A true JP2011186994A (en) | 2011-09-22 |
Family
ID=44793143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010054277A Withdrawn JP2011186994A (en) | 2010-03-11 | 2010-03-11 | Character input device and character input method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011186994A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014106927A1 (en) * | 2013-01-07 | 2014-07-10 | 日立マクセル株式会社 | Portable terminal device and information processing system |
JP2015172848A (en) * | 2014-03-12 | 2015-10-01 | 株式会社ゼンリンデータコム | lip reading input device, lip reading input method and lip reading input program |
JP2016224608A (en) * | 2015-05-28 | 2016-12-28 | 国立大学法人九州工業大学 | Character string input device |
WO2022062884A1 (en) * | 2020-09-27 | 2022-03-31 | 华为技术有限公司 | Text input method, electronic device, and computer-readable storage medium |
-
2010
- 2010-03-11 JP JP2010054277A patent/JP2011186994A/en not_active Withdrawn
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014106927A1 (en) * | 2013-01-07 | 2014-07-10 | 日立マクセル株式会社 | Portable terminal device and information processing system |
JP2014132396A (en) * | 2013-01-07 | 2014-07-17 | Hitachi Consumer Electronics Co Ltd | Portable terminal device and information processing system |
US10303433B2 (en) | 2013-01-07 | 2019-05-28 | Maxell, Ltd. | Portable terminal device and information processing system |
US11487502B2 (en) | 2013-01-07 | 2022-11-01 | Maxell, Ltd. | Portable terminal device and information processing system |
US11861264B2 (en) | 2013-01-07 | 2024-01-02 | Maxell, Ltd. | Portable terminal device and information processing system |
JP2015172848A (en) * | 2014-03-12 | 2015-10-01 | 株式会社ゼンリンデータコム | lip reading input device, lip reading input method and lip reading input program |
JP2016224608A (en) * | 2015-05-28 | 2016-12-28 | 国立大学法人九州工業大学 | Character string input device |
WO2022062884A1 (en) * | 2020-09-27 | 2022-03-31 | 华为技术有限公司 | Text input method, electronic device, and computer-readable storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100318573B1 (en) | Character input apparatus and storage medium in which character input program is stored | |
US8605039B2 (en) | Text input | |
RU2206118C2 (en) | Ambiguity elimination system with downsized keyboard | |
US7414615B2 (en) | System and method for inputting characters using a directional pad | |
JP2011254553A (en) | Japanese language input mechanism for small keypad | |
JP2005182208A (en) | Information processor and data input method | |
JP2007133884A5 (en) | ||
US7561902B2 (en) | Apparatus and method for inputting character and numerals to display of a mobile communication terminal | |
JP2012079252A (en) | Information terminal, character input method and character input program | |
US20080158201A1 (en) | Character input device | |
JP2008123553A (en) | Information apparatus | |
JP2005508031A (en) | Adaptable stroke order system based on radicals | |
JP2017509080A (en) | Kanji input device, kanji input method, and kanji search method using the same | |
JP2011186994A (en) | Character input device and character input method | |
TW201512858A (en) | Electronic device and text-input interface displaying method thereof | |
CN111694443A (en) | Input method using touch gestures as interaction mode | |
CN100517186C (en) | Letter inputting method and apparatus based on press-key and speech recognition | |
JP2012098891A (en) | Information processing system and information processing method | |
JP4133523B2 (en) | Character input device | |
Alnfiai et al. | Improved Singeltapbraille: Developing a Single Tap Text Entry Method Based on Grade 1 and 2 Braille Encoding. | |
KR100538248B1 (en) | Apparatus and method of inputting Korean vowels | |
JP7109498B2 (en) | voice input device | |
KR100373332B1 (en) | Method for korean character input in mobile communication terminal | |
KR101312875B1 (en) | Data entry system | |
JP2012181593A (en) | Text input device, text input reception method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20130604 |