JP2011134021A - Character string predicting program and information processing apparatus - Google Patents
Character string predicting program and information processing apparatus Download PDFInfo
- Publication number
- JP2011134021A JP2011134021A JP2009291430A JP2009291430A JP2011134021A JP 2011134021 A JP2011134021 A JP 2011134021A JP 2009291430 A JP2009291430 A JP 2009291430A JP 2009291430 A JP2009291430 A JP 2009291430A JP 2011134021 A JP2011134021 A JP 2011134021A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- kana
- dictionary
- character
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、ユーザが望む文字や文字列を予測する機能を有する文字列予測プログラムおよび情報処理装置に関する。 The present invention relates to a character string prediction program and an information processing apparatus having a function of predicting a character or character string desired by a user.
従来、携帯情報端末(PDA: Personal Digital Assistant)においては、文字入力方式として、タッチパネルに対してスタイラスペン等を用いて手書きにより文字列を入力する方式(以下、「手書き入力方式」と称す。)を採用するものが一般的であった。その後、携帯電話機に見られるように、個々の文字が割り付けられているダイヤルキー(テンキー)やQWERTY配列のキーボードのキーを押し下げる方式(以下、「キー押下入力方式」と称す。)が一般的になるにつれ、「手書き入力方式」による文字列の入力はあまり利用されなくなっていった。その理由としては、以下のことが挙げられる。 2. Description of the Related Art Conventionally, in a personal digital assistant (PDA), as a character input method, a character string is input by handwriting using a stylus pen or the like on a touch panel (hereinafter referred to as “handwriting input method”). The one that adopted was common. Thereafter, as seen in mobile phones, a method of pressing down a dial key (ten key) to which individual characters are assigned or a QWERTY keyboard (hereinafter referred to as a “key press input method”) is generally used. As it turns out, the input of character strings by the “handwriting input method” has become less used. The reason is as follows.
「キー押下入力方式」を採用する機器では、入力されるかなの文字や文字列を単漢字や単文節に変換する変換処理のほか、例えば変換後の文字や文字列をもとにユーザが望むであろう文章の一部を予測する「予測変換」や、予測された文章の一部を確定した後、これに続くものとしてユーザが望むであろう文章の一部をさらに予測する「連携予測変換」が実現され、少ないキー操作で所望の文章を早く簡単に作成することができた。 For devices that use the “key press input method”, the user wishes based on the converted character or character string, for example, in addition to conversion processing that converts the input kana character or character string into a single kanji or single phrase. "Predictive transformation" that predicts a part of a sentence that will be, or after confirming a part of a predicted sentence, "Federated prediction" that further predicts a part of a sentence that the user would want to follow "Conversion" was realized, and the desired text could be created quickly and easily with few key operations.
これに対し、「手書き入力方式」を採用する機器は、一般に、例えば漢字混じりの文字列(漢字とひらがなとを含む文字列)が入力された場合、上述したような「予測変換」や「連携予測変換」は容易には行えなかった。このため、ユーザは漢字を手書きで入力する毎に、認識される文字を決定する処理又は選択してから決定する処理を行わなければならず、送りがななどについても一字ずつ手書きで入力しなければならなかった。 On the other hand, devices that adopt the “handwriting input method” generally, for example, when a character string mixed with kanji (character string including kanji and hiragana) is input, “Predictive transformation” was not easily performed. For this reason, every time a user inputs a kanji by hand, the user must perform a process of determining a recognized character or a process of determining after selecting a character. did not become.
なお、特許文献1には、「手書き入力方式」の機器において、入力される漢字からユーザが望む漢字の文字列を予測する文字列予測方法が開示されている。また、特許文献2には、入力される漢字などから後続の文字列を予測する「文字列予測部」と、予測された文字列がひらがなである場合に漢字を含む文字列に変換する「かな漢字変換部」とを備えた文字列予測装置が開示されている。
上述の特許文献1,2の技術は、「手書き入力方式」の機器への適用を示すものであるが、以下のような問題がある。
The techniques of
特許文献1の技術では、入力される文字列から予測される文字列を得るためには辞書の全体を検索する必要があるため、CPUの処理を占有し、携帯情報端末などのCPUクロック周波数の低い組込み機器の場合には、「キー押下入力方式」の機器に比べ、検索結果を得るまでに長時間を要し、その結果、入力操作が遅くなってしまう。
In the technique of
一方、特許文献2の技術では、「手書き入力方式」で入力される文字列が例えばひらがなである場合、「かな漢字変換部」と「文字列予測部」の両方の機能を用いて検索が行われるため、特許文献1の場合と同様、CPUの処理を占有し、携帯情報端末などのCPUクロック周波数の低い組込み機器の場合には、「キー押下入力方式」の機器に比べ、検索結果を得るまでに長時間を要し、その結果、入力操作が遅くなってしまう。さらに、特許文献2の技術では、「かな漢字変換部」および「文字列予測部」のそれぞれが辞書を有しているため、携帯電話機などのROM領域に容量制限のある組込み機器の場合には、このROM領域を辞書により圧迫する可能性がある。
On the other hand, in the technique of
本発明は上記実情に鑑みてなされたものであり、限られた記憶領域や同じ構造の辞書を有効に利用しつつ、検索処理の負荷の増大を抑え、入力される文字列が漢字等を含むか否かにかかわらずユーザが望む後続の文字列を素早く予測することが可能な文字列予測プログラムおよび情報処理装置を提供することを目的とする。 The present invention has been made in view of the above circumstances, and while effectively using a limited storage area and a dictionary having the same structure, an increase in the load of search processing is suppressed, and an input character string includes kanji and the like. It is an object of the present invention to provide a character string prediction program and an information processing apparatus capable of quickly predicting a subsequent character string desired by a user regardless of whether or not.
本発明の一態様による文字列予測プログラムは、手書きによる文字列の入力が可能な入力装置と、情報を記憶する記憶媒体と、情報を画面に表示する表示装置とを備えたコンピュータに、1)かな以外を含む文字列の表記と当該文字列の少なくとも一部の読み又は見出しを示すかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列され、当該情報がコード順の配列方向に複数のブロックに区分される辞書データ部と、2)前記辞書データ部に含まれる前記かなの文字列の少なくとも先頭から一部の文字列とかな以外の文字列とを対応付けた情報を含み、前記かな以外の文字列がコード順に配列される第1のインデックスと、3)前記辞書データ部のブロックを指定するブロック識別情報と当該識別情報により指定されるブロックの先頭に位置するかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列される第2のインデックスとを、前記記憶媒体の所定の記憶領域に記憶させる記憶処理機能と、前記入力装置により入力される文字列を認識する認識機能と、前記認識機能により認識される文字列にかな以外の文字列が含まれている場合に、前記第1のインデックスの中から当該かな以外の文字列に対応するかなの文字列を検索し、さらに前記第2のインデックスの中から当該検索したかなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索し、一方、前記認識機能により認識される文字列にかな以外の文字列が含まれておらず、かなの文字列が含まれている場合に、前記第1のインデックスを用いずに前記第2のインデックスの中から当該かなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索する検索機能と、前記検索機能により検索される文字列の表記を候補として前記表示装置の画面に表示させる表示処理機能とを実現させるための文字列予測プログラムである。 A character string prediction program according to an aspect of the present invention is a computer including an input device capable of inputting a character string by handwriting, a storage medium for storing information, and a display device for displaying information on a screen. Including information that associates notation of a character string including characters other than kana with a kana character string indicating at least a part of reading or heading of the character string, the kana character strings are arranged in code order, and the information is encoded A dictionary data section that is divided into a plurality of blocks in the order of arrangement, and 2) at least a part of the kana character string included in the dictionary data section and a character string other than kana are associated with each other A first index in which a character string other than the kana is arranged in code order, and 3) block identification information designating a block of the dictionary data portion and the identification information. Storage processing for storing, in a predetermined storage area of the storage medium, a second index that includes information in association with a kana character string located at the head of a block and in which the kana character string is arranged in code order A function, a recognition function for recognizing a character string input by the input device, and a character string other than kana included in the character string recognized by the recognition function. A kana character string corresponding to a character string other than the kana character string is searched, block identification information corresponding to the searched kana character string is searched from the second index, and the searched block identification information is further searched. The character string recognized by the recognition function is searched for the notation of the character string corresponding to the searched kana character string from the block of the dictionary data portion specified by When a character string other than kana is not included and a kana character string is included, a block corresponding to the kana character string from the second index without using the first index A search function for searching for identification information, and further searching for a notation of a character string corresponding to the character string of the searched kana from among the blocks of the dictionary data portion specified in the searched block identification information; and the search function This is a character string prediction program for realizing a display processing function for displaying on the screen of the display device as candidates the notation of the character string searched for.
本発明によれば、限られた記憶領域や同じ構造の辞書を有効に利用しつつ、検索処理の負荷の増大を抑え、入力される文字列が漢字等を含むか否かにかかわらずユーザが望む後続の文字列を素早く予測することが可能となる。 According to the present invention, while effectively using a limited storage area and a dictionary having the same structure, an increase in the load of search processing is suppressed, and the user can determine whether the input character string includes kanji or the like. It is possible to quickly predict the desired subsequent character string.
以下、図面を参照して、本発明の一実施形態について説明する。
なお、本願明細書でいう「文字列」とは、文字が1つのみの場合もあり得るものとする。「かな」とは、ひらがな又はカタカナを指す。「かな以外」とは、漢字、数字、英字だけではなく、記号、特殊文字なども含んでいることを示す。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
It should be noted that the “character string” referred to in the present specification may have only one character. “Kana” refers to hiragana or katakana. “Non-kana” indicates not only kanji, numbers, and alphabets but also symbols and special characters.
図1は、本発明の一実施形態に係る情報処理装置の構成の一例を示す図である。図1(a)は情報処理装置のハードウェア構成の一例を示し、図1(b)は情報処理装置に搭載されるコンピュータプログラムとしてのソフトウェアの構成の一例を示している。 FIG. 1 is a diagram illustrating an example of a configuration of an information processing apparatus according to an embodiment of the present invention. FIG. 1A illustrates an example of a hardware configuration of the information processing apparatus, and FIG. 1B illustrates an example of a software configuration as a computer program installed in the information processing apparatus.
図1(a)に示す情報処理装置は、例えば、携帯電話機や携帯情報端末など、組込みシステムとして実現するのに適した機器に相当するものであり、実質的にはプログラムを実行するコンピュータとして動作する。この情報処理装置は、制御装置1、不揮発性記憶装置2A、揮発性記憶装置2B、入力装置3、表示装置4、およびI/O装置5を備えている。これらの要素は、バス10により相互に接続される。
The information processing apparatus illustrated in FIG. 1A corresponds to a device suitable for implementation as an embedded system, such as a mobile phone or a portable information terminal, and substantially operates as a computer that executes a program. To do. The information processing apparatus includes a
制御装置1は、例えばCPU等のプロセッサに相当するものであり、本装置全体の制御を司る。この制御装置1は、例えば、不揮発性記憶装置2Aに記憶されるプログラムやデータを読み出したり、読み出したプログラムやデータを揮発性記憶装置2Bへロードして各種の処理を実行したりする。さらに、制御装置1は、例えば、入力装置3を通じて入力されるデータや表示装置4へ出力するデータを不揮発性記憶装置2A、揮発性記憶装置2B、もしくは外部I/O装置5との間で送受する制御を行ったり、外部I/O装置5を通じて外部のネットワークから取得されるデータを不揮発性記憶装置2A等に記憶させる処理を行ったりする。
The
不揮発性記憶装置2Aは、例えばフラッシュメモリなどの書換え可能な半導体メモリ、もしくはハードディスクドライブに相当するものである。この不揮発性記憶装置2Aは、本実施形態に係る文字列予測プログラムや、当該プログラムが使用する各種の辞書やインデックス(後述)などを含むデータを記憶している。
The
揮発性記憶装置2Bは、例えばRAMなどの半導体メモリに相当するものである。この揮発性記憶装置2Bは、制御装置1の作業領域として使用され、不揮発性記憶装置2Aからロードされるプログラムやデータを記憶する。
The volatile storage device 2B corresponds to a semiconductor memory such as a RAM. The volatile storage device 2B is used as a work area of the
入力装置3は、表示装置4上に配置され、ペンタブレットもしくはタッチパネルを形成している。このペンタブレットもしくはタッチパネル上の所定の領域内において、スタイラスペンもしくは指先を押し当てながら文字を描く操作を行うことにより、手書きによる文字や文字列の入力が達成される。本実施形態では、ペンタブレットに対しスタイラスペンを用いて入力を行う場合を例にとって説明する。
The
表示装置4は、例えば液晶ディスプレイ装置であり、入力装置3を通じて手書きにより入力される文字の筆跡を第1の表示領域に表示したり、入力後に認識された文字列の候補を第2の表示領域に表示したり、候補の中から自動もしくは手動により選択された文字列を第3の表示領域に表示したり、表示されている文字列をもとにユーザが望むものとして予測された文字列を第4の表示領域に表示したりする。
The
I/O装置5は、外部のネットワークを通じて辞書などをダウンロードして不揮発性記憶装置2Aへ送ったりする。
The I /
図1(b)には、上記不揮発性記憶装置2Aに格納された文字列予測プログラムおよびデータの記憶部が示されている。文字列予測プログラムには、記憶処理部31、文字認識部32、検索部33、予測候補出力部34、表示順序処理部35、辞書編集部36、および表示処理部37が備えられる。文字列予測プログラムが使用するデータの各記憶部としては、文字認識辞書情報記憶部21、基本辞書情報記憶部22、予測辞書情報記憶部23、学習辞書情報記憶部24、インデックス情報記憶部25、および予測候補情報記憶部26が設けられる。そのほか、図示しないが、ユーザ辞書情報記憶部、ダウンロード辞書情報記憶部(以下、「DL辞書記憶部」と称す。)、および連携予測辞書記憶部が設けられる。なお、これらの記憶部内のデータは、揮発性記憶装置2Bにロードされた際にもそれぞれ同じ記憶部(記憶領域)が確保される。
FIG. 1B shows a character string prediction program and data storage unit stored in the
記憶処理部31は、不揮発性記憶装置2Aから、1)「かな以外」を含む文字列(例えば、「かな以外」とかなとを含むかな混じりの文字列や、「かな以外」のみの文字列)の表記と当該文字列の少なくとも一部の読み又は見出しを示すかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列され、当該情報がコード順の配列方向に複数のブロックに区分される辞書データ部と、2)前記辞書データ部に含まれる前記かなの文字列の少なくとも先頭から一部の文字列と「かな以外」の文字列とを対応付けた情報を含み、前記かな以外の文字列がコード順に配列される第1のインデックス(以下、「漢字インデックス」と称す。)と、3)前記辞書データ部のブロックを指定するブロック識別情報(ブロック番号)と当該識別情報により指定されるブロックの先頭に位置するかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列される第2のインデックス(以下、「ヨミインデックス」と称す。)とを読み出し、揮発性記憶装置2B内の所定の記憶領域にロードして記憶させる機能である。なお、漢字インデックス、ヨミインデックス、および辞書データ部は、辞書を構成し、種類が異なる辞書毎に存在するものである。また、前記ブロックは、辞書データ部の記憶領域において、最も効率よく辞書内の文字列が検索できる容量ごとに分けた領域の一つを指す。
The
ここで、ブロックについてより詳細に説明する。
ブロックとは、記憶デバイスおよびそのドライバによって、物理的あるいは論理的に定まる、統計的にもっともアクセス時間が少なくなるよう推奨される記憶容量の管理単位である。本実施形態では、1ブロックに辞書内の各レコードが収まるように記録される。レコードは、順次コード順に記録されもし、1レコードがブロックの境界にまたがる場合は、その部分は未使用として、次のブロックの先頭より記録される。これらのブロックは、連続した整数で表されるブロック番号を有する。また、本実施形態では、ヨミインデックスによって、その語の含まれる記憶部のブロックが限定されることによって検索時間を短く終わらせることができる。これを他の方法で実施しようとすると、もし検索対象の語が辞書に含まれていない場合、全部の辞書を検索することになり、非常に時間がかかることになる。
Here, the block will be described in more detail.
A block is a management unit of storage capacity that is physically or logically determined by the storage device and its driver and is statistically recommended to minimize the access time. In the present embodiment, each record in the dictionary is recorded in one block. Records are sequentially recorded in code order. If one record crosses a block boundary, that portion is recorded as unused and recorded from the beginning of the next block. These blocks have block numbers represented by consecutive integers. Further, in this embodiment, the search time can be shortened by limiting the block of the storage unit including the word by the reading index. If this is attempted by another method, if the search target word is not included in the dictionary, the entire dictionary will be searched, which will be very time consuming.
文字認識部32は、入力装置3により入力される文字列を認識する機能である。具体的には、文字認識部32は、手書きにより入力された文字を文字認識辞書情報記憶部21に記憶される文字認識辞書をもとに手書き文字の認識を行い、この認識した単一又は複数の認識結果を、表示処理部37を通じて表示装置4における画面上の認識文字結果表示用ウインドウ42の領域に表示させる。
The
検索部33は、文字認識部32により認識される文字列に「かな以外」の文字列が含まれている場合に、前記漢字インデックスの中から当該「かな以外」の文字列に対応するかなの文字列を検索し、さらに前記ヨミインデックスの中から当該検索したかなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索し、一方、文字認識部32により認識される文字列に「かな以外」の文字列が含まれておらず、かなの文字列が含まれている場合に、前記漢字インデックスを用いずに前記ヨミインデックスの中から当該かなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索する機能である。
When the character string recognized by the
具体的には、検索部33は、文字認識部32による手書き入力文字の認識結果から入力文字としての確定前の文字列に「かな以外」が含まれるか否かを判定し、その判定結果によって、この文字列に続く文字の予測形態を、かな文字列に続く文字列を予測する形態である「かな予測処理」と、「かな以外」が含まれる文字列に続く文字列を予測する形態である「漢字予測処理」との間で切り替える機能を有する。また、検索部33は、候補文字表示用ウインドウ44に表示可能な数の予測変換候補を得るために各種辞書の検索を行う機能を有する。検索部33は、「漢字予測処理」により予測変換候補を得るためには、各種辞書について漢字インデックスを検索した上で、ヨミインデックスを検索し、さらに辞書データ部を検索する。一方、「かな予測処理」により予測変換候補を得るためには、ヨミインデックスを検索した上で、辞書データ部を検索する。すなわち、本実施形態では、「かな予測処理」に使用されるヨミインデックスおよび辞書データ部が「漢字予測処理」においても有効に利用される。このため、「漢字予測処理」のために専用のヨミインデックスおよび辞書データ部を個々に設ける必要がなく、辞書データ部に比べてデータ量が極端に少ない漢字インデックスを加えるだけで、限られた記憶領域を有効に利用し、入力される文字列が「かな以外」を含むか否かにかかわらず予測変換候補を素早く出力させることを実現している。
Specifically, the
また、検索部33は、漢字インデックス、ヨミインデックス、および辞書データ部のブロックのそれぞれの中においてコード順に配列された個々の文字列に対しバイナリサーチを実施することにより所望のデータが存在する位置を求める機能を有する。これにより、検索速度を一層高めることが可能となる。
In addition, the
予測候補出力部34は、かな予測処理や漢字予測処理により得た予測変換候補を、表示処理部37を通じて表示装置4における画面上の候補文字表示用ウインドウ44に表示させる機能である。
The prediction
表示順序処理部35は、予測候補情報記憶部26に格納された予測変換候補の表示順を設定する機能である。
The display
辞書編集部36は、学習辞書情報記憶部24に記憶される学習辞書の編集を行う機能である。
The
表示処理部37は、例えば、検索部33により検索される文字列の表記を候補として表示装置4の画面上に表示させるなど、各種の情報を表示させる機能である。
The
文字認識辞書情報記憶部21は、手書きによる文字を認識するための文字認識辞書を記憶する。この文字認識辞書は、二次元パターンと文字との対応付けを示す情報を有する。
The character recognition dictionary
基本辞書情報記憶部22は、基本辞書の本体となる辞書データ部を記憶する。この基本辞書の辞書データ部は、1列目のデータとしてかなの文字列を備え、2列目のデータとして、前記1列目のデータのかな文字列に対応する、「かな以外」を含む文字列(例えば、「かな以外」とかなとを含むかな混じりの文字列や、「かな以外」のみの文字列)を備えており、コード順の配列方向へ複数のブロックに区分された形態で記憶されている。この構造により、かなの文字列を「かな以外」を含む文字列に変換することができる。特に、この基本辞書の辞書データ部においては、1列目のデータであるかな文字列は、2列目のデータである「かな以外」を含む文字列の読みの全てをかな文字列にしたものとなっている。
The basic dictionary
予測辞書情報記憶部23は、予測辞書の本体となる辞書データ部を記憶する。この予測辞書の辞書データ部は、前述の基本辞書の辞書データ部と同様の構造を有する。但し、この予測辞書の辞書データ部においては、1列目のデータであるかな文字列は、2列目のデータである「かな以外」を含む文字列の読みの前方の一部(例えば、当該文字列の後方を省略して読んだときの読みである省略読み)をかな文字列にしたものとなっている。この場合のかな文字列は、例えば1〜3文字からなる。
The prediction dictionary
学習辞書情報記憶部24は、学習辞書の本体となる辞書データ部を記憶する。この学習辞書の辞書データ部は、前述の各辞書の辞書データ部と同様の構造を有する。但し、この学習辞書の辞書データ部は、かなの文字列を「かな以外」を含む文字列に変換するための第1の学習辞書データ部と、「かな以外」を含む文字列をかなの文字列に変換するための第2の学習辞書データ部とから構成されている。また、この学習辞書の辞書データ部は、文字列毎にユーザが入力した頻度を示す情報も備えている。
The learning dictionary
また、図示しないユーザ辞書情報記憶部は、ユーザ辞書の本体となる辞書データ部を記憶する。このユーザ辞書の辞書データ部は、前述の基本辞書や予測辞書や学習辞書の辞書データ部と同様の構造を有する。但し、このユーザ辞書の辞書データ部は、1列目のデータと2列目のデータ(例えば、ヨミと表記)をユーザが任意に登録できるようになっている。 Further, a user dictionary information storage unit (not shown) stores a dictionary data unit that is a main body of the user dictionary. The dictionary data part of this user dictionary has the same structure as the dictionary data part of the basic dictionary, prediction dictionary, or learning dictionary described above. However, the dictionary data portion of this user dictionary allows the user to arbitrarily register the data in the first column and the data in the second column (for example, written as Yomi).
また、図示しないDL辞書情報記憶部は、ダウンロード辞書(以下、「DL辞書」と称す。)の本体となる辞書データ部を記憶する。このDL辞書の辞書データ部は、前述の各辞書の辞書データ部と同様の構造を有する。特に、DL辞書は、I/O装置5からネットワークを通じて外部からダウンロードすることができる。DL辞書は、当該辞書もしくは本文字列予測プログラムのプロバイダ、あるいは本情報処理装置のメーカなどがネットワークを通じてユーザに提供する。
In addition, a DL dictionary information storage unit (not shown) stores a dictionary data unit serving as a main body of a download dictionary (hereinafter referred to as “DL dictionary”). The dictionary data portion of the DL dictionary has the same structure as the dictionary data portion of each dictionary described above. In particular, the DL dictionary can be downloaded from the I /
インデックス情報記憶部25は、漢字インデックスおよびヨミインデックスを記憶する。漢字インデックスは、2列目のデータとして、辞書データ部の1列目のデータ(かなの文字列)の前方2文字までの文字列(但し、3文字以上も可能)を備え、1列目のデータとして、前記辞書データ部の1列目のデータに対応する2列目のデータ(かな以外を含む文字列)の前方1文字を備えている。すなわち、漢字インデックスは、辞書データ部から収集したデータで構成されている。ヨミインデックスは、2列目のデータとして、辞書データ部のブロックを指定するブロック識別情報を備え、1列目のデータとして、そのブロックの第1列目のデータであってコード順における先頭レコードに位置するデータ(かなの文字列)を備えている。
The index
予測候補情報記憶部26は、予測変換候補として表示させる情報を記憶する。
The prediction candidate
ここで、図2〜図4を参照して、「漢字」、「ひらがな」、「漢字とひらがな」を、それぞれ手書きで入力した場合の表示装置4の画面上での予測変換等の動作の例について説明する。
Here, referring to FIG. 2 to FIG. 4, examples of operations such as predictive conversion on the screen of the
なお、表示装置4の画面上に表示される文字の認識結果である認識文字候補の選択方法として、自動選択モードと手動選択モードが用意されている。モードは、画面上に表示される設定メニューからユーザが自由に選択できるようになっている。自動選択モードでは、ペンがパネルから離れたときに、認識文字候補の最上位が自動的に選択され、対応する予測候補が表示される。一方、手動選択モードでは、ペンがパネルから離れたときに、認識文字候補が表示され、ユーザは候補を選択し、対応する予測候補が表示される。
Note that an automatic selection mode and a manual selection mode are prepared as methods for selecting recognized character candidates that are recognition results of characters displayed on the screen of the
図2は、「漢字」を手書きで入力した場合の表示装置4の画面上での予測変換等の動作の例を示す図である。
FIG. 2 is a diagram illustrating an example of operations such as predictive conversion on the screen of the
まず、図2(a)に示すように、表示装置4に画面が表示され、この画面の右下にある手書き文字入力用ウインドウ41内に、ペンタッチにより手書きによる入力が開始されると、文字認識エンジンに従い、入力の軌跡をチェックし表示装置4の手書き文字入力用ウインドウ41からタッチペンが離れるまで、入力文字が文字認識エンジンに記憶されている文字パターンと比較し文字認識辞書情報記憶部21に記憶される辞書とを照合して、手書き入力された文字の認識結果を当該辞書から単一又は複数検索する。上記文字認識エンジンは当該技術で一般的に用いられるものであればよい。
First, as shown in FIG. 2A, when a screen is displayed on the
本実施形態の自動選択モードにおいては、図2(a)に示すように、手書き文字入力用ウインドウ41内に、ペンタッチにより漢字の「大」が入力されると、表示装置4の画面の左下にある認識文字結果表示用ウインドウ42内に、手書き入力された文字の認識結果が表示され、表示装置4の画面の上部にある文字表示用ウインドウ43内に、文字認識エンジンにより最も入力文字に近いであろう文字が、図2(b)に示すように表示され、さらに仮確定認識文字「大」に対する漢字予測処理により、表示装置4の画面の中央部の候補文字表示用ウインドウ44内に、予測変換候補の文字列「大阪」、「大きな」、「大人」、「大幅」が表示される。次に、予測変換候補の文字列のうち「大阪」がユーザにより選択されると、図2(c)に示すように、連携予測変換候補の文字列「府」、「府立」、「駅」等が表示される。
In the automatic selection mode of the present embodiment, as shown in FIG. 2A, when a “large” Chinese character is input by pen touch into the handwritten character input window 41, it is displayed at the lower left of the screen of the
図3は、「ひらがな」を手書きで入力した場合の表示装置の画面上での予測変換等の動作の例を示す図である。 FIG. 3 is a diagram illustrating an example of operations such as predictive conversion on the screen of the display device when “Hiragana” is input by handwriting.
まず、図3(a)に示すように、手書き文字入力用ウインドウ41内に、ペンタッチにより手書きによる一文字の文字である「お」が入力されると、次に、図3(b)に示すように、認識結果である文字の候補の中から文字が自動選択または手動選択され、選択された文字が仮確定認識文字「お」にされると、かな予測処理により、表示装置4の画面の中央部の候補文字表示用ウインドウ44内に、予測変換候補の文字列「お疲れ」、「お疲れ様」が表示される。
First, as shown in FIG. 3A, when “o”, which is one handwritten character, is input by pen touch into the handwritten character input window 41, next, as shown in FIG. 3B. In addition, when a character is automatically selected or manually selected from among the candidate characters that are the recognition results, and the selected character is set to the temporarily confirmed recognition character “O”, the center of the screen of the
図4は、「漢字とひらがな」を手書きで入力した場合の表示装置4の画面上での予測変換等の動作の例を示す図である。
FIG. 4 is a diagram illustrating an example of operations such as predictive conversion on the screen of the
図4(a)では、図2(a),(b)と同様に、手書き文字入力用ウインドウ41内に漢字の「大」が入力された後に仮確定文字「大」に対する予測変換候補が候補文字表示用ウインドウ44に表示され、次に、図4(b)に示すように、手書き文字入力用ウインドウ41内に、ひらがなで「き」が手書きで入力されると、図4(c)に示すように、文字表示用ウインドウ43内に、仮確定文字の「大き」に対する予測変換候補が表示され、候補の中から「い」がユーザにより選択されると、図4(d)に示すように、候補文字表示用ウインドウ44内に、仮確定文字「大きい」に対する連携予測変換候補の文字列「。」、「?」、「!」、「のに」、「ので」が表示される。
In FIG. 4A, as in FIGS. 2A and 2B, a candidate for a predictive conversion candidate for the tentative fixed character “Large” after the Chinese character “Large” is input in the handwritten character input window 41 is displayed. When it is displayed in the character display window 44 and then “ki” is input by handwriting in the handwritten character input window 41 as shown in FIG. 4B, FIG. As shown in FIG. 4D, when a predicted conversion candidate for the “large” provisionally confirmed character is displayed in the
ここで、図5を参照して、検索部33による検索の動作の一例について説明する。
Here, an example of a search operation performed by the
検索部33は、検索処理において各種の辞書を用いるが、ここでは予測辞書を用いる処理のみに焦点を絞って説明する。なお、予測辞書は、予測辞書用漢字インデックスと、予測辞書用ヨミインデックスと、予測辞書データ部とからなる。これら3つの情報は、共通して、1列目のデータとして文字列(A)を備えるとともに、2列目のデータとして文字列(B)を備えている。文字列(A)は、検索キーとなる文字列との照合に供されるデータであり、文字列(B)は、検索結果として出力するためのデータである。
The
最初に、検索部33は、変換対象文字にかな以外が含まれているか否かの漢字予測判定を行う。
First, the
判定の結果、かな以外が含まれている場合には、漢字予測処理を行う。 As a result of the determination, if a character other than kana is included, kanji prediction processing is performed.
漢字予測処理において、例えば、漢字“山”が含まれている場合、検索部33は、予測辞書用漢字インデックスの1列目のデータである文字列(A)の中からバイナリサーチにより漢字の“山”が存在する位置を求め、この“山”に対応するかなの文字列“サン”,“ヤ”,“ヤマ”を2列目のデータである文字列(B)の中から抽出する。
In the kanji prediction process, for example, when the kanji “yama” is included, the
次に、検索部33は、予測辞書用ヨミインデックスの1列目のデータである文字列(A)の中からバイナリサーチによりかなの文字列“サン”,“ヤ”,“ヤマ”が存在する位置をそれぞれ求め、これらにそれぞれ対応するブロック番号を2列目のデータである文字列(B)の中から抽出する。例えば、“サン”は、文字列(A)の中の個々のかな文字列のうち、文字コード順で“サマ”と“サンカ”との間にあるため、“サマ”に対応するブロック番号94を2列目のデータである文字列(B)の中から抽出する。また、かな文字列“サンカ”は、“サン”を含むため、“サンカ”に対応するブロック番号95についても2列目のデータである文字列(B)の中から抽出する。なお、“ザ”は、“サン”よりも下位の文字コードであり、“ザ”は、“サン”を含まないため、抽出しない。
Next, the
続いて、検索部33は、辞書データ部のブロック番号94のブロックにおける1列目のデータである文字列(A)の中からバイナリサーチによりかなの文字列“サン”が含まれる文字列の位置を求めるとともに、辞書データ部のブロック番号95のブロックにおける1列目のデータである文字列(A)の中からバイナリサーチにより、かなの文字列“サン”を含む文字列の位置を求め、これらにそれぞれ対応する表記を2列目のデータである文字列(B)の中から“山”を含む文字列を抽出する。例えば、予測データ部の文字列(A)の中の個々のかな文字列のうち、“サンイ”は、“サン”を含む文字列であり、“サンイ”に対応する文字列(B)は、“山“を含むため“山陰”を抽出、この“山陰”を、“山”の予測変換候補の一つとして出力する。
Subsequently, the
また、図示しない辞書データ部の他のブロックや、予測辞書以外の各種の辞書における辞書データ部のブロックからも、同様な手法により“山”の予測変換候補が出力される。 In addition, a prediction conversion candidate of “mountain” is output from other blocks of the dictionary data portion (not shown) and dictionary data portion blocks in various dictionaries other than the prediction dictionary by the same method.
一方、上記判定の結果、かな以外が含まれていない場合には、かな予測処理を行う。 On the other hand, if the result of the determination does not include anything other than kana, kana prediction processing is performed.
検索部33は、例えば、“サン”が含まれている場合、予測辞書用ヨミインデックスの1列目のデータである文字列(A)の中からバイナリサーチによりかなの文字列“サン”が存在する位置をそれぞれ求め、2列目のデータである文字列(B)の中から該当するブロック番号を抽出し、続いて、辞書データ部の該当するブロックにおける1列目のデータである文字列(A)の中からバイナリサーチによりかなの文字列“サン”が存在する位置を求め、対応する表記を2列目のデータである文字列(B)の中から抽出し、“サン”の予測変換候補の一つとして出力する。
For example, when “Sun” is included, the
このような仕組みにより、辞書全体を検索するよりも、より素早く検索することができる。 With such a mechanism, it is possible to search faster than searching the entire dictionary.
次に、図6〜図10を参照して、各種辞書の漢字インデックス、ヨミインデックス、および辞書データ部のデータ構造の詳細について説明する。 Next, with reference to FIG. 6 to FIG. 10, details of the data structure of the kanji index, the yomi index, and the dictionary data portion of various dictionaries will be described.
各種辞書の漢字インデックス、ヨミインデックス、および辞書データ部は、共通して、1列目のデータとして文字列(A)、2列目のデータとして文字列(B)、3列目以降のデータとして属性を、それぞれ備えている。属性には、属性(1),属性(2),属性(3)の3種類がある。また、各辞書、各辞書毎の漢字インデックスは、1列目、2列目の文字列が同一の重複する情報は含まない。 The kanji index, the yomi index, and the dictionary data portion of various dictionaries are commonly used as a character string (A) as data in the first column, a character string (B) as data in the second column, and data from the third column onwards. Each attribute is provided. There are three types of attributes: attribute (1), attribute (2), and attribute (3). In addition, the kanji index for each dictionary and each dictionary does not include overlapping information in which the first and second character strings are the same.
このようにデータ構造を共通化することにより、限られた記憶領域を無駄なく有効に使用でき、検索速度を向上させることができる。 By sharing the data structure in this way, a limited storage area can be used effectively without waste, and the search speed can be improved.
図6は、同実施形態における情報処理装置に記憶される各種辞書の辞書データ部のデータ構造の例を表形式で示す図である。
図6(a)の例に示される基本辞書の辞書データ部は、前述した通り基本辞書情報記憶部22に記憶されるもので、文字列(A)としてかなの文字列(…、サザンカ、…、サンカ、…、サンカク、…)を備え、文字列(B)として表記を示す「かな以外」を含む文字列(…、山茶花、…、参加、…、△、…)を備えており、複数のブロックに区分された形態で記憶されている。また、属性(1)として品詞を示す情報(…、普通名詞、…、普通名詞、…、普通名詞、…)と、属性(2)として優先度(予測変換候補の表示順の優先度)を示す情報(…、低優先、…、通常、…、通常、…)とを備えている。
FIG. 6 is a diagram illustrating an example of a data structure of a dictionary data portion of various dictionaries stored in the information processing apparatus according to the embodiment in a table format.
The dictionary data portion of the basic dictionary shown in the example of FIG. 6A is stored in the basic dictionary
図6(b)の例に示される予測辞書の辞書データ部は、前述した通り予測辞書情報記憶部23に記憶されるもので、文字列(A)としてかなの文字列(…、サン、サン、…、サンイ、…)を備え、文字列(B)として表記を示す「かな以外」を含む文字列(…、三角、III等、…、山陰、…)を備えており、複数のブロックに区分された形態で記憶されている。また、属性(1)として品詞を示す情報(…、普通名詞、普通名詞、…、固有名詞、…)と、属性(2)として優先度(予測変換候補の表示順の優先度)を示す情報(…、通常、低優先、…、通常、…)とを備えている。
The dictionary data portion of the prediction dictionary shown in the example of FIG. 6B is stored in the prediction dictionary
図6(b)に示した例では、表記「三角」に対応する文字列「サン」は省略読みであり、表記「山陽新幹線」に対応する文字列「サンヨ」は省略読みである。つまり、手書き入力により「サン」を入力した場合には、これに続く文字を入力しなくとも、予測変換候補として「三角」が表示され、手書き入力により「サンヨ」を入力した場合には、これに続く文字を入力しなくとも、予測変換候補として「山陽新幹線」が表示されることになる。 In the example shown in FIG. 6B, the character string “San” corresponding to the notation “triangle” is omitted, and the character string “Sanyo” corresponding to the notation “Sanyo Shinkansen” is omitted. In other words, when “san” is input by handwriting input, “triangle” is displayed as a predictive conversion candidate without inputting the subsequent character, and when “sanyo” is input by handwriting input, Even if the character following is not input, “Sanyo Shinkansen” is displayed as a predictive conversion candidate.
図6(c)の例に示される学習辞書の辞書データ部は、前述した通り学習辞書情報記憶部24に記憶されるもので、文字列(A)としてかなの文字列(…、サ、…、ヤ、…)を備え、文字列(B)としてとして表記を示す「かな以外」を含む文字列(…、山さん、…、山手線沿い、…)を備えており、複数のブロックに区分された形態で記憶されている。但し、図示されていないが、学習辞書の辞書データ部には、文字列(A)として「かな以外」を含む文字列を備え、文字列(B)としてかなの文字列を含む文字列を備えた情報も存在する。また、属性(3)として頻度を示す情報(…、5、…、2、…)を備えている。
The dictionary data portion of the learning dictionary shown in the example of FIG. 6C is stored in the learning dictionary
図6(c)の例に示されるように、文字列(A)と文字列(B)との組合せは、かな漢字変換による入力文字の確定にかかる頻度の高い順に配列されている。なお、頻度を採用する代わりに優先度を採用するようにしてもよい。また、前述した組み合わせの配列は、前回利用、つまり前回の入力文字として確定した文字を最上部に表示する配列としてもよい。 As shown in the example of FIG. 6C, the combinations of the character string (A) and the character string (B) are arranged in descending order of the frequency of input character determination by kana-kanji conversion. In addition, you may make it employ | adopt a priority instead of employ | adopting frequency. Moreover, the arrangement | sequence of the combination mentioned above is good also as an arrangement | sequence which displays the character confirmed as last input, ie, the last input character, on the uppermost part.
図6(d)の例に示されるユーザ辞書の辞書データ部は、前述した通り図示しないユーザ辞書情報記憶部に記憶されるもので、文字列(A)としてかなの文字列(…、ア、…)を備え、文字列(B)として表記を示す「かな以外」を含む文字列(…、山陽新幹線、…)を備えており、複数のブロックに区分された形態で記憶されている。また、属性(1)として品詞を示す情報(…、普通名詞、…)と、属性(2)として優先度(予測変換候補の表示順の優先度)を示す情報(…、通常、…)とを備えている。文字列(A)の「ア」と文字列(B)の「山陽新幹線」は、ユーザが任意に登録したものである。 The dictionary data portion of the user dictionary shown in the example of FIG. 6D is stored in a user dictionary information storage portion (not shown) as described above, and a kana character string (..., a, ...) and a character string (..., Sanyo Shinkansen, ...) including "other than kana" indicating notation as a character string (B), and stored in a form divided into a plurality of blocks. Also, information (..., common noun, ...) indicating the part of speech as the attribute (1), information (..., normal, ...) indicating the priority (priority of the display order of the prediction conversion candidates) as the attribute (2), and It has. The character string (A) “A” and the character string (B) “Sanyo Shinkansen” are arbitrarily registered by the user.
図6(e)の例に示されるDL辞書の辞書データ部は、前述した通り図示しないDL辞書情報記憶部に記憶されるもので、例えば「関西弁辞書」等の方言辞書や、「医学用語辞書」等の専門辞書がある。 The dictionary data portion of the DL dictionary shown in the example of FIG. 6 (e) is stored in a DL dictionary information storage portion (not shown) as described above. For example, a dialect dictionary such as “Kansai dialect dictionary” or “medical terminology” There are specialized dictionaries such as “Dictionary”.
DL辞書は、文字列(A)としてかなの文字列(…、サンカクコ、…)を備え、文字列(B)として表記を示す「かな以外」を含む文字列(…、△湖、…)を備えており、複数のブロックに区分された形態で記憶されている。また、属性(1)として品詞を示す情報(…、固有名詞、…)と、属性(2)として優先度(予測変換候補の表示順の優先度)を示す情報(…、通常、…)とを備えている。このDL辞書は、ユーザがダウンロードしたものである。 The DL dictionary includes a kana character string (..., Sankakuko, ...) as a character string (A), and a character string (..., △ lake, ...) including "other than kana" indicating notation as the character string (B). And is stored in a form divided into a plurality of blocks. Also, information (..., proper noun, ...) indicating the part of speech as the attribute (1), information (..., normal, ...) indicating the priority (priority of the display order of the prediction conversion candidates) as the attribute (2), and It has. This DL dictionary is downloaded by the user.
そのほか、記憶装置2Aには、図示しない連携予測辞書が備えられる。この連携予測辞書は、例えば、予測変換候補として選択された表記である確定表記と、当該確定表記に連なる表記である連語・連想表記と、読みを示す文字列(ヨミ文字列)と、品詞と、優先度とが対応付けられる情報である。この連携予測辞書における確定表記および連語・連想表記は「かな以外の文字」を含む。一方、連携予測辞書におけるヨミ文字列は、かな文字である。
In addition, the
図7は、同実施形態における情報処理装置に記憶される漢字インデックスの構成例を表形式で示す図である。
図7(a)の例に示される基本辞書用漢字インデックスは、前述した通りインデックス情報記憶部25に記憶されるもので、文字列(A)として「かな以外」を含む文字列(…、山、山、山、山、…)を備え、文字列(B)としてかなの文字列(…、サザ、ザン、ヤマ、ワサ、…)を備えている。
FIG. 7 is a diagram illustrating a configuration example of the kanji index stored in the information processing apparatus according to the embodiment in a table format.
The kanji index for basic dictionary shown in the example of FIG. 7A is stored in the index
図7(b)の例に示される予測辞書用漢字インデックスは、前述した通りインデックス情報記憶部25に記憶されるもので、文字列(A)として「かな以外」を含む文字列(…、山、山、山、…)を備え、文字列(B)としてかなの文字列(…、サン、ヤ、ワ、…)を備えている。
The kanji index for prediction dictionary shown in the example of FIG. 7B is stored in the index
図7(a)および図7(b)の例では、文字列(B)は、辞書データ部のブロックにおける文字列(A)の文字列の前方2文字までの文字列である。但し、前方2文字までに限ることなく3文字以上とすることも可能である。また、これらの漢字インデックスは、前述した基本辞書や予測辞書の辞書データ部のヨミ文字列および表記の対応関係をもとに予め構築され、文字列(A)の配列は文字コード順とする。但し、文字コード順に限らずにその他のコード順とすることも可能である。 In the example of FIGS. 7A and 7B, the character string (B) is a character string up to the first two characters of the character string of the character string (A) in the block of the dictionary data portion. However, it is possible to make it 3 or more characters without being limited to 2 characters in front. These kanji indexes are constructed in advance based on the correspondence between the Yomi character strings and the notations in the dictionary data portions of the basic dictionary and the prediction dictionary described above, and the arrangement of the character strings (A) is in the character code order. However, other code orders are possible without being limited to the character code order.
図8は、同実施形態における情報処理装置による候補文字表示ウインドウ44の一例を示す図である。図8の上位の文字列から順に、候補文字表示ウインドウ44の左に順番に表示される。 FIG. 8 is a diagram illustrating an example of a candidate character display window 44 by the information processing apparatus according to the embodiment. The character strings are displayed in order from the upper character string in FIG.
この表示例では、「山さん」の表示順位が上であって、「山茶花」の表示順位が下である。この「山茶花」は基本辞書用予測辞書から「山ノ会」や「山っ気」より先に検索されたが、検索元の基本辞書用予測辞書にて対応付けられる優先度が「低優先」であることなどから、表示順序処理部35の処理により「山ノ会」や「山っ気」より表示順位が下となったことを示している。
In this display example, the display order of “Yamasan” is higher, and the display order of “Yamachahana” is lower. This "Sancha Hana" was searched from the basic dictionary prediction dictionary before "Yamanokai" and "Yamaki", but the priority associated with the basic dictionary prediction dictionary of the search source is "low priority" This indicates that the display order is lower than “Yamanokai” or “Yamaki” by the processing of the display
次に、本実施形態の詳細例について説明する。この詳細例では、予測辞書と基本辞書を、漢字インデックス、ヨミインデックスおよびデータ部で構成するものである。
図9は、本発明の実施形態における情報処理装置に記憶される予測辞書の詳細を表形式で示す図である。
この詳細例における予測辞書は、図5においても説明した通り、予測辞書用漢字インデックス、予測辞書ヨミインデックス、および予測辞書データ部により構成される。
図9(a)の例に示される予測辞書用漢字インデックスは、インデックス情報記憶部25に記憶されるもので、文字列(A)として「かな以外」を含む文字列(…、山、山、山、…)を備え、文字列(B)としてかなの文字列(…、サン、ヤ、ヤマ、…)を備えている。
Next, a detailed example of this embodiment will be described. In this detailed example, the prediction dictionary and the basic dictionary are composed of a Kanji index, a Yomi index, and a data part.
FIG. 9 is a diagram showing details of the prediction dictionary stored in the information processing apparatus according to the embodiment of the present invention in a tabular format.
The prediction dictionary in this detailed example includes a prediction dictionary kanji index, a prediction dictionary reading index, and a prediction dictionary data section, as described with reference to FIG.
The kanji index for prediction dictionary shown in the example of FIG. 9A is stored in the index
図9(b)の例に示される予測辞書用ヨミインデックスは、インデックス情報記憶部25に記憶されるもので、文字列(A)としてかなの文字列(…、サマ、サンカ、ザ、…)を備え、文字列(B)として予測辞書の辞書データ部のブロックを指定するブロック番号(…、94、95、96、…)を備えている。文字列(A)には、文字列(B)のブロック番号により指定されるブロックの先頭に位置するかなの文字列がコード順に配列される。
The prediction dictionary reading index shown in the example of FIG. 9B is stored in the index
図9(c)の例に示されるブロック番号94の予測辞書データ部のブロックは、予測辞書情報記憶部23に記憶されるもので、文字列(A)としてかなの文字列(サマ、…、…、サンイ,…)を備え、文字列(B)として「かな以外」を含む文字列(様々、…、…、山陰、…)を備えている。
The block of the prediction dictionary data part of the
図9(d)の例に示されるブロック番号95の予測辞書データ部のブロックは、予測辞書情報記憶部23に記憶されるもので、文字列(A)としてかなの文字列(サンカ、…、…)を備え、文字列(B)として「かな以外」を含む文字列(参画、…、…)を備えている。
The block of the prediction dictionary data part of
なお、図9に示される予測辞書の使い方については、図5の例で説明した通りである。 The usage of the prediction dictionary shown in FIG. 9 is as described in the example of FIG.
図9の構成によれば、予測辞書による検索処理機能が向上し、予測変換候補の検索範囲を狭くすることができるので、予測変換処理にかかる処理負荷を軽減することができる。 According to the configuration of FIG. 9, the search processing function using the prediction dictionary is improved and the search range of prediction conversion candidates can be narrowed, so that the processing load on the prediction conversion process can be reduced.
図10は、本発明の実施形態における情報処理装置に記憶される基本辞書の詳細例を表形式で示す図である。
この詳細例における基本辞書は、図5においても説明した通り、基本辞書用漢字インデックス、基本辞書ヨミインデックス、および基本辞書データ部により構成される。
図10(a)の例に示される基本辞書用漢字インデックスは、インデックス情報記憶部25に記憶されるもので、文字列(A)として「かな以外」を含む文字列(…、山、山、山、山、山、山、…)を備え、文字列(B)としてかなの文字列(…、サザ、サン、ザン、ヤキ、ヤマ、ワサ、…)を備えている。
FIG. 10 is a diagram showing a detailed example of the basic dictionary stored in the information processing apparatus according to the embodiment of the present invention in a table format.
The basic dictionary in this detailed example is composed of a basic dictionary kanji index, a basic dictionary reading index, and a basic dictionary data section as described with reference to FIG.
The kanji index for basic dictionary shown in the example of FIG. 10 (a) is stored in the index
図10(b)の例に示される基本辞書用ヨミインデックスは、インデックス情報記憶部25に記憶されるもので、文字列(A)としてかなの文字列(…、サゲ、ササミ、サシタル、…)を備え、文字列(B)として基本辞書の辞書データ部のブロックを指定するブロック番号(…、401、402、403、…)を備えている。文字列(A)には、文字列(B)のブロック番号により指定されるブロックの先頭に位置するかなの文字列がコード順に配列される。
The basic dictionary reading index shown in the example of FIG. 10B is stored in the index
図10(c)の例に示されるブロック番号401の基本辞書データ部のブロックは、基本辞書情報記憶部22に記憶されるもので、文字列(A)としてかなの文字列(サゲ、…、…)を備え、文字列(B)として「かな以外」を含む文字列(下げ、…、…)を備えている。
The block of the basic dictionary data portion with the
図10(d)の例に示されるブロック番号402の基本辞書データ部のブロックは、基本辞書情報記憶部23に記憶されるもので、文字列(A)としてかなの文字列(…、サザンカ、…)を備え、文字列(B)として「かな以外」を含む文字列(…、山茶花、…)を備えている。
The block of the basic dictionary data part with the
なお、図10に示される基本辞書の使い方については、図5の例と同様となるため、その説明を省略する。 The usage of the basic dictionary shown in FIG. 10 is the same as in the example of FIG.
また、図10の構成によれば、基本辞書による検索処理機能も向上し、予測変換候補の検索範囲を狭くすることができるので、予測変換処理にかかる処理負荷を軽減することができる。 Further, according to the configuration of FIG. 10, the search processing function by the basic dictionary is also improved and the search range of the prediction conversion candidates can be narrowed, so that the processing load for the prediction conversion processing can be reduced.
また、図9、図10と同様に、学習辞書、ユーザ辞書、DL辞書にも漢字インデッスク、ヨミインデックスを備える。 Similarly to FIGS. 9 and 10, the learning dictionary, the user dictionary, and the DL dictionary are also provided with a kanji index and a Yomi index.
なお、これまでの説明からわかるように、文字列(A)は例えばコード順に配列されているが、文字列(B)はコード順に配列されているわけではない。 As can be seen from the above description, the character strings (A) are arranged in code order, for example, but the character strings (B) are not arranged in code order.
また、表示すべき複数の候補が、例えば図7中の文字列(A)に示されるような同じ文字列にそれぞれ対応するものである場合、表示順はどのような並び順でも良い。例えば、語の登録順でもよいし、文字列(B)の順でもよい。あるいは候補として出力される順を考慮して任意に調整されてもよい。 Further, when the plurality of candidates to be displayed correspond to the same character string as shown in the character string (A) in FIG. 7, for example, the display order may be any order. For example, the registration order of words may be used, or the order of character strings (B) may be used. Or you may adjust arbitrarily considering the order output as a candidate.
次に、本実施形態に係る情報処理装置による予測変換処理の動作について説明する。
図11は、同実施形態に係る情報処理装置による予測変換候補表示に係る動作の一例を示すフローチャートである。
まず、入力装置3への所定の操作により、図2(a),図3(a)と同様に文字が入力されると(ステップS1)、文字認識部32は、この入力された文字と文字認識辞書情報記憶部21に記憶される辞書とを照合することで、手書き入力された文字の認識結果の文字を当該辞書から単一又は複数検索し、この検索結果を、表示処理部37を通じて表示装置4の画面の左下にある認識文字結果表示用ウインドウ42内に表示させる(ステップS2)。
Next, the operation | movement of the prediction conversion process by the information processing apparatus which concerns on this embodiment is demonstrated.
FIG. 11 is a flowchart illustrating an example of operations related to prediction conversion candidate display by the information processing apparatus according to the embodiment.
First, when a character is input by a predetermined operation on the
文字認識部32は、手書き入力された文字の認識結果の文字の検索結果のうち、手書き入力された文字に最も近い検索結果を仮確定認識文字として、表示処理部37を通じて認識文字結果表示用ウインドウ42内の左上に表示させる。ユーザは、この表示された仮確定認識文字が、例えば自身が意図した文字に一致しない場合には(ステップS3のNO)、認識文字結果表示用ウインドウ42内の認識結果の文字のうち仮確定認識文字以外から、例えば自身が意図した文字を当該文字の表示部分へのペンタッチにより選択すると、この選択した文字が新たな仮確定認識文字として画面上の文字表示用ウインドウ43内に表示される(ステップS4)。この段階では、この表示された文字は入力文字として確定しておらず、この状態で、画面内に表示される「決定キー」が表示されている部分をペンタッチすることで、未確定だった文字列が入力済みの文字列として確定する。
The
前述した未確定の状態において、仮確定認識文字に続く文字を入力したい場合には、再度入力画面の手書き文字入力用ウインドウ41内へのペンタッチにより手書きによる一文字の文字入力を行なえばよい。 In the above-described unconfirmed state, when it is desired to input a character that follows the tentatively recognized character, it is only necessary to input one character by handwriting by pen touching the handwritten character input window 41 on the input screen again.
ステップS4の処理がなされた場合、もしくは認識文字結果表示用ウインドウ42内に表示された仮確定認識文字が、ユーザ自身が意図した文字に一致しているために(ステップS3のYES)、ステップS4の処理がなされない場合、検索部33は、仮確定の文字列に「かな以外」の文字が含まれているか否かを判別する(ステップS5)。
When the process of step S4 is performed, or because the temporarily confirmed recognized character displayed in the recognized character
この判別の結果、文字列に「かな以外」の文字が含まれている場合には(ステップS5のYES)、漢字予測処理がなされ(ステップS6)、文字列に「かな以外」の文字が含まれていない場合には(ステップS5のNO)、かな予測処理がなされる(ステップS7)。 As a result of the determination, if the character string includes a character other than “kana” (YES in step S5), kanji prediction processing is performed (step S6), and the character string includes a character other than “kana”. If not (NO in step S5), kana prediction processing is performed (step S7).
ここで、ステップS7のかな予測処理について説明する。
図12は、同実施形態における情報処理装置のかな予測処理による予測変換候補の表示に係る動作の一例を示すフローチャートである。
このかな予測処理では、検索部33は、学習辞書の検索(ステップS21)、ユーザ辞書の検索(ステップS22)、DL辞書の検索(ステップS23)、予測辞書の検索(ステップS24〜S27)、および基本辞書の検索(ステップS28)をこの順序で実行する。各辞書の検索のステップを構成する複数のステップは同様である。ここでは、予測辞書の検索に焦点を絞って複数のステップS24〜S27の処理の詳細について説明する。
Here, the kana prediction process in step S7 will be described.
FIG. 12 is a flowchart illustrating an example of an operation related to the display of the prediction conversion candidate by the kana prediction process of the information processing apparatus according to the embodiment.
In this kana prediction process, the
検索部33は、予測辞書を呼び出すと(ステップS24)、この予測辞書に含まれている予測辞書用ヨミインデックスを検索し(ステップS25)、予測辞書用ヨミインデックスの1列目のデータである文字列(A)の中からバイナリサーチにより対象のかな文字列が存在する位置をそれぞれ求め、それぞれ対応するブロック番号を2列目のデータである文字列(B)の中から抽出する。
When the
続いて、検索部33は、抽出したブロック番号によりそれぞれ指定される辞書データ部のブロックを検索し(ステップS26)、当該ブロックにおける1列目のデータである文字列(A)の中からバイナリサーチにより対象のかな文字列が含まれる文字列の位置を求め、それぞれ対応する表記を2列目のデータである文字列(B)の中から抽出し、それらを予測変換候補として所定の記憶領域に格納する(ステップS27)。これらのステップをヨミインデックスの文字列(A)と対象のカナ文字列が一致する間繰り返す。
Subsequently, the
このようなステップS24〜S27の処理は、学習辞書の検索(ステップS21)、ユーザ辞書の検索(ステップS22)、DL辞書の検索(ステップS23)、および基本辞書の検索(ステップS28)においても同様となる。 The processes in steps S24 to S27 are the same in the search of the learning dictionary (step S21), the search of the user dictionary (step S22), the search of the DL dictionary (step S23), and the search of the basic dictionary (step S28). It becomes.
次に、表示順序処理部35は、予測候補情報記憶部26に格納された予測変換候補の情報の検索元の辞書における優先度情報および品詞情報を参照し、この優先度情報の区分および品詞情報で示される品詞の種別に対応する所定の優先度を認識して、予測変換候補の表示順を設定し(ステップS29)、設定した順番に予測変換候補を表示装置4の画面上に表示させる(ステップS30)。表示装置4の画面上に表示された予測変換候補の中から1つのユーザにより候補が選択され(ステップS31)、選択された候補への予測結果の確定入力がなされると(ステップS32)、この選択された候補が画面上の文字表示用ウインドウ44内に表示される。
Next, the display
本実施形態では、学習辞書から検索された予測変換候補の表示順位は、表示順序処理部35による処理を経ても他の辞書から検索された予測変換候補の表示順位より高く、予測辞書から検索された予測変換候補の表示順位は、表示順序処理部35による処理を経ても基本辞書から検索された予測変換候補の表示順位より高いとする(ステップS7)。
In this embodiment, the display order of prediction conversion candidates searched from the learning dictionary is higher than the display order of prediction conversion candidates searched from other dictionaries even after the processing by the display
品詞ごとの優先順位の設定方法としては、各種品詞についての優先順位を選択メニューを設けユーザにより設定する手法、文字入力画面における各種入力フィールドの種別に応じて優先する品詞を設定する手法、および、入力された文字の品詞を解析してこの解析結果を記憶し、次に入力されるであろう品詞を選択して当該選択した品詞を予測変換候補として優先表示する文法解析処理により設定する手法が挙げられる。 As a method for setting the priority order for each part of speech, a method for setting a priority order for various parts of speech by a user and setting by the user, a method for setting a part of speech priority according to the type of various input fields on the character input screen, and A method of analyzing the part-of-speech of the input character, storing the analysis result, selecting the part-of-speech that will be input next, and setting the selected part-of-speech preferentially as a predictive conversion candidate and setting it by grammar analysis processing Can be mentioned.
ここで、ステップS6の漢字予測処理について説明する。
図13は、同実施形態における情報処理装置の漢字予測処理による予測変換候補の表示に係る動作の一例を示すフローチャートである。
この漢字予測処理では、検索部33は、学習辞書の検索(ステップS41)、ユーザ辞書の検索(ステップS42)、DL辞書の検索(ステップS43)、予測辞書の検索(ステップS44〜S48)、および基本辞書の検索(ステップS49)をこの順序で実行する。各辞書の検索のステップを構成する複数のステップは同様である。ここでは、予測辞書の検索に焦点を絞って複数のステップS44〜S48の処理の詳細について説明する。
Here, the kanji prediction process in step S6 will be described.
FIG. 13 is a flowchart illustrating an example of operations related to display of prediction conversion candidates by the kanji prediction process of the information processing apparatus according to the embodiment.
In this kanji prediction process, the
検索部33は、予測辞書を呼び出すと(ステップS44)、この予測辞書に含まれている予測辞書用漢字インデックスを検索し(ステップS45)、予測辞書用漢字インデックスの1列目のデータである文字列(A)の中からバイナリサーチにより対象のかな以外の文字が存在する位置をそれぞれ求め、それぞれ対応するかな文字を2列目のデータである文字列(B)の中から抽出する。
When the
続いて、検索部33は、この予測辞書に含まれている予測辞書用ヨミインデックスを検索し(ステップS46)、予測辞書用ヨミインデックスの1列目のデータである文字列(A)の中からバイナリサーチにより抽出したかな文字列が存在する位置をそれぞれ求め、それぞれ対応するブロック番号を2列目のデータである文字列(B)の中から抽出する。
Subsequently, the
続いて、検索部33は、抽出したブロック番号によりそれぞれ指定される辞書データ部のブロックを検索し(ステップS47)、当該ブロックにおける1列目のデータである文字列(A)の中からバイナリサーチにより対象のかな文字列が含まれる文字列の位置を求め、それぞれ対応する表記を2列目のデータである文字列(B)の中から抽出し、それらを予測変換候補として所定の記憶領域に格納する(ステップS48)。
Subsequently, the
これらのステップを漢字インデックスの文字列(A)と対象のかな以外の文字列が一致するまで繰り返す。 These steps are repeated until the character string (A) of the kanji index matches the character string other than the target kana.
このようなステップS44〜S48の処理は、学習辞書の検索(ステップS41)、ユーザ辞書の検索(ステップS42)、DL辞書の検索(ステップS43)、および基本辞書の検索(ステップS49)においても同様となる。 The processing in steps S44 to S48 is the same in the learning dictionary search (step S41), the user dictionary search (step S42), the DL dictionary search (step S43), and the basic dictionary search (step S49). It becomes.
次に、表示順序処理部35は、予測候補情報記憶部26に格納された予測変換候補の情報の検索元の辞書における優先度情報および品詞情報を参照し、この優先度情報の区分および品詞情報で示される品詞の種別に対応する所定の優先度を認識して、予測変換候補の表示順を設定し(ステップS50)、設定した順番に予測変換候補を表示装置4の画面上に表示させる(ステップS51)。表示装置4の画面上に表示された予測変換候補の中から1つの候補が選択され(ステップS52)、選択された候補への予測結果の確定入力がなされると(ステップS53)、この選択された候補が画面上の文字表示用ウインドウ44内に表示される。
Next, the display
そして、図11に戻り、辞書編集部36は、選択された結果を学習辞書に登録する。既に登録済の場合は、学習辞書上の頻度を更新する(ステップS11)。そして、辞書編集部36は、学習辞書上の当該選択した文字の情報を前回利用の履歴情報として所定の記憶領域に記憶させる。
Then, returning to FIG. 11, the
検索部33は、連携予測辞書の確定表記と確定済みの文字列とを照合することで、連携予測変換候補である連語・連想表記を検索し(ステップS12)、予測候補出力部34は、この検索した候補を、表示処理部37を通じて表示装置4に表示させる(ステップS13)。
The
ユーザが、この表示された連携予測候補のうち、所望の候補の表示部分へのペンタッチにより選択すると(ステップS14)、この選択した候補への連携予測結果の確定入力がなされたことになり(ステップS15)、この選択した候補が画面上の文字表示用ウインドウ43内に表示されることになり、この選択した候補が画面上の文字表示用ウインドウ43内に表示される。辞書編集部36は、選択済みの候補の検索元の辞書および学習辞書上の頻度を更新する(ステップS16)。辞書編集部36は、学習辞書上の当該選択した文字の情報を前回利用の履歴情報として所定の記憶領域に記憶させる。
When the user selects a desired candidate from among the displayed linked prediction candidates by a pen touch (step S14), the confirmed input of the linked prediction result to the selected candidate is made (step S14). In step S15, the selected candidate is displayed in the
手書きによる入力が終了していない場合には(ステップS17のNO)、ステップS1の処理に戻り、手書きによる入力が終了した場合には(ステップS17のYES)、一連の処理が終了する。 If the handwritten input has not ended (NO in step S17), the process returns to step S1, and if the handwritten input has ended (YES in step S17), the series of processes ends.
以上のように、本発明の実施形態における情報処理装置では、「かな以外」を含む文字列が手書き入力された場合、この入力された文字の読みを示す表記を各種漢字インデックスから検索し、この検索結果に対応して、かつ、手書き入力された「かな以外」の字を含む表記を各種辞書から検索するので、従来の予測変換候補の表示のための構成と比較して、専用の辞書を新たに設ける必要なしに従来より用いられる基本辞書や予測辞書を有効に活用して、手書き入力された「かな以外」を含む文字列にもとづく予測変換処理や連携予測変換処理を行うことができる。よって、機器の記憶容量や処理負荷を著しく増大させること無しに、「かな以外」を含む文字列を手書き入力する際のユーザ入力操作にかかる負担を大幅に軽減することができる。 As described above, in the information processing apparatus according to the embodiment of the present invention, when a character string including “other than kana” is input by handwriting, the notation indicating the reading of the input character is searched from various kanji indexes, In response to the search results, and searches for various notations containing handwritten input characters other than “kana”, the dedicated dictionary is compared with the conventional configuration for displaying predictive conversion candidates. It is possible to perform predictive conversion processing and cooperative predictive conversion processing based on a character string including “other than kana” input by handwriting by effectively utilizing a basic dictionary and a prediction dictionary that have been conventionally used without the necessity of providing a new one. Therefore, the burden on the user input operation when inputting a character string including “other than kana” by handwriting can be greatly reduced without significantly increasing the storage capacity and processing load of the device.
よって、従来のように、かな文字のみを手書き入力した際の予測変換のための操作と同一の操作が「かな以外」を含む文字列を手書き入力した場合でも実現でき、操作性が大幅に向上する。よって、手書きにより入力された漢字をもとにした予測変換の機能実装の効率および入力作業の効率を大幅に向上させることができる。 Therefore, as in the past, the same operation for predictive conversion when only Kana characters are input by hand can be realized even when a character string including “other than Kana” is input by hand, greatly improving operability. To do. Therefore, it is possible to greatly improve the efficiency of the predictive conversion function implementation based on the handwritten Kanji characters and the efficiency of the input work.
また、キー押下入力方式で行っていた文字列予測を手書き入力方式で実現し、かつ、専用の漢字予測変換辞書を設ける必要なしに、キー押下入力方式による文字入力予測処理と同等の処理速度を保つことができる。 In addition, the character string prediction performed by the key press input method is realized by the handwriting input method, and the processing speed equivalent to the character input prediction process by the key press input method is achieved without the need for providing a dedicated kanji prediction conversion dictionary. Can keep.
また、漢字インデックスを予測辞書用と基本辞書用とにそれぞれ設けることで、漢字インデックスをそれぞれの辞書に適した構成とすることができるので、漢字インデックスを予測辞書及び基本辞書に共通した単一のインデックス情報とした場合と比較して、不必要な検索を抑制できるので、検索のパフォーマンスが向上する。 In addition, by providing a kanji index for the prediction dictionary and the basic dictionary, the kanji index can be configured to be suitable for each dictionary. Compared with the case where the index information is used, unnecessary search can be suppressed, and search performance is improved.
なお、この発明は前記実施形態そのままに限定されるものではなく実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合わせにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を省略してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。 The present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be omitted from all the components shown in the embodiment. Furthermore, you may combine suitably the component covering different embodiment.
また、上記実施形態に記載した手法は、コンピュータに実行させることのできるプログラムとして、半導体メモリ(フラッシュメモリなど)、磁気ディスク(ハードディスク、フロッピー(登録商標)ディスクなど)、光ディスク(CD−ROM、DVDなど)、光磁気ディスク(MO)などの記憶媒体に格納して頒布することもできる。 In addition, the method described in the above embodiment is a program that can be executed by a computer, such as a semiconductor memory (flash memory, etc.), a magnetic disk (hard disk, floppy (registered trademark) disk, etc.), an optical disk (CD-ROM, DVD, etc.). Etc.) and can be distributed in a storage medium such as a magneto-optical disk (MO).
また、この記憶媒体としては、プログラムを記憶でき、かつコンピュータが読み取り可能な記憶媒体であれば、その記憶形式は何れの形態であっても良い。 In addition, as long as the storage medium can store a program and can be read by a computer, the storage format may be any form.
また、記憶媒体からコンピュータにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワークソフト等のMW(ミドルウェア)等が上記実施形態を実現するための各処理の一部を実行しても良い。 In addition, an OS (operating system) running on a computer based on an instruction of a program installed in the computer from a storage medium, MW (middleware) such as database management software, network software, and the like realize the above-described embodiment. A part of each process may be executed.
さらに、本発明における記憶媒体は、コンピュータと独立した媒体に限らず、LANやインターネット等により伝送されたプログラムをダウンロードして記憶又は一時記憶した記憶媒体も含まれる。 Further, the storage medium in the present invention is not limited to a medium independent of a computer, but also includes a storage medium in which a program transmitted via a LAN, the Internet, or the like is downloaded and stored or temporarily stored.
また、記憶媒体は1つに限らず、複数の媒体から上記実施形態における処理が実行される場合も本発明における記憶媒体に含まれ、媒体構成は何れの構成であっても良い。 Further, the number of storage media is not limited to one, and the case where the processing in the above embodiment is executed from a plurality of media is also included in the storage media in the present invention, and the media configuration may be any configuration.
尚、本発明におけるコンピュータは、記憶媒体に記憶されたプログラムに基づき、上記実施形態における各処理を実行するものであって、パソコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であっても良い。 The computer according to the present invention executes each process in the above-described embodiment based on a program stored in a storage medium, and is a single device such as a personal computer or a system in which a plurality of devices are connected to a network. Any configuration may be used.
また、本発明におけるコンピュータとは、携帯情報端末、携帯電話機、パーソナルコンピュータなどに限らず、家庭電化製品等に含まれる演算処理装置、マイコン等も含み、プログラムによって本発明の機能を実現することが可能な機器、装置を総称している。 In addition, the computer in the present invention is not limited to a portable information terminal, a mobile phone, a personal computer, and the like, and includes an arithmetic processing unit, a microcomputer, and the like included in home appliances, and the functions of the present invention can be realized by a program. It is a generic term for all possible equipment and devices.
1…制御装置、2A…不揮発性記憶装置、2B…揮発性記憶装置、3…入力装置、4…表示装置、5…I/O装置、10…バス、21…文字認識辞書情報記憶部、22…基本辞書情報記憶部、23…予測辞書情報記憶部、24…学習辞書情報記憶部、25…インデックス情報記憶部、26…予測候補情報記憶部、31…記憶処理部、32…文字認識部、33…検索部、34…予測候補出力部、35…表示順序処理部、36…辞書編集部、37…表示処理部。
DESCRIPTION OF
Claims (3)
1)かな以外を含む文字列の表記と当該文字列の少なくとも一部の読み又は見出しを示すかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列され、当該情報がコード順の配列方向に複数のブロックに区分される辞書データ部と、2)前記辞書データ部に含まれる前記かなの文字列の少なくとも先頭から一部の文字列とかな以外の文字列とを対応付けた情報を含み、前記かな以外の文字列がコード順に配列される第1のインデックスと、3)前記辞書データ部のブロックを指定するブロック識別情報と当該識別情報により指定されるブロックの先頭に位置するかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列される第2のインデックスとを、前記記憶媒体の所定の記憶領域に記憶させる記憶処理機能と、
前記入力装置により入力される文字列を認識する認識機能と、
前記認識機能により認識される文字列にかな以外の文字列が含まれている場合に、前記第1のインデックスの中から当該かな以外の文字列に対応するかなの文字列を検索し、さらに前記第2のインデックスの中から当該検索したかなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索し、一方、前記認識機能により認識される文字列にかな以外の文字列が含まれておらず、かなの文字列が含まれている場合に、前記第1のインデックスを用いずに前記第2のインデックスの中から当該かなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索する検索機能と、
前記検索機能により検索される文字列の表記を候補として前記表示装置の画面に表示させる表示処理機能と
を実現させるための文字列予測プログラム。 In a computer comprising an input device capable of inputting a handwritten character string, a storage medium for storing information, and a display device for displaying information on a screen,
1) including information that associates a character string representation other than kana with a kana character string indicating at least a part of reading or heading of the character string, the kana character strings are arranged in code order, and the information A dictionary data part that is divided into a plurality of blocks in the arrangement direction of the code order; and 2) at least a part of the character string and a character string other than the kana character string included in the dictionary data part. A first index that includes associated information and in which a character string other than the kana is arranged in code order; 3) block identification information that specifies a block of the dictionary data portion; and a head of a block that is specified by the identification information A second index in which the kana character strings are arranged in code order and stored in a predetermined storage area of the storage medium. And processing functions,
A recognition function for recognizing a character string input by the input device;
When a character string other than kana is included in the character string recognized by the recognition function, a kana character string corresponding to a character string other than the kana is searched from the first index, and A block identification information corresponding to the retrieved kana character string is retrieved from the second index, and the retrieved kana character is selected from the blocks of the dictionary data portion specified by the retrieved block identification information. If the character string corresponding to the column is searched for, and the character string recognized by the recognition function does not include a character string other than kana and includes a kana character string, The dictionary specified by the searched block identification information is searched for the block identification information corresponding to the kana character string from the second index without using the index of 1. A search function of searching the representation of the character string corresponding to the character string of kana and the search from the block over data portion,
A character string prediction program for realizing a display processing function for displaying on the screen of the display device as candidates a notation of a character string searched by the search function.
前記検索機能は、辞書毎に存在する前記第1のインデックス、前記第2のインデックス、および辞書データ部を用いて検索を行うことを特徴とする請求項1に記載の文字列予測プログラム。 The first index, the second index, and the dictionary data part exist for different types of dictionaries,
The character string prediction program according to claim 1, wherein the search function performs a search using the first index, the second index, and a dictionary data portion that exist for each dictionary.
情報を記憶する記憶媒体と、
情報を画面に表示する表示装置と、
1)かな以外を含む文字列の表記と当該文字列の少なくとも一部の読み又は見出しを示すかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列され、当該情報がコード順の配列方向に複数のブロックに区分される辞書データ部と、2)前記辞書データ部に含まれる前記かなの文字列の少なくとも先頭から一部の文字列とかな以外の文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列される第1のインデックスと、3)前記辞書データ部のブロックを指定するブロック識別情報と当該識別情報により指定されるブロックの先頭に位置するかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列される第2のインデックスとを、前記記憶媒体の所定の記憶領域に記憶させる記憶処理手段と、
前記入力装置により入力される文字列を認識する認識手段と、
前記認識手段により認識される文字列にかな以外の文字列が含まれている場合に、前記第1のインデックスの中から当該かな以外の文字列に対応するかなの文字列を検索し、さらに前記第2のインデックスの中から当該検索したかなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索し、一方、前記認識手段により認識される文字列にかな以外の文字列が含まれておらず、かなの文字列が含まれている場合に、前記第1のインデックスを用いずに前記第2のインデックスの中から当該かなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索する検索手段と、
前記検索手段により検索される文字列の表記を候補として前記表示装置の画面に表示させる表示処理手段と
を具備することを特徴とする情報処理装置。 An input device capable of inputting a handwritten character string;
A storage medium for storing information;
A display device for displaying information on the screen;
1) including information that associates a character string representation other than kana with a kana character string indicating at least a part of reading or heading of the character string, the kana character strings are arranged in code order, and the information A dictionary data part that is divided into a plurality of blocks in the arrangement direction of the code order; and 2) at least a part of the character string and a character string other than the kana character string included in the dictionary data part. A first index including the associated information, in which the kana character string is arranged in code order, and 3) block identification information for designating a block of the dictionary data portion and at the head of the block designated by the identification information A storage process for storing, in a predetermined storage area of the storage medium, a second index in which the kana character string is arranged in code order, including information that associates the kana character string with the position And means,
Recognition means for recognizing a character string input by the input device;
When a character string other than kana is included in the character string recognized by the recognition means, a kana character string corresponding to a character string other than the kana is searched from the first index, and A block identification information corresponding to the retrieved kana character string is retrieved from the second index, and the retrieved kana character is selected from the blocks of the dictionary data portion specified by the retrieved block identification information. If the character string corresponding to the column is searched and the character string recognized by the recognizing means does not include a character string other than kana and includes a kana character string, The dictionary specified by the searched block identification information is searched for the block identification information corresponding to the kana character string from the second index without using the index of 1. Search means for searching the representation of the character string corresponding to the character string of kana and the search from the block over data portion,
An information processing apparatus comprising: a display processing unit configured to display on the screen of the display device as a candidate a notation of a character string searched by the search unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009291430A JP2011134021A (en) | 2009-12-22 | 2009-12-22 | Character string predicting program and information processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009291430A JP2011134021A (en) | 2009-12-22 | 2009-12-22 | Character string predicting program and information processing apparatus |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012264346A Division JP5460836B2 (en) | 2012-12-03 | 2012-12-03 | Character string prediction program and information processing apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011134021A true JP2011134021A (en) | 2011-07-07 |
Family
ID=44346699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009291430A Pending JP2011134021A (en) | 2009-12-22 | 2009-12-22 | Character string predicting program and information processing apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011134021A (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6458018A (en) * | 1987-08-28 | 1989-03-06 | Hitachi Ltd | Method and device for retrieving data |
JPH05181837A (en) * | 1991-11-01 | 1993-07-23 | Sony Corp | Character converter |
JP2002007390A (en) * | 2000-06-23 | 2002-01-11 | Toshiba Corp | Character string prediction control method and character string input device |
JP2006005771A (en) * | 2004-06-18 | 2006-01-05 | Ntt Docomo Inc | Character input device, and character input method |
-
2009
- 2009-12-22 JP JP2009291430A patent/JP2011134021A/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6458018A (en) * | 1987-08-28 | 1989-03-06 | Hitachi Ltd | Method and device for retrieving data |
JPH05181837A (en) * | 1991-11-01 | 1993-07-23 | Sony Corp | Character converter |
JP2002007390A (en) * | 2000-06-23 | 2002-01-11 | Toshiba Corp | Character string prediction control method and character string input device |
JP2006005771A (en) * | 2004-06-18 | 2006-01-05 | Ntt Docomo Inc | Character input device, and character input method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3889466B2 (en) | Text input device and method | |
KR100909917B1 (en) | Recording medium recording an information processing apparatus, an information processing method, and an information processing program | |
JP4241883B2 (en) | Text input device and method | |
JP4502615B2 (en) | Similar sentence search device, similar sentence search method, and program | |
JP2009059140A (en) | Electronic dictionary, retrieval method for electronic dictionary, and retrieval program for electronic dictionary | |
JP5460836B2 (en) | Character string prediction program and information processing apparatus | |
JP4007400B2 (en) | Text input device and method | |
JP2011134021A (en) | Character string predicting program and information processing apparatus | |
JP4207089B2 (en) | Text input device and method | |
JP4251000B2 (en) | Kana-kanji conversion device, kana-kanji conversion method, and kana-kanji conversion program | |
JP6221275B2 (en) | Character input program and character input device | |
US10664064B2 (en) | Input device implementing predictive input method by assigning characters to keys | |
JP4416644B2 (en) | Character processing apparatus with prediction function, method, recording medium, and program | |
JP4535186B2 (en) | Electronic device and program with dictionary function | |
JP2008117310A (en) | Dictionary retrieval device and dictionary retrieval processing program | |
JP4363167B2 (en) | Electronic dictionary apparatus and program | |
JP2006092004A (en) | Dictionary information display control device, dictionary information display control program, and dictionary information display control method | |
JP2007257188A (en) | Dictionary search device and its control program | |
JP3592284B2 (en) | Japanese input system, its program, and portable information terminal | |
JP2013134730A (en) | Character-inputting program and information processor | |
JP5573257B2 (en) | Character input program and communication terminal device | |
JP4519106B2 (en) | Text input device and method | |
JPH1055360A (en) | Device and method for address book processing | |
JP5861382B2 (en) | Input support program, input support apparatus, and input support method | |
JP5370339B2 (en) | Information processing apparatus, information processing program, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120221 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121002 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130226 |