JP2011134021A - Character string predicting program and information processing apparatus - Google Patents

Character string predicting program and information processing apparatus Download PDF

Info

Publication number
JP2011134021A
JP2011134021A JP2009291430A JP2009291430A JP2011134021A JP 2011134021 A JP2011134021 A JP 2011134021A JP 2009291430 A JP2009291430 A JP 2009291430A JP 2009291430 A JP2009291430 A JP 2009291430A JP 2011134021 A JP2011134021 A JP 2011134021A
Authority
JP
Japan
Prior art keywords
character string
kana
dictionary
character
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009291430A
Other languages
Japanese (ja)
Inventor
Kazuyuki Ooka
一幸 大岡
Masaki Iuchi
雅樹 井内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Soft Inc
Original Assignee
Fuji Soft Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Soft Inc filed Critical Fuji Soft Inc
Priority to JP2009291430A priority Critical patent/JP2011134021A/en
Publication of JP2011134021A publication Critical patent/JP2011134021A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To quickly predict a following character string requested by a user regardless of whether an input character string includes Chinese characters or the like by suppressing the increase of the load of retrieval processing while effectively using a limited storage region or an existing dictionary. <P>SOLUTION: When a character string recognized by a character recognition part retrieval part includes any character string other than Kana, a retrieval part retrieves the character string of Kana corresponding to the character string other than Kana from among Chinese character indexes, and retrieves block identification information corresponding to the retrieved character string of Kana from among Yomi indexes, and retrieves the notation of the character string corresponding to the retrieved character string of Kana from among the blocks of a dictionary data part designated by the retrieved block identification information. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、ユーザが望む文字や文字列を予測する機能を有する文字列予測プログラムおよび情報処理装置に関する。   The present invention relates to a character string prediction program and an information processing apparatus having a function of predicting a character or character string desired by a user.

従来、携帯情報端末(PDA: Personal Digital Assistant)においては、文字入力方式として、タッチパネルに対してスタイラスペン等を用いて手書きにより文字列を入力する方式(以下、「手書き入力方式」と称す。)を採用するものが一般的であった。その後、携帯電話機に見られるように、個々の文字が割り付けられているダイヤルキー(テンキー)やQWERTY配列のキーボードのキーを押し下げる方式(以下、「キー押下入力方式」と称す。)が一般的になるにつれ、「手書き入力方式」による文字列の入力はあまり利用されなくなっていった。その理由としては、以下のことが挙げられる。   2. Description of the Related Art Conventionally, in a personal digital assistant (PDA), as a character input method, a character string is input by handwriting using a stylus pen or the like on a touch panel (hereinafter referred to as “handwriting input method”). The one that adopted was common. Thereafter, as seen in mobile phones, a method of pressing down a dial key (ten key) to which individual characters are assigned or a QWERTY keyboard (hereinafter referred to as a “key press input method”) is generally used. As it turns out, the input of character strings by the “handwriting input method” has become less used. The reason is as follows.

「キー押下入力方式」を採用する機器では、入力されるかなの文字や文字列を単漢字や単文節に変換する変換処理のほか、例えば変換後の文字や文字列をもとにユーザが望むであろう文章の一部を予測する「予測変換」や、予測された文章の一部を確定した後、これに続くものとしてユーザが望むであろう文章の一部をさらに予測する「連携予測変換」が実現され、少ないキー操作で所望の文章を早く簡単に作成することができた。   For devices that use the “key press input method”, the user wishes based on the converted character or character string, for example, in addition to conversion processing that converts the input kana character or character string into a single kanji or single phrase. "Predictive transformation" that predicts a part of a sentence that will be, or after confirming a part of a predicted sentence, "Federated prediction" that further predicts a part of a sentence that the user would want to follow "Conversion" was realized, and the desired text could be created quickly and easily with few key operations.

これに対し、「手書き入力方式」を採用する機器は、一般に、例えば漢字混じりの文字列(漢字とひらがなとを含む文字列)が入力された場合、上述したような「予測変換」や「連携予測変換」は容易には行えなかった。このため、ユーザは漢字を手書きで入力する毎に、認識される文字を決定する処理又は選択してから決定する処理を行わなければならず、送りがななどについても一字ずつ手書きで入力しなければならなかった。   On the other hand, devices that adopt the “handwriting input method” generally, for example, when a character string mixed with kanji (character string including kanji and hiragana) is input, “Predictive transformation” was not easily performed. For this reason, every time a user inputs a kanji by hand, the user must perform a process of determining a recognized character or a process of determining after selecting a character. did not become.

なお、特許文献1には、「手書き入力方式」の機器において、入力される漢字からユーザが望む漢字の文字列を予測する文字列予測方法が開示されている。また、特許文献2には、入力される漢字などから後続の文字列を予測する「文字列予測部」と、予測された文字列がひらがなである場合に漢字を含む文字列に変換する「かな漢字変換部」とを備えた文字列予測装置が開示されている。   Patent Document 1 discloses a character string prediction method for predicting a character string of a Chinese character desired by a user from an input Chinese character in a “handwriting input method” device. Patent Document 2 discloses a “character string prediction unit” that predicts a subsequent character string from input kanji and the like, and a “kana-kanji character” that is converted to a character string that includes kanji when the predicted character string is hiragana. A character string prediction device including a “conversion unit” is disclosed.

特開平9−16586号公報(図1〜図7等)JP-A-9-16586 (FIGS. 1-7, etc.) 特開平8−255158号公報(図3、図4等)JP-A-8-255158 (FIG. 3, FIG. 4 etc.)

上述の特許文献1,2の技術は、「手書き入力方式」の機器への適用を示すものであるが、以下のような問題がある。   The techniques of Patent Documents 1 and 2 described above show application to a “handwriting input method” device, but have the following problems.

特許文献1の技術では、入力される文字列から予測される文字列を得るためには辞書の全体を検索する必要があるため、CPUの処理を占有し、携帯情報端末などのCPUクロック周波数の低い組込み機器の場合には、「キー押下入力方式」の機器に比べ、検索結果を得るまでに長時間を要し、その結果、入力操作が遅くなってしまう。   In the technique of Patent Document 1, since it is necessary to search the entire dictionary in order to obtain a predicted character string from an input character string, the CPU processing is occupied, and the CPU clock frequency of a portable information terminal or the like is increased. In the case of a low embedded device, it takes a long time to obtain a search result as compared with a device of “key press input method”, and as a result, the input operation becomes slow.

一方、特許文献2の技術では、「手書き入力方式」で入力される文字列が例えばひらがなである場合、「かな漢字変換部」と「文字列予測部」の両方の機能を用いて検索が行われるため、特許文献1の場合と同様、CPUの処理を占有し、携帯情報端末などのCPUクロック周波数の低い組込み機器の場合には、「キー押下入力方式」の機器に比べ、検索結果を得るまでに長時間を要し、その結果、入力操作が遅くなってしまう。さらに、特許文献2の技術では、「かな漢字変換部」および「文字列予測部」のそれぞれが辞書を有しているため、携帯電話機などのROM領域に容量制限のある組込み機器の場合には、このROM領域を辞書により圧迫する可能性がある。   On the other hand, in the technique of Patent Document 2, when a character string input by the “handwriting input method” is, for example, hiragana, a search is performed using both the functions of “kana-kanji conversion unit” and “character string prediction unit”. Therefore, as in the case of Patent Document 1, in the case of an embedded device that occupies CPU processing and has a low CPU clock frequency, such as a portable information terminal, the search result is obtained as compared with a “key press input method” device. Takes a long time, and as a result, the input operation becomes slow. Furthermore, in the technique of Patent Document 2, since each of the “kana-kanji conversion unit” and the “character string prediction unit” has a dictionary, in the case of an embedded device having a capacity limit in the ROM area such as a mobile phone, There is a possibility that this ROM area is compressed by a dictionary.

本発明は上記実情に鑑みてなされたものであり、限られた記憶領域や同じ構造の辞書を有効に利用しつつ、検索処理の負荷の増大を抑え、入力される文字列が漢字等を含むか否かにかかわらずユーザが望む後続の文字列を素早く予測することが可能な文字列予測プログラムおよび情報処理装置を提供することを目的とする。   The present invention has been made in view of the above circumstances, and while effectively using a limited storage area and a dictionary having the same structure, an increase in the load of search processing is suppressed, and an input character string includes kanji and the like. It is an object of the present invention to provide a character string prediction program and an information processing apparatus capable of quickly predicting a subsequent character string desired by a user regardless of whether or not.

本発明の一態様による文字列予測プログラムは、手書きによる文字列の入力が可能な入力装置と、情報を記憶する記憶媒体と、情報を画面に表示する表示装置とを備えたコンピュータに、1)かな以外を含む文字列の表記と当該文字列の少なくとも一部の読み又は見出しを示すかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列され、当該情報がコード順の配列方向に複数のブロックに区分される辞書データ部と、2)前記辞書データ部に含まれる前記かなの文字列の少なくとも先頭から一部の文字列とかな以外の文字列とを対応付けた情報を含み、前記かな以外の文字列がコード順に配列される第1のインデックスと、3)前記辞書データ部のブロックを指定するブロック識別情報と当該識別情報により指定されるブロックの先頭に位置するかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列される第2のインデックスとを、前記記憶媒体の所定の記憶領域に記憶させる記憶処理機能と、前記入力装置により入力される文字列を認識する認識機能と、前記認識機能により認識される文字列にかな以外の文字列が含まれている場合に、前記第1のインデックスの中から当該かな以外の文字列に対応するかなの文字列を検索し、さらに前記第2のインデックスの中から当該検索したかなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索し、一方、前記認識機能により認識される文字列にかな以外の文字列が含まれておらず、かなの文字列が含まれている場合に、前記第1のインデックスを用いずに前記第2のインデックスの中から当該かなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索する検索機能と、前記検索機能により検索される文字列の表記を候補として前記表示装置の画面に表示させる表示処理機能とを実現させるための文字列予測プログラムである。   A character string prediction program according to an aspect of the present invention is a computer including an input device capable of inputting a character string by handwriting, a storage medium for storing information, and a display device for displaying information on a screen. Including information that associates notation of a character string including characters other than kana with a kana character string indicating at least a part of reading or heading of the character string, the kana character strings are arranged in code order, and the information is encoded A dictionary data section that is divided into a plurality of blocks in the order of arrangement, and 2) at least a part of the kana character string included in the dictionary data section and a character string other than kana are associated with each other A first index in which a character string other than the kana is arranged in code order, and 3) block identification information designating a block of the dictionary data portion and the identification information. Storage processing for storing, in a predetermined storage area of the storage medium, a second index that includes information in association with a kana character string located at the head of a block and in which the kana character string is arranged in code order A function, a recognition function for recognizing a character string input by the input device, and a character string other than kana included in the character string recognized by the recognition function. A kana character string corresponding to a character string other than the kana character string is searched, block identification information corresponding to the searched kana character string is searched from the second index, and the searched block identification information is further searched. The character string recognized by the recognition function is searched for the notation of the character string corresponding to the searched kana character string from the block of the dictionary data portion specified by When a character string other than kana is not included and a kana character string is included, a block corresponding to the kana character string from the second index without using the first index A search function for searching for identification information, and further searching for a notation of a character string corresponding to the character string of the searched kana from among the blocks of the dictionary data portion specified in the searched block identification information; and the search function This is a character string prediction program for realizing a display processing function for displaying on the screen of the display device as candidates the notation of the character string searched for.

本発明によれば、限られた記憶領域や同じ構造の辞書を有効に利用しつつ、検索処理の負荷の増大を抑え、入力される文字列が漢字等を含むか否かにかかわらずユーザが望む後続の文字列を素早く予測することが可能となる。   According to the present invention, while effectively using a limited storage area and a dictionary having the same structure, an increase in the load of search processing is suppressed, and the user can determine whether the input character string includes kanji or the like. It is possible to quickly predict the desired subsequent character string.

本発明の一実施形態に係る情報処理装置の構成の一例を示す図。The figure which shows an example of a structure of the information processing apparatus which concerns on one Embodiment of this invention. 「漢字」を手書きで入力した場合の表示装置の画面上での予測変換等の動作の例を示す図。The figure which shows the example of operation | movement, such as prediction conversion on the screen of a display apparatus at the time of inputting "Kanji" by handwriting. 「ひらがな」を手書きで入力した場合の表示装置の画面上での予測変換等の動作の例を示す図。The figure which shows the example of operation | movement, such as prediction conversion on the screen of a display apparatus at the time of inputting "Hiragana" by handwriting. 「漢字とひらがな」を手書きで入力した場合の表示装置の画面上での予測変換等の動作の例を示す図。The figure which shows the example of operation | movement, such as predictive conversion on the screen of a display apparatus at the time of inputting "Kanji and Hiragana" by handwriting. 検索部による検索の動作の一例を示す概念図。The conceptual diagram which shows an example of operation | movement of the search by a search part. 各種辞書の辞書データ部のデータ構造の例を表形式で示す図。The figure which shows the example of the data structure of the dictionary data part of various dictionaries in tabular form. 漢字インデックスの構成例を表形式で示す図。The figure which shows the structural example of a kanji index in a table format. 予測変換候補出力画面の一例を示す図。The figure which shows an example of a prediction conversion candidate output screen. 予測辞書の詳細例を表形式で示す図。The figure which shows the detailed example of a prediction dictionary in tabular form. 基本辞書の詳細例を表形式で示す図。The figure which shows the detailed example of a basic dictionary in tabular form. 予測変換候補表示に係る動作の一例を示すフローチャート。The flowchart which shows an example of the operation | movement which concerns on prediction conversion candidate display. かな予測処理による予測変換候補の表示に係る動作の一例を示すフローチャート。The flowchart which shows an example of the operation | movement which concerns on the display of the prediction conversion candidate by a kana prediction process. 漢字予測処理による予測変換候補の表示に係る動作の一例を示すフローチャート。The flowchart which shows an example of the operation | movement which concerns on the display of the prediction conversion candidate by a Chinese character prediction process.

以下、図面を参照して、本発明の一実施形態について説明する。
なお、本願明細書でいう「文字列」とは、文字が1つのみの場合もあり得るものとする。「かな」とは、ひらがな又はカタカナを指す。「かな以外」とは、漢字、数字、英字だけではなく、記号、特殊文字なども含んでいることを示す。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
It should be noted that the “character string” referred to in the present specification may have only one character. “Kana” refers to hiragana or katakana. “Non-kana” indicates not only kanji, numbers, and alphabets but also symbols and special characters.

図1は、本発明の一実施形態に係る情報処理装置の構成の一例を示す図である。図1(a)は情報処理装置のハードウェア構成の一例を示し、図1(b)は情報処理装置に搭載されるコンピュータプログラムとしてのソフトウェアの構成の一例を示している。   FIG. 1 is a diagram illustrating an example of a configuration of an information processing apparatus according to an embodiment of the present invention. FIG. 1A illustrates an example of a hardware configuration of the information processing apparatus, and FIG. 1B illustrates an example of a software configuration as a computer program installed in the information processing apparatus.

図1(a)に示す情報処理装置は、例えば、携帯電話機や携帯情報端末など、組込みシステムとして実現するのに適した機器に相当するものであり、実質的にはプログラムを実行するコンピュータとして動作する。この情報処理装置は、制御装置1、不揮発性記憶装置2A、揮発性記憶装置2B、入力装置3、表示装置4、およびI/O装置5を備えている。これらの要素は、バス10により相互に接続される。   The information processing apparatus illustrated in FIG. 1A corresponds to a device suitable for implementation as an embedded system, such as a mobile phone or a portable information terminal, and substantially operates as a computer that executes a program. To do. The information processing apparatus includes a control device 1, a nonvolatile storage device 2 </ b> A, a volatile storage device 2 </ b> B, an input device 3, a display device 4, and an I / O device 5. These elements are connected to each other by a bus 10.

制御装置1は、例えばCPU等のプロセッサに相当するものであり、本装置全体の制御を司る。この制御装置1は、例えば、不揮発性記憶装置2Aに記憶されるプログラムやデータを読み出したり、読み出したプログラムやデータを揮発性記憶装置2Bへロードして各種の処理を実行したりする。さらに、制御装置1は、例えば、入力装置3を通じて入力されるデータや表示装置4へ出力するデータを不揮発性記憶装置2A、揮発性記憶装置2B、もしくは外部I/O装置5との間で送受する制御を行ったり、外部I/O装置5を通じて外部のネットワークから取得されるデータを不揮発性記憶装置2A等に記憶させる処理を行ったりする。   The control device 1 corresponds to a processor such as a CPU, for example, and controls the entire device. For example, the control device 1 reads a program or data stored in the nonvolatile storage device 2A, or loads the read program or data into the volatile storage device 2B to execute various processes. Further, for example, the control device 1 transmits / receives data input through the input device 3 and data output to the display device 4 to / from the nonvolatile storage device 2A, the volatile storage device 2B, or the external I / O device 5. Or a process of storing data acquired from an external network through the external I / O device 5 in the nonvolatile storage device 2A or the like.

不揮発性記憶装置2Aは、例えばフラッシュメモリなどの書換え可能な半導体メモリ、もしくはハードディスクドライブに相当するものである。この不揮発性記憶装置2Aは、本実施形態に係る文字列予測プログラムや、当該プログラムが使用する各種の辞書やインデックス(後述)などを含むデータを記憶している。   The nonvolatile storage device 2A corresponds to a rewritable semiconductor memory such as a flash memory or a hard disk drive. The nonvolatile storage device 2A stores data including a character string prediction program according to the present embodiment and various dictionaries and indexes (described later) used by the program.

揮発性記憶装置2Bは、例えばRAMなどの半導体メモリに相当するものである。この揮発性記憶装置2Bは、制御装置1の作業領域として使用され、不揮発性記憶装置2Aからロードされるプログラムやデータを記憶する。   The volatile storage device 2B corresponds to a semiconductor memory such as a RAM. The volatile storage device 2B is used as a work area of the control device 1 and stores programs and data loaded from the nonvolatile storage device 2A.

入力装置3は、表示装置4上に配置され、ペンタブレットもしくはタッチパネルを形成している。このペンタブレットもしくはタッチパネル上の所定の領域内において、スタイラスペンもしくは指先を押し当てながら文字を描く操作を行うことにより、手書きによる文字や文字列の入力が達成される。本実施形態では、ペンタブレットに対しスタイラスペンを用いて入力を行う場合を例にとって説明する。   The input device 3 is disposed on the display device 4 and forms a pen tablet or a touch panel. By performing an operation of drawing a character while pressing a stylus pen or a fingertip within a predetermined area on the pen tablet or touch panel, input of a handwritten character or character string is achieved. In this embodiment, a case where input is performed using a stylus pen on a pen tablet will be described as an example.

表示装置4は、例えば液晶ディスプレイ装置であり、入力装置3を通じて手書きにより入力される文字の筆跡を第1の表示領域に表示したり、入力後に認識された文字列の候補を第2の表示領域に表示したり、候補の中から自動もしくは手動により選択された文字列を第3の表示領域に表示したり、表示されている文字列をもとにユーザが望むものとして予測された文字列を第4の表示領域に表示したりする。   The display device 4 is, for example, a liquid crystal display device, and displays handwriting of characters input by handwriting through the input device 3 in the first display region, or character string candidates recognized after input in the second display region. Or a character string automatically or manually selected from the candidates is displayed in the third display area, or a character string predicted by the user based on the displayed character string is displayed. Or display in the fourth display area.

I/O装置5は、外部のネットワークを通じて辞書などをダウンロードして不揮発性記憶装置2Aへ送ったりする。   The I / O device 5 downloads a dictionary or the like through an external network and sends it to the nonvolatile storage device 2A.

図1(b)には、上記不揮発性記憶装置2Aに格納された文字列予測プログラムおよびデータの記憶部が示されている。文字列予測プログラムには、記憶処理部31、文字認識部32、検索部33、予測候補出力部34、表示順序処理部35、辞書編集部36、および表示処理部37が備えられる。文字列予測プログラムが使用するデータの各記憶部としては、文字認識辞書情報記憶部21、基本辞書情報記憶部22、予測辞書情報記憶部23、学習辞書情報記憶部24、インデックス情報記憶部25、および予測候補情報記憶部26が設けられる。そのほか、図示しないが、ユーザ辞書情報記憶部、ダウンロード辞書情報記憶部(以下、「DL辞書記憶部」と称す。)、および連携予測辞書記憶部が設けられる。なお、これらの記憶部内のデータは、揮発性記憶装置2Bにロードされた際にもそれぞれ同じ記憶部(記憶領域)が確保される。   FIG. 1B shows a character string prediction program and data storage unit stored in the nonvolatile storage device 2A. The character string prediction program includes a storage processing unit 31, a character recognition unit 32, a search unit 33, a prediction candidate output unit 34, a display order processing unit 35, a dictionary editing unit 36, and a display processing unit 37. As each storage unit of data used by the character string prediction program, a character recognition dictionary information storage unit 21, a basic dictionary information storage unit 22, a prediction dictionary information storage unit 23, a learning dictionary information storage unit 24, an index information storage unit 25, A prediction candidate information storage unit 26 is provided. In addition, although not shown, a user dictionary information storage unit, a download dictionary information storage unit (hereinafter referred to as “DL dictionary storage unit”), and a cooperative prediction dictionary storage unit are provided. Note that the same storage unit (storage area) is secured for the data in these storage units when they are loaded into the volatile storage device 2B.

記憶処理部31は、不揮発性記憶装置2Aから、1)「かな以外」を含む文字列(例えば、「かな以外」とかなとを含むかな混じりの文字列や、「かな以外」のみの文字列)の表記と当該文字列の少なくとも一部の読み又は見出しを示すかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列され、当該情報がコード順の配列方向に複数のブロックに区分される辞書データ部と、2)前記辞書データ部に含まれる前記かなの文字列の少なくとも先頭から一部の文字列と「かな以外」の文字列とを対応付けた情報を含み、前記かな以外の文字列がコード順に配列される第1のインデックス(以下、「漢字インデックス」と称す。)と、3)前記辞書データ部のブロックを指定するブロック識別情報(ブロック番号)と当該識別情報により指定されるブロックの先頭に位置するかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列される第2のインデックス(以下、「ヨミインデックス」と称す。)とを読み出し、揮発性記憶装置2B内の所定の記憶領域にロードして記憶させる機能である。なお、漢字インデックス、ヨミインデックス、および辞書データ部は、辞書を構成し、種類が異なる辞書毎に存在するものである。また、前記ブロックは、辞書データ部の記憶領域において、最も効率よく辞書内の文字列が検索できる容量ごとに分けた領域の一つを指す。   The storage processing unit 31 uses the non-volatile storage device 2A from 1) a character string including “other than kana” (for example, a character string including a kana including “other than kana” and a character string including only “other than kana”. ) And the kana character string indicating at least a part of reading or heading of the character string, the kana character string is arranged in code order, and the information is arranged in the arrangement direction of the code order. A dictionary data part divided into a plurality of blocks, and 2) information in which at least a part of the character string included in the dictionary data part is associated with a character string “other than kana” from the beginning. And a first index (hereinafter referred to as “kanji index”) in which character strings other than the kana are arranged in code order, and 3) block identification information (block number) designating a block of the dictionary data portion Concerned A second index (hereinafter referred to as “yomi index”) that includes information in association with a kana character string located at the head of a block specified by different information and in which the kana character string is arranged in code order. ) And is loaded and stored in a predetermined storage area in the volatile storage device 2B. Note that the Kanji index, the Yomi index, and the dictionary data part form a dictionary and exist for each different type of dictionary. The block indicates one of the areas divided for each capacity in which the character string in the dictionary can be searched most efficiently in the storage area of the dictionary data portion.

ここで、ブロックについてより詳細に説明する。
ブロックとは、記憶デバイスおよびそのドライバによって、物理的あるいは論理的に定まる、統計的にもっともアクセス時間が少なくなるよう推奨される記憶容量の管理単位である。本実施形態では、1ブロックに辞書内の各レコードが収まるように記録される。レコードは、順次コード順に記録されもし、1レコードがブロックの境界にまたがる場合は、その部分は未使用として、次のブロックの先頭より記録される。これらのブロックは、連続した整数で表されるブロック番号を有する。また、本実施形態では、ヨミインデックスによって、その語の含まれる記憶部のブロックが限定されることによって検索時間を短く終わらせることができる。これを他の方法で実施しようとすると、もし検索対象の語が辞書に含まれていない場合、全部の辞書を検索することになり、非常に時間がかかることになる。
Here, the block will be described in more detail.
A block is a management unit of storage capacity that is physically or logically determined by the storage device and its driver and is statistically recommended to minimize the access time. In the present embodiment, each record in the dictionary is recorded in one block. Records are sequentially recorded in code order. If one record crosses a block boundary, that portion is recorded as unused and recorded from the beginning of the next block. These blocks have block numbers represented by consecutive integers. Further, in this embodiment, the search time can be shortened by limiting the block of the storage unit including the word by the reading index. If this is attempted by another method, if the search target word is not included in the dictionary, the entire dictionary will be searched, which will be very time consuming.

文字認識部32は、入力装置3により入力される文字列を認識する機能である。具体的には、文字認識部32は、手書きにより入力された文字を文字認識辞書情報記憶部21に記憶される文字認識辞書をもとに手書き文字の認識を行い、この認識した単一又は複数の認識結果を、表示処理部37を通じて表示装置4における画面上の認識文字結果表示用ウインドウ42の領域に表示させる。   The character recognition unit 32 has a function of recognizing a character string input by the input device 3. Specifically, the character recognition unit 32 recognizes handwritten characters based on a character recognition dictionary stored in the character recognition dictionary information storage unit 21 based on characters input by handwriting, and recognizes the recognized single or plural characters. Is displayed in the area of the recognized character result display window 42 on the screen of the display device 4 through the display processing unit 37.

検索部33は、文字認識部32により認識される文字列に「かな以外」の文字列が含まれている場合に、前記漢字インデックスの中から当該「かな以外」の文字列に対応するかなの文字列を検索し、さらに前記ヨミインデックスの中から当該検索したかなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索し、一方、文字認識部32により認識される文字列に「かな以外」の文字列が含まれておらず、かなの文字列が含まれている場合に、前記漢字インデックスを用いずに前記ヨミインデックスの中から当該かなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索する機能である。   When the character string recognized by the character recognition unit 32 includes a character string “other than kana”, the search unit 33 corresponds to the character string “other than kana” from the kanji index. Search for a character string, further search block identification information corresponding to the searched character string from the Yomi index, and further, from among the blocks of the dictionary data portion specified by the searched block identification information The notation of the character string corresponding to the searched kana character string is searched, while the character string recognized by the character recognition unit 32 does not include the character string “other than kana”, and the kana character string is If it is included, the block identification information corresponding to the character string of the kana is searched from the Yomi index without using the Kanji index, and the searched block identification information A function of searching the representation of the character string corresponding to the character string of kana and the search from among the dictionary data of the block which is specified.

具体的には、検索部33は、文字認識部32による手書き入力文字の認識結果から入力文字としての確定前の文字列に「かな以外」が含まれるか否かを判定し、その判定結果によって、この文字列に続く文字の予測形態を、かな文字列に続く文字列を予測する形態である「かな予測処理」と、「かな以外」が含まれる文字列に続く文字列を予測する形態である「漢字予測処理」との間で切り替える機能を有する。また、検索部33は、候補文字表示用ウインドウ44に表示可能な数の予測変換候補を得るために各種辞書の検索を行う機能を有する。検索部33は、「漢字予測処理」により予測変換候補を得るためには、各種辞書について漢字インデックスを検索した上で、ヨミインデックスを検索し、さらに辞書データ部を検索する。一方、「かな予測処理」により予測変換候補を得るためには、ヨミインデックスを検索した上で、辞書データ部を検索する。すなわち、本実施形態では、「かな予測処理」に使用されるヨミインデックスおよび辞書データ部が「漢字予測処理」においても有効に利用される。このため、「漢字予測処理」のために専用のヨミインデックスおよび辞書データ部を個々に設ける必要がなく、辞書データ部に比べてデータ量が極端に少ない漢字インデックスを加えるだけで、限られた記憶領域を有効に利用し、入力される文字列が「かな以外」を含むか否かにかかわらず予測変換候補を素早く出力させることを実現している。   Specifically, the search unit 33 determines whether or not “other than kana” is included in the character string before being determined as the input character from the recognition result of the handwritten input character by the character recognition unit 32, and based on the determination result In the form of predicting the character string following this character string, the character string following the character string including “kana predicting process” and “other than kana” that predicts the character string following the kana character string. It has a function of switching between certain “kanji prediction processing”. The search unit 33 has a function of searching various dictionaries in order to obtain the number of predictive conversion candidates that can be displayed in the candidate character display window 44. In order to obtain a prediction conversion candidate by the “kanji prediction process”, the search unit 33 searches the kanji index for various dictionaries, then searches the yomi index, and further searches the dictionary data unit. On the other hand, in order to obtain a predictive conversion candidate by the “kana prediction process”, the dictionary data part is searched after searching the reading index. That is, in the present embodiment, the reading index and the dictionary data portion used for the “kana prediction process” are also effectively used for the “kanji prediction process”. For this reason, there is no need to provide a dedicated Yomi index and dictionary data part for “Kanji prediction processing”, and only a kanji index with a data amount extremely smaller than that of the dictionary data part is added. By effectively using the area, it is possible to quickly output predictive conversion candidates regardless of whether the input character string includes “other than kana” or not.

また、検索部33は、漢字インデックス、ヨミインデックス、および辞書データ部のブロックのそれぞれの中においてコード順に配列された個々の文字列に対しバイナリサーチを実施することにより所望のデータが存在する位置を求める機能を有する。これにより、検索速度を一層高めることが可能となる。   In addition, the search unit 33 performs a binary search on each character string arranged in the code order in each of the blocks of the kanji index, the yomi index, and the dictionary data unit, thereby determining the position where the desired data exists. It has the required function. As a result, the search speed can be further increased.

予測候補出力部34は、かな予測処理や漢字予測処理により得た予測変換候補を、表示処理部37を通じて表示装置4における画面上の候補文字表示用ウインドウ44に表示させる機能である。   The prediction candidate output unit 34 has a function of displaying the prediction conversion candidate obtained by the kana prediction process or the kanji prediction process on the candidate character display window 44 on the screen of the display device 4 through the display processing unit 37.

表示順序処理部35は、予測候補情報記憶部26に格納された予測変換候補の表示順を設定する機能である。   The display order processing unit 35 is a function for setting the display order of prediction conversion candidates stored in the prediction candidate information storage unit 26.

辞書編集部36は、学習辞書情報記憶部24に記憶される学習辞書の編集を行う機能である。   The dictionary editing unit 36 is a function for editing the learning dictionary stored in the learning dictionary information storage unit 24.

表示処理部37は、例えば、検索部33により検索される文字列の表記を候補として表示装置4の画面上に表示させるなど、各種の情報を表示させる機能である。   The display processing unit 37 has a function of displaying various information, for example, displaying a character string searched by the search unit 33 as a candidate on the screen of the display device 4.

文字認識辞書情報記憶部21は、手書きによる文字を認識するための文字認識辞書を記憶する。この文字認識辞書は、二次元パターンと文字との対応付けを示す情報を有する。   The character recognition dictionary information storage unit 21 stores a character recognition dictionary for recognizing handwritten characters. This character recognition dictionary has information indicating a correspondence between a two-dimensional pattern and a character.

基本辞書情報記憶部22は、基本辞書の本体となる辞書データ部を記憶する。この基本辞書の辞書データ部は、1列目のデータとしてかなの文字列を備え、2列目のデータとして、前記1列目のデータのかな文字列に対応する、「かな以外」を含む文字列(例えば、「かな以外」とかなとを含むかな混じりの文字列や、「かな以外」のみの文字列)を備えており、コード順の配列方向へ複数のブロックに区分された形態で記憶されている。この構造により、かなの文字列を「かな以外」を含む文字列に変換することができる。特に、この基本辞書の辞書データ部においては、1列目のデータであるかな文字列は、2列目のデータである「かな以外」を含む文字列の読みの全てをかな文字列にしたものとなっている。   The basic dictionary information storage unit 22 stores a dictionary data unit that is a main body of the basic dictionary. The dictionary data portion of this basic dictionary includes a kana character string as the first column of data, and the second column of data includes characters other than kana corresponding to the kana character string of the first column of data. It is provided with a string (for example, a string of characters including “Kana” and “Kana”, or a string of “Other than Kana” only), and stored in a form divided into a plurality of blocks in the arrangement direction of the code order. Has been. With this structure, a kana character string can be converted into a character string including “other than kana”. In particular, in the dictionary data portion of this basic dictionary, the kana character string that is the data in the first column is a kana character string that includes all the readings of the character string that includes “other than kana” that is the data in the second column. It has become.

予測辞書情報記憶部23は、予測辞書の本体となる辞書データ部を記憶する。この予測辞書の辞書データ部は、前述の基本辞書の辞書データ部と同様の構造を有する。但し、この予測辞書の辞書データ部においては、1列目のデータであるかな文字列は、2列目のデータである「かな以外」を含む文字列の読みの前方の一部(例えば、当該文字列の後方を省略して読んだときの読みである省略読み)をかな文字列にしたものとなっている。この場合のかな文字列は、例えば1〜3文字からなる。   The prediction dictionary information storage unit 23 stores a dictionary data portion that is a main body of the prediction dictionary. The dictionary data portion of the prediction dictionary has the same structure as the dictionary data portion of the basic dictionary described above. However, in the dictionary data portion of the prediction dictionary, the kana character string that is the data in the first column is a part of the front of the reading of the character string that includes “other than kana” that is the data in the second column (for example, It is a kana character string that is abbreviated as the reading when reading the back of the character string. The kana character string in this case consists of, for example, 1 to 3 characters.

学習辞書情報記憶部24は、学習辞書の本体となる辞書データ部を記憶する。この学習辞書の辞書データ部は、前述の各辞書の辞書データ部と同様の構造を有する。但し、この学習辞書の辞書データ部は、かなの文字列を「かな以外」を含む文字列に変換するための第1の学習辞書データ部と、「かな以外」を含む文字列をかなの文字列に変換するための第2の学習辞書データ部とから構成されている。また、この学習辞書の辞書データ部は、文字列毎にユーザが入力した頻度を示す情報も備えている。   The learning dictionary information storage unit 24 stores a dictionary data part serving as a main body of the learning dictionary. The dictionary data part of this learning dictionary has the same structure as the dictionary data part of each dictionary described above. However, the dictionary data portion of the learning dictionary includes a first learning dictionary data portion for converting a kana character string into a character string including “other than kana”, and a character string including “other than kana”. It is composed of a second learning dictionary data part for converting into a column. The dictionary data part of the learning dictionary also includes information indicating the frequency of input by the user for each character string.

また、図示しないユーザ辞書情報記憶部は、ユーザ辞書の本体となる辞書データ部を記憶する。このユーザ辞書の辞書データ部は、前述の基本辞書や予測辞書や学習辞書の辞書データ部と同様の構造を有する。但し、このユーザ辞書の辞書データ部は、1列目のデータと2列目のデータ(例えば、ヨミと表記)をユーザが任意に登録できるようになっている。   Further, a user dictionary information storage unit (not shown) stores a dictionary data unit that is a main body of the user dictionary. The dictionary data part of this user dictionary has the same structure as the dictionary data part of the basic dictionary, prediction dictionary, or learning dictionary described above. However, the dictionary data portion of this user dictionary allows the user to arbitrarily register the data in the first column and the data in the second column (for example, written as Yomi).

また、図示しないDL辞書情報記憶部は、ダウンロード辞書(以下、「DL辞書」と称す。)の本体となる辞書データ部を記憶する。このDL辞書の辞書データ部は、前述の各辞書の辞書データ部と同様の構造を有する。特に、DL辞書は、I/O装置5からネットワークを通じて外部からダウンロードすることができる。DL辞書は、当該辞書もしくは本文字列予測プログラムのプロバイダ、あるいは本情報処理装置のメーカなどがネットワークを通じてユーザに提供する。   In addition, a DL dictionary information storage unit (not shown) stores a dictionary data unit serving as a main body of a download dictionary (hereinafter referred to as “DL dictionary”). The dictionary data portion of the DL dictionary has the same structure as the dictionary data portion of each dictionary described above. In particular, the DL dictionary can be downloaded from the I / O device 5 through the network. The DL dictionary is provided to the user via the network by the dictionary, the provider of the character string prediction program, or the manufacturer of the information processing apparatus.

インデックス情報記憶部25は、漢字インデックスおよびヨミインデックスを記憶する。漢字インデックスは、2列目のデータとして、辞書データ部の1列目のデータ(かなの文字列)の前方2文字までの文字列(但し、3文字以上も可能)を備え、1列目のデータとして、前記辞書データ部の1列目のデータに対応する2列目のデータ(かな以外を含む文字列)の前方1文字を備えている。すなわち、漢字インデックスは、辞書データ部から収集したデータで構成されている。ヨミインデックスは、2列目のデータとして、辞書データ部のブロックを指定するブロック識別情報を備え、1列目のデータとして、そのブロックの第1列目のデータであってコード順における先頭レコードに位置するデータ(かなの文字列)を備えている。   The index information storage unit 25 stores a Chinese character index and a Yomi index. The kanji index includes a character string up to the first two characters of the data (kana character string) in the first column of the dictionary data portion (however, three or more characters are possible) as the second column data. As data, the first character of the data in the second column (character string including other than kana) corresponding to the data in the first column of the dictionary data portion is provided. That is, the kanji index is composed of data collected from the dictionary data part. The Yomi index has block identification information that designates a block of the dictionary data portion as the data in the second column, and the data in the first column of the block as the first column data and the first record in the code order It has data (kana character string).

予測候補情報記憶部26は、予測変換候補として表示させる情報を記憶する。   The prediction candidate information storage unit 26 stores information to be displayed as a prediction conversion candidate.

ここで、図2〜図4を参照して、「漢字」、「ひらがな」、「漢字とひらがな」を、それぞれ手書きで入力した場合の表示装置4の画面上での予測変換等の動作の例について説明する。   Here, referring to FIG. 2 to FIG. 4, examples of operations such as predictive conversion on the screen of the display device 4 when “Kanji”, “Hiragana”, and “Kanji and Hiragana” are input by handwriting, respectively. Will be described.

なお、表示装置4の画面上に表示される文字の認識結果である認識文字候補の選択方法として、自動選択モードと手動選択モードが用意されている。モードは、画面上に表示される設定メニューからユーザが自由に選択できるようになっている。自動選択モードでは、ペンがパネルから離れたときに、認識文字候補の最上位が自動的に選択され、対応する予測候補が表示される。一方、手動選択モードでは、ペンがパネルから離れたときに、認識文字候補が表示され、ユーザは候補を選択し、対応する予測候補が表示される。   Note that an automatic selection mode and a manual selection mode are prepared as methods for selecting recognized character candidates that are recognition results of characters displayed on the screen of the display device 4. The mode can be freely selected by the user from a setting menu displayed on the screen. In the automatic selection mode, when the pen leaves the panel, the highest recognition character candidate is automatically selected, and the corresponding prediction candidate is displayed. On the other hand, in the manual selection mode, when the pen leaves the panel, the recognized character candidates are displayed, and the user selects the candidate and the corresponding prediction candidate is displayed.

図2は、「漢字」を手書きで入力した場合の表示装置4の画面上での予測変換等の動作の例を示す図である。   FIG. 2 is a diagram illustrating an example of operations such as predictive conversion on the screen of the display device 4 when “Kanji” is input by handwriting.

まず、図2(a)に示すように、表示装置4に画面が表示され、この画面の右下にある手書き文字入力用ウインドウ41内に、ペンタッチにより手書きによる入力が開始されると、文字認識エンジンに従い、入力の軌跡をチェックし表示装置4の手書き文字入力用ウインドウ41からタッチペンが離れるまで、入力文字が文字認識エンジンに記憶されている文字パターンと比較し文字認識辞書情報記憶部21に記憶される辞書とを照合して、手書き入力された文字の認識結果を当該辞書から単一又は複数検索する。上記文字認識エンジンは当該技術で一般的に用いられるものであればよい。   First, as shown in FIG. 2A, when a screen is displayed on the display device 4 and handwriting input is started by pen touch in the handwritten character input window 41 at the lower right of the screen, character recognition is performed. According to the engine, the input trajectory is checked, and the input character is compared with the character pattern stored in the character recognition engine and stored in the character recognition dictionary information storage unit 21 until the touch pen leaves the handwritten character input window 41 of the display device 4. The recognition result of the character input by handwriting is searched single or plural from the dictionary. The character recognition engine may be any generally used in the art.

本実施形態の自動選択モードにおいては、図2(a)に示すように、手書き文字入力用ウインドウ41内に、ペンタッチにより漢字の「大」が入力されると、表示装置4の画面の左下にある認識文字結果表示用ウインドウ42内に、手書き入力された文字の認識結果が表示され、表示装置4の画面の上部にある文字表示用ウインドウ43内に、文字認識エンジンにより最も入力文字に近いであろう文字が、図2(b)に示すように表示され、さらに仮確定認識文字「大」に対する漢字予測処理により、表示装置4の画面の中央部の候補文字表示用ウインドウ44内に、予測変換候補の文字列「大阪」、「大きな」、「大人」、「大幅」が表示される。次に、予測変換候補の文字列のうち「大阪」がユーザにより選択されると、図2(c)に示すように、連携予測変換候補の文字列「府」、「府立」、「駅」等が表示される。   In the automatic selection mode of the present embodiment, as shown in FIG. 2A, when a “large” Chinese character is input by pen touch into the handwritten character input window 41, it is displayed at the lower left of the screen of the display device 4. The recognition result of the handwritten character is displayed in a certain recognized character result display window 42, and the character display engine 43 is the closest to the input character in the character display window 43 at the top of the screen of the display device 4. The wax character is displayed as shown in FIG. 2 (b), and the prediction conversion is performed in the candidate character display window 44 at the center of the screen of the display device 4 by the kanji prediction process for the provisionally recognized recognition character “large”. The candidate character strings “Osaka”, “Large”, “Adult”, and “Significant” are displayed. Next, when “Osaka” is selected by the user from the character strings of the predictive conversion candidates, as shown in FIG. 2C, the character strings “fu”, “prefecture”, and “station” of the cooperative predictive conversion candidates are displayed. Etc. are displayed.

図3は、「ひらがな」を手書きで入力した場合の表示装置の画面上での予測変換等の動作の例を示す図である。   FIG. 3 is a diagram illustrating an example of operations such as predictive conversion on the screen of the display device when “Hiragana” is input by handwriting.

まず、図3(a)に示すように、手書き文字入力用ウインドウ41内に、ペンタッチにより手書きによる一文字の文字である「お」が入力されると、次に、図3(b)に示すように、認識結果である文字の候補の中から文字が自動選択または手動選択され、選択された文字が仮確定認識文字「お」にされると、かな予測処理により、表示装置4の画面の中央部の候補文字表示用ウインドウ44内に、予測変換候補の文字列「お疲れ」、「お疲れ様」が表示される。   First, as shown in FIG. 3A, when “o”, which is one handwritten character, is input by pen touch into the handwritten character input window 41, next, as shown in FIG. 3B. In addition, when a character is automatically selected or manually selected from among the candidate characters that are the recognition results, and the selected character is set to the temporarily confirmed recognition character “O”, the center of the screen of the display device 4 is obtained by kana prediction processing. In the candidate character display window 44, the character strings “Thank you” and “Thank you” are displayed.

図4は、「漢字とひらがな」を手書きで入力した場合の表示装置4の画面上での予測変換等の動作の例を示す図である。   FIG. 4 is a diagram illustrating an example of operations such as predictive conversion on the screen of the display device 4 when “kanji and hiragana” are input by handwriting.

図4(a)では、図2(a),(b)と同様に、手書き文字入力用ウインドウ41内に漢字の「大」が入力された後に仮確定文字「大」に対する予測変換候補が候補文字表示用ウインドウ44に表示され、次に、図4(b)に示すように、手書き文字入力用ウインドウ41内に、ひらがなで「き」が手書きで入力されると、図4(c)に示すように、文字表示用ウインドウ43内に、仮確定文字の「大き」に対する予測変換候補が表示され、候補の中から「い」がユーザにより選択されると、図4(d)に示すように、候補文字表示用ウインドウ44内に、仮確定文字「大きい」に対する連携予測変換候補の文字列「。」、「?」、「!」、「のに」、「ので」が表示される。   In FIG. 4A, as in FIGS. 2A and 2B, a candidate for a predictive conversion candidate for the tentative fixed character “Large” after the Chinese character “Large” is input in the handwritten character input window 41 is displayed. When it is displayed in the character display window 44 and then “ki” is input by handwriting in the handwritten character input window 41 as shown in FIG. 4B, FIG. As shown in FIG. 4D, when a predicted conversion candidate for the “large” provisionally confirmed character is displayed in the character display window 43 and “i” is selected from the candidates, In addition, in the candidate character display window 44, the character strings “.”, “?”, “!”, “Nani”, “So” are displayed for the cooperative prediction conversion candidate for the provisionally confirmed character “large”.

ここで、図5を参照して、検索部33による検索の動作の一例について説明する。   Here, an example of a search operation performed by the search unit 33 will be described with reference to FIG.

検索部33は、検索処理において各種の辞書を用いるが、ここでは予測辞書を用いる処理のみに焦点を絞って説明する。なお、予測辞書は、予測辞書用漢字インデックスと、予測辞書用ヨミインデックスと、予測辞書データ部とからなる。これら3つの情報は、共通して、1列目のデータとして文字列(A)を備えるとともに、2列目のデータとして文字列(B)を備えている。文字列(A)は、検索キーとなる文字列との照合に供されるデータであり、文字列(B)は、検索結果として出力するためのデータである。   The search unit 33 uses various dictionaries in the search process, but here, only the process using the prediction dictionary will be described. The prediction dictionary is composed of a prediction dictionary kanji index, a prediction dictionary reading index, and a prediction dictionary data section. These three pieces of information have a character string (A) as the first column of data and a character string (B) as the second column of data. The character string (A) is data used for collation with a character string serving as a search key, and the character string (B) is data to be output as a search result.

最初に、検索部33は、変換対象文字にかな以外が含まれているか否かの漢字予測判定を行う。   First, the search unit 33 performs kanji prediction determination as to whether or not a character other than kana is included in the conversion target character.

判定の結果、かな以外が含まれている場合には、漢字予測処理を行う。   As a result of the determination, if a character other than kana is included, kanji prediction processing is performed.

漢字予測処理において、例えば、漢字“山”が含まれている場合、検索部33は、予測辞書用漢字インデックスの1列目のデータである文字列(A)の中からバイナリサーチにより漢字の“山”が存在する位置を求め、この“山”に対応するかなの文字列“サン”,“ヤ”,“ヤマ”を2列目のデータである文字列(B)の中から抽出する。   In the kanji prediction process, for example, when the kanji “yama” is included, the search unit 33 performs a binary search from the character string (A) that is the first column data of the kanji index for prediction dictionary. The position where the “mountain” exists is obtained, and the character strings “Sun”, “Ya” and “Yama” corresponding to this “mountain” are extracted from the character string (B) which is the second column data.

次に、検索部33は、予測辞書用ヨミインデックスの1列目のデータである文字列(A)の中からバイナリサーチによりかなの文字列“サン”,“ヤ”,“ヤマ”が存在する位置をそれぞれ求め、これらにそれぞれ対応するブロック番号を2列目のデータである文字列(B)の中から抽出する。例えば、“サン”は、文字列(A)の中の個々のかな文字列のうち、文字コード順で“サマ”と“サンカ”との間にあるため、“サマ”に対応するブロック番号94を2列目のデータである文字列(B)の中から抽出する。また、かな文字列“サンカ”は、“サン”を含むため、“サンカ”に対応するブロック番号95についても2列目のデータである文字列(B)の中から抽出する。なお、“ザ”は、“サン”よりも下位の文字コードであり、“ザ”は、“サン”を含まないため、抽出しない。   Next, the search unit 33 includes kana character strings “Sun”, “Ya”, and “Yama” by binary search from the character string (A) that is the first column data of the prediction dictionary reading index. Each position is obtained, and the block number corresponding to each position is extracted from the character string (B) that is the data in the second column. For example, “San” is located between “Sama” and “Sanka” in the character code order among the individual Kana character strings in the character string (A), and therefore, the block number 94 corresponding to “Sama”. Are extracted from the character string (B) which is the data in the second column. Further, since the kana character string “sanka” includes “san”, the block number 95 corresponding to “sanka” is also extracted from the character string (B) that is the data in the second column. Note that “The” is a character code lower than “Sun”, and “The” does not include “Sun” and thus is not extracted.

続いて、検索部33は、辞書データ部のブロック番号94のブロックにおける1列目のデータである文字列(A)の中からバイナリサーチによりかなの文字列“サン”が含まれる文字列の位置を求めるとともに、辞書データ部のブロック番号95のブロックにおける1列目のデータである文字列(A)の中からバイナリサーチにより、かなの文字列“サン”を含む文字列の位置を求め、これらにそれぞれ対応する表記を2列目のデータである文字列(B)の中から“山”を含む文字列を抽出する。例えば、予測データ部の文字列(A)の中の個々のかな文字列のうち、“サンイ”は、“サン”を含む文字列であり、“サンイ”に対応する文字列(B)は、“山“を含むため“山陰”を抽出、この“山陰”を、“山”の予測変換候補の一つとして出力する。   Subsequently, the search unit 33 searches for the position of the character string including the kana character string “sun” by binary search from the character string (A) which is the first column data in the block with the block number 94 in the dictionary data part. The position of the character string including the kana character string “Sun” is obtained by binary search from the character string (A) which is the data in the first column in the block with the block number 95 in the dictionary data portion. A character string including “mountain” is extracted from the character string (B), which is the data in the second column, with the notation corresponding to each. For example, among the individual kana character strings in the character string (A) of the prediction data portion, “San” is a character string including “San”, and the character string (B) corresponding to “San” is Since “Mountain” is included, “San-in” is extracted, and this “San-in” is output as one of the prediction conversion candidates of “Mountain”.

また、図示しない辞書データ部の他のブロックや、予測辞書以外の各種の辞書における辞書データ部のブロックからも、同様な手法により“山”の予測変換候補が出力される。   In addition, a prediction conversion candidate of “mountain” is output from other blocks of the dictionary data portion (not shown) and dictionary data portion blocks in various dictionaries other than the prediction dictionary by the same method.

一方、上記判定の結果、かな以外が含まれていない場合には、かな予測処理を行う。   On the other hand, if the result of the determination does not include anything other than kana, kana prediction processing is performed.

検索部33は、例えば、“サン”が含まれている場合、予測辞書用ヨミインデックスの1列目のデータである文字列(A)の中からバイナリサーチによりかなの文字列“サン”が存在する位置をそれぞれ求め、2列目のデータである文字列(B)の中から該当するブロック番号を抽出し、続いて、辞書データ部の該当するブロックにおける1列目のデータである文字列(A)の中からバイナリサーチによりかなの文字列“サン”が存在する位置を求め、対応する表記を2列目のデータである文字列(B)の中から抽出し、“サン”の予測変換候補の一つとして出力する。   For example, when “Sun” is included, the search unit 33 includes the kana character string “Sun” by binary search from the character string (A) that is the first column data of the prediction dictionary reading index. Each corresponding position is obtained, the corresponding block number is extracted from the character string (B) that is the data in the second column, and then the character string (the data in the first column in the corresponding block in the dictionary data portion) A) The position where the kana character string “Sun” exists is obtained by binary search, and the corresponding notation is extracted from the character string (B) which is the data of the second column, and “Sun” predictive conversion is performed. Output as one of the candidates.

このような仕組みにより、辞書全体を検索するよりも、より素早く検索することができる。   With such a mechanism, it is possible to search faster than searching the entire dictionary.

次に、図6〜図10を参照して、各種辞書の漢字インデックス、ヨミインデックス、および辞書データ部のデータ構造の詳細について説明する。   Next, with reference to FIG. 6 to FIG. 10, details of the data structure of the kanji index, the yomi index, and the dictionary data portion of various dictionaries will be described.

各種辞書の漢字インデックス、ヨミインデックス、および辞書データ部は、共通して、1列目のデータとして文字列(A)、2列目のデータとして文字列(B)、3列目以降のデータとして属性を、それぞれ備えている。属性には、属性(1),属性(2),属性(3)の3種類がある。また、各辞書、各辞書毎の漢字インデックスは、1列目、2列目の文字列が同一の重複する情報は含まない。   The kanji index, the yomi index, and the dictionary data portion of various dictionaries are commonly used as a character string (A) as data in the first column, a character string (B) as data in the second column, and data from the third column onwards. Each attribute is provided. There are three types of attributes: attribute (1), attribute (2), and attribute (3). In addition, the kanji index for each dictionary and each dictionary does not include overlapping information in which the first and second character strings are the same.

このようにデータ構造を共通化することにより、限られた記憶領域を無駄なく有効に使用でき、検索速度を向上させることができる。   By sharing the data structure in this way, a limited storage area can be used effectively without waste, and the search speed can be improved.

図6は、同実施形態における情報処理装置に記憶される各種辞書の辞書データ部のデータ構造の例を表形式で示す図である。
図6(a)の例に示される基本辞書の辞書データ部は、前述した通り基本辞書情報記憶部22に記憶されるもので、文字列(A)としてかなの文字列(…、サザンカ、…、サンカ、…、サンカク、…)を備え、文字列(B)として表記を示す「かな以外」を含む文字列(…、山茶花、…、参加、…、△、…)を備えており、複数のブロックに区分された形態で記憶されている。また、属性(1)として品詞を示す情報(…、普通名詞、…、普通名詞、…、普通名詞、…)と、属性(2)として優先度(予測変換候補の表示順の優先度)を示す情報(…、低優先、…、通常、…、通常、…)とを備えている。
FIG. 6 is a diagram illustrating an example of a data structure of a dictionary data portion of various dictionaries stored in the information processing apparatus according to the embodiment in a table format.
The dictionary data portion of the basic dictionary shown in the example of FIG. 6A is stored in the basic dictionary information storage unit 22 as described above, and the character string (A) is a kana character string (..., sasanka, ... , Sanka, ..., Sankaku, ...), and a character string (..., Sanchahana, ..., Participation, ..., △, ...) containing "other than kana" indicating the notation as a character string (B) It is stored in a form divided into blocks. Also, information (..., common noun, ..., common noun, ..., common noun, ...) indicating the part of speech as attribute (1) and priority (priority of display order of prediction conversion candidates) as attribute (2). (..., low priority, ..., normal, ..., normal, ...).

図6(b)の例に示される予測辞書の辞書データ部は、前述した通り予測辞書情報記憶部23に記憶されるもので、文字列(A)としてかなの文字列(…、サン、サン、…、サンイ、…)を備え、文字列(B)として表記を示す「かな以外」を含む文字列(…、三角、III等、…、山陰、…)を備えており、複数のブロックに区分された形態で記憶されている。また、属性(1)として品詞を示す情報(…、普通名詞、普通名詞、…、固有名詞、…)と、属性(2)として優先度(予測変換候補の表示順の優先度)を示す情報(…、通常、低優先、…、通常、…)とを備えている。   The dictionary data portion of the prediction dictionary shown in the example of FIG. 6B is stored in the prediction dictionary information storage unit 23 as described above, and the kana character string (... , ..., Sany, ...), and a character string (..., triangle, III, etc., Sanin, ...) including "other than kana" indicating notation as a character string (B), and in a plurality of blocks It is stored in a segmented form. Also, information indicating the part of speech as the attribute (1) (..., common noun, common noun, ..., proper noun, ...) and information indicating the priority (priority of the display order of the prediction conversion candidates) as the attribute (2) (..., normal, low priority, ..., normal, ...).

図6(b)に示した例では、表記「三角」に対応する文字列「サン」は省略読みであり、表記「山陽新幹線」に対応する文字列「サンヨ」は省略読みである。つまり、手書き入力により「サン」を入力した場合には、これに続く文字を入力しなくとも、予測変換候補として「三角」が表示され、手書き入力により「サンヨ」を入力した場合には、これに続く文字を入力しなくとも、予測変換候補として「山陽新幹線」が表示されることになる。   In the example shown in FIG. 6B, the character string “San” corresponding to the notation “triangle” is omitted, and the character string “Sanyo” corresponding to the notation “Sanyo Shinkansen” is omitted. In other words, when “san” is input by handwriting input, “triangle” is displayed as a predictive conversion candidate without inputting the subsequent character, and when “sanyo” is input by handwriting input, Even if the character following is not input, “Sanyo Shinkansen” is displayed as a predictive conversion candidate.

図6(c)の例に示される学習辞書の辞書データ部は、前述した通り学習辞書情報記憶部24に記憶されるもので、文字列(A)としてかなの文字列(…、サ、…、ヤ、…)を備え、文字列(B)としてとして表記を示す「かな以外」を含む文字列(…、山さん、…、山手線沿い、…)を備えており、複数のブロックに区分された形態で記憶されている。但し、図示されていないが、学習辞書の辞書データ部には、文字列(A)として「かな以外」を含む文字列を備え、文字列(B)としてかなの文字列を含む文字列を備えた情報も存在する。また、属性(3)として頻度を示す情報(…、5、…、2、…)を備えている。   The dictionary data portion of the learning dictionary shown in the example of FIG. 6C is stored in the learning dictionary information storage unit 24 as described above, and the kana character string (... , Ya, ...), and a character string (..., Yamasan, ..., along the Yamanote line, ...) that includes "other than kana" indicating the notation as a character string (B), and is divided into a plurality of blocks Stored in the form. Although not shown, the dictionary data portion of the learning dictionary includes a character string including “other than kana” as the character string (A) and a character string including the kana character string as the character string (B). There is also information. Moreover, the information (..., 5, ..., 2, ...) indicating the frequency is provided as the attribute (3).

図6(c)の例に示されるように、文字列(A)と文字列(B)との組合せは、かな漢字変換による入力文字の確定にかかる頻度の高い順に配列されている。なお、頻度を採用する代わりに優先度を採用するようにしてもよい。また、前述した組み合わせの配列は、前回利用、つまり前回の入力文字として確定した文字を最上部に表示する配列としてもよい。   As shown in the example of FIG. 6C, the combinations of the character string (A) and the character string (B) are arranged in descending order of the frequency of input character determination by kana-kanji conversion. In addition, you may make it employ | adopt a priority instead of employ | adopting frequency. Moreover, the arrangement | sequence of the combination mentioned above is good also as an arrangement | sequence which displays the character confirmed as last input, ie, the last input character, on the uppermost part.

図6(d)の例に示されるユーザ辞書の辞書データ部は、前述した通り図示しないユーザ辞書情報記憶部に記憶されるもので、文字列(A)としてかなの文字列(…、ア、…)を備え、文字列(B)として表記を示す「かな以外」を含む文字列(…、山陽新幹線、…)を備えており、複数のブロックに区分された形態で記憶されている。また、属性(1)として品詞を示す情報(…、普通名詞、…)と、属性(2)として優先度(予測変換候補の表示順の優先度)を示す情報(…、通常、…)とを備えている。文字列(A)の「ア」と文字列(B)の「山陽新幹線」は、ユーザが任意に登録したものである。   The dictionary data portion of the user dictionary shown in the example of FIG. 6D is stored in a user dictionary information storage portion (not shown) as described above, and a kana character string (..., a, ...) and a character string (..., Sanyo Shinkansen, ...) including "other than kana" indicating notation as a character string (B), and stored in a form divided into a plurality of blocks. Also, information (..., common noun, ...) indicating the part of speech as the attribute (1), information (..., normal, ...) indicating the priority (priority of the display order of the prediction conversion candidates) as the attribute (2), and It has. The character string (A) “A” and the character string (B) “Sanyo Shinkansen” are arbitrarily registered by the user.

図6(e)の例に示されるDL辞書の辞書データ部は、前述した通り図示しないDL辞書情報記憶部に記憶されるもので、例えば「関西弁辞書」等の方言辞書や、「医学用語辞書」等の専門辞書がある。   The dictionary data portion of the DL dictionary shown in the example of FIG. 6 (e) is stored in a DL dictionary information storage portion (not shown) as described above. For example, a dialect dictionary such as “Kansai dialect dictionary” or “medical terminology” There are specialized dictionaries such as “Dictionary”.

DL辞書は、文字列(A)としてかなの文字列(…、サンカクコ、…)を備え、文字列(B)として表記を示す「かな以外」を含む文字列(…、△湖、…)を備えており、複数のブロックに区分された形態で記憶されている。また、属性(1)として品詞を示す情報(…、固有名詞、…)と、属性(2)として優先度(予測変換候補の表示順の優先度)を示す情報(…、通常、…)とを備えている。このDL辞書は、ユーザがダウンロードしたものである。   The DL dictionary includes a kana character string (..., Sankakuko, ...) as a character string (A), and a character string (..., △ lake, ...) including "other than kana" indicating notation as the character string (B). And is stored in a form divided into a plurality of blocks. Also, information (..., proper noun, ...) indicating the part of speech as the attribute (1), information (..., normal, ...) indicating the priority (priority of the display order of the prediction conversion candidates) as the attribute (2), and It has. This DL dictionary is downloaded by the user.

そのほか、記憶装置2Aには、図示しない連携予測辞書が備えられる。この連携予測辞書は、例えば、予測変換候補として選択された表記である確定表記と、当該確定表記に連なる表記である連語・連想表記と、読みを示す文字列(ヨミ文字列)と、品詞と、優先度とが対応付けられる情報である。この連携予測辞書における確定表記および連語・連想表記は「かな以外の文字」を含む。一方、連携予測辞書におけるヨミ文字列は、かな文字である。   In addition, the storage device 2A includes a cooperative prediction dictionary (not shown). This cooperative prediction dictionary includes, for example, a fixed notation that is a notation selected as a predictive conversion candidate, a collocation / associative notation that is a notation connected to the fixed notation, a character string (yomi character string) indicating reading, a part of speech, , Information associated with priority. The definite notation and the combined word / associative notation in this cooperative prediction dictionary include “characters other than kana”. On the other hand, the Yomi character string in the cooperative prediction dictionary is a kana character.

図7は、同実施形態における情報処理装置に記憶される漢字インデックスの構成例を表形式で示す図である。
図7(a)の例に示される基本辞書用漢字インデックスは、前述した通りインデックス情報記憶部25に記憶されるもので、文字列(A)として「かな以外」を含む文字列(…、山、山、山、山、…)を備え、文字列(B)としてかなの文字列(…、サザ、ザン、ヤマ、ワサ、…)を備えている。
FIG. 7 is a diagram illustrating a configuration example of the kanji index stored in the information processing apparatus according to the embodiment in a table format.
The kanji index for basic dictionary shown in the example of FIG. 7A is stored in the index information storage unit 25 as described above, and a character string (..., mountain including “other than kana” as the character string (A). , Mountain, mountain, mountain,..., And a kana character string (..., Saza, Zan, Yama, Wasa,...) As a character string (B).

図7(b)の例に示される予測辞書用漢字インデックスは、前述した通りインデックス情報記憶部25に記憶されるもので、文字列(A)として「かな以外」を含む文字列(…、山、山、山、…)を備え、文字列(B)としてかなの文字列(…、サン、ヤ、ワ、…)を備えている。   The kanji index for prediction dictionary shown in the example of FIG. 7B is stored in the index information storage unit 25 as described above, and a character string (..., mountain including “other than kana” as the character string (A). , Mountain, mountain,..., And a character string (..., San, Ya, Wa,...) As a character string (B).

図7(a)および図7(b)の例では、文字列(B)は、辞書データ部のブロックにおける文字列(A)の文字列の前方2文字までの文字列である。但し、前方2文字までに限ることなく3文字以上とすることも可能である。また、これらの漢字インデックスは、前述した基本辞書や予測辞書の辞書データ部のヨミ文字列および表記の対応関係をもとに予め構築され、文字列(A)の配列は文字コード順とする。但し、文字コード順に限らずにその他のコード順とすることも可能である。   In the example of FIGS. 7A and 7B, the character string (B) is a character string up to the first two characters of the character string of the character string (A) in the block of the dictionary data portion. However, it is possible to make it 3 or more characters without being limited to 2 characters in front. These kanji indexes are constructed in advance based on the correspondence between the Yomi character strings and the notations in the dictionary data portions of the basic dictionary and the prediction dictionary described above, and the arrangement of the character strings (A) is in the character code order. However, other code orders are possible without being limited to the character code order.

図8は、同実施形態における情報処理装置による候補文字表示ウインドウ44の一例を示す図である。図8の上位の文字列から順に、候補文字表示ウインドウ44の左に順番に表示される。   FIG. 8 is a diagram illustrating an example of a candidate character display window 44 by the information processing apparatus according to the embodiment. The character strings are displayed in order from the upper character string in FIG.

この表示例では、「山さん」の表示順位が上であって、「山茶花」の表示順位が下である。この「山茶花」は基本辞書用予測辞書から「山ノ会」や「山っ気」より先に検索されたが、検索元の基本辞書用予測辞書にて対応付けられる優先度が「低優先」であることなどから、表示順序処理部35の処理により「山ノ会」や「山っ気」より表示順位が下となったことを示している。   In this display example, the display order of “Yamasan” is higher, and the display order of “Yamachahana” is lower. This "Sancha Hana" was searched from the basic dictionary prediction dictionary before "Yamanokai" and "Yamaki", but the priority associated with the basic dictionary prediction dictionary of the search source is "low priority" This indicates that the display order is lower than “Yamanokai” or “Yamaki” by the processing of the display order processing unit 35.

次に、本実施形態の詳細例について説明する。この詳細例では、予測辞書と基本辞書を、漢字インデックス、ヨミインデックスおよびデータ部で構成するものである。
図9は、本発明の実施形態における情報処理装置に記憶される予測辞書の詳細を表形式で示す図である。
この詳細例における予測辞書は、図5においても説明した通り、予測辞書用漢字インデックス、予測辞書ヨミインデックス、および予測辞書データ部により構成される。
図9(a)の例に示される予測辞書用漢字インデックスは、インデックス情報記憶部25に記憶されるもので、文字列(A)として「かな以外」を含む文字列(…、山、山、山、…)を備え、文字列(B)としてかなの文字列(…、サン、ヤ、ヤマ、…)を備えている。
Next, a detailed example of this embodiment will be described. In this detailed example, the prediction dictionary and the basic dictionary are composed of a Kanji index, a Yomi index, and a data part.
FIG. 9 is a diagram showing details of the prediction dictionary stored in the information processing apparatus according to the embodiment of the present invention in a tabular format.
The prediction dictionary in this detailed example includes a prediction dictionary kanji index, a prediction dictionary reading index, and a prediction dictionary data section, as described with reference to FIG.
The kanji index for prediction dictionary shown in the example of FIG. 9A is stored in the index information storage unit 25, and is a character string (..., mountain, mountain, etc.) including "other than kana" as the character string (A). And a character string (..., Sun, Yama, Yama ...) as a character string (B).

図9(b)の例に示される予測辞書用ヨミインデックスは、インデックス情報記憶部25に記憶されるもので、文字列(A)としてかなの文字列(…、サマ、サンカ、ザ、…)を備え、文字列(B)として予測辞書の辞書データ部のブロックを指定するブロック番号(…、94、95、96、…)を備えている。文字列(A)には、文字列(B)のブロック番号により指定されるブロックの先頭に位置するかなの文字列がコード順に配列される。   The prediction dictionary reading index shown in the example of FIG. 9B is stored in the index information storage unit 25, and is a kana character string (..., Summer, sangka, the...) As the character string (A). And a block number (..., 94, 95, 96,...) That designates a block of the dictionary data portion of the prediction dictionary as a character string (B). In the character string (A), a kana character string positioned at the head of the block designated by the block number of the character string (B) is arranged in the order of codes.

図9(c)の例に示されるブロック番号94の予測辞書データ部のブロックは、予測辞書情報記憶部23に記憶されるもので、文字列(A)としてかなの文字列(サマ、…、…、サンイ,…)を備え、文字列(B)として「かな以外」を含む文字列(様々、…、…、山陰、…)を備えている。   The block of the prediction dictionary data part of the block number 94 shown in the example of FIG. 9C is stored in the prediction dictionary information storage part 23, and the kana character string (summer,... ..., Sany, ...), and a character string (various, ..., ..., Sanin, ...) including "other than kana" as the character string (B).

図9(d)の例に示されるブロック番号95の予測辞書データ部のブロックは、予測辞書情報記憶部23に記憶されるもので、文字列(A)としてかなの文字列(サンカ、…、…)を備え、文字列(B)として「かな以外」を含む文字列(参画、…、…)を備えている。   The block of the prediction dictionary data part of block number 95 shown in the example of FIG. 9 (d) is stored in the prediction dictionary information storage part 23, and a kana character string (sanka,... ...) and a character string (participation, ..., ...) including "other than kana" as the character string (B).

なお、図9に示される予測辞書の使い方については、図5の例で説明した通りである。   The usage of the prediction dictionary shown in FIG. 9 is as described in the example of FIG.

図9の構成によれば、予測辞書による検索処理機能が向上し、予測変換候補の検索範囲を狭くすることができるので、予測変換処理にかかる処理負荷を軽減することができる。   According to the configuration of FIG. 9, the search processing function using the prediction dictionary is improved and the search range of prediction conversion candidates can be narrowed, so that the processing load on the prediction conversion process can be reduced.

図10は、本発明の実施形態における情報処理装置に記憶される基本辞書の詳細例を表形式で示す図である。
この詳細例における基本辞書は、図5においても説明した通り、基本辞書用漢字インデックス、基本辞書ヨミインデックス、および基本辞書データ部により構成される。
図10(a)の例に示される基本辞書用漢字インデックスは、インデックス情報記憶部25に記憶されるもので、文字列(A)として「かな以外」を含む文字列(…、山、山、山、山、山、山、…)を備え、文字列(B)としてかなの文字列(…、サザ、サン、ザン、ヤキ、ヤマ、ワサ、…)を備えている。
FIG. 10 is a diagram showing a detailed example of the basic dictionary stored in the information processing apparatus according to the embodiment of the present invention in a table format.
The basic dictionary in this detailed example is composed of a basic dictionary kanji index, a basic dictionary reading index, and a basic dictionary data section as described with reference to FIG.
The kanji index for basic dictionary shown in the example of FIG. 10 (a) is stored in the index information storage unit 25, and a character string (..., mountain, mountain, etc.) including "other than kana" as the character string (A). Mountain, mountain, mountain, mountain,..., And a character string (..., Saza, Sun, Zan, Yaki, Yama, Wasa,...) As a character string (B).

図10(b)の例に示される基本辞書用ヨミインデックスは、インデックス情報記憶部25に記憶されるもので、文字列(A)としてかなの文字列(…、サゲ、ササミ、サシタル、…)を備え、文字列(B)として基本辞書の辞書データ部のブロックを指定するブロック番号(…、401、402、403、…)を備えている。文字列(A)には、文字列(B)のブロック番号により指定されるブロックの先頭に位置するかなの文字列がコード順に配列される。   The basic dictionary reading index shown in the example of FIG. 10B is stored in the index information storage unit 25, and is a kana character string (..., Sage, fillet, sagittal,...) As a character string (A). And a block number (..., 401, 402, 403,...) That designates a block of the dictionary data portion of the basic dictionary as a character string (B). In the character string (A), a kana character string positioned at the head of the block designated by the block number of the character string (B) is arranged in the order of codes.

図10(c)の例に示されるブロック番号401の基本辞書データ部のブロックは、基本辞書情報記憶部22に記憶されるもので、文字列(A)としてかなの文字列(サゲ、…、…)を備え、文字列(B)として「かな以外」を含む文字列(下げ、…、…)を備えている。   The block of the basic dictionary data portion with the block number 401 shown in the example of FIG. 10C is stored in the basic dictionary information storage portion 22 and is a kana character string (sage,... ...) and a character string (lower, ..., ...) including "other than kana" as the character string (B).

図10(d)の例に示されるブロック番号402の基本辞書データ部のブロックは、基本辞書情報記憶部23に記憶されるもので、文字列(A)としてかなの文字列(…、サザンカ、…)を備え、文字列(B)として「かな以外」を含む文字列(…、山茶花、…)を備えている。   The block of the basic dictionary data part with the block number 402 shown in the example of FIG. 10D is stored in the basic dictionary information storage part 23, and the character string (A) is a kana character string (... ...) and a character string (..., Sanchahana ...) including "other than kana" as the character string (B).

なお、図10に示される基本辞書の使い方については、図5の例と同様となるため、その説明を省略する。   The usage of the basic dictionary shown in FIG. 10 is the same as in the example of FIG.

また、図10の構成によれば、基本辞書による検索処理機能も向上し、予測変換候補の検索範囲を狭くすることができるので、予測変換処理にかかる処理負荷を軽減することができる。   Further, according to the configuration of FIG. 10, the search processing function by the basic dictionary is also improved and the search range of the prediction conversion candidates can be narrowed, so that the processing load for the prediction conversion processing can be reduced.

また、図9、図10と同様に、学習辞書、ユーザ辞書、DL辞書にも漢字インデッスク、ヨミインデックスを備える。   Similarly to FIGS. 9 and 10, the learning dictionary, the user dictionary, and the DL dictionary are also provided with a kanji index and a Yomi index.

なお、これまでの説明からわかるように、文字列(A)は例えばコード順に配列されているが、文字列(B)はコード順に配列されているわけではない。   As can be seen from the above description, the character strings (A) are arranged in code order, for example, but the character strings (B) are not arranged in code order.

また、表示すべき複数の候補が、例えば図7中の文字列(A)に示されるような同じ文字列にそれぞれ対応するものである場合、表示順はどのような並び順でも良い。例えば、語の登録順でもよいし、文字列(B)の順でもよい。あるいは候補として出力される順を考慮して任意に調整されてもよい。   Further, when the plurality of candidates to be displayed correspond to the same character string as shown in the character string (A) in FIG. 7, for example, the display order may be any order. For example, the registration order of words may be used, or the order of character strings (B) may be used. Or you may adjust arbitrarily considering the order output as a candidate.

次に、本実施形態に係る情報処理装置による予測変換処理の動作について説明する。
図11は、同実施形態に係る情報処理装置による予測変換候補表示に係る動作の一例を示すフローチャートである。
まず、入力装置3への所定の操作により、図2(a),図3(a)と同様に文字が入力されると(ステップS1)、文字認識部32は、この入力された文字と文字認識辞書情報記憶部21に記憶される辞書とを照合することで、手書き入力された文字の認識結果の文字を当該辞書から単一又は複数検索し、この検索結果を、表示処理部37を通じて表示装置4の画面の左下にある認識文字結果表示用ウインドウ42内に表示させる(ステップS2)。
Next, the operation | movement of the prediction conversion process by the information processing apparatus which concerns on this embodiment is demonstrated.
FIG. 11 is a flowchart illustrating an example of operations related to prediction conversion candidate display by the information processing apparatus according to the embodiment.
First, when a character is input by a predetermined operation on the input device 3 in the same manner as in FIGS. 2A and 3A (step S1), the character recognition unit 32 causes the input character and character to be input. By collating with a dictionary stored in the recognition dictionary information storage unit 21, a single or a plurality of characters as a recognition result of the handwritten input character are searched from the dictionary, and the search result is displayed through the display processing unit 37. It is displayed in the recognized character result display window 42 at the lower left of the screen of the device 4 (step S2).

文字認識部32は、手書き入力された文字の認識結果の文字の検索結果のうち、手書き入力された文字に最も近い検索結果を仮確定認識文字として、表示処理部37を通じて認識文字結果表示用ウインドウ42内の左上に表示させる。ユーザは、この表示された仮確定認識文字が、例えば自身が意図した文字に一致しない場合には(ステップS3のNO)、認識文字結果表示用ウインドウ42内の認識結果の文字のうち仮確定認識文字以外から、例えば自身が意図した文字を当該文字の表示部分へのペンタッチにより選択すると、この選択した文字が新たな仮確定認識文字として画面上の文字表示用ウインドウ43内に表示される(ステップS4)。この段階では、この表示された文字は入力文字として確定しておらず、この状態で、画面内に表示される「決定キー」が表示されている部分をペンタッチすることで、未確定だった文字列が入力済みの文字列として確定する。   The character recognition unit 32 uses the search result closest to the handwritten input character among the character search results of the recognition result of the handwritten input character as a provisionally confirmed recognition character, and displays a recognized character result display window through the display processing unit 37. It is displayed on the upper left in 42. For example, when the displayed temporarily confirmed recognition character does not match the character intended by the user (NO in step S3), the user temporarily recognizes the recognition result among the recognition result characters in the recognized character result display window 42. If, for example, a character intended by itself is selected from other than a character by pen touching the display portion of the character, the selected character is displayed in the character display window 43 on the screen as a new tentatively recognized character (step) S4). At this stage, the displayed character is not confirmed as an input character. In this state, by touching the part where the “Enter key” displayed on the screen is displayed, the character that has not been confirmed is displayed. The column is confirmed as the entered character string.

前述した未確定の状態において、仮確定認識文字に続く文字を入力したい場合には、再度入力画面の手書き文字入力用ウインドウ41内へのペンタッチにより手書きによる一文字の文字入力を行なえばよい。   In the above-described unconfirmed state, when it is desired to input a character that follows the tentatively recognized character, it is only necessary to input one character by handwriting by pen touching the handwritten character input window 41 on the input screen again.

ステップS4の処理がなされた場合、もしくは認識文字結果表示用ウインドウ42内に表示された仮確定認識文字が、ユーザ自身が意図した文字に一致しているために(ステップS3のYES)、ステップS4の処理がなされない場合、検索部33は、仮確定の文字列に「かな以外」の文字が含まれているか否かを判別する(ステップS5)。   When the process of step S4 is performed, or because the temporarily confirmed recognized character displayed in the recognized character result display window 42 matches the character intended by the user (YES in step S3), step S4 If the above process is not performed, the search unit 33 determines whether or not the character string “other than kana” is included in the temporarily confirmed character string (step S5).

この判別の結果、文字列に「かな以外」の文字が含まれている場合には(ステップS5のYES)、漢字予測処理がなされ(ステップS6)、文字列に「かな以外」の文字が含まれていない場合には(ステップS5のNO)、かな予測処理がなされる(ステップS7)。   As a result of the determination, if the character string includes a character other than “kana” (YES in step S5), kanji prediction processing is performed (step S6), and the character string includes a character other than “kana”. If not (NO in step S5), kana prediction processing is performed (step S7).

ここで、ステップS7のかな予測処理について説明する。
図12は、同実施形態における情報処理装置のかな予測処理による予測変換候補の表示に係る動作の一例を示すフローチャートである。
このかな予測処理では、検索部33は、学習辞書の検索(ステップS21)、ユーザ辞書の検索(ステップS22)、DL辞書の検索(ステップS23)、予測辞書の検索(ステップS24〜S27)、および基本辞書の検索(ステップS28)をこの順序で実行する。各辞書の検索のステップを構成する複数のステップは同様である。ここでは、予測辞書の検索に焦点を絞って複数のステップS24〜S27の処理の詳細について説明する。
Here, the kana prediction process in step S7 will be described.
FIG. 12 is a flowchart illustrating an example of an operation related to the display of the prediction conversion candidate by the kana prediction process of the information processing apparatus according to the embodiment.
In this kana prediction process, the search unit 33 searches the learning dictionary (step S21), searches the user dictionary (step S22), searches the DL dictionary (step S23), searches the prediction dictionary (steps S24 to S27), and The basic dictionary search (step S28) is executed in this order. The plurality of steps constituting the search step of each dictionary are the same. Here, the details of the processes in steps S24 to S27 will be described focusing on the search of the prediction dictionary.

検索部33は、予測辞書を呼び出すと(ステップS24)、この予測辞書に含まれている予測辞書用ヨミインデックスを検索し(ステップS25)、予測辞書用ヨミインデックスの1列目のデータである文字列(A)の中からバイナリサーチにより対象のかな文字列が存在する位置をそれぞれ求め、それぞれ対応するブロック番号を2列目のデータである文字列(B)の中から抽出する。   When the retrieval unit 33 calls the prediction dictionary (step S24), the retrieval unit 33 retrieves the prediction dictionary reading index included in the prediction dictionary (step S25), and the character that is data in the first column of the prediction dictionary reading index. Each position where the target kana character string exists is obtained from the column (A) by binary search, and the corresponding block number is extracted from the character string (B) which is the data of the second column.

続いて、検索部33は、抽出したブロック番号によりそれぞれ指定される辞書データ部のブロックを検索し(ステップS26)、当該ブロックにおける1列目のデータである文字列(A)の中からバイナリサーチにより対象のかな文字列が含まれる文字列の位置を求め、それぞれ対応する表記を2列目のデータである文字列(B)の中から抽出し、それらを予測変換候補として所定の記憶領域に格納する(ステップS27)。これらのステップをヨミインデックスの文字列(A)と対象のカナ文字列が一致する間繰り返す。   Subsequently, the search unit 33 searches for a block of the dictionary data portion respectively designated by the extracted block number (step S26), and performs a binary search from the character string (A) that is the first column data in the block. To obtain the position of the character string including the target kana character string, extract the corresponding notation from the character string (B) which is the data in the second column, and store them in a predetermined storage area as a predictive conversion candidate Store (step S27). These steps are repeated while the character string (A) of the reading index matches the target kana character string.

このようなステップS24〜S27の処理は、学習辞書の検索(ステップS21)、ユーザ辞書の検索(ステップS22)、DL辞書の検索(ステップS23)、および基本辞書の検索(ステップS28)においても同様となる。   The processes in steps S24 to S27 are the same in the search of the learning dictionary (step S21), the search of the user dictionary (step S22), the search of the DL dictionary (step S23), and the search of the basic dictionary (step S28). It becomes.

次に、表示順序処理部35は、予測候補情報記憶部26に格納された予測変換候補の情報の検索元の辞書における優先度情報および品詞情報を参照し、この優先度情報の区分および品詞情報で示される品詞の種別に対応する所定の優先度を認識して、予測変換候補の表示順を設定し(ステップS29)、設定した順番に予測変換候補を表示装置4の画面上に表示させる(ステップS30)。表示装置4の画面上に表示された予測変換候補の中から1つのユーザにより候補が選択され(ステップS31)、選択された候補への予測結果の確定入力がなされると(ステップS32)、この選択された候補が画面上の文字表示用ウインドウ44内に表示される。   Next, the display order processing unit 35 refers to the priority information and the part of speech information in the dictionary of the search source for the information of the prediction conversion candidate stored in the prediction candidate information storage unit 26, and classifies the part of the priority information and the part of speech information. Recognize a predetermined priority level corresponding to the type of part of speech indicated by (2), set the display order of predictive conversion candidates (step S29), and display the predictive conversion candidates on the screen of the display device 4 in the set order ( Step S30). When a candidate is selected by one user from the prediction conversion candidates displayed on the screen of the display device 4 (step S31), and the confirmation input of the prediction result to the selected candidate is made (step S32), The selected candidate is displayed in the character display window 44 on the screen.

本実施形態では、学習辞書から検索された予測変換候補の表示順位は、表示順序処理部35による処理を経ても他の辞書から検索された予測変換候補の表示順位より高く、予測辞書から検索された予測変換候補の表示順位は、表示順序処理部35による処理を経ても基本辞書から検索された予測変換候補の表示順位より高いとする(ステップS7)。   In this embodiment, the display order of prediction conversion candidates searched from the learning dictionary is higher than the display order of prediction conversion candidates searched from other dictionaries even after the processing by the display order processing unit 35, and is searched from the prediction dictionary. It is assumed that the display order of the predicted conversion candidates is higher than the display order of the predicted conversion candidates searched from the basic dictionary even after the processing by the display order processing unit 35 (step S7).

品詞ごとの優先順位の設定方法としては、各種品詞についての優先順位を選択メニューを設けユーザにより設定する手法、文字入力画面における各種入力フィールドの種別に応じて優先する品詞を設定する手法、および、入力された文字の品詞を解析してこの解析結果を記憶し、次に入力されるであろう品詞を選択して当該選択した品詞を予測変換候補として優先表示する文法解析処理により設定する手法が挙げられる。   As a method for setting the priority order for each part of speech, a method for setting a priority order for various parts of speech by a user and setting by the user, a method for setting a part of speech priority according to the type of various input fields on the character input screen, and A method of analyzing the part-of-speech of the input character, storing the analysis result, selecting the part-of-speech that will be input next, and setting the selected part-of-speech preferentially as a predictive conversion candidate and setting it by grammar analysis processing Can be mentioned.

ここで、ステップS6の漢字予測処理について説明する。
図13は、同実施形態における情報処理装置の漢字予測処理による予測変換候補の表示に係る動作の一例を示すフローチャートである。
この漢字予測処理では、検索部33は、学習辞書の検索(ステップS41)、ユーザ辞書の検索(ステップS42)、DL辞書の検索(ステップS43)、予測辞書の検索(ステップS44〜S48)、および基本辞書の検索(ステップS49)をこの順序で実行する。各辞書の検索のステップを構成する複数のステップは同様である。ここでは、予測辞書の検索に焦点を絞って複数のステップS44〜S48の処理の詳細について説明する。
Here, the kanji prediction process in step S6 will be described.
FIG. 13 is a flowchart illustrating an example of operations related to display of prediction conversion candidates by the kanji prediction process of the information processing apparatus according to the embodiment.
In this kanji prediction process, the search unit 33 searches the learning dictionary (step S41), searches the user dictionary (step S42), searches the DL dictionary (step S43), searches the prediction dictionary (steps S44 to S48), and The basic dictionary search (step S49) is executed in this order. The plurality of steps constituting the search step of each dictionary are the same. Here, the details of the processes in steps S44 to S48 will be described focusing on the search of the prediction dictionary.

検索部33は、予測辞書を呼び出すと(ステップS44)、この予測辞書に含まれている予測辞書用漢字インデックスを検索し(ステップS45)、予測辞書用漢字インデックスの1列目のデータである文字列(A)の中からバイナリサーチにより対象のかな以外の文字が存在する位置をそれぞれ求め、それぞれ対応するかな文字を2列目のデータである文字列(B)の中から抽出する。   When the retrieval unit 33 calls the prediction dictionary (step S44), the retrieval unit 33 retrieves the prediction dictionary kanji index included in the prediction dictionary (step S45), and the character that is data in the first column of the prediction dictionary kanji index. Each position where a character other than the target kana exists is obtained from the column (A) by binary search, and the corresponding kana character is extracted from the character string (B) which is data in the second column.

続いて、検索部33は、この予測辞書に含まれている予測辞書用ヨミインデックスを検索し(ステップS46)、予測辞書用ヨミインデックスの1列目のデータである文字列(A)の中からバイナリサーチにより抽出したかな文字列が存在する位置をそれぞれ求め、それぞれ対応するブロック番号を2列目のデータである文字列(B)の中から抽出する。   Subsequently, the search unit 33 searches the prediction dictionary reading index included in the prediction dictionary (step S46), and from the character string (A) that is the first column data of the prediction dictionary reading index. Each position where the kana character string extracted by the binary search exists is obtained, and the corresponding block number is extracted from the character string (B) which is the data of the second column.

続いて、検索部33は、抽出したブロック番号によりそれぞれ指定される辞書データ部のブロックを検索し(ステップS47)、当該ブロックにおける1列目のデータである文字列(A)の中からバイナリサーチにより対象のかな文字列が含まれる文字列の位置を求め、それぞれ対応する表記を2列目のデータである文字列(B)の中から抽出し、それらを予測変換候補として所定の記憶領域に格納する(ステップS48)。   Subsequently, the search unit 33 searches the blocks of the dictionary data part respectively designated by the extracted block numbers (step S47), and performs a binary search from the character string (A) that is the first column data in the block. To obtain the position of the character string including the target kana character string, extract the corresponding notation from the character string (B) which is the data in the second column, and store them in a predetermined storage area as a predictive conversion candidate Store (step S48).

これらのステップを漢字インデックスの文字列(A)と対象のかな以外の文字列が一致するまで繰り返す。 These steps are repeated until the character string (A) of the kanji index matches the character string other than the target kana.

このようなステップS44〜S48の処理は、学習辞書の検索(ステップS41)、ユーザ辞書の検索(ステップS42)、DL辞書の検索(ステップS43)、および基本辞書の検索(ステップS49)においても同様となる。   The processing in steps S44 to S48 is the same in the learning dictionary search (step S41), the user dictionary search (step S42), the DL dictionary search (step S43), and the basic dictionary search (step S49). It becomes.

次に、表示順序処理部35は、予測候補情報記憶部26に格納された予測変換候補の情報の検索元の辞書における優先度情報および品詞情報を参照し、この優先度情報の区分および品詞情報で示される品詞の種別に対応する所定の優先度を認識して、予測変換候補の表示順を設定し(ステップS50)、設定した順番に予測変換候補を表示装置4の画面上に表示させる(ステップS51)。表示装置4の画面上に表示された予測変換候補の中から1つの候補が選択され(ステップS52)、選択された候補への予測結果の確定入力がなされると(ステップS53)、この選択された候補が画面上の文字表示用ウインドウ44内に表示される。   Next, the display order processing unit 35 refers to the priority information and the part of speech information in the dictionary of the search source for the information of the prediction conversion candidate stored in the prediction candidate information storage unit 26, and classifies the part of the priority information and the part of speech information. Recognize a predetermined priority level corresponding to the type of part of speech indicated by (2), set the display order of prediction conversion candidates (step S50), and display the prediction conversion candidates on the screen of the display device 4 in the set order ( Step S51). When one candidate is selected from the prediction conversion candidates displayed on the screen of the display device 4 (step S52), and the confirmation result is input to the selected candidate (step S53), the selected candidate is selected. The candidates are displayed in the character display window 44 on the screen.

そして、図11に戻り、辞書編集部36は、選択された結果を学習辞書に登録する。既に登録済の場合は、学習辞書上の頻度を更新する(ステップS11)。そして、辞書編集部36は、学習辞書上の当該選択した文字の情報を前回利用の履歴情報として所定の記憶領域に記憶させる。   Then, returning to FIG. 11, the dictionary editing unit 36 registers the selected result in the learning dictionary. If already registered, the frequency in the learning dictionary is updated (step S11). Then, the dictionary editing unit 36 stores information on the selected character on the learning dictionary in a predetermined storage area as history information used last time.

検索部33は、連携予測辞書の確定表記と確定済みの文字列とを照合することで、連携予測変換候補である連語・連想表記を検索し(ステップS12)、予測候補出力部34は、この検索した候補を、表示処理部37を通じて表示装置4に表示させる(ステップS13)。   The search unit 33 searches for the collocation / association notation that is a linked prediction conversion candidate by collating the confirmed notation of the linked prediction dictionary with the confirmed character string (step S12), and the predicted candidate output unit 34 The retrieved candidates are displayed on the display device 4 through the display processing unit 37 (step S13).

ユーザが、この表示された連携予測候補のうち、所望の候補の表示部分へのペンタッチにより選択すると(ステップS14)、この選択した候補への連携予測結果の確定入力がなされたことになり(ステップS15)、この選択した候補が画面上の文字表示用ウインドウ43内に表示されることになり、この選択した候補が画面上の文字表示用ウインドウ43内に表示される。辞書編集部36は、選択済みの候補の検索元の辞書および学習辞書上の頻度を更新する(ステップS16)。辞書編集部36は、学習辞書上の当該選択した文字の情報を前回利用の履歴情報として所定の記憶領域に記憶させる。   When the user selects a desired candidate from among the displayed linked prediction candidates by a pen touch (step S14), the confirmed input of the linked prediction result to the selected candidate is made (step S14). In step S15, the selected candidate is displayed in the character display window 43 on the screen, and the selected candidate is displayed in the character display window 43 on the screen. The dictionary editing unit 36 updates the frequencies of the selected candidate search source dictionary and the learning dictionary (step S16). The dictionary editing unit 36 stores the information of the selected character on the learning dictionary in a predetermined storage area as history information used last time.

手書きによる入力が終了していない場合には(ステップS17のNO)、ステップS1の処理に戻り、手書きによる入力が終了した場合には(ステップS17のYES)、一連の処理が終了する。   If the handwritten input has not ended (NO in step S17), the process returns to step S1, and if the handwritten input has ended (YES in step S17), the series of processes ends.

以上のように、本発明の実施形態における情報処理装置では、「かな以外」を含む文字列が手書き入力された場合、この入力された文字の読みを示す表記を各種漢字インデックスから検索し、この検索結果に対応して、かつ、手書き入力された「かな以外」の字を含む表記を各種辞書から検索するので、従来の予測変換候補の表示のための構成と比較して、専用の辞書を新たに設ける必要なしに従来より用いられる基本辞書や予測辞書を有効に活用して、手書き入力された「かな以外」を含む文字列にもとづく予測変換処理や連携予測変換処理を行うことができる。よって、機器の記憶容量や処理負荷を著しく増大させること無しに、「かな以外」を含む文字列を手書き入力する際のユーザ入力操作にかかる負担を大幅に軽減することができる。   As described above, in the information processing apparatus according to the embodiment of the present invention, when a character string including “other than kana” is input by handwriting, the notation indicating the reading of the input character is searched from various kanji indexes, In response to the search results, and searches for various notations containing handwritten input characters other than “kana”, the dedicated dictionary is compared with the conventional configuration for displaying predictive conversion candidates. It is possible to perform predictive conversion processing and cooperative predictive conversion processing based on a character string including “other than kana” input by handwriting by effectively utilizing a basic dictionary and a prediction dictionary that have been conventionally used without the necessity of providing a new one. Therefore, the burden on the user input operation when inputting a character string including “other than kana” by handwriting can be greatly reduced without significantly increasing the storage capacity and processing load of the device.

よって、従来のように、かな文字のみを手書き入力した際の予測変換のための操作と同一の操作が「かな以外」を含む文字列を手書き入力した場合でも実現でき、操作性が大幅に向上する。よって、手書きにより入力された漢字をもとにした予測変換の機能実装の効率および入力作業の効率を大幅に向上させることができる。   Therefore, as in the past, the same operation for predictive conversion when only Kana characters are input by hand can be realized even when a character string including “other than Kana” is input by hand, greatly improving operability. To do. Therefore, it is possible to greatly improve the efficiency of the predictive conversion function implementation based on the handwritten Kanji characters and the efficiency of the input work.

また、キー押下入力方式で行っていた文字列予測を手書き入力方式で実現し、かつ、専用の漢字予測変換辞書を設ける必要なしに、キー押下入力方式による文字入力予測処理と同等の処理速度を保つことができる。   In addition, the character string prediction performed by the key press input method is realized by the handwriting input method, and the processing speed equivalent to the character input prediction process by the key press input method is achieved without the need for providing a dedicated kanji prediction conversion dictionary. Can keep.

また、漢字インデックスを予測辞書用と基本辞書用とにそれぞれ設けることで、漢字インデックスをそれぞれの辞書に適した構成とすることができるので、漢字インデックスを予測辞書及び基本辞書に共通した単一のインデックス情報とした場合と比較して、不必要な検索を抑制できるので、検索のパフォーマンスが向上する。   In addition, by providing a kanji index for the prediction dictionary and the basic dictionary, the kanji index can be configured to be suitable for each dictionary. Compared with the case where the index information is used, unnecessary search can be suppressed, and search performance is improved.

なお、この発明は前記実施形態そのままに限定されるものではなく実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合わせにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を省略してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。   The present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be omitted from all the components shown in the embodiment. Furthermore, you may combine suitably the component covering different embodiment.

また、上記実施形態に記載した手法は、コンピュータに実行させることのできるプログラムとして、半導体メモリ(フラッシュメモリなど)、磁気ディスク(ハードディスク、フロッピー(登録商標)ディスクなど)、光ディスク(CD−ROM、DVDなど)、光磁気ディスク(MO)などの記憶媒体に格納して頒布することもできる。   In addition, the method described in the above embodiment is a program that can be executed by a computer, such as a semiconductor memory (flash memory, etc.), a magnetic disk (hard disk, floppy (registered trademark) disk, etc.), an optical disk (CD-ROM, DVD, etc.). Etc.) and can be distributed in a storage medium such as a magneto-optical disk (MO).

また、この記憶媒体としては、プログラムを記憶でき、かつコンピュータが読み取り可能な記憶媒体であれば、その記憶形式は何れの形態であっても良い。   In addition, as long as the storage medium can store a program and can be read by a computer, the storage format may be any form.

また、記憶媒体からコンピュータにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワークソフト等のMW(ミドルウェア)等が上記実施形態を実現するための各処理の一部を実行しても良い。   In addition, an OS (operating system) running on a computer based on an instruction of a program installed in the computer from a storage medium, MW (middleware) such as database management software, network software, and the like realize the above-described embodiment. A part of each process may be executed.

さらに、本発明における記憶媒体は、コンピュータと独立した媒体に限らず、LANやインターネット等により伝送されたプログラムをダウンロードして記憶又は一時記憶した記憶媒体も含まれる。   Further, the storage medium in the present invention is not limited to a medium independent of a computer, but also includes a storage medium in which a program transmitted via a LAN, the Internet, or the like is downloaded and stored or temporarily stored.

また、記憶媒体は1つに限らず、複数の媒体から上記実施形態における処理が実行される場合も本発明における記憶媒体に含まれ、媒体構成は何れの構成であっても良い。   Further, the number of storage media is not limited to one, and the case where the processing in the above embodiment is executed from a plurality of media is also included in the storage media in the present invention, and the media configuration may be any configuration.

尚、本発明におけるコンピュータは、記憶媒体に記憶されたプログラムに基づき、上記実施形態における各処理を実行するものであって、パソコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であっても良い。   The computer according to the present invention executes each process in the above-described embodiment based on a program stored in a storage medium, and is a single device such as a personal computer or a system in which a plurality of devices are connected to a network. Any configuration may be used.

また、本発明におけるコンピュータとは、携帯情報端末、携帯電話機、パーソナルコンピュータなどに限らず、家庭電化製品等に含まれる演算処理装置、マイコン等も含み、プログラムによって本発明の機能を実現することが可能な機器、装置を総称している。   In addition, the computer in the present invention is not limited to a portable information terminal, a mobile phone, a personal computer, and the like, and includes an arithmetic processing unit, a microcomputer, and the like included in home appliances, and the functions of the present invention can be realized by a program. It is a generic term for all possible equipment and devices.

1…制御装置、2A…不揮発性記憶装置、2B…揮発性記憶装置、3…入力装置、4…表示装置、5…I/O装置、10…バス、21…文字認識辞書情報記憶部、22…基本辞書情報記憶部、23…予測辞書情報記憶部、24…学習辞書情報記憶部、25…インデックス情報記憶部、26…予測候補情報記憶部、31…記憶処理部、32…文字認識部、33…検索部、34…予測候補出力部、35…表示順序処理部、36…辞書編集部、37…表示処理部。   DESCRIPTION OF SYMBOLS 1 ... Control apparatus, 2A ... Nonvolatile memory | storage device, 2B ... Volatile memory | storage device, 3 ... Input device, 4 ... Display apparatus, 5 ... I / O device, 10 ... Bus, 21 ... Character recognition dictionary information storage part, 22 ... basic dictionary information storage unit, 23 ... prediction dictionary information storage unit, 24 ... learning dictionary information storage unit, 25 ... index information storage unit, 26 ... prediction candidate information storage unit, 31 ... storage processing unit, 32 ... character recognition unit, 33 ... Search unit, 34 ... Prediction candidate output unit, 35 ... Display order processing unit, 36 ... Dictionary editing unit, 37 ... Display processing unit.

Claims (3)

手書きによる文字列の入力が可能な入力装置と、情報を記憶する記憶媒体と、情報を画面に表示する表示装置とを備えたコンピュータに、
1)かな以外を含む文字列の表記と当該文字列の少なくとも一部の読み又は見出しを示すかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列され、当該情報がコード順の配列方向に複数のブロックに区分される辞書データ部と、2)前記辞書データ部に含まれる前記かなの文字列の少なくとも先頭から一部の文字列とかな以外の文字列とを対応付けた情報を含み、前記かな以外の文字列がコード順に配列される第1のインデックスと、3)前記辞書データ部のブロックを指定するブロック識別情報と当該識別情報により指定されるブロックの先頭に位置するかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列される第2のインデックスとを、前記記憶媒体の所定の記憶領域に記憶させる記憶処理機能と、
前記入力装置により入力される文字列を認識する認識機能と、
前記認識機能により認識される文字列にかな以外の文字列が含まれている場合に、前記第1のインデックスの中から当該かな以外の文字列に対応するかなの文字列を検索し、さらに前記第2のインデックスの中から当該検索したかなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索し、一方、前記認識機能により認識される文字列にかな以外の文字列が含まれておらず、かなの文字列が含まれている場合に、前記第1のインデックスを用いずに前記第2のインデックスの中から当該かなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索する検索機能と、
前記検索機能により検索される文字列の表記を候補として前記表示装置の画面に表示させる表示処理機能と
を実現させるための文字列予測プログラム。
In a computer comprising an input device capable of inputting a handwritten character string, a storage medium for storing information, and a display device for displaying information on a screen,
1) including information that associates a character string representation other than kana with a kana character string indicating at least a part of reading or heading of the character string, the kana character strings are arranged in code order, and the information A dictionary data part that is divided into a plurality of blocks in the arrangement direction of the code order; and 2) at least a part of the character string and a character string other than the kana character string included in the dictionary data part. A first index that includes associated information and in which a character string other than the kana is arranged in code order; 3) block identification information that specifies a block of the dictionary data portion; and a head of a block that is specified by the identification information A second index in which the kana character strings are arranged in code order and stored in a predetermined storage area of the storage medium. And processing functions,
A recognition function for recognizing a character string input by the input device;
When a character string other than kana is included in the character string recognized by the recognition function, a kana character string corresponding to a character string other than the kana is searched from the first index, and A block identification information corresponding to the retrieved kana character string is retrieved from the second index, and the retrieved kana character is selected from the blocks of the dictionary data portion specified by the retrieved block identification information. If the character string corresponding to the column is searched for, and the character string recognized by the recognition function does not include a character string other than kana and includes a kana character string, The dictionary specified by the searched block identification information is searched for the block identification information corresponding to the kana character string from the second index without using the index of 1. A search function of searching the representation of the character string corresponding to the character string of kana and the search from the block over data portion,
A character string prediction program for realizing a display processing function for displaying on the screen of the display device as candidates a notation of a character string searched by the search function.
前記第1のインデックス、前記第2のインデックス、および辞書データ部は、種類が異なる辞書毎に存在しており、
前記検索機能は、辞書毎に存在する前記第1のインデックス、前記第2のインデックス、および辞書データ部を用いて検索を行うことを特徴とする請求項1に記載の文字列予測プログラム。
The first index, the second index, and the dictionary data part exist for different types of dictionaries,
The character string prediction program according to claim 1, wherein the search function performs a search using the first index, the second index, and a dictionary data portion that exist for each dictionary.
手書きによる文字列の入力が可能な入力装置と、
情報を記憶する記憶媒体と、
情報を画面に表示する表示装置と、
1)かな以外を含む文字列の表記と当該文字列の少なくとも一部の読み又は見出しを示すかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列され、当該情報がコード順の配列方向に複数のブロックに区分される辞書データ部と、2)前記辞書データ部に含まれる前記かなの文字列の少なくとも先頭から一部の文字列とかな以外の文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列される第1のインデックスと、3)前記辞書データ部のブロックを指定するブロック識別情報と当該識別情報により指定されるブロックの先頭に位置するかなの文字列とを対応付けた情報を含み、前記かなの文字列がコード順に配列される第2のインデックスとを、前記記憶媒体の所定の記憶領域に記憶させる記憶処理手段と、
前記入力装置により入力される文字列を認識する認識手段と、
前記認識手段により認識される文字列にかな以外の文字列が含まれている場合に、前記第1のインデックスの中から当該かな以外の文字列に対応するかなの文字列を検索し、さらに前記第2のインデックスの中から当該検索したかなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索し、一方、前記認識手段により認識される文字列にかな以外の文字列が含まれておらず、かなの文字列が含まれている場合に、前記第1のインデックスを用いずに前記第2のインデックスの中から当該かなの文字列に対応するブロック識別情報を検索し、さらに当該検索したブロック識別情報に指定される前記辞書データ部のブロックの中から前記検索したかなの文字列に対応する文字列の表記を検索する検索手段と、
前記検索手段により検索される文字列の表記を候補として前記表示装置の画面に表示させる表示処理手段と
を具備することを特徴とする情報処理装置。
An input device capable of inputting a handwritten character string;
A storage medium for storing information;
A display device for displaying information on the screen;
1) including information that associates a character string representation other than kana with a kana character string indicating at least a part of reading or heading of the character string, the kana character strings are arranged in code order, and the information A dictionary data part that is divided into a plurality of blocks in the arrangement direction of the code order; and 2) at least a part of the character string and a character string other than the kana character string included in the dictionary data part. A first index including the associated information, in which the kana character string is arranged in code order, and 3) block identification information for designating a block of the dictionary data portion and at the head of the block designated by the identification information A storage process for storing, in a predetermined storage area of the storage medium, a second index in which the kana character string is arranged in code order, including information that associates the kana character string with the position And means,
Recognition means for recognizing a character string input by the input device;
When a character string other than kana is included in the character string recognized by the recognition means, a kana character string corresponding to a character string other than the kana is searched from the first index, and A block identification information corresponding to the retrieved kana character string is retrieved from the second index, and the retrieved kana character is selected from the blocks of the dictionary data portion specified by the retrieved block identification information. If the character string corresponding to the column is searched and the character string recognized by the recognizing means does not include a character string other than kana and includes a kana character string, The dictionary specified by the searched block identification information is searched for the block identification information corresponding to the kana character string from the second index without using the index of 1. Search means for searching the representation of the character string corresponding to the character string of kana and the search from the block over data portion,
An information processing apparatus comprising: a display processing unit configured to display on the screen of the display device as a candidate a notation of a character string searched by the search unit.
JP2009291430A 2009-12-22 2009-12-22 Character string predicting program and information processing apparatus Pending JP2011134021A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009291430A JP2011134021A (en) 2009-12-22 2009-12-22 Character string predicting program and information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009291430A JP2011134021A (en) 2009-12-22 2009-12-22 Character string predicting program and information processing apparatus

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012264346A Division JP5460836B2 (en) 2012-12-03 2012-12-03 Character string prediction program and information processing apparatus

Publications (1)

Publication Number Publication Date
JP2011134021A true JP2011134021A (en) 2011-07-07

Family

ID=44346699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009291430A Pending JP2011134021A (en) 2009-12-22 2009-12-22 Character string predicting program and information processing apparatus

Country Status (1)

Country Link
JP (1) JP2011134021A (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6458018A (en) * 1987-08-28 1989-03-06 Hitachi Ltd Method and device for retrieving data
JPH05181837A (en) * 1991-11-01 1993-07-23 Sony Corp Character converter
JP2002007390A (en) * 2000-06-23 2002-01-11 Toshiba Corp Character string prediction control method and character string input device
JP2006005771A (en) * 2004-06-18 2006-01-05 Ntt Docomo Inc Character input device, and character input method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6458018A (en) * 1987-08-28 1989-03-06 Hitachi Ltd Method and device for retrieving data
JPH05181837A (en) * 1991-11-01 1993-07-23 Sony Corp Character converter
JP2002007390A (en) * 2000-06-23 2002-01-11 Toshiba Corp Character string prediction control method and character string input device
JP2006005771A (en) * 2004-06-18 2006-01-05 Ntt Docomo Inc Character input device, and character input method

Similar Documents

Publication Publication Date Title
JP3889466B2 (en) Text input device and method
KR100909917B1 (en) Recording medium recording an information processing apparatus, an information processing method, and an information processing program
JP4241883B2 (en) Text input device and method
JP4502615B2 (en) Similar sentence search device, similar sentence search method, and program
JP2009059140A (en) Electronic dictionary, retrieval method for electronic dictionary, and retrieval program for electronic dictionary
JP5460836B2 (en) Character string prediction program and information processing apparatus
JP4007400B2 (en) Text input device and method
JP2011134021A (en) Character string predicting program and information processing apparatus
JP4207089B2 (en) Text input device and method
JP4251000B2 (en) Kana-kanji conversion device, kana-kanji conversion method, and kana-kanji conversion program
JP6221275B2 (en) Character input program and character input device
US10664064B2 (en) Input device implementing predictive input method by assigning characters to keys
JP4416644B2 (en) Character processing apparatus with prediction function, method, recording medium, and program
JP4535186B2 (en) Electronic device and program with dictionary function
JP2008117310A (en) Dictionary retrieval device and dictionary retrieval processing program
JP4363167B2 (en) Electronic dictionary apparatus and program
JP2006092004A (en) Dictionary information display control device, dictionary information display control program, and dictionary information display control method
JP2007257188A (en) Dictionary search device and its control program
JP3592284B2 (en) Japanese input system, its program, and portable information terminal
JP2013134730A (en) Character-inputting program and information processor
JP5573257B2 (en) Character input program and communication terminal device
JP4519106B2 (en) Text input device and method
JPH1055360A (en) Device and method for address book processing
JP5861382B2 (en) Input support program, input support apparatus, and input support method
JP5370339B2 (en) Information processing apparatus, information processing program, and recording medium

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121002

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130226