JP5849690B2 - Character input program and information processing apparatus - Google Patents

Character input program and information processing apparatus Download PDF

Info

Publication number
JP5849690B2
JP5849690B2 JP2011286600A JP2011286600A JP5849690B2 JP 5849690 B2 JP5849690 B2 JP 5849690B2 JP 2011286600 A JP2011286600 A JP 2011286600A JP 2011286600 A JP2011286600 A JP 2011286600A JP 5849690 B2 JP5849690 B2 JP 5849690B2
Authority
JP
Japan
Prior art keywords
dictionary
word
pictogram
candidate
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011286600A
Other languages
Japanese (ja)
Other versions
JP2013134730A (en
Inventor
瑞穂 四宮
瑞穂 四宮
拓也 中山
拓也 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2011286600A priority Critical patent/JP5849690B2/en
Publication of JP2013134730A publication Critical patent/JP2013134730A/en
Application granted granted Critical
Publication of JP5849690B2 publication Critical patent/JP5849690B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、起動中のアプリケーションに文字を入力するための文字入力装置としてコンピュータを機能させるためのプログラム、文字入力機能を備えた情報処理装置に関する。   The present invention relates to a program for causing a computer to function as a character input device for inputting characters to a running application, and an information processing device having a character input function.

携帯電話に代表される携帯型情報処理装置の多くは、文字入力の単調さを解消し、ユーザの楽しみを増やすために、様々な絵文字を入力できるように構成されている。たとえば絵文字とその絵文字に対応する概念の語句の読みとの組み合わせを登録し、読みの入力に応じて、通常の文字表記による候補と共に絵文字の候補が呼び出されるようにすることによって、絵文字の入力にかかる労力を軽減したものがある(特許文献1を参照。)。   Many portable information processing devices typified by mobile phones are configured to input various pictograms in order to eliminate the monotony of character input and increase the enjoyment of the user. For example, by registering a combination of a pictogram and a reading of a concept word corresponding to the pictogram, and by calling a pictogram candidate together with a normal text notation candidate according to the input of the reading, Some have reduced such labor (see Patent Document 1).

また、多くの携帯型情報処理装置には、入力対象の語句が確定されたことに応じてその語句に続いて入力される語句の候補(以下、「繋がり予測候補」という。)を予測して表示し、ユーザにより選択された繋がり予測候補を入力対象として確定する機能が設けられている(たとえば特許文献2を参照。)。この機能を利用して、直前に確定された語句の概念を表す絵文字が繋がり予測候補として表示されるようにした機種も出回っている。この絵文字の予測機能によれば、ユーザは、通常の文字表記による語句(たとえば「桜」)に続いて、その語句に対応する概念の絵文字(たとえば桜の花を表す絵文字)を入力することができ、文字入力の興趣を高めることができる。   Further, many portable information processing devices predict word candidates (hereinafter referred to as “connection prediction candidates”) that are input subsequent to the input word / phrase when the input object word / phrase is confirmed. A function is provided for determining a connection prediction candidate that is displayed and selected by the user as an input target (see, for example, Patent Document 2). There are also models that use this function to connect pictographs representing the concept of the word / phrase that has been confirmed immediately before and are displayed as prediction candidates. According to this pictogram prediction function, a user can input a concept pictogram (for example, a pictogram representing a cherry blossom) corresponding to the phrase following a phrase (for example, “sakura”) in normal text notation. , Can enhance the interest of character input.

特開2000−148748号公報JP 2000-148748 A 特開2008−293403号公報JP 2008-293403 A

繋がり予測候補として絵文字の候補を抽出するには、各種絵文字をその絵の概念に適合する語句に対応づけて登録する必要がある。しかし、絵文字に適切な概念を設定する作業には手間や時間がかかるため、語句に対応づけられた絵文字の数を大幅に増やすのは困難である。このため、現状では、繋がり予測リストにおける絵文字の出現頻度を十分に高めることが困難である。   In order to extract a pictographic candidate as a connection prediction candidate, it is necessary to register various pictographs in association with words or phrases that match the concept of the picture. However, since it takes time and effort to set an appropriate concept for pictograms, it is difficult to greatly increase the number of pictograms associated with words. For this reason, at present, it is difficult to sufficiently increase the appearance frequency of pictograms in the connection prediction list.

本発明は上記の問題に着目してなされたもので、絵文字が対応づけられていない語句の確定に対しても、絵文字の繋がり予測候補を表示できるようにするによって、文字入力の興趣や利便性を高めることを、課題とする。   The present invention has been made paying attention to the above-mentioned problem, and it is possible to display the connection prediction candidates of pictograms even for the determination of words and phrases that are not associated with pictograms. The challenge is to increase

本発明によるプログラムは、複数の語句がそれぞれの繋がり関係に紐付けられて登録された辞書を、入力対象の語句が確定されたことに応じて検索して、確定された語句に続いて入力される語句の候補を抽出し、抽出された候補のリスト(以下、「繋がり予測リスト」という。)を表示する予測手段と、表示されたリスト内の一候補を選択する操作に応じて選択された候補を確定して出力する候補確定手段とを含む文字入力装置として、コンピュータを機能させる。   The program according to the present invention searches a dictionary in which a plurality of words are registered in association with each connection relationship according to the confirmation of an input target word, and is input subsequent to the confirmed word. Selected in accordance with a prediction means for displaying a list of extracted candidates (hereinafter referred to as “connection prediction list”) and an operation for selecting one candidate in the displayed list. The computer is caused to function as a character input device including candidate determination means for determining and outputting candidates.

この文字入力装置の辞書には、複数の絵文字がそれぞれその絵文字に対応する概念の語句に対応づけられて登録された絵文字予測辞書が含まれる。予測手段は、この絵文字予測辞書を検索の対象に含めて、入力対象として確定された語句の形態に少なくとも一部分が一致する語句に対応する絵文字を当該絵文字予測辞書から抽出し、抽出された絵文字を上記のリストに含める。   The dictionary of this character input device includes a pictographic prediction dictionary in which a plurality of pictographs are registered in association with conceptual words corresponding to the pictographs. The prediction means includes the pictogram prediction dictionary as a search target, extracts a pictogram corresponding to a phrase that at least partially matches the form of the phrase determined as an input target from the pictogram prediction dictionary, and extracts the extracted pictogram Include in the list above.

上記の構成によれば、入力対象として確定された語句が絵文字に対応づけられて絵文字予測辞書に登録されている場合には、その語句に対応する絵文字を含む繋がり予測リストを表示することができる。また、絵文字に対応づけられて絵文字予測辞書に登録されていない語句が確定された場合でも、その語句の形態の一部に一致する語句に絵文字が対応づけられているならば、その絵文字を含む繋がり予測リストを表示することができる。   According to the above configuration, when a word / phrase determined as an input target is associated with a pictogram and registered in the pictogram prediction dictionary, a connection prediction list including the pictogram corresponding to the word / phrase can be displayed. . In addition, even if a phrase that is associated with a pictogram and is not registered in the pictogram prediction dictionary is confirmed, if the pictogram is associated with a phrase that matches a part of the form of the phrase, that pictogram is included. A connection prediction list can be displayed.

本発明の予測手段は、入力対象として確定された語句に対応づけられている絵文字を絵文字予測辞書から抽出する機能と、入力対象として確定された語句の末尾または先頭の文字列に対応づけられている絵文字を絵文字予測辞書から抽出する機能とを具備する。たとえば、雪の概念を表す絵文字が「雪」という単語に対応づけられて登録されている場合には、「雪」そのものが確定された場合のほか、「雪」を末尾に含む語(「粉雪」「大雪」など)が確定された場合にも、雪の概念を表す絵文字を繋がり予測リストに含めることが可能になる。 The predicting means of the present invention has a function of extracting a pictogram associated with a word determined as an input target from a pictogram prediction dictionary and a character string associated with the end or top character string of the word determined as an input target. And a function for extracting a pictograph from the pictograph prediction dictionary. For example, if an emoticon representing the concept of snow is registered in association with the word “snow,” the word that contains “snow” at the end (“snow”) "Every snow" etc.) is confirmed, it is possible to include pictographs representing the concept of snow and include them in the prediction list.

本発明の一実施形態による文字入力装置では、類似する概念の語の組み合わせが複数登録された類語辞書が設けられ、予測手段に、類語辞書および絵文字予測辞書に対する検索によって、確定された語句に類似する概念を有する語句に対応づけられている絵文字を抽出する機能が付加される。この構成によれば、絵文字が対応づけられた語句の形態に一致しない語に対しても、絵文字を含む繋がり予測リストを表示することが可能になる。 In the character input device according to an embodiment of the present invention, a synonym dictionary in which a plurality of combinations of words having similar concepts are registered is provided, and the predicting unit is similar to a word / phrase determined by searching the synonym dictionary and the pictogram prediction dictionary. A function is added to extract pictograms associated with words having the concept. According to this configuration, it is possible to display a connection prediction list including a pictograph even for a word that does not match the form of the phrase with which the pictograph is associated.

他の実施形態による文字入力装置では、候補確定手段に、リスト内の候補のうち、入力対象として確定された語句の形態の一部分に対応する絵文字の候補が選択された頻度、または当該絵文字の候補が選択されなかった頻度を、絵文字予測辞書で当該絵文字に対応づけられている語句と確定された語句との組み合わせに対応づけて学習する学習手段が含まれる。また予測手段は、絵文字予測辞書に対する検索により、入力対象として確定された語句の形態の一部分に対応する絵文字を抽出したとき、その絵文字に対応する語句と確定された語句との組み合わせに対応づけて学習されている前記頻度に基づき、当該絵文字をリストに含めるか否かを判定する。   In the character input device according to another embodiment, the frequency at which a candidate for a pictograph corresponding to a part of the form of a phrase determined as an input target is selected from candidates in the list or the candidate for the pictograph Learning means is included for learning the frequency at which is not selected in association with a combination of a phrase associated with the pictogram in the pictogram prediction dictionary and a confirmed phrase. Further, when the predicting means extracts a pictograph corresponding to a part of the form of the word / phrase determined as an input target by searching the pictograph prediction dictionary, the predicting means associates the word / phrase corresponding to the pictograph with the combination of the confirmed word / phrase. Based on the learned frequency, it is determined whether or not the pictogram is included in the list.

確定された語の形態に一部分が対応することにより抽出されて繋がり予測リストに含まれた絵文字が、確定された語の概念に適合していない場合には、その絵文字は殆ど選択されることはない。上記の実施形態によれば、過去に同様の検索により抽出されたが選択されなかった頻度が高い絵文字がリストから除外されるので、候補として適切でない絵文字が表示され続けるのを防ぐことができる。   If the pictograms extracted and connected in the prediction list are partially matched with the confirmed word form and do not conform to the concept of the confirmed word, the pictogram is almost always selected. Absent. According to the above embodiment, since pictograms that have been extracted by the same search in the past but are not selected are excluded from the list, it is possible to prevent pictograms that are not suitable as candidates from being continuously displayed.

本発明でいうところの絵文字には、フォントデータにより構成されるもの、画像ファイルにより構成されるものが含まれる。さらに、何らかの概念を表現するために複数の記号を組み合わせたもの(顔文字など)も、本発明の絵文字に含まれる。
また、絵文字予測辞書は、絵文字の繋がり予測候補を抽出するための専用の辞書としてもよいし、通常の文字表記による繋がり予測候補を抽出するための予測辞書内に含まれるようにしてもよい。
The pictograms referred to in the present invention include those composed of font data and those composed of image files. Further, a pictograph according to the present invention includes a combination of a plurality of symbols (such as an emoticon) in order to express some concept.
The pictogram prediction dictionary may be a dedicated dictionary for extracting a pictographic connection prediction candidate, or may be included in a prediction dictionary for extracting a normal character notation connection prediction candidate.

本発明によれば、絵文字に対応づけられていない語句が入力対象として確定された場合でも、その確定された語に関連する概念の絵文字を含む繋がり予測リストを表示することが可能になる。よって、絵文字を利用した文字入力がより容易になって操作性が高められると共に、文字入力の興趣を高めることができる。   According to the present invention, even when a phrase that is not associated with a pictogram is confirmed as an input target, it is possible to display a connection prediction list including pictograms of concepts related to the confirmed word. Therefore, character input using pictograms becomes easier and operability is improved, and the interest of character input can be enhanced.

本発明が適用された文字入力システムの機能ブロック図およびシステム内の各種辞書のデータ構成を示す図である。It is a functional block diagram of a character input system to which the present invention is applied, and a diagram showing a data structure of various dictionaries in the system. 文字入力システムにおける処理の概略手順を示すフローチャートである。It is a flowchart which shows the schematic procedure of the process in a character input system. 類語一致検索の具体例を説明する図である。It is a figure explaining the specific example of a synonym matching search. 末尾語一致検索の具体例を説明する図である。It is a figure explaining the specific example of a tail word matching search. 非選択学習辞書の更新処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the update process of a non-selection learning dictionary. 繋がり予測リストの作成処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the creation process of a connection prediction list.

図1は、本発明が適用された文字入力システムの構成例を示す。
この実施例の文字入力システム1は、携帯電話などの情報処理装置内で、ユーザの操作に従って仮名漢字変換処理を実行し、変換後の文字列を当該装置で起動中のアプリケーション100(メモ帳、メーラーなど)に入力するためのものである。具体的に当該システム1には、ユーザインターフェース10、変換処理部11、確定処理部12、変換辞書13、繋がり予測辞書14、類語辞書15、学習辞書16、非選択学習辞書17などが含まれる。これらはいずれも、専用のプログラムを情報処理装置に組み込むことによって設定される。
FIG. 1 shows a configuration example of a character input system to which the present invention is applied.
The character input system 1 of this embodiment executes a kana-kanji conversion process in accordance with a user operation in an information processing apparatus such as a mobile phone, and converts the converted character string into an application 100 (notepad, To input to a mailer). Specifically, the system 1 includes a user interface 10, a conversion processing unit 11, a confirmation processing unit 12, a conversion dictionary 13, a connection prediction dictionary 14, a synonym dictionary 15, a learning dictionary 16, a non-selected learning dictionary 17, and the like. All of these are set by incorporating a dedicated program into the information processing apparatus.

ユーザインタフェース10は、図示しない表示部に文字キーを含む操作部を立ち上げ、キー操作の内容を変換処理部11や確定処理部12に連絡しながら、かな漢字変換処理の過程や結果(読み文字列の組み立て処理、候補リストの作成処理、候補の確定など)を表示する。なお、操作部は画像によるものに限らず、実物のキーによる操作部を設けてもよい。   The user interface 10 starts up an operation unit including a character key on a display unit (not shown), and communicates the contents of the key operation to the conversion processing unit 11 and the confirmation processing unit 12, while the process and result (reading character string) Assembly process, candidate list creation process, candidate confirmation, etc.) are displayed. The operation unit is not limited to an image, and an operation unit using real keys may be provided.

変換処理部11は、ユーザインタフェース10と協働して、読み文字列を組み立てつつ、変換辞書13や学習辞書16に対する検索により、入力対象の語句の候補を抽出する。抽出された候補はユーザインタフェース10によってリスト表示される。ユーザインタフェース10がいずれかの候補を選択する操作を受け付けると、確定処理部12は、選択された語句を表す文字列を確定し、アプリケーション100へと出力する。   The conversion processing unit 11 cooperates with the user interface 10 to extract candidate words to be input by searching the conversion dictionary 13 and the learning dictionary 16 while assembling a reading character string. The extracted candidates are displayed as a list by the user interface 10. When the user interface 10 accepts an operation for selecting one of the candidates, the confirmation processing unit 12 confirms a character string representing the selected word and outputs it to the application 100.

確定処理部12には、候補の確定に応じて学習辞書16および非選択学習辞書17を更新する機能も設定される。また、候補が確定すると、変換処理部11は確定された語句により繋がり予測辞書14や学習辞書16を検索して、次に入力される可能性のある語句(絵文字を含む。)の候補を抽出する処理(繋がり予測処理)を実行する。この処理により繋がり予測リストが作成されて表示され、リスト内の候補が選択されると、その候補が確定されてアプリケーション100へと出力される。   The confirmation processing unit 12 is also set with a function for updating the learning dictionary 16 and the non-selected learning dictionary 17 in accordance with candidate confirmation. When the candidate is determined, the conversion processing unit 11 searches the connection prediction dictionary 14 and the learning dictionary 16 by the determined word and extracts candidates for a word (including pictograms) that may be input next. The process (connection prediction process) to perform is performed. By this process, a connection prediction list is created and displayed, and when a candidate in the list is selected, the candidate is confirmed and output to the application 100.

図1では、システムの機能ブロック図とともに、学習辞書16を除く各種辞書について、概略のデータ構成をテーブル形式で示している(図1の(a)〜(d))。これらのテーブルを参照して、各辞書の構成を説明する。   In FIG. 1, together with the functional block diagram of the system, the schematic data structure of various dictionaries excluding the learning dictionary 16 is shown in a table format ((a) to (d) in FIG. 1). The configuration of each dictionary will be described with reference to these tables.

図1(a)に示すように、変換辞書13の辞書データには語句の読み(変換前のかな文字列)および表記(変換後の形態)が含まれる。
図示されていないが、変換辞書13の辞書データには、品詞種別や優先度なども含まれる。また、絵文字を表記とした辞書データを登録することもできるが、その場合には、絵文字の概念を示す語句の仮名表記が読みに設定される。なお、絵文字の表記は、一文字文のフォントデータまたは画像ファイルにより表されるが、顔文字など、複数のフォントデータの組み合わせにより表されるものもある。
As shown in FIG. 1A, the dictionary data of the conversion dictionary 13 includes readings of phrases (kana character strings before conversion) and notations (forms after conversion).
Although not shown, the dictionary data of the conversion dictionary 13 includes part of speech type and priority. In addition, dictionary data with pictograms can be registered. In this case, kana notation of a phrase indicating the concept of pictograms is set to be read. Note that pictogram notation is represented by font data or an image file of a single character sentence, but there is also a representation of a combination of a plurality of font data such as a face character.

繋がり予測辞書14には、前後に繋げて使用される可能性が高い語句が組み合わせられて登録される。具体的には、図1(b)に示すように、語句の組み合わせ毎に、それぞれの語句の読みおよび表記を含む辞書データが登録される。以下では、前方の語句を指す場合には「繋がり元」と言い、後方の語句を指す場合には「繋がり先」と言う。   In the connection prediction dictionary 14, words that are highly likely to be connected in front and rear are combined and registered. Specifically, as shown in FIG. 1B, dictionary data including the reading and notation of each word is registered for each word combination. In the following, when referring to the front word / phrase, it is referred to as “connection source”, and when referring to the rear word / phrase, it is referred to as “connection destination”.

図1(b)の例では、絵文字が繋がり先となる辞書データを抜粋して示している。この種の辞書データでは、原則として、繋がり先の語句の読みが繋がり元の読みに一致する。一方、通常の文字表記による語句同士の組み合わせによる辞書データでは、たとえば、「いつも」と「お世話に」との組み合わせや、「おはよう」と「ございます」との組み合わせのように、一般に、繋がり元の読みと繋がり先の読みとが異なるものになる。   In the example of FIG. 1B, dictionary data to which pictograms are connected are extracted and shown. With this type of dictionary data, in principle, the reading of the connected phrase matches the original reading. On the other hand, in the case of dictionary data that is a combination of words in normal character notation, for example, a combination of “always” and “caregiving” or a combination of “good morning” and “you” is generally connected source The reading of and the reading of the connection will be different.

図1(c)に示すように、類語辞書15には、概念が類似する複数の語句がグループ分けされて、グループ毎に辞書データが登録される、各辞書データには、組み合わせられた語句の読みおよび表記が含まれる。   As shown in FIG. 1C, the synonym dictionary 15 groups a plurality of words and phrases having similar concepts and registers dictionary data for each group. Includes reading and notation.

変換辞書13、繋がり予測辞書14、類語辞書15に格納される辞書データは、いずれも開発者によりあらかじめ作成されたもので、使用頻度などの一部情報を除けば、原則として更新されない。これに対し、学習辞書16や非選択学習辞書17は、ユーザによる候補の選択に応じて作成された辞書データを蓄積するもので、頻繁に更新される。   The dictionary data stored in the conversion dictionary 13, the connection prediction dictionary 14, and the synonym dictionary 15 are all created in advance by the developer, and are not updated in principle except for some information such as usage frequency. On the other hand, the learning dictionary 16 and the non-selection learning dictionary 17 accumulate dictionary data created in response to selection of candidates by the user, and are frequently updated.

学習辞書16には、ユーザの選択操作に応じて確定されてアプリケーション100へ出力された語句による辞書データが、確定された順序に従って一定数まで蓄積される。この辞書データにも、確定された語句の読みや表記が含まれる。   In the learning dictionary 16, dictionary data based on phrases that are determined according to the user's selection operation and output to the application 100 are accumulated up to a certain number according to the determined order. This dictionary data also includes the reading and notation of the confirmed words.

非選択学習辞書17は、絵文字の繋がり予測候補を抽出する検索の結果を学習するためのものである。具体的には、図1(d)に示すように、確定語句とその末尾の語(末尾語)と抽出された絵文字との組み合わせ毎に、これらの読みおよび表記と絵文字の非選択回数とを含む辞書データが作成され、非選択学習辞書17に格納される。この辞書データに関連する処理や辞書データの利用の詳細に関しては後述する。   The non-selection learning dictionary 17 is used for learning the result of a search for extracting pictographic connection prediction candidates. Specifically, as shown in FIG. 1 (d), for each combination of a fixed phrase, its last word (last word), and an extracted pictogram, these readings and notations and the number of times the pictogram is not selected are calculated. Including dictionary data is created and stored in the non-selected learning dictionary 17. Details of processing related to the dictionary data and use of the dictionary data will be described later.

図2は、上記の文字入力システム1で実行される処理の概略手順を示す。以下、この図のステップ符号を参照して、各種操作に伴う処理の流れを説明する。   FIG. 2 shows a schematic procedure of processing executed by the character input system 1 described above. In the following, the flow of processing associated with various operations will be described with reference to step codes in this figure.

この処理では、毎時のキー操作を受け付けながら(ステップS1)、その操作の内容に応じた処理を実行する。
まず読みを示す仮名の入力が受け付けられた場合(ステップS2が「YES」)には、変換前の読み文字列を組み立て(ステップS6)、当該読み文字列により変換辞書13を検索し、読み文字列に前方一致する読みを有する語句を抽出して予測候補リストを作成する(ステップS7)。さらにステップS12に進んで、作成された予測候補リストを表示する。
In this process, while accepting an hourly key operation (step S1), a process corresponding to the content of the operation is executed.
First, when an input of a kana indicating reading is accepted ("YES" in step S2), a reading character string before conversion is assembled (step S6), the conversion dictionary 13 is searched using the reading character string, and the reading character is read. A prediction candidate list is created by extracting words having readings that coincide with the column (step S7). Furthermore, it progresses to step S12 and the produced prediction candidate list is displayed.

読み文字列が組み立てられている状態下で変換操作を受け付けた場合(ステップS3が「YES」)には、その読み文字列により変換辞書13および学習辞書16を検索して変換候補リストを作成し(ステップS8)、しかる後にステップS12に進んでリスト内の各候補を表示する。なお、ステップS8では、読み文字列と部分一致する語句を抽出し、抽出された語句の品詞種別に基づき読み文字列を語頭部分と語尾部分とに区分けするなどして、変換後文字列を作成する。   When a conversion operation is received in a state where the reading character string is assembled (step S3 is “YES”), the conversion dictionary 13 and the learning dictionary 16 are searched using the reading character string to create a conversion candidate list. (Step S8) After that, the process proceeds to Step S12 to display each candidate in the list. In step S8, a word / phrase partially matching the reading character string is extracted, and a converted character string is created by dividing the reading character string into a head part and a tail part based on the part of speech type of the extracted word / phrase. To do.

予測候補リストまたは変換候補リストが表示されている状態下で、リスト内のいずれかの候補が選択されると(ステップS4が「YES」)、選択された候補を確定してアプリケーション100に出力する(ステップS9)。さらに、この確定に応じて学習辞書16や非選択学習辞書17を更新し(ステップS10)、確定された語句の次に入力される語句の予測リスト(繋がり予測リスト)を作成する(ステップS11)。
この後は、ステップS12によって、繋がり予測リスト内の各候補が表示される。このリスト内の候補が選択された場合にも、ステップS4が「YES」となって、ステップS9,S10,S11,S12が順に実行される。すなわち、繋がり予測リスト内の候補が選択され、選択された語句が確定すると、繋がり予測リストの表示が更新される。
When any candidate in the list is selected in a state where the prediction candidate list or the conversion candidate list is displayed (step S4 is “YES”), the selected candidate is fixed and output to the application 100. (Step S9). Further, the learning dictionary 16 and the non-selection learning dictionary 17 are updated in accordance with the confirmation (step S10), and a prediction list (connection prediction list) of words to be input next to the confirmed words is created (step S11). .
Thereafter, in step S12, each candidate in the connection prediction list is displayed. Even when a candidate in this list is selected, step S4 becomes “YES”, and steps S9, S10, S11, and S12 are executed in order. That is, when a candidate in the connection prediction list is selected and the selected word is confirmed, the display of the connection prediction list is updated.

所定の時点で終了操作が行われると(ステップS5)、操作部の表示を消失させることにより文字入力処理を終了する。   When a termination operation is performed at a predetermined time (step S5), the character input process is terminated by erasing the display on the operation unit.

上記の手順は、従来の文字入力システムにおけるものと殆ど同じであるが、太枠で示したステップS11では、絵文字の繋がり予測候補を抽出するために、従来とは異なる内容の処理を実行する。その前のステップS10には、絵文字の繋がり予測候補の精度を高めるための学習処理が含まれる。以下、これらの処理について詳細に説明する。   The above-described procedure is almost the same as that in the conventional character input system. However, in step S11 shown by a thick frame, processing of contents different from the conventional one is executed in order to extract pictographic connection prediction candidates. The previous step S10 includes a learning process for increasing the accuracy of pictographic connection prediction candidates. Hereinafter, these processes will be described in detail.

絵文字の繋がり予測候補(以下、「絵文字候補」という。)は、繋がり予測辞書14に対する検索により抽出されるが、従来の検索では、確定語句の読みおよび表記が繋がり元に設定されている辞書データを抽出するだけである。したがって、確定語句に繋がる絵文字が登録されている場合でなければ、繋がり絵文字候補を表示することはできなかった。   Pictograph connection prediction candidates (hereinafter referred to as “pictogram candidates”) are extracted by searching the connection prediction dictionary 14, but in conventional search, dictionary data in which the reading and notation of a definite phrase are set as the connection source. Is just extracted. Therefore, unless the pictographs connected to the fixed phrase are registered, the connected pictograph candidates cannot be displayed.

これに対し、この実施例では、確定語句に繋がる絵文字が見つからなかった場合には、さらに以下の図3または図4に示す検索を実行する。
図3および図4では、文字入力画面における表示の展開を、その表示に関わる辞書データに関連づけて示している。
On the other hand, in this embodiment, when the pictograph connected to the fixed phrase is not found, the search shown in FIG. 3 or FIG. 4 is further executed.
3 and 4 show the display development on the character input screen in association with dictionary data related to the display.

図3に示す検索処理では、まず、確定語句の読みおよび表記により類語辞書15を検索して、確定語句に概念が類似する語句(以下、「類語」という。)を抽出する。そして、繋がり元の読みおよび表記が類語の読みおよび表記に完全一致する辞書データを繋がり予測辞書14から抽出する。以下、この検索を「類語一致検索」という。
類語一致検索により該当する辞書データが見つかった場合には、そのデータ内の絵文字が繋がり絵文字候補に設定される。
In the search process shown in FIG. 3, first, the synonym dictionary 15 is searched by reading and writing a fixed phrase, and a phrase (hereinafter referred to as “synonym”) similar in concept to the fixed phrase is extracted. Then, dictionary data in which the reading and notation of the connection source completely match the reading and notation of the synonym is extracted from the connection prediction dictionary 14. Hereinafter, this search is referred to as “synonymous search”.
When the corresponding dictionary data is found by the synonym match search, pictograms in the data are connected and set as pictograph candidates.

図3に示す具体例では、「おおゆき」という読み文字列の入力に対して「大雪」という単語が確定されて、その確定に応じて絵文字候補を含む繋がり予測リストが表示され(図3の(A)→(B))、絵文字候補が選択されている(図3の(C))。
この例の繋がり予測辞書14には「大雪」に直接繋がる絵文字は登録されていないが、類語辞書15に、「大雪」の類語として「雪」が登録され、繋がり予測辞書14に「雪」を繋がり元とする絵文字が登録されている。よって、類語辞書15から「大雪」の類語として「雪」を抽出し、この「雪」を用いた類語一致検索を実行することによって、「雪」を繋がり元とする絵文字を抽出した結果、図3(B)に示すような繋がり予測リストが表示される。
In the specific example shown in FIG. 3, the word “Daisetsu” is confirmed in response to the input of the reading character string “Oyuki”, and a connection prediction list including pictogram candidates is displayed according to the confirmation (in FIG. 3). (A) → (B)), a pictograph candidate is selected ((C) of FIG. 3).
In this example, the connection prediction dictionary 14 does not register a pictograph directly connected to “Daisetsu”, but “snow” is registered in the synonym dictionary 15 as a synonym of “Daisetsu”, and “snow” is stored in the connection prediction dictionary 14. The emoji used as the connection source is registered. Therefore, “snow” is extracted from the synonym dictionary 15 as a synonym of “large snow”, and a pictogram based on “snow” is extracted by executing a synonym matching search using this “snow”. A connection prediction list as shown in 3 (B) is displayed.

図4に示す検索処理では、繋がり予測辞書14内の絵文字を繋がり先とする辞書データの中から、繋がり元の読みおよび表記が確定語句の末尾の語の読みおよび表記に完全一致するものを抽出する。以下、この方法による検索を「末尾語一致検索」といい、検索のキーとなる語を「末尾語」という。
末尾語一致検索により該当する辞書データが見つかった場合には、そのデータ内の絵文字が絵文字候補に設定される。
In the search processing shown in FIG. 4, from the dictionary data whose connection destination is the pictogram in the connection prediction dictionary 14, the one whose reading and notation of the connection source completely matches the reading and notation of the word at the end of the fixed word phrase is extracted. To do. Hereinafter, a search by this method is referred to as “end word match search”, and a word serving as a search key is referred to as “end word”.
When the corresponding dictionary data is found by the tail word matching search, the pictogram in the data is set as a pictograph candidate.

図4に示す具体例では、「こなゆき」という読み文字列の入力に対して「粉雪」という単語が確定されて、その確定に応じて絵文字候補を含む繋がり予測リストが表示され(図4の(a)→(b))、絵文字候補が選択されている(図3の(c))。
この例の繋がり予測辞書14には「粉雪」に直接繋がる絵文字は登録されていないが、「粉雪」の末尾の「雪」を繋がり元とする絵文字の辞書データが含まれている。よって、「雪」をキーとする末尾語一致検索により、「雪」に繋がる絵文字を絵文字候補として抽出した結果、図4(b)に示すような繋がり予測リストが表示される。
In the specific example shown in FIG. 4, the word “powder and snow” is confirmed in response to the input of the reading character string “Konayuki”, and a connection prediction list including pictographic candidates is displayed according to the confirmation (FIG. 4). (A) → (b)), a pictograph candidate is selected ((c) of FIG. 3).
The connection prediction dictionary 14 in this example does not register pictographs directly connected to “powder snow”, but includes dictionary data of pictographs connected to “snow” at the end of “powder snow”. Therefore, as a result of extracting the pictographs connected to “snow” as the pictograph candidates by the end word match search using “snow” as a key, a connection prediction list as shown in FIG. 4B is displayed.

なお、図4の例では、確定語句が2文字構成であるため、末尾の一文字の「雪」のみが末尾語として機能するが、確定語句が3文字以上となる場合には、末尾の一文字を含む複数の文字列(先頭から見て2番目以降の文字から末尾までの文字列)を末尾語として、つながり予測辞書14に対する検索を実施してもよい。ただし,末尾語となる文字列は、それのみでも自立語として機能する必要がある。   In the example of FIG. 4, since the fixed word is composed of two characters, only the last character “snow” functions as the last word. However, when the fixed word has three or more characters, the last character is changed. A search for the connection prediction dictionary 14 may be performed using a plurality of character strings (character strings from the second character onward as viewed from the beginning to the end) as the end words. However, the character string that becomes the end word needs to function as an independent word by itself.

図3や図4の検索方法によれば、絵文字の繋がり元として登録されていない語句が確定された場合でも、その語句に近い概念を有する絵文字を抽出して、その絵文字を含む繋がり予測リストを作成することができる。これにより、通常の文字表記による語句の確定に応じて絵文字候補を含む繋がり予測リストが表示される頻度を増やし、利便性を高めることができる。   According to the search method of FIG. 3 or FIG. 4, even when a word that is not registered as a connection source of pictograms is determined, a pictogram having a concept close to that word is extracted, and a connection prediction list including the pictogram is obtained. Can be created. Thereby, the frequency with which the connection prediction list including the pictogram candidates is displayed according to the determination of the phrase by the normal character notation can be increased, and the convenience can be improved.

ただし、末尾語一致検索によると、確定語句に近いとは言えない概念の絵文字が抽出されるおそれもある。たとえば、「日本」という語句が確定した場合には、日の丸や日本地図などの絵文字が表示されるのが望ましいが、このような絵文字が「日本」に組み合わせられて繋がり予測辞書14に登録されていない場合には、「日本」の末尾語の「本」を用いた末尾語一致検索により、図1(b)の上から3番目の辞書データがヒットして、「本」の概念を表す絵文字が抽出されてしまう。   However, according to the end word match search, there is a possibility that pictograms of a concept that cannot be said to be close to a fixed word phrase are extracted. For example, when the phrase “Japan” is confirmed, it is desirable to display pictograms such as Hinomaru and a Japanese map, but such pictograms are combined with “Japan” and registered in the connection prediction dictionary 14. If there is not, the third dictionary data from the top in FIG. 1B is hit by the end word matching search using “book” as the end word of “Japan”, and the pictogram representing the concept of “book” Will be extracted.

このように、末尾語一致検索には精度面で若干の問題があるので、この実施例では、2つの方法によって、この問題に対応するようにしている。1つめの方法は、確定語句そのものを繋がり元とする辞書データを検索する処理(以下、「完全一致検索」という。)を最優先し、この完全一致検索で絵文字を抽出できない場合には類語検索を実行し、類語検索検索でも絵文字を抽出できない場合に末尾語一致検索を実行する、というものである。   Thus, since there is a slight problem in accuracy in the tail word match search, in this embodiment, this problem is dealt with by two methods. The first method gives priority to the process of searching the dictionary data based on the fixed phrase itself (hereinafter referred to as “exact match search”), and if the exact match search cannot extract pictograms, the synonym search is performed. When the pictograph cannot be extracted even by the synonym search search, the end word match search is executed.

2つめの方法は、末尾語一致検索の検索結果に対するユーザの候補選択状況を学習し、末尾語一致検索で絵文字が抽出されても、過去の同様の検索でその絵文字が選択された頻度が低い場合には、当該絵文字を絵文字候補としない、というものである。非選択学習辞書17は、この方法を実施するための学習用の辞書であって、末尾語一致検索が実施されたときの確定語句、末尾語、および抽出された絵文字の組み合わせ毎に、これらの読みおよび表記ならびに絵文字候補が選択されなかった回数(非選択回数)を含む辞書データが作成され、保存される。
変換処理部11は、末尾語一致検索を行うと、非選択学習辞書17から検索の内容に適合する辞書データを読み出し、そのデータ内の非選択回数があらかじめ定めたしきい値を下回ることを条件に、検索で抽出された絵文字を含む繋がり予測リストを作成する。一方、非選択回数がしきい値以上になる場合には、検索で抽出された絵文字を繋がり予測リストから除外する。
The second method learns the user candidate selection status for the search result of the tail word match search, and even if a pictograph is extracted by the tail word match search, the frequency at which the pictograph is selected in the same past search is low. In this case, the pictograph is not set as a pictograph candidate. The non-selection learning dictionary 17 is a learning dictionary for carrying out this method, and for each combination of a definite word, an end word, and an extracted pictogram when an end word match search is performed, Dictionary data including the number of readings and notations and the number of times that a pictograph candidate is not selected (number of times of non-selection) is created and stored.
When the conversion processing unit 11 performs a tail word matching search, the conversion processing unit 11 reads out dictionary data that matches the content of the search from the non-selection learning dictionary 17, and the number of times of non-selection in the data falls below a predetermined threshold value. In addition, a connection prediction list including pictograms extracted by the search is created. On the other hand, when the number of non-selections is equal to or greater than the threshold, the pictograms extracted by the search are connected and excluded from the prediction list.

たとえば、上記のしきい値を5回として、「日本(にほん)」という語の確定に応じてその末尾の「本(ほん)」を用いた末尾語一致検索が行われた場合、図1(d)に示す非選択学習辞書17のデータ構成によると、当該検索で抽出された絵文字の非選択回数は既にしきい値を超えているため、この絵文字は繋がり予測リストには含まれない。   For example, when the above threshold value is set to 5 times and a word match search using “book” at the end is performed in accordance with the determination of the word “Japan”, FIG. According to the data structure of the non-selection learning dictionary 17 shown in d), since the number of non-selection of pictograms extracted by the search has already exceeded the threshold value, the pictograms are not included in the connection prediction list.

上記の方法によれば、確定語句とは異なる概念の絵文字は、当初は絵文字候補として表示されるが、ユーザに選択される機会がなければ自然に淘汰され、同じ語句が確定しても絵文字候補として採用されない状態になる。よって、確定語句の概念に適合しない絵文字が絵文字候補として呼び出される状態が続くのを防ぐことができる。   According to the above method, a pictograph with a concept different from the fixed phrase is initially displayed as a candidate for the pictograph, but if there is no opportunity for the user to select it, it will be deceived naturally, and even if the same phrase is fixed, the pictograph candidate It will not be adopted as. Therefore, it is possible to prevent a situation in which a pictograph that does not conform to the concept of the fixed phrase is called as a pictograph candidate.

ただし、末尾語一致検索で抽出された絵文字の非選択回数の学習は、検索の内容が整合するもの毎に行われるので、ある確定語句に対しては繋がり予測リストから除外される絵文字であっても、他の確定語句に対しては、繋がり予測リストに含めることができる。
たとえば、「日本」という語の確定に対して、「本」の絵文字が絵文字候補として表示されない状態になったとしても、「豪華本」という語の確定に対する末尾語一致検索では、「本」の絵文字を絵文字候補として繋がり予測リストに含めることができる。
However, since the learning of the number of times of non-selection of pictograms extracted in the tail word match search is performed for each search content that matches, the pictograms that are excluded from the linked prediction list for a certain fixed phrase However, other definite words can be included in the connection prediction list.
For example, when the word “Japan” is confirmed, even if the “book” pictogram is not displayed as a candidate for the pictogram, the final word match search for the word “gorgeous book” Pictographs can be connected as pictograph candidates and included in the prediction list.

図5は、語句の確定に応じて非選択学習辞書を更新する処理の手順を示す。この処理は、図2のステップS10に含まれるものである。
最初のステップS101では、末尾語一致検索による絵文字候補が抽出されているか否かをチェックする。この絵文字候補が抽出されていない場合には、ステップS101が「NO」となり、直ちに処理終了となる。
FIG. 5 shows a procedure of processing for updating the non-selected learning dictionary in accordance with the word / phrase confirmation. This process is included in step S10 in FIG.
In the first step S101, it is checked whether or not a pictograph candidate is extracted by end word match search. If this pictograph candidate has not been extracted, step S101 is “NO”, and the process is immediately terminated.

末尾語一致検索による絵文字候補が抽出されている場合(ステップS101が「YES」)には、その検索内容に該当する辞書データが非選択学習辞書17に登録されているかどうかをチェックする(ステップS102)。辞書データが登録されていない場合(ステップS102が「NO」)には、ステップS103に進み、確定語句、検索に使用された末尾語、および抽出された絵文字の組み合わせに対する辞書データを作成し、これを非選択学習辞書17に保存する(ステップS103)。この辞書データには、確定語句、末尾語、絵文字のそれぞれの読みおよび表記が含められるほか、非選択回数として初期値の0が格納される。
末尾語一致検索の内容に該当する辞書データが既に非選択学習辞書17に登録されている場合(ステップS102が「YES」)には、ステップS103はスキップされる。
If a pictograph candidate is extracted by the tail word match search ("YES" in step S101), it is checked whether dictionary data corresponding to the search content is registered in the non-selection learning dictionary 17 (step S102). ). If the dictionary data is not registered (“NO” in step S102), the process proceeds to step S103, and dictionary data is created for the combination of the fixed word / phrase, the last word used for the search, and the extracted pictogram. Is stored in the non-selection learning dictionary 17 (step S103). The dictionary data includes readings and notations of each of the definite words, end words, and pictograms, and stores an initial value of 0 as the number of non-selections.
If dictionary data corresponding to the content of the tail word match search has already been registered in the non-selection learning dictionary 17 (step S102 is “YES”), step S103 is skipped.

つぎに、ステップS104では、末尾語一致検索により抽出された絵文字候補が選択されたか否かをチェックする。絵文字候補が選択されていない場合(ステップS104が「NO」)には、ステップS105に進み、非選択学習辞書17内の検索内容に該当する辞書データの非選択回数を1つ増やす。一方、絵文字候補が選択された場合(ステップS104が「YES」)には、非選択学習辞書17内の検索内容に該当するデータの非選択回数をゼロクリアする。   Next, in step S104, it is checked whether a pictograph candidate extracted by the end word match search is selected. If a pictograph candidate has not been selected (“NO” at step S104), the process proceeds to step S105, and the number of times of non-selection of dictionary data corresponding to the search contents in the non-selection learning dictionary 17 is increased by one. On the other hand, when a pictograph candidate is selected (step S104 is “YES”), the number of times of non-selection of data corresponding to the search contents in the non-selection learning dictionary 17 is cleared to zero.

図6は、繋がり予測リストの作成に関する処理の手順(図2のステップS11の詳細)を示す。
最初のステップS201では、繋がり予測辞書14および学習辞書16を対象に、確定語句の読みおよび表記による検索を実行して、通常の文字表記による候補を含む繋がり予測リストを作成する。
FIG. 6 shows a processing procedure (details of step S11 in FIG. 2) regarding the creation of the connection prediction list.
In the first step S201, the connection prediction dictionary 14 and the learning dictionary 16 are subjected to a search by reading and writing a definite phrase, and a connection prediction list including candidates by normal character notation is created.

ステップS202〜S212は、絵文字による繋がり予測候補を抽出するための処理に相当する。まず、ステップS202では、確定語句による完全一致検索を実行し、この検索により絵文字が見つかった場合(ステップS203)には、抽出された絵文字を繋がり予測リストに追加する(ステップS212)。   Steps S202 to S212 correspond to processing for extracting connection prediction candidates using pictograms. First, in step S202, an exact match search using a fixed word is executed, and when a pictograph is found by this search (step S203), the extracted pictograph is added to the linked prediction list (step S212).

完全一致検索では絵文字が見つからなかった場合(ステップS203が「NO」)には類語辞書15を検索して、確定語句に対する類語を抽出する(ステップS204)。この検索で類語が見つかると(ステップS205が「YES」)、当該類語を用いた類語一致検索を実行する(ステップS206)。この検索により絵文字が見つかった場合(ステップS207が「YES」)には、ステップS212に進み、抽出された絵文字を繋がり予測リストに追加する。   If no pictogram is found in the exact match search (step S203 is “NO”), the synonym dictionary 15 is searched to extract a synonym for the confirmed phrase (step S204). If a synonym is found by this search (“YES” in step S205), a synonym match search using the synonym is executed (step S206). If a pictograph is found by this search (“YES” in step S207), the process proceeds to step S212, and the extracted pictograph is added to the connection prediction list.

確定語句に対する類語が見つからなかった場合(ステップS205が「NO」)、または類語は見つかったがその類語に繋がる絵文字が見つからなかった場合(ステップS207が「NO」)には、確定語句の末尾語を用いて末尾語一致検索を実行する(ステップS208)。この検索で絵文字が抽出された場合(ステップS209が「YES」)には、確定語句、検索に用いた末尾語、および抽出された絵文字の組み合わせにより非選択学習辞書17を検索し、当該組み合わせに対応する非選択回数を取得する(ステップS210)。この非選択回数がしきい値を下回る場合(ステップS211が「YES」)には、ステップS212に進み、抽出された絵文字を繋がり予測リストに追加する。   If no synonym for the fixed phrase is found (“NO” in step S205), or if a synonym is found but no pictograph connected to the synonym is found (“NO” in step S207), the final word of the fixed phrase Is used to execute the end word match search (step S208). When pictograms are extracted by this search (“YES” in step S209), the non-selection learning dictionary 17 is searched by a combination of the fixed phrase, the last word used for the search, and the extracted pictograms. The corresponding number of non-selections is acquired (step S210). If the number of times of non-selection is less than the threshold (step S211 is “YES”), the process proceeds to step S212, and the extracted pictogram is connected and added to the prediction list.

上記のとおり、完全一致検索、類語一致検索、末尾語一致検索のいずれかにより絵文字を抽出すると、その絵文字を繋がり予測リストに追加する処理(ステップS212)を実行し、その後にステップS213に進む。またいずれの検索でも絵文字が抽出されなかった場合(ステップS209が「NO」)や、最後の末尾語検索により絵文字が抽出されたがステップS210で取得した非選択回数がしきい値に達している場合(ステップS211が「NO」)には、ステップS212を実行せずにステップS213に進む。
ステップS213では、文字表記による候補を含む全候補を対象に、繋がり予測リスト内で重複している候補を統合したり、優先順位を整理するなどの処理を実行する。このステップS213の終了をもって繋がり予測リストの作成処理は終了し、作成されたリストを表示する処理(図2のステップS12)に進むことになる。
As described above, when pictographs are extracted by any one of the complete match search, the synonym match search, and the end word match search, a process of connecting the pictographs to the prediction list (step S212) is executed, and then the process proceeds to step S213. In addition, when no pictograph is extracted in any of the searches (“NO” in step S209), or the pictograph is extracted by the last word search, the number of non-selection acquired in step S210 has reached the threshold value. In the case (“NO” in step S211), the process proceeds to step S213 without executing step S212.
In step S213, for all candidates including candidates in character notation, processing such as integrating candidates overlapping in the connection prediction list and organizing priorities is executed. The connection prediction list creation process ends with the end of step S213, and the process proceeds to a process of displaying the created list (step S12 in FIG. 2).

なお、上記の実施例では、完全一致検索、類語一致検索、末尾語一致検索の順に優先順位を設定し、優先度の高い検索で絵文字が抽出された場合には他の検索を実施しないようにしたが、アルゴリズムはこれに限定されるものではない。たとえば、3種類の検索を全て実行してもよい。ただし、各検索で抽出された絵文字を、優先度の高い検索で抽出されたものが上位になるようにして表示するのが望ましい。   In the above embodiment, priorities are set in the order of exact match search, synonym match search, and end word match search, and when a pictograph is extracted in a search with high priority, no other search is performed. However, the algorithm is not limited to this. For example, all three types of searches may be executed. However, it is desirable to display the pictograms extracted by each search so that the ones extracted by the high priority search are higher.

末尾語一致検索により抽出された絵文字の取扱いについて、上記実施例では、非選択回数がしきい値を超えた場合には予測候補リストから除外するようにしたが、反対に絵文字候補の選択回数を計数し、選択回数がしきい値以下の絵文字を予測候補リストから除外してもよい。   Regarding the handling of pictograms extracted by tail word matching search, in the above embodiment, when the number of non-selection exceeds the threshold value, it is excluded from the prediction candidate list. Counting and pictograms for which the number of selections is equal to or less than a threshold value may be excluded from the prediction candidate list.

ただし、選択頻度の低い絵文字であっても繋がり予測リストから除外せずに、順位を下げてリストに残すようにしてもよい。たとえば、非選択回数が所定値以下のときは繋がり予測リストの上位に設定し、非選択回数が所定値を超えた後は、回数が多くなるにつれて順位を下げるようにしてもよい。   However, even pictograms with a low selection frequency may be left in the list by lowering the rank without being excluded from the connection prediction list. For example, when the number of non-selections is less than or equal to a predetermined value, the rank may be set higher in the connection prediction list, and after the number of non-selections exceeds a predetermined value, the rank may be lowered as the number increases.

また、末尾語一致検索に代えて、または末尾語一致検索と共に、確定された語句の先頭部分に対応する絵文字を抽出する検索を実行してもよい。この検索によって、たとえば「桜吹雪」という語が確定されたことに応じて「桜」に対応づけられた絵文字を表示したり、「本屋」という語が確定されたことに応じて「本」に対応づけられた絵文字を表示することが可能になる。   Further, instead of the end word match search or together with the end word match search, a search for extracting a pictograph corresponding to the head portion of the confirmed phrase may be executed. By this search, for example, a pictogram associated with “Sakura” is displayed when the word “Sakura Fubuki” is confirmed, or “Book” is displayed when the word “Bookstore” is confirmed. It is possible to display the associated pictogram.

また、上記実施例では、末尾語一致検索で抽出された絵文字のみに対して、過去の学習履歴に基づき絵文字候補として採用するか否かを判定しているが、類語一致検索や完全一致検索により抽出された絵文字についても、同様の学習や判定を行うようにしてもよい。このようにすれば、ユーザが絵文字を利用する習慣がない場合には、繋がり予測リストに絵文字候補が含まれる頻度を削減し、通常の文字表記による候補が表示されやすい状態にすることができる。   In the above embodiment, only the pictograms extracted by the tail word match search are determined based on the past learning history as to whether or not to adopt them as pictogram candidates. Similar learning and determination may be performed on the extracted pictograms. In this way, when the user has no habit of using pictograms, it is possible to reduce the frequency at which pictogram candidates are included in the connection prediction list, and to easily display candidates in normal text notation.

上記実施例の文字入力システム1は、専用のプログラムをインストールすることによって、情報処理装置内に設定される。ただし、装置内に既存の文字入力システムが存在し、繋がり予測辞書内に絵文字を繋がり先とする辞書データが複数登録されている場合には、図5および図6の処理を行うためのアップデート用のプログラムをインストールしてもよい。
また、繋がり予測辞書14を、通常の文字表記を繋がり先とする辞書ファイルと絵文字を繋がり先とする辞書ファイルとに分けて保存してもよい。
The character input system 1 of the above embodiment is set in the information processing apparatus by installing a dedicated program. However, if there is an existing character input system in the apparatus and a plurality of dictionary data to which pictograms are connected are registered in the connection prediction dictionary, an update for performing the processing of FIG. 5 and FIG. You may install the program.
Further, the connection prediction dictionary 14 may be stored separately into a dictionary file having a normal character notation as a connection destination and a dictionary file having a pictogram as a connection destination.

最後に、上記の文字入力システム1は、携帯型の情報処理装置に限らず、据え置き型の装置(ディスプレイ装置やファクシミリなど)に組み込むこともできる。またパーソナルコンピュータにも適用することが可能である。また、入力対象の言語は日本語に限らず、英語などの他の言語の入力にも、同様の構成のシステムにより対応することができる。   Finally, the character input system 1 is not limited to a portable information processing apparatus, but can be incorporated in a stationary apparatus (such as a display apparatus or a facsimile). It can also be applied to a personal computer. Further, the input target language is not limited to Japanese, and input of other languages such as English can be handled by a system having the same configuration.

1 文字入力システム
10 ユーザインタフェース
11 変換処理部
12 確定処理部
13 変換辞書
14 繋がり予測辞書
15 類語辞書
16 学習辞書
17 非選択学習辞書
100 アプリケーション
DESCRIPTION OF SYMBOLS 1 Character input system 10 User interface 11 Conversion process part 12 Confirmation process part 13 Conversion dictionary 14 Connection prediction dictionary 15 Synonym dictionary 16 Learning dictionary 17 Non-selection learning dictionary 100 Application

Claims (4)

複数の語句がそれぞれの繋がり関係に紐付けられて登録された辞書を、入力対象の語句が確定されたことに応じて検索して、前記確定された語句に続いて入力される語句の候補を抽出し、抽出された候補のリストを表示する予測手段と、表示されたリスト内の一候補を選択する操作に応じて選択された候補を確定して出力する候補確定手段とを含む文字入力装置としてコンピュータを機能させるためのプログラムであって、
前記予測手段は、複数の絵文字がそれぞれの絵文字に対応する概念の語句に対応づけられて登録された絵文字予測辞書を前記検索の対象に含めて、当該検索により抽出された絵文字を前記リストに含めるものであり、入力対象として確定された語句に対応づけられている絵文字を前記絵文字予測辞書から抽出する機能と、前記入力対象として確定された語句の末尾または先頭の文字列に対応づけられている絵文字を前記絵文字予測辞書から抽出する機能とを具備する、ことを特徴とする文字入力用のプログラム。
A dictionary in which a plurality of words are registered in association with each connection relationship is searched according to the confirmation of the input target word, and candidate words to be input subsequent to the determined word are obtained. A character input device comprising: a prediction unit that extracts and displays a list of extracted candidates; and a candidate determination unit that determines and outputs a candidate selected according to an operation of selecting one candidate in the displayed list As a program for causing a computer to function as
The prediction means includes a pictographic prediction dictionary in which a plurality of pictographs are registered in association with concept words corresponding to the pictographs, and includes the pictographs extracted by the search in the list. And a function for extracting a pictograph associated with a word determined as an input target from the pictographic prediction dictionary and a character string at the end or top of the word determined as the input target A program for character input comprising a function of extracting a pictograph from the pictograph prediction dictionary .
前記予測手段は、類似する概念の語句の組み合わせが複数組登録された類語辞書および前記絵文字予測辞書に対する検索によって、前記確定された語句に類似する概念を有する語句に対応づけられている絵文字を抽出する機能を、さらに具備する請求項1に記載された文字入力用のプログラム。 The predicting means extracts pictograms associated with a phrase having a concept similar to the confirmed phrase by searching for a synonym dictionary in which a plurality of combinations of phrases of similar concepts are registered and the pictogram prediction dictionary The character input program according to claim 1 , further comprising a function of 前記候補確定手段は、前記リスト内の候補のうち、入力対象として確定された語句の形態の一部分に対応する絵文字の候補が選択された頻度、または当該絵文字の候補が選択されなかった頻度を、前記絵文字予測辞書で当該絵文字に対応づけられている語句と前記確定された語句との組み合わせに対応づけて学習する学習手段が含まれており、
前記予測手段は、前記絵文字予測辞書に対する検索により、入力対象として確定された語句の形態の一部分に対応する絵文字を抽出したとき、その絵文字に対応する語句と前記確定された語句との組み合わせに対応づけて学習されている前記頻度に基づき、当該絵文字を前記リストに含めるか否かを判定する、請求項1または2に記載された文字入力用のプログラム。
The candidate confirming means is a frequency at which a pictogram candidate corresponding to a part of a form of a phrase that has been confirmed as an input target is selected from the candidates in the list, or a frequency at which the pictogram candidate is not selected. Learning means for learning in association with a combination of a phrase that is associated with the pictogram in the pictogram prediction dictionary and the determined phrase;
When the predicting means extracts a pictograph corresponding to a part of the form of the phrase determined as an input target by searching the pictographic prediction dictionary, it corresponds to a combination of the phrase corresponding to the pictograph and the determined phrase. association based on the frequency that is learned, it is determined whether inclusion of the pictogram in the list, according to claim 1 or character program for input as described in 2.
複数の語句がそれぞれの繋がり関係に紐付けられて登録された辞書と、入力対象の語句が確定されたことに応じて前記辞書を検索して、前記確定された語句に続いて入力される語句の候補を抽出し、抽出された候補のリストを表示する予測手段と、表示されたリスト内の一候補を選択する操作に応じて選択された候補を確定して出力する候補確定手段とを備えた情報処理装置であって、
前記辞書には、複数の絵文字がそれぞれその絵文字に対応する概念の語句に対応づけられて登録された絵文字予測辞書が含まれており、
前記予測手段は、前記絵文字予測辞書に対する検索によって抽出された絵文字を前記リストに含めるものであり、入力対象として確定された語句に対応づけられている絵文字を前記絵文字予測辞書から抽出する機能と、前記入力対象として確定された語句の末尾または先頭の文字列に対応づけられている絵文字を前記絵文字予測辞書から抽出する機能とを具備する、ことを特徴とする情報処理装置。
A dictionary in which a plurality of words are registered in association with each connection relationship, and a word that is input following the confirmed word by searching the dictionary in response to confirmation of the word to be input A predictor that extracts a candidate and displays a list of extracted candidates, and a candidate determiner that determines and outputs a candidate selected according to an operation of selecting one candidate in the displayed list. An information processing apparatus,
The dictionary includes a pictogram prediction dictionary in which a plurality of pictograms are registered in association with concept words corresponding to the pictograms, respectively.
The predicting means includes a pictogram extracted by searching the pictogram prediction dictionary in the list, and extracts a pictogram associated with a word / phrase determined as an input target from the pictogram prediction dictionary; An information processing apparatus comprising: a function of extracting a pictograph associated with a character string at the end or top of a word determined as the input target from the pictographic prediction dictionary .
JP2011286600A 2011-12-27 2011-12-27 Character input program and information processing apparatus Active JP5849690B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011286600A JP5849690B2 (en) 2011-12-27 2011-12-27 Character input program and information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011286600A JP5849690B2 (en) 2011-12-27 2011-12-27 Character input program and information processing apparatus

Publications (2)

Publication Number Publication Date
JP2013134730A JP2013134730A (en) 2013-07-08
JP5849690B2 true JP5849690B2 (en) 2016-02-03

Family

ID=48911349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011286600A Active JP5849690B2 (en) 2011-12-27 2011-12-27 Character input program and information processing apparatus

Country Status (1)

Country Link
JP (1) JP5849690B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6342194B2 (en) * 2014-03-28 2018-06-13 株式会社東芝 Electronic device, method and program
CN111259209B (en) * 2020-01-10 2023-12-29 平安科技(深圳)有限公司 User intention prediction method based on artificial intelligence, electronic device and storage medium

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003178061A (en) * 2001-12-11 2003-06-27 Sony Corp Information processing device and method therefor, and program
JP4232093B2 (en) * 2003-06-30 2009-03-04 日本電気株式会社 Emoticon input system and method using multiple search methods
JP4241423B2 (en) * 2004-02-18 2009-03-18 株式会社東芝 Writing device
JP5181502B2 (en) * 2007-03-14 2013-04-10 日本電気株式会社 Character processing apparatus, character processing method and program
JP2009015743A (en) * 2007-07-09 2009-01-22 Fujifilm Corp Document creation support system, document creation support method, and document creation support program
JP5475221B2 (en) * 2007-07-09 2014-04-16 株式会社キングジム Character input device and tape printer
JP5337441B2 (en) * 2008-09-29 2013-11-06 京セラ株式会社 Portable electronic devices
JP2011209914A (en) * 2010-03-29 2011-10-20 Ntt Docomo Inc Device and method for distribution of dictionary data

Also Published As

Publication number Publication date
JP2013134730A (en) 2013-07-08

Similar Documents

Publication Publication Date Title
AU2012227212B2 (en) Consolidating speech recognition results
JP3983265B1 (en) Dictionary creation support system, method and program
KR20160105400A (en) System and method for inputting text into electronic devices
US20130041890A1 (en) Method for displaying candidate in character input, character inputting program, and character input apparatus
JP4655109B2 (en) CHARACTER INPUT PROGRAM, CHARACTER INPUT DEVICE, AND CHARACTER INPUT METHOD
US20160110339A1 (en) Information processing apparatus, information processing method, and program
JP6417649B2 (en) Text processing device, text display system, program
US20150058011A1 (en) Information processing apparatus, information updating method and computer-readable storage medium
JP2008225602A (en) Pictogram search apparatus, system and method
JP5849690B2 (en) Character input program and information processing apparatus
JPH08314910A (en) Different kind of code character string transcribing device and electronic dictionary
JP2004326367A (en) Text analysis device, text analysis method and text audio synthesis device
JP5672357B2 (en) Electronic device and program
JP2019095603A (en) Information generation program, word extraction program, information processing device, information generation method and word extraction method
JP6221275B2 (en) Character input program and character input device
JP6805206B2 (en) Search word suggestion device, expression information creation method, and expression information creation program
JP5428622B2 (en) Electronic device and program
JP5583230B2 (en) Information search apparatus and information search method
JP5474723B2 (en) Speech recognition apparatus and control program therefor
JP5621145B2 (en) Document check device, document check program, and document check method
CN113924573A (en) Translation device
JP5573257B2 (en) Character input program and communication terminal device
JP5849675B2 (en) Character input program and information processing apparatus
KR101447388B1 (en) Method of automatic word suggestion generation system to transcribe Korean characters into Latin script on input software
CN113268984A (en) Text processing method and device, storage medium and electronic equipment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150616

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150805

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151117

R150 Certificate of patent or registration of utility model

Ref document number: 5849690

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250