JP2011210001A - Information processing apparatus, conversion candidate extraction method, and program - Google Patents
Information processing apparatus, conversion candidate extraction method, and program Download PDFInfo
- Publication number
- JP2011210001A JP2011210001A JP2010076945A JP2010076945A JP2011210001A JP 2011210001 A JP2011210001 A JP 2011210001A JP 2010076945 A JP2010076945 A JP 2010076945A JP 2010076945 A JP2010076945 A JP 2010076945A JP 2011210001 A JP2011210001 A JP 2011210001A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- conversion
- kana
- index
- roman
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 285
- 230000010365 information processing Effects 0.000 title claims abstract description 80
- 238000000605 extraction Methods 0.000 title claims abstract description 38
- 240000000220 Panda oleosa Species 0.000 claims abstract description 180
- 235000016496 Panda oleosa Nutrition 0.000 claims abstract description 180
- 239000000284 extract Substances 0.000 claims abstract description 18
- 238000004891 communication Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 238000000034 method Methods 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 238000010295 mobile communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
Images
Abstract
Description
本発明は、入力されたローマ字列を取得して、該ローマ字列に対応する変換候補を抽出する情報を検索する情報処理装置に関する。 The present invention relates to an information processing apparatus that acquires an input Roman character string and searches for information for extracting conversion candidates corresponding to the Roman character string.
従来、パーソナルコンピューター等のクライアント端末を用いて、文書を作成する場合、所定の単語について、読みの先頭の数文字を入力すると、該当する候補の単語を表示することにより、ユーザの入力を支援する入力支援方法が用いられている。
例えば、仮名文字からなる文字列と、該文字列に対応する変換後の候補である変換後文字列とを対応付けたインデックスを作成するとともに、ユーザにより入力された仮名文字からなる文字列を解析する入力支援方法が知られている(例えば、特許文献1)。このような入力支援方法によれば、ユーザにより入力された仮名文字からなる文字列を解析し、候補となる漢字等の文字列を表示することで、ユーザの入力を支援できる。
Conventionally, when a document is created by using a client terminal such as a personal computer, when the first few characters of reading are input for a predetermined word, the corresponding candidate word is displayed to assist the user's input. An input support method is used.
For example, an index that associates a character string composed of kana characters with a converted character string that is a candidate after conversion corresponding to the character string is created, and a character string composed of kana characters input by the user is analyzed An input support method is known (for example, Patent Document 1). According to such an input support method, the user's input can be supported by analyzing a character string composed of kana characters inputted by the user and displaying candidate character strings such as kanji.
しかしながら、上述した従来の入力支援方法には、次のような問題があった。すなわち、上述した入力支援方法では、クライアント端末の不具合や、ユーザの操作ミス等、仮名漢字変換モードに切り替えることなくローマ字からなる文字列が入力された場合、候補となる文字列を表示することができないという問題がある。
これに対し、ローマ字からなる文字列に入力候補を対応付けたインデックスを作成するという手法も考えられるが、ローマ字からの仮名変換規則には複数の規格があるため、全ての規格を網羅したインデックスを作成すると、データ量が膨大となるという問題がある。
However, the above-described conventional input support method has the following problems. That is, in the input support method described above, when a character string composed of Roman characters is input without switching to the kana-kanji conversion mode, such as a malfunction of the client terminal or a user operation error, a candidate character string can be displayed. There is a problem that you can not.
On the other hand, a method of creating an index that associates input candidates with a character string consisting of Roman characters is also conceivable, but since there are multiple standards for kana conversion rules from Roman characters, an index that covers all the standards is used. If created, there is a problem that the amount of data becomes enormous.
そこで、本発明は、このような状況に鑑みてなされたものであり、インデックスを膨大化させることなく、ローマ字からなる入力に対する変換候補の出力を実現することを目的とする。 Therefore, the present invention has been made in view of such a situation, and an object of the present invention is to realize conversion candidate output for input composed of Roman characters without enlarging an index.
上述した問題を解決するため、本発明は、次のような特徴を有している。まず、本発明の第1の特徴は、入力されたローマ字列(ローマ字列153)を取得して、該ローマ字列に対応する変換候補(仮名漢字変換候補170又はローマ字変換候補171)を抽出する情報処理装置(情報処理装置100)であって、1文字以上の仮名からなる仮名文字列(仮名文字列163)と、該仮名文字列の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列(変換不可文字列165)とからなるインデックス(ローマ字対応インデックス161)と、前記インデックスに対応する変換候補(ローマ字変換候補171)とを記憶する記憶手段(ローマ字対応インデックス記憶部113)と、前記入力された一連のローマ字列を該ローマ字列の前方から仮名変換規則に基づいて仮名変換する仮名変換手段(仮名変換部107)と、前記仮名変換手段に変換された文字列に基づいて、前記記憶手段から前記インデックスを検索し、検索された該インデックスに対応する前記変換候補を前記記憶手段から抽出する抽出手段(入力候補インデックス抽出部103)と、を備えることを要旨とする。
In order to solve the problems described above, the present invention has the following features. First, the first feature of the present invention is that information that acquires an input Roman character string (Roman character string 153) and extracts a conversion candidate (kana-kanji
このような情報処理装置は、記憶手段と、仮名変換手段と、抽出手段とを備える。仮名変換手段は、入力された一連のローマ字列を仮名変換規則に基づいて仮名変換する。すなわち、仮名変換手段は、複数の規格による異なる入力規則で入力されたローマ字列を仮名変換する。 Such an information processing apparatus includes a storage unit, a kana conversion unit, and an extraction unit. The kana conversion means converts the input series of Roman characters into a kana based on a kana conversion rule. That is, the kana conversion means performs kana conversion of a Roman character string input according to different input rules according to a plurality of standards.
記憶手段は、1文字以上の仮名からなる仮名文字列と、仮名文字列の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列とからなるインデックスと、インデックスに対応する変換候補とを記憶する。
すなわち、記憶手段は、仮名変換手段に変換された文字列をインデックスとして記憶するとともに、インデックスに対応する変換候補を記憶する。
The storage means includes a kana character string composed of one or more kana characters, an index composed of one or more roman character strings that follow the kana character string and do not satisfy the kana conversion rules, and conversion candidates corresponding to the indexes. Remember.
That is, the storage unit stores the character string converted by the kana conversion unit as an index and stores conversion candidates corresponding to the index.
このため、記憶手段は、ローマ字入力の全ての規格を網羅するためにデータ量を膨大にすることなく、ローマ字からなる文字列に入力候補を対応付けたインデックスを記憶できる。 For this reason, the storage means can store an index in which input candidates are associated with character strings composed of Roman characters without enlarging the amount of data in order to cover all the standards of Roman character input.
また、抽出手段は、仮名変換手段に変換された文字列に基づいて、記憶手段からインデックスを検索し、検索された該インデックスに対応する変換候補を記憶手段から抽出する。 Further, the extraction means searches the index from the storage means based on the character string converted by the kana conversion means, and extracts the conversion candidates corresponding to the searched index from the storage means.
このインデックスにより、異なる入力規則によって入力されたローマ字列が入力された場合でも、情報処理装置は、変換候補を出力することができる。従って、情報処理装置は、インデックスを膨大化させることなくローマ字からなる入力に対する変換候補の出力を実現することができる。 With this index, the information processing apparatus can output conversion candidates even when a Roman character string input according to different input rules is input. Therefore, the information processing apparatus can realize conversion candidate output for input composed of Roman characters without enlarging the index.
本発明の第2の特徴は、本発明の第1の特徴に係り、予め登録された文字列(クエリ151)をローマ字変換規則に基づいて、ローマ字列に変換するローマ字変換手段(ローマ字変換部121)と、前記ローマ字変換手段により変換されたローマ字列を先頭から任意の位置で区切り、前記区切った位置までのローマ字列を仮名変換規則に基づいて変換することで、前記インデックスを作成するインデックス作成手段(インデックス作成部125)と、を更に備え、前記記憶手段は、前記予め登録された文字列を変換候補として、前記インデックス作成手段により作成されたインデックスに対応させて記憶することを要旨とする。 The second feature of the present invention relates to the first feature of the present invention, and is a Roman character conversion means (Roman character conversion unit 121) for converting a pre-registered character string (query 151) into a Roman character string based on a Roman character conversion rule. And the Roman character string converted by the Roman character conversion means at an arbitrary position from the beginning, and the Roman character string up to the divided position is converted based on a kana conversion rule, thereby creating the index. (Index creation unit 125), and the storage unit stores the previously registered character string as a conversion candidate in association with the index created by the index creation unit.
本発明の第3の特徴は、本発明の第2の特徴に係り、前記ローマ字変換手段は、変換規則が異なる複数のローマ字変換規則それぞれに基づいて、前記入力された文字列(クエリ151)をローマ字列(例えば、ローマ字列候補157a、ローマ字列候補157b、ローマ字列候補157n)に変換することを要旨とする。
A third feature of the present invention relates to the second feature of the present invention, in which the Roman character conversion means converts the input character string (query 151) based on each of a plurality of Roman character conversion rules having different conversion rules. The gist is to convert it into a Roman character string (for example, a Roman
本発明の第4の特徴は、本発明の第1乃至第3の特徴に係り、前記記憶手段は、入力されたクエリを変換候補として記憶することを要旨とする。 A fourth feature of the present invention relates to the first to third features of the present invention, and is summarized in that the storage unit stores an input query as a conversion candidate.
本発明の第5の特徴は、入力されたローマ字列を取得して、該ローマ字列に対応する変換候補を抽出するコンピュータの変換候補抽出方法であって、コンピュータが、前記入力された一連のローマ字列を該ローマ字列の前方から仮名変換規則に基づいて仮名変換するステップ(ステップS305)と、コンピュータが、前記変換された文字列に基づいて、1文字以上の仮名からなる仮名文字列と、該仮名文字列の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列とからなるインデックスと、前記インデックスに対応する変換候補とを記憶する記憶手段から前記インデックスを検索し、検索された該インデックスに対応する前記変換候補を前記記憶手段から抽出するステップ(ステップS311)と、を備えることを要旨とする。 According to a fifth aspect of the present invention, there is provided a conversion candidate extraction method for a computer that acquires an input Roman character string and extracts conversion candidates corresponding to the Roman character string, wherein the computer performs the input series of Roman characters. A step of converting a string from the front of the Roman character string based on a kana conversion rule (step S305), and a computer, based on the converted character string, a kana character string consisting of one or more kana characters, The index is searched from storage means for storing an index consisting of one or more Roman characters that follow the kana character string and does not satisfy the kana conversion rule, and conversion candidates corresponding to the index, and the searched Extracting the conversion candidate corresponding to the index from the storage unit (step S311). To.
本発明の第6の特徴は、入力されたローマ字列を取得して、該ローマ字列に対応する変換候補を抽出するプログラムであって、1文字以上の仮名からなる仮名文字列と、該仮名文字列の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列とからなるインデックスと、前記インデックスに対応する変換候補とを記憶するステップと、前記入力された一連のローマ字列を該ローマ字列の前方から仮名変換規則に基づいて仮名変換するステップと、前記仮名変換手段に変換された文字列に基づいて、前記記憶手段から前記インデックスを検索し、検索された該インデックスに対応する前記変換候補を前記記憶手段から抽出するステップと、をコンピュータに実行させることを要旨とする。 A sixth feature of the present invention is a program for acquiring an input Roman character string and extracting conversion candidates corresponding to the Roman character string, the kana character string consisting of one or more kana characters, and the kana character A step of storing an index consisting of one or more Roman character strings that follow the sequence and do not satisfy the kana conversion rule, and conversion candidates corresponding to the index; and the input sequence of Roman characters A kana conversion step from the front of the kana conversion rule based on the kana conversion rule, and the index is searched from the storage unit based on the character string converted by the kana conversion unit, and the conversion candidate corresponding to the searched index And a step of causing a computer to execute the step of extracting the information from the storage means.
本発明によれば、インデックスを膨大化させることなく、ローマ字からなる入力に対する変換候補の出力を実現できる。 According to the present invention, it is possible to realize conversion candidate output for input composed of Roman characters without enlarging the index.
次に、図面を参照して、本発明の実施形態について説明する。 Next, embodiments of the present invention will be described with reference to the drawings.
なお、以下の図面の記載において、同一または類似の部分には、同一または類似の符号を付している。また、図面は模式的なものであり、各寸法の比率などは現実のものとは異なる。 In the following description of the drawings, the same or similar parts are denoted by the same or similar reference numerals. Further, the drawings are schematic, and the ratio of each dimension is different from the actual one.
したがって、具体的な寸法などは以下の説明を参酌して判断すればよく、図面相互間においても互いの寸法の関係や比率が異なる部分が含まれている。 Therefore, specific dimensions and the like may be determined in consideration of the following description, and include portions where the relationship and ratio of the dimensions are different between the drawings.
以下の実施形態においては、(1)情報処理システム1の全体構成、(2)情報処理装置100の詳細構成、(3)情報処理システム1の動作、(5)作用・効果、及び(6)その他の実施形態について説明する。
In the following embodiments, (1) the overall configuration of the information processing system 1, (2) the detailed configuration of the
(1)情報処理システム1の全体構成
図1は、本実施形態に係る情報処理システム1の全体概略構成図である。
(1) Overall Configuration of Information Processing System 1 FIG. 1 is an overall schematic configuration diagram of an information processing system 1 according to this embodiment.
図1に示す情報処理システム1は、ユーザ端末10、ユーザ端末30、情報処理装置100を含む。本実施形態では、ユーザ端末10、ユーザ端末30、情報処理装置100が、通信ネットワーク50(インターネットなど)を介して接続され、互いにデータ通信可能となっている。
An information processing system 1 illustrated in FIG. 1 includes a
本実施形態では、ユーザ端末10が、携帯通信端末装置であり、ユーザ端末30が、いわゆるPCである点を除き、ユーザ端末10及びユーザ端末30は、同様の機能を有しており、以下の記載においては、主にユーザ端末10について、記載する。従って、ユーザ端末30についてもユーザ端末10と同様の機能を有しているが、詳細の記載は、適宜省略する。
In the present embodiment, the
情報処理システム1は、ユーザ端末10、ユーザ端末30と、情報処理装置100との間で、クエリ151、ローマ字変換候補171、検索ページの受け渡しを行う。
The information processing system 1 exchanges the
情報処理装置100は、クエリ151としてユーザ端末10から入力されたローマ字列153を取得して、該ローマ字列153に対応する仮名漢字変換候補170又はローマ字変換候補171を抽出して、ユーザ端末10に送信する。以下の実施形態では、「yuubin」というローマ字列153からなるクエリ151に基づいて、ローマ字列153に対応するローマ字変換候補171として、「郵便番号」、「郵便局」、「郵便」、「郵便料金」を抽出するものとして、具体例を記載する。
The
ユーザ端末10は、通信ネットワーク50を介して、情報処理装置100から検索ページを取得する装置である。ユーザ端末10は、ユーザが使用するPC(Personal Computer)や携帯通信端末装置(携帯電話機やスマートフォン)、カーナビゲーションシステム等であり、無線LANや、近傍無線通信(Bluetooth(登録商標)や赤外線通信等)或いは有線通信(USB(Universal Serial Bus)ケーブル接続等)によって、通信ネットワーク50を介して情報処理装置100に接続されている。ユーザ端末10は、情報処理装置100が有するハードウェア資源に加えて、キーボタンやタッチパネル等の入力装置、液晶ディスプレイ等の出力装置、一般的なブラウザを備える。ブラウザは、インターネットの標準プロトコルであるHTTP(Hyper Text Transfer Protocol)等に従い、HTML(Hyper Text Markup Language)等の言語で記述されたページデータの要求、取得及び表示、フォームデータの送信等を行う機能を有している。
The
ユーザ端末10では、ユーザから文字・数字等がクエリ151として入力されるクエリ入力欄260(図2参照)と、クエリ入力欄260のクエリに基づいた検索を実行するための検索ボタン270(図2参照)と、ローマ字変換候補171をユーザに表示する変換候補欄280とが少なくとも表示される。ユーザ端末10は、ユーザのクエリ入力欄260への入力に基づいて、逐次入力中のクエリ151を情報処理装置100へ送信する。ユーザ端末10は、ユーザの検索ボタン270への操作に伴って、クエリ151を情報処理装置100へ送信してもよい。このユーザ端末10がクエリ入力欄260に入力されたクエリを逐次情報処理装置100に送信する処理は、例えば、ウェブページに埋め込まれたJavaScript等のプログラムにより実現可能である。
In the
また、ユーザ端末10は、情報処理装置100からローマ字変換候補171を逐次取得し、変換候補欄280を介して、ローマ字変換候補171をユーザに表示する。すなわち、ユーザ端末10は、入力中のクエリ151について、情報処理装置100からローマ字変換候補171を逐次取得し、ユーザに表示する。
In addition, the
(2)情報処理装置100の詳細構成
図2は、本実施形態に係る情報処理装置100の機能ブロック図である。
(2) Detailed Configuration of
情報処理装置100は、CPU等の制御装置、メモリやHDD等の記憶装置、通信ネットワーク50と通信する通信I/F等の通信装置といったハードウェア資源を有するコンピュータ(単一或いは複数)により構成される。情報処理装置100が備える下記の各ブロックは、前述したコンピュータの制御装置等のハードウェア資源を用いてコンピュータプログラムを実行することによって実現されるものである。なお、これらの各ブロック、手段は、単一のコンピュータ上に配置される必要はなく、必要に応じて分散される構成を採用しても良い。
The
情報処理装置100は、クエリ取得部101、入力候補インデックス抽出部103、入力候補インデックス記憶部105、仮名変換部107、変換文字列判定部109、ローマ字対応インデックス抽出部111、ローマ字対応インデックス記憶部113、入力候補送信部115、クエリログ取得部117、クエリログ記憶部119、ローマ字変換部121、仮名変換辞書記憶部123、インデックス作成部125を備える。これらの機能部は、いわゆるコンピュータにより構成され、演算/制御装置としてのCPU(Central Processing Unit)、記憶媒体としてのRAM(Random Access Memory)及びROM(Read Only Memory)、通信インターフェイス等が関連することで実現される。以下、各機能部について、説明する。
The
(2.1)クエリ取得部101
クエリ取得部101は、通信ネットワーク50を介して、ユーザ端末10からクエリ151を取得する。具体的には、クエリ取得部101は、通信ネットワーク50を介して、ユーザ端末10から入力中のクエリ151を逐次取得する。例えば、クエリ取得部101は、「yuubin」からなるクエリ151を、入力に伴って逐次ユーザ端末10から取得する。
(2.1)
The
(2.2)入力候補インデックス抽出部103
図3は、情報処理装置100の入力候補インデックス記憶部105に記憶される情報の一例を示す図である。
入力候補インデックス抽出部103は、クエリ取得部101で取得したクエリ151に基づいて、入力候補インデックス記憶部105から検索を行い、対応する仮名漢字変換候補170を抽出する。すなわち、クエリ151は、仮名漢字対応インデックス160に相当するものであり、クエリ151と略一致する仮名漢字対応インデックス160を検索することにより、対応する仮名漢字変換候補170を抽出する。
(2.2) Input candidate
FIG. 3 is a diagram illustrating an example of information stored in the input candidate
The input candidate
本実施形態では、入力候補インデックス抽出部103は、「yuubin」からなるクエリ151が仮名漢字対応インデックス160として記憶されておらず、仮名漢字対応インデックス160を入力候補インデックス記憶部105から検索できないため、仮名漢字変換候補170を抽出することができない。
In this embodiment, the input candidate
また、入力候補インデックス抽出部103は、仮名変換部107でクエリ151を仮名変換規則に基づいて変換された変換文字列169に基づいて、入力候補インデックス記憶部105から検索を行い、対応する仮名漢字変換候補170を抽出する。
Further, the input candidate
図3に示すように、例えば、入力候補インデックス抽出部103は、クエリ取得部101で取得したクエリ又は変換文字列169が、「ゆうびん」であった場合、入力候補インデックス記憶部105から「ゆうびん」に該当する仮名漢字対応インデックス160を検索し、検索された「ゆうびん」に対応する仮名漢字変換候補170として、「郵便番号」、「郵便局」、「郵便」、「郵便料金」を抽出する。
As illustrated in FIG. 3, for example, the input candidate
(2.3)入力候補インデックス記憶部105
図3に示すように、入力候補インデックス記憶部105は、1文字以上の仮名漢字を含むとともに、ローマ字を含まない文字列からなる仮名漢字対応インデックス160と、仮名漢字対応インデックス160に対応する変換候補である仮名漢字変換候補170とを記憶する。
(2.3) Input candidate
As shown in FIG. 3, the input candidate
具体的には、入力候補インデックス記憶部105は、入力されたクエリ151が、仮名漢字を含むとともに、ローマ字を含まない文字列からなる場合に、入力されたクエリ151を仮名漢字対応インデックス160として記憶する。また入力候補インデックス記憶部105は、仮名漢字変換候補170を仮名漢字対応インデックス160に対応させて記憶する。
Specifically, the input candidate
なお、仮名漢字対応インデックス160とは、クエリ151に基づいて、仮名漢字変換候補170を引き当てるためのインデックスであり、平仮名、カタカナ、漢字、数字等の文字列、又はこれらの組み合わせにより構成される。また、仮名漢字変換候補170とは、ユーザ端末10の変換候補欄280に表示させるクエリ151の変換候補である。すなわち、仮名漢字変換候補170は、平仮名、カタカナ、漢字、数字、ローマ字等の文字列、又はこれらの組み合わせにより構成される。
The kana-
例えば、入力候補インデックス記憶部105は、「ゆう」、「ゆうび」、・・「郵」、「ゆう便」等を仮名漢字対応インデックス160として、対応する「郵便番号」、「郵便局」、「郵便」、「郵便料金」等を仮名漢字変換候補170として記憶する。
For example, the input candidate
(2.4)仮名変換部107
図4は、情報処理装置100の仮名変換部107の動作を説明するための概念図である。
(2.4)
FIG. 4 is a conceptual diagram for explaining the operation of the
図4に示すように、仮名変換部107は、入力されたクエリ151が、一連のローマ字列153により構成される場合、クエリ151を該ローマ字列153の前方から仮名変換規則に基づいて仮名変換する。具体的には、仮名変換部107は、クエリ151をローマ字列153の前方から仮名変換規則に基づいて変換文字列169に変換する。なお、変換文字列169は、入力された一連のローマ字列153によって、1文字以上の仮名からなる仮名文字列163のみによって構成される場合(図4(a))と、1文字以上の仮名からなる仮名文字列163と、該仮名文字列163の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列である変換不可文字列165とによって構成される場合(図4(b))とがある。
As illustrated in FIG. 4, when the
例えば、図4(a)に示すように、仮名変換部107は、クエリ151が、「yuubin」であった場合、「yuubin」を変換文字列169として「ゆうびん」に変換する。また、図4(b)に示すように、仮名変換部107は、クエリ151が、「yuub」であった場合、「yuub」を変換文字列169として「ゆうb」に変換する。
For example, as illustrated in FIG. 4A, when the
(2.5)変換文字列判定部109
変換文字列判定部109は、変換文字列169が、仮名文字列163と、該仮名文字列163の後ろに続く変換不可文字列165とによって構成されるか、又は1文字以上の仮名からなる仮名文字列163のみによって構成されるかを判定する。
(2.5) Conversion character
The conversion character
具体的には、変換文字列判定部109は、変換文字列169が、仮名文字列163のみによって構成されると判定した場合に、仮名漢字変換候補170を入力候補インデックス記憶部105から抽出することを判定する。
Specifically, the conversion character
また、変換文字列判定部109は、変換文字列169が、仮名文字列163と、該仮名文字列163の後ろに続く変換不可文字列165とによって構成されると判定した場合にローマ字変換候補171をローマ字対応インデックス記憶部113から抽出することを判定する。
Further, when the conversion character
(2.6)ローマ字対応インデックス抽出部111
図5は、情報処理装置100のローマ字対応インデックス記憶部113に記憶される情報の一例を示す図である。
(2.6) Romaji corresponding index extraction unit 111
FIG. 5 is a diagram illustrating an example of information stored in the Roman alphabet corresponding
図5に示すように、ローマ字対応インデックス抽出部111は、変換文字列169が、1文字以上の仮名からなる仮名文字列と、該仮名文字列の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列とによって構成される場合にローマ字変換候補171をローマ字対応インデックス記憶部113から抽出する。
As illustrated in FIG. 5, the Roman alphabet corresponding index extracting unit 111 includes a
具体的には、ローマ字対応インデックス抽出部111は、仮名変換部107に変換された文字列に基づいて、ローマ字対応インデックス記憶部113からローマ字対応インデックス161を検索し、検索されたローマ字対応インデックス161に対応するローマ字変換候補171をローマ字対応インデックス記憶部113から抽出する。
例えば、ローマ字対応インデックス抽出部111は、仮名変換部107で変換された変換文字列169が、「ゆうb」であった場合、ローマ字対応インデックス記憶部113から「ゆうb」に該当するローマ字対応インデックス161を検索し、検索された「ゆうb」に対応するローマ字変換候補171として、「郵便番号」、「郵便局」、「郵便」、「郵便料金」をローマ字対応インデックス記憶部113から抽出する。
Specifically, the Roman alphabet corresponding index extraction unit 111 searches the Roman
For example, when the converted
(2.7)ローマ字対応インデックス記憶部113
図5に示すように、ローマ字対応インデックス記憶部113は、1文字以上の仮名からなる仮名文字列163と、該仮名文字列163の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列である変換不可文字列165とからなるインデックスであるローマ字対応インデックス161と、ローマ字対応インデックス161に対応する変換候補であるローマ字変換候補171とを記憶する。
(2.7) Roman letter correspondence
As illustrated in FIG. 5, the Roman alphabet corresponding
具体的には、ローマ字対応インデックス記憶部113は、仮名変換部107に変換された変換文字列169が、1文字以上の仮名からなる仮名文字列163と、該仮名文字列163の後ろに続くとともに仮名変換規則を満たさない1文字以上の文字列である変換不可文字列165とによって構成される場合に、変換文字列169をローマ字対応インデックス161として記憶する。また、ローマ字対応インデックス記憶部113は、予め登録された文字列からなるクエリ151をローマ字変換候補171として、ローマ字対応インデックス161に対応させて記憶する。
Specifically, in the Roman alphabet corresponding
なお、ローマ字対応インデックス161とは、クエリ151に基づいて、ローマ字変換候補171を引き当てるためのインデックスであり、1文字以上の仮名からなる仮名文字列163と、該仮名文字列163の後ろに続くとともに仮名変換規則を満たさない1文字以上の文字列である変換不可文字列165とによって構成される。また、ローマ字変換候補171とは、ユーザ端末10の変換候補欄280に表示されるクエリ151の変換候補である。すなわち、ローマ字変換候補171は、平仮名、カタカナ、漢字、数字、ローマ字等の文字列、又はこれらの組み合わせにより構成される。
The Roman
また、変換不可文字列165とは、いかなる仮名変換規則に基づいても、仮名に変換できないローマ字列である。具体的には、変換不可文字列165とは、仮名変換規則に基づいて母音(a、i、u、e、o)が不足しているローマ字列である。
The
例えば、ローマ字対応インデックス記憶部113は、「ゆうb」、「ゆうびn」、「ゆうびx」等をローマ字対応インデックス161として、対応する「郵便番号」、「郵便局」、「郵便」、「郵便料金」等をローマ字変換候補171として記憶する。
For example, the Roman alphabet corresponding
(2.8)入力候補送信部115
入力候補送信部115は、ユーザ端末10からの入力中の一連のローマ字列153について、仮名漢字変換候補170又はローマ字変換候補171をユーザ端末10に逐次送信する。
(2.8) Input candidate transmission unit 115
The input candidate transmission unit 115 sequentially transmits the kana-
具体的には、入力候補送信部115は、ローマ字列153が、1文字以上の仮名からなる仮名文字列163のみによって構成される場合、仮名漢字変換候補170をユーザ端末10に送信する。また、入力候補送信部115は、ローマ字列153が、1文字以上の仮名からなる仮名文字列163と、該仮名文字列163の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列である変換不可文字列165とによって構成される場合、ローマ字変換候補171をユーザ端末10に送信する。
Specifically, the input candidate transmission unit 115 transmits the kana-
(2.9)クエリログ取得部117
クエリログ取得部117は、クエリログ記憶部119から、ユーザにより入力されたクエリ151を取得する。
(2.9) Query log acquisition unit 117
The query log acquisition unit 117 acquires the
(2.10)クエリログ記憶部119
クエリログ記憶部119は、ユーザにより入力されたクエリ151を記憶する。具体的には、クエリログ記憶部119は、クエリ取得部101によって取得されたクエリ151、クエリ151に基づいた検索結果からユーザがユーザ端末10において選択したサイトのURL、クエリ151が入力された時間情報等を記憶する。
(2.10) Query
The query
(2.11)ローマ字変換部121
図6は、情報処理装置100のローマ字変換部121の動作を説明するための概念図である。
(2.11)
FIG. 6 is a conceptual diagram for explaining the operation of the
図6に示すように、ローマ字変換部121は、予め登録された文字列であるクエリ151をローマ字変換規則に基づいて、ローマ字列であるローマ字列候補157に変換する。
As illustrated in FIG. 6, the Roman
ローマ字変換部121は、変換規則が異なる複数のローマ字変換規則それぞれに基づいて、入力されたクエリ151をローマ字列候補157に変換する。
The
具体的には、ローマ字変換部121は、上記のローマ字変換規則として、例えば、「JIS X 4063:2000」(仮名漢字変換システムのための英字キー入力から仮名への変換方式)、訓令式、ヘボン式、「Microsoft(登録商標) IME」による入力から仮名への変換方式、「ATOK(登録商標)」による入力から仮名への変換方式に基づいて、クエリ151を複数のローマ字列候補157に変換する。
Specifically, the
また、ローマ字変換部121は、クエリログ取得部117により取得されたクエリ151をローマ字列候補157に変換する。なお、クエリ151に漢字が含まれる場合、ローマ字変換部121は、クエリ151に基づいて、仮名変換辞書記憶部123から対応する仮名文字列163を抽出する。
The Roman
例えば、図6(a)に示すように、クエリログ取得部117により取得されたクエリ151が、「郵便番号」であった場合、ローマ字変換部121は、「郵便番号」に対応する仮名文字列163である「ゆうびんばんごう」を仮名変換辞書記憶部123に記憶された辞書に基づいて変換する。次に、ローマ字変換部121は、「ゆうびんばんごう」を、ローマ字列候補157a、ローマ字列候補157b、・・・ローマ字列候補157n等である「yuubinbangou」、「yuwubinbangou」、「yuwubinbangowu」「yuubinnbanngou」、「yuubixnbaxngou」等に変換する。
For example, as illustrated in FIG. 6A, when the
また、図6(b)に示すように、ローマ字変換部121は、クエリログ取得部117により取得されたクエリ151が、仮名文字列163からなる(例えば、「ゆうびんばんごう」である)場合、仮名変換辞書記憶部123を用いることなくクエリ151である「ゆうびんばんごう」を、上記の例と同様にローマ字列候補157に変換する。
Also, as shown in FIG. 6B, the Roman
(2.12)仮名変換辞書記憶部123
仮名変換辞書記憶部123は、仮名文字列以外の文字が含まれている漢字混合文字列と、漢字混合文字列の読み仮名からなる仮名文字列とを記憶する。具体的には、仮名変換辞書記憶部123は、漢字、カタカナ、数字等を漢字混合文字列として記憶する。
(2.12) Kana conversion
The kana conversion
(2.13)インデックス作成部125
図7は、情報処理装置100のローマ字変換部121の動作を説明するための概念図である。
(2.13)
FIG. 7 is a conceptual diagram for explaining the operation of the
図7に示すように、インデックス作成部125は、ローマ字変換部121により変換された一連のローマ字列であるローマ字列候補157を先頭から任意の位置(例えば、2文字や3文字ずつ区切った位置)で区切り、その区切った位置126までのローマ字列候補157を仮名変換規則に基づいて変換することで、仮名漢字対応インデックス160又はローマ字対応インデックス161を作成する。
As shown in FIG. 7, the
具体的には、図7(a)に示すように、インデックス作成部125は、ローマ字列候補157の区切った位置126に応じて、1文字以上の仮名からなる仮名文字列163のみによって構成される変換文字列169に変換する場合がある。また、図7(b)に示すように、インデックス作成部125は、ローマ字列候補157の区切った位置126に応じて、1文字以上の仮名からなる仮名文字列163と、該仮名文字列163の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列である変換不可文字列165とによって構成される変換文字列169に変換する場合がある。
Specifically, as shown in FIG. 7A, the
インデックス作成部125は、変換文字列169が、仮名文字列163のみによって構成される場合に変換文字列169を仮名漢字対応インデックス160として、入力候補インデックス記憶部105に記憶する。また、インデックス作成部125は、ローマ字変換部121及びインデックス作成部125により変換文字列169に変換された元のクエリ151を仮名漢字対応インデックス160に対応する仮名漢字変換候補170として入力候補インデックス記憶部105に記憶する。
The
インデックス作成部125は、変換文字列169が、仮名文字列163と、該仮名文字列163の後ろに続く変換不可文字列165とによって構成される場合に変換文字列169をローマ字対応インデックス161として、ローマ字対応インデックス記憶部113に記憶する。また、インデックス作成部125は、ローマ字変換部121及びインデックス作成部125により変換文字列169に変換された元のクエリ151をローマ字対応インデックス161に対応するローマ字変換候補171としてローマ字対応インデックス記憶部113に記憶する。
When the
(3)情報処理システム1の動作
情報処理システム1の動作について、(3.1)全体概略動作、(3.2)情報処理装置100の変換候補抽出処理動作、(3.3)情報処理装置100のインデックス作成処理動作の順に説明する。
(3) Operation of Information Processing System 1 Regarding the operation of the information processing system 1, (3.1) Overall schematic operation, (3.2) Conversion candidate extraction processing operation of the
(3.1)全体概略動作
図8は、実施形態に係る情報処理システム1の変換候補抽出及び検索処理動作を示すシーケンス図である。情報処理システム1は、ユーザ端末10によって入力されたクエリ151に基づいて、情報処理装置100が、検索ページを作成し、ユーザ端末10に表示する。
(3.1) Overall Schematic Operation FIG. 8 is a sequence diagram showing conversion candidate extraction and search processing operations of the information processing system 1 according to the embodiment. In the information processing system 1, based on the
図8に示すように、ステップS100において、ユーザ端末10は、ユーザからローマ字列153からなるクエリ151を受け入れる。
ステップS200において、ユーザ端末10は、通信ネットワーク50を介して、ユーザが入力途中のクエリ151について、逐次、情報処理装置100のクエリ取得部101へ送信する。
As shown in FIG. 8, in step S <b> 100, the
In step S <b> 200, the
ステップS300において、情報処理装置100は、入力されたローマ字列をクエリ151として取得して、該ローマ字列に対応する仮名漢字変換候補170又はローマ字変換候補171を抽出してユーザ端末10に送信する。
In step S <b> 300, the
ステップS400において、ユーザ端末10は、仮名漢字変換候補170又はローマ字変換候補171を一覧表示して、ユーザの変換候補を選択させる。
In step S400, the
ステップS500において、ユーザ端末10は、検索実行要求を情報処理装置100へ送信する。
In step S <b> 500, the
ステップS600において、情報処理装置100は、ステップS400で選択された文字列をクエリとして検索を行い、通信ネットワーク50を介して、検索ページをユーザ端末10に送信する。
In step S <b> 600, the
ステップS700において、ユーザ端末10は、検索ページを表示する。
In step S700, the
(3.2)情報処理装置100の変換候補抽出処理動作
図9は、実施形態に係る情報処理装置100の変換候補抽出処理動作を示すフローチャートである。具体的には、図9は、ステップS300における情報処理装置100が、ローマ字変換候補171を抽出する処理の詳細動作を示す。
(3.2) Conversion Candidate Extraction Processing Operation of
ステップS301において、クエリ取得部101は、通信ネットワーク50を介して、ユーザ端末10から入力中のクエリ151を逐次取得する。
In step S <b> 301, the
ステップS303において、入力候補インデックス抽出部103は、クエリ取得部101で取得したクエリ151に基づいて、入力候補インデックス記憶部105から検索を行い、対応する仮名漢字変換候補170が有るか否かを判定する。
In step S303, the input candidate
具体的には、入力候補インデックス抽出部103は、クエリ151に対応する仮名漢字変換候補170が有る場合、仮名漢字変換候補170を抽出し、処理をステップS313へ進める。入力候補インデックス抽出部103は、クエリ151に対応する仮名漢字変換候補170が無い場合、処理をステップS305へ進める。
Specifically, if there is a kana-
ステップS305において、仮名変換部107は、入力されたクエリ151を仮名変換規則に基づいた変換文字列169に変換する。
In step S305, the
ステップS307において、変換文字列判定部109は、変換文字列169が、1文字以上の仮名からなる仮名文字列163と、該仮名文字列163の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列である変換不可文字列165とによって構成されるか、又は1文字以上の仮名からなる仮名文字列163のみによって構成されるかを判定する。
In step S307, the converted character
具体的には、変換文字列判定部109は、変換文字列169が、1文字以上の仮名からなる仮名文字列163のみによって構成される場合、処理をステップS309へ進める。また、変換文字列判定部109は、変換文字列169が、1文字以上の仮名からなる仮名文字列163と、該仮名文字列163の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列とによって構成される場合、処理をステップS311へ進める。
Specifically, the conversion character
ステップS309において、入力候補インデックス抽出部103は、変換文字列169に対応する仮名漢字変換候補170を入力候補インデックス記憶部105から抽出する。
In step S 309, the input candidate
ステップS311において、ローマ字対応インデックス抽出部111は、変換文字列169に対応するローマ字変換候補171をローマ字対応インデックス記憶部113から抽出する。
In step S <b> 311, the Romaji correspondence index extraction unit 111 extracts the
ステップS313において、入力候補送信部115は、ユーザ端末10からの入力中の一連のローマ字列153について、変換候補をユーザ端末10に逐次送信する。
これにより、情報処理装置100は、変換候補の抽出処理動作を終了する。
In step S <b> 313, the input candidate transmission unit 115 sequentially transmits conversion candidates to the
As a result, the
(3.3)情報処理装置100のインデックス作成処理動作
図10は、実施形態に係る情報処理装置100のインデックス作成処理動作を示すフローチャートである。具体的には、図10は、ステップS300における情報処理装置100が、ローマ字変換候補171を作成するインデックス作成処理の詳細動作を示す。
情報処理装置100は、ローマ字列153からなるクエリ151に基づいて、ローマ字変換候補171を抽出するために、ローマ字対応インデックス161と、ローマ字変換候補171とを記憶するデータベースを以下の処理によりローマ字対応インデックス記憶部113に記憶する。
(3.3) Index Creation Processing Operation of
In order to extract the
ステップS801において、クエリログ取得部117は、クエリログ記憶部119から、ユーザにより入力されたクエリ151を取得する。
In step S801, the query log acquisition unit 117 acquires the
ステップS803において、ローマ字変換部121は、クエリ151をローマ字変換規則に基づいて、ローマ字列であるローマ字列候補157に変換する。
In step S803, the
ステップS805において、インデックス作成部125は、ローマ字変換部121により変換されたローマ字列候補157を先頭から任意の位置で区切り、区切った位置までのローマ字列候補157を仮名変換規則に基づいた変換文字列169に変換することで、仮名漢字対応インデックス160又はローマ字対応インデックス161を作成する。
In step S805, the
ステップS807において、インデックス作成部125は、仮名漢字対応インデックス160又はローマ字対応インデックス161を作成し、入力候補インデックス記憶部105又はローマ字対応インデックス記憶部113にそれぞれ記憶する。
In step S807, the
また、インデックス作成部125は、クエリ151を仮名漢字対応インデックス160に対応する仮名漢字変換候補170として、入力候補インデックス記憶部105に記憶する。同様にして、インデックス作成部125は、クエリ151をローマ字対応インデックス161に対応するローマ字変換候補171として、ローマ字対応インデックス記憶部113に記憶する。
Further, the
これにより、情報処理装置100は、インデックス作成処理動作を終了する。
Thereby, the
(5)作用・効果
以上説明したように、本実施形態によれば、情報処理装置100は、ローマ字対応インデックス記憶部113と、仮名変換部107と、入力候補インデックス抽出部103とを備える。
(5) Operation / Effect As described above, according to the present embodiment, the
仮名変換部107は、入力された一連のローマ字列153を仮名変換規則に基づいた変換文字列169に変換する。すなわち、仮名変換部107は、複数のローマ字変換の規格に基づいて、異なる入力規則によって入力されたローマ字列153が入力された場合でも、変換文字列169に変換する。
The
ローマ字対応インデックス記憶部113は、1文字以上の仮名からなる仮名文字列163と、仮名文字列163の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列である変換不可文字列165とからなるローマ字対応インデックス161と、ローマ字対応インデックス161に対応するローマ字変換候補171とを記憶する。
The Roman character correspondence
すなわち、ローマ字入力に対応した変換候補のインデックスを、仮名漢字を含んだローマ字対応インデックス161として作成しているため、様々な入力規則のあるローマ字入力を吸収したインデックスを作成していると言える。
That is, since the conversion candidate index corresponding to the Romaji input is created as the
このため、ローマ字対応インデックス記憶部113は、ローマ字入力の全ての規格を網羅するためにデータ量を膨大にすることなく、ローマ字からなる文字列に入力候補を対応付けたインデックスを記憶できる。これにより、複数のローマ字変換の規格に基づいて、異なる入力規則によってローマ字列153が入力された場合でも、該ローマ字列153に対応した変換候補を出力できる。従って、データ量の膨大化を抑制してローマ字入力に対応したインデックスを作成することで、情報処理装置100にかかる負荷を低減できる。
For this reason, the Roman alphabet corresponding
また、入力候補インデックス抽出部103は、仮名変換部107に変換された変換文字列169に基づいて、ローマ字対応インデックス記憶部113からローマ字対応インデックス161を検索し、検索された該ローマ字対応インデックス161に対応するローマ字変換候補171をローマ字対応インデックス記憶部113から抽出する。
Further, the input candidate
すなわち、情報処理装置100は、入力されたローマ字列153を変換文字列169に変換し、変換文字列169に対応するローマ字変換候補171を抽出できる。
That is, the
従って、情報処理装置100は、情報処理装置100にかかる負荷を軽減しつつ、ローマ字からなる入力に対する変換候補を表示できる。
Therefore, the
実施形態では、情報処理装置100は、入力された文字列であるクエリ151をローマ字変換規則に基づいて、ローマ字列に変換するローマ字変換部121と、ローマ字変換部121により変換されたローマ字列を先頭から任意の位置で区切り、区切った位置までのローマ字列を仮名変換規則に基づいた変換文字列169に変換することで、ローマ字対応インデックス161を作成するインデックス作成部125とを更に備える。また、ローマ字対応インデックス記憶部113は、クエリ151をローマ字変換候補171として、ローマ字対応インデックス161に対応させて記憶する。
In the embodiment, the
このため、ローマ字対応インデックス記憶部113は、入力候補とする単語を事前に登録する必要がなく、ユーザの情報処理装置100の利用に伴って入力されるクエリ151により、ローマ字対応インデックス161とローマ字変換候補171とを更新できる。すなわち、ローマ字対応インデックス記憶部113によれば、ユーザの行動データからローマ字対応インデックス記憶部113を更新できる。
For this reason, the Roman alphabet corresponding
実施形態では、ローマ字変換候補171は、変換規則が異なる複数のローマ字変換規則に基づいて、クエリ151を変換規則の異なるローマ字列候補157a、ローマ字列候補157b、・・・、ローマ字列候補157nに変換する。
In the embodiment, the Roman
このため、ローマ字対応インデックス記憶部113は、入力候補とする単語を事前に登録することなく、変換規則が異なる複数のローマ字変換規則を網羅したローマ字対応インデックス161を記憶することができる。従って、情報処理装置100は、複数の規格に基づいて、異なる入力規則によって入力されたローマ字列153が入力された場合でも、ローマ字列153に対応するローマ字変換候補171として抽出できる。
For this reason, the Roman alphabet corresponding
実施形態では、ローマ字対応インデックス記憶部113は、入力されたクエリ151をローマ字変換候補171として記憶する。このため、ユーザの情報処理装置100の利用に伴って逐次入力される情報をローマ字変換候補171として、抽出できる。
In the embodiment, the Roman alphabet corresponding
(6)その他の実施形態
上述した実施形態では、変換文字列169が、仮名文字列163のみによって構成される場合に仮名漢字変換候補170を入力候補インデックス記憶部105に記憶する。また、変換文字列169が、仮名文字列163と、該仮名文字列163の後ろに続く変換不可文字列165とによって構成される場合にローマ字変換候補171をローマ字対応インデックス記憶部113に記憶する。本発明は、これに限られず、入力候補インデックス記憶部105と、ローマ字対応インデックス記憶部113とが、一つの記憶部に記憶されていてもよい。この場合、また、入力候補インデックス抽出部103と、ローマ字対応インデックス抽出部111とは、一つの抽出部として機能してもよい。また、該ローマ字列153に対応する仮名漢字変換候補170又はローマ字変換候補171は、変換候補として、仮名漢字変換候補170及びローマ字変換候補171を識別することなく抽出してもよい。
(6) Other Embodiments In the above-described embodiment, the kana-
このように、本発明は、ここでは記載していない様々な実施の形態などを含むことは勿論である。したがって、本発明の技術的範囲は、上述の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。 As described above, the present invention naturally includes various embodiments that are not described herein. Therefore, the technical scope of the present invention is defined only by the invention specifying matters according to the scope of claims reasonable from the above description.
例えば、各構成図、フローチャート、概念図の図などは例示に過ぎず、各要素の有無、その順序や具体的内容などは適宜変更可能である。一例として、手動によるブロックの指定は必須ではなく、また、本発明において、各手段などの要素は、コンピュータの演算制御部に限らず、ワイヤードロジック等に基づく電子回路で実現してもよい。 For example, each configuration diagram, flowchart, conceptual diagram, and the like are merely examples, and the presence / absence of each element, its order, specific contents, and the like can be changed as appropriate. As an example, manual block designation is not indispensable, and in the present invention, elements such as each means are not limited to an arithmetic control unit of a computer but may be realized by an electronic circuit based on wired logic or the like.
1 情報処理システム
10 ユーザ端末
30 ユーザ端末
50 通信ネットワーク
100 情報処理装置
101 クエリ取得部
103 入力候補インデックス抽出部
105 入力候補インデックス記憶部
107 仮名変換部
109 変換文字列判定部
111 ローマ字対応インデックス抽出部
113 ローマ字対応インデックス記憶部
115 入力候補送信部
117 クエリログ取得部
119 クエリログ記憶部
121 ローマ字変換部
123 仮名変換辞書記憶部
125 インデックス作成部
126 位置
151 クエリ
153 ローマ字列
157、157a、157b、157n ローマ字列候補
160 仮名漢字対応インデックス
161 ローマ字対応インデックス
163 仮名文字列
165 変換不可文字列
169 変換文字列
170 仮名漢字変換候補
171 ローマ字変換候補
260 クエリ入力欄
270 検索ボタン
280 変換候補欄
DESCRIPTION OF SYMBOLS 1
Claims (6)
1文字以上の仮名からなる仮名文字列と、該仮名文字列の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列とからなるインデックスと、前記インデックスに対応する変換候補とを記憶する記憶手段と、
前記入力された一連のローマ字列を該ローマ字列の前方から仮名変換規則に基づいて仮名変換する仮名変換手段と、
前記仮名変換手段に変換された文字列に基づいて、前記記憶手段から前記インデックスを検索し、検索された該インデックスに対応する前記変換候補を前記記憶手段から抽出する抽出手段と、
を備えることを特徴とする情報処理装置。 An information processing apparatus that acquires an input Roman character string and extracts conversion candidates corresponding to the Roman character string,
An kana character string consisting of one or more kana characters, an index consisting of one or more roman character strings that follow the kana character string and do not satisfy the kana conversion rules, and conversion candidates corresponding to the index are stored. Storage means;
Kana conversion means for converting the input series of roman characters from the front of the romaji based on kana conversion rules;
Based on the character string converted into the kana conversion unit, the index is searched from the storage unit, and the conversion candidate corresponding to the searched index is extracted from the storage unit;
An information processing apparatus comprising:
前記ローマ字変換手段により変換されたローマ字列を先頭から任意の位置で区切り、前記区切った位置までのローマ字列を仮名変換規則に基づいて変換することで、前記インデックスを作成するインデックス作成手段と、
を更に備え、
前記記憶手段は、
前記予め登録された文字列を変換候補として、前記インデックス作成手段により作成されたインデックスに対応させて記憶することを特徴とする請求項1に記載の情報処理装置。 Roman character conversion means for converting a pre-registered character string into a Roman character string based on a Roman character conversion rule;
Index creating means for creating the index by dividing the Roman character string converted by the Roman character converting means at an arbitrary position from the top, and converting the Roman character string up to the divided position based on a kana conversion rule;
Further comprising
The storage means
The information processing apparatus according to claim 1, wherein the character string registered in advance is stored as a conversion candidate in association with the index created by the index creating unit.
変換規則が異なる複数のローマ字変換規則それぞれに基づいて、前記入力された文字列をローマ字列に変換することを特徴とする請求項2に記載の情報処理装置。 The romaji conversion means is:
The information processing apparatus according to claim 2, wherein the input character string is converted into a Roman character string based on a plurality of Roman character conversion rules having different conversion rules.
入力されたクエリを変換候補として記憶することを特徴とする請求項1乃至3の何れか一項に記載の情報処理装置。 The storage means
The information processing apparatus according to claim 1, wherein the input query is stored as a conversion candidate.
コンピュータが、前記入力された一連のローマ字列を該ローマ字列の前方から仮名変換規則に基づいて仮名変換するステップと、
コンピュータが、前記変換された文字列に基づいて、1文字以上の仮名からなる仮名文字列と、該仮名文字列の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列とからなるインデックスと、前記インデックスに対応する変換候補とを記憶する記憶手段から前記インデックスを検索し、検索された該インデックスに対応する前記変換候補を前記記憶手段から抽出するステップと、
を備えることを特徴とする変換候補抽出方法。 A computer conversion candidate extraction method for acquiring an input Roman character string and extracting conversion candidates corresponding to the Roman character string,
The computer converting the input series of Roman characters from the front of the Roman characters based on kana conversion rules;
An index comprising a kana character string consisting of one or more kana characters based on the converted character string, and a roman character string of one or more characters that follows the kana character string and does not satisfy the kana conversion rules Retrieving the index from storage means for storing conversion candidates corresponding to the index, and extracting the conversion candidate corresponding to the searched index from the storage means;
A conversion candidate extraction method comprising:
前記入力された一連のローマ字列を該ローマ字列の前方から仮名変換規則に基づいて仮名変換するステップと、
前記変換された文字列に基づいて、1文字以上の仮名からなる仮名文字列と、該仮名文字列の後ろに続くとともに仮名変換規則を満たさない1文字以上のローマ字列とからなるインデックスと、前記インデックスに対応する変換候補とを記憶する記憶手段から前記インデックスを検索し、検索された該インデックスに対応する前記変換候補を前記記憶手段から抽出するステップと、
をコンピュータに実行させることを特徴とするプログラム。 A program that acquires an input Roman character string and extracts conversion candidates corresponding to the Roman character string,
Converting the input series of Roman characters from the front of the Roman characters based on kana conversion rules;
Based on the converted character string, an index consisting of a kana character string consisting of one or more kana characters, and a roman character string of one or more characters that follows the kana character string and does not satisfy the kana conversion rules; Retrieving the index from storage means for storing conversion candidates corresponding to the index, and extracting the conversion candidates corresponding to the searched index from the storage means;
A program that causes a computer to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010076945A JP5094902B2 (en) | 2010-03-30 | 2010-03-30 | Information processing apparatus, conversion candidate extraction method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010076945A JP5094902B2 (en) | 2010-03-30 | 2010-03-30 | Information processing apparatus, conversion candidate extraction method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011210001A true JP2011210001A (en) | 2011-10-20 |
JP5094902B2 JP5094902B2 (en) | 2012-12-12 |
Family
ID=44940991
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010076945A Active JP5094902B2 (en) | 2010-03-30 | 2010-03-30 | Information processing apparatus, conversion candidate extraction method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5094902B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS584424A (en) * | 1981-07-01 | 1983-01-11 | Toshiba Corp | Japanese word input device |
JPH08335217A (en) * | 1995-06-07 | 1996-12-17 | Toshiba Corp | Reading converting method and document preparation device |
JPH11338858A (en) * | 1998-05-22 | 1999-12-10 | Toshiba Corp | Device and method for predicting input and storage medium recording input predictive program |
JP2007172662A (en) * | 2007-03-22 | 2007-07-05 | Microsoft Corp | Japanese input device and method |
-
2010
- 2010-03-30 JP JP2010076945A patent/JP5094902B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS584424A (en) * | 1981-07-01 | 1983-01-11 | Toshiba Corp | Japanese word input device |
JPH08335217A (en) * | 1995-06-07 | 1996-12-17 | Toshiba Corp | Reading converting method and document preparation device |
JPH11338858A (en) * | 1998-05-22 | 1999-12-10 | Toshiba Corp | Device and method for predicting input and storage medium recording input predictive program |
JP2007172662A (en) * | 2007-03-22 | 2007-07-05 | Microsoft Corp | Japanese input device and method |
Also Published As
Publication number | Publication date |
---|---|
JP5094902B2 (en) | 2012-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107025217B (en) | Synonymy-converted sentence generation method, synonymy-converted sentence generation device, recording medium, and machine translation system | |
KR20140023677A (en) | Terminal and method for determining a type of input method editor | |
US20140026043A1 (en) | Computer product, input support method, and input support apparatus | |
CN111194457A (en) | Patent evaluation determination method, patent evaluation determination device, and patent evaluation determination program | |
JP5094902B2 (en) | Information processing apparatus, conversion candidate extraction method, and program | |
US8335680B2 (en) | Electronic apparatus with dictionary function background | |
JP5084859B2 (en) | Information processing apparatus, data extraction method, and program | |
JP5749626B2 (en) | Web information providing system and web information providing program | |
KR100933270B1 (en) | Method, system and computer-readable recording medium for performing web search based on image information | |
JPWO2015075920A1 (en) | Input support apparatus, input support method, and program | |
JP2006155275A (en) | Information extraction method and information extraction device | |
JP2002189744A (en) | Web page retrieval system | |
JP4004060B1 (en) | Character search method | |
JP5189884B2 (en) | Station name input device and station name input program | |
JP2005293217A (en) | Information display controller, server and program | |
JP2020021455A (en) | Patent evaluation determination method, patent evaluation determination device, and patent evaluation determination program | |
JP2009093299A (en) | Data input device, method, and program | |
JP2008217770A (en) | Language data display system, language data display method, and language data display program | |
JP6729656B2 (en) | Text processing device, text display system, information processing device, program | |
JP2018055620A (en) | Information processing device and program | |
JP2008065577A (en) | Document retrieval system, document retrieval program and computer-readable recording medium recorded with document retrieval program | |
JP2011014101A (en) | Information display device, information display method, information display program, and electronic dictionary | |
JP2017068307A (en) | Information retrieval device, control method thereof, and information retrieval program | |
JP2008140074A (en) | Example sentence retrieving device and example sentence retrieval processing program | |
JP6447068B2 (en) | Information processing apparatus, information display method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120918 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5094902 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150928 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |