JP6277655B2 - Character string search program, character string search method, and character string search device - Google Patents
Character string search program, character string search method, and character string search device Download PDFInfo
- Publication number
- JP6277655B2 JP6277655B2 JP2013208505A JP2013208505A JP6277655B2 JP 6277655 B2 JP6277655 B2 JP 6277655B2 JP 2013208505 A JP2013208505 A JP 2013208505A JP 2013208505 A JP2013208505 A JP 2013208505A JP 6277655 B2 JP6277655 B2 JP 6277655B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- search
- string
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、文字列を検索する文字列検索プログラム、文字列検索方法及び文字列検索装置に関する。 The present invention relates to a character string search program, a character string search method, and a character string search device that search for a character string.
従来の検索システムでは、検索により目的の文字列を取得する際に、例えば目的の文字列の一部を入力して検索を行う前方一致検索や後方一致検索等が知られている。さらに従来では、例えば表記が揺らいでいる場合でも、統一した表記の文字列を出力する検索システムが知られている。 In a conventional search system, when acquiring a target character string by search, for example, a forward match search or a backward match search in which a search is performed by inputting a part of the target character string is known. Further, conventionally, for example, a search system that outputs a character string with a unified notation even when the notation fluctuates is known.
従来の検索システムにおいて目的の文字列を検索するためには、少なくとも目的の文字列の一部を正確に入力する必要がある。したがって、例えば目的の文字列の記憶が曖昧なために目的の文字列の一部を正確に入力できない場合等には、検索を行うことが困難であった。 In order to search for a target character string in a conventional search system, it is necessary to input at least a part of the target character string accurately. Therefore, it is difficult to perform a search, for example, when the storage of the target character string is ambiguous and a part of the target character string cannot be accurately input.
1つの側面では、曖昧に記憶された文字列と関連する文字列を検索することが可能な文字列検索プログラム、文字列検索方法及び文字列検索装置を提供することを目的とする。 In one aspect, an object is to provide a character string search program, a character string search method, and a character string search device that can search a character string related to an ambiguously stored character string.
開示の技術は、第一の文字列を受け付けると、前記第一の文字列に含まれる各文字の順に、母音と子音との関係に基づき所定の位置に各文字を配置した配列表における文字間の距離と方向を示すベクトルの列を特定して、所定の類似関係を満たすベクトルの列となる第二の文字列を特定し、前記第二の文字列を出力するか、又は、前記第二の文字列を検索キーとした検索を実行する処理をコンピュータに実行させる。 When the disclosed technique accepts the first character string, the characters in the arrangement table in which each character is arranged at a predetermined position based on the relationship between the vowel and the consonant in the order of each character included in the first character string. A vector string indicating the distance and direction of the second character string is specified, a second character string that is a vector string satisfying a predetermined similarity relationship is specified, and the second character string is output, or the second character string is output The computer is caused to execute a process of executing a search using the character string of as a search key.
上記各処理は、上記各処理を実現する機能部、上記各処理を手順としてンピュータにより実行させる方法、プログラムを記憶したコンピュータ読み取り可能な記憶媒体とすることもできる。 Each of the above processes may be a functional unit that realizes each of the above processes, a method of causing each computer to execute each of the processes as a procedure, and a computer-readable storage medium that stores the program.
あいまいに記憶された文字列と関連する文字列を検索することができる。 It is possible to search for a character string associated with an ambiguously stored character string.
以下に図面を参照して本実施例について説明する。図1は、文字列検索装置のハードウェア構成の一例の示す図である。 The present embodiment will be described below with reference to the drawings. FIG. 1 is a diagram illustrating an example of a hardware configuration of a character string search device.
文字列検索装置100は、それぞれバスBで相互に接続されている入力装置11,出力装置12、ドライブ装置13、補助記憶装置14、メモリ装置15、演算処理装置16及びインターフェース装置17を含む。
The character
入力装置11はキーボードやマウス等を含み、各種信号を入力するために用いられる。出力装置12はディスプレイ装置等を含み、各種ウインドウやデータ等を表示するために用いられる。インターフェース装置17は、モデム,LANカード等を含み、ネットワークNに接続する為に用いられる。
The
文字列検索プログラムは、文字列検索装置100を制御する各種プログラムの少なくとも一部である。文字列検索プログラムは例えば記録媒体18の配布やネットワークからのダウンロードなどによって提供される。文字列検索プログラムを記録した記録媒体28は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
The character string search program is at least a part of various programs that control the character
また、文字列検索プログラムは、文字列検索プログラムを記録した記録媒体18がドライブ装置13にセットされるとは記録媒体18からドライブ装置13を介して補助記憶装置14にインストールされる。ネットワークからダウンロードされた文字列検索プログラムは、インターフェース装置17を介して補助記憶装置14にインストールされる。
The character string search program is installed from the
補助記憶装置14は、インストールされた文字列検索プログラムを格納すると共に、必要なファイル、データ等を格納する。メモリ装置15は、コンピュータの起動時に補助記憶装置14から文字列検索プログラムを読み出して格納する。そして、演算処理装置16はメモリ装置15に格納された文字列検索プログラムに従って、後述するような各種処理を実現している。
The
本実施例の文字列検索装置100は、例えばタブレット型のコンピュータであっても良い。また本実施例の文字列検索装置100は、例えばスマートフォンを含む多機能の携帯電話あっても良い。
The character
次に図2を参照して、本実施例の文字列検索装置100の機能について説明する。図2は、文字列検索装置の機能構成を説明する図である。
Next, the function of the character
本実施例の文字列検索装置100は、入力受付部110、距離方向算出部120、母集団登録部130、許容範囲設定部140、検索部150、文字列抽出部160、出力部170を有する。後述する各部の機能は、演算処理装置16が文字列検索プログラムを実行することで実現される。
The character
また本実施例の文字列検索装置100は、文字座標列表210、母集団データベース220を有する。文字座標列表210と母集団データベース220とは、例えば補助記憶装置14等の所定の記憶領域に格納されていても良い。
The character
本実施例の文字列検索装置100は、検索キーとなる文字列(以下、単に検索キーと呼ぶ。)が入力されると、文字列に含まれる各文字について、文字座標列表210における文字同士の距離と方向を算出する。そして文字列検索装置100は、算出した距離と方向とを用いて母集団データベース220を検索し、抽出された文字列を検索キーと関連する文字列として出力する。文字座標列表210と母集団データベース220の詳細は後述する。
When a character string serving as a search key (hereinafter simply referred to as a search key) is input, the character
本実施例の文字列検索装置100の入力受付部110は、入力装置11から入力されたデータを受け付ける。本実施例において、入力装置11から入力されるデータは、例えば検索キーや、後述する許容範囲に関するパラメータ等である。
The
距離方向算出部120は、文字列に含まれる文字のうち、隣り合う文字同士の文字座標列表210における距離と方向とを算出する。距離方向算出部120の詳細は後述する。
The distance
母集団登録部130は、母集団データベース220の登録を行う。本実施例では、母集団データベース220に格納する文字列群が入力されると、各文字列において隣り合う文字同士の距離と方向を算出し、文字列と対応付けた1つのレコードとして母集団データベース220へ登録する。尚、隣り合う文字同士の距離と方向は、距離方向算出部120により算出される。
The
許容範囲設定部140は、距離方向算出部120により算出された距離と方向を所定範囲の値とするためのパラメータを設定する。本実施例のパラメータは、具体的には距離を所定の範囲の値とする距離パラメータと、方向を所定の範囲の値とする方向パラメータとを含む。本実施例のパラメータは、例えば予めメモリ装置25等に複数種類格納されていても良い。許容範囲設定部140は、メモリ装置25から母集団データベース220に対応したパラメータを取得して設定しても良い。パラメータの詳細は後述する。
The allowable
検索部150は、入力受付部110が受け付けた検索キーについて、距離方向算出部120が算出した距離と方向及び設定されたパラメータに基づき母集団データベース220を検索する。検索部150の処理の詳細は後述する。
The
文字列抽出部160は、検索部150による検索の結果として該当する文字列を母集団データベース220から抽出する。出力部170は、抽出された文字列を検索キーと関連する関連文字列として出力装置12等により出力する。
The character
尚、本実施例の文字列検索装置100は、例えば端末装置とネットワークを介して接続されていても良い。この場合文字列検索装置100は、例えば端末装置において入力された検索キーを検索要求と共に受け付け、検索キーに基づく検索を行い、その結果を端末装置へ出力しても良い。
In addition, the character
以下に図3を参照して本実施例の文字座標列表210について説明する。図3は、文字座標列表の一例を示す図である。 The character coordinate sequence table 210 of this embodiment will be described below with reference to FIG. FIG. 3 is a diagram illustrating an example of the character coordinate sequence table.
本実施例の文字座標列表210は、五十音表に基づき文字を配列した表である。 The character coordinate sequence table 210 of the present embodiment is a table in which characters are arranged based on a Japanese syllabary table.
五十音表は、日本語の仮名文字(平仮名、片仮名)を母音に基づき縦に五字、子音に基づき横に十字ずつ並べたものであり、言語音に関する物理的特性を扱うとされている音声学に基づき配列されている。言語音とは、いわゆる音のうち言語に用いられるものを示し、子音と母音に分けられる。 The Japanese syllabary table is composed of Japanese kana characters (Hiragana and Katakana) arranged in five letters vertically based on vowels and crosses horizontally based on consonants, and is said to handle physical characteristics related to speech sounds. Arranged based on phonetics. The language sound indicates a so-called sound used for a language, and is divided into a consonant and a vowel.
母音は、口腔内で呼気の流れがあまり妨げられないで発せれられる言語音であり、子音は、口腔内で呼気の流れがある程度妨げられて発せれられる言語音である。 A vowel is a language sound that is uttered without much obstructing the flow of exhalation in the oral cavity, and a consonant is a language sound that is uttered with some obstruction of the flow of exhalation in the oral cavity.
子音は、調音点及び調音法に基づいて分類されている。より具体的には、子音は、調音法より、調音点において呼気がどのように流れるか、あるいは流れないかにより分類される。 Consonants are classified based on articulation points and articulation methods. More specifically, consonants are classified according to how exhalation flows or does not flow at the articulation point, based on the articulation method.
調音点とは、肺から唇までの発声器官の中で、音の区別に大きく係る部分を指す。調音法とは、喉頭以上の調音器官の形や動きによって発声器官内の空気の流れを制御したり、発声器官内で発生する音声の共鳴の仕方を変化させたり、新たな音を発生あるいは追加したりして、さまざまな母音や子音を発生させる方法である。 The articulatory point refers to a portion of the voicing organ from the lungs to the lips that is largely related to the distinction of sound. The articulation method controls the flow of air in the vocal organs by changing the shape and movement of the articulator above the larynx, changes the way the sound resonates within the vocal organs, and generates or adds new sounds. This is a method of generating various vowels and consonants.
この調音点と調音法に基づいて主要な子音を配置した表に発音記号を配置すると、五十音表の「あかさたな・・・」の順序は、調音点の喉の奥から口の前の方という並びになると考えられている。すなわち五十音表における文字の配列は、音声学的な観点で定められた配列であると言える(参考:「言語学の基礎/アカサタナの謎:音声学の基礎」http://culture.cc.hirosaki-u.ac.jp/english/utsumi/linguistics/lingusitics_c2_ja.html)。 If you place a phonetic symbol on a table with the main consonants based on this articulation point and articulation method, the order of `` Akasata ... '' in the 50-sound table is from the back of the throat to the front of the mouth. It is thought that it becomes the line. In other words, it can be said that the arrangement of letters in the Japanese syllabary table is an arrangement determined from a phonetic viewpoint (Reference: “Basics of Linguistics / Mystery of Akasatana: Basics of Phonetics” http://culture.cc .hirosaki-u.ac.jp / english / utsumi / linguistics / lingusitics_c2_en.html).
そこで本願の発明者は、記憶があいまいな文字列は、文字の情報ではなく音声の情報として記憶される可能性がある点に着目し、五十音表に基づく文字座標列表210における文字と文字の位置関係を検索に用いることを考えた。本実施例における文字と文字の位置関係とは、距離方向算出部120により算出される、文字座標列表210における文字と文字の間の距離と方向により示される。
Therefore, the inventor of the present application pays attention to the fact that a character string that is ambiguously stored may be stored as voice information instead of character information, and character and character in the character coordinate string table 210 based on the Japanese syllabary table We considered using the positional relationship of for the search. The positional relationship between characters in the present embodiment is indicated by the distance and direction between characters in the character coordinate sequence table 210 calculated by the distance
本実施例の文字座標列表210では、X軸方向に子音を並べ、Y軸方向に母音を配列した。すなわち本実施例では、文字座標列表210におけるY軸方向の座標の変化は、母音の遷移を示し、文字座標列表210におけるX軸方向の座標の変化は、子音の遷移を示す。また本実施例の文字座標列表210では、子音の次に濁音を配置した。 In the character coordinate sequence table 210 of this embodiment, consonants are arranged in the X-axis direction and vowels are arranged in the Y-axis direction. That is, in this embodiment, a change in the coordinate in the Y-axis direction in the character coordinate sequence table 210 indicates a vowel transition, and a change in the coordinate in the X-axis direction in the character coordinate sequence table 210 indicates a consonant transition. Further, in the character coordinate sequence table 210 of this embodiment, the muddy sound is arranged next to the consonant.
本実施例の文字座標列表210は、例えば図4に示すように各文字の座標の値を保持していても良い。図4は、文字座標列表における座標の保持の仕方の一例を示す図である。 The character coordinate sequence table 210 of the present embodiment may hold the coordinate values of each character as shown in FIG. 4, for example. FIG. 4 is a diagram illustrating an example of how to maintain coordinates in the character coordinate sequence table.
本実施例では、図4に示すように、文字と、文字のX座標とY座標とを対応付けて格納したデータベースを文字座標列表210として保持しても良い。 In this embodiment, as shown in FIG. 4, a database that stores characters and the X coordinates and Y coordinates of the characters in association with each other may be stored as a character coordinate sequence table 210.
また本実施例の文字座標列表210は、母集団データベース220と対応して設けられていても良い。
Further, the character coordinate sequence table 210 of the present embodiment may be provided corresponding to the
次に図5を参照して本実施例の距離方向算出部120の処理について説明する。図5は、距離方向算出部の処理を説明する図である。
Next, processing of the distance
図5では、例えば入力受付部110が「デイデイコ」という文字列を検索キーとして受け付けた場合について説明する。
In FIG. 5, for example, a case where the
本実施例の距離方向算出部120は、文字座標列表210における文字列「デイデイコ」に含まれる各文字の座標を取得する。
The distance
文字座標列表210において、文字列「デイデイコ」に含まれる最初の文字「デ」の座標(X1,Y1)は、(13,4)である。文字「イ」の座標(X2,Y2)は、(1,2)である。文字「コ」の座標(X3,Y3)は、(2,5)である。 In the character coordinate sequence table 210, the coordinates (X1, Y1) of the first character “de” included in the character sequence “day deico” are (13, 4). The coordinates (X2, Y2) of the character “I” are (1,2). The coordinates (X3, Y3) of the character “ko” are (2, 5).
本実施例の距離方向算出部120は、各文字の座標を用い文字間の距離と方向を算出する。始めに、距離方向算出部120による文字間の距離の算出について説明する。
The distance
本実施例において、座標(X1,Y1)の文字「デ」と、座標(X2,Y2)の文字「イ」との間の距離Lは、以下の式(1)で算出される。 In this embodiment, the distance L between the character “de” at the coordinates (X1, Y1) and the character “I” at the coordinates (X2, Y2) is calculated by the following equation (1).
L=√{(X1−X2)2+(Y1−Y2)2} 式(1)
したがって「デ」と文字「イ」との間の距離L=√{(13−1)2+(4−2)2}=12.16(小数点第3位以下切り捨て)となる。
L = √ {(X1−X2) 2 + (Y1−Y2) 2 } Formula (1)
Therefore, the distance L between “de” and the letter “I” is L = √ {(13-1) 2 + (4-2) 2 } = 12.16 (rounded down to the third decimal place).
本実施例の距離方向算出部120は、以上のようにして各文字間の距離を算出する。
The distance
次に、距離方向算出部120による文字間の方向の算出について説明する。本実施例では、先に入力された文字に対する次に入力された文字の文字座標列表210における角度を文字間の方向とする。
Next, calculation of the direction between characters by the distance
以下に文字「デ」に対する文字「イ」の方向について説明する。文字列「デイデイコ」において、文字「デ」の次に入力された文字が「イ」である。よって本実施例の距離方向算出部120は、文字座標列表210における文字「デ」に対する文字「イ」の角度を文字「デ」に対する文字「イ」の方向を示す値として算出する。以下の説明では、方向を示す値を単に方向と呼ぶ。
The direction of the character “I” with respect to the character “DE” will be described below. In the character string “Day Deiko”, the character input next to the character “De” is “I”. Therefore, the distance
文字座標列表210における文字「デ」に対する文字「イ」の角度θは、各文字の座標を用いて以下の式(2)で算出される。 The angle θ of the character “I” relative to the character “DE” in the character coordinate sequence table 210 is calculated by the following equation (2) using the coordinates of each character.
θ=tan−1{(Y1−Y2)/(X1−X2)}×180/π 式(2)
したがって文字「デ」に対する文字「イ」の方向θ=tan−1{(4−2)/(13−1)}=9.46(小数点第3位以下切り捨て)となる。
θ = tan −1 {(Y1−Y2) / (X1−X2)} × 180 / π Formula (2)
Therefore, the direction of the character “I” with respect to the character “DE” is θ = tan −1 {(4-2) / (13-1)} = 9.46 (rounded down to the second decimal place).
本実施例では、以上のようにして算出した文字「デ」と文字「イ」の間の距離と、文字「デ」に対する文字「イ」の向きを、文字座標列表210における文字「デ」と文字「イ」の位置関係を示すベクトルとする。 In the present embodiment, the distance between the character “de” and the character “I” calculated as described above and the direction of the character “I” with respect to the character “de” are represented by the character “de” in the character coordinate sequence table 210. It is a vector indicating the positional relationship of the character “I”.
次に、本実施例の母集団データベース220について説明する。
Next, the
本実施例の母集団登録部130は、例えば管理者により母集団となる文字列群が入力されると、上述した手法により各文字列において隣り合う文字と文字の位置関係を示すベクトルを算出し、文字列とベクトルと対応付けて母集団データベース220に登録する。
For example, when a group of character strings serving as a population is input by an administrator, the
以下に図6を参照して、本実施例の母集団の登録の処理について説明する。図6は、母集団の登録の処理を説明するフローチャートである。 Hereinafter, with reference to FIG. 6, the registration processing of the population according to the present embodiment will be described. FIG. 6 is a flowchart for explaining the registration process of the population.
本実施例の文字列検索装置100は、検索対象となる母集団である文字列群の入力を受け付けると(ステップS601)、母集団登録部130は、文字列群のうち最初に入力された文字列を取得する(ステップS602)。
When the character
続いて距離方向算出部120は、変数n=0とする(ステップS603)。続いて距離方向算出部120は、n=n+1とし、ステップS602で取得した文字列から、n番目の文字を取得する(ステップS604)。続いて距離方向算出部120は、n番目の文字が文字列における最後の文字か否かを判断する(ステップS605)。
Subsequently, the distance
ステップS605において最後の文字であった場合、後述するステップS608へ進む。ステップS605において最後の文字でない場合、距離方向算出部120は、文字座標列表210におけるn番目の文字とn+1番目の文字の座標を取得し、n番目の文字とn+1番目の文字の位置関係を示すベクトルを算出する(ステップS606)。具体的には距離方向算出部120は、n番目の文字とn+1番目の文字の間の距離と、n番目の文字に対するn+1番目の文字の文字座標列表210における方向と、を算出する。算出の方法は、上述した通りである。
If it is the last character in step S605, the process proceeds to step S608 described later. If it is not the last character in step S605, the distance
続いて母集団登録部130は、ステップS602で取得した文字列と、n番目の文字とn+1番目の文字のベクトルとを対応付けて母集団データベース220に格納し(ステップS607)、ステップS604へ戻る。
Subsequently, the
本実施例の母集団登録部130は、ステップS604〜ステップS607の処理を繰り返すことで、文字列に含まれる全ての文字について、文字と文字との位置関係を示すベクトルを取得することができる。
The
ステップS605において、n+1番目の文字が文字列における最後の文字であった場合、母集団登録部130は、ステップS601で入力された全ての文字列に対して、ステップS604からステップS607の処理を実行したか否かを判断する(ステップS608)。ステップS608において、全ての文字列について処理を実行していない場合、母集団登録部130はステップS602へ戻る。ステップS608において全ての文字列について処理を実行した場合、母集団登録部130は、母集団の登録の処理を終了する。
In step S605, when the (n + 1) th character is the last character in the character string, the
図7は、母集団データベースの一例を示す図である。 FIG. 7 is a diagram illustrating an example of a population database.
図7に示す母集団データベース220は、文字列と、文字列に含まれる文字と文字の位置関係を示すベクトルとが対応付けられて格納されている。図7に示す母集団データベース220は、母集団として入力された文字列群が例えば星座の名前であった場合を示している。
The
図7に示す母集団データベース220は、情報の項目として、星座名を示す文字列、星座の英語名を示す文字列、英語名の発音を示す文字列、英語名の発音を示す文字列に含まれる各文字、各文字の文字座標列表210における座標を含む。また母集団データベース220は、情報の項目として、英語名の発音を示す文字列の文字間の距離と方向、すなわち文字と文字の位置関係を示すベクトルを含む。
The
具体的には、項目「距離1」は文字列に含まれる1番目の文字と2番目の文字との間の距離を示し、項目「方向1」は文字列に含まれる1番目の文字に対する2番目の文字の方向を示す。したがって、1番目の文字と2番目の文字の位置関係は、ベクトル(距離1,方向1)と表すことができる。
Specifically, the item “
同様に項目「距離2」は、文字列に含まれる2番目の文字と3番目の文字との間の距離を示し、項目「方向2」は文字列に含まれる2番目の文字に対する3番目の文字の方向を示す。したがって、2番目の文字と3番目の文字の位置関係は、ベクトル(距離2,方向2)と表すことができる。
Similarly, the item “
具体的には例えば、文字列「バランス」において、文字「バ」と文字「ラ」の関係は、ベクトル(5.00,0.00)で示すことができる。また文字「ラ」と文字「ン」の関係は、ベクトル(9.00,0.00)で示すことができる。また文字「ン」と文字「ス」の関係は、ベクトル(15.13,−7.59)で示すことができる。よって文字列「バランス」に含まれる各文字間の関係は、ベクトルの列(5.00,0.00),(9.00,0.00),(15.13,−7.59)で示すことができる。すなわち本実施例のベクトルの列は、文字列「バランス」に含まれる各文字の文字座標列表210における遷移の方向を順に示している。言い換えれば、本実施例のベクトルの列は、文字列「バランス」に含まれる各文字の文字座標列表210における遷移パターンを特定する値の組みの列である。 Specifically, for example, in the character string “balance”, the relationship between the character “B” and the character “La” can be represented by a vector (5.00, 0.00). The relationship between the character “La” and the character “N” can be represented by a vector (9.00, 0.00). The relationship between the character “n” and the character “su” can be represented by a vector (15.13, −7.59). Therefore, the relationship between the characters included in the character string “balance” is a vector sequence (5.00, 0.00), (9.00, 0.00), (15.13, −7.59). Can show. That is, the vector sequence of this embodiment sequentially indicates the transition direction in the character coordinate sequence table 210 of each character included in the character sequence “balance”. In other words, the vector sequence in this embodiment is a set of values specifying a transition pattern in the character coordinate sequence table 210 of each character included in the character sequence “balance”.
本実施例の母集団データベース220において、文字列から算出されたベクトルの列は、文字列と対応付けられた1つのレコードとして格納される。
In the
尚図7に示す母集団データベース220は、星座の名前が格納されたものとしたが、これに限定されない。母集団データベース220は、様々なカテゴリ毎に設けられていても良い。例えば本実施例の文字列検索装置100は、薬品名が格納された母集団データベースや、キャラクタの名前が格納された母集団データベース等を有していても良い。
Although the
次に、図8を参照して本実施例の文字列検索装置100における検索について説明する。図8は、文字列検索装置における検索の処理を説明するフローチャートである。
Next, the search in the character
本実施例の文字列検索装置100において、入力受付部110が検索キーとなる文字列の入力を受け付けると(ステップS801)、距離方向算出部120は、変数n=0とする(ステップS802)。
In the character
図8のステップS803からステップS805までの処理は、図6のステップS604からステップS606までの処理と同様であるから、説明を省略する。 The processing from step S803 to step S805 in FIG. 8 is the same as the processing from step S604 to step S606 in FIG.
ステップS803からステップS805までの処理により、検索キーにおける文字と文字の位置関係を示すベクトルの列が算出される。 Through the processing from step S803 to step S805, a sequence of vectors indicating the positional relationship between characters in the search key is calculated.
本実施例の文字列検索装置100において許容範囲設定部140は、ベクトルの列に含まれる各ベクトルから方向の値を取得し、各方向の値に予め決められた方向パラメータを設定する(ステップS806)。ステップS806では、ベクトルの列から方向の値の列が取得され、各方向の値に方向パラメータが設定される。したがってステップS806では、所定範囲の方向の値の列が取得される。
In the character
続いて検索部150は、母集団データベース220を、ステップS806で取得した所定範囲の方向の値の列で検索する(ステップS807)。
Subsequently, the
ステップS807の検索の結果、方向の値の列が、所定範囲の方向の値の列に含まれる文字列が存在しない場合(ステップS808)、文字列検索装置100は、後述するステップS814へ進む。ステップS807の検索の結果、該当する文字列が存在する場合、文字列抽出部160は、該当する文字列を抽出する(ステップS809)。
As a result of the search in step S807, if there is no character string included in the direction value string in the direction value string in the predetermined range (step S808), the character
続いて検索部150は、ベクトルの列に含まれる各ベクトルから距離の値を取得し、各距離の値に予め決められた距離パラメータを設定する(ステップS810)。ステップS810は、各ベクトルから取得され距離の値の列が取得され、各距離の値に距離パラメータが設定される。したがってステップS810では、所定範囲の距離の値の列が取得される。
Subsequently, the
続いて検索部150は、ステップS809で抽出した文字列を、ステップS810で取得した所定範囲の距離の値の列で検索する(ステップS811)。
Subsequently, the
ステップS811の検索の結果、ステップS809で抽出された文字列において、距離の値の列が所定範囲の距離の値の列に含まれる文字列が存在しない場合(ステップS812)、文字列検索装置100は、後述するステップS814へ進む。ステップS811の検索の結果、該当する文字列が存在する場合、文字列抽出部160は、該当する文字列を抽出し、出力部170は、抽出された文字列を検索結果として出力装置12に表示させる(ステップS813)。ステップS813で出力される文字列は、検索キーと関連した文字列である。
As a result of the search in step S811, in the character string extracted in step S809, if there is no character string in which the distance value column is included in the distance value column in the predetermined range (step S812), the character
続いて文字列検索装置100は、入力受付部110において、パラメータの調整を受け付けたか否かを判断する(ステップS814)。
Subsequently, the character
ステップS814においてパラメータが調整された場合、文字列検索装置100はステップS806の処理へ戻る。ステップS814においてパラメータが調整されない場合、文字列検索装置100は処理を終了する。
When the parameter is adjusted in step S814, the character
本実施例では、ステップS813で出力された検索キーと関連する文字列に、取得すべき目的の文字列が含まれている場合には、検索の処理を終了しても良い。また検索キーと関連する文字列に、目的の文字列の一部が含まれている場合には、目的の文字列の一部を検索キーとして再度検索を行っても良い。 In this embodiment, if the target character string to be acquired is included in the character string associated with the search key output in step S813, the search process may be terminated. If the character string related to the search key includes a part of the target character string, the search may be performed again using a part of the target character string as the search key.
以下に図8で説明した検索の処理について具体的に説明する。図9は、検索キーとなる文字列に含まれる文字間の方向と距離の一例を示す図である。 The search process described with reference to FIG. 8 will be specifically described below. FIG. 9 is a diagram illustrating an example of the direction and distance between characters included in a character string serving as a search key.
図9では、検索キーとして「ヤンス」という文字列が入力された場合について説明する。本実施例の距離方向算出部120は、文字座標列表210を参照し、文字「ヤ」と文字「ン」の位置関係を示すベクトルを算出する。
FIG. 9 illustrates a case where a character string “Yance” is input as a search key. The distance
図9の例では、文字「ヤ」と文字「ン」の距離は10.00であり、文字「ヤ」に対する文字「ン」の方向を示す値は0.00である。よって文字座標列表210における文字「ヤ」と文字「ン」の位置関係は、ベクトル(10.00,0.00)で示される。同様に文字「ン」と文字「ス」の距離は15.13であり、文字「ン」に対する文字「ス」の方向を示す値は−7.59である。よって文字座標列表210における文字「ン」と文字「ス」の位置関係は、ベクトル(15.13,−7.59)で示される。 In the example of FIG. 9, the distance between the character “Y” and the character “N” is 10.00, and the value indicating the direction of the character “N” with respect to the character “Y” is 0.00. Therefore, the positional relationship between the character “Y” and the character “N” in the character coordinate sequence table 210 is represented by a vector (10.00, 0.00). Similarly, the distance between the character “n” and the character “su” is 15.13, and the value indicating the direction of the character “su” with respect to the character “n” is −7.59. Therefore, the positional relationship between the character “n” and the character “su” in the character coordinate sequence table 210 is represented by a vector (15.13, −7.59).
したがって、検索キー「ヤンス」に含まれる各文字と文字の位置関係は、ベクトルの列(10.00,0.00)、(15.13,−7.59)により示される。本実施例では、図8のステップS805までの処理で、検索キーの含まれる各文字と文字の位置関係を示すベクトルの列が得られる。 Therefore, the positional relationship between each character included in the search key “Yance” is indicated by vector columns (10.00, 0.00) and (15.13, −7.59). In the present embodiment, a string of vectors indicating the positional relationship between each character included in the search key is obtained by the processing up to step S805 in FIG.
次にステップS806の処理を具体的に説明する。 Next, the process of step S806 will be specifically described.
本実施例の許容範囲設定部140は、ベクトルの列(10.00,0.00)、(15.13,−7.59)から、方向の値の列を取得する。各ベクトルにおける方向の値は、0.00,−7.59であるから、ここで取得される方向の値の列は、0.00,−7.59である。
The allowable
つぎに本実施例の許容範囲設定部140は、それぞれの方向の値に方向パラメータを設定する。本実施例では、例えば方向パラメータを±2.00とした。許容範囲設定部140は、それぞれの方向に値に、方向パラメータを±2.00を設定することで、方向の値を所定範囲の方向の値とする。
Next, the permissible
方向の値0.00は、方向パラメータ±2.00が設定されると、範囲−2.00〜2.00の方向の値となる。方向の値−7.59は、方向パラメータ±2.00が設定されると、範囲−9.59〜−5.59の方向の値となる。 The direction value 0.00 becomes a direction value in the range of -2.00 to 2.00 when the direction parameter ± 2.00 is set. The direction value −7.59 becomes a direction value in the range −9.59 to −5.59 when the direction parameter ± 2.00 is set.
したがって方向の値の列は、(−2.00〜2.00),(−9.59〜−5.59)という所定範囲の方向の値の列となる。ステップS806では、この所定範囲の方向の値の列が取得される。 Therefore, the direction value column is a column of direction values in a predetermined range of (−2.00 to 2.00) and (−9.59 to −5.59). In step S806, a sequence of values in the direction of the predetermined range is acquired.
次に検索部150は、母集団データベース220から、所定範囲の方向の値の列(−2.00〜2.00),(−9.59〜−5.59)に方向の列の値が含まれる文字列を検索する。
Next, the
本実施例の母集団データベース220において、英語名の発音を示す文字列「バランス」から得られるベクトルの列は、(5.00,0.00),(9.00,0.00),(15.13,−7.59)てである。またこのベクトルの列から取得される方向の値の列は、0.00,0.00,−7.59である。
In the
この方向の値の列に含まれる列0.00,−7.59は、所定範囲の方向の値の列(−2.00〜2.00),(−9.59〜−5.59)に含まれる。よってステップS809では、文字列抽出部160により文字列「バランス」が抽出される。
Columns 0.00 and -7.59 included in this direction value column are value columns (-2.00 to 2.00) and (-9.59 to -5.59) in a predetermined range. include. Therefore, in step S809, the character string “balance” is extracted by the character
以上のように本実施例では、検索キーに含まれる文字と文字から得たベクトルを所定範囲の値の組みとすることで、文字座標列表210において検索キーに含まれる各文字の位置関係と所定の類似関係にある文字列を抽出できる。 As described above, in this embodiment, the character contained in the search key and the vector obtained from the character are set as a set of values within a predetermined range, whereby the positional relationship between each character included in the search key and the predetermined value in the character coordinate sequence table 210 are determined. Character strings with similar relationships can be extracted.
ここで、母集団データベース220に該当する文字列が存在しなかった場合について考える。本実施例では、この場合に所定範囲を広げるように、方向パラメータを調整(変更)することができる。
Here, consider a case where there is no corresponding character string in the
具体的には例えば、方向パラメータを±2.00から±3.00とすれば、文字座標列表210における文字間の角度がより広い範囲である文字列を該当文字列として抽出することができる。よって母集団データベース220からより多くの候補となる文字列を抽出することができる。
Specifically, for example, when the direction parameter is set to ± 2.00 to ± 3.00, a character string having a wider angle between characters in the character coordinate sequence table 210 can be extracted as the corresponding character string. Therefore, more candidate character strings can be extracted from the
ステップS807で文字列「バランス」が抽出されると、次に検索部150は、ベクトルの列(10.00,0.00)、(15.13,−7.59)から、距離の値の列を取得する。各ベクトルにおける距離の値は、10.00,15.13であるから、ここで取得される方向の値の列は、10.00,15.13である。
When the character string “balance” is extracted in step S807, the
つぎに本実施例の許容範囲設定部140は、それぞれの距離の値に距離パラメータを設定する。本実施例では、例えば距離パラメータを±1.00とした。許容範囲設定部140は、それぞれの距離の値に、距離パラメータを±1.00を設定することで、距離の値を所定範囲の距離の値とする。
Next, the allowable
距離の値10.00は、距離パラメータ±1.00が設定されると、範囲9.00〜11.00の距離の値となる。距離の値15.13は、距離パラメータ±1.00が設定されると、範囲14.13〜16.13の距離の値となる。 The distance value 10.00 is a distance value in the range 9.00 to 11.00 when the distance parameter ± 1.00 is set. The distance value 15.13 is a distance value in the range 14.13 to 16.13 when the distance parameter ± 1.00 is set.
したがって距離の値の列は、(9.00〜11.00),(14.13〜16.13)という所定範囲の距離の値の列となる。ステップS810では、この所定範囲の距離の値の列が取得される。 Therefore, the column of distance values is a column of distance values in a predetermined range of (9.00 to 11.00) and (14.13 to 16.13). In step S810, a sequence of distance values within the predetermined range is acquired.
次に検索部150は、ステップS809で抽出された文字列から、所定範囲の距離の値の列(9.00〜11.00),(14.13〜16.13)に距離の値の列が含まれる文字列を検索する。
Next, the
ステップS809で抽出された文字列は、「バランス」である。「バランス」の距離の値の列は、10.00,15.13であり、所定範囲の距離の値の列(9.00〜11.00),(14.13〜16.13)に含まれる。 The character string extracted in step S809 is “balance”. The “balance” distance value columns are 10.00 and 15.13, and are included in the distance value columns (9.00 to 11.00) and (14.13 to 16.13) in the predetermined range. It is.
よって出力部170は、検索キー「ヤンス」と関連する文字列として、「バランス」を出力装置12に表示させる。
Therefore, the
ここで、ステップS809で抽出された文字列に該当する文字列が存在しなかった場合について考える。本実施例では、この場合に所定範囲を広げるように、距離パラメータを調整(変更)しても良い。距離パラメータの範囲を広げれば、文字座標列表210におけるける文字間の距離がより広い範囲である文字列を該当文字列として抽出できる。 Here, consider a case where there is no character string corresponding to the character string extracted in step S809. In this embodiment, the distance parameter may be adjusted (changed) so as to widen the predetermined range in this case. If the range of the distance parameter is expanded, a character string having a wider distance between characters in the character coordinate string table 210 can be extracted as the corresponding character string.
また本実施例では、方向パラメータの範囲と距離パラメータの範囲とを狭くするように調整することもできる。 In this embodiment, the range of the direction parameter and the range of the distance parameter can be adjusted to be narrow.
本実施例において、例えば検索キーと関連する文字列として、複数の文字列が抽出された場合、ステップS814において方向パラメータの範囲と距離パラメータの範囲を狭くすれば、文字と文字の位置関係がより検索キーと類似した文字列を抽出することができる。 In this embodiment, for example, when a plurality of character strings are extracted as character strings related to the search key, if the range of the direction parameter and the range of the distance parameter are narrowed in step S814, the positional relationship between the characters is more improved. A character string similar to the search key can be extracted.
また本実施例では、方向パラメータと距離パラメータとを設定してから検索部150による検索を行うものとしたが、これに限定されない。
In the present embodiment, the search is performed by the
例えば文字列検索装置100は、最初に検索キーから得られたベクトルの列を用いて母集団データベース220を検索しても良い。この検索により抽出される文字列は、検索キーと同じ文字列を含む文字列となる。また文字列検索装置100は、検索キーから得られたベクトルの列を用いた検索において、該当する文字列が存在しなかった場合に、方向パラメータと距離パラメータを設定し、再度検索を行っても良い。また設定するパラメータは、方向パラメータ又は距離パラメータの何れか一方であっても良い。
For example, the character
また本実施例では、母集団データベース220は、検索対象となる文字列群のベクトルの列が母集団登録部130により予め登録されているものとして説明したが、これに限定されない。文字列検索装置100は、例えばる文字列群のみが予め母集団データベース220に格納されており、検索の処理と並行して文字列群に含まれる各文字列のベクトルの列を算出しても良い。
In this embodiment, the
以下に図10、図11を参照し、本実施例における検索キーの入力画面と、検索結果の出力画面について説明する。 The search key input screen and search result output screen in this embodiment will be described below with reference to FIGS.
図10は、検索キーの入力画面の一例を示す図である。図10に示す入力画面101は、検索キーとなる文字列の入力欄102と、パラメータの範囲を設定する設定バー103と、検索の実行を指示する指示ボタン104、105とが表示されている。
FIG. 10 is a diagram illustrating an example of a search key input screen. An
本実施例では、例えば設定バー103上のスライダ103aを上下させることで、パラメータの値が調整されても良い。尚図10の例では、パラメータを設定する設定バー103は1つのみ表示されるものとしたが、設定バー103は、方向パラメータと距離パラメータのそれぞれと対応して2つ表示されても良い。または図10に示す設定バー103により設定された範囲が、方向パラメータと距離パラメータの両方に設定されても良い。
In this embodiment, the parameter value may be adjusted by moving the
また本実施例の文字列検索装置100は、入力画面101において指示ボタン104が操作された際は、パラメータを設定せずに検索を行っても良い。また本実施例の文字列検索装置100は、入力画面101において指示ボタン105が操作された際は、設定バー103で設定されたパラメータを用いて検索を行っても良い。
The character
図11は、検索結果が表示された出力画面の一例を示す図である。 FIG. 11 is a diagram illustrating an example of an output screen on which search results are displayed.
本実施例の出力画面111には、検索キーと関連する文字列が表示される表示欄112と、検索の結果抽出された文字列の数を表示するメッセージ113とが表示される。また本実施例の出力画面111には、再検索の実行を指示する指示ボタン106が表示される。本実施例の文字列検索装置100は、例えば設定バー103でパラメータの範囲が調整された後に指示ボタン106が操作されたとき、再検索を実行しても良い。また本実施例の文字列検索装置100は、例えば入力欄102に新たな検索キーが入力された後に指示ボタン106が操作されたとき、検索を実行しても良い。
On the
以上のように本実施例の文字列検索装置100は、検索対象となる文字列群について、文字座標列表210に基づき、各文字列における文字と文字の位置関係を示すベクトルを予め算出し、母集団データベース220に登録する。
As described above, the character
また本実施例の文字列検索装置100は、検索キーが入力されると、検索対象となる文字列群を母集団データベース220に登録する際に用いた文字座標列表210に基づき、検索キーに含まれる文字と文字の位置関係を示すベクトルを算出する。
In addition, when a search key is input, the character
そして本実施例の文字列検索装置100は、検索キーから得られたベクトルを用いて、母集団データベース220を検索する。
The character
すなわち本実施例では、五十音表に基づく文字座標列表210における文字と文字の位置関係を検索に用いることで、検索キーが検索により得られる目的の文字列と一致していなくても、検索キーと関連する文字列を検索することができる。したがって本実施例では、目的の文字列の一部を正確に入力できない場合でも、検索を行うことができる。 That is, in this embodiment, by using the positional relationship between characters in the character coordinate sequence table 210 based on the Japanese syllabary table for the search, even if the search key does not match the target character string obtained by the search, the search is performed. You can search for strings associated with keys. Therefore, in this embodiment, a search can be performed even when a part of the target character string cannot be accurately input.
本実施例の文字列検索装置100は、例えば図書館における蔵書の検索や、薬品名や外国の地名等のカタカナ文字で類似した名称が多い文字列群(データベース)における所望の文字列の検索等に用いることができる。これらの検索に本実施例の文字列検索装置100を用いることで、蔵書の名称や薬品の名称、地名等を正確に記憶していなくても、正しい名称や地名の候補を検索キーと関連する文字列とてして抽出することができる。
The character
また本実施例の文字列検索装置100は、例えば母集団データベースを教材に関する情報が格納されたデータベースとしても良い。この場合、問いを検索キーとして入力させ、検索結果として出力された検索キーと関連する文字列を問いに対するヒントとして提供しても良い。
Moreover, the character
開示の技術では、以下に記載する付記のような形態が考えられる。
(付記1)
第一の文字列に含まれる各文字の母音成分の遷移パターンを特定し、
特定した前記遷移パターンと所定の類似関係を満たす遷移パターンで各文字の母音成分が遷移する第二の文字列を特定し、
前記第二の文字列を前記第一の文字列の関連文字列として出力するか、又は前記第二の文字列を検索キーとした検索を実行する、
処理をコンピュータに実行させる文字列検索プログラム。
(付記2)
第一の文字列に含まれる各文字の五十音表に基づく文字の配列における遷移の方向と順を示すベクトルの列を特定し、
前記ベクトルの列と所定の類似関係を満たすベクトルの列によって前記配列における遷移の方向と順が示される第二の文字列を特定し、
前記第二の文字列を前記第一の文字列の関連文字列として出力するか、又は前記第二の文字列を検索キーとした検索を実行する、
処理をコンピュータに実行させる文字列検索プログラム。
(付記3)
前記ベクトルは、
前記配列における第一の文字と第二の文字との間の距離を示す値と、前記第一の文字に対する前記第二の文字の角度を示す値との組みであり、
前記所定の類似関係を満たすベクトルの列は、
前記第一の文字列に含まれる各文字から得られたベクトルの前記距離を示す値と前記角度の値との差分が所定の範囲内のベクトルの列である付記2記載の文字列検索プログラム。
(付記4)
前記五十音表に基づく文字の配列は、清音と濁音とを含む付記2又は3記載の文字列検索プログラム。
(付記5)
前記第二の文字列を特定する処理は、
文字列群の文字列毎に、前記文字列に含まれる各文字から得られた前記配列におけるベクトルの列が格納された記憶部において、前記第一の文字列から特定されたベクトルの列と前記所定の類似関係を満たすベクトルの列と対応する文字列を第二の文字列に特定する付記2乃至4の何れか一項に記載の文字列検索プログラム。
(付記6)
入力された前記文字列群の文字列毎に、前記文字列に含まれる各文字の前記配列におけるベクトルの列を算出し、
前記文字列と前記ベクトルの列とを対応させて前記記憶部に格納する処理をコンピュータに実行させる付記5記載の文字列検索プログラム。
(付記7)
コンピュータによる文字列検索方法であって、該コンピュータが、
第一の文字列に含まれる各文字の母音成分の遷移パターンを特定し、
特定した前記遷移パターンと所定の類似関係を満たす遷移パターンで各文字の母音成分が遷移する第二の文字列を特定し、
前記第二の文字列を前記第一の文字列の関連文字列として出力するか、又は前記第二の文字列を検索キーとした検索を実行する文字列検索方法。
(付記8)
コンピュータによる文字列検索方法であって、該コンピュータが、
第一の文字列に含まれる各文字の五十音表に基づく文字の配列における遷移の方向と順を示すベクトルの列を特定し、
前記ベクトルの列と所定の類似関係を満たすベクトルの列によって前記配列における遷移の方向と順が示される第二の文字列を特定し、
前記第二の文字列を前記第一の文字列の関連文字列として出力するか、又は前記第二の文字列を検索キーとした検索を実行する文字列検索方法。
(付記9)
第一の文字列に含まれる各文字の母音成分の遷移パターンを特定する第一特定部と、
特定した前記遷移パターンと所定の類似関係を満たす遷移パターンで各文字の母音成分が遷移する第二の文字列を特定する第二特定部と、
前記第二の文字列を前記第一の文字列の関連文字列として出力するか、又は前記第二の文字列を検索キーとした検索を実行する制御部と、を有する文字列検索装置。
(付記10)
第一の文字列に含まれる各文字の五十音表に基づく文字の配列における遷移の方向と順を示すベクトルの列を特定する第一特定部と、
前記ベクトルの列と所定の類似関係を満たすベクトルの列によって前記配列における遷移の方向と順が示される第二の文字列を特定する第二特定部と、
前記第二の文字列を前記第一の文字列の関連文字列として出力するか、又は前記第二の文字列を検索キーとした検索を実行する制御部と、を有する文字列検索装置。
In the disclosed technology, forms such as the following supplementary notes are conceivable.
(Appendix 1)
Identify the transition pattern of the vowel component of each character in the first string,
Identify a second character string in which the vowel component of each character transitions in a transition pattern that satisfies a predetermined similarity relationship with the identified transition pattern;
Outputting the second character string as a related character string of the first character string, or executing a search using the second character string as a search key;
A string search program that causes a computer to execute processing.
(Appendix 2)
Identify a vector string indicating the direction and order of transition in the character array based on the alphabetic table of each character included in the first character string,
Identifying a second character string indicating the direction and order of transition in the array by a vector sequence satisfying a predetermined similarity relationship with the vector sequence;
Outputting the second character string as a related character string of the first character string, or executing a search using the second character string as a search key;
A string search program that causes a computer to execute processing.
(Appendix 3)
The vector is
A combination of a value indicating the distance between the first character and the second character in the array and a value indicating the angle of the second character with respect to the first character;
A sequence of vectors satisfying the predetermined similarity relationship is
The character string search program according to
(Appendix 4)
The character string search program according to
(Appendix 5)
The process of specifying the second character string is as follows:
For each character string in the character string group, in a storage unit storing a vector string in the array obtained from each character included in the character string, the vector string specified from the first character string and the The character string search program according to any one of
(Appendix 6)
For each character string of the input character string group, calculate a sequence of vectors in the array of each character included in the character string,
The character string search program according to
(Appendix 7)
A character string search method by a computer, wherein the computer
Identify the transition pattern of the vowel component of each character in the first string,
Identify a second character string in which the vowel component of each character transitions in a transition pattern that satisfies a predetermined similarity relationship with the identified transition pattern;
A character string search method for outputting the second character string as a related character string of the first character string or executing a search using the second character string as a search key.
(Appendix 8)
A character string search method by a computer, wherein the computer
Identify a vector string indicating the direction and order of transition in the character array based on the alphabetic table of each character included in the first character string,
Identifying a second character string indicating the direction and order of transition in the array by a vector sequence satisfying a predetermined similarity relationship with the vector sequence;
A character string search method for outputting the second character string as a related character string of the first character string or executing a search using the second character string as a search key.
(Appendix 9)
A first specifying unit that specifies a transition pattern of a vowel component of each character included in the first character string;
A second specifying unit that specifies a second character string in which a vowel component of each character transitions in a transition pattern that satisfies a predetermined similarity relationship with the specified transition pattern;
A character string search device comprising: a control unit that outputs the second character string as a related character string of the first character string or executes a search using the second character string as a search key.
(Appendix 10)
A first specifying unit for specifying a vector sequence indicating a direction and order of transition in an arrangement of characters based on the alphabetic table of each character included in the first character string;
A second specifying unit that specifies a second character string indicating a direction and order of transition in the array by a vector sequence satisfying a predetermined similarity relationship with the vector sequence;
A character string search device comprising: a control unit that outputs the second character string as a related character string of the first character string or executes a search using the second character string as a search key.
本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から
逸脱することなく、種々の変形や変更が可能である。
The present invention is not limited to the specifically disclosed embodiments, and various modifications and changes can be made without departing from the scope of the claims.
100 文字列検索装置
110 入力受付部
120 距離方向算出部
130 母集団登録部
140 許容範囲設定部
150 検索部
160 文字列抽出部
170 出力部
210 文字座標列表
220 母集団データベース
DESCRIPTION OF
Claims (8)
前記第二の文字列を出力するか、又は、前記第二の文字列を検索キーとした検索を実行する、
処理をコンピュータに実行させる文字列検索プログラム。 When the first character string is received, the distance and direction between the characters in the array table in which each character is arranged at a predetermined position based on the relationship between the vowel and the consonant in the order of each character included in the first character string. Identifying a vector string to be identified, identifying a second character string that is a vector string satisfying a predetermined similarity relationship,
Output the second character string, or execute a search using the second character string as a search key.
A string search program that causes a computer to execute processing.
前記ベクトルの列と所定の類似関係を満たすベクトルの列によって前記配列における遷移の方向と順が示される第二の文字列を特定し、
前記第二の文字列を前記第一の文字列の関連文字列として出力するか、又は前記第二の文字列を検索キーとした検索を実行する、
処理をコンピュータに実行させる文字列検索プログラム。 Identify a vector string indicating the direction and order of transition in the character array based on the alphabetic table of each character included in the first character string,
Identifying a second character string indicating the direction and order of transition in the array by a vector sequence satisfying a predetermined similarity relationship with the vector sequence;
Outputting the second character string as a related character string of the first character string, or executing a search using the second character string as a search key;
A string search program that causes a computer to execute processing.
前記配列における第一の文字と第二の文字との間の距離を示す値と、前記第一の文字に対する前記第二の文字の角度を示す値との組みであり、
前記所定の類似関係を満たすベクトルの列は、
前記第一の文字列に含まれる各文字から得られたベクトルの前記距離を示す値と前記角度の値との差分が所定の範囲内のベクトルの列である請求項2記載の文字列検索プログラム。 The vector is
A combination of a value indicating the distance between the first character and the second character in the array and a value indicating the angle of the second character with respect to the first character;
A sequence of vectors satisfying the predetermined similarity relationship is
3. The character string search program according to claim 2, wherein a difference between a value indicating the distance of the vector obtained from each character included in the first character string and the value of the angle is a vector string within a predetermined range. .
第一の文字列を受け付けると、前記第一の文字列に含まれる各文字の順に、母音と子音との関係に基づき所定の位置に各文字を配置した配列表における文字間の距離と方向を示すベクトルの列を特定して、所定の類似関係を満たすベクトルの列となる第二の文字列を特定し、
前記第二の文字列を出力するか、又は、前記第二の文字列を検索キーとした検索を実行する文字列検索方法。 A character string search method by a computer, wherein the computer
When the first character string is received, the distance and direction between the characters in the array table in which each character is arranged at a predetermined position based on the relationship between the vowel and the consonant in the order of each character included in the first character string. Identifying a vector string to be identified, identifying a second character string that is a vector string satisfying a predetermined similarity relationship,
A character string search method for outputting the second character string or performing a search using the second character string as a search key.
第一の文字列に含まれる各文字の五十音表に基づく文字の配列における遷移の方向と順を示すベクトルの列を特定し、
前記ベクトルの列と所定の類似関係を満たすベクトルの列によって前記配列における遷移の方向と順が示される第二の文字列を特定し、
前記第二の文字列を前記第一の文字列の関連文字列として出力するか、又は前記第二の文字列を検索キーとした検索を実行する文字列検索方法。 A character string search method by a computer, wherein the computer
Identify a vector string indicating the direction and order of transition in the character array based on the alphabetic table of each character included in the first character string,
Identifying a second character string indicating the direction and order of transition in the array by a vector sequence satisfying a predetermined similarity relationship with the vector sequence;
A character string search method for outputting the second character string as a related character string of the first character string or executing a search using the second character string as a search key.
前記第二の文字列を出力するか、又は、前記第二の文字列を検索キーとした検索を実行する制御部と、を有する文字列検索装置。 When the first character string is received, the distance and direction between the characters in the array table in which each character is arranged at a predetermined position based on the relationship between the vowel and the consonant in the order of each character included in the first character string. A specifying unit that specifies a vector string to be shown and specifies a second character string that is a vector string that satisfies a predetermined similarity relationship;
A character string search device comprising: a control unit that outputs the second character string or executes a search using the second character string as a search key.
前記ベクトルの列と所定の類似関係を満たすベクトルの列によって前記配列における遷移の方向と順が示される第二の文字列を特定する第二特定部と、
前記第二の文字列を前記第一の文字列の関連文字列として出力するか、又は前記第二の文字列を検索キーとした検索を実行する制御部と、を有する文字列検索装置。 A first specifying unit for specifying a vector sequence indicating a direction and order of transition in an arrangement of characters based on the alphabetic table of each character included in the first character string;
A second specifying unit that specifies a second character string indicating a direction and order of transition in the array by a vector sequence satisfying a predetermined similarity relationship with the vector sequence;
A character string search device comprising: a control unit that outputs the second character string as a related character string of the first character string or executes a search using the second character string as a search key.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013208505A JP6277655B2 (en) | 2013-10-03 | 2013-10-03 | Character string search program, character string search method, and character string search device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013208505A JP6277655B2 (en) | 2013-10-03 | 2013-10-03 | Character string search program, character string search method, and character string search device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015072630A JP2015072630A (en) | 2015-04-16 |
JP6277655B2 true JP6277655B2 (en) | 2018-02-14 |
Family
ID=53014945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013208505A Active JP6277655B2 (en) | 2013-10-03 | 2013-10-03 | Character string search program, character string search method, and character string search device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6277655B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102329127B1 (en) * | 2017-04-11 | 2021-11-22 | 삼성전자주식회사 | Apparatus and method for converting dialect into standard language |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH079654B2 (en) * | 1989-07-31 | 1995-02-01 | 日本電信電話株式会社 | Katakana word error detection and correction device |
JPH1064252A (en) * | 1996-08-14 | 1998-03-06 | Sony Corp | Retrieval-support apparatus |
JP3109642U (en) * | 2005-01-06 | 2005-05-19 | 株式会社エムティーアイ | Portable Korean input device |
JP2006227743A (en) * | 2005-02-15 | 2006-08-31 | Xing Inc | Retrieving device |
-
2013
- 2013-10-03 JP JP2013208505A patent/JP6277655B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015072630A (en) | 2015-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2016186805A5 (en) | ||
JP2012521025A (en) | Input method editor | |
CN104239289B (en) | Syllabification method and syllabification equipment | |
KR101936208B1 (en) | Method for providing notation of standard chinese pronunciation utilizing hangul block building rules and hangul vowel letters which fulfilling traditional four hu theory of chinese language as they are pronounced in modern korean hangul*language and system thereof | |
KR20170057623A (en) | An apparatus for the linguistically disabled to synthesize the pronunciation and the script of words of a plural of designated languages | |
JP6277655B2 (en) | Character string search program, character string search method, and character string search device | |
Godard | Unsupervised word discovery for computational language documentation | |
JP2019095603A (en) | Information generation program, word extraction program, information processing device, information generation method and word extraction method | |
JP5302784B2 (en) | Machine translation method and system | |
KR101777141B1 (en) | Apparatus and method for inputting chinese and foreign languages based on hun min jeong eum using korean input keyboard | |
JP5008248B2 (en) | Display processing apparatus, display processing method, display processing program, and recording medium | |
JP5169602B2 (en) | Morphological analyzer, morphological analyzing method, and computer program | |
JP2021089473A (en) | Document processing program, document processing device, and document processing method | |
KR102016805B1 (en) | Method and apparatus for providing chinese dictionary based on plane deployment | |
Pue | Acoustic Traces of Poetry in South Asia | |
JP6244993B2 (en) | Encouraging sound determination device, encouraging sound determination method, and encouraging sound determination computer program | |
JP2007171275A (en) | Language processor and language processing method | |
JP2014085724A (en) | Character string division device, model file learning device, and character string division system | |
JP7363107B2 (en) | Idea support devices, idea support systems and programs | |
JP4646078B2 (en) | Apparatus and method for extracting sets of interrelated specific expressions | |
JP2008158630A (en) | Image output device and image output method | |
KR101645420B1 (en) | Touch screen device for inputting traditional korean based on touch and method for inputting traditional korean based on touch of the touch screen device | |
JP2001109740A (en) | Device and method for preparing chinese document | |
JP2924089B2 (en) | Japanese pronunciation training machine | |
Helsen et al. | The Sticky Riff: Quantifying the Melodic Identities of Medieval Modes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160606 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170307 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170502 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171010 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6277655 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |