JP5522613B1 - Ticket issuing machine, station name enumeration program for ticket issuing machine, computer-readable recording medium in which station name enumeration program for ticket issuing machine is recorded, and station name enumeration method in ticket issuing machine - Google Patents
Ticket issuing machine, station name enumeration program for ticket issuing machine, computer-readable recording medium in which station name enumeration program for ticket issuing machine is recorded, and station name enumeration method in ticket issuing machine Download PDFInfo
- Publication number
- JP5522613B1 JP5522613B1 JP2013022956A JP2013022956A JP5522613B1 JP 5522613 B1 JP5522613 B1 JP 5522613B1 JP 2013022956 A JP2013022956 A JP 2013022956A JP 2013022956 A JP2013022956 A JP 2013022956A JP 5522613 B1 JP5522613 B1 JP 5522613B1
- Authority
- JP
- Japan
- Prior art keywords
- station name
- candidate station
- character
- candidate
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 235000016496 Panda oleosa Nutrition 0.000 claims abstract description 125
- 240000000220 Panda oleosa Species 0.000 claims abstract description 125
- 239000000284 extract Substances 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 5
- 241000209094 Oryza Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 241001168730 Simo Species 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Landscapes
- Ticket-Dispensing Machines (AREA)
Abstract
【課題】入力された文字が含まれる駅名を検索し、その駅名をオペレータにとって見やすく並べて表示することができる乗車券発券機などを提供する。
【解決手段】候補駅名(仮名)から、頻出語(仮名)、第一の未知語、を区分する読み仮名区分装置と、頻出語(仮名)および第一の未知語のうち、いずれかの文字列に含まれる検索文字の位置を解析する文字位置解析装置と、候補駅名から、頻出語、包含駅名、第二の未知語、を区分する候補駅名区分装置と、検索文字の位置に基づく候補駅名の並べ方である第一条件に基づいて候補駅名を並べ、候補駅名同士で共通する文字列を、頻出語、包含駅名、第二の未知語ごとに検出して計数し、計数した候補駅名同士で共通する文字列の個数に基づく候補駅名の並べ方である第二条件に基づいて候補駅名を並べる分析装置と、から乗車券発券機を構成する。
【選択図】図3The present invention provides a ticket issuing machine capable of searching for a station name including input characters and displaying the station name side by side for easy viewing by an operator.
SOLUTION: A reading kana classification device for classifying a frequent word (kana) and a first unknown word from candidate station names (kana), and any character of the frequent word (kana) and the first unknown word Character position analysis device that analyzes the position of the search character included in the column, candidate station name classification device that classifies frequent words, inclusion station name, second unknown word from candidate station name, and candidate station name based on the position of the search character Candidate station names are arranged based on the first condition that is the way of arrangement of, and the character string common to the candidate station names is detected and counted for each frequent word, inclusive station name, second unknown word, and between the candidate station names counted A ticket issuing machine is configured from an analyzer that arranges candidate station names based on a second condition that is a method of arranging candidate station names based on the number of common character strings.
[Selection] Figure 3
Description
本発明は、乗車券発券機、乗車券発券機の駅名列挙プログラム、乗車券発券機の駅名列挙プログラムが記録されたコンピュータで読み取り可能な記録媒体、および乗車券発券機における駅名列挙方法に関するものである。 The present invention relates to a ticket issuing machine, a station name enumeration program for a ticket issuing machine, a computer-readable recording medium in which a station name enumeration program for a ticket issuing machine is recorded, and a station name enumerating method in the ticket issuing machine. is there.
従来、定期券発行装置は、例えば鉄道などの交通機関の駅の窓口などで用いられ、定期券を発行する。オペレータ(鉄道会社の従業員)は、定期券の購入者の求めに応じて定期券発行装置に発着駅、経由駅を入力する。定期券発行装置は、駅名の一部の文字が入力されれば、その文字が含まれる駅名を検索し、表示部に表示する。入力された文字が含まれる駅名の候補が複数あれば、定期券発行装置はそれらをすべて表示する(下記特許文献1参照)。 Conventionally, a commuter pass issuing device is used at, for example, a window of a transportation station such as a railway, and issues a commuter pass. An operator (an employee of a railway company) inputs a departure / arrival station and a transit station in a commuter pass issuing device in response to a request from a commuter pass purchaser. The commuter pass issuance device searches for a station name including the character and displays it on the display unit when a part of the character of the station name is input. If there are a plurality of station name candidates that include the input characters, the commuter pass issuing device displays them all (see Patent Document 1 below).
入力された文字が含まれる駅名を複数表示する場合、この複数の駅名をオペレータにとって見やすく表示することができれば、オペレータが迅速に業務を遂行することができる。 When a plurality of station names including the input characters are displayed, the operator can quickly perform the operation if the plurality of station names can be displayed in an easy-to-read manner for the operator.
本発明は、上記の実情に鑑みて提案されたものである。すなわち、入力された文字が含まれる駅名を検索し、その駅名をオペレータにとって見やすく並べて表示することができる乗車券発券機、乗車券発券機の駅名列挙プログラム、乗車券発券機の駅名列挙プログラムが記録されたコンピュータで読み取り可能な記録媒体、および乗車券発券機における駅名列挙方法の提供を目的とする。 The present invention has been proposed in view of the above circumstances. In other words, the station name enumeration program, the station name enumeration program of the ticket issuing machine, and the station name enumeration program of the ticket issuing machine that can search the station name including the entered characters and display the station name side by side for easy viewing by the operator are recorded. Another object of the present invention is to provide a computer-readable recording medium and a station name enumeration method in a ticket issuing machine.
上記目的を達成するために、本発明に係る乗車券発券機は、駅名が読み仮名と共に記憶された駅名記憶部から、入力された文字が含まれる前記駅名を抽出して候補駅名として表示する乗車券発券機において、前記駅名に用いられる頻度が高い文字である頻出語が読み仮名と共に記憶された頻出語記憶部と、前記頻出語記憶部を用いて、前記候補駅名の読み仮名から、前記頻出語の読み仮名部分、この頻出語の読み仮名部分以外の読み仮名部分である第一の未知語部分、を区分する読み仮名区分装置と、この読み仮名区分装置が区分した前記頻出語の読み仮名部分および前記第一の未知語部分のうち、いずれかの文字列に含まれる前記入力された文字の位置を解析する文字位置解析装置と、前記頻出語記憶部および前記駅名記憶部を用いて、前記候補駅名から、前記頻出語部分、前記候補駅名の文字列に含まれる前記駅名である包含駅名部分、および、前記頻出語部分および前記包含駅名部分以外の文字である第二の未知語部分、を区分する候補駅名区分装置と、前記文字位置解析装置が解析した前記入力された文字の位置に基づく前記候補駅名の並べ方を第一条件として、この第一条件に基づいて前記候補駅名を並べ、前記候補駅名同士で共通する文字列を、前記候補駅名区分装置が区分した頻出語部分、包含駅名部分、および第二の未知語部分ごとに検出して計数し、この計数した前記候補駅名同士で共通する文字列の個数に基づく前記候補駅名の並べ方を第二条件として、前記第一条件にしたがいつつ前記第二条件に基づいて前記候補駅名を並べる分析装置と、から構成された、ことを特徴としている。 In order to achieve the above object, a ticket issuing machine according to the present invention extracts a station name including input characters from a station name storage unit in which a station name is read and stored together with a pseudonym and displays it as a candidate station name. In the ticket-issuing machine, a frequent word storage unit in which frequently used words that are frequently used in the station name are stored together with a reading kana, and a frequent word storage unit that is used to generate the frequent occurrence from the reading kana of the candidate station name. A reading kana part for classifying the first kanji part of the word, the first unknown word part which is a reading kana part other than the reading kana part of the frequent word, and the reading kana of the frequent word divided by the reading kana classification part Among the part and the first unknown word part, using a character position analysis device that analyzes the position of the input character included in any character string, the frequent word storage unit and the station name storage unit, Previous From the candidate station name, the frequent word part, the inclusion station name part that is the station name included in the character string of the candidate station name, and the second unknown word part that is a character other than the frequent word part and the inclusion station name part, Candidate station name classifying device to classify, and the candidate station name based on the position of the input character analyzed by the character position analysis device as a first condition, the candidate station name is aligned based on the first condition, Character strings common to candidate station names are detected and counted for each frequent word part, inclusion station name part, and second unknown word part classified by the candidate station name classification device, and common to the counted candidate station names An analysis device that arranges the candidate station names based on the second condition while conforming to the first condition, with the arrangement of the candidate station names based on the number of character strings to be performed as a second condition It is characterized in that.
また、前記分析装置が、前記候補駅名区分装置が区分した頻出語部分、包含駅名部分、および第二の未知語部分の前記候補駅名における位置に基づく前記候補駅名の並べ方を第三条件として、前記第二条件にしたがいつつ前記第三条件に基づいて前記候補駅名を並べる、ことを特徴としている。 In addition, the analysis device, as a third condition, the arrangement of the candidate station name based on the position in the candidate station name of the frequent word portion, the inclusion station name portion, and the second unknown word portion divided by the candidate station name classification device, In accordance with the second condition, the candidate station names are arranged based on the third condition.
また、前記第一条件は、前記入力された文字の位置が、前記読み仮名区分装置が区分した前記頻出語の読み仮名部分および前記第一の未知語部分のうち、いずれかの先頭である前記候補駅名を、並べ方の上位とすることであり、前記第二条件は、前記計数した前記候補駅名同士で共通する文字列の個数が多い前記候補駅名を、並べ方の上位とすることであり、前記第三条件は、前記候補駅名区分装置が区分した頻出語部分、包含駅名部分、および第二の未知語部分の前記候補駅名における位置が先頭である前記候補駅名、途中である前記候補駅名、末尾である前記候補駅名の順に前記候補駅名を並べることである、ことを特徴としている。 Further, the first condition is that the position of the input character is the head of any one of the reading kana part of the frequent word and the first unknown word part classified by the reading kana classification device The candidate station name is to be placed at the top of the arrangement, and the second condition is to place the candidate station name having a large number of character strings in common between the counted candidate station names at the top of the arrangement, The third condition is that the position of the candidate station name at the top of the candidate station name of the frequent word part, the inclusion station name part, and the second unknown word part classified by the candidate station name classification device, the candidate station name in the middle, the end The candidate station names are arranged in the order of the candidate station names.
本発明に係る乗車券発券機の駅名列挙プログラムは、コンピュータを、前記駅名に用いられる頻度が高い文字である頻出語が読み仮名と共に記憶された頻出語記憶装置と、前記頻出語記憶部を用いて、前記候補駅名の読み仮名から、前記頻出語の読み仮名部分、この頻出語の読み仮名部分以外の読み仮名部分である第一の未知語部分、を区分する読み仮名区分装置と、この読み仮名区分装置が区分した前記頻出語の読み仮名部分および前記第一の未知語部分のうち、いずれかの文字列に含まれる前記入力された文字の位置を解析する文字位置解析装置と、前記頻出語記憶部および前記駅名記憶部を用いて、前記候補駅名から、前記頻出語部分、前記候補駅名の文字列に含まれる前記駅名である包含駅名部分、および、前記頻出語部分および前記包含駅名部分以外の文字である第二の未知語部分、を区分する候補駅名区分装置と、前記文字位置解析装置が解析した前記入力された文字の位置に基づく前記候補駅名の並べ方を第一条件として、この第一条件に基づいて前記候補駅名を並べ、前記候補駅名同士で共通する文字列を、前記候補駅名区分装置が区分した頻出語部分、包含駅名部分、および第二の未知語部分ごとに検出して計数し、この計数した前記候補駅名同士で共通する文字列の個数に基づく前記候補駅名の並べ方を第二条件として、前記第一条件にしたがいつつ前記第二条件に基づいて前記候補駅名を並べる分析装置と、して機能させる、ことを特徴としている。 The station name enumeration program for a ticket-issuing machine according to the present invention uses a computer, a frequent word storage device in which frequent words that are frequently used in the station name are read and stored together with kana, and the frequent word storage unit. A reading kana classification device for classifying the reading kana part of the frequent word from the reading kana of the candidate station name, and a first unknown word part that is a reading kana part other than the reading kana part of the frequent word, A character position analysis device that analyzes the position of the input character included in any one of the reading kana part and the first unknown word part of the frequent word classified by the kana classification device, and the frequent occurrence Using the word storage unit and the station name storage unit, from the candidate station name, the frequent word part, the inclusion station name part which is the station name included in the character string of the candidate station name, and the frequent word part and the previous A candidate station name classifying device that classifies a second unknown word part that is a character other than the inclusion station name part, and a method of arranging the candidate station names based on the position of the input character analyzed by the character position analyzing device The candidate station names are arranged based on the first condition, and the character string common to the candidate station names is divided into the frequent word part, the inclusion station name part, and the second unknown word part that are classified by the candidate station name classification device. The candidate station name is arranged based on the number of character strings common to the candidate station names thus counted as a second condition, and the candidate is based on the second condition according to the first condition. It is characterized by functioning as an analyzer that arranges station names.
本発明に係るコンピュータで読み取り可能な記録媒体は、上記した乗車券発券機の駅名列挙プログラムが記録されている、ことを特徴としている。 The computer-readable recording medium according to the present invention is characterized in that a station name listing program for the above-mentioned ticket issuing machine is recorded.
本発明に係る乗車券発券機における駅名列挙方法は、前記駅名に用いられる頻度が高い文字である頻出語が読み仮名と共に記憶された頻出語記憶部を備え、コンピュータを動作させるための、前記頻出語記憶部を用いて、前記候補駅名の読み仮名から、前記頻出語の読み仮名部分、この頻出語の読み仮名部分以外の読み仮名部分である第一の未知語部分、を区分する読み仮名区分手順と、この読み仮名区分装置が区分した前記頻出語の読み仮名部分および前記第一の未知語部分のうち、いずれかの文字列に含まれる前記入力された文字の位置を解析する文字位置解析手順と、前記頻出語記憶部および前記駅名記憶部を用いて、前記候補駅名から、前記頻出語部分、前記候補駅名の文字列に含まれる前記駅名である包含駅名部分、および、前記頻出語部分および前記包含駅名部分以外の文字である第二の未知語部分、を区分する候補駅名区分手順と、前記文字位置解析装置が解析した前記入力された文字の位置に基づく前記候補駅名の並べ方を第一条件として、この第一条件に基づいて前記候補駅名を並べ、前記候補駅名同士で共通する文字列を、前記候補駅名区分装置が区分した頻出語部分、包含駅名部分、および第二の未知語部分ごとに検出して計数し、この計数した前記候補駅名同士で共通する文字列の個数に基づく前記候補駅名の並べ方を第二条件として、前記第一条件にしたがいつつ前記第二条件に基づいて前記候補駅名を並べる分析手順と、を有する、ことを特徴としている。 The station name enumeration method in the ticket issuing machine according to the present invention includes the frequent word storage unit in which the frequent words that are frequently used in the station name are stored together with the reading kana, and the frequent frequency for operating the computer. Using a word storage unit, from the reading kana of the candidate station name, the reading kana part for dividing the reading kana part of the frequent word and the first unknown word part that is a reading kana part other than the reading kana part of the frequent word Character position analysis for analyzing the position of the input character included in any one of the procedure and the first kanji part and the first unknown word part of the frequent words sorted by the kana classifier Using the procedure, the frequent word storage unit and the station name storage unit, from the candidate station name, the frequent word part, the included station name part which is the station name included in the character string of the candidate station name, and Candidate station name classification procedure for classifying a second unknown word part that is a character other than the outgoing word part and the inclusion station name part, and the candidate station name based on the position of the input character analyzed by the character position analysis device Based on the first condition, the candidate station names are arranged based on the first condition, and the character string common to the candidate station names is divided into the frequent word part, the inclusion station name part, and the second Detecting and counting for each unknown word part, the second condition is based on the first condition, the second condition is a way of arranging the candidate station names based on the number of character strings common to the counted candidate station names And an analysis procedure for arranging the candidate station names on the basis of
本発明に係る乗車券発券機は上記した構成である。すなわち、読み仮名区分装置は、候補駅名の読み仮名から頻出語の読み仮名を区分する。入力された文字が頻出語の読み仮名(または頻出語の読み仮名の先頭)と一致すれば、その候補駅名はオペレータが所望する駅名である可能性が高い。同様に、入力された文字が第一の未知語(または第一の未知語の先頭)と一致すれば、その候補駅名はオペレータが所望する駅名である可能性が高い。分析装置はこの結果に基づいて、オペレータが所望する駅名である可能性が高い順に候補駅名を並べる。したがって、候補駅名をオペレータにとって見やすく並べて表示することができる。 The ticket issuing machine according to the present invention has the above-described configuration. That is, the reading kana classification device classifies the reading kana of frequent words from the reading kana of candidate station names. If the input characters match the frequently used word reading kana (or the top of the frequently used reading kana), the candidate station name is likely to be the station name desired by the operator. Similarly, if the input character matches the first unknown word (or the head of the first unknown word), the candidate station name is likely to be the station name desired by the operator. Based on this result, the analyzer arranges the candidate station names in the order of the possibility that the operator desires the station name. Therefore, the candidate station names can be displayed side by side for the operator.
候補駅名区分装置は、候補駅名から頻出語および包含駅名を区分する。分析装置は、頻出語、包含駅名、および第二の未知語のそれぞれにおいて、共通する文字列を計数する。文字列が共通する頻出語などを含む候補駅名同士は、頻出語などを通して関連性のある駅名である可能性が高い。分析装置はこの結果に基づいて、関連性のある駅名である可能性が高い候補駅名を並べる。したがって、候補駅名をオペレータにとって見やすく並べて表示することができる。 The candidate station name classification device classifies frequently used words and inclusive station names from candidate station names. The analysis device counts common character strings in the frequent words, the inclusive station names, and the second unknown words. It is highly possible that candidate station names including frequently used words with common character strings are related station names through frequently used words. Based on this result, the analysis apparatus arranges candidate station names that are highly likely to be related station names. Therefore, the candidate station names can be displayed side by side for the operator.
分析装置は、頻出語、包含駅名、および第二の未知語の候補駅名における位置を、先頭、途中、末尾に区分して順番に並べる。頻出語などが候補駅名の文字列(または候補駅名の先頭)と一致すれば、その候補駅名はオペレータが所望する駅名である可能性が高い。分析装置はこの結果に基づいて、オペレータが所望する駅名である可能性が高い順に候補駅名を並べる。したがって、候補駅名をオペレータにとって見やすく並べて表示することができる。 The analyzer sorts the positions of the frequent words, the inclusion station names, and the second unknown word candidate station names into the top, middle, and end in order. If the frequent word or the like matches the character string of the candidate station name (or the head of the candidate station name), the candidate station name is likely to be the station name desired by the operator. Based on this result, the analyzer arranges the candidate station names in the order of the possibility that the operator desires the station name. Therefore, the candidate station names can be displayed side by side for the operator.
本発明に係る乗車券発券機の駅名列挙プログラム、乗車券発券機の駅名列挙プログラムが記録されたコンピュータで読み取り可能な記録媒体、および乗車券発券機における駅名列挙方法は、上記した効果と同様の効果を奏する。 The station name enumeration program of the ticket issuing machine according to the present invention, the computer-readable recording medium in which the station name enumeration program of the ticket issuing machine is recorded, and the station name enumeration method in the ticket issuing machine have the same effects as described above There is an effect.
以下に、本発明の実施形態を図面に基づいて説明する。図1は本実施形態に係る乗車券発券機10の概略構成が示され、図2は本実施形態に係る乗車券発券機10のハードウェア構成が示されている。 Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 shows a schematic configuration of a ticket issuing machine 10 according to the present embodiment, and FIG. 2 shows a hardware configuration of the ticket issuing machine 10 according to the present embodiment.
図1において、乗車券発券機10は、処理部20、操作部30、出力部40、および制御部50から構成されている。なお、オプションとして、例えばカスタマディスプレイ、電源制御装置、LANボードなどが適宜増設される。 In FIG. 1, the ticket issuing machine 10 includes a processing unit 20, an operation unit 30, an output unit 40, and a control unit 50. As options, for example, a customer display, a power supply control device, a LAN board, etc. are added as appropriate.
処理部20は、クレジットカードに記憶された情報を読み取るクレジットカードリーダ21、クレジットカードの所有者を確認するための暗証番号が入力される暗証番号入力パッド22から構成されている。操作部30は、オペレータが情報を入力するタッチパネル31であり、キーボードやマウスを備えていてもよい。出力部40は、制御部50が検索した駅名などが表示されるCRTディスプレイや液晶ディスプレイ41、乗車券(例えば回数券、定期券など)およびそのレシートを発行する発券プリンタ42およびレシートプリンタ43、ICカード式乗車券に記憶された情報を更新するためのICカードプリンタ44から構成される。 The processing unit 20 includes a credit card reader 21 that reads information stored in a credit card, and a password input pad 22 into which a password for confirming the owner of the credit card is input. The operation unit 30 is a touch panel 31 on which an operator inputs information, and may include a keyboard and a mouse. The output unit 40 includes a CRT display or a liquid crystal display 41 on which a station name searched by the control unit 50 is displayed, a ticket (for example, a coupon ticket, a commuter pass, etc.) and a ticket issuing printer 42 and a receipt printer 43 for issuing a receipt thereof, an IC It consists of an IC card printer 44 for updating the information stored in the card type ticket.
制御部50は、上記した処理部20、操作部30、および出力部40を制御する。制御部50は、駅名記憶部51、頻出語記憶部52、読み仮名区分装置53、文字位置解析装置54、候補駅名区分装置55、および分析装置56から構成される。 The control unit 50 controls the processing unit 20, the operation unit 30, and the output unit 40 described above. The control unit 50 includes a station name storage unit 51, a frequent word storage unit 52, a reading kana classification device 53, a character position analysis device 54, a candidate station name classification device 55, and an analysis device 56.
制御部50は、処理部20、操作部30からの入力情報を検出すると共に、ROM3に格納されたプログラムに従って、CPU1に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの一部が格納されたRAM2を使用して上記各装置53から56を制御し、入力情報の処理結果を出力部40に出力する。 The control unit 50 detects input information from the processing unit 20 and the operation unit 30 and stores a part of an OS (Operating System) program and application programs to be executed by the CPU 1 in accordance with the program stored in the ROM 3. The respective devices 53 to 56 are controlled using the RAM 2, and the processing result of the input information is output to the output unit 40.
なお、制御部50を構成する各装置53から56は、ハードウェア構成、DSP(Digital Signal Processor)、MPU(Micro Processing Unit)、ソフトウェアによって実現することが可能である。例えば、ソフトウェアによって実現する場合、CPU、あるいはMPU、RAM、ROMなどを備えた乗車券発券機10により、RAMやROMに記憶されたプログラムが動作することによって実現できる。 Each of the devices 53 to 56 constituting the control unit 50 can be realized by a hardware configuration, a DSP (Digital Signal Processor), an MPU (Micro Processing Unit), and software. For example, when realized by software, it can be realized by operating a program stored in the RAM or ROM by the ticket issuing machine 10 provided with a CPU, MPU, RAM, ROM or the like.
したがって、乗車券発券機10が上記した各装置53から56の機能を果たすように動作させるプログラムを、例えばCD−ROM等の記録媒体に記録し、乗車券発券機10に読み込ませることによって実現できる。プログラムを記録する記録媒体としては、CD−ROM以外に、例えばフレキシブルディスク、光ディスク等を用いることができる。また、プログラムをインターネット等のネットワークを介して乗車券発券機10にダウンロードすることによっても実現できる。 Therefore, a program that causes the ticket issuing machine 10 to operate so as to perform the functions of the devices 53 to 56 described above can be realized by recording the program on a recording medium such as a CD-ROM and causing the ticket issuing machine 10 to read the program. . As a recording medium for recording the program, for example, a flexible disk, an optical disk or the like can be used in addition to the CD-ROM. It can also be realized by downloading the program to the ticket issuing machine 10 via a network such as the Internet.
駅名記憶部51、頻出語記憶部52は、制御部50に含まれるROM3、RAM2、HDD4などに格納されている。 The station name storage unit 51 and the frequent word storage unit 52 are stored in the ROM 3, RAM 2, HDD 4, etc. included in the control unit 50.
駅名記憶部51には、全国または一部の地域における鉄道会社の駅名が読み仮名と共に記憶されている。また、頻出語記憶部52には、駅名に用いられる頻出語が読み仮名と共に記憶されている。 The station name storage unit 51 stores the station names of railway companies in the whole country or a part of the area together with the reading pseudonym. The frequent word storage unit 52 stores frequently used words used as station names together with reading kana.
ここで頻出語とは、駅名に含まれる文字のうち、駅名に用いられる頻度が高い文字をいう。頻出語は、例えば、「東、西、南、北、新、中、本、中央、前」などの方位などに関する単語、「紀伊、大和」などの旧国名、都市名、地名に関する単語、「小田急、西鉄」などの各鉄道会社が提供している路線に関する単語、などが含まれる(図38参照)。 Here, a frequent word refers to a character that is frequently used for a station name among characters included in the station name. Frequent words include, for example, words related to directions such as “east, west, south, north, new, middle, book, center, front”, old country names such as “Kii, Yamato”, words related to city names, place names, “ This includes words related to routes provided by railway companies such as “Odakyu, Nishitetsu” (see FIG. 38).
なお、駅名や頻出語は一般的に、漢字、仮名文字、またはアルファベットで表記されるが、ほとんどが漢字表記であるため、以下、一般的に表記される駅名や頻出語そのものの文字列を、“駅名(漢字)”“頻出語(漢字)”と記す。一方で、読み仮名の文字列を“駅名(読み仮名)”“頻出語(読み仮名)”と記す。 Station names and frequent words are generally written in kanji, kana characters, or alphabets, but since most of them are written in kanji, the following are commonly used station names and frequently used character strings: “Station name (kanji)” “Frequently used words (kanji)”. On the other hand, the character string of the reading kana is written as “station name (reading kana)” “frequent word (reading kana)”.
読み仮名区分装置53、文字位置解析装置54、候補駅名区分装置55、および分析装置56は候補駅名を解析する。ここで、各装置53から56を用いた制御部50による処理手順を図面に基づいて説明する。図3は制御部50による処理の流れがステップS1からステップS9まで示されている。図4から図13は処理の流れの詳細が示され、図14から図22、および図27から図37は処理の結果が示され、図23から図28は処理の具体例が示されている。 The reading kana sorting device 53, the character position analyzing device 54, the candidate station name sorting device 55, and the analyzing device 56 analyze the candidate station names. Here, a processing procedure by the control unit 50 using the devices 53 to 56 will be described with reference to the drawings. FIG. 3 shows the flow of processing by the control unit 50 from step S1 to step S9. 4 to 13 show the details of the processing flow, FIGS. 14 to 22 and FIGS. 27 to 37 show the results of the processing, and FIGS. 23 to 28 show specific examples of the processing. .
ステップS1において、制御部50はオペレータによってタッチパネル31に入力された仮名文字を認識する。以下、“入力された仮名文字”を“検索文字”と記す。 In step S1, the control unit 50 recognizes a kana character input to the touch panel 31 by the operator. Hereinafter, “input kana characters” are referred to as “search characters”.
ステップS2において、制御部50は、部分一致検索によって検索文字が含まれる駅名(読み仮名)を駅名記憶部51から抽出する(図4参照)。抽出された複数の駅名(読み仮名)は、オペレータが所望する駅名の候補である候補駅名(読み仮名)である。検索文字は一文字以上であればよく、所望する駅名の頭文字の他、二番目の文字、三番目の文字などであってもよい。すなわち、制御部50は、検索文字を頭文字とする駅名、途中に含む駅名、末尾とする駅名の全てを抽出する。 In step S2, the control unit 50 extracts a station name (reading pseudonym) including a search character from the station name storage unit 51 by partial match search (see FIG. 4). The extracted plurality of station names (reading pseudonyms) are candidate station names (reading pseudonyms) that are candidates for the station name desired by the operator. The search character may be one or more characters, and may be the second character, the third character, etc. in addition to the initial character of the desired station name. That is, the control unit 50 extracts all of the station name having the initial character as the search character, the station name included in the middle, and the station name having the end.
ステップS3において、読み仮名区分装置53は、頻出語記憶部52に基づいて候補駅名(読み仮名)の文字列を、頻出語(読み仮名)と一致する部分と、第一の未知語となる部分とに区分する(図5参照)。ここで、第一の未知語とは、候補駅名(読み仮名)のうち頻出語(読み仮名)部分を除いた部分の読み仮名をいう。以下、区分された候補駅名(読み仮名)のうち、頻出語(読み仮名)と一致する部分を[A]、第一の未知語となる部分を[C]と記す。 In step S <b> 3, the reading kana sorting device 53 uses the frequent word storage unit 52 to match the character string of the candidate station name (reading kana) with the frequent word (reading kana) and the first unknown word. (See FIG. 5). Here, the first unknown word means a reading kana of a candidate station name (reading kana) excluding a frequently used word (reading kana). Hereinafter, of the classified candidate station names (reading kana), a portion that coincides with the frequent word (reading kana) is referred to as [A], and a portion that becomes the first unknown word is referred to as [C].
読み仮名区分装置53は最長一致法に基づいて候補駅名(読み仮名)の構文を解析し、処理する(図6参照)。解析を開始する位置は候補駅名(読み仮名)の文字列の頭文字の前に便宜的に設けた架空先頭文字とする(ステップS3−1)。読み仮名区分装置53は、架空先頭文字に候補駅名(読み仮名)の文字列の頭文字、二番目の文字、三番目の文字・・・末尾の文字を順に累積して付加しながらそれぞれの文字列が頻出語(読み仮名)と一致するか否かを判定する(ステップS3−2からS3−6)。判定の結果、これらの文字列のうち頻出語(読み仮名)と一致する文字列があればその文字列が[A]とされ(ステップS3−4)、一致しない文字列が[C]とされる(ステップS3−5)。読み仮名区分装置53は、候補駅名(読み仮名)の頭文字から始まるすべての文字列を判定する。 The reading-kana classification device 53 analyzes and processes the syntax of the candidate station name (reading-kana) based on the longest match method (see FIG. 6). The position at which the analysis is started is a fictitious head character provided for convenience before the initial character of the candidate station name (reading kana) character string (step S3-1). The reading-kana classification device 53 adds the initial character, the second character, the third character,. It is determined whether or not the column matches a frequent word (reading kana) (steps S3-2 to S3-6). As a result of the determination, if there is a character string that matches the frequent word (reading kana) among these character strings, the character string is set to [A] (step S3-4), and the character string that does not match is set to [C]. (Step S3-5). The reading-kana classification device 53 determines all character strings that start with the first letter of the candidate station name (reading-kana).
読み仮名区分装置53は、候補駅名(読み仮名)の頭文字から始まる文字列に(候補駅名(読み仮名)の文字列のうち解析を開始する位置が共通する文字列に)、[A]が含まれているか否かを判定する(ステップS3−7)。判定の結果、候補駅名(読み仮名)に[A]が含まれていればステップS3−8が処理され、含まれていなければステップS3−12が処理される。 The reading-a-kana sorting device 53 uses a character string starting with the initial character of the candidate station name (a reading kana) (to a character string having a common starting position in the character string of the candidate station name (a reading kana)), and [A] is It is determined whether it is included (step S3-7). As a result of the determination, if [A] is included in the candidate station name (reading pseudonym), step S3-8 is processed, and if not included, step S3-12 is processed.
読み仮名区分装置53は、候補駅名(読み仮名)の頭文字から始まる文字列に(候補駅名(読み仮名)の文字列のうち解析を開始する位置が共通する文字列に)、複数の[A]が含まれる場合、最も文字数が多い[A]を採用して文字列を区分する(ステップS3−8)。読み仮名区分装置53は、解析を開始する位置を候補駅名(読み仮名)の文字列のうち区分した[A]以降の文字列の頭文字に移す(ステップS3−9)。 The reading kana sorting device 53 uses a plurality of [A as a character string starting with an initial letter of a candidate station name (a reading kana) (to a character string having a common analysis start position in the character string of the candidate station name (a reading kana)). ] Is included, the character string is segmented by adopting [A] having the largest number of characters (step S3-8). The reading-kana classification device 53 moves the starting position of the analysis to the first letter of the character string after [A] that is divided among the character strings of the candidate station names (reading kana) (step S3-9).
一方、候補駅名(読み仮名)の頭文字から始まる文字列に(候補駅名(読み仮名)の文字列のうち解析を開始する位置が共通する文字列に)[A]が含まれていない場合、読み仮名区分装置53は、候補駅名(読み仮名)の頭文字から始まる文字列(候補駅名(読み仮名)の文字列のうち解析を開始する位置が共通する文字列)のうち最初の文字列である一文字を[C]として採用する(ステップS3−12)。読み仮名区分装置53は、解析を開始する位置を候補駅名(読み仮名)の文字列のうち採用した[C]の次の文字に移す(ステップS3−13)。 On the other hand, if [A] is not included in the character string starting from the initial letter of the candidate station name (reading kana) (in the character string of the candidate station name (reading kana) where the analysis start position is common), The reading kana sorting device 53 is the first character string in a character string starting from the initial character of the candidate station name (reading kana) (character string having the same starting position in the character string of the candidate station name (reading kana)). A certain character is adopted as [C] (step S3-12). The reading kana sorting device 53 moves the position to start analysis to the next character after [C], which is adopted in the character string of the candidate station name (reading kana) (step S3-13).
読み仮名区分装置53は、解析を開始する位置が、候補駅名(読み仮名)の末尾の文字の後に便宜的に設けられた架空末尾文字か否かを判定する(ステップS3−10)。判定の結果、解析を開始する位置が架空末尾文字であればステップS3−11が処理され、架空末尾文字でなければ上記した処理が繰り返される。 The reading-kana classification device 53 determines whether or not the analysis start position is a fictitious end character provided for convenience after the last character of the candidate station name (reading kana) (step S3-10). As a result of the determination, if the analysis start position is the fictitious end character, step S3-11 is processed, and if it is not a fictitious end character, the above-described processing is repeated.
読み仮名区分装置53は、採用された[C]が連続する場合[C]を一つにまとめ、処理を終了する(ステップS3−11)。 If the adopted [C] continues, the reading-kana classification device 53 collects [C] into one and ends the process (step S3-11).
具体例を挙げて詳説すれば、図23において、候補駅名(読み仮名)が「カイヤマト」であり、頻出語(読み仮名)が「カイ」および「ヤマト」であるとする。候補駅名(読み仮名)は「カイヤマト」の頭文字である架空先頭文字から「カ」「カイ」「カイヤ」・・・「カイヤマト」まで順に処理される(図23(a)参照)。頭文字である「カ」は頻出語(読み仮名)と一致しないため[C]である。頭文字「カ」と二番目の文字「イ」とから構成された「カイ」は頻出語(読み仮名)と一致するため、[A]に区分される。この処理が「カイヤマト」まで繰り返される。 Specifically, in FIG. 23, it is assumed that the candidate station name (reading kana) is “Kaiyamato” and the frequent words (reading kana) are “Kai” and “Yamato”. Candidate station names (reading pseudonyms) are processed in order from an imaginary head character, which is an acronym of “Kaiyamato”, to “K”, “Kai”, “Kaiya”... “Kaiyamato” (see FIG. 23A). The acronym “K” is [C] because it does not match a frequent word (reading kana). “Chi” composed of the initial character “K” and the second character “I” matches the frequent word (reading kana) and is therefore classified as [A]. This process is repeated until “Kaiyamato”.
[A]である「カイ」の次の文字である「ヤ」に解析を開始する位置が移る。「ヤ」が解析を開始する位置の最後でないため、「カイ」以降の文字列の頭文字である「ヤ」から「ヤマ」「ヤマト」まで順に処理される(図23(b)参照)。「ヤ」および「ヤマ」は頻出語(読み仮名)と一致しないため、いずれも[C]である。「ヤマト」は頻出語(読み仮名)と一致するため[A]に区分される。解析を開始する位置が「ヤマト」の次の文字である架空末尾文字に移されると、解析を開始する位置が最後となるため処理が終了する。 The position where the analysis is started moves to “Y”, which is the next character after “K”, which is [A]. Since “YA” is not the last position at which to start the analysis, processing is performed in order from “YA” to “YAMA” and “YAMATO”, which are the initial characters of the character string after “KAI” (see FIG. 23B). Since “Ya” and “Yama” do not match frequently-occurring words (reading kana), both are [C]. “Yamato” is classified as [A] because it coincides with a frequent word (reading kana). When the analysis start position is moved to the fictitious end character that is the next character after “Yamato”, the process ends because the analysis start position is last.
このようにして、「カイヤマト」は頻出語(読み仮名)と一致する「カイ」および「ヤマト」の二つに区分され、[A]と[A]とで構成された構文であると読み仮名区分装置53によって解析される(図23(c)参照)。 In this way, “Kaiyamato” is divided into two parts “Kai” and “Yamato” that coincide with the frequent words (Yomikana), and Yomiana is assumed to have a syntax composed of [A] and [A]. Analysis is performed by the sorting device 53 (see FIG. 23C).
また、他の具体例によれば、図24において、候補駅名(読み仮名)が「ヤマトフタミ」であり、頻出語(読み仮名)が「ヤマト」であるとする。候補駅名(読み仮名)は「ヤマトフタミ」の頭文字である架空先頭文字から「ヤ」「ヤマ」「ヤマト」・・・「ヤマトフタミ」まで順に処理される(図24(a)参照)。「ヤ」および「ヤマ」は頻出語(読み仮名)と一致しないため、いずれも[C]である。「ヤマト」は頻出語(読み仮名)と一致するため[A]に区分される。 According to another specific example, in FIG. 24, it is assumed that the candidate station name (reading kana) is “Yamato Futami” and the frequent word (reading kana) is “Yamato”. Candidate station names (reading pseudonyms) are sequentially processed from the fictitious first character, which is the initial of “Yamato Futami”, to “Ya”, “Yama”, “Yamato”... “Yamato Futami” (see FIG. 24A). Since “Ya” and “Yama” do not match frequently-occurring words (reading kana), both are [C]. “Yamato” is classified as [A] because it coincides with a frequent word (reading kana).
[A]である「ヤマト」の次の文字である「フ」に解析を開始する位置が移る。「フ」が解析を開始する位置の最後でないため、「ヤマト」以降の文字列の頭文字である「フ」から「フタ」「フタミ」まで順に処理される(図24(b)参照)。これらは頻出語(読み仮名)と一致しないため、いずれも[C]である。これらの文字列は[A]が含まれていないため、これらのうち最初の文字列である「フ」が[C]として採用される。解析を開始する位置が「フ」の次の文字である「タ」に移され、「タ」「タミ」が順に処理される(図24(c)参照)。これらの文字列は頻出語(読み仮名)と一致しないため、いずれも[C]である。これらの文字列はいずれも[A]が含まれていないため、これらのうち最初の文字列である「タ」が[C]として採用される。解析を開始する位置が「タ」の次の文字である「ミ」に移され、「ミ」が処理される(図24(d)参照)。解析する文字列である「ミ」は[C]である。解析を開始する位置が架空末尾文字に移されると、解析を開始する位置が最後となり、また、採用された[C]が連続するため「フ」「タ」「ミ」が一つにまとめられて処理が終了する。 The position where the analysis is started moves to “F”, which is the next character of “Yamato” which is [A]. Since “F” is not the last position to start analysis, “F”, “Fut” and “Futami”, which are initial characters of the character string after “Yamato”, are processed in order (see FIG. 24B). Since these do not coincide with frequent words (reading kana), both are [C]. Since these character strings do not include [A], the first character string “F” among them is adopted as [C]. The analysis start position is moved to “T”, which is the next character after “F”, and “T” and “Tami” are sequentially processed (see FIG. 24C). Since these character strings do not coincide with the frequent words (yana), both are [C]. Since none of these character strings includes [A], the first character string “Ta” among them is adopted as [C]. The analysis start position is moved to “mi”, which is the next character after “ta”, and “mi” is processed (see FIG. 24D). “M”, which is a character string to be analyzed, is [C]. When the analysis start position is moved to the fictitious end character, the analysis start position is the last, and since [C] adopted continues, “F”, “TA” and “MI” are combined into one. The process ends.
このようにして、「ヤマトフタミ」は頻出語(読み仮名)と一致する「ヤマト」とそれ以外の文字列である第一の未知語である「フタミ」とに区分され、[A]と[C]とで構成された構文であると読み仮名区分装置53によって解析される(図24(e)参照)。 In this way, “Yamato Futami” is divided into “Yamato” that matches the frequent word (reading kana) and “Futami” that is the first unknown word that is the other character string, and [A] and [C ] Is analyzed by the kana classifier 53 (see FIG. 24E).
ステップS4において、文字位置解析装置54は候補駅名(読み仮名)の[A]または[C]のどの位置に検索文字があるか解析する(図7参照)。 In step S4, the character position analyzer 54 analyzes the position of the search character in [A] or [C] of the candidate station name (reading pseudonym) (see FIG. 7).
文字位置解析装置54は、検索文字が候補駅名(読み仮名)の[A]または[C]の文字列の先頭であるか([A]または[C]の文字列と一致するか)否かを判定する(ステップS4−1)。判定の結果、検索文字が候補駅名(読み仮名)の[A]または[C]の文字列の先頭であれば([A]または[C]の文字列と一致すれば)、文字位置解析装置54はその候補記名(読み仮名)の確度を“高”とする(ステップS4−2)。一方、検索文字が候補駅名(読み仮名)の[A]または[C]の文字列の先頭でなければ([A]または[C]の文字列と一致しなければ)確度を“低”とする(ステップS4−3)。ここで確度とは、候補駅名が、オペレータが所望する駅名と一致する可能性の高さの度合いをいう。 The character position analysis device 54 determines whether the search character is the head of the character string [A] or [C] of the candidate station name (reading kana) (matches the character string [A] or [C]). Is determined (step S4-1). If the result of determination is that the search character is the head of the character string [A] or [C] of the candidate station name (reading pseudonym) (if it matches the character string [A] or [C]), the character position analysis device 54, the accuracy of the candidate name (reading pseudonym) is set to “high” (step S4-2). On the other hand, if the search character is not the head of the character string [A] or [C] of the candidate station name (reading pseudonym) (if it does not match the character string [A] or [C]), the accuracy is “low”. (Step S4-3). Here, the accuracy means the degree of possibility that the candidate station name matches the station name desired by the operator.
具体例を挙げて詳説すれば、図16(項番8参照)において、検索文字が「ヤマト」、候補駅名(読み仮名)が「ヤマトフタミ」、このうち「ヤマト」が[A]、「フタミ」が[C]であるとする。検索文字である「ヤマト」が、「ヤマトフタミ」を区分した[A]または[C]のどの位置にあるかを解析する。検索文字である「ヤマト」が[A]の先頭であるため([A]と一致するため)、文字位置解析装置54は「ヤマトフタミ」の確度を“高”とする。 Specifically, referring to FIG. 16 (see item 8), the search character is “Yamato”, the candidate station name (reading pseudonym) is “Yamato Futami”, among which “Yamato” is [A], “Futami” Is [C]. The search character “Yamato” is analyzed in which position of [A] or [C] that categorizes “Yamato Futami”. Since the search character “Yamato” is the head of [A] (because it matches [A]), the character position analyzer 54 sets the accuracy of “Yamato Futami” to “high”.
一方、図16(項番1参照)において、検索文字が「ヤマト」、候補駅名(読み仮名)が「アサヒヤマドウブツエン」、この文字列が[C]であるとする。検索文字である「ヤマト」が[C]の先頭でなく、また、[C]と一致しないため、文字位置解析装置54は「アサヒヤマドウブツエン」の確度を“低”とする。 On the other hand, in FIG. 16 (see item number 1), the search character is “Yamato”, the candidate station name (reading pseudonym) is “Asahiyama Dobutsuen”, and this character string is [C]. Since the search character “Yamato” is not at the beginning of [C] and does not match [C], the character position analyzer 54 sets the accuracy of “Asahiyama Dobutsuen” to “low”.
ステップS5において、候補駅名区分装置55は、頻出語記憶部52および駅名記憶部51に基づいて、候補駅名(漢字)を頻出語(漢字)と一致する部分、候補駅名(漢字)の文字列に含まれる駅名(漢字)である包含駅名(漢字)と一致する部分、および第二の未知語となる部分に区分する(図8参照)。ここで、候補駅名区分装置55による候補駅名(漢字)の文字列の区分の対象は、読み仮名区分装置53と異なり、一般的に表記されている候補駅名そのものの文字列であり、漢字、仮名文字、またはアルファベット表記の文字列である。 In step S5, the candidate station name classification device 55 converts the candidate station name (kanji) into a character string of the candidate station name (kanji), a portion that matches the candidate station name (kanji) based on the frequent word storage unit 52 and the station name storage unit 51. It is divided into a part that matches the included station name (kanji), which is an included station name (kanji), and a part that becomes the second unknown word (see FIG. 8). Here, the candidate station name (kanji) character string classification target by the candidate station name classification device 55 is a character string of the candidate station name itself that is generally written, unlike the reading kana classification device 53. It is a character or a character string in alphabetical notation.
包含駅名(漢字)とは、候補駅名(漢字)の文字列の一部によって駅名(漢字)が成立し、候補駅名(漢字)そのものを含まないものをいう。例えば、候補駅名(漢字)が「大和小泉」であれば「大和」が包含駅名であり、候補駅名(漢字)そのものである「大和小泉」は包含駅名(漢字)に含まれない。 The inclusive station name (kanji) means that a station name (kanji) is formed by a part of the character string of the candidate station name (kanji) and does not include the candidate station name (kanji) itself. For example, if the candidate station name (kanji) is “Yamato Koizumi”, “Yamato” is the inclusion station name, and “Yamato Koizumi”, which is the candidate station name (kanji) itself, is not included in the inclusion station name (kanji).
第二の未知語とは、候補駅名(漢字)のうち頻出語(漢字)部分と包含駅名(漢字)部分とを除いた部分の文字をいう。以下、区分された候補駅名(漢字)のうち頻出語(漢字)と一致する部分を[A]、包含駅名(漢字)と一致する部分を[B]、第二の未知語となる部分を[C]と記す。 The second unknown word refers to the character of the candidate station name (kanji) excluding the frequently used word (kanji) part and the included station name (kanji) part. Hereinafter, among the classified candidate station names (kanji), the part that matches the frequent word (kanji) [A], the part that matches the inclusion station name (kanji) [B], and the part that becomes the second unknown word [ C].
候補駅名区分装置55は最長一致法に基づいて候補駅名(漢字)の構文を解析し、処理する(図9参照)。解析を開始する位置は候補駅名(漢字)の文字列の頭文字の前に便宜的に設けた架空先頭文字とする(ステップS5−1)。候補駅名区分装置55は、架空先頭文字に候補駅名(漢字)の文字列の頭文字、二番目の文字、三番目の文字・・・末尾の文字を順に累積して付加しながらそれぞれの文字列が頻出語(漢字)または駅名(漢字)と一致するか否かを判定する(ステップS5−2からS5−8)。駅名(漢字)は候補駅名(漢字)そのものを含まない(ステップS5−5)。判定の結果、これらの文字列のうち頻出語(漢字)と一致する文字列があればその文字列が[A]とされ(ステップS5−4)、駅名(漢字)と一致すればその文字列が[B]とされ(ステップS5−6)、頻出語(漢字)とも駅名(漢字)とも一致しなければその文字列が[C]とされる(ステップS5−7)。頻出語(漢字)および駅名(漢字)と一致する場合は頻出語(漢字)が優先される(ステップS5−3)。候補駅名区分装置55は、候補駅名(漢字)の文字列の頭文字から始まるすべての文字列を判定する。 The candidate station name classification device 55 analyzes and processes the syntax of the candidate station name (kanji) based on the longest match method (see FIG. 9). The position where the analysis is started is an imaginary head character provided for convenience before the initial character of the character string of the candidate station name (kanji) (step S5-1). The candidate station name classification device 55 accumulates the initial character of the candidate station name (kanji), the second character, the third character,... It is determined whether or not matches a frequent word (kanji) or a station name (kanji) (steps S5-2 to S5-8). The station name (kanji) does not include the candidate station name (kanji) itself (step S5-5). As a result of the determination, if there is a character string that matches the frequent word (kanji) among these character strings, the character string is set to [A] (step S5-4), and if it matches the station name (kanji), that character string. [B] (step S5-6), and if the frequent word (kanji) and the station name (kanji) do not match, the character string is set to [C] (step S5-7). If it matches the frequent word (kanji) and the station name (kanji), the frequent word (kanji) is prioritized (step S5-3). The candidate station name classification device 55 determines all character strings starting from the first letter of the character string of the candidate station name (kanji).
候補駅名区分装置55は、候補駅名(漢字)の頭文字から始まる文字列に(候補駅名(漢字)の文字列のうち解析を開始する位置が共通する文字列に)、[A]が含まれているか否か、また[B]が含まれているか否かを判定する(ステップS5−9、S5−12)。判定の結果、候補駅名(漢字)に[A]が含まれていればステップS5−10が処理され、[B]が含まれていればステップS5−13が処理され、[A][B]いずれも含まれていなければステップS5−15が処理される。 The candidate station name classification device 55 includes [A] in the character string starting from the initial character of the candidate station name (kanji) (in the character string of the candidate station name (kanji) where the analysis start position is common). It is determined whether or not [B] is included (steps S5-9 and S5-12). As a result of the determination, if [A] is included in the candidate station name (kanji), step S5-10 is processed, and if [B] is included, step S5-13 is processed, and [A] [B]. If neither is included, step S5-15 is processed.
候補駅名区分装置55は、候補駅名(漢字)の頭文字から始まる文字列に(候補駅名(漢字)の文字列のうち解析を開始する位置が共通する文字列に)、複数の[A]が含まれる場合、最も文字数が多い[A]を採用して文字列を区分する(ステップS5−10)。候補駅名区分装置55は、解析を開始する位置を候補駅名(漢字)の文字列のうち採用した[A]以降の文字列の頭文字に移す(ステップS5−11)。 The candidate station name classifying device 55 has a character string starting with an initial letter of the candidate station name (kanji) (a character string having a common position to start analysis in the character string of the candidate station name (kanji)), and a plurality of [A] s. If it is included, the character string is segmented by adopting [A] having the largest number of characters (step S5-10). The candidate station name classification device 55 moves the position where the analysis is started to the first letter of the character string after [A], which is adopted in the character string of the candidate station name (kanji) (step S5-11).
候補駅名(漢字)の頭文字から始まる文字列に(候補駅名(漢字)の文字列のうち解析を開始する位置が共通する文字列に)、複数の[B]が含まれる場合、最も文字数が多い[B]を採用して文字列を区分する(ステップS5−13)。候補駅名区分装置55は、解析を開始する位置を候補駅名(漢字)の文字列のうち区分した[B]以降の文字列の頭文字に移す(ステップS5−14)。 If the character string starting with the initial letter of the candidate station name (kanji) (in the character string of the candidate station name (kanji), the character string having the same starting position for analysis) and multiple [B] are included, the number of characters is the largest. A large number [B] is adopted to divide the character string (step S5-13). The candidate station name classification device 55 moves the position where the analysis is started to the first letter of the character string after [B], which is classified among the character strings of the candidate station name (kanji) (step S5-14).
候補駅名(漢字)の頭文字から始まる文字列に(候補駅名(漢字)の文字列のうち解析を開始する位置が共通する文字列に)、[A][B]が含まれていない場合、候補駅名区分装置55は、候補駅名(漢字)の頭文字から始まる文字列(候補駅名(漢字)の文字列のうち解析を開始する位置が共通する文字列)のうち最初の文字列である一文字を[C]として採用する(ステップS5−15)。候補駅名区分装置55は、解析を開始する位置を候補駅名(漢字)の文字列のうち採用した[C]以降の次の文字に移す(ステップS5−16)。 If the character string starting with the initial character of the candidate station name (kanji) (in the character string of the candidate station name (kanji), the character string having the same position to start analysis) does not contain [A] [B] The candidate station name classification device 55 is a character that is the first character string in a character string starting from the initial character of the candidate station name (kanji) (a character string having a common start position in the character string of the candidate station name (kanji)). Is adopted as [C] (step S5-15). The candidate station name classification device 55 moves the position to start the analysis to the next character after [C] that is adopted in the character string of the candidate station name (kanji) (step S5-16).
候補駅名区分装置55は、解析を開始する位置が、候補駅名(漢字)の末尾の文字の後に便宜的に設けられた架空末尾文字か否かを判定する(ステップS5−17)。判定の結果、解析を開始する位置が架空末尾文字であればステップS5−18が処理され、架空末尾文字でなければ上記した処理が繰り返される。 The candidate station name classification device 55 determines whether or not the analysis start position is a fictitious end character provided for convenience after the last character of the candidate station name (kanji) (step S5-17). As a result of the determination, if the analysis start position is the fictitious end character, step S5-18 is processed, and if it is not a fictitious end character, the above-described processing is repeated.
候補駅名区分装置55は、採用された[C]が連続する場合[C]を一つにまとめ(ステップS5−18)、候補駅名(漢字)が[C]のみに区分されたか否かを判定する(ステップS5−19)。判定の結果、[C]のみに区分されていた場合、[C]が[B]に変更されて候補駅名(漢字)の文字列が区分し直される(ステップS5−20)。 If the adopted [C] continues, the candidate station name classification device 55 combines [C] into one (step S5-18), and determines whether the candidate station name (kanji) is classified into only [C]. (Step S5-19). As a result of the determination, if only [C] is classified, [C] is changed to [B], and the character string of the candidate station name (kanji) is reclassified (step S5-20).
具体例を挙げて詳説すれば、図25において、候補駅名(漢字)が「稲毛海岸」であり、駅名(漢字)が「稲毛」であるとする。候補駅名(漢字)は「稲毛海岸」の頭文字である架空先頭文字から「稲」「稲毛」「稲毛海」「稲毛海岸」の順に処理される(図25(a)参照)。頭文字である「稲」は頻出語(漢字)とも駅名(漢字)とも一致しないため[C]である。「稲毛」は駅名(漢字)と一致するため、[B]に区分される。「稲毛海」は「稲」と同様に[C]である。「稲毛海岸」は候補駅名(漢字)そのものであるため[B]ではなく[C]である。 Specifically, in FIG. 25, it is assumed that the candidate station name (kanji) is “Inage Kaigan” and the station name (kanji) is “Inage”. Candidate station names (kanji) are processed in the order of “rice”, “Inage”, “Inage Sea”, and “Inage Coast” from the fictitious first character that is an initial of “Inage Coast” (see FIG. 25A). The acronym “rice” is “C” because it does not match a frequent word (kanji) nor a station name (kanji). Since “Inage” matches the station name (kanji), it is classified as [B]. “Inage Sea” is [C] like “rice”. “Inage Coast” is a candidate station name (kanji) itself, so it is [C] instead of [B].
[B]である「稲毛」の次の文字である「海」に解析を開始する位置が移る。「海」が解析を開始する位置の最後でないため、「稲毛」以降の文字列の頭文字である「海」「海岸」が順に処理される(図25(b)参照)。これらは頻出語(漢字)と一致しないため、いずれも[C]である。これらの文字列は[A]が含まれていないため、これらのうち最初の文字列である「海」が[C]として採用される。解析を開始する位置が「海」の次の文字である「岸」に移され、「岸」が処理される(図25(c)参照)。解析する文字列である「岸」は[C]である。解析を開始する位置が架空末尾文字に移されると、解析を開始する位置が最後となり、採用された[C]が連続するため「海」「岸」が一つにまとめられて処理が終了する。 The position at which the analysis is started moves to “sea”, which is the next character after “Inage”, which is [B]. Since “sea” is not the last position to start the analysis, “sea” and “coast”, which are the initials of the character string after “Inage”, are sequentially processed (see FIG. 25B). Since these do not coincide with frequent words (kanji), both are [C]. Since these character strings do not include [A], the first character string “sea” is adopted as [C]. The analysis start position is moved to “shore”, which is the next character of “sea”, and “shore” is processed (see FIG. 25C). “Kishi”, which is a character string to be analyzed, is [C]. When the analysis start position is moved to the fictitious end character, the analysis start position is the last, and since the adopted [C] continues, “sea” and “shore” are combined into one, and the process ends. .
このようにして、「稲毛海岸」は駅名(漢字)と一致する「稲毛」とそれ以外の文字列である第二の未知語である「海岸」とに区分され、[B]と[C]とで構成された構文であると候補駅名区分装置55によって解析される(図25(d)参照)。 In this way, “Inage Coast” is divided into “Inage” that matches the station name (kanji) and “Coast” that is the second unknown word that is the other character string, and [B] and [C]. Are analyzed by the candidate station name classification device 55 (see FIG. 25D).
また、他の具体例によれば、図26において、候補駅名(漢字)が「大和二見」であり、頻出語(漢字)が「大和」、駅名(漢字)が「大和」であるとする。候補駅名(漢字)は「大和二見」の頭文字である架空先頭文字から「大」「大和」「大和二」「大和二見」の順に処理される(図26(a)参照)。頭文字である「大」は頻出語(漢字)とも駅名(漢字)とも一致しないため[C]である。「大和」は、頻出語(漢字)および駅名(漢字)と一致するが頻出語(漢字)が優先するため[A]に区分される。「大和二」は「大」と同様に[C]である。「大和二見」は候補駅名(漢字)そのものであるため[B]ではなく[C]である。 According to another specific example, in FIG. 26, the candidate station name (kanji) is “Yamato Futami”, the frequent word (kanji) is “Yamato”, and the station name (kanji) is “Yamato”. Candidate station names (kanji) are processed in the order of “Dai”, “Yamato”, “Daiwaji”, and “Daiwa Futami” from the fictitious first character that is an acronym for “Daiwa Futami” (see FIG. 26A). The acronym “Large” is [C] because it does not match a frequent word (kanji) nor a station name (kanji). “Yamato” matches the frequent word (kanji) and the station name (kanji), but is frequently classified as [A] because the frequent word (kanji) has priority. “Yamatoji” is [C] like “Daiwa”. Since “Yamato Futami” is the candidate station name (kanji) itself, it is [C] instead of [B].
[A]である「大和」の次の文字である「二」に解析を開始する位置が移る。「二」が解析を開始する位置の最後でないため、「大和」以降の文字列の頭文字である「二」「二見」が順に処理される(図26(b)参照)。これらは頻出語(漢字)と一致しないため、いずれも[C]である。これらの文字列は[A]が含まれていないため、これらのうち最初の文字列である「二」が[C]として採用される。解析を開始する位置が「二」の次の文字である「見」に移され、「見」が処理される(図26(c)参照)。解析する文字列である「見」は[C]である。解析を開始する位置が架空末尾文字に移されると、解析を開始する位置が最後となり、採用された[C]が連続するため「二」「見」が一つにまとめられて処理が終了する。 The position where the analysis is started moves to “2” which is the next character after “Yamato” which is [A]. Since “2” is not the last position where the analysis is started, “2” and “Futami” which are initials of the character string after “Yamato” are processed in order (see FIG. 26B). Since these do not coincide with frequent words (kanji), both are [C]. Since these character strings do not include [A], the first character string “two” among them is adopted as [C]. The position at which the analysis is started is moved to “see”, which is the next character after “two”, and “see” is processed (see FIG. 26C). The “look” that is the character string to be analyzed is [C]. When the analysis start position is moved to the fictitious end character, the analysis start position is the last, and since the adopted [C] continues, “two” and “see” are combined into one, and the process ends. .
このようにして「大和二見」は頻出語(漢字)と一致する「大和」とそれ以外の文字列である第二の未知語である「二見」とに区分され、[A]と[C]とで構成された構文であると候補駅名区分装置55によって解析される(図26(d)参照)。 In this way, “Yamato Futami” is divided into “Yamato” that matches frequently-occurring words (kanji) and “Futami” that is the second unknown word that is a character string other than that, and [A] and [C] The candidate station name classification device 55 analyzes that the syntax is composed of (see FIG. 26D).
さらに他の具体例によれば、図27において、候補駅名が「センター南」であり、頻出語(漢字)が「南」であるとする。候補駅名(漢字)は「センター南」の頭文字である架空先頭文字から「セ」「セン」・・・「センター南」まで順に処理される(図27(a)参照)。こられの文字列はいずれも頻出語(漢字)とも駅名(漢字)とも一致せず、また「センター南」は候補駅名(漢字)そのものであるため、いずれも[C]である。 According to another specific example, in FIG. 27, the candidate station name is “center south”, and the frequent word (kanji) is “south”. Candidate station names (kanji characters) are processed in order from an imaginary first character that is an acronym for “center south” to “se”, “sen”... “Center south” (see FIG. 27A). Since these character strings do not coincide with frequent words (kanji) or station names (kanji), and “center south” is a candidate station name (kanji) itself, both are [C].
これらの文字列は[A]も[B]も含まれていないため、これらのうち最初の文字列である「セ」が[C]として採用される。解析を開始する位置が「セ」の次の文字である「ン」に移され、「ンタ」から「ンター」「ンター南」まで順に処理される(図27(b)参照)。これらの文字列はいずれも[A]または[B]が含まれていないため、これらのうち最初の文字列である「ン」が[C]として採用される。同様に、解析を開始する位置が一文字ずつ移され、最後に「南」が処理される(図27(d)参照)。「南」は頻出語(漢字)と一致するため[A]に区分される。解析を開始する位置が架空末尾文字に移されると、解析を開始する位置が最後となり、また採用された[C]が連続するため「セ」「ン」「タ」「ー」が一つにまとめられて処理が終了する。 Since these character strings include neither [A] nor [B], the first character string “S” among them is adopted as [C]. The position at which the analysis is started is moved to “n”, which is the next character of “C”, and is processed in order from “enter” to “inter” and “inter south” (see FIG. 27B). Since none of these character strings includes [A] or [B], the first character string “N” among them is adopted as [C]. Similarly, the analysis start position is moved character by character, and “South” is processed last (see FIG. 27D). “South” is classified as [A] because it coincides with frequent words (kanji). When the analysis start position is moved to the fictitious end character, the analysis start position is the last, and since [C] adopted is continuous, “C”, “N”, “T”, and “-” are combined into one. The processing is completed after being collected.
このようにして「センター南」は第二の未知語である「センター」と、頻出語(漢字)と一致する「南」とに区分され、[C]と[A]とで構成された構文であると候補駅名区分装置55によって解析される(図27(e)参照)。 In this way, “center south” is divided into “center”, which is the second unknown word, and “south” that coincides with frequent words (kanji), and is composed of [C] and [A]. Is analyzed by the candidate station name classification device 55 (see FIG. 27E).
さらに他の具体例によれば、図28において、候補駅名(漢字)が「山都」であるとする。候補駅名(漢字)は「山都」の頭文字である架空先頭文字から「山」「山都」の順に処理される(図28(a)参照)。これらの文字列はいずれも頻出語(漢字)とも駅名(漢字)とも一致せず、また「山都」は候補駅名(漢字)そのものであるため、いずれも[C]である。 According to another specific example, in FIG. 28, the candidate station name (kanji) is assumed to be “Yamato”. Candidate station names (kanji) are processed in the order of "mountain" and "mountain capital" from the fictitious first character that is an acronym for "mountain capital" (see FIG. 28A). Since these character strings do not match frequent words (kanji) and station names (kanji), and “Santo” is a candidate station name (kanji) itself, both are [C].
これらの文字列は[A]も[B]も含まれていないため、これらのうち最初の文字列である「山」が[C]として採用される。解析を開始する位置が「山」の次の文字である「都」に移され、「都」が処理される(図28(b)参照)。解析を開始する文字列である「都」は[C]である。解析を開始する位置が架空末尾文字に移されると、解析を開始する位置が最後となり、また、採用された[C]が連続するため「山」「都」が一つにまとめられる。ここで、候補駅名(漢字)は[C]のみに区分されたため、[B]に区分し直される。 Since these character strings include neither [A] nor [B], the first character string “mountain” among them is adopted as [C]. The position where the analysis is started is moved to “Miyako”, which is the next character after “Mountain”, and “Miyako” is processed (see FIG. 28B). “C”, which is a character string for starting analysis, is [C]. When the analysis start position is moved to the fictitious end character, the analysis start position is the last, and since [C] adopted is continuous, “mountain” and “city” are combined into one. Here, since the candidate station name (kanji) is divided only into [C], it is re-classified into [B].
このようにして「山都」は[B]で構成された構文であると候補駅名区分装置55によって解析される(図28(c)参照)。 In this way, “Santo” is analyzed by the candidate station name classification device 55 as having the syntax composed of [B] (see FIG. 28C).
ステップS6において、分析装置56は、文字位置解析装置54が頻出語(漢字)、包含駅名(漢字)、および第二の未知語に区分した候補駅名(漢字)を分解して並べる(図10参照)。その際、分解された頻出語(漢字)、包含駅名(漢字)、および第二の未知語のそれぞれに、分解する前の候補駅名(漢字)、および文字位置解析装置54によって判断された確度を関連付ける。以下、“分解された候補駅名(漢字)の頻出語(漢字)、包含駅名(漢字)、および第二の未知語”を“分解単語”と記す。 In step S6, the analysis device 56 disassembles and arranges the candidate station names (kanji characters) that the character position analysis device 54 has divided into frequent words (kanji characters), inclusion station names (kanji characters), and second unknown words (see FIG. 10). ). At that time, each of the decomposed frequent words (kanji), the inclusive station name (kanji), and the second unknown word, the candidate station name (kanji) before being decomposed, and the accuracy determined by the character position analysis device 54 are shown. Associate. Hereinafter, “frequent word (kanji), candidate station name (kanji), and second unknown word” of decomposed candidate station names (kanji) will be referred to as “decomposed words”.
具体例を挙げて詳説すれば、図18(項番8参照)において候補駅名(漢字)が「大和二見」であるとする。「大和二見」は頻出語(漢字)と一致する「大和」とそれ以外の文字列である第二の未知語である「二見」とに区分されるため、「大和」と「二見」とに分解されて並べられる。その際、「大和」および「二見」はそれぞれ、分解される前の元の候補駅名(漢字)である「大和二見」と関連付けられ、また、文字位置解析装置54で判断された確度“高”と関連付けられる。 To explain in more detail with a specific example, it is assumed that the candidate station name (kanji) is “Yamato Futami” in FIG. 18 (see item number 8). “Yamato Futami” is divided into “Yamato”, which is a frequent word (kanji), and “Futami”, the second unknown word that is a character string other than that. Disassembled and arranged. At that time, “Yamato” and “Futami” are each associated with “Yamato Futami”, which is the original candidate station name (kanji) before being decomposed, and the accuracy “high” determined by the character position analysis device 54 is obtained. Associated with.
ステップS7において、分析装置56は候補駅名(読み仮名)の並べ方である第一条件(ステップS7−1)、候補駅名(漢字)の並べ方である第二条件(ステップS7−3)、および文字コード(ステップS7−4)に基づいて候補駅名(漢字)を並べる(図11参照)。ここで、第一条件とは、候補駅名(読み仮名)の文字列に含まれる頻出語(読み仮名)または第一の未知語のいずれかにおいて、検索文字の位置が先頭である候補駅名(読み仮名)を、並べ方の上位とすることをいう。第二条件とは、候補駅名(漢字)同士で共通する文字列を、頻出語(漢字)、包含駅名(漢字)、および第二の未知語ごとに検出して計数し、候補駅名(漢字)同士で共通する文字列の個数が多い候補駅名(漢字)を、並べ方の上位とすることをいう。文字コードの並びは昇順である。 In step S7, the analysis device 56 uses a first condition (step S7-1) as a way of arranging candidate station names (reading pseudonyms), a second condition (step S7-3) as a way of arranging candidate station names (kanji), and a character code. Based on (Step S7-4), candidate station names (kanji) are arranged (see FIG. 11). Here, the first condition is the candidate station name (reading) where the position of the search character is the first in either the frequent word (reading kana) or the first unknown word contained in the character string of the candidate station name (reading kana). This means that the pseudonym) is at the top of the lineup. The second condition is to detect and count a character string common to candidate station names (kanji) for each frequent word (kanji), including station name (kanji), and second unknown word, and select candidate station name (kanji). Candidate station names (kanji) with a large number of character strings that are common to each other are placed at the top of the arrangement. The character code sequence is in ascending order.
第一条件によれば、文字位置解析装置54によって確度が“高”とされた分解単語を含む候補駅名(漢字)が上位となり、確度が“低”とされた分解単語を含む候補駅名(漢字)が下位となる(ステップS7−1)。分析装置56は共通する分解単語を計数する(ステップS7−2)。第二条件によれば、計数の結果、個数が多い分解単語を含む候補駅名(漢字)が上位となり、個数が少ない分解単語を含む候補駅名(漢字)が下位となる(ステップS7−3)。文字コードによれば、並びが昇順である(ステップS7−4)。第一条件は第二条件よりも優先し、第二条件は文字コードよりも優先する。 According to the first condition, the candidate station name (kanji) including the decomposed word whose accuracy is “high” by the character position analyzer 54 is higher, and the candidate station name (kanji) including the decomposed word whose accuracy is “low”. ) Is the lower order (step S7-1). The analysis device 56 counts common decomposed words (step S7-2). According to the second condition, as a result of counting, a candidate station name (kanji) including a decomposed word having a large number becomes higher, and a candidate station name (kanji) including a decomposed word having a small number becomes lower (step S7-3). According to the character code, the arrangement is in ascending order (step S7-4). The first condition has priority over the second condition, and the second condition has priority over the character code.
具体例を挙げて詳説すれば、図19において、第一条件に基づき、確度が“低”である「旭山動物園」は下位である。第二条件に基づき、候補駅名(漢字)同士において共通する分解単語のうち「大和」は5個あるため、分解単語「大和」はそれぞれに「5」が関連付けられる。この「大和」を含む候補駅名(漢字)は上位である。分解単語のうち「二見」は1個であるため、「1」が関連づけられる。この「二見」を含む候補駅名(漢字)は下位である。第二条件において同位である候補駅名(漢字)は文字コードの並びが昇順である。 Specifically, in FIG. 19, “Asahiyama Zoo” with the accuracy of “low” based on the first condition is subordinate. Based on the second condition, among the decomposed words common to the candidate station names (kanji), there are five “Yamato”, so that each decomposed word “Yamato” is associated with “5”. Candidate station names (Kanji) including “Yamato” are higher rank. Since there is only one “Futami” among the decomposed words, “1” is associated. Candidate station names (Kanji) including this “Futami” are lower. In the second condition, candidate station names (kanji characters) that are peers are in ascending order of character codes.
ステップS8において、分析装置56は候補駅名(漢字)の並べ方である第三条件に基づいて候補駅名(漢字)を並べる(図12参照)。ここで、第三条件とは、候補駅名区分装置55によって区分された頻出語(漢字)、包含駅名(漢字)、および第二の未知語の位置を、候補駅名(漢字)ごとに、先頭、途中、および末尾に区分し、位置が先頭である候補駅名(漢字)、途中である候補駅名(漢字)、末尾である候補駅名(漢字)の順に候補駅名(漢字)を並べることをいう。 In step S8, the analyzer 56 arranges the candidate station names (kanji characters) based on the third condition, which is how the candidate station names (kanji characters) are arranged (see FIG. 12). Here, the third condition refers to the position of the frequent words (kanji), inclusion station name (kanji), and second unknown words classified by the candidate station name classification device 55 for each candidate station name (kanji), Candidate station names (kanji) are arranged in the order of the candidate station name (kanji) whose position is the head, the candidate station name (kanji) in the middle, and the candidate station name (kanji) that is the tail.
分析装置56は分解単語が候補駅名(漢字)の文字列のどの位置にあるか判定する(ステップS8−1)。分解単語が候補駅名(漢字)の文字列の先頭であれば(候補駅名(漢字)の文字列と一致すれば)「前」とし(ステップS8−2)、末尾にあれば「後」とし(ステップS8−3)、それ以外にあれば「中」とする(ステップS8−4)。この処理がすべての分解単語に対して繰り返される。「前」とされた分解単語を含む候補駅名(漢字)が上位であり、次いで「中」「後」とされた分解単語を含む候補駅名(漢字)が並べられる(ステップS8−5)。 The analysis device 56 determines in which position of the character string of the candidate station name (kanji) the decomposed word is located (step S8-1). If the decomposed word is the beginning of the character string of the candidate station name (kanji) (if it matches the character string of the candidate station name (kanji)), it is set to “before” (step S8-2), and if it is at the end, “after” ( Step S8-3), otherwise “middle” (step S8-4). This process is repeated for all decomposed words. Candidate station names (kanji characters) including the decomposed words “before” are ranked higher, and then candidate station names (kanji characters) including the decomposed words “middle” and “after” are arranged (step S8-5).
具体例を挙げて詳説すれば、図20において、候補駅名(漢字)が「大和小泉」であり、分解単語が「大和」(頻出語(漢字))および「小泉」(包含駅名(漢字))であるとする。「大和」の位置は「大和小泉」の文字列の先頭であるため「前」である。「小泉」の位置は「大和小泉」の文字列の末尾であるため「後」である。「大和」の位置が「前」である「大和小泉」は上位であり、「小泉」の位置が「後」である「大和小泉」は下位である。 Specifically, in FIG. 20, the candidate station name (kanji) is “Yamato Koizumi”, and the decomposed words are “Yamato” (frequent word (kanji)) and “Koizumi” (including station name (kanji)). Suppose that The position of “Yamato” is “Previous” because it is the beginning of the character string “Yamato Koizumi”. The position of “Koizumi” is “after” because it is the end of the character string “Yamato Koizumi”. “Yamato Koizumi” where “Yamato” is “front” is higher, and “Yamato Koizumi” where “Koizumi” is “rear” is lower.
ステップS9において、分析装置56は重複する候補駅名(漢字)のうち下位である方を削除する(図13参照)。 In step S9, the analysis apparatus 56 deletes the lower one of the overlapping candidate station names (kanji) (see FIG. 13).
以上のようにして、制御部50は読み仮名区分装置53、文字位置解析装置54、候補駅名区分装置55、および分析装置56を用いて候補駅名(漢字)を解析して並べる。 As described above, the control unit 50 analyzes and arranges candidate station names (kanji characters) using the reading kana sorting device 53, the character position analyzing device 54, the candidate station name sorting device 55, and the analyzing device 56.
次に、本実施形態の効果を説明する。 Next, the effect of this embodiment will be described.
上記したように、本実施形態によれば、読み仮名区分装置53は、候補駅名(読み仮名)から頻出語(読み仮名)を区分する。入力された文字が頻出語(読み仮名)(または頻出語(読み仮名)の先頭)と一致すれば、その候補駅名はオペレータが所望する駅名である可能性が高い。同様に、入力された文字が第一の未知語(または第一の未知語の先頭)と一致すれば、その候補駅名(読み仮名)はオペレータが所望する駅名である可能性が高い。このような候補駅名(読み仮名)に関し、文字位置解析装置54は確度を“高”とする。分析装置56はこの結果に基づいて、オペレータが所望する駅名である可能性が高い順に候補駅名を並べる。したがって、候補駅名をオペレータにとって見やすく並べて表示することができる。 As described above, according to the present embodiment, the reading kana sorting device 53 sorts frequent words (reading kana) from candidate station names (reading kana). If the input character matches the frequent word (reading kana) (or the top of the frequent word (reading kana)), the candidate station name is likely to be a station name desired by the operator. Similarly, if the input character matches the first unknown word (or the beginning of the first unknown word), the candidate station name (reading pseudonym) is likely to be the station name desired by the operator. For such a candidate station name (reading pseudonym), the character position analysis device 54 sets the accuracy to “high”. Based on this result, the analyzer 56 arranges the candidate station names in the order of the high possibility that the station name is desired by the operator. Therefore, the candidate station names can be displayed side by side for the operator.
候補駅名区分装置55は、候補駅名(漢字)から頻出語(漢字)および包含駅名(漢字)を区分する。分析装置56は、頻出語(漢字)、包含駅名(漢字)、および第二の未知語のそれぞれにおいて、共通する文字列を計数する。文字列が共通する頻出語などを含む候補駅名同士は、頻出語(漢字)などを通して関連性のある駅名である可能性が高い。分析装置56はこの結果に基づいて、関連性のある駅名である可能性が高い候補駅名を並べる。したがって、候補駅名をオペレータにとって見やすく並べて表示することができる。 The candidate station name classifying device 55 classifies frequently used words (kanji characters) and inclusion station names (kanji characters) from candidate station names (kanji characters). The analysis device 56 counts common character strings in the frequent words (kanji), the inclusive station name (kanji), and the second unknown word. Candidate station names that include frequent words with common character strings are likely to be related station names through frequent words (kanji). Based on this result, the analyzer 56 arranges candidate station names that are highly likely to be related station names. Therefore, the candidate station names can be displayed side by side for the operator.
分析装置56は、頻出語(漢字)、包含駅名(漢字)、および第二の未知語の候補駅名(漢字)における位置を、先頭、途中、末尾に区分して順番に並べる。位置は、頻出語(漢字)などが候補駅名(漢字)の先頭であれば“前”、末尾であれば“後”、それ以外であれば“中”である。頻出語(漢字)などが候補駅名(漢字)の文字列(または候補駅名(漢字)の先頭)と一致すれば、その候補駅名はオペレータが所望する駅名である可能性が高い。分析装置この結果に基づいて、オペレータが所望する駅名である可能性が高い順に候補駅名(漢字)を並べる。したがって、候補駅名をオペレータにとって見やすく並べて表示することができる。 The analysis device 56 sorts the positions of the frequent words (kanji), the inclusive station name (kanji), and the candidate station name (kanji) of the second unknown word into the top, middle, and end in order. The position is “front” if the frequent word (kanji) or the like is the head of the candidate station name (kanji), “back” if it is the end, and “middle” otherwise. If a frequent word (kanji) or the like matches the character string of the candidate station name (kanji) (or the head of the candidate station name (kanji)), the candidate station name is likely to be a station name desired by the operator. Based on this result, the candidate station names (kanji) are arranged in descending order of possibility of the station name desired by the operator. Therefore, the candidate station names can be displayed side by side for the operator.
本発明に係る乗車券発券機の駅名列挙プログラム、乗車券発券機の駅名列挙プログラムが記録されたコンピュータで読み取り可能な記録媒体、および乗車券発券機における駅名列挙方法は、上記した効果と同様の効果を奏する。 The station name enumeration program of the ticket issuing machine according to the present invention, the computer-readable recording medium in which the station name enumeration program of the ticket issuing machine is recorded, and the station name enumeration method in the ticket issuing machine have the same effects as described above There is an effect.
次に、本発明の実施例を図面に基づいて説明する。図29から図37は、本発明の第一実施例を示し、図14から図22は本発明の第二実施例を示す。 Next, embodiments of the present invention will be described with reference to the drawings. 29 to 37 show a first embodiment of the present invention, and FIGS. 14 to 22 show a second embodiment of the present invention.
<第一実施例>
図29において、第一実施例では、オペレータによって入力された仮名文字(検索文字)が「ヨコハマ」である(ステップS2)。候補駅名は「ヨコハマ」を含む「新横浜(シンヨコハマ)」「陸奥横浜(ムツヨコハマ)」および「横浜(ヨコハマ)」である。
<First Example>
In FIG. 29, in the first embodiment, the kana character (search character) input by the operator is “Yokohama” (step S2). Candidate station names include “Yokohama”, “Shin Yokohama”, “Mutsu Yokohama” and “Yokohama”.
図30において、「シンヨコハマ」は頻出語(読み仮名)と一致する「シン」が[A]に区分され、「ヨコハマ」が第一の未知語となって[C]に区分される(ステップS3)。「ムツヨコハマ」は頻出語(読み仮名)と一致する「ムツ」が[A]に区分され、「ヨコハマ」が上記同様に[C]に区分される。同様に「ヨコハマ」は[C]に区分される。 In FIG. 30, “Shin Yokohama” is classified as [A], “Shin”, which coincides with a frequent word (reading kana), and “Yokohama” is classified as [C] as the first unknown word (step). S3). As for “Mutsukohama”, “Mutsu” that coincides with frequent words (reading kana) is classified as [A], and “Yokohama” is classified as [C] as described above. Similarly, “Yokohama” is classified as [C].
図31において、「シンヨコハマ」は[C]が検索文字である「ヨコハマ」と一致するため(検索文字である「ヨコハマ」が[C]の先頭であるため)、確度が“高”である(ステップS4)。同様に、「ムツヨコハマ」は[C]が検索文字である「ヨコハマ」と一致するため、確度が“高”である。同様に「ヨコハマ」は確度が”高“である。 In FIG. 31, “ShinYokohama” matches “Y” as the search character (“Yokohama”) (since “Yokohama” as the search character is the head of [C]), the accuracy is “high”. (Step S4). Similarly, “Mutokohama” has a high accuracy because “C” matches “Yokohama” as the search character. Similarly, “Yokohama” has a high accuracy.
図32において、「新横浜」は頻出語(漢字)と一致する「新」が[A]に区分され、駅名と一致する「横浜」が[B]に区分される(ステップS5)。「陸奥横浜」は頻出語(漢字)と一致する「陸奥」が[A]に区分され、「横浜」が上記同様に[B]に区分される。「横浜」は[C]であるが[B]に区分し直される。 In FIG. 32, “Shin-Yokohama” is divided into “A” for “New” that matches frequently-occurring words (Kanji), and “Yokohama” that matches with the station name is divided into [B] (Step S5). In “Mutsu-Yokohama”, “Mutsu”, which coincides with frequent words (kanji), is classified as [A], and “Yokohama” is classified as [B] as described above. “Yokohama” is [C] but is reclassified as [B].
図33において、各候補駅名(漢字)は、「新横浜」が「新」と「横浜」とに分解され、「陸奥横浜」が「陸奥」と「横浜」とに分解されて並べられる(ステップS6)。 In FIG. 33, each candidate station name (kanji) is divided into “Shin-Yokohama” into “New” and “Yokohama”, and “Mutsu-Yokohama” is separated into “Mutsu-ku” and “Yokohama” (step S6). ).
図34において、候補駅名(漢字)はすべて確度が“高”であるため第一条件に関して同位である。共通する分解単語は「横浜」である(ステップS7)。分解単語は、「横浜」が3個、「新」および「陸奥」が1個である。したがって第二条件に関して、分解単語である「横浜」を含む「新横浜」「陸奥横浜」および候補駅名(漢字)である「横浜」は上位であり、「新」を含む「新横浜」および「陸奥」を含む「陸奥横浜」は下位である。分解単語は文字コードに関し「新」「陸奥」の順である。 In FIG. 34, all candidate station names (kanji) have the same accuracy with respect to the first condition because the accuracy is “high”. The common decomposed word is “Yokohama” (step S7). The decomposed words are three “Yokohama” and one “New” and “Mutsu”. Therefore, regarding the second condition, “Shin-Yokohama” including “Yokohama” which is the decomposition word and “Yokohama” which is the candidate station name (kanji) are higher rank, and “Shin-Yokohama” and “Mutsu” including “New”. "Mutsu Yokohama" including is subordinate. The decomposed words are in the order of “new” and “mutsu” in relation to the character code.
図35において、分解単語である「横浜」は候補駅名(漢字)である「横浜」と一致するため(先頭であるため)位置が「前」である(ステップS8)。分解単語である「横浜」は「新横浜」の末尾であるため位置が「後」である。分解単語である「横浜」は「陸奥横浜」の末尾であるため位置が「後」である。分解単語である「新」は「新横浜」の先頭であるため位置が「前」である。分解単語である「陸奥」は「陸奥横浜」の先頭であるため位置が「前」である。第三条件に関し分解単語である「横浜」が共通する候補駅名(漢字)は、位置が「前」である「横浜」が上位であり、位置が「後」である「新横浜」および「陸奥横浜」が下位である(図36参照)。 In FIG. 35, since the decomposition word “Yokohama” matches “Yokohama” which is a candidate station name (kanji) (because it is the head), the position is “front” (step S8). Since the breakdown word “Yokohama” is the end of “Shin-Yokohama”, the position is “after”. Since the breakdown word “Yokohama” is the end of “Mutsu Yokohama”, the position is “back”. Since the new word “new” is the head of “Shin-Yokohama”, the position is “front”. Since the decomposition word “Miku” is the head of “Miku”, the position is “front”. Candidate station names (kanji) that share the breakdown word “Yokohama” with respect to the third condition are “Yokohama” with the position “Front”, and “Shin Yokohama” and “Mutsu Yokohama” with the position “Back” "Is the lower order (see FIG. 36).
図36において、下位であり項番が重複するものが削除され(ステップS9)、図37において候補駅名(漢字)は「横浜」「新横浜」「陸奥横浜」の順に並べられる。 In FIG. 36, those that are lower and have duplicate item numbers are deleted (step S9), and in FIG. 37, candidate station names (kanji) are arranged in the order of “Yokohama”, “Shin Yokohama”, and “Mutsu Yokohama”.
<第二実施例>
図14において、第二実施例では、オペレータによって入力された仮名文字(検索文字)が「ヤマト」である(ステップS2)。候補駅名は「ヤマト」を含む「旭山動物園(アサヒヤマドウブツエン)」「甲斐大和(カイヤマト)」「下山門(シモヤマト)」「山都(ヤマト)」「大和(ヤマト)」「大和小泉(ヤマトコイズミ)」「大和新庄(ヤマトシンジョウ)」および「大和二見(ヤマトフタミ)」である。
<Second Example>
In FIG. 14, in the second embodiment, the kana character (search character) input by the operator is “Yamato” (step S2). Candidate station names include “Yamato” “Asahiyama Dobutsuen” “Kaiyamato” “Shimoyamato” “Yamato” “Yamato” “Yamato Koizumi” ) ”“ Yamato Shinjo ”and“ Yamato Futami ”.
図15において、「アサヒヤマドウツブエン」は頻出語(読み仮名)と一致しないため、第一の未知語となり[C]に区分される(ステップS3)。「カイヤマト」は頻出語(読み仮名)と一致する「カイ」および「ヤマト」がそれぞれ[A]に区分される。「シモヤマト」は頻出語(読み仮名)と一致する「シモ」および「ヤマト」がそれぞれ[A]に区分される。「ヤマト」は頻出語(読み仮名)と一致するため[A]に区分される。「ヤマトコイズミ」は頻出語(読み仮名)である「ヤマト」が[A]に区分され、「コイズミ」が第一の未知語となって[C]に区分される。「ヤマトシンジョウ」は頻出語(読み仮名)と一致する「ヤマト」が[A]に区分され、「シンジョウ」が第一の未知語となって[C]に区分される。「ヤマトフタミ」は頻出語(読み仮名)と一致する「ヤマト」が[A]に区分され、「フタミ」が第一の未知語となって[C]に区分される。 In FIG. 15, “Asahiyama Doubsbuen” does not match the frequent word (reading kana), so it becomes the first unknown word and is classified as [C] (step S3). “Kai Yamato” is divided into [A] each of “Kai” and “Yamato” that coincide with frequent words (reading kana). In “Simo Yamato”, “Simo” and “Yamato” that coincide with frequent words (reading kana) are each divided into [A]. “Yamato” is classified as [A] because it coincides with a frequent word (reading kana). In “Yamato Koizumi”, “Yamato”, which is a frequent word (reading pseudonym), is classified as [A], and “Koizumi” is classified as [C] as the first unknown word. In “Yamato Shinjo”, “Yamato” that coincides with a frequent word (reading kana) is classified as [A], and “Shinjo” is classified as [C] as the first unknown word. In “Yamato Futami”, “Yamato” that coincides with the frequent words (reading kana) is classified as [A], and “Futami” is classified as [C] as the first unknown word.
図16において、「アサヒヤマドウブツエン」は先頭が検索文字である「ヤマト」と一致しないため確度が“低”である(ステップS4)。「カイヤマト」は[A]が検索文字である「ヤマト」と一致するため、確度が“高”である。「シモヤマト」は[A]が検索文字である「ヤマト」と一致するため、確度が“高”である。「ヤマト」は[A]が検索文字である「ヤマト」と一致するため、確度が“高”である。「ヤマトコイズミ」は[A]が検索された文字である「ヤマト」と一致するため、確度が“高”である。「ヤマトシンジョウ」は[A]が検索された文字である「ヤマト」と一致するため、確度が“高”である。「ヤマトフタミ」は[A]が検索された文字である「ヤマト」と一致するため、確度が“高”である。 In FIG. 16, “Asahiyama Dobutsuen” does not match the search character “Yamato” at the beginning, so the accuracy is “low” (step S4). The accuracy of “Kiyamato” is “high” because [A] matches the search character “Yamato”. “Shiyamato” has a high accuracy because “A” matches “Yamato” as a search character. “Yamato” has a high accuracy because [A] matches the search character “Yamato”. Since “Yamato Koizumi” matches “Yamato”, which is the character searched for [A], the accuracy is “high”. Since “Yamato Shinjo” matches “Yamato”, which is the searched character, [A] has a high accuracy. Since “Yamato Futami” matches “Yamato” which is the searched character, [A] has a high accuracy.
図17において、「旭山動物園」は[C]であるが[B]に区分し直される(ステップS5)。「甲斐大和」は頻出語(漢字)と一致する「甲斐」および「大和」がそれぞれ[A]に区分される。「下山門」は頻出語(漢字)と一致する「下」が[A]に区分され、第二の未知語となる「山門」が[C]に区分される。「山都」は[C]であるが[B]に区分し直される。「大和」は頻出語(漢字)と一致するため[A]に区分される。「大和小泉」は頻出語(漢字)と一致する「大和」が[A]に区分され、駅名(漢字)と一致する「小泉」が[B]に区分される。「大和新庄」は頻出語(漢字)と一致する「大和」が[A]に区分され、駅名(漢字)と一致する「新庄」が[B]に区分される。「大和二見」は頻出語(漢字)と一致する「大和」が[A]に区分され、第二の未知語となる「小泉」が[C]に区分される。 In FIG. 17, “Asahiyama Zoo” is [C], but is reclassified to [B] (step S5). In “Kai Yamato”, “Kai” and “Yamato” that coincide with frequent words (Kanji) are classified into [A]. In “Shimoyamamon”, “bottom” that coincides with a frequently used word (kanji) is classified as [A], and “yamamon” as the second unknown word is classified as [C]. “Santo” is [C] but is reclassified to [B]. “Yamato” is classified as [A] because it matches a frequent word (kanji). As for “Yamato Koizumi”, “Yamato” that matches the frequent word (kanji) is classified as [A], and “Koizumi” that matches the station name (kanji) is classified as [B]. In “Yamato Shinjo”, “Yamato” that matches the frequent word (kanji) is classified as [A], and “Shinjo” that matches the station name (kanji) is classified as [B]. In “Yamato Futami”, “Yamato” that coincides with frequent words (kanji) is classified as [A], and “Koizumi” as the second unknown word is classified as [C].
図18において、「旭山動物園」は分解されない。「甲斐大和」は「甲斐」と「大和」とに分解されて並べられる(ステップS6)。「下山門」は「下」と「山門」とに分解されて並べられる。「山都」「大和」は分解されない。「大和小泉」は「大和」と「小泉」とに分解されて並べられる。「大和新庄」は「大和」と「新庄」とに分解されて並べられる。「大和二見」は「大和」と「二見」とに分解されて並べられる。 In FIG. 18, “Asahiyama Zoo” is not disassembled. “Kai Yamato” is divided into “Kai” and “Yamato” and arranged (step S6). "Shimoyamamon" is broken down into "bottom" and "yamamon". “Santo” and “Yamato” are not disassembled. “Yamato Koizumi” is broken down into “Yamato” and “Koizumi”. “Yamato Shinjo” is broken down into “Yamato” and “Shinjo”. “Yamato Futami” is broken down into “Yamato” and “Futami”.
図19において、「旭山動物園」は確度が“低”であるため、第一条件に関して下位であり、それ以外候補駅名(漢字)は確度が“高”であるため、上位である(ステップS7)。共通する分解単語は「大和」である。分解単語は「大和」が5個、「下」「甲斐」「山都」「山門」「小泉」「新庄」「二見」「旭山動物園」がそれぞれ1個である。したがって第二条件に関して、分解単語である「大和」を含む「甲斐大和」「大和」「大和小泉」「大和新庄」「大和二見」は上位であり、それ以外は下位である。分解単語は文字コードに関し「下」「甲斐」「山都」「山門」「小泉」「新庄」「二見」「旭山動物園」の順である。 In FIG. 19, “Asahiyama Zoo” has a low accuracy, so it is low in terms of the first condition, and the other candidate station names (kanji) have a high accuracy, so that they are high (step S7). . The common decomposed word is “Yamato”. The decomposed words are five “Yamato”, and one each of “below”, “armor”, “mountain”, “Sanmon”, “Koizumi”, “Shinjo”, “Futami” and “Asahiyama Zoo”. Therefore, regarding the second condition, “Kai Yamato”, “Yamato”, “Yamato Koizumi”, “Yamato Shinjo”, and “Yamato Futami” including the dissociation word “Yamato” are higher, and the others are lower. The decomposed words are in the order of “lower”, “armor”, “mountain”, “yamamon”, “Koizumi”, “Shinjo”, “Futami”, “Asahiyama Zoo”.
図20において、分解単語である「大和」は候補駅名である「大和」と一致するため(先頭であるため)位置が「前」である。分解単語である「大和」は「大和小泉」の先頭であるため位置が「前」である。分解単語である「大和」は「大和新庄」の先頭であるため位置が「前」である。分解単語である「大和」は「大和二見」の先頭であるため位置が「前」である。分解単語である「大和」は「甲斐大和」の末尾であるため位置が「後」である。分解単語である「下」は「下山門」の先頭であるため位置が「前」である。分解単語である「甲斐」は「甲斐大和」の先頭であるため位置が「前」である。分解単語である「山都」は候補駅名(漢字)である「山都」と一致するため(先頭であるため)位置が「前」である。分解単語である「山門」は「下山門」の末尾であるため位置が「後」である。分解単語である「小泉」は「大和小泉」の末尾であるため位置が「後」である。分解単語である「新庄」は「大和新庄」の末尾であるため位置が「後」である。分解単語である「二見」は「大和二見」の末尾であるため位置が「後」である。分解単語である「旭山動物園」は候補駅名(漢字)である「旭山動物園」と一致するため(先頭であるため)位置が「前」である(図21参照)。 In FIG. 20, the decomposed word “Yamato” matches the candidate station name “Yamato” (because it is the head), so the position is “Previous”. Since the decomposition word “Yamato” is the head of “Yamato Koizumi”, the position is “Previous”. Since the disassembled word “Yamato” is the head of “Yamato Shinjo”, the position is “Previous”. Since the decomposition word “Yamato” is the head of “Yamato Futami”, the position is “Previous”. Since the decomposed word “Yamato” is the end of “Kai Yamato”, the position is “after”. Since the decomposition word “below” is the head of “Shimoyamamon”, the position is “front”. Since the disassembled word “Kai” is the head of “Kai Yamato”, the position is “Previous”. Since the disassembled word “Santo” matches the candidate station name (Kanji) “Santo” (because it is the head), the position is “Previous”. Since the disassembled word “Sanmon” is the end of “Shimoyamamon”, the position is “After”. Since the decomposition word “Koizumi” is the end of “Yamato Koizumi”, the position is “after”. Since the decomposition word “Shinjo” is the end of “Yamato Shinjo”, the position is “after”. Since the disassembled word “Futami” is the end of “Yamato Futami”, the position is “After”. Since the decomposed word “Asahiyama Zoo” matches the candidate station name (Kanji) “Asahiyama Zoo” (because it is the head), the position is “front” (see FIG. 21).
図21において、下位であり項番が重複するものが削除され、図22において候補駅名(漢字)は「大和」「大和小泉」「大和新庄」「大和二見」「甲斐大和」「下山門」「山都」「旭山動物園」の順に並べられる。 In FIG. 21, subordinate items with overlapping item numbers are deleted. In FIG. 22, candidate station names (kanji) are “Yamato”, “Yamato Koizumi”, “Yamato Shinjo”, “Yamato Futami”, “Kai Yamato”, “Shimasumon”, “Mountain” They are arranged in the order of “City” and “Asahiyama Zoo”.
以上、本発明の実施形態を詳述したが、本発明は上記実施形態に限定されるものではない。そして本発明は、特許請求の範囲に記載された事項を逸脱することがなければ、種々の設計変更を行うことが可能である。 As mentioned above, although embodiment of this invention was explained in full detail, this invention is not limited to the said embodiment. The present invention can be modified in various ways without departing from the scope of the claims.
1 CPU
2 RAM
3 ROM
4 HDD
10 乗車券発券機
20 処理部
21 クレジットカードリーダ
22 暗証記号入力パッド
30 操作部
31 タッチパネル
40 出力部
41 ディスプレイ
42 発券プリンタ
43 レシートプリンタ
44 ICカードプリンタ
50 制御部
51 駅名記憶部
52 頻出語記憶部
53 読み仮名区分装置
54 文字位置解析装置
55 候補駅名区分装置
56 分析装置
1 CPU
2 RAM
3 ROM
4 HDD
DESCRIPTION OF SYMBOLS 10 Ticket issuing machine 20 Processing part 21 Credit card reader 22 PIN input pad 30 Operation part 31 Touch panel 40 Output part 41 Display 42 Ticket issuing printer 43 Receipt printer 44 IC card printer 50 Control part 51 Station name memory | storage part 52 Frequent word memory | storage part 53 Reading Kana classification device 54 Character position analysis device 55 Candidate station name classification device 56 Analysis device
Claims (6)
前記駅名に用いられる頻度が高い文字である頻出語が読み仮名と共に記憶された頻出語記憶部と、
前記頻出語記憶部を用いて、前記候補駅名の読み仮名から、前記頻出語の読み仮名部分、この頻出語の読み仮名部分以外の読み仮名部分である第一の未知語部分、を区分する読み仮名区分装置と、
この読み仮名区分装置が区分した前記頻出語の読み仮名部分および前記第一の未知語部分のうち、いずれかの文字列に含まれる前記入力された文字の位置を解析する文字位置解析装置と、
前記頻出語記憶部および前記駅名記憶部を用いて、前記候補駅名から、前記頻出語部分、前記候補駅名の文字列に含まれる前記駅名である包含駅名部分、および、前記頻出語部分および前記包含駅名部分以外の文字部分である第二の未知語部分、を区分する候補駅名区分装置と、
前記文字位置解析装置が解析した前記入力された文字の位置に基づく前記候補駅名の並べ方を第一条件として、この第一条件に基づいて前記候補駅名を並べ、
前記候補駅名同士で共通する文字列を、前記候補駅名区分装置が区分した頻出語部分、包含駅名部分、および第二の未知語部分ごとに検出して計数し、この計数した前記候補駅名同士で共通する文字列の個数に基づく前記候補駅名の並べ方を第二条件として、前記第一条件にしたがいつつ前記第二条件に基づいて前記候補駅名を並べる分析装置と、
から構成された、
ことを特徴とする乗車券発券機。 In the ticket issuing machine that extracts the station name including the input characters and displays it as a candidate station name from the station name storage unit in which the station name is read and stored together with the pseudonym,
A frequent word storage unit in which frequent words that are frequently used in the station name are stored together with reading kana,
Using the frequent word storage unit, a reading kana part of the candidate station name is used to distinguish a reading kana part of the frequent word and a first unknown word part that is a reading kana part other than the reading kana part of the frequent word. A kana sorting device;
A character position analysis device for analyzing the position of the input character included in any one of the character strings of the frequently used word and the first unknown word portion classified by the reading character classification device;
Using the frequent word storage unit and the station name storage unit, from the candidate station name, the frequent word part, an included station name part that is the station name included in a character string of the candidate station name, and the frequent word part and the inclusion Candidate station name classifying device that classifies a second unknown word part that is a character part other than the station name part,
Arranging the candidate station names based on the first condition based on the input character position analyzed by the character position analysis device, the candidate station names based on the first condition,
A common character string between the candidate station names is detected and counted for each frequent word part, inclusion station name part, and second unknown word part classified by the candidate station name classification device. An analysis device that arranges the candidate station names based on the second condition while following the first condition, with the second condition being a way of arranging the candidate station names based on the number of common character strings,
Composed of,
A ticket issuing machine characterized by that.
ことを特徴とする請求項1に記載の乗車券発券機。 The analysis apparatus uses the second condition word line arrangement method based on the position of the frequent station part, the included station name part, and the second unknown word part classified by the candidate station name classification apparatus in the candidate station name as the second condition. Arranging the candidate station names based on the third condition according to the conditions,
The ticket issuing machine according to claim 1.
前記第二条件は、前記計数した前記候補駅名同士で共通する文字列の個数が多い前記候補駅名を、並べ方の上位とすることであり、
前記第三条件は、前記候補駅名区分装置が区分した頻出語部分、包含駅名部分、および第二の未知語部分の前記候補駅名における位置が先頭である前記候補駅名、途中である前記候補駅名、末尾である前記候補駅名の順に前記候補駅名を並べることである、
ことを特徴とする請求項2に記載の乗車券発券機。 The first condition is that the position of the input character is the candidate station name that is at the head of either the reading kana part of the frequent word or the first unknown word part classified by the reading kana classification device To the top of the lineup,
The second condition is to place the candidate station names having a large number of character strings in common between the counted candidate station names in the order of arrangement,
The third condition is that the candidate station name at the top of the candidate station name at the position of the candidate station name of the frequent word part, inclusion station name part, and second unknown word part classified by the candidate station name classification device, The candidate station names are arranged in the order of the candidate station names at the end.
The ticket issuing machine according to claim 2, wherein:
コンピュータを、
前記駅名に用いられる頻度が高い文字である頻出語が読み仮名と共に記憶された頻出語記憶装置と、
前記頻出語記憶部を用いて、前記候補駅名の読み仮名から、前記頻出語の読み仮名部分、この頻出語の読み仮名部分以外の読み仮名部分である第一の未知語部分、を区分する読み仮名区分装置と、
この読み仮名区分装置が区分した前記頻出語の読み仮名部分および前記第一の未知語部分のうち、いずれかの文字列に含まれる前記入力された文字の位置を解析する文字位置解析装置と、
前記頻出語記憶部および前記駅名記憶部を用いて、前記候補駅名から、前記頻出語部分、前記候補駅名の文字列に含まれる前記駅名である包含駅名部分、および、前記頻出語部分および前記包含駅名部分以外の文字部分である第二の未知語部分、を区分する候補駅名区分装置と、
前記文字位置解析装置が解析した前記入力された文字の位置に基づく前記候補駅名の並べ方を第一条件として、この第一条件に基づいて前記候補駅名を並べ、
前記候補駅名同士で共通する文字列を、前記候補駅名区分装置が区分した頻出語部分、包含駅名部分、および第二の未知語部分ごとに検出して計数し、この計数した前記候補駅名同士で共通する文字列の個数に基づく前記候補駅名の並べ方を第二条件として、前記第一条件にしたがいつつ前記第二条件に基づいて前記候補駅名を並べる分析装置と、
して機能させる、
ことを特徴とする乗車券発券機の駅名列挙プログラム。 In the station name enumeration program of the ticket issuing machine that extracts the station name including the input characters and displays it as a candidate station name from the station name storage unit in which the station name is stored together with the reading pseudonym,
Computer
A frequent word storage device in which frequent words that are frequently used in the station name are stored together with reading kana,
Using the frequent word storage unit, a reading kana part of the candidate station name is used to distinguish a reading kana part of the frequent word and a first unknown word part that is a reading kana part other than the reading kana part of the frequent word. A kana sorting device;
A character position analysis device for analyzing the position of the input character included in any one of the character strings of the frequently used word and the first unknown word portion classified by the reading character classification device;
Using the frequent word storage unit and the station name storage unit, from the candidate station name, the frequent word part, an included station name part that is the station name included in a character string of the candidate station name, and the frequent word part and the inclusion Candidate station name classifying device that classifies a second unknown word part that is a character part other than the station name part,
Arranging the candidate station names based on the first condition based on the input character position analyzed by the character position analysis device, the candidate station names based on the first condition,
A common character string between the candidate station names is detected and counted for each frequent word part, inclusion station name part, and second unknown word part classified by the candidate station name classification device. An analysis device that arranges the candidate station names based on the second condition while following the first condition, with the second condition being a way of arranging the candidate station names based on the number of common character strings,
Make it work,
Station name enumeration program for ticket-issuing machines.
ことを特徴とするコンピュータで読み取り可能な記録媒体。 The station name enumeration program of the ticket issuing machine according to claim 4 is recorded,
A computer-readable recording medium characterized by the above.
前記駅名に用いられる頻度が高い文字である頻出語が読み仮名と共に記憶された頻出語記憶部を備え、
コンピュータを動作させるための、
前記頻出語記憶部を用いて、前記候補駅名の読み仮名から、前記頻出語の読み仮名部分、この頻出語の読み仮名部分以外の読み仮名部分である第一の未知語部分、を区分する読み仮名区分手順と、
この読み仮名区分装置が区分した前記頻出語の読み仮名部分および前記第一の未知語部分のうち、いずれかの文字列に含まれる前記入力された文字の位置を解析する文字位置解析手順と、
前記頻出語記憶部および前記駅名記憶部を用いて、前記候補駅名から、前記頻出語部分、前記候補駅名の文字列に含まれる前記駅名である包含駅名部分、および、前記頻出語部分および前記包含駅名部分以外の文字部分である第二の未知語部分、を区分する候補駅名区分手順と、
前記文字位置解析装置が解析した前記入力された文字の位置に基づく前記候補駅名の並べ方を第一条件として、この第一条件に基づいて前記候補駅名を並べ、
前記候補駅名同士で共通する文字列を、前記候補駅名区分装置が区分した頻出語部分、包含駅名部分、および第二の未知語部分ごとに検出して計数し、この計数した前記候補駅名同士で共通する文字列の個数に基づく前記候補駅名の並べ方を第二条件として、前記第一条件にしたがいつつ前記第二条件に基づいて前記候補駅名を並べる分析手順と、
を有する、
ことを特徴とする乗車券発券機における駅名列挙方法。 In the station name enumeration method in the ticket issuing machine that extracts the station name including the input characters and displays it as a candidate station name from the station name storage unit in which the station name is stored together with the reading pseudonym,
A frequent word storage unit in which frequent words that are frequently used in the station name are stored together with reading kana,
To operate the computer,
Using the frequent word storage unit, a reading kana part of the candidate station name is used to distinguish a reading kana part of the frequent word and a first unknown word part that is a reading kana part other than the reading kana part of the frequent word. Kana classification procedure;
Character position analysis procedure for analyzing the position of the input character included in any one of the character strings of the frequently used words and the first unknown word part classified by the reading kana classification device;
Using the frequent word storage unit and the station name storage unit, from the candidate station name, the frequent word part, an included station name part that is the station name included in a character string of the candidate station name, and the frequent word part and the inclusion Candidate station name classification procedure for classifying the second unknown word part, which is a character part other than the station name part,
Arranging the candidate station names based on the first condition based on the input character position analyzed by the character position analysis device, the candidate station names based on the first condition,
A common character string between the candidate station names is detected and counted for each frequent word part, inclusion station name part, and second unknown word part classified by the candidate station name classification device. An analysis procedure for arranging the candidate station names based on the second condition while following the first condition, with the second condition being the arrangement of the candidate station names based on the number of common character strings,
Having
The station name enumeration method in the ticket issuing machine characterized by the above-mentioned.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013022956A JP5522613B1 (en) | 2013-02-08 | 2013-02-08 | Ticket issuing machine, station name enumeration program for ticket issuing machine, computer-readable recording medium in which station name enumeration program for ticket issuing machine is recorded, and station name enumeration method in ticket issuing machine |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013022956A JP5522613B1 (en) | 2013-02-08 | 2013-02-08 | Ticket issuing machine, station name enumeration program for ticket issuing machine, computer-readable recording medium in which station name enumeration program for ticket issuing machine is recorded, and station name enumeration method in ticket issuing machine |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5522613B1 true JP5522613B1 (en) | 2014-06-18 |
JP2014153909A JP2014153909A (en) | 2014-08-25 |
Family
ID=51175649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013022956A Active JP5522613B1 (en) | 2013-02-08 | 2013-02-08 | Ticket issuing machine, station name enumeration program for ticket issuing machine, computer-readable recording medium in which station name enumeration program for ticket issuing machine is recorded, and station name enumeration method in ticket issuing machine |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5522613B1 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002092660A (en) * | 2000-09-18 | 2002-03-29 | Toshiba Corp | Commutation ticket issuing device and commutation ticket issuing method used for it |
JP2006139411A (en) * | 2004-11-10 | 2006-06-01 | Matsushita Electric Ind Co Ltd | In-train supplement ticket issuing device |
JP2007148775A (en) * | 2005-11-28 | 2007-06-14 | Hitachi Ltd | Station name retrieval method |
JP2009276846A (en) * | 2008-05-12 | 2009-11-26 | Hitachi Ltd | Screen display method for train ticket machine, and train ticket system |
JP2009295192A (en) * | 2009-09-24 | 2009-12-17 | Oki Electric Ind Co Ltd | Discount ticket issuing device and discount ticket issuing system |
-
2013
- 2013-02-08 JP JP2013022956A patent/JP5522613B1/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002092660A (en) * | 2000-09-18 | 2002-03-29 | Toshiba Corp | Commutation ticket issuing device and commutation ticket issuing method used for it |
JP2006139411A (en) * | 2004-11-10 | 2006-06-01 | Matsushita Electric Ind Co Ltd | In-train supplement ticket issuing device |
JP2007148775A (en) * | 2005-11-28 | 2007-06-14 | Hitachi Ltd | Station name retrieval method |
JP2009276846A (en) * | 2008-05-12 | 2009-11-26 | Hitachi Ltd | Screen display method for train ticket machine, and train ticket system |
JP2009295192A (en) * | 2009-09-24 | 2009-12-17 | Oki Electric Ind Co Ltd | Discount ticket issuing device and discount ticket issuing system |
Also Published As
Publication number | Publication date |
---|---|
JP2014153909A (en) | 2014-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005122295A (en) | Relationship figure creation program, relationship figure creation method, and relationship figure generation device | |
CN106951495A (en) | Method and apparatus for information to be presented | |
US7716256B2 (en) | Information navigation system | |
JP2013030089A (en) | Document retrieval system and document retrieval program | |
JP5347878B2 (en) | Inter-literature relationship analysis apparatus, program, and method | |
JP5522613B1 (en) | Ticket issuing machine, station name enumeration program for ticket issuing machine, computer-readable recording medium in which station name enumeration program for ticket issuing machine is recorded, and station name enumeration method in ticket issuing machine | |
JP2008262506A (en) | Information extraction system, information extraction method, and information extraction program | |
JP2004220176A (en) | Database search system and search method, method for forming data file used for search, and storage medium storing data file | |
JP2002157262A (en) | Classification rule definition supporting method | |
JP5326781B2 (en) | Extraction rule creation system, extraction rule creation method, and extraction rule creation program | |
JP2019061522A (en) | Document recommendation system, document recommendation method and document recommendation program | |
JP2006155275A (en) | Information extraction method and information extraction device | |
JPH06124308A (en) | Information rearfrangement processor | |
JP7173314B2 (en) | Mapping support device, mapping support method, and program | |
JP2003203091A (en) | Document speed-read supporting device, method and program, and recording medium | |
JPH10207875A (en) | Tabulating device and its method | |
JPH10105562A (en) | Retrieval system | |
JP4446714B2 (en) | Document search device, document search method, and document search program | |
JP2018055504A (en) | Information processing apparatus | |
JP2549745B2 (en) | Document search device | |
JP4569178B2 (en) | Classification code processor | |
JPH07262199A (en) | Retrieval result sorter | |
WO2021192050A1 (en) | Analysis assistance program, system, and method | |
JP4769379B2 (en) | Document search device | |
JP2018010543A (en) | Notation fluctuation glossary creation device, retrieval system, methods thereof, computer program thereof and recording medium recording computer program thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140331 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5522613 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |