JPH0520299A - 'kana' key item formation processing system - Google Patents
'kana' key item formation processing systemInfo
- Publication number
- JPH0520299A JPH0520299A JP3171503A JP17150391A JPH0520299A JP H0520299 A JPH0520299 A JP H0520299A JP 3171503 A JP3171503 A JP 3171503A JP 17150391 A JP17150391 A JP 17150391A JP H0520299 A JPH0520299 A JP H0520299A
- Authority
- JP
- Japan
- Prior art keywords
- kana
- character
- conversion
- key item
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、カード読み取り装置、
光学文字読み取り装置、磁気テープ装置、フロッピーデ
ィスク装置等の周辺処理装置又は端末装置、他システム
等からのオンライン処理で入力されたカナ氏名、カナ企
業名等のカナ文字列をファイルのキー項目として使用す
るように処理するカナキー項目の作成処理方式に関する
ものである。BACKGROUND OF THE INVENTION The present invention relates to a card reader,
Uses Kana character strings such as Kana name and Kana company name input by online processing from peripheral processing devices or terminal devices such as optical character reading devices, magnetic tape devices, floppy disk devices, and other systems as key items of files The present invention relates to a kana key item creation processing method for performing such processing.
【0002】[0002]
【従来の技術】従来、この種のカナキー項目の作成処理
方式は、カード読み取り装置、光学文字読み取り装置、
磁気テープ装置、フロッピーディスク装置等の周辺処理
装置又は、端末装置、他システム等のオンライン処理で
入力されたカナ文字を、そのままカナキー項目として使
用していた。2. Description of the Related Art Conventionally, this type of kana key item creation processing system is based on a card reading device, an optical character reading device,
Peripheral processing devices such as magnetic tape devices and floppy disk devices, or kana characters input by online processing of terminal devices, other systems, etc., are used as they are as kana key items.
【0003】[0003]
【発明が解決しようとする課題】上述した従来のカナキ
ー項目の作成処理方式は、入力されたカナ文字列をその
まま、ファイルのカナキー項目としているので、同一氏
名、同一企業名等であったとしても、カナ大文字をカナ
小文字として入力したり、濁点、半濁点、スペース、カ
ッコを付ける位置が間違っていたり、又は余分に付けた
り、カナ文字のつづりを間違えたり、又は入力する段階
で統一されてなかったり(例えば同一の対象についてイ
トオまたはイトウと入力する)、長音を使用したり、し
なかったり(例えはネームとネエム)等というように入
力された場合には、同一対象をまったく別の氏名、企業
名等のカナキー項目として扱うという欠点がある。In the above-described conventional kana key item creation processing method, since the input kana character string is directly used as the kana key item of the file, even if the same name, the same company name, etc. , Kana capital letters are entered as Kana lower case letters, dakuten, semi-dakuten, spaces, parentheses are wrongly placed or added, spelling kana characters is misspelled, or they are not unified at the input stage. If (for example, enter Ito or Ito for the same object), use long sounds, or not (for example, name and neem), etc., the same object with a completely different name, There is a drawback that it is handled as a kana key item such as a company name.
【0004】[0004]
【課題を解決するための手段】本発明のカナキー項目の
作成処理方式は、カナ文字列からファイルのキー項目を
作成するカナキー項目の作成処理方式において、カナ小
文字のカナ大文字への変換と、数字のマイナスと英数字
の下線のカナ文字の長音への変換と、カッコ、濁点、半
濁点およびスペースの削除と、ウの文字が第一字目に存
在する場合を除き直前の文字の母音がオ列の場合に当該
ウのオへの変換と、長音の直前の文字の対応する母音へ
の変換するための手段とを有する。The kana key item creation processing method of the present invention is a kana key item creation processing method for creating a key item of a file from a kana character string. Minus and underscore alphanumeric conversion of kana characters into long sounds, deletion of parentheses, dakuten, semi-dakuten and spaces, and the vowel sound of the preceding character is turned off unless the character c is present in the first character. In the case of a string, it has means for converting the c to o and converting the character immediately preceding the long sound into the corresponding vowel.
【0005】[0005]
【実施例】次に、本発明について図面を参照して説明す
る。DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, the present invention will be described with reference to the drawings.
【0006】図1は本発明の一実施例を示すブロック図
であり、ホストコンピュータ15に端末装置11および
磁気ディスク装置18が接続され、ホストコンピュータ
15にはメインメモリ14,業務プログラム12および
カナ文字列変換処理13が備えられ、磁気ディスク装置
18には索引部16およびデータ部17が備えられてい
る。FIG. 1 is a block diagram showing an embodiment of the present invention. A terminal device 11 and a magnetic disk device 18 are connected to a host computer 15, and the host computer 15 has a main memory 14, a business program 12 and kana characters. A column conversion process 13 is provided, and a magnetic disk device 18 is provided with an index unit 16 and a data unit 17.
【0007】本実施例のカナキー項目変換によるデータ
登録処理を説明する。端末装置11より入力されたカナ
文字列、例えはカナ企業名「ニッポン△シーザー」のカ
ナ文字列を、業務プログラム12で受信を行ない、メイ
ン・メモリ14に展開を行なう。カナ文字列変換処理1
3は、メイン・メモリ14に展開されているカナ文字列
を統一されたカナ項目にするための一定の規則に従った
変換を行なう。例えは「ニッポン△シーザー」と入力さ
れたものを「ニホンシイサア」と変換し、メイン・メモ
リ14の別エリアに展開する。業務プログラム12では
変換された結果をカナキー項目として、磁気ディスク1
8内の索引順編成ファイルのキー項目として、索引部1
6とデータ部17に出力する。A data registration process by converting Kana key items according to the present embodiment will be described. The kana character string input from the terminal device 11, for example, the kana character string of the kana company name “Nippon Δ Caesar” is received by the business program 12 and expanded in the main memory 14. Kana character string conversion processing 1
3 performs conversion according to a certain rule for converting the Kana character string developed in the main memory 14 into a unified Kana item. For example, what is input as “Nippon Δ Caesar” is converted into “Nihon Shiisaa” and is expanded in another area of the main memory 14. In the business program 12, the converted result is used as a kana key item for the magnetic disk 1
Index section 1 as a key item of the index sequential file in
6 and the data section 17.
【0008】次に、本実施例のカナキー項目変換による
データ検索処理を説明する。端末装置11より入力した
カナ文字列を業務プログラム12で受信する。カナ文字
列変換処理23にて一定の規則に従った変換を行ない、
変換結果は統一されたカナ文字列のカナ項目に変換さ
れ、索引部16、データ部17の本来必要なデータを検
索することが可能となる。Next, a data search process by converting the Kana key item according to the present embodiment will be described. The business program 12 receives the Kana character string input from the terminal device 11. Kana character string conversion processing 23 performs conversion according to a certain rule,
The conversion result is converted into a kana item of a unified kana character string, and it is possible to retrieve the originally necessary data in the index part 16 and the data part 17.
【0009】例えば、「ニッポン△シーザー」と入力す
るのを間違えて端末装置11より「ニホン△シーサー」
と入力されたカナ文字列はカナ文字列変換処理23で
「ニホンシイサア」と変換されデータ登録処理で「ニッ
ポン△シーザー」の変換結果の「ニホンシイサア」と同
じになり、この登録されたデータを検索することが可能
となる。For example, if the user mistakenly inputs "Nippon Δ Caesar", the terminal device 11 reads "Nihon Δ Caesar".
The kana character string input as is converted to "Japanese character" in the kana character string conversion processing 23 and becomes the same as "Nihon Shiisa" in the conversion result of "Nippon △ Caesar" in the data registration processing, and this registered data is searched. It becomes possible.
【0010】図2はカナ文字列変換処理での一定の規則
に従った処理を示す。FIG. 2 shows processing in accordance with a certain rule in the kana character string conversion processing.
【0011】入力カナ文字列変換処理21では入力項目
チェック、各変換処理に先だち、カナ小文字をカナ大文
字に、数字のマイナス、英数字の下線を長音にそれぞれ
変換し、入力文字チェック22は、入力文字中に右カッ
コに続いて右カッコがある場合、左カッコに続いて左カ
ッコがある場合、カナ大文字、濁点、半濁点、右カッ
コ、左カッコ、長音以外がある場合、濁点の直前の文字
が、ウ、カ行、サ行、ハ行の文字以外の場合、半濁点の
直前の文字が、ハ行の文字以外の場合はエラーとする。In the input kana character string conversion process 21, the kana lowercase character is converted into kana uppercase character, the minus of the number and the underline of the alphanumeric character are converted into the long sound respectively before the input item check and each conversion processing, and the input character check 22 inputs If there is a right parenthesis followed by a right parenthesis, a left parenthesis followed by a left parenthesis, a kana capital letter, dakuten, semi-voiced sound, right parenthesis, left parenthesis, or a character other than a long sound, the character immediately before the dakuten If is not a character on U, K, SA, or C, it is an error if the character immediately before the semi-voiced sound is not on H.
【0012】カナ文字削除処理23は、右カッコより前
にある文字列、左カッコより後にある文字列、左右のカ
ッコで囲まれている場合はその内側の文字列、濁点、半
濁点、スペース、左右のカッコの削除を行ない、「ウ」
の変換処理24では、「ウ」の文字が第一字目に存在す
る場合を除いて、直前の文字を参照し、対応する母音が
オ列(オ・コ・ソ・ト・ノ・ホ・モ・ヨ・ロ)の場合
は、「ウ」を「オ」に変換し、長音の変換25は、長音
の直前の文字の対応する母音に変換(例えば「シーザ
ー」と入力されたカナ文字列は「シイサア」と変換)
し、特殊文字変換26として、「チ」を「ツ」、「シ」
を「ス」、「ニッポン」を「ニホン」に変換する。The kana character deleting process 23 includes a character string before the right parenthesis, a character string after the left parenthesis, a character string inside the parenthesis when surrounded by left and right parentheses, a dakuten, a half-dakuten, a space, Remove the left and right parentheses, and
In the conversion process 24 of, except for the case where the character “U” exists in the first character, the immediately preceding character is referred to, and the corresponding vowel sound is a sequence of o (o, co, so, no, ho, In the case of mo yo ro), "u" is converted to "o", and the conversion 25 of the long sound is converted to the corresponding vowel of the character immediately before the long sound (for example, the kana character string entered as "Caesar"). Is converted to "Shiisaa")
Then, as the special character conversion 26, "chi" is changed to "tsu", "shi".
To "Su" and "Nippon" to "Nihon".
【0013】[0013]
【発明の効果】以上説明したように本発明は、入力され
たカナ文字列のうち特に間違いの多い濁点、半濁点、ス
ペース、カッコ、長音、ウ等を一定の規則に従い変換を
行なったり、削除を行なう事により、入力ミス又は漢字
の読み間違い、あるいはカナ文字のつづり間違い等があ
るような場合においても、一定のカナキー項目の作成が
できる効果がある。As described above, according to the present invention, the input kana character strings are converted or deleted according to a certain rule, such as the dakuten, the semi-dakuten, the space, the brackets, the long sound, and the c that have many mistakes. By performing the above, there is an effect that a certain kana key item can be created even when there is an input error, a misreading of kanji, or a misspelling of kana characters.
【図1】本発明の一実施例を示すブロック図である。FIG. 1 is a block diagram showing an embodiment of the present invention.
【図2】図1中のカナ文字変換処理13での処理を示す
流れ図である。FIG. 2 is a flowchart showing a process in a Kana character conversion process 13 in FIG.
11 端末装置 12 業務プログラム 13 カナ文字列変換処理 14 メイン・メモリ 15 ホストコンピュータ 16 索引順編成ファイルの索引部 17 索引順編成ファイルのデータ部 18 磁気ディスク装置 11 terminal devices 12 Business programs 13 Kana character string conversion processing 14 main memory 15 Host computer 16 Index section of index sequential file 17 Data part of index sequential file 18 Magnetic disk unit
Claims (2)
成するカナキー項目の作成処理方式において、カナ小文
字のカナ大文字への変換と、数字のマイナスと英数字の
下線のカナ文字の長音への変換と、カッコ、濁点、半濁
点およびスペースの削除と、ウの文字が第一字目に存在
する場合を除き直前の文字の母音がオ列の場合に当該ウ
のオへの変換と、長音の直前の文字の対応する母音への
変換とを含むことを特徴とするカナキー項目の作成処理
方式。1. In a kana key item creation processing method for creating a key item of a file from a kana character string, kana lowercase characters are converted to kana uppercase characters, and numbers of minus and alphanumeric underlines are converted to kana characters. And the deletion of parentheses, dakuten, semi-dakuten and spaces, and conversion of the chorus to o when the vowel of the preceding letter is o unless there is the letter c in the first character. A method for creating a kana key item, including conversion of the immediately preceding character into a corresponding vowel.
成するカナキー項目の作成処理方式において、カナ小文
字のカナ大文字への変換と、数字のマイナスと英数字の
下線のカナ文字の長音への変換と、カッコ、濁点、半濁
点およびスペースの削除と、ウの文字が第一字目に存在
する場合を除き直前の文字の母音がオ列の場合に当該ウ
のオへの変換と、長音の直前の文字の対応する母音への
変換と、チをシにシをスにニッポンをニホンに変換する
特殊文字変換処理とを含むことを特徴とするカナキー項
目の作成処理方式。2. In a kana key item creation processing method for creating a key item of a file from a kana character string, kana lowercase characters are converted to kana uppercase characters and numbers minus and alphanumeric underscores are converted to kana characters. And the deletion of parentheses, dakuten, semi-dakuten and spaces, and conversion of the chorus to o when the vowel of the preceding letter is o unless there is the letter c in the first character. A kana key item creation processing method characterized by including conversion of the immediately preceding character into a corresponding vowel, and special character conversion processing for converting chi to si, si to su and Nippon to Nihon.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3171503A JPH0520299A (en) | 1991-07-12 | 1991-07-12 | 'kana' key item formation processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3171503A JPH0520299A (en) | 1991-07-12 | 1991-07-12 | 'kana' key item formation processing system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0520299A true JPH0520299A (en) | 1993-01-29 |
Family
ID=15924317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3171503A Pending JPH0520299A (en) | 1991-07-12 | 1991-07-12 | 'kana' key item formation processing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0520299A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009044168A (en) * | 2003-09-03 | 2009-02-26 | Nikon Corp | Device and method for supplying fluid for immersion lithography |
-
1991
- 1991-07-12 JP JP3171503A patent/JPH0520299A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009044168A (en) * | 2003-09-03 | 2009-02-26 | Nikon Corp | Device and method for supplying fluid for immersion lithography |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2726568B2 (en) | Character recognition method and device | |
US4876665A (en) | Document processing system deciding apparatus provided with selection functions | |
EP0394633A2 (en) | Method for language-independent text tokenization using a character categorization | |
JPH0823864B2 (en) | Heading judgment method | |
JPH0211934B2 (en) | ||
JPH0520299A (en) | 'kana' key item formation processing system | |
JP3398729B2 (en) | Automatic keyword extraction device and automatic keyword extraction method | |
JP2943791B2 (en) | Language identification device, language identification method, and recording medium recording language identification program | |
JPS6174062A (en) | Sentence input system | |
JP3814000B2 (en) | Character string conversion apparatus and character string conversion method | |
JPS6211385B2 (en) | ||
JP2560959B2 (en) | Post-processing method for character recognition | |
JP2570784B2 (en) | Document reader post-processing device | |
JPH05282293A (en) | Word processor | |
JPH0821031B2 (en) | Language analyzer | |
JPH10198664A (en) | Japanese language input system and medium for recorded with japanese language input program | |
JPH02136970A (en) | English word retrieving device | |
JPH0711800B2 (en) | Japanese sentence analysis device | |
JPH05225183A (en) | Automatic error detector for words in japanese sentence | |
JPH05108703A (en) | Machine translator | |
JPH07141347A (en) | Method for segmenting japanese character string | |
JPH0715690B2 (en) | Japanese document analysis device | |
JPH11191107A (en) | Method and device for processing document | |
JPH06301822A (en) | Character recognition postprocessing system | |
JPH0546806A (en) | Character recognition method |