JPH0520299A - 'kana' key item formation processing system - Google Patents

'kana' key item formation processing system

Info

Publication number
JPH0520299A
JPH0520299A JP3171503A JP17150391A JPH0520299A JP H0520299 A JPH0520299 A JP H0520299A JP 3171503 A JP3171503 A JP 3171503A JP 17150391 A JP17150391 A JP 17150391A JP H0520299 A JPH0520299 A JP H0520299A
Authority
JP
Japan
Prior art keywords
kana
character
conversion
key item
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3171503A
Other languages
Japanese (ja)
Inventor
Akihiko Iinuma
明彦 飯沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Software Chubu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Software Chubu Ltd filed Critical NEC Software Chubu Ltd
Priority to JP3171503A priority Critical patent/JPH0520299A/en
Publication of JPH0520299A publication Critical patent/JPH0520299A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To form fixed 'KANA' (Japanese syllabary) key items by converting or deleting voiced sound symbols, semivoiced sound symbols, spaces, parentheses, long sounds, 'u', etc., which may especially frequently mistaken out of 'KANA' character strings in accordance with a fixed rule. CONSTITUTION:A terminal equipment 11 and a magnetic disk device 18 are connected to a host computer 15, the host computer 15 is provided with a main memory 14, an operation program 12 and a 'KANA' character string converter 13 and the device 18 is provided with an index part 16 and a data part 17. The conversion of 'KANA' small letters to 'KANA' large letters, the conversion of a minus numeral and a 'KANA' character under an alphanumeric into long sounds, the deletion of parentheses, a voice sound symbol, a semivoiced sound symbol and a space, the conversion of 'u' to 'o' when the vowel of a just preceding character is in the 'o' string except the case that a 'u' character exists in the 1st character, and the conversion of a character existing immediately before a long sound into its corresponding vowel are executed. Thereby even when an input miss, the reading mistake of a 'KANJI' (Chinese character), the writing mistake of 'KANA' characters, etc., exist, a 'KANA' key item can be formed.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、カード読み取り装置、
光学文字読み取り装置、磁気テープ装置、フロッピーデ
ィスク装置等の周辺処理装置又は端末装置、他システム
等からのオンライン処理で入力されたカナ氏名、カナ企
業名等のカナ文字列をファイルのキー項目として使用す
るように処理するカナキー項目の作成処理方式に関する
ものである。
BACKGROUND OF THE INVENTION The present invention relates to a card reader,
Uses Kana character strings such as Kana name and Kana company name input by online processing from peripheral processing devices or terminal devices such as optical character reading devices, magnetic tape devices, floppy disk devices, and other systems as key items of files The present invention relates to a kana key item creation processing method for performing such processing.

【0002】[0002]

【従来の技術】従来、この種のカナキー項目の作成処理
方式は、カード読み取り装置、光学文字読み取り装置、
磁気テープ装置、フロッピーディスク装置等の周辺処理
装置又は、端末装置、他システム等のオンライン処理で
入力されたカナ文字を、そのままカナキー項目として使
用していた。
2. Description of the Related Art Conventionally, this type of kana key item creation processing system is based on a card reading device, an optical character reading device,
Peripheral processing devices such as magnetic tape devices and floppy disk devices, or kana characters input by online processing of terminal devices, other systems, etc., are used as they are as kana key items.

【0003】[0003]

【発明が解決しようとする課題】上述した従来のカナキ
ー項目の作成処理方式は、入力されたカナ文字列をその
まま、ファイルのカナキー項目としているので、同一氏
名、同一企業名等であったとしても、カナ大文字をカナ
小文字として入力したり、濁点、半濁点、スペース、カ
ッコを付ける位置が間違っていたり、又は余分に付けた
り、カナ文字のつづりを間違えたり、又は入力する段階
で統一されてなかったり(例えば同一の対象についてイ
トオまたはイトウと入力する)、長音を使用したり、し
なかったり(例えはネームとネエム)等というように入
力された場合には、同一対象をまったく別の氏名、企業
名等のカナキー項目として扱うという欠点がある。
In the above-described conventional kana key item creation processing method, since the input kana character string is directly used as the kana key item of the file, even if the same name, the same company name, etc. , Kana capital letters are entered as Kana lower case letters, dakuten, semi-dakuten, spaces, parentheses are wrongly placed or added, spelling kana characters is misspelled, or they are not unified at the input stage. If (for example, enter Ito or Ito for the same object), use long sounds, or not (for example, name and neem), etc., the same object with a completely different name, There is a drawback that it is handled as a kana key item such as a company name.

【0004】[0004]

【課題を解決するための手段】本発明のカナキー項目の
作成処理方式は、カナ文字列からファイルのキー項目を
作成するカナキー項目の作成処理方式において、カナ小
文字のカナ大文字への変換と、数字のマイナスと英数字
の下線のカナ文字の長音への変換と、カッコ、濁点、半
濁点およびスペースの削除と、ウの文字が第一字目に存
在する場合を除き直前の文字の母音がオ列の場合に当該
ウのオへの変換と、長音の直前の文字の対応する母音へ
の変換するための手段とを有する。
The kana key item creation processing method of the present invention is a kana key item creation processing method for creating a key item of a file from a kana character string. Minus and underscore alphanumeric conversion of kana characters into long sounds, deletion of parentheses, dakuten, semi-dakuten and spaces, and the vowel sound of the preceding character is turned off unless the character c is present in the first character. In the case of a string, it has means for converting the c to o and converting the character immediately preceding the long sound into the corresponding vowel.

【0005】[0005]

【実施例】次に、本発明について図面を参照して説明す
る。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, the present invention will be described with reference to the drawings.

【0006】図1は本発明の一実施例を示すブロック図
であり、ホストコンピュータ15に端末装置11および
磁気ディスク装置18が接続され、ホストコンピュータ
15にはメインメモリ14,業務プログラム12および
カナ文字列変換処理13が備えられ、磁気ディスク装置
18には索引部16およびデータ部17が備えられてい
る。
FIG. 1 is a block diagram showing an embodiment of the present invention. A terminal device 11 and a magnetic disk device 18 are connected to a host computer 15, and the host computer 15 has a main memory 14, a business program 12 and kana characters. A column conversion process 13 is provided, and a magnetic disk device 18 is provided with an index unit 16 and a data unit 17.

【0007】本実施例のカナキー項目変換によるデータ
登録処理を説明する。端末装置11より入力されたカナ
文字列、例えはカナ企業名「ニッポン△シーザー」のカ
ナ文字列を、業務プログラム12で受信を行ない、メイ
ン・メモリ14に展開を行なう。カナ文字列変換処理1
3は、メイン・メモリ14に展開されているカナ文字列
を統一されたカナ項目にするための一定の規則に従った
変換を行なう。例えは「ニッポン△シーザー」と入力さ
れたものを「ニホンシイサア」と変換し、メイン・メモ
リ14の別エリアに展開する。業務プログラム12では
変換された結果をカナキー項目として、磁気ディスク1
8内の索引順編成ファイルのキー項目として、索引部1
6とデータ部17に出力する。
A data registration process by converting Kana key items according to the present embodiment will be described. The kana character string input from the terminal device 11, for example, the kana character string of the kana company name “Nippon Δ Caesar” is received by the business program 12 and expanded in the main memory 14. Kana character string conversion processing 1
3 performs conversion according to a certain rule for converting the Kana character string developed in the main memory 14 into a unified Kana item. For example, what is input as “Nippon Δ Caesar” is converted into “Nihon Shiisaa” and is expanded in another area of the main memory 14. In the business program 12, the converted result is used as a kana key item for the magnetic disk 1
Index section 1 as a key item of the index sequential file in
6 and the data section 17.

【0008】次に、本実施例のカナキー項目変換による
データ検索処理を説明する。端末装置11より入力した
カナ文字列を業務プログラム12で受信する。カナ文字
列変換処理23にて一定の規則に従った変換を行ない、
変換結果は統一されたカナ文字列のカナ項目に変換さ
れ、索引部16、データ部17の本来必要なデータを検
索することが可能となる。
Next, a data search process by converting the Kana key item according to the present embodiment will be described. The business program 12 receives the Kana character string input from the terminal device 11. Kana character string conversion processing 23 performs conversion according to a certain rule,
The conversion result is converted into a kana item of a unified kana character string, and it is possible to retrieve the originally necessary data in the index part 16 and the data part 17.

【0009】例えば、「ニッポン△シーザー」と入力す
るのを間違えて端末装置11より「ニホン△シーサー」
と入力されたカナ文字列はカナ文字列変換処理23で
「ニホンシイサア」と変換されデータ登録処理で「ニッ
ポン△シーザー」の変換結果の「ニホンシイサア」と同
じになり、この登録されたデータを検索することが可能
となる。
For example, if the user mistakenly inputs "Nippon Δ Caesar", the terminal device 11 reads "Nihon Δ Caesar".
The kana character string input as is converted to "Japanese character" in the kana character string conversion processing 23 and becomes the same as "Nihon Shiisa" in the conversion result of "Nippon △ Caesar" in the data registration processing, and this registered data is searched. It becomes possible.

【0010】図2はカナ文字列変換処理での一定の規則
に従った処理を示す。
FIG. 2 shows processing in accordance with a certain rule in the kana character string conversion processing.

【0011】入力カナ文字列変換処理21では入力項目
チェック、各変換処理に先だち、カナ小文字をカナ大文
字に、数字のマイナス、英数字の下線を長音にそれぞれ
変換し、入力文字チェック22は、入力文字中に右カッ
コに続いて右カッコがある場合、左カッコに続いて左カ
ッコがある場合、カナ大文字、濁点、半濁点、右カッ
コ、左カッコ、長音以外がある場合、濁点の直前の文字
が、ウ、カ行、サ行、ハ行の文字以外の場合、半濁点の
直前の文字が、ハ行の文字以外の場合はエラーとする。
In the input kana character string conversion process 21, the kana lowercase character is converted into kana uppercase character, the minus of the number and the underline of the alphanumeric character are converted into the long sound respectively before the input item check and each conversion processing, and the input character check 22 inputs If there is a right parenthesis followed by a right parenthesis, a left parenthesis followed by a left parenthesis, a kana capital letter, dakuten, semi-voiced sound, right parenthesis, left parenthesis, or a character other than a long sound, the character immediately before the dakuten If is not a character on U, K, SA, or C, it is an error if the character immediately before the semi-voiced sound is not on H.

【0012】カナ文字削除処理23は、右カッコより前
にある文字列、左カッコより後にある文字列、左右のカ
ッコで囲まれている場合はその内側の文字列、濁点、半
濁点、スペース、左右のカッコの削除を行ない、「ウ」
の変換処理24では、「ウ」の文字が第一字目に存在す
る場合を除いて、直前の文字を参照し、対応する母音が
オ列(オ・コ・ソ・ト・ノ・ホ・モ・ヨ・ロ)の場合
は、「ウ」を「オ」に変換し、長音の変換25は、長音
の直前の文字の対応する母音に変換(例えば「シーザ
ー」と入力されたカナ文字列は「シイサア」と変換)
し、特殊文字変換26として、「チ」を「ツ」、「シ」
を「ス」、「ニッポン」を「ニホン」に変換する。
The kana character deleting process 23 includes a character string before the right parenthesis, a character string after the left parenthesis, a character string inside the parenthesis when surrounded by left and right parentheses, a dakuten, a half-dakuten, a space, Remove the left and right parentheses, and
In the conversion process 24 of, except for the case where the character “U” exists in the first character, the immediately preceding character is referred to, and the corresponding vowel sound is a sequence of o (o, co, so, no, ho, In the case of mo yo ro), "u" is converted to "o", and the conversion 25 of the long sound is converted to the corresponding vowel of the character immediately before the long sound (for example, the kana character string entered as "Caesar"). Is converted to "Shiisaa")
Then, as the special character conversion 26, "chi" is changed to "tsu", "shi".
To "Su" and "Nippon" to "Nihon".

【0013】[0013]

【発明の効果】以上説明したように本発明は、入力され
たカナ文字列のうち特に間違いの多い濁点、半濁点、ス
ペース、カッコ、長音、ウ等を一定の規則に従い変換を
行なったり、削除を行なう事により、入力ミス又は漢字
の読み間違い、あるいはカナ文字のつづり間違い等があ
るような場合においても、一定のカナキー項目の作成が
できる効果がある。
As described above, according to the present invention, the input kana character strings are converted or deleted according to a certain rule, such as the dakuten, the semi-dakuten, the space, the brackets, the long sound, and the c that have many mistakes. By performing the above, there is an effect that a certain kana key item can be created even when there is an input error, a misreading of kanji, or a misspelling of kana characters.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例を示すブロック図である。FIG. 1 is a block diagram showing an embodiment of the present invention.

【図2】図1中のカナ文字変換処理13での処理を示す
流れ図である。
FIG. 2 is a flowchart showing a process in a Kana character conversion process 13 in FIG.

【符号の説明】[Explanation of symbols]

11 端末装置 12 業務プログラム 13 カナ文字列変換処理 14 メイン・メモリ 15 ホストコンピュータ 16 索引順編成ファイルの索引部 17 索引順編成ファイルのデータ部 18 磁気ディスク装置 11 terminal devices 12 Business programs 13 Kana character string conversion processing 14 main memory 15 Host computer 16 Index section of index sequential file 17 Data part of index sequential file 18 Magnetic disk unit

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 カナ文字列からファイルのキー項目を作
成するカナキー項目の作成処理方式において、カナ小文
字のカナ大文字への変換と、数字のマイナスと英数字の
下線のカナ文字の長音への変換と、カッコ、濁点、半濁
点およびスペースの削除と、ウの文字が第一字目に存在
する場合を除き直前の文字の母音がオ列の場合に当該ウ
のオへの変換と、長音の直前の文字の対応する母音への
変換とを含むことを特徴とするカナキー項目の作成処理
方式。
1. In a kana key item creation processing method for creating a key item of a file from a kana character string, kana lowercase characters are converted to kana uppercase characters, and numbers of minus and alphanumeric underlines are converted to kana characters. And the deletion of parentheses, dakuten, semi-dakuten and spaces, and conversion of the chorus to o when the vowel of the preceding letter is o unless there is the letter c in the first character. A method for creating a kana key item, including conversion of the immediately preceding character into a corresponding vowel.
【請求項2】 カナ文字列からファイルのキー項目を作
成するカナキー項目の作成処理方式において、カナ小文
字のカナ大文字への変換と、数字のマイナスと英数字の
下線のカナ文字の長音への変換と、カッコ、濁点、半濁
点およびスペースの削除と、ウの文字が第一字目に存在
する場合を除き直前の文字の母音がオ列の場合に当該ウ
のオへの変換と、長音の直前の文字の対応する母音への
変換と、チをシにシをスにニッポンをニホンに変換する
特殊文字変換処理とを含むことを特徴とするカナキー項
目の作成処理方式。
2. In a kana key item creation processing method for creating a key item of a file from a kana character string, kana lowercase characters are converted to kana uppercase characters and numbers minus and alphanumeric underscores are converted to kana characters. And the deletion of parentheses, dakuten, semi-dakuten and spaces, and conversion of the chorus to o when the vowel of the preceding letter is o unless there is the letter c in the first character. A kana key item creation processing method characterized by including conversion of the immediately preceding character into a corresponding vowel, and special character conversion processing for converting chi to si, si to su and Nippon to Nihon.
JP3171503A 1991-07-12 1991-07-12 'kana' key item formation processing system Pending JPH0520299A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3171503A JPH0520299A (en) 1991-07-12 1991-07-12 'kana' key item formation processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3171503A JPH0520299A (en) 1991-07-12 1991-07-12 'kana' key item formation processing system

Publications (1)

Publication Number Publication Date
JPH0520299A true JPH0520299A (en) 1993-01-29

Family

ID=15924317

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3171503A Pending JPH0520299A (en) 1991-07-12 1991-07-12 'kana' key item formation processing system

Country Status (1)

Country Link
JP (1) JPH0520299A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009044168A (en) * 2003-09-03 2009-02-26 Nikon Corp Device and method for supplying fluid for immersion lithography

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009044168A (en) * 2003-09-03 2009-02-26 Nikon Corp Device and method for supplying fluid for immersion lithography

Similar Documents

Publication Publication Date Title
JP2726568B2 (en) Character recognition method and device
US4876665A (en) Document processing system deciding apparatus provided with selection functions
EP0394633A2 (en) Method for language-independent text tokenization using a character categorization
JPH0823864B2 (en) Heading judgment method
JPH0211934B2 (en)
JPH0520299A (en) 'kana' key item formation processing system
JP3398729B2 (en) Automatic keyword extraction device and automatic keyword extraction method
JP2943791B2 (en) Language identification device, language identification method, and recording medium recording language identification program
JPS6174062A (en) Sentence input system
JP3814000B2 (en) Character string conversion apparatus and character string conversion method
JPS6211385B2 (en)
JP2560959B2 (en) Post-processing method for character recognition
JP2570784B2 (en) Document reader post-processing device
JPH05282293A (en) Word processor
JPH0821031B2 (en) Language analyzer
JPH10198664A (en) Japanese language input system and medium for recorded with japanese language input program
JPH02136970A (en) English word retrieving device
JPH0711800B2 (en) Japanese sentence analysis device
JPH05225183A (en) Automatic error detector for words in japanese sentence
JPH05108703A (en) Machine translator
JPH07141347A (en) Method for segmenting japanese character string
JPH0715690B2 (en) Japanese document analysis device
JPH11191107A (en) Method and device for processing document
JPH06301822A (en) Character recognition postprocessing system
JPH0546806A (en) Character recognition method