JPH0962661A - Device and method for automatically discriminating code system - Google Patents

Device and method for automatically discriminating code system

Info

Publication number
JPH0962661A
JPH0962661A JP7220438A JP22043895A JPH0962661A JP H0962661 A JPH0962661 A JP H0962661A JP 7220438 A JP7220438 A JP 7220438A JP 22043895 A JP22043895 A JP 22043895A JP H0962661 A JPH0962661 A JP H0962661A
Authority
JP
Japan
Prior art keywords
code
jis
euc
identification
shift
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7220438A
Other languages
Japanese (ja)
Inventor
Hiromi Sugawara
博美 菅原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solution Innovators Ltd filed Critical NEC Solution Innovators Ltd
Priority to JP7220438A priority Critical patent/JPH0962661A/en
Publication of JPH0962661A publication Critical patent/JPH0962661A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To perform the discrimination of a code system for which all character codes are made to be objects by analyzing input data and discriminating which of a JIS code, an EUC code and a shift JIS code the code system belongs to. SOLUTION: A data input means 1 inputs a data file 101 for which it is desired to discriminate which of the JIS code, the shift JIS code and the EUC code the code system belongs to. Then, a code system discrimination device 20 discriminates the code system of inputted data as the JIS code in the case of the JIS code by a first discrimination means 2 from the presence/absence of the peculiar character codes of the respective code systems including external character codes and the combination of the codes. When it is not discriminated as the JIS code in the first discrimination means 2, whether it is the shift JIS code or the EUC code is checked by a second discrimination means 3 and the shift JIS code and the EUC code are discriminated. Then, the discriminated result 201 is outputted from a discriminated result output means 4.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、コード体系自動識
別装置に関し、特に、外字文字を含めたコード体系を自
動識別するコード体系自動識別装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a code system automatic identification device, and more particularly to a code system automatic identification device for automatically identifying a code system including an external character.

【0002】[0002]

【従来の技術】従来、この種のコード体系自動識別装置
は、コード体系がそれぞれに持つ外字文字コードは除外
されてコード体系の識別が行われていた。
2. Description of the Related Art Conventionally, in this type of code system automatic identification apparatus, the code system is identified by excluding the external character code that each code system has.

【0003】[0003]

【発明が解決しようとする課題】この従来のコード体系
自動識別装置では、外字コードは識別するための識別条
件とされないため、独自の外字コードが含まれるデータ
を識別する際に識別できないことがあるという問題があ
る。
In this conventional code system automatic identification device, since the external character code is not used as an identification condition for identification, it may not be possible to identify when identifying the data containing the unique external character code. There is a problem.

【0004】[0004]

【課題を解決するための手段】本発明のコード体系自動
識別装置は、JISコード、シフトJISコード、EU
Cコードのいずれのコード体系かを識別したいデータフ
ァイル(101) を入力するデータ入力手段(1) と、入力さ
れたデータのコード体系を、外字文字コードを含めたコ
ード体系それぞれの独自の文字コードの有無とコードの
組み合わせから、JISコードかどうか調べ、JISコ
ードである場合はJISコードと識別する第1識別手段
(2) と、この第1識別手段においてJISコードと識別
されない場合は、シフトJISコード、あるいは、EU
Cコードかを調べ、シフトJISコードである場合は、
シフトJISコードと識別し、EUCコードである場合
はEUCコードと識別する第2識別手段(3) と、前記の
識別結果を出力する識別結果出力手段(4) とを有する。
The automatic code system identifying apparatus of the present invention is a JIS code, a shift JIS code, an EU.
The data input means (1) for inputting the data file (101) to identify which C code is used, and the code system of the input data is the unique character code of each code system including the external character code. First identification means for checking whether or not it is a JIS code based on the combination of the presence or absence of the code and the code, and if it is a JIS code
(2) If the first identification means does not identify the JIS code, the shift JIS code or EU
Check if it is a C code, and if it is a shift JIS code,
It has a second discriminating means (3) for discriminating the shift JIS code and discriminating the EUC code when it is the EUC code, and discrimination result outputting means (4) for outputting the discrimination result.

【0005】[0005]

【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
Next, embodiments of the present invention will be described with reference to the drawings.

【0006】図1は本発明の一実施の形態を示す構成図
である。図2は本発明の図1の実施の形態の動作を示す
流れ図である。
FIG. 1 is a block diagram showing an embodiment of the present invention. FIG. 2 is a flow chart showing the operation of the embodiment of FIG. 1 of the present invention.

【0007】図1を参照すると、本発明の一実施の形態
は、入力データファイル101中のデータを読み込むデ
ータ入力装置10と、入力データを解析してJISコー
ド、EUCコード、シフトJISコードのいずれのコー
ド体系かを識別するコード体系識別装置20と、識別結
果201を出力する結果出力装置30から構成される。
Referring to FIG. 1, according to one embodiment of the present invention, any one of a data input device 10 for reading data in an input data file 101 and a JIS code, EUC code, or shift JIS code for analyzing the input data. The code system identification device 20 for identifying whether or not the code system and the result output device 30 for outputting the identification result 201.

【0008】コード体系識別装置20は、JISコード
の識別を行う第1識別手段2と、シフトJISコード、
EUCコードの識別を行う第2識別手段3と、識別情報
を保留する識別情報保留部4とを備える。
The code system identification device 20 includes a first identification means 2 for identifying a JIS code, a shift JIS code,
The second identification means 3 for identifying the EUC code and the identification information holding unit 4 for holding the identification information are provided.

【0009】次に図1および図2を参照して、本実施の
形態の動作について説明する。
Next, the operation of the present embodiment will be described with reference to FIGS. 1 and 2.

【0010】データ入力装置10のデータ入力手段1に
より入力データファイル101の読み込みを行い(ステ
ップA1)、データがあるかどうかを調べる(ステップ
A2)。データがある場合(終わりでない場合)は、ス
テップA1において読み込まれたデータが、第1識別手
段2に供給される。第1識別手段2は、入力データがJ
ISコードのエスケープシーケンスと一致するかどうか
調べる(ステップA3)。
The input data file 101 is read by the data input means 1 of the data input device 10 (step A1), and it is checked whether or not there is data (step A2). When there is data (when it is not the end), the data read in step A1 is supplied to the first identifying means 2. The input data of the first identifying means 2 is J
It is checked whether it matches the escape sequence of the IS code (step A3).

【0011】第1識別手段2のステップA3で、入力デ
ータがJISコードのエスケープシーケンスと一致して
いる場合は、入力データはJISコードであるという識
別結果が結果出力装置30に与えられ、結果出力装置3
0は識別結果201を出力する(ステップA7)。
In step A3 of the first identifying means 2, if the input data matches the escape sequence of the JIS code, the result output device 30 is provided with the identification result that the input data is the JIS code, and the result output is performed. Device 3
0 outputs the identification result 201 (step A7).

【0012】第1識別手段2のステップA3で、入力デ
ータがJISコードのエスケープシーケンスと一致しな
かった場合は、第2識別手段3に、第1識別手段2に供
給されたデータと同じデータが供給される。第2識別手
段3は、シフトJISコード、あるいは、EUCコード
独自の文字コードと一致するかどうかを調べる(ステッ
プA4)。
In step A3 of the first identifying means 2, if the input data does not match the escape sequence of the JIS code, the second identifying means 3 receives the same data as the data supplied to the first identifying means 2. Supplied. The second identifying means 3 checks whether or not it matches the shift JIS code or a character code unique to the EUC code (step A4).

【0013】ここで図3を参照してシフトJISコー
ド、EUCコードそれぞれの独自の文字コードについて
説明する。
The unique character codes of the shift JIS code and EUC code will be described with reference to FIG.

【0014】シフトJISコード独自の文字コードは、
シフトJIS漢字領域1(8140[Hex]〜9FF
C[Hex])からEUCカナ・漢字領域2(8EA1
[Hex]〜8EDF[Hex]および8FA1[He
x]〜8FFE[Hex])を除く部分とシフトJIS
漢字領域4(E040[Hex]〜FCFC[He
x])からEUC外字領域5(A1A1[Hex]〜F
EFE[Hex])を除く部分である。
The character code unique to the shift JIS code is
Shift JIS Kanji area 1 (8140 [Hex] ~ 9FF
C [Hex]) to EUC Kana / Kanji area 2 (8EA1)
[Hex] to 8EDF [Hex] and 8FA1 [He
x] to 8FFE [Hex]) and shift JIS
Kanji area 4 (E040 [Hex] to FCFC [He
x]) to EUC external character area 5 (A1A1 [Hex] to F
It is a part excluding EFE [Hex]).

【0015】EUCコード独自の文字コードは、EUC
カナ・漢字領域2(8EA1[Hex]〜8EDF[H
ex]および8FA1[Hex]〜8FFE[He
x])からシフトJIS漢字領域1(8140[He
x]〜A0FC[Hex])を除く部分とEUC外字領
域5(A1A1[Hex]〜FEFE[Hex])から
シフトJIS・EUC共通領域3(A1A1[Hex]
〜DFFC[Hex])およびシフトJIS漢字領域4
(E040[Hex]〜FCFC[Hex])を除く部
分である。
EUC code The unique character code is EUC.
Kana / Kanji area 2 (8EA1 [Hex] to 8EDF [H
ex] and 8FA1 [Hex] to 8FFE [He]
x]) to shift JIS Kanji area 1 (8140 [He
x] to A0FC [Hex]) and shift from EUC external character area 5 (A1A1 [Hex] to FEFE [Hex]) JIS / EUC common area 3 (A1A1 [Hex])
~ DFFC [Hex]) and shift JIS Kanji area 4
It is a part excluding (E040 [Hex] to FCFC [Hex]).

【0016】第2識別手段3のステップA4において、
入力データがシフトJISコード独自の文字コードと一
致している場合は、入力データはシフトJISコードで
あるという識別結果201が結果出力装置30に与えら
れ、入力データがEUCコード独自の文字コードと一致
している場合は、入力データはEUCコードであるとい
う識別結果201が結果出力装置30に与えられる。結
果出力装置30は、与えられた識別結果201を出力す
る(ステップA7)。
In step A4 of the second identifying means 3,
When the input data matches the character code unique to the shift JIS code, the identification result 201 indicating that the input data is the shift JIS code is given to the result output device 30, and the input data matches the character code unique to the EUC code. If so, the identification result 201 that the input data is the EUC code is given to the result output device 30. The result output device 30 outputs the given identification result 201 (step A7).

【0017】第2識別手段3のステップA4において、
入力データがシフトJISコード、または、EUCコー
ドのどちらにも識別されない場合は、入力データが前述
したシフトJISコード、EUCコードの共通領域の文
字コードと一致するかどうか調べる(ステップA5)。
In step A4 of the second identifying means 3,
If the input data is not identified by either the shift JIS code or the EUC code, it is checked whether the input data matches the character code of the common area of the shift JIS code or EUC code (step A5).

【0018】第2識別手段3のステップA5において、
シフトJISコード、EUCコードの共通領域の文字コ
ードと一致している場合は、入力データはJISコード
ではなという情報が識別情報保留部4に記憶される(ス
テップA6)。
In step A5 of the second identifying means 3,
If the character code matches the character code in the common area of the shift JIS code and EUC code, information that the input data is not the JIS code is stored in the identification information holding unit 4 (step A6).

【0019】第1識別手段2と第2識別手段3におい
て、JISコード、シフトJISコード、EUCコード
のいずれとも識別できない場合は、さらに次のデータを
読み込み(ステップA1)、同様に識別を繰り返す。
When the first identifying means 2 and the second identifying means 3 cannot identify any of the JIS code, the shift JIS code, and the EUC code, the next data is further read (step A1), and the identification is similarly repeated.

【0020】ステップA2において、読み込まれたデー
タがない場合は、全ての識別が終了したと判断し、識別
情報保留部4の識別情報が、結果出力装置30に与えら
れ、結果出力手段5は識別結果201を出力する(ステ
ップA7)。
In step A2, if there is no read data, it is judged that all the identification has been completed, the identification information of the identification information holding section 4 is given to the result output device 30, and the result output means 5 identifies. The result 201 is output (step A7).

【0021】[0021]

【発明の効果】以上説明したように、本発明によるコー
ド体系自動識別装置は、入力データのコード体系が不明
な場合に、外字文字コードを含めた全ての文字コードを
対象としたコード体系の識別を行うことができるという
効果を有する。
As described above, the automatic code system identifying apparatus according to the present invention identifies the code system for all character codes including the external character code when the code system of the input data is unknown. It has an effect that can be performed.

【図面の簡単な説明】[Brief description of drawings]

【図1】図1は本発明の一実施の形態の構成図である。FIG. 1 is a configuration diagram of an embodiment of the present invention.

【図2】図2は図1の実施の形態の動作を示す流れ図で
ある。
FIG. 2 is a flow chart showing an operation of the embodiment shown in FIG.

【図3】図3はシフトJISコード,EUCコードの文
字コードの範囲を示す図である。
FIG. 3 is a diagram showing a range of character codes of shift JIS code and EUC code.

【符号の説明】[Explanation of symbols]

1 データ入力手段 2 第1識別手段 3 第2識別手段 4 識別情報保留部 5 結果出力手段 10 データ入力装置 20 コード体系識別装置 30 結果出力装置 101 入力データファイル 201 識別結果 DESCRIPTION OF SYMBOLS 1 data input means 2 1st identification means 3 2nd identification means 4 identification information reservation part 5 result output means 10 data input device 20 code system identification device 30 result output device 101 input data file 201 identification result

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 JISコード、シフトJISコード、E
UCコードのいずれのコード体系かを識別したいデータ
ファイルを入力するデータ入力手段と、入力されたデー
タのコード体系を、外字文字コードを含めたコード体系
それぞれの独自の文字コードの有無とコードの組み合わ
せから、JISコードかどうか調べ、JISコードであ
る場合はJISコードと識別する第1識別手段と、この
第1識別手段においてJISコードと識別されない場合
は、シフトJISコード、あるいは、EUCコードかを
調べ、シフトJISコードである場合は、シフトJIS
コードと識別し、EUCコードである場合はEUCコー
ドと識別する第2識別手段と、前記の識別結果を出力す
る識別結果出力手段とを有するコード体系自動識別装
置。
1. JIS code, shift JIS code, E
Data input means for inputting a data file to identify which one of the UC codes is used, and the code system of the input data is the combination of the unique character code of each code system including the external character code and the code. From the above, it is checked whether it is a JIS code, and if it is a JIS code, it is checked whether it is a first identification means for identifying it as a JIS code, and if it is not identified by this first identification means, it is a shift JIS code or an EUC code. , If it is a shift JIS code, shift JIS
A code system automatic identification device having a second identification means for identifying a code and, if it is an EUC code, an EUC code, and an identification result output means for outputting the identification result.
【請求項2】 前記第2識別手段において、シフトJ
ISコードとEUCコードの切り分けはできないが、シ
フトJISコードとEUCコードの共通コードである場
合は、JISコードではないと記憶してから次に進むこ
とを特徴とする請求項1記載のコード体系自動識別装
置。
2. The shift J in the second identifying means.
The code system according to claim 1, wherein the IS code and the EUC code cannot be separated, but when the shift JIS code and the EUC code are common codes, it is stored as a non-JIS code before proceeding to the next step. Identification device.
【請求項3】 JISコード、シフトJISコード、E
UCコードのいずれかのコード体系を識別したいデータ
を入力するデータ入力手段と、データのコード体系を識
別するコード体系識別手段と、前記の識別結果を出力す
る識別結果出力手段とを含むコード体系識別方法におい
て、データ入力手段から与えられるデータをJISコー
ド独自のコードの有無からJISコードかどうか調べる
第1の識別ステップと、シフトJISコード、EUCコ
ードの独自のコードの有無からシフトJISコード、あ
るいは、EUCコードかどうかを調べる第2の識別ステ
ップと、シフトJISコード、EUCコードの共通のコ
ードかどうかを調べ、シフトJISコード、EUCコー
ド共通のコードである場合は、JISコードではないと
記憶する第3の識別ステップとを含むコード体系自動識
別方法。
3. JIS code, shift JIS code, E
Code system identification including data input means for inputting data for identifying any one of UC codes, code system identification means for identifying data code system, and identification result output means for outputting the identification result In the method, a first identification step of checking whether the data provided from the data input means is a JIS code based on the presence or absence of a unique code of the JIS code, and a shift JIS code based on the presence or absence of a unique code of the shift JIS code or EUC code, or A second identification step of checking whether it is an EUC code, and checking whether it is a code common to shift JIS code and EUC code, and if it is a code common to shift JIS code and EUC code, storing it as not a JIS code A code system automatic identification method including the identification step of 3.
JP7220438A 1995-08-29 1995-08-29 Device and method for automatically discriminating code system Pending JPH0962661A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7220438A JPH0962661A (en) 1995-08-29 1995-08-29 Device and method for automatically discriminating code system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7220438A JPH0962661A (en) 1995-08-29 1995-08-29 Device and method for automatically discriminating code system

Publications (1)

Publication Number Publication Date
JPH0962661A true JPH0962661A (en) 1997-03-07

Family

ID=16751117

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7220438A Pending JPH0962661A (en) 1995-08-29 1995-08-29 Device and method for automatically discriminating code system

Country Status (1)

Country Link
JP (1) JPH0962661A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4427597B1 (en) * 2008-09-30 2010-03-10 株式会社東芝 Digital television broadcast receiver

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4427597B1 (en) * 2008-09-30 2010-03-10 株式会社東芝 Digital television broadcast receiver
JP2010087868A (en) * 2008-09-30 2010-04-15 Toshiba Corp Digital television broadcast receiver

Similar Documents

Publication Publication Date Title
JP2009266372A (en) Method and system for setting optical drive write speed
KR880010374A (en) Portable electronics
WO2002029589A1 (en) Comparing device, data communication system, and data communication method
CA2348239A1 (en) Culturally correct ordering of keyed records
CN111177795A (en) Method, device and computer storage medium for identifying video tampering by using block chain
JPH0962661A (en) Device and method for automatically discriminating code system
JPH0729003A (en) Fingerprint collation device
US5404533A (en) Language processing system for converting a source program into a computer executable machine language
JPS63153689A (en) Domicile reader
CN110109774B (en) Method and system for generating Sercedit recognizable INF file through SCM (Single chip computer) knowledge base
JPS6024631A (en) Registering and retrieving system of information
JP2692628B2 (en) Package alarm detector
JP2773657B2 (en) String search device
JPH06139267A (en) Information processing system capable of individual identification
JPH0721326A (en) Character processor
JPS5842494B2 (en) library management device
JPS62126460A (en) Answer collating device
JP2003085047A (en) Data input device, double entry check method and data falsification prevention system
JPS63303481A (en) Address reader
JPS6243752A (en) Signal controller
JPH05120308A (en) Number sampling processor
JPS62200483A (en) Character reader
JPH02294833A (en) Vocabulary analysis system
JPH11149340A (en) Data input guide method/device
JPH0348995A (en) Personal identification device

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19980908