JPH09282208A - Table generating method - Google Patents

Table generating method

Info

Publication number
JPH09282208A
JPH09282208A JP8087942A JP8794296A JPH09282208A JP H09282208 A JPH09282208 A JP H09282208A JP 8087942 A JP8087942 A JP 8087942A JP 8794296 A JP8794296 A JP 8794296A JP H09282208 A JPH09282208 A JP H09282208A
Authority
JP
Japan
Prior art keywords
item
character string
record
file
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8087942A
Other languages
Japanese (ja)
Other versions
JP3489326B2 (en
Inventor
Tetsuo Tanaka
哲雄 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP08794296A priority Critical patent/JP3489326B2/en
Publication of JPH09282208A publication Critical patent/JPH09282208A/en
Application granted granted Critical
Publication of JP3489326B2 publication Critical patent/JP3489326B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To facilitate the data handling by defining the formats of file and record, extracting a character string corresponding to the record and determining the value of an item from the correspondent relation and the type of the item. SOLUTION: Record format and file format definition names are inputted and retrieved from a record format/file format definition table 109, a text file to be an object is inputted, and the character string is discriminated out of that file. The character string corresponding to the item is extracted from the discriminated character string. The value of the item is determined from the relation of correspondence among the extracted character string, item name and character string corresponding to the item and the type of the item. Thus, by inputting the formats of the file and the record without describing any program, a table can be generated from the text file in which plural items repeatedly appear.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、ワークステーショ
ンやパーソナルコンピュータ等の計算機で処理される複
数の項目が繰り返し出現するテキストファイルから、複
数の項目をもつ複数のレコードからなるテーブルを生成
する方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method of generating a table consisting of a plurality of records having a plurality of items from a text file in which a plurality of items repeatedly processed by a computer such as a workstation or a personal computer. .

【0002】[0002]

【従来の技術】電子メールのアーカイブ、著者名・文献
名・雑誌名・発行日等からなる文献データのリスト、関
数名・引数の名前・引数の型・機能等からなる関数仕様
のリストなど、複数の項目から構成される同種のデータ
のリストを、計算機上のテキストファイルとして保存し
ておくことが多い。一方、表計算ソフトを用いることに
より、同種のデータのリストの操作が容易になる。例え
ば、ある項目の値によって並べ替えたり、ある項目の値
がある条件に合致するもののみを取り出したりすること
が容易になる。しかし、表計算ソフトが扱うことができ
るファイルの形式は固定的であり、前記のテキストファ
イルを表計算ソフトで扱うには、全てのファイルを1つ
のファイルにまとめ、各項目をカンマなどの表計算ソフ
トで決められた文字で区切るなどの処理が必要になる。
2. Description of the Related Art E-mail archives, a list of document data consisting of author names, document names, journal names, issue dates, etc., a list of function specifications consisting of function names, argument names, argument types, functions, etc. A list of data of the same type consisting of multiple items is often saved as a text file on a computer. On the other hand, the use of spreadsheet software facilitates the operation of lists of data of the same type. For example, it becomes easy to sort by the value of a certain item, or to take out only those values of a certain item that meet certain conditions. However, the format of files that spreadsheet software can handle is fixed. To handle the above text files with spreadsheet software, combine all files into one file and put each item in a spreadsheet such as a comma. It is necessary to perform processing such as delimiting with characters specified by the software.

【0003】これらのテキストファイル処理は、「矢
吹、宮城、富田、初めて使うEmacs、テクノプレス、1
995」にあるようなテキストエディタを用いることで
可能になる。テキストエディタの文字列の切り貼り機能
を用い、利用者が、移動または削除する文字列を選択
し、選択した文字列を切り取り、移動の場合は、異動先
に切り取った文字列を貼り付ける。
These text file processes are described in "Yabuki, Miyagi, Tomita, Emacs used for the first time, Technopress, 1
This can be done by using a text editor such as "995". Using the cut and paste function of the character string of the text editor, the user selects the character string to move or delete, cuts the selected character string, and in the case of moving, pastes the cut character string to the transfer destination.

【0004】また、「石田晴久、UNIX、共立出版株式会
社、1983」にあるようなプログラミング言語を用
い、テキスト処理用のプログラムを記述しそのプログラ
ムを実行することにより、テキストファイルから必要な
文字列だけを取り出して、カンマやスペースで区切られ
たテーブル形式のデータに変換することができる。
Further, by using a programming language such as "Haruhisa Ishida, UNIX, Kyoritsu Shuppan Co., Ltd., 1983", a text processing program is written and the program is executed to obtain a required character string from a text file. You can just take out and convert it into a tabular data separated by commas or spaces.

【0005】[0005]

【発明が解決しようとする課題】従来の技術におけるテ
キストエディタを用いる方法では、利用者が逐一、テキ
ストの選択・切り取り、貼り付けの処理を行わなければ
ならない。データ量が多くなるほど、利用者の操作は増
える。
In the conventional method using the text editor, the user must select, cut and paste the text one by one. The larger the amount of data, the more user operations.

【0006】また、プログラミング言語を用いる方法で
は、利用者はプログラミング言語の文法を理解し、その
文法に合致し、利用者の望む処理をするプログラムをフ
ァイルの種類毎に記述しなければならい。
Further, in the method using a programming language, the user must understand the grammar of the programming language, and describe the program that matches the grammar and performs the processing desired by the user for each file type.

【0007】本発明は上記不便を解消するためになされ
たもので、その目的は、1つ以上のテキストファイルか
ら複数の項目で構成されるレコードを抽出し、抽出した
複数のレコードで構成されるテーブルを自動的に生成す
ることである。同じ構造をもつ複数のデータをテーブル
形式に変換することにより、データの操作が容易にな
る。例えば、ある項目の値によって並べ替えたり、ある
項目の値がある条件に合致するもののみを取り出したり
することが容易になる。
The present invention has been made to solve the above inconvenience, and an object thereof is to extract a record composed of a plurality of items from one or more text files and to compose a plurality of extracted records. It is to generate the table automatically. By manipulating a plurality of data having the same structure into a table format, data manipulation becomes easy. For example, it becomes easy to sort by the value of a certain item, or to take out only those values of a certain item that meet certain conditions.

【0008】[0008]

【課題を解決するための手段】上記目的を達成するため
に、本発明のテーブル生成方法は、ファイルとレコード
の形式、すなわち、ファイル内のレコードに相当する文
字列を識別するための、レコードの先頭と終了の文字列
パターン、レコードに相当する文字列内における項目に
相当する文字列を識別するための、項目の区切り文字列
パターン、レコードを構成する項目名、項目の型、項目
名とテキストファイルの属性の対応関係、及び、項目名
とテキストファイル内の項目に相当する文字列の対応関
係、を入力するステップ、処理の対象となるテキストフ
ァイルの属性を抽出するステップ、抽出した属性と、前
記項目名とテキストファイルの属性の対応関係と、項目
の型から、項目の値を決定するステップ、対象となるテ
キストファイルを入力するステップ、前記レコードに相
当する文字列を識別する方法に基づき、入力したテキス
トからレコードに相当する文字列を抽出するステップ、
前記レコードの項目に相当する文字列を識別する方法に
基づき、レコードに相当する文字列から項目に相当する
文字列を抽出するステップ、抽出した文字列と、前記項
目名と項目に相当する文字列の対応関係と、前記項目の
型から項目の値を決定するステップ、を有する。
In order to achieve the above object, the table generation method of the present invention uses a record format for identifying a file and a record format, that is, a character string corresponding to a record in the file. Character string pattern at the beginning and end, item delimiter string pattern for identifying the character string corresponding to the item in the character string corresponding to the record, item name that configures the record, item type, item name and text A step of inputting the correspondence relationship between the file attributes and a correspondence relationship between the item name and the character string corresponding to the item in the text file, the step of extracting the attribute of the text file to be processed, the extracted attribute, The step of determining the value of the item from the correspondence between the item name and the attribute of the text file and the type of the item, the target text file The step of force, according to the method of identifying the character string corresponding to the record, and extracts a character string corresponding to the record from the entered text step,
Extracting a character string corresponding to an item from the character string corresponding to the record based on the method of identifying the character string corresponding to the item of the record, the extracted character string, the item name and the character string corresponding to the item And the step of determining an item value from the item type.

【0009】以下、項目を表す文字列を項目文字列、項
目間の区切りを表す文字列を区切り文字列と呼ぶ。
Hereinafter, a character string representing an item is referred to as an item character string, and a character string representing a delimiter between items is referred to as a delimiter character string.

【0010】[0010]

【発明の実施の形態】以下、本発明の実施例を図面によ
り説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0011】図1は本発明のテーブル生成システムの構
成の一例である。図1において、101は中央処理装
置、111は主記憶装置、102は中央処理装置101
の処理結果を表示するディスプレー、103,104は
利用者からの入力を受け付けるキーボード、マウス、1
05はハードディスク等の外部記憶装置である。外部記
憶装置には、テーブル生成プログラム106、ファイル
形式登録プログラム107、処理の対象となるテキスト
ファイル108、ファイル形式登録プログラム107で
登録された結果であるレコード形式・ファイル形式定義
表109、基本制御プログラム110が格納されてい
る。外部記憶装置105に格納されているプログラム及
びデータは主記憶装置111に転送され中央処理装置1
01で処理される。
FIG. 1 shows an example of the configuration of the table generation system of the present invention. In FIG. 1, 101 is a central processing unit, 111 is a main storage unit, and 102 is a central processing unit 101.
A display for displaying the processing result of the above, 103, 104 are a keyboard, a mouse, and 1 for receiving the input from the user.
Reference numeral 05 is an external storage device such as a hard disk. In the external storage device, a table generation program 106, a file format registration program 107, a text file 108 to be processed, a record format / file format definition table 109 which is a result registered by the file format registration program 107, and a basic control program. 110 is stored. The programs and data stored in the external storage device 105 are transferred to the main storage device 111 and transferred to the central processing unit 1.
01.

【0012】図2は、テーブル生成プログラム106の
処理フローの一例である。図3は図2におけるレコード
生成ステップ(ステップ209、及び、ステップ21
1)の処理フローの詳細である。図4は、図3における
ファイルから1レコード分バッファに読み込むステップ
(ステップ310)の詳細である。図5は、図3におけ
る区切り文字列と項目文字列に分割するステップ(ステ
ップ311)の詳細である。
FIG. 2 shows an example of the processing flow of the table generation program 106. 3 shows the record generation step (step 209 and step 21 in FIG. 2).
It is a detail of the processing flow of 1). FIG. 4 shows details of the step (step 310) of reading one record from the file shown in FIG. 3 into the buffer. FIG. 5 shows details of the step (step 311) of dividing into the delimiter character string and the item character string in FIG.

【0013】図6は、ファイル形式登録プログラム10
7の処理フローの一例である。
FIG. 6 shows a file format registration program 10.
7 is an example of the processing flow of No. 7.

【0014】図7は、ファイル形式登録プログラム10
7がレコード形式・ファイル形式定義ダイアログを表示
するステップ(ステップ601)でディスプレー102
に表示するダイアログの構成例である。図7において、
700はファイル形式・レコード形式定義ダイアログ、
701は定義名入力領域、702は1ファイルに1レコ
ードの情報しか含まれないか複数レコードの情報が含ま
れるかの選択ボタン、703はレコードの先頭パターン
の入力領域、704はレコードが703で入力するパタ
ーンを含むか否かを選択する選択ボタン。705はレコ
ードの終了パターンの入力領域、706はレコードが7
05で入力するパターンを含むか否かを選択する選択ボ
タン、707は区切り文字列と項目文字列の並びの定義
領域、710は区切り文字列と項目文字列の並び順が固
定か不定かの選択ボタン、711はレコードの形式と項
目の識別方法入力領域、718は入力された内容を登録
するためのOKボタン、719は入力を登録せずにプロ
グラムを終了するCANCELボタンである。また、7
07は区切り文字列か項目名かの種別の入力領域708
(「項目名」または「区切り文字列パターン」のどちら
かを入力)と項目名または区切り文字列パターンの入力
領域709からなる。707には項目名を連続して入力
しない(項目名の間には必ず区切り文字列を入れる)。
711は、項目名の入力領域712、項目の型入力領域
713(「整数型」、「浮動小数型」、「日付型」等を
入力)、項目の決定方法入力領域714(「属性から」
または「内容から」を入力)、属性名入力領域715
(「最終更新日時」、「作成者名」、「ファイル名」、
または「ディレクトリ名」を入力)、項目判定方法入力
領域716(「前の区切り文字列から」、「後ろの区切
り文字列から」、または、「項目文字列パターンから」
を入力)、文字列パターン入力領域717のリストから
なる。なお、703〜706は702で1ファイル複数
レコードを選択した場合のみ入力する領域である。ま
た、属性名入力領域715は決定方法714に「属性か
ら」を入力した場合のみ入力する。また716と717
は714に「内容から」を入力し、かつ、710で不定
を選択した場合のみ入力する。また、714が「内容か
ら」であるような項目の項目名712と同じものを70
8に入力する。703,705,709,717の各パ
ターンは正規表現で入力する。なお、正規表現について
は「河野真治、入門Perl、pp46-54、株式会社アス
キー、1994」に詳しい。
FIG. 7 shows a file format registration program 10.
7 displays the record format / file format definition dialog (step 601).
It is a configuration example of a dialog displayed in. In FIG.
700 is a file format / record format definition dialog,
701 is a definition name input area, 702 is a selection button as to whether information of one record is included in one file or information of a plurality of records, 703 is an input area of the top pattern of the record, and 704 is an input in 703 of the record Selection button to select whether or not to include the pattern. 705 is the input area of the end pattern of the record, and 706 is the record 7
A selection button for selecting whether to include the pattern to be input in 05, 707 is a definition area for the arrangement of the delimiter character string and the item character string, and 710 is a selection of whether the arrangement order of the delimiter character string and the item character string is fixed or undefined. A button 711 is a record format and item identification method input area, a reference numeral 718 is an OK button for registering the input contents, and a reference numeral 719 is a CANCEL button for terminating the program without registering the input. Also, 7
07 is an input area 708 for the type of delimited character string or item name
(Enter either "item name" or "delimited character string pattern") and item name or delimited character string pattern input area 709. Item names are not continuously input to 707 (delimiter character strings are always inserted between item names).
An item name input area 712, an item type input area 713 (“integer type”, “floating point type”, “date type”, etc. are input) 711, an item determination method input area 714 (“from attribute”).
Or enter "from content"), attribute name input area 715
("Last updated date", "Creator name", "File name",
Or enter "directory name"), item determination method input area 716 ("from previous delimiter string", "from later delimiter string", or "from item string pattern")
Input)) and a list of character string pattern input areas 717. Note that reference numerals 703 to 706 are areas to be input only when a plurality of records in one file are selected in 702. Further, the attribute name input area 715 is input only when “from attribute” is input to the determination method 714. Also 716 and 717
Is input only when “From content” is input in 714 and when indefinite is selected in 710. In addition, the same name as the item name 712 of the item in which 714 is “from content” is set to 70.
Enter 8 The patterns 703, 705, 709, and 717 are input as regular expressions. For more information on regular expressions, see "Shinji Kono, Introductory Perl, pp46-54, ASCII Corporation, 1994".

【0015】図8は、レコード形式・ファイル形式定義
表109の構成例である。図8において、レコード形式
・ファイル形式定義表109は、定義名801、1ファ
イルに1レコードの情報しか含まれないか複数レコード
の情報が含まれるかを表すフラグ802(1レコードし
か含まれないときTRUE、複数含まれるときFALS
E)、レコードの先頭パターンの定義803、レコード
の終了パターンの定義806、区切り文字列と項目の並
び定義810、レコード形式表818へのポインタ81
4からなる行のリストである。また、レコードの先頭パ
ターンの定義803は正規表現で表されるパターン80
4とそのパターンをレコードが含むか含まないかを表す
フラグ805(含むときTRUE、含まないときFAL
SE)からなる。806も同様に正規表現で表されるパ
ターン807とそのパターンをレコードが含むか含まな
いかを表すフラグ808(含むときTRUE、含まない
ときFALSE)からなる。区切り文字列と項目の並び
810は区切り文字列・項目名リスト815へのポイン
タ812と、項目の順序が固定か不定かをあらわすフラ
グ813(固定のときTRUE、不定のときFALS
E)からなる。なお、803と806は802がFAL
SEの場合のみ定義する。区切り文字列・項目名リスト
815は種別816と項目名または区切り文字列パター
ン817からなる行のリストである。種別816により
817の内容が項目名か区切り文字列パターンかを識別
する。また、レコード形式表は818は項目名819、
項目の型820、ファイルの内容から項目の値を決定す
るかファイルの属性から決定するかを表す決定方法82
1、決定方法821が「属性から」のとき、ファイルの
「更新日時」、「作成者」、「ファイル名」、「ディレ
クトリ名」の内、何れの属性から決定するかをあらわす
属性名822、決定方法821が「内容から」のとき、
項目の値をどのように決定するかを表す項目判定方法8
23(「前の区切り文字列による」、「後ろの区切り文
字列による」、または「項目文字列のパターンによ
る」)、判定に用いる区切り文字列パターンまたは項目
文字列パターン824からなる行のリストである。
FIG. 8 is a structural example of the record format / file format definition table 109. In FIG. 8, a record format / file format definition table 109 includes a definition name 801, a flag 802 indicating whether one file includes information of one record or information of a plurality of records (when only one record is included). TRUE, FALS when more than one is included
E), definition 803 of record head pattern, definition 806 of record end pattern, definition 810 of delimiter character string and item, pointer 81 to record format table 818
It is a list of lines consisting of four. Further, the definition 803 of the leading pattern of the record is the pattern 80 represented by the regular expression.
4 and flag 805 indicating whether or not the record includes the pattern (TRUE when the record is included, FAL when the record is not included)
SE). Similarly, 806 is also composed of a pattern 807 represented by a regular expression and a flag 808 (TRUE when the record includes the pattern and FALSE when the record does not include the pattern). The delimiter string / item arrangement 810 is a pointer 812 to the delimiter string / item name list 815, and a flag 813 indicating whether the order of the items is fixed or undefined (TRUE when fixed, FALS when undefined).
E). 803 and 806, 802 is FAL
Defined only for SE. The delimiter string / item name list 815 is a list of lines including a type 816 and an item name or delimiter string pattern 817. The type 816 identifies whether the content of 817 is an item name or a delimiter string pattern. In the record format table, 818 is the item name 819,
Item type 820, determination method 82 that indicates whether to determine the value of the item from the contents of the file or the attribute of the file
1. When the determination method 821 is “from attribute”, an attribute name 822 indicating which attribute among the “update date / time”, “creator”, “file name”, and “directory name” of the file to determine When the determination method 821 is “from content”,
Item determination method 8 showing how to determine the value of an item
23 (“by the delimiter string before”, “by the delimiter string after”, or “by the pattern of the item string”), a list of lines consisting of the delimiter string pattern or the item string pattern 824 used for determination is there.

【0016】図9は、本発明のテーブル生成方法で生成
したテーブルの一例である。テーブル91はレコード形
式表818で定義された項目名819をもつ項目93で
構成されるレコード92のリストである。
FIG. 9 shows an example of a table generated by the table generating method of the present invention. The table 91 is a list of records 92 composed of items 93 having the item names 819 defined in the record format table 818.

【0017】図10は、図3における「バッファ内の文
字列を区切り文字列と項目文字列に分割するステップ」
(ステップ311)の結果の一例である。分割結果は、
区切り文字列1001と項目文字列1002の連接とな
る。
FIG. 10 shows "step of dividing character string in buffer into delimiter character string and item character string" in FIG.
It is an example of the result of (step 311). The division result is
The delimiter character string 1001 and the item character string 1002 are connected.

【0018】次に、テーブル生成プログラム106の処
理フローを図2を用いて説明する。
Next, the processing flow of the table generation program 106 will be described with reference to FIG.

【0019】まず、レコード形式・ファイル形式定義名
を入力し、入力された定義名のレコード形式・ファイル
形式定義をレコード形式・ファイル形式定義表109か
ら検索し、読み込む(ステップ201)。次に、レコー
ドの形式814が指し示すレコード形式表818の全て
の項目名819を含む空のテーブル91を生成し(ステ
ップ202)、処理の対象となるテキストファイルの名
称を1個以上入力する(ステップ203)。次に入力さ
れた全てのファイル名のファイルに対して以下の処理を
行う。すなわち、入力されたファイル名の全てのファイ
ルを処理したか否かを判定し(ステップ204)、全て
のファイルを処理したならば終了する。未処理のファイ
ルの内の一つに着目し(ステップ205)、そのファイ
ルの属性である最終更新日時、作成者名、ファイル名、
ファイルが格納されているディレクトリ名を記憶する
(ステップ206)。次に、1ファイル中に1レコード
か否かを802によって判定し(ステップ207)、1
ファイル中に複数のレコードを含むのであれば、ファイ
ルの最後まで以下の処理を行う。すなわち、ファイルの
終わりまで処理したか否かを判定し(ステップ20
8)、終わりまで処理したならばステップ204に戻
る。終わりまで処理していないならば、未処理の部分か
らレコード92を生成し(ステップ209)、生成した
レコード92をステップ202で生成したテーブル91
に挿入し(ステップ210)、ステップ208に戻る。
ステップ207において、1ファイル中に1レコードの
みを含むのであれば、ファイルからレコード92を生成
し(ステップ211)、生成したレコード92をステッ
プ202で生成したテーブル91に挿入し(ステップ2
12)、ステップ204に戻る。
First, a record format / file format definition name is input, and the record format / file format definition of the input definition name is retrieved from the record format / file format definition table 109 and read (step 201). Next, an empty table 91 including all the item names 819 of the record format table 818 indicated by the record format 814 is generated (step 202), and one or more text file names to be processed are input (step 203). Next, the following processing is performed for all the input file names. That is, it is determined whether or not all the files having the input file name have been processed (step 204), and if all the files have been processed, the process ends. Focusing on one of the unprocessed files (step 205), the last update date and time, the creator name, the file name, which are the attributes of the file,
The directory name in which the file is stored is stored (step 206). Next, it is determined by 802 whether there is one record in one file (step 207), 1
If the file contains multiple records, do the following until the end of the file: That is, it is determined whether or not processing has been performed up to the end of the file (step 20
8) When the processing is completed, the process returns to step 204. If not processed to the end, a record 92 is generated from the unprocessed part (step 209), and the generated record 92 is generated in the table 91 generated in step 202.
(Step 210) and returns to step 208.
If only one record is included in one file in step 207, the record 92 is generated from the file (step 211), and the generated record 92 is inserted into the table 91 generated in step 202 (step 2
12) and returns to step 204.

【0020】次に、図2のレコードを生成するステップ
(ステップ209、ステップ211)の詳細を図3を用
いて説明する。
Next, details of the steps (step 209, step 211) for generating the record shown in FIG. 2 will be described with reference to FIG.

【0021】まず、レコード形式表818の決定方法8
21が「属性から」となっている行を全て処理したか否
かを判定し(ステップ301)、全てを処理していない
ならば、未処理の行の一つについて以下の処理を行う。
すなわち、レコード形式表818中の未処理の行の一つ
に着目し(ステップ302)、その行の属性名822が
「最終更新日時」であれば(ステップ303)、ファイ
ルの最終更新日時をその行の項目名819をもつ項目9
3とし(ステップ304)、ステップ301に戻る。そ
の行の属性名822が「ファイル名」であれば(ステッ
プ305)、ファイル名をその行の項目名819をもつ
項目93とし(ステップ306)、ステップ301に戻
る。その行の属性名822が「ディレクトリ名」であれ
ば(ステップ307)、ファイルが格納されているディ
レクトリ名をその行の項目名819をもつ項目93とし
(ステップ308)、ステップ301に戻る。その行の
属性名822が上記のいずれでもなければ「作成者名」
であるので、ファイルの作成者名をその行の項目名81
9をもつ項目93とし(ステップ309)、ステップ3
01に戻る。ステップ301において821が「属性か
ら」となっているレコード形式表818中の行を全て処
理したならば、ファイルから1レコード分の文字列をバ
ッファに読み込み(ステップ310)、バッファの内容
を区切りを表す区切り文字列1001と項目を表す項目
文字列1002に分割する(ステップ311)。次に、
iを1とし(ステップ312)、iが区切り文字列・項
目リスト815中の項目名の数以下か否かを判定し(ス
テップ313)、以下でなければ終了する。以下なら
ば、項目の順序が固定か否かを813により判定し(ス
テップ314)、固定ならば、ステップ311で分割し
た文字列の内、i番目の項目文字列を区切り文字列・項
目名リスト815中のi番目の項目名をもつ項目とする
(ステップ315)。項目の順序が不定ならば、区切り
文字列・項目名リスト815中のi番目の項目名817
をNとし、Nと同じ項目名819をもつレコード形式表
818中の行Lを検索し(ステップ316)、Lの項目
判定方法823が「前の区切り文字列で判定」ならば
(ステップ317)、Lの文字列パターン824にマッ
チする区切り文字列1001をステップ311で分割し
たバッファから検索し、その区切り文字列1001の次
の項目文字列1002を項目名Nをもつ項目93とする
(ステップ318)。Lの項目判定方法823が「後の
区切り文字列で判定」ならば(ステップ319)、Lの
文字列パターン824にマッチする区切り文字列100
1をステップ311で分割したバッファから検索し、そ
の区切り文字列1001の前の項目文字列1002を項
目名Nをもつ項目93とする(ステップ320)。Lの
項目判定方法823が上記以外、すなわち「項目文字列
のパターンで判定」ならば、Lの文字列パターン824
にマッチする項目文字列1002をステップ311で分
割したバッファから検索し、その項目文字列1002を
項目名Nをもつ項目93とする(ステップ321)。つ
ぎに、iを1増やし(ステップ322)、ステップ31
3に戻る。なお、ステップ304,306,308,3
09,318,320,321において、属性または項
目文字列を項目とするとき、レコード形式表818の型
820に変換して項目とする。 次に図3におけるファ
イルから1レコード分バッファに読み込むステップ(ス
テップ310)の詳細を図4を用いて説明する。
First, the determination method 8 of the record format table 818
It is determined whether or not all the rows in which 21 is "from attribute" have been processed (step 301). If all the rows have not been processed, the following processing is performed for one of the unprocessed rows.
That is, paying attention to one of the unprocessed lines in the record format table 818 (step 302), and if the attribute name 822 of that line is “last update date / time” (step 303), the last update date / time of the file is Item 9 with line item name 819
3 (step 304) and the process returns to step 301. If the attribute name 822 of the line is "file name" (step 305), the file name is set as the item 93 having the item name 819 of the line (step 306), and the process returns to step 301. If the attribute name 822 of the line is "directory name" (step 307), the directory name in which the file is stored is set as the item 93 having the item name 819 of the line (step 308), and the process returns to step 301. If the attribute name 822 in that line is none of the above, "creator name"
Therefore, the file creator name is the item name 81 of that line.
Item 93 having 9 (step 309), step 3
Return to 01. When all the rows in the record format table 818 in which the attribute 821 is "from attribute" are processed in step 301, the character string for one record is read from the file into the buffer (step 310), and the buffer contents are separated. It is divided into a delimiter character string 1001 representing the item and an item character string 1002 representing the item (step 311). next,
i is set to 1 (step 312), it is determined whether i is equal to or less than the number of item names in the delimited character string / item list 815 (step 313), and if not, the process ends. If it is the following, it is determined by 813 whether or not the order of items is fixed (step 314). If fixed, the i-th item character string of the character strings divided in step 311 is a delimited character string / item name list. The item having the i-th item name in 815 is set (step 315). If the order of the items is undefined, the i-th item name 817 in the delimited character string / item name list 815
Is set to N, and the row L in the record format table 818 having the same item name 819 as N is searched (step 316). If the item determination method 823 for L is “determined by previous delimiter character string” (step 317). , L of the delimiter string 1001 matching the character string pattern 824 is searched from the buffer divided in step 311, and the next item character string 1002 of the delimiter string 1001 is set as the item 93 having the item name N (step 318). ). If the L item determination method 823 is “determined by subsequent delimiter character string” (step 319), the delimiter character string 100 that matches the L character string pattern 824.
1 is searched from the buffer divided in step 311, and the item character string 1002 before the delimiter character string 1001 is set as the item 93 having the item name N (step 320). If the L item determination method 823 is other than the above, that is, "determined by the item character string pattern", the L character string pattern 824
The item character string 1002 that matches is searched from the buffer divided in step 311, and the item character string 1002 is set as the item 93 having the item name N (step 321). Next, i is incremented by 1 (step 322), and step 31
Return to 3. Note that steps 304, 306, 308, 3
In 09, 318, 320, and 321, when an attribute or an item character string is used as an item, it is converted into a type 820 of the record format table 818 to be an item. Next, details of the step (step 310) of reading from the file in FIG. 3 into the buffer for one record will be described with reference to FIG.

【0022】まず、レコード情報としてレコードの先頭
パターンを含むか否かを805により判定し(ステップ
401)、含むのであれば、パターン804にマッチす
る文字列の前までファイルを読み飛ばす(ステップ40
2)。含まないのであれば、パターン804にマッチす
る文字列まで読み飛ばす(ステップ403)。次にレコ
ード情報としてレコードの終了パターンを含むか否かを
判定し(ステップ404)、含むのであれば、パターン
にマッチする文字列までファイルを読み込みバッファに
格納する(ステップ405)。含まないのであれば、パ
ターンにマッチする文字列の前までファイルを読み込み
バッファに格納する(ステップ406)。
First, it is determined by 805 whether or not the record start pattern is included as the record information (step 401). If it is included, the file is skipped to before the character string matching the pattern 804 (step 40).
2). If it is not included, the character string that matches the pattern 804 is skipped (step 403). Next, it is determined whether or not the end pattern of the record is included as the record information (step 404), and if it is included, the file is read up to the character string matching the pattern and stored in the buffer (step 405). If not included, the file is read up to the character string matching the pattern and stored in the buffer (step 406).

【0023】次に図3におけるバッファの内容を区切り
文字列と項目文字列に分割するステップ(ステップ31
1)の詳細を図5を用いて説明する。
Next, a step of dividing the contents of the buffer in FIG. 3 into a delimiter character string and an item character string (step 31
Details of 1) will be described with reference to FIG.

【0024】まず、バッファにおける処理位置を示すカ
ーソルをバッファの先頭とし、i,jをぞれぞれ1とす
る(ステップ501)。次に、カーソルがバッファの最
後にあるか否かを判定し(ステップ502)、最後にあ
れば処理を終了する。最後になければ、項目の順序が固
定か否かを813により判定し(ステップ503)、固
定であればi番目の区切り文字列にマッチする文字列を
i番目の区切り文字列1001とする(ステップ50
4)。固定でなければ、カーソル位置以降の文字列で、
815中の何れかの区切り文字列にマッチする最初の文
字列をi番目の区切り文字列とする。次にiが2以上で
かつi−1番目の区切り文字列とi番目の区切り文字列
が連続していないならば(ステップ506)、i−1番
目の区切り文字列とi番目の区切り文字列の間の文字列
をj番目の項目文字列とし、jを1増やす(ステップ5
07)。次にカーソル位置をi番目の区切り文字列の直
後とし、iを1増やす(ステップ508)。
First, the cursor indicating the processing position in the buffer is set to the head of the buffer, and i and j are set to 1 (step 501). Next, it is determined whether or not the cursor is at the end of the buffer (step 502), and if it is at the end, the process ends. If it is not the last, it is determined by 813 whether or not the order of items is fixed (step 503). If fixed, the character string that matches the i-th delimited character string is set as the i-th delimited character string 1001 (step Fifty
4). If it is not fixed, it is the character string after the cursor position,
The first character string that matches any of the delimiter character strings in 815 is the i-th delimiter character string. Next, if i is 2 or more and the i-1 th delimiter string and the i th delimiter string are not continuous (step 506), the i-1 th delimiter string and the i th delimiter string. The character string between the two is the j-th item character string, and j is incremented by 1 (step 5
07). Next, the cursor is positioned immediately after the i-th delimited character string, and i is incremented by 1 (step 508).

【0025】次にファイル形式登録プログラム107の
処理を図6を用いて説明する。
Next, the processing of the file format registration program 107 will be described with reference to FIG.

【0026】まず、レコード形式・ファイル形式定義ダ
イアログをディスプレー102に表示し(ステップ60
1)、利用者からの入力を受け付け(ステップ60
2)、入力が選択ボタン(702,704,706,7
10)の押下であれば(ステップ603)、選択された
旨を示すマークを付け(ステップ604)、ステップ6
02に戻る。入力領域(701,703,705,70
8,711)へのテキスト入力であれば(ステップ60
5)、入力された内容を入力領域に表示し(ステップ6
06)、ステップ602に戻る。入力がOKボタン71
8の押下であれば(ステップ607)、入力された内容
からレコード形式・ファイル形式定義表を更新し(ステ
ップ607)、処理を終了する。上記以外の入力であれ
ば(CANCELボタン719)の押下であれば、処理
を終了する。
First, a record format / file format definition dialog is displayed on the display 102 (step 60).
1) Accept input from user (step 60
2) Input is select button (702, 704, 706, 7
If the button 10 is pressed (step 603), a mark indicating that it has been selected is added (step 604), and step 6
Return to 02. Input area (701, 703, 705, 70
8, 711) is a text input (step 60).
5) Display the input contents in the input area (step 6
06), and returns to step 602. Input is OK button 71
If the user presses 8 (step 607), the record format / file format definition table is updated from the input contents (step 607), and the process ends. If the input is other than the above, and the (CANCEL button 719) is pressed, the process ends.

【0027】ステップ604では、レコード形式・ファ
イル形式定義表109に1行追加し、各項目の値を以下
のように設定する。701の内容を801の値とする。
702で「1ファイル1レコード」が選択されていれば
TRUEを「1ファイル複数レコード」が選択されてい
ればFALSEを802の値とする。703の内容を8
04の値とする。704で「から」が選択されていれば
TRUEを、「の次から」が選択されていればFALS
Eを805の値とする。705の内容を807の値とす
る。706で「から」が選択されていればTRUEを、
「の次から」が選択されていればFALSEを808の
値とする。707の内容をそのまま区切り文字列・項目
名リスト815とし、それへのポインタを812の値と
する。710で、「固定」が選択されていればTRU
E、「不定」が選択されていればFALSEを813の
値とする。711の内容をそのままレコード形式表81
8とし、それへのポインタを814の値とする。
In step 604, one line is added to the record format / file format definition table 109, and the value of each item is set as follows. The content of 701 is set to the value of 801.
If "1 file 1 record" is selected in 702, TRUE is set to FALSE if "1 file multiple records" is selected. Contents of 703 8
The value is 04. TRUE if "from" is selected in 704, and FALS if "after" is selected.
Let E be a value of 805. The content of 705 is set to the value of 807. If "kara" is selected in 706, TRUE is selected,
If “after” is selected, FALSE is set to a value of 808. The content of 707 is directly used as the delimited character string / item name list 815, and the pointer to it is set to the value of 812. If “fixed” is selected in 710, TRU
If E and "undefined" are selected, then FALSE is set to a value of 813. Record format table 81 with the contents of 711 as it is
8 and the pointer to it is the value of 814.

【0028】[0028]

【発明の効果】本発明によれば、プログラミング言語で
プログラムを記述することなく、ファイルの形式とレコ
ードの形式を入力することにより、複数の項目が繰り返
し出現するテキストファイルからテーブルを生成できる
ので、利用者は1レコード中の項目の数に比例するだけ
の情報を入力すればよく、レコードの形式が変わらなけ
ればデータ量が増えても利用者の操作が増えることはな
い。
According to the present invention, a table can be generated from a text file in which a plurality of items appear repeatedly by inputting a file format and a record format without writing a program in a programming language. The user only needs to input information in proportion to the number of items in one record, and if the format of the record does not change, the number of operations by the user does not increase even if the amount of data increases.

【0029】また、本発明によれば、一度入力したファ
イル形式の定義とレコードの形式の定義を保存できるの
で、同じ形式のファイルを処理する場合は、くり返し定
義情報を入力する必要がない。
Further, according to the present invention, since the file format definition and the record format definition that have been input once can be saved, it is not necessary to repeatedly input definition information when processing files of the same format.

【0030】また、本発明によれば、テキストファイル
の内容だけでなく、ファイルの属性もレコードの項目と
することができる。
Further, according to the present invention, not only the contents of the text file but also the attributes of the file can be the items of the record.

【図面の簡単な説明】[Brief description of drawings]

【図1】システム構成である。FIG. 1 is a system configuration.

【図2】テーブル生成プログラム106の処理フローで
ある。
FIG. 2 is a processing flow of a table generation program 106.

【図3】図2におけるステップ209とステップ211
の詳細な処理フローである。
FIG. 3 shows steps 209 and 211 in FIG.
Is a detailed processing flow of.

【図4】図3におけるステップ310の詳細な処理フロ
ーである。
FIG. 4 is a detailed processing flow of step 310 in FIG.

【図5】図3におけるステップ311の詳細な処理フロ
ーである。
5 is a detailed processing flow of step 311 in FIG.

【図6】ファイル形式登録プログラム107の処理フロ
ーである。
FIG. 6 is a processing flow of a file format registration program 107.

【図7】レコード形式・ファイル形式定義ダイアログの
構成である。
FIG. 7 shows the structure of a record format / file format definition dialog.

【図8】レコード形式・ファイル形式定義表である。FIG. 8 is a record format / file format definition table.

【図9】テーブルである。FIG. 9 is a table.

【図10】図3におけるステップ311の結果の一例で
ある。
10 is an example of a result of step 311 in FIG.

【符号の説明】[Explanation of symbols]

91…テーブル、 92…レコード、93…項目、10
1…中央処理装置、102…ディスプレー、103…キ
ーボード、 104…マウス、105…外部記憶装
置、106…テーブル生成プログラム、107…ファイ
ル形式登録プログラム、 108…処理対象テキス
ト、109…レコード形式・ファイル形式定義表、11
0…基本制御プログラム、111…主記憶装置、700
…ファイル形式・レコード形式定義ダイアログ、815
…区切り文字列・項目名リスト、 818…レコー
ド形式表、1001…区切り文字列、1002…項目文
字列。
91 ... Table, 92 ... Record, 93 ... Item, 10
DESCRIPTION OF SYMBOLS 1 ... Central processing unit, 102 ... Display, 103 ... Keyboard, 104 ... Mouse, 105 ... External storage device, 106 ... Table generation program, 107 ... File format registration program, 108 ... Text to be processed, 109 ... Record format / file format Definition table, 11
0 ... Basic control program, 111 ... Main storage device, 700
… File format / record format definition dialog, 815
Delimiter character string / item name list, 818 ... Record format table, 1001 ... Delimiter character string, 1002 ... Item character string.

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】複数の項目が繰り返し出現する1つ以上の
テキストファイルから、複数の項目をもつ複数のレコー
ドからなるテーブルを生成するシステムにおいて、テキ
ストファイルに含まれるレコードに相当する文字列を識
別する情報、該レコードに相当する文字列に含まれるレ
コードの項目に相当する文字列を識別する情報、レコー
ドを構成する項目の名称、項目の型、項目の名称とテキ
ストファイルの属性の対応関係、および、項目の名称と
テキストファイルに含まれる項目に相当する文字列の対
応関係、からなるテキストファイルとレコードの形式の
定義を入力するステップ、テキストファイルを入力する
ステップ、該テキストファイルの属性を抽出するステッ
プ、該ステップで抽出した属性と、前記項目の名称とテ
キストファイルの属性の対応関係と、項目の型から、項
目の値を決定するステップ、前記レコードに相当する文
字列を識別する方法に基づき、前記入力したテキストか
らレコードに相当する文字列を抽出するステップ、前記
レコードの項目に相当する文字列を識別する方法に基づ
き、前記ステップで抽出したレコードに相当する文字列
から項目に相当する文字列を抽出するステップ、及び、
該抽出した文字列と、前記項目名と項目に相当する文字
列の対応関係と、前記項目の型から項目の値を決定する
ステップ、を有することを特徴とするテーブル生成方
法。
1. A system for generating a table consisting of a plurality of records having a plurality of items from one or more text files in which a plurality of items appear repeatedly, and identifying a character string corresponding to a record included in the text file. Information, information for identifying a character string corresponding to an item of a record included in a character string corresponding to the record, a name of an item forming the record, an item type, a correspondence relationship between the item name and the attribute of the text file, And the step of inputting the definition of the format of the text file and record consisting of the correspondence between the item names and the character strings corresponding to the items included in the text file, the step of inputting the text file, and the attributes of the text file are extracted. Step, the attribute extracted in the step, the item name and the text file Determining the value of the item from the correspondence relationship of sex and the type of item, extracting the character string corresponding to the record from the input text based on the method of identifying the character string corresponding to the record, Extracting a character string corresponding to an item from the character string corresponding to the record extracted in the step based on a method of identifying a character string corresponding to an item of a record, and
A table generation method comprising: a step of determining a value of an item from a type of the item and a correspondence relationship between the extracted character string, the item name and a character string corresponding to the item.
【請求項2】情報を格納する記憶手段をもち、前記テキ
ストファイルとレコードの形式を入力するステップで入
力した定義を該記憶手段に格納するステップと、該記憶
手段に格納されている複数の定義から一つを選択するス
テップを有し、前記項目の値を決定するステップ、前記
レコードに相当する文字列を抽出するステップ、前記項
目に相当する文字列を抽出するステップ、前記項目の値
を決定するステップでは、前記選択された定義の内容に
基づくことを特徴とする請求項1記載のテーブル生成方
法。
2. A storage means for storing information, the step of storing the definition input in the step of inputting the format of the text file and the record in the storage means, and a plurality of definitions stored in the storage means. Selecting one of the items, determining the value of the item, extracting the character string corresponding to the record, extracting the character string corresponding to the item, determining the value of the item The table generating method according to claim 1, wherein the step of performing is based on the content of the selected definition.
【請求項3】前記、ファイル内のレコードに相当する文
字列を識別する方法は、該レコードの先頭の文字列のパ
ターンと該レコードの最終の文字列のパターンであるこ
とを特徴とする請求項1ないし2記載のテーブル生成方
法。
3. The method of identifying a character string corresponding to a record in a file is a pattern of a character string at the beginning of the record and a pattern of a final character string of the record. The table generation method described in 1 or 2.
【請求項4】前記、レコードに相当する文字列内のレコ
ードの項目に相当する文字列を識別する情報は項目を区
切る文字列のパターンであることを特徴とする請求項1
ないし3記載のテーブル生成方法。
4. The information for identifying the character string corresponding to the item of the record in the character string corresponding to the record is a pattern of the character string delimiting the item.
The table generation method according to any one of 3 to 3.
【請求項5】前記、ファイルの属性はファイルの最終更
新日時とファイルの作成者名とファイルの名称とファイ
ルが格納されている場所であることを特徴とする請求項
1ないし4記載のテーブル生成方法。
5. The table generation according to claim 1, wherein the attribute of the file is the date and time of the last update of the file, the name of the creator of the file, the name of the file, and the location where the file is stored. Method.
【請求項6】前記、項目の名称とテキストファイル内の
項目に相当する文字列の対応関係は、項目の前または後
の項目を区切る文字列のパターンと項目の名称の組、ま
たは、項目に相当する文字列のパターンと項目の名称の
組、であることを特徴とする請求項1ないし5記載のテ
ーブル生成方法。
6. The correspondence between the name of an item and a character string corresponding to an item in a text file is a combination of a pattern of a character string delimiting an item before or after an item and an item name, or an item. 6. The table generating method according to claim 1, wherein the table generating method is a set of corresponding character string patterns and item names.
JP08794296A 1996-04-10 1996-04-10 Table generation method Expired - Fee Related JP3489326B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08794296A JP3489326B2 (en) 1996-04-10 1996-04-10 Table generation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08794296A JP3489326B2 (en) 1996-04-10 1996-04-10 Table generation method

Publications (2)

Publication Number Publication Date
JPH09282208A true JPH09282208A (en) 1997-10-31
JP3489326B2 JP3489326B2 (en) 2004-01-19

Family

ID=13928958

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08794296A Expired - Fee Related JP3489326B2 (en) 1996-04-10 1996-04-10 Table generation method

Country Status (1)

Country Link
JP (1) JP3489326B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11143750A (en) * 1997-11-14 1999-05-28 Nec Software Ltd Device and method for generating and updating data layout
JPH11272703A (en) * 1998-03-23 1999-10-08 Sharp Corp Character string extraction system
WO2007139039A1 (en) 2006-05-26 2007-12-06 Nec Corporation Information classification device, information classification method, and information classification program
JP2020530629A (en) * 2017-08-08 2020-10-22 アビニシオ テクノロジー エルエルシー Technology that dynamically defines the format in a data record

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8554582B2 (en) 2004-10-13 2013-10-08 Nissay Information Technology Co., Ltd. Data management apparatus and method thereof

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11143750A (en) * 1997-11-14 1999-05-28 Nec Software Ltd Device and method for generating and updating data layout
JPH11272703A (en) * 1998-03-23 1999-10-08 Sharp Corp Character string extraction system
WO2007139039A1 (en) 2006-05-26 2007-12-06 Nec Corporation Information classification device, information classification method, and information classification program
US9025890B2 (en) 2006-05-26 2015-05-05 Nec Corporation Information classification device, information classification method, and information classification program
JP2020530629A (en) * 2017-08-08 2020-10-22 アビニシオ テクノロジー エルエルシー Technology that dynamically defines the format in a data record

Also Published As

Publication number Publication date
JP3489326B2 (en) 2004-01-19

Similar Documents

Publication Publication Date Title
US5623406A (en) Method and system for entering text in computer equipment
JP2536998B2 (en) Storage and retrieval of non-text objects
JP3571408B2 (en) Document processing method and apparatus
US5752021A (en) Document database management apparatus capable of conversion between retrieval formulae for different schemata
US8065267B2 (en) Information processing device, file data merging method, file naming method, and file data output method
US7062751B2 (en) Sequence analysis method and apparatus
JPH08305616A (en) Data management system
JP2006091994A (en) Device, method and program for processing document information
US5907851A (en) Editing nested documents by appointing a portion for insertion with an alternative substitute
JP3489326B2 (en) Table generation method
JPH07239850A (en) Structured document preparation supporting system
JPH06259420A (en) Sentence editing support device
JPH1145289A (en) Document processor, storage medium storing document processing program and document processing method
JP4005672B2 (en) Document processing apparatus, storage medium storing document processing program, and document processing method
JP2001216311A (en) Event analyzing device and program device stored with event analyzing program
JPH09245052A (en) Structured document processor
JPH1145252A (en) Information retrieval device and computer readable recording medium for recording program for having computer function as the same device
JPH07302347A (en) Graph generating device
US5617120A (en) Two-relation icon ranking and selecting method
JP2001052013A (en) Method and device for document processing and medium with document processing program recorded
JPH1153398A (en) Device and method for document processing and storage medium storing document processing program
JP3210842B2 (en) Information processing device
JPH05120358A (en) Picture information processing system
JPS6366665A (en) Document analyzing/shaping device
JPH0981581A (en) Data base generation method

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees