JPH04153880A - Partial string extraction processing system for character string - Google Patents
Partial string extraction processing system for character stringInfo
- Publication number
- JPH04153880A JPH04153880A JP2280322A JP28032290A JPH04153880A JP H04153880 A JPH04153880 A JP H04153880A JP 2280322 A JP2280322 A JP 2280322A JP 28032290 A JP28032290 A JP 28032290A JP H04153880 A JPH04153880 A JP H04153880A
- Authority
- JP
- Japan
- Prior art keywords
- string
- extraction
- character
- storage area
- attributes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 96
- 239000000284 extract Substances 0.000 claims abstract description 11
- 238000000034 method Methods 0.000 claims description 8
- 238000003672 processing method Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 19
- 230000000694 effects Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【発明の詳細な説明】
[概要〕
文字プリミティブ列から所定の条件に適合した部分列を
抽出する文字列の部分列抽出処理方式に関し。DETAILED DESCRIPTION OF THE INVENTION [Summary] This invention relates to a character string substring extraction processing method for extracting a substring that satisfies a predetermined condition from a character primitive string.
入力文字列を所定の部分列に分割して所定の条件に適合
したものを抽出することを目的とし入力文字列を文字プ
リミティブ列に分割する分割部と、前記文字プリミティ
ブ列の属性を判別する属性判別部と5抽出条件から抽出
条件判別列を生成する抽出条件生成部と、前記抽出条件
に適合した前記文字プリミティブ列を抽出する抽出部と
前記属性を所定の順に格納する配列型格納領域とを備え
、前記属性判別部が、前記属性を前記配列型格納領域に
前記所定の順に格納し、前記抽出部が、前記配列型格納
領域に格納された内容と前記抽出条件判別列とを比較す
ることにより、前記抽出を行なうように構成する。A dividing unit that divides an input character string into character primitive strings for the purpose of dividing an input character string into predetermined substrings and extracting substrings that meet predetermined conditions; and an attribute that determines the attributes of the character primitive strings. a discriminator, an extraction condition generation section that generates an extraction condition discriminant string from the extraction conditions, an extraction section that extracts the character primitive string that matches the extraction condition, and an array type storage area that stores the attributes in a predetermined order. The attribute discriminator stores the attributes in the array type storage area in the predetermined order, and the extraction unit compares the contents stored in the array type storage area with the extraction condition discrimination string. Accordingly, the above extraction is performed.
本発明は文字列の部分列抽出処理方式に関し。 The present invention relates to a substring extraction processing method for character strings.
更に詳しくは1文字プリミティブ列から所定の条件に適
合した部分列を抽出する文字列の部分列抽出処理方式に
関する。More specifically, the present invention relates to a character string substring extraction processing method for extracting a substring that satisfies a predetermined condition from a single character primitive string.
ある規則に従って作成された文字列の中から。From among strings created according to certain rules.
所定の条件に適合した部分列を自動的に抽出することが
できれば、当該部分列の内容が正しいか否か等のチエツ
クを行うのに有効である。If it is possible to automatically extract a subsequence that meets a predetermined condition, it is effective for checking whether the contents of the subsequence are correct or not.
例えば、複数の部分を組立てである1つの製品を製造す
る場合5通常1組立て図面が作成される。For example, if a product is manufactured by assembling multiple parts, one assembly drawing is usually created.
組立て図面には、m立での仕様の他ムこ、どの部品を何
個使用するかという情報〔部品情報〕も記載される。部
品情報は1例えば、数量(何個用いるか)1品名(部品
の一般的な名称)2図番(部品の詳細を特定する番号)
等からなる。The assembly drawings include information on which parts and how many are to be used (parts information) in addition to the specifications in m-stand. Part information includes: 1. Quantity (how many pieces to use) 1. Product name (general name of the part) 2. Drawing number (number that specifies the details of the part)
Consists of etc.
一方、m立てに用いる部品の購入、管理等を目的として
3通常2部品リスト(SK)も作成される。部品リスト
は5部品情報からなる。On the other hand, a 3-ordinary-2 parts list (SK) is also created for the purpose of purchasing, managing, etc. parts used for m-setting. The parts list consists of five parts information.
ここで1組立て図と部品リストとの関係を考える9本来
1部品リストは1Mi立て図の完成後、これに基づいて
作成されるものである。しかし、これでは製造工程完了
の短縮が図れないので、ある程度まで組立て図が作成進
行した段階で部品リストが作成され1発注等がなされる
。そして1組立て図の完成後に部品リストを修正する。Here, let us consider the relationship between the 1 assembly drawing and the parts list.9 Originally, the 1 parts list is created based on the 1Mi vertical drawing after completion. However, since this cannot shorten the time required to complete the manufacturing process, a parts list is created and an order is placed after the assembly drawings have been created to a certain extent. Then, after completing one assembly drawing, the parts list is revised.
この修正のために1Mi立て図と部品7ノストを対比し
て1部品情報をチエツクする必要がある。In order to make this correction, it is necessary to check the 1 part information by comparing the 1Mi elevation and the part 7 nost.
前述の従来技術において1部品情報の対比によるチエツ
クは、設計者等が人手によって行っている。In the prior art described above, checking by comparing information on one part is performed manually by a designer or the like.
このため、以下の問題があった。即ち1組立て図におけ
る部品情報は、当該部品の近傍(の所定位置)に記入さ
れるため2図面全域に散在しており、その位置が判りに
くい。また1図と文字とが混在するため、この点からも
判りにくい。更に組立て図中には1部品情報の他にも種
々の情報が存在し、これらは共に「文字列」という形態
をとるため、どの文字列が部品情報か判りにくい。また
5部品情報の文字列のフォーマットには、幾つかの種類
があり、一方、フォーマントが変更されることがある。This caused the following problems. That is, the component information in one assembly drawing is written near (at a predetermined position) the component, so it is scattered throughout the two drawings, and its position is difficult to understand. Also, since there is a mixture of figures and text, it is difficult to understand from this point of view as well. Furthermore, in addition to single part information, there are various pieces of information in the assembly diagram, and since both of these pieces of information take the form of "character strings," it is difficult to determine which character string is part information. Furthermore, there are several types of formats for character strings of the 5-component information, and the formant may be changed.
このような場合1人手に依るチエツクでは正確に変更等
に対応できず、エラーを生しる可能性もある。In such a case, checking by one person cannot accurately respond to changes, etc., and there is a possibility that errors may occur.
本発明は2人力文字列を所定の部分列に分割して所定の
条件に適合したものを抽出することを可能とした文字列
の部分列抽出処理方式を提供することを目的とする。SUMMARY OF THE INVENTION An object of the present invention is to provide a character string substring extraction processing method that makes it possible to divide a character string manually into predetermined substrings and extract those that meet predetermined conditions.
第1図は本発明の原理構成図であり6本発明によるデー
タ処理装置を示す。FIG. 1 is a basic configuration diagram of the present invention, and shows a data processing apparatus according to the present invention.
第1図において、1は処理装置、2は分割部3は属性判
別部、4は抽出条件生成部、5は抽出部、6は配列型格
納領域、7は読取り装置、8は出力装置である。In FIG. 1, 1 is a processing device, 2 is a division unit 3 is an attribute discrimination unit, 4 is an extraction condition generation unit, 5 is an extraction unit, 6 is an array type storage area, 7 is a reading device, and 8 is an output device. .
処理装置lは、中央処理装置(cpu)及びメモリから
なる。The processing device l consists of a central processing unit (CPU) and a memory.
分割部2は、入力文字列を文字プリミティブ列(即ち部
分列)に分割する。The dividing unit 2 divides the input character string into character primitive strings (ie, substrings).
属性判別部3は2分割された文字プリミティブ列毎にそ
の属性を判別する。The attribute determination unit 3 determines the attribute of each character primitive string divided into two.
抽出条件生成部4は、抽出条件から抽出条件判別列を生
成する。The extraction condition generation unit 4 generates an extraction condition discriminant string from the extraction conditions.
抽出部5は7分割された文字プリミティブ列のうちから
、抽出条件に適合したものを抽出する。The extracting unit 5 extracts a string of character primitives that meets the extraction conditions from among the seven divided character primitive strings.
配列型格納領域6は、処理装置lのメモリ上に設けられ
2文字プリミティブ列の属性を所定の順に格納する。即
ち、このために、予め定められた大きさの配列型とされ
る。The array type storage area 6 is provided on the memory of the processing device 1 and stores attributes of a two-character primitive string in a predetermined order. That is, for this purpose, an array type having a predetermined size is used.
読取り装置7は1図面上の入力文字列、抽出条件を読取
る。The reading device 7 reads input character strings and extraction conditions on one drawing.
出力装置8は、抽出された文字プリミティブ列を出力す
る。The output device 8 outputs the extracted character primitive string.
第2図は本発明の作用説明図であり1本発明の処理フロ
ーを示す。FIG. 2 is an explanatory diagram of the operation of the present invention, and shows a processing flow of the present invention.
■ 分割部2が、読取り装置7の読取った入力文字列を
、予め定められた条件に従って1文字プリミティブ列(
部分列)に分割する。■ The dividing unit 2 divides the input character string read by the reading device 7 into a one-character primitive string (
subsequence).
■ 属性判別部3が1分割部2の分割した文字プリミテ
ィブ列の各々について予め定められた条件を用いてその
属性を判別し、その結果を、配列型格納領域6に所定の
順に格納(配列)する。■ The attribute determination unit 3 determines the attribute of each of the character primitive strings divided by the first division unit 2 using predetermined conditions, and stores the results in the array type storage area 6 in a predetermined order (array). do.
これにより、属性を記述した属性列が得られる。This provides an attribute string that describes the attributes.
■ 抽出条件生成部4が、読取り装置7の読取った抽出
条件から、抽出条件判別列を生成する。(2) The extraction condition generation unit 4 generates an extraction condition discrimination string from the extraction conditions read by the reading device 7.
■ 抽出部5が、配列型格納領域6に格納された内容即
ち属性列の各々と、抽出条件判別列とを比較し、一致し
た属性列に対応する文字プリミティブ列を、抽出条件に
適合したものとして抽出する。そして、出力装置FBが
、当該文字プリミティブ列を例えば、印刷等により出力
する。■ The extraction unit 5 compares the contents stored in the array type storage area 6, that is, each of the attribute strings, with the extraction condition discrimination string, and selects a character primitive string corresponding to the matching attribute string as one that meets the extraction conditions. Extract as. Then, the output device FB outputs the character primitive string by, for example, printing.
以上によれば1図面上の文字列を区別なく入力し、この
中から所定の抽出条件に適合した文字列(部分列)1例
えば1部品情報のみを自動的に抽出することができる。According to the above, character strings on one drawing can be input without distinction, and only a character string (partial string) 1, for example, 1 part information that meets a predetermined extraction condition can be automatically extracted from among the character strings.
また、抽出条件を入力して判別列を生成することにより
1例えば部品情報のフォーマットの変更等に容易に対応
することができる。Furthermore, by inputting extraction conditions and generating a discriminant string, it is possible to easily respond to changes in the format of component information, for example.
第3図は実施例構成図であり、第1図図示のデータ処理
装置の詳細を示す。FIG. 3 is a block diagram of an embodiment, showing details of the data processing apparatus shown in FIG.
入力文字列読取り装置10及び抽出条件読取り装置14
は、読取り装置7を構成する。Input character string reading device 10 and extraction condition reading device 14
constitutes the reading device 7.
文字プリミティブ分解部11は2分割部2に相当し1分
割した文字プリミティブを文字プリミティブ格納領域1
2に格納する。文字プリミティブ格納領域12は、処理
装置1のメモリの所定の位置に設けられる。The character primitive decomposition unit 11 corresponds to the two-part dividing unit 2, and stores the character primitives divided into one into the character primitive storage area 1.
Store in 2. The character primitive storage area 12 is provided at a predetermined location in the memory of the processing device 1.
判別値決定部13は2属性判別部3に相当し文字プリミ
ティブ格納領域12から文字プリミティブを取出し、そ
の属性、即ち2判別値を決定しこれを配列型格納IJI
域6に格納する。The discriminant value determining unit 13 corresponds to the two-attribute discriminating unit 3, takes out a character primitive from the character primitive storage area 12, determines its attributes, that is, two discriminant values, and stores it in an array type IJI.
Store in area 6.
抽出条件判別列生成部15は、抽出条件生成部4に相当
し、生成した抽出条件判別列を抽出条件判別列格納領域
16に格納する。この領域16は。The extraction condition discriminant string generation section 15 corresponds to the extraction condition generation section 4, and stores the generated extraction condition discriminant string in the extraction condition discriminant string storage area 16. This area 16 is.
処理装置1のメモリの所定の位置に設けられる。It is provided at a predetermined location in the memory of the processing device 1.
配列型記憶領域抽出条件判別列比較部17は。The array type storage area extraction condition discriminant string comparison unit 17 is.
文字プリミティブ抜出し部18と共に抽出部5を構成し
、配列型記憶領域6の内容の各々と抽出条件判別列の各
々とを比較する。この比較の結果に基づいて2文字プリ
ミティブ抜出し部18は1文字プリミティブ格納領域1
2から適合する文字プリミティブを抜出す。The extraction section 5 is configured together with the character primitive extraction section 18, and compares each of the contents of the array type storage area 6 with each of the extraction condition discrimination strings. Based on the result of this comparison, the two-character primitive extraction unit 18 extracts the one-character primitive storage area 1.
Extract matching character primitives from 2.
文字プリミティブ出力装置19は、出力装置8に相当し
、抜出された文字プリミティブを出力すなお、各部11
.13,15.17及び18は。The character primitive output device 19 corresponds to the output device 8 and outputs the extracted character primitives.
.. 13, 15, 17 and 18.
処理袋N1のcpuとそのメモリ上に存在する処理プロ
グラムとによって実現される。This is realized by the CPU of the processing bag N1 and the processing program existing on its memory.
第4図は文字プリミティブ説明図である。FIG. 4 is an explanatory diagram of character primitives.
第4図(a)において、■乃至[相]の各々が文字プリ
ミティブであり、「!」が文字プリミティブ列である。In FIG. 4(a), each of ■ to [phase] is a character primitive, and "!" is a character primitive string.
文字プリミティブ列!は、入力文字列に等しく所定の記
号(区切り文字)1例えば、「口(ブランクを表すもの
とする)」、 r、 (ピリオド)」。Character primitive string! is a predetermined symbol (delimiter) 1 that is equal to the input string, for example, "mouth (shall represent a blank)", r, (period).
「、(カンマ)」等によって区切られる。この区切られ
た文字列の各々■乃至[相]が文字プリミティブである
。従って1文字プリミティブ■乃至0は。Separated by ", (comma)" etc. Each of the separated character strings from ■ to [phase] are character primitives. Therefore, the one-character primitive ■ to 0.
複数の文字を含むことがあり、かつ、これ以上分割して
は意味をなさなくなるものである。例えば。It may contain multiple characters, and it would be meaningless to divide it further. for example.
■の「コネジ」を「コJ、r$ジ」に分解しては意味を
失う。If you break down ``Koneji'' in ■ into ``koJ, r$ji'', it loses its meaning.
なお、この文字プリミティブ列lは、主に部品情報(数
量2品名1図番)からなる。Note that this character primitive string 1 mainly consists of parts information (2 quantities, 1 product name, 1 drawing number).
また、このような分割処理は1分割部2が、第8図図示
の分割処理フローに従って、実行するものである。Further, such division processing is executed by the 1 division unit 2 according to the division processing flow shown in FIG.
即ち、読取り装置7で読取られた入力文字列は一旦所定
の配憶領域(図示せず)に格納される。That is, the input character string read by the reading device 7 is temporarily stored in a predetermined storage area (not shown).
分割部2は、入力文字列から一文字づつ取出した文字に
ついて1区切り文字か否かを判定し、これを利用して文
字プリミティブに分解する。The dividing unit 2 determines whether or not each character extracted from the input character string is a single delimiter, and uses this to decompose the character into character primitives.
なお、第8図において、Neは入力文字数。In addition, in FIG. 8, Ne is the number of input characters.
Npは文字プリミティブの数である。Np is the number of character primitives.
第4図(b)は2文字プリミティブ■乃至[相]の各々
について その属性を判別値「1」又は「0」を用いて
示している。この場合1文字プリミティブ列!から部品
情報を抽出しようとしているので属性が部品情報の数量
2品名2図番のうちのいずれを表しているのかを示す。FIG. 4(b) shows the attributes of each of the two-character primitives ``■'' to ``phase'' using the discriminant value ``1'' or ``0''. In this case, a one-character primitive string! Since we are trying to extract component information from , the attribute indicates which of the quantity, product name, and drawing number of the component information.
例えば、■の「ネジ」は、「品名」であるから2品名に
ついての判別値を「1」とじ5数量及び図番についての
判別値は「OJとされる。他の文字プリミティブ■乃至
[相]についても同様に判別値が決定される。例えば2
文字プリミティブが片仮名からなれば「品名」、数字か
らなれば「数量」、アルファニューメリ、りからなれば
「図番」であると判別される。For example, "Screw" in ■ is a "product name", so the discriminant values for 2 product names are set to "1", and the discriminant values for 5 quantities and drawing numbers are set to "OJ". ] The discriminant value is determined in the same way. For example, 2
If the character primitive consists of katakana, it is determined that it is a "product name," if it consists of numbers, it is determined that it is a "quantity," and if it consists of an alphanumeric character, it is determined that it is a "picture number."
なお 判別の方法は、これに限定されるものではない。Note that the determination method is not limited to this.
また、一般に1文字プリミティブの属性(判別値)の数
をNaとすると、当該属性は
(al+a!+ ・・・a N11−1+ a m
alなる集合で表される。ある文字プリミティブがn番
目の属性である(n番目の判別値が「1」)であるとき
5
ak =1 (k=n)
=O(kin)
となる。In addition, in general, if the number of attributes (discriminant values) of a one-character primitive is Na, then the attribute is (al+a!+...a N11-1+ a m
It is represented by the set al. When a certain character primitive has the nth attribute (the nth discriminant value is "1"), 5 ak =1 (k=n) =O(kin).
第5図は抽出条件判別列説明図である。FIG. 5 is an explanatory diagram of the extraction condition discrimination sequence.
今2部品情報を抽出しようとしているものとし。Assume that you are currently trying to extract information on two parts.
かつ2部品情報は、数量1品名1図番の3つのみをこの
順序に記載することにより構成されているとする。It is also assumed that the two-part information is composed of only three items, one quantity, one item name, and one drawing number, written in this order.
この場合1部品情報は2本来的に、前記3つの項目の全
てが記入されたものからなるから、抽出条件としては「
数量1品名1図番」と指定され。In this case, 1 parts information 2 essentially consists of all of the above three items filled in, so the extraction condition is ``
Quantity: 1 item name: 1 drawing number.
入力される。これにより5抽出条件判別列は。is input. This results in 5 extraction condition discrimination columns.
rll、l」となる。即ち、数量1品名5図番の3つに
ついての文字列が存在しく記入があり)。rll, l". In other words, three character strings exist and have been entered: quantity 1 product name 5 drawing number).
この結果各々の判別値が「l」であるものが抽出され、
抽出条件に適合する文字列2即ち2部品情報とされる。As a result, those whose discriminant value is "l" are extracted,
The character string 2, that is, the 2-part information, that meets the extraction conditions is set.
また3部品情報は、その数量が「1」である場合にこれ
を省略して記入されることがある。そこで このような
ものまで部品情報として抽出する場合、抽出条件として
「〔省略〕十品名十図番」と指定される。これにより、
抽出条件判別列はrol、l」となる。Furthermore, when the quantity of three parts information is "1", this may be omitted and entered. Therefore, when extracting such information as part information, the extraction condition is specified as ``[omitted] 10 product names and 10 drawing numbers.'' This results in
The extraction condition discriminant string is "rol,l".
更に2部品情報は1図番のみで品名を必要としないこと
があるので、これを省略して記入されることがある。そ
こで、この場合には抽出条件は「数量+(省略〕十図番
jとされ、抽出条件判別列はro、0.IJ又はrl、
0.0」となる。Furthermore, since two-part information may require only one drawing number and no product name, this may be omitted and entered. Therefore, in this case, the extraction condition is "Quantity + (omitted) 10 drawing number j," and the extraction condition discrimination column is ro, 0.IJ or rl,
0.0".
本発明によれば、このように種々の抽出条件を所望によ
り設定できる。即ち、抽出条件読取り装置14を設ける
ことにより、抽出対象に応して。According to the present invention, various extraction conditions can be set as desired in this way. That is, by providing the extraction condition reading device 14, depending on the extraction target.
柔軟な抽出条件が設定できる。そして、このように種々
の抽出条件を設定することにより、抽出対象の抽出率を
極めて高いものにできる。Flexible extraction conditions can be set. By setting various extraction conditions in this manner, the extraction rate of the extraction target can be made extremely high.
なお、抽出条件は4つ以上の項目で構成されていてもよ
い0例えば、8つの項目からなり、その3番目、5番目
及び6番目の項目が省略されているものを抽出するとす
る。この場合、抽出条件判別列は。Note that the extraction condition may consist of four or more items. For example, suppose that the extraction condition consists of eight items and the third, fifth, and sixth items are omitted. In this case, the extraction condition determination column is.
*+に+kOO011 $$00001* *0O100**。*++kOO011 $$00001* *0O100**.
11000***。11000***.
の4つとなる。There are four.
また、このような生成処理は、抽出条件生成部4が、第
9図図示の生成処理フローに従って実行するものである
。Further, such a generation process is executed by the extraction condition generation unit 4 according to the generation process flow shown in FIG.
第9図において、要素d ijに「0」又は「1」。In FIG. 9, element dij is "0" or "1".
省略の場合には「*」が格納されることによって。If omitted, "*" is stored.
抽出条件判別列が求まる。ここで、jは「1」乃至rN
a」の値をとり、第5図中のX方向に相当し、iは「1
」乃至rNdJ(抽出条件判別列の番号)の値をとり、
第5図中のX方向に相当する。Determine the extraction condition discriminant column. Here, j is "1" to rN
a", which corresponds to the X direction in FIG. 5, and i is "1".
” to rNdJ (number of extraction condition discriminant column),
This corresponds to the X direction in FIG.
X方向のi列目の全要素をDiで表すと2 このDiが
1つの抽出条件判別列を示す。If all the elements of the i-th column in the X direction are represented by Di, then 2 This Di indicates one extraction condition discriminant string.
第6図は格納状態説明図である。FIG. 6 is an explanatory diagram of the stored state.
今2文字プリミティブ■に着目すると、これが部品情報
の一部である可能性は1例えば。Now, if we focus on the two-character primitive ■, there is a possibility that this is part of the component information, for example.
(数量十品名十図番)−(省略+■+■)(数量十品名
十図番)−(■+■+■)(数量十品名十図番)=(■
十■+■)の3つの組合せがある。従って、この各々に
ついて、抽出条件判別列r1.1.IJ又はrO,1゜
1」等と一致するか否かを調べる必要がある。(Quantity: 10 product names, 10 drawing numbers) - (omitted + ■ + ■) (Quantity: 10 product names, 10 drawing numbers) - (■ + ■ + ■) (Quantity: 0.
There are three combinations: 10■+■). Therefore, for each of these extraction condition discriminant columns r1.1. It is necessary to check whether it matches with IJ or rO, 1°1.
そこで、まず、配列型格納領域6が用意される。Therefore, first, an array type storage area 6 is prepared.
この配列の横の要素数は部品情報の項目の数Naとされ
、縦の要素数は(文字プリミティブ数Np+(前記項目
の数−1))とされる。そして、この配列に、所定の順
で1文字プリミティブ■乃至[株]の各々の属性の判別
値が格納される。文字プリミティブ■(n)について見
ると、その図番1品名及び数量は、各々1組合せ順“2
(n)”“’3 (n+1)”及び“4 (n+2)”
の該当する項目の領域に格納される。他についても同様
である0以上により1文字プリミティブ■乃至[相]の
各々について1部品情報を構成する可能性のある組合せ
の全ての属性列を作成できる。The number of horizontal elements in this array is the number Na of parts information items, and the number of vertical elements is (number of character primitives Np+(number of items - 1)). Then, the discrimination values of the attributes of each of the one-character primitives ``■'' to ``stock'' are stored in this array in a predetermined order. Looking at the character primitive ■(n), its drawing number, product name, and quantity are each in the order of combination "2".
(n)” “’3 (n+1)” and “4 (n+2)”
is stored in the area of the corresponding item. Similarly for the others, it is possible to create all attribute strings of combinations that may constitute one part information for each of the one-character primitives ① to [phase] using 0 or more.
このような判別及び格納処理は、属性判別部3が、第1
0図図示の判別格納処理フローに従って実行するもので
ある。Such discrimination and storage processing is carried out by the attribute discriminator 3 in the first
This is executed according to the discrimination storage processing flow shown in FIG.
第10図において、要素txyに属性aVが格納される
ことによって、属性列が生成される。ここで、Xはrl
、乃至「Na」の値をとり、第6図中のX方向に相当し
、yは「1」乃至rNp 十Na−1」の値をとり5第
6図中のX方向に相当する。X方向のi列目の全要素を
Tiで表すと。In FIG. 10, an attribute string is generated by storing attribute aV in element txy. Here, X is rl
, to "Na", which corresponds to the X direction in FIG. 6, and y takes values from "1" to "rNp +Na-1", and corresponds to the X direction in FIG. Let Ti represent all the elements in the i-th column in the X direction.
このTiが1つの属性列を示す。This Ti indicates one attribute string.
第7図は抽出処理説明図であり5第3図乃至第6図まで
をまとめて示したものである。FIG. 7 is an explanatory diagram of the extraction process, and shows all of FIG. 3 to FIG. 6 together.
前述の如く、入力文字列を文字プリミティブ■乃至[株
]に分解し、その属性の判別を行い1判別値を配列型格
納領域6に所定の順で格納する。一方抽出条件から抽出
条件判別列rl、1.IJ及びro、1.IJを得る。As described above, the input character string is decomposed into the character primitives ``■'' to ``stock'', their attributes are determined, and 1 discriminant values are stored in the array type storage area 6 in a predetermined order. On the other hand, from the extraction conditions, the extraction condition discriminant string rl, 1. IJ and ro, 1. Get IJ.
そして、配列型記憶領域6の各組合せ順と抽出条件判別
列とを比較する。この結果1組合せ順“6″及び13″
が一致する。前者は、その数量2品名及び図番が、各々
2文字プリミティブ■■及び■により構成される部品情
報である。後者は、その数量1品名及び図番が、各々、
省略1文字プリミティブ@及び■により構成される部品
情報である。Then, each combination order in the array type storage area 6 is compared with the extraction condition discrimination string. As a result, 1 combination order “6” and 13”
matches. The former is part information whose quantity, two product name, and drawing number are each composed of two-character primitives ■■ and ■. For the latter, the quantity 1 product name and drawing number are respectively
This is part information composed of the omitted one-character primitive @ and ■.
このように1文字プリミティブ列中から2部品情報が2
つ抽出される。即ち7「3.ネジ四M3×30」は2図
番rM3X3.で特定される「ネジ」が「3」個である
ことを意味し、「ネジ四M7×70」は1図番「M7×
7」で特定される「ネジ」が「1」個であることを意味
する。この場合の部品情報の抽出率は100% である
。従って、この後の作業を橿めて効率よく行いうる。In this way, two parts information from one character primitive string is
One is extracted. That is, 7 "3. Four screws M3 x 30" is 2 drawing number rM3X3. This means that the number of "screws" specified by is "3", and "four screws M7 x 70" is one drawing number "M7 x
7" means that the number of "screws" specified is "1". The parts information extraction rate in this case is 100%. Therefore, subsequent work can be done more efficiently.
以上の抽出処理は、抽出部5が、第11図図示の抽出処
理フローに従って実行するものである。The extraction process described above is executed by the extraction unit 5 according to the extraction process flow shown in FIG.
第11図において、抽出条件判別列Dj と属性列T+
とを比較し1両者が一致し、がっ、その属性が指定さ
れている場合に、当該属性列Tiのその属性に対応する
文字プリミティブを、当該属性として出力する。ここで
、qh=0なら、に番目の属性が指定されており、Qk
=1なら、当該属性が省略されていることを意味する。In FIG. 11, the extraction condition discrimination column Dj and the attribute column T+
If they match and the attribute is specified, the character primitive corresponding to the attribute in the attribute string Ti is output as the attribute. Here, if qh=0, the th attribute is specified and Qk
=1 means that the attribute is omitted.
以上説明したように1本発明によれば、所定の条件に適
合した部分列を抽出する文字列の部分列抽出処理におい
て1文字列を分割した文字プリミティブの属性を所定の
順に配列したものと抽出条件判別列とを比較することに
より、所望の抽出条件に適合した文字プリミティブを抽
出することができるので2部分列を用いた作業を行うた
めの当該部分列の抽出処理を自動化でき1作業の効率を
大幅に向上できる。As explained above, according to the present invention, attributes of character primitives obtained by dividing one character string are arranged in a predetermined order and extracted in a substring extraction process of a character string that extracts substrings that meet predetermined conditions. By comparing the condition discriminant string, character primitives that meet the desired extraction conditions can be extracted, which can automate the process of extracting the subsequence when performing work using two subsequences, increasing the efficiency of one task. can be significantly improved.
第1図は本発明の原理構成図。
第2図は本発明の作用説明図
第3図は実施例構成図。
第4図は文字プリミティブ説明図
第5図は抽出条件判別列説明図。
第6図は格納状態説明図9
第7図は抽出処理説明図。
第8図は分割処理フロー
第9図は生成処理フロー
第10図は判別格納処理フロー
第11図は抽出処理フロー
1は処理装置、2は分剖部53は属性判別部4は抽出条
件生成部、5は抽出部、6は配列型格納領域、7は読取
り装置、8は出力装置である。
特許出願人 株式会社ビーエフニー
代理人 弁理士 長谷用 交情(外2名)本
発
明
の
作
用
説
明
図
第
図
実
施例橋成
第3図
図
生成処理フロ
第 9 図(その1)
住
成
処
理
フ
ロ
第
図(その2)
生成処理フロ
第 9 区(その3)
生成処理フロ
第 9 図(その4)
1別格納処理フロー
第10図
抽 出 処
第11
理 フ ロ
図(その1)
抽出処
第11
1! フ ロ
図(その2)FIG. 1 is a diagram showing the principle configuration of the present invention. FIG. 2 is an explanatory diagram of the operation of the present invention. FIG. 3 is a diagram showing the configuration of an embodiment. FIG. 4 is an explanatory diagram of character primitives. FIG. 5 is an explanatory diagram of extraction condition discrimination strings. FIG. 6 is a diagram illustrating the storage state; FIG. 7 is a diagram illustrating the extraction process. FIG. 8 is a division processing flow. FIG. 9 is a generation processing flow. FIG. 10 is a discrimination storage processing flow. FIG. 11 is an extraction processing flow. , 5 is an extraction unit, 6 is an array type storage area, 7 is a reading device, and 8 is an output device. Patent Applicant: BFN Co., Ltd. Agent Patent Attorney: Yo Hase Kojo (2 others) Action explanatory diagram of the present invention Figure 3 Embodiment Figure 3 Generation process flow Figure 9 (Part 1) Housing process flow diagram (Part 2) Generation Processing Flow Section 9 (Part 3) Generation Processing Flow Fig. 9 (Part 4) Separate Storage Processing Flow Fig. 10 Extraction Process 11 Process Flow Diagram (Part 1) Extraction Process 11 1 ! Flow diagram (Part 2)
Claims (2)
部(2)と、 前記文字プリミティブ列の属性を判別する属性判別部(
3)と、 抽出条件から抽出条件判別列を生成する抽出条件生成部
(4)と、 前記抽出条件に適合した前記文字プリミティブ列を抽出
する抽出部(5)と、 前記属性を所定の順に格納する配列型格納領域(6)と
を備え、 前記属性判別部(3)が、前記属性を前記配列型格納領
域(6)に前記所定の順に格納し、前記抽出部(5)が
、前記配列型格納領域(6)に格納された内容と前記抽
出条件判別列とを比較することにより、前記抽出を行な
う ことを特徴とする文字列の部分列抽出処理方式。(1) A dividing unit (2) that divides an input character string into character primitive strings; and an attribute determination unit (2) that determines the attributes of the character primitive strings.
3), an extraction condition generation unit (4) that generates an extraction condition discriminant string from the extraction conditions, an extraction unit (5) that extracts the character primitive string that matches the extraction condition, and stores the attributes in a predetermined order. an array type storage area (6) in which the attribute discriminator (3) stores the attributes in the array type storage area (6) in the predetermined order, and the extraction unit (5) stores the attributes in the array type storage area (6); A substring extraction processing method for a character string, characterized in that the extraction is performed by comparing the content stored in a type storage area (6) with the extraction condition discriminant string.
)で読取る ことを特徴とする請求項(1)記載の文字列の部分列抽
出処理方式。(2) The input character string and extraction conditions are sent to the reading device (7
2. The method for extracting a substring of a character string according to claim 1, wherein the character string is read as follows.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2280322A JPH04153880A (en) | 1990-10-18 | 1990-10-18 | Partial string extraction processing system for character string |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2280322A JPH04153880A (en) | 1990-10-18 | 1990-10-18 | Partial string extraction processing system for character string |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04153880A true JPH04153880A (en) | 1992-05-27 |
Family
ID=17623386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2280322A Pending JPH04153880A (en) | 1990-10-18 | 1990-10-18 | Partial string extraction processing system for character string |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04153880A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06103329A (en) * | 1992-09-22 | 1994-04-15 | Fujitsu Ltd | Data input system |
-
1990
- 1990-10-18 JP JP2280322A patent/JPH04153880A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06103329A (en) * | 1992-09-22 | 1994-04-15 | Fujitsu Ltd | Data input system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2726568B2 (en) | Character recognition method and device | |
US6470347B1 (en) | Method, system, program, and data structure for a dense array storing character strings | |
US5895446A (en) | Pattern-based translation method and system | |
JPH02299068A (en) | Word separation method and apparatus | |
Sedláček et al. | A new Czech morphological analyser ajka | |
US20070179932A1 (en) | Method for finding data, research engine and microprocessor therefor | |
US20020016796A1 (en) | Document processing method, system and medium | |
EP0241717A2 (en) | Linguistic analysis method and apparatus | |
US11361565B2 (en) | Natural language processing (NLP) pipeline for automated attribute extraction | |
CN112668281A (en) | Automatic corpus expansion method, device, equipment and medium based on template | |
JPH04153880A (en) | Partial string extraction processing system for character string | |
JP3531222B2 (en) | Similar character string search device | |
JPH0743728B2 (en) | Summary sentence generation method | |
JPH08115330A (en) | Method for retrieving similar document and device therefor | |
JP3470930B2 (en) | Natural language analysis method and device | |
JPH0412866B2 (en) | ||
JPS59736A (en) | System for analyzing syntax | |
JPH07230468A (en) | Method and device for automatically extracting keyword | |
JPH01266670A (en) | Extracting processing system for characteristic vocabulary in japanese object sentence | |
JP4139805B2 (en) | Apparatus, method and program for converting lexical data to data | |
JPH02148174A (en) | Data retrieving device | |
JPH0546370A (en) | Program generating device | |
JPH0635930A (en) | System and method of processing table data | |
JPH04123185A (en) | Document recognizing system | |
JPH0554148B2 (en) |