LT6273B - System and method of ofaviation parts structure recognition in structure free text - Google Patents

System and method of ofaviation parts structure recognition in structure free text Download PDF

Info

Publication number
LT6273B
LT6273B LT2014120A LT2014120A LT6273B LT 6273 B LT6273 B LT 6273B LT 2014120 A LT2014120 A LT 2014120A LT 2014120 A LT2014120 A LT 2014120A LT 6273 B LT6273 B LT 6273B
Authority
LT
Lithuania
Prior art keywords
text
computer
word
processing
information
Prior art date
Application number
LT2014120A
Other languages
Lithuanian (lt)
Other versions
LT2014120A (en
Inventor
Žilvinas SADAUSKAS
Original Assignee
Uab "Locatory.Com"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Uab "Locatory.Com" filed Critical Uab "Locatory.Com"
Priority to LT2014120A priority Critical patent/LT6273B/en
Priority to PCT/IB2015/057544 priority patent/WO2016059505A1/en
Publication of LT2014120A publication Critical patent/LT2014120A/en
Publication of LT6273B publication Critical patent/LT6273B/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Abstract

The invention relates to system and method of a text processing and more particularly to electronic text data processing system and a method with integrated artificial neuron networks. The system comprises at least one computer with digital data storage, where stored commands of computer program to recognize text of aviation parts at least the number, quantity, condition in the structure free text.Mentioned computer program includes a word processing commands and network commands, and processor means for process the computer program commands stored in the digital storage. The invention allows automatically get the result - the structured data, such as aeronautical engineering parts list to a specific part number, quantity and condition from any type of text input such as the e-mail, or other digital format documents. It can be used to make process automatic - scan e-mails or other text format document and integrate this data into the aviation companies for search of used parts inventory, ERP and other systems.

Description

11

LT 6273 B Išradimo sritis Išradimas yra susijęs su teksto apdorojimo sistema ir būdu, o tiksliau su elektroninių tekstinių duomenų apdorojimo sistema ir būdu su integruotu apmokomu dirbtiniu neuroniniu tinklu.FIELD OF THE INVENTION The present invention relates to a text processing system and method, and more specifically to an electronic text data processing system and a method for an integrated trained artificial neural network.

Technikos lygisTechnical level

Aviacijos detalių rinkoje, kiekviena detalė turi savo unikalų numerį pagal kurį jos yra identifikuojamos. Tai leidžia supaprastinti komunikaciją tarp gamintojų, pirkėjų ir pardavėjų, išvengti klaidų kilusių dėl sudėtingų detalių pavadinimų. Visos dabartinės aviacijos detalių paieškos ir ERP sistemos (verslo valdymo sistemos) darbui naudoja susistemintus duomenis apie detalę (detalės numeris, kiekis, būklė). Dauguma pirkėjų ir pardavėjų tarpusavyje susirašinėja elektroninio pašto pagalba, kuriuo siunčiami duomenys, pavyzdžiui tekstas elektroninio laiško turinyje ar prisegtose laikmenose, dažniausiai neturi struktūros arba turi struktūrą, būdingą tik vienam laiškui ar prisegtam dokumentui. Norint rasti norimą informaciją apie reikalingas aviacijos technikos detales konkrečiame elektroniniame laiške ar kitame dokumente, į aviacijos technikos detalių paieškos ar ERP sistemą reikia įvesti atitinkamus duomenis, pavyzdžiui aviacijos technikos detalės pavadinimą. Tai yra atliekama perrašant arba kopijuojant ir įklijuojant į konkrečią aviacijos technikos detalių paieškos ar ERP sistemą elektroninio laiško turinio tekstines dalis. Atitinkamos rankiniu būdu atliekamos operacijos, ypač dirbant su dideliais duomenų kiekiais, reikalauja didelių žmogiškųjų resursų. JAV patente US 8392409 B1 yra atskleidžiamas sistema ir būdas, skirti elektroninių laiškų analizei ir peržiūrai, kuriame su elektroniniu laišku susijusios informacijos atvaizdavimas apima informacijos, susijusios su daugybe elektroninių laiškų gavimą kaip atsaką į pateiktą paieškos užklausą. Kompiuteriu nuskaitomoje laikmenoje saugomas kompiuterinės programos produktas apima paieškos informacijos gavimo kodą ir elektroninių laiškų kategorizavimo pagal numatytas kategorijas kodą, vartotojo įvesties, kurioje yra nurodoma žyma, gavimo kodą, ir žymos susiejimo su bent vienu iš daugybės elektroninių laiškų susiejimo kodą. Šio išradimo trūkumas yra tas, kad sistema atlieka paiešką elektroninio laiško tekste tik pagal nurodomus žodžius t.y. paieškai atlikti yra būtini konkretūs paieškos žodžiai, kurių yra ieškoma daugybėje apdorojamų elektroninių laiškų. 2In the aerospace market, every detail has its own unique number that identifies them. This allows you to simplify communication between manufacturers, buyers and sellers, avoiding errors due to complex details. All current aviation parts search and ERP systems (business management systems) use structured detail details (part number, quantity, status). Most buyers and sellers interact by e-mail, sending data, such as text in e-mail content or attached media, usually without a structure or structure specific to one letter or attached document. In order to find the required information about the required aeronautical details in a particular e-mail or other document, relevant data, such as the name of the aeronautical component, should be entered into the aeronautical component search or ERP system. This is done by transcribing or copying and pasting the textual parts of the e-mail content into a specific aeronautical component search or ERP system. Relevant manual operations, especially when dealing with large amounts of data, require significant human resources. U.S. Patent No. 8392409 B1 discloses a system and method for analyzing and reviewing e-mails, wherein displaying information related to e-mail includes receiving information relating to multiple e-mails as a response to a search query provided. A computer program product stored on a computer-readable medium includes a code for retrieving search information and a code for the categorization of e-mails according to the intended categories, a user code for the tag containing the tag, and a tag linking with at least one of a plurality of e-mail linking codes. The drawback of the present invention is that the system performs a search in the text of an e-mail only according to the words t.y. Search engines require specific search terms that are searched for by many processed emails. 2

LT 6273 B JAV patente US 7548848 B1 yra atskleidžiamas būdas įvertinti elektroninės žinutės teksto turinį. Semantinės paieškos operacijos yra atliekamos naudojant žinutės turinį, kur identifikuota žinutė yra paverčiama į žymų srautą, kuriame ir yra atpažįstamos su kiekviena iš identifikuotų žymų susijusios komandos, kurios vėliau yra vykdomos. Žinutės turinio analizė ir įvertinimas yra vykdomi naudojant raktažodžius, kur sistema ir būdas yra apriboti tik užduotų raktažodžių paieška žinutėse. JAV patentinėje paraiškoje Nr. US 11/397,593 yra atskleidžiama sistema ir būdas, skirti nesistemingų žinučių ir susirašinėjimų, kurie gal būti gauti elektroninio laiško arba telefoninio pokalbio išrašo forma, tikrinimui. Išgauto teksto tyrinys yra tikrinamas tam, kad būtų gauta naudinga ir susijusi informacija naudojant žodžių ir frazių sąrašą, kur minėti žodžiai ir frazės gali būti apibūdinti kaip pramonėje pripažįstami žodžiai ir frazės. Šis išradimas yra iš esmės apribotas tikslių terminų paieška elektroninės žinutės tekste.U.S. Pat. No. 6,273,848 B1 discloses a method for evaluating the content of an electronic message text. Semantic search operations are performed using message content, where the identified message is converted to a tagged stream, which is recognized by each of the identified tag related commands that are subsequently executed. Message content analysis and evaluation is carried out using keywords where the system and method are limited to the search of the targeted keywords in the messages. U.S. Pat. US 11 / 397,593 discloses a system and method for checking non-systemic messages and correspondence that may be received in the form of an e-mail or telephone call statement. The extracted text is scanned to provide useful and relevant information using a list of words and phrases where these words and phrases can be described as industry-recognized words and phrases. The present invention is essentially limited to the search for exact terms in the text of an electronic message.

Artimiausias išradimui yra "Amber Artificial Intelligence ΤοοΓ ir "Amber A.I. Plugin" produktai skirti atlikti paiešką Locatory.com sistemoje, aviacijos detalių atpažinimui naudojant sulyginimą su duomenų baze. Šie produktai yra apriboti dirbti tik su Locatory.com paieškos sistema. Išradimas leidžia iš bet kokio tipo tekstinės įvesties su duomenimis apie ieškomas aviacijos technikos detales, pavyzdžiui iš elektroninio laiško, ar kito formato elektroninių dokumentų, automatizuotai gauti rezultatą - susistemintus duomenis, tokius kaip aviacijos technikos detalių sąrašą su konkrečios detalės numeriu, kiekiu ir būkle. Tai gali būti panaudota automatizuojant elektroninių laiškų ar kitokio formato tekstinių dokumentų nuskaitymą ir integruojant šiuos duomenis į aviacijos įmonių naudojamas detalių paieškos, ERP ir kitas sistemas. Tokiu būdu yra žymiai padidinamas darbuotojų našumas ir tuo pačiu sumažėja darbuotojų poreikis, kadangi išradimas automatizuotai iš elektroninio laiško ar kitokio dokumento nuskaito ieškomas aviacijos technikos detales ir sudaro jų sąrašą, t.y. naudotojui nebereikia ieškoti konkrečios detalės pavadinimo ir rankiniu būdu susidarinėti jų sąrašą.The closest to the invention is the "Amber Artificial Intelligence" and "Amber A.I." Plugin " products for search in Locatory.com, for aerospace identification using database matching. These products are limited to work only with Locatory.com search engine. The invention allows automated retrieval of the result from any type of text input with data on searched aeronautical details, such as electronic mail or other format electronic documents, such as a list of aeronautical parts with a particular part number, number and condition. This can be used to automate the scanning of e-mails or other forms of text documents and to integrate these data into search engine, ERP and other systems used by aviation companies. In this way, the productivity of the employees is significantly increased and at the same time the need for employees is reduced, since the invention automatically reads and lists the searched aircraft parts in an automated form from an e-mail or other document, i. the user no longer needs to search for a specific detail name and manually create a list of them.

Trumpas išradimo aprašymas Išradimas apima sistemą, skirtą aviacijos detalių informacijos atpažinimui struktūros neturinčiame elektroninio formato tekste ir paieškai. Sistema apima bent 3BRIEF DESCRIPTION OF THE INVENTION The invention relates to a system for identifying aeronautical details in text-free text and searching in a structure. The system includes at least 3

LT 6273 B vieną kompiuterį su kompiuterine elektroninių duomenų laikmena, joje saugomas kompiuterinės programos komandas, skirtas struktūros neturinčiame tekste atpažinti bent aviacijos detalių bent numerius, kiekius, būkles, kur minėta kompiuterinė programa apima teksto apdorojimo komandas ir apmokyto dirbtinio neuroninio tinklo komandas, ir procesorinę priemonę, skirtą vykdyti elektroninių duomenų laikmenoje saugomas kompiuterinės programos komandas. Sistema taip pat apima su minėtu bent vienu kompiuteriu susietas bent kitas kompiuterines priemones su duomenų laikmenomis, kuriose yra saugoma informacija apie aviacijos detalių numerius, jų kiekius ir jų būkles. Išradimas taip pat apima būdą, skirtą aviacijos detalių atpažinimui struktūros neturinčiame tekste, naudojant sistemą, apimančią bent kompiuterinę elektroninių duomenų laikmeną, joje saugomas kompiuterinės programos komandas, skirtas struktūros neturinčiame tekste atpažinti bent aviacijos detalių bent numerius, kiekius, būkles, kur minėta kompiuterinė programa apima teksto apdorojimo komandas ir dirbtinio neuroninio tinklo komandas, ir procesorinę priemonę, skirtą vykdyti elektroninių duomenų laikmenoje saugomas kompiuterinės programos komandas. Būdas apima dirbtinio neuroninio tinklo apmokymą elektroninio formato tekste rasti bent aviacijos detalių numerius, jų kiekius, būkles atitinkančią informaciją, apmokyto dirbtinio neuroninio tinklo panaudojimą tam, kad naudojant programos, kurioje yra integruotas minėtas dirbtinis neuroninis tinklas, komandas būtų atliktas struktūros neturinčio elektroninio formato teksto gavimas procesorinėje priemonėje, teksto apdorojimas ir reikalingos informacijos, pavyzdžiui aviacijos detalių numerių, kiekių ar jų būklės, paieška, išvedimas ir išsaugojimas laikmenoje. O taip pat naudojant kompiuterinę programą yra atliekamas aviacijos detalių numerių, kiekių ar jų būklės informacijos palyginimas su kitų kompiuterinių priemonių laikmenose esančia aviacijos detalių numerių, kiekių ar jų būklės informacija.EN 6273 B one computer with electronic data storage medium, stored in computer program commands for recognizing at least numbers, quantities, states of at least parts of the structure in a text without structure, where said computer program includes text processing commands and trained artificial neural network commands, and processor tool for executing computer program commands stored on an electronic data carrier. The system also includes at least one computer device associated with said at least one computer with data carriers containing information about the aviation part numbers, their quantities and their states. The invention also encompasses a method for recognizing aviation parts in a non-structured text using a system comprising at least a computerized electronic data medium, storing computer program commands for recognizing at least numbers, quantities, states of at least parts of the structure in a text without structure, wherein said computer program includes said computer program text processing commands and artificial neural network commands, and a processor tool for executing computer program commands stored on an electronic data carrier. The method includes training the artificial neural network in the electronic text to find at least the parts of the aeronautical parts, the amounts thereof, the information corresponding to the state, the use of the trained artificial neural network in order to obtain the text of the non-structural electronic format using the program in which said artificial neural network is integrated in a processor, text processing, and retrieving, retrieving, and storing the necessary information, such as number, quantity, or condition of aviation in the medium. Also, using a computer program is a comparison of aeronautical part numbers, quantities or their state information with the details of aircraft parts, quantities or their state on the media of other computer devices.

Trumpas brėžinių aprašymasA brief description of the drawings

Fig. 1 Principinė aviacijos technikos detalių numerių, kiekių ir būklių informacijos atpažinimo nesusistemintame tekste sistemos schema;FIG. 1 Principal scheme of system identification of parts, numbers and states of aeronautical parts in non-systematic text;

Fig. 2 Detalių numerių, kiekių ir būklių informacijos paieškos sistemos schema.FIG. 2 Schematic of a system for searching for details of number, quantity and condition information.

Fig. 3 Neuroninio tinklo apmokymo schema 4FIG. 3 Neural Network Training Scheme 4

LT 6273 BLT 6273 B

Fig. 4 Teksto apdorojimo schema;FIG. 4 Text processing scheme;

Detalus išradimo aprašymas Išradimą sudaro informacijos, susijusios su aviacijos detalių numeriais, kiekiais ir būklėmis atpažinimo nesusistemintame tekste būdas ir paieškos sistema.DETAILED DESCRIPTION OF THE INVENTION The invention relates to a method and a search engine for identifying information, numbers and states of aviation details in a non-systematic text.

Minėtą sistemą sudaro bent vienas pirmas kompiuteris (PR), sujungtas su bent kompiuterine elektroninių duomenų laikmena (1), kurioje yra saugoma kompiuterinė programa (2), kurios komandos yra skirtos atpažinti aviacijos detalių bent numerius, kiekius, būkles struktūros neturinčiame tekste (3), kur minėta kompiuterinė programa (2) apima teksto apdorojimo komandas ir apmokyto dirbtinio neuroninio tinklo komandas, ir apimantis procesorinę priemonę (6), skirtą vykdyti elektroninių duomenų laikmenoje (1) saugomas kompiuterinės programos komandas. Sistema taip pat apima su minėtu pirmu kompiuteriu (PR) per kompiuterinių komunikacinių tinklų priemonę (KKTP) sujungtą elektroninės tekstinės informacijos gavimo priemonę (7), tokią kaip elektroninio pašto serveriai, susieti su kompiuterinėmis programomis, su kuriomis gali būti susieta kompiuterinė programa (2), bent kitas kompiuterines priemones (KKP), sujungtas su duomenų saugojimo laikmenomis (DSL), kuriose yra patalpinta informacija apie aviacijos detales, jų kiekius ir jų būkles. Minėtas bent vienas pirmas kompiuteris (PR) yra sujungtas su minėtomis bent kitomis kompiuterinėmis priemonėmis (KKP) per kompiuterinių komunikacinių tinklų priemones (KKTP) tam, kad procesorine priemone (6) vykdoma programa (2) galėtų gauti informaciją iš minėtų bent kitų kompiuterinių priemonių laikmenų (DSL) ir ją galėtų palyginti su bent vieno pirmo kompiuterio (PR) laikmenoje (1) esančia išsaugota, iš apdorotos įvestos tekstinės informacijos gauta, detalių numerių, jų kiekių ir būklių informacija. Būdas atpažinti nesusistemintame tekste esančią informaciją, susijusią su aviacijos detalių numeriais, kiekiais ir būklėmis, panaudojant minėtą sistemą, apima dirbtinio neuroninio tinklo parinkimą (21) ir talpinimą į kompiuterinę laikmeną (1); dirbtinio neuroninio tinklo apmokymą (22), apimantį kompiuterinėje laikmenoje (1) esančioje realių detalių duomenų bazėje su detalėmis susijusios informacijos, kuri gali būti bent detalės numeris, detalių skaičius ir būklė, apdorojimą, apimantį kiekvieno žodžio vertimą į skaitinių parametrų aibę; elektroninio laiško gavimą (23); tekstinės informacijos apdorojimo programos (2) vykdymą (24); elektroninio laiško turinio atpažinimą (25); detalės paieškos atlikimą (26) ir paieškos rezultatų išvedimą 5The system comprises at least one first computer (PR) connected to at least a computerized electronic data carrier (1), which contains a stored computer program (2) whose commands are designed to identify at least numbers, quantities, and statuses of the aviation parts in a text without structure (3) , wherein said computer program (2) comprises text processing commands and commands for a trained artificial neural network, and comprising a processor (6) for executing computer program commands stored in an electronic data medium (1). The system also includes an electronic text information retrieval tool (7) connected to said first computer (PR) via a Computer Communication Networks (CCP), such as email servers associated with computer programs that can be associated with a computer program (2). , at least other computer tools (CCPs) connected to data storage media (DSL) containing information about the aviation components, their quantities and their states. The at least one first computer (PR) is connected to said at least other computer means (CCPs) via means of computer communication networks (CCPs) so that the program (2) executed by the processor (6) can obtain information from said at least other computer media (DSL) and can compare it with the stored, received, input, textual information, number and condition information of at least one first computer (PR) (1). The method of recognizing information in an unstructured text relating to the numbers, quantities, and states of aeronautical parts using said system includes selecting an artificial neural network (21) and placing it on a computer medium (1); an artificial neural network training (22) comprising processing of information related to the details in a computerized medium (1) in the details of the details, which may be at least a part number, a number of parts and a condition, comprising translating each word into a set of numeric parameters; receiving an e-mail (23); executing a text information processing program (2) (24); electronic message content recognition (25); performing a component search (26) and retrieving search results 5

LT 6273 B (27) į kompiuterinės priemonės duomenų išvedimo priemonę.EN 6273 B (27).

Apmokant (22) dirbtinį neuroninį tinklą vykdomo vertimo (28) metu yra tikrinama kiek kokios rūšies simbolių, apimančių grupę iš raidžių, iš eilės einančių skaičių, simbolių iš ASCII lentelės, simbolių esančių už ASCII lentelės ribų, @, brūkšnių, yra duotame žodyje ir koks yra žodžio ilgis. Apmokymui taip pat yra naudojamas panašus kiekis žodžių, kurie nėra aviacijos technikos detalių numeriai ir su visais žodžiais. Dirbtinio neuroninio tinklo apmokymui gali būti naudojama apie 70% duomenų iš detalių duomenų bazės, o atlikus apmokymą likusi dalis duomenų iš minėtos duomenų bazės yra naudojama nustatyti, kokiu tikslumu apmokytas dirbtinis neuroninis tinklas atskiria jam nežinomus duomenis, t.y. duomenis, kurie nebuvo naudojami apmokymo metu; dirbtinio neuroninio tinklo ir kompiuterinėje laikmenoje (1) esančios teksto apdorojimo programos (2) vienalaikį vykdymą procesorinėje priemonėje (6) tam, kad minėta programa (2), tekstinės informacijos įvesties į kompiuterinėje laikmenoje saugomą duomenų bazę, priemone (7) įvestoje tekstinėje informacijoje būtų atpažinti (30) aviacijos detalių numeriai, esami jų kiekiai ir būklės, kur minėta detalių numerių, jų kiekių ir būklės informacija yra išsaugoma kompiuterinėje laikmenoje (1).By training (22) an artificial neural network during an ongoing translation (28), the number of characters comprising a group of letters, consecutive numbers, characters from an ASCII table, characters outside the ASCII table, @, dashes is checked in the given word and what is the length of the word. The training also uses a similar amount of words that are not aeronautical parts numbers and all words. About 70% of the data in the detail database can be used for the training of the artificial neural network, while the rest of the data from the database is used to determine the accuracy of the trained artificial neural network separating the unknown data, i. data not used during training; the simultaneous execution of an artificial neural network and a word processing program (2) in a computer medium (1) in a processor device (6), so that the said program (2), the text information input to the database stored in the computer medium (7), is in the text information Identify (30) The parts, numbers and states of the aeronautical parts, where the details of the aforementioned part numbers, their quantities and status are stored on a computer medium (1).

Minėta teksto apdorojimo programa yra vykdoma (24) procesorinėje priemonėje (6) tam, kad įvesta (23) tekstinė informacija būtų apdorota pagal toliau pateiktus žingsnius: iš įvesties teksto, bet kokių simbolių visumos, yra išmetami (31) į detalės numerio struktūrą panašūs simbolių junginiai, pavyzdžiui datos, lėktuvų pavadinimai, telefono numeriai, adresai; skirtukai, pavyzdžiui įvairūs nestandartiniai tarpai, skyrybos ženklai, yra pakeičiami (32) į žodžio tarpo simbolį; įvesties tekstas, bet kokių simbolių visuma, yra skaldomas (33, 34) į eilutes, pavyzdžiui pagal naujos eilutės simbolį, pagal HTML lentelės eilutes ir pan., o šios į žodžius pagal tarpo simbolį; yra vykdomos iteracijos per kiekvieną eilutę ir per tos eilutės žodžius, kur žodžiai yra konvertuojami (35) į parametrų aibę, tuo pačiu būdu kaip tai daroma dirbtinio neuroninio tinklo apmokymui; ši aibė yra perduodama apmokytą dirbtinį neuroninį tinklą naudojančiai programai, kuri grąžina (36) skaitinę tikimybę nuo -1 iki 1, kad šis žodis yra aviacijos detalės numeris. Jeigu tikimybė yra pakankamai artima 100%, pavyzdžiui apie 90%, žodis yra laikomas detale ir yra tiriama eilutė kurioje yra šis žodis.The above word processing program is executed (24) in the processor device (6) so that the entered (23) textual information is processed according to the following steps: from the input text, any set of characters, is ejected (31) into the part number structure-like characters compounds such as dates, aircraft names, phone numbers, addresses; tabs, such as various non-standard spaces, punctuation marks, are replaced (32) by the word space symbol; the input text, any set of characters, is broken (33, 34) into rows, such as the new line symbol, the rows of the HTML table, etc., and these are words by space character; iterations are performed on each row and through the words of the line where the words are converted (35) to a set of parameters, in the same way as for the training of the artificial neural network; this set is transmitted to a program using a trained artificial neural network, which returns (36) the numerical probability of -1 to 1, so that the word is a part of the aviation part. If the probability is close enough to 100%, for example about 90%, the word is considered as a detail and is investigated by the line containing that word.

Radus (37) aviacijos detalių numerius, toliau yra ieškoma (38) detalės kiekio 6After finding (37) the aviation part numbers, the part quantity (6) 6 is further searched

LT 6273 B t.y. detalės numerio aplinkoje, pavyzdžiui eilutėje, kurioje buvo rastas detalės numeris, yra ieškomas skaičius, jeigu yra randami keli skaičiai - imamas paskutinis. Jei ši informacija yra randama, tikrinama ar tai nėra eilučių numeracija, kur kiekis yra lyginamas su praeitos eilutės kiekiu ir jei jis didėja po vieną vienetą, yra laikoma, kad tai yra numeracija, ir ar kiekis nebuvo palaikytas atskiru detalės numeriu, pavyzdžiui 100 gali būti ir kiekis ir detalės numeris, todėl prieš ieškant kiekio iš eilutės yra išmetami rasti detalių numeriai.LT 6273 B t.y. in the part number environment, such as the line where the part number was found, the number is searched for if several numbers are found - the last one is taken. If this information is found, it is checked that it is not a numbering of lines, where the quantity is compared to the previous line and if it increases by one, it is considered to be numbering, and whether the quantity was not supported by a separate part number, for example 100 may be and quantity and part number, so part numbers are discarded from the line before searching for quantity.

Radus (38) aviacijos detalių kiekius, toliau yra ieškoma (39) ir detalės būklę nusakanti informacija. Pradžioje būklės raktažodžiai yra verčiami į jų trumpinius ir tada eilutėje yra ieškoma šių trumpinių, kurie gali būti parinkti iš grupės, susidedančios iš, bet neapsiribojant jais: FN - tiesiai iš gamyklos, NE - nauja įranga, NS - naujas perteklinis, OH - po kapitalinio remonto, RP - pataisoma, SV -panaudojama, AR - stadija kaip numontuota, NA - nenustatyta.After finding (38) the quantities of aviation components, the information (39) and the state of the part are further searched (39). Initially, the status keywords are translated into their abbreviations, and then the line contains the following shortcuts that can be selected from the group consisting of, but not limited to: FN - directly from the factory, NO - new equipment, NS - new surplus, OH - after capital repairs, RP - corrected, SV - used, AR - stage as dismantled, NA - not set.

Tokiu principu yra apdorojamas visas pateiktas įvesties tekstas, yra suformuojamas (40) sąrašas su rastais duomenimis ir išsaugomas kompiuterinėje laikmenoje. Šis sąrašas turi tikslią struktūrą, apimančią bent detalių numerius, jų būkles ir kiekius, kuris gali būti pateiktas bet kokiu formatu, pavyzdžiui JSON, dėl to yra galima integracija su bet kokia esama ar naujai kuriama paieškos sistema, ERP ar kita darbui su aviacijos detalėmis skirta sistema pertam skirtas sąsajas.In this way, the entire input text is processed, a list (40) is created with the data found and stored on a computer medium. This list has an exact structure that includes at least the part numbers, their states, and the quantities that can be presented in any format, such as JSON, which makes it possible to integrate with any existing or emerging search engine, ERP or other work with aviation components system for hinged interfaces.

Pateikiamas išradimo įgyvendinimo pavyzdys neturėtų būti laikomas kaip vienintelis įgyvendinimo pavyzdys ir turėtų būti suprantama, kad yra galimos įvairios sistemos ir būdo modifikacijos ir pritaikymai, kurie būtų savaime suprantami srities ekspertui pagal pateiktą mokymą.The exemplary embodiment of the present invention should not be construed as the sole example of implementation and it should be understood that various modifications and adaptations of the system and method are readily apparent to those skilled in the art upon the basis of the teachings provided.

Claims (1)

7 LT 6273 B Apibrėžtis 1. Sistema, apimanti kompiuteriu nuskaitomoje laikmenoje saugomą kompiuterinės programos produktą skirtą elektroninių laiškų apdorojimui, turinio informacijos išrinkimui ir paieškos atlikimui kompiuteriniais tinklais pasiekiamose duomenų bazėse besiskirianti tuo, kad sistemos elektroninių duomenų laikmenoje (1) saugoma kompiuterinė programa (2) apima teksto apdorojimo komandas ir apmokyto dirbtinio neuroninio tinklo komandas, skirtas atpažinti aviacijos detalių numerius, kiekius ir būkles struktūros neturinčiame tekste (3). 2. Būdas, skirtas kompiuteriu nuskaitomoje laikmenoje saugoma kompiuterine programa apdoroti elektroninius laiškus, išrinkti turinio informaciją ir atlikti paiešką kompiuteriniais tinklais pasiekiamose duomenų bazėse b e s i s k i r i antis tuo, kad apima žingsnius: a) dirbtinio neuroninio tinklo parinkimą (21) ir talpinimą į kompiuterinę laikmeną (1); b) dirbtinio neuroninio tinklo apmokymą (22), apimantį kompiuterinėje laikmenoje (1) esančioje realių detalių duomenų bazėje su detalėmis susijusios informacijos, kuri gali būti bent detalės numeris, detalių skaičius ir būklė, apdorojimą, apimantį kiekvieno žodžio vertimą į skaitinių parametrų aibę; c) elektroninio laiško gavimą (23) kompiuterinėje laikmenoje (1); d) elektroninio laiško turinio tekstinės informacijos apdorojimui tekstinės informacijos apdorojimo programos (2) vykdymą (24) procesorine priemone; e) elektroninio laiško turinio, susijusio su aviacijos detalių numeriais, kiekiais ir būklėmis atpažinimą (25) nesusistemintame tekste; f) detalės paieškos atlikimą (26) pagal žingsnyje e) atpažintą elektroninio laiško turinį; g) žingsnio f) rezultatų išsaugojimą kompiuterinėje laikmenoje (1) ir išvedimą (27) informacijos atvaizdavimo priemone. δ LT 6273 B 3. Būdas pagal 2 punktą, besiskiriantis tuo, kad neuroninio tinklo apmokymas apima žingsnius: a) kompiuterinėje laikmenoje (1) esančioje realių detalių duomenų bazėje (DB) su detalėmis susijusios informacijos, kuri gali būti bent detalės numeris, detalių skaičius ir būklė, apdorojimą, apimantį kiekvieno žodžio vertimą (28) į skaitinių parametrų aibę ir tikrinamą, kiek kokios rūšies simbolių, apimančių grupę iš raidžių, iš eilės einančių skaitmenų skaičių, simbolių iš ASCII lentelės, simbolių esančių už ASCII lentelės ribų, @, brūkšnių, yra duotame žodyje ir koks yra žodžio ilgis; b) žingsnio a) kartojimą (29) su visais žodžiais, esančiais tekste, c) dirbtinio neuroninio tinklo ir kompiuterinėje laikmenoje (1) esančios teksto apdorojimo programos (2) vienalaikį vykdymą procesorinėje priemonėje (6) tam, kad minėta programa (2), tekstinės informacijos įvesties į kompiuterinėje laikmenoje saugomą duomenų bazę priemone (7) įvestoje tekstinėje informacijoje būtų atpažinti (30) aviacijos detalių numeriai, esami jų kiekiai ir būklės, kur minėta detalių numerių, jų kiekių ir būklės informacija yra išsaugoma kompiuterinėje laikmenoje (1). d) žingsnio c) kartojimą su visais rastais detalių numeriais. 4. Būdas pagal 2 arba 3 punktą, besiskiriantis tuo, kad minėta teksto apdorojimo programa (4) yra vykdoma procesorinėje priemonėje (6) tam, kad įvesta tekstinė informacija būtų apdorota pagal toliau pateiktus žingsnius: a) iš įvesties teksto, bet kokių simbolių visumos, yra išmetami (31) į detalės numerio struktūrą panašūs simbolių junginiai, bet ne detalės numeriai; b) skirtukai, pavyzdžiui įvairūs nestandartiniai tarpai, skyrybos ženklai, yra pakeičiami (32) į žodžio tarpo simbolį; c) įvesties tekstas, bet kokių simbolių visuma, yra skaldomas (33) į eilutes, o šios į žodžius(34) pagal tarpo simbolį; d) yra vykdomos (35) iteracijos per kiekvieną eilutę ir per tos eilutės žodžius, kur žodžiai yra konvertuojami į parametrų aibę; e) žingsnyje d) gauta aibė yra perduodama apmokytą dirbtinį neuroninį tinklą naudojančiai programai, kuri grąžina (36) skaitinę tikimybę nuo -1 iki 1, kad šis žodis g LT 6273 B yra aviacijos detalės numeris; f) toliau yra ieškoma (37) detalės kiekio; g) žingsnyje f) rastas detalės kiekis, tikrinamas (38) ar tai nėra eilučių numeracija, kur kiekis yra lyginamas su praeitos eilutės kiekiu; h) toliau yra ieškoma (39) detalės būklę nusakanti informacija, būklės raktažodžius verčiant į jų trumpinius ir eilutėje ieškant šių trumpinių, kurie gali būti parinkti iš grupės, susidedančios iš, bet neapsiribojant jais: FN - tiesiai iš gamyklos, NE - nauja įranga, NS - naujas perteklinis, OH - po kapitalinio remonto, RP -pataisoma, SV - panaudojama, AR - stadija kaip numontuota, NA - nenustatyta. i) suformuojamas (40) sąrašas su tikslia struktūra, apimančia bent detalių numerius, jų būkles ir kiekius, ir išsaugomas kompiuterinėje laikmenoje.7 EN 6273 B Definition 1. A system comprising a computer program product stored on a computer-readable medium for the processing of e-mails, the selection of content information and the conduct of searches in computer-accessible databases, is characterized by the fact that a computer program is stored on a system's electronic data medium (1) (2) includes word processing commands and trained artificial neural network commands for recognizing aerospace part numbers, quantities and states in a text without structure (3). 2. A method for processing computer e-mails, selecting content information, and searching for computer-accessible databases in a computer-readable computer program comprises the steps of: a) selecting an artificial neural network (21) and placing it on a computer medium (1) ); b) training an artificial neural network (22) comprising processing of information related to the details in a real-time data base in a computer medium (1), which may be at least a part number, a number of parts and a condition, comprising translating each word into a set of numeric parameters; c) receiving (23) an electronic message on a computer medium (1); d) executing (24) a text processing program (2) for processing textual information of the e-mail message by means of a processor; (e) the identification (25) of the content of the electronic mail relating to the numbering, quantity and condition of the aeronautical parts in an unstructured text; f) performing a component search (26) according to the e-mail content recognized in step e); g) storing the results of step f) in a computer medium (1) and output (27) as an information display device. δ LT 6273 B 3. A method according to claim 2, characterized in that the training of the neural network comprises the steps of: a) a number of details of the details of the details in the computer medium (1), which may be at least a part number and status, processing comprising the translation of each word (28) into a set of numeric parameters and the number of characters to be checked, comprising a group of letters, a number of consecutive digits, characters from an ASCII table, characters outside the ASCII table, @, dashes is in a given word and the length of the word; b) repeating step (a) (29) with all words in the text; (c) simultaneous processing of the artificial word neural network (1) and the word processing program (2) in the computer medium (2) in the processor (6) for said program (2); The text information entered into the text information input to the database stored in the computer medium (7) would recognize (30) the numbers of the aeronautical parts, their present quantities and the states in which said details of numbers, their quantities and status are stored on a computer medium (1). d) repeating step c) with all part numbers found. 4. Method according to claim 2 or 3, characterized in that said word processing program (4) is executed in a processor (6) to process the entered textual information according to the following steps: a) from the input text, any character set , (31) character combinations similar to the part number structure are discarded, but not part numbers; b) tabs, such as various non-standard spaces, punctuation marks, are replaced (32) by the word space symbol; c) the input text, any set of characters, is broken (33) into rows, and the words (34) are separated by a space character; d) iterating (35) each line and the words of the line where the words are converted into a set of parameters; e) the set obtained in step d) is transmitted to a program using a trained artificial neural network, which returns (36) a numeric probability of -1 to 1, so that the word g LT 6273 B is the aviation part number; f) further detailing (37) the amount of detail; g) the amount of detail found in step f) is checked (38) whether it is a numbering of rows where the amount is compared with the amount of the previous row; h) searching for information (39) detailing the state of the part, translating the state keywords into their abbreviations, and searching in the line for these abbreviations that can be selected from the group consisting of, but not limited to: FN - directly from the factory, NO - new equipment, NS - new surplus, OH - after major repairs, RP-corrected, SV - used, AR - stage as dismantled, NA - not established. i) generating (40) a list of accurate structures comprising at least part numbers, their states and quantities, and stored on a computer medium.
LT2014120A 2014-10-14 2014-10-14 System and method of ofaviation parts structure recognition in structure free text LT6273B (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
LT2014120A LT6273B (en) 2014-10-14 2014-10-14 System and method of ofaviation parts structure recognition in structure free text
PCT/IB2015/057544 WO2016059505A1 (en) 2014-10-14 2015-10-02 A system and a method for recognition of aerospace parts in unstructured text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
LT2014120A LT6273B (en) 2014-10-14 2014-10-14 System and method of ofaviation parts structure recognition in structure free text

Publications (2)

Publication Number Publication Date
LT2014120A LT2014120A (en) 2016-04-25
LT6273B true LT6273B (en) 2016-05-25

Family

ID=54542296

Family Applications (1)

Application Number Title Priority Date Filing Date
LT2014120A LT6273B (en) 2014-10-14 2014-10-14 System and method of ofaviation parts structure recognition in structure free text

Country Status (2)

Country Link
LT (1) LT6273B (en)
WO (1) WO2016059505A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102279164B1 (en) * 2019-03-27 2021-07-19 네이버 주식회사 Image editting method and apparatus using artificial intelligence model
CN111222549B (en) * 2019-12-30 2023-10-24 航天时代飞鸿技术有限公司 Unmanned aerial vehicle fault prediction method based on deep neural network

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6044375A (en) * 1998-04-30 2000-03-28 Hewlett-Packard Company Automatic extraction of metadata using a neural network
US7546234B1 (en) 2003-01-08 2009-06-09 Xambala, Inc. Semantic processing engine
US20060009966A1 (en) * 2004-07-12 2006-01-12 International Business Machines Corporation Method and system for extracting information from unstructured text using symbolic machine learning
US8392409B1 (en) 2006-01-23 2013-03-05 Symantec Corporation Methods, systems, and user interface for E-mail analysis and review

Also Published As

Publication number Publication date
WO2016059505A1 (en) 2016-04-21
LT2014120A (en) 2016-04-25

Similar Documents

Publication Publication Date Title
CN110276410B (en) Method and device for determining bad reason, electronic equipment and storage medium
US20170004413A1 (en) Data driven classification and data quality checking system
CN111324784A (en) Character string processing method and device
US9898464B2 (en) Information extraction supporting apparatus and method
CN112163424A (en) Data labeling method, device, equipment and medium
CN110019703B (en) Data marking method and device and intelligent question-answering method and system
US10083403B2 (en) Data driven classification and data quality checking method
CN113055481B (en) Message pushing method, device, equipment and computer readable storage medium
CN110941702A (en) Retrieval method and device for laws and regulations and laws and readable storage medium
US20180129714A1 (en) Apparatus And Method For Tag Mapping With Industrial Machines
US20210406464A1 (en) Skill word evaluation method and device, electronic device, and non-transitory computer readable storage medium
CN112445894A (en) Business intelligent system based on artificial intelligence and analysis method thereof
CN111428480A (en) Resume identification method, device, equipment and storage medium
CN111338693B (en) Model construction-based target file generation method, server and storage medium
CN115269959A (en) Search association recommendation method and device, electronic equipment and storage medium
LT6273B (en) System and method of ofaviation parts structure recognition in structure free text
CN111104422B (en) Training method, device, equipment and storage medium of data recommendation model
JP2010211575A (en) Information evaluation support system
US20180144309A1 (en) System and Method for Determining Valid Request and Commitment Patterns in Electronic Messages
CN115718807A (en) Personnel relationship analysis method, device, equipment and storage medium
CN110941713A (en) Self-optimization financial information plate classification method based on topic model
US20210295211A1 (en) Information processing apparatus and non-transitory computer readable medium
CN115150354A (en) Method and device for generating domain name, storage medium and electronic equipment
JP6190341B2 (en) DATA GENERATION DEVICE, DATA GENERATION METHOD, AND PROGRAM
CN112685566A (en) Method, device and equipment for rapidly processing problems and storage medium

Legal Events

Date Code Title Description
BB1A Patent application published

Effective date: 20160425

FG9A Patent granted

Effective date: 20160525