ITTO20120303A1 - METHOD AND SYSTEM FOR CARRYING OUT ANALYSIS AND AUTOMATIC COMPARISON OF PATENTS AND TECHNICAL DESCRIPTIONS. - Google Patents
METHOD AND SYSTEM FOR CARRYING OUT ANALYSIS AND AUTOMATIC COMPARISON OF PATENTS AND TECHNICAL DESCRIPTIONS. Download PDFInfo
- Publication number
- ITTO20120303A1 ITTO20120303A1 IT000303A ITTO20120303A ITTO20120303A1 IT TO20120303 A1 ITTO20120303 A1 IT TO20120303A1 IT 000303 A IT000303 A IT 000303A IT TO20120303 A ITTO20120303 A IT TO20120303A IT TO20120303 A1 ITTO20120303 A1 IT TO20120303A1
- Authority
- IT
- Italy
- Prior art keywords
- components
- artifact
- component
- field
- functional
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 45
- 238000004458 analytical method Methods 0.000 title claims description 38
- 230000003993 interaction Effects 0.000 claims description 30
- 238000012482 interaction analysis Methods 0.000 claims description 16
- 238000012805 post-processing Methods 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 claims description 8
- 230000009471 action Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 230000021615 conjugation Effects 0.000 claims description 3
- 238000013519 translation Methods 0.000 claims description 3
- 230000014616 translation Effects 0.000 claims description 3
- 230000014509 gene expression Effects 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 claims description 2
- 241000269627 Amphiuma means Species 0.000 claims 1
- 238000004590 computer program Methods 0.000 claims 1
- 239000000047 product Substances 0.000 description 54
- 230000006870 function Effects 0.000 description 23
- 238000013461 design Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000010230 functional analysis Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- PGLIUCLTXOYQMV-UHFFFAOYSA-N Cetirizine hydrochloride Chemical compound Cl.Cl.C1CN(CCOCC(=O)O)CCN1C(C=1C=CC(Cl)=CC=1)C1=CC=CC=C1 PGLIUCLTXOYQMV-UHFFFAOYSA-N 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Description
Descrizione dell'Invenzione Industriale avente per titolo: "METODO E SISTEMA PER EFFETTUARE ANALISI E CONFRONTI AUTOMATICI DI BREVETTI E DESCRIZIONI TECNICHE" Description of the Industrial Invention entitled: "METHOD AND SYSTEM FOR PERFORMING ANALYSIS AND AUTOMATIC COMPARISON OF PATENTS AND TECHNICAL DESCRIPTIONS"
DESCRIZIONE DESCRIPTION
La presente invenzione riguarda un metodo ed un sistema per effettuare analisi e confronti automatici di brevetti e descrizioni tecniche. The present invention relates to a method and a system for carrying out automatic analyzes and comparisons of patents and technical descriptions.
Il numero di tecnologie commercialmente disponibili in campo tecnico, ma anche nel campo dei beni di consumo, è in crescita. Nonostante la progressiva specializzazione delle tecnologie, diverse risorse sono dedicate anche alla diffusione di soluzioni tecniche al di fuori del loro campo di applicazione originario, che trovano così un maggior numero di applicazioni pratiche in nuovi prodotti e processi. The number of technologies commercially available in the technical field, but also in the field of consumer goods, is growing. Despite the progressive specialization of technologies, various resources are also dedicated to the diffusion of technical solutions outside their original field of application, which thus find a greater number of practical applications in new products and processes.
L'opportunità di ottenere vantaggi sia economici, sia strategici, per mezzo di brevetti è spesso ritardata, se non addirittura non sfruttata, per via delle difficoltà legate al numero di brevetti esistenti da analizzare ed al linguaggio formale usato per descrivere l'invenzione. The opportunity to obtain both economic and strategic advantages by means of patents is often delayed, if not actually exploited, due to the difficulties linked to the number of existing patents to be analyzed and to the formal language used to describe the invention.
Ogni giorno pensatori inventori e società disperdono energie e tempo cercando di valutare il livello di innovazione, la brevettabilità di un'invenzione e l'originalità del contenuto. Every day thinkers, inventors and companies waste energy and time trying to evaluate the level of innovation, the patentability of an invention and the originality of the content.
Ad esempio, è noto che per circa cinquanta anni sono state proposte teorie, ora ben collaudate (TRIZ by Altshuller G., "Creativity as an Exact Science: The Theory of thè Solution of Inventive Problems", Gordon & Breach Science pub., 1984) per confrontare e valutare il livello inventivo di invenzioni diverse. Queste teorie, per essere applicate, richiedono il diretto intervento dell'uomo ed una considerevole parte di questo lavoro è dedicata ad applicazioni del cervello umano meno intense quali leggere e costruirsi un'immagine mentale delle relazioni esistenti fra i componenti dell'invenzione esaminata, piuttosto che comprendere i concetti espressi e l'ontologia dell' invenzione . For example, it is known that for about fifty years now well-tested theories have been proposed (TRIZ by Altshuller G., "Creativity as an Exact Science: The Theory of the Solution of Inventive Problems", Gordon & Breach Science pub., 1984 ) to compare and evaluate the inventive level of different inventions. These theories, to be applied, require the direct intervention of man and a considerable part of this work is dedicated to less intense applications of the human brain such as reading and building a mental image of the relationships existing between the components of the invention examined, rather than to understand the concepts expressed and the ontology of the invention.
Esistono diversi pacchetti software che rappresentano contenuti tecnici /tecnologici in base alla loro rappresentazione funzionale, un subset ingegneristico della matematica teoria dei grafi. Strumenti dedicati si sono dimostrati realmente efficaci per velocizzare la comprensione di concetti, ma nonostante questi aiuti, grandi quantità di tempo sono necessarie per definire una rappresentazione funzionale di un'invenzione. There are several software packages that represent technical / technological contents based on their functional representation, an engineering subset of mathematical graph theory. Dedicated tools have proven to be really effective in speeding up the understanding of concepts, but despite these aids, large amounts of time are required to define a functional representation of an invention.
L'analisi funzionale è uno strumento potente per progettisti che non si vogliono limitare all'introduzione di piccole ottimizzazioni di un sistema meccanico, ma piuttosto si propongono di introdurre innovazioni significative al fine di realizzare prodotti realmente nuovi. La descrizione funzionale di un prodotto è una descrizione a livello astratto, tale che diverse soluzioni progettuali possono essere esplorate in fase di progettazione concettuale, sviluppando le varianti funzionali. Functional analysis is a powerful tool for designers who do not want to limit themselves to introducing small optimizations of a mechanical system, but rather intend to introduce significant innovations in order to create truly new products. The functional description of a product is a description at an abstract level, such that different design solutions can be explored in the conceptual design phase, developing functional variants.
Inoltre, l'analisi funzionale può rivestire un ruolo importante al fine dell'aggiramento brevettuale: un'attenta analisi funzionale di un brevetto consente l'individuazione di eventuali definizioni ambigue tali da rendere possibile il superamento dei vincoli brevettali con modifiche di piccola entità. Viceversa, nello scrivere un brevetto, un'analisi funzionale del testo costituisce una efficace verifica della qualità del lavoro compiuto. Furthermore, functional analysis can play an important role in patent circumvention: a careful functional analysis of a patent allows the identification of any ambiguous definitions such as to make it possible to overcome the patent constraints with minor modifications. Conversely, when writing a patent, a functional analysis of the text constitutes an effective verification of the quality of the work done.
La modellazione funzionale è spesso impiegata anche a livello di progettazione di dettaglio: seguendo l'approccio del Suh (Suh N.P., "The Principles of Design", Oxford Press, 1990), la funzione è assunta come l'obiettivo ed il progetto è scomposto in requisiti funzionali che sono messi direttamente in relazione con i parametri di progetto a qualsiasi livello di astrazione. Dato che i prodotti sono definiti e dovrebbero essere progettati in base alla funzione che devono svolgere, svariati autori hanno classificato le funzioni tipiche della progettazione meccanica, con il fine di associare "subsystem" (assiemi di parti fisiche o componenti) e sub-funzioni in modo tale da fornire al progettista un insieme di unità modulari con le quali sviluppare il prodotto finale. Un'esaustiva descrizione di questi lavori è data da Kirschman (Kirschman C.F. et al, "Classifying Functions for Mechanical Design", Journal of Mechanical Design (ASME), Voi. 120, September 1998). Functional modeling is also often used at the level of detailed design: following the approach of the Suh (Suh N.P., "The Principles of Design", Oxford Press, 1990), the function is assumed as the goal and the project is broken down in functional requirements that are directly related to the design parameters at any level of abstraction. Since the products are defined and should be designed according to the function they must perform, various authors have classified the typical functions of mechanical design, with the aim of associating "subsystems" (assemblies of physical parts or components) and sub-functions in in such a way as to provide the designer with a set of modular units with which to develop the final product. An exhaustive description of these works is given by Kirschman (Kirschman C.F. et al, "Classifying Functions for Mechanical Design", Journal of Mechanical Design (ASME), Vol. 120, September 1998).
Diversi lavori sono stati pubblicati per proporre rappresentazioni efficaci delle funzioni per descrivere i diversi aspetti dell'intento del progettista, compito questo cruciale per lo sviluppo di sistemi di ausilio alla progettazione concettuale; lo scopo di questi lavori è la definizione di metodi efficaci anche per la rappresentazione delle relazioni esistenti fra le funzioni, quali le relazioni "scomposto-in", "condizionato-da", "accresciuto-da", "descritto-come" (Shimomura et al., "Representation of Design Object Based on thè Functional Evolution Process Mode", Journal of Mechanical Design (ASME), Voi. 120, June 1998). Several papers have been published to propose effective representations of the functions to describe the different aspects of the designer's intent, a crucial task for the development of aids to conceptual design; the purpose of these works is the definition of effective methods also for the representation of the relations existing between functions, such as the relations "decomposed-in", "conditioned-by", "increased-by", "described-as" (Shimomura et al., "Representation of Design Object Based on the Functional Evolution Process Mode", Journal of Mechanical Design (ASME), Vol. 120, June 1998).
In questo contesto gli inventori stanno sviluppando strumenti, sistemi e metodi per assistere il progettista nello svolgimento di analisi funzionali a partire da diversi tipi di dati in ingresso. In accordo con la definizione di architettura di prodotto data da Ulrich (Ulrich, K.T., "The Role of a Product Architecture in thè Manufacturing Firm" Research Policy, voi. 24, 1995), vale a dire il modo in cui il progettista mette in relazione elementi funzionali con le rispettive implementazioni fisiche, gran parte dell'attività di ricerca in questo campo è indirizzata alla mappatura di funzioni in componenti. La definizione di criteri generali per mappare la corrispondenza fra funzioni e feature di assemblaggio di un sistema CAD è evidentemente utile; questo obiettivo è stato perseguito anche da Line et al. (Line J.K. et al, "Calculation of Product Architecture Metrics Within a Solid Modeler", accepted for publication on Proceedings of thè Institution of Mechanical Engineers Part B - Journal of Engineering Manufacture, 2001) sia pure con una strategia del tutto diversa. In this context, inventors are developing tools, systems and methods to assist the designer in carrying out functional analyzes starting from different types of input data. In accordance with the definition of product architecture given by Ulrich (Ulrich, K.T., "The Role of a Product Architecture in the Manufacturing Firm" Research Policy, vol. 24, 1995), i.e. the way in which the designer puts in relationship functional elements with the respective physical implementations, much of the research activity in this field is addressed to the mapping of functions into components. The definition of general criteria to map the correspondence between assembly functions and features of a CAD system is obviously useful; this goal was also pursued by Line et al. (Line J.K. et al, "Calculation of Product Architecture Metrics Within a Solid Modeler", accepted for publication on Proceedings of the Institution of Mechanical Engineers Part B - Journal of Engineering Manufacture, 2001) albeit with a completely different strategy.
Al giorno d'oggi è possibile disporre di diverse tecniche e tecnologie per analizzare testi in formato elettronico e semplificare la lettura del relativo contenuto. In particolare per documenti scientifici e brevetti queste tecnologie hanno dimostrato la loro efficacia, tuttavia è necessario ancora molto lavoro per consentire un confronto veloce ed efficiente fra documenti simili, individuando gli elementi di novità nel documento o ordinando per livello di innovatività più documenti. Nowadays it is possible to have different techniques and technologies to analyze texts in electronic format and simplify the reading of its content. In particular for scientific documents and patents these technologies have proved their effectiveness, however much work is still required to allow a fast and efficient comparison between similar documents, identifying the novelty elements in the document or sorting more documents by level of innovation.
Nonostante le enormi energie dedicate alla concezione ed allo sviluppo di software per l'analisi automatica di documenti elettronici, l'estrazione e la rappresentazione di informazioni sono solitamente effettuate nel medesimo campo di applicazione delle tecniche e tecnologie già implementate: (1) le tecnologie per l'estrazione di concetti il più delle volte trascurano quanto già esistente, tralasciando il retroscena storico e le regole insite nel layout del documento originale o nello stato dell'arte della tecnologia; (2) le tecniche/tecnologie per la rappresentazione di concetti il più delle volte sono associate a metodi di visualizzazione più legati alla tecnologia di estrazione dei concetti che allo scopo stesso di rappresentare in un modo fruibile all'uomo i risultati dell'analisi svolta. Despite the enormous energies dedicated to the conception and development of software for the automatic analysis of electronic documents, the extraction and representation of information are usually carried out in the same field of application as the techniques and technologies already implemented: (1) technologies for the extraction of concepts most of the time neglect what already exists, leaving out the historical background and the rules inherent in the layout of the original document or in the state of the art of the technology; (2) the techniques / technologies for the representation of concepts are most often associated with visualization methods more related to the technology of extracting the concepts that for the very purpose of representing the results of the analysis carried out in a way that is usable to man.
In tale contesto è evidente che le analisi automatiche di testi conducono alla categorizzazione di concetti mediante tassonomia o tecniche simili "text-based" e che dati strutturati quali i linguaggi di programmazione o database possono essere rappresentati mediante le tecniche della teoria dei grafi; entrambe queste rappresentazioni sono naturali nel loro campo e mostrano gli effettivi vantaggi del passo evolutivo successivo in questo campo: testi ibridi e analisi basate su grafi di documenti elettronici con rappresentazione testuale e grafica dei loro contenuti. In this context it is evident that the automatic analyzes of texts lead to the categorization of concepts by taxonomy or similar "text-based" techniques and that structured data such as programming languages or databases can be represented by the techniques of graph theory; both of these representations are natural in their field and show the actual advantages of the next evolutionary step in this field: hybrid texts and graph-based analyzes of electronic documents with textual and graphical representation of their contents.
Un sistema software basato su computer ed un metodo in accordo con i principi della presente invenzione risolvono i problemi descritti nei paragrafi precedenti grazie alla capacità di compiere analisi e confronti automatici di brevetti e descrizioni tecniche di sistemi ingegneristici (quali report tecnici, manuali di uso e manutenzione, manuali di riparazione etc.), in modo da tradurre il testo dell'invenzione in un diagramma a blocchi la cui rappresentazione grafica è effettuata in accordo con i principali standard di mercato, vale a dire modelli funzionali, modelli IDEF, etc. A computer-based software system and a method in accordance with the principles of the present invention solve the problems described in the previous paragraphs thanks to the ability to perform automatic analysis and comparisons of patents and technical descriptions of engineering systems (such as technical reports, user manuals and maintenance, repair manuals etc.), in order to translate the text of the invention into a block diagram whose graphic representation is carried out in accordance with the main market standards, i.e. functional models, IDEF models, etc.
Infatti, il sistema proposto, in accordo ai principi della presente invenzione, è in grado di riconoscere i componenti del sistema descritto nel documento analizzato, anche se compaiono con denominazioni differenti. Inoltre, può essere identificata la gerarchia in termini di livello di dettaglio/astrazione dei componenti individuati, nonché può essere compiuta una classificazione in categorie quali "assembly", "part", "portion". Infine, il sistema è in grado di analizzare le interazioni funzionali fra i componenti e di identificare i prodotti secondari ed il prodotto principale del sistema analizzato. In fact, the proposed system, according to the principles of the present invention, is able to recognize the components of the system described in the analyzed document, even if they appear with different denominations. Furthermore, the hierarchy can be identified in terms of level of detail / abstraction of the identified components, as well as a classification into categories such as "assembly", "part", "portion". Finally, the system is able to analyze the functional interactions between the components and to identify the secondary products and the main product of the analyzed system.
I vantaggi appena descritti dell'invenzione ed altri ancora che verranno illustrati nel corso della descrizione, sono ottenuti mediante un metodo ed un sistema secondo le rivendicazioni 1 e 15 rispettivamente. Le implementazioni preferenziali e le variazioni non banali della presente invenzione sono rivendicate nelle rispettive rivendicazioni dipendenti. The advantages of the invention just described and others besides which will be illustrated in the course of the description, are obtained by means of a method and a system according to claims 1 and 15 respectively. The preferential implementations and non-trivial variations of the present invention are claimed in the respective dependent claims.
Tali elaborazioni sono compiute dai Moduli Analisi Testi che interagiscono fra loro e fanno uso del contenuto di un database personalizzabile di "stop words" e termini analoghi secondo quanto descritto di seguito. I risultati di questa analisi possono essere arricchiti facendo uso di un processore semantico, quale quello descritto in US-A-6,167,370, capace di analizzare un documento elettronico al fine di estrarre da ciascuna frase il Soggetto, l'Azione e 1'Oggetto. These processing are carried out by the Text Analysis Modules which interact with each other and make use of the content of a customizable database of "stop words" and similar terms as described below. The results of this analysis can be enriched by making use of a semantic processor, such as that described in US-A-6,167,370, capable of analyzing an electronic document in order to extract the Subject, the Action and the Object from each sentence.
I risultati dell'analisi del Modulo Analisi Testi possono essere forniti all'utente in diversi modi, in accordo con le funzionalità del Modulo di "Post Processing" della presente invenzione. The results of the analysis of the Text Analysis Module can be provided to the user in different ways, in accordance with the functionality of the "Post Processing" Module of the present invention.
(1) La prima modalità di output consiste nel fornire all'utente una rappresentazione grafica del sistema analizzato, che consente una rapida visione dei componenti del sistema, la loro classificazione gerarchica e le loro interazioni funzionali. (1) The first output mode consists in providing the user with a graphical representation of the analyzed system, which allows a quick view of the system components, their hierarchical classification and their functional interactions.
(2) Un confronto fra i risultati di analisi diverse può essere eseguito mediante un insieme di indicatori quantitativi capaci di valutare la rilevanza, la complessità ed il livello di innovazione (in accordo alla definizione di Altshuller) dei sistemi analizzati ed (opzionalmente) di seguire il loro percorso evolutivo. (2) A comparison between the results of different analyzes can be performed using a set of quantitative indicators capable of assessing the relevance, complexity and level of innovation (according to Altshuller's definition) of the systems analyzed and (optionally) to follow their evolutionary path.
(3) Le funzioni compiute da o eseguite su un componente in tutti i sistemi analizzati sono registrate in un database in modo tale da poter facilmente ritrovare tutti i possibili impieghi funzionali di tale componente. (3) The functions performed by or performed on a component in all the systems analyzed are recorded in a database in such a way as to be able to easily find all the possible functional uses of that component.
(4) I componenti capaci di compiere una data funzione, in base ai risultati delle analisi compiute, sono registrati in un database, in modo da disporre di uno strumento per la ricerca delle possibili soluzioni tecniche in grado di svolgere un compito prestabilito. (4) The components capable of performing a given function, on the basis of the results of the analyzes performed, are registered in a database, in order to have a tool for finding possible technical solutions capable of performing a predetermined task.
I database descritti in (3) ed in (4) della lista precedente possono essere facilmente integrati con sistemi CAD e strumenti di ausilio alla progettazione concettuale. The databases described in (3) and in (4) of the previous list can be easily integrated with CAD systems and tools to aid conceptual design.
La presente invenzione verrà meglio descritta mediante alcune implementazioni preferenziali, da considerare esempi non limitativi, con riferimento alle figure allegate in cui: - FIG. 1 è una rappresentazione schematica di un esempio di implementazione del sistema in accordo con i principi della presente invenzione; The present invention will be better described by means of some preferential implementations, to be considered non-limiting examples, with reference to the attached figures in which: - FIG. 1 is a schematic representation of an example of implementation of the system in accordance with the principles of the present invention;
- FIG. 2 è una rappresentazione schematica dei principali elementi dell'architettura del sistema in accordo con i principi della presente invenzione; - FIG. 2 is a schematic representation of the main elements of the system architecture in accordance with the principles of the present invention;
FIG. 3 è una rappresentazione schematica del Modulo Classificazione componenti del sistema in accordo con i principi della presente invenzione; FIG. 3 is a schematic representation of the Component Classification Module of the system in accordance with the principles of the present invention;
- FIG. 4 è una rappresentazione schematica del metodo di identificazione componenti del sistema in accordo con i principi della presente invenzione; - FIG. 4 is a schematic representation of the method for identifying the components of the system in accordance with the principles of the present invention;
- FIG. 5 è una rappresentazione schematica del metodo per classificare i componenti del sistema in accordo con i principi della presente invenzione; - FIG. 5 is a schematic representation of the method for classifying the components of the system in accordance with the principles of the present invention;
- FIG. 6 è un esempio di visualizzazione grafica delle informazioni estratte da un'invenzione analizzata; - FIG. 6 is an example of a graphic display of the information extracted from an analyzed invention;
- FIG. 7 è un esempio di lista di componenti con i relativi livelli di dettaglio DL ed i corrispondenti "supersystem" estratti dalla descrizione del sistema illustrato in Fig. 6; - FIG. 8 è un esempio della lista di prodotti secondari con il rispettivo valore di probabilità di prodotto principale MPPV, valutato secondo i due approcci descritti nnella descrizione dettagliata della presente invenzione, estratti dalla descrizione del sistema illustrato in Fig. 6; - FIG. 7 is an example of a list of components with the relative levels of detail DL and the corresponding "supersystems" extracted from the description of the system illustrated in Fig. 6; - FIG. 8 is an example of the list of secondary products with the respective probability value of main product MPPV, evaluated according to the two approaches described in the detailed description of the present invention, extracted from the description of the system illustrated in Fig. 6;
- FIG. 9 è un esempio della lista di interazioni funzionali fra i componenti identificati dell'invenzione mostrata in Fig. 6; - FIG. 9 is an example of the list of functional interactions between the identified components of the invention shown in Fig. 6;
FIG. 10 è un esempio dell'andamento del livello di dettaglio nel corso della descrizione dell'invenzione mostrata in Fig. 6 FIG. 10 is an example of the development of the level of detail during the description of the invention shown in Fig. 6
Un esempio di implementazione della presente invenzione come illustrato in Fig. 1, include: una CPU 11 che può comprendere un personal computer "generai purpose", un server di rete o un minicomputer, con periferiche di ingresso/uscita standard quali una tastiera 12, un mouse 13, uno scanner 14, un lettore CD 17 ed una stampante 15. Il sistema include inoltre porte di comunicazione standard verso reti LAN, WAN etc pubbliche e/o private. An example of implementation of the present invention as illustrated in Fig. 1, includes: a CPU 11 which may comprise a "general purpose" personal computer, a network server or a minicomputer, with standard input / output peripherals such as a keyboard 12, a mouse 13, a scanner 14, a CD reader 17 and a printer 15. The system also includes standard communication ports towards public and / or private LANs, WANs, etc.
L'utente può introdurre il testo da analizzare digitandolo direttamente da tastiera 12, o mediante altre periferiche di input (quali ad esempio lo scanner 14 con sistemi OCR, il microfono 18 e software di "speech recognition" etc.), o ancora selezionando documenti da memorie di massa locali, reti locali o dalla rete WWW. The user can enter the text to be analyzed by typing it directly from the keyboard 12, or through other input devices (such as the scanner 14 with OCR systems, the microphone 18 and "speech recognition" software etc.), or by selecting documents from local mass storage, local networks or the WWW network.
In accordo con lo schema di Fig. 2, un esempio di implementazione della presente invenzione è costituito da un Deposito Temporaneo 20, un Modulo Analisi Testi 30, un Database Personalizzabile di "Stop Words" e Termini Analoghi 40, Un Database delle Informazioni Estratte 50, un Modulo di Post-Processing 60. In accordance with the diagram of Fig. 2, an example of implementation of the present invention consists of a Temporary Deposit 20, a Text Analysis Module 30, a Customizable Database of "Stop Words" and Analogous Terms 40, a Database of Extracted Information 50 , a Post-Processing Module 60.
Il testo da analizzare, inserito dall'utente, è archiviato nel Deposito Temporaneo 20. Tale testo viene processato dal modulo Analisi Testi 30, facendo uso del Database Personalizzabile di "Stop Words" e Termini Analoghi 40 e (opzionalmente) di un processore semantico commerciale (esterno al sistema descritto nella presente invenzione), in accordo con la metodologia descritta nei paragrafi seguenti. The text to be analyzed, entered by the user, is stored in the Temporary Repository 20. This text is processed by the Text Analysis module 30, making use of the Customizable Database of "Stop Words" and Analogous Terms 40 and (optionally) of a commercial semantic processor (external to the system described in the present invention), in accordance with the methodology described in the following paragraphs.
I risultati dell'analisi del testo vengono poi registrati nel Database delle Informazioni estratte 50. The results of the text analysis are then recorded in the Extracted Information Database 50.
II Modulo di Post-Processing 60 fornisce all'utente le informazioni contenute nel database 50, organizzate secondo formati differenti, come descritto nei paragrafi seguenti, per un utilizzo rapido ed efficace dei risultati dell'analisi. L'output può essere inviato verso una periferica qualsiasi, verso una unità di salvataggio dati locale o verso una rete. The Post-Processing Module 60 provides the user with the information contained in the database 50, organized according to different formats, as described in the following paragraphs, for a quick and effective use of the analysis results. The output can be sent to any peripheral, to a local data storage unit or to a network.
Il Modulo di Identificazione componenti 31 consente di individuare tutti i componenti del sistema descritto nel testo esaminato (vale a dire nel caso di un brevetto i componenti dell'invenzione). The Component Identification Module 31 makes it possible to identify all the components of the system described in the examined text (ie in the case of a patent the components of the invention).
Questo compito può essere eseguito seguendo due tecniche differenti: ricerca per "keywords" e ricerca semantica (Fig. 4). This task can be performed following two different techniques: search by "keywords" and semantic search (Fig. 4).
La ricerca per keywords (Fig. 4, a sinistra), è basata sulla regola per la scrittura di brevetti (ad esempio il Titolo 37 dell' U.S. Code of Federai Regulations), secondo la quale ciascun componente del sistema deve essere numerato in modo tale che lo stesso numero di riferimento è adottato nel corso dell'intera descrizione ed in tutte le figure del brevetto. The search by keywords (Fig. 4, left), is based on the rule for writing patents (for example Title 37 of the U.S. Code of Federal Regulations), according to which each component of the system must be numbered in such a way that the same reference number is adopted throughout the entire description and in all the figures of the patent.
Viene adottata la seguente procedura: The following procedure is adopted:
1) ricerca dei caratteri numerici nel testo; 1) search for numeric characters in the text;
2) si analizzano gli intorni di parole precedenti e seguenti ciascun numero; la dimensione dell'intorno è personalizzabile dall'utente con valori distinti per il numero di parole che precedono e quelle che seguono i caratteri numerici; si assume un valore di default di cinque parole precedenti/seguenti il numero; ciascun intorno costituisce una riga della matrice dei candidati componenti; 2) the neighborhoods of words preceding and following each number are analyzed; the size of the neighborhood can be customized by the user with distinct values for the number of words that precede and those that follow the numeric characters; a default value of five words preceding / following the number is assumed; each neighborhood constitutes a row of the matrix of the component candidates;
3) filtraggio dei termini relativi a "non componenti": si cancellano le righe contenenti parole appartenenti all'insieme a) del Database di "Stop Words" e Termini Analoghi 40; 3) filtering of the terms relating to "non-components": the rows containing words belonging to the set a) of the Database of "Stop Words" and Analogous Terms 40 are deleted;
4) ricognizione dei sinonimi e dei termini analoghi fra tutte le righe contenenti lo stesso carattere numerico: la lista di sinonimi è contenuta nell'insieme b) del Database di "Stop Words" e Termini Analoghi 40; 4) recognition of synonyms and analogous terms among all lines containing the same numeric character: the list of synonyms is contained in the set b) of the Database of "Stop Words" and Analogous Terms 40;
5) identificazione dell'insieme intersezione delle parole appartenenti alle righe contenenti lo stesso carattere numerico; si assume tale insieme di parole come denominazione rappresentativa del componente identificato dal numero di riferimento presente nella stessa riga. Se la prima parola seguente il carattere numerico è "of", l'insieme intersezione viene valutato solo fra le parole alla sinistra del numero, mentre le parole alla sua destra sono utilizzate dal Modulo Classificazione Componenti 32. I passi 4) e 5) possono essere opportunamente invertiti senza che si abbiano variazione nei risultati. 5) identification of the intersection set of the words belonging to the lines containing the same numeric character; this set of words is assumed as the representative name of the component identified by the reference number present in the same row. If the first word following the numeric character is "of", the intersection set is evaluated only between the words to the left of the number, while the words to its right are used by the Component Classification Module 32. Steps 4) and 5) can be suitably reversed without any variation in the results.
La ricerca semantica (Fig. 4 a destra) è basata sull'assunzione che nella descrizione tecnica di un sistema, il soggetto e l'oggetto di una frase sono in molti casi componenti del sistema stesso, e cioè, in accordo con la teoria di Altshuller, una terna elementare TFA (Tool, il soggetto; Field, l'azione; Artifact, l'oggetto). Se il Field della terna TFA è un verbo non significativo (da un punto di vista funzionale), i Tool ed Artifact corrispondenti perdono il loro ruolo di candidati componenti del sistema. La procedura consiste in: The semantic search (Fig. 4 on the right) is based on the assumption that in the technical description of a system, the subject and the object of a sentence are in many cases components of the system itself, that is, in accordance with the theory of Altshuller, an elementary triplet TFA (Tool, the subject; Field, the action; Artifact, the object). If the Field of the TFA triad is an insignificant verb (from a functional point of view), the corresponding Tool and Artifact lose their role as candidate components of the system. The procedure consists of:
1) si processa con un processore semantico commerciale (ad esempio Cobrain™, Knowledgist™, Phrasys™, Semantic Explorer™, CREAX, Kiwilogic™ etc.) il testo da analizzare, estraendo così da ciascuna proposizione une terna TFA; 1) the text to be analyzed is processed with a commercial semantic processor (for example Cobrain ™, Knowledgist ™, Phrasys ™, Semantic Explorer ™, CREAX, Kiwilogic ™ etc.), thus extracting a TFA from each proposition;
2) filtraggio delle terne TFA (Tool-Field-Artifact) contenenti un Field appartenente all'insieme f) del Database di "Stop Words" e Termini Analoghi 40; 2) filtering of the TFA (Tool-Field-Artifact) triples containing a Field belonging to the set f) of the Database of "Stop Words" and Analogous Terms 40;
3) raccolta dei Tool e degli Artifact sopravvissuti alla precedente fase di filtraggio; 3) collection of tools and artifacts that survived the previous filtering phase;
4) (opzionale) aggiunta di un ulteriore insieme di candidati componenti facendo uso ti tecniche comunemente disponibili per l'identificazione dei termini rappresentativi del contenuto del testo (quali analisi statistiche, clusterizzatori, reti Bayesiane etc.); 4) (optional) addition of a further set of candidate components making use of commonly available techniques for the identification of terms representative of the text content (such as statistical analysis, clustering, Bayesian networks, etc.);
5) fra tutti i candidati componenti le ripetizioni vengono clusterizzate anche tenendo conto della lista di sinonimi dell'insieme b) del Database di "Stop Words" e Termini Analoghi 40. 5) among all the candidates making up the repetitions are clustered also taking into account the list of synonyms of the set b) of the Database of "Stop Words" and Analogous Terms 40.
L'attività di Identificazione dei Componenti può essere compiuta seguendo alternativamente o in parallelo la ricerca per keyword e la ricerca semantica. Combinando queste due tecniche è possibile anche identificare "supersystem": i Tool e gli Artifact che non appartengono all'insieme di componenti identificati da un numero di riferimento sono chiaramente componenti esterni al sistema. The Component Identification activity can be carried out by following alternatively or in parallel the search by keyword and the semantic search. By combining these two techniques it is also possible to identify "supersystems": the Tools and Artifacts that do not belong to the set of components identified by a reference number are clearly components external to the system.
Il prodotto del Modulo Identificazione Componenti è una lista di denominazioni, rappresentativi dei componenti concettuali del sistema esaminato; un numero di riferimento (lo stesso numero di riferimento utilizzato nel testo per la descrizione del sistema) è associato a ciascun nome di componente insieme alla lista di tutte le denominazioni alternative adottate nella descrizione del sistema per identificare tale componente (sinonimi, pronomi, aggettivi che possono essere stati filtrati dall'azione di intersezione al passo 5) della ricerca per keyword, se talvolta sono stati omessi). The product of the Component Identification Module is a list of denominations, representative of the conceptual components of the examined system; a reference number (the same reference number used in the text for the description of the system) is associated with each component name together with the list of all the alternative names adopted in the description of the system to identify that component (synonyms, pronouns, adjectives that they may have been filtered by the intersection action in step 5) of the keyword search, if they were sometimes omitted).
I risultati del Modulo Identificazione Componenti 31 sono registrati nel Database delle Informazioni Estratte 50. The results of the Component Identification Form 31 are recorded in the Extracted Information Database 50.
II Modulo Classificazione Componenti 32 ordina e classifica i componenti identificati dal Nodulo Identificazione Componenti 31 in base a tre criteri principali: livello di dettaglio/astrazione; prodotti secondari e prodotto principale dell'invenzione; ruolo nell'assemblaggio. Un esempio di implementazione del Modulo Classificazione Componenti 32 in accordo ai principi della presente invenzione è illustrato in Fig. 3: consiste di tre sub-moduli, rispettivamente il Sub-Modulo Identificazione Gerarchia 34, il Sub-Modulo Identificazione di Prodotto 35, il Sub-Modulo Analisi dell'Implementazione Meccanica 36. The Component Classification Module 32 sorts and classifies the components identified by the Component Identification Node 31 based on three main criteria: level of detail / abstraction; secondary products and main product of the invention; role in assembly. An example of implementation of the Component Classification Module 32 according to the principles of the present invention is illustrated in Fig. 3: it consists of three sub-modules, respectively the Hierarchy Identification Sub-Module 34, the Product Identification Sub-Module 35, the Sub-Module -Mechanical Implementation Analysis Module 36.
Una rappresentazione schematica del metodo per classificare i componenti del sistema in accordo ai principi della presente invenzione è mostrata in Fig. 5. A schematic representation of the method for classifying the components of the system according to the principles of the present invention is shown in Fig. 5.
La procedura consiste nei seguenti passi: The procedure consists of the following steps:
1) analisi delle locuzioni descrittive e delle espressioni di specificazione quali "...of...": ad esempio, come descritto nella Identificazione Componenti tramite keyword, talvolta la parola seguente il carattere numerico che rappresenta il numero di riferimento del componente è la preposizione "of", seguita da un altro componente (es. side N of thè piston M; arm N of thè support M etc.); in questi casi si assume che il componente precedente la preposizione "of" è un "subsystem" del componente che segue la medesima preposizione; in altre parole il livello di dettaglio del primo componente è almeno un gradino più spinto del livello di dettaglio del secondo; 1) analysis of descriptive phrases and specification expressions such as "... of ...": for example, as described in the Component Identification by keyword, sometimes the word following the numeric character representing the reference number of the component is the preposition "of", followed by another component (eg side N of the piston M; arm N of the support M etc.); in these cases it is assumed that the component preceding the preposition "of" is a "subsystem" of the component following the same preposition; in other words, the level of detail of the first component is at least one step higher than the level of detail of the second;
2) ricerca dei verbi descrittivi: la lista dei verbi descrittivi è contenuta nell'insieme d) del Database di "Stop Words" e Termini Analoghi 40. Un verbo descrittivo è un verbo del tipo "comprise", "to be made of", "to be constituted by" etc. Se un intorno di parole centrato sul verbo descrittivo (l'ampiezza dell'intorno è funzione del verbo, dato che in funzione del suo significato sono attesi uno o più soggetti ed uno o più oggetti) contiene componenti identificati dal Modulo Individuazione Componenti 31, si assume che i componenti che precedono il verbo descrittivo sono subsystem/supersystem dei componenti che lo seguono, in funzione del significato del verbo stesso: ad esempio, dalla frase "thè arm support comprises two guide rails, a screw drive and a carrier" si può evincere che "arm support" è un Supersystem rispetto a "guide rails", "screw drive" e "carrier", cioè è ad un livello di astrazione più elevato. 2) search for descriptive verbs: the list of descriptive verbs is contained in the set d) of the Database of "Stop Words" and Analogous Terms 40. A descriptive verb is a verb of the type "comprise", "to be made of", "to be constituted by" etc. If a neighborhood of words centered on the descriptive verb (the width of the neighborhood is a function of the verb, given that, depending on its meaning, one or more subjects and one or more objects are expected) contains components identified by the Component Identification Module 31, assumes that the components that precede the descriptive verb are subsystem / supersystem of the components that follow it, depending on the meaning of the verb itself: for example, from the phrase "the arm support comprises two guide rails, a screw drive and a carrier" one can infer that "arm support" is a Supersystem compared to "guide rails", "screw drive" and "carrier", ie it is at a higher level of abstraction.
Questa ricerca è compiuta tenendo conto anche delle denominazioni alternative di ciascun componente registrate dal Modulo Identificazione Componenti 31. This research is carried out also taking into account the alternative names of each component recorded by the Component Identification Form 31.
Come nel caso dell'Identificazione Componenti, le prestazioni della presente invenzione possono essere accresciute dall'impiego di un processore semantico, dato che può essere garantita una più affidabile identificazione dei componenti che effettivamente sono il soggetto o l'oggetto del verbo descrittivo: si consideri l'esempio precedente modificato come segue: "thè arm support comprises two guide rails, a screw drive arranged between thè opposite guide rails, and a carrier"; in questo caso l'inciso "arranged between thè opposite guide rails" non contiene alcun oggetto del verbo "comprise", ma contiene un componente identificato del sistema ("guide rails"). As in the case of Component Identification, the performances of the present invention can be increased by the use of a semantic processor, since a more reliable identification of the components that are actually the subject or object of the descriptive verb can be guaranteed: consider the previous example modified as follows: "the arm support comprises two guide rails, a screw drive arranged between the opposite guide rails, and a carrier"; in this case the phrase "arranged between the opposite guide rails" does not contain any object of the verb "comprise", but contains an identified component of the system ("guide rails").
3) Semplificazione della gerarchia: può accadere che la gerarchia di livelli di dettaglio definita in base ai due passi precedenti presenti dei salti gerarchici; ad esempio, "A è un supersystem di B", "B è un supersystem di C" e nel testo C è menzionato come subsystem di A; analizzando la lista completa di legami gerarchici fra i componenti del sistema, tutti i salti di questo tipo vengono eliminati. 3) Simplification of the hierarchy: it may happen that the hierarchy of levels of detail defined on the basis of the two previous steps present hierarchical jumps; for example, "A is a supersystem of B", "B is a supersystem of C" and in the text C is mentioned as a subsystem of A; by analyzing the complete list of hierarchical links between the components of the system, all jumps of this type are eliminated.
4) identificazione di gerarchie parallele: può accadere che uno o più componenti sono identificati come subsystem di due o più componenti al medesimo livello di dettaglio; per esempio: A è un supersystem per Al e A2; B è un supersystem per B1 e B2; A2 e B1 sono subsystem di C. Tali gerarchie parallele vengono opportunamente registrate dato che solitamente esse corrispondono alle diverse funzioni compiute da uno stesso componente. 4) identification of parallel hierarchies: it may happen that one or more components are identified as subsystems of two or more components at the same level of detail; for example: A is a supersystem for Al and A2; B is a supersystem for B1 and B2; A2 and B1 are subsystems of C. These parallel hierarchies are appropriately registered since they usually correspond to the different functions performed by the same component.
Un livello di dettaglio (DL) è assegnato a ciascun componente in modo tale che il Massimo livello di astrazione è rappresentato da DL=0 ed il DL di ciascun subsystem è un livello superiore del DL del corrispondente supersystem. A level of detail (DL) is assigned to each component in such a way that the Maximum level of abstraction is represented by DL = 0 and the DL of each subsystem is a higher level than the DL of the corresponding supersystem.
I risultati della prima fase di classificazione può essere ulteriormente elaborati per identificare il ruolo dei componenti all'interno dell'assemblaggio descritto nel testo: è possibile assegnare a ciascun componente un attributo "assembly", "part" o "portion" con il fine di consentire un più completo scambio di informazioni con sistemi CAD/PDI/CRM; queste informazioni possono essere trasferite mediante i più comuni formati di scambio dati, quali IGES, STEP, IDEF etc. 1) un attributo "portion" viene assegnato a tutti i componenti il cui nome contiene parole appartenenti all'insieme e) del Database di "Stop Words" e Termini Analoghi 40, quali "side of...", "upper part of..." etc. In un sistema CAD questi componenti corrispondono ad entità geometriche quali feature di modellazione, facce, spigoli vertici etc. The results of the first classification phase can be further processed to identify the role of the components within the assembly described in the text: it is possible to assign to each component an "assembly", "part" or "portion" attribute with the aim of allow a more complete exchange of information with CAD / PDI / CRM systems; this information can be transferred using the most common data exchange formats, such as IGES, STEP, IDEF etc. 1) a "portion" attribute is assigned to all the components whose name contains words belonging to the set e) of the Database of "Stop Words" and Analogous Terms 40, such as "side of ...", "upper part of. .. "etc. In a CAD system these components correspond to geometric entities such as modeling features, faces, vertex edges etc.
2) un attributo "assembly" viene assegnato a tutti i componenti che hanno almeno un subsystem che non è stato etichettato come "portino" al passo precedente; 2) an "assembly" attribute is assigned to all components that have at least one subsystem that has not been labeled as "leading" to the previous step;
3) un attributo "part" viene assegnato a tutti i componenti non etichettati nei due passi precedenti. 3) a "part" attribute is assigned to all components not labeled in the previous two steps.
Tale classificazione consente un legame diretto con l'albero delle Feature di un modello di Parte e/o con l'albero di assemblaggio di un modello di assieme in un sistema CAD, integrando quindi il modello concettuale di un sistema meccanico con la sua implementazione. This classification allows a direct link with the Feature tree of a Part model and / or with the assembly tree of an assembly model in a CAD system, thus integrating the conceptual model of a mechanical system with its implementation.
Una terza strada per classificare i componenti del sistema esaminato consiste nell'identificare quali di essi sono prodotti secondari del sistema stesso e fra questi il prodotto principale. Per questa classificazione sono necessari i risultati del Modulo di Analisi delle Interazioni, e quindi verrà descritta in seguito. A third way to classify the components of the examined system consists in identifying which of them are secondary products of the system itself and among these the main product. For this classification the results of the Interaction Analysis Module are required, and therefore will be described later.
I risultati del Modulo Classificazione Componenti 32 vengono registrati nel Database delle Informazioni Estratte 50. The results of the Component Classification Form 32 are recorded in the Extracted Information Database 50.
II Modulo di Analisi delle Interazioni 33 consente l'identificazione dei vincoli funzionali esistenti fra i componenti identificati del sistema esaminato. Anche in questo caso possono essere seguiti due diversi approcci (ricerca per keyword e semantica): The Interaction Analysis Module 33 allows the identification of the functional constraints existing between the identified components of the examined system. Also in this case two different approaches can be followed (keyword search and semantics):
1) ricerca delle sequenze di parole contenenti i nomi di due componenti del sistema separati da un verbo non appartenente alla lista f) del Database di "Stop Words" e Termini Analoghi 40; si assume che tale verbo sia il Field di una terna TFA; si assume che i componenti precedenti e seguenti il verbo siano il Tool e l'Artifact della terna TFA, in funzione del significato e della forma (attiva/passiva) del verbo stesso; 1) search for word sequences containing the names of two system components separated by a verb not belonging to the list f) of the "Stop Words" Database and Analogous Terms 40; this verb is assumed to be the Field of a TFA triplet; it is assumed that the components preceding and following the verb are the Tool and the Artifact of the TFA triad, according to the meaning and form (active / passive) of the verb itself;
2) ricerca delle sequenze di parole contenenti almeno un componente del sistema ed un verbo appartenente all'insieme c) del Database di "Stop Words" e Termini Analoghi 40 (verbi significativi dal punto di vista funzionale): si assume che tale verbo sia il Field della terna TFA, mentre il componente è considerato Tool o Artifact in funzione della sua posizione rispetto al verbo (precedente o seguente), e del significato e della forma (attiva o passiva) del verbo stesso. È evidente che la lista c) del Database di "Stop Words" e Termini Analoghi 40 deve contenere tutte le forme che i verbi appartenenti a tale lista possono assumere. 2) search for word sequences containing at least one component of the system and a verb belonging to the set c) of the Database of "Stop Words" and Analogous Terms 40 (verbs significant from the functional point of view): it is assumed that this verb is the Field of the TFA triad, while the component is considered Tool or Artifact according to its position with respect to the verb (previous or following), and the meaning and form (active or passive) of the verb itself. It is evident that the list c) of the Database of "Stop Words" and Analogous Terms 40 must contain all the forms that the verbs belonging to this list can take.
Un'implementazione alternativa della stessa funzione fa uso di un processore semantico: di ciascuna terna TFA, se sia il Tool, sia l'Artifact sono componenti del sistema ed il Field è un verbo non appartenente alla lista f) del Database di "Stop Words" e Termini Analoghi 40, allora si assume tale terna TFA come un blocco funzionale elementare del sistema; in caso contrario, se solo uno fra Tool e Artifact è un componente die sistema, ma il Field è un verbo appartenente all'insieme c) del Database di "Stop Words" e Termini Analoghi 40, si assume che il Tool/Artifact non identificato sia un Componente Esterno del sistema e la terna completa costituisce un blocco funzionale elementare del sistema. Infine può accadere che il Tool sia un componente del sistema, ma la coppia Field-Artifact sia essa stessa una funzione del sistema (ad esempio, provide-tension = tighten); se una coppia Field-Artifact fra quelle estratte dal processore semantico appartiene all'insieme g) del Database di "Stop Words" e Termini Analoghi 40, allora il soggetto viene considerato il Tool della terna e la coppia Field-Artifact è tradotta in un Field funzionale in accordo con la tabella associata all'insieme g) del Database di "Stop Words" e Termini Analoghi 40. La ricerca dell'Artifact di tale funzione può essere demandata all'utente o eseguita cercando il primo componente identificato che segue la preposizione tipicamente associata a tale coppia Field-Artifact (nella stessa tabella del Database di "Stop Words" e Termini Analoghi 40 sono citate la/le preposizioni più tipicamente associate alle coppie Field-Artifact). Per esempio, nella frase "thè upper end of thè piston contacts thè arm to provide tension on thè arm which..." il processore semantico identifica la terna "upper end - provide - tension" dalla quale sono estratti il Tool "upper end", il Field "tighten" e l'Artifact "arm" (come componente seguente la preposizione "on". An alternative implementation of the same function makes use of a semantic processor: of each TFA triad, if both the Tool and the Artifact are components of the system and the Field is a verb not belonging to the list f) of the "Stop Words Database "and Analogous Terms 40, then this triad TFA is assumed as an elementary functional block of the system; otherwise, if only one of the Tool and Artifact is a system component, but the Field is a verb belonging to the set c) of the Database of "Stop Words" and Analogous Terms 40, it is assumed that the Tool / Artifact is not identified both an External Component of the system and the complete triad constitutes an elementary functional block of the system. Finally, it may happen that the Tool is a component of the system, but the Field-Artifact pair is itself a function of the system (for example, provide-tension = tighten); if a Field-Artifact pair among those extracted from the semantic processor belongs to the set g) of the Database of "Stop Words" and Analogous Terms 40, then the subject is considered the Tool of the triad and the Field-Artifact pair is translated into a Field functional in accordance with the table associated with the set g) of the Database of "Stop Words" and Analogous Terms 40. The search for the Artifact of this function can be left to the user or performed by searching for the first identified component that typically follows the preposition associated with this Field-Artifact pair (the prepositions most typically associated with Field-Artifact pairs are cited in the same table of the Database of "Stop Words" and Analogous Terms 40). For example, in the sentence "the upper end of the piston contacts the arm to provide tension on the arm which ..." the semantic processor identifies the triad "upper end - provide - tension" from which the "upper end" Tool are extracted , the Field "tighten" and the Artifact "arm" (as a component following the preposition "on".
Alla fine della fase di Analisi delle Interazioni tutti i Tool/Artifact non identificati dal Modulo Identificazione Componenti 31 sono considerati Sistemi Esterni e possono essere usati per legare o combinare due o più invenzioni, sistemi tecnici e/o evidenziare le relazioni fra il sistema esaminato e gli altri sistemi appartenenti allo Stato dell'Arte del campo di applicazione. At the end of the Interaction Analysis phase all the Tool / Artifacts not identified by the Component Identification Module 31 are considered External Systems and can be used to link or combine two or more inventions, technical systems and / or highlight the relationships between the examined system and the other systems belonging to the State of the Art of the field of application.
Solitamente, se il testo da esaminare è un brevetto, l'Analisi delle Interazioni è eseguita sulla Descrizione Dettagliata dell'Invenzione e/o sul sommario e/o sulle rivendicazioni . Usually, if the text to be examined is a patent, the Interaction Analysis is performed on the Detailed Description of the Invention and / or on the summary and / or on the claims.
Al termine dell'analisi delle interazioni compiuta dal Modulo 33, tutte le terne TFA vengono registrate nel Database delle Informazioni Estratte 50, al pari della posizione nel testo esaminato della frase dalla quale tale terna è stata estratta: la posizione è valutata numerando in maniera sequenziale tutte le frasi del testo esaminato, distinguendo le frasi fra loro sulla base del carattere "." 0 del carattere ASCII di Ritorno Carrello. At the end of the analysis of the interactions carried out by Module 33, all the TFA triples are recorded in the Database of Extracted Information 50, as well as the position in the text examined of the sentence from which this triplet was extracted: the position is evaluated by numbering sequentially all the sentences of the examined text, distinguishing the sentences from each other on the basis of the character "." 0 of the ASCII Carriage Return character.
Combinando i risultati del Modulo Identificazione Componenti 31, del Sub-Modulo Identificazione della Gerarchia di dettaglio 34 e del Modulo di Analisi delle Interazioni Funzionali 33 è possibile identificare tutti i prodotti secondari e fra questi il prodotto principale del sistema analizzato. Nell'esempio di implementazione della presente invenzione, illustrato in Fig. 3, questo compito è svolto dal Sub-Modulo Identificazione dei Prodotti 35, in accordo con la seguente procedura: By combining the results of the Component Identification Module 31, the Detail Hierarchy Identification Sub-Module 34 and the Functional Interaction Analysis Module 33, it is possible to identify all the secondary products and among them the main product of the analyzed system. In the example of implementation of the present invention, illustrated in Fig. 3, this task is performed by the Product Identification Sub-Module 35, in accordance with the following procedure:
1) ogni Artifact è un prodotto del suo Tool attraverso l'azione del Field della terna TFA; pertanto, in prima analisi, si assume che ogni Artifact sia un prodotto secondario del sistema esaminato; 1) each Artifact is a product of its Tool through the action of the Field of the TFA triad; therefore, in the first analysis, it is assumed that each Artifact is a secondary product of the examined system;
2) un prodotto secondario perde questa proprietà (divenendo quindi un componente standard del sistema) nei casi seguenti: 2) a secondary product loses this property (thus becoming a standard component of the system) in the following cases:
a.nella gerarchia in termini di dettaglio/astrazione il candidato prodotto secondario ha almeno due livelli di astrazione superiori, vale a dire che il suo DL (Detail Level) è maggiore o uguale a 2; a. in the hierarchy in terms of detail / abstraction the candidate secondary product has at least two higher abstraction levels, i.e. its DL (Detail Level) is greater than or equal to 2;
b. il numero di interazioni funzionali tali che il prodotto secondario è un Tool è maggiore o uguale del numero di interazioni funzionali in cui è un Artifact; b. the number of functional interactions such that the secondary product is a Tool is greater than or equal to the number of functional interactions in which it is an Artifact;
3) di ciascun prodotto secondario si calcola il rapporto fra il numero di interazioni tali che esso è un Artifact ed il numero di interazioni in cui è un Tool; tale rapporto è detto Probabilità di Prodotto Principale (MPPV); 3) of each secondary product the ratio between the number of interactions such that it is an Artifact and the number of interactions in which it is a Tool is calculated; this ratio is called Principal Product Probability (MPPV);
4) in alternativa, se il testo esaminato è un brevetto, il fattore MPPV può essere calcolato come la somma dei seguenti valori di probabilità parziale: 4) alternatively, if the examined text is a patent, the MPPV factor can be calculated as the sum of the following partial probability values:
a. verifica se un prodotto secondario è menzionato come Artifact nelle prime due rivendicazioni del brevetto; esempio di valore di probabilità parziale: 50%; to. check if a secondary product is mentioned as an Artifact in the first two claims of the patent; example of partial probability value: 50%;
b. verifica se un prodotto secondario è menzionato come Artifact nel sommario del brevetto; esempio di valore di probabilità parziale: 30%; b. check if a secondary product is mentioned as an Artifact in the patent summary; example of partial probability value: 30%;
c. verifica se un prodotto secondario è menzionato come Artifact nel titolo del brevetto; esempio di valore di probabilità parziale: 15%; c. check if a secondary product is mentioned as an Artifact in the patent title; example of partial probability value: 15%;
d. calcolo delle ricorrenze dei prodotti secondari nell'intero testo del brevetto e normalizzazione di tali valori rispetto al massimo; questi valori normalizzati sono in percentuale il valore di probabilità parziale, che in ogni caso non deve però superare un valore predefinito (ad es. 5%); d. calculation of the occurrences of secondary products in the entire text of the patent and normalization of these values with respect to the maximum; these normalized values are the partial probability value as a percentage, which in any case must not exceed a predefined value (eg 5%);
e. verifica se un prodotto secondario è un Artifact di un Field presente come Field nelle prime due rivendicazioni del brevetto; esempio di valore di probabilità parziale: 30%; And. verifies whether a secondary product is an Artifact of a Field present as Field in the first two claims of the patent; example of partial probability value: 30%;
f.verifica se un prodotto secondario è un Artifact di un Field presente come Field nel sommario del brevetto; esempio di valore di probabilità parziale: 20%; f. check if a secondary product is an Artifact of a Field present as Field in the patent summary; example of partial probability value: 20%;
g.verifica se un prodotto secondario è un Artifact di un Field presente come Field nel titolo del brevetto; esempio di valore di probabilità parziale: 10%; g. check if a secondary product is an Artifact of a Field present as Field in the title of the patent; example of partial probability value: 10%;
h.calcolo delle ricorrenze dei Field che agiscono sui prodotti secondari (nel ruolo di Artifact) nell'intero testo del brevetto e normalizzazione di tali valori rispetto al massimo; questi valori normalizzati sono in percentuale il valore di probabilità parziale, che in ogni caso non deve però superare un valore predefinito (ad es. 10%); h. calculation of the occurrences of the Fields that act on secondary products (in the role of Artifact) in the entire text of the patent and normalization of these values with respect to the maximum; these normalized values are a percentage of the partial probability value, which in any case must not exceed a predefined value (eg 10%);
i.calcolo delle ricorrenze delle coppie Field-Artifact tali che 1'Artifact è un prodotto secondario nell'intero testo del brevetto e normalizzazione di tali valori rispetto al massimo; questi valori normalizzati sono in percentuale il valore di probabilità parziale, che in ogni caso non deve però superare un valore predefinito (ad es. 30%); i. calculation of the occurrences of the Field-Artifact pairs such that the Artifact is a secondary product in the entire text of the patent and normalization of these values with respect to the maximum; these normalized values are the partial probability value as a percentage, which in any case must not exceed a predefined value (eg 30%);
Il Modulo di Post Processing 60 fornisce il contenuto del Database delle Informazioni estratte 50 all'utente, organizzando tali dati in quattro forme differenti, in funzione dello scopo dell'analisi. Un esempio di implementazione del Modulo di post Processing 60, in accordo con i principi della presente invenzione, è costituito da quattro sub-moduli come mostrato in Fig. 2: Modulo di Mappatura Grafica del contenuto del Testo 61; Modulo di Confronto testi 62; Database degli Impieghi Funzionali dei componenti esaminati 63; Database dei componenti capaci di svolgere una funzione predefinita 64. The Post Processing Module 60 provides the contents of the Extracted Information Database 50 to the user, organizing such data in four different forms, according to the purpose of the analysis. An example of implementation of the Post Processing Module 60, in accordance with the principles of the present invention, consists of four sub-modules as shown in Fig. 2: Graphical Mapping Module of the Text content 61; Text Comparison Module 62; Functional Uses Database of the examined components 63; Database of components capable of performing a predefined function 64.
Il Modulo di Mappatura Grafica del contenuto del Testo 61 è uno strumento efficace per la comunicazione di tutte le informazioni estratte dal Modulo Analisi testi 30: i risultati dell'Identificazione Componenti, Identificazione della Gerarchia ed Analisi delle Interazioni Funzionali sono rappresentati in un diagramma, come in Fig. 6, con le seguenti convenzioni: The Text Content Graph Mapping Module 61 is an effective tool for communicating all the information extracted from the Text Analysis Module 30: the results of the Component Identification, Hierarchy Identification and Functional Interaction Analysis are represented in a diagram, such as in Fig. 6, with the following conventions:
1) ogni componente identificato del sistema è rappresentato da un rettangolo etichettato con il suo numero di riferimento e la denominazione rappresentativa definita dal Modulo Identificazione componenti 31; ciascun componente identificato esterno al sistema è rappresentato da un esagono etichettato mediante una stringa "EXT", un numero sequenziale e la denominazione rappresentativa definita dal Modulo Identificazione componenti 31; il prodotto principale è rappresentato da un'ellisse etichettata con gli stessi criteri appena descritti per i componenti interni /esterni al sistema; 1) each identified component of the system is represented by a rectangle labeled with its reference number and the representative name defined by the Component Identification Module 31; each component identified external to the system is represented by a hexagon labeled by means of an "EXT" string, a sequential number and the representative name defined by the Component Identification Module 31; the main product is represented by an ellipse labeled with the same criteria described above for the internal / external components of the system;
2) la gerarchia di livelli di dettaglio identificata dal Modulo di Classificazione 32, è rappresentata annidando i componenti a livello di dettaglio più spinto all'interno dei corrispondenti componenti a livello più astratto; 2) the hierarchy of levels of detail identified by the Classification Module 32 is represented by nesting the components at the highest level of detail within the corresponding components at the most abstract level;
3) le interazioni funzionali fra i componenti identificati del sistema sono rappresentate mediante frecce puntate dal Tool verso l'Artifact, etichettate mediante il Field, in accordo ai risultati del modulo Analisi delle Interazioni 33; 3) the functional interactions between the identified components of the system are represented by arrows pointed by the Tool towards the Artifact, labeled using the Field, according to the results of the Interaction Analysis module 33;
4) su richiesta, alcune tabelle riassuntive possono essere fornite all'utente: 4) upon request, some summary tables can be provided to the user:
a. lista dei componenti con il corrispondente livello di dettaglio DL ed il relativo supersystem (Fig. 7); to. list of components with the corresponding level of detail DL and the relative supersystem (Fig. 7);
b. lista dei prodotti secondari come coppie Field-Artifact, con il corrispondente Valore di Probabilità di prodotto Principale MPPV (Fig. 8); b. list of secondary products as Field-Artifact pairs, with the corresponding MPPV Principal Product Probability Value (Fig. 8);
c. lista dei valori di probabilità parziale valutati secondo la procedura dettagliata nella descrizione del Sub-Modulo di Identificazione Prodotti 35 (Fig. 8); d. lista delle interazioni funzionali fra i componenti identificati (Fig. 9); c. list of partial probability values evaluated according to the detailed procedure in the description of the Product Identification Sub-Module 35 (Fig. 8); d. list of functional interactions between the identified components (Fig. 9);
e. lista delle coppie Field-Artifact, tali che l'Artifact è il Prodotto Principale del sistema. And. list of Field-Artifact pairs, such that the Artifact is the Main Product of the system.
Il Modulo Confronto Testi 62 consente il confronto fra le descrizioni di due o più sistemi, in base ai seguenti parametri: The Text Comparison Module 62 allows the comparison between the descriptions of two or more systems, based on the following parameters:
1) confronto fra i "diametri delle invenzioni", vale a dire il numero di livelli di dettaglio identificati dal modulo di Classificazione componenti 32; 1) comparison between the "diameters of the inventions", ie the number of levels of detail identified by the Component Classification module 32;
2) confronto fra il numero di componenti interni al sistema esaminato, distinguendo anche il numero di componenti identificati a ciascun livello di astrazione; 2) comparison between the number of internal components of the examined system, also distinguishing the number of components identified at each level of abstraction;
3) (se è stata compiuta l'analisi mediante il Modulo Analisi dell'Implementazione Meccanica 36) confronto fra il numero di "assembly", "part" e "portion" del sistema esaminato; 4) confronto fra il numero di interazioni identificate dal Modulo di Analisi delle Interazioni 33; se due o più Field sono associate alla medesima coppia Tool/Artifact, viene effettuata una verifica per eliminare i Field sinonimi, in base alla lista i) del Database delle "Stop Words" e dei Termini Analoghi 40; 3) (if the analysis was carried out using the Mechanical Implementation Analysis Module 36) comparison between the number of "assembly", "part" and "portion" of the examined system; 4) comparison between the number of interactions identified by the Interaction Analysis Module 33; if two or more Fields are associated with the same Tool / Artifact pair, a check is carried out to eliminate the synonyms Fields, based on the list i) of the Database of "Stop Words" and Analogous Terms 40;
5) confronto fra il numero di interazioni (contate come al passo 4) che agiscono su componenti al medesimo livello di dettaglio; possibilità di evidenziare se tali componenti appartengono al medesimo supersystem oppure no; 5) comparison between the number of interactions (counted as in step 4) that act on components at the same level of detail; possibility of highlighting whether these components belong to the same supersystem or not;
6) confronto fra il numero di interazioni (contate come al passo 4) che agiscono su componenti a diverso livello di dettaglio; possibilità di evidenziare se tali componenti appartengono al medesimo supersystem oppure no; si registra anche la "distanza gerarchica" fra i componenti interagenti, bvale a dire la differenza fra i loro livelli di dettaglio DL; 6) comparison between the number of interactions (counted as in step 4) that act on components at different levels of detail; possibility of highlighting whether these components belong to the same supersystem or not; the "hierarchical distance" between the interacting components is also recorded, ie the difference between their levels of detail DL;
7) confronto fra il numero e le lunghezze dei rami presenti nel diagramma funzionale dei sistemi esaminati (come quello in Fig. 6) valutate a partire dal Prodotto Principale del sistema; 7) comparison between the number and the lengths of the branches present in the functional diagram of the systems examined (such as the one in Fig. 6) evaluated starting from the Main Product of the system;
8) confronto fra i componenti dello stesso rango: il rango di un componente è definito come la minima distanza, in termini di numero di interazioni funzionali, che legano il Prodotto Principale del Sistema al componente stesso; 8) comparison between the components of the same rank: the rank of a component is defined as the minimum distance, in terms of the number of functional interactions, which bind the Main Product of the System to the component itself;
9) analisi dell'andamento del livello di dettaglio nel corso della descrizione del sistema esaminato (Fig. 10): il Modulo di Analisi delle interazioni 33 registra la posizione nel testo di ciascuna delle interazioni funzionali TFA identificate; si assume che il livello di dettaglio del Tool e dell'Art ifact nella frase siano il livello di dettaglio della descrizione, pertanto è possibile analizzare l'andamento del livello di dettaglio nel testo e confrontare quello di testi differenti. L'analisi dei picchi del Livello di Dettaglio nel corso della descrizione di un sistema consente l'identificazione del "core' dell'invenzione, nonché delle peculiarità secondarie . 9) analysis of the trend of the level of detail during the description of the examined system (Fig. 10): the Interaction Analysis Module 33 records the position in the text of each of the TFA functional interactions identified; it is assumed that the level of detail of the Tool and the Art ifact in the sentence are the level of detail of the description, therefore it is possible to analyze the trend of the level of detail in the text and compare that of different texts. The analysis of the peaks of the Level of Detail during the description of a system allows the identification of the "core" of the invention, as well as of the secondary peculiarities.
Il Database degli Impieghi Funzionali dei componenti in sistemi differenti 63 registra tutte le interazioni funzionali associate a componenti omonimi in tutti i testi esaminati, archiviando il riferimento al documento sorgente ed il ruolo del componente nella terna TFA. The Database of the Functional Uses of the components in different systems 63 records all the functional interactions associated with homonymous components in all the examined texts, storing the reference to the source document and the role of the component in the TFA triad.
All'utente può essere fornito un confronto fra i diversi modi di impiego di un medesimo componente nei diversi sistemi esaminati. The user can be provided with a comparison between the different ways of using the same component in the different systems examined.
Il Database dei Componenti in grado di compiere una funzione data 64 registra: The Database of Components capable of performing a data 64 function records:
1) tutti i Tool associati a Field omonimi trovati in tutti i testi esaminati, registrando il riferimento al testo sorgente e la terna TFA completa; 1) all the Tools associated with homonymous Fields found in all the examined texts, recording the reference to the source text and the complete TFA triad;
2) tutti i Tool associati con coppie omonime Field-Artifact trovati in tutti i testi esaminati, registrando il riferimento al testo sorgente e la terna TFA completa; 2) all the Tools associated with homonymous Field-Artifact pairs found in all the examined texts, recording the reference to the source text and the complete TFA triad;
All'utente può essere fornito un confronto fra i modi in cui una medesima azione (Field) o una medesima funzione (Field-Artifact) sono compiute nei diversi sistemi esaminati. The user can be provided with a comparison between the ways in which the same action (Field) or the same function (Field-Artifact) are performed in the different systems examined.
Il Database delle "StopWords" e dei Termini Analoghi 40 è costituito da otto insiemi di parole, tutti personalizzabili dall'utente sia manualmente, sia attraverso una procedura di estrazione automatica di seguito descritta: The Database of "StopWords" and Analogous Terms 40 consists of eight sets of words, all of which can be customized by the user either manually or through an automatic extraction procedure described below:
1) l'utente fornisce al sistema un insieme di documenti tipici del campo di applicazione in cui è interessato; 2) si compie un'analisi semantica per mezzo di un processore semantico commerciale (ad esempio, Cobrain™, Knowledgist™, Phrasys™, Semantic Explorer™, CREAX, Kiwilogic™ etc.) e si registra una tabella di Tool e Artifact e della loro frequenza; 1) the user provides the system with a set of documents typical of the field of application in which he is interested; 2) a semantic analysis is performed by means of a commercial semantic processor (for example, Cobrain ™, Knowledgist ™, Phrasys ™, Semantic Explorer ™, CREAX, Kiwilogic ™ etc.) and a table of Tool and Artifact and of the their frequency;
3) a partire dal confronto della tabella definita al passo precedente ed il Database 40 completo, è possibile personalizzare le listi di filtri e sinonimi, creando così un sottoinsieme tipizzato del Database 40, etichettato con il campo di applicazione dei documenti processati al passo 1)· 3) starting from the comparison of the table defined in the previous step and the complete Database 40, it is possible to customize the lists of filters and synonyms, thus creating a typed subset of Database 40, labeled with the field of application of the documents processed in step 1) ·
Il Database 40 è costituito dai seguenti insiemi: Database 40 consists of the following sets:
a) lista delle "Stop Words" per le parole adiacenti ai caratteri numerici durante l'attività di Identificazione Componenti; questo insieme è tipicamente costituito dai riferimenti a figure, brevetti o altri documenti, unità di misura etc. a) list of "Stop Words" for words adjacent to numerical characters during the Component Identification activity; this set is typically made up of references to figures, patents or other documents, units of measurement etc.
b) tabella dei sinonimi dei candidati componenti, a differenti livelli di dettaglio (per esempio, portino, side, end; piston, plunger etc.); b) table of synonyms of the candidate components, at different levels of detail (for example, portino, side, end; piston, plunger etc.);
c) lista dei Field tipici delle funzionalità richieste in un dato campo di applicazione; c) list of fields typical of the functions required in a given field of application;
d) tabella dei verbi descrittivi quali "to comprise", "to be made of", "to be constituted by", etc. Tale lista deve tenere conto di tutte le forme che questi verbi possono assumere, anche dovute ad irregolarità della coniugazione; ad esempio, insieme all'infinito "to comprise" sono registrate le forme "comprise", "comprises", "comprised", "comprising" etc. d) table of descriptive verbs such as "to comprise", "to be made of", "to be constituted by", etc. This list must take into account all the forms that these verbs can take, also due to conjugation irregularities; for example, the forms "comprise", "comprises", "comprised", "comprising" etc. are recorded together with the infinitive "to comprise".
e) liste dei termini che descrivono una porzione di componente, quali "end", "side", "face", "part" etc. e) lists of terms that describe a portion of a component, such as "end", "side", "face", "part" etc.
f) lista dei verbi che non sono significativi da un punto di vista funzionale; f) list of verbs that are not significant from a functional point of view;
g) tabella delle coppie Field-Artifact, loro traduzione in un verbo funzionale ed una o più preposizioni tipicamente associate, impiegate per la ricerca automatica dell'Artifact; ad esempio, "provide tension", "tighten", "on"; g) table of Field-Artifact pairs, their translation into a functional verb and one or more typically associated prepositions, used for the automatic search of the Artifact; for example, "provide tension", "tighten", "on";
h) tabella dei sinonimi dei verbi funzionali che rappresentano un Field. h) table of synonyms of functional verbs representing a Field.
Il Database delle "Stop Words" e dei Termini Analoghi 40 consente la personalizzazione del sistema descritto nella presente invenzione, ma sono possibili anche altre personalizzazioni : The "Stop Words" and Analogous Terms Database 40 allows customization of the system described in the present invention, but other customizations are also possible:
1) le attività del Modulo Identificazione Componenti 31, Modulo Classificazione Componenti 32 e Modulo Analisi delle Interazioni 33 possono essere monitorate passo per passo dall'utente che può confrontare le informazioni estratte con la relativa frase sorgente, o possono essere eseguite in automatico sia pure con una affidabilità inferiore ; 1) the activities of the Component Identification Module 31, Component Classification Module 32 and Interaction Analysis Module 33 can be monitored step by step by the user who can compare the information extracted with the relative source sentence, or they can be performed automatically, albeit with lower reliability;
2) l'utente può specificare una lista di componenti (Tools/Artifacts) e/o funzioni (Fields) sui quali focalizzare l'analisi delle interazioni, in modo tale che venga estratto solo il relativo sotto-diagramma funzionale; 2) the user can specify a list of components (Tools / Artifacts) and / or functions (Fields) on which to focus the analysis of the interactions, so that only the relative functional sub-diagram is extracted;
3) la ricerca dei prodotti secondari e/o del prodotto principale dei sistemi esaminati può essere limitata ai componenti esterni al sistema. 3) the search for secondary products and / or the main product of the systems examined can be limited to components external to the system.
Ulteriori caratteristiche della presente invenzione sono date da: Further characteristics of the present invention are given by:
* il modulo di Post Processing 60, in cui il Modulo Contenuto del Testo 61 rappresenta: * the Post Processing module 60, in which the Text Content Module 61 represents:
a.ogni componente identificato del sistema con il suo numero di riferimento e la denominazione rappresentativa definite dal Modulo di Identificazione Componenti 31; a. each identified component of the system with its reference number and representative name defined by the Component Identification Form 31;
b. ogni componente identificato o elemento esterno al sistema; b. any identified component or element external to the system;
c. il prodotto principale; c. the main product;
d. la gerarchia dei livelli di dettaglio determinata dal Modulo di Classificazione 32; d. the hierarchy of levels of detail determined by the Classification Module 32;
e. le interazioni funzionali fra i componenti identificati in accordo ai risultati del Modulo di Analisi delle Interazioni 33; And. the functional interactions between the components identified according to the results of the Interaction Analysis Module 33;
* il modulo Contenuto Testi 61 che rappresenta: * the Text Content module 61 which represents:
- ogni componente identificato del sistema mediante un rettangolo etichettato con il suo numero di riferimento e la denominazione rappresentativa definita dal Modulo Identificazione Componenti 31; - each component identified in the system by means of a rectangle labeled with its reference number and the representative name defined by the Component Identification Form 31;
- ogni componente identificato o elemento esterno al sistema è rappresentato mediante un esagono etichettato con la stringa "EXT", un numero sequenziale e la denominazione rappresentativa definita dal Modulo Identificazione Componenti 31; - each identified component or element external to the system is represented by a hexagon labeled with the string "EXT", a sequential number and the representative name defined by the Component Identification Module 31;
- il prodotto principale mediante un'ellisse etichettata con gli stessi criteri illustrati sopra per i componenti interni/esterni; - the main product by means of an ellipse labeled with the same criteria illustrated above for the internal / external components;
- la gerarchia dei livelli di dettaglio determinata dal Modulo di Classificazione 32 rappresentata annidando i componenti ad un livello di dettaglio più spinto internamente ai componenti ad un livello di astrazione maggiore ; - the hierarchy of the levels of detail determined by the Classification Module 32 represented by nesting the components at a level of detail more pushed internally to the components at a higher level of abstraction;
- le interazioni funzionali fra i componenti identificati sono rappresentate mediante frecce che puntano dal Tool all'Artifact, etichettate con il Field, in accordo con i risultati del Modulo Analisi delle Interazioni 33; - the functional interactions between the identified components are represented by arrows pointing from the Tool to the Artifact, labeled with the Field, in accordance with the results of the Interaction Analysis Module 33;
* il modulo di Post Processing 60 in cui il Modulo Contenuto del Testo 61 rappresenta: * the Post Processing module 60 in which the Text Content Module 61 represents:
a. una lista di componenti con il loro livello di dettaglio DL ed il corrispondente supersystem; to. a list of components with their DL level of detail and the corresponding supersystem;
b. una lista di prodotti secondari nella forma di coppie Field-Artifact con il corrispondente valore di probabilità di prodotto principale MPPV; b. a list of secondary products in the form of Field-Artifact pairs with the corresponding MPPV main product probability value;
c. una lista di valori di probabilità parziali valutati in accordo alla procedura dettagliata nella descrizione del sub-modulo Identificazione di Prodotto 35; c. a list of partial probability values evaluated in accordance with the detailed procedure in the description of the Product Identification sub-module 35;
d. una lista di interazioni funzionali fra i componenti identificati; d. a list of functional interactions between the identified components;
* il modulo di Post Processing 60 in cui il Modulo Confronto Testi 62 consente il confronto fra due o più descrizioni di sistemi in accordo ai seguenti parametri: * the Post Processing module 60 in which the Text Comparison Module 62 allows the comparison between two or more system descriptions according to the following parameters:
a. confronto fra il "diametro" dei sistemi, definito come il numero di livelli di dettaglio identificti dal Modulo Classificazione Componenti 32; to. comparison between the "diameter" of the systems, defined as the number of levels of detail identified by the Component Classification Module 32;
b. confronto fra il numero di componenti interni dei sistemi esaminati, tenendo conto sia della lista completa dei componenti identificati, sia di quelli a ciascun livello di dettaglio; b. comparison between the number of internal components of the systems examined, taking into account both the complete list of identified components and those at each level of detail;
c. (se è stata compiuta l'analisi del sub-modulo Analisi dell'Implementazione Meccanica 36) confronto fra il numero di "assembly" "part" e "portion" del sistema esaminato; c. (if the analysis of the Mechanical Implementation Analysis sub-module 36 has been carried out) comparison between the number of "assemblies" "parts" and "portions" of the examined system;
d. confronto fra il numero di interazioni identificate dal modulo Analisi delle Interazioni 33; se due o più Field sono associati alla stessa coppia Tool-Artifact viene effettuata una verifica per eliminare Field sinonimi, tenendo conto dell'insieme i) del database di "stop Words" e Termini Analoghi 40; d. comparison between the number of interactions identified by the Interaction Analysis module 33; if two or more Fields are associated with the same Tool-Artifact pair, a check is carried out to eliminate synonyms Fields, taking into account the set i) of the database of "stop Words" and Analogous Terms 40;
e. confronto fra il numero di interazioni (contate come al passo d) agenti su componenti allo stesso livello di dettaglio; è possibile evidenziare se questi componenti sono interni o esterni al sistema; And. comparison between the number of interactions (counted as in step d) acting on components at the same level of detail; it is possible to highlight whether these components are internal or external to the system;
f. confronto fra il numero di interazioni (contate come al passo d) agenti su componenti a diversi livelli di dettaglio; può essere evidenziato se questi componenti sono l'uno un subsystem dell'altro o no; si può inoltre tenere conto della "distanza gerarchica" fra i componenti interagenti, cioè la differenza fra i loro livelli di dettaglio; f. comparison between the number of interactions (counted as in step d) acting on components at different levels of detail; it can be highlighted whether these components are one subsystem of the other or not; it is also possible to take into account the "hierarchical distance" between the interacting components, ie the difference between their levels of detail;
g. confronto fra il numero e la lunghezza dei rami presenti nel diagramma funzionale dei sistemi esaminati (come quello in Fig. 6) valutati a partire dal Prodotto Principale dei sistemi stessi; g. comparison between the number and length of the branches present in the functional diagram of the systems examined (such as the one in Fig. 6) evaluated starting from the Main Product of the systems themselves;
h. confronto dei componenti dello stesso rango: il rango di un componente è definito come la minima distanza in termini di numero di interazioni, che collega il Prodotto Principale del sistema con il componente stesso; h. comparison of components of the same rank: the rank of a component is defined as the minimum distance in terms of number of interactions, which connects the Main Product of the system with the component itself;
i.analisi dell'andamento del livello di dettaglio nel corso della descrizione del sistema esaminato: il Modulo Analisi delle Interazioni 33 registra la posizione nel testo di ciascuna interazione TFA; il livello di dettaglio del Tool e dell'Artifact in una frase è assunto come il livello di dettaglio della descrizione, quindi è possibile analizzare l'andamento del livello di dettaglio nel testo esaminato e confrontare tale andamento in testi differenti ; i. analysis of the trend of the level of detail during the description of the examined system: the Interaction Analysis Module 33 records the position in the text of each TFA interaction; the level of detail of the Tool and of the Artifact in a sentence is assumed as the level of detail of the description, therefore it is possible to analyze the trend of the level of detail in the examined text and compare this trend in different texts;
* il modulo di Post Processing 60 in cui l'analisi dei picchi dell'andamento del livello di dettaglio nel corso della descrizione del sistema consente l'identificazione del core e delle peculiarità secondarie del sistema stesso; * the Post Processing module 60 in which the analysis of the peaks of the trend of the level of detail during the description of the system allows the identification of the core and the secondary peculiarities of the system itself;
* il modulo di Post Processing 60 in cui il database degli usi Funzionali dei Componenti nei diversi sistemi 63 registra tutte le interazioni funzionali associate a componenti omonimi in tutti i testi esaminati, registrando il riferimento al testo sorgente ed il ruolo del componente nella terna TFA; * the Post Processing module 60 in which the database of the Functional uses of the Components in the different systems 63 records all the functional interactions associated with homonymous components in all the examined texts, recording the reference to the source text and the role of the component in the TFA triad;
* il modulo di Post Processing 60 in cui il database dei Componenti Capaci di Compiere una Funzione Data 64 registra: a. tutti i Tool associati a Field omonimi in tutti i testi esaminati, registrando il riferimento al testo sorgente e la terna completa; * the Post Processing module 60 in which the database of Components Capable of Performing a Data 64 Function records: a. all the tools associated with homonymous Fields in all the texts examined, recording the reference to the source text and the complete triad;
b. tutti i Tool associati alle coppie omonime Field-Artifact trovati nei testi esaminati, registrando il riferimento al testo sorgente e la terna completa; b. all the Tools associated with the homonymous Field-Artifact pairs found in the examined texts, recording the reference to the source text and the complete triad;
* il database di "Stop Words" e Termini Analoghi 40 che è costituito da otto insiemi di parole, tutti personalizzabili dall'utente attraverso la seguente procedura di estrazione automatica: * the database of "Stop Words" and Analogous Terms 40 which consists of eight sets of words, all customizable by the user through the following automatic extraction procedure:
a) l'utente fornisce al sistema un insieme di documenti tipici del campo di applicazione del quale è interessato; a) the user provides the system with a set of documents typical of the field of application he is interested in;
b)viene compiuta un'analisi semantica per mezzo di un processore semantico disponibile in commercio (ad esempio, Cobrain™, Knowledgist™, Phrasys™, Semantic Explorer™, Kiwilogic™ etc.) e viene registrata una tabella di Tool e Artifact ed il numero di occorrenze; b) a semantic analysis is performed by means of a commercially available semantic processor (for example, Cobrain ™, Knowledgist ™, Phrasys ™, Semantic Explorer ™, Kiwilogic ™ etc.) and a table of Tool and Artifact is recorded and the number of occurrences;
c) confrontando la tabella definita al passo precedente ed il database 40 completo è possibile personalizzare automaticamente le liste di filtri e sinonimi, creando quindi sottoinsieme tipizzati del database 40, etichettati con il campo di applicazione dei documenti processati al passo 1); c) comparing the table defined in the previous step and the complete database 40 it is possible to automatically customize the lists of filters and synonyms, thus creating typed sub-sets of the database 40, labeled with the field of application of the documents processed in step 1);
* il database di "Stop Words" e Termini Analoghi 40 che è costituito dai seguenti insiemi: * the database of "Stop Words" and Analogous Terms 40 which is made up of the following sets:
a) lista di stop keywords per parole adiacenti ai caratteri numerici durante 1'attività di Identificazione Componenti; questo insieme è tipicamente costituito da riferimenti a figure, brevetti o altri documenti, unità di misura etc. b) tabella dei sinonimi dei candidati componenti, a diverso livello di dettaglio (ad esempio, portion, side, end; piston, plunger etc.); a) list of stop keywords for words adjacent to numerical characters during the Component Identification activity; this set is typically made up of references to figures, patents or other documents, units of measurement etc. b) table of synonyms of the candidate candidates, at different levels of detail (for example, portion, side, end; piston, plunger etc.);
c) lista dei Field tipici delle funzionalità richieste in un dato campo di applicazione; c) list of fields typical of the functions required in a given field of application;
d) tabella dei verbi descrittivi quali "to comprise", "to be made of", "to be constituted by", etc., tenendo conto in tale lista di tutte le forme che questi verbi possono assumere, anche a causa di irregolarità della coniugazione; d) table of descriptive verbs such as "to comprise", "to be made of", "to be constituted by", etc., taking into account in this list all the forms that these verbs can take, also due to irregularities of the conjugation;
e) lista dei termini descriventi una porzione di componente, quali "end", "side", "face", "part" etc. f) lista dei verbi non significativi da un punto di vista funzionale; e) list of terms describing a portion of a component, such as "end", "side", "face", "part" etc. f) list of verbs that are not significant from a functional point of view;
g) tabella delle coppie Field-Artifact, delle loro traduzioni in un verbo funzionale ed una o più preposizioni tipicamente associate a tale locuzione usate per la ricerca automatica dell'Artifact; h)tabella dei sinonimi dei verbi funzionali rappresentanti un Field; g) table of Field-Artifact pairs, of their translations into a functional verb and one or more prepositions typically associated with this term used for the automatic search of the Artifact; h) table of synonyms of functional verbs representing a Field;
* il sistema in cui è consentita la personalizzazione dei seguenti sistemi: * the system in which customization of the following systems is allowed:
a. l'attività del Modulo Identificazione Componenti 31, Modulo Classificazione Componenti 32 e Modulo Analisi delle Interazioni 33 può essere seguita passo passo dall'utente, che può confrontare l'informazione estratta con la corrispondente frase sorgente, o può essere svolta automaticamente sebbene con minore affidabilità; b. l'utente può specificare una lista di componenti (Tool, Artifact) e/o funzioni (Field) su cui focalizzare l'analisi delle interazioni funzionali, in modo tale da estrarre i corrispondenti sotto-diagrammi funzionali; c. la ricerca dei prodotti secondari e del prodotto principale dei sistemi esaminati può essere limitata ai componenti esterni al sistema. to. the activity of the Component Identification Module 31, Component Classification Module 32 and Interaction Analysis Module 33 can be followed step by step by the user, who can compare the extracted information with the corresponding source sentence, or it can be carried out automatically although with less reliability ; b. the user can specify a list of components (Tool, Artifact) and / or functions (Field) on which to focus the analysis of functional interactions, in order to extract the corresponding functional sub-diagrams; c. the search for secondary products and the main product of the systems examined can be limited to components external to the system.
Claims (12)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT000303A ITTO20120303A1 (en) | 2012-04-05 | 2012-04-05 | METHOD AND SYSTEM FOR CARRYING OUT ANALYSIS AND AUTOMATIC COMPARISON OF PATENTS AND TECHNICAL DESCRIPTIONS. |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT000303A ITTO20120303A1 (en) | 2012-04-05 | 2012-04-05 | METHOD AND SYSTEM FOR CARRYING OUT ANALYSIS AND AUTOMATIC COMPARISON OF PATENTS AND TECHNICAL DESCRIPTIONS. |
Publications (1)
Publication Number | Publication Date |
---|---|
ITTO20120303A1 true ITTO20120303A1 (en) | 2012-07-05 |
Family
ID=46051807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
IT000303A ITTO20120303A1 (en) | 2012-04-05 | 2012-04-05 | METHOD AND SYSTEM FOR CARRYING OUT ANALYSIS AND AUTOMATIC COMPARISON OF PATENTS AND TECHNICAL DESCRIPTIONS. |
Country Status (1)
Country | Link |
---|---|
IT (1) | ITTO20120303A1 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774833A (en) * | 1995-12-08 | 1998-06-30 | Motorola, Inc. | Method for syntactic and semantic analysis of patent text and drawings |
US6167370A (en) * | 1998-09-09 | 2000-12-26 | Invention Machine Corporation | Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures |
WO2001001289A1 (en) * | 1999-06-30 | 2001-01-04 | Invention Machine Corporation, Inc. | Semantic processor and method with knowledge analysis of and extraction from natural language documents |
EP1351156A1 (en) * | 2002-03-14 | 2003-10-08 | Universita' Degli Studi di Firenze | System and method for automatically performing functional analyses of technical texts |
-
2012
- 2012-04-05 IT IT000303A patent/ITTO20120303A1/en unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774833A (en) * | 1995-12-08 | 1998-06-30 | Motorola, Inc. | Method for syntactic and semantic analysis of patent text and drawings |
US6167370A (en) * | 1998-09-09 | 2000-12-26 | Invention Machine Corporation | Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures |
WO2001001289A1 (en) * | 1999-06-30 | 2001-01-04 | Invention Machine Corporation, Inc. | Semantic processor and method with knowledge analysis of and extraction from natural language documents |
EP1351156A1 (en) * | 2002-03-14 | 2003-10-08 | Universita' Degli Studi di Firenze | System and method for automatically performing functional analyses of technical texts |
Non-Patent Citations (1)
Title |
---|
"Field Programmable Logic and Application", vol. 3163, 1 January 2004, SPRINGER BERLIN HEIDELBERG, Berlin, Heidelberg, ISBN: 978-3-54-045234-8, ISSN: 0302-9743, article GAETANO CASCINI ET AL: "Natural Language Processing of Patents and Technical Documentation", pages: 508 - 520, XP055054320, DOI: 10.1007/978-3-540-28640-0_48 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2657173C2 (en) | Sentiment analysis at the level of aspects using methods of machine learning | |
Ristoski et al. | Rdf2vec: Rdf graph embeddings for data mining | |
Falleri et al. | Fine-grained and accurate source code differencing | |
US10691891B2 (en) | Information extraction from natural language texts | |
Gangemi | A comparison of knowledge extraction tools for the semantic web | |
US20180267958A1 (en) | Information extraction from logical document parts using ontology-based micro-models | |
US20160147736A1 (en) | Creating ontologies by analyzing natural language texts | |
US20170161255A1 (en) | Extracting entities from natural language texts | |
de Araujo et al. | Ontology-based information extraction for juridical events with case studies in Brazilian legal realm | |
Amrouch et al. | Survey on the literature of ontology mapping, alignment and merging | |
Flisar et al. | Identification of self-admitted technical debt using enhanced feature selection based on word embedding | |
US20190179897A1 (en) | Information object extraction using combination of classifiers | |
CN107103363A (en) | A kind of construction method of the software fault expert system based on LDA | |
CN105824801A (en) | Entity relationship rapid extraction method based on automaton | |
Eke et al. | The significance of global vectors representation in sarcasm analysis | |
Sun | A natural language interface for querying graph databases | |
Sartini et al. | Marriage is a peach and a chalice: Modelling cultural symbolism on the semantic web | |
EP1351156A1 (en) | System and method for automatically performing functional analyses of technical texts | |
Kozmina et al. | Information requirements for big data projects: A review of state-of-the-art approaches | |
Dorodnykh et al. | Conceptual model engineering for industrial safety inspection based on spreadsheet data analysis | |
Adrian et al. | iDocument: using ontologies for extracting and annotating information from unstructured text | |
Pinquié et al. | Requirement mining for model-based product design | |
Buey et al. | Automatic legal document analysis: Improving the results of information extraction processes using an ontology | |
CN111831624A (en) | Data table creating method and device, computer equipment and storage medium | |
Jabeen et al. | Divided we stand out! forging cohorts for numeric outlier detection in large scale knowledge graphs (conod) |