ITTO20120303A1 - METHOD AND SYSTEM FOR CARRYING OUT ANALYSIS AND AUTOMATIC COMPARISON OF PATENTS AND TECHNICAL DESCRIPTIONS. - Google Patents

METHOD AND SYSTEM FOR CARRYING OUT ANALYSIS AND AUTOMATIC COMPARISON OF PATENTS AND TECHNICAL DESCRIPTIONS. Download PDF

Info

Publication number
ITTO20120303A1
ITTO20120303A1 IT000303A ITTO20120303A ITTO20120303A1 IT TO20120303 A1 ITTO20120303 A1 IT TO20120303A1 IT 000303 A IT000303 A IT 000303A IT TO20120303 A ITTO20120303 A IT TO20120303A IT TO20120303 A1 ITTO20120303 A1 IT TO20120303A1
Authority
IT
Italy
Prior art keywords
components
artifact
component
field
functional
Prior art date
Application number
IT000303A
Other languages
Italian (it)
Inventor
Gaetano Cascini
Original Assignee
Wolf S R L Dr
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wolf S R L Dr filed Critical Wolf S R L Dr
Priority to IT000303A priority Critical patent/ITTO20120303A1/en
Publication of ITTO20120303A1 publication Critical patent/ITTO20120303A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Description

Descrizione dell'Invenzione Industriale avente per titolo: "METODO E SISTEMA PER EFFETTUARE ANALISI E CONFRONTI AUTOMATICI DI BREVETTI E DESCRIZIONI TECNICHE" Description of the Industrial Invention entitled: "METHOD AND SYSTEM FOR PERFORMING ANALYSIS AND AUTOMATIC COMPARISON OF PATENTS AND TECHNICAL DESCRIPTIONS"

DESCRIZIONE DESCRIPTION

La presente invenzione riguarda un metodo ed un sistema per effettuare analisi e confronti automatici di brevetti e descrizioni tecniche. The present invention relates to a method and a system for carrying out automatic analyzes and comparisons of patents and technical descriptions.

Il numero di tecnologie commercialmente disponibili in campo tecnico, ma anche nel campo dei beni di consumo, è in crescita. Nonostante la progressiva specializzazione delle tecnologie, diverse risorse sono dedicate anche alla diffusione di soluzioni tecniche al di fuori del loro campo di applicazione originario, che trovano così un maggior numero di applicazioni pratiche in nuovi prodotti e processi. The number of technologies commercially available in the technical field, but also in the field of consumer goods, is growing. Despite the progressive specialization of technologies, various resources are also dedicated to the diffusion of technical solutions outside their original field of application, which thus find a greater number of practical applications in new products and processes.

L'opportunità di ottenere vantaggi sia economici, sia strategici, per mezzo di brevetti è spesso ritardata, se non addirittura non sfruttata, per via delle difficoltà legate al numero di brevetti esistenti da analizzare ed al linguaggio formale usato per descrivere l'invenzione. The opportunity to obtain both economic and strategic advantages by means of patents is often delayed, if not actually exploited, due to the difficulties linked to the number of existing patents to be analyzed and to the formal language used to describe the invention.

Ogni giorno pensatori inventori e società disperdono energie e tempo cercando di valutare il livello di innovazione, la brevettabilità di un'invenzione e l'originalità del contenuto. Every day thinkers, inventors and companies waste energy and time trying to evaluate the level of innovation, the patentability of an invention and the originality of the content.

Ad esempio, è noto che per circa cinquanta anni sono state proposte teorie, ora ben collaudate (TRIZ by Altshuller G., "Creativity as an Exact Science: The Theory of thè Solution of Inventive Problems", Gordon & Breach Science pub., 1984) per confrontare e valutare il livello inventivo di invenzioni diverse. Queste teorie, per essere applicate, richiedono il diretto intervento dell'uomo ed una considerevole parte di questo lavoro è dedicata ad applicazioni del cervello umano meno intense quali leggere e costruirsi un'immagine mentale delle relazioni esistenti fra i componenti dell'invenzione esaminata, piuttosto che comprendere i concetti espressi e l'ontologia dell' invenzione . For example, it is known that for about fifty years now well-tested theories have been proposed (TRIZ by Altshuller G., "Creativity as an Exact Science: The Theory of the Solution of Inventive Problems", Gordon & Breach Science pub., 1984 ) to compare and evaluate the inventive level of different inventions. These theories, to be applied, require the direct intervention of man and a considerable part of this work is dedicated to less intense applications of the human brain such as reading and building a mental image of the relationships existing between the components of the invention examined, rather than to understand the concepts expressed and the ontology of the invention.

Esistono diversi pacchetti software che rappresentano contenuti tecnici /tecnologici in base alla loro rappresentazione funzionale, un subset ingegneristico della matematica teoria dei grafi. Strumenti dedicati si sono dimostrati realmente efficaci per velocizzare la comprensione di concetti, ma nonostante questi aiuti, grandi quantità di tempo sono necessarie per definire una rappresentazione funzionale di un'invenzione. There are several software packages that represent technical / technological contents based on their functional representation, an engineering subset of mathematical graph theory. Dedicated tools have proven to be really effective in speeding up the understanding of concepts, but despite these aids, large amounts of time are required to define a functional representation of an invention.

L'analisi funzionale è uno strumento potente per progettisti che non si vogliono limitare all'introduzione di piccole ottimizzazioni di un sistema meccanico, ma piuttosto si propongono di introdurre innovazioni significative al fine di realizzare prodotti realmente nuovi. La descrizione funzionale di un prodotto è una descrizione a livello astratto, tale che diverse soluzioni progettuali possono essere esplorate in fase di progettazione concettuale, sviluppando le varianti funzionali. Functional analysis is a powerful tool for designers who do not want to limit themselves to introducing small optimizations of a mechanical system, but rather intend to introduce significant innovations in order to create truly new products. The functional description of a product is a description at an abstract level, such that different design solutions can be explored in the conceptual design phase, developing functional variants.

Inoltre, l'analisi funzionale può rivestire un ruolo importante al fine dell'aggiramento brevettuale: un'attenta analisi funzionale di un brevetto consente l'individuazione di eventuali definizioni ambigue tali da rendere possibile il superamento dei vincoli brevettali con modifiche di piccola entità. Viceversa, nello scrivere un brevetto, un'analisi funzionale del testo costituisce una efficace verifica della qualità del lavoro compiuto. Furthermore, functional analysis can play an important role in patent circumvention: a careful functional analysis of a patent allows the identification of any ambiguous definitions such as to make it possible to overcome the patent constraints with minor modifications. Conversely, when writing a patent, a functional analysis of the text constitutes an effective verification of the quality of the work done.

La modellazione funzionale è spesso impiegata anche a livello di progettazione di dettaglio: seguendo l'approccio del Suh (Suh N.P., "The Principles of Design", Oxford Press, 1990), la funzione è assunta come l'obiettivo ed il progetto è scomposto in requisiti funzionali che sono messi direttamente in relazione con i parametri di progetto a qualsiasi livello di astrazione. Dato che i prodotti sono definiti e dovrebbero essere progettati in base alla funzione che devono svolgere, svariati autori hanno classificato le funzioni tipiche della progettazione meccanica, con il fine di associare "subsystem" (assiemi di parti fisiche o componenti) e sub-funzioni in modo tale da fornire al progettista un insieme di unità modulari con le quali sviluppare il prodotto finale. Un'esaustiva descrizione di questi lavori è data da Kirschman (Kirschman C.F. et al, "Classifying Functions for Mechanical Design", Journal of Mechanical Design (ASME), Voi. 120, September 1998). Functional modeling is also often used at the level of detailed design: following the approach of the Suh (Suh N.P., "The Principles of Design", Oxford Press, 1990), the function is assumed as the goal and the project is broken down in functional requirements that are directly related to the design parameters at any level of abstraction. Since the products are defined and should be designed according to the function they must perform, various authors have classified the typical functions of mechanical design, with the aim of associating "subsystems" (assemblies of physical parts or components) and sub-functions in in such a way as to provide the designer with a set of modular units with which to develop the final product. An exhaustive description of these works is given by Kirschman (Kirschman C.F. et al, "Classifying Functions for Mechanical Design", Journal of Mechanical Design (ASME), Vol. 120, September 1998).

Diversi lavori sono stati pubblicati per proporre rappresentazioni efficaci delle funzioni per descrivere i diversi aspetti dell'intento del progettista, compito questo cruciale per lo sviluppo di sistemi di ausilio alla progettazione concettuale; lo scopo di questi lavori è la definizione di metodi efficaci anche per la rappresentazione delle relazioni esistenti fra le funzioni, quali le relazioni "scomposto-in", "condizionato-da", "accresciuto-da", "descritto-come" (Shimomura et al., "Representation of Design Object Based on thè Functional Evolution Process Mode", Journal of Mechanical Design (ASME), Voi. 120, June 1998). Several papers have been published to propose effective representations of the functions to describe the different aspects of the designer's intent, a crucial task for the development of aids to conceptual design; the purpose of these works is the definition of effective methods also for the representation of the relations existing between functions, such as the relations "decomposed-in", "conditioned-by", "increased-by", "described-as" (Shimomura et al., "Representation of Design Object Based on the Functional Evolution Process Mode", Journal of Mechanical Design (ASME), Vol. 120, June 1998).

In questo contesto gli inventori stanno sviluppando strumenti, sistemi e metodi per assistere il progettista nello svolgimento di analisi funzionali a partire da diversi tipi di dati in ingresso. In accordo con la definizione di architettura di prodotto data da Ulrich (Ulrich, K.T., "The Role of a Product Architecture in thè Manufacturing Firm" Research Policy, voi. 24, 1995), vale a dire il modo in cui il progettista mette in relazione elementi funzionali con le rispettive implementazioni fisiche, gran parte dell'attività di ricerca in questo campo è indirizzata alla mappatura di funzioni in componenti. La definizione di criteri generali per mappare la corrispondenza fra funzioni e feature di assemblaggio di un sistema CAD è evidentemente utile; questo obiettivo è stato perseguito anche da Line et al. (Line J.K. et al, "Calculation of Product Architecture Metrics Within a Solid Modeler", accepted for publication on Proceedings of thè Institution of Mechanical Engineers Part B - Journal of Engineering Manufacture, 2001) sia pure con una strategia del tutto diversa. In this context, inventors are developing tools, systems and methods to assist the designer in carrying out functional analyzes starting from different types of input data. In accordance with the definition of product architecture given by Ulrich (Ulrich, K.T., "The Role of a Product Architecture in the Manufacturing Firm" Research Policy, vol. 24, 1995), i.e. the way in which the designer puts in relationship functional elements with the respective physical implementations, much of the research activity in this field is addressed to the mapping of functions into components. The definition of general criteria to map the correspondence between assembly functions and features of a CAD system is obviously useful; this goal was also pursued by Line et al. (Line J.K. et al, "Calculation of Product Architecture Metrics Within a Solid Modeler", accepted for publication on Proceedings of the Institution of Mechanical Engineers Part B - Journal of Engineering Manufacture, 2001) albeit with a completely different strategy.

Al giorno d'oggi è possibile disporre di diverse tecniche e tecnologie per analizzare testi in formato elettronico e semplificare la lettura del relativo contenuto. In particolare per documenti scientifici e brevetti queste tecnologie hanno dimostrato la loro efficacia, tuttavia è necessario ancora molto lavoro per consentire un confronto veloce ed efficiente fra documenti simili, individuando gli elementi di novità nel documento o ordinando per livello di innovatività più documenti. Nowadays it is possible to have different techniques and technologies to analyze texts in electronic format and simplify the reading of its content. In particular for scientific documents and patents these technologies have proved their effectiveness, however much work is still required to allow a fast and efficient comparison between similar documents, identifying the novelty elements in the document or sorting more documents by level of innovation.

Nonostante le enormi energie dedicate alla concezione ed allo sviluppo di software per l'analisi automatica di documenti elettronici, l'estrazione e la rappresentazione di informazioni sono solitamente effettuate nel medesimo campo di applicazione delle tecniche e tecnologie già implementate: (1) le tecnologie per l'estrazione di concetti il più delle volte trascurano quanto già esistente, tralasciando il retroscena storico e le regole insite nel layout del documento originale o nello stato dell'arte della tecnologia; (2) le tecniche/tecnologie per la rappresentazione di concetti il più delle volte sono associate a metodi di visualizzazione più legati alla tecnologia di estrazione dei concetti che allo scopo stesso di rappresentare in un modo fruibile all'uomo i risultati dell'analisi svolta. Despite the enormous energies dedicated to the conception and development of software for the automatic analysis of electronic documents, the extraction and representation of information are usually carried out in the same field of application as the techniques and technologies already implemented: (1) technologies for the extraction of concepts most of the time neglect what already exists, leaving out the historical background and the rules inherent in the layout of the original document or in the state of the art of the technology; (2) the techniques / technologies for the representation of concepts are most often associated with visualization methods more related to the technology of extracting the concepts that for the very purpose of representing the results of the analysis carried out in a way that is usable to man.

In tale contesto è evidente che le analisi automatiche di testi conducono alla categorizzazione di concetti mediante tassonomia o tecniche simili "text-based" e che dati strutturati quali i linguaggi di programmazione o database possono essere rappresentati mediante le tecniche della teoria dei grafi; entrambe queste rappresentazioni sono naturali nel loro campo e mostrano gli effettivi vantaggi del passo evolutivo successivo in questo campo: testi ibridi e analisi basate su grafi di documenti elettronici con rappresentazione testuale e grafica dei loro contenuti. In this context it is evident that the automatic analyzes of texts lead to the categorization of concepts by taxonomy or similar "text-based" techniques and that structured data such as programming languages or databases can be represented by the techniques of graph theory; both of these representations are natural in their field and show the actual advantages of the next evolutionary step in this field: hybrid texts and graph-based analyzes of electronic documents with textual and graphical representation of their contents.

Un sistema software basato su computer ed un metodo in accordo con i principi della presente invenzione risolvono i problemi descritti nei paragrafi precedenti grazie alla capacità di compiere analisi e confronti automatici di brevetti e descrizioni tecniche di sistemi ingegneristici (quali report tecnici, manuali di uso e manutenzione, manuali di riparazione etc.), in modo da tradurre il testo dell'invenzione in un diagramma a blocchi la cui rappresentazione grafica è effettuata in accordo con i principali standard di mercato, vale a dire modelli funzionali, modelli IDEF, etc. A computer-based software system and a method in accordance with the principles of the present invention solve the problems described in the previous paragraphs thanks to the ability to perform automatic analysis and comparisons of patents and technical descriptions of engineering systems (such as technical reports, user manuals and maintenance, repair manuals etc.), in order to translate the text of the invention into a block diagram whose graphic representation is carried out in accordance with the main market standards, i.e. functional models, IDEF models, etc.

Infatti, il sistema proposto, in accordo ai principi della presente invenzione, è in grado di riconoscere i componenti del sistema descritto nel documento analizzato, anche se compaiono con denominazioni differenti. Inoltre, può essere identificata la gerarchia in termini di livello di dettaglio/astrazione dei componenti individuati, nonché può essere compiuta una classificazione in categorie quali "assembly", "part", "portion". Infine, il sistema è in grado di analizzare le interazioni funzionali fra i componenti e di identificare i prodotti secondari ed il prodotto principale del sistema analizzato. In fact, the proposed system, according to the principles of the present invention, is able to recognize the components of the system described in the analyzed document, even if they appear with different denominations. Furthermore, the hierarchy can be identified in terms of level of detail / abstraction of the identified components, as well as a classification into categories such as "assembly", "part", "portion". Finally, the system is able to analyze the functional interactions between the components and to identify the secondary products and the main product of the analyzed system.

I vantaggi appena descritti dell'invenzione ed altri ancora che verranno illustrati nel corso della descrizione, sono ottenuti mediante un metodo ed un sistema secondo le rivendicazioni 1 e 15 rispettivamente. Le implementazioni preferenziali e le variazioni non banali della presente invenzione sono rivendicate nelle rispettive rivendicazioni dipendenti. The advantages of the invention just described and others besides which will be illustrated in the course of the description, are obtained by means of a method and a system according to claims 1 and 15 respectively. The preferential implementations and non-trivial variations of the present invention are claimed in the respective dependent claims.

Tali elaborazioni sono compiute dai Moduli Analisi Testi che interagiscono fra loro e fanno uso del contenuto di un database personalizzabile di "stop words" e termini analoghi secondo quanto descritto di seguito. I risultati di questa analisi possono essere arricchiti facendo uso di un processore semantico, quale quello descritto in US-A-6,167,370, capace di analizzare un documento elettronico al fine di estrarre da ciascuna frase il Soggetto, l'Azione e 1'Oggetto. These processing are carried out by the Text Analysis Modules which interact with each other and make use of the content of a customizable database of "stop words" and similar terms as described below. The results of this analysis can be enriched by making use of a semantic processor, such as that described in US-A-6,167,370, capable of analyzing an electronic document in order to extract the Subject, the Action and the Object from each sentence.

I risultati dell'analisi del Modulo Analisi Testi possono essere forniti all'utente in diversi modi, in accordo con le funzionalità del Modulo di "Post Processing" della presente invenzione. The results of the analysis of the Text Analysis Module can be provided to the user in different ways, in accordance with the functionality of the "Post Processing" Module of the present invention.

(1) La prima modalità di output consiste nel fornire all'utente una rappresentazione grafica del sistema analizzato, che consente una rapida visione dei componenti del sistema, la loro classificazione gerarchica e le loro interazioni funzionali. (1) The first output mode consists in providing the user with a graphical representation of the analyzed system, which allows a quick view of the system components, their hierarchical classification and their functional interactions.

(2) Un confronto fra i risultati di analisi diverse può essere eseguito mediante un insieme di indicatori quantitativi capaci di valutare la rilevanza, la complessità ed il livello di innovazione (in accordo alla definizione di Altshuller) dei sistemi analizzati ed (opzionalmente) di seguire il loro percorso evolutivo. (2) A comparison between the results of different analyzes can be performed using a set of quantitative indicators capable of assessing the relevance, complexity and level of innovation (according to Altshuller's definition) of the systems analyzed and (optionally) to follow their evolutionary path.

(3) Le funzioni compiute da o eseguite su un componente in tutti i sistemi analizzati sono registrate in un database in modo tale da poter facilmente ritrovare tutti i possibili impieghi funzionali di tale componente. (3) The functions performed by or performed on a component in all the systems analyzed are recorded in a database in such a way as to be able to easily find all the possible functional uses of that component.

(4) I componenti capaci di compiere una data funzione, in base ai risultati delle analisi compiute, sono registrati in un database, in modo da disporre di uno strumento per la ricerca delle possibili soluzioni tecniche in grado di svolgere un compito prestabilito. (4) The components capable of performing a given function, on the basis of the results of the analyzes performed, are registered in a database, in order to have a tool for finding possible technical solutions capable of performing a predetermined task.

I database descritti in (3) ed in (4) della lista precedente possono essere facilmente integrati con sistemi CAD e strumenti di ausilio alla progettazione concettuale. The databases described in (3) and in (4) of the previous list can be easily integrated with CAD systems and tools to aid conceptual design.

La presente invenzione verrà meglio descritta mediante alcune implementazioni preferenziali, da considerare esempi non limitativi, con riferimento alle figure allegate in cui: - FIG. 1 è una rappresentazione schematica di un esempio di implementazione del sistema in accordo con i principi della presente invenzione; The present invention will be better described by means of some preferential implementations, to be considered non-limiting examples, with reference to the attached figures in which: - FIG. 1 is a schematic representation of an example of implementation of the system in accordance with the principles of the present invention;

- FIG. 2 è una rappresentazione schematica dei principali elementi dell'architettura del sistema in accordo con i principi della presente invenzione; - FIG. 2 is a schematic representation of the main elements of the system architecture in accordance with the principles of the present invention;

FIG. 3 è una rappresentazione schematica del Modulo Classificazione componenti del sistema in accordo con i principi della presente invenzione; FIG. 3 is a schematic representation of the Component Classification Module of the system in accordance with the principles of the present invention;

- FIG. 4 è una rappresentazione schematica del metodo di identificazione componenti del sistema in accordo con i principi della presente invenzione; - FIG. 4 is a schematic representation of the method for identifying the components of the system in accordance with the principles of the present invention;

- FIG. 5 è una rappresentazione schematica del metodo per classificare i componenti del sistema in accordo con i principi della presente invenzione; - FIG. 5 is a schematic representation of the method for classifying the components of the system in accordance with the principles of the present invention;

- FIG. 6 è un esempio di visualizzazione grafica delle informazioni estratte da un'invenzione analizzata; - FIG. 6 is an example of a graphic display of the information extracted from an analyzed invention;

- FIG. 7 è un esempio di lista di componenti con i relativi livelli di dettaglio DL ed i corrispondenti "supersystem" estratti dalla descrizione del sistema illustrato in Fig. 6; - FIG. 8 è un esempio della lista di prodotti secondari con il rispettivo valore di probabilità di prodotto principale MPPV, valutato secondo i due approcci descritti nnella descrizione dettagliata della presente invenzione, estratti dalla descrizione del sistema illustrato in Fig. 6; - FIG. 7 is an example of a list of components with the relative levels of detail DL and the corresponding "supersystems" extracted from the description of the system illustrated in Fig. 6; - FIG. 8 is an example of the list of secondary products with the respective probability value of main product MPPV, evaluated according to the two approaches described in the detailed description of the present invention, extracted from the description of the system illustrated in Fig. 6;

- FIG. 9 è un esempio della lista di interazioni funzionali fra i componenti identificati dell'invenzione mostrata in Fig. 6; - FIG. 9 is an example of the list of functional interactions between the identified components of the invention shown in Fig. 6;

FIG. 10 è un esempio dell'andamento del livello di dettaglio nel corso della descrizione dell'invenzione mostrata in Fig. 6 FIG. 10 is an example of the development of the level of detail during the description of the invention shown in Fig. 6

Un esempio di implementazione della presente invenzione come illustrato in Fig. 1, include: una CPU 11 che può comprendere un personal computer "generai purpose", un server di rete o un minicomputer, con periferiche di ingresso/uscita standard quali una tastiera 12, un mouse 13, uno scanner 14, un lettore CD 17 ed una stampante 15. Il sistema include inoltre porte di comunicazione standard verso reti LAN, WAN etc pubbliche e/o private. An example of implementation of the present invention as illustrated in Fig. 1, includes: a CPU 11 which may comprise a "general purpose" personal computer, a network server or a minicomputer, with standard input / output peripherals such as a keyboard 12, a mouse 13, a scanner 14, a CD reader 17 and a printer 15. The system also includes standard communication ports towards public and / or private LANs, WANs, etc.

L'utente può introdurre il testo da analizzare digitandolo direttamente da tastiera 12, o mediante altre periferiche di input (quali ad esempio lo scanner 14 con sistemi OCR, il microfono 18 e software di "speech recognition" etc.), o ancora selezionando documenti da memorie di massa locali, reti locali o dalla rete WWW. The user can enter the text to be analyzed by typing it directly from the keyboard 12, or through other input devices (such as the scanner 14 with OCR systems, the microphone 18 and "speech recognition" software etc.), or by selecting documents from local mass storage, local networks or the WWW network.

In accordo con lo schema di Fig. 2, un esempio di implementazione della presente invenzione è costituito da un Deposito Temporaneo 20, un Modulo Analisi Testi 30, un Database Personalizzabile di "Stop Words" e Termini Analoghi 40, Un Database delle Informazioni Estratte 50, un Modulo di Post-Processing 60. In accordance with the diagram of Fig. 2, an example of implementation of the present invention consists of a Temporary Deposit 20, a Text Analysis Module 30, a Customizable Database of "Stop Words" and Analogous Terms 40, a Database of Extracted Information 50 , a Post-Processing Module 60.

Il testo da analizzare, inserito dall'utente, è archiviato nel Deposito Temporaneo 20. Tale testo viene processato dal modulo Analisi Testi 30, facendo uso del Database Personalizzabile di "Stop Words" e Termini Analoghi 40 e (opzionalmente) di un processore semantico commerciale (esterno al sistema descritto nella presente invenzione), in accordo con la metodologia descritta nei paragrafi seguenti. The text to be analyzed, entered by the user, is stored in the Temporary Repository 20. This text is processed by the Text Analysis module 30, making use of the Customizable Database of "Stop Words" and Analogous Terms 40 and (optionally) of a commercial semantic processor (external to the system described in the present invention), in accordance with the methodology described in the following paragraphs.

I risultati dell'analisi del testo vengono poi registrati nel Database delle Informazioni estratte 50. The results of the text analysis are then recorded in the Extracted Information Database 50.

II Modulo di Post-Processing 60 fornisce all'utente le informazioni contenute nel database 50, organizzate secondo formati differenti, come descritto nei paragrafi seguenti, per un utilizzo rapido ed efficace dei risultati dell'analisi. L'output può essere inviato verso una periferica qualsiasi, verso una unità di salvataggio dati locale o verso una rete. The Post-Processing Module 60 provides the user with the information contained in the database 50, organized according to different formats, as described in the following paragraphs, for a quick and effective use of the analysis results. The output can be sent to any peripheral, to a local data storage unit or to a network.

Il Modulo di Identificazione componenti 31 consente di individuare tutti i componenti del sistema descritto nel testo esaminato (vale a dire nel caso di un brevetto i componenti dell'invenzione). The Component Identification Module 31 makes it possible to identify all the components of the system described in the examined text (ie in the case of a patent the components of the invention).

Questo compito può essere eseguito seguendo due tecniche differenti: ricerca per "keywords" e ricerca semantica (Fig. 4). This task can be performed following two different techniques: search by "keywords" and semantic search (Fig. 4).

La ricerca per keywords (Fig. 4, a sinistra), è basata sulla regola per la scrittura di brevetti (ad esempio il Titolo 37 dell' U.S. Code of Federai Regulations), secondo la quale ciascun componente del sistema deve essere numerato in modo tale che lo stesso numero di riferimento è adottato nel corso dell'intera descrizione ed in tutte le figure del brevetto. The search by keywords (Fig. 4, left), is based on the rule for writing patents (for example Title 37 of the U.S. Code of Federal Regulations), according to which each component of the system must be numbered in such a way that the same reference number is adopted throughout the entire description and in all the figures of the patent.

Viene adottata la seguente procedura: The following procedure is adopted:

1) ricerca dei caratteri numerici nel testo; 1) search for numeric characters in the text;

2) si analizzano gli intorni di parole precedenti e seguenti ciascun numero; la dimensione dell'intorno è personalizzabile dall'utente con valori distinti per il numero di parole che precedono e quelle che seguono i caratteri numerici; si assume un valore di default di cinque parole precedenti/seguenti il numero; ciascun intorno costituisce una riga della matrice dei candidati componenti; 2) the neighborhoods of words preceding and following each number are analyzed; the size of the neighborhood can be customized by the user with distinct values for the number of words that precede and those that follow the numeric characters; a default value of five words preceding / following the number is assumed; each neighborhood constitutes a row of the matrix of the component candidates;

3) filtraggio dei termini relativi a "non componenti": si cancellano le righe contenenti parole appartenenti all'insieme a) del Database di "Stop Words" e Termini Analoghi 40; 3) filtering of the terms relating to "non-components": the rows containing words belonging to the set a) of the Database of "Stop Words" and Analogous Terms 40 are deleted;

4) ricognizione dei sinonimi e dei termini analoghi fra tutte le righe contenenti lo stesso carattere numerico: la lista di sinonimi è contenuta nell'insieme b) del Database di "Stop Words" e Termini Analoghi 40; 4) recognition of synonyms and analogous terms among all lines containing the same numeric character: the list of synonyms is contained in the set b) of the Database of "Stop Words" and Analogous Terms 40;

5) identificazione dell'insieme intersezione delle parole appartenenti alle righe contenenti lo stesso carattere numerico; si assume tale insieme di parole come denominazione rappresentativa del componente identificato dal numero di riferimento presente nella stessa riga. Se la prima parola seguente il carattere numerico è "of", l'insieme intersezione viene valutato solo fra le parole alla sinistra del numero, mentre le parole alla sua destra sono utilizzate dal Modulo Classificazione Componenti 32. I passi 4) e 5) possono essere opportunamente invertiti senza che si abbiano variazione nei risultati. 5) identification of the intersection set of the words belonging to the lines containing the same numeric character; this set of words is assumed as the representative name of the component identified by the reference number present in the same row. If the first word following the numeric character is "of", the intersection set is evaluated only between the words to the left of the number, while the words to its right are used by the Component Classification Module 32. Steps 4) and 5) can be suitably reversed without any variation in the results.

La ricerca semantica (Fig. 4 a destra) è basata sull'assunzione che nella descrizione tecnica di un sistema, il soggetto e l'oggetto di una frase sono in molti casi componenti del sistema stesso, e cioè, in accordo con la teoria di Altshuller, una terna elementare TFA (Tool, il soggetto; Field, l'azione; Artifact, l'oggetto). Se il Field della terna TFA è un verbo non significativo (da un punto di vista funzionale), i Tool ed Artifact corrispondenti perdono il loro ruolo di candidati componenti del sistema. La procedura consiste in: The semantic search (Fig. 4 on the right) is based on the assumption that in the technical description of a system, the subject and the object of a sentence are in many cases components of the system itself, that is, in accordance with the theory of Altshuller, an elementary triplet TFA (Tool, the subject; Field, the action; Artifact, the object). If the Field of the TFA triad is an insignificant verb (from a functional point of view), the corresponding Tool and Artifact lose their role as candidate components of the system. The procedure consists of:

1) si processa con un processore semantico commerciale (ad esempio Cobrain™, Knowledgist™, Phrasys™, Semantic Explorer™, CREAX, Kiwilogic™ etc.) il testo da analizzare, estraendo così da ciascuna proposizione une terna TFA; 1) the text to be analyzed is processed with a commercial semantic processor (for example Cobrain ™, Knowledgist ™, Phrasys ™, Semantic Explorer ™, CREAX, Kiwilogic ™ etc.), thus extracting a TFA from each proposition;

2) filtraggio delle terne TFA (Tool-Field-Artifact) contenenti un Field appartenente all'insieme f) del Database di "Stop Words" e Termini Analoghi 40; 2) filtering of the TFA (Tool-Field-Artifact) triples containing a Field belonging to the set f) of the Database of "Stop Words" and Analogous Terms 40;

3) raccolta dei Tool e degli Artifact sopravvissuti alla precedente fase di filtraggio; 3) collection of tools and artifacts that survived the previous filtering phase;

4) (opzionale) aggiunta di un ulteriore insieme di candidati componenti facendo uso ti tecniche comunemente disponibili per l'identificazione dei termini rappresentativi del contenuto del testo (quali analisi statistiche, clusterizzatori, reti Bayesiane etc.); 4) (optional) addition of a further set of candidate components making use of commonly available techniques for the identification of terms representative of the text content (such as statistical analysis, clustering, Bayesian networks, etc.);

5) fra tutti i candidati componenti le ripetizioni vengono clusterizzate anche tenendo conto della lista di sinonimi dell'insieme b) del Database di "Stop Words" e Termini Analoghi 40. 5) among all the candidates making up the repetitions are clustered also taking into account the list of synonyms of the set b) of the Database of "Stop Words" and Analogous Terms 40.

L'attività di Identificazione dei Componenti può essere compiuta seguendo alternativamente o in parallelo la ricerca per keyword e la ricerca semantica. Combinando queste due tecniche è possibile anche identificare "supersystem": i Tool e gli Artifact che non appartengono all'insieme di componenti identificati da un numero di riferimento sono chiaramente componenti esterni al sistema. The Component Identification activity can be carried out by following alternatively or in parallel the search by keyword and the semantic search. By combining these two techniques it is also possible to identify "supersystems": the Tools and Artifacts that do not belong to the set of components identified by a reference number are clearly components external to the system.

Il prodotto del Modulo Identificazione Componenti è una lista di denominazioni, rappresentativi dei componenti concettuali del sistema esaminato; un numero di riferimento (lo stesso numero di riferimento utilizzato nel testo per la descrizione del sistema) è associato a ciascun nome di componente insieme alla lista di tutte le denominazioni alternative adottate nella descrizione del sistema per identificare tale componente (sinonimi, pronomi, aggettivi che possono essere stati filtrati dall'azione di intersezione al passo 5) della ricerca per keyword, se talvolta sono stati omessi). The product of the Component Identification Module is a list of denominations, representative of the conceptual components of the examined system; a reference number (the same reference number used in the text for the description of the system) is associated with each component name together with the list of all the alternative names adopted in the description of the system to identify that component (synonyms, pronouns, adjectives that they may have been filtered by the intersection action in step 5) of the keyword search, if they were sometimes omitted).

I risultati del Modulo Identificazione Componenti 31 sono registrati nel Database delle Informazioni Estratte 50. The results of the Component Identification Form 31 are recorded in the Extracted Information Database 50.

II Modulo Classificazione Componenti 32 ordina e classifica i componenti identificati dal Nodulo Identificazione Componenti 31 in base a tre criteri principali: livello di dettaglio/astrazione; prodotti secondari e prodotto principale dell'invenzione; ruolo nell'assemblaggio. Un esempio di implementazione del Modulo Classificazione Componenti 32 in accordo ai principi della presente invenzione è illustrato in Fig. 3: consiste di tre sub-moduli, rispettivamente il Sub-Modulo Identificazione Gerarchia 34, il Sub-Modulo Identificazione di Prodotto 35, il Sub-Modulo Analisi dell'Implementazione Meccanica 36. The Component Classification Module 32 sorts and classifies the components identified by the Component Identification Node 31 based on three main criteria: level of detail / abstraction; secondary products and main product of the invention; role in assembly. An example of implementation of the Component Classification Module 32 according to the principles of the present invention is illustrated in Fig. 3: it consists of three sub-modules, respectively the Hierarchy Identification Sub-Module 34, the Product Identification Sub-Module 35, the Sub-Module -Mechanical Implementation Analysis Module 36.

Una rappresentazione schematica del metodo per classificare i componenti del sistema in accordo ai principi della presente invenzione è mostrata in Fig. 5. A schematic representation of the method for classifying the components of the system according to the principles of the present invention is shown in Fig. 5.

La procedura consiste nei seguenti passi: The procedure consists of the following steps:

1) analisi delle locuzioni descrittive e delle espressioni di specificazione quali "...of...": ad esempio, come descritto nella Identificazione Componenti tramite keyword, talvolta la parola seguente il carattere numerico che rappresenta il numero di riferimento del componente è la preposizione "of", seguita da un altro componente (es. side N of thè piston M; arm N of thè support M etc.); in questi casi si assume che il componente precedente la preposizione "of" è un "subsystem" del componente che segue la medesima preposizione; in altre parole il livello di dettaglio del primo componente è almeno un gradino più spinto del livello di dettaglio del secondo; 1) analysis of descriptive phrases and specification expressions such as "... of ...": for example, as described in the Component Identification by keyword, sometimes the word following the numeric character representing the reference number of the component is the preposition "of", followed by another component (eg side N of the piston M; arm N of the support M etc.); in these cases it is assumed that the component preceding the preposition "of" is a "subsystem" of the component following the same preposition; in other words, the level of detail of the first component is at least one step higher than the level of detail of the second;

2) ricerca dei verbi descrittivi: la lista dei verbi descrittivi è contenuta nell'insieme d) del Database di "Stop Words" e Termini Analoghi 40. Un verbo descrittivo è un verbo del tipo "comprise", "to be made of", "to be constituted by" etc. Se un intorno di parole centrato sul verbo descrittivo (l'ampiezza dell'intorno è funzione del verbo, dato che in funzione del suo significato sono attesi uno o più soggetti ed uno o più oggetti) contiene componenti identificati dal Modulo Individuazione Componenti 31, si assume che i componenti che precedono il verbo descrittivo sono subsystem/supersystem dei componenti che lo seguono, in funzione del significato del verbo stesso: ad esempio, dalla frase "thè arm support comprises two guide rails, a screw drive and a carrier" si può evincere che "arm support" è un Supersystem rispetto a "guide rails", "screw drive" e "carrier", cioè è ad un livello di astrazione più elevato. 2) search for descriptive verbs: the list of descriptive verbs is contained in the set d) of the Database of "Stop Words" and Analogous Terms 40. A descriptive verb is a verb of the type "comprise", "to be made of", "to be constituted by" etc. If a neighborhood of words centered on the descriptive verb (the width of the neighborhood is a function of the verb, given that, depending on its meaning, one or more subjects and one or more objects are expected) contains components identified by the Component Identification Module 31, assumes that the components that precede the descriptive verb are subsystem / supersystem of the components that follow it, depending on the meaning of the verb itself: for example, from the phrase "the arm support comprises two guide rails, a screw drive and a carrier" one can infer that "arm support" is a Supersystem compared to "guide rails", "screw drive" and "carrier", ie it is at a higher level of abstraction.

Questa ricerca è compiuta tenendo conto anche delle denominazioni alternative di ciascun componente registrate dal Modulo Identificazione Componenti 31. This research is carried out also taking into account the alternative names of each component recorded by the Component Identification Form 31.

Come nel caso dell'Identificazione Componenti, le prestazioni della presente invenzione possono essere accresciute dall'impiego di un processore semantico, dato che può essere garantita una più affidabile identificazione dei componenti che effettivamente sono il soggetto o l'oggetto del verbo descrittivo: si consideri l'esempio precedente modificato come segue: "thè arm support comprises two guide rails, a screw drive arranged between thè opposite guide rails, and a carrier"; in questo caso l'inciso "arranged between thè opposite guide rails" non contiene alcun oggetto del verbo "comprise", ma contiene un componente identificato del sistema ("guide rails"). As in the case of Component Identification, the performances of the present invention can be increased by the use of a semantic processor, since a more reliable identification of the components that are actually the subject or object of the descriptive verb can be guaranteed: consider the previous example modified as follows: "the arm support comprises two guide rails, a screw drive arranged between the opposite guide rails, and a carrier"; in this case the phrase "arranged between the opposite guide rails" does not contain any object of the verb "comprise", but contains an identified component of the system ("guide rails").

3) Semplificazione della gerarchia: può accadere che la gerarchia di livelli di dettaglio definita in base ai due passi precedenti presenti dei salti gerarchici; ad esempio, "A è un supersystem di B", "B è un supersystem di C" e nel testo C è menzionato come subsystem di A; analizzando la lista completa di legami gerarchici fra i componenti del sistema, tutti i salti di questo tipo vengono eliminati. 3) Simplification of the hierarchy: it may happen that the hierarchy of levels of detail defined on the basis of the two previous steps present hierarchical jumps; for example, "A is a supersystem of B", "B is a supersystem of C" and in the text C is mentioned as a subsystem of A; by analyzing the complete list of hierarchical links between the components of the system, all jumps of this type are eliminated.

4) identificazione di gerarchie parallele: può accadere che uno o più componenti sono identificati come subsystem di due o più componenti al medesimo livello di dettaglio; per esempio: A è un supersystem per Al e A2; B è un supersystem per B1 e B2; A2 e B1 sono subsystem di C. Tali gerarchie parallele vengono opportunamente registrate dato che solitamente esse corrispondono alle diverse funzioni compiute da uno stesso componente. 4) identification of parallel hierarchies: it may happen that one or more components are identified as subsystems of two or more components at the same level of detail; for example: A is a supersystem for Al and A2; B is a supersystem for B1 and B2; A2 and B1 are subsystems of C. These parallel hierarchies are appropriately registered since they usually correspond to the different functions performed by the same component.

Un livello di dettaglio (DL) è assegnato a ciascun componente in modo tale che il Massimo livello di astrazione è rappresentato da DL=0 ed il DL di ciascun subsystem è un livello superiore del DL del corrispondente supersystem. A level of detail (DL) is assigned to each component in such a way that the Maximum level of abstraction is represented by DL = 0 and the DL of each subsystem is a higher level than the DL of the corresponding supersystem.

I risultati della prima fase di classificazione può essere ulteriormente elaborati per identificare il ruolo dei componenti all'interno dell'assemblaggio descritto nel testo: è possibile assegnare a ciascun componente un attributo "assembly", "part" o "portion" con il fine di consentire un più completo scambio di informazioni con sistemi CAD/PDI/CRM; queste informazioni possono essere trasferite mediante i più comuni formati di scambio dati, quali IGES, STEP, IDEF etc. 1) un attributo "portion" viene assegnato a tutti i componenti il cui nome contiene parole appartenenti all'insieme e) del Database di "Stop Words" e Termini Analoghi 40, quali "side of...", "upper part of..." etc. In un sistema CAD questi componenti corrispondono ad entità geometriche quali feature di modellazione, facce, spigoli vertici etc. The results of the first classification phase can be further processed to identify the role of the components within the assembly described in the text: it is possible to assign to each component an "assembly", "part" or "portion" attribute with the aim of allow a more complete exchange of information with CAD / PDI / CRM systems; this information can be transferred using the most common data exchange formats, such as IGES, STEP, IDEF etc. 1) a "portion" attribute is assigned to all the components whose name contains words belonging to the set e) of the Database of "Stop Words" and Analogous Terms 40, such as "side of ...", "upper part of. .. "etc. In a CAD system these components correspond to geometric entities such as modeling features, faces, vertex edges etc.

2) un attributo "assembly" viene assegnato a tutti i componenti che hanno almeno un subsystem che non è stato etichettato come "portino" al passo precedente; 2) an "assembly" attribute is assigned to all components that have at least one subsystem that has not been labeled as "leading" to the previous step;

3) un attributo "part" viene assegnato a tutti i componenti non etichettati nei due passi precedenti. 3) a "part" attribute is assigned to all components not labeled in the previous two steps.

Tale classificazione consente un legame diretto con l'albero delle Feature di un modello di Parte e/o con l'albero di assemblaggio di un modello di assieme in un sistema CAD, integrando quindi il modello concettuale di un sistema meccanico con la sua implementazione. This classification allows a direct link with the Feature tree of a Part model and / or with the assembly tree of an assembly model in a CAD system, thus integrating the conceptual model of a mechanical system with its implementation.

Una terza strada per classificare i componenti del sistema esaminato consiste nell'identificare quali di essi sono prodotti secondari del sistema stesso e fra questi il prodotto principale. Per questa classificazione sono necessari i risultati del Modulo di Analisi delle Interazioni, e quindi verrà descritta in seguito. A third way to classify the components of the examined system consists in identifying which of them are secondary products of the system itself and among these the main product. For this classification the results of the Interaction Analysis Module are required, and therefore will be described later.

I risultati del Modulo Classificazione Componenti 32 vengono registrati nel Database delle Informazioni Estratte 50. The results of the Component Classification Form 32 are recorded in the Extracted Information Database 50.

II Modulo di Analisi delle Interazioni 33 consente l'identificazione dei vincoli funzionali esistenti fra i componenti identificati del sistema esaminato. Anche in questo caso possono essere seguiti due diversi approcci (ricerca per keyword e semantica): The Interaction Analysis Module 33 allows the identification of the functional constraints existing between the identified components of the examined system. Also in this case two different approaches can be followed (keyword search and semantics):

1) ricerca delle sequenze di parole contenenti i nomi di due componenti del sistema separati da un verbo non appartenente alla lista f) del Database di "Stop Words" e Termini Analoghi 40; si assume che tale verbo sia il Field di una terna TFA; si assume che i componenti precedenti e seguenti il verbo siano il Tool e l'Artifact della terna TFA, in funzione del significato e della forma (attiva/passiva) del verbo stesso; 1) search for word sequences containing the names of two system components separated by a verb not belonging to the list f) of the "Stop Words" Database and Analogous Terms 40; this verb is assumed to be the Field of a TFA triplet; it is assumed that the components preceding and following the verb are the Tool and the Artifact of the TFA triad, according to the meaning and form (active / passive) of the verb itself;

2) ricerca delle sequenze di parole contenenti almeno un componente del sistema ed un verbo appartenente all'insieme c) del Database di "Stop Words" e Termini Analoghi 40 (verbi significativi dal punto di vista funzionale): si assume che tale verbo sia il Field della terna TFA, mentre il componente è considerato Tool o Artifact in funzione della sua posizione rispetto al verbo (precedente o seguente), e del significato e della forma (attiva o passiva) del verbo stesso. È evidente che la lista c) del Database di "Stop Words" e Termini Analoghi 40 deve contenere tutte le forme che i verbi appartenenti a tale lista possono assumere. 2) search for word sequences containing at least one component of the system and a verb belonging to the set c) of the Database of "Stop Words" and Analogous Terms 40 (verbs significant from the functional point of view): it is assumed that this verb is the Field of the TFA triad, while the component is considered Tool or Artifact according to its position with respect to the verb (previous or following), and the meaning and form (active or passive) of the verb itself. It is evident that the list c) of the Database of "Stop Words" and Analogous Terms 40 must contain all the forms that the verbs belonging to this list can take.

Un'implementazione alternativa della stessa funzione fa uso di un processore semantico: di ciascuna terna TFA, se sia il Tool, sia l'Artifact sono componenti del sistema ed il Field è un verbo non appartenente alla lista f) del Database di "Stop Words" e Termini Analoghi 40, allora si assume tale terna TFA come un blocco funzionale elementare del sistema; in caso contrario, se solo uno fra Tool e Artifact è un componente die sistema, ma il Field è un verbo appartenente all'insieme c) del Database di "Stop Words" e Termini Analoghi 40, si assume che il Tool/Artifact non identificato sia un Componente Esterno del sistema e la terna completa costituisce un blocco funzionale elementare del sistema. Infine può accadere che il Tool sia un componente del sistema, ma la coppia Field-Artifact sia essa stessa una funzione del sistema (ad esempio, provide-tension = tighten); se una coppia Field-Artifact fra quelle estratte dal processore semantico appartiene all'insieme g) del Database di "Stop Words" e Termini Analoghi 40, allora il soggetto viene considerato il Tool della terna e la coppia Field-Artifact è tradotta in un Field funzionale in accordo con la tabella associata all'insieme g) del Database di "Stop Words" e Termini Analoghi 40. La ricerca dell'Artifact di tale funzione può essere demandata all'utente o eseguita cercando il primo componente identificato che segue la preposizione tipicamente associata a tale coppia Field-Artifact (nella stessa tabella del Database di "Stop Words" e Termini Analoghi 40 sono citate la/le preposizioni più tipicamente associate alle coppie Field-Artifact). Per esempio, nella frase "thè upper end of thè piston contacts thè arm to provide tension on thè arm which..." il processore semantico identifica la terna "upper end - provide - tension" dalla quale sono estratti il Tool "upper end", il Field "tighten" e l'Artifact "arm" (come componente seguente la preposizione "on". An alternative implementation of the same function makes use of a semantic processor: of each TFA triad, if both the Tool and the Artifact are components of the system and the Field is a verb not belonging to the list f) of the "Stop Words Database "and Analogous Terms 40, then this triad TFA is assumed as an elementary functional block of the system; otherwise, if only one of the Tool and Artifact is a system component, but the Field is a verb belonging to the set c) of the Database of "Stop Words" and Analogous Terms 40, it is assumed that the Tool / Artifact is not identified both an External Component of the system and the complete triad constitutes an elementary functional block of the system. Finally, it may happen that the Tool is a component of the system, but the Field-Artifact pair is itself a function of the system (for example, provide-tension = tighten); if a Field-Artifact pair among those extracted from the semantic processor belongs to the set g) of the Database of "Stop Words" and Analogous Terms 40, then the subject is considered the Tool of the triad and the Field-Artifact pair is translated into a Field functional in accordance with the table associated with the set g) of the Database of "Stop Words" and Analogous Terms 40. The search for the Artifact of this function can be left to the user or performed by searching for the first identified component that typically follows the preposition associated with this Field-Artifact pair (the prepositions most typically associated with Field-Artifact pairs are cited in the same table of the Database of "Stop Words" and Analogous Terms 40). For example, in the sentence "the upper end of the piston contacts the arm to provide tension on the arm which ..." the semantic processor identifies the triad "upper end - provide - tension" from which the "upper end" Tool are extracted , the Field "tighten" and the Artifact "arm" (as a component following the preposition "on".

Alla fine della fase di Analisi delle Interazioni tutti i Tool/Artifact non identificati dal Modulo Identificazione Componenti 31 sono considerati Sistemi Esterni e possono essere usati per legare o combinare due o più invenzioni, sistemi tecnici e/o evidenziare le relazioni fra il sistema esaminato e gli altri sistemi appartenenti allo Stato dell'Arte del campo di applicazione. At the end of the Interaction Analysis phase all the Tool / Artifacts not identified by the Component Identification Module 31 are considered External Systems and can be used to link or combine two or more inventions, technical systems and / or highlight the relationships between the examined system and the other systems belonging to the State of the Art of the field of application.

Solitamente, se il testo da esaminare è un brevetto, l'Analisi delle Interazioni è eseguita sulla Descrizione Dettagliata dell'Invenzione e/o sul sommario e/o sulle rivendicazioni . Usually, if the text to be examined is a patent, the Interaction Analysis is performed on the Detailed Description of the Invention and / or on the summary and / or on the claims.

Al termine dell'analisi delle interazioni compiuta dal Modulo 33, tutte le terne TFA vengono registrate nel Database delle Informazioni Estratte 50, al pari della posizione nel testo esaminato della frase dalla quale tale terna è stata estratta: la posizione è valutata numerando in maniera sequenziale tutte le frasi del testo esaminato, distinguendo le frasi fra loro sulla base del carattere "." 0 del carattere ASCII di Ritorno Carrello. At the end of the analysis of the interactions carried out by Module 33, all the TFA triples are recorded in the Database of Extracted Information 50, as well as the position in the text examined of the sentence from which this triplet was extracted: the position is evaluated by numbering sequentially all the sentences of the examined text, distinguishing the sentences from each other on the basis of the character "." 0 of the ASCII Carriage Return character.

Combinando i risultati del Modulo Identificazione Componenti 31, del Sub-Modulo Identificazione della Gerarchia di dettaglio 34 e del Modulo di Analisi delle Interazioni Funzionali 33 è possibile identificare tutti i prodotti secondari e fra questi il prodotto principale del sistema analizzato. Nell'esempio di implementazione della presente invenzione, illustrato in Fig. 3, questo compito è svolto dal Sub-Modulo Identificazione dei Prodotti 35, in accordo con la seguente procedura: By combining the results of the Component Identification Module 31, the Detail Hierarchy Identification Sub-Module 34 and the Functional Interaction Analysis Module 33, it is possible to identify all the secondary products and among them the main product of the analyzed system. In the example of implementation of the present invention, illustrated in Fig. 3, this task is performed by the Product Identification Sub-Module 35, in accordance with the following procedure:

1) ogni Artifact è un prodotto del suo Tool attraverso l'azione del Field della terna TFA; pertanto, in prima analisi, si assume che ogni Artifact sia un prodotto secondario del sistema esaminato; 1) each Artifact is a product of its Tool through the action of the Field of the TFA triad; therefore, in the first analysis, it is assumed that each Artifact is a secondary product of the examined system;

2) un prodotto secondario perde questa proprietà (divenendo quindi un componente standard del sistema) nei casi seguenti: 2) a secondary product loses this property (thus becoming a standard component of the system) in the following cases:

a.nella gerarchia in termini di dettaglio/astrazione il candidato prodotto secondario ha almeno due livelli di astrazione superiori, vale a dire che il suo DL (Detail Level) è maggiore o uguale a 2; a. in the hierarchy in terms of detail / abstraction the candidate secondary product has at least two higher abstraction levels, i.e. its DL (Detail Level) is greater than or equal to 2;

b. il numero di interazioni funzionali tali che il prodotto secondario è un Tool è maggiore o uguale del numero di interazioni funzionali in cui è un Artifact; b. the number of functional interactions such that the secondary product is a Tool is greater than or equal to the number of functional interactions in which it is an Artifact;

3) di ciascun prodotto secondario si calcola il rapporto fra il numero di interazioni tali che esso è un Artifact ed il numero di interazioni in cui è un Tool; tale rapporto è detto Probabilità di Prodotto Principale (MPPV); 3) of each secondary product the ratio between the number of interactions such that it is an Artifact and the number of interactions in which it is a Tool is calculated; this ratio is called Principal Product Probability (MPPV);

4) in alternativa, se il testo esaminato è un brevetto, il fattore MPPV può essere calcolato come la somma dei seguenti valori di probabilità parziale: 4) alternatively, if the examined text is a patent, the MPPV factor can be calculated as the sum of the following partial probability values:

a. verifica se un prodotto secondario è menzionato come Artifact nelle prime due rivendicazioni del brevetto; esempio di valore di probabilità parziale: 50%; to. check if a secondary product is mentioned as an Artifact in the first two claims of the patent; example of partial probability value: 50%;

b. verifica se un prodotto secondario è menzionato come Artifact nel sommario del brevetto; esempio di valore di probabilità parziale: 30%; b. check if a secondary product is mentioned as an Artifact in the patent summary; example of partial probability value: 30%;

c. verifica se un prodotto secondario è menzionato come Artifact nel titolo del brevetto; esempio di valore di probabilità parziale: 15%; c. check if a secondary product is mentioned as an Artifact in the patent title; example of partial probability value: 15%;

d. calcolo delle ricorrenze dei prodotti secondari nell'intero testo del brevetto e normalizzazione di tali valori rispetto al massimo; questi valori normalizzati sono in percentuale il valore di probabilità parziale, che in ogni caso non deve però superare un valore predefinito (ad es. 5%); d. calculation of the occurrences of secondary products in the entire text of the patent and normalization of these values with respect to the maximum; these normalized values are the partial probability value as a percentage, which in any case must not exceed a predefined value (eg 5%);

e. verifica se un prodotto secondario è un Artifact di un Field presente come Field nelle prime due rivendicazioni del brevetto; esempio di valore di probabilità parziale: 30%; And. verifies whether a secondary product is an Artifact of a Field present as Field in the first two claims of the patent; example of partial probability value: 30%;

f.verifica se un prodotto secondario è un Artifact di un Field presente come Field nel sommario del brevetto; esempio di valore di probabilità parziale: 20%; f. check if a secondary product is an Artifact of a Field present as Field in the patent summary; example of partial probability value: 20%;

g.verifica se un prodotto secondario è un Artifact di un Field presente come Field nel titolo del brevetto; esempio di valore di probabilità parziale: 10%; g. check if a secondary product is an Artifact of a Field present as Field in the title of the patent; example of partial probability value: 10%;

h.calcolo delle ricorrenze dei Field che agiscono sui prodotti secondari (nel ruolo di Artifact) nell'intero testo del brevetto e normalizzazione di tali valori rispetto al massimo; questi valori normalizzati sono in percentuale il valore di probabilità parziale, che in ogni caso non deve però superare un valore predefinito (ad es. 10%); h. calculation of the occurrences of the Fields that act on secondary products (in the role of Artifact) in the entire text of the patent and normalization of these values with respect to the maximum; these normalized values are a percentage of the partial probability value, which in any case must not exceed a predefined value (eg 10%);

i.calcolo delle ricorrenze delle coppie Field-Artifact tali che 1'Artifact è un prodotto secondario nell'intero testo del brevetto e normalizzazione di tali valori rispetto al massimo; questi valori normalizzati sono in percentuale il valore di probabilità parziale, che in ogni caso non deve però superare un valore predefinito (ad es. 30%); i. calculation of the occurrences of the Field-Artifact pairs such that the Artifact is a secondary product in the entire text of the patent and normalization of these values with respect to the maximum; these normalized values are the partial probability value as a percentage, which in any case must not exceed a predefined value (eg 30%);

Il Modulo di Post Processing 60 fornisce il contenuto del Database delle Informazioni estratte 50 all'utente, organizzando tali dati in quattro forme differenti, in funzione dello scopo dell'analisi. Un esempio di implementazione del Modulo di post Processing 60, in accordo con i principi della presente invenzione, è costituito da quattro sub-moduli come mostrato in Fig. 2: Modulo di Mappatura Grafica del contenuto del Testo 61; Modulo di Confronto testi 62; Database degli Impieghi Funzionali dei componenti esaminati 63; Database dei componenti capaci di svolgere una funzione predefinita 64. The Post Processing Module 60 provides the contents of the Extracted Information Database 50 to the user, organizing such data in four different forms, according to the purpose of the analysis. An example of implementation of the Post Processing Module 60, in accordance with the principles of the present invention, consists of four sub-modules as shown in Fig. 2: Graphical Mapping Module of the Text content 61; Text Comparison Module 62; Functional Uses Database of the examined components 63; Database of components capable of performing a predefined function 64.

Il Modulo di Mappatura Grafica del contenuto del Testo 61 è uno strumento efficace per la comunicazione di tutte le informazioni estratte dal Modulo Analisi testi 30: i risultati dell'Identificazione Componenti, Identificazione della Gerarchia ed Analisi delle Interazioni Funzionali sono rappresentati in un diagramma, come in Fig. 6, con le seguenti convenzioni: The Text Content Graph Mapping Module 61 is an effective tool for communicating all the information extracted from the Text Analysis Module 30: the results of the Component Identification, Hierarchy Identification and Functional Interaction Analysis are represented in a diagram, such as in Fig. 6, with the following conventions:

1) ogni componente identificato del sistema è rappresentato da un rettangolo etichettato con il suo numero di riferimento e la denominazione rappresentativa definita dal Modulo Identificazione componenti 31; ciascun componente identificato esterno al sistema è rappresentato da un esagono etichettato mediante una stringa "EXT", un numero sequenziale e la denominazione rappresentativa definita dal Modulo Identificazione componenti 31; il prodotto principale è rappresentato da un'ellisse etichettata con gli stessi criteri appena descritti per i componenti interni /esterni al sistema; 1) each identified component of the system is represented by a rectangle labeled with its reference number and the representative name defined by the Component Identification Module 31; each component identified external to the system is represented by a hexagon labeled by means of an "EXT" string, a sequential number and the representative name defined by the Component Identification Module 31; the main product is represented by an ellipse labeled with the same criteria described above for the internal / external components of the system;

2) la gerarchia di livelli di dettaglio identificata dal Modulo di Classificazione 32, è rappresentata annidando i componenti a livello di dettaglio più spinto all'interno dei corrispondenti componenti a livello più astratto; 2) the hierarchy of levels of detail identified by the Classification Module 32 is represented by nesting the components at the highest level of detail within the corresponding components at the most abstract level;

3) le interazioni funzionali fra i componenti identificati del sistema sono rappresentate mediante frecce puntate dal Tool verso l'Artifact, etichettate mediante il Field, in accordo ai risultati del modulo Analisi delle Interazioni 33; 3) the functional interactions between the identified components of the system are represented by arrows pointed by the Tool towards the Artifact, labeled using the Field, according to the results of the Interaction Analysis module 33;

4) su richiesta, alcune tabelle riassuntive possono essere fornite all'utente: 4) upon request, some summary tables can be provided to the user:

a. lista dei componenti con il corrispondente livello di dettaglio DL ed il relativo supersystem (Fig. 7); to. list of components with the corresponding level of detail DL and the relative supersystem (Fig. 7);

b. lista dei prodotti secondari come coppie Field-Artifact, con il corrispondente Valore di Probabilità di prodotto Principale MPPV (Fig. 8); b. list of secondary products as Field-Artifact pairs, with the corresponding MPPV Principal Product Probability Value (Fig. 8);

c. lista dei valori di probabilità parziale valutati secondo la procedura dettagliata nella descrizione del Sub-Modulo di Identificazione Prodotti 35 (Fig. 8); d. lista delle interazioni funzionali fra i componenti identificati (Fig. 9); c. list of partial probability values evaluated according to the detailed procedure in the description of the Product Identification Sub-Module 35 (Fig. 8); d. list of functional interactions between the identified components (Fig. 9);

e. lista delle coppie Field-Artifact, tali che l'Artifact è il Prodotto Principale del sistema. And. list of Field-Artifact pairs, such that the Artifact is the Main Product of the system.

Il Modulo Confronto Testi 62 consente il confronto fra le descrizioni di due o più sistemi, in base ai seguenti parametri: The Text Comparison Module 62 allows the comparison between the descriptions of two or more systems, based on the following parameters:

1) confronto fra i "diametri delle invenzioni", vale a dire il numero di livelli di dettaglio identificati dal modulo di Classificazione componenti 32; 1) comparison between the "diameters of the inventions", ie the number of levels of detail identified by the Component Classification module 32;

2) confronto fra il numero di componenti interni al sistema esaminato, distinguendo anche il numero di componenti identificati a ciascun livello di astrazione; 2) comparison between the number of internal components of the examined system, also distinguishing the number of components identified at each level of abstraction;

3) (se è stata compiuta l'analisi mediante il Modulo Analisi dell'Implementazione Meccanica 36) confronto fra il numero di "assembly", "part" e "portion" del sistema esaminato; 4) confronto fra il numero di interazioni identificate dal Modulo di Analisi delle Interazioni 33; se due o più Field sono associate alla medesima coppia Tool/Artifact, viene effettuata una verifica per eliminare i Field sinonimi, in base alla lista i) del Database delle "Stop Words" e dei Termini Analoghi 40; 3) (if the analysis was carried out using the Mechanical Implementation Analysis Module 36) comparison between the number of "assembly", "part" and "portion" of the examined system; 4) comparison between the number of interactions identified by the Interaction Analysis Module 33; if two or more Fields are associated with the same Tool / Artifact pair, a check is carried out to eliminate the synonyms Fields, based on the list i) of the Database of "Stop Words" and Analogous Terms 40;

5) confronto fra il numero di interazioni (contate come al passo 4) che agiscono su componenti al medesimo livello di dettaglio; possibilità di evidenziare se tali componenti appartengono al medesimo supersystem oppure no; 5) comparison between the number of interactions (counted as in step 4) that act on components at the same level of detail; possibility of highlighting whether these components belong to the same supersystem or not;

6) confronto fra il numero di interazioni (contate come al passo 4) che agiscono su componenti a diverso livello di dettaglio; possibilità di evidenziare se tali componenti appartengono al medesimo supersystem oppure no; si registra anche la "distanza gerarchica" fra i componenti interagenti, bvale a dire la differenza fra i loro livelli di dettaglio DL; 6) comparison between the number of interactions (counted as in step 4) that act on components at different levels of detail; possibility of highlighting whether these components belong to the same supersystem or not; the "hierarchical distance" between the interacting components is also recorded, ie the difference between their levels of detail DL;

7) confronto fra il numero e le lunghezze dei rami presenti nel diagramma funzionale dei sistemi esaminati (come quello in Fig. 6) valutate a partire dal Prodotto Principale del sistema; 7) comparison between the number and the lengths of the branches present in the functional diagram of the systems examined (such as the one in Fig. 6) evaluated starting from the Main Product of the system;

8) confronto fra i componenti dello stesso rango: il rango di un componente è definito come la minima distanza, in termini di numero di interazioni funzionali, che legano il Prodotto Principale del Sistema al componente stesso; 8) comparison between the components of the same rank: the rank of a component is defined as the minimum distance, in terms of the number of functional interactions, which bind the Main Product of the System to the component itself;

9) analisi dell'andamento del livello di dettaglio nel corso della descrizione del sistema esaminato (Fig. 10): il Modulo di Analisi delle interazioni 33 registra la posizione nel testo di ciascuna delle interazioni funzionali TFA identificate; si assume che il livello di dettaglio del Tool e dell'Art ifact nella frase siano il livello di dettaglio della descrizione, pertanto è possibile analizzare l'andamento del livello di dettaglio nel testo e confrontare quello di testi differenti. L'analisi dei picchi del Livello di Dettaglio nel corso della descrizione di un sistema consente l'identificazione del "core' dell'invenzione, nonché delle peculiarità secondarie . 9) analysis of the trend of the level of detail during the description of the examined system (Fig. 10): the Interaction Analysis Module 33 records the position in the text of each of the TFA functional interactions identified; it is assumed that the level of detail of the Tool and the Art ifact in the sentence are the level of detail of the description, therefore it is possible to analyze the trend of the level of detail in the text and compare that of different texts. The analysis of the peaks of the Level of Detail during the description of a system allows the identification of the "core" of the invention, as well as of the secondary peculiarities.

Il Database degli Impieghi Funzionali dei componenti in sistemi differenti 63 registra tutte le interazioni funzionali associate a componenti omonimi in tutti i testi esaminati, archiviando il riferimento al documento sorgente ed il ruolo del componente nella terna TFA. The Database of the Functional Uses of the components in different systems 63 records all the functional interactions associated with homonymous components in all the examined texts, storing the reference to the source document and the role of the component in the TFA triad.

All'utente può essere fornito un confronto fra i diversi modi di impiego di un medesimo componente nei diversi sistemi esaminati. The user can be provided with a comparison between the different ways of using the same component in the different systems examined.

Il Database dei Componenti in grado di compiere una funzione data 64 registra: The Database of Components capable of performing a data 64 function records:

1) tutti i Tool associati a Field omonimi trovati in tutti i testi esaminati, registrando il riferimento al testo sorgente e la terna TFA completa; 1) all the Tools associated with homonymous Fields found in all the examined texts, recording the reference to the source text and the complete TFA triad;

2) tutti i Tool associati con coppie omonime Field-Artifact trovati in tutti i testi esaminati, registrando il riferimento al testo sorgente e la terna TFA completa; 2) all the Tools associated with homonymous Field-Artifact pairs found in all the examined texts, recording the reference to the source text and the complete TFA triad;

All'utente può essere fornito un confronto fra i modi in cui una medesima azione (Field) o una medesima funzione (Field-Artifact) sono compiute nei diversi sistemi esaminati. The user can be provided with a comparison between the ways in which the same action (Field) or the same function (Field-Artifact) are performed in the different systems examined.

Il Database delle "StopWords" e dei Termini Analoghi 40 è costituito da otto insiemi di parole, tutti personalizzabili dall'utente sia manualmente, sia attraverso una procedura di estrazione automatica di seguito descritta: The Database of "StopWords" and Analogous Terms 40 consists of eight sets of words, all of which can be customized by the user either manually or through an automatic extraction procedure described below:

1) l'utente fornisce al sistema un insieme di documenti tipici del campo di applicazione in cui è interessato; 2) si compie un'analisi semantica per mezzo di un processore semantico commerciale (ad esempio, Cobrain™, Knowledgist™, Phrasys™, Semantic Explorer™, CREAX, Kiwilogic™ etc.) e si registra una tabella di Tool e Artifact e della loro frequenza; 1) the user provides the system with a set of documents typical of the field of application in which he is interested; 2) a semantic analysis is performed by means of a commercial semantic processor (for example, Cobrain ™, Knowledgist ™, Phrasys ™, Semantic Explorer ™, CREAX, Kiwilogic ™ etc.) and a table of Tool and Artifact and of the their frequency;

3) a partire dal confronto della tabella definita al passo precedente ed il Database 40 completo, è possibile personalizzare le listi di filtri e sinonimi, creando così un sottoinsieme tipizzato del Database 40, etichettato con il campo di applicazione dei documenti processati al passo 1)· 3) starting from the comparison of the table defined in the previous step and the complete Database 40, it is possible to customize the lists of filters and synonyms, thus creating a typed subset of Database 40, labeled with the field of application of the documents processed in step 1) ·

Il Database 40 è costituito dai seguenti insiemi: Database 40 consists of the following sets:

a) lista delle "Stop Words" per le parole adiacenti ai caratteri numerici durante l'attività di Identificazione Componenti; questo insieme è tipicamente costituito dai riferimenti a figure, brevetti o altri documenti, unità di misura etc. a) list of "Stop Words" for words adjacent to numerical characters during the Component Identification activity; this set is typically made up of references to figures, patents or other documents, units of measurement etc.

b) tabella dei sinonimi dei candidati componenti, a differenti livelli di dettaglio (per esempio, portino, side, end; piston, plunger etc.); b) table of synonyms of the candidate components, at different levels of detail (for example, portino, side, end; piston, plunger etc.);

c) lista dei Field tipici delle funzionalità richieste in un dato campo di applicazione; c) list of fields typical of the functions required in a given field of application;

d) tabella dei verbi descrittivi quali "to comprise", "to be made of", "to be constituted by", etc. Tale lista deve tenere conto di tutte le forme che questi verbi possono assumere, anche dovute ad irregolarità della coniugazione; ad esempio, insieme all'infinito "to comprise" sono registrate le forme "comprise", "comprises", "comprised", "comprising" etc. d) table of descriptive verbs such as "to comprise", "to be made of", "to be constituted by", etc. This list must take into account all the forms that these verbs can take, also due to conjugation irregularities; for example, the forms "comprise", "comprises", "comprised", "comprising" etc. are recorded together with the infinitive "to comprise".

e) liste dei termini che descrivono una porzione di componente, quali "end", "side", "face", "part" etc. e) lists of terms that describe a portion of a component, such as "end", "side", "face", "part" etc.

f) lista dei verbi che non sono significativi da un punto di vista funzionale; f) list of verbs that are not significant from a functional point of view;

g) tabella delle coppie Field-Artifact, loro traduzione in un verbo funzionale ed una o più preposizioni tipicamente associate, impiegate per la ricerca automatica dell'Artifact; ad esempio, "provide tension", "tighten", "on"; g) table of Field-Artifact pairs, their translation into a functional verb and one or more typically associated prepositions, used for the automatic search of the Artifact; for example, "provide tension", "tighten", "on";

h) tabella dei sinonimi dei verbi funzionali che rappresentano un Field. h) table of synonyms of functional verbs representing a Field.

Il Database delle "Stop Words" e dei Termini Analoghi 40 consente la personalizzazione del sistema descritto nella presente invenzione, ma sono possibili anche altre personalizzazioni : The "Stop Words" and Analogous Terms Database 40 allows customization of the system described in the present invention, but other customizations are also possible:

1) le attività del Modulo Identificazione Componenti 31, Modulo Classificazione Componenti 32 e Modulo Analisi delle Interazioni 33 possono essere monitorate passo per passo dall'utente che può confrontare le informazioni estratte con la relativa frase sorgente, o possono essere eseguite in automatico sia pure con una affidabilità inferiore ; 1) the activities of the Component Identification Module 31, Component Classification Module 32 and Interaction Analysis Module 33 can be monitored step by step by the user who can compare the information extracted with the relative source sentence, or they can be performed automatically, albeit with lower reliability;

2) l'utente può specificare una lista di componenti (Tools/Artifacts) e/o funzioni (Fields) sui quali focalizzare l'analisi delle interazioni, in modo tale che venga estratto solo il relativo sotto-diagramma funzionale; 2) the user can specify a list of components (Tools / Artifacts) and / or functions (Fields) on which to focus the analysis of the interactions, so that only the relative functional sub-diagram is extracted;

3) la ricerca dei prodotti secondari e/o del prodotto principale dei sistemi esaminati può essere limitata ai componenti esterni al sistema. 3) the search for secondary products and / or the main product of the systems examined can be limited to components external to the system.

Ulteriori caratteristiche della presente invenzione sono date da: Further characteristics of the present invention are given by:

* il modulo di Post Processing 60, in cui il Modulo Contenuto del Testo 61 rappresenta: * the Post Processing module 60, in which the Text Content Module 61 represents:

a.ogni componente identificato del sistema con il suo numero di riferimento e la denominazione rappresentativa definite dal Modulo di Identificazione Componenti 31; a. each identified component of the system with its reference number and representative name defined by the Component Identification Form 31;

b. ogni componente identificato o elemento esterno al sistema; b. any identified component or element external to the system;

c. il prodotto principale; c. the main product;

d. la gerarchia dei livelli di dettaglio determinata dal Modulo di Classificazione 32; d. the hierarchy of levels of detail determined by the Classification Module 32;

e. le interazioni funzionali fra i componenti identificati in accordo ai risultati del Modulo di Analisi delle Interazioni 33; And. the functional interactions between the components identified according to the results of the Interaction Analysis Module 33;

* il modulo Contenuto Testi 61 che rappresenta: * the Text Content module 61 which represents:

- ogni componente identificato del sistema mediante un rettangolo etichettato con il suo numero di riferimento e la denominazione rappresentativa definita dal Modulo Identificazione Componenti 31; - each component identified in the system by means of a rectangle labeled with its reference number and the representative name defined by the Component Identification Form 31;

- ogni componente identificato o elemento esterno al sistema è rappresentato mediante un esagono etichettato con la stringa "EXT", un numero sequenziale e la denominazione rappresentativa definita dal Modulo Identificazione Componenti 31; - each identified component or element external to the system is represented by a hexagon labeled with the string "EXT", a sequential number and the representative name defined by the Component Identification Module 31;

- il prodotto principale mediante un'ellisse etichettata con gli stessi criteri illustrati sopra per i componenti interni/esterni; - the main product by means of an ellipse labeled with the same criteria illustrated above for the internal / external components;

- la gerarchia dei livelli di dettaglio determinata dal Modulo di Classificazione 32 rappresentata annidando i componenti ad un livello di dettaglio più spinto internamente ai componenti ad un livello di astrazione maggiore ; - the hierarchy of the levels of detail determined by the Classification Module 32 represented by nesting the components at a level of detail more pushed internally to the components at a higher level of abstraction;

- le interazioni funzionali fra i componenti identificati sono rappresentate mediante frecce che puntano dal Tool all'Artifact, etichettate con il Field, in accordo con i risultati del Modulo Analisi delle Interazioni 33; - the functional interactions between the identified components are represented by arrows pointing from the Tool to the Artifact, labeled with the Field, in accordance with the results of the Interaction Analysis Module 33;

* il modulo di Post Processing 60 in cui il Modulo Contenuto del Testo 61 rappresenta: * the Post Processing module 60 in which the Text Content Module 61 represents:

a. una lista di componenti con il loro livello di dettaglio DL ed il corrispondente supersystem; to. a list of components with their DL level of detail and the corresponding supersystem;

b. una lista di prodotti secondari nella forma di coppie Field-Artifact con il corrispondente valore di probabilità di prodotto principale MPPV; b. a list of secondary products in the form of Field-Artifact pairs with the corresponding MPPV main product probability value;

c. una lista di valori di probabilità parziali valutati in accordo alla procedura dettagliata nella descrizione del sub-modulo Identificazione di Prodotto 35; c. a list of partial probability values evaluated in accordance with the detailed procedure in the description of the Product Identification sub-module 35;

d. una lista di interazioni funzionali fra i componenti identificati; d. a list of functional interactions between the identified components;

* il modulo di Post Processing 60 in cui il Modulo Confronto Testi 62 consente il confronto fra due o più descrizioni di sistemi in accordo ai seguenti parametri: * the Post Processing module 60 in which the Text Comparison Module 62 allows the comparison between two or more system descriptions according to the following parameters:

a. confronto fra il "diametro" dei sistemi, definito come il numero di livelli di dettaglio identificti dal Modulo Classificazione Componenti 32; to. comparison between the "diameter" of the systems, defined as the number of levels of detail identified by the Component Classification Module 32;

b. confronto fra il numero di componenti interni dei sistemi esaminati, tenendo conto sia della lista completa dei componenti identificati, sia di quelli a ciascun livello di dettaglio; b. comparison between the number of internal components of the systems examined, taking into account both the complete list of identified components and those at each level of detail;

c. (se è stata compiuta l'analisi del sub-modulo Analisi dell'Implementazione Meccanica 36) confronto fra il numero di "assembly" "part" e "portion" del sistema esaminato; c. (if the analysis of the Mechanical Implementation Analysis sub-module 36 has been carried out) comparison between the number of "assemblies" "parts" and "portions" of the examined system;

d. confronto fra il numero di interazioni identificate dal modulo Analisi delle Interazioni 33; se due o più Field sono associati alla stessa coppia Tool-Artifact viene effettuata una verifica per eliminare Field sinonimi, tenendo conto dell'insieme i) del database di "stop Words" e Termini Analoghi 40; d. comparison between the number of interactions identified by the Interaction Analysis module 33; if two or more Fields are associated with the same Tool-Artifact pair, a check is carried out to eliminate synonyms Fields, taking into account the set i) of the database of "stop Words" and Analogous Terms 40;

e. confronto fra il numero di interazioni (contate come al passo d) agenti su componenti allo stesso livello di dettaglio; è possibile evidenziare se questi componenti sono interni o esterni al sistema; And. comparison between the number of interactions (counted as in step d) acting on components at the same level of detail; it is possible to highlight whether these components are internal or external to the system;

f. confronto fra il numero di interazioni (contate come al passo d) agenti su componenti a diversi livelli di dettaglio; può essere evidenziato se questi componenti sono l'uno un subsystem dell'altro o no; si può inoltre tenere conto della "distanza gerarchica" fra i componenti interagenti, cioè la differenza fra i loro livelli di dettaglio; f. comparison between the number of interactions (counted as in step d) acting on components at different levels of detail; it can be highlighted whether these components are one subsystem of the other or not; it is also possible to take into account the "hierarchical distance" between the interacting components, ie the difference between their levels of detail;

g. confronto fra il numero e la lunghezza dei rami presenti nel diagramma funzionale dei sistemi esaminati (come quello in Fig. 6) valutati a partire dal Prodotto Principale dei sistemi stessi; g. comparison between the number and length of the branches present in the functional diagram of the systems examined (such as the one in Fig. 6) evaluated starting from the Main Product of the systems themselves;

h. confronto dei componenti dello stesso rango: il rango di un componente è definito come la minima distanza in termini di numero di interazioni, che collega il Prodotto Principale del sistema con il componente stesso; h. comparison of components of the same rank: the rank of a component is defined as the minimum distance in terms of number of interactions, which connects the Main Product of the system with the component itself;

i.analisi dell'andamento del livello di dettaglio nel corso della descrizione del sistema esaminato: il Modulo Analisi delle Interazioni 33 registra la posizione nel testo di ciascuna interazione TFA; il livello di dettaglio del Tool e dell'Artifact in una frase è assunto come il livello di dettaglio della descrizione, quindi è possibile analizzare l'andamento del livello di dettaglio nel testo esaminato e confrontare tale andamento in testi differenti ; i. analysis of the trend of the level of detail during the description of the examined system: the Interaction Analysis Module 33 records the position in the text of each TFA interaction; the level of detail of the Tool and of the Artifact in a sentence is assumed as the level of detail of the description, therefore it is possible to analyze the trend of the level of detail in the examined text and compare this trend in different texts;

* il modulo di Post Processing 60 in cui l'analisi dei picchi dell'andamento del livello di dettaglio nel corso della descrizione del sistema consente l'identificazione del core e delle peculiarità secondarie del sistema stesso; * the Post Processing module 60 in which the analysis of the peaks of the trend of the level of detail during the description of the system allows the identification of the core and the secondary peculiarities of the system itself;

* il modulo di Post Processing 60 in cui il database degli usi Funzionali dei Componenti nei diversi sistemi 63 registra tutte le interazioni funzionali associate a componenti omonimi in tutti i testi esaminati, registrando il riferimento al testo sorgente ed il ruolo del componente nella terna TFA; * the Post Processing module 60 in which the database of the Functional uses of the Components in the different systems 63 records all the functional interactions associated with homonymous components in all the examined texts, recording the reference to the source text and the role of the component in the TFA triad;

* il modulo di Post Processing 60 in cui il database dei Componenti Capaci di Compiere una Funzione Data 64 registra: a. tutti i Tool associati a Field omonimi in tutti i testi esaminati, registrando il riferimento al testo sorgente e la terna completa; * the Post Processing module 60 in which the database of Components Capable of Performing a Data 64 Function records: a. all the tools associated with homonymous Fields in all the texts examined, recording the reference to the source text and the complete triad;

b. tutti i Tool associati alle coppie omonime Field-Artifact trovati nei testi esaminati, registrando il riferimento al testo sorgente e la terna completa; b. all the Tools associated with the homonymous Field-Artifact pairs found in the examined texts, recording the reference to the source text and the complete triad;

* il database di "Stop Words" e Termini Analoghi 40 che è costituito da otto insiemi di parole, tutti personalizzabili dall'utente attraverso la seguente procedura di estrazione automatica: * the database of "Stop Words" and Analogous Terms 40 which consists of eight sets of words, all customizable by the user through the following automatic extraction procedure:

a) l'utente fornisce al sistema un insieme di documenti tipici del campo di applicazione del quale è interessato; a) the user provides the system with a set of documents typical of the field of application he is interested in;

b)viene compiuta un'analisi semantica per mezzo di un processore semantico disponibile in commercio (ad esempio, Cobrain™, Knowledgist™, Phrasys™, Semantic Explorer™, Kiwilogic™ etc.) e viene registrata una tabella di Tool e Artifact ed il numero di occorrenze; b) a semantic analysis is performed by means of a commercially available semantic processor (for example, Cobrain ™, Knowledgist ™, Phrasys ™, Semantic Explorer ™, Kiwilogic ™ etc.) and a table of Tool and Artifact is recorded and the number of occurrences;

c) confrontando la tabella definita al passo precedente ed il database 40 completo è possibile personalizzare automaticamente le liste di filtri e sinonimi, creando quindi sottoinsieme tipizzati del database 40, etichettati con il campo di applicazione dei documenti processati al passo 1); c) comparing the table defined in the previous step and the complete database 40 it is possible to automatically customize the lists of filters and synonyms, thus creating typed sub-sets of the database 40, labeled with the field of application of the documents processed in step 1);

* il database di "Stop Words" e Termini Analoghi 40 che è costituito dai seguenti insiemi: * the database of "Stop Words" and Analogous Terms 40 which is made up of the following sets:

a) lista di stop keywords per parole adiacenti ai caratteri numerici durante 1'attività di Identificazione Componenti; questo insieme è tipicamente costituito da riferimenti a figure, brevetti o altri documenti, unità di misura etc. b) tabella dei sinonimi dei candidati componenti, a diverso livello di dettaglio (ad esempio, portion, side, end; piston, plunger etc.); a) list of stop keywords for words adjacent to numerical characters during the Component Identification activity; this set is typically made up of references to figures, patents or other documents, units of measurement etc. b) table of synonyms of the candidate candidates, at different levels of detail (for example, portion, side, end; piston, plunger etc.);

c) lista dei Field tipici delle funzionalità richieste in un dato campo di applicazione; c) list of fields typical of the functions required in a given field of application;

d) tabella dei verbi descrittivi quali "to comprise", "to be made of", "to be constituted by", etc., tenendo conto in tale lista di tutte le forme che questi verbi possono assumere, anche a causa di irregolarità della coniugazione; d) table of descriptive verbs such as "to comprise", "to be made of", "to be constituted by", etc., taking into account in this list all the forms that these verbs can take, also due to irregularities of the conjugation;

e) lista dei termini descriventi una porzione di componente, quali "end", "side", "face", "part" etc. f) lista dei verbi non significativi da un punto di vista funzionale; e) list of terms describing a portion of a component, such as "end", "side", "face", "part" etc. f) list of verbs that are not significant from a functional point of view;

g) tabella delle coppie Field-Artifact, delle loro traduzioni in un verbo funzionale ed una o più preposizioni tipicamente associate a tale locuzione usate per la ricerca automatica dell'Artifact; h)tabella dei sinonimi dei verbi funzionali rappresentanti un Field; g) table of Field-Artifact pairs, of their translations into a functional verb and one or more prepositions typically associated with this term used for the automatic search of the Artifact; h) table of synonyms of functional verbs representing a Field;

* il sistema in cui è consentita la personalizzazione dei seguenti sistemi: * the system in which customization of the following systems is allowed:

a. l'attività del Modulo Identificazione Componenti 31, Modulo Classificazione Componenti 32 e Modulo Analisi delle Interazioni 33 può essere seguita passo passo dall'utente, che può confrontare l'informazione estratta con la corrispondente frase sorgente, o può essere svolta automaticamente sebbene con minore affidabilità; b. l'utente può specificare una lista di componenti (Tool, Artifact) e/o funzioni (Field) su cui focalizzare l'analisi delle interazioni funzionali, in modo tale da estrarre i corrispondenti sotto-diagrammi funzionali; c. la ricerca dei prodotti secondari e del prodotto principale dei sistemi esaminati può essere limitata ai componenti esterni al sistema. to. the activity of the Component Identification Module 31, Component Classification Module 32 and Interaction Analysis Module 33 can be followed step by step by the user, who can compare the extracted information with the corresponding source sentence, or it can be carried out automatically although with less reliability ; b. the user can specify a list of components (Tool, Artifact) and / or functions (Field) on which to focus the analysis of functional interactions, in order to extract the corresponding functional sub-diagrams; c. the search for secondary products and the main product of the systems examined can be limited to components external to the system.

Claims (12)

RIVENDICAZIONI 1. Metodo atto ad essere eseguito automaticamente in un programma informatico per effettuare analisi e confronti automatici di brevetti e descrizioni tecniche di sistemi ingegneristici tramite una gerarchia di componenti in termini di livello di dettaglio, detto metodo comprendendo le fasi di: - esaminare un testo di un brevetto o di una descrizione tecnica; identificare componenti di sistema descritti nel testo esaminato; classificare il ruolo di detti componenti identificati in termini di categorie quali "assembly", "part", "port ion"; classificare detti componenti identificati in una gerarchia in termini di livello di dettaglio/astrazione; riconoscere tutti i legami funzionali e le interazioni esistenti fra detti componenti identificati del sistema esaminato; tradurre detti componenti identificati in un diagramma a blocchi ; confrontare componenti e descrizioni tra due o più sistemi; e - organizzare i dati in forme diverse secondo lo scopo dell<1>analisi. CLAIMS 1. Method suitable to be automatically executed in a computer program to carry out automatic analysis and comparisons of patents and technical descriptions of engineering systems through a hierarchy of components in terms of level of detail, said method comprising the steps of: - examine a text of a patent or a technical description; identify system components described in the examined text; classify the role of said components identified in terms of categories such as "assembly", "part", "port ion"; classifying said components identified in a hierarchy in terms of level of detail / abstraction; recognize all functional links and interactions existing between said identified components of the examined system; translating said identified components into a block diagram; compare components and descriptions between two or more systems; And - organize the data in different forms according to the purpose of the analysis. 2. Metodo secondo la rivendicazione 1, caratterizzato dal fatto che l'identificazione di tutti i componenti del sistema descritto nel testo esaminato, è compiuta in base alla procedura seguente: a. ricerca dei caratteri numerici nel testo; b.per ciascun numero, analisi di un intorno delle parole precedenti e seguenti, ciascun intorno costituendo una riga della matrice dei candidati componenti; c. filtraggio dei termini "non componenti", cancellando le righe contenenti le parole adiacenti al carattere numerico; d. riconoscimento di sinonimi e termini analoghi fra le righe contenenti il medesimo carattere numerico; e. identificazione dell'insieme intersezione delle parole appartenenti alle righe contenenti lo stesso carattere numerico, assumendo tale insieme di parole come rappresentativo del componente identificato dal carattere numerico di tali righe. 2. Method according to claim 1, characterized in that the identification of all the components of the system described in the examined text is performed according to the following procedure: to. search for numeric characters in the text; b. for each number, analysis of a neighborhood of the preceding and following words, each neighborhood constituting a row of the matrix of the component candidates; c. filtering of the "non-component" terms, deleting the lines containing the words adjacent to the numeric character; d. recognition of synonyms and similar terms between lines containing the same numeric character; And. identification of the intersection set of the words belonging to the lines containing the same numeric character, assuming this set of words as representative of the component identified by the numeric character of these lines. 3. Metodo secondo la rivendicazione 1 caratterizzato dal fatto che l'identificazione di tutti i componenti del sistema descritto nel testo esaminato è compiuta in base all'assunzione che detti componenti interagiscono come soggetti ed oggetti di una terna funzionale elementare TFA (Tool, soggetto; Field, azione; Artifact, oggetto) in accordo con la seguente procedura: a. estrazione da ciascuna frase di una terna TFA (Tool-Field-Artif act), per esempio da un documento XML o mediante un processore semantico; b. filtraggio delle terne TFA contenenti una lista di verbi non significativi dal punto di vista funzionale; c. raccolta dei Tool e degli Artifact sopravvissuti alla precedente fase di filtraggio; d. in modo opzionale, aggiunta di un'ulteriore insieme di candidati componenti facendo uso di tecniche comunemente disponibili per l'identificazione di parole rappresentative del contenuto di un testo; e. fra tutti i candidati componenti (Tool e Artifact sopravvissuti alla fase di filtraggio), rimozione dei nomi ripetuti, anche tenendo conto dei sinonimi dei candidati componenti. 3. Method according to claim 1 characterized by the fact that the identification of all the components of the system described in the examined text is performed on the basis of the assumption that said components interact as subjects and objects of an elementary functional triad TFA (Tool, subject; Field, action; Artifact, object) in accordance with the following procedure: to. extraction from each sentence of a triad TFA (Tool-Field-Artif act), for example from an XML document or by means of a semantic processor; b. filtering of the TFA triples containing a list of verbs that are not meaningful from a functional point of view; c. collection of the Tools and Artifacts that survived the previous filtering phase; d. optionally, adding a further set of component candidates making use of commonly available techniques for identifying words representative of the content of a text; And. among all component candidates (Tool and Artifact surviving the filtering phase), removal of repeated names, also taking into account the synonyms of the component candidates. 4. Metodo secondo la rivendicazione 1, caratterizzato dal fatto che un criterio di confronto del dettaglio/astrazione è applicato per classificare i componenti del sistema in accordo con i seguenti passi: a. analisi delle locuzioni descrittive e delle espressioni di specificazione quali "...of..."; b. assegnazione ai componenti precedenti la preposizione "of" del ruolo di subsystem del sistema seguente la preposizione "of"; c. ricerca dei verbi descrittivi quali "to comprise", "to be made of", "to be constituted by" etc., tenendo conto di tutte le forme che questi verbi possono assumere, anche per via delle irregolarità della coniugazione; d. assegnazione ai componenti precedenti di un verbo descrittivo del ruolo di subsystem/supersystem dei componenti seguenti il medesimo verbo descrittivo in funzione del significato di tale verbo; e. svolgimento di tale analisi tenendo conto di tutte le denominazioni alternative di ciascun componente, in cui un Livello di Dettaglio (DL) è assegnato a ciascun componente, rappresentando detto DL il massimo livello di astrazione quando DL=0, e tale che ciascun subsystem è un livello superiore del corrispondente supersystem, e, se diversi Livelli di Dettaglio (DL) sono assegnati ad un medesimo componente, tale che il massimo livello di astrazione è rappresentato da DL=0 ed il DL di ciascun subsystem è un livello più grande del DL del corrispondente supersystem, viene effettuata una semplificazione della gerarchia eliminando i salti gerarchici, e se diversi Livelli di Dettaglio (DL) sono assegnati ad un medesimo componente, tale che il massimo livello di astrazione è rappresentato da DL=0 ed il DL di ciascun subsystem è un livello più grande del DL del corrispondente supersystem, avviene l'identificazione delle gerarchie parallele tenendo conto di tali gerarchie "parallele". 4. Method according to claim 1, characterized in that a detail / abstraction comparison criterion is applied to classify the components of the system in accordance with the following steps: a. analysis of descriptive phrases and specification expressions such as "... of ..."; b. assignment to the components preceding the preposition "of" of the subsystem role of the system following the preposition "of"; c. search for descriptive verbs such as "to comprise", "to be made of", "to be constituted by" etc., taking into account all the forms that these verbs can take, also due to the irregularities of the conjugation; d. assignment to the previous components of a verb describing the role of subsystem / supersystem of the components following the same descriptive verb according to the meaning of this verb; And. carrying out this analysis taking into account all the alternative names of each component, in which a Level of Detail (DL) is assigned to each component, representing said DL the maximum level of abstraction when DL = 0, and such that each subsystem is a higher level of the corresponding supersystem, and, if different Levels of Detail (DL) are assigned to the same component, such that the maximum level of abstraction is represented by DL = 0 and the DL of each subsystem is a level greater than the DL of the corresponding supersystem, a simplification of the hierarchy is carried out by eliminating the hierarchical jumps, and if different Levels of Detail (DL) are assigned to the same component, such that the maximum level of abstraction is represented by DL = 0 and the DL of each subsystem is a level greater than the DL of the corresponding supersystem, the identification of parallel hierarchies takes place taking into account such "parallel" hierarchies. 5. Metodo secondo la rivendicazione 1, caratterizzato dal fatto che tutti i componenti sono processati ulteriormente in modo da identificare il ruolo di un componente nell'assemblaggio descritto nel testo, in accordo con la seguente procedura: a. un attributo "portion" è assegnato a tutti i componenti il cui nome contiene termini che descrivono la porzione di un componente, quali "end", "side", "face", "part", etc.; b. un attributo "assembly" è assegnato a tutti i componenti che abbiano almeno un subsystem che al passo precedente non sia stato etichettato come "portion"; c. un attributo "part" è assegnato a tutti i componenti non etichettati nei due passi precedenti. 5. Method according to claim 1, characterized in that all components are further processed in order to identify the role of a component in the assembly described in the text, in accordance with the following procedure: to. a "portion" attribute is assigned to all components whose name contains terms that describe the portion of a component, such as "end", "side", "face", "part", etc .; b. an "assembly" attribute is assigned to all components that have at least one subsystem that has not been labeled as "portion" in the previous step; c. a "part" attribute is assigned to all components not labeled in the previous two steps. 6. Metodo secondo la rivendicazione 3, caratterizzato dal fatto che un'identificazione dei legami funzionali esistenti fra i componenti identificati del sistema esaminato è compiuta in accordo con i seguenti passi: a. ricerca delle sequenze di parole contenenti i nomi di due componenti del sistema separati da un verbo, escludendo le terne componente-verbo-componente tali che il verbo non sia significativo "dal punto di vista funzionale"; b. attribuzione ai componenti che precedono e seguono detto verbo del ruolo di Tool e di Artifact della terna, in funzione del significato e della forma attiva o passiva del verbo stesso; c. ricerca delle sequenze di parole contenenti almeno un componente del sistema ed un verbo delle funzionalità richieste in un dato campo di applicazione, cioè i verbi significativi da un punto di vista funzionale; d. attribuzione a detto componente del ruolo di componente della terna, in funzione del significato e della forma attiva o passiva del verbo stesso; in cui viene identificato un sistema esterno, essendo tale sistema un Tool o un Artifact di una terna funzionale TFA, ed in cui, se un legame funzionale è identificato e tale per cui il Tool è un componente del sistema e la coppia Field-Artifact può essere tradotta in una funzione, la ricerca dell'Artifact di tale funzione è demandata all'utente o compiuta cercando il primo componente identificato seguente la preposizione tipicamente associata a tale coppia Field-Artifact. 6. Method according to claim 3, characterized in that an identification of the functional links existing between the identified components of the examined system is performed in accordance with the following steps: to. search for word sequences containing the names of two system components separated by a verb, excluding the component-verb-component triples such that the verb is not meaningful "from the functional point of view"; b. attribution to the components that precede and follow said verb of the role of Tool and Artifact of the triad, according to the meaning and the active or passive form of the verb itself; c. search for word sequences containing at least one component of the system and a verb of the required functionalities in a given field of application, that is, the verbs that are significant from a functional point of view; d. attribution to said component of the role of component of the triad, according to the meaning and the active or passive form of the verb itself; in which an external system is identified, this system being a Tool or an Artifact of a TFA functional triad, and where, if a functional link is identified and such that the Tool is a component of the system and the Field-Artifact pair can be translated into a function, the search for the Artifact of this function is delegated to the user or performed by searching for the first component identified following the preposition typically associated with this Field-Artifact pair. 7. Metodo secondo la rivendicazione 6, caratterizzato dal fatto che vengono identificati tutti i prodotti secondari del sistema esaminato in accordo con la seguente procedura: a. si assume che ogni Artifact sia un prodotto secondario del sistema esaminato; b. un prodotto secondario perde la sua caratteristica, divenendo così un componente "standard" del sistema, nei casi seguenti: - nella gerarchia del livello di dettaglio un candidato prodotto secondario ha almeno due livelli di astrazione superiore, cioè il suo Livello di Dettaglio o Detail Level, DL, è maggiore o uguale a 2; - il numero di interazioni funzionali tali che il candidato prodotto secondario è un Tool è maggiore o uguale al numero di interazioni funzionali tali che è un Artifact. 7. Method according to claim 6, characterized in that all secondary products of the examined system are identified in accordance with the following procedure: to. each Artifact is assumed to be a secondary product of the examined system; b. a secondary product loses its characteristic, thus becoming a "standard" component of the system, in the following cases: - in the hierarchy of the level of detail a secondary product candidate has at least two levels of superior abstraction, that is, its Level of Detail or Detail Level, DL, is greater than or equal to 2; - the number of functional interactions such that the candidate secondary product is a Tool is greater than or equal to the number of functional interactions such that it is an Artifact. 8. Metodo secondo la rivendicazione 1, caratterizzato per il fatto che viene identificato, fra tutti i prodotti secondari, il prodotto principale del sistema esaminato, come quello per cui è massima la somma dei seguenti differenti valori di probabilità: a. verificando se un prodotto secondario è menzionato come Artifact nelle prime due rivendicazioni del brevetto; b. verificando se un prodotto secondario è menzionato come Artifact nel sommario del brevetto; c. verificando se un prodotto secondario è menzionato come Artifact nel titolo del brevetto; d. valutando quante volte i prodotti secondari sono menzionati nell'intero brevetto e normalizzando questi valori rispetto alla frequenza massima, questo valore normalizzato moltiplicato per 100 essendo assunto come valore di probabilità parziale, ma in ogni caso dovendo essere minore o uguale ad un valore predefinito; e. verificando se un prodotto secondario è un Artifact di un Field presente come Field nelle prime due rivendicazioni del brevetto; a. verificando se un prodotto secondario è un Artifact di un Field presente come Field nel sommario del brevetto; b. verificando se un prodotto secondario è un Artifact di un Field presente come Field nel titolo del brevetto; c. valutando quante volte i Field agenti sui prodotti secondari, considerai come Artifact, sono menzionati nell'intero brevetto e normalizzando questi valori rispetto alla frequenza massima, questo valore normalizzato moltiplicato per 100 essendo assunto come valore di probabilità parziale, ma in ogni caso dovendo essere minore o uguale ad un valore predefinito; d.valutando quante volte le coppie Field-Artifact , tali che l'Artifact è un prodotto secondario, sono menzionate nell'intero brevetto e normalizzando questi valori rispetto alla frequenza massima, questo valore normalizzato moltiplicato per 100 essendo assunto come valore di probabilità parziale, ma in ogni caso dovendo essere minore o uguale ad un valore predefinito . 8. Method according to claim 1, characterized in that the main product of the examined system is identified among all the secondary products, as the one for which the sum of the following different probability values is maximum: to. verifying if a secondary product is mentioned as an Artifact in the first two claims of the patent; b. verifying if a secondary product is mentioned as an Artifact in the patent summary; c. verifying if a secondary product is mentioned as an Artifact in the patent title; d. evaluating how many times the secondary products are mentioned in the entire patent and normalizing these values with respect to the maximum frequency, this normalized value multiplied by 100 being assumed as a partial probability value, but in any case having to be less than or equal to a predefined value; And. verifying if a secondary product is an Artifact of a Field present as Field in the first two claims of the patent; to. verifying if a secondary product is an Artifact of a Field present as Field in the patent summary; b. verifying if a secondary product is an Artifact of a Field present as Field in the title of the patent; c. evaluating how many times the Fields acting on secondary products, considered as Artifact, are mentioned in the entire patent and normalizing these values with respect to the maximum frequency, this normalized value multiplied by 100 being assumed as a partial probability value, but in any case it must be lower or equal to a predefined value; d. by evaluating how many times the Field-Artifact pairs, such that the Artifact is a secondary product, are mentioned in the entire patent and normalizing these values with respect to the maximum frequency, this normalized value multiplied by 100 being taken as a partial probability value, but in any case it must be less than or equal to a predefined value. 9. Sistema per compiere analisi automatiche e confronti di brevetti e descrizioni tecniche di sistemi ingegneristici secondo il metodo della rivendicazione 1, detto sistema essendo caratterizzato dal fatto di comprendere: - un Archivio Temporaneo 20 in cui viene registrato il testo da analizzare introdotto dall'utente; - un Database di Stop Words e Termini Analoghi 40; - un Modulo di Analisi Testi 30 dal quale viene processato il testo; - un Database delle Informazioni Estratte 50; - un Modulo di Post-Processing 60; - un Modulo di Identificazione Componenti 31 atto ad identificare tutti i componenti del sistema descritti nel testo esaminato; - un Modulo di Classificazione Componenti 32 atto ad ordinare e classificare i componenti identificati; - un Modulo di Analisi delle Interazioni 33 atto ad identificare i legami funzionali esistenti fra i componenti identificati del sistema esaminato, tutti i legami identificati essendo atti ad essere registrati nel Database delle Informazioni Estratte 50; - un sub-modulo di Identificazione Prodotti atto ad identificare tutti i prodotti secondari e fra questi il prodotto principale del sistema esaminato; - il Modulo di Post Processing 60 essendo atto a fornire il contenuto del database delle informazioni estratte 50 all'utente, organizzando tali dati in forme differenti in funzione dello scopo dell'analisi. 9. System for carrying out automatic analyzes and comparisons of patents and technical descriptions of engineering systems according to the method of claim 1, said system being characterized in that it comprises: - a Temporary Archive 20 in which the text to be analyzed entered by the user is recorded; - a Database of Stop Words and Analogous Terms 40; - a Text Analysis Module 30 from which the text is processed; - a Database of Extracted Information 50; - a Post-Processing Module 60; - a Component Identification Form 31 designed to identify all the components of the system described in the examined text; - a Component Classification Form 32 designed to sort and classify the identified components; - an Interaction Analysis Module 33 designed to identify the functional links existing between the identified components of the examined system, all the links identified being capable of being registered in the Extracted Information Database 50; - a Product Identification sub-module designed to identify all secondary products and among them the main product of the system examined; - the Post Processing Module 60 being able to supply the content of the database of the extracted information 50 to the user, organizing such data in different forms according to the purpose of the analysis. 10. Sistema secondo la rivendicazione 9, caratterizzato dal fatto di comprendere inoltre un processore semantico atto ad eseguire l'identificazione di tutti i componenti di sistema descritti nel testo esaminato, detto processore semantico essendo atto ad estrarre da ciascuna frase una terna TFA (Tool-Field-Artifact), detto processore semantico comprendendo: a.mezzi per filtrare le terne TFA (Tool-Field-Artifact) contenenti un Field appartenenti ad un insieme del database delle Stop Words e dei Termini Analoghi 40 che contiene un elenco di verbi non significativi dal punto di vista funzionale; b. mezzi per raccogliere i Tool e gli Artifact sopravvissuti ai precedenti mezzi di filtraggio; c. in modo opzionale, mezzi per l'aggiunta di un ulteriore insieme di candidati componenti mediante tecniche comunemente disponibili per identificare le parole rappresentative del contenuto del testo, cioè analisi statistiche, clusterizzatori, reti Bayesiane; d. fra tutti i candidati componenti, detti componenti essendo Tool e Artifact sopravvissuti ai mezzi di filtraggio, mezzi per eliminare i nomi ripetuti anche tenendo conto della lista dei sinonimi di un insieme del database delle Stop Words e dei Termini Analoghi 40 contenente una tabella di sinonimi di componenti candidati, ad un diverso livello di dettaglio; e. mezzi per assumere tutti i componenti rimasti come componenti del sistema esaminato. 10. System according to claim 9, characterized by the fact that it further comprises a semantic processor suitable for carrying out the identification of all the system components described in the examined text, said semantic processor being able to extract from each sentence a triad TFA (Tool- Field-Artifact), called semantic processor comprising: a. means for filtering the TFA (Tool-Field-Artifact) triples containing a Field belonging to a set of the database of Stop Words and Analogous Terms 40 which contains a list of verbs that are not significant from a functional point of view; b. means to collect the surviving tools and artifacts of previous filtering means; c. optionally, means for adding a further set of component candidates by means of commonly available techniques for identifying words representative of the text content, ie statistical analyzes, clusterizers, Bayesian networks; d. among all the component candidates, said components being Tool and Artifact surviving the filtering means, means to eliminate the repeated names also taking into account the list of synonyms of a set of the database of Stop Words and Analogous Terms 40 containing a table of synonyms of candidate members, at a different level of detail; And. means for assuming all remaining components as components of the examined system. 11. Sistema secondo la rivendicazione 9, caratterizzato dal fatto di comprendere inoltre un processore semantico che è atto ad identificare i legami funzionali esistenti fra i componenti riconosciuti del sistema esaminato, detto processore semantico essendo atto ad estrarre da ciascuna frase una terna TFA (Tool-Field-Artifact) e comprendendo: a. se sia il Tool sia l'Artifact sono componenti del sistema ed il Field non appartiene ad un insieme del database delle Stop Words e dei Termini Analoghi 40 che contiene un elenco di verbi non significativi dal punto di vista funzionale, mezzi per considerare tale terna TFA un blocco funzionale elementare del sistema; b. altrimenti, se solo uno fra Tool e Artifact è un componente del sistema, ma il Field è un verbo delle funzionalità richieste in un dato campo di applicazione, mezzi per considerare che il Tool/Artifact mancante sia un Componente Esterno del sistema e considerare la terna completa un blocco funzionale elementare del sistema; c. se una coppia Field-Artifact fra quelle estratte dal processore semantico appartiene ad un insieme del database delle Stop Words e dei Termini Analoghi 40, le loro traduzioni in un verbo funzionale e una o piàù preposizioni tipicamente associate a tale locuzione, utilizzati per cercare automaticamente l'Artifact, mezzi per considerare il soggetto del verbo come Tool della terna e tradurre la coppia Field-Artifact, in accordo con la tabella del database delle Stop Words e dei Termini Aanaloghi 40, in un Field funzionale. 11. System according to claim 9, characterized in that it further comprises a semantic processor which is able to identify the functional links existing between the recognized components of the examined system, said semantic processor being able to extract from each sentence a triad TFA (Tool- Field-Artifact) and including: a. if both the Tool and the Artifact are components of the system and the Field does not belong to a set of the database of Stop Words and Analogous Terms 40 which contains a list of verbs that are not meaningful from a functional point of view, means to consider this triad TFA an elementary functional block of the system; b. otherwise, if only one of the Tool and Artifact is a component of the system, but the Field is a verb of the required functionalities in a given field of application, means to consider that the missing Tool / Artifact is an External Component of the system and to consider the triad completes an elementary functional block of the system; c. if a Field-Artifact pair among those extracted from the semantic processor belongs to a set of the database of Stop Words and Analogous Terms 40, their translations into a functional verb and one or more prepositions typically associated with this phrase, used to automatically search for the 'Artifact, means to consider the subject of the verb as a Tool of the triad and to translate the Field-Artifact pair, in accordance with the table of the database of Stop Words and Analogous Terms 40, into a functional Field. 12. Sistema secondo la rivendicazione 9, caratterizzato per il fatto che attributi quali "assembly", "part" o "portion" identificanti il ruolo di un componente nell'assemblaggio descritto nel testo sono atti ad essere legati al database geometrico di un sistema CAD con un'associazione diretta all'albero delle feature di un modello di parte e/o all'albero di assemblaggio di un modello di assieme, integrando quindi un modello concettuale di un sistema meccanico con la sua implementazione.12. System according to claim 9, characterized in that attributes such as "assembly", "part" or "portion" identifying the role of a component in the assembly described in the text are suitable for being linked to the geometric database of a CAD system with a direct association to the feature tree of a part model and / or to the assembly tree of an assembly model, thus integrating a conceptual model of a mechanical system with its implementation.
IT000303A 2012-04-05 2012-04-05 METHOD AND SYSTEM FOR CARRYING OUT ANALYSIS AND AUTOMATIC COMPARISON OF PATENTS AND TECHNICAL DESCRIPTIONS. ITTO20120303A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
IT000303A ITTO20120303A1 (en) 2012-04-05 2012-04-05 METHOD AND SYSTEM FOR CARRYING OUT ANALYSIS AND AUTOMATIC COMPARISON OF PATENTS AND TECHNICAL DESCRIPTIONS.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT000303A ITTO20120303A1 (en) 2012-04-05 2012-04-05 METHOD AND SYSTEM FOR CARRYING OUT ANALYSIS AND AUTOMATIC COMPARISON OF PATENTS AND TECHNICAL DESCRIPTIONS.

Publications (1)

Publication Number Publication Date
ITTO20120303A1 true ITTO20120303A1 (en) 2012-07-05

Family

ID=46051807

Family Applications (1)

Application Number Title Priority Date Filing Date
IT000303A ITTO20120303A1 (en) 2012-04-05 2012-04-05 METHOD AND SYSTEM FOR CARRYING OUT ANALYSIS AND AUTOMATIC COMPARISON OF PATENTS AND TECHNICAL DESCRIPTIONS.

Country Status (1)

Country Link
IT (1) ITTO20120303A1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774833A (en) * 1995-12-08 1998-06-30 Motorola, Inc. Method for syntactic and semantic analysis of patent text and drawings
US6167370A (en) * 1998-09-09 2000-12-26 Invention Machine Corporation Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
WO2001001289A1 (en) * 1999-06-30 2001-01-04 Invention Machine Corporation, Inc. Semantic processor and method with knowledge analysis of and extraction from natural language documents
EP1351156A1 (en) * 2002-03-14 2003-10-08 Universita' Degli Studi di Firenze System and method for automatically performing functional analyses of technical texts

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774833A (en) * 1995-12-08 1998-06-30 Motorola, Inc. Method for syntactic and semantic analysis of patent text and drawings
US6167370A (en) * 1998-09-09 2000-12-26 Invention Machine Corporation Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
WO2001001289A1 (en) * 1999-06-30 2001-01-04 Invention Machine Corporation, Inc. Semantic processor and method with knowledge analysis of and extraction from natural language documents
EP1351156A1 (en) * 2002-03-14 2003-10-08 Universita' Degli Studi di Firenze System and method for automatically performing functional analyses of technical texts

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Field Programmable Logic and Application", vol. 3163, 1 January 2004, SPRINGER BERLIN HEIDELBERG, Berlin, Heidelberg, ISBN: 978-3-54-045234-8, ISSN: 0302-9743, article GAETANO CASCINI ET AL: "Natural Language Processing of Patents and Technical Documentation", pages: 508 - 520, XP055054320, DOI: 10.1007/978-3-540-28640-0_48 *

Similar Documents

Publication Publication Date Title
RU2657173C2 (en) Sentiment analysis at the level of aspects using methods of machine learning
Ristoski et al. Rdf2vec: Rdf graph embeddings for data mining
Falleri et al. Fine-grained and accurate source code differencing
US10691891B2 (en) Information extraction from natural language texts
Gangemi A comparison of knowledge extraction tools for the semantic web
US20180267958A1 (en) Information extraction from logical document parts using ontology-based micro-models
US20160147736A1 (en) Creating ontologies by analyzing natural language texts
US20170161255A1 (en) Extracting entities from natural language texts
de Araujo et al. Ontology-based information extraction for juridical events with case studies in Brazilian legal realm
Amrouch et al. Survey on the literature of ontology mapping, alignment and merging
Flisar et al. Identification of self-admitted technical debt using enhanced feature selection based on word embedding
US20190179897A1 (en) Information object extraction using combination of classifiers
CN107103363A (en) A kind of construction method of the software fault expert system based on LDA
CN105824801A (en) Entity relationship rapid extraction method based on automaton
Eke et al. The significance of global vectors representation in sarcasm analysis
Sun A natural language interface for querying graph databases
Sartini et al. Marriage is a peach and a chalice: Modelling cultural symbolism on the semantic web
EP1351156A1 (en) System and method for automatically performing functional analyses of technical texts
Kozmina et al. Information requirements for big data projects: A review of state-of-the-art approaches
Dorodnykh et al. Conceptual model engineering for industrial safety inspection based on spreadsheet data analysis
Adrian et al. iDocument: using ontologies for extracting and annotating information from unstructured text
Pinquié et al. Requirement mining for model-based product design
Buey et al. Automatic legal document analysis: Improving the results of information extraction processes using an ontology
CN111831624A (en) Data table creating method and device, computer equipment and storage medium
Jabeen et al. Divided we stand out! forging cohorts for numeric outlier detection in large scale knowledge graphs (conod)