IT201600074756A1 - sistema e metodo per identificare, segnalare e correggere inefficienze linguistiche e comunicative della scrittura professionale - Google Patents

sistema e metodo per identificare, segnalare e correggere inefficienze linguistiche e comunicative della scrittura professionale

Info

Publication number
IT201600074756A1
IT201600074756A1 IT102016000074756A IT201600074756A IT201600074756A1 IT 201600074756 A1 IT201600074756 A1 IT 201600074756A1 IT 102016000074756 A IT102016000074756 A IT 102016000074756A IT 201600074756 A IT201600074756 A IT 201600074756A IT 201600074756 A1 IT201600074756 A1 IT 201600074756A1
Authority
IT
Italy
Prior art keywords
linguistic
inefficiency
identify
lists
phenomena
Prior art date
Application number
IT102016000074756A
Other languages
English (en)
Inventor
Giovanni Acerboni
Beatrice Branchesi
Alessandro Panunzi
Original Assignee
Beatrice Branchesi
Alessandro Panunzi
Giovanni Acerboni
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beatrice Branchesi, Alessandro Panunzi, Giovanni Acerboni filed Critical Beatrice Branchesi
Priority to IT102016000074756A priority Critical patent/IT201600074756A1/it
Publication of IT201600074756A1 publication Critical patent/IT201600074756A1/it

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Description

"Sistema e metodo per identificare, segnalare e correggere inefficienze linguistiche e comunicative della scrittura professionale",
L'invenzione trova applicazione in un sistema,di correzione informatizzato (SIGI) che consente di identificare, segnalare e correggere inefficienze linguìstiche e comunicative dei testi professionali in formato digitale. Sono inefficienti le caratteristiche di fenomeni linguistici che diminuiscono o annullano l'effetto che il fenomeno linguistico dovrebbe ottenere su chi legge, generando incomprensioni, equivoci, scarsa chiarezza, ridondanza dei contenuti espositivi, e perdita di informazioni. Le inefficienze considerate, che non sono in sé stesse errori grammaticali, riguardano elementi informativi e testuali, fatti lessicali e costrutti sintattici.
L'invenzione comprende un metodo che include le seguenti funzioni:
1. realizza un corpus specifico di testi professionali;
2. individua nel corpus i fenomeni linguistici tipici dei testi professionali, tra cui; Capoverso, Cumuli Nominali, Descrizione Bibliografica, Enclisi, Futuro Deontico, Impersonale, Lessico, Participio Presente,Periodo Lungo, Pronomi, Struttura A Lista, Titolo;
3.distingue i testi professionali da testi Che rientrano in altre tipologie, come ad esempio sceneggiature p romanzi, in base alla presenza, nel contenuto espositivo, dei fenomeni linguistici tipici;
4.elabora regole operative per ogni fenomeno linguistico, composte da istruzioni e liste specifiche, che si combinano tra loro per permettere al sistema informatizzato di identificare tutti i fenomeni linguistici tipici;
5.definisce il flusso logico ottimale, cioè l'ordine dei fenomeni linguisticisecondo il quale devono essere identificate le inefficienze dal sistema di correzione
informatizzato;
6,realizza un Modulo informatico per la revisione e la correzione della Scrittura Professionale (MSP), che
implementa le istruzioni e le liste delle regole operative.
L'invenzione comprende anche un Sistema di Correzione Informatizzato: (SIGI) che svolge le seguenti funzioni: identifica, segnala & corregge le inefficienze linguìstiche e comunicative dei contenuti dei testi professionali, sia automaticamente sia in via parzialmente interattiva, mediante l'interazione del MSP con una pluralità di applicazioni informatiche per l'elaborazione dei
testi (ad esempio i comuni word processor) e per il trattamento automatico del linguaggio, tra cui uno strumento di Natural Language Processing {MLP). Gli attuali strumenti di HLP sono in V grado dì fornire un'annotazione linguistica di base, ma non compiono un'analisi specificamente mirata dei testi professionali e dunque non sono in grado di identificarne i fenomeni linguistici tipici, tanto meno di operarne la correzione.
Nell'applicare gli strumenti di NLP alla composizione efficiente dei testi professionali, l'invenzione produce un sensibile miglioramento delle performance, sia in termini di precisione
nell'identificazione dei veri positivi e nell esclusione dei falsi positivi relativi ai fenomeni linguistici tipici e inefficienti della scrittura professionale sia in termini dì velocità, intesa come minore durata dei processo di identificazione di tali fenomeni e diminuzione del tempo per la restituzione dei risultati, via via che il SIC1 opera e grazie alle procedure di autoapprendimento del SIGI,
L’invenzione rappresenta, dunque, un innovativo strumento di redazione, revisione e correzione dei testi della scrittura professionale, applicabile anche ad altri tipi di testi, di sicura applicazione industriale, e garantisce i seguenti vantaggi:
la correttezza e l’ottimizzazione dei contenuti espositivi, secondo le regole della comunicazione e della scrittura professionale,
la massima efficacia comunicativa per chiarezza e razionalità espositiva;
la riduzione dei costi e dei tempi di analisi, revisione, correzione, dei,contenuti espositivi;
la sinteticità dei testi, che sono resi più concisi sino a oltre il 50% e mediamente del 30%, a parità di contenuti*
Ambito
L'invenzione ha il suo àmbito preferibilmente nella scrittura professionale, detta anche 'scrittura burocratica’, 'scrittura: aziendale', 'scrittura commerciale', 'business writing' ecc.
Si intende per 'scrittura professionale' quella prodotta da chi scrive all'intèrno di studi professionali, uffici, enti e organizzazioni pubbliche e private, da persone che redigono e/o revisionano testi professionali in quanto comunicare per iscritto fa parte delle loro mansioni, siano essi lavoratori autonomi o dipendenti,consulenti, professionisti (avvocati, commercialisti, medici, pubblicisti ecc.), ma anche stagisti, studenti, candidati a concorsi, saggisti ecc.
Nell'ambito della scrittura professionale rientrano anche i contenuti digitali legati alla comunicazione on line, sui social network e social media.
I:destinatari dei testi professionali sono persone che operano nella stessa struttura organizzativa o in altre strutture, ma anche interlocutori esterni, come cittadini, clienti, associati ece.
I testi professionali utilizzano diversi canali attraverso i quali vengono pubblicati e diffusi: stampa e web (siti, intranet, social media eec.), e-mail, fax, affissioni {avvisi, segnaletica eec,), testate giornalistiche ecc.
La scrittura professionale viene utilizzata in tipi di testo molto diversi tra loro nella funzione, nella struttura e nei contenuti. Esempi non esaustivi di testi professionali:
atti giudiziari, normativi, amministrativi, notarili, pareri, verbali, direttive, regolamenti;
contratti, policy aziendale, codice etico, bilancio, procedure interne, disposizioni, istruzioni, manuali, circolari, ordini di servizio,scheda prodotto, comunicatostampa, offerte commerciali, relazioni, progetti;
articoli per testate giornalistiche anche on line, blog, eec.;
tèmi scolastici, relazioni e saggi, tesi di laurea e di dottorato, elaborati di esami e concorsi, elaborati peritali.
Gii argomenti di cui trattano i testi della scrittura professionale sono di varia natura. Esempi non esaustivi; aziendale, bancario, commerciale, finanziario, fiscale, legale, normativo, amministrativo, politico, associativo, scientificadivulgativo.
Stato dell'arte
Per descrivere lo stato deli'arte, è necessaria una premessa; i testi professionali costituiscono, in termini di volume complessivo e di rilevanza per il valore operativo é legale delle loro informazi.OHÌ, un ambito particolare e particolamente delicato di tutta la produzione di testi.
Gli strumenti di NLP e gli altri strumenti di composizione, ricerca, classificazione, analisi automatica eco. di testi e linguaggi, attualmente {elenco non esaustivo):
offrono supporti alla gestione documentale;
operano il riconoscimento grammaticalegenerale,dei fenomeni linguistici;
consentono la ricerca di fatti lessicali in corpora molto consistenti (milioni di parole);
operano la traduzione dei testi;
interpretano il significato dei testi e l’atteggiamento di chi liha scritti;
svolgono il controllo ortografico dei testi;
operano una revisione grammaticale non contestualizzata, standardizzata egenericamente ristretta a pochi fenomeni linguistici superficiali;
segnalano fatti lessicali non noti ai dizionari installati sulle applicazioni e ne consentono l'aggiunta; suggeriscono parole da scrivere e sinonimi di una parola già scritta;
valutano la leggibilità secondo indici generici, basati su algoritmi standardizzati e quantitativi, ad esempio lunghezza delle parole, presenza o assenza dì una parola nei vocabolari di frequenza, frequenza di una parola nel testo eco.); trasformano automaticamente il parlato in un testo scritto ( speech-to-text) o , viceversa, riproducono un testo scritto attraverso la sintesi vocale { text-ta-speech) ,
in particolare, gli strumenti di NLP:
svolgono funzionidi analisi generale dei testi, analizzandone le unità grafiche ( tphenization) , etichettando il lessico ( leiwnatizatian) riconoscendo le caratteristiche grammaticali di ogni vocabolo ( PoS tagger) , riconoscendo le dipendenze sintattiche (dependency parser), disambiguando il riferimento delle parole {word sanse disambiguation) ;
sono generalmente addestrati sulla base di porpora ibridi (cioè composti variamente da testi giornalistici, legislativi, narrativi eco.} provenienti dal web.
In sintesi, gli strumenti di NLP e gli altri strumenti di composizione, ricerca, cìassìfreazione, analisi automatica-non finalizzano l'analisi linguistica in funzione dell'identificazione dei fenomeni linguistici tipici e inefficienti dei testi
Problema tecnico, effetti tecnici e vantaggi
Il problema tecnico che l'invenzione affronta é il limite degli strumenti di NL? e degli strumenti di.ri.cerca e analisi deitesti e dei linguaggi, dato dall'assenza di una implementazione specifica per i testi professionali. Questo limite incide negativamente sulle applicazioni industriali. In particolare, gli autori e i revisori dei testi professionali non dispongono di sistemi in grado di identificare, in tempi e modalità compatibili con un'applicazione industriale, le inefficienze e di correggerle automaticamente.
L'Invenzione consente di ottenere una serie di effetti tecnici e vantaggi, tra iguali
ottiene testi professionali più chiari nella esposizione dei concetti, più razionali nella presentazione delle informazioni, più corretti formalmente,e più concisi, sino a oltre il 50% e mediamente del 30%, a parità di contenuti; ottiene testi professionali corrètti in modo personalizzato, anche in modo auto-apprendente;
rende possìbile la correzione immediata e automatica, evitando perdite di tempo e la revisione umana;
riduce al minimo indispensabile i tempi di redazione e pubblicazione dei testi, e annulla quelli della revisione umana;
rende possibile per l'utilizzatore un servizio costantemente aggiornabile in relazione sia all'evoluzione della lingua sìa all'evoluzione della comunicazione personale;
rende possibile la standardizzazione deitesti professionali delle buone pratiche, rendendo omogenea la comunicazione all'interno delle organizzazioni e tra organizzazioni; rende possibile per gli strumenti di NLP l'individuazione dei fenomeni linguistici tipici dei testi professionali; rendepossibile per gli strumenti di NLP l'identificazione di eventuali inefficienze linguistiche e comunicative della scrittura professionale determinate dai fenomeni linguistici tipici;
rende gli strumenti di NLP strategici nella composizione dì
produce un sensibile miglioramento delle performance degli strumenti dì NLP in termini dì precisione. La precisione comprende 1identificazione dei veri positivi,e l'esclusione dei falsi positivi relativi ai fenomeni linguistici tipici dei testi professionali;
produce un sensibile miglioramento dei risultati dei sistemi text-to-speech che, trattando testi più efficienti e concisi, operano più facilmente e velocemente;
ottiene unSICI preciso e veloce che aumenterà la sua velocit via via che il SICI opera, grazie alla personalizzazione del SICI e alle procedure di autoapprendimento degli strumenti di NLP, in termini di minore durata del processo di identificazione dei fenomeni linguistici tipici dei testi professionali e di diminuzione del tempo per la restituzione dei risultati.
Descrizione dettagliata
Individuazione dei fenomeni linguistici
Tra i fenomeni linguistici tipici della scrittura professionale vi sono, in ordine alfabetico: Capoverso, Cumuli Nominali, Descrizione Bibliografica, Enclisi, Futuro Deontico, Impersonale, Lessico, Participio Presente Con Valore Verbale, Periodo lungo, Pronomi, Struttura a lista, Titolo,.
Questi fenomeni linguistici sono:
distintivi in quanto esclusivi della scrittura professionale, perché scomparsi dalla lingua contemporanea e dagli altri tipi di testo (es. Participio Presente, Futuro Deontico); oppure
distintivi in quanto gestiti in modo tìpicamente inefficiente nella scrittura professionale (es. Lessico, Cumuli Nominali); oppure
caratterizzanti in quanto piu frequenti nella scrittura professionale che in altri tipi di testo, e in quanto gestiti in modo tipicamente inefficiente (es. Descrizione Bibliografica, Struttura A Lista, Pronomi, Impersonale); oppure
tipici e inefficienti ma non distìntivi né caratterizzanti (Capoverso, Enclisi).
Tali fenomeni linguistici, considerati singolarmente, risultano di per sé inefficienti (es. Cumuli Nominali), oppure producono l'inefficienza quando vengono gestiti male (es. Capoverso).
Pertanto, i fenomeni linguistici tipici dei testi professionali sono anche inefficienti e, considerati complessivamente, compromettono la linearità, la chiarezza e la sinteticità del testo. A tale proposito, va precisato che le inefficienze di cui si occupa 1*invenzione non sono errori grammaticali.
Questi fenomeni linguistici riguardano:
1,aspetti testuali:
a.errori di coerenza, cioè della sequenza logica dèlle informazioni (es. Capoverso);
b.ridondanza di alcune informazioni rispetto all'interesse primario del lettore;(es. Descrizione Bibliografica); c.forme verbali che compromettono la relazione con il lettore, generando distanza, incomprensione ecc. (es. Impersonale, Futuro Deontico);
d.porzioni di testo troppo lunghe o non coese (es. Struttura A Lista)
e.frasi da spostare o da riscrivere perché spezzano la linearità del discorso (es. Descrizione Bibliografica, Struttura A Lista);
2.costrutti sintattici complessi o desueti da sostituire con altri più semplici e correnti (es. Cumuli Nominali, Enclisi, participio Presente);
3.fatti lessicali perifrastici,desueti, oscuri ecc, da sostituire con altri più semplici e chiari (es. Lessico)
Il flusso logico ottimale
Il flusso logico ottimale, che garantisce nel modo migliore la precisione e la velocità delle performance, è rappresentato dall'ordine seguente dei fenomeni linguistici: Lessico, Periodo Lungo, Capoverso, Descrizione Bibliografica, Struttura A Lista, Participio PresenteCon valore Verbale, Enclisi,Pronomi, Cumuli Nominali, Impersonale, Futuro;Deontico, Titolo.
Questo ordine è ottimale perché:
Lessicoè un;fenomeno comune a:Periodo Lungo, Capoverso, Descrizione .Bibliografida, PàrtiCipio Presente, Enclisi, Pronomi, Cumuli nominali, Impersonale, Futuro Deontico;
Periodo lungo è un fenomeno correlato a capoverso, Descrizione Bibliografica, Struttura A.Lista, Cumuli Nominali,'
Capoverso è un fenomeno correlato anche a Descrizione bibliografica e Struttura A Lista;
Descrizione bibliografica :è oaratferizzato dalla presenza di Participio Presente, Pronomi, Cumuli Nominali, Impersonale;
Participio presente è spesso presente nelle frasi in cui compaiono Pronomi, Cumuli Nominali, Impersonale;
Enclisi é spesso presente nelle frasi in cui compaiono Pronomi, Cumuli Nominali, Impersonale;
Pronomiè spesso presente nelle frasi in cui compare Cumuli Nominali;
Cumuli Nominali è spesso presente nelle frasi in cui compare Impersonale, Futuro Deontico;
Impersonale e FuturoDeontico non caràtterizzano 1 fenomeni precedenti;
Titolo è la sintesi delle informazioni del testo e deriva A quindi dalla gestione del fenomeni linguistici precedenti.
Facendo un esempio del primo fenomeno, cioè Lessico:
l’individuazione di Lessico crea un sottoinsieme di fenomeni connessi che opera come fattore di distinzione dei testi professionali da altri tipi di testo;
la correzione automatica delle inefficienze di Lessico riduce la quantità di inefficienze dei fenomeni connessi.
Applicando il flusso logico ottimale, pertanto-, è precisa e· massimamente veloce la correzione automatica di tutte le inefficienze linguistiche del contenuto espositivo dei testi professionali, perché della correzione delle inefficienze dei fenòmeni precedenti beneficiano più ø meno direttamente i fenomeni successivi.
Il metodoconsentecomunque di realizzare anche un diverso flusso, se funzionale a testi dotati di caratteristiche particolari o estranei alla scrittura professionale
Un primo flusso alternativo è il seguente: Titolo, Lessico,
Periodo Lungo, Struttura A Lista, Descrizione:Bibliografica, Capoverso,, Pronomi,CumuliNominali, Participio Presente, Enclisi, Impersonale, Futuro Deontico,
Un secondo flusso alternativo è il seguente: Impersonale,. Futuro , Deontico, Participio Presente, Enclisi, Pronomi, Lessico, Cumuli Nominali, Struttura A Lista, Descrizione Bibliografica, Capoverso, Periodo Lungo, Titolo-
Un terzo flusso alternativo è il seguente: Titolo, Impersonale, Futuro Deontico, Participio Presente, Enclisi, Pronomi, Struttura
A Lista, Periodo Lungo, Descrizione Bibliografica, Cumuli
Nominali, Lessico, Capoverso
Sistema di Correzione Informatizzato (SICI) per la correzione del testi professionali
Una delle possibili applicazioni industriali dell'invenzione, che ne amplifica glieffetti tecnici, è 1 ' individuazione e la
correzione automatica delle inefficienze linguistiche,e
comunicative nei testi professionali, che si può ottenere, per esempio, con il seguente SIGI e con il dialogo tra le applicazioni informatiche seguenti:
1.un Modulo Editor, con cui l'utilizzatore scrive il testo e da cui invia la richiesta di controllo e correzione a
2. un Modulo Interfaccia, che collega I'Editor al
3. MSP {Modulo Scrittura Professionale), che implementa le istruzioni (descritte al paragrafo successivo)!, gestisce i
database (descritti al paragrafo successivo), e che invia la richiesta di annotazione del testo a
4.uh Modulo NLP, il quale svolge le funzioni di analisi dì base del testo di cui si è detto, è reinvia 1'annotazione al
5.MSP, ehe sfrutta l'analisi fornita dal Modulo NLP per identificare le inefficienze, ed invia i risultati
dell'identificazione al
6.Modulo Interfaccia che invia a) l'istruzione dì evidenziare i fenomeni identificati,, oppure b) l'istruzione per correggere automaticamente il testo al
7.Modulo Editor dove 1'utilizzatore trova a) evidenziato ogni 7 fenomeno Linguistico identificato, oppure b) il testo automaticamente corretto. Nel caso di a) appare, in corrispondenza del fenomeno evidenziato:
8.un Modulo Finestra dì dialogo che segnala e descrive l'inefficienza suggerendo soluzioni alternative manuali e interattive, e la correzione automatica.
Con questo SIGI, che non è l'unico possibile, si può prevedere:
l'attivazione del controllo e della correzione nei campi per la composizione degli elementi testuali (esempi non esaustivi: frontespizio, titolo, titolo dei paragrafi, note a piè di pagina ecc.};
1'attivazione del controllo e della correzione nei campiper La composizione del corpo del testo (pagine dei capitoli, dei paragrafi ecc.);
l'attivazione del controlloe della correzione anche separato per i campì relativi alla composizione degli elementi testuali e nei campi relativi alla composizione del corpo del testo. Esempi non esaustivi: l'utente può attivare il controllo dei fatti lessicali nei campi per la compostaiene degli elementi testuali; attivare il controllo dei costrutti sintattici nei campi per la composizione del corpo del testo eco,;
1'attivazione del controllo anche automatico, durante la composizione dei testo o, a scelta, al tèrmine della composizione.
La precisione e la velocità di analisi, e la correzione automatica dei tèsti professionali possono essere ottenute dalla seguente:tra le possibili realizzazioni del SIGI (ma non l'unica):
la disattivazione dei moduli dell'NLP inutili per l'analisi dei testiprofessionali (es. Keywords) ;
uneventuale stadio preliminare di addestramento e di personalizzazione del SIC! da parte dell'utilizzatore;
uno stadio operativo di uso del S1CI per ottenére il risultato di testi professionali efficienti.
Lo stadie preliminare è caratterizzato dalla personalizzazione del SIGI. La personalizzazione:dei SIGI puòavvenire nel modo seguente;
l‘utilizzatore richiède il controllo di un fenomeno linguistico alla volta;
ì'utilizzatore, mediante la Finestra di dialogo, personalizza il SIGI scegliendo tra le opzioni offerte dalla Finestra di dialogo.
La Finestra di dialogo contiene una sèrie di comandi accanto a ogni soluzione:alternativa suggerita. I comandi preferibilmente sono:
Correggi ora e correggi automaticamente sèmpre senza chiedere più
Correggi solo questa volta e mostra ancora il suggerimento Correggi ora e correggi automaticamente sempre con [qui
1'utilizzatore può inserire manualmente le disposizioni desiderate] e non mostrare più il suggerimento
Correggi solo questa volta con [qui 1'utilizzatore può inserire manualmente le disposizioni desiderate] e-mostra ancora il suggerimento
& Prosegui senza correggere solo questa volta e mostra ancora il suggerimento
Prosegui senza correggere ora e sempre, e non mostrare più il
Per esempio, la Finestra di dialogo che appare all'utilizzatore ijr corrispondenza di un fatto lessicale inefficiente, cóme per esempio 'ovvero*, potrebbe essere visualizzata come segue:
[Testo scritto dall'utilizzatore] Ogni rinvio ad altre norme contenuto in disposizioni legislative, nonché in regolamenti, decreti o circolari emanati dalla pubblicaamministrazione deve contestualmente indicare, in forma integrale ovvero in forma sintetica e di chiara comprensione, il testo al quale le disposizioni fanno riferimento.
[Finestra di dialogo] Ovvero'.
1.Correggi con 'oppure*
a .Correggi ora e sorreggi automaticamente sèmpre senza chiedere più
b.Correggi solo questa volta e mostra ancora il
suggerimerito;
2. Correggi con 'cioè'
a.Correggi ora e correggi automaticamente sempre senza chiedere più
b.Correggi solo questa Volta e mostra ancora il suggerimento;
3. Correggi con " [1'utilizzatore inserisce la sua correzione]
a.Correggi ora e correggiautomaticamente sempre,e non mostrare più il suggerimento
b.Correggi solo questa volta e mostra ancora il suggerimento
4. Proseguì senza correggere
a.Solo questa volta e mostra ancora il suggerimento b.Sempre, e non mostrare piu il suggerimento
5,Consulta la documentazione: articolo, video, esempi Nello stadio operativo, che è autonomo rispetto allo stadio preliminare, il SIGI è istruito per correggere automaticamente il testo, anche secondo le richieste specifiche dell'utilizzatore, ed è anche più veloce, perché 1 fenomeni linguistici inefficienti, grazie alla personalizzazione, sono diminuiti. Richiamando l'esemplo fatto, è possibile sia la sostituzione automatica di "ovvero* con 'oppure' o altre congiunzioni effettuata dal sistema senza interpellare 1'utilizzatore, sia la sostituzione automatica di 'ovvero' con 'oppure'o altre congiunzioni scelti previamente dall'utilizzatore nello stadio preliminare di personalizzazione.
Quésto SIGI può essere implementato anche per dòritenuti espositivi diversi da quelli professionali.
he Regole Operative
Le Regole Operative riguardano ognuna un fenomeno linguistico tipico e inefficiente dei testi professionali. Pur differenti nelle istruzioni è nelle liste, le Regole operative rispondono tutte, nella struttura lògica e nell'organizzazione delle informazioni, alla medesima metodologia per garantire l'unitarietà della loro funzione e dell’effetto tecnico, di seguito descritto esemplificandolo con l'applicazione industriale della correzione dei testi professionali. La metodologia è la seguente:
• elaborazione di Istruzioni formalizzate per permetterealSIC! di identificare i fenomeni linguistici tipici e inefficienti, e dì correggerli anche automaticamente;
elaborazione di opportune liste, cioè repertori che contengono informazioni linguistiche appositamente selezionate, relative a fattilessicali e costrutti sintattici, che integrano le Istruzioni, le liste possono essere:
• Black list: repertorio di fenomeni linguistici non ammessi;
® White list: repertorio di fenomeni linguistici ammessi; • Frequericy lisi: repertorio di fenomeni linguistici elencati secondo la loro frequenza;
« Liste di fenomeni linguistici rilevanti ; per esempio:
locuzioni preposizionali, polirematiche, riamed entities eoe,;
* combinazione delle Istruzioni e delle Liste, per permettere al SIGI di identificare con la massima precisione e la massima velocità ì veri positivi, escludendo i falsi positivi.
L‘ implementazione delle Istruzioni e delle Liste viene realizzata con il MSP, cioècon ilModulo informatico per la revisione e la correzióne della Scrittura Professionale.
Le Regole -Operative.*Lessico', 'Participio Presente', 'Enclisi', 'Pronomi', 'Impersonale', 'Futuro Deontico', utilizzano,il criterio dell'identificazione di una parola o di una locuzione all 'interno diuna frase: le istruzioni sono ovviamente diverse per ogni fenomeno, in modo funzionale alla sua specifica identificazione.
Le Regole Operative 'Capoverso', Descrizione Bibliografica', 'Struttura A Lista:' e 'Cumuli Nominali’ utilizzano il criterio c dell'identificazione di una porzione di frase o di una frase o di una porzione di testo: anche in questo caso le istruzioni sorto diverse per ogni fenomeno, in modo funzionale:alla sua specifica identificazione.
Lacorrezione automatica o anche parzialmente interattiva dei fenomeni linguistici del.primo gruppo comprende almeno lina delle seguenti funzioni: eliminazione, sostituzione, modifica, spostamento della parola o della locuzione. La correzione automatica o anche parzialmente interattiva dei fenomeni linguistici del secondo gruppo comprendealmeno una delle seguenti funzioni: eliminazione, sostituzione, modifica, riformulazione, spostamentodella porzione di frase o delia frase o della porzione di testo, riordinamento e delle informazioni, aggiunta di informazioni.
Tra i fenomeni linguistici dei testi professionali:
Capoverso, Descrizione Bibliografica, Periodo Lungo, Struttura A Lista e Titolo producono inefficienze testuali e dunque non dipendono dalla lingua in cui è scritto il tèsto professionale. Di seguito, gli esempi relativi sono tratti da testi professionali in lingua italiana,
Lessico produce inefficienze linguistiche in tutte le lìngue. Di seguito, gli esempi relativi sono tratti da testi professionali in lingua italiana
Cumuli Nominali, Participio Presente, Enclisi, Pronomi, Impersonale, Futuro Deontico producono inefficienze linguistiche nella lingua italiana ma anche nelle altre lingue nelle quali questi fenomeni esistono (per esempio le lingue derivate dal.latino). Di seguito, le Istruzioni relative sonoesemplificate per la lingua italiana, e gii esempi relativi sono tratti da testi professionali in francese,italiano, inglese e polacco.
A) Regola operativa 'Lessico'
Problema tecnico specifico: come identificare 1 fatti lessicali tipici e inefficienti. Un fatto lessicale è tipico e inefficiente se é abusato, disusato, enfatico, errato, improprio, piu lungo di un suo sinonimo ecc. Esempi: A decorrere da, Detto, Ovvero.
Soluzione per la correzione anche automatica dei testi professionali: sostituire i fatti lessicali tìpici e inefficienti scegliendo tra le alternative o Operare automaticamente;la correzione. Esempi, rispettivamente: Da, Quésto, Oppure/Gìoè.
Istruzioni
1. Disambiguare i fatti lessicali che appartengono a più di un lemma e/o parte del discorso
2. Cercare i fatti lessicali che appartengono a un solo lemma e/o parte del discorso
3. Individuare i fatti lessicali inefficienti che sono contenuti nelle Liste
. Correggere, in modoautomatico o interattivo, l’inefficienza determinata da un fatto lessicale in uno o più dei modi seguenti:
a. selezionare un fatto lessicale semanticamente equivalente b dare un ordine diverso ai fatti lessicali che lo precedono e lo seguono o di cui è eventualmente composto
c. eliminare il fatto lessicale
d. eliminare:un altro fattolessicale della frase
e. ridurre la perifrasi
f. riformulare la frase ø l’intero periodo
Liste
1. Black list MA dei fatti lessicali morfologicamente non ambigui il cui utilizzo produce 1'inefficienza dei testi
2 Black List SM dei fatti lessicali morfologicamente ambigui il cui utilizzo produce l'inefficienza dei testi professionali 3. Black List MW delle locuzioni, polirematiche, nanne d enti ties non ammesse
4 , White list MW delle locuzióni, polirematiche, named entities ammesse
B)Regola Operativa *Capoverso
Problema tecnico specifico: come identificare i capoversi forzati iritorno a capo non corretto) o collocati fuori posto, che danneggiano la coerenza e la comprensibilità , fino a rendere il testo illeggibile.
Soluzione per la correzione anche automatica dei testi professionali: ristabilire la correttezza, scegliendo una delle alternative possibili o attuando la correzione automatica.
Istruzioni
1. Di ogni capoverso, considerare solo il primo·periodo
2. Del primo periodo, considerare solo un numero N -di parole numero massimo desiderato)
3.Identificare se nel numero N di parole compare uno dei fatti lessicali delie liste relative al capoverso iniziale, ai capoversi intermedi e al capoverso finale
4.Identificare se 1’analisi automatica evidenzia un errore logico-semantico tra il capoverso in analisi e il precedente 5.Correggere, in modo automatico o interattivo, l'inefficienza dei capoversi forzati o fuori posizione in uno b più dei modi
a.annullare il ritorno a capo
b.sostituire il fatto lessicale nonammesso con un altro che esprima la discontinuità dal capoverso precèdente c.spostare il capoverso prima o dopò un altro
d.ordinare diversamente le informazioni
e.rifar,mulare ilcapoverso
• Liste
1.Black list primo capoverso: fatti lessicali non ammessi t . Black lisi capoversi intermedi: fatti lessicali non ammessi 3.Black list ultimo capoverso: fatti lessicali non ammessi 4-White list polirematiche ammesse
5,Frequency list: frequenza dei fatti lessicali amméssi, non ammessi, dubbi
C)Regola Operativa 'Descrizione Bibliografica’
Problema tecnico specifico: come identificare la descrizione bibliografica di un testo a cui fa riferimento chi scrive, ohe aumenta ilnumero di parole della frase, appesantisce la lettura e allontana le informazioni importanti, producendo più fatica e meno interesse. Esèmpio: "XI decreto attua quanto previsto
dall' articolo 1, comma 1, lettera d) , è comma 2, letterao) , della legge n. 243 del 2004 e detta una nuova disciplina dell'istituto della totalizzazione, in sostituzione delle disposizioni contenute nell'articolo 71 della L. 23.12.2000, ri. 388 e nel successivo decreto di attuazione del 7.2.2003, n. 57, disposizioni che vengono di conseguenza abrogate’’.
Soluzione per la correzione anche automatica del testi
professionali: definire una diversa gestione delle informazioni
in esse contenute, suggerire le alternative possibili, ø operare automaticamente la correzione. Esempio:
"Il decreto,che attua la l"gge243/2004 (1), detta una nuova disciplina dell'istituto della totalizzazione (2)
1). Articolo i, comma 1, lettera d} , e comma 2flettera o) ,
2} Le disposizioni dell'articolo 71 della L. 23 12 ,2000 , n, 388 e del successivo decreto di attuazione del 7.2.2003, n.57 vengono
Nella riformulazione, il numero delle parole è passato da 58 in un 3⁄4 unico periodò a 46 (-21%), delle quali 14 a testò (-76%) e 32
nelle note a piè di pagina.
® Istruzioni
1.Escludere le note a piè di pagina e la bibliografia
2. Cercare le voci dicui si compone la descrizione bibliografica 3. Identificare quando le voci costituiscono un sintagma con più
di N voci {N = numero massimo desiderato)
4 .Correggere, in modo automatico q interattivo, l'inefficienza della descrizione bibliografica in uno o più dei modi
seguenti:
a.spostare le voci in eccesso in una nota a piè di pagina, e adeguare la frase
b.eliminare una o più voci
c.riformulare la frase
*Liste
1. Black lisi nomi e abbreviazioni che rappresentano una descrizione bibliografica
2. Black lisi luoghi che rappresentano la descrizione
bibliografica
D) Regola Operativa 'Struttura A Lista'
Problema tecnico specifico: come identificare l'inefficienza delle strutture a lista troppo lunghe, o con una sola voce, o con segni paragrafematici o di punteggiatura mancanti o np-n ammessi.
Soluzione per la correzione anche automatica dei testi
professionali: costruire diversamente le strutture a lista, scegliendo tra le alternative possibili, o operare automaticamente l la correzione.
• Istruzioni
1.Individuare i segni paragrafematici che identificano le voci della struttura a lista
a. Identificare quando il segno paragrafematico è uno -solo 2. Identificare quando lavoce che corrisponde a;l primo segno paragrafematico è preceduta da una o più parole che non terminano con i due punti
3. Identificare quando le voci, dalla prima alla penultima, non terminano con il punto e virgola
4. Identificare quando l'ultima voce non termina con il punto
5. Identificare quando il numero di parole complessivo delle voci
è superiore a N {N= numero massimo desiderato)
6. Correggere, in modo automatico o interattivo, le inefficienze determinate da unastruttura a lista scorretta o troppo lunga in uno o più dei modi seguenti:
a.aggiungere isegni di punteggiatura mancanti
b.sostituire i segni di punteggiatura non ammessi con
quelli ammessi
c.sostituire i segni paragrafematici non ammessi con quelli ammessi
diaggiungere almeno una voce alla lista composta da uria
sola voce
e.sintetizzare il contenuto delle voci
f.spostare una o più voci, ó parti di voci, in nota a piè di pagina
g.eliminare una o più voci.
h.spostare una o più voci prima o dopo la struttura a lista i.riordinare le informazioni in tutta la struttura (testa e voci) e riformularle
j.eliminare la struttura a lista
k,riformulare la struttura a lista
• Liste
1.Black List dei segni paragrafematicie dei segni di punteggiatura non ammessi
2.White list dei segni paragrafematici e dei segni di punteggiatura ammessi
E)Regola Operativa 'Participio Presente Con Valore Verbale' Problema tecnico specifico; come identificare il participio presente con valore verbale, che è in disuso e dunque trasmette distanza dal lettore, il quale percepisce del mittente un'identità diversa da quella desiderata e viene indotto a equivocare il significato del testo. Esempio in italiano: "Le Direzioni avranno cura di conservare agli atti fa documentazione comprovante la data in cui la risposta si intende fornita". Esempio in francese; "Les commissions sont una rémunération constìtvant un salaire. La Lai sur les nomes du travail s applique mème si unte personne est rémunérée entièrement à commission".
Soluzione per la correzione anche automatica dei testi professionali: sostituire il participio presente, scegliendo tra le alternative, o operare automaticamente la sostituzione. Esempio in ilaliano: "Le Direzioni avranno cura di conservare agli atti la documentazione che comprova la data in cui la risposta si intende fornita”.
« Istruzioni
1. Escludere il participio presente quando ha funzione di aggettivo
2. Identificare il participio presente con valore Verbale quando connette due tèste nominali, comprese quelle composte anche da un numero cardinale
3. Identificare il participio presente con valore verbale quando connette la testa nominale che lo precede, con una frase completiva introdotta da 'che', che lo segue
4. Escludere il participio presente quando è preceduto da:
articolo, preposizione, preposizione articolata,locuzione preposizionale, verbo, pronome relativo 'che
5. Escludere il participio presente quando è seguito da
a. Punteggiatura
a.i, Trarrne le virgolette doppie citazionali o che racchiudono il titolo di un testo
a.ii, Tranne il trattino o la parentesi
a,iii, Tranne i due punti che introducono una enumerazione eventualmente anche in struttura a lista
b, Pronome
b.i. Tranne il pronome relativo indiretto (es. in cui)
G . Verbo
6. Correggere, in modo automatico o interattivo, l'inefficienza del participio presente con valore verbale in uno o più dei modi seguenti:
a . eliminare il participio presente
b . sostituire il participio presente con una frase relativa c . sostituire il participio presente con una frase secondaria d. sostituire il participio presente con una preposizione, o una preposizione articolata, o una locuzione preposizionale
e . sostituire il participio presente con un aggettivo
t. spezzare il periodo e spostare 1'informazione in un'altra frase, riformulando 1'informazione
g - riformulare la frase
Liste
1. Black list dei participi presente con valore sempre verbale 2. White list dei participi presente che non sono mai participi presenti con valore verbale
F)Regola’Operativa:'Enclisi'
Problema tecnico specifico: come identificare il sl' enclitico, che produce inefficienze in due casi: quando è incorporato alla fine di un infinito sostantivata (esempio: "Il recupero avveniva con il realizzarsi delle perdite"); quando è incorporato alla fine di alcuni modi dei verbo (esempio: "A tale quadro doveva invece farsi ricorso per le differenze emergenti dal prosieguo della gestione"). In entrambi ì casi, è un fenomeno linguistico disusato, produce distanza dal lettore, che può equivocare il significato del testo e percepire del mittente un 'identità diversa da quella desiderata.
Soluzione per la correzione anche automatica dei testi professionali: sostituire il 'si* enclitico scegliendo tra le alternative, o operare automaticamente la sostituzione. Esempi: "Il recupero avveniva quando si realizzavano le perdite"; "A tale quadro sì doveva invece fare ricorso per le differenze emergenti dal prosieguo della gestione".
• Istruzioni
1. Identificare l'infinito sostantivato che
a. Termina in -àrsi / -ersi / -irsi
b. È preceduto da articolo o preposizione articolata
c. È seguito da preposizione o preposizione articolata locuzione preposizionale
2. Identificare il ’si’ pronome riflessivo
a. Nei verbi semplici
2.a.l. Modi finiti, forma attiva, alla terza persona singolare e alla terza persona plurale
2.a.2. Modo infinito, tempo presente, preceduto da una preposizione semplice o da una congiunzione o da una locuzione o da un verbo
b. Negli ausiliari dei verbi composti, nei verbi modali o aspettuali seguiti da un verbo lessicale, di modo finito e di modo infinito tempo passato,di forma attiva o passiva, alla terza persona singolare e alla terza persona plurale c. Escludere
.c.l. I modi imperativo, gerundio e participio passato 2-C.2. I Verbi riflessivi enclitici
3. Correggere, in modo automatico o interattivo, l'inefficienza del 'si enclitico in uno o più dei modi seguenti:
a. sostituire 1'infinito sostantivato con il verbo o con un altro verbo e ricostruire la frase
b. spostare il 'si' pronome riflessivo.davanti al verbo
c. spostare il 'si' pronome riflessivo davanti all'ausiliare del verbo
d. nel caso dell'infinito presente, spostare il 'si' pronome riflessivo davanti al verbo che lo introduce
e. cambiare il modo e/o il tempo del verbo, adattando la frase f . cambiare la forma (es, attiva > passiva) del verbo,adattando la frase
d· cambiare l'ausiliare del verbo, adattando la frase
h. organizzare diversamente le informazioni delia frase riformulare la frase
Liste
1. Black list di fatti lessicali che corrispondono a infinito sostantivato non ammissibile
2. White list di fatti lessicali che corrispondono a infinito sostantivato accettabile
3. Black list di verbi con 'si' enclitico certo
4. White list di verbi con 'si' enclitico non dì interesse
5. Black list dì preposizioni, congiunzioni e locuzioni che precedono 1 verbi con 'si' enclitico
6. Black list di verbi ausiliari/modali/aspettuali
G)Regola Operativa 'Pronomi
Problema tecnico specifico: come identificare le forme composte di alcuni pronomi personali soggetto e complemento e le.forme composte dialcuni pronomi possessivi. Queste forme sono composte da articolo o preposizione articolata stesso/a/i/e {es. 'la stessa’, 'della stèssa'). Queste forme complicano la comprensibilità del testo e creano distanza dal lettore. Esempio: "L'Operazione si sostanzia nella permuta tra A ed alcuni azionisti rilevanti di B dì azioni ordinarie proprie di A, rappresentanti complessivamente il 3366% dell'attualecapitale sociale ordinario della stessa, contro azioni ordinarie".
Soluzione per la correzione anche automatica dei testi professionali: sostituire le forme composte dei pronomi personali e possessivi, scegliendo tra le forme base ((es. 'lei , 'sua') o altre alternative, o operare automaticamente la correzione.
Esempio: "L'Operazióne si sostanzia nella permuta tra A ed alcuni azionisti rilevanti di B di azioni ordinarie proprie di A, rappresentanti complessivamente il 3,366% del suo attuale capitale sociale ordinario, contro azioni ordinarie".
® Istruzioni
1.Identificare 'stesso', 'stessa' / 'stessi', 'stesse' quando sono preceduti da: un articolo, una preposizione articolata 2.Identificare 'stesso', 'stessa* / 'stessi', 'stesse' quando sono seguiti da: un segno di punteggiatura, una preposizione, un verbo, un articolo, una congiunzione
3.Correggere, in modo automatico o interattivo, l'inefficienza determinata da 'stesso* in uno o più dei modi seguenti:
a .sostituire 'stesso'con la forma base corrispondente del pronome e adeguare la costruzione della frase b.sostituire 'stesso' con il nome a cui sì riferisce c. eliminare 'stesso'
d. riformulare la frase
• Lista
1. Black list dì sintagmi preposizionali non ammessi
2. white List dì sintagmi preposizionali ammessi
H)Regola Operativa 'Cumuli Nominali'
Problema tecnico specìfico: come identificare i cumuli nominali, che provocano l'eccessiva lunghezza del periodo, aumentano il numero delle parole nella frase,aggravano il carico informativo e rendono farraginoso il contenuto.
Esempio in italiano: "Il decreto legge n. 112/2008 contiene, tra l'altro, una serie di misure sull' attività di impresa per la promozione dello sviluppo economico, tra le quali si segnala, in particolare, la prevista definizione entro sei mesi di una strategia energetica nazionale, volta ad assicurare la diversificazione delle fonti di energia e delle aree di approvvigionamento, la promozione delle fonti rinnovabili e dell'efficienza energetica, lo sviluppo delle infrastrutture, la realizzazione di impianti di produzione di energia nucleare e la sostenibilità ambientale, la concessione di agevolazioni finanziarie a sostegno degli investimenti dei privati". Esempio in inglese: "Council Directive 85/577/EEC of 20 December 1985 to protect thè consumer in respect of contracts negotiated away from business premises and Directive 97/7/EC of thè European Parliament and of thè Council of 20 May 1997 on thè protection of consumers in respect of distance contracts lay down a number of contractual rights for consumers". Esempio in polacco: "Harmonizacja niektórych aspektów umów z udziaìem konsumentòw zawieranych na odlegiosó i niektórych aspektów umów z udziaìem konsumentòw zawieranych poza lokalem przedsiebiorstwa jest niezb§dna w celu wspierania rzeczywistego rynku wewngtrznego dia konsumentòw, opartego na wìasciwej równowadze pomigdzy wysokim poziomem ochrony konsumentòw i konkurencyjnoàcia przedsigbiorstw, przy jednoczesnym zapewnieniu poszanowania zasady pomocniczoéci".
Soluzione per la correzione anche automatica dei testi professionali: ridurre i cumuli nominali, costruendo diversamente la frase, scegliendo una delle alternative possibili o attuando la correzione automatica. Esempio in italiano:
"Una delle misure (1) su attività di impresa e sviluppo economico è la strategia energetica nazionale, che definirà entro sei mesi come:
diversificare le fonti di energia e le aree di approvvigionamento;
promuovere le fonti rinnovabili e 1'efficienza energetica; sviluppare le infrastrutture;
realizzare gli impianti di produzione di energìa nucleare, e la sostenibilità ambientale;
concedere agevolazioni finanziarie che sostengano gli investimenti privati
1} Decreto legge n. 112720Q8".
Nella riformulazione, il numero di parole è passato da 89 a 62 (-30,33%), il numero dì verbi è passato da 3 a 7 {+ 133,33%) e i cumuli nominali sono spariti, essendo il numero di complementi indiretti passato da 19 a 4 (- 79%).
• Istruzioni
1.Cercare, in un periodo o in una frase anche senza verbo, i complementi indiretti, cioè introdotti da una preposizione o locuzione preposizionale
a.Assegnare valore 0
a.i. alle preposizioni contenute nelle polirematiche a.ii. alle preposizioni contenute nelle named entities a .ili. alle preposizioni contenute negli incisi tra parentesi in posizione mediana nel periodo, se contengono un verbo
b.Assegnare valore 1
b.i. a ogni preposizione,contenuta in una locuzione preposizionale
b.ii. alle locuzioni preposizionali formate con un verbo c.Identificare quando il numero di preposizioni è maggiore di JM (N= numero massimo desiderato)
2. Correggere, in modo automatico o interattivo, l'inefficienza dei complementi indiretti in uno Q più dei modi seguenti:
a.spezzare il periodo in due σ più periodi
b.spostare le informazioni relative a uno o più complementi indiretti in una nota a piè di pagina o in un'altra frase o in un altro periodo o in una struttura a lista c.riformulare il cumulo nominale eliminando uno o più complementi indiretti
d.cancellare una o più delle informazióni veicolate dai complementi indiretti
e.riformulare l’intero periodo con un numero non maggiore di N di complementi indiretti
• uiste
1.White list: locuzioni preposizionali
2.White list;locuzioni non preposizionali
3.White list: named entities
4,white list; polirematiche
5.Frequency list: lista di<'>frequenza dei .costrutti sintattici 'soggetto umano o inanimato > verbo attivo o passivo complemento indiretto'
I)Regola Operativa 'Impersonale’
Problema tecnico specifico: come identificare l'impersonale quando esprime unsoggetto indeterminato e quando questosoggetto coincide implicitamente con l'autore della comunicazione. In questo caso, l'impersonale è inefficiente perché chi legge non riesce a comprendere chiaramente chi dice o fa che cosa; il destinatario può, oltretutto, dedurre ohe il mittente non sì assuma la;responsabilità di ciò che dice e fa. Esempio in italiano: "Si trasmette in allegato la documentazione richiesta". Esempio in francese: "La pension de révérsion et sóh paiement ne sont pas automatiques. Il est vi vemen t conseillé è la famille d'un fonctionnaire déoédé en activité de s'adresser aussì rapidement que possible à l'administration dont il relevalt".
Soluzione per la correzione anche automatica dei testi professionali: sostituire l’impersonale, scegliendo tra le alternative, o operare automaticamente la correzione. Esempio: " Allego-Alleghiamp / .Invi o- Inviamo in allegato la documentazione richiesta".
*Istruzioni
1.Cercare l'impersonale nei verbi alla terza persona singolare e alla terza personaplurale
2. Cercare l'impersonale nei modi finiti del verbo
3.Cercare 1'impersonale nei verbi al tempo presente, passato prossimo, imperfetto, futuro, futuro anteriore
4.Cercare 1*impersonale nei verbi fatici e azionali
5.Cercare l'impersonale nei verbi in posizione iniziale di periodo, anche quando è preceduto
a,da una determinazione temporale
b.da un nesso che lo connette alla frase/periodo precedente 6.Cercare l'impersonale nei verbi in posizione intermedia di periodo, anche quando è preceduto
a.da una o più frasi secondarie
b. dalla frase principale ed eventualmente una :o<:>più secondarie
7.Escludere
a,'si'passivante
b. Verbi riflessivi
8.Correggere, in modo automatico o interattivo, l'inefficienza dell'impersonale in uno o più dei modi seguenti:
a .esplicitare il soggetto e concordare il verboe gli altri costituenti della frase
b. eliminare la costruzione impersonale
c. riformulare la frase
« Liste
l.White list: verbi che possono essere impersonali e riflessivi 2.Black list: verbi fatici e azionali tipici della costruzione impersonale di interesse
J)Regola Operativa 'Futuro Deontico
Problema tecnico specifico: come identificare il futuro deontico, che rende poco,chiaro o comunque meno incisivo l'obbligo del destinatario del testo. Esempio in italiano: "Gli intervistati forbiranno risposte sulla loro attività professionale". Esempio in francese: "Si vous SQuhaitez des renseignements particulìers à propos de votre situation de futur retraité, demandez-les auService du personnel ou des pensiona de votre admlnistration".
Soluzione per la correzione anche automatica dei testi professionali: sostituire il futuro deontico, scegliendo tra le alternative, o operare automaticamente la correzione. Esempio in italiano: "Gli intervistati dovranno / devono fornire risposte sulla loro attività professionale".
• Istruzióni
1. Cercare il futuro deontico nei verbi attivi e passivi, di seconda e terza persona singolare e plurale, al futuro semplice
2 .Escludere quando
a. L'ausiliare è 'dovere'
b.C'è un predicato nominale
c.Negli intorni occorrono termini come (elenco non esaustivo): 'necessario', 'obbligatorio', 'dovuto', 'tenuto' ecc.
3 .Correggere, in modo automatico o interattivo, l'inefficienza del futuro deontico in uno o più dei modi seguenti:
a.sostituire il futuro deontico con un'espressione equivalente composta con l'ausiliare 'dovere' b.sostituire il futuro deontico con un'espressione equivalente presente nelle Liste
c.eliminare il futuro deontico
d.riformulare la frase
• Liste
1. Black list di fatti lessicali connessi al futuro deontico 2. White lisi di fatti lessicali non connessi al futuro deontico 3. Black list dei verbi attivi
4.Black list dei verbi passivi
5.White list dì espressioni equivalenti al futuro deontico.
Glossario
Per ciascuno dei termini qui elencati viene data una definizione sintetica, volta a chiarire il significato con cui essi sono stati utilizzati in questa sede.
1. Capoverso: il capoverso, segnalato dal ritorno a capo, indica al lettore il passaggio a un argomento diverso, ma correlato a quello del capoverso precedente.
2. Coerenza: qualità relativa al senso complessivo di un testo, data dalla correttezza e comprensibilità della sequenza dei significati. Errori frequenti sono la ripetizione, la contraddizione, il salto logico, l'ambiguità ecc.
3. Complemento indiretto: complemento composto da un nome preceduto da preposizione, o preposizione più articolo, o preposizione articolata o locuzione preposizionale (es. "è stata effettuata la verifica del pagamento dell ' imposta”)
4. Costrutto sintattico: caratteristiche (posizione, funzione ecc.) dei costituenti di una frase (es. soggetto, verbo dipendente, complementi).
5.Cumulo nominale: presenza nella stessa frase di un numero eccessivo di complementi indiretti.
6. Descrizione bibliografica: l'insieme delle voci che definiscono un testo. Le voci possono rappresentare l'autore, il nome del testo, il titolo, la data, l'editore, l'anno di pubblicazione, un luogo specifico (per esempio, la pagina di un libro, l'articolo di una legge ecc.).
7.Determinazione temporale: avverbio, locuzione, complemento ecc.
che indica il tempo (èS, Dal 3 ottobre).
8.Elemento testuale: un testo è composto da diversi elementi. Per esempio, il titolo, il capoverso, le note a piè di pagina ecc.
9.Enclisi: parola priva di accento proprio che viene incorporata alla fine di una parola dotata di accento proprio. In questa sede, si prende in considerazione il pronome 'si' incorporato al termine di un verbo (esempio: 'trattasi')
10. Fatto lessicale: vocabolo (es, "porta") o locuzione (es. "di male in peggio") o polìrèmatica (es. "dare una mano").
11. Fenomeno linguistico: termine generale che indica uno qualsiasi degli elementi informativi e testuali, dei fatti lessicali, dei costrutti sintattici e di altre questioni grammaticali.
12. Frase: detta anche proposizione, è un fenomeno linguistico di senso compiuto che fa parte di un periodo.
13. Futuro deontico: il futuro quando esprime un obbligò (es. il cittadino risponderà ai questionario = il cittadino deve/dovrà rispondere al questionario).
14. Impersonale: il verbo è costruito all'impersonale quando è privo del soggetto esplicito e preceduto dal pronome indefinito 'si' che opera come soggetto del verbo (es. si comunica).
15. Inanimato: nome che rappresenta una cosa (es. documento) o un concetto (es. libertà).
16. Inefficienza: caratteristica di un fenomeno linguistico che diminuisce o annulla 1'effetto che il fenomeno linguistico dovrebbe ottenere su chi legge, ma non è riconducibile a un errore di grammatica. Le inefficienze considerate in questa sede riguardano elementi informativi e testuali, fatti lessicali e costrutti sintattici. Le inefficienze dei testi professionali non coincidono necessariaménte con quelle riscontrabili in altri testi (es. romanzi, sceneggiature eco.).
17. Infinito sostantivato: la nominalizzazione del verbo, cioè l'uso dei verbo come sostantivo, all'infinito con elemento enclitico (es. "al verificarsi" invece di "quando/se si
verifica ".).
18. Lemma: unità grafica che, in una voce dì dizionario, corrisponde convenzionalmente a una unità del lessico (una parola o una lopuzione); può corrispondere a significati diversi (es. "forza") ed essere costituita da più parole (es. "pro capite ").
19. Lessico: insieme dei vocaboli e locuzioni di una lingua.
20. Locuzione: unità linguistica composta da due o più vocaboli. Es, 'forze dell'ordine', 'al fine di'.
21*Morfologico: che attiene alla forma o alle forme che una parola può assumere (es, 'che' ha solo una forma), anche in relazione alle parti del discorso a cui una forma di Una parola può appartenere (es. 'detto'può essere un aggettivo come in "il detto decreto", ma anche il participio passato del verbo "dire", come in "Il Presidente ha detto che...").
22. Named entity: nome di una organizzazione, di una struttura, di una carica ecc,, composto da una o più parole (es. Presidenza del Consiglio),
23, Parti del discorso: classi dì parole che organizzano il lessico in categorie Omogenee soprattutto dal punto di vista morfologico e semantico. Tradizionalmente sono nove: nomi, verbi, pronomi, articoli, aggettivi, avverbi, preposizioni, congiunzioni, interiezioni.
24. Participio presente con valore verbale: il participio presente ha valore verbale quando svolge la funzione di deserivére uno stato o una azione (anche figurata) che transita dalla testa nominale che precede il participio presente agli elementi che lo seguono, o viceversa. Lo stato o l'azione possono essere passati o presentì o futuri indipendentemente dal tempo del verbo della frase principale (es. "un documento attestante il pagamento"). 25. Partizione dì un testo: Sezione, Capìtolo, Paragrafo, Sotto paràgrafo, Blocco tematico, Capoverso. Le prime quattro sono titolate e numerate; la quinta è titolata; la sesta non è né titolata né numerata (tranne che in alcuni particolari testi, come le leggi, gli atti forensi ecc.).
26. Periodo: fenomeno linguistico o insieme di fenomeni linguistici, di senso compiuto, che termina con un punto o punto esclamativo o punto interrogativo.
27. Polirematica: locuzione il cui significato non è desumìbile da quello delle parole che la compongono (es. 'dare una mano', 'ferro da stiro').
28. Pronomi: in questa sede si prende in considerazione il pronome 'stesso' quando ha la funzione di: a) pronome personale, e ìndica la persona senza nominarla.In questo caso, può essere soggetto {es, Mei') o complemento (es. Ma’); b) pronome possessivo, quando indica il possessore e il posseduto (esempio: "dello stesso" usato al posto di "suo’).
29. Segno paragrafematico: marcatore che esprime un valore funzionale o distintivo. Segni paragrafematici possono essere lettere, numeri, forme grafiche (freccette, pallini eco.).
30. Semantico: relativo alla semantica, cioè al significato di un vocabolo, di una locuzione, di una poiibernatida,di una frase ecc-Sl. Sintagma: sequenza di parole che, in una frase, costituisce una unità (es. Gino adora il pane integrale con la nutella). 32. Struttura a lista: detta anche 'elenco puntato', 'bullet point' eoe., è un modo di presentare in verticale le informazioni. La struttura a lista sì compone di due elementi: a} la testa (una frase, una parola) che riunisce le informazioni comuni a b) le voci, che vengono disposte in verticale, che sono precedute da un marcatore paragrafematico (es. un numero, un segno grafico eoe.) e che sono separate tra loro da un ritorno a capo.
3<;>3, Subordinata completiva: frase subordinata che svolge una necessaria funzione di argomento della frase principale (es. il contratto prevede che si debba erogare il pagamento entro tre mesi).
34. Testa nominale: il nome che, in un sintagma, è l'elemento principale del sintagma (es. ha letto un libro molto difficile). In questo caso, il sintagma si dice 'sintagma nominale'.
35. Verbo azionale: vèrbo che esprime una azione (es. inviare). . Verbo fatico: verbo che esprime l'azione del dire (es. comunicare).
RIVENDICAZIONI
1.Metodo implementato informaticamente per identificare e correggere, in via automatica ed eventualmente anche parzialmente interattiva, inefficienze di fenomeni linguistici di un testo professionale in formato digitale, causate da elementi informativi e testuali, fatti lessicali e costrutti sintattici che generano incomprensioni edequivoci, opacità, scarsa chiarezza, irrazionalità e ridondanza dei contenuti espositivi, comprendente le fasi di:
definizione di regole operative, che comprendono istruzioni e liste che hanno la funzione di identificare le inefficienze dei fenomeni linguistici del testo professionale;
definizione di un ordine di identificazione dei fenomeni linguistici secondo il quale devono essere identificate le inefficienze;
combinazione e implementazione delle istruzioni e delle liste, e dell'ordine di identificazione, in un modulo informatico che interagisce con una pluralità di altri moduli informatici per l’elaborazione del testo professionale e per il trattamento automatico del linguaggio;
esecuzione del modulo informatico per 1'identificazione delle inefficienze dei fenomeni linguistici del testo professionale;
correzione delle inefficienze dei fenomeni linguistici identificati.
2.Metodo, secondo la Rivendicazione 1, in cui le inefficienze dei fenomeni linguistici sono relative ad almeno un fenomeno linguistico tra: Capoverso, Cumuli Nominali, Descrizione Bibliografica, Enclisi, Futuro deontico, Impersonale, Lessico, Participio Presente ConValore Verbale, Periodo Lungo, Pronomi, Struttura A Lista, Titolo.
3. Metodo, secondo la rivendicazione 2, in cui:
per il fenomeno linguistico Gapoverso, l'inefficienza dei fenomeni linguistici comprende almeno uno tra: il capoversó fuoriposto e l'a capo forzato;
per il fenomeno linguistico Cumuli Nominali, l’inefficienza dei fenòmeni linguistici comprende almeno uno tra: eccesso di complementi indiretti, eccesso di parole, scarsità di verbi attivi;
per il fenomeno linguistico Descrizione Bibliografica,
1*inefficienza dei fenomeni linguistici comprende almeno uno; tra: eccesso dì informazioni relative ai testi citati interruzione del discorso principale, posticipazione del discorso principale;
per il fenomeno linguistico Futuro Deontico, 1'inefficienza dei fenomeni linguistici comprende almeno uno tra: uso di una forma verbale desueta, ambiguità del valore imperativo;
per il fenomeno linguistico Impersonale, l'inefficienza dei fenomeni linguistici comprende almeno uno tra: ambiguità del soggetto, forma verbale usata con eccessiva frequenza;
per il fenomeno linguistico Lessico, 1 inefficienza dei fenomeni linguistici comprende almeno uno tra: parola o locuzione usata con eccessiva frequenza, disusata, enfatica, errata, impropria, più lunga di un suo sinonimo;
per il fenomeno linguistico Participio Presente Con Valore Verbale, l'inefficienza dei fenomenilinguistici comprende almeno uno tra: forma verbale disusata nella lingua comune; forma verbale che favorisce le inefficienze dei cumuli nominali;
per il fenomeno linguistico Periodo Lungo, l'inefficienza dei fenomeni linguistici comprende almeno uno tra: eccesso di informazioni, sintassi involuta, eccesso di numero di parole; per II fenomeno linguistico Enclisi, 1*inefficienza dei fenomeni linguistici comprende almeno uno tra: fenomeno disusato, ambiguità del significato;
per il fenomeno linguistico Pronomi, 1*inefficienza dei fenomeni linguistici comprende almeno uno tra: forma disusata del pronome base, eccesso di numero di parole, ambiguità del significato;
per il fenomeno linguistico Struttura A Lista, l'inefficienza i dei fenomeni linguistici comprende almeno uno tra: punteggiatura scorretta, eccesso di informazioni;
per il fenomeno linguistica Titolo, l'inefficienza dei fenomeni linguistici comprende almeno uno tra: informazioni che non definiscono l'argomento Specifico del testo, informazioni che non indicano l'urgenza della lettura.
4 ,Metodo, secondo una qualsiasi delle rivendicazioni
precedenti, in cui l'ordine di identificazione dei fenomeni linguistici secondo il quale devono essere identificate le inefficienze è il seguente: Lessico, Periodo Lungo,
Capoverso, Descrizione Bibliografica, Struttura A Lista, Participio Presente Con Valore verbale, Enclisi, Pronomi, Cumuli Nominali, Impersonale, Futuro Deontico, Titolo.
5.Metodo, secondo una qualsiasi delle rivendicazioni
precedenti, in cui, per un primo gruppo dei fenomeni linguistici, le istruzioni e le liste delle regole operative sono atte a identificarele inefficienze dei fenomeni linguistici ielative alméno a una porzione di frase e/o una frase e/o una porzione di testo; e sono atte a correggere le inefficienze identificate mediante almeno una delle seguenti funzioni: eliminazione, sostituzione, modifica,
rlformulazione /o spostamento della porzione di frase, della frase o della porzione di testo.
6, Metodo, secondo la rivendicazione 5), in cui il primo gruppo dei fenomeni linguistici comprende almeno uno dei seguenti fenomeni linguistici: Capoverso, Cumuli Nominali, Descrizione Bibliografica, Periodo Lungo, Struttura A Lista, Titolo.
7.Metodo, secondo unaQualsiasi delle rivendicazioni precedenti, in cui, per un secondo gruppo dei fenomeni linguistici, le istruzioni e le liste delle regole operative sono atte a identificare le inefficienze dei fenomeni linguistici relative almeno a una parola o locuzione; e sono atte a correggere la inefficienze identificate mediante almeno una delle seguenti funzioni: eliminazione, sostituzione, modifica, e/o spostamento della parola o della locuzione.
8.Metodo, secondo la rivendicazione 7), in cui il secondo gruppo dei fenomeni linguistici comprende almeno uno dei seguenti fenomeni linguistici: Lessico, Participio Presente, Enclisi, Pronomi, Impersonale, Futuro Deontico.
9,Metodo, secondo una qualsiasi delle rivendicazioni precedenti, in Cui le istruzioni, Che sono una serie di comandi formalizzati, e le liste, che sono repertori di informazioni linguistiche appositamente selezionate, relative a fattilessicali e costrutti sintattici, che contestualizzano e integrano le istruzioni, comprendono:
per il fenomeno linguistico Capoverso:
Analizzare le prime N parole,dove:N è uri intero maggioreo uguale a 1, del primo periodo:di ciascun capOverso del testo
Identificare le inefficienze dei fatti lessicali sulla base delle relative liste
Identificare le inefficienze dei rapporti logico-semantici tra il capoverso corrente e il precedente;
per il fenomeno linguisticoDescrizioneBibliografica;
Escludere le note a piè dì pagina è làbibliografia
Cercare almeno una voce che costituisce la descrizione bibliografica tra: autore, nome del testo, titolo, data, editore, anno dipubblicazione, luogo specifico,sulla base delle relative liste
Cercare se una o più di tali voci ricorrono nell'intorno ± N parole dì una voce,dove N è un intero maggiore o uguale a 1
Identificare 1'inefficienza quando nell'intorno ±N ci sono
più di X voci, dove X è un intero maggiore o uguale a 1;
per il fenomeno linguistico Struttura A Lista:
Cercare un segmento di testo;in cui compare almeno un segno paragrafematico ed eseguite almeno una delle seguenti fasi:
Identificare l'inefficienza dei segni paragrafematici non ammessi nelle relative liste
Identificare l'inefficienza quando il segno paragrafematico è uno solo
Identificare1 'inefficienza quando il primo segno paragrafematico non è preceduto da due punti
Identificare l'inefficienza quando le voci che corrispondono ai segni paragrafematici non terminano con il punto e virgola
Identificare 1’inefficienza quando l’ultima voce dèlia lista non termina con il punto
Identificare 1<1>inefficienza quando il numero di parole di
tutta la lista supera N, dove N è un intero maggiore o uguale a 1;
per il fenomeno linguistico Cumuli Nominali:
Calcolare i complementi indiretti in un periodo ø in una sua a, frase anche senza vèrbo
Nel calcolo, assegnare valore 0
alle preposizioni contenute nelle polirematiche, sulla base delle relative liste
alle preposisioni contenute nelle named entities, sulla base delle relative liste
alle preposizioni contenute negli incisi tra parentesi in posizione mediana nel periodo, se contengono un verbo
Nel calcolo, assegnare valore 1 alla locuzione preposizionale composta con un verbo, sulla base delle relative liste
Identificare l'Inefficienza quando il numero di preposizioni è maggiore di N, dove N è un intero maggiore o uguale a 1;
per il fenomeno linguistico Futuro Deontico,in caso della lingua italiana:
Identificare l’inefficienza nei verbi attivi e passivi, di seconda e terza persona singolare e plurale, al futuro semplice, preceduti da un soggetto e seguiti da un complemento
Escludere quando l'ausiliare del verbo è "dovere"
Escludere quando c’è un predicato nominale
Escludere quando in un intorno di ± N parole, dove N è un intero maggiore o uguale a 1, occorrono fatti lessicali che esprimono obbligo e necessità confrontando le relative liste, e fatti lessicali e costrutti sintattici non connessi al futuro deontico confrontando le relative liste;
per il fenomeno linguistico Impersonale, in caso delia
lingua italiana:
Cercare "sì" seguito da verbo di modo finito alla terza persona singolare o alla terza persona plurale, nei tempi 3 presente, passato prossimo, imperfetto, futuro, futuro
anteriore
Escludere il "si"
Escludere quando il verbo è riflessivo
Identificare l<r>inefficienza del "si" seguito da verbo fatico o azionale tipico sulla base delle relative liste
Identificare 1'inefficienza del "si" seguitò da verbo non ammissibile seguito da frase o complemento sulla base delle relative liste
Escludere quando il verbo è in posizione finale di periodo;
per il fenomeno linguistico Lessico:
Disambiguare i fatti lessicali che appartengono a più di un lemma e/o parte del discorso
Cercare i fatti lessicali che appartengono ad un solo lemma o a una sola parte del discorso
Per ogni fatto lessicale che risulta da queste due operazioni, identificare l'inefficienza sulla base delle relative liste;
per il fenomeno linguistico Participio Presente Con Valore Verbale,in caso della Ungi italiana:
Escludere il participio presente con funzione di aggettivo
Escludere il participio presente preceduto da articolo o preposizione articolata o locuzione preposizionale o verbo o pronome relativo "che"
Escludere il participio presente seguito da
Punteggiatura tranne virgolette doppie, trattini, parentesi e due punti che introducono una enumerazione, eventualmente anche disposte in una struttura a lista
Pronome: (tranne il pronome relativo indiretto)
Verbo
identificare 1'inefficienza del participio presente preceduto da testa nominale comprèse quelle composte anche da un numero cardinale, e seguito da testa nominale o da frase completiva introdotta da "che";
per il fenomeno linguistico Enclisi,in caso della lingua italiana:
Cercare le sequenze di parole:
articolo o preposizione articolata
verbo all'infinito che termina in "-arsi "/"-ersi"/" irsi"
preposizione o preposizione articolata o locuzione preposizionale
Identificare l'inefficienza dei verbi inammissibili sulla base delle relative liste
Cercare "si" pronome riflessivo
scludere
I verbi riflessivi enclitici
I modi imperativo, gerundio
II participio passato
Identificare 1'inefficienza dei verbi semplici di modo finito, forma attiva, alla terza persona singolare e plurale sulla base delle relative liste
Identificare l'inefficienza dei verbi sémplici di mòdo infinito, tempo presente, preceduti da preposizione o congiunzione ø locuzione che precede 1 "si" enclitici, oppure precèduti da un verbo ausiliare, modale o aspettuale in una costruzione riflessiva o passivizzante sulla base delle relative liste
Identificare l'inefficienza degli ausiliari dei verbi composti, alla terza persona singolare e alla terza persona plurale, di forma attiva o passiva, di modo finito o di modo infinito tempo passato sulla base delle relative liste;
per il fenomeno linguistico Pronomi, in caso della lingua italiana:
Identificare quando la forma "stess(o,a,i,e) " è preceduta da articolo o preposizione articolata e seguita da
articolo o verbo o congiunzione o segno di punteggiatura; oppure
da preposizione semplice o articolata in un sintagma preposizionale non ammesso, sulla base delle relative liste. io. Sistema informatizzato configurato per implementare il metodo secondo una qualsiasi delle rivendicazioni precedenti, che comprende:
un modulo informatico per l'identificazione, segnalazione e correzione delle inefficienze linguistiche dei testi professionali che combina e implementa le istruzioni e le liste delle regole operative e l'ordine di identificazione;
almeno uno dei seguenti moduli informatici: un editor di testi e uno strumento di Naturai Language Processing.

Claims (8)

  1. RIVENDICAZIONI 1. Metodo implementato informaticamente da parte di un calcolatore per identificare e correggere, in via automatica ed eventualmente anche parzialmente interattiva, inefficienze di fenomeni linguistici di un testo professionale in formato digitale, causate da elementi informativi e testuali, fatti lessicali e costrutti sintattici che generano incomprensioni ed equivoci, opacità, scarsa chiarezza, irrazionalità e ridondanza dei contenuti espositivi, comprendente le fasi di; definizione e implementazione informatica di regole operative, che comprendono istruzioni e liste che hanno la funzione di identificare le inefficienze dei fenomeni linguistici del testo professionale ; definizione e implementazione informatica di un ordine secondo il quale devono essere identificate le inefficienze dei fenomeni linguistici ; combinazione e implementazione informatica delle istruzioni e delle liste, e dell'ordine di identificazione, in un modulo informatico che interagisce con una pluralità di altri moduli informatici per l’elaborazione del testo professionale e per il trattamento automatico del linguaggio; esecuzione del modulo informatico tramite il calcolatore per l'identificazione delle inefficienze dei fenomeni linguistici del testo professionale; correzione in via automatica, e parzialmente interattiva tramite messaggi di correzione in finestre di dialogo, e tramite il calcolatore delle inefficienze dei fenomeni linguistici identificati; metodo in cui l'ordine secondo il quale devono essere identificate le inefficienze è uno dei seguenti: primo flusso logico: Lessico, Periodo Lungo, Capoverso, Descrizione Bibliografica, Struttura A Lista, Participio presente Con Valore Verbale, Enclisi, Pronomi, Cumuli Nominali, Impersonale, Futuro Deontico, Titolo, secondo flusso logico: Titolo, Lessico, Periodo Lungo, Struttura A Lista, Descrizione Bibliografica, Capoverso, Pronomi, Cumuli Nominali, Participio Presente, Enclisi, Impersonale, Futuro Deontico, terzo flusso logico: Impersonale, Futuro Deontico, Participio Presente, Enclisi, Pronomi, Lessico, Cumuli Nominali, Struttura A Lista, Descrizione Bibliografica, Capoverso, Periodo Lungo, Titolo, quarto flusso logico: Titolo, Impersonale, Futuro Deontico, Participio Presente, Enclisi, Pronomi, Struttura A Lista, Periodo Lungo, Descrizione Bibliografica, Cumuli Nominali, Lessico, Capoverso.
  2. 2. Metodo, secondo la rivendicazione 1 in cui: per il fenomeno linguistico Capoverso, l'inefficienza dei fenomeni linguistici, da identificare informaticamente, comprende almeno uno tra: il capoverso fuori posto e l'a capo forzato; per il fenomeno linguistico Cumuli Nominali, l'inefficienza dei fenomeni linguistici, da identificare informaticamente, comprende almeno uno tra: eccesso di complementi indiretti, eccesso di parole, scarsità di verbi attivi; per il fenomeno linguistico Descrizione Bibliografica, l'inefficienza dei fenomeni linguistici, da identificare informaticamente, comprende almeno uno tra: eccesso di informazioni relative ai testi citati, interruzione del discorso principale, posticipazione del discorso principale; per il fenomeno linguistico Futuro Deontico, l'inefficienza dei fenomeni linguistici, da identificare informaticamente, comprende almeno uno tra: uso di una forma verbale desueta, ambiguità del valore imperativo; per il fenomeno linguistico Impersonale, l'inefficienza dei fenomeni linguistici, da identificare informaticamente, comprende almeno uno tra: ambiguità del soggetto, forma verbale usata con eccessiva frequenza; per il fenomeno linguistico Lessico, l'inefficienza dei fenomeni linguistici, da identificare informaticamente, comprende almeno uno tra: parola o locuzione usata con eccessiva frequenza, disusata, enfatica, errata, impropria, più lunga di un suo sinonimo; per il fenomeno linguistico Participio Presente Con Valore Verbale, l'inefficienza dei fenomeni linguistici, da identificare informaticamente, comprende almeno uno tra: forma verbale disusata nella lingua comune; forma verbale che favorisce le inefficienze dei cumuli nominali; per il fenomeno linguistico Periodo Lungo, l'inefficienza dei fenomeni linguistici, da identificare informaticamente, comprende almeno uno tra: eccesso di informazioni, sintassi involuta, eccesso di numero di parole; per il fenomeno linguistico Enclisi, l'inefficienza dei fenomeni linguistici, da identificare informaticamente, comprende almeno uno tra: fenomeno disusato, ambiguità del significato; per il fenomeno linguistico Pronomi, l'inefficienza dei fenomeni linguistici, da identificare informaticamente, comprende almeno uno tra: forma disusata del pronome base, eccesso di numero di parole, ambiguità del significato; per il fenomeno linguistico Struttura A Lista, l'inefficienza dei fenomeni linguistici, da identificare informaticamente, comprende almeno uno tra: punteggiatura scorretta, eccesso di informazioni; per il fenomeno linguistico Titolo, l'inefficienza dei fenomeni linguistici, da identificare informaticamente, comprende almeno uno tra: informazioni che non definiscono l'argomento specifico del testo, informazioni che non indicano l'urgenza della lettura
  3. 3. Metodo, secondo una qualsiasi delle rivendicazioni precedenti, in cui, per un primo gruppo dei fenomeni linguistici, le istruzioni e le liste delle regole operative sono atte a identificare le inefficienze dei fenomeni linguistici relative almeno a una porzione di frase e/o una frase e/o una porzione di testo; e sono atte a correggere, in via automatica, e parzialmente interattiva tramite messaggi di correzione in finestre di dialogo, e tramite il calcolatore, le inefficienze identificate mediante almeno una delle seguenti funzioni: eliminazione, sostituzione, modifica, riformulazione e/o spostamento della porzione di frase, della frase o della porzione di testo.
  4. 4. Metodo, secondo la rivendicazione 3, in cui il primo gruppo dei fenomeni linguistici comprende almeno uno dei seguenti fenomeni linguistici: Capoverso, Cumuli Nominali, Descrizione Bibliografica, Periodo Lungo, Struttura A Lista, Titolo.
  5. 5. Metodo, secondo una qualsiasi delle rivendicazioni precedenti in cui, per un secondo gruppo dei fenomeni linguistici, le istruzioni e le liste delle regole operative sono atte a identificare le inefficienze dei fenomeni linguistici relative almeno a una parola o locuzione; e sono atte a correggere, in via automatica, e parzialmente interattiva tramite messaggi di correzione in finestre di dialogo, e tramite il calcolatore, le inefficienze identificate mediante almeno una delle seguenti funzioni: eliminazione, sostituzione, modifica, e/o spostamento della parola o della locuzione.
  6. 6. Metodo, secondo la rivendicazione 5, in cui il secondo gruppo dei fenomeni linguistici comprende almeno uno dei seguenti fenomeni linguistici: Lessico, Participio Presente, Enclisi, Pronomi, Impersonale, Futuro Deontico.
  7. 7, Metodo, secondo una qualsiasi delle rivendicazioni precedenti, in cui le istruzioni, che sono una serie di comandi formalizzati, e le liste, che sono repertori di informazioni linguistiche appositamente selezionate, relative a fatti lessicali e costrutti sintattici, che contestualizzano e integrano le istruzioni, comprendono : per il fenomeno linguistico Capoverso: Analizzare le prime N parole, dove N è un intero maggiore o uguale a 1, del primo periodo di ciascun capoverso del testo professionale Identificare le inefficienze dei fatti lessicali sulla base delle relative liste Identificare le inefficienze dei rapporti logico-semantici tra il capoverso corrente e il precedente; per il fenomeno linguistico Descrizione Bibliografica: Escludere le note a piè di pagina e la bibliografia Cercare almeno una voce che costituisce la descrizione bibliografica tra: autore, nome del testo, titolo, data, editore, anno di pubblicazione, luogo specifico, sulla base delle relative liste Cercare se una o più di tali voci ricorrono nell'intorno ± N parole di una voce, dove N è un intero maggiore o uguale a 1 Identificare l'inefficienza quando nell'intorno ± N ci sono più di X voci, dove X è un intero maggiore o uguale a 1; per il fenomeno linguistico Struttura A Lista: Cercare un segmento di testo in cui compare almeno un segno paragrafematico ed eseguire almeno una delle seguenti fasi: Identificare l'inefficienza dei segni paragrafematici non ammessi nelle relative liste Identificare l'inefficienza quando il segno paragrafematico è uno solo Identificare l'inefficienza quando il primo segno paragrafematico non è preceduto da due punti Identificare l'inefficienza quando le voci che corrispondono ai segni paragrafematici non terminano con il punto e virgola Identificare l'inefficienza quando l'ultima voce della lista non termina con il punto Identificare l'inefficienza quando il numero di parole di tutta la lista supera N, dove N è un intero maggiore o uguale a 1; per il fenomeno linguistico Cumuli Nominali: Calcolare i complementi indiretti in un periodo o in una sua frase anche senza verbo Nel calcolo, assegnare valore 0 alle preposizioni contenute nelle polirematiche, sulla base delle relative liste alle preposizioni contenute nelle named entities, sulla base delle relative liste alle preposizioni contenute negli incisi tra parentesi in posizione mediana nel periodo, se contengono un verbo Nel calcolo, assegnare valore 1 alla locuzione preposizionale composta con un verbo, sulla base delle relative liste Identificare l'inefficienza quando il numero di preposizioni è maggiore di N, dove N è un intero maggiore o uguale a 1; per il fenomeno linguistico Futuro Deontico,in caso della lingua italiana: Identificare l'inefficienza nei verbi attivi e passivi, di seconda e terza persona singolare e plurale, al futuro semplice, preceduti da un soggetto e seguiti da un complemento Escludere quando l'ausiliare del verbo è "dovere" Escludere quando c'è un predicato nominale Escludere quando in un intorno di ± N parole, dove N è un intero maggiore o uguale a 1, occorrono fatti lessicali che esprimono obbligo e necessità confrontando le relative liste, e fatti lessicali e costrutti sintattici non connessi al futuro deontico confrontando le relative liste; per il fenomeno linguistico Impersonale, in caso della lingua italiana : Cercare "si" seguito da verbo di modo finito alla terza persona singolare o alla terza persona plurale, nei tempi presente, passato prossimo, imperfetto, futuro, futuro anteriore Escludere il "si" passivante Escludere quando il verbo è riflessivo Identificare l'inefficienza del "si" seguito da verbo fatico o azionale tipico sulla base delle relative liste Identificare l'inefficienza del "si" seguito da verbo non ammissibile seguito da frase o complemento sulla base delle relative liste Escludere quando il verbo è in posizione finale di periodo; per il fenomeno linguistico Lessico: Disambiguare i fatti lessicali che appartengono a più di un lemma e/o parte del discorso Cercare i fatti lessicali che appartengono ad un solo lemma o a una sola parte del discorso Per ogni fatto lessicale che risulta da queste due operazioni, identificare l'inefficienza sulla base delle relative liste; per il fenomeno linguistico Participio Presente Con Valore Verbale,in caso della lingua italiana: Escludere il participio presente con funzione di aggettivo Escludere il participio presente preceduto da articolo o preposizione articolata o locuzione preposizionale o verbo o pronome relativo "che" Escludere il participio presente seguito da Punteggiatura tranne virgolette doppie, trattini, parentesi e due punti che introducono una enumerazione, eventualmente anche disposte in una struttura a lista Pronome, tranne il pronome relativo indiretto Verbo Identificare l'inefficienza del participio presente preceduto da testa nominale comprese quelle composte anche da un numero cardinale, e seguito da testa nominale o da frase completiva introdotta da "che"; per il fenomeno linguistico Enclisi,in caso della lingua italiana Cercare le sequenze di parole: articolo o preposizione articolata verbo all'infinito che termina in "-arsi"/"-ersi"/"-irsi" preposizione o preposizione articolata o locuzione preposizionale Identificare l'inefficienza dei verbi inammissibili sulla base delle relative Liste Cercare "si" pronome riflessivo Escludere I verbi riflessivi enclitici I modi imperativo, gerundio II participio passato Identificare l’inefficienza dei verbi semplici di modo finito, forma attiva, alla terza persona singolare e plurale sulla base delle relative liste Identificare l'inefficienza dei verbi semplici di modo infinito, tempo presente, preceduti da preposizione o congiunzione o locuzione che precede i "si" enclitici, oppure preceduti da un verbo ausiliare, modale o aspettuale in una costruzione riflessiva o passivizzante sulla base delle relative liste Identificare l'inefficienza degli ausiliari dei verbi composti, alla terza persona singolare e alla terza persona plurale, di forma attiva o passiva, di modo finito o di modo infinito tempo passato sulla base delle relative liste; per il fenomeno linguìstico Pronomi, in caso della lingua italiana: Identificare quando la forma "stess/o/a/i/e" è preceduta da articolo o preposizione articolata e seguita da articolo o verbo o congiunzione o segno di punteggiatura; oppure da preposizione semplice o articolata in un sintagma preposizionale non ammesso, sulla base delle relative liste.
  8. 8. Sistema informatizzato configurato per implementare il metodo secondo una qualsiasi delle rivendicazioni precedenti, che comprende un calcolare su cui è installato: il modulo informatico per l'identificazione, segnalazione e correzione delle inefficienze linguistiche dei testi professionali che combina e implementa le istruzioni e le liste delle regole operative e l'ordine di identificazione; e almeno uno dei seguenti moduli informatici: un editor di testi e uno strumento di Naturai Language Processing, in cui il calcolatore è atto ad eseguire i suddetti moduli informatici per l'identificazione delle inefficienze dei fenomeni linguistici del testo professionale e correggere in via automatica, e parzialmente interattiva tramite messaggi di correzione in finestre di dialogo, le inefficienze dei fenomeni linguistici identificati.
IT102016000074756A 2016-07-18 2016-07-18 sistema e metodo per identificare, segnalare e correggere inefficienze linguistiche e comunicative della scrittura professionale IT201600074756A1 (it)

Priority Applications (1)

Application Number Priority Date Filing Date Title
IT102016000074756A IT201600074756A1 (it) 2016-07-18 2016-07-18 sistema e metodo per identificare, segnalare e correggere inefficienze linguistiche e comunicative della scrittura professionale

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT102016000074756A IT201600074756A1 (it) 2016-07-18 2016-07-18 sistema e metodo per identificare, segnalare e correggere inefficienze linguistiche e comunicative della scrittura professionale

Publications (1)

Publication Number Publication Date
IT201600074756A1 true IT201600074756A1 (it) 2018-01-18

Family

ID=58455385

Family Applications (1)

Application Number Title Priority Date Filing Date
IT102016000074756A IT201600074756A1 (it) 2016-07-18 2016-07-18 sistema e metodo per identificare, segnalare e correggere inefficienze linguistiche e comunicative della scrittura professionale

Country Status (1)

Country Link
IT (1) IT201600074756A1 (it)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0658259A1 (en) * 1992-09-04 1995-06-21 Caterpillar Inc. Integrated authoring and translation system
US20080195379A1 (en) * 1999-12-02 2008-08-14 Vanderwold Linda B Style-checking method and apparatus for business writing
US20100257182A1 (en) * 2009-04-06 2010-10-07 Equiom Labs Llc Automated dynamic style guard for electronic documents
US20110313757A1 (en) * 2010-05-13 2011-12-22 Applied Linguistics Llc Systems and methods for advanced grammar checking

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0658259A1 (en) * 1992-09-04 1995-06-21 Caterpillar Inc. Integrated authoring and translation system
US20080195379A1 (en) * 1999-12-02 2008-08-14 Vanderwold Linda B Style-checking method and apparatus for business writing
US20100257182A1 (en) * 2009-04-06 2010-10-07 Equiom Labs Llc Automated dynamic style guard for electronic documents
US20110313757A1 (en) * 2010-05-13 2011-12-22 Applied Linguistics Llc Systems and methods for advanced grammar checking

Similar Documents

Publication Publication Date Title
Jagaiah et al. Syntactic complexity measures: variation by genre, grade-level, students’ writing abilities, and writing quality
Marton et al. Dependency parsing of Modern Standard Arabic with lexical and inflectional features
Nagy English for special purposes: Specialized languages and problems of terminology
Vis et al. Diachronic changes in subjectivity and stance–A corpus linguistic study of Dutch news texts
US20090019362A1 (en) Automatic Reusable Definitions Identification (Rdi) Method
Unuabonah et al. Commentary pragmatic markers in Nigerian English
Larsson Grammatical stance marking across registers: Revisiting the formal-informal dichotomy
Ahmad et al. Use of modal verbs as stance markers in Pakistani English newspaper editorials
Kashyap The pragmatic principles of agreement in Bajjika verbs
Zidan A linguistic analysis of some problems of Arabic-English translation of legal texts, with special reference to contracts
Meurman-Solin The connectives And, For, But, and Only as clause and discourse type indicators in 16th-and 17th-century epistolary prose
Xia et al. “Please let me know” Lexical bundles in business emails by business English learners and working professionals
Ruohonen Assessing the readability of policy documents on the digital single market of the European Union
Pérez-Llantada ‘Glocal’Rhetorical Practices in Academic Writing: An intercultural rhetoric approach to L2 English discoursal hybridisation
Ferrari et al. QuOD: an NLP tool to improve the quality of business process descriptions
López Arroyo et al. The use of-ing and-ndo forms in sales contracts: An English-Spanish contrastive analysis
Alexandris English, German and the “Semi-Professional” International Translator: A Morphological Approach to Implied Connotative Features: A Morphological Approach to Implied Connotative Features
IT201600074756A1 (it) sistema e metodo per identificare, segnalare e correggere inefficienze linguistiche e comunicative della scrittura professionale
Sarveswaran et al. Hierarchical tag-set for rule-based processing of Tamil language
Wright Is legal jargon a restrictive practice?
Harrison Variation in present Norfolk Island speech: a study of stability and instability in diglossia
Fillmore A valency dictionary of English
Vincze The relationship of dependency relations and parts of speech in Hungarian
ABBAS Semi-Semantic Annotation: A guideline for the URDU. KON-TB treebank POS annotation
Atalay et al. A natural language processing approach to predicting the persuasiveness of marketing communications