ITUB20154726A1 - Metodo e sistema per l?estrazione di riassunti da testi con sottolineatura strutturata. - Google Patents

Metodo e sistema per l?estrazione di riassunti da testi con sottolineatura strutturata. Download PDF

Info

Publication number
ITUB20154726A1
ITUB20154726A1 ITUB2015A004726A ITUB20154726A ITUB20154726A1 IT UB20154726 A1 ITUB20154726 A1 IT UB20154726A1 IT UB2015A004726 A ITUB2015A004726 A IT UB2015A004726A IT UB20154726 A ITUB20154726 A IT UB20154726A IT UB20154726 A1 ITUB20154726 A1 IT UB20154726A1
Authority
IT
Italy
Prior art keywords
text
level
relevance
user
electronic
Prior art date
Application number
ITUB2015A004726A
Other languages
English (en)
Inventor
Giampaolo Maurizio Ferradini
Francesco Frassinelli
Original Assignee
Kjuicer Com S R L
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kjuicer Com S R L filed Critical Kjuicer Com S R L
Priority to ITUB2015A004726A priority Critical patent/ITUB20154726A1/it
Priority to US15/769,214 priority patent/US11321416B2/en
Priority to EP16823354.2A priority patent/EP3365814B1/en
Priority to PCT/IT2016/000245 priority patent/WO2017068606A1/en
Publication of ITUB20154726A1 publication Critical patent/ITUB20154726A1/it

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04812Interaction techniques based on cursor appearance or behaviour, e.g. being affected by the presence of displayed objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04817Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0483Interaction with page-structured environments, e.g. book metaphor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)
  • Peptides Or Proteins (AREA)

Description

Metodo e sistema per l'estrazione di riassunti da testi con sottolineatura strutturata
La presente invenzione riguarda un metodo e sistema per l'estrazione di riassunti da testi con sottolineatura strutturata.
Più precisamente, la presente invenzione produce un sistema che migliora l'efficienza dei processi di lettura e apprendimento consentendo un uso innovativo della pratica delle sottolineature e aumentandone l'efficacia; creando rappresentazioni testuali gerarchiche multiple, e quindi con diversi livelli di sintesi, significativamente più efficienti di quelle tradizionali; abbinando alla visualizzazione delle stesse modalità di “navigazione" dei testi che modificano significativamente le riletture successive alla prima -o di lettori successivi- rendendole molto più rapide e più efficaci per la acquisizione o il recupero delle informazioni; permettono di fruire dei contenuti di un testo in maniera non più solo lineare ma anche ad accesso casuale. L'invenzione consente altresì ai lettori di arricchire i testi che essi leggono o studiano, permettendo loro di mostrare il proprio taglio di lettura in modo più completo; di integrare il testo originale con il proprio contributo; di creare percorsi di lettura personali o personalizzati per altri lettori; di combinare più testi fra loro, completi dei benefici illustrati poco sopra.
Stato dalla tecnica
E' nota a tutti la tecnica della sottolineatura di un testo per individuare i passaggi e i concetti rilevanti. Con la tecnica della sottolineatura;
- il testo rimane esteso, e conseguentemente le sottolineature rimangono sparse per tutto il testo;
- Il tempo per rileggere si può ridurre, ma rimane comunque piuttosto lungo;
- Si ha la tendenza a rileggere il contesto intorno alle sottolineature stesse;
- spesso si crea uno “stacco" importante fra sottolineature e testo originale; oppure
- le sottolineature sono troppo estese e quindi mancano di sintesi.
Dalle sottolineature si può estrarre un riassunto. Tuttavia, se le sottolineature sono molte, si ha un guadagno relativamente ridotto in fase di rilettura, o per un lettore successivo, in quanto il testo estratto è ancora piuttosto lungo.
Viceversa qualora invece il lettore mantenga il numero e la estensione delle proprie sottolineature esiguo, in modo da evidenziare solo i concetti realmente importanti, si crea una frattura troppo ampia fra il testo originale, ricco di informazioni, e l'esiguità del nuovo testo ricavato dalle sottolineature, rendendo anche in questo caso la rilettura meno utile, pur se per una ragione differente.
Vi è quindi la necessità di un metodo per una selezione/estrazione strutturata di informazioni da un testo, per l'eventuale ri-fruizione o condivisione, che risolva i problemi della tecnica nota, ed in particolare raggiunga almeno parzialmente i seguenti effetti;
1. strutturare le informazioni contenute nel testo per renderle accessibili facilmente in seguito,* ;2. fissare i concetti trovati in un testo, in modo da non dover rifare il medesimo studio in successive riletture, magari a distanza di molto tempo; ;3. rendere più facile il trasferimento della conoscenza acquisita dal lettore a terzi; ;4. evitare ai lettori, o quantomeno a determinate categorie di lettori, di ripetere integralmente il lavoro di studio effettuato dal primo di essi; ;5. "trattare" i testi scritti in modo che siano poi navigabili come i contenuti presenti su siti web ben strutturati, senza dover costruire un sito, e addirittura ottenere una navigabilità testuale anche più flessibile di quella consentita dall'html. ;6. eliminare la necessità di procedere linearmente nella lettura; ;7, aumentare in maniera rilevante la velocità di lettura per testi il cui contenuto è già familiare al lettore o di apprendimento laddove questi ne è digiuno; 8, integrare un testo con materiale aggiuntivo mantenendone 1'integrità e non incorrere nella creazione di un'opera derivata o un plagio; ;9. creare un'opera che sia il remix di diverse opere, mantenendone l'integrità; ;10. trasformare in slides e bullet points un contenuto testuale senza ricorrere a copia-incolla e formattazioni ripetute. ;Scopo della presente invenzione è un metodo ed un sistema che risolva almeno in parte i problemi della tecnica anteriore e raggiunga almeno in parte gli effetti sopra menzionati. ;E' oggetto della presente invenzione un metodo ed un sistema secondo le allegate rivendicazioni, che fanno parte integrante della presente descrizione. ;L'invenzione verrà ora descritta a titolo illustrativo ma non limitativo, con particolare riferimento ai disegni delle figure allegate, in cui; ;- la figura 1 mostra una rappresentazione a espansioni consecutive dei livelli di struttura ottenuti con il metodo secondo l'invenzione; ;- la figura 2 mostra una seconda rappresentazione piramidale dei livelli di struttura ottenuti con il metodo secondo 1'invenzione; ;- la figura 3 mostra una implementazione del metodo con l'impiego di un database secondo 1'invenzione; ;- la figura 4 mostra un diagramma di flusso di una forma di realizzazione del metodo secondo 1'invenzione; ;- la figura 5 mostra un diagramma di flusso di una differente forma di realizzazione del metodo secondo 1'invenzione; ;- la figura 6 mostra un diagramma di flusso di una ulteriore differente forma di realizzazione del metodo secondo l'invenzione; ;- la figura 7 mostra una rappresentazione del testo ottenuta con il metodo secondo l'invenzione ad un primo livello di sintesi, con evidenziata (freccia) una frase di interesse; ;- la figura 8 mostra una rappresentazione del testo ottenuta con il metodo secondo l'invenzione al secondo livello di sintesi, con alcune parti di interesse evidenziate; ;- la figura 9 mostra una rappresentazione del testo ottenuta con il metodo secondo l'invenzione al terzo livello di sintesi, con alcune parti di interesse evidenziate; ;- la figura 10 mostra una rappresentazione del testo originale ottenuta con il metodo secondo l'invenzione comprensivo del testo base con alcune parti di interesse evidenziate; ;- la figura 11 mostra un diagramma di flusso di un aspetto di funzionamento del metodo secondo 1'invenzione; ;- la figura 12 mostra in (a) un testo estratto con il metodo dell'invenzione, in (b) una prima formattazione di questo testo estratto, ed in (c) una seconda trasformazione dello stesso testo estratto; ;- la figura 13 mostra uno schema di flusso del metodo secondo l'invenzione per rappresentare i singoli livelli testuali aggiuntivi nella versione standard. ;;Descrizione dettagliata di esempi di realizzazione dell'invenzione ;Lo scopo dell'invenzione viene raggiunto agendo su tre fronti: le sottolineature, la rappresentazione del testo e la navigabilità. ;;Le sottolineature ;Le sottolineature sono multiple, ovvero si possono fare sottolineature mostrate con un colore differente che indica un rispettivo “livello di sottolineatura". Il minimo per ottenere un risultato tangibilmente differente da soluzioni già esistenti è di due livelli di sottolineatura. In questa descrizione faremo riferimento ad un modello con tre livelli di sottolineatura, ma ciò non è da intendersi come limitativo del concetto dell'invenzione, potendosi ugualmente realizzare una struttura con più di tre livelli di sottolineatura. ;Il Livello Sottolineatura associato alla sottolineatura è gerarchico (livello di rilevanza del testo). Per gerarchico si intende che la sottolineatura non può essere utilizzata indipendentemente dal suo Livello Sottolineatura (che poi è uno specifico colore, per l'utente di questo esempio). Il lettore deve quindi impiegarla in modo coerente con gli altri livelli: se come nell'esempio ce ne sono tre, il lettore - per ottenere il risultato che l'invenzione consente - deve utilizzare il Livello 1 (il più “elevato" nella gerarchia, associato al colore giallo nelle figure da 1 a 3, e da 7 a 10) per evidenziare i concetti fondamentali. Potrà invece utilizzare il Livello 2 (associato al colore verde chiaro nelle figure da 1 a 3, e da 7 a 10) per mettere in luce concetti importanti ma meno rilevanti, che arricchiscano i concetti sottolineati con il Livello 1. A sua volta potrà utilizzare il Livello 3 (associato al colore verde scuro nelle figure da 1 a 3, e da 7 a 10) per completare il quadro, per segnarsi (o segnalare a terzi) quegli elementi che egli ritiene rilevanti ma non essenziali come ciò che evidenzia con il Livello 1 né importanti come quelli cui avrà scelto di attribuire il Livello 2. ;Se dovessimo paragonare il metodo dell'invenzione ad una bicicletta per la lettura, le sottolineature costituirebbero il cambio della bicicletta. ;Le sottolineature sono archiviate in un database posto in una memoria fisica tangibile. ;Le sottolineature costituiscono anelli di una catena che consente di costruire più rappresentazioni testuali estrapolate dal testo di partenza. ;;La rappresentazione del testo ;La rappresentazione che lo strumento secondo l'invenzione effettua del testo, ha due caratteristiche : ;1. E' gerarchica, quasi piramidale,-2. E' interconnessa. ;L'utilizzo dello strumento secondo l'invenzione consente al lettore di generare livelli testuali “interconnessi tra loro", che rappresentano sintesi differenti ma legate l'una all'altra, del medesimo contenuto. ;L'interconnessione risulta molto utile in quanto ogni segmento del testo è collegato al corrispondente segmento in un livello di sintesi differente, e quindi è estremamente agevole, durante la navigazione del testo, passare ad un livello di sintesi meno pronunciata e con maggiori dettagli sull'argomento di interesse, o viceversa ad un livello di sintesi maggiore, riprendendo il filo più generale del discorso. ;Una prima rappresentazione di questa situazione è mostrata nelle figure 1 e 2. Nel seguito questo aspetto sarà spiegato con maggior dettaglio e correlato da un esempio. ;;La navigazione del testo ;Il documento che scaturisce grazie alle sottolineature gerarchiche ha una struttura piramidale che parte dal primo livello testuale, quello di maggior sintesi, scende ad un secondo livello, poi ad un terzo ed infine al testo originale, nell'esempio portato in questa sede. E' possibile espandere quindi una frase presente in uno qualunque dei tre livelli di sintesi creati dal metodo dell'invenzione, e acquisire quei maggiori dettagli che vengono forniti nel livello successivo, fino al massimo grado di approfondimento che è costituito dal testo oggetto di esame. Inoltre da ciascun livello - testo originale, terzo livello e secondo livello - è possibile risalire verso un livello testuale più sintetico. ;Ritornando alle sottolineature, il metodo dell'invenzione tiene traccia delle sottolineature effettuate dall'utente grazie ad un semplice database che contiene: ;;Livello Posizione Posizione ;Record sottolineat Iniziale Finale ;ura ;1 o 2 o 3 1 postiniz1 pos„fini ;o ... ;1 o 2 o 3 2 pos_iniz2 pos_fin2 ;o ... ;3 ;4 ;5 ;6 ;;Tabella 1 ;;La sequenza dei record delle sottolineature viene mantenuta aggregata per ragioni di ottimizzazione, ma questa scelta permette anche di poter successivamente rappresentare il testo nei tre livelli in maniera coerente con il testo originale. ;Poiché nel testo originale premesse, affermazioni di elevata importanza, informazioni rilevanti o incisi si alternano senza soluzione di continuità, mantenere aggregate le informazioni sulle sottolineature consente di rappresentare le diverse sintesi mantenendo la coerenza “narrativa" ma eliminando i dettagli non strettamente necessari a quel particolare riassunto, consentendo però in fase di lettura di riaggiungerli a piacimento, con uno, due o al massimo tre click (o "press" sullo schermo di un dispositivo mobile come un telefono, un tablet o un lettore di ebook). ;La creazione di una tabella per ciascun livello di sottolineatura - che eviterebbe la necessità del campo "Livello di Sottolineatura" che vediamo nella Tabella 1 renderebbe inutilmente complessa la successiva ricostruzione dei riassunti corrispondenti a ciascun livello. In ogni caso questa è un'implementazione possibile. Da notare che quello che viene qui descritto come un Database fa riferimento a tre differenti strumenti per registrare i dati: il primo è costituito da una vera e propria tabella come la Tabella 1 sopra o la Tabella 2 che verrà mostrata più avanti; il secondo è costituito da una variabile vettoriale; il terzo e più semplice è costituito da una stringa, opportunamente costruita, grazie alla quale è possibile tenere traccia dei dati delle sottolineature e dei loro livelli, necessari al funzionamento dell'invenzione. ;Tutte queste soluzioni sono ovviamente possibili, e la scelta fra di esse dipende dalle esigenze della versione dell'invenzione. Questa di solito è influenzata dal tipo di device su cui l'applicazione viene fatta girare, dalla sua potenza, dal fatto che l'applicazione giri in modo nativo o all'interno di un browser, dalla velocità richiesta e dalla potenza di calcolo che si stima per i device su cui l'applicazione viene impiegata. In questo senso la versione più usata attualmente, come accennato in altre parti di questo testo, è quella tight {rappresentazione testuale unica che contiene tutto il testo sottolineato dall'utente), in quanto consente una considerevole velocità e funziona su quasi tutti i browser ragionevolmente recenti in formato Web-app, il che si traduce in una esperienza utente simile alle App senza richiedere una installazione. ;;Rappresentazione - versione Standard ;Una volta completata da parte dell'utente la sottolineatura di un testo, lo strumento offrirà la rappresentazione di un numero di nuovi livelli testuali pari al numero di sottolineature scelto, che nell'esempio sono 3 {il quarto pennarello in figura è il cancellino), ;La rappresentazione di ciascun livello può avvenire secondo uno schema che ricalca quanto anticipato dalla figura 3: ;• Il primo livello testuale sarà costituito dalla estrazione del testo sottolineato con il Livello 1 {evidenziature in giallo nella figura 3). Lo strumento può correggere la rappresentazione testuale in modo da non separare eventuali frasi o paragrafi che già nel testo originale erano intere, ovvero separando con opportuni a capo frasi e paragrafi indipendenti fra loro. ;• Il secondo livello testuale ed i successivi verranno invece rappresentati come “sommatoria" del testo corrispondente alle sottolineature del primo livello, nonché dei livelli successivi fino a quello che si desidera rappresentare. Anche in questo caso avviene la correzione descritta al punto precedente per non separare eventuali frasi o paragrafi che già nel testo originale erano intere, ovvero separando con opportuni a capo frasi e paragrafi indipendenti fra loro. ;La figura 13 mostra uno schema di flusso del metodo secondo l'invenzione per rappresentare i singoli livelli testuali aggiuntivi nella versione standard. Lo schema richiede che gli sia passato come input il livello L che si desidera rappresentare. ;;Rappresentazione- versione Light ;Quanto illustrato sopra si può ottenere grazie alle tecnologie web in un modo che per certi versi rappresenta l'inverso del primo: invece di procedere aggiungendo le porzioni di testo che si desidera rappresentare, si pre-caricano tutti i testi sottolineati e si visualizza solo quello richiesto dall'utente. Questo secondo metodo è quello impiegato nella versione attuale del prototipo dello strumento secondo l'invenzione. ;Quest'ultima è più leggera - garantisce una maggiore velocità e la minimizzazione di traffico fra Client e Server, che dialogano solo per “salvare" il lavoro dell'utente - ma potrebbe porre problemi qualora si volesse "mostrare" unicamente una sintesi specifica ma non tutto il testo: con questo sistema il browser o l'applicazione in cui lo strumento è inserito "carica" tutta la sintesi, che quindi transita sulla macchina dell'utente finale e potrebbe essere facilmente intercettata. ;La versione "Light" come anticipato prevede che venga creata una rappresentazione testuale unica che contiene tutto il testo sottolineato dall'utente. Viene poi attribuito uno stile alle porzioni di testo caratterizzate dal Livello 1 {Stile 1, che nell'esempio è una sottolineatura di colore giallo), un altro stile alle porzioni di testo che siano state sottolineate con il Livello 2 {Stile 2, verde chiaro), ed un terzo per la parte di testo classificata con sottolineature di Livello 3 (Stile 3, verde scuro). A questo punto è possibile scegliere di rappresentare unicamente il testo contrassegnato con lo Stile 1 per ottenere la sintesi più stringata, rappresentare il testo contrassegnato con entrambi gli Stile 1 e Stile 2 per ottenere il secondo livello di sintesi, o mostrare tutti e tre gli stili contemporaneamente. ;In questa seconda versione dello strumento secondo l'invenzione, la rappresentazione avviene in due fasi: prima viene preparato il testo, cui viene assegnato lo Stile, e nella seconda si procede a mostrarne solo la porzione richiesta dall'utente. Entrambe le fasi possono avvenire sul Client poiché i dati relativi alle sottolineature, dopo essere stati sincronizzati con il Server, rimangono disponibili in locale. ;;Preparazione del testo sintetizzato ;Nella prima fase viene preparata una pagina contenente tutto il testo sottolineato, e ad ogni testo corrispondente a ciascuna sottolineatura viene attribuito uno Stile, che in veste grafica sarà rappresentato come un colore di sfondo per i caratteri della porzione di testo interessata. Nel caso di esempio, in cui i Livelli di Sottolineatura sono tre, anche gli Stili saranno tre, e nella successiva rappresentazione le porzioni di testo sottolineate al Livello 1 saranno mostrate con un colore di sfondo {che quindi appare come una evidenziatura) di colore giallo, mentre i Livelli 2 e 3 saranno associati ad uno Stile 2 ed uno Stile 3, cui corrispondono i colori Verde Chiaro e Verde Scuro. ;Si veda la figura 5 per comprendere come avviene la preparazione della nuova pagina, che servirà alla successiva rappresentazione dei 3 livelli di sintesi. ;;Rappresentazione del livello di testo richiesto dall'utente ;La preparazione del testo estratto, ovvero l'operazione descritta nella figura 5 (preparazione del testo), avviene a livello del Client appena 1'utente chiede di visualizzare uno dei livelli di sintesi. Essa verrà però effettuata nuovamente nel caso in cui l'utente, dopo aver chiesto la prima sintesi, effettui delle nuove sottolineature. In questo modo i testi sintetizzati mostrati saranno sempre aggiornati. ;Una volta ottenuto il documento denominato "TestoSintesi" nello schema di figura 5 , il metodo secondo l'invenzione è in grado di rappresentarlo. La rappresentazione avverrà secondo la figura 4, ;Il testo che lo strumento oggetto dell'invenzione mostrerà all'utente viene poi aggiornato ogni volta che questi richieda di visualizzare un livello di sintesi differente. L'utente può esprimere una tale richiesta -in questa versione dell'invenzione- in due modi: ;• premendo sui tasti contrassegnati dalle lenti con il "più" e con il "meno"; ;• cliccando su una frase che lo interessa. ;L'utente in ogni momento può quindi scegliere di passare dal testo originale ad una versione più sintetica del testo, e vicevers. Una descrizione più completa e dettagliata di questo meccanismo verrà data nel seguito. ;;Allineamento dei testi - Reflow e Allinea Testo ;Nel caso in cui il livello di sintesi mostrato fosse diverso dal Livello 3, sono necessarie due operazioni ulteriori, per mantenere la leggibilità del testo. ;Ricordiamo che il testo oggetto di tutte le sottolineature viene raccolto in una unica pagina in anticipo, cioè prima di mostrarlo: se venisse mostrato solo il livello 1, ad esempio, tutte le frasi corrispondenti ai livelli 2 e 3 sarebbero nascoste, lasciando spazi vuoti nelle parti mancanti. ;Per mantenere la leggibilità è necessario quindi effettuare il "reflow" del risultato, cui provvede il browser durante l'applicazione dello Stile. Si tratta di riavvicinare fra loro gli elementi testuali che sono mostrati nel caso di specie, per farli rappresentare consecutivamente nella pagina che l'utente leggerà. La procedura potrebbe anche essere descritta come la eliminazione degli spazi vuoti fra un livello sottolineatura e l'altro. In pratica se l'utente decide di visualizzare il solo Livello 1, e quindi la sintesi più stringata, il reflow accorperà tutte le frasi sottolineate con il colore Giallo una di seguito all'altra, eliminando gli eventuali spazi che le separano. Se dovesse invece scegliere di visualizzare il secondo livello di sintesi, che come visto in precedenza viene costruito come la somma dei testi corrispondenti alle sottolineature contrassegnate dai Livelli 1 e 2, il reflow accorperà tali testi di seguito fra loro, eliminando gli spazi vuoti. In quest'ultimo esempio gli spazi vuoti - essendo la pagina della sintesi costruita come la sequenza di tutti i testi sottolineati, secondo il loro ordine originale e indipendentemente dal livello di sottolineatura, come è stato mostrato per la costruzione di TestoSintesi - sarebbero costituiti dai testi contrassegnati con 1'evidenziatura di Livello 3, quella verde scuro, che non dovrà essere mostrata. La procedura di reflow del testo è ormai pratica comune, e viene utilizzata sia per adattare il testo a schermi di dimensioni differenti tra loro, che per rendere leggibili documenti che da un punto di vista "nativo" sarebbero statici, come ad esempio i file PDF, Inoltre, affinché il testo venga distribuito correttamente nei livelli 1 e 2, è necessario effettuare la rettifica degli "a capo", che avevamo già visto nella Versione Standard di cui sopra, e che era inserita nei singoli schemi di rappresentazione. In questo contesto chiamiamo questa ulteriore rettifica "Allinea Testo". ;Ricordiamo che per il livello 3 entrambe queste operazioni non sono necessarie: il TestoSintesi è già costruito mettendo di seguito tutto il testo sottolineato, e quindi è compatto e leggibile con comodità dall'utente. Inoltre gli "a capo" vengono inseriti come evidenziato in figura 5. ;L'inserimento degli "a capo" applicato ai livelli 1 e 2 del testo sintetizzato è invece descritto nel diagramma di flusso di figura 6. ;;Navigazione ;Uno degli elementi che permette allo strumento secondo l'invenzione di costituire un ausilio significativo nella lettura è la navigazione. Come anticipato brevemente nella descrizione dello strumento a seguito dell'impiego del meccanismo di sottolineatura su un testo e della sua rappresentazione con i metodi descritti sopra - l'utente "struttura" il testo, che originariamente era distribuito su un solo piano, su più piani. Ciascun piano preso da solo costituisce un testo compiuto e leggibile, e nel caso di utilizzo più semplice esso rappresenta una sintesi dell'argomento trattato {perfino il testo originale può essere infatti concettualmente descritto come una sintesi dell'argomento di cui all'oggetto). Già il fatto di avere una, due, tre {nell'esempio descritto in questa sede) o più sintesi oltre al testo originale è un risultato di valore, in quanto esse permettono di ritornare sull'argomento in un tempo inferiore alla lettura completa iniziale. Il valore di questi “nuovi" testi aumenta ancora però, e molto considerevolmente, se la lettura oltre che poter essere effettuata sul singolo piano può essere effettuata passando agevolmente da un piano ad un altro. Le figure 1 e 2 davano già una indicazione visiva di quanto qui descritto, ma vale la pena fare un esempio più dettagliato per rendere l'idea del meccanismo prima di vedere la parte costruttiva. ;;Esempio di navigazione ;In questo esempio, dato che ci interessa analizzare la navigazione del testo dopo che la struttura dello stesso è stata creata grazie a opportune sottolineature, presupporremo che il nostro utente abbia a già a disposizione i tre Livelli testuali generati dal metodo secondo l'invenzione secondo quanto descritto sopra. ;Si supponga che il nostro utente sia interessato alla lettura del libro "The Cathedral and thè Bazaar", un saggio sullo sviluppo del software scritto da Eric S. Raymond che descrive il mondo del software Open Source. Nel libro l'autore spiega come Linus Torvalds abbia generato un vero e proprio nuovo modello di sviluppo per il software, cui attribuisce il nome di “bazaar" perché è trasparente e sempre aperto a chiunque voglia contribuire al miglioramento del prodotto finale, contrapposto al modello “cattedrale" in cui una società che costruisce un nuovo programma lo fa in un cantiere, chiuso ai non addetti ai lavori. Il metodo secondo l'invenzione permette al nostro lettore di approcciare il libro in modo diverso, perché ha a disposizione varie alternative: leggere la versione completa, o uno dei riassunti, ma anche di navigare il testo. Il nostro esempio è incentrato proprio su quest'ultima modalità. ;Una volta lette le prime frasi del Livello 1 generato dal metodo secondo l'invenzione, che come si può immaginare è composto solo da frasi evidenziate in giallo nell'esempio, il nostro lettore viene colpito dalla frase evidenziata con una freccia in Figura 7. ;Il metodo secondo l'invenzione consente al nostro utente di esplorare più in dettaglio quella particolare affermazione: cliccando sopra l'elemento appena identificato, lo strumento mostrerà la medesima frase ma nel contesto del Livello successivo, facendola brevemente lampeggiare per permetterne l'identificazione immediata: ;In figura 8, il paragrafo evidenziato dalla parentesi graffa grande, contrassegnata dalla lettera A, segnala le porzioni di testo evidenziate dall'utente precedente con il colore verde chiaro, corrispondenti al Livello 2 negli schemi costruttivi, intorno o {come in questo caso) di seguito alla frase che aveva attirato l'attenzione del nostro lettore. Questi, dopo aver letto il paragrafo, trova una porzione di testo che gli permette di approfondire ulteriormente quanto di suo interesse: la parte segnalata dalla parentesi graffa di dimensioni più ridotte, contrassegnata dalla lettera B. Fra queste frasi sceglie di espandere cliccando sulla porzione di testo indicata dalla freccia e contrassegnata dalla lettera C. ;Il nostro lettore peraltro sa che tutto il testo del livello in cui si trova prima di effettuare il click che lo porta al livello successivo rimane rappresentato e facilmente identificabile anche nel livello successivo: le frasi del Livello 2 rimangono presenti nel Livello 3 - perchè quest'ultimo è costruito dalla somma dei testi evidenziati in Giallo, in Verde Chiaro oltre che a quelli propri solo del Livello 3 che corrispondono al colore Verde Scuro - e il loro colore Verde Chiaro le rende ben distinguibili anche quando rappresentate nel Livello 3. Quindi scegliendo di cliccare su quella frase del Livello 2 potrà comunque poi eventualmente identificare ancora i testi del Livello 2 pur essendo “sceso" al Livello 3. ;Cliccando sulla frase “C", il lettore verrà proiettato sul Livello 3, questa volta. Facendo riferimento alla figura 9, il metodo secondo l'invenzione mostrerà a questo punto la rappresentazione testuale del Livello 3 e, dopo aver fatto brevemente lampeggiare (opzionale) la frase che il nostro lettore ha scelto di cliccare sul Livello 2, consentirà al lettore di leggere. Nel nostro esempio il lettore trova qualche elemento in più, quelli mostrati in figura dalla graffa contrassegnata dalla lettera D. Prova quindi a verificare se cliccando ulteriormente ottiene informazioni aggiuntive, e sceglie la frase segnalata dalla freccia identificata dalla lettera E. ;A questo punto il metodo secondo l'invenzione mostrerà il testo originale, completo delle sottolineature, come in figura 10. E' qui importante affermare che per "sottolineatura" si intende una qualsiasi evidenziazione del testo, che sia una linea inferiore, superiore, un colore o ogni altra grafica atta allo scopo. ;Anche in questo caso un breve lampeggiare della frase cliccata al Livello 3 e ora contestualizzata nel testo originale aiuterà il nostro lettore ad identificare rapidamente il paragrafo rilevante, quello evidenziato dalla parentesi graffa indicata con la lettera F. ;Premendo la lente evidenziata dalla freccia e contrassegnata dalla lettera G, il nostro utente potrà risalire ai livelli precedenti, mantenendo il segno del punto che sta leggendo come nell'utilizzo dello zoom in aumento. Opzionalmente, la frase che è stata selezionata per ultima lampeggerà nel livello precedente e, se la sottolineatura di questa dovesse essere di un livello inferiore a quello mostrato, dopo aver lampeggiato brevemente sparirà per lasciare visibili solo le porzioni di testo del livello in questione . ;In ogni momento l'utente può utilizzare i tasti delle lenti "+ " e per aumentare o diminuire il livello di zoom sul testo, come se si trovasse su una mappa. Se l'utente prima di operare lo zoom avrà cliccato su una porzione di testo sottolineato, questa fungerà da punto di riferimento per il metodo dell'invenzione per "portare" l'utente alla posizione di quella sottolineatura nel livello prescelto. Altrimenti i tasti cambieranno semplicemente il livello mostrato, scendendo verso rappresentazioni testuali più complete con il tasto della lente contrassegnata dal "+ ", e risalendo verso i livelli più sintetici premendo la lente contrassegnata dal ;Lo strumento secondo l'invenzione quindi interconnette i vari livelli di sintesi testuali fra loro: ogni elemento sottolineato mantiene una "parentela" sia con il livello testuale di sintesi superiore che con quello inferiore, oltre che con tutti gli altri grazie alle informazioni contenute nel database. Questa si trasforma in un vantaggio considerevole in termini di fluidità di sperimentazione del testo, che non è più una sequenza interminabile di parole da leggere tutte di seguito per non perdere il senso del contenuto, ma diventa una risorsa zoomabile come se fosse una mappa. ;I vantaggi dello strumento secondo l'invenzione sono tutti quelli legati al suo uso ed immediatamente evidenti nell'uso. Tra questi, se ne segnalano qui due particolarmente importanti. ;Anzitutto, il primo lettore che sottolinea il testo beneficerà in modo molto significativo della struttura che crea man mano che procede nella lettura, e questo vantaggio sarà tanto maggiore quanto più complesso è il documento che affronta. Questo perché non appena quest'ultimo farà riferimento a qualsiasi elemento spiegato in precedenza, il lettore potrà ritornare indietro con il meccanismo dello zoom-out (la lente con il segno , identificare la parte dove si trovava l'elemento in questione ed eventualmente effettuare lo zoom-in sul capitolo-paragrafo-frase rilevante, e recuperare in un paio di click la spiegazione completa senza bisogno di fare ulteriori ricerche. Nella sperimentazione da noi operata in fase di sviluppo questa opzione rende molto più rapido l'apprendimento di testi e argomenti complessi, riteniamo addirittura fino a 5 volte più veloce. ;In secondo luogo, uno dei vantaggi considerevoli che invece pertengono ai lettori successivi si manifesta in particolare per chi conosca già l'argomento trattato dal testo: in questo caso il lettore che trova la versione del testo elaborata secondo l'invenzione può saltare con notevole confidenza tutte le parti che conosce già. Infatti a differenza di un indice nel quale spesso vengono raccolti titoli che anticipano solo l'argomento che verrà trattato, le frasi sottolineate tendono a evidenziare il cuore di ogni sezione. Laddove queste frasi siano già chiare al lettore che segue, egli si potrà permettere di sorvolarle risparmiandosi la lettura delle parti che conosce e volando direttamente ai contenuti innovativi o che non gli sono familiari. Passiamo ad analizzare come il metodo secondo l'invenzione ottenga questo risultato. ;;Identificazione della sottolineatura oggetto di click Secondo una forma realizzativa, 1'evidenziatura è composta da più parti, tante quante sono gli elementi sulla quale essa si estende: se, ad esempio, una evidenziatura inizia in un paragrafo e termina nel successivo, saranno presenti due parti. Questo fatto è dovuto al funzionamento interno del sistema di evidenziatura, che opera rispettando la struttura ad albero del documento (X)HTML {standard W3C che richiede che l'apertura e la chiusura di un tag avvenga all'interno del medesimo elemento padre). ;Per ottenere una navigazione come descritto sopra, è necessario identificare correttamente dove l'utente ciùcca o effettua un “press" sullo schermo nel caso si tratti di un dispositivo mobile; in questa sede intendiamo anche descrivere l'azione di “press". ;L'identificazione è agevolata dal fatto che i browser hanno un evento “on__click" che restituisce l'elemento di Stile cliccato, che corrisponde alla sottolineatura. L'identificativo dell'evidenziatura è quindi espresso in maniera univoca tramite una coppia di valori, che rappresentano: ;1. la posizione della parte interessata dall'evento in questione nella lista delle parti appartenenti alla medesima evidenziatura, e ;2. la posizione dell'evidenziatura alla quale la parte appartiene nell'elenco di tutte le evidenziature. ;;Posizionamento della porzione interessata di testo al centro dello schermo ;Una volta ottenuta l'informazione di cui al Sottoparagrafo precedente, l'applicativo provvederà a rigenerare la rappresentazione testuale corretta, mostrando il Livello di maggiore dettaglio: se si parte dal Livello 1, quando l'utente ciùcca su una frase, l'invenzione rappresenterà il Livello 2; se si parte dal Livello 2 mostrerà il Livello 3 e così via, fino al livello del testo originale; in quest'ultimo un nuovo click setterà semplicemente il posto dal quale partire per una rappresentazione nuova in caso l'utente chieda di tornare indietro a livelli di maggiore sintesi premendo il tasto lente con il segno ;Essendo riusciti a risalire come descritto sopra alla porzione di testo di interesse del lettore, il metodo dell'invenzione rappresenterà il livello successivo, effettuerà lo scroll (traslerà il testo fino a posizionarlo nel punto desiderato) fino ad avere quella porzione di testo in alto sullo schermo, poi effettuerà un ulteriore scroll per farla scendere di un offset {un numero di linee prefissato) che posizioni la porzione di testo poco sopra la metà dello schermo dell'utente, ed infine farà lampeggiare brevemente la porzione di testo, in modo da renderla facilmente identificabile dall'utente stesso. Si noti che la misura dell'offset, cioè di quante linee scenderà in seguito il testo, viene determinata dinamicamente grazie alle informazioni che il device dell'utente fornisce circa la dimensione dello schermo o della sua porzione su cui viene rappresentato il testo. ;;Interazioni Client-Server ;In figura 11 si presenta uno schema contenente le interazioni che la versione Light effettua con il server. ;;Inserimento di componenti testuali nuovi e modifica del testo di un livello ;Il metodo secondo l'invenzione consente aggiuntivamente e opzionalmente di effettuare modifiche ai testi risultanti in ciascun livello aggiuntivo. Questo sia per permettere di limare eventuali imperfezioni nelle frasi, che per integrarne il contenuto. Naturalmente è lasciato all'utente l'uso che egli vuole fare di questa possibilità, e il risultato potrebbe differire nei significati, ma in questo caso ne ha responsabilità. Peraltro nell'uso personale è del tutto ragionevole che il lettore tragga conclusioni anche differenti rispetto a quelle dell'autore originario, mentre nella condivisione il lettore successivo ha la possibilità di esprimere gradimento sulle sintesi fatto dal primo, “avvisando" i lettori/navigatori che seguiranno. ;Formattazioni ;Poiché la gerarchia insita nel metodo dell'invenzione si presta molto bene a creare testi strutturati, è naturale offrire la possibilità di formattare il testo in modo da rendere ancora più chiara ed agevole la sua comprensione. ;Grazie a questa opzione diventa semplice trasformare un testo lineare in slides per una presentazione. Si vedano le figure 12(a)-(c). ;Mentre l'inserimento di testo o formattazioni all'interno di un documento standard è tecnica conosciuta, la possibilità di abbinare tale tecnica al un testo già reso gerarchico su più livelli - come sopra descritto - consente di generare dall'originale una serie di risultati altrimenti ottenibili solo con un numero di passaggi ben superiore e al prezzo di molteplici operazioni manuali, tipicamente di copia e incolla, ripetute e ripetitive. ;;Una struttura per espandere il contenuto del Testo Originale ;Naturale complemento alle possibilità esposte finora consiste nella possibilità di inserire note, che avviene in modo tradizionale. ;Lo strumento secondo l'invenzione però ha aggiunto il meccanismo dei Livelli alla rappresentazione testuale, e quindi è altresì possibile integrare il testo ed inserire del materiale aggiuntivo vero e proprio, che andrà a sommarsi al testo originario e a crearne una versione espansa. ;La differenza con quanto sopra esposto circa la modifica del testo risiede nello scopo per il quale il testo viene inserito, e nel come lo strumento lo tratta: nel caso di cui sopra si trattava di modifiche apportate per adattare il testo di un Livello specifico alle proprie esigenze; nel caso di specie invece è possibile creare uno o più Livelli Aggiuntivi, destinato/i a contenere testo nuovo inserito dall'utente, al fine di integrare ed espandere il testo originale. ;Ritornando all'esempio con il quale abbiamo illustrato finora lo strumento secondo l'invenzione, se il nostro utente aggiunge testo al Livello Originale ha la possibilità di creare un Livello Aggiuntivo oltre a quelli costituiti dal testo originale e dai Livelli derivati ed estratti grazie alle sottolineature, descritti finora. Si ritrova a questo punto ad avere a disposizione - e quindi potenzialmente a poter condividere - una struttura sempre piramidale ma questa volta composta ad esempio di 5 Livelli: Livello Aggiuntivo - Livello del Testo Originale - Livello 1-Livello 2 - Livello 3. ;In termini costruttivi, questa aggiunta è potenzialmente molto semplice da ottenere, in quanto i Livelli Aggiuntivi possono essere trattati come dei testi nuovi che dovranno essere salvati sul server. Questa possibilità è concessa dal fatto che il testo viene aggiunto, e non estratto e "fatto sparire" come nel meccanismo di Rappresentazione sopra descritto. Questo meccanismo si adatta perfettamente alla Rappresentazione Light di cui sopra, che impiega una variabile vettoriale per identificare le posizioni e il Livello delle sottolineature, variabile che però non si presterebbe agevolmente a contenere testo aggiuntivo. ;i1— ;Viene invece usato un metodo1più efficiente sopratutto in termini di spazio o0ccupato - e robusto NÌ;per ottenere il risultato, espa1ndendo il database per consentire di contenere il testo inserito dall'utente. La Tabella 1 descrittiva_ del Database viene quindi modificata come segue: ;;Posizion Livello Eventuale Reco Posizion ;e Sottolineatura Testo rd e Finale ;Iniziale / Aggiuntivo Aggiuntivo pos_iniz ;1 pos_fini 1 o 2 o 3 o... N .A. ;1 ;pos_iniz ;2 pos__fin2 "XYZ" ;2 ;3 ;4 ;5 ;6 ;;*
Tabei;La 2
Come il lettore potrebbe aver intuito: quando nel campo Livello Sottolineatura / Livello Aggiuntivo si trova un numero positivo, il Record in questione descrive una sottolineatura che pertiene al livello originale del testo con Livello Sottolineatura pari al valore del campo stesso, quindi il campo Eventuale Testo Aggiuntivo non sarà popolato. Quando invece nel campo Livello Sottolineatura / Livello Aggiuntivo sarà presente un numero negativo, che sta ad indicare un Livello Aggiuntivo, a questo corrisponderà un campo Eventuale Testo Aggiuntivo popolato dalla porzione di testo che l'utente ha inserito.
In questo modo la Rappresentazione Standard (con il database) di cui sopra non viene in alcun modo modificata, ma l'utente con il metodo secondo l'invenzione acquisisce una possibilità assai importante per se stesso e potenzialmente per molti altri utenti: aggiungere ulteriore ricchezza al contenuto mantenendola ben separata dall'originale pur se leggibile congiuntamente e navigabile con gli strumenti del metodo dell'invenzione. Quest'ultimo dettaglio è molto interessante per creare materiale che arricchisca il testo di partenza, dando la possibilità all'utente di aggiungerlo per se stesso o per altri:
Livelli Autonomi
Con Livelli Autonomi si intendono eventuali livelli corrispondenti a sottolineature non “connesse" con quelle descritte finora ma indipendenti.
Queste ulteriori sottolineature potrebbero essere singole - e generare un estratto testuale autonomo - o connesse con altri Livelli e quindi costituire un percorso di lettura alternativo a quello principale.
Nel primo caso, essendo l'estrazione di testo non facente parte della presente richiesta di Brevetto in quanto tecnica conosciuta, non costituiscono di per sé una innovazione, ma la loro coesistenza con il percorso di lettura principale costituisce una possibilità aggiuntiva per l'utente.
Nel secondo caso la interconnessione con altri Livelli di Sottolineatura Autonomi può consentire di effettuare un uso assai sofisticato: si pensi ad un testo che tratti un argomento complesso come una proposta di fusione tra due aziende. Un testo così può essere evidenziato/sottolineato da utenti differenti come i legali, gli esperti di marketing, gli esperti della produzione e magari i responsabili IT, e questi segnaleranno a coloro che devono deliberare sulla proposta di fusione - come l'Amministratore Delegato, il Consiglio di Amministrazione o 1'Assemblea- ciò che ritengono rilevante, magari completando le sottolineature con le loro considerazioni. In questo modo il testo iniziale, aperto su un numero di istanze pari ai tagli di lettura che si vogliono ottenere, può essere ri-rappresentato in modo differente per evidenziare opportunità e criticità notate dai vari specialisti. La navigazione su più livelli di sintesi consentirebbe però ai soggetti decisori di cogliere il succo delle considerazioni dei loro collaboratori senza dover rileggere testo e valutazioni dall'inizio alla fine ogni volta, rendendo la valutazione complessiva molto più agevole.
Il singolo documento diventa quindi oggetto di tagli di lettura specifici e specializzati, funzionali ad una sua comprensione più articolata e da punti di vista differenti. Oltre a questo esempio, si possono immaginare cartelle cliniche di pazienti "complessi" lette dai diversi specialisti che ne curano le patologie e le sintomatologie a loro familiari e "sottolineano" ciò che li guida a beneficio dei colleghi che a loro volta curano il paziente. Tutti gli specialisti permetteranno così agli altri di comprendere le loro terapie e al medico principale di eventualmente coordinarne l'azione.
Mix
L'ulteriore, opzionale funzionalità di "mix" è presente per consentire, all'utente che costruisce un percorso di lettura, di alterare la struttura narrativa del testo, creandone una vera e propria variante. In questo caso l'utente che beneficerà del lavoro non seguirà il percorso logico dell'autore originario, ma quello dell'utente "Master" che ha creato il Mix. L'utilità di questa funzione è evidente se si pensa ad esempio ad un insegnante, che scelga di far affrontare argomenti del testo originale in una sequenza differente per perseguire gli scopi didattici specifici della sua classe o del suo corso.
In termini costruttivi la funzione Mix consiste nella generazione di un nuovo database che coesisterà con il database principale, analogo a quello descritto precedentemente in Tabella 2. Questo nuovo database viene popolato grazie ad una interfaccia grafica di “drag and drop", grazie alla quale l'utente Master trascina le porzioni di testo, prelevate dal livello del testo originale o da uno qualsiasi dei Livelli delle Sottolineature, in un nuovo testo. Il nuovo testo rimane connesso con quello originale, di modo che sebbene le sue porzioni siano state spostate è sempre possibile al lettore finale recuperare il livello inferiore di maggior dettaglio, se esistente, e se lo desidera o ne ha bisogno.
.Remix
L'ulteriore, opzionale funzionalità di "remix" è simile alla precedente, ma consente di effettuare il mix partendo da diversi testi già strutturati con il metodo secondo l'invenzione, creando un'opera "remix". Anche in questo caso lo scopo e il bisogno che hanno generato questa soluzione provengono dalle esigenze di insegnamento: è molto frequente il caso di docenti che articolino i propri corsi estrapolando porzioni di differenti testi.
Il vantaggio considerevole costituito dall'effettuare questa operazione con l'ausilio del metodo secondo l'invenzione consiste nel fatto che il Remix dei testi diventa un unicum fruibile in modo molto semplice su una unica interfaccia che gode dei benefici già descritti in precedenza: è gerarchico, consente diverse velocità di lettura grazie ai riassunti corrispondenti ai Livelli, e l'esplorazione non lineare. Il tutto rimanendo connesso ai testi sorgente del corso e quindi consentendo agevolmente l'espansione della ricerca agli studenti.
Log/tracciatura dell'attività del/degli utenti ai fini di "gamification" e SEO
Una ulteriore funzionalità opzionale dello strumento è costituita dalla possibilità di tracciare la navigazione del/degli utente/i, raccogliendo le loro interazioni con l'interfaccia utente dello strumento sotto forma di dati quali il numero di click, la loro posizione, i momenti in cui essi avvengono nonché la loro frequenza temporale, ecc.
Questa funzionalità è di valore per acquisire una serie molto ampia di informazioni, fra le quali segnaliamo :
Comprendere l'efficacia del testo originario;
- Comprendere l'efficacia di una, o della, struttura gerarchica ottenuta grazie allo strumento;
- Comprendere quali parti siano state oggetto di interesse da parte degli utenti;
- Quali parti del testo o della struttura gerarchica hanno migliore probabilità di esser state comprese dai lettori o dagli utenti;
- Quali parti potrebbero aver bisogno di essere riviste.
In aggiunta, questa specifica funzione consente di alimentare meccanismi di cosiddetta "gamification", ovvero 1 'utilizzo delle meccaniche e dinamiche dei giochi come livelli, punti o premi, nello specifico contesto della lettura al fine di creare più interesse o risolvere problemi di scarsa attenzione. Tale funzione consente infatti di sapere quali argomenti ha esplorato il lettore/utente, e diventa agevole remunerare la sua “ricerca" e fornirgli feedback, confrontarne la performance con alti lettori/utenti, remunerare comportamenti o caratteristiche della sua lettura come la completezza, la velocità, i percorsi di navigazione che ha effettuato eccetera. L'invenzione quindi risolve una delle sfide principali nella creazione di strumenti di gamification, che è appunto il modo di raccogliere elementi per "valutare" la performance degli utenti, nell'ambito dello studio, nel quale finora la gamification non è riuscita ad ottenere risultati particolarmente interessanti.
Tali tracciature sono altresì finalizzate alla esportazione di dati relativi alla frequenza di click degli utenti su termini, porzioni e parti di testo, al fine di raccogliere dati per poter ottimizzare le strategie gergalmente definite di SEO, in lingua inglese Search Engine Optimization. Queste ultime sono attività volte ad ottenere la migliore rilevazione, analisi e lettura di pagine o siti web da parte dei motori di ricerca attraverso i loro spider, al fine di migliorare (o mantenere un elevato) posizionamento nelle pagine di risposta alle interrogazioni degli utenti del web. Tali dati, che poi si traducono in parole chiave, rappresentano materia di considerevole interesse e valore per tali attività.
Una differente forma di realizzazione della presente invenzione prevede che tutto avvenga sul computer dell'utente, e quindi "in locale", salvando i dati relativi alle sottolineature nella cache del browser e utilizzando una stringa inserita in fondo all'indirizzo http della pagina web cui viene applicato lo strumento secondo l'invenzione. Questa versione consente di ottenere il risultato in modo efficace, ma è caratterizzata da alcuni limiti importanti, fra cui:
1. Qualsiasi click imprevisto può cancellare parzialmente il lavoro di sottolineatura, se la cronologia del browser non ha registrato la modifica dell'indirizzo;
2. La chiusura anche involontaria del browser o della scheda contenente la pagina web analizzata può causare il medesimo danno;
3. In presenza di testi lunghi la stringa contenente le sottolineature potrebbe diventare troppo voluminosa, rendendo il link di difficile impiego;
4. In alcuni casi addirittura il browser potrebbe non supportare link di lunghezza compatibile con la stringa delle sottolineature generata dallo strumento. Ad esempio Safari, il browser presente nei dispositivi Apple, è solito “tagliare" il link oltre ad una certa lunghezza, generando un errore e rendendo questa versione dello strumento inutilizzabile.
Ulteriore forma di realizzazione
Il metodo secondo l'invenzione è implementato via computer, per l'estrazione di riassunti di differente livello di rilevanza/sintesi da un testo elettronico con sottolineature strutturate e gerarchiche di suoi elementi di testo.
Il metodo prevede anzitutto l'acquisizione e la memorizzazione, su una memoria fisica di o connessa a detto computer, dio un dataset di partenza comprendente:
- le coordinate relative di una o più evidenziazioni di livello di rilevanza decrescente in detto testo elettronico;
- uno o più valori predefiniti rispettivamente associati a ciascuna di dette una o più evidenziazioni, ciascun valore predefinito indicando un livello di rilevanza del testo.
Successivamente, per il livello di rilevanza più alto, si estrae una porzione di detto testo elettronico ai cui elementi di testo è associato il corrispondente valore predefinito, in cui detti elementi di testo in detta porzione mantengono la stessa posizione relativa o assoluta che hanno nel testo elettronico.
Va detto qui che per tutte le forme realizzative se nel testo vi sono immagini, esse verranno tolte o lasciate a seconda delle necessità, per esempio possono essere lasciate nella stessa posizione relativa che hanno nel testo elettronico originario.
A questo punto, per ogni livello di rilevanza successivo, si estrae una porzione di detto testo elettronico comprendente o composto degli elementi di testo cui è associato il corrispondente valore predefinito oltre agli elementi di testo cui sono associati i valori predefiniti di tutti i livelli di rilevanza più elevati, in cui detti elementi di testo in detta porzione mantengono la stessa posizione relativa o assoluta che hanno nel testo elettronico.
Si memorizzano poi le porzioni di testo elettronico delle fasi precedenti su una memoria fisica di o connessa a detto computer, sotto forma di database o all'interno di variabili opportunamente configurate.
A questo punto il metodo può interrompersi perché si è già ottenuto l'effetto tecnico di produrre riassunti gerarchici.
Se si vuole, il metodo può continuare con la costruzione e memorizzazione, per ciascuna porzione di testo elettronico della fase D, di una corrispondente porzione di testo formattato in cui sono eliminati spazi inutili tra gli elementi di testo e sono inseriti degli accapo tra insiemi di elementi di testo che appartengono a frasi differenti nel testo elettronico, opzionalmente inserendo maiuscole all'inizio di ogni frase.
Infine, si può visualizzare, su una interfaccia grafica mostrata su uno schermo, la porzione di testo formattata della fase E corrispondente ad uno specifico livello di rilevanza o detto testo elettronico, sulla base di una scelta di utente.
Gli elementi di testo di ciascun livello di rilevanza sono usualmente ma non obbligatoriamente visualizzati con differenti colori e/o font e/o background e/o dimensioni.
Una volta effettuata la fase F con la visualizzazione di una porzione di testo formattata, è possibile visualizzare successivamente un altra porzione di testo formattata corrispondente ad un differente livello di rilevanza , sulla base di un'ulteriore scelta utente. Questa altra porzione di testo formattata può essere una porzione di testo formattata di livello di rilevanza inferiore e detta ulteriore scelta utente è fatta tramite puntatore o cursore sull'interfaccia grafica, l'elemento di testo puntato dall'utente essendo fatto lampeggiare per un tempo determinato in sovrapposizione a detta altra porzione di testo formattata.
Opzionalmente, possono essere memorizzati in detta memoria fisica altri testi elettronici aggiuntivi, eventualmente utilizzando porzioni di detto testo elettronico. A tali testi elettronici aggiuntivi è convenientemente associato un rispettivo livello di rilevanza aggiuntivo, che l'utente può visualizzare come sopra.
L'utente può anche creare un nuovo testo, completo di sottolineature gerarchiche, combinando il testo elettronico e le porzioni di testo estratte nelle fasi di estrazione di cui sopra con uno o più altri testi.
Durante l'esecuzione della fase di visualizzazione, possono essere raccolti e memorizzati dati relativi alle varie visualizzazioni di dette porzioni di testo con livelli di rilevanza differenti.
L'invenzione può comprendere un programma per elaboratore, comprendente mezzi a codice tali che, quando vengono eseguiti su un sistema computerizzato, eseguono le fasi del metodo secondo quanto sopra nelle varie forme realizzative che possono essere combinate.
L'invenzione può anche fornire un sistema computerizzato, comprendete almeno un computer e una memoria fisica, in particolare un sistema client/server, configurato per eseguire le fasi del metodo secondo l'invenzione in una o più forme realizzative anche in combinazione.
In quel che precede sono state descritte le preferite forme di realizzazione e sono state suggerite delle varianti della presente invenzione, ma è da intendersi che gli esperti del ramo potranno apportare modificazioni e cambiamenti senza con ciò uscire dal relativo ambito di protezione, come definito dalle rivendicazioni allegate.

Claims (9)

  1. RIVENDICAZIONI 1) Metodo implementato via computer per l'estrazione di riassunti di differente livello di rilevanza/sintesi da un testo elettronico con sottolineature strutturate e gerarchiche di suoi elementi di testo, in cui sono eseguite le seguenti fasi: A. acquisire e memorizzare, su una memoria fisica di o connessa a detto computer, un dataset di partenza comprendente: - le coordinate relative di una o più evidenziazioni di livello di rilevanza decrescente in detto testo elettronico; - uno o più valori predefiniti rispettivamente associati a ciascuna di dette una o più evidenziazioni, ciascun valore predefinito indicando un livello di rilevanza del testo; B. per il livello di rilevanza più alto, estrarre una porzione di detto testo elettronico ai cui elementi di testo è associato il corrispondente valore predefinito, in cui detti elementi di testo in detta porzione mantengono la stessa posizione relativa o assoluta che hanno nel testo elettronico; C. per ogni livello di rilevanza successivo, estrarre una porzione di detto testo elettronico comprendente o composto degli elementi di testo cui è associato il corrispondente valore predefinito oltre agli elementi di testo cui sono associati i valori predefiniti di tutti i livelli di rilevanza più elevati, in cui detti elementi di testo in detta porzione mantengono la stessa posizione relativa o assoluta che hanno nel testo elettronico; D. memorizzare le porzioni di testo elettronico della fase B e C su una memoria fisica di o connessa a detto computer, sotto forma di database o all'interno di variabili opportunamente configurate; E. costruire e memorizzare, per ciascuna porzione di testo elettronico della fase D, una corrispondente porzione di testo formattato in cui sono eliminati spazi inutili tra gli elementi di testo e sono inseriti degli accapo tra insiemi di elementi di testo che appartengono a frasi differenti nel testo elettronico, opzionalmente inserendo maiuscole all'inizio di ogni frase; F. visualizzare, su una interfaccia grafica mostrata su uno schermo, la porzione di testo formattata della fase E corrispondente ad uno specifico livello di rilevanza o detto testo elettronico, sulla base di una scelta di utente.
  2. 2) Metodo secondo la rivendicazione 1, in cui gli elementi di testo di ciascun livello di rilevanza sono visualizzati con differenti colori e/o font e/o background e/o dimensioni.
  3. 3) Metodo secondo la rivendicazione 1 o 2, in cui una volta effettuata la fase F con la visualizzazione di una porzione di testo formattata, è possibile visualizzare successivamente un altra porzione di testo formattata corrispondente ad un differente livello di rilevanza , sulla base di un'ulteriore scelta utente.
  4. 4) Metodo secondo la rivendicazione 3, in cui detta altra porzione di testo formattata è una porzione di testo formattata di livello di rilevanza inferiore e detta ulteriore scelta utente è fatta tramite puntatore o cursore sull'interfaccia grafica, l'elemento di testo puntato dall'utente essendo fatto lampeggiare per un tempo determinato in sovrapposizione a detta altra porzione di testo formattata.
  5. 5) Metodo secondo una qualsiasi delle rivendicazioni da 1 a 4, in cui sono memorizzati in detta memoria fisica altri testi elettronici aggiuntivi, eventualmente utilizzando porzioni di detto testo elettronico, a cui è associato un rispettivo livello di rilevanza aggiuntivo, che l'utente può visualizzare come nella fase F.
  6. 6) Metodo secondo una qualsiasi delle rivendicazioni da 1 a 5, in cui l'utente può creare un nuovo testo, completo di sottolineature gerarchiche, combinando il testo elettronico e le porzioni di testo estratte nelle fasi B and/or C con uno o più altri testi.
  7. 7) Metodo secondo una qualsiasi delle rivendicazioni da 1 a 6, in cui durante l'esecuzione della fase F vengono raccolti e memorizzati dati relativi alle varie visualizzazioni di dette porzioni di testo con livelli di rilevanza differenti.
  8. 8) Programma per elaboratore, comprendente mezzi a codice tali che, quando vengono eseguiti su un sistema computerizzato, eseguono le fasi del metodo secondo le rivendicazioni da 1 a 7.
  9. 9) Sistema computerizzato, comprendete almeno un computer e una memoria fisica, in particolare un sistema Client/server, configurato per eseguire le fasi del metodo secondo una qualsiasi delle rivendicazioni da 1 a 7.
ITUB2015A004726A 2015-10-19 2015-10-19 Metodo e sistema per l?estrazione di riassunti da testi con sottolineatura strutturata. ITUB20154726A1 (it)

Priority Applications (4)

Application Number Priority Date Filing Date Title
ITUB2015A004726A ITUB20154726A1 (it) 2015-10-19 2015-10-19 Metodo e sistema per l?estrazione di riassunti da testi con sottolineatura strutturata.
US15/769,214 US11321416B2 (en) 2015-10-19 2016-10-19 Computer-implemented method for the generation of zoomable hierarchical texts starting from an original electronic text
EP16823354.2A EP3365814B1 (en) 2015-10-19 2016-10-19 Computer-implemented method for the generation of zoomable hierarchical texts starting from an original electronic text
PCT/IT2016/000245 WO2017068606A1 (en) 2015-10-19 2016-10-19 Computer-implemented method for the generation of zoomable hierarchical texts starting from an original electronic text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
ITUB2015A004726A ITUB20154726A1 (it) 2015-10-19 2015-10-19 Metodo e sistema per l?estrazione di riassunti da testi con sottolineatura strutturata.

Publications (1)

Publication Number Publication Date
ITUB20154726A1 true ITUB20154726A1 (it) 2017-04-19

Family

ID=55273370

Family Applications (1)

Application Number Title Priority Date Filing Date
ITUB2015A004726A ITUB20154726A1 (it) 2015-10-19 2015-10-19 Metodo e sistema per l?estrazione di riassunti da testi con sottolineatura strutturata.

Country Status (4)

Country Link
US (1) US11321416B2 (it)
EP (1) EP3365814B1 (it)
IT (1) ITUB20154726A1 (it)
WO (1) WO2017068606A1 (it)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107301227A (zh) * 2017-06-21 2017-10-27 北京百度网讯科技有限公司 基于人工智能的搜索信息解析方法及装置
EP4059006A4 (en) 2019-11-14 2023-12-06 E Ink Corporation METHOD FOR CONTROLLING ELECTRO-OPTICAL DISPLAYS

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7747943B2 (en) * 2001-09-07 2010-06-29 Microsoft Corporation Robust anchoring of annotations to content
US7779347B2 (en) * 2005-09-02 2010-08-17 Fourteen40, Inc. Systems and methods for collaboratively annotating electronic documents
US7925993B2 (en) * 2006-03-30 2011-04-12 Amazon Technologies, Inc. Method and system for aggregating and presenting user highlighting of content
US7844891B2 (en) 2006-06-23 2010-11-30 Rohit Chandra Method and apparatus for creating, configuring and displaying a widget to display user-generated highlights
US8352573B2 (en) * 2006-06-23 2013-01-08 Rohit Chandra Method and apparatus for automatically embedding and emailing user-generated highlights
US20120131520A1 (en) * 2009-05-14 2012-05-24 Tang ding-yuan Gesture-based Text Identification and Selection in Images
US9087043B2 (en) * 2010-09-29 2015-07-21 Rhonda Enterprises, Llc Method, system, and computer readable medium for creating clusters of text in an electronic document
KR20130140435A (ko) * 2012-06-14 2013-12-24 삼성전자주식회사 컨텐츠에 중요도를 부여하기 위한 방법 및 그 전자 장치
US10198776B2 (en) * 2012-09-21 2019-02-05 Graham Holdings Company System and method for delivering an open profile personalization system through social media based on profile data structures that contain interest nodes or channels
US9665550B2 (en) * 2012-11-30 2017-05-30 Michael E. Lee Expert based integrated annotation software interface and database using e-book technology
US20150058716A1 (en) * 2013-08-21 2015-02-26 iPedago, LLC System and method for summarizing documents
US9792272B2 (en) * 2013-12-31 2017-10-17 Barnes & Noble College Booksellers, Llc Deleting annotations of paginated digital content

Also Published As

Publication number Publication date
US20180307776A1 (en) 2018-10-25
EP3365814A1 (en) 2018-08-29
EP3365814B1 (en) 2020-12-02
WO2017068606A1 (en) 2017-04-27
US11321416B2 (en) 2022-05-03

Similar Documents

Publication Publication Date Title
Jänicke et al. Visual text analysis in digital humanities
US10671251B2 (en) Interactive eReader interface generation based on synchronization of textual and audial descriptors
Bateman et al. Multimodality and empiricism
Kottwitz LaTeX cookbook: Over 90 hands-on recipes for quickly preparing LaTeX documents to solve various challenging tasks
Wernimont et al. Feminism in the age of digital archives: the women writers project
US20130227402A1 (en) System, apparatus, method, and applications for measuring and reporting on the process of composing written material
US20090055721A1 (en) Patent claim visualization system and method
Jänicke et al. Interactive visual alignment of medieval text versions
Agosti et al. Annotating illuminated manuscripts: an effective tool for research and education
Kruse et al. Digital writing technologies in higher education: theory, research, and practice
CN104850580B (zh) 一种在互联网上标识和检索教学资源的方法
ITUB20154726A1 (it) Metodo e sistema per l?estrazione di riassunti da testi con sottolineatura strutturata.
JP2012059225A (ja) 情報処理装置,情報処理方法及びそのプログラム
Bateman et al. Multimodality and empiricism: methodological issues in the study of multimodal meaning-making
JP2008146637A (ja) ドメイン変換言語
CN106033348A (zh) 一种制作网页的方法、装置及电子设备
Helsen et al. Optical music recognition and manuscript chant sources
Browne et al. EPUB3 indexes and the future of indexing
JP7308059B2 (ja) 発想支援システム、発想支援方法、プログラム
Herrmann Guidelines for Writing a High-Quality Thesis with the PSIThesis Template
Liu et al. Building large scale text corpus for Tibetan natural language processing by extracting text from web
Bhowmik Bichitra: The Online Tagore Variorum Project
Kushwaha et al. Visualizing the Lost Script of South Asia Under the Umbrella of the Digital Humanities Tool-VisualEye.
Stars et al. The PracTeX Journal 2012-1
Clavaud The digital edition of the medieval charters of the Abbey of Saint-Denis: first results and prospects