ES2285736T3 - Procesador de textos. - Google Patents
Procesador de textos. Download PDFInfo
- Publication number
- ES2285736T3 ES2285736T3 ES97935052T ES97935052T ES2285736T3 ES 2285736 T3 ES2285736 T3 ES 2285736T3 ES 97935052 T ES97935052 T ES 97935052T ES 97935052 T ES97935052 T ES 97935052T ES 2285736 T3 ES2285736 T3 ES 2285736T3
- Authority
- ES
- Spain
- Prior art keywords
- text
- rules
- termination
- attributes
- categories
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B17/00—Teaching reading
- G09B17/04—Teaching reading for increasing the rate of reading; Reading rate control
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/06—Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
- G09B5/065—Combinations of audio and video presentations, e.g. videotapes, videodiscs, television systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Business, Economics & Management (AREA)
- Educational Technology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Machine Translation (AREA)
- Debugging And Monitoring (AREA)
- Saccharide Compounds (AREA)
- Document Processing Apparatus (AREA)
Abstract
Método para mejorar la presentación de texto a partir de un texto de lenguaje natural legible por máquina basándose en parámetros específicos del lector, incluyendo como mínimo las dimensiones del campo de visión, que comprende: analizar sintácticamente de dicho texto signos de puntuación y categorías gramaticales para extraer atributos específicos del texto; almacenar dichos atributos específicos del texto en relación con las categorías gramaticales para producir un texto enriquecido; aplicar reglas de terminación primarias seguidas por reglas de terminación secundarias a dicho texto enriquecido, aplicadas de acuerdo con una categoría de reglas de terminación que dividen dicho texto en segmentos de texto, teniendo dichas reglas de terminación como mínimo dichos atributos de puntuación y atributos de categoría gramatical como entradas y atributos visuales como salidas; aplicar reglas de terminación secundaria hasta que se alcanza un determinado límite, que de manera preferente esla longitud mínima de línea; y en el que los atributos visuales incluyen la visualización de segmentos de texto en nuevas líneas; aplicar reglas de desplazamiento horizontal de segmentos de texto a dichos segmentos de texto para determinar un desplazamiento horizontal para cada segmento de texto, incluyendo dichas reglas de desplazamiento horizontal categorías gramaticales como entradas y atributos visuales de desplazamiento horizontal como salidas para producir un texto mejorado; y visualizar dicho texto mejorado mediante una presentación en cascada de segmentos de texto en líneas descendentes y a lo ancho del dispositivo de visualización.
Description
Procesador de textos.
La presente invención se refiere a un método de
proceso de textos para obtener, a partir de un texto legible por
máquina, una presentación de texto mejorada basada en parámetros
específicos del lector y un procesador de textos para llevar a cabo
dicho método.
La finalidad de la lectura es causar un impacto
en la mente del lector. Esto es cierto tanto en el caso en que el
texto que es leído es una novela o cuando es una pantalla de
visualización tipo "heads-up" de un avión. El
material presentado en un medio no textual lleva información
apropiada para la absorción por el ser humano, además del
correspondiente texto unidimensional. Las imágenes estáticas
presentan atributos de objeto tales como colores, tamaños
relativos, patrones, agrupamiento, y jerarquías. Un objeto es visto
dentro de un contexto. Por ejemplo, una imagen de un objeto pequeño
localizado con otros en una esquina lleva distinta información que
el mismo objeto, con mayor tamaño, por sí solo, y en el centro.
Comenzar oraciones y párrafos añade información contextual por el
sólo hecho de su posición. Las imágenes en movimiento presentan
modificaciones de movimiento y temporales como atributos añadidos.
Una gran parte de la información penetra en el cerebro visualmente y
a través de reconocimiento de parámetros. Otra información penetra
como información auditiva, llevando información a través de un
tono, cambiando la inflexión, y cambiando el nivel de volumen.
La presentación por ordenador de un texto para
la lectura humana ha fracasado en la utilización de una parte
importante del cerebro humano. Como resultado, se utiliza sólo una
parte del ancho de banda disponible, y la presentación de texto por
ordenador a menudo es percibida como desfavorable, constante,
mecánica, y generalmente incompleta en algún sentido. Cuando se les
da la opción, la mayoría de las personas prefieren leer un libro
impreso que un libro a través de la pantalla del ordenador. La
presentación actual de textos por ordenador resulta pobre en
comparación con un libro, y aún más pobre teniendo en cuenta su
potencial.
Se ha realizado cierto trabajo en la
presentación de texto por ordenador. El documento
US-A-4.880.385 da a conocer un
dispositivo de lectura de velocidad optomecánica que permite el
visionado de texto impreso sobre papel a través de una ventana de
visión de una línea de una sola vez, avanzando automáticamente las
líneas.
Se han logrado avances en métodos para el
análisis gramatical por ordenador del lenguaje natural separando
las categorías gramaticales. El documento
US-A-5.475.588 da a conocer un
sistema de análisis gramatical mejorado para crear árboles de
análisis gramatical. El documento
US-A-5.331.556 da a conocer un
método para almacenar información de categorías gramaticales en un
archivo junto con el texto original para la búsqueda mejorada
subsiguiente del texto. Los documentos
US-A-4.661.924 y
US-A-5.146.405 dan a conocer métodos
para eliminar ambigüedades de múltiples categorías gramaticales.
Los documentos US-A-4.887.212,
US-A-5.068.789 y
US-A-5.083.268 dan a conocer
métodos para análisis gramatical de texto de lenguaje natural. La
lectura es un proceso complejo y existen numerosos factores que
determinan diferencias en el rendimiento de lectura entre lectores e
incluso para el mismo lector en distintas ocasiones. Dichas
diferencias incluyen condiciones neurofisiológicas tales como la
dislexia, pero también la edad; factores de comportamiento y
motivación; nivel de educación y práctica de lectura previa; y
restricciones de la percepción. Un lector también puede tener
distintos objetivos para la lectura que afectarán su forma de
acercamiento al material de lectura. A pesar de todo lo dicho
anteriormente, el texto es presentado por ordenadores, en el peor
de los casos, como "cuentas en una cadena" unidimensional, en
el mejor de los casos, similar al texto bidimensional presentado por
los libros. De hecho, si el texto es presentado en versión impresa
o en una pantalla de visualización electrónica, es de poca
importancia debido a que la presentación del texto es esencialmente
idéntica.
El documento
US-A-5.060.155 da a conocer un
método para codificar sin ambigüedades múltiples análisis
gramaticales de una secuencia de palabras de lenguaje natural en
dependencia de la gramática, en los que las dependencias quedan
definidas entre pares de palabras, cada par consistiendo en una
palabra superordinada o gobernante y una palabra relacionada o
dependiente. Una red sintáctica es determinada y es representada
como un árbol que consiste en nodos acoplados mutuamente por bordes
o aristas y que comprende como mínimo un nodo principal, uno o más
nodos terminales y eventualmente una cantidad de nodos intermedios,
sirviendo cada nodo como puntero en el caso de que exista una única
alternativa y sirviendo como punto de elección en el caso de que
existan varias alternativas, por lo cual cada uno de los nodos
punteros es asignado a una palabra de la secuencia y cada borde es
asignado a la relación sintáctica entre los dos nodos acoplados por
dicho borde, por lo cual cada nodo está codificado por un
identificador que, en el caso de un nodo puntero, está directamente
relacionado con la entrada de una palabra en el diccionario y en el
caso de un punto de elección comprende una lista de identificadores
adicionales, uno de los cuales debe ser seleccionado.
El documento
US-A-4.613.309 da a conocer un
modelo educativo para enseñar elementos gramaticales del lenguaje,
sintaxis y estructura de la oración, en el que se identifican
treinta elementos del habla o categorías gramaticales individuales
y son agrupadas en diez conjuntos distintos que son incorporados en
modelos físicos. Cada modelo representa una palabra o grupo de
palabras, denominadas "elementos", que forman los bloques de
construcción lógica del lenguaje. Determinados elementos son en
realidad elementos híbridos, dado que reflejan las propiedades y
derivaciones únicas de los verbos, frases y oraciones. Los símbolos
son utilizados para designar la función de cada elemento; el color
es utilizado para designar el conjunto de elementos, y la forma es
utilizada para designar la parte de la oración y la categoría
gramatical. El usuario interrelaciona cada elemento con otros
elementos para formar una frase, suboración, u oración como una
alternativa a los diagramas sintácticos convencionales. Los modelos
pueden ser realizados en soporte impreso, plástico, vídeo o
software.
Los ejemplos de presentación constante son
numerosos. Las oraciones que presentan un tema son presentadas del
mismo modo que el resto de las oraciones de un párrafo. Las palabras
técnicas son presentadas del mismo modo que las palabras que no son
técnicas. Los adjetivos son iguales a los sustantivos. Términos que
resultan complicados desde un punto de vista educativo son
presentados del mismo modo que términos simples. El último párrafo
de un capítulo es presentado del mismo modo que el primer párrafo.
El texto es presentado con formato justificado a la izquierda, como
líneas partidas de anchura constante, que requieren de un movimiento
alternado del ojo desde el extremo derecho hasta el extremo
izquierdo con intervalos regulares. El texto es cortado en mitad de
una oración, mitad de una frase y en mitad de una palabra, aplicando
reglas de composición antiguas. Dicho texto fuerza al ojo a
desplazarse grandes distancias hacia un lado y hacia el otro,
imitando el carro de una máquina de escribir. El texto es avanzado
manualmente, partido en trozos determinados por la cantidad de
líneas que caben en la
pantalla.
pantalla.
El documento
US-A-5.060.155 da a conocer un
método de codificación no ambigua de múltiples análisis sintácticos
de una secuencia de palabras de lenguaje natural en dependencia de
la gramática, en el que dichas dependencias son definidas entre
pares de palabras, consistiendo cada par en una palabra
superordinada o gobernador y una palabra relacionada o dependiente
de la misma. Para cada palabra en la secuencia, se determina un
índice de palabra, que representa la orden de rango de dicha
palabra en dicho secuencia. Todos las posibles dependientes de cada
palabra son determinadas, además de la relación entre la palabra y
las dependientes, utilizando un algoritmo de análisis sintáctico en
combinación con una gramática y un diccionario en el que todas las
palabras del lenguaje son almacenadas junto con su interpretación
sintáctica y un índice de interpretación, que representa el orden
de rango de la interpretación sintáctica de la palabra en el
diccionario a efectos de distinguir entre múltiples
interpretaciones sintácticas de dicha palabra. Queda determinada una
red de interconexión sintáctica que es representada como un árbol
que consiste en nodos acoplados mutuamente por bordes y que
comprende como mínimo un nodo superior, uno o más nodos terminales
y eventualmente una cantidad de nodos intermedios, siendo
interpretado cada uno de dichos nodos como un nodo OR exclusivo que
sirve como puntero si existe sólo una alternativa y sirviendo como
punto de elección en el caso de que existan varias alternativas, por
lo cual cada uno de los nodos punteros es asignado a una palabra de
la secuencia y cada borde es asignado a la relación sintáctica
entre dos nodos acoplados por dicho borde, por lo cual cada nodo es
codificado por un identificador que en caso de un nodo puntero está
directamente relacionado con la entrada de una palabra en el
diccionario y en el caso de un punto de elección comprende una
lista de identificadores adicionales, uno de los cuales debe ser
seleccionado.
A partir de "Software-Practice
and Experience", vol. 11, 1119-1184 (1981),
Donald E. Knuth y Michael F. Plass, "Breaking Paragraphs into
Lines", se conoce un procesamiento del lenguaje por ordenador, es
decir una composición mejorada. Dicho artículo da a conocer un
nuevo acercamiento al problema de dividir el texto de un párrafo en
líneas de longitud aproximadamente igual manteniendo el espacio
entre palabras dentro de un rango deseado; evitando grandes
variaciones del tamaño de separación entre palabras encontrado en
una línea en comparación con el siguiente; evitando saltos de línea
"psicológicamente malos" y reduciendo el número de palabras
cortadas o escritas con guión; evitando palabras "salientes"
en márgenes derechos irregulares que se sitúan completamente sobre
un espacio vacío de la siguiente línea; y evitando patrones de
espacios blancos desagradables, por ejemplo, "dibujo de pata de
gallo" ("houndsteeth"), lagartijas, o ríos, que se extienden
a través de una secuencia de líneas y distraen la vista del lector.
Se calculan "cajas" ("boxes"), "pegamento"
("glue") y "penalizaciones" para determinar los puntos de
corte óptimos, a partir de una variedad de opciones de puntos de
corte, para rellenar un espacio bidimensional que tenga márgenes
izquierdo y derecho definidos.
Existen varias buenas razones para no colocar
sólo una oración realzada por página en un libro. Estas razones
pueden haber sido traspasadas de forma inapropiada a la
visualización por ordenador de un texto. La posibilidad de
modificar la presentación del texto para mejorar la capacidad del
lector para leer dicho texto aprovechando el poder de la
manipulación digital parece haber sido pasado por alto por las
personas más especializadas dentro del ámbito de la
informática.
El objetivo de la presente invención es dar a
conocer un método de proceso de textos para producir un texto
mejorado a partir de un texto legible por máquina en el que se
aceptan parámetros específicos del lector en el procesamiento de
dicho texto, y un procesador de textos para llevar a cabo dicho
método.
Para lograr dicho objetivo, la presente
invención da a conocer un método de proceso de textos y un
procesador de textos tal como queda definido en las
reivindicaciones independientes. Las realizaciones preferentes de
la presente invención están caracterizadas en las reivindicaciones
dependientes.
Una ventaja de la presente invención es que los
segmentos de texto significativos son visualizados en líneas en una
pantalla que toma en cuenta parámetros específicos del lector que
incluyen, como mínimo, las dimensiones del campo de visión elegidas
por el lector. La presente invención es operativa para visualizar
los segmentos de texto significativos tanto si el campo de visión,
por ejemplo la anchura de la pantalla, es seleccionada pequeña o
grande. Por lo tanto, los segmentos de texto pueden ser
visualizados, por ejemplo, en toda la pantalla o una parte más
pequeña de la pantalla en la que el segmento de texto sigue siendo
un segmento de texto significativo.
Además, una ventaja de la presente invención es
que la misma extrae atributos a partir de una secuencia de entrada
y visualiza dicha secuencia como segmentos de texto en cascada en
dirección descendente y a lo ancho de la pantalla en la que la
segmentación y el desplazamiento horizontal quedan determinados
mediante la aplicación de reglas que utilizan categorías
gramaticales, puntuación y preferencias del lector.
Las realizaciones preferentes de la presente
invención incluyen la extracción de atributos específicos del texto
a partir de un texto legible por máquina, variando la presentación
del texto de acuerdo con los atributos, y creando un producto
visual tridimensional (superficie de lectura y tiempo) para mejorar
la experiencia de lectura. El color del texto y el fondo también
pueden ser variados dependiendo de las categorías gramaticales y la
posición de las oraciones dentro de los párrafos y de dichos
párrafos dentro de capítulos.
En las realizaciones preferentes de la presente
invención atributos visuales significativos realzan la presentación
de texto visualizado por ordenador sobre la visualización textual
constante y mecánica de los sistemas existentes en la actualidad.
Se crea una pista visual que está relacionada con el contenido de la
nueva frase y su relación con la frase previa. Dicha pista está
disponible antes de que el texto sea leído, creando un contexto para
el texto. El procesamiento de análisis sintáctico de oraciones
utiliza la puntuación de las oraciones y el contenido de las mismas
para crear un sistema de pistas visuales significativas que incluyen
distintas frases que favorecen el reconocimiento más rápido de las
palabras en una frase y sus significados. La oración mejorada
desciende en cascada por la página creando un patrón de frases
significativas determinadas por el contenido del texto y las
preferencias del lector, haciendo que los ojos se muevan distancias
cortas entre frase y frase.
Una oración representa una idea completa, y un
párrafo representa un tema o razonamiento diferenciado. La
comprensión de la lectura mejora cuando aparece una sola oración a
la vez y cuando la transición desde un párrafo al siguiente es
señalada visualmente e incluye una pausa para la aparición de dichos
elementos de texto. La presente invención crea atributos visuales
apropiados para proporcionar dichas señales visuales. Los atributos
visuales pueden incluir segmentación de texto, desplazamiento
horizontal de una línea respecto a otra, color de texto y fondo,
brillo del texto, y animación. La animación puede incluir brillo
progresivo, temporal, dependiente del tiempo, parpadeante y
deslizante, de los elementos de texto, y el movimiento del texto
desde la presentación estándar a la presentación en cascada.
En una sesión de lectura a modo de ejemplo, el
lector selecciona el texto que leerá, e informa al sistema de
lectura acerca del tipo, por ejemplo una novela. El sistema de
lectura recupera el entorno apropiado previamente almacenado para
dicho lector leyendo dicho tipo de texto seleccionado. El lector
tiene la oportunidad de editar las reglas de lectura y los
conjuntos de palabras, pero la rechaza. Comenzado al inicio de un
capítulo, en el que el lector retoma la lectura, el texto es
presentado, una oración a la vez, descendiendo en cascada y a lo
ancho de la pantalla. A medida que las líneas presentadas en
pantalla son partidas en segmentos de texto significativo en lugar
de la finalización arbitraria a los 80 caracteres, es posible leer y
comprender un segmento completo por vez, haciendo que el movimiento
resultante del ojo sea desde el centro de un segmento de texto
hacia el centro de otro segmento de texto, hacia abajo y a lo ancho
de la pantalla. El color de fondo de la oración es una función de
la posición de la oración dentro de un párrafo y la posición de
dicho párrafo dentro del capítulo. Cada una de las oraciones en un
párrafo puede tener el mismo color, y sin embargo presentar cambios
incrementales pero discernibles de la saturación del color u
oscuridad entre oraciones, y cambios incrementales pero
discernibles del color entre párrafos. Por lo tanto, el color de
fondo proporciona información de posición no literal, señalando el
comienzo y finalización de un párrafo, y el comienzo y finalización
de un
capítulo.
capítulo.
Las oraciones son segmentadas de acuerdo con
reglas aprobadas por el lector. Cada preposición pliega una frase
de manera predecible, resultando en dos segmentos de texto, cada uno
de ellos ocupando una nueva línea. El contenido de la línea
superior produce el desplazamiento horizontal de la línea inferior.
La misma preposición pliega y desplaza horizontalmente el texto del
mismo modo siempre que sea posible. Como resultado, la misma
preposición produce un patrón similar, que ya resulta familiar para
el lector. Las categorías gramaticales afectan el color del texto
de acuerdo con reglas aprobadas por el lector. Como resultado, la
estructura de la oración y las categorías gramaticales son
inmediatamente reconocibles a partir del reconocimiento del patrón
y color, aún antes de que una palabra del texto sea reconocida,
proporcionando al lector pistas visuales y no literales.
Las oraciones avanzan con una velocidad
determinada por una regla previamente seleccionada por el lector.
La fórmula es una función del tipo de texto, cantidad de palabra,
nivel de educación, y cantidad de sílabas presentes en una línea.
La velocidad de avance es un poco más rápida que la velocidad que
resulta cómoda para el lector, para aumentar la comprensión. Una
pausa más larga entre presentación de oraciones señala un nuevo
párrafo antes de que aparezca. El lector es capaz de interactuar de
forma sencilla con el sistema de lectura, manteniendo las oraciones
complicadas más tiempo en la pantalla, y aumentando o disminuyendo
la velocidad de presentación.
La sesión de lectura a modo de ejemplo descrita
anteriormente se muestra sólo a modo de ejemplo, y no limita o
abarca todas las realizaciones posibles dentro del alcance de la
presente invención.
El proceso de resalte explota el hecho de que
los elementos de texto tienen cualidades no literales que pueden
ser utilizadas para producir una presentación de texto en el tiempo
y el espacio que sea más significativa y mejore la capacidad para
comprender el significado literal del texto en mayor grado que los
formatos existentes en ordenadores o papel. La presentación en
cascada descendente y a lo ancho de la pantalla de frases imprime
un corolario visual acerca del modo en que se podría experimentar el
texto si fuera escuchado en una lectura en vivo, sin que el lector
tenga que subvocalizarlo. Leer un texto realzado de esta manera es
casi como escuchar con los ojos, pero como un paquete visual
completo que es experimentado de manera casi simultánea.
Las realizaciones preferentes de la presente
invención serán descritas haciendo referencia a los dibujos, en los
que:
La figura 1 es un diagrama de flujo de alto
nivel de un método utilizado en una realización de la presente
invención;
La figura 2 es una tabla que muestra varios
atributos de los elementos en una oración;
La figura 3 contiene un ejemplo de un texto
mejorado que incluye la presentación en cascada con ángulos de
descenso hacia la derecha;
La figura 4 presenta la oración de la figura 3
como texto mejorado incluyendo la presentación en cascada con
ángulos de descenso hacia la derecha y hacia la izquierda;
La figura 5 muestra la etapa -110- en
detalle;
La figura 6 muestra conjuntos de palabras que
establecen una jerarquía de puntos de terminación secundarios;
La figura 7 muestra posiciones de puntos de
terminación dentro de una oración;
La figura 8 muestra la etapa -136- en
detalle;
La figura 9 muestra la oración de la figura 7
presentada como texto mejorado;
La figura 10 muestra un mapa del historial de
muestreo del intervalo de presentación, en el que el tiempo
necesario para la lectura es una función de la dificultad y
complejidad de la oración; y
La figura 11 muestra una oración de la figura 7
que muestra 5 pronunciaciones visuales de sílabas enfatizadas.
La figura 1 muestra un diagrama de flujo de alto
nivel de un método utilizado en una realización de la presente
invención. Por supuesto que las etapas en la figura 1 y todas las
mencionadas figuras pueden ser separadas en etapas adicionales o
combinarse en menor cantidad de etapas y aún describir la misma
realización.
En la etapa -102-, el dispositivo de lectura es
iniciado y se lleva a cabo la identificación (ID) del lector y la
identificación del archivo de texto que será leído. En una
realización preferente, la ID del lector es obtenida a partir del
sistema operativo. En otra realización, el lector es instado a
identificarse. En una realización, existe sólo un lector del
dispositivo. Dada la ID del lector, los parámetros especificados del
lector son recuperados en la etapa -104-. Los parámetros son
descritos en detalle posteriormente en el presente documento. Dada
la ID del texto, el archivo de texto y los parámetros específicos
del texto son recuperados en la etapa -104-. En una realización
preferente, los parámetros tienen valores por defecto, y no
requieren entradas del lector. En una realización más preferente,
se permite la entrada de parámetros específicos preferidos por el
lector, se aceptan los valores, y los valores de dichos parámetros
son almacenados como en la etapa -108-. En una realización, se
permite que el usuario despliegue menús que contienen cuadros de
diálogo, vea los parámetros por defecto y los modifique utilizando
interfaces estándar de usuario que incluyen entradas numéricas,
entradas de texto, barras de deslizamiento, y botones. En una
realización preferente, dado un permiso de acceso apropiado, se
permite la modificación de los parámetros globales aplicados a todos
los lectores del texto. Se permite que el lector tenga parámetros
configurados sólo para el texto actual, todos los textos del mismo
tipo que el texto actual, o todos los textos leídos por dicho
lector.
Los parámetros específicos del lector incluyen:
dimensiones de campo de visión; paleta de color para el fondo y el
texto; conjunto de palabras; entradas para reglas; longitud mínima
de frase; longitud mínima de línea; longitud mínima y máxima de
segmento de texto; ángulos de descenso; entradas de reglas de
desplazamiento horizontal; preferencias de justificación
horizontal; longitud de intervalo entre frases; proporción de
avance; proporciones de intervalo entre oraciones y entre párrafos;
definiciones de etiquetas de identificación; especificaciones de
animación; definiciones de parámetros para derivar los intervalos de
presentación dependientes del contenido; definiciones de parámetros
y pesado para derivar la materia, longitud, densidad, complejidad y
contenido de la frase/texto; e identidades de rutina
("scripts") de eventos especiales.
Las dimensiones del campo de visión pueden
especificar el tamaño de la ventana para visualizar el texto en las
dos dimensiones X e Y, y una tercera dimensión, que es el tiempo.
Este campo puede incluir toda la pantalla o una parte más pequeña
de dicha pantalla. La dimensión tiempo puede incluir el tiempo
durante el cual se producen animaciones dependientes del tiempo,
tales como los parpadeos.
La paleta de color para el fondo y el texto
permite la especificación de colores preferentes para el fondo y
texto que varían de acuerdo con el texto. En una realización
preferente, el tono y el brillo del color de fondo varían de
acuerdo con la posición dentro de un párrafo, y la posición del
párrafo dentro de un capítulo. En una realización más preferente,
el brillo es fijado a un nivel para la primera oración en un párrafo
y un segundo nivel para la última oración de un párrafo, haciendo
que el color de cada oración progrese entre dicho primer nivel y
dicho segundo nivel. En una realización preferente, el tono del
fondo es fijado a un primer valor para el primer párrafo en un
capítulo y un segundo valor para el último párrafo de un capítulo,
haciendo que el tono de cada párrafo progrese entre dicho primer
valor y dicho segundo valor. En una realización más preferente, el
primer tono es verde y el segundo es
violeta.
violeta.
En las realizaciones preferentes, el color del
texto puede variar de acuerdo con una categoría de palabra y
atributos continuos. Un atributo de categoría es una función de la
categoría a la que se ajusta una palabra. En una realización más
preferente, las categorías incluyen categorías gramaticales, por
ejemplo verbos, y palabras técnicas. Los atributos continuos
incluyen aquellos que pueden ser medidos como nivel de instrucción,
por ejemplo duodécimo grado, cantidad de sílabas, y longitud de
palabra. En una realización preferente, las distintas categorías
gramaticales tienen distintos colores de texto. En una realización
más preferente, el color del texto es variado junto con el color de
fondo para proporcionar un contraste óptimo y preferido por el
lector.
Los conjuntos de palabras pueden ser utilizados
para especificar algunas categorías gramaticales. Por ejemplo,
"I" es una pronombre, "had" es un verbo, "a" es un
artículo, y "farm" podría ser un sustantivo, verbo o adjetivo.
Las categorías gramaticales sólo necesitan ser categorías
gramaticales similares tal como ocurre con la palabra "farm",
que podría ser un sustantivo, un verbo o un adjetivo. Un ejemplo de
las categorías gramaticales en una sola oración es mostrado en la
figura 2. Las múltiples categorías posibles de la columna de
categoría gramatical (150) son mostradas como es la categoría
gramatical desambiguada de la columna (152).
Los conjuntos de palabras son introducidos en
las realizaciones preferentes utilizando dos métodos. El primer
método utiliza un formato de texto estructurado tal como el lenguaje
de marcado generalizado estándar (SGML), permitiendo la importación
y exportación de grandes conjuntos de palabras y diccionarios de
diversas fuentes. Analizadores SGML estándar son utilizados para
almacenar los conjuntos de palabras en una base de datos apropiada.
El segundo método permite la edición interactiva de conjuntos de
palabras que utilizan una jerarquía de menús desplegables y cuadros
de diálogo. En una realización preferente, los conjuntos de palabras
especificados por el lector son almacenados en una base de datos
separada del diccionario o conjuntos de palabras de glosario, para
permitir al almacenamiento, edición y recuperación rápida de manera
separada.
Una realización preferente incluye una longitud
mínima de segmento de texto especificada por el lector. Un segmento
de texto es un trozo de texto que es presentado en una sola línea en
una pantalla de visualización. La longitud mínima del segmento de
texto, que puede ser determinado en palabras, es lo mínimo que el
lector desea ver en una línea individual. La longitud máxima de
línea es la longitud máxima que el lector desea ver en una sola
línea. Las longitudes pueden medirse en número de caracteres,
palabras, sílabas, nivel de instrucción, o cualquier suma de
productos de dichas cantidades. En una realización, la longitud
mínima de línea es de diez caracteres y la longitud máxima de línea
es de treinta y cinco caracteres.
La longitud de frase es un atributo derivado de
una frase (segmento de texto o segmento de texto potencial) que
otorga alguna medida de la cantidad de material dentro de una frase.
En una realización, la longitud de frase es simplemente el número
de palabras dentro de una frase. En una realización preferente de la
presente invención, la longitud de frase incluye la densidad de la
frase y la complejidad de la frase. La densidad de frase puede
incluir la cantidad de palabras técnicas o cantidad de palabras que
excedan un determinado nivel. La complejidad de frase puede incluir
el número de similitudes ortográficas entre palabras dentro de una
frase, cantidad de palabras ambiguas, y la longitud total de las
palabras con longitud especificada por el lector.
Una realización preferente incluye longitudes
máximas y mínimas de segmentos de texto. La longitud del segmento
de texto es la cantidad de texto que el lector desea ver en una
línea separada. En realizaciones preferentes, la longitud del
segmento de texto es la suma de los peses de frase dentro de dicho
segmento de texto.
Las reglas de justificación horizontal
especifican la justificación horizontal de una línea de texto con
respecto a la línea anterior. La justificación puede incluir el
tipo de justificación para la frase o línea que es posicionada, es
decir justificación a la derecha, a la izquierda, o centrada. La
justificación puede incluir además la parte de texto de la línea
sobre la cual se mide la justificación, es decir, la línea completa
de texto con respecto a una frase, el punto de dicha parte
utilizada, por ejemplo extremo izquierdo, extremo derecho o centro.
La justificación horizontal en una realización se mide simplemente
dentro de la línea que es posicionada en lugar de medirse respecto
a la línea
superior.
superior.
En una realización preferente de la presente
invención, la primera frase en una línea está justificado al
centro, midiendo desde el centro de la última frase en la línea
inmediatamente superior. En otra realización, la línea completa de
texto está justificada al centro debajo del centro de la línea del
texto superior. En aún otra realización, el "centro de
gravedad" del segmento de texto, calculado utilizando la
dificultad de cada palabra, es utilizado como el centro del
segmento de texto con fines de justificación.
Un ángulo de descenso es la cantidad de
desplazamiento horizontal para cada nueva línea, modificando la
posición horizontal determinada sólo por las reglas de
justificación horizontal. Por definición, cada segmento de texto es
presentado en una nueva línea. En una realización preferente, el
ángulo de descenso es caracterizado en unidades de caracteres. El
ángulo de descenso y la justificación horizontal determinan como
mínimo de manera parcial la "cascada de texto" hacia abajo y a
lo ancho de la pantalla en realizaciones preferentes. Un ejemplo de
texto en cascada se muestra en las figuras 3 y 4. Un ángulo de
descenso puede ser cero, queriendo decir sin más que la posición
horizontal del segmento de texto está determinada sólo por las
reglas de justificación horizontal. Un ángulo de descenso puede ser
hacia la izquierda, en cuyo caso la línea inferior será desplazada
hacia la izquierda con respecto a la línea anterior o hacia la
derecha, en cuyo caso el texto se desplazará hacia la derecha. La
figura 3 muestra sólo ángulos de descenso hacia la derecha.
En una realización de la presente invención, el
ángulo de descenso es una constante para cada nueva línea. En una
realización preferente, el ángulo de descenso es una función de la
longitud del segmento de texto de la línea superior. En otra
realización preferente, las reglas de justificación horizontal
determinan la justificación centrada debajo del centro de cada
línea inmediatamente superior, y el ángulo de descenso es calculado
para presentar substancialmente una trayectoria recta, cuando todas
las líneas de texto son presentadas, desde el centro de línea al
centro de línea, desde la izquierda superior hasta la derecha
inferior de la superficie de la pantalla.
En una realización preferente, las entradas para
las reglas de ángulo de descenso incluyen atributos del texto de la
línea superior. En una realización preferente, las entradas incluyen
la razón para plegar la línea superior, es decir, un punto de
terminación primario, un punto de terminación secundario, o regla de
bloqueo. En una realización preferente, se utiliza un ángulo de
descenso más positivo cuando la línea inmediatamente superior se ha
plegado debido a un punto de terminación primario en lugar de un
punto de terminación secundario. En otra realización preferente,
las entradas incluyen la longitud del segmento de texto de la línea
actual y la línea superior.
Debe indicarse que la regla de justificación
horizontal podría utilizar justificación a izquierda y medir el
desplazamiento horizontal desde el margen izquierdo, además de un
ángulo de descenso igual a cero, resultando en un texto justificado
en la izquierda en cada línea. Debe indicarse además que el
posicionamiento del texto horizontal puede lograrse de numerosas
formas equivalentes al ejemplo dado anteriormente. En particular,
los cálculos de la posición del texto pueden llevarse a cabo
primero justificando y luego desplazando, o primero desplazando y
luego justificando, obteniendo resultados equivalentes.
En una realización, las separaciones están
asociadas con puntos de terminación cuyas localizaciones han sido
determinadas, pero debido a otras reglas, permanecen en la misma
línea y no producen terminación. Una separación igual a cero o más
espacios es añadida después de un punto de terminación en el que
dicho punto de terminación ha fracasado en la creación de una nueva
línea. En una realización preferente, la longitud de separación es
un parámetro determinado por el lector, en el que una longitud de
separación igual a cero resulta EN que no se crea una separación.
Las separaciones dan pistas visuales acerca de la existencia de
frases aún cuando las frases no han producido la formación de una
nueva línea.
Las velocidades de avance especifican los
tiempos de duración de visualización y los intervalos de tiempo
entre presentación de un agrupamiento de texto y el siguiente. En
una realización preferente, una oración es presentada en una
pantalla. En una realización preferente, la tasa de duración de
visualización puede ser una función del número de palabras del
texto apropiadamente ponderadas, nivel de instrucción, tiempo de
pronunciación, número de frases, número de sílabas, o longitud de
la frase. Los intervalos de tiempo pueden incluir el intervalo
entre oraciones y párrafos. En una realización preferente, el
intervalo de tiempo entre oraciones y párrafos es diferente. De
este modo, el ritmo de llegada constante de texto en los sistemas
existentes en la actualidad puede reemplazarse con un ritmo
dependiente de la posición del texto y en el contenido de dicho
texto.
Las estaciones son posiciones de la superficie
de la pantalla en las que el texto es visualizado. Las estaciones
pueden ser ventanas identificadas dentro de las cuales el texto es
presentado o puntos en los que comienza la presentación de texto.
Una realización preferente incluye una estación de texto activa, en
la que es presentado el texto que será leído. Otra realización
preferente incluye una estación de prelectura que muestra texto a
punto de ser leído y una estación de post-lectura
que muestra el texto ya leído. En una realización, el texto total
presentado en todas las estaciones en la superficie de visualización
es controlado por el tiempo de lectura o pronunciación esperado. En
una realización, aproximadamente sólo un minuto de material es
permitido en la pantalla en cualquier momento y de forma
simultánea.
La animación es la presentación del texto
dependiente del tiempo. Ejemplos de animación incluyen parpadeos,
disolución, y barrido, es decir la animación o iluminación de partes
sucesivas del texto con una velocidad específica. En una
realización preferente, se logra un efecto modificado de
desplazamiento por pantalla apilando texto a punto de ser leído en
filas planas en la estación de prelectura en la parte superior de la
pantalla, apilando las filas previamente leídas en la estación de
post-lectura en la parte inferior de la pantalla, y
presentando en cascada la oración activa en una estación activa a lo
ancho de la parte central de la pantalla. En una realización, el
color del texto de prelectura y de post-lectura y/o
los colores de fondo difieren de los del texto que está siendo
leído.
El etiquetado incluye la designación de cuándo
una oración será etiquetada con una definición o un dibujo
relacionado con la palabra. En una realización preferente, un
conjunto de palabras especifica las palabras que serán etiquetadas
con una definición. Cuando una palabra etiquetada es seleccionada
por un lector, una definición, gráfico u otra representación
electrónica de la palabra puede ser visualizada. En una realización
preferente de la presente invención, una palabra etiquetada, cuando
es seleccionada, visualiza una ventana emergente o
"pop-up" que contiene la definición o dibujo.
Los métodos preferentes de selección incluyen la utilización de un
ratón y la tecla de desplazamiento ("shift") a la derecha.
Un evento de lectura incluye la aparición y
desaparición de una oración y cualquier otro momento adicional
antes de la aparición de la siguiente oración. Un evento de lectura
contiene una serie de momentos de lectura. Un momento de lectura es
una aparición de un marco congelado de texto en los ojos del lector
que intenta comprender dicho texto. Para muchos lectores, el
momento de lectura encontrará al ojo centrado en una frase,
apareciendo dicha frase sola en una línea, y el lector
comprendiendo dicha única frase.
El intervalo de presentación es la duración de
la presentación en pantalla de una oración. El intervalo de
presentación puede ser controlado por el lector o determinado de
forma automática. El control por parte del lector en una
realización puede ser mediante "clicks" (pulsaciones) del
ratón. En otra realización, el control por parte del lector puede
ser mediante detección del movimiento de los ojos o detección de
cambios en las ondas cerebrales. La detección de ondas cerebrales
funciona generando una solicitud de nueva oración cuando las ondas
cerebrales correspondientes a la actividad de lectura cambian a
ondas cerebrales asociadas con el hecho de haber terminado de leer
una oración.
La velocidad de lectura es medida en contenido
de texto por unidad de tiempo. Dichas Unidades de Contenido de
Texto pueden ser medidas en unidades de longitud tales como número
de palabras, sílabas, tiempo de pronunciación, o cualquiera de las
medidas de longitud de frase o cualquier suma de productos de dichas
cantidades, tal como ha sido descrito anteriormente en el presente
documento. Las unidades de contenido de texto también pueden ser
medidas en unidades de complejidad tales como las descritas
anteriormente en relación a la complejidad o longitud de la frase o
cualquier suma de productos de dichas cantidades. Las unidades de
contenido de texto en una realización preferente son calculadas
para una oración presentada y utilizadas para comparar la velocidad
de lectura actual en unidades de contenido de texto por unidades de
tiempo a intervalos de presentación controlados por el lector, y
para ajustar el intervalo de presentación de texto a intervalos de
presentación de texto controlados de forma automática. De este
modo, el intervalo de presentación puede hacerse dependiente del
tiempo, y puede hacerse que rastree la velocidad de presentación
probable preferida por el lector.
Los eventos especiales son eventos dependientes
del tiempo que se producen durante el evento de lectura. Los
eventos especiales incluyen una pista visual o auditiva que
proporciona una señal permanente en el tiempo. Por ejemplo, cuando
ha transcurrido el 75% del intervalo de presentación dependiente del
contenido, aparecería una pista visual en la pantalla. Los eventos
especiales pueden darse por un "script" de eventos especiales.
Los eventos especiales complejos incluyen una serie de eventos
especiales.
La pronunciación visual implica el
escalonamiento en el tiempo de los cambios de color o brillo de
frases, palabras y sílabas individuales, aunque no necesariamente
todos ellos. Una realización hace énfasis en las palabras más
difíciles y largas que requieren tiempos de pronunciación más largos
utilizando un efecto de resaltado. La pronunciación visual es un
ejemplo de un evento especial complejo.
En una realización de la presente invención, el
texto es presentado en pantalla en una estación de prelectura
durante un porcentaje del intervalo de presentación dependiente del
contenido, luego es presentado en una cascada de oraciones, un solo
segmento de texto o una sola línea de texto a la vez. Descender la
cascada es un ejemplo de un evento especial complejo.
El texto lineal es presentado y leído desde el
comienzo hasta el final. Un libro diseñado para ser leído desde el
comienzo hasta el final es un ejemplo común de texto lineal. Un
texto no lineal incluye la presentación y lectura de texto en un
orden distinto al orden lineal. Un ejemplo de texto no lineal es el
"Hipertexto", en el que ciertas palabras son presentadas de un
modo tal que indican un enlace, por ejemplo el texto está encerrado
entre paréntesis angulares o en color azul. La presentación de texto
no lineal puede ser dirigida por el lector o automática. Un ejemplo
de esto es la presentación automática de Hipertexto en un primer
orden de profundidad, siguiendo el primer enlace de Hipertexto,
ignorando los ciclos. Otro ejemplo es una primera presentación en
profundidad, presentado el primer nivel de texto, seguido por
cualquier enlace de Hipertexto del nivel principal, seguido por
cualquier enlace de Hipertexto del primer nivel, y continuando hasta
que se alcance la mayor profundidad o intervenga el lector. Aún
otro ejemplo es la eliminación de la primera presentación de
profundidad o intensidad para incluir sólo partes que contengan
determinadas palabras claves de interés.
En una realización, la presentación de texto
puede comenzar presentado texto común sin formato. Cuando el lector
desea ver el texto presentado como texto mejorado, entonces el
lector designa una parte del texto que será mejorada colocando un
icono tal como un "icono de lente de lectura mágica" sobre
alguna parte de la oración. Dicha oración y las oraciones
siguientes son presentadas como texto mejorado. Esta presentación de
texto mejorado continúa hasta que el lector desactiva la lente de
lectura mágica. Dicha lente de lectura mágica puede funcionar como
punto alternativo de entrada dentro del procesador de textos
mejorado.
En la figura 1, etapa -110-, el texto es
preprocesado. La etapa -110- es mostrada en detalle en la figura 5.
El texto es analizado para identificar párrafos, oraciones, palabras
y puntuación. Los párrafos pueden ser identificados por líneas en
blanco, marcadores de párrafos, caracteres de identificación,
caracteres de tabulación, o cualquier otra característica adecuada
del texto. Las oraciones pueden ser identificadas utilizando reglas
de gramática que incluyen períodos, espaciado, utilización de letras
mayúsculas, y abreviaturas o la falta de las mismas. En una
realización preferente leyendo texto bien construido, un punto, un
signo de interrogación, o signo de exclamación, solo o seguido de
un punto, seguido por dos espacios o un fin de párrafo, señala la
finalización de una oración.
En la etapa -124-, la oración es dividida en
palabras y signos de puntuación. Los signos enfáticos originales
especificados por el autor, por ejemplo el texto en cursiva o
subrayado, es conservado en realizaciones preferentes. Un scanner
léxico estándar, tal como el Lex (denominación comercial) es
utilizado en una realización, en el que el extremo de una palabra
es señalado en las reglas de gramática por un espacio en blanco o un
signo de puntuación. Otra realización utiliza un analizador léxico
de escritura manuscrita. Una realización de la presente invención
almacena caracteres de formato tales como tabuladores y sangrados
como símbolos de puntuación. La posición de una palabra es
almacenada de manera preferente como un atributo de dicha palabra,
proporcionando enlaces al trabajo original y buscando dentro del
mismo.
Una realización preferente permite además que
grupos de palabras sean unidas de forma conjunta, y sean reconocidas
como un grupo de palabras. En una realización, dichos grupos de
palabras son reconocidos por el escáner léxico. En otra
realización, dichas palabras son reconocidas por un preprocesador
que precede al escáner léxico para asegurar el reconocimiento como
una frase en lugar de simples palabras individuales. Las palabras
unidas firmemente, por ejemplo "Príncipe de Gales", serían
reconocidas como una sola frase, y de manera preferente no sería
partida por la preposición en dos frases visualizadas en dos
líneas.
En la etapa -126-, las palabras son buscadas en
diccionarios, glosarios y tablas para determinar sus atributos. El
texto es procesado adicionalmente para determinar atributos
continuos y de categoría. En una realización preferente, los
atributos de categoría importantes incluyen categorías gramaticales,
y atributos continuos importantes incluyen la posición de la
palabra, nivel de instrucción, tiempo de pronunciación, y número de
sílaba, posición, sonido y nivel de énfasis vocal. La identificación
de categorías gramaticales con un 100% de precisión requeriría
largas tareas de programación para determinar el contexto real de
dicho texto. Dicha precisión no es necesaria para llevar a cabo la
presente invención, dado que los errores son una consecuencia menor
debido a que el lector es humano y no una máquina. Las posibles
categorías gramaticales son primero determinadas buscándolas en el
diccionario o glosario. Dicho diccionario o glosario sólo necesita
tener las categorías gramaticales probables para una palabra, no
una definición. Por ejemplo, la palabra "farm" podría ser un
sustantivo, un verbo o un adjetivo. Una realización preferente
almacena atributos de las categorías gramaticales utilizando un
mapa de bits para conservar las múltiples categorías gramaticales
posibles. Una realización de la presente invención almacena de
forma explícita un atributo de ambigüedad, que indica si la palabra
aún presenta múltiples categorías gramaticales posibles. Otra
realización utiliza la existencia de más de una sola categoría
gramatical posible como indicación de ambigüedad.
En una realización preferente de la presente
invención, las categorías gramaticales por defecto existen en un
diccionario y pueden ser buscadas En una realización más preferente,
un conjunto de palabras puede ser añadido para anular o suplementar
el conjunto por defecto. En otra realización, las palabras técnicas
son especificadas por los conjuntos de palabras introducidos por el
usuario.
La figura 6 muestra nueve conjuntos de palabras
que caracterizan categorías gramaticales dispuestas en una
jerarquía. Dichos conjuntos de palabras y jerarquías también son
utilizados como datos de entrada para las reglas de terminación,
descritas posteriormente en el presente documento. Una realización
preferente comprueba los conjuntos de palabras mostrados en la
figura 6, comenzando por la Clase 1, Subclase 1, y terminando con
la Clase 3, Subclase 1. La búsqueda es terminada una vez que una
palabra o frase es encontrada. Dado el vocabulario limitado y la
naturaleza estática de los conjuntos de palabras en la figura 6, la
realización más preferente de la presente invención utiliza un
analizador sintáctico rápido de texto manuscrito para buscar las
palabras y frases en la figura 6. Las realizaciones preferentes
incluyen analizadores sintácticos escritos en C, C++, Perl, AWK
compilado, AWK y AWK a C, C con funciones de expresión regular, o
cualquier lenguaje apropiado. Una realización de analizador
sintáctico utiliza YACC.
En una realización, el diccionario es un
diccionario disponible comercialmente en medio electrónico, tal como
un CD-ROM. El diccionario estándar es analizado
buscando atributos de palabras tales como las categorías
gramaticales y la cantidad de sílabas. Debido a que las
definiciones de las palabras no son necesarias en numerosas
realizaciones, es posible el almacenamiento de numerosas palabras
con el número asociado de sílabas y categorías gramaticales. En la
realización más preferente de la presente invención, las palabras
más comúnmente utilizadas y más recientemente utilizadas son
almacenadas en una memoria de acceso rápido tal como una memoria de
acceso aleatorio (RAM) de estado sólido. En realizaciones en las
que los diccionarios deban ser confeccionados a mano, resulta
preferente la utilización de un método rápido que use código de
comprobación, detección de colisiones y compartimientos de memoria.
En realizaciones en las que los conjuntos de palabras son fijados
antes de la lectura, es preferente comprobación perfecta sin
compartimientos de memoria.
En aún otra realización, el nivel de énfasis de
pronunciación es derivado como un atributo dependiente en parte de
la categoría gramatical. En la realización más preferente, en
énfasis de pronunciación es categorizado como primario, secundario
e inexistente. En una realización, el tiempo de pronunciación y el
sonido real, por ejemplo tal como se encontraría en un archivo de
sonido, también son recuperados a partir del diccionario o glosario
y almacenados como atributos de la palabra.
En la etapa -128-, se busca el lector y los
conjuntos de palabras específicas del texto. En una realización
preferente, los conjuntos de palabras especificadas por el lector
son almacenados en una base de datos separada del diccionario o
conjuntos de palabras del glosario, para permitir el almacenamiento
separado y una recuperación más rápida. En una realización, los
conjuntos de palabras especificadas por el lector son comprobadas
antes de los diccionarios, y los diccionario sólo son comprobados
si las palabras requeridas y los atributos no son encontrados en
los conjuntos de palabras especificadas por el lector. Las
realizaciones preferentes utilizan una jerarquía de bases de datos
para buscar las palabras.
En la etapa -130-, múltiples categorías
gramaticales son desambiguadas. En una realización, se utiliza una
microgramática para determinar categorías gramaticales probables.
Una microgramática utiliza palabras adyacentes o cercanas para
determinar de forma más precisa la categoría gramatical más probable
para una palabra. Por ejemplo, el término "farm" en la frase
"a farm in" podría ser un sustantivo dado que es precedido por
un artículo y sucedido por una preposición. A modo de ejemplo
adicional, si una palabra pudiera ser un sustantivo o un verbo, y
la palabra está precedida por "could", "will",
"shall", o "to", entonces la palabra probablemente es un
verbo. Si la palabra "farm" estuviera precedida por
"will", la palabra probablemente sea un verbo. En otra
realización, toda la desambiguación es llevada a cabo seleccionando
el uso estadísticamente más probable de la palabra. En aún otra
realización, no se produce desambiguación automática, sólo se
utiliza desambiguación manual utilizando edición mediante la
intervención humana. En una realización preferente, un atributo de
desambiguación es almacenado para cada palabra, indicando si aún
después de la desambiguación existen múltiples categorías
gramaticales posibles. En aún otra realización, un atributo de
ambigüedad no es almacenado sino derivado a partir de la existencia
de múltiples categorías gramaticales posibles almacenadas para una
palabra. En una realización, la ambigüedad es deducida a partir de
la presentación visual de colores de texto en franjas o alternantes
asociados con cada categoría gramatical. Por ejemplo, si los verbos
son naranjas y los adjetivos son amarillos, entonces un posible
verbo o adjetivo podría tener rayas o caracteres de texto amarillos
y naranjas.
En una realización de la presente invención, las
categorías gramaticales son determinadas en parte buscando morfemas
(palabras raíz) y asignando atributos de categorías gramaticales
basándose en las terminaciones de palabras, por ejemplo "-ly",
"-ing".
En la etapa -132-, los atributos determinados
para las palabras y frases son almacenados, creando una "oración
jerarquizada", que probablemente permanecerá inalterada entre los
lectores. Por ejemplo, el nivel de instrucción y la categoría
gramatical de una palabra permanecerán inalterados para distintos
lectores, a pesar de que puedan desear distintas longitudes de
segmentos de texto y velocidades de presentación. En una
realización, la oración enriquecida es almacenada en un
almacenamiento duradero, tal como un archivo. En otra realización,
el texto enriquecido es almacenado en un CD-ROM. En
una realización preferente, la oración enriquecida es interpretada
como una lista de nodos vinculados, teniendo cada nodo los atributos
de palabra o frase descritos anteriormente incluyendo la posición
de la palabra dentro del texto original. En la figura 5, etapa
-134-, los puntos primarios de terminación son determinados
aplicando reglas de punto de terminación primario. Los puntos de
terminación son puntos de división del texto localizados entre
letras. En una realización preferente, los puntos de terminación
son clasificados como primarios y secundarios. Los puntos de
terminación primario son determinados utilizando reglas de
terminación primario que determinan posiciones de puntos de
terminación primario basándose en símbolos de puntuación. La figura
7 muestra un punto de terminación primario después de una coma
siguiendo a la palabra "África". Los puntos de terminación
primario dividen el texto en "superfrases". En una realización
preferente, los puntos de terminación primario están localizados en
cada coma, dos puntos, punto y coma, y paréntesis izquierdo,
corchetes y llaves. La posición del punto de terminación puede ser
almacenada como un atributo en un nodo en una lista de nodos
vinculados que conforman una oración enriquecida.
Los puntos de terminación secundarios son
determinados aplicando reglas de punto de terminación secundario.
En realizaciones preferentes, los puntos y reglas de terminación
secundarios están categorizados con una jerarquía y las reglas de
terminación secundario aceptan categorías gramaticales como
entradas. En una realización más preferente, las reglas de
terminación secundarias incluyen como entradas de regla atributos
del contenido de texto de los segmentos de texto y frases que son
procesados. Por ejemplo, un punto de terminación secundario puede
ser requerido por un segmento de texto que exceda la longitud máxima
de segmento de texto preferido por el lector a pesar de que no se
haya alcanzado la longitud máxima de segmento de texto.
Los atributos continuos tales como la dificultad
de la frase, densidad, complejidad, potencia y tiempo de
pronunciación pueden ser utilizados como entradas para una regla que
modifique la categoría establecida por una tabla tal como la
mostrada en la figura 6, utilizando sólo categorías gramaticales
para determinar categorías de partes de terminación secundaria. Por
ejemplo, un segmento de texto que tenga una longitud mayor al 35%
del texto promedio tendría una categoría de clase "1" asignada
independientemente de la categoría determinada por la tabla de la
figura 6. En una realización preferente, la longitud o potencia de
frase es utilizada exclusivamente para determinar categorías de
puntos de terminación secundarios, en lugar de utilizar solamente
categorías gramaticales.
En una realización alternativa, las reglas de
terminación determinan una terminación basándose en la cantidad de
caracteres en la línea, y las categorías gramaticales son
visualizadas utilizando colores correspondientes a la categoría
gramatical de dichas palabras. La última realización puede que no
ofrezca las ventajas de la visualización en cascada, pero
proporciona pistas visuales basadas en el contenido del texto.
La figura 6 muestra una tabla utilizada en una
realización preferente para determinar puntos de terminación
secundarios. Por ejemplo, las preposiciones determinan puntos de
terminación secundarios de Clase 3, Subclase 1. En la figura 7,
existen puntos de terminación secundaria de clase 3 antes de las
preposiciones "in" y "of". Los puntos de terminación
secundario dividen superfrases en "minifrases", tal como se
muestra en la figura 7. Las minifrases están relacionadas con
segmentos de texto que en dicha minifrase a menudo son iguales a
segmentos de texto y son visualizadas cada una en una nueva línea.
Una vez que las minifrases son identificadas, sin embargo, las
reglas pueden dictar que aparezca más o menos de una minifrase como
un segmento de texto o línea.
Primero se aplican las reglas de terminación
primario, seguidas por las reglas de terminación secundario,
aplicadas en el orden que determina la categoría de reglas de
terminación. Un ejemplo de categoría de reglas de terminación
secundario es mostrado en la figura 6, establecida por la categoría
de los conjuntos de palabras que dan lugar a los puntos de
terminación secundario. Algunas realizaciones preferentes utilizan
la longitud o potencia de la frase para determinar la categoría de
punto de terminación secundario en lugar de utilizar solamente las
categorías gramaticales. La realización más preferente permite la
introducción por parte del lector de preferencias de categorías
gramaticales o determinación de la ponderación/potencia de la frase
de la categoría de los puntos de terminación secundarios. Algunos
lectores prefieren la segmentación del texto basándose en la
estructura, mientras que otros prefieren la segmentación del texto
basándose en la complejidad o tiempo estimado para leer un segmento
de texto.
En una realización preferente, las reglas de
terminación secundario son aplicadas sólo hasta que se alcanza un
determinado límite. Dicho límite es a menudo la longitud mínima de
línea. Un método para determinar la posición de los puntos de
terminación secundarios se muestra en la figura 5, etapa -136-, y en
detalle en la figura 8, etapa -136-. En una realización, en la que
la aplicación de una regla de terminación secundario a una
superfrase resultaría en una longitud de minifrase menor que la
longitud de línea mínima especificada, dicha regla de terminación
no es aplicada ni tampoco se aplica ninguna otra regla de
terminación a dicha superfrase. Por el contrario, cuando no existe
otro punto de terminación en una línea que excede la longitud de
línea máxima, se aplica una regla de bloqueo, que fuerza la
terminación del texto en dos líneas. Cuando a todas las superfrases
no se les aplique ninguna regla de terminación adicional, el proceso
de terminación está completado.
En la figura 1, etapa -111-, los parámetros,
atributos, y reglas de terminación pueden ser utilizados como
entradas para las reglas de desplazamiento horizontal. Las reglas de
desplazamiento horizontal determinan la posición horizontal del
segmento de texto. En una realización preferente, las reglas de
desplazamiento horizontal incluyen las reglas de justificación
horizontal y reglas de ángulo de descenso. El desplazamiento
horizontal en esta realización es la suma de los resultados de la
regla de justificación horizontal y la regla de ángulo de descenso.
En una realización fácil de implementar, la regla de desplazamiento
horizontal es simplemente el ángulo de descenso aplicado al
segmento de texto justificado al centro o centrado. Dicha
realización no utiliza la regla de terminación que pone fin al
segmento de texto precedente como entrada y proporciona un
movimiento ocular mínimo durante la lectura de la cascada de
oraciones. Otra realización añade descenso hacia la izquierda para
puntos de terminación precedentes de Clase 1, y descenso a derecha
para puntos de terminación precedentes de Clase 3. Una realización
preferente permite al lector determinar desplazamientos adicionales
a derecha o izquierda para los puntos de terminación, incluyendo
valores entrados por el lector para puntos de terminación primario,
y cada clase y subclase de puntos de terminación secundario. Una
realización almacena el desplazamiento añadido en una tabla en
unidades de caracteres. Habiendo determinado el desplazamiento
horizontal, se conserva el ajuste del texto.
En el ejemplo de la figura 9, la superfrase 1,
"I had a farm in Africa" es dividida de la superfrase 2, "at
the foot of the Ngong Hills", por el punto de terminación
primario después de la coma. La superfrase 2 es dividida en dos
superfrases por el punto de terminación secundario antes de la
preposición "of". En la realización mostrada en la figura 9,
dos minifrases son presentadas como el mismo segmento de texto que
la minifrase "in Africa", que está por debajo de la longitud
mínima de tres palabras especificada por el lector. La primera
minifrase, "at the foot", en una nueva línea es centrada por
debajo del segmento de texto superior y desplazada hacia la derecha
mediante un ángulo de descenso a derecha. La última minifrase "of
the Ngong Hills" es desplazada hacia la izquierda a causa de una
regla de desplazamiento horizontal que determina un desplazamiento a
izquierda cuando la línea precedente ha terminado con un punto de
terminación secundario en lugar de uno primario. Por lo tanto, en
el ejemplo de la figura 9, el desplaza-
miento horizontal total es determinado por una combinación del ángulo de descenso y la justificación de la línea.
miento horizontal total es determinado por una combinación del ángulo de descenso y la justificación de la línea.
Los signos de puntuación por parejas incluyendo
paréntesis, corchetes, llaves, y comillas, sirven como signos de
puntuación que determinan posiciones de puntos de terminación
primario en una realización preferente. En una realización, dichos
signos de puntuación por parejas son incluidos como una entrada a
las reglas de desplazamiento horizontal, incluyendo justificación
horizontal y reglas de ángulo de descenso. Por ejemplo, un segmento
de texto de multifrases largo contenido entre paréntesis puede
tener desplazamientos horizontales reducidos y desplazamientos
verticales reducidos, es decir, menor espacio entre líneas que el
resto del texto en la zona de visualización activa de la superficie
de visualización.
En la etapa -112-, se crea el texto mejorado. En
esta etapa, se crean los códigos necesarios para crear un segmento
de texto visualizado apropiadamente. Por ejemplo, cuando las
especificaciones del lector requieren palabras técnicas coloreadas
en rojo, y el texto enriquecido indica que una palabra es una
palabra técnica, puede crearse una secuencia de escape que será
interpretada por la etapa de visualización como una solicitud de
texto de color rojo. Un código similar puede ser necesario para las
animaciones. El texto mejorado puede ser almacenado en este punto
para una posterior visualización.
En la etapa -113-, el texto mejorado es
presentado en el dispositivo de visualización, mostrando un segmento
de texto por cada nueva línea formada. El texto mejorado puede
incluir además animación, color de fondo, color de texto,
etiquetas, y velocidades de presentación descritas anteriormente en
el presente documento. En una realización preferente, el color de
fondo es presentado como una función de las posiciones de la oración
y el párrafo.
En otra realización, mostrada en la figura 11,
una parte del texto es presentada de forma inicial con un color o
brillo durante un período de tiempo, seguido por la presentación con
un segundo color o brillo. En la figura 11, la oración es
presentada en tres nuevas líneas formadas indicadas por las flechas
(200), (202), y (203). Dentro de dichas líneas, el texto es
presentado completamente en la misma línea, con las palabras de la
figura 11 mostradas en distintas líneas para mostrar el cambio
temporal del color/resaltado del texto inicial (206) hacia el
color/resaltado del texto (207), y el color/resaltado del texto
inicial (208) al (209). El texto "Af" en (206) es la sílaba
enfatizada de la palabra "Africa", y es mostrada de forma
inicial con color/resaltado (206) por esta razón. La parte del
texto "gong" también es la sílaba enfatizada de la palabra
"Ngong", y tiene un color/resaltado inicial (208), seguido por
el color/resaltado (209).
La realización preferente mostrada en la figura
1 permite que los textos enriquecidos de la etapa -132- y la etapa
-113- sean editados. En una realización preferente, un dispositivo
puntero de palabra, tal como un ratón, es utilizado para
seleccionar una parte del texto que será editado. La oración
enriquecida correspondiente a dicha parte del texto enriquecido es
seleccionada internamente, y los atributos son puestos a disposición
para llevar a cabo la edición. Este modo puede ser implementado
utilizando menús desplegables que permiten editar cada atributo del
texto enriquecido y el texto mejorado. Si las ediciones al texto
enriquecido afectaran la presentación, el texto es preprocesado
nuevamente de acuerdo con la etapa -110-. En la sesión de edición
de la etapa -114-, las anotaciones del lector, ocultas o
inmediatamente visibles, son aceptadas y pueden ser almacenadas en
las oraciones enriquecidas y mejoradas. Dichas anotaciones cumplen
la misma función que las notas escritas a mano en un libro. Las
características que pueden ser editadas incluyen categorías
gramaticales, definición, color, texto, puntos de terminación, y
desplazamiento horizontal.
Los atributos editados y visualizados de esta
realización también pueden ser almacenados, en la etapa -116-,
conservando los cambios. En una realización de la presente
invención, sólo las oraciones mejoradas son almacenadas. En una
realización preferente, el texto enriquecido y mejorado es
almacenado. En realizaciones preferentes, algunas ediciones son
grabadas como específicas del lector o globales, para la
presentación del texto a cualquier otro lector. La edición manual
del texto mejorado es especialmente útil cuando el mismo texto será
visualizado repetidamente por otras personas, tal como sucede con
un libro electrónico.
En una variante de la realización de la figura
1, las etapas -113-, -114- y -116- son omitidas, sin intervención
humana y sin visualización inmediata. En esta realización, el texto
enriquecido y mejorado es creado y almacenado para visualización
futura. El texto mejorado puede ser almacenado en formato de
procesamiento de palabras estándar tal como archivos binarios de
Microsoft Word (denominación comercial) o Corel Word Perfect
(denominación comercial. En esta realización, el software de
presentación puede ser simple, pequeño, y rápido en comparación con
el software necesario para buscar palabras y analizar texto. Dicha
presentación es una realización preferente para la distribución
masiva de texto mejorado para lectura como "libro
electrónico".
En una variante relacionada con la realización
de la figura 1, el texto mejorado en sí es recuperado en la etapa
-106-, sin requisitos de procesamiento y sin permisos de edición.
Dicha presentación también es una realización preferente para la
distribución masiva de texto mejorado para lectura como "libro
electrónico".
Haciendo referencia a la figura 1, etapa -113-,
la presentación de cada pantalla de texto mejorado puede ser
activada manualmente, por ejemplo mediante el clic de un ratón. En
una realización preferente, la velocidad de presentación es
controlada por los parámetros especificados por el lector,
incluyendo el tiempo de visualización para cada texto, y los
tiempos de llegada entre oración y entre párrafo. En una realización
más preferente, el contenido de texto es medido, y el intervalo de
presentación de texto depende de dicho contenido de texto. En una
realización preferente, el tiempo de pronunciación del texto es
utilizado como una medida del contenido de texto para determinar el
intervalo de presentación. En otra realización, las longitudes de
frase son utilizadas para medir el contenido de texto y determinar
el intervalo de presentación.
Una realización preferente permite a los
lectores extender el tiempo de presentación para una oración, además
de aumentar y disminuir la velocidad de presentación. Esta
velocidad puede ser grabada, del mismo modo que la longitud de
oración y la dificultad de oración correspondiente a un intervalo de
presentación particular. La figura 10 muestra un ejemplo de un
gráfico en 3-D, "mapa historial de muestreo de
intervalo de presentación", que muestra el tiempo necesario para
leer una oración como una función de dos atributos, la dificultad de
la oración y la longitud de la oración. El tiempo necesario para
leer puede ser medido por las preferencias del lector o por el
seguimiento de movimiento ocular o actividad de ondas cerebrales
anteriormente mencionadas en el presente documento. Entonces, el
tiempo puede ser correlacionado contra dos atributos tal como en la
figura 10, o cualquier otra cantidad de atributos. El intervalo de
presentación en una realización preferente es ajustado de forma
continua para adaptarse al tiempo de lectura requerido y
predecido.
En aún otra realización, que resulta la más
apropiada cuando la velocidad de lectura es medida de forma
estricta, las entradas para las reglas de terminación son
modificadas y se lleva a cabo un seguimiento de la velocidad de
lectura resultante. En una realización apropiada para crear un
producto de lectura óptimo para el mercado masivo, las entradas
para las reglas de terminación son modificadas y las velocidades de
lectura son grabadas para una población de muestra. Las entradas
son variadas para lograr una velocidad de lectura y una compresión
óptimas. Por ejemplo, la importancia establecida por las reglas de
terminación secundario a categorías gramaticales relativas a la
longitud de la frase es modificada para lograr una velocidad de
lectura óptima.
En otra realización, la edición manual del
lector de la visualización de oración inicial es analizada en cuanto
a contribución relativa a la estructura de la oración, categorías
gramaticales, longitud y complejidad. Después de dicho período de
ajuste o prueba inicial, se utilizan longitudes similares en reglas
de terminación para mejorar el texto automáticamente. Las ediciones
subsiguientes pueden ser utilizadas para refinar de manera adicional
las reglas de terminación.
En la etapa -118-, la presentación del texto se
detiene cuando no existe más texto o el lector solicita la
interrupción. Las etapas -120- proporcionan un proceso de limpieza,
incluyendo almacenamiento final de texto enriquecido y mejorado,
además de almacenamiento del historial acerca de la sesión de
lectura.
Numerosas características y ventajas de la
presente invención dada a conocer en el presente documento han sido
determinadas en la presente descripción. Debe entenderse que, sin
embargo, esta descripción es dada, en muchos aspectos, meramente a
modo de ejemplo. Pueden realizarse cambios en detalles, en
particular en cuanto a las etapas de combinación, separación, y
disposición, sin salir del alcance de la presente invención. Por
supuesto, el alcance de la presente invención queda definido por las
reivindicaciones adjuntas.
Claims (15)
1. Método para mejorar la presentación de texto
a partir de un texto de lenguaje natural legible por máquina
basándose en parámetros específicos del lector, incluyendo como
mínimo las dimensiones del campo de visión, que comprende:
analizar sintácticamente de dicho texto signos
de puntuación y categorías gramaticales para extraer atributos
específicos del texto;
almacenar dichos atributos específicos del texto
en relación con las categorías gramaticales para producir un texto
enriquecido;
aplicar reglas de terminación primarias seguidas
por reglas de terminación secundarias a dicho texto enriquecido,
aplicadas de acuerdo con una categoría de reglas de terminación que
dividen dicho texto en segmentos de texto, teniendo dichas reglas
de terminación como mínimo dichos atributos de puntuación y
atributos de categoría gramatical como entradas y atributos
visuales como salidas;
aplicar reglas de terminación secundaria hasta
que se alcanza un determinado límite, que de manera preferente es
la longitud mínima de línea; y
en el que los atributos visuales incluyen la
visualización de segmentos de texto en nuevas líneas;
aplicar reglas de desplazamiento horizontal de
segmentos de texto a dichos segmentos de texto para determinar un
desplazamiento horizontal para cada segmento de texto, incluyendo
dichas reglas de desplazamiento horizontal categorías gramaticales
como entradas y atributos visuales de desplazamiento horizontal como
salidas para producir un texto mejorado; y
visualizar dicho texto mejorado mediante una
presentación en cascada de segmentos de texto en líneas descendentes
y a lo ancho del dispositivo de visualización.
2. Método de la reivindicación 1, en el que
dichos atributos específicos incluyen la localización del texto
dentro de una caja de texto, incluyendo dicha presentación de texto
un color de fondo y dicho proceso de textos incluye la variación de
dicho color de fondo de acuerdo con dicha localización de texto.
3. Método de la reivindicación 1, en el que
dichos atributos específicos de texto incluyen una medida de la
dificultad del texto, y dicha presentación de texto incluye una
velocidad de avance de texto automática, y dicho proceso de textos
incluye la variación de dicha velocidad de presentación del texto de
acuerdo con dicha medida de dificultad del
texto.
texto.
4. Método de la reivindicación 3, en el que
dicha medida de la dificultad del texto incluye un tiempo de
pronunciación estimado de dicho texto y/o un nivel de instrucción
estimado para dicho texto y/o la cantidad de sílabas en dicho
texto.
5. Método de la reivindicación 1, en el que
dichos atributos visuales incluyen la visualización de dichos
segmentos de texto con un color que depende de dichas categorías
gramaticales y/o la visualización de dichos segmentos de texto en
nuevas líneas.
6. Método de la reivindicación 1, en el que:
dichas reglas primarias incluyen signos de
puntuación como entradas;
dichas reglas secundarias incluyen categorías
gramaticales como entradas.
7. Método de la reivindicación 6, en el que
dichas reglas de terminación incluyen una microgramática para
desambiguar dichas categorías gramaticales.
8. Método de la reivindicación 1, que comprende
además la determinación de las categorías gramaticales probables de
dichas palabras a partir de dicha etapa de análisis sintáctico.
9. Método de la reivindicación 9, que
comprende:
proporcionar reglas de visualización de color,
en las que dichas reglas de visualización de color incluyen dichas
categorías gramaticales probables como entradas y color de texto
como salidas; y
visualizar dicho texto de acuerdo con dicha
salida de color de texto.
\newpage
10. Método de las reivindicaciones 1 y 6, en el
que la aplicación de reglas de terminación primarias y secundarias
comprende:
proporcionar una longitud de segmento de texto
mínima;
proporcionar una longitud de segmento de texto
máxima;
determinar las posiciones de los puntos de
terminación primario en dicho texto aplicando las reglas de
terminación primarias, dividiendo de este modo dicho texto en
superfrases;
determinar las posiciones de los puntos de
terminación secundario en las superfrases aplicando las reglas de
terminación secundarias, dividiendo de este modo las superfrases en
segmentos de texto;
repetir dicha etapa previa hasta que los
segmentos de texto no son más largos que la longitud de segmento de
texto máxima, y no son más cortos que la longitud de segmento de
texto mínima.
11. Método de la reivindicación 1 ó 10, que
comprende además:
aceptar las ediciones hechas por el usuario de
los puntos de terminación del texto visualizado; y
almacenar las ediciones hechas por el usuario en
formato legible por máquina; y/o
aceptar las ediciones hechas por el usuario de
las categorías gramaticales del texto visualizado; y almacenar las
ediciones hechas por el usuario en formato legible por máquina;
y/o
aceptar las anotaciones hechas por el usuario en
las categorías gramaticales del texto visualizado; y almacenar las
anotaciones hechas por el usuario en formato legible por
máquina.
12. Dispositivo para mejorar la presentación de
texto a partir de un texto de lenguaje natural legible por máquina
y una presentación de texto mejorada basada en parámetros
específicos determinados por el lector que incluyen como mínimo,
las dimensiones del campo de visión, que comprende:
medios de análisis sintáctico para dividir dicho
texto a través de los signos de puntuación y categorías gramaticales
para extraer atributos específicos del texto;
medios de almacenamiento para almacenar dichos
atributos específicos del texto en relación con las categorías
gramaticales para producir un texto enriquecido;
medios para aplicar reglas de terminación
primarias seguidas de reglas de terminación secundarias a dicho
texto enriquecido, aplicadas de acuerdo con un rango de reglas de
terminación, dividiendo de este modo el texto en segmentos de
texto, teniendo dichas reglas de terminación como mínimo atributos
de puntuación y atributos de categorías gramaticales como datos de
entrada y atributos visuales como datos de salida;
medios para aplicar reglas de terminación
secundarias hasta que se alcanza un determinado límite, siendo dicho
límite de manera preferente la longitud mínima de línea; y
en el que los atributos visuales incluyen la
visualización de segmentos de texto en líneas nuevas;
medios para aplicar reglas de desplazamiento
horizontal del segmento de texto a dichos segmentos de texto para
determinar un desplazamiento horizontal para cada segmento de texto,
incluyendo dichas reglas de desplazamiento horizontal categorías
gramaticales como entradas y atributos visuales de desplazamiento
horizontal como salidas para producir un texto mejorado; y
medios para visualizar dicho texto mejorado
presentando en cascada los segmentos de texto en líneas descendentes
y a lo ancho del dispositivo de visualización.
13. Dispositivo de la reivindicación 12, en el
que dichos medios para aplicar dichas reglas primarias y secundarias
de terminación comprenden medios de entrada de la longitud mínima
del segmento de texto para introducir una longitud mínima del
segmento de texto;
medios de entrada de la longitud máxima del
segmento de texto para introducir una longitud máxima del segmento
de texto;
medios de determinación primaria para determinar
las posiciones de los puntos de terminación primario en dicho texto
aplicando las reglas de terminación primarias, dividiendo de este
modo el texto en superfrases;
\newpage
medios de determinación secundaria para
determinar las posiciones de los puntos de terminación secundario
en las superfrases aplicando las reglas de terminación secundaria,
dividiendo de este modo las superfrases en segmentos de texto;
medios para repetir dicha etapa de determinación
de posiciones de puntos de terminación secundario hasta que todos
los segmentos del texto no son más largos que la longitud máxima de
segmento de texto, y no son más cortos que la longitud mínima de
segmento de texto.
14. Dispositivo de la reivindicación 13, en el
que el texto enriquecido incluye palabras y frases y está
implementado como una lista vinculada de nodos, teniendo cada nodo
atributos de palabra o frase.
15. Dispositivo de la reivindicación 12, en el
que dichas reglas de terminación incluyen reglas primarias y
secundarias, incluyendo dichas reglas primarias los signos de
puntuación como datos de entrada y dichas reglas secundarias
incluyendo categorías gramaticales como datos de entrada;
comprendiendo una tabla que contiene conjuntos de palabras que
establecen una jerarquía de puntos de terminación secundario.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US693444 | 1996-08-07 | ||
US08/693,444 US5802533A (en) | 1996-08-07 | 1996-08-07 | Text processor |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2285736T3 true ES2285736T3 (es) | 2007-11-16 |
Family
ID=24784672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES97935052T Expired - Lifetime ES2285736T3 (es) | 1996-08-07 | 1997-07-24 | Procesador de textos. |
Country Status (17)
Country | Link |
---|---|
US (1) | US5802533A (es) |
EP (1) | EP0917698B1 (es) |
JP (2) | JP2000516002A (es) |
AT (1) | ATE366449T1 (es) |
AU (1) | AU712608B2 (es) |
BR (1) | BR9711819A (es) |
CA (1) | CA2262530C (es) |
CY (1) | CY2579B1 (es) |
DE (1) | DE69737884T2 (es) |
DK (1) | DK0917698T3 (es) |
ES (1) | ES2285736T3 (es) |
HK (1) | HK1021911A1 (es) |
IL (1) | IL128012A (es) |
NO (1) | NO323852B1 (es) |
NZ (1) | NZ333686A (es) |
PT (1) | PT917698E (es) |
WO (1) | WO1998006082A1 (es) |
Families Citing this family (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6279017B1 (en) * | 1996-08-07 | 2001-08-21 | Randall C. Walker | Method and apparatus for displaying text based upon attributes found within the text |
GB9620082D0 (en) | 1996-09-26 | 1996-11-13 | Eyretel Ltd | Signal monitoring apparatus |
JPH10105556A (ja) * | 1996-09-27 | 1998-04-24 | Sharp Corp | 電子式辞書および情報表示方法 |
US6088711A (en) * | 1997-07-01 | 2000-07-11 | Microsoft Corporation | Method and system for defining and applying a style to a paragraph |
US6874122B1 (en) * | 1998-01-15 | 2005-03-29 | International Business Machines Corporation | Computer system, program product and method of adjusting the display positions of hypertext links to modify the relative alignment thereof |
US6216131B1 (en) * | 1998-02-06 | 2001-04-10 | Starfish Software, Inc. | Methods for mapping data fields from one data set to another in a data processing environment |
US7069508B1 (en) * | 2000-07-13 | 2006-06-27 | Language Technologies, Inc. | System and method for formatting text according to linguistic, visual and psychological variables |
US7346489B1 (en) | 1999-07-16 | 2008-03-18 | Language Technologies, Inc. | System and method of determining phrasing in text |
US7110945B2 (en) * | 1999-07-16 | 2006-09-19 | Dreamations Llc | Interactive book |
US6529203B1 (en) * | 1999-12-30 | 2003-03-04 | Joseph William Griffin | Rotating color word |
SE518881C2 (sv) * | 2000-01-20 | 2002-12-03 | Tomas Dalstroem | Anordning och datorprogram för att understödja läsning av en text |
DE10028085C2 (de) * | 2000-06-07 | 2002-04-25 | Reinhard Werth | Leselernverfahren |
EP1162587A1 (en) * | 2000-06-10 | 2001-12-12 | MCIAN, Peter | Method for enhancing readability of rapidly displayed text |
US6832281B2 (en) * | 2000-07-06 | 2004-12-14 | Onspec Electronic Inc. | Flashtoaster for reading several types of flash memory cards with or without a PC |
US7493437B1 (en) | 2000-07-06 | 2009-02-17 | Mcm Portfolio Llc | Flashtoaster for reading several types of flash memory cards with or without a PC |
SE524403C2 (sv) * | 2000-11-06 | 2004-08-03 | Ericsson Telefon Ab L M | System och metod för anpassningsbar RSVP-baserad textvisning |
US20020124019A1 (en) * | 2001-01-03 | 2002-09-05 | David Proulx | Method and apparatus for rich text document storage on small devices |
US20030074188A1 (en) * | 2001-10-12 | 2003-04-17 | Tohgo Murata | Method and apparatus for language instruction |
US7137070B2 (en) * | 2002-06-27 | 2006-11-14 | International Business Machines Corporation | Sampling responses to communication content for use in analyzing reaction responses to other communications |
US8495503B2 (en) * | 2002-06-27 | 2013-07-23 | International Business Machines Corporation | Indicating the context of a communication |
US7493253B1 (en) | 2002-07-12 | 2009-02-17 | Language And Computing, Inc. | Conceptual world representation natural language understanding system and method |
US7613731B1 (en) | 2003-06-11 | 2009-11-03 | Quantum Reader, Inc. | Method of analysis, abstraction, and delivery of electronic information |
US20040253568A1 (en) * | 2003-06-16 | 2004-12-16 | Shaver-Troup Bonnie S. | Method of improving reading of a text |
US7365738B2 (en) | 2003-12-02 | 2008-04-29 | International Business Machines Corporation | Guides and indicators for eye movement monitoring systems |
WO2005066916A1 (es) * | 2004-01-08 | 2005-07-21 | Palacios Angel | Sistema, procedimiento, programa de ordenador y conjunto de datos para facilitar el aprendizaje de lenguas mediante la identificación de sonidos |
JP2005251034A (ja) * | 2004-03-05 | 2005-09-15 | Konami Co Ltd | 文字列表示システム、文字列表示方法及びプログラム |
WO2005114468A2 (en) * | 2004-05-20 | 2005-12-01 | Wizpatent, Pte Ltd. | System and method for text segmentation and display |
JP4639734B2 (ja) * | 2004-09-30 | 2011-02-23 | 富士ゼロックス株式会社 | スライドコンテンツ処理装置およびプログラム |
US8418057B2 (en) * | 2005-06-01 | 2013-04-09 | Cambridge Reading Project, Llc | System and method for displaying text |
WO2007027596A2 (en) * | 2005-08-29 | 2007-03-08 | Kriger Joshua K | System, device, and method for conveying information using a rapid serial presentation technique |
US7966557B2 (en) | 2006-03-29 | 2011-06-21 | Amazon Technologies, Inc. | Generating image-based reflowable files for rendering on various sized displays |
US7810026B1 (en) * | 2006-09-29 | 2010-10-05 | Amazon Technologies, Inc. | Optimizing typographical content for transmission and display |
US20080154576A1 (en) * | 2006-12-21 | 2008-06-26 | Jianchao Wu | Processing of reduced-set user input text with selected one of multiple vocabularies and resolution modalities |
US20110055209A1 (en) * | 2007-02-23 | 2011-03-03 | Anthony Novac | System and method for delivering content and advertisments |
IL184180A0 (en) * | 2007-06-24 | 2007-10-31 | Mobile App Ltd | User interface and method for displaying text |
KR101247825B1 (ko) * | 2007-06-29 | 2013-03-26 | 후지쯔 가부시끼가이샤 | 정보 표시 장치, 정보 표시 방법 및 정보 표시 프로그램을 기록한 컴퓨터로 판독가능한 기록 매체 |
US8306356B1 (en) | 2007-09-28 | 2012-11-06 | Language Technologies, Inc. | System, plug-in, and method for improving text composition by modifying character prominence according to assigned character information measures |
US8782516B1 (en) | 2007-12-21 | 2014-07-15 | Amazon Technologies, Inc. | Content style detection |
US8572480B1 (en) | 2008-05-30 | 2013-10-29 | Amazon Technologies, Inc. | Editing the sequential flow of a page |
JP4661909B2 (ja) * | 2008-06-04 | 2011-03-30 | 富士ゼロックス株式会社 | 情報表示装置及びプログラム |
US9229911B1 (en) * | 2008-09-30 | 2016-01-05 | Amazon Technologies, Inc. | Detecting continuation of flow of a page |
US8819541B2 (en) | 2009-02-13 | 2014-08-26 | Language Technologies, Inc. | System and method for converting the digital typesetting documents used in publishing to a device-specfic format for electronic publishing |
US8499236B1 (en) | 2010-01-21 | 2013-07-30 | Amazon Technologies, Inc. | Systems and methods for presenting reflowable content on a display |
US8977538B2 (en) * | 2010-09-13 | 2015-03-10 | Richard Salisbury | Constructing and analyzing a word graph |
CA2721498C (en) | 2010-11-25 | 2011-08-02 | Microsoft Corporation | Efficient use of exceptions in text segmentation |
US8782510B2 (en) | 2010-12-21 | 2014-07-15 | Business Objects Software Limited | Cell content scrolling |
JP2012221107A (ja) * | 2011-04-06 | 2012-11-12 | Sony Corp | 情報処理装置、情報処理方法、プログラム、サーバおよび情報処理システム |
US9323723B2 (en) | 2011-06-17 | 2016-04-26 | Microsoft Technology Licensing, Llc | Reading ease of text on a device |
WO2013059647A1 (en) | 2011-10-21 | 2013-04-25 | New York University | Reducing visual crowding, increasing attention and improving visual span |
WO2013123583A1 (en) | 2012-02-22 | 2013-08-29 | Quillsoft Ltd. | System and method for enhancing comprehension and readability of text |
CN103425636A (zh) * | 2012-05-24 | 2013-12-04 | 吴启波 | 基于标点符号的意群切分以提高在电子阅读器中阅读速度的方法 |
US10650089B1 (en) | 2012-10-25 | 2020-05-12 | Walker Reading Technologies | Sentence parsing correction system |
JP6167630B2 (ja) * | 2012-12-27 | 2017-07-26 | 大日本印刷株式会社 | 文書表示装置、文書表示方法、文書表示システムおよびプログラム |
JP6053587B2 (ja) * | 2013-03-19 | 2016-12-27 | 三菱電機株式会社 | 電子ファイル制作装置及び電子ファイル制作システム |
US20150104763A1 (en) * | 2013-10-15 | 2015-04-16 | Apollo Group, Inc. | Teaching students to recognize and correct sentence fragments |
US10108308B2 (en) * | 2013-11-25 | 2018-10-23 | Rakuten Kobo Inc. | Sensing user input to change attributes of rendered content |
CN103577148A (zh) * | 2013-11-28 | 2014-02-12 | 南京奇幻通信科技有限公司 | 语音朗读方法及装置 |
EP3134824A4 (en) | 2014-04-25 | 2018-03-28 | Mayo Foundation for Medical Education and Research | Enhancing reading accuracy, efficiency and retention |
JP6550713B2 (ja) * | 2014-10-10 | 2019-07-31 | 大日本印刷株式会社 | 文章表示装置、プログラム及び制御方法 |
US11275897B2 (en) * | 2016-07-20 | 2022-03-15 | Sony Corporation | Information processing apparatus, information processing method, and program for modifying a cluster segment relating to a character string group |
KR102366617B1 (ko) * | 2017-03-28 | 2022-02-23 | 삼성전자주식회사 | 음성 인식 서비스 운용 방법 및 이를 지원하는 전자 장치 |
FR3067135B1 (fr) * | 2017-06-01 | 2021-04-23 | Majenat Sas | Procede d'affichage d'un document textuel segmente en rheses mis graphiquement en evidence |
DE212021000356U1 (de) | 2020-04-07 | 2023-01-03 | Cascade Reading, Inc. | Erzeugen einer gestuften Textformatierung für elektronische Dokumente und Anzeigen |
FR3119481B1 (fr) * | 2021-02-02 | 2023-12-22 | Univ Claude Bernard Lyon | Procédé et dispositif d’assistance à la lecture et à son apprentissage par focalisation de l’attention. |
CN112906392B (zh) * | 2021-03-23 | 2022-04-01 | 北京天融信网络安全技术有限公司 | 一种文本增强方法、文本分类方法及相关装置 |
US11170154B1 (en) | 2021-04-09 | 2021-11-09 | Cascade Reading, Inc. | Linguistically-driven automated text formatting |
WO2023059818A1 (en) * | 2021-10-06 | 2023-04-13 | Cascade Reading, Inc. | Acoustic-based linguistically-driven automated text formatting |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6140672A (ja) * | 1984-07-31 | 1986-02-26 | Hitachi Ltd | 多品詞解消処理方式 |
US4613309A (en) * | 1985-09-19 | 1986-09-23 | Mccloskey Emily A | Figures of speech |
US5083268A (en) * | 1986-10-15 | 1992-01-21 | Texas Instruments Incorporated | System and method for parsing natural language by unifying lexical features of words |
US4887212A (en) * | 1986-10-29 | 1989-12-12 | International Business Machines Corporation | Parser for natural language text |
US4880385A (en) * | 1987-12-11 | 1989-11-14 | Huang Yi Chao | Fully automatic speed-reading trainer |
US5146405A (en) * | 1988-02-05 | 1992-09-08 | At&T Bell Laboratories | Methods for part-of-speech determination and usage |
DE68928230T2 (de) * | 1988-09-15 | 1998-02-05 | Oce Tech Bv | System zur grammatikalischen Verarbeitung eines aus natürlicher Sprache zusammengesetzten Satzes |
NL8900247A (nl) * | 1989-02-01 | 1990-09-03 | Bso Buro Voor Systeemontwikkel | Werkwijze en stelsel voor het weergeven van meervoudige analyses in een afhankelijkheidsgrammatica, alsmede ontleed-inrichting voor het genereren van een dergelijke weergave. |
US5278943A (en) * | 1990-03-23 | 1994-01-11 | Bright Star Technology, Inc. | Speech animation and inflection system |
JPH0415872A (ja) * | 1990-05-09 | 1992-01-21 | Electron Maaketeingu:Kk | 情報蓄積システム及び情報提供システム |
US5267331A (en) * | 1990-07-26 | 1993-11-30 | Ronald Siwoff | Digitally enhanced imager for the visually impaired |
CA2089177C (en) * | 1990-08-09 | 2002-10-22 | Bruce R. Baker | Communication system with text message retrieval based on concepts inputted via keyboard icons |
US5442742A (en) * | 1990-12-21 | 1995-08-15 | Apple Computer, Inc. | Method and apparatus for the manipulation of text on a computer display screen |
US5211563A (en) * | 1991-07-03 | 1993-05-18 | Hitachi, Ltd. | Computer assisted learning support system and processing method therefor |
GB2258125A (en) * | 1991-07-20 | 1993-01-27 | Ibm | Improved method and apparatus for setting the colour balance of a colour display device |
JPH0553496A (ja) * | 1991-08-26 | 1993-03-05 | Nec Corp | 点字表示端末装置 |
JPH06309359A (ja) * | 1991-09-24 | 1994-11-04 | Hitachi Maxell Ltd | 携帯形電子読書装置 |
JPH05101120A (ja) * | 1991-10-04 | 1993-04-23 | Oki Electric Ind Co Ltd | 文章抄録生成装置 |
JPH05158401A (ja) * | 1991-12-06 | 1993-06-25 | Ricoh Co Ltd | 文書速読支援表示方式並びに文書処理装置及び文書検索装置 |
US5408603A (en) * | 1992-03-31 | 1995-04-18 | Dow Benelux N.V. | Global process control information system and method |
DE69229112T2 (de) * | 1992-07-20 | 1999-10-14 | Oce-Technologies B.V. | Verfahren zur Wiedergabe von Text auf einem Rasterausgangsgerät |
US6002798A (en) * | 1993-01-19 | 1999-12-14 | Canon Kabushiki Kaisha | Method and apparatus for creating, indexing and viewing abstracted documents |
US5432948A (en) * | 1993-04-26 | 1995-07-11 | Taligent, Inc. | Object-oriented rule-based text input transliteration system |
US5475588A (en) * | 1993-06-18 | 1995-12-12 | Mitsubishi Electric Research Laboratories, Inc. | System for decreasing the time required to parse a sentence |
JPH0728799A (ja) * | 1993-06-25 | 1995-01-31 | Hitachi Electron Service Co Ltd | 用語辞書生成機能を備えた文書表示方法 |
US5331556A (en) * | 1993-06-28 | 1994-07-19 | General Electric Company | Method for natural language data processing using morphological and part-of-speech information |
JPH07125374A (ja) * | 1993-11-02 | 1995-05-16 | King Jim Co Ltd | レイアウト表示装置 |
US5513305A (en) * | 1994-03-01 | 1996-04-30 | Apple Computer, Inc. | System and method for documenting and displaying computer program code |
-
1996
- 1996-08-07 US US08/693,444 patent/US5802533A/en not_active Expired - Lifetime
-
1997
- 1997-07-24 WO PCT/US1997/012807 patent/WO1998006082A1/en active IP Right Grant
- 1997-07-24 DE DE69737884T patent/DE69737884T2/de not_active Expired - Lifetime
- 1997-07-24 DK DK97935052T patent/DK0917698T3/da active
- 1997-07-24 JP JP10507941A patent/JP2000516002A/ja active Pending
- 1997-07-24 BR BR9711819-2A patent/BR9711819A/pt not_active Application Discontinuation
- 1997-07-24 AU AU38080/97A patent/AU712608B2/en not_active Expired
- 1997-07-24 IL IL12801297A patent/IL128012A/en not_active IP Right Cessation
- 1997-07-24 EP EP97935052A patent/EP0917698B1/en not_active Expired - Lifetime
- 1997-07-24 AT AT97935052T patent/ATE366449T1/de active
- 1997-07-24 NZ NZ333686A patent/NZ333686A/xx not_active IP Right Cessation
- 1997-07-24 CA CA002262530A patent/CA2262530C/en not_active Expired - Lifetime
- 1997-07-24 PT PT97935052T patent/PT917698E/pt unknown
- 1997-07-24 ES ES97935052T patent/ES2285736T3/es not_active Expired - Lifetime
-
1999
- 1999-02-05 NO NO19990535A patent/NO323852B1/no not_active IP Right Cessation
- 1999-11-26 HK HK99105508A patent/HK1021911A1/xx not_active IP Right Cessation
-
2007
- 2007-10-08 CY CY0700015A patent/CY2579B1/xx unknown
-
2009
- 2009-05-29 JP JP2009131160A patent/JP4855500B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
WO1998006082A1 (en) | 1998-02-12 |
DE69737884D1 (de) | 2007-08-16 |
AU712608B2 (en) | 1999-11-11 |
JP2009211716A (ja) | 2009-09-17 |
CA2262530A1 (en) | 1998-02-12 |
HK1021911A1 (en) | 2000-07-14 |
CA2262530C (en) | 2006-07-04 |
AU3808097A (en) | 1998-02-25 |
NO990535D0 (no) | 1999-02-05 |
ATE366449T1 (de) | 2007-07-15 |
EP0917698A1 (en) | 1999-05-26 |
JP2000516002A (ja) | 2000-11-28 |
PT917698E (pt) | 2007-08-02 |
IL128012A0 (en) | 1999-11-30 |
EP0917698B1 (en) | 2007-07-04 |
CY2579B1 (en) | 2008-07-02 |
NZ333686A (en) | 2000-05-26 |
IL128012A (en) | 2001-10-31 |
BR9711819A (pt) | 1999-08-31 |
NO323852B1 (no) | 2007-07-16 |
EP0917698A4 (en) | 2002-03-13 |
DK0917698T3 (da) | 2007-08-20 |
JP4855500B2 (ja) | 2012-01-18 |
DE69737884T2 (de) | 2007-10-31 |
US5802533A (en) | 1998-09-01 |
NO990535L (no) | 1999-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2285736T3 (es) | Procesador de textos. | |
US7765471B2 (en) | Method for enhancing text by applying sets of folding and horizontal displacement rules | |
Shen et al. | Development of orthographic skills in Chinese children | |
AU2007203103B2 (en) | Reading Product Fabrication Methodology | |
AU2004200447B2 (en) | Text processor | |
MXPA99001290A (es) | Procesador de texto | |
Nazemi et al. | Complete Reading System For The Vision Impaired | |
Black | Review of Fromkin and Rodman, An Introduction to Language |