ES2285736T3

ES2285736T3 - Procesador de textos.

Info

Publication number: ES2285736T3
Application number: ES97935052T
Authority: ES
Inventors: Randall C. Walker
Original assignee: Individual
Current assignee: Individual
Priority date: 1996-08-07
Filing date: 1997-07-24
Publication date: 2007-11-16
Anticipated expiration: 2017-07-24
Also published as: WO1998006082A1; DE69737884D1; AU712608B2; JP2009211716A; CA2262530A1; HK1021911A1; CA2262530C; AU3808097A; NO990535D0; ATE366449T1; EP0917698A1; JP2000516002A; PT917698E; IL128012A0; EP0917698B1; CY2579B1; NZ333686A; IL128012A; BR9711819A; NO323852B1

Abstract

Método para mejorar la presentación de texto a partir de un texto de lenguaje natural legible por máquina basándose en parámetros específicos del lector, incluyendo como mínimo las dimensiones del campo de visión, que comprende: analizar sintácticamente de dicho texto signos de puntuación y categorías gramaticales para extraer atributos específicos del texto; almacenar dichos atributos específicos del texto en relación con las categorías gramaticales para producir un texto enriquecido; aplicar reglas de terminación primarias seguidas por reglas de terminación secundarias a dicho texto enriquecido, aplicadas de acuerdo con una categoría de reglas de terminación que dividen dicho texto en segmentos de texto, teniendo dichas reglas de terminación como mínimo dichos atributos de puntuación y atributos de categoría gramatical como entradas y atributos visuales como salidas; aplicar reglas de terminación secundaria hasta que se alcanza un determinado límite, que de manera preferente esla longitud mínima de línea; y en el que los atributos visuales incluyen la visualización de segmentos de texto en nuevas líneas; aplicar reglas de desplazamiento horizontal de segmentos de texto a dichos segmentos de texto para determinar un desplazamiento horizontal para cada segmento de texto, incluyendo dichas reglas de desplazamiento horizontal categorías gramaticales como entradas y atributos visuales de desplazamiento horizontal como salidas para producir un texto mejorado; y visualizar dicho texto mejorado mediante una presentación en cascada de segmentos de texto en líneas descendentes y a lo ancho del dispositivo de visualización.

Description

Procesador de textos.

La presente invención se refiere a un método de proceso de textos para obtener, a partir de un texto legible por máquina, una presentación de texto mejorada basada en parámetros específicos del lector y un procesador de textos para llevar a cabo dicho método.

La finalidad de la lectura es causar un impacto en la mente del lector. Esto es cierto tanto en el caso en que el texto que es leído es una novela o cuando es una pantalla de visualización tipo "heads-up" de un avión. El material presentado en un medio no textual lleva información apropiada para la absorción por el ser humano, además del correspondiente texto unidimensional. Las imágenes estáticas presentan atributos de objeto tales como colores, tamaños relativos, patrones, agrupamiento, y jerarquías. Un objeto es visto dentro de un contexto. Por ejemplo, una imagen de un objeto pequeño localizado con otros en una esquina lleva distinta información que el mismo objeto, con mayor tamaño, por sí solo, y en el centro. Comenzar oraciones y párrafos añade información contextual por el sólo hecho de su posición. Las imágenes en movimiento presentan modificaciones de movimiento y temporales como atributos añadidos. Una gran parte de la información penetra en el cerebro visualmente y a través de reconocimiento de parámetros. Otra información penetra como información auditiva, llevando información a través de un tono, cambiando la inflexión, y cambiando el nivel de volumen.

La presentación por ordenador de un texto para la lectura humana ha fracasado en la utilización de una parte importante del cerebro humano. Como resultado, se utiliza sólo una parte del ancho de banda disponible, y la presentación de texto por ordenador a menudo es percibida como desfavorable, constante, mecánica, y generalmente incompleta en algún sentido. Cuando se les da la opción, la mayoría de las personas prefieren leer un libro impreso que un libro a través de la pantalla del ordenador. La presentación actual de textos por ordenador resulta pobre en comparación con un libro, y aún más pobre teniendo en cuenta su potencial.

Se ha realizado cierto trabajo en la presentación de texto por ordenador. El documento US-A-4.880.385 da a conocer un dispositivo de lectura de velocidad optomecánica que permite el visionado de texto impreso sobre papel a través de una ventana de visión de una línea de una sola vez, avanzando automáticamente las líneas.

Se han logrado avances en métodos para el análisis gramatical por ordenador del lenguaje natural separando las categorías gramaticales. El documento US-A-5.475.588 da a conocer un sistema de análisis gramatical mejorado para crear árboles de análisis gramatical. El documento US-A-5.331.556 da a conocer un método para almacenar información de categorías gramaticales en un archivo junto con el texto original para la búsqueda mejorada subsiguiente del texto. Los documentos US-A-4.661.924 y US-A-5.146.405 dan a conocer métodos para eliminar ambigüedades de múltiples categorías gramaticales. Los documentos US-A-4.887.212, US-A-5.068.789 y US-A-5.083.268 dan a conocer métodos para análisis gramatical de texto de lenguaje natural. La lectura es un proceso complejo y existen numerosos factores que determinan diferencias en el rendimiento de lectura entre lectores e incluso para el mismo lector en distintas ocasiones. Dichas diferencias incluyen condiciones neurofisiológicas tales como la dislexia, pero también la edad; factores de comportamiento y motivación; nivel de educación y práctica de lectura previa; y restricciones de la percepción. Un lector también puede tener distintos objetivos para la lectura que afectarán su forma de acercamiento al material de lectura. A pesar de todo lo dicho anteriormente, el texto es presentado por ordenadores, en el peor de los casos, como "cuentas en una cadena" unidimensional, en el mejor de los casos, similar al texto bidimensional presentado por los libros. De hecho, si el texto es presentado en versión impresa o en una pantalla de visualización electrónica, es de poca importancia debido a que la presentación del texto es esencialmente idéntica.

El documento US-A-5.060.155 da a conocer un método para codificar sin ambigüedades múltiples análisis gramaticales de una secuencia de palabras de lenguaje natural en dependencia de la gramática, en los que las dependencias quedan definidas entre pares de palabras, cada par consistiendo en una palabra superordinada o gobernante y una palabra relacionada o dependiente. Una red sintáctica es determinada y es representada como un árbol que consiste en nodos acoplados mutuamente por bordes o aristas y que comprende como mínimo un nodo principal, uno o más nodos terminales y eventualmente una cantidad de nodos intermedios, sirviendo cada nodo como puntero en el caso de que exista una única alternativa y sirviendo como punto de elección en el caso de que existan varias alternativas, por lo cual cada uno de los nodos punteros es asignado a una palabra de la secuencia y cada borde es asignado a la relación sintáctica entre los dos nodos acoplados por dicho borde, por lo cual cada nodo está codificado por un identificador que, en el caso de un nodo puntero, está directamente relacionado con la entrada de una palabra en el diccionario y en el caso de un punto de elección comprende una lista de identificadores adicionales, uno de los cuales debe ser seleccionado.

El documento US-A-4.613.309 da a conocer un modelo educativo para enseñar elementos gramaticales del lenguaje, sintaxis y estructura de la oración, en el que se identifican treinta elementos del habla o categorías gramaticales individuales y son agrupadas en diez conjuntos distintos que son incorporados en modelos físicos. Cada modelo representa una palabra o grupo de palabras, denominadas "elementos", que forman los bloques de construcción lógica del lenguaje. Determinados elementos son en realidad elementos híbridos, dado que reflejan las propiedades y derivaciones únicas de los verbos, frases y oraciones. Los símbolos son utilizados para designar la función de cada elemento; el color es utilizado para designar el conjunto de elementos, y la forma es utilizada para designar la parte de la oración y la categoría gramatical. El usuario interrelaciona cada elemento con otros elementos para formar una frase, suboración, u oración como una alternativa a los diagramas sintácticos convencionales. Los modelos pueden ser realizados en soporte impreso, plástico, vídeo o software.

Los ejemplos de presentación constante son numerosos. Las oraciones que presentan un tema son presentadas del mismo modo que el resto de las oraciones de un párrafo. Las palabras técnicas son presentadas del mismo modo que las palabras que no son técnicas. Los adjetivos son iguales a los sustantivos. Términos que resultan complicados desde un punto de vista educativo son presentados del mismo modo que términos simples. El último párrafo de un capítulo es presentado del mismo modo que el primer párrafo. El texto es presentado con formato justificado a la izquierda, como líneas partidas de anchura constante, que requieren de un movimiento alternado del ojo desde el extremo derecho hasta el extremo izquierdo con intervalos regulares. El texto es cortado en mitad de una oración, mitad de una frase y en mitad de una palabra, aplicando reglas de composición antiguas. Dicho texto fuerza al ojo a desplazarse grandes distancias hacia un lado y hacia el otro, imitando el carro de una máquina de escribir. El texto es avanzado manualmente, partido en trozos determinados por la cantidad de líneas que caben en la
pantalla.

El documento US-A-5.060.155 da a conocer un método de codificación no ambigua de múltiples análisis sintácticos de una secuencia de palabras de lenguaje natural en dependencia de la gramática, en el que dichas dependencias son definidas entre pares de palabras, consistiendo cada par en una palabra superordinada o gobernador y una palabra relacionada o dependiente de la misma. Para cada palabra en la secuencia, se determina un índice de palabra, que representa la orden de rango de dicha palabra en dicho secuencia. Todos las posibles dependientes de cada palabra son determinadas, además de la relación entre la palabra y las dependientes, utilizando un algoritmo de análisis sintáctico en combinación con una gramática y un diccionario en el que todas las palabras del lenguaje son almacenadas junto con su interpretación sintáctica y un índice de interpretación, que representa el orden de rango de la interpretación sintáctica de la palabra en el diccionario a efectos de distinguir entre múltiples interpretaciones sintácticas de dicha palabra. Queda determinada una red de interconexión sintáctica que es representada como un árbol que consiste en nodos acoplados mutuamente por bordes y que comprende como mínimo un nodo superior, uno o más nodos terminales y eventualmente una cantidad de nodos intermedios, siendo interpretado cada uno de dichos nodos como un nodo OR exclusivo que sirve como puntero si existe sólo una alternativa y sirviendo como punto de elección en el caso de que existan varias alternativas, por lo cual cada uno de los nodos punteros es asignado a una palabra de la secuencia y cada borde es asignado a la relación sintáctica entre dos nodos acoplados por dicho borde, por lo cual cada nodo es codificado por un identificador que en caso de un nodo puntero está directamente relacionado con la entrada de una palabra en el diccionario y en el caso de un punto de elección comprende una lista de identificadores adicionales, uno de los cuales debe ser seleccionado.

A partir de "Software-Practice and Experience", vol. 11, 1119-1184 (1981), Donald E. Knuth y Michael F. Plass, "Breaking Paragraphs into Lines", se conoce un procesamiento del lenguaje por ordenador, es decir una composición mejorada. Dicho artículo da a conocer un nuevo acercamiento al problema de dividir el texto de un párrafo en líneas de longitud aproximadamente igual manteniendo el espacio entre palabras dentro de un rango deseado; evitando grandes variaciones del tamaño de separación entre palabras encontrado en una línea en comparación con el siguiente; evitando saltos de línea "psicológicamente malos" y reduciendo el número de palabras cortadas o escritas con guión; evitando palabras "salientes" en márgenes derechos irregulares que se sitúan completamente sobre un espacio vacío de la siguiente línea; y evitando patrones de espacios blancos desagradables, por ejemplo, "dibujo de pata de gallo" ("houndsteeth"), lagartijas, o ríos, que se extienden a través de una secuencia de líneas y distraen la vista del lector. Se calculan "cajas" ("boxes"), "pegamento" ("glue") y "penalizaciones" para determinar los puntos de corte óptimos, a partir de una variedad de opciones de puntos de corte, para rellenar un espacio bidimensional que tenga márgenes izquierdo y derecho definidos.

Existen varias buenas razones para no colocar sólo una oración realzada por página en un libro. Estas razones pueden haber sido traspasadas de forma inapropiada a la visualización por ordenador de un texto. La posibilidad de modificar la presentación del texto para mejorar la capacidad del lector para leer dicho texto aprovechando el poder de la manipulación digital parece haber sido pasado por alto por las personas más especializadas dentro del ámbito de la informática.

El objetivo de la presente invención es dar a conocer un método de proceso de textos para producir un texto mejorado a partir de un texto legible por máquina en el que se aceptan parámetros específicos del lector en el procesamiento de dicho texto, y un procesador de textos para llevar a cabo dicho método.

Para lograr dicho objetivo, la presente invención da a conocer un método de proceso de textos y un procesador de textos tal como queda definido en las reivindicaciones independientes. Las realizaciones preferentes de la presente invención están caracterizadas en las reivindicaciones dependientes.

Una ventaja de la presente invención es que los segmentos de texto significativos son visualizados en líneas en una pantalla que toma en cuenta parámetros específicos del lector que incluyen, como mínimo, las dimensiones del campo de visión elegidas por el lector. La presente invención es operativa para visualizar los segmentos de texto significativos tanto si el campo de visión, por ejemplo la anchura de la pantalla, es seleccionada pequeña o grande. Por lo tanto, los segmentos de texto pueden ser visualizados, por ejemplo, en toda la pantalla o una parte más pequeña de la pantalla en la que el segmento de texto sigue siendo un segmento de texto significativo.

Además, una ventaja de la presente invención es que la misma extrae atributos a partir de una secuencia de entrada y visualiza dicha secuencia como segmentos de texto en cascada en dirección descendente y a lo ancho de la pantalla en la que la segmentación y el desplazamiento horizontal quedan determinados mediante la aplicación de reglas que utilizan categorías gramaticales, puntuación y preferencias del lector.

Las realizaciones preferentes de la presente invención incluyen la extracción de atributos específicos del texto a partir de un texto legible por máquina, variando la presentación del texto de acuerdo con los atributos, y creando un producto visual tridimensional (superficie de lectura y tiempo) para mejorar la experiencia de lectura. El color del texto y el fondo también pueden ser variados dependiendo de las categorías gramaticales y la posición de las oraciones dentro de los párrafos y de dichos párrafos dentro de capítulos.

En las realizaciones preferentes de la presente invención atributos visuales significativos realzan la presentación de texto visualizado por ordenador sobre la visualización textual constante y mecánica de los sistemas existentes en la actualidad. Se crea una pista visual que está relacionada con el contenido de la nueva frase y su relación con la frase previa. Dicha pista está disponible antes de que el texto sea leído, creando un contexto para el texto. El procesamiento de análisis sintáctico de oraciones utiliza la puntuación de las oraciones y el contenido de las mismas para crear un sistema de pistas visuales significativas que incluyen distintas frases que favorecen el reconocimiento más rápido de las palabras en una frase y sus significados. La oración mejorada desciende en cascada por la página creando un patrón de frases significativas determinadas por el contenido del texto y las preferencias del lector, haciendo que los ojos se muevan distancias cortas entre frase y frase.

Una oración representa una idea completa, y un párrafo representa un tema o razonamiento diferenciado. La comprensión de la lectura mejora cuando aparece una sola oración a la vez y cuando la transición desde un párrafo al siguiente es señalada visualmente e incluye una pausa para la aparición de dichos elementos de texto. La presente invención crea atributos visuales apropiados para proporcionar dichas señales visuales. Los atributos visuales pueden incluir segmentación de texto, desplazamiento horizontal de una línea respecto a otra, color de texto y fondo, brillo del texto, y animación. La animación puede incluir brillo progresivo, temporal, dependiente del tiempo, parpadeante y deslizante, de los elementos de texto, y el movimiento del texto desde la presentación estándar a la presentación en cascada.

En una sesión de lectura a modo de ejemplo, el lector selecciona el texto que leerá, e informa al sistema de lectura acerca del tipo, por ejemplo una novela. El sistema de lectura recupera el entorno apropiado previamente almacenado para dicho lector leyendo dicho tipo de texto seleccionado. El lector tiene la oportunidad de editar las reglas de lectura y los conjuntos de palabras, pero la rechaza. Comenzado al inicio de un capítulo, en el que el lector retoma la lectura, el texto es presentado, una oración a la vez, descendiendo en cascada y a lo ancho de la pantalla. A medida que las líneas presentadas en pantalla son partidas en segmentos de texto significativo en lugar de la finalización arbitraria a los 80 caracteres, es posible leer y comprender un segmento completo por vez, haciendo que el movimiento resultante del ojo sea desde el centro de un segmento de texto hacia el centro de otro segmento de texto, hacia abajo y a lo ancho de la pantalla. El color de fondo de la oración es una función de la posición de la oración dentro de un párrafo y la posición de dicho párrafo dentro del capítulo. Cada una de las oraciones en un párrafo puede tener el mismo color, y sin embargo presentar cambios incrementales pero discernibles de la saturación del color u oscuridad entre oraciones, y cambios incrementales pero discernibles del color entre párrafos. Por lo tanto, el color de fondo proporciona información de posición no literal, señalando el comienzo y finalización de un párrafo, y el comienzo y finalización de un
capítulo.

Las oraciones son segmentadas de acuerdo con reglas aprobadas por el lector. Cada preposición pliega una frase de manera predecible, resultando en dos segmentos de texto, cada uno de ellos ocupando una nueva línea. El contenido de la línea superior produce el desplazamiento horizontal de la línea inferior. La misma preposición pliega y desplaza horizontalmente el texto del mismo modo siempre que sea posible. Como resultado, la misma preposición produce un patrón similar, que ya resulta familiar para el lector. Las categorías gramaticales afectan el color del texto de acuerdo con reglas aprobadas por el lector. Como resultado, la estructura de la oración y las categorías gramaticales son inmediatamente reconocibles a partir del reconocimiento del patrón y color, aún antes de que una palabra del texto sea reconocida, proporcionando al lector pistas visuales y no literales.

Las oraciones avanzan con una velocidad determinada por una regla previamente seleccionada por el lector. La fórmula es una función del tipo de texto, cantidad de palabra, nivel de educación, y cantidad de sílabas presentes en una línea. La velocidad de avance es un poco más rápida que la velocidad que resulta cómoda para el lector, para aumentar la comprensión. Una pausa más larga entre presentación de oraciones señala un nuevo párrafo antes de que aparezca. El lector es capaz de interactuar de forma sencilla con el sistema de lectura, manteniendo las oraciones complicadas más tiempo en la pantalla, y aumentando o disminuyendo la velocidad de presentación.

La sesión de lectura a modo de ejemplo descrita anteriormente se muestra sólo a modo de ejemplo, y no limita o abarca todas las realizaciones posibles dentro del alcance de la presente invención.

El proceso de resalte explota el hecho de que los elementos de texto tienen cualidades no literales que pueden ser utilizadas para producir una presentación de texto en el tiempo y el espacio que sea más significativa y mejore la capacidad para comprender el significado literal del texto en mayor grado que los formatos existentes en ordenadores o papel. La presentación en cascada descendente y a lo ancho de la pantalla de frases imprime un corolario visual acerca del modo en que se podría experimentar el texto si fuera escuchado en una lectura en vivo, sin que el lector tenga que subvocalizarlo. Leer un texto realzado de esta manera es casi como escuchar con los ojos, pero como un paquete visual completo que es experimentado de manera casi simultánea.

Las realizaciones preferentes de la presente invención serán descritas haciendo referencia a los dibujos, en los que:

La figura 1 es un diagrama de flujo de alto nivel de un método utilizado en una realización de la presente invención;

La figura 2 es una tabla que muestra varios atributos de los elementos en una oración;

La figura 3 contiene un ejemplo de un texto mejorado que incluye la presentación en cascada con ángulos de descenso hacia la derecha;

La figura 4 presenta la oración de la figura 3 como texto mejorado incluyendo la presentación en cascada con ángulos de descenso hacia la derecha y hacia la izquierda;

La figura 5 muestra la etapa -110- en detalle;

La figura 6 muestra conjuntos de palabras que establecen una jerarquía de puntos de terminación secundarios;

La figura 7 muestra posiciones de puntos de terminación dentro de una oración;

La figura 8 muestra la etapa -136- en detalle;

La figura 9 muestra la oración de la figura 7 presentada como texto mejorado;

La figura 10 muestra un mapa del historial de muestreo del intervalo de presentación, en el que el tiempo necesario para la lectura es una función de la dificultad y complejidad de la oración; y

La figura 11 muestra una oración de la figura 7 que muestra 5 pronunciaciones visuales de sílabas enfatizadas.

La figura 1 muestra un diagrama de flujo de alto nivel de un método utilizado en una realización de la presente invención. Por supuesto que las etapas en la figura 1 y todas las mencionadas figuras pueden ser separadas en etapas adicionales o combinarse en menor cantidad de etapas y aún describir la misma realización.

En la etapa -102-, el dispositivo de lectura es iniciado y se lleva a cabo la identificación (ID) del lector y la identificación del archivo de texto que será leído. En una realización preferente, la ID del lector es obtenida a partir del sistema operativo. En otra realización, el lector es instado a identificarse. En una realización, existe sólo un lector del dispositivo. Dada la ID del lector, los parámetros especificados del lector son recuperados en la etapa -104-. Los parámetros son descritos en detalle posteriormente en el presente documento. Dada la ID del texto, el archivo de texto y los parámetros específicos del texto son recuperados en la etapa -104-. En una realización preferente, los parámetros tienen valores por defecto, y no requieren entradas del lector. En una realización más preferente, se permite la entrada de parámetros específicos preferidos por el lector, se aceptan los valores, y los valores de dichos parámetros son almacenados como en la etapa -108-. En una realización, se permite que el usuario despliegue menús que contienen cuadros de diálogo, vea los parámetros por defecto y los modifique utilizando interfaces estándar de usuario que incluyen entradas numéricas, entradas de texto, barras de deslizamiento, y botones. En una realización preferente, dado un permiso de acceso apropiado, se permite la modificación de los parámetros globales aplicados a todos los lectores del texto. Se permite que el lector tenga parámetros configurados sólo para el texto actual, todos los textos del mismo tipo que el texto actual, o todos los textos leídos por dicho lector.

Los parámetros específicos del lector incluyen: dimensiones de campo de visión; paleta de color para el fondo y el texto; conjunto de palabras; entradas para reglas; longitud mínima de frase; longitud mínima de línea; longitud mínima y máxima de segmento de texto; ángulos de descenso; entradas de reglas de desplazamiento horizontal; preferencias de justificación horizontal; longitud de intervalo entre frases; proporción de avance; proporciones de intervalo entre oraciones y entre párrafos; definiciones de etiquetas de identificación; especificaciones de animación; definiciones de parámetros para derivar los intervalos de presentación dependientes del contenido; definiciones de parámetros y pesado para derivar la materia, longitud, densidad, complejidad y contenido de la frase/texto; e identidades de rutina ("scripts") de eventos especiales.

Dimensiones del campo de visión

Las dimensiones del campo de visión pueden especificar el tamaño de la ventana para visualizar el texto en las dos dimensiones X e Y, y una tercera dimensión, que es el tiempo. Este campo puede incluir toda la pantalla o una parte más pequeña de dicha pantalla. La dimensión tiempo puede incluir el tiempo durante el cual se producen animaciones dependientes del tiempo, tales como los parpadeos.

Paleta de color

La paleta de color para el fondo y el texto permite la especificación de colores preferentes para el fondo y texto que varían de acuerdo con el texto. En una realización preferente, el tono y el brillo del color de fondo varían de acuerdo con la posición dentro de un párrafo, y la posición del párrafo dentro de un capítulo. En una realización más preferente, el brillo es fijado a un nivel para la primera oración en un párrafo y un segundo nivel para la última oración de un párrafo, haciendo que el color de cada oración progrese entre dicho primer nivel y dicho segundo nivel. En una realización preferente, el tono del fondo es fijado a un primer valor para el primer párrafo en un capítulo y un segundo valor para el último párrafo de un capítulo, haciendo que el tono de cada párrafo progrese entre dicho primer valor y dicho segundo valor. En una realización más preferente, el primer tono es verde y el segundo es
violeta.

En las realizaciones preferentes, el color del texto puede variar de acuerdo con una categoría de palabra y atributos continuos. Un atributo de categoría es una función de la categoría a la que se ajusta una palabra. En una realización más preferente, las categorías incluyen categorías gramaticales, por ejemplo verbos, y palabras técnicas. Los atributos continuos incluyen aquellos que pueden ser medidos como nivel de instrucción, por ejemplo duodécimo grado, cantidad de sílabas, y longitud de palabra. En una realización preferente, las distintas categorías gramaticales tienen distintos colores de texto. En una realización más preferente, el color del texto es variado junto con el color de fondo para proporcionar un contraste óptimo y preferido por el lector.

Los conjuntos de palabras pueden ser utilizados para especificar algunas categorías gramaticales. Por ejemplo, "I" es una pronombre, "had" es un verbo, "a" es un artículo, y "farm" podría ser un sustantivo, verbo o adjetivo. Las categorías gramaticales sólo necesitan ser categorías gramaticales similares tal como ocurre con la palabra "farm", que podría ser un sustantivo, un verbo o un adjetivo. Un ejemplo de las categorías gramaticales en una sola oración es mostrado en la figura 2. Las múltiples categorías posibles de la columna de categoría gramatical (150) son mostradas como es la categoría gramatical desambiguada de la columna (152).

Los conjuntos de palabras son introducidos en las realizaciones preferentes utilizando dos métodos. El primer método utiliza un formato de texto estructurado tal como el lenguaje de marcado generalizado estándar (SGML), permitiendo la importación y exportación de grandes conjuntos de palabras y diccionarios de diversas fuentes. Analizadores SGML estándar son utilizados para almacenar los conjuntos de palabras en una base de datos apropiada. El segundo método permite la edición interactiva de conjuntos de palabras que utilizan una jerarquía de menús desplegables y cuadros de diálogo. En una realización preferente, los conjuntos de palabras especificados por el lector son almacenados en una base de datos separada del diccionario o conjuntos de palabras de glosario, para permitir al almacenamiento, edición y recuperación rápida de manera separada.

Longitud mínima de segmento de texto y longitud máxima de línea

Una realización preferente incluye una longitud mínima de segmento de texto especificada por el lector. Un segmento de texto es un trozo de texto que es presentado en una sola línea en una pantalla de visualización. La longitud mínima del segmento de texto, que puede ser determinado en palabras, es lo mínimo que el lector desea ver en una línea individual. La longitud máxima de línea es la longitud máxima que el lector desea ver en una sola línea. Las longitudes pueden medirse en número de caracteres, palabras, sílabas, nivel de instrucción, o cualquier suma de productos de dichas cantidades. En una realización, la longitud mínima de línea es de diez caracteres y la longitud máxima de línea es de treinta y cinco caracteres.

Longitud de frase

La longitud de frase es un atributo derivado de una frase (segmento de texto o segmento de texto potencial) que otorga alguna medida de la cantidad de material dentro de una frase. En una realización, la longitud de frase es simplemente el número de palabras dentro de una frase. En una realización preferente de la presente invención, la longitud de frase incluye la densidad de la frase y la complejidad de la frase. La densidad de frase puede incluir la cantidad de palabras técnicas o cantidad de palabras que excedan un determinado nivel. La complejidad de frase puede incluir el número de similitudes ortográficas entre palabras dentro de una frase, cantidad de palabras ambiguas, y la longitud total de las palabras con longitud especificada por el lector.

Longitud mínima y longitud máxima de segmento de texto

Una realización preferente incluye longitudes máximas y mínimas de segmentos de texto. La longitud del segmento de texto es la cantidad de texto que el lector desea ver en una línea separada. En realizaciones preferentes, la longitud del segmento de texto es la suma de los peses de frase dentro de dicho segmento de texto.

Reglas de justificación horizontal

Las reglas de justificación horizontal especifican la justificación horizontal de una línea de texto con respecto a la línea anterior. La justificación puede incluir el tipo de justificación para la frase o línea que es posicionada, es decir justificación a la derecha, a la izquierda, o centrada. La justificación puede incluir además la parte de texto de la línea sobre la cual se mide la justificación, es decir, la línea completa de texto con respecto a una frase, el punto de dicha parte utilizada, por ejemplo extremo izquierdo, extremo derecho o centro. La justificación horizontal en una realización se mide simplemente dentro de la línea que es posicionada en lugar de medirse respecto a la línea
superior.

En una realización preferente de la presente invención, la primera frase en una línea está justificado al centro, midiendo desde el centro de la última frase en la línea inmediatamente superior. En otra realización, la línea completa de texto está justificada al centro debajo del centro de la línea del texto superior. En aún otra realización, el "centro de gravedad" del segmento de texto, calculado utilizando la dificultad de cada palabra, es utilizado como el centro del segmento de texto con fines de justificación.

Ángulo de descenso

Un ángulo de descenso es la cantidad de desplazamiento horizontal para cada nueva línea, modificando la posición horizontal determinada sólo por las reglas de justificación horizontal. Por definición, cada segmento de texto es presentado en una nueva línea. En una realización preferente, el ángulo de descenso es caracterizado en unidades de caracteres. El ángulo de descenso y la justificación horizontal determinan como mínimo de manera parcial la "cascada de texto" hacia abajo y a lo ancho de la pantalla en realizaciones preferentes. Un ejemplo de texto en cascada se muestra en las figuras 3 y 4. Un ángulo de descenso puede ser cero, queriendo decir sin más que la posición horizontal del segmento de texto está determinada sólo por las reglas de justificación horizontal. Un ángulo de descenso puede ser hacia la izquierda, en cuyo caso la línea inferior será desplazada hacia la izquierda con respecto a la línea anterior o hacia la derecha, en cuyo caso el texto se desplazará hacia la derecha. La figura 3 muestra sólo ángulos de descenso hacia la derecha.

En una realización de la presente invención, el ángulo de descenso es una constante para cada nueva línea. En una realización preferente, el ángulo de descenso es una función de la longitud del segmento de texto de la línea superior. En otra realización preferente, las reglas de justificación horizontal determinan la justificación centrada debajo del centro de cada línea inmediatamente superior, y el ángulo de descenso es calculado para presentar substancialmente una trayectoria recta, cuando todas las líneas de texto son presentadas, desde el centro de línea al centro de línea, desde la izquierda superior hasta la derecha inferior de la superficie de la pantalla.

En una realización preferente, las entradas para las reglas de ángulo de descenso incluyen atributos del texto de la línea superior. En una realización preferente, las entradas incluyen la razón para plegar la línea superior, es decir, un punto de terminación primario, un punto de terminación secundario, o regla de bloqueo. En una realización preferente, se utiliza un ángulo de descenso más positivo cuando la línea inmediatamente superior se ha plegado debido a un punto de terminación primario en lugar de un punto de terminación secundario. En otra realización preferente, las entradas incluyen la longitud del segmento de texto de la línea actual y la línea superior.

Debe indicarse que la regla de justificación horizontal podría utilizar justificación a izquierda y medir el desplazamiento horizontal desde el margen izquierdo, además de un ángulo de descenso igual a cero, resultando en un texto justificado en la izquierda en cada línea. Debe indicarse además que el posicionamiento del texto horizontal puede lograrse de numerosas formas equivalentes al ejemplo dado anteriormente. En particular, los cálculos de la posición del texto pueden llevarse a cabo primero justificando y luego desplazando, o primero desplazando y luego justificando, obteniendo resultados equivalentes.

Longitud de separación

En una realización, las separaciones están asociadas con puntos de terminación cuyas localizaciones han sido determinadas, pero debido a otras reglas, permanecen en la misma línea y no producen terminación. Una separación igual a cero o más espacios es añadida después de un punto de terminación en el que dicho punto de terminación ha fracasado en la creación de una nueva línea. En una realización preferente, la longitud de separación es un parámetro determinado por el lector, en el que una longitud de separación igual a cero resulta EN que no se crea una separación. Las separaciones dan pistas visuales acerca de la existencia de frases aún cuando las frases no han producido la formación de una nueva línea.

Velocidades de avance

Las velocidades de avance especifican los tiempos de duración de visualización y los intervalos de tiempo entre presentación de un agrupamiento de texto y el siguiente. En una realización preferente, una oración es presentada en una pantalla. En una realización preferente, la tasa de duración de visualización puede ser una función del número de palabras del texto apropiadamente ponderadas, nivel de instrucción, tiempo de pronunciación, número de frases, número de sílabas, o longitud de la frase. Los intervalos de tiempo pueden incluir el intervalo entre oraciones y párrafos. En una realización preferente, el intervalo de tiempo entre oraciones y párrafos es diferente. De este modo, el ritmo de llegada constante de texto en los sistemas existentes en la actualidad puede reemplazarse con un ritmo dependiente de la posición del texto y en el contenido de dicho texto.

Estaciones

Las estaciones son posiciones de la superficie de la pantalla en las que el texto es visualizado. Las estaciones pueden ser ventanas identificadas dentro de las cuales el texto es presentado o puntos en los que comienza la presentación de texto. Una realización preferente incluye una estación de texto activa, en la que es presentado el texto que será leído. Otra realización preferente incluye una estación de prelectura que muestra texto a punto de ser leído y una estación de post-lectura que muestra el texto ya leído. En una realización, el texto total presentado en todas las estaciones en la superficie de visualización es controlado por el tiempo de lectura o pronunciación esperado. En una realización, aproximadamente sólo un minuto de material es permitido en la pantalla en cualquier momento y de forma simultánea.

Animación

La animación es la presentación del texto dependiente del tiempo. Ejemplos de animación incluyen parpadeos, disolución, y barrido, es decir la animación o iluminación de partes sucesivas del texto con una velocidad específica. En una realización preferente, se logra un efecto modificado de desplazamiento por pantalla apilando texto a punto de ser leído en filas planas en la estación de prelectura en la parte superior de la pantalla, apilando las filas previamente leídas en la estación de post-lectura en la parte inferior de la pantalla, y presentando en cascada la oración activa en una estación activa a lo ancho de la parte central de la pantalla. En una realización, el color del texto de prelectura y de post-lectura y/o los colores de fondo difieren de los del texto que está siendo leído.

Etiquetado

El etiquetado incluye la designación de cuándo una oración será etiquetada con una definición o un dibujo relacionado con la palabra. En una realización preferente, un conjunto de palabras especifica las palabras que serán etiquetadas con una definición. Cuando una palabra etiquetada es seleccionada por un lector, una definición, gráfico u otra representación electrónica de la palabra puede ser visualizada. En una realización preferente de la presente invención, una palabra etiquetada, cuando es seleccionada, visualiza una ventana emergente o "pop-up" que contiene la definición o dibujo. Los métodos preferentes de selección incluyen la utilización de un ratón y la tecla de desplazamiento ("shift") a la derecha.

Evento de lectura

Un evento de lectura incluye la aparición y desaparición de una oración y cualquier otro momento adicional antes de la aparición de la siguiente oración. Un evento de lectura contiene una serie de momentos de lectura. Un momento de lectura es una aparición de un marco congelado de texto en los ojos del lector que intenta comprender dicho texto. Para muchos lectores, el momento de lectura encontrará al ojo centrado en una frase, apareciendo dicha frase sola en una línea, y el lector comprendiendo dicha única frase.

Velocidad de lectura

El intervalo de presentación es la duración de la presentación en pantalla de una oración. El intervalo de presentación puede ser controlado por el lector o determinado de forma automática. El control por parte del lector en una realización puede ser mediante "clicks" (pulsaciones) del ratón. En otra realización, el control por parte del lector puede ser mediante detección del movimiento de los ojos o detección de cambios en las ondas cerebrales. La detección de ondas cerebrales funciona generando una solicitud de nueva oración cuando las ondas cerebrales correspondientes a la actividad de lectura cambian a ondas cerebrales asociadas con el hecho de haber terminado de leer una oración.

La velocidad de lectura es medida en contenido de texto por unidad de tiempo. Dichas Unidades de Contenido de Texto pueden ser medidas en unidades de longitud tales como número de palabras, sílabas, tiempo de pronunciación, o cualquiera de las medidas de longitud de frase o cualquier suma de productos de dichas cantidades, tal como ha sido descrito anteriormente en el presente documento. Las unidades de contenido de texto también pueden ser medidas en unidades de complejidad tales como las descritas anteriormente en relación a la complejidad o longitud de la frase o cualquier suma de productos de dichas cantidades. Las unidades de contenido de texto en una realización preferente son calculadas para una oración presentada y utilizadas para comparar la velocidad de lectura actual en unidades de contenido de texto por unidades de tiempo a intervalos de presentación controlados por el lector, y para ajustar el intervalo de presentación de texto a intervalos de presentación de texto controlados de forma automática. De este modo, el intervalo de presentación puede hacerse dependiente del tiempo, y puede hacerse que rastree la velocidad de presentación probable preferida por el lector.

Eventos especiales

Los eventos especiales son eventos dependientes del tiempo que se producen durante el evento de lectura. Los eventos especiales incluyen una pista visual o auditiva que proporciona una señal permanente en el tiempo. Por ejemplo, cuando ha transcurrido el 75% del intervalo de presentación dependiente del contenido, aparecería una pista visual en la pantalla. Los eventos especiales pueden darse por un "script" de eventos especiales. Los eventos especiales complejos incluyen una serie de eventos especiales.

Pronunciación visual

La pronunciación visual implica el escalonamiento en el tiempo de los cambios de color o brillo de frases, palabras y sílabas individuales, aunque no necesariamente todos ellos. Una realización hace énfasis en las palabras más difíciles y largas que requieren tiempos de pronunciación más largos utilizando un efecto de resaltado. La pronunciación visual es un ejemplo de un evento especial complejo.

Descendiendo la cascada

En una realización de la presente invención, el texto es presentado en pantalla en una estación de prelectura durante un porcentaje del intervalo de presentación dependiente del contenido, luego es presentado en una cascada de oraciones, un solo segmento de texto o una sola línea de texto a la vez. Descender la cascada es un ejemplo de un evento especial complejo.

Texto no lineal

El texto lineal es presentado y leído desde el comienzo hasta el final. Un libro diseñado para ser leído desde el comienzo hasta el final es un ejemplo común de texto lineal. Un texto no lineal incluye la presentación y lectura de texto en un orden distinto al orden lineal. Un ejemplo de texto no lineal es el "Hipertexto", en el que ciertas palabras son presentadas de un modo tal que indican un enlace, por ejemplo el texto está encerrado entre paréntesis angulares o en color azul. La presentación de texto no lineal puede ser dirigida por el lector o automática. Un ejemplo de esto es la presentación automática de Hipertexto en un primer orden de profundidad, siguiendo el primer enlace de Hipertexto, ignorando los ciclos. Otro ejemplo es una primera presentación en profundidad, presentado el primer nivel de texto, seguido por cualquier enlace de Hipertexto del nivel principal, seguido por cualquier enlace de Hipertexto del primer nivel, y continuando hasta que se alcance la mayor profundidad o intervenga el lector. Aún otro ejemplo es la eliminación de la primera presentación de profundidad o intensidad para incluir sólo partes que contengan determinadas palabras claves de interés.

Lente de lectura mágica

En una realización, la presentación de texto puede comenzar presentado texto común sin formato. Cuando el lector desea ver el texto presentado como texto mejorado, entonces el lector designa una parte del texto que será mejorada colocando un icono tal como un "icono de lente de lectura mágica" sobre alguna parte de la oración. Dicha oración y las oraciones siguientes son presentadas como texto mejorado. Esta presentación de texto mejorado continúa hasta que el lector desactiva la lente de lectura mágica. Dicha lente de lectura mágica puede funcionar como punto alternativo de entrada dentro del procesador de textos mejorado.

Método

En la figura 1, etapa -110-, el texto es preprocesado. La etapa -110- es mostrada en detalle en la figura 5. El texto es analizado para identificar párrafos, oraciones, palabras y puntuación. Los párrafos pueden ser identificados por líneas en blanco, marcadores de párrafos, caracteres de identificación, caracteres de tabulación, o cualquier otra característica adecuada del texto. Las oraciones pueden ser identificadas utilizando reglas de gramática que incluyen períodos, espaciado, utilización de letras mayúsculas, y abreviaturas o la falta de las mismas. En una realización preferente leyendo texto bien construido, un punto, un signo de interrogación, o signo de exclamación, solo o seguido de un punto, seguido por dos espacios o un fin de párrafo, señala la finalización de una oración.

En la etapa -124-, la oración es dividida en palabras y signos de puntuación. Los signos enfáticos originales especificados por el autor, por ejemplo el texto en cursiva o subrayado, es conservado en realizaciones preferentes. Un scanner léxico estándar, tal como el Lex (denominación comercial) es utilizado en una realización, en el que el extremo de una palabra es señalado en las reglas de gramática por un espacio en blanco o un signo de puntuación. Otra realización utiliza un analizador léxico de escritura manuscrita. Una realización de la presente invención almacena caracteres de formato tales como tabuladores y sangrados como símbolos de puntuación. La posición de una palabra es almacenada de manera preferente como un atributo de dicha palabra, proporcionando enlaces al trabajo original y buscando dentro del mismo.

Una realización preferente permite además que grupos de palabras sean unidas de forma conjunta, y sean reconocidas como un grupo de palabras. En una realización, dichos grupos de palabras son reconocidos por el escáner léxico. En otra realización, dichas palabras son reconocidas por un preprocesador que precede al escáner léxico para asegurar el reconocimiento como una frase en lugar de simples palabras individuales. Las palabras unidas firmemente, por ejemplo "Príncipe de Gales", serían reconocidas como una sola frase, y de manera preferente no sería partida por la preposición en dos frases visualizadas en dos líneas.

En la etapa -126-, las palabras son buscadas en diccionarios, glosarios y tablas para determinar sus atributos. El texto es procesado adicionalmente para determinar atributos continuos y de categoría. En una realización preferente, los atributos de categoría importantes incluyen categorías gramaticales, y atributos continuos importantes incluyen la posición de la palabra, nivel de instrucción, tiempo de pronunciación, y número de sílaba, posición, sonido y nivel de énfasis vocal. La identificación de categorías gramaticales con un 100% de precisión requeriría largas tareas de programación para determinar el contexto real de dicho texto. Dicha precisión no es necesaria para llevar a cabo la presente invención, dado que los errores son una consecuencia menor debido a que el lector es humano y no una máquina. Las posibles categorías gramaticales son primero determinadas buscándolas en el diccionario o glosario. Dicho diccionario o glosario sólo necesita tener las categorías gramaticales probables para una palabra, no una definición. Por ejemplo, la palabra "farm" podría ser un sustantivo, un verbo o un adjetivo. Una realización preferente almacena atributos de las categorías gramaticales utilizando un mapa de bits para conservar las múltiples categorías gramaticales posibles. Una realización de la presente invención almacena de forma explícita un atributo de ambigüedad, que indica si la palabra aún presenta múltiples categorías gramaticales posibles. Otra realización utiliza la existencia de más de una sola categoría gramatical posible como indicación de ambigüedad.

En una realización preferente de la presente invención, las categorías gramaticales por defecto existen en un diccionario y pueden ser buscadas En una realización más preferente, un conjunto de palabras puede ser añadido para anular o suplementar el conjunto por defecto. En otra realización, las palabras técnicas son especificadas por los conjuntos de palabras introducidos por el usuario.

La figura 6 muestra nueve conjuntos de palabras que caracterizan categorías gramaticales dispuestas en una jerarquía. Dichos conjuntos de palabras y jerarquías también son utilizados como datos de entrada para las reglas de terminación, descritas posteriormente en el presente documento. Una realización preferente comprueba los conjuntos de palabras mostrados en la figura 6, comenzando por la Clase 1, Subclase 1, y terminando con la Clase 3, Subclase 1. La búsqueda es terminada una vez que una palabra o frase es encontrada. Dado el vocabulario limitado y la naturaleza estática de los conjuntos de palabras en la figura 6, la realización más preferente de la presente invención utiliza un analizador sintáctico rápido de texto manuscrito para buscar las palabras y frases en la figura 6. Las realizaciones preferentes incluyen analizadores sintácticos escritos en C, C++, Perl, AWK compilado, AWK y AWK a C, C con funciones de expresión regular, o cualquier lenguaje apropiado. Una realización de analizador sintáctico utiliza YACC.

En una realización, el diccionario es un diccionario disponible comercialmente en medio electrónico, tal como un CD-ROM. El diccionario estándar es analizado buscando atributos de palabras tales como las categorías gramaticales y la cantidad de sílabas. Debido a que las definiciones de las palabras no son necesarias en numerosas realizaciones, es posible el almacenamiento de numerosas palabras con el número asociado de sílabas y categorías gramaticales. En la realización más preferente de la presente invención, las palabras más comúnmente utilizadas y más recientemente utilizadas son almacenadas en una memoria de acceso rápido tal como una memoria de acceso aleatorio (RAM) de estado sólido. En realizaciones en las que los diccionarios deban ser confeccionados a mano, resulta preferente la utilización de un método rápido que use código de comprobación, detección de colisiones y compartimientos de memoria. En realizaciones en las que los conjuntos de palabras son fijados antes de la lectura, es preferente comprobación perfecta sin compartimientos de memoria.

En aún otra realización, el nivel de énfasis de pronunciación es derivado como un atributo dependiente en parte de la categoría gramatical. En la realización más preferente, en énfasis de pronunciación es categorizado como primario, secundario e inexistente. En una realización, el tiempo de pronunciación y el sonido real, por ejemplo tal como se encontraría en un archivo de sonido, también son recuperados a partir del diccionario o glosario y almacenados como atributos de la palabra.

En la etapa -128-, se busca el lector y los conjuntos de palabras específicas del texto. En una realización preferente, los conjuntos de palabras especificadas por el lector son almacenados en una base de datos separada del diccionario o conjuntos de palabras del glosario, para permitir el almacenamiento separado y una recuperación más rápida. En una realización, los conjuntos de palabras especificadas por el lector son comprobadas antes de los diccionarios, y los diccionario sólo son comprobados si las palabras requeridas y los atributos no son encontrados en los conjuntos de palabras especificadas por el lector. Las realizaciones preferentes utilizan una jerarquía de bases de datos para buscar las palabras.

En la etapa -130-, múltiples categorías gramaticales son desambiguadas. En una realización, se utiliza una microgramática para determinar categorías gramaticales probables. Una microgramática utiliza palabras adyacentes o cercanas para determinar de forma más precisa la categoría gramatical más probable para una palabra. Por ejemplo, el término "farm" en la frase "a farm in" podría ser un sustantivo dado que es precedido por un artículo y sucedido por una preposición. A modo de ejemplo adicional, si una palabra pudiera ser un sustantivo o un verbo, y la palabra está precedida por "could", "will", "shall", o "to", entonces la palabra probablemente es un verbo. Si la palabra "farm" estuviera precedida por "will", la palabra probablemente sea un verbo. En otra realización, toda la desambiguación es llevada a cabo seleccionando el uso estadísticamente más probable de la palabra. En aún otra realización, no se produce desambiguación automática, sólo se utiliza desambiguación manual utilizando edición mediante la intervención humana. En una realización preferente, un atributo de desambiguación es almacenado para cada palabra, indicando si aún después de la desambiguación existen múltiples categorías gramaticales posibles. En aún otra realización, un atributo de ambigüedad no es almacenado sino derivado a partir de la existencia de múltiples categorías gramaticales posibles almacenadas para una palabra. En una realización, la ambigüedad es deducida a partir de la presentación visual de colores de texto en franjas o alternantes asociados con cada categoría gramatical. Por ejemplo, si los verbos son naranjas y los adjetivos son amarillos, entonces un posible verbo o adjetivo podría tener rayas o caracteres de texto amarillos y naranjas.

En una realización de la presente invención, las categorías gramaticales son determinadas en parte buscando morfemas (palabras raíz) y asignando atributos de categorías gramaticales basándose en las terminaciones de palabras, por ejemplo "-ly", "-ing".

En la etapa -132-, los atributos determinados para las palabras y frases son almacenados, creando una "oración jerarquizada", que probablemente permanecerá inalterada entre los lectores. Por ejemplo, el nivel de instrucción y la categoría gramatical de una palabra permanecerán inalterados para distintos lectores, a pesar de que puedan desear distintas longitudes de segmentos de texto y velocidades de presentación. En una realización, la oración enriquecida es almacenada en un almacenamiento duradero, tal como un archivo. En otra realización, el texto enriquecido es almacenado en un CD-ROM. En una realización preferente, la oración enriquecida es interpretada como una lista de nodos vinculados, teniendo cada nodo los atributos de palabra o frase descritos anteriormente incluyendo la posición de la palabra dentro del texto original. En la figura 5, etapa -134-, los puntos primarios de terminación son determinados aplicando reglas de punto de terminación primario. Los puntos de terminación son puntos de división del texto localizados entre letras. En una realización preferente, los puntos de terminación son clasificados como primarios y secundarios. Los puntos de terminación primario son determinados utilizando reglas de terminación primario que determinan posiciones de puntos de terminación primario basándose en símbolos de puntuación. La figura 7 muestra un punto de terminación primario después de una coma siguiendo a la palabra "África". Los puntos de terminación primario dividen el texto en "superfrases". En una realización preferente, los puntos de terminación primario están localizados en cada coma, dos puntos, punto y coma, y paréntesis izquierdo, corchetes y llaves. La posición del punto de terminación puede ser almacenada como un atributo en un nodo en una lista de nodos vinculados que conforman una oración enriquecida.

Los puntos de terminación secundarios son determinados aplicando reglas de punto de terminación secundario. En realizaciones preferentes, los puntos y reglas de terminación secundarios están categorizados con una jerarquía y las reglas de terminación secundario aceptan categorías gramaticales como entradas. En una realización más preferente, las reglas de terminación secundarias incluyen como entradas de regla atributos del contenido de texto de los segmentos de texto y frases que son procesados. Por ejemplo, un punto de terminación secundario puede ser requerido por un segmento de texto que exceda la longitud máxima de segmento de texto preferido por el lector a pesar de que no se haya alcanzado la longitud máxima de segmento de texto.

Los atributos continuos tales como la dificultad de la frase, densidad, complejidad, potencia y tiempo de pronunciación pueden ser utilizados como entradas para una regla que modifique la categoría establecida por una tabla tal como la mostrada en la figura 6, utilizando sólo categorías gramaticales para determinar categorías de partes de terminación secundaria. Por ejemplo, un segmento de texto que tenga una longitud mayor al 35% del texto promedio tendría una categoría de clase "1" asignada independientemente de la categoría determinada por la tabla de la figura 6. En una realización preferente, la longitud o potencia de frase es utilizada exclusivamente para determinar categorías de puntos de terminación secundarios, en lugar de utilizar solamente categorías gramaticales.

En una realización alternativa, las reglas de terminación determinan una terminación basándose en la cantidad de caracteres en la línea, y las categorías gramaticales son visualizadas utilizando colores correspondientes a la categoría gramatical de dichas palabras. La última realización puede que no ofrezca las ventajas de la visualización en cascada, pero proporciona pistas visuales basadas en el contenido del texto.

La figura 6 muestra una tabla utilizada en una realización preferente para determinar puntos de terminación secundarios. Por ejemplo, las preposiciones determinan puntos de terminación secundarios de Clase 3, Subclase 1. En la figura 7, existen puntos de terminación secundaria de clase 3 antes de las preposiciones "in" y "of". Los puntos de terminación secundario dividen superfrases en "minifrases", tal como se muestra en la figura 7. Las minifrases están relacionadas con segmentos de texto que en dicha minifrase a menudo son iguales a segmentos de texto y son visualizadas cada una en una nueva línea. Una vez que las minifrases son identificadas, sin embargo, las reglas pueden dictar que aparezca más o menos de una minifrase como un segmento de texto o línea.

Primero se aplican las reglas de terminación primario, seguidas por las reglas de terminación secundario, aplicadas en el orden que determina la categoría de reglas de terminación. Un ejemplo de categoría de reglas de terminación secundario es mostrado en la figura 6, establecida por la categoría de los conjuntos de palabras que dan lugar a los puntos de terminación secundario. Algunas realizaciones preferentes utilizan la longitud o potencia de la frase para determinar la categoría de punto de terminación secundario en lugar de utilizar solamente las categorías gramaticales. La realización más preferente permite la introducción por parte del lector de preferencias de categorías gramaticales o determinación de la ponderación/potencia de la frase de la categoría de los puntos de terminación secundarios. Algunos lectores prefieren la segmentación del texto basándose en la estructura, mientras que otros prefieren la segmentación del texto basándose en la complejidad o tiempo estimado para leer un segmento de texto.

En una realización preferente, las reglas de terminación secundario son aplicadas sólo hasta que se alcanza un determinado límite. Dicho límite es a menudo la longitud mínima de línea. Un método para determinar la posición de los puntos de terminación secundarios se muestra en la figura 5, etapa -136-, y en detalle en la figura 8, etapa -136-. En una realización, en la que la aplicación de una regla de terminación secundario a una superfrase resultaría en una longitud de minifrase menor que la longitud de línea mínima especificada, dicha regla de terminación no es aplicada ni tampoco se aplica ninguna otra regla de terminación a dicha superfrase. Por el contrario, cuando no existe otro punto de terminación en una línea que excede la longitud de línea máxima, se aplica una regla de bloqueo, que fuerza la terminación del texto en dos líneas. Cuando a todas las superfrases no se les aplique ninguna regla de terminación adicional, el proceso de terminación está completado.

En la figura 1, etapa -111-, los parámetros, atributos, y reglas de terminación pueden ser utilizados como entradas para las reglas de desplazamiento horizontal. Las reglas de desplazamiento horizontal determinan la posición horizontal del segmento de texto. En una realización preferente, las reglas de desplazamiento horizontal incluyen las reglas de justificación horizontal y reglas de ángulo de descenso. El desplazamiento horizontal en esta realización es la suma de los resultados de la regla de justificación horizontal y la regla de ángulo de descenso. En una realización fácil de implementar, la regla de desplazamiento horizontal es simplemente el ángulo de descenso aplicado al segmento de texto justificado al centro o centrado. Dicha realización no utiliza la regla de terminación que pone fin al segmento de texto precedente como entrada y proporciona un movimiento ocular mínimo durante la lectura de la cascada de oraciones. Otra realización añade descenso hacia la izquierda para puntos de terminación precedentes de Clase 1, y descenso a derecha para puntos de terminación precedentes de Clase 3. Una realización preferente permite al lector determinar desplazamientos adicionales a derecha o izquierda para los puntos de terminación, incluyendo valores entrados por el lector para puntos de terminación primario, y cada clase y subclase de puntos de terminación secundario. Una realización almacena el desplazamiento añadido en una tabla en unidades de caracteres. Habiendo determinado el desplazamiento horizontal, se conserva el ajuste del texto.

En el ejemplo de la figura 9, la superfrase 1, "I had a farm in Africa" es dividida de la superfrase 2, "at the foot of the Ngong Hills", por el punto de terminación primario después de la coma. La superfrase 2 es dividida en dos superfrases por el punto de terminación secundario antes de la preposición "of". En la realización mostrada en la figura 9, dos minifrases son presentadas como el mismo segmento de texto que la minifrase "in Africa", que está por debajo de la longitud mínima de tres palabras especificada por el lector. La primera minifrase, "at the foot", en una nueva línea es centrada por debajo del segmento de texto superior y desplazada hacia la derecha mediante un ángulo de descenso a derecha. La última minifrase "of the Ngong Hills" es desplazada hacia la izquierda a causa de una regla de desplazamiento horizontal que determina un desplazamiento a izquierda cuando la línea precedente ha terminado con un punto de terminación secundario en lugar de uno primario. Por lo tanto, en el ejemplo de la figura 9, el desplaza-
miento horizontal total es determinado por una combinación del ángulo de descenso y la justificación de la línea.

Los signos de puntuación por parejas incluyendo paréntesis, corchetes, llaves, y comillas, sirven como signos de puntuación que determinan posiciones de puntos de terminación primario en una realización preferente. En una realización, dichos signos de puntuación por parejas son incluidos como una entrada a las reglas de desplazamiento horizontal, incluyendo justificación horizontal y reglas de ángulo de descenso. Por ejemplo, un segmento de texto de multifrases largo contenido entre paréntesis puede tener desplazamientos horizontales reducidos y desplazamientos verticales reducidos, es decir, menor espacio entre líneas que el resto del texto en la zona de visualización activa de la superficie de visualización.

En la etapa -112-, se crea el texto mejorado. En esta etapa, se crean los códigos necesarios para crear un segmento de texto visualizado apropiadamente. Por ejemplo, cuando las especificaciones del lector requieren palabras técnicas coloreadas en rojo, y el texto enriquecido indica que una palabra es una palabra técnica, puede crearse una secuencia de escape que será interpretada por la etapa de visualización como una solicitud de texto de color rojo. Un código similar puede ser necesario para las animaciones. El texto mejorado puede ser almacenado en este punto para una posterior visualización.

En la etapa -113-, el texto mejorado es presentado en el dispositivo de visualización, mostrando un segmento de texto por cada nueva línea formada. El texto mejorado puede incluir además animación, color de fondo, color de texto, etiquetas, y velocidades de presentación descritas anteriormente en el presente documento. En una realización preferente, el color de fondo es presentado como una función de las posiciones de la oración y el párrafo.

En otra realización, mostrada en la figura 11, una parte del texto es presentada de forma inicial con un color o brillo durante un período de tiempo, seguido por la presentación con un segundo color o brillo. En la figura 11, la oración es presentada en tres nuevas líneas formadas indicadas por las flechas (200), (202), y (203). Dentro de dichas líneas, el texto es presentado completamente en la misma línea, con las palabras de la figura 11 mostradas en distintas líneas para mostrar el cambio temporal del color/resaltado del texto inicial (206) hacia el color/resaltado del texto (207), y el color/resaltado del texto inicial (208) al (209). El texto "Af" en (206) es la sílaba enfatizada de la palabra "Africa", y es mostrada de forma inicial con color/resaltado (206) por esta razón. La parte del texto "gong" también es la sílaba enfatizada de la palabra "Ngong", y tiene un color/resaltado inicial (208), seguido por el color/resaltado (209).

La realización preferente mostrada en la figura 1 permite que los textos enriquecidos de la etapa -132- y la etapa -113- sean editados. En una realización preferente, un dispositivo puntero de palabra, tal como un ratón, es utilizado para seleccionar una parte del texto que será editado. La oración enriquecida correspondiente a dicha parte del texto enriquecido es seleccionada internamente, y los atributos son puestos a disposición para llevar a cabo la edición. Este modo puede ser implementado utilizando menús desplegables que permiten editar cada atributo del texto enriquecido y el texto mejorado. Si las ediciones al texto enriquecido afectaran la presentación, el texto es preprocesado nuevamente de acuerdo con la etapa -110-. En la sesión de edición de la etapa -114-, las anotaciones del lector, ocultas o inmediatamente visibles, son aceptadas y pueden ser almacenadas en las oraciones enriquecidas y mejoradas. Dichas anotaciones cumplen la misma función que las notas escritas a mano en un libro. Las características que pueden ser editadas incluyen categorías gramaticales, definición, color, texto, puntos de terminación, y desplazamiento horizontal.

Los atributos editados y visualizados de esta realización también pueden ser almacenados, en la etapa -116-, conservando los cambios. En una realización de la presente invención, sólo las oraciones mejoradas son almacenadas. En una realización preferente, el texto enriquecido y mejorado es almacenado. En realizaciones preferentes, algunas ediciones son grabadas como específicas del lector o globales, para la presentación del texto a cualquier otro lector. La edición manual del texto mejorado es especialmente útil cuando el mismo texto será visualizado repetidamente por otras personas, tal como sucede con un libro electrónico.

En una variante de la realización de la figura 1, las etapas -113-, -114- y -116- son omitidas, sin intervención humana y sin visualización inmediata. En esta realización, el texto enriquecido y mejorado es creado y almacenado para visualización futura. El texto mejorado puede ser almacenado en formato de procesamiento de palabras estándar tal como archivos binarios de Microsoft Word (denominación comercial) o Corel Word Perfect (denominación comercial. En esta realización, el software de presentación puede ser simple, pequeño, y rápido en comparación con el software necesario para buscar palabras y analizar texto. Dicha presentación es una realización preferente para la distribución masiva de texto mejorado para lectura como "libro electrónico".

En una variante relacionada con la realización de la figura 1, el texto mejorado en sí es recuperado en la etapa -106-, sin requisitos de procesamiento y sin permisos de edición. Dicha presentación también es una realización preferente para la distribución masiva de texto mejorado para lectura como "libro electrónico".

Haciendo referencia a la figura 1, etapa -113-, la presentación de cada pantalla de texto mejorado puede ser activada manualmente, por ejemplo mediante el clic de un ratón. En una realización preferente, la velocidad de presentación es controlada por los parámetros especificados por el lector, incluyendo el tiempo de visualización para cada texto, y los tiempos de llegada entre oración y entre párrafo. En una realización más preferente, el contenido de texto es medido, y el intervalo de presentación de texto depende de dicho contenido de texto. En una realización preferente, el tiempo de pronunciación del texto es utilizado como una medida del contenido de texto para determinar el intervalo de presentación. En otra realización, las longitudes de frase son utilizadas para medir el contenido de texto y determinar el intervalo de presentación.

Una realización preferente permite a los lectores extender el tiempo de presentación para una oración, además de aumentar y disminuir la velocidad de presentación. Esta velocidad puede ser grabada, del mismo modo que la longitud de oración y la dificultad de oración correspondiente a un intervalo de presentación particular. La figura 10 muestra un ejemplo de un gráfico en 3-D, "mapa historial de muestreo de intervalo de presentación", que muestra el tiempo necesario para leer una oración como una función de dos atributos, la dificultad de la oración y la longitud de la oración. El tiempo necesario para leer puede ser medido por las preferencias del lector o por el seguimiento de movimiento ocular o actividad de ondas cerebrales anteriormente mencionadas en el presente documento. Entonces, el tiempo puede ser correlacionado contra dos atributos tal como en la figura 10, o cualquier otra cantidad de atributos. El intervalo de presentación en una realización preferente es ajustado de forma continua para adaptarse al tiempo de lectura requerido y predecido.

En aún otra realización, que resulta la más apropiada cuando la velocidad de lectura es medida de forma estricta, las entradas para las reglas de terminación son modificadas y se lleva a cabo un seguimiento de la velocidad de lectura resultante. En una realización apropiada para crear un producto de lectura óptimo para el mercado masivo, las entradas para las reglas de terminación son modificadas y las velocidades de lectura son grabadas para una población de muestra. Las entradas son variadas para lograr una velocidad de lectura y una compresión óptimas. Por ejemplo, la importancia establecida por las reglas de terminación secundario a categorías gramaticales relativas a la longitud de la frase es modificada para lograr una velocidad de lectura óptima.

En otra realización, la edición manual del lector de la visualización de oración inicial es analizada en cuanto a contribución relativa a la estructura de la oración, categorías gramaticales, longitud y complejidad. Después de dicho período de ajuste o prueba inicial, se utilizan longitudes similares en reglas de terminación para mejorar el texto automáticamente. Las ediciones subsiguientes pueden ser utilizadas para refinar de manera adicional las reglas de terminación.

En la etapa -118-, la presentación del texto se detiene cuando no existe más texto o el lector solicita la interrupción. Las etapas -120- proporcionan un proceso de limpieza, incluyendo almacenamiento final de texto enriquecido y mejorado, además de almacenamiento del historial acerca de la sesión de lectura.

Numerosas características y ventajas de la presente invención dada a conocer en el presente documento han sido determinadas en la presente descripción. Debe entenderse que, sin embargo, esta descripción es dada, en muchos aspectos, meramente a modo de ejemplo. Pueden realizarse cambios en detalles, en particular en cuanto a las etapas de combinación, separación, y disposición, sin salir del alcance de la presente invención. Por supuesto, el alcance de la presente invención queda definido por las reivindicaciones adjuntas.

Claims

1. Método para mejorar la presentación de texto a partir de un texto de lenguaje natural legible por máquina basándose en parámetros específicos del lector, incluyendo como mínimo las dimensiones del campo de visión, que comprende:

analizar sintácticamente de dicho texto signos de puntuación y categorías gramaticales para extraer atributos específicos del texto;

almacenar dichos atributos específicos del texto en relación con las categorías gramaticales para producir un texto enriquecido;

aplicar reglas de terminación primarias seguidas por reglas de terminación secundarias a dicho texto enriquecido, aplicadas de acuerdo con una categoría de reglas de terminación que dividen dicho texto en segmentos de texto, teniendo dichas reglas de terminación como mínimo dichos atributos de puntuación y atributos de categoría gramatical como entradas y atributos visuales como salidas;

aplicar reglas de terminación secundaria hasta que se alcanza un determinado límite, que de manera preferente es la longitud mínima de línea; y

en el que los atributos visuales incluyen la visualización de segmentos de texto en nuevas líneas;

aplicar reglas de desplazamiento horizontal de segmentos de texto a dichos segmentos de texto para determinar un desplazamiento horizontal para cada segmento de texto, incluyendo dichas reglas de desplazamiento horizontal categorías gramaticales como entradas y atributos visuales de desplazamiento horizontal como salidas para producir un texto mejorado; y

visualizar dicho texto mejorado mediante una presentación en cascada de segmentos de texto en líneas descendentes y a lo ancho del dispositivo de visualización.

2. Método de la reivindicación 1, en el que dichos atributos específicos incluyen la localización del texto dentro de una caja de texto, incluyendo dicha presentación de texto un color de fondo y dicho proceso de textos incluye la variación de dicho color de fondo de acuerdo con dicha localización de texto.

3. Método de la reivindicación 1, en el que dichos atributos específicos de texto incluyen una medida de la dificultad del texto, y dicha presentación de texto incluye una velocidad de avance de texto automática, y dicho proceso de textos incluye la variación de dicha velocidad de presentación del texto de acuerdo con dicha medida de dificultad del
texto.

4. Método de la reivindicación 3, en el que dicha medida de la dificultad del texto incluye un tiempo de pronunciación estimado de dicho texto y/o un nivel de instrucción estimado para dicho texto y/o la cantidad de sílabas en dicho texto.

5. Método de la reivindicación 1, en el que dichos atributos visuales incluyen la visualización de dichos segmentos de texto con un color que depende de dichas categorías gramaticales y/o la visualización de dichos segmentos de texto en nuevas líneas.

6. Método de la reivindicación 1, en el que:

dichas reglas primarias incluyen signos de puntuación como entradas;

dichas reglas secundarias incluyen categorías gramaticales como entradas.

7. Método de la reivindicación 6, en el que dichas reglas de terminación incluyen una microgramática para desambiguar dichas categorías gramaticales.

8. Método de la reivindicación 1, que comprende además la determinación de las categorías gramaticales probables de dichas palabras a partir de dicha etapa de análisis sintáctico.

9. Método de la reivindicación 9, que comprende:

proporcionar reglas de visualización de color, en las que dichas reglas de visualización de color incluyen dichas categorías gramaticales probables como entradas y color de texto como salidas; y

visualizar dicho texto de acuerdo con dicha salida de color de texto.

\newpage

10. Método de las reivindicaciones 1 y 6, en el que la aplicación de reglas de terminación primarias y secundarias comprende:

proporcionar una longitud de segmento de texto mínima;

proporcionar una longitud de segmento de texto máxima;

determinar las posiciones de los puntos de terminación primario en dicho texto aplicando las reglas de terminación primarias, dividiendo de este modo dicho texto en superfrases;

determinar las posiciones de los puntos de terminación secundario en las superfrases aplicando las reglas de terminación secundarias, dividiendo de este modo las superfrases en segmentos de texto;

repetir dicha etapa previa hasta que los segmentos de texto no son más largos que la longitud de segmento de texto máxima, y no son más cortos que la longitud de segmento de texto mínima.

11. Método de la reivindicación 1 ó 10, que comprende además:

aceptar las ediciones hechas por el usuario de los puntos de terminación del texto visualizado; y

almacenar las ediciones hechas por el usuario en formato legible por máquina; y/o

aceptar las ediciones hechas por el usuario de las categorías gramaticales del texto visualizado; y almacenar las ediciones hechas por el usuario en formato legible por máquina; y/o

aceptar las anotaciones hechas por el usuario en las categorías gramaticales del texto visualizado; y almacenar las anotaciones hechas por el usuario en formato legible por máquina.

12. Dispositivo para mejorar la presentación de texto a partir de un texto de lenguaje natural legible por máquina y una presentación de texto mejorada basada en parámetros específicos determinados por el lector que incluyen como mínimo, las dimensiones del campo de visión, que comprende:

medios de análisis sintáctico para dividir dicho texto a través de los signos de puntuación y categorías gramaticales para extraer atributos específicos del texto;

medios de almacenamiento para almacenar dichos atributos específicos del texto en relación con las categorías gramaticales para producir un texto enriquecido;

medios para aplicar reglas de terminación primarias seguidas de reglas de terminación secundarias a dicho texto enriquecido, aplicadas de acuerdo con un rango de reglas de terminación, dividiendo de este modo el texto en segmentos de texto, teniendo dichas reglas de terminación como mínimo atributos de puntuación y atributos de categorías gramaticales como datos de entrada y atributos visuales como datos de salida;

medios para aplicar reglas de terminación secundarias hasta que se alcanza un determinado límite, siendo dicho límite de manera preferente la longitud mínima de línea; y

en el que los atributos visuales incluyen la visualización de segmentos de texto en líneas nuevas;

medios para aplicar reglas de desplazamiento horizontal del segmento de texto a dichos segmentos de texto para determinar un desplazamiento horizontal para cada segmento de texto, incluyendo dichas reglas de desplazamiento horizontal categorías gramaticales como entradas y atributos visuales de desplazamiento horizontal como salidas para producir un texto mejorado; y

medios para visualizar dicho texto mejorado presentando en cascada los segmentos de texto en líneas descendentes y a lo ancho del dispositivo de visualización.

13. Dispositivo de la reivindicación 12, en el que dichos medios para aplicar dichas reglas primarias y secundarias de terminación comprenden medios de entrada de la longitud mínima del segmento de texto para introducir una longitud mínima del segmento de texto;

medios de entrada de la longitud máxima del segmento de texto para introducir una longitud máxima del segmento de texto;

medios de determinación primaria para determinar las posiciones de los puntos de terminación primario en dicho texto aplicando las reglas de terminación primarias, dividiendo de este modo el texto en superfrases;

\newpage

medios de determinación secundaria para determinar las posiciones de los puntos de terminación secundario en las superfrases aplicando las reglas de terminación secundaria, dividiendo de este modo las superfrases en segmentos de texto;

medios para repetir dicha etapa de determinación de posiciones de puntos de terminación secundario hasta que todos los segmentos del texto no son más largos que la longitud máxima de segmento de texto, y no son más cortos que la longitud mínima de segmento de texto.

14. Dispositivo de la reivindicación 13, en el que el texto enriquecido incluye palabras y frases y está implementado como una lista vinculada de nodos, teniendo cada nodo atributos de palabra o frase.

15. Dispositivo de la reivindicación 12, en el que dichas reglas de terminación incluyen reglas primarias y secundarias, incluyendo dichas reglas primarias los signos de puntuación como datos de entrada y dichas reglas secundarias incluyendo categorías gramaticales como datos de entrada; comprendiendo una tabla que contiene conjuntos de palabras que establecen una jerarquía de puntos de terminación secundario.