WO2005094158A2 - Sistema y programa para clasificar categorizaciones complejas - Google Patents

Sistema y programa para clasificar categorizaciones complejas Download PDF

Info

Publication number
WO2005094158A2
WO2005094158A2 PCT/ES2005/000165 ES2005000165W WO2005094158A2 WO 2005094158 A2 WO2005094158 A2 WO 2005094158A2 ES 2005000165 W ES2005000165 W ES 2005000165W WO 2005094158 A2 WO2005094158 A2 WO 2005094158A2
Authority
WO
WIPO (PCT)
Prior art keywords
entities
entity
instance
category
tree structure
Prior art date
Application number
PCT/ES2005/000165
Other languages
English (en)
French (fr)
Other versions
WO2005094158A3 (es
Inventor
Ángel PALACIOS ORUETA
Original Assignee
Kerkego Sl Unipersonal En Constitución
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kerkego Sl Unipersonal En Constitución filed Critical Kerkego Sl Unipersonal En Constitución
Priority to JP2007510050A priority Critical patent/JP2008547065A/ja
Priority to US10/599,384 priority patent/US20070150519A1/en
Publication of WO2005094158A2 publication Critical patent/WO2005094158A2/es
Publication of WO2005094158A3 publication Critical patent/WO2005094158A3/es

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes

Definitions

  • the present invention corresponds to the sector of computer tools to facilitate the classification of information.
  • the present invention presents a type of organization for sets of entities, where said entities can be for example objects, concepts, ideas, terms or others, which facilitates the conceptualization of classifications and the conduct of searches.
  • the invention facilitates the realization of systematic categorizations in which there are different criteria for organizing the information, and facilitates its inspection and use by the user.
  • the invention unites in the same tree the categories that are used to classify the instances that are being classified and the different criteria that define the different hierarchies of categories. That is, in the same tree it creates a multicriteria classification, in which different hierarchies of categories belonging to different criteria coexist. This tree can be displayed graphically in an alborea structure.
  • Figure 1 shows a simple example of a possible tree structure for a multi-criteria classification of words.
  • the logical organization of entities through parent-child relations will be called a tree, and the tree structure will be called the representation of said tree in a graphical interface.
  • the following agreement will be followed: - the different instances are marked between points, such as ".martillo.” - in Illustration 1 these instances would be the specific words,
  • Illustration 1 Words Name According to nature Entity .martillo. .brother, .writer, .cereza. Attribute. Height. .honesty. Event According to duration Punctual. Durative .concert, .storm. According to action Action. Concert,. No action. Storm. Other .metro, .field. According to meaning It has use .martillo. It has a .writer function. It has a relationship. Other. Height.
  • the tree structure can show the different instances in duplicate or repeated manner in the different positions that correspond to the different categories. That is, ". Arrive.” it appears both in “According to duration>Punctual” and in “According to action>Action”
  • the invention refers both to the case in which there are still no instances, and therefore only the criteria and categories appear, as to the case in which there are instances that are shown. Thus, it could also be used in a case where only criteria and categories are shown, and instances are not shown. In this case, the categories and criteria shown could be used to perform searches against a database in which the instances were stored.
  • OPTIONAL ASPECTS The invention allows to construct different embodiments with different optional aspects. To facilitate the explanation of the advantages of the invention and without limiting effects, some of these optional aspects are described below: 1.
  • a relational database is used in which there are two tables. One table is used to store the instances and the other table is used to store the categories and criteria.
  • a different code is assigned to each record in the categories and criteria table (that is, a different code is assigned to each category and each criterion), for example a numerical code where each code is an integer.
  • the user can select a set of categories, which may or may not belong to different classification criteria, and the system searches for instances that have certain relationships with those categories.
  • the user could only select the "Entity” category (dependent on Name> According to Nature and the system could return the instances: “.martillo.”, “. Brother.”, “. writer. “and” .cereza. ", that is, all those instances that have the category” Entity. "If the user instead simultaneously selects” Entity "and” Has use "(where” Has use "is dependent on Name> According to Meaning), the system could only return ".martillo.”, Since it is the only instance that belongs to both categories.
  • a summary tree structure is characterized by being a tree structure that contains only the nodes selected in the main tree structure at a given time. For example, in Figure 1 you can select certain nodes, for example those that are shown in bold letters in Figure 2. A possible tree structure summary for this situation would be the structure shown in Figure 3.
  • summary tree structure information could also be shown as in Figure 4.
  • ADVANTAGES OF THE INVENTION 1 It allows the simple merging of categorizations based on different criteria, so that the user can understand the effects of multi-categorization easily. 2. It allows the simple realization of sophisticated searches, because the user only has to select in the same control all the categories that he wants and then he will have to combine in some way to perform the search. 3. It allows the creation of simple user interfaces, as it allows multicriteria classifications to be carried out with a single tree-type computer control.
  • Two nodes that could be criteria ie "Application” and “Catalog” are parents of nodes that are not categories, but are apparently products (Programming, Typing, Editing, Text Processing).
  • UVW printer Company B .XYZ-890.
  • Figure 1 shows a typical graph used in systemic linguistics work.
  • Figure 2 shows a block diagram of the preferred embodiment.
  • Figure 3 shows a schematic example of what the preferred embodiment would look like for a classification fragment,
  • Figure 4 shows a block diagram of an alternative embodiment.
  • the invention is constructed with a computerized system.
  • a computerized system which may be based, for example, on the PC Dell Dimension XPS ® ®, to which he also adds a mouse and keyboard user to interact with the system.
  • an operating system can be, for example, Microsoft ® Windows
  • Figure 2 shows a block diagram of the preferred embodiment, in which a screen 2001 is observed to observe the behavior of the invention; a processing unit 2002 that produces the functionality of the invention; interaction means 2003, which could be for example a mouse, a keyboard, a stylus or other means; and 2004 data containing the categories, criteria and instances that are being classified by the invention.
  • the invention uses a tree-type computer control, such as the Microsoft TreeView ® control.
  • Figure 3 schematically shows how a tree structure according to the present invention could be made for a fragment of the classification of Figure 1.
  • the following means are used to distinguish the criterion nodes from the other nodes.
  • the invention is used to perform searches on a set of categorized instances. For this, it is necessary first to have categorized these instances, that is, to have assigned the categories to which the instances belong within the different criteria.
  • two special procedures are used to facilitate the categorization of instances. For this, the concept of DOMAIN is introduced.
  • a domain is a set of sibling criteria that includes all siblings of those criteria. In these circumstances, if a given instance belongs to a category of one of the criteria, it must also belong to some category of each of the other criteria in the domain.
  • a neutral criterion is that for which it is not necessary to select any category, and for which there is indeed no selected category, for example, in Figure 1, if "hammer” is being categorized and the "Seg” category has been selected n Nature> entity “must also select a category belonging to the criterion” According meaning "they belong to the same domain. However, it is not necessary to select any category of the criteria “According to duration” or “According to action”. However, if the category "According to nature>event> According to duration>Punctual" has been selected. It is necessary to select a category belonging to the "According to action” criteria, as they belong to the same domain.
  • the procedure to perform the categorization of instances includes the following steps: 1. Select the instance to be categorized
  • each database there is a single database for each type of object (for example, a database for words, a database for books etc.), and in each database there are two tables. Instances are stored in one table and categories and criteria are stored in the other table. In both tables, the database system assigns correlative numerical codes to the entities that are created (be they instances, categories, or criteria). To create the classifications of the instances, hyphens are used around the codes of the categories to which the instance belongs, such as in "-1 -23-22-"
  • FIG. 4 shows another possible embodiment of the invention, comprising a processing unit 4001 that executes a program capable of organizing entities in the manner set forth in this invention. This would be the case, for example, of a company providing a data access service through the Internet, which users would access remotely through personal computers.
  • the invention can be used through an independent computerized system 4002 to which it is linked by a telecommunication system 4003.
  • the data managed by the unit 4001 may be integrated together with the unit 4001 or may be dispersed, such as the data 4005, 4006, 4007, 4008, to which the unit 4001 would be linked by a system of Telecommunication 4004.
  • the most effective tree structures are tower-like structures, which are characterized in that the different nodes are placed one above the other, and are distinguished fundamentally by the level of indentation.
  • the illustrations shown in this document and the Microsoft Treeview® control are examples of tone structures. These structures are much more comfortable than those used for example in systemic linguistics, such as the one shown in Figure 1.
  • tree structures can also be created using text controls, and placing them over each other, and applying different levels of indentation to each other.
  • An example of these structures are those created on the Internet pages with HTML language, and would be similar to the structures shown in the Illustrations in this document.
  • tree structures can be created that do not have added functionality to expand and contract nodes, but are permanently open.
  • the main advantage of the invention is the separation between criteria and categories and the procedures of search and categorization management.
  • the invention can also be carried out with other tree structure designs.
  • One of these designs is shown in Figure 15.
  • the criteria nodes are not at a higher level than the categories that dominate directly, but simply differ in text and format but have the Same level of indentation.
  • This tree structure design facilitates the relationship of some categories with their parent categories, as can be seen by inspecting "Name” and "Entity”, where it is clear that "Entity” is a category directly dependent on "Name”.
  • a criterion can be expanded or contracted, and it would result in the categories that depend on it appearing or disappearing without the criterion node itself appearing or disappearing. For example, if the criterion "According to nature" is contracted, the result would be that shown in Figure 16.
  • Illustration 15 Words Name According to nature Entity .martillo. .brother, .writer, .cereza. Attribute. Height. .honesty. Event According to duration Punctual. Durative .concert, .storm. According to action Action. Concert,. No action. Storm. Other .metro, .field. According to meaning It has use .martillo. It has a .writer function. It has a relationship. Other. Height. Adjective Adverb Verb Closed Class

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Exhaust Gas After Treatment (AREA)
  • Measurement Of Resistance Or Impedance (AREA)
  • Nitrogen Condensed Heterocyclic Rings (AREA)

Abstract

Sistema, procedimiento y programa para clasificar categorizaciones complejas que se basa en estructuras arbóreas y que organiza un conjunto de instancias en diferentes categorías y según diferentes criterios. Las instancias pueden corresponder a cualquier ámbito de la realidad, como objetos reales o eventos. La representación gráfica de la clasificación toma forma de árbol, y puede aparecer visualmente, en cuyo caso, se puede editar y organizar de diversas maneras. Pueden incluirse medios para realizar búsquedas.

Description

DESCRIPCIÓN
TITULO
"Organizador para categorizaciones complejas"
SECTOR DE LA TÉCNICA La presente invención corresponde al sector de herramientas informáticas para facilitar la clasificación de información.
ESTADO DE LA TÉCNICA
En el presente documento se hace referencia a los siguientes trabajos del estado de la técnica:
[1] Amazon. Navegador de Libros, www. amazon. com [2] Barnes and Noble. Navegador de Libros, www.bn.com.
[3] Benson, J.D., Cum ings, M., Greaves, W.S. (eds) (1988) "Linguistics in a Systemic Perspective", Amsterdam: John Benjamins Publishing Company [4] IBM (2000). Patente en EE.UU. número 6.055.515 [5] Microsoft. MSDN Libraiy Visual Studio 6.0 [6] Real Academia Española. Diccionario de la Lengua Española. Espasa.
La aparición de la informática en general y de Internet en particular han propiciado que exista en la actualidad una creciente cantidad de información disponible para una gran cantidad de personas, muchas de las cuales no son usuarios expertos de informática. Por ejemplo, actualmente existe una gran variedad de bases de datos accesibles en CD-ROM, DVD o en servidores de Internet. Algunos ejemplos de estas bases de datos son los siguientes:
1. El diccionario elecüónico de la Real Academia Española de la Lengua.
2. La enciclopedia Microsoft® Encarta®.
3. El sistema de ayuda de Microsoft® Visual Studio®. 4. La jerarquía de temas de Yahoo®.
5. Los fondos de libros de Amazon®, Bames and Noble® y otros. En general, estas bases de datos están organizadas de manera que contienen muchos tipos de conceptos mezclados, y la búsqueda no es sencilla. Esto hace necesario que existan mecanismos nuevos y mejores para organi-zar la información y facilitar la ejecución de búsquedas. EXPLICACIÓN DE LA INVENCIÓN
ESENCIA DE LA INVENCIÓN La presente invención presenta un tipo de organización para conjuntos de entidades, donde dichas entidades pueden ser por ejemplo objetos, conceptos, ideas, términos u otros, que facilita la conceptualización de las clasificaciones y la realización de búsquedas. En particular, la invención facilita la realización de categorizaciones sistemáticas en las que existen diferentes criterios para organizar la información, y facilita su inspección y utilización por el usuario. La invención une en un mismo árbol las categorías que se utilizan para clasificar las instancias que se están clasificando y los diferentes criterios que definen las distintas jerarquías de categorías. Es decir, en un mismo árbol crea una clasificación multicriterio, en la que coexisten diferentes jerarquías de categorías pertenecientes a diferentes criterios. Este árbol se puede mostrar gráficamente en una estructura alborea. La Ilustración 1 muestra un ejemplo sencillo de una posible estructura arbórea para una clasificación multicriterio de palabras. Para facilitar la explicación, en este documento se llamará árbol a la organización lógica de entidades mediante relaciones padre-hijo, y se llamará estructura arbórea a la representación de dicho árbol en una interfaz gráfica. También para facilitar la explicación, en las diferentes estructuras arbóreas que se muestren se seguirá el siguiente convenio: - las diferentes instancias se marcan entre puntos, como por ejemplo ".martillo." — en la Ilustración 1 dichas instancias serían las palabras concretas,
- las diferentes categorías que se usan se muestran con tipo de letra normal, como por ejemplo "Nombre" y
- los diferentes criterios que se utilizan se marcan con formato de letra subrayado, como por ejemplo "Según naturaleza".
Se debe tener en cuenta que la categorización de la Ilustración 1, y otras que se muestren más adelante, tienen como objetivo únicamente explicar la invención, y que las decisiones concretas que se utilizan para los criterios, categorías e instancias son únicamente de ejemplo y no tienen carácter li-nitativo. Ilustración 1 Palabras Nombre Según naturaleza Entidad .martillo. .hermano, .escritor, .cereza. Atributo .altura. .honradez. Evento Según duración Puntual .llegada. Durativo .concierto, .tormenta. Según acción Acción .concierto, .llegada. No acción .tormenta. Otros .metro, .campo. Según significado Tiene uso .martillo. Tiene función .escritor. Tiene relación .hermano. Otros .altura. Verbo Adjetivo Adverbio Clase Cerrada Como se observa, con este enfoque se pueden mezclar las diferentes categorías y los diferentes criterios de forma indefinida. Es decir, de un criterio pueden depender categorías u otros criterios. De una categoría pueden depender criterios u otras categorías. En el ejemplo de la Ilusuación 1 no hay ningún caso en el que un criterio dependa de otro criterio, pero esto también podría suceder. Como se observa, la categorización de la Ilustración 1 se puede construir de manera sencilla en un mismo control informático del tipo árbol, por ejemplo uno similar a los utilizados habitualmente en informática, por ejemplo el Microsoft Treeview®, el cual se usa en la estructura de directorios del sistema operativo Microsoft Windows®. En este caso, tanto los criterios como las categorías se podrían realizar como nodos de la esttuctura arbórea representada en el control. Como también se observa, para facilitar la utilización de la invención, en general podrán existir opcionahnente medios gráficos que permitirán distinguir los nodos-criterio de los nodos- categoría, como por ejemplo se ha hecho en la Ilustración 1 utilizando formato de letia subrayado para los nodos-criterio, aunque también se podrían utilizar otro tipo de medios. Como también se observa, las instancias pueden pertenecer a diferentes categorías; en particular, noimalmente pertenecerán a diferentes categorías que están encuadradas en criterios hermanos. Por ejemplo, en la Ilustración 1, ".llegada." pertenece a "Según duración > Puntual" y a "Según acción > Acción". Es decir, dependiendo del criterio que se utilice, la palabra pertenece a diferentes categorías. Como se hace habitualmente en el estado de la técnica, la estiτιctura arbórea puede mostrar las diferentes instancias de manera duplicada o repetida en las diferentes posiciones que corresponden a las diferentes categorías. Es decir, ".llegada." aparece tanto en "Según duración > Puntual" como en "Según acción > Acción" Por último, la invención se refiere tanto al caso en el que todavía no existan instancias, y por lo tanto solamente aparezcan los criterios y las categorías, como al caso en el que sí existen instancias que se muestran. Asíinismo, también se podría utilizar en un caso en el que únicamente se muestran los criterio y las categorías, y las instancias no se muestran. En este caso se podrían utilizar las categorías y criterios mostrados para ejecutar búsquedas contra una base de datos en la que estuvieran almacenadas las instancias.
ASPECTOS OPCIONALES La invención permite construir diferentes realizaciones con diferentes aspectos opcionales. Para facilitar la explicación de las ventajas de la invención y sin efectos limita tivos, a continuación se describen algunas de dichos aspectos opcionales: 1. Se utiliza una base de datos relacional en la que existen dos tablas. Una tabla se utiliza para almacenar las instancias y la otra tabla se utiliza para almacenar las categorías y los criterios.
2. Se asigna un código diferente a cada registro de la tabla de categorías y criterios (es decir, se asigna un código diferente a cada categoría y a cada criterio), por ejemplo un código numérico donde cada código es un número entero.
3. Se crea un campo especial en la tabla de instancias, llamado por ejemplo "Clasificación".
4. Para cada instancia, se identifican las categorías a las que corresponde y se concatenan los códigos de dichas categorías, y además se utiliza algún carácter separador especial alrededor de los códigos. En un caso hipotético, si se utilizara un guión, la concatenación podría dar lugar a una cadena como "-1-23-42-100-230-"
5. Se asigna la concatenación de códigos de cada instancia al campo "Clasificación" de cada instancia.
De esta manera, se podría llevar a cabo una búsqueda muy potente sobre las instancias. Se podrían realizar búsquedas de instancias que cumplen determinadas categorías utilizando la función de SQL "Li e" u otra similar en algún otro lenguaje de bases de datos. Por ejemplo, si se buscaran instancias que estuvieran asignadas a la categoría cuyo código "1", la orden de búsqueda podría ser similar a la siguiente "Clasificación LIKE '-1-'". Esta orden devolvería todas las instancias que contuvieran el código "1". Como se observa, la utilización de los códigos separadores impide confusiones, como por ejemplo las que podrían ocurrir con el código "100", pues sin los separadores podría suceder que se devolviera el código equivocado.
Para realizar búsquedas, existe otio aspecto opcional que se caracteriza porque el usuario puede seleccionar un conjunto de categorías, que pueden pertenecer o no a diferentes criterios de clasificación, y el sistema busca las instancias que tengan determinadas relaciones con dichas categorías. Por ejemplo, para los datos de la Ilustración 1, el usuario podría seleccionar únicamente la categoría "Entidad" (dependiente de Nombre > Según Naturaleza y el sistema podría devolver las instancias: ".martillo.", ".hermano.", ".escritor." y ".cereza.", es decir, todas aquellas instancias que tienen la categoría "Entidad". Si el usuario en cambio seleccionara simultáneamente "Entidad" y "Tiene uso" (donde "Tiene uso" es dependiente de Nombre > Según Significado), el sistema podría devolver únicamente ".martillo.", dado que es la única instancia que pertenece a ambas categorías. Se pueden realizar búsquedas tan complejas como se quiera utilizando expresiones booleanas, de manera que se refínen las condiciones que se quieren imponer con las categorías seleccionadas. Por ejemplo, si el usuario seleccionara "Entidad" y NO "Tiene uso" (donde "NO" es la función booleana inversa) el sistema devolvería únicamente ".hermano.", ".escritor." y ".cereza.". Para facilitar aún más la realización de búsquedas, un aspecto opcional útil es la ESTRUCTURA ARBÓREA RESUMEN. Una estructura arbórea resumen se caracteriza por ser una estructura arbórea que contiene únicamente los nodos seleccionados en la estructura arbórea principal en un momento dado. Por ejemplo, en la Ilustración 1 se pueden seleccionar determinados nodos, por ejemplo los que están mostrados con letra negrita en la Ilustración 2. Una posible estructura arbórea resumen para esta situación sería la estructura mostrada en la Ilustración 3. Ilustración 2 Palabras Nombre Según naturaleza Entidad .martillo. .hermano, .escritor, .cereza. Atributo .altura. .honradez. Evento Según duración Puntual .llegada. Durativo .concierto, .tormenta. Según acción Acción .concierto. .llegada. No acción .tormenta. Otros .metro. .campo. Sefti s frniftcado Tiene uso .martillo. Tiene función .escritor. Tiene relación .hermano. Otros .altura. Verbo Adjetivo Adverbio Clase Cerrada
Ilustración 3 Palabras Nombre Según naturaleza Entidad Evento Según acción Acción Según significado Tiene relación
Para facilitar más la gestión de los nodos seleccionados, la información de la estructura arbórea resumen se podría mostrar también como en la Ilustración 4.
Ilustración 4
Palabras > Nombre > Según naturaleza > Entidad
Palabras > Nombre > Según naturaleza > Evento > Según acción > Acción
Palabras > Nombre > Según significado > Tiene relación También se puede añadir algún apodo a los nodos seleccionados, para utilizarlos en las búsquedas de forma más cómoda, como se muestra en la Ilustración 5. Ilustración 5
Figure imgf000009_0001
Otro aspecto opcional que se puede llevar a cabo tiene que ver con general' búsquedas a partir de la selección de instancias. Es decir, al seleccionar una instancia, se pueden seleccionar automáticamente las categorías a las que dicha instancia pertenece, y el usuario entonces puede tomar esas instancias como punto de partida para realizar búsquedas. VENTAJAS DE LA INVENCIÓN 1. Permite la fusión sencilla de categorizaciones basadas en diferentes criterios, de manera que el usuario puede comprender los efectos de la multi-categorización de manera sencilla. 2. Permite la realización sencilla de búsquedas sofisticadas, debido a que el usuario sólo tiene que seleccionar en el mismo control todas las categorías que desea y que luego tendrá que combinar de alguna manera para realizar la búsqueda. 3. Permite la realización de interfaces de usuario sencillas, pues permite realizar clasificaciones multicriterio con un único control informático tipo árbol.
4. Permite la realización flexible de bases de datos. Si se desea cambiar algo en los nodos del árbol, solo es necesario añadir más registros en la base de datos (para añadir los nuevos nodos) y alterar el valor del campo "Clasificación" para las instancias, y no es necesario alterar la estructura de la base de datos. 5. Permite la realización flexible de interfaces de usuario. Si se desea cambiar algo, como por ejemplo añadir o eliminar algún criterio, no es necesario alterar los programas de gestión de la estructura arbórea ni la interfaz de usuario, pues sólo hay que añadir más nodos al árbol. 6. Facilita la aplicación de sistemas de minería de datos, debido a que se pueden valorar diferentes categorías de manera independiente. Para el ejemplo de la Ilustración 1, se puede analizar la palabra ".escritor." desde el punto de vista de "Tiene Función" y de "Entidad".
Las búsquedas basadas en comandos tipo "LIKE" tal y como se ha mencionado son relativamente lentas, lo cual constituye una cierta desventaja. Sin embargo, los momentos en los momentos de creación de una base de datos, que es cuando la flexibilidad es más necesaria, suelen existir lógicamente menos registros, y por lo tanto esta desventaja es menor. Si se desea aumentar la velocidad de las búsquedas, se puede alterar la estructura de la base de datos añadiendo más campos para "Clasificación", de manera que se puedan disgregar las diferentes categorías en diferentes campos y se puedan realizar búsquedas más rápidas. En estas circunstancias, se pueden decidir que determinados campos alberguen las categorías que pueden cambiar menos, y crear uno o más campos para recoger los códigos concatenados relativos a las categorías que pueden cambial- más.
COMPARACIÓN CON OTROS TRABAJOS EXISTENTES EN EL ESTADO DE LA TÉCNICA Hasta donde se ha podido investigar, no existen propuestas como la de la invención, aunque existen propuestas que comparten ciertos rasgos. Las propuestas más similares son las siguientes:
Trabajos de lingüística sistémica. En esta escuela de investigación lingüística se realizan una gran cantidad de taxonomías sobre el lenguaje. Una muestra de trabajos se puede encontrar en [Benson et al 1988]. En la tradición de la lingüística sistémica, las entidades lingüísticas se categorizan con diagramas similares a los mostrados en la Figura 1, tomado de [Benson et al 1988, p.326]. En estos diagramas se puede observar que existen partes que corresponden a categorías, y partes que pueden asimilarse a lo que en esta invención se ha llamado criterios. Sin embargo, a pesar del largo tiempo en que se vienen utilizando diagramas de este tipo (al menos desde 1988, fecha de la referencia), y a pesar de que existen diversas herramientas informáticas para gestionar este tipo de diagramas, hasta donde se ha llegado a conocer no se han producido propuestas como las de la invención actual. Los diagramas que se utilizan tienen el formato de un gráfico de dos dimensiones, como en la Figura 1, que es mucho más difícil de utilizar que un control tipo árbol como el Microsoft TreeView. Por ejemplo, estos gráficos no tienen las posibilidades de selección de los controles tipo árbol, como abrir y cenar nodos. Además, se extienden de izquierda a derecha y de arriba abajo, con lo que complican excesivamente el manejo de la interfaz de usuario. Además, se precisan desarrollos informáticos especiales para este tipo de gráficos. Adiciona-mente, no existe una distinción clara entre criterios y categorías. No se ha podido encontrar ninguna propuesta donde se integre todo el diagrama en un control que se pueda utilizar de manera cómoda. Como contraste, la invención descrita en este documento puede realizarse de forma cómoda con un control árbol estándar, como el Microsoft Treeview®, o uniendo cadenas de texto en lenguaje HTML.
Clasificaciones donde aparecen aspectos mezclados. En estos trabajos, las clasificaciones tienen nodos que representan categorías, otros que podrían parecer criterios pero que realmente no lo son, y otros que representan otros aspectos. Las mayoría de los trabajos que se han encontrado corresponden a clasificaciones de aspectos mezclados. En estos uabajos, no existe un procedimiento de clasificación y búsqueda que facilite al usuario la utilización de la categorización. Los nodos de diferente tipo aparecen mezclados, con lo que genera cierta confusión al usuario. Una selección de algunos trabajos de este tipo es la siguiente: [Real Academia Española], [IBM 2000], [Microsoft]. [Amazon], [Barnes and Noble].
Por ejemplo, en [Real Academia Española] se puede observar una clasificación como la mostrada en la Ilustración 6. En este trabajo, se puede seleccionar cualquiera de las categorías existentes para explorar las instancias que dependen de dicha categoría. En este trabajo no existen realmente nodos que correspondan a lo que en la presente solicitud de patente se denomina "criterios". Aunque algunos nodos podrían parecer criterios de clasificación, realmente son categorías. Por ejemplo, el adjetivo ".alto." no aparece bajo el nodo-categoría "genero -> masculino", sino que este nodo-categoría está reservado a aquellos adjetivos que son únicamente masculinos, los cuales a su vez no aparecen en la categoría "adjetivo". El adjetivo ".altísimo." sólo aparece en "grados->superlativo" y el adjetivo ".encinta." sólo aparece en "genero- >femenino". Sin embargo, la palabra ".tanto." aparece en "adjetivo" y en "usos como adjetivo". Ilustración 6 adjetivos adjetivo .alto, .tanto, usos como adjetivo .tanto, genero masculino .alto, femenino .encinta. Invariable grados comparativo superlativo .altísimo, tipos anafórico calificativo demostrativo epíteto gentilicio indefinido posesivo adjetivos latinos locuciones adjetivas
En [Microsoft] se puede observar una clasificación como la mostrada en la Ilustración 7 (se han omitido muchos nodos para facilitar la exposición). En este caso, el árbol contiene una gran variedad de temas, organizados de la misma manera en que podrían haber aparecido en un libro que estuviera estructurado en capítulos y epígiafes, y sucede que algunas instancias aparecen en varios nodos, como por ejemplo el control "CheckBox Control". Sin embargo, no es una clasificación como la propuesta en esta invención debido, entre otras cosas, a que falta el concepto de nodo-criterio. Ilustración 7 MSDN Library Visual Studio 6.0 Welcome to the MSDN Library Visual Studio Documentation Visual Basic Documentation Using Visual Basic Reference Language Reference Objects .CheckBox Control. Properties Controls Reference Intrinsic Controls .CheckBox Control.
En [IBM 2000] se puede observar una clasificación como la mostrada en la Ilustración 8, que en [IBM 2000] se utiliza como ejemplo para presentar una invención relacionada con navegadores para clasificaciones. Ilustración 8 Aplicación Contabilidad .ABC-123. .XYZ-890. .Programación. .Mecanografía. Catalogo .Edición. Hoja de Calculo .ABC-123. .XYZ-890. .Procesado de Textos. Fabricante Compañía A .ABC- 123. Compañía B .XYZ-890.
Debido a que esta clasificación es únicamente un ejemplo limitado, resulta difícil conocer exactamente la intención de los autores del trabajo. Sin embargo, la interpretación más apropiada es que se trata de nuevo de una clasificación en la que se mezclan entidades diferentes, como en
[Microsoft], Las razones que explican esto son las siguientes: 1. La intención de los autores es únicamente mostrar una clasificación donde puedan aparecer caminos múltiples a una instancia sin necesidad de que sea debido a la existencia de criterios. Otra posible clasificación en este sentido podría haber sido una como la de la Ilustración 9, en la que el producto XXX podría aparecer en dos nodos diferentes, y que sin embargo no tendría relación con la invención actual. Las siguientes frases del trabajo señalan que la intención de los autores es esa: "introducir elementos que puedan ser subcategorías o productos de varias categorías diferentes" ("enter items that can be subcategories or producís of several different categories"), y "un usuario debería poder navegar a un par de gafas de sol siguiendo un camino a través de muchas categorías, como por ejemplo productos de playa, o productos deportivos o productos para el cuidado visual" ("a user should be able to navigate to a pair of sunglasses by following a path thorugh niany categories, such as beach wear, or sportswear of eye care"), donde la situación que está descrita en esta última fiase aparece representada en la Ilustración 10.
2. En todo momento se habla únicamente de categorías y de productos, y no se hace ninguna distinción enue los tipos de categorías, con lo cual queda claro que no aparece el concepto de criterio.
3. La clasificación presentada únicamente mezcla conceptos diferentes, como lo praeba el hecho de que existen ties nodos raíz, los cuales no dependen de un mismo nodo categoría, de forma similar a como [Microsoft] une conceptos diferentes. Si esta clasificación hubiera sido tomada de una situación real, probablemente existirían otros conceptos, como ocurre en [Microsoft]. Por ejemplo, tal y como se muesua en la Ilustración 11, podría haber productos como impresoras, dependiendo del nodo "Fabricante", que sin embargo no encajarían en la categoría "Aplicación".
4. La clasificación implementa herencia múltiple, como comentan los autores: "las subcategorías o productos heredan tanto la definición como cualquier valor de sus categorías" ("subcategories or product inherit both the definition and any assigned valúes -rom their categories") . En estas circunstancias, no se puede interpretar que los nodos "Aplicación", "Catalogo" y "Fabricante" sean criterios, sino que son nodo-categoría.
5. Dos nodos que podrían ser criterios, es decir "Aplicación" y "Catalogo" son padres de nodos que no son categorías, sino que aparentemente son productos (Programación, Mecanografía, Edición, Procesado de Textos).
6. Dado que los autores están patentando un navegador mejorado para utilizar clasificaciones, si hubieran tenido intención de reflejar los aspectos novedosos que se presentan en la invención del presente solicitud de patente los habrían mencionado, y sin embargo no lo hacen.
Ilustración 9
Aplicación Gestión de Datos .XXX. Simulación .XXX. Contabilidad .XXX.
Ilustración 10 Productos De Playa .gafas de sol. De Deporte .gafas de sol. Cuidado de los Ojos .gafas de sol.
Ilustración 11
Aplicación Contabilidad .ABC-123. .XYZ-890. .Programación. .Mecanografía. Catalogo .Edición. Hoja de Calculo .ABC-123. .XYZ-890. .Procesado de Textos.
Fabricante Compañía A .ABC-123. .Impresora UVW. Compañía B .XYZ-890.
Un último ejemplo de clasificaciones donde aparecen categorías mezcladas es [Barnes and Noble]. En algunos puntos, el sistema muestra fragmentos de árbol que tienen algunas similitudes con la presente invención, como el de la Ilustración 13. Sin embargo, esta propuesta realmente está lejos de la presente invención, pues de nuevo aparecen criterios y categorías mezclados y las propias categorías cambian según se avanza en la búsqueda. Por ejemplo, al inicio existen dos categorías diferentes "Negocios" e "Historia", y más adelante existe una categoría diferente llamada "Historia de Negocios". Para entender mejor la diferencia entre este sistema y lo que propone la presente solicitud de patente, la Ilustración 14 muestra una realización del sistema de búsqueda que habría sido similar a lo planteado por esta invención.
Ilustración 12
Ficción Ficción y literatura Novelas gráficas Horror Misterio y crii-αen
Otras formas de buscar Audiobooks Español Sale Recommended Large Print
Ilustración 13
Formatos Tapas duras Rústica Rústica especial Audio Letra grande
Ilustración 14 Según origen Ficción No Ficción Según contenido Suele ser ficción Horror Misterio y crimen Romance Suspense Suele ser no ficción Empresa Contabilidad Empresa y legislación comercial Historia empresarial África Gastronomía, cocina y vinos. Historia Según formato Papel Audio eBook
VALORACIÓN DE LA NOVEDAD Y NATURALEZA INVENTIVA DE LA INVENCIÓN La explicación contenida en las secciones anteriores muestra las ventajas de la invención. También ha mostrado ciertos trabajos existentes en el estado de la técnica que comparten ciertas características con la presente invención, pero sin llegar a ser igual a ésta. A pesar de que muchas de las características de la presente invención aparecen en otros trabajos, en ningún trabajo aparecen unidas todas esas características. Cada uno de los sistemas de clasificación que se han presentado tienen ciertos problemas de realización que la presente invención resuelve mediante la unión de todas esas características y la adición de alguna más. Los trabajos presentados tienen cierta antigüedad. [Benson et al 1988] es de 1988.
[Microsoft] es anterior a 2000. [Real Academia Española] es anterior a 2002. La patente [IBM
2000] fue presentada en 1996. El hecho de que haya pasado tanto tiempo sin que haya aparecido una propuesta como la de la presente invención refuerza aún más la naturaleza inventiva de ésta.
DESCRIPCIÓN DE LOS DIBUJOS
La Figura 1 muestra un gráfico típico utilizado en los trabajos de lingüística sistéinica. La Figura 2 muestra un esquema de bloques de la realización preferida. La Figura 3 muestra un ejemplo esquemático del aspecto que tendría la realización preferida para un fragmento de clasificación,
La Figura 4 muesua un esquema de bloques de una realización alternativa.
EXPOSICIÓN DE UN MODO DE REALIZACIÓN DE LA INVENCIÓN
DESCRIPCIÓN DE LA REALIZACIÓN PREFERIDA En la realización preferida, la invención se construye con un sistema computerizado. que puede estar basado, por ejemplo, en el ordenador personal Dell® Dimensión XPS®, al que se le añade además un ratón y un teclado para que el usuario interactúe con el sistema. En el sistema computerizado existe un sistema operativo que puede ser, por ejemplo, Microsoft® Windows
2000®. La Figura 2 muestra un esquema de bloques de la realización preferida, en la que se observan una pantalla 2001 para observar el comportamiento de la invención; una unidad de procesamiento 2002 que produce la funcionalidad de la invención; unos medios de interacción 2003, que podrían ser por ejemplo un ratón, un teclado, un lápiz óptico u otros medios; y unos datos 2004 que contienen las categorías, criterios e instancias que están siendo clasificadas por la invención. Además, la invención utiliza un control informático tipo árbol, como por ejemplo el control Microsoft TreeView®. La Figura 3 muestra esquemáticamente cómo se podría realizar una estructura arbórea según la invención actual para un fragmento de la clasificación de la Ilustración 1.
En la realización preferida, se utilizan los siguientes medios para distinguir los nodos criterio de los demás nodos.
1. Icono tipo carpeta, pero con una marca en el centro
2. Texto del nodo comenzando con "Según..."
3. Texto de color rojo (que para no introducir colores en las figuras, aparece mostrado en letra subrayada en la Figura 2)
La invención se utüiza para realizar búsquedas sobre un conjunto de instancias categorizadas. Para ello, es necesario primeramente haber categorizado dichas instancias, es decir, haber asignado las categorías a las que las instancias pertenecen dentro de los diferentes criterios. En la realización preferida se utilizan dos procedimientos especiales para facilitar la categorización de instancias. Para ello se introduce el concepto de DOMINIO. Un dominio es un conjunto de criterios hermanos que incluye todos los hermanos de dichos criterios. En estas circunstancias, si una instancia dada pertenece a una categoría de uno de los criterios, también debe pertenecer a alguna categoría de cada uno de los demás criterios del dominio. Por ejemplo, en la Ilustración 1, los nodos que dependen de "Nombre>Segήn naturaleza>Evento" forman un dominio (se trata de los nodos "Según duración" y "Según acción". Si una instancia tiene la categoría "Evento", quiere decir que también debe tener alguna de las categorías que dependen de ella, con lo cual debe tener además al menos una categoría de cada uno de los criterios pertenecientes a este dominio ("Según Duración" y "Según Acción"). En estas circunstancias, un criterio incompleto es aquel para el que no se ha seleccionado ninguna categoría, a pesar de que se debería haber seleccionado al menos una. Un criterio completo es aquel para el que se ha seleccionado el número mínimo de categorías. Un criterio neutro es aquel para el que no es necesario seleccionar ninguna categoría, y para el que efectivamente no existe ninguna categoría seleccionada. Por ejemplo, en la Ilustración 1, si se está categorizando "martillo" y se ha seleccionado la categoría "Según naturaleza>entidad", se debe seleccionar también una categoría perteneciente al criterio "Según significado", pues pertenecen al mismo dominio. Sin embargo, no es necesario seleccionar ninguna categoría de los criterios "Según duración" o "Según acción". Sin embargo, si se ha seleccionado la categoría "Según naturaleza>evento>Según duración>Puntual". es necesario seleccionar alguna categoría perteneciente al criterio "Según acción", pues pertenecen al mismo dominio.
El procedimiento para realizar la categorización de instancias comprende los siguientes pasos: 1. Seleccionar la instancia que se va a categorizar
2. Seleccionar un conjunto de nodos categoría del árbol, para indicar a qué categorías debe pertenecer dicha instancia
3. Identificar los criterios completos, incompletos y neutros (este paso lo llevaría a cabo la invención). 4. Marcar con medios gráficos los criterios completos, los incompletos, y los neutros, (este paso también lo lleva a cabo la invención) de manera que el usuario pueda evaluar la selección actual. En la realización preferida, los criterios completos se marcan con color de fondo verde, los criterios incompletos con color de fondo rojo (y color de texto blanco) y los criterios neutros se dejan como estaban. El procedimiento para realizar búsquedas se lleva a cabo como se explica a continuación. El usuario debe seleccionar un conjunto de categorías, y la invención buscará las instancias que correspondan a dichas categorías. En este caso, se pueden dejar criterios incompletos. Si se deja un criterio incompleto, como por ejemplo puede ser "Según naturaleza". el sistema no utilizará las categorías de dicho criterio para restringir la búsqueda. Normalmente se seleccionará más de una categoría. En estas circunstancias, será preciso especificar las relaciones booleanas implicadas, a no ser que estén definidas de manera implícita. Por ejemplo, en la Ilustración 14, si el usuario selecciona "Horror" y "Suspense", será necesario especificar si desea "Horror" y "Suspense", "Horror" o "Suspense" u otra combinación booleana.
En la realización preferida, existe una única base de datos para cada tipo de objeto (por ejemplo, una base de datos para palabras, una base de datos para libros etc), y en cada base de datos existen dos tablas. En una tabla se almacenan las instancias y en la otra tabla se almacenan las categorías y los criterios. En ambas tablas, el sistema de base de datos asigna códigos numéricos correlativos a las entidades que se crean (sean instancias, categorías, o criterios). Para crear las clasificaciones de las instancias, se utilizan guiones alrededor de los códigos de las categorías a las que la instancia pertenece, como por ejemplo en "-1 -23-22-"
DESCRIPCIÓN DE OTRAS REALIZACIONES Se pueden llevar a cabo otras realizaciones con otra elección de componentes para el sistema computerizado, como puede ser otro ordenador, otro control informático tipo árbol, otro sistema operativo u otro elemento en general. Hasta aquí, se ha supuesto que se utilizaban tres tipos de nodos (nodos-criterio, nodos- categoría y nodos-instancia). En otras realizaciones puede haber más tipos de nodos. Por ejemplo se puede introducir un nodo-superjerarquía que incluya ciertas propiedades para las características que dependan de él. La Figura 4 muestra otra posible realización de la invención, que comprende una unidad de procesamiento 4001 que ejecuta un programa con capacidad de organizar entidades de la manera expücada en esta invención. Este sería el caso, por ejemplo, de una empresa dando un servicio de acceso a datos a través de Internet, al cual accederían los usuarios remotamente a través de ordenadores personales. En esta realización, la invención puede ser utilizada a través de un sistema computerizado independiente 4002 al que está unida por un sistema de telecomunicación 4003.
A su vez, los datos que gestiona la unidad 4001 pueden estar integrados junto con la unidad 4001 o pueden estar dispersos, como por ejemplo serían los datos 4005, 4006, 4007, 4008, a los que se uniría la unidad 4001 mediante un sistema de telecomunicación 4004.
En general, las estructuras arbóreas más eficaces son las estructuras tipo torre, las cuales se caracterizan porque los diferentes nodos están colocados uno sobre los otros, y se distinguen fundamentalmente por el nivel de indentación. Las Ilustraciones mostradas en este documento y el control Microsoft Treeview® son ejemplos de estructuras tipo tone. Estas estructuras son mucho más cómodas que las utilizadas por ejemplo en lingüística sistémica, como la mostrada en la Figura 1. Además de las realizaciones que se basan en controles como el Microsoft Treeview®, también se pueden crear estructuras arbóreas utilizando controles de texto, y colocándolos unos sobre los otros, y aplicando diferentes niveles de indentación a unos y a otros. Un ejemplo de estas estructuras son las creadas en las páginas de Internet con lenguaje HTML, y sería similar a las estructuras mostradas en las Ilustraciones de este documento. En otras realizaciones se pueden crear estructuras arbóreas que no tengan añadida la funcionalidad para expandir y contraer nodos, sino que estén permanentemente abiertos. En este caso, la principal ventaja de la invención es la separación entre criterios y categorías y los procedimientos de gestión de búsquedas y de categorizaciones. También se puede realizar la invención con otros diseños de estructuras arbóreas. Uno de estos diseños se muestra en la Ilustración 15. En esta estructura arbórea, los nodos criterios no están a un nivel superior al de las categorías que dominan de manera directa, sino que simplemente se diferencian en el texto y en el formato pero tienen el mismo nivel de indentación. Este diseño de estructura arbórea facilita la relación de unas categorías con sus categorías padre, como por ejemplo se puede ver al inspeccionar "Nombre" y "Entidad", donde queda claro que "Entidad" es una categoría dependiente dilectamente de "Nombre". En esta estructura arbórea, un criterio se puede expandir o contraer, y daría como resultado que las categorías que dependen de él aparecerían o desaparecerían sin que el propio nodo criterio apareciera o desapareciera. Por ejemplo, si se contrae el criterio "Según naturaleza" el resultado sería el mostrado en la Ilustración 16.
Ilustración 15 Palabras Nombre Según naturaleza Entidad .martillo. .hermano, .escritor, .cereza. Atributo .altura. .honradez. Evento Según duración Puntual .llegada. Durativo .concierto, .tormenta. Según acción Acción .concierto, .llegada. No acción .tormenta. Otros .metro, .campo. Según significado Tiene uso .martillo. Tiene función .escritor. Tiene relación .hermano. Otros .altura. Verbo Adjetivo Adverbio Clase Cerrada
Ilustración 16 Palabras Nombre Según naturaleza Según significado Tiene uso .martillo. Tiene función .escritor. Tiene relación .hermano. Otros .altura. Verbo Adjetivo Adverbio Clase Cenada

Claims

REIVINDICACIONES
1. Sistema computerizado de clasificación, caracterizado porque comprende los siguientes medios: - medios para organizar entidades de diferentes tipos, - medios para organizar en forma de árbol algunas o todas de dichas entidades, con relaciones padre-hijo, de manera que dichas entidades se corresponden con los nodos de dicho árbol, donde no es necesario que exista una representación gráfica de dicho árbol, - medios para gestionar, al menos, entidades categoría y entidades criterio, y opcionalmente también entidades instancia, donde se cumple que: - dichas entidades instancia pueden corresponder a objetos, conceptos, eventos, características, ideas u otro tipo de entidad de cualquier ámbito de la realidad, - dichas entidades categoría tienen como funcionalidad establecer diferentes grupos de pertenencia a los que se pueden adscribir dichas entidades instancia, - dichas entidades criterio tienen como funcionalidad establecer diferentes criterios de clasificación, a partir de los cuales se pueden generar diferentes entidades categoría, donde dicho sistema puede ser de varios tipos, como por ejemplo uno de los siguientes tipos: - un sistema computerizado independiente que comprende pantalla y otros medios, - un sistema computerizado que puede carecer de pantalla pero que comprende medios de telecomunicaciones para que el usuario de la invención pueda conectarse con dicho sistema, de manera que dicho usuario podría para dicha conexión utilizar por ejemplo un segundo sistema computerizado dotado de pantalla, - un sistema de otro tipo que tenga otras características.
2. Sistema según la reivindicación 1, caracterizado porque comprende además medios para mostrar una estructura arbórea que represente a dicho árbol, donde pueden existir diferentes maneras de realizar dicha estructura arbórea, donde es posible que todas las entidades instancia, o sólo una parte de ellas, o ninguna de ellas aparezcan en dicha estructura arbórea, y donde se cumple que: - las entidades instancia que aparezcan en dicha estructura arbórea pueden estar representadas como pertenecientes a todas las entidades categoría a las que pertenecen o sólo en alguna o algunas de ellas, - en dicha estructura arbórea, las entidades criterio y las entidades categoría pueden alternarse, de manera que una entidad criterio puede ser padre de una entidad categoría y viceversa, y una entidad criterio puede ser padre de otras entidades criterio.
3. Sistema según la reivindicación 2, caracterizado porque comprende además medios para abrir y cenar los nodos de dicha estructura arbórea.
4. Sistema según la reivindicación 2, caracterizado porque comprende además medios para resaltar en dicha estructura alborea las entidades criterio frente al resto de las entidades, donde dichos medios pueden ser por ejemplo un texto especial, un tipo de letra especial, un formato de letra especial u otro medio.
5. Sistema según la reivindicación 2, caracterizado porque comprende además medios para mostrar una estructura arbórea resumen para las selecciones que se hayan realizado en la estructura arbórea principal.
6. Sistema según la reivindicación 2, caracterizado porque una de dichas maneras diferentes de realizar dicha estructura arbórea es una estructura arbórea en la cual las entidades categoría que dependen de una entidad criterio tienen un nivel de indentación mayor nivel que el nivel de indentación de dicha entidad criterio.
7. Sistema según la reivindicación 2, caracterizado porque una de dichas maneras diferentes de realizar dicha estructura arbórea es una estructura arbórea en la cual las entidades categoría que dependen de una entidad criterio tienen el mismo nivel de indentación que dicha entidad criterio, y dicho sistema puede opcionalmente comprender medios para ocultar dichas entidades categoría sin ocultar dicha entidad criterio.
8. Sistema según la reivindicación 2, caracterizado porque comprende además medios para modificar dicho árbol — como por ejemplo para añadir o eliminar entidades — sin que sea necesario alterar el número de controles existentes en la interfaz gráfica donde se muestra dicha estructura arbórea, de manera el único cambio que es preciso introducir es modificar el conjunto de nodos que existen en dicha estructura arbórea.
9. Sistema según la reivindicación 2, caracterizado porque comprende además medios para categorizar entidades instancia de manera que el usuario añade una entidad instancia en diferentes posiciones de dicha estructura arbórea y dicho sistema crea una clasificación para dicha entidad instancia que refleja las entidades categoría que aparecen como nodos padre de dicha entidad instancia.
10. Sistema según la reivindicación 1, caracterizado porque comprende además medios para modificar dicho árbol — como por ejemplo para añadir o eliminar entidades — sin que sea necesario alterar el sistema informático en el que se gestiona dicho árbol, de manera que el único cambio que es preciso introducir es modificar el número de registros existentes en las bases de datos donde se almacenan las entidades.
11. Sistema según la reivindicación 1, caracterizado porque comprende además medios para identificar las entidades criterio que son completas, incompletas y nulas, de manera que el usuario puede valorar si existen demasiadas entidades categoría seleccionadas o demasiado pocas para realizar una categorización conecta de una o más entidades instancia.
12. Sistema según la reivindicación 1, caracterizado porque comprende además medios para realizar búsquedas de entidades instancia, de manera que las cadenas de búsqueda se construyen a partir de una o más entidades categoría o entidades instancia que han sido seleccionadas.
13. Sistema según la reivindicación 1, caracterizado porque comprende además medios para clasificar entidades instancia utilizando determinadas cadenas de clasificación, donde se cumple que - dichas cadenas de clasificación son cadenas de caracteres, - dichas cadenas de clasificación se caracterizan por ser una concatenación de los códigos asignados a dichas entidades instancia, donde dichos códigos pueden ser de varios tipos, como por ejemplo, ~ códigos de las entidades categoría a las que cada entidad instancia está asignada, ~ códigos de las entidades criterio a las que pertenecen dichas entidades categoría, ~ otros tipos de códigos. - dichas cadenas de clasificación comprenden caracteres separadores especiales que permiten distinguir donde empieza y dónde termina cada uno de dichos códigos, de manera que se evita confusión entre caracteres iguales que pudieran existir en diferentes códigos, y donde existen medios para almacenar dichas cadenas de clasificación en una base de datos, de manera que se pueden almacenar en un único campo o en varios campos de manera fraccionada, y donde dicha base de datos puede ser una base de datos relacional u otro tipo de base de datos.
14. Sistema según la reivindicación 1% caracterizado porque comprende además medios para buscar entidades instancia utilizando para ello dichas cadenas de clasificación, donde dicha búsqueda se basa en encontrar las instancias en cuyas cadenas de clasificación existan determinados conjuntos de caracteres, para lo cual dichos medios pueden utilizar mecanismos como la expresión "LIKE" de SQL (Structured Query Language) u otros mecanismos similares.
15. Procedimiento computerizado de clasificación de entidades de diferentes tipos, caracterizado porque comprende los siguientes pasos: - añadir a la clasificación entidades categoría y entidades criterio y, opcionalmente añadir también entidades instancia, donde ~ dichas entidades instancia pueden conesponder a objetos, conceptos, eventos, características, ideas u otro tipo de entidad de cualquier ámbito de la realidad, ~ dichas entidades categoría tienen como funcionalidad establecer diferentes grupos de pertenencia a los que se pueden adscribir dichas entidades instancia, ~ dichas entidades criterio tienen como funcionalidad establecer diferentes criterios de clasificación, a partir de los cuales se pueden generar diferentes entidades categoría, - organizar algunas o todas de dichas entidades en forma de árbol, con relaciones padre- hijo, de manera que dichas entidades se corresponden con los nodos de dicho árbol, donde no es necesario que exista una representación gráfica de dicho árbol, donde dicho procedimiento se basa en un sistema computerizado que puede ser de varios tipos, como por ejemplo uno de los siguientes tipos: - un sistema computerizado independiente dotado de pantalla y otros medios, - un sistema computerizado que puede carecer de pantalla pero que comprende medios de telecomunicaciones para que el usuario de la invención pueda conectarse con dicho sistema, de manera que dicho usuario podría para dicha conexión utilizar por ejemplo un segundo sistema computerizado dotado de pantalla, - un sistema de otro tipo que tenga otras características.
16. Procedimiento según la reivindicación 15, caracterizado porque dicho procedimiento comprenda además el- paso de mostrar una estructura arbórea que represente a dicho árbol, donde pueden existir diferentes maneras de realizar dicha estructura arbórea, donde es posible que todas las entidades instancia, o sólo una parte de ellas, o ninguna de ellas aparezcan en dicha estructura arbórea, y donde se cumple que: - las entidades instancia que aparezcan en dicha estructura arbórea pueden estar representa3as como pertenecientes a todas las entidades categoría a las que pertenecen o sólo en alguna o algunas de ellas, - en dicha estructura arbórea, las entidades criterio y las entidades categoría pueden alternarse, de manera que una entidad criterio puede ser padre de una entidad categoría y viceversa, y una entidad criterio puede ser padre de otras entidades criterio.
17. Procedimiento según la reivindicación 16, caracterizado porque comprende además el paso de abrir y cenar nodos de dicha estructura arbórea.
18. Procedimiento según la reivindicación 16, caracterizado porque comprende además el paso de resaltar en dicha estructura arbórea dichas entidades criterio frente al resto de las entidades por algún medio, como puede ser un texto especial, un tipo de letra especial, un formato de letra especial u otro medio.
19. Procedimiento según la reivindicación 16, caracterizado porque comprende además el paso de mostrar una estructura arbórea resumen para las selecciones que se hayan realizado en la estructura arbórea principal.
20. Procedimiento según la reivindicación 16, caracterizado porque una de dichas maneras diferentes de realizar dicha estructura arbórea es una estructura arbórea en la cual las entidades categoría que dependen de una entidad criterio tienen un nivel de indentaciόn mayor nivel que el nivel de indentación de dicha entidad criterio.
21. Procedimiento según la reivindicación 16, caracterizado porque una de dichas maneras diferentes de realizar dicha estructura arbórea es una estructura arbórea en la cual las entidades categoría que dependen de una entidad criterio tienen el mismo nivel de indentación -que dicha entidad criterio, y dicho -sistema -puede opcionalmente comprender medios para ocultar dichas entidades categoría sin ocultar dicha entidad criterio.
22. Procedimiento según la reivindicación 16, caracterizado porque comprende además el paso de modificar dicho árbol — como por-ejemplo para añadir o eliminar-- entidades — sin-alterar-el número de controles existentes en la interfaz gráfica donde se muestra dicha estructura arbórea, de manera el único cambio que es preciso introducir es modificar el conjunto de nodos que-existen en dicha- estructura arbórea.
23. Procedimiento según la reivindicación 16, caracterizado porque comprende además el paso de categorizar entidades instancia de manera que el usuario añade una entidad instancia en diferentes posiciones de dicha estructura arbórea y dicho -sistema crea-una clasificación para dicha entidad instancia que refleja las entidades categoría que aparecen como nodos padre de dicha entidad instancia
24. Procedimiento según la reivindicación 15. caracterizado porque comprende además el paso de modificar dicho árbol— como por-ejemplo para añadir o eliminar entidades — sin alterar-el sistema informático en el que se gestiona dicho árbol, de manera que el único cambio que es preciso introducir es modificar el número de registros existentes en las bases de datos donde se-almacenan-las entidades.
25. Procedimiento según la reivindicación 15, caracterizado porque comprende además el paso de categorizar entidades instancia, donde dicho paso comprende los siguientes subpasos: - seleccionar diferentes entidades categoría, - identificar automáticamente las entidades criterio que son completas, incompletas y nulas, de manera que el usuario puede valorar si existen demasiadas entidades categoría seleccionadas o demasiado pocas.
26. Procedimiento según la reivindicación 15, caracterizado porque comprende además el paso de realizar búsquedas de entidades instancia, de manera que las cadenas de búsqueda se construyen a partir de una o más entidades categoría o entidades instancia que han sido seleccionadas.
27. Procedimiento según la reivindicación 15, caracterizado porque comprende además el paso clasificar- dichas entidades instancia utilizando determinadas cadenas de clasificación, donde se cumple que: - dichas cadenas de clasificación son cadenas de caracteres-, - dichas cadenas de clasificación se caracterizan por ser una concatenación de los códigos asignados a dichas entidades instancia, donde dichos códigos pueden ser de varios tipos, como por ejemplo, ~ códigos de las entidades categoría a las que cada entidad instancia está asignada, ~ códigos de las entidades criterio a las que pertenecen dichas entidades categoría, - OÜΌS tipos- de códigos; - dichas cadenas de clasificación comprenden caracteres separadores especiales que permiten distinguir donde empieza y dónde termina cada uno de dichos códigos, de manera que se evita confusión entre caracteres iguales que pudieran existir en- diferentes códigos, y donde dichas cadenas de clasificación pueden estar almacenadas en una base de datos, de manera que se pueden almacenar en un único campo o en varios Gampos de manera fraccionada, y donde dicha base de datos puede ser una base de datos relacional u otro tipo de base- de datos. -
28. Sistema según la reivindicación 27, caracterizado porque comprende además el paso de buscar entidades instancia utilizando para ello dichas cadenas de clasificación, donde dicha búsqueda se basa en encontrar las instancias en cuyas cadenas de clasificación existan detemiinados conjuntos de caracteres, para lo cual dichos medios pueden utilizar mecanismos como la expresión "LIKE" de SQL (Structured Query Language) u otios mecanismos similares.
29. Un programa de ordenador caracterizado porque permite realizar el sistema de una o más de las reivindicaciones 1 a-14,-
30. Un programa de ordenador caracterizado porque permite realizar el procedimiento de una o más-de las-reivindicaciones- 1-5 a-28.
31. Un soporte leíble por algún medio caracterizado porque contiene alguno de los programas de ordenador-mencionados en las reivindicaciones 29 a 30.-
PCT/ES2005/000165 2004-03-30 2005-03-29 Sistema y programa para clasificar categorizaciones complejas WO2005094158A2 (es)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007510050A JP2008547065A (ja) 2004-03-30 2005-03-29 複雑なカテゴリー化のための分類ツール
US10/599,384 US20070150519A1 (en) 2004-03-30 2005-03-29 Organiser for complex categorisations

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ESP200400776 2004-03-30
ES200400776 2004-03-30

Publications (2)

Publication Number Publication Date
WO2005094158A2 true WO2005094158A2 (es) 2005-10-13
WO2005094158A3 WO2005094158A3 (es) 2005-11-10

Family

ID=35064172

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/ES2005/000165 WO2005094158A2 (es) 2004-03-30 2005-03-29 Sistema y programa para clasificar categorizaciones complejas

Country Status (3)

Country Link
US (1) US20070150519A1 (es)
JP (1) JP2008547065A (es)
WO (1) WO2005094158A2 (es)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8452790B1 (en) * 2008-06-13 2013-05-28 Ustringer LLC Method and apparatus for distributing content
US9367609B1 (en) 2010-03-05 2016-06-14 Ustringer LLC Method and apparatus for submitting, organizing, and searching for content
KR101139238B1 (ko) * 2011-06-20 2012-05-14 유택상 아이디어 창출 지원 방법 및 시스템
CN103049444B (zh) 2011-10-12 2016-09-28 阿里巴巴集团控股有限公司 一种数据信息分类结构的存储方法和系统
US20140280042A1 (en) * 2013-03-13 2014-09-18 Sap Ag Query processing system including data classification

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5696916A (en) * 1985-03-27 1997-12-09 Hitachi, Ltd. Information storage and retrieval system and display method therefor
US6055515A (en) * 1996-07-30 2000-04-25 International Business Machines Corporation Enhanced tree control system for navigating lattices data structures and displaying configurable lattice-node labels
WO2001079964A2 (en) * 2000-04-14 2001-10-25 Realnetworks, Inc. System and method of managing metadata
US20020107893A1 (en) * 2001-02-02 2002-08-08 Hitachi, Ltd. Method and system for displaying data with tree structure

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5838965A (en) * 1994-11-10 1998-11-17 Cadis, Inc. Object oriented database management system
US6112201A (en) * 1995-08-29 2000-08-29 Oracle Corporation Virtual bookshelf
US5953724A (en) * 1997-11-24 1999-09-14 Lowry Software, Incorporated Global database library data structure for hierarchical graphical listing computer software
US6397221B1 (en) * 1998-09-12 2002-05-28 International Business Machines Corp. Method for creating and maintaining a frame-based hierarchically organized databases with tabularly organized data
US6868525B1 (en) * 2000-02-01 2005-03-15 Alberti Anemometer Llc Computer graphic display visualization system and method
US8396859B2 (en) * 2000-06-26 2013-03-12 Oracle International Corporation Subject matter context search engine
US6834282B1 (en) * 2001-06-18 2004-12-21 Trilogy Development Group, Inc. Logical and constraint based browse hierarchy with propagation features
US7324447B1 (en) * 2002-09-30 2008-01-29 Packeteer, Inc. Methods, apparatuses and systems facilitating concurrent classification and control of tunneled and non-tunneled network traffic
JP2004177996A (ja) * 2002-11-22 2004-06-24 Toshiba Corp 階層型データベース装置及び階層型データベースの構築方法
CA2536179A1 (en) * 2003-08-27 2005-03-10 Sox Limited Method of building persistent polyhierarchical classifications based on polyhierarchies of classification criteria

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5696916A (en) * 1985-03-27 1997-12-09 Hitachi, Ltd. Information storage and retrieval system and display method therefor
US6055515A (en) * 1996-07-30 2000-04-25 International Business Machines Corporation Enhanced tree control system for navigating lattices data structures and displaying configurable lattice-node labels
WO2001079964A2 (en) * 2000-04-14 2001-10-25 Realnetworks, Inc. System and method of managing metadata
US20020107893A1 (en) * 2001-02-02 2002-08-08 Hitachi, Ltd. Method and system for displaying data with tree structure

Also Published As

Publication number Publication date
JP2008547065A (ja) 2008-12-25
US20070150519A1 (en) 2007-06-28
WO2005094158A3 (es) 2005-11-10

Similar Documents

Publication Publication Date Title
Martin Meaning matters: A short history of systemic functional linguistics
US6658406B1 (en) Method for selecting terms from vocabularies in a category-based system
US7383503B2 (en) Filtering a collection of items
Bateman et al. Multimodality and empiricism
US6816175B1 (en) Orthogonal browsing in object hierarchies
Fluit et al. Ontology-based information visualization: toward semantic web applications
US20150026159A1 (en) Digital Resource Set Integration Methods, Interfaces and Outputs
Piasecki et al. WordNetLoom: a WordNet development system integrating form-based and graph-based perspectives
WO2005094158A2 (es) Sistema y programa para clasificar categorizaciones complejas
Hlava The Taxobook: History, Theories, and Concepts of Knowledge Organization, Part 1 of a Part-3 Series
US9002851B2 (en) Accessing stored electronic resources
Ridi Hypertext
Collins Docuburst: Document content visualization using language structure
Mírovský Netgraph: A tool for searching in prague dependency treebank 2.0
Herrero-Solana et al. Bibliographic displays of Web-based OPACs: Multivariate analysis applied to Latin-American catalogues
Mastrodomenico The Python Book
Sciore Understanding Oracle APEX 5 Application Development
Piasecki et al. WordnetLoom: a graph-based visual wordnet development framework
Nualart et al. Texty, a visualization tool to aid selection of texts from search outputs
Revere et al. Transhierarchy: A stable tree view with transclusion for hypertext navigation
Gayoso-Cabada et al. Learning object repositories with dynamically reconfigurable metadata schemata
Crofts Museum informatics: the challenge of integration
Tyrkkö Network graphs to the rescue, or how to visualise distributions and networks in corpora and language
Weiner Modelling Lexical Structures in the Oxford English Dictionary
Limeback Simply SQL: The Fun and Easy Way to Learn Best-Practice SQL

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

WWE Wipo information: entry into national phase

Ref document number: 2007150519

Country of ref document: US

Ref document number: 10599384

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2007510050

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

WWW Wipo information: withdrawn in national office

Country of ref document: DE

WWE Wipo information: entry into national phase

Ref document number: 2005729483

Country of ref document: EP

WWW Wipo information: withdrawn in national office

Ref document number: 2005729483

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 10599384

Country of ref document: US

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: COMMUNICATION UNDER RULE 69 EPC ( EPO FORM 1205A DATED 21/05/07 )

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 05729483

Country of ref document: EP

Kind code of ref document: A2

122 Ep: pct application non-entry in european phase

Ref document number: 05729483

Country of ref document: EP

Kind code of ref document: A2

WWW Wipo information: withdrawn in national office

Ref document number: 5729483

Country of ref document: EP