WO2007085304A1 - System zur automatisierten generierung von datenbankstrukturen und/oder datenbanken und entsprechendes verfahren - Google Patents

System zur automatisierten generierung von datenbankstrukturen und/oder datenbanken und entsprechendes verfahren Download PDF

Info

Publication number
WO2007085304A1
WO2007085304A1 PCT/EP2006/061175 EP2006061175W WO2007085304A1 WO 2007085304 A1 WO2007085304 A1 WO 2007085304A1 EP 2006061175 W EP2006061175 W EP 2006061175W WO 2007085304 A1 WO2007085304 A1 WO 2007085304A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
user
database
elements
user profile
Prior art date
Application number
PCT/EP2006/061175
Other languages
English (en)
French (fr)
Inventor
Adam Neal Boucher
Original Assignee
Swiss Reinsurance Company
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Swiss Reinsurance Company filed Critical Swiss Reinsurance Company
Publication of WO2007085304A1 publication Critical patent/WO2007085304A1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2423Interactive query statement specification based on a database schema

Definitions

  • the invention relates to a system and method for the automated generation of database structures and / or databases, wherein unstructured data and / or data records are acquired and assigned to one another by means of a central unit based on the database structure and wherein the central unit comprises means for selecting the data of the database based on user information ,
  • the system relates to database structures that are generated based on metadata.
  • the computer and communication systems thereby data, or more generally multimedia data over networks, such as. a LAN (Local Area Network), a WAN (Wide Area Network) or the Internet via e.g. the public switched telephone network (PSTN) or a public land mobile network (PLMN), e.g. GSM (Global System for Mobile Communication) or UMTS (Universal Mobile Telephone System) networks, etc. to select, obtain or transmit.
  • networks such as. a LAN (Local Area Network), a WAN (Wide Area Network) or the Internet via e.g. the public switched telephone network (PSTN) or a public land mobile network (PLMN), e.g. GSM (Global System for Mobile Communication) or UMTS (Universal Mobile Telephone System) networks, etc. to select, obtain or transmit.
  • PSTN public switched telephone network
  • PLMN public land mobile network
  • GSM Global System for Mobile Communication
  • UMTS Universal Mobile Telephone System
  • multimedia data i.a. digital data such as text, graphics, images, animations, video, quicktime and sound recordings.
  • MPx MP3
  • MPEGx MPEG7
  • EflSATZBWm (RiGEL26) Efforts by industry to develop and develop new databases have barely kept pace with rising demand. In recent years, the fast growing popularity of services such as the Internet has contributed to the demand for data "on demand”. Higher user numbers with individualized requirements and ever larger amounts of data are thus the triggers for the usual data structures and storage options repeatedly reaching their performance limits. In addition, the cost of developing fast customizable and powerful databases is still too high compared to the benefit achieved thereby.
  • One of the disadvantages of designing customized high-speed and memory-efficient databases is that it is time consuming and relatively expensive.
  • a database is an electronic archive for the structured and / or memory-saving and / or access-speed-optimized storage of large amounts of content-related or structurally related data from which data can be retrieved.
  • a database system comprises the database consisting of the primary data, a database description and several database programs.
  • the known databases have the disadvantage that they are often not executable by read-only media such as CD-ROM, DVD-ROM and Internet. Furthermore, it is disadvantageous that the known databases usually have no or only a very slow full-text search function, which may be based on different technical problems. Furthermore, the known databases have speed or even stability problems if they contain data sets of different structure and / or lengths. They are therefore only of limited use for the use of data sets which have different structure and / or lengths.
  • the full-text database systems have the disadvantage that they require a lot of memory and fast
  • ERSATZBU7T (RULE 26) Processors need to be able to run fast. These full-text database systems dynamically create full-text indexes in real-time to ensure database searchability. For large amounts of data, this is a very time-consuming process that adversely affects the processing time of search queries. Frequently, as mentioned, individually adapted databases (size, structure, etc.) can also have great advantages.
  • the databases of the prior art are usually static in this sense and adaptable only with great time, staff and cost. Thus, the prior art databases also have the problem that they often also include unnecessary and / or unusable information for the corresponding user, which increases the amount of information stored in the database. This has the disadvantage that such databases are also poorly suited for mobile use in mobile terminals with mostly limited storage capacity and / or network interface capacity. Likewise, such databases are often also for the reasons mentioned above, little for mobile storage media, such as CD-ROM or DVD-ROM.
  • the database structure and / or database should be dynamically and individually generatable and / or adaptable by means of the device. Likewise, they should be dynamically adaptable to media such as CD-ROMs, DVD-ROMs or individualized and if necessary be segmented accordingly.
  • ERSAT2BU7T (REG 26)
  • the central unit is based on means for selecting the data of the database user information
  • the central unit comprises a query generation module, wherein by means of user-selectable elements of the query generation module a personalized query form for the search of corresponding data can be generated and / or modified
  • the system comprises an extraction module, wherein the database structure is dynamically generated by means of the extraction module based on the elements of the personalized query form and at least partially by automatic analysis of the unstructured data and / or data records and the unstructured data and / or the data records associated with the database structure can be stored in a memory unit of the system.
  • the central unit can comprise, for example, means for selecting data of the database based on the elements of the query mask and / or a user profile, which data can be transmitted to a communication device of a user by means of a communication module of the central unit.
  • the user profile may include, for example, user-specific data on network properties and / or data on hardware properties of the user's communication device and / or user behavior data.
  • the invention has the advantages, inter alia, that a speed and storage-efficient management of data volumes in the database can be ensured.
  • the database structure and / or database can be dynamically and individually generated and / or adapted by means of the device.
  • the database can be dynamically adapted to media such as CD-ROM, DVD-ROM or individualized and, if necessary, generated correspondingly segmented.
  • media such as CD-ROM, DVD-ROM or individualized and, if necessary, generated correspondingly segmented.
  • this has the advantage, inter alia, that the invention brings about a more cost-effective and faster improvement, without the user being restricted in terms of the quality or quantity of the information transmitted.
  • Another advantage is that the user can spend a lot of time searching and compiling data, especially multimedia data
  • the invention optimizes both the data redundancy, integration and security of the databases or database systems generated thereby.
  • the invention achieves a hitherto impossible avoidance of multiple storage of one and the same information (index cards, order administrations, etc.), (redundancy avoidance).
  • index cards, order administrations, etc. index cards, order administrations, etc.
  • redundancy avoidance Likewise, with the invention to a large extent an irrelevance of the internal form of data storage, ie data independence is achieved without the optimization would be affected.
  • the data protection and data security will also be indirectly optimized, since the system is the smallest possible through the structure optimization.
  • Standard databases typically increase their access speed and efficiency based on optimized hashing modules with the appropriate routines and memory elements and the most efficient memory modules with appropriate routines. On the one hand, this already presupposes a corresponding database structure, which is typically created by means of the most accurate knowledge possible of the data to be stored or its contents. In the prior art, these database structures are created manually and adapted to the data to be stored. The structure or efficiency of the hashing modules and / or tables and / or access and / or storage
  • Replacement Blade Routines substantially determines the performance of typical prior art databases.
  • the system according to the invention works with unstructured and / or unsorted data.
  • the advantages are not only in the power and speed gain, but in that the invention, in contrast to the prior art does not require predetermined or otherwise selected and / or filtered data, which usually saves many hours of intense and difficult work. It also minimizes security against errors in recognizing the internal structure of the data to be collected, and provides new database flexibility, which in turn results in speed and performance gains.
  • the schema and / or the structure of the query mask can be used for prototyping the database structure, which is likewise not known in the prior art.
  • the system comprises a filter module for generating metadata, wherein the metadata based on the elements of the personalized query form at least partially by automatic analysis of the unstructured data and / or data records can be generated and assigned to the data, and wherein the database structure based on the metadata and / or the elements of the personalized query form is dynamically generated.
  • the filter module may e.g. also included means for at least partially dynamically generating the metadata, wherein the dynamic generation is at least partially based on the elements of the personalized query mask.
  • a user profile is created based on user information, wherein the generation of the metadata is at least partially additionally based on the user profile.
  • ERSAT2BLATT FEGEL 26 continuously have the necessary up-to-date for the user. This is also achieved without unnecessary wear on system resources.
  • the central unit comprises a repackaging module, wherein the data of the database can be optimized in a content-oriented and user-specific manner by means of the repackaging module, taking into account the elements of the query mask and the data of the user profile.
  • This variant also has the same advantages as the first embodiment.
  • the central unit comprises a content module, wherein the data of the database can be accessed by the user stored in a permanent data memory of the content module and which data of the data memory can be modified by the user.
  • the variant has u.a. the advantage that once generated database in use by the user allows to ensure quick access to the desired data while saving computing power.
  • the search of data is improved based on the optimized database and / or based on the generated metadata regarding access time, memory requirements and computing power. This applies u.a. also for the first execution.
  • the user profile data includes at least portions that are modifiable by the user.
  • this is useful for embodiments where the user can define multiple user profiles for different communication devices.
  • An advantage of this variant embodiment is that the user can thus centrally manage a plurality of completely different optimized databases for different communication devices. Thus, he can e.g. Determine and manage the data and / or databases to be provided for a different communication device such as a WAP and / or SMS-enabled mobile device via a convenient interface of a computer system in the central unit.
  • the data stored in the data memory of the content module to the user comprises at least parts which can be managed by the user himself. This has the advantage, among other things, that the user can directly influence the storage of the data in the content module.
  • the data of the database taking account of the elements of the query mask and / or the user data of the user profile, can be optimally optimized by the repackaging module to match the requirements of the user's communication device or devices and / or the communication link from the central processing unit the said communication device or devices are adapted.
  • the user profile comprises access condition data which defines a monetary value of a credit limit that can be defined by the user and / or the central unit up to which credit limit an automatic billing of the data obtained from the database based on the query form takes place.
  • the central unit comprises a memory unit and corresponding means for automatically acquiring data on user behavior and the
  • Replacement Blade- (REGA 26) User profile associated with saving the data. This has the advantage, for example, that statistical surveys on user behavior can be carried out centrally and service providers can react quickly to changed user behavior.
  • the user profile of the user and / or the central unit comprises definable reuse condition data, based on soft reuse condition data by means of the central unit, the user profile and / or the database and / or database structure evaluable and accessible to third parties.
  • This embodiment has e.g. the advantage that the user can specify up to which level data about his database and / or database structure and / or his user behavior or his user profile may be made available to third parties and e.g. may also be used for statistical surveys. For example, the provider can respond flexibly to customer behavior and customer requirements when generating generalized databases and / or database structures.
  • the present invention relates not only to the method according to the invention but also to a system for carrying out this method and a corresponding computer program product.
  • FIG. 1 shows a block diagram which schematically illustrates an exemplary embodiment of a system according to the invention for the automated generation of database structures 13 and / or databases 14, wherein unstructured data and / or data records 30,..., 32 are recorded by means of a central unit 10 based on the database structure 13 and the central unit 10 having means 15 for selecting the data of the database 14 based on user information.
  • Figure 1 illustrates an architecture that may be used to implement the invention.
  • unstructured data and / or data records 30,..., 32 are recorded for the automated generation of database structures 13 and the corresponding databases 14, based on the database structure 13 by means of the central unit 10 and stored in the database 14 in an associated manner.
  • the unstructured data and / or data records 30,..., 32 can be stored, for example, on decentralized databases.
  • "unstructured data” is understood to mean that the data need not include any order and / or structural binding or arrangement among each other.
  • the data and / or data records 30,..., 32 of a special database can be structured and in all likelihood include an association among themselves.
  • the decentralized databases with the data and / or data records 30,..., 32 can be connected to the central unit 10 via a network 50, for example, by means of a corresponding network interface 20,.
  • the communication network 50 can be, for example, a GSM or a UMTS network, or a satellite-based mobile radio network, and / or one or more fixed networks, for example the public switched telephone network, the worldwide Internet or a suitable Local Area Network (LAN) or WAN (Wide Area Network) Network). In particular, it may also include ISDN and XDSL connections.
  • the data and / or data records 30,..., 32 may in particular include, for example, multimedia data such as digital data such as texts, graphics, images, maps, animations, moving images, video, quicktime, sound recordings, programs (software), program-accompanying data and Hyperlinks or references to multimedia data. These include, for example, MPx (MP3) or MPEGx (MPEG4 or 7) standards, as defined by the Moving Picture Experts Group.
  • MPx MP3
  • MPEGx MPEG4 or 7
  • the data and / or data records 30,..., 32 can be stored at different locations in different networks or locally accessible to the central unit 10.
  • the latter networks may include, for example, a local area network (LAN) or a wide area network (WAN), the Internet, broadcast cable networks, PSTN, PLMN or the like.
  • the data of the database 14 are based on
  • the central unit 10 comprises the necessary means, such as database interface, e.g. based on a standardized query language such as SQL (Structured Query Language), and communication tools and modules.
  • the central unit 10 comprises all the necessary software and / or hardware-implemented database management modules and units, in particular file organization, (such as internal formats of files and access paths) data definition (such as conceptual (ontological) data schemes) , View definitions (such as definition of user views (output formats) etc.), masking (such as design of menus and masks for user or interface interaction), data manipulation (such as operations on underlying databases), request language (such as: interactive access to the database, etc.), optimizations (such as modules and / or mechanisms for generating efficient database access), evaluation (such as implementation (of optimized) access to the underlying files), access control (such as access to the operating / syste close levels) and data dictionary and corresponding data memory (such as
  • Access to the database 14 can be bidirectional and / or unidirectional. Likewise, access can be controlled by access, encrypted or unencrypted.
  • elements 111 of a query generation module 11 a user 42 generates and / or modifies a user-specific query mask 112 for searching corresponding data.
  • the elements 111 may include modules for generating query table, for sifting, for querying synonyms and indexes, and for forming system / catalog tables.
  • the elements may e.g. even generate and / or modify standardized query language (such as the mentioned SQL).
  • the elements 111 may be e.g. also by means of a Data Definition Language (DDL) for setting up a database structure and / or using a Data Manipulation Language (DML)
  • DDL Data Definition Language
  • DML Data Manipulation Language
  • Some of them may also include domain functions for data type definitions for values that occur in several tables in the same form. Domains thus facilitate the creation of tables in the query form 112, since complicated field definitions need to be made only once and not in each table.
  • the domains may e.g. be named and can then be used under this name in each table. It makes sense to create the domains by the user 42 before the definition of the table, otherwise they would not be known when generating the tables.
  • the database structure 13 is generated dynamically based on the elements 111 of the personalized query form 112 and at least partially by automatic analysis of the unstructured data and / or data records.
  • Data and / or data records 30 32 are stored in the database structure 13 or in the database e.g. stored associated with the above-mentioned corresponding database management modules.
  • Metadata means all those data which may be responsible for the organizational management of the actual data.
  • the metadata 161 may be e.g. at least partially
  • ERS ⁇ I ⁇ BLATT may be extracted using a content-based indexing technique and may include keywords, synonyms, references to multimedia data (eg, hyperlinks), image and / or sound sequences, etc.
  • Such systems are known in the prior art in a great variety of variations. Examples of these are US Pat. No. 5,414,644, which describes a three-file indexing technique, or US Pat. No. 5,210,868, which also stores synonyms as search keywords when indexing the multimedia data and extracting the metadata.
  • the metadata can also be generated at least partially dynamically (in real time) based on user data of a user profile 162. This has the advantage, for example, that the metadata always has the relevance and accuracy that is meaningful for the user 42.
  • the database structure 13 may in this case be dynamically generated and assigned based on the metadata 161 and / or the elements 111 of the personalized query mask 112.
  • the metadata 161 may be generated at least partially dynamically, wherein the dynamic generation is at least partially based on the elements 111 of the personalized query mask 112.
  • a user profile 162 are created on the basis of user information, wherein the generation of the metadata 161 can at least partially additionally be based on the user profile 162.
  • the named user profile 162 is created on the basis of user information and can be used e.g. stored in the central unit 10 associated with the user.
  • the data of the database 14 can be optimized in a content-oriented and user-specific manner by means of a repackaging module 17, taking into account the elements 111 of the query mask 112 and the data of the user profile 162.
  • User behavior data may e.g. automatically recorded by the central unit 10 and stored in association with the user profile (162).
  • ERSAlIBLATf (RULE 28) Data of the database 14 can be made available, for example, to the user 42 in a permanent data memory of a content module 163 of the central unit 10.
  • the data of the data memory may be modifiable by the user 42.
  • the user profile 162 data may be at least partially modifiable by the user 42.
  • the user 42 can at least partially self-manage the data stored in the data memory of the content module 163 to the user.
  • the data of the database 14 may be selected based on the elements 111 of the query mask 112 and / or the user profile 162 and transmitted from a central processing unit 10 to a communication device 40/41 of a user 42.
  • a central processing unit 10 e.g. based on the database 14 according to the user profile 162 content-oriented and user-specific optimized data are transmitted in a corresponding request to the communication device 40/41 of a user.
  • the user profile 162 may be e.g. permanently saved to a specific user.
  • the user's communication device 40/41 may be, for example, a PC (Personal Computer), TV, PDA (Personal Digital Assistant), or a mobile (in particular, for example, in combination with a broadcast receiver).
  • the user profile 162 may include information about a user, such as a user. Location of the communication unit 40/41 of the user in the network, identity of the user, user-specific network properties, user-specific hardware properties, user behavior data, etc. include. In particular, the user 42 may previously define and / or modify at least parts of user data of the user profile 161. Of course, he also has the opportunity to access the data of the database 14 by direct access, ie without search and compilation assistance of the central unit 10 to them. The data of the user profile 161 may be e.g. also be determined automatically by the central unit 10, by authorized third parties or also by the user. Thus, the central unit 10 may be e.g. automatic port detection, user identification and / or automatic recording and evaluation of user behavior (time of access, frequency of access, etc.). This user behavior data
  • ERGATZBLAIT (REGa 28) can then be modified by the user 42 in accordance with his wishes in an embodiment variant.
  • the repackaging module 17 may include means for optimizing the data of the database 14, taking into account the elements 111 of the query form 112 and / or the user data of the user profile 162, such that the data meets the requirements of the communication device or devices 40/41 of the user 42 and or the communication link from the central unit 10 to said communication device or devices 40/41 are adapted. This means that, as mentioned above, from the selected data of the database 14 by means of the repackaging module 17 taking into account the user profile 162 and in particular corresponding user data, content-oriented and user-specifically optimized data can be generated prior to the transmission.
  • the desired data is extracted from the general data found in the network, the database structure is dynamically generated or adjusted, the data stored in the database is stored, compiled, and based on the user profile 162 eg optimized for user-specific hardware properties or network properties (e.g., compressed, sequenced, image resolution or reduced sound quality, etc.).
  • the user has the ability to access access request data prior to obtaining data in user profile 162, e.g. also be determined by means of the query generation module 11.
  • the access request data may e.g. Time, date, type, designation, general descriptions (e.g., synonyms) and / or characteristics such as resolution etc. of the desired data.
  • optimization may also address specific user requests (e.g., download times).
  • personalizing data is u.a. the above-mentioned process of selecting data and sequences of data based on the query form 112 and / or the user profile 162 or according to direct indications of
  • EB8A12BL ⁇ TT (RULE £ 6)
  • User 42 meant.
  • it comprises a content-related compilation of data, in particular database and / or database structure.
  • optimizing the user-specific network and / or hardware properties and / or user behavior based on the query mask 112 and / or the user profile 162 may be meant by user-specific optimization of the data.
  • the user profile 162 may additionally be e.g. Access condition data which defines a monetary amount value of a credit limit that can be defined by the user 42 and / or the central unit 10 up to which credit limit an automatic billing of the data obtained from the database based on the query form 112 takes place.
  • the credit limit is e.g.
  • a monetary amount value definable by the user 42 and / or the central unit 10 and / or authorized third parties eg banks, credit card companies, multimedia data providers, etc.
  • third parties eg banks, credit card companies, multimedia data providers, etc.
  • a maximum monetary value for the receipt of fee-based, content-oriented and user-optimized data of the database 14 and / or Whole database 14 and / or database structure 13 determines up to what monetary amount of the central unit 10, an automatic billing for the reference of the data and / or databases 14, etc. can be made.
  • the central unit 10 makes, for example, a query to a bank regarding the creditworthiness of the user.
  • the credit limit may also serve the user 42 to protect him from unforeseen costs for the purchase of the service (data, etc.).
  • the user 42 can access the billing unit via the central unit 10 for fee-based access-controlled data and / or databases 14 (conditional access) from third-party providers.
  • the handling and management of the billing and / or the access key may e.g. be executed by the central unit 10.
  • Decoding and / or decryption of the access controlled data and / or databases 14 may be achieved by means of an access control module of the central processing unit 10 or the repackaging module 17, e.g. Distribution Key and / or Session Key (key) according to the ETSI standard can be used.
  • the repackaging module 17 according to the invention can be designed in terms of hardware or software.
  • SUPPLEMENTARY SHEET (RULE 26) and / or database structures, ie the offsetting of the reference of the service, for example, corresponding billing data can be generated by the central unit 10, for example comprising billing documents (eg electronically signed), similar to CDR documents (CaII data records) in so-called DUR documents ( DAB / DVB Usage Records).
  • the billing documents are transmitted from the central unit 10, for example, to a clearing module of a credit card company, where they are further processed, or the central unit 10 can, for example, carry out the billing independently.
  • the content-oriented and user-specifically optimized data can also be provided with an electronic stamp, an electronic signature or an electronic watermark.
  • the electronic signature makes it possible to assign the content-oriented and user-specifically optimized data of the database 14 at any later time to the user 42 who has obtained them from the central unit 10 and / or the database 14. Thus, the misuse of paid data by the user 42 or third parties can be prevented.
  • the user profile 162 by the user 42 and / or the central unit 10 definable re-use condition data includes based on soft re-use condition data, the central unit 10, the database 14 and / or the database structure 13 and / or the user profile 162 evaluates and makes available to third parties.
  • the user 42 may e.g. determine up to what level data may be made accessible to third parties via its database 14 and / or database structure 13 and / or its user behavior or profile 162, and e.g. may also be used for statistical surveys.
  • the provider can respond flexibly to customer behavior and customer requirements when generating generalized databases and / or database structures.
  • the data protection can be determined by the user 42.
  • the evaluation can be generally statistically but also quite individually related to the specific user 42.
  • the central unit 10 can act here as an independent filter station of the data and / or databases 14 and / or database structures 13 in accordance with the further use condition data of the user 42.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Vorgeschlagen wird ein System und Verfahren zur automatisierten Generierung von Datenbankstrukturen (13) und/oder Datenbanken (14), wobei unstrukturierte Daten und/oder Datenrekords (30,..., 32) mittels einer Zentraleinheit (10) basierend auf der Datenbankstruktur (13) erfasst und einander zugeordnet werden, wobei die Zentraleinheit (10) ein Query- Generations-Modul (11 ) umfasst, mittels welchem durch einen Benutzer (42) selektierbaren Elementen (111 ) eine personifizierte Abfragemaske (112) zur Suche entsprechender Daten erzeugbar ist, wobei das System ein Extraktionsmodul (12) umfasst, mittels welchem die Datenbankstruktur dynamisch basierend auf den Elementen der personifizierten Abfragemaske (112) und mindestens teilweise durch automatische Analyse der unstrukturierten Daten und/oder Datenrekords (30,...,32) generierbar sind und wobei die unstrukturierten Daten und/oder Datenrekords (30, ...,32) der Datenbankstruktur (13) zugeordnet in einer Speichereinheit (14) des Systems abgespeichert werden.

Description

System zur automatisierten Generierung von Datenbankstrukturen und/oder Datenbanken und entsprechendes Verfahren
Die Erfindung betrifft System und Verfahren zur automatisierten Generierung von Datenbankstrukturen und/oder Datenbanken, wobei unstrukturierte Daten und/oder Datenrekords mittels einer Zentraleinheit basierend auf der Datenbankstruktur erfasst und einander zugeordnet werden und wobei die Zentraleinheit Mittel zum Selektieren der Daten der Datenbank basierend auf Benutzerinformationen umfasst. Insbesondere betrifft das System Datenbankstrukturen, welche basierend auf Metadaten generiert sind.
Datenbanken spielen in der modernen Kommunikations- und Informationsgesellschaft insbesondere in Wissenschaft, Technik, Entwicklung und Industrie eine immense Rolle. Natürlich hat die weltweite Vernetzung durch das Backbone Netzwerk Internet dazu beigetragen. Dabei sind die technischen Anforderungen an diese Systeme gestiegen. Dies betrifft nicht nur die Speicherkapazität, sondern auch die Zugriffszeiten im Wesentlichen basierend auf der Prozessorenleistung und den Zugriffstrukturen, aber auch den Busgeschwindigkeiten und Netzwerkkapazitäten. Die Computer- und Kommunikationssysteme sollen dabei Daten, bzw. ganz allgemein Multimediadaten über Netzwerke, wie z.B. einem LAN (Local Area Network), einem WAN (Wide Area Network) oder dem Internet via z.B. dem öffentlichen, geschalteten Telefonnetzwerk (PSTN: Public Switched Telephone Network) oder einem Mobilfunknetz (PLMN: Public Land Mobile Network) wie z.B. GSM- (Global System for Mobile communication) oder UMTS-Netzen (Universal Mobile Telephone System) etc. entsprechend selektieren, beziehen oder übermitteln. Umgekehrt werden bezogenen Daten dann wieder gespeichert und/oder dargestellt und/oder bearbeitet und/oder anderen Computersystemen modifiziert zur Verfügung gestellt. Unter Multimediadaten fallen u.a. digitale Daten wie Texte, Graphiken, Bilder, Animationen, Video, Quicktime und Tonaufnahmen. Dazu gehören auch MPx (MP3) oder MPEGx (MPEG7) Standards, wie sie durch die Moving Picture Experts Group definiert werden. Datenbanken zum Speichern der Daten haben dabei eine zentrale Rolle bei Aufbewahren, Aufbereiten und Zugänglichmachen der Daten inne. Die anfallenden Datenmenge ist in den meisten Fällen jedoch enorm. Trotz grosser
EflSATZBWm(RiGEL26) Anstrengungen von Seiten der Industrie im Ausbau und Entwicklung neuer Datenbanken konnte sie bis anhin mit der steigenden Nachfrage kaum Schritt gehalten werden. Dazu beigetragen hat in den letzten Jahren die schnell wachsende Popularität von Diensten wie dem Internet, die Forderung nach Daten "on demand". Höhere Benutzerzahlen mit individualisierten Anforderungen und immer grossere Datenmenge sind somit die Auslöser, dass die gewohnten Datenstrukturen und Speichermöglichkeiten immer wieder an ihre Leistungsgrenzen stossen. Zusätzlich liegen die Kosten zur Entwicklung schneller individuell-angepasster und leistungsfähiger Datenbanken immer noch zu hoch im Vergleich zum damit erreichten Vorteil. Zu den Nachteilen der Entwicklung angepasster schneller und speichereffizienter Datenbanken gehört, dass sie zeitaufwendig und verhältnismässig teuer ist.
Im Stand der Technik sind z.B. zum einen Computersysteme mit Datenbanken bekannt, die sich gliedern in Structured Query Language- Datenbanken und Datenbank-Standardprogramme. Zum anderen sind Computersysteme mit Volltext-Datenbanksystemen geläufig. Bekannte Datenbank-Standardprogramme sind Microsoft Access, dBase, FoxPro, CA- Clipper, Informix und Paradox. Bekannte Volltext-Datenbanksysteme sind u.a. Oracle und Adabas D. Eine Datenbank ist ein elektronisches Archiv für die strukturierte und/oder speicherplatzsparende und/oder zugriffsgeschwindigkeitsoptimierende Aufbewahrung grosser Mengen inhaltlich oder strukturell zusammengehöriger Daten, aus dem Daten abrufbar sind. Ein Datenbanksystem umfasst die aus den Primärdaten bestehende Datenbasis, eine Datenbankbeschreibung und mehrere Datenbank-Programme. Bei den bekannten Datenbanken ist von Nachteil, dass sie häufig nicht von Nur-Lese- Medien wie CD-ROM, DVD-ROM und Internet lauffähig sind. Weiterhin ist von Nachteil, dass die bekannten Datenbanken meist keine oder nur eine sehr langsame Volltextsuchfunktion bereithalten, wobei dem unterschiedliche technische Probleme zugrunde liegen können. Des weiteren weisen die bekannten Datenbanken Geschwindigkeits- oder sogar Stabilitätsprobleme auf, wenn sie Datensätze unterschiedlicher Struktur und/oder Längen enthalten. Sie sind somit für den Einsatz von Datensätzen, die unterschiedliche Struktur und/oder Längen aufweisen, nur bedingt geeignet. Bei den Volltext- Datenbanksystemen ist von Nachteil, dass sie sehr viel Speicher und schnelle
ERSATZBU7T(REGEL 26) Prozessoren benötigen, um schnell ablaufen zu können. Diese Volltext- Datenbanksysteme erstellen Volltext-Indizes dynamisch in Echtzeit, um die Durchsuchbarkeit der Datenbank zu gewährleisten. Bei grossen Datenmengen ist dies ein sehr zeitintensiver Prozess, der sich negativ auf die Bearbeitungsdauer von Suchanfragen auswirkt. Häufig können wie erwähnt auch individuell angepasste Datenbanken (Grosse, Struktur etc. etc.) grosse Vorteile haben. Die Datenbanken des Standes der Technik sind jedoch in diesem Sinn meist statisch und nur unter grossem Zeit-, Mitarbeiter- und Kostenaufwand anpassbar. Damit haben die Datenbanken des Standes der Technik auch das Problem, dass sie häufig für den entsprechenden Benutzer unnötige und/oder unbrauchbare Informationen ebenfalls umfassen, was die in der Datenbank gespeicherte Informationsmenge vergrössert. Dies hat den Nachteil, dass sich solche Datenbanken auch schlecht für den mobilen Einsatz in mobilen Endgeräten mit meistens beschränkter Speicherkapazität und/oder Netzwerkinterfacekapazität eignen. Ebenso eignen sich solche Datenbanken häufig aus den oben genannten Gründen auch wenig für mobile Speichermedien, wie z.B. CD-ROM oder DVD-ROM.
Es ist daher Aufgabe der Erfindung, eine automatisierte Vorrichtung oder System zur Generierung von Datenbankstrukturen und/oder Datenbanken vorzuschlagen, welche die oben erwähnten Nachteile nicht aufweist. Mittels der erfindungsgemässen Vorrichtung soll eine geschwindigkeits- und speichereffiziente Verwaltung von Datenmengen in der Datenbank gewährleistet werden. Insbesondere soll die Datenbankstruktur und/oder Datenbank mittels der Vorrichtung dynamisch und individuell generierbar und/oder anpassbar sein. Ebenso sollen sie dynamisch an Medien wie CD- ROM, DVD-ROM anpassbar oder dafür individualisiert und falls notwendig entsprechend segmentiert generierbar sein. D
Gemäss der vorliegenden Erfindung wird dieses Ziel insbesondere durch die Elemente der unabhängigen Ansprüche erreicht. Weitere vorteilhafte Ausführungsformen gehen ausserdem aus den abhängigen Ansprüchen und der Beschreibung hervor.
ERSAT2BU7T (REGa 26) Insbesondere werden diese Ziele durch die Erfindung dadurch erreicht, dass zur automatisierten Generierung von Datenbankstrukturen und/oder Datenbanken unstrukturierte Daten und/oder Datenrekords mittels einer Zentraleinheit basierend auf der Datenbankstruktur erfasst und einander zugeordnet sind, dass die Zentraleinheit Mittel zum Selektieren der Daten der Datenbank basierend auf Benutzerinformationen umfasst, dass die Zentraleinheit ein Query-Generations-Modul umfasst, wobei mittels durch einen Benutzer selektierbaren Elementen des Query-Generations-Moduls eine personifizierte Abfragemaske zur Suche entsprechender Daten erzeugbar und/oder modifizierbar ist, und dass das System ein Extraktionsmodul umfasst, wobei die Datenbankstruktur mittels des Extraktionsmodul dynamisch basierend auf den Elementen der personifizierten Abfragemaske und mindestens teilweise durch automatische Analyse der unstrukturierten Daten und/oder Datenrekords generierbar ist und die unstrukturierten Daten und/oder Datenrekords der Datenbankstruktur zugeordnet in einer Speichereinheit des Systems abspeicherbar ist. Die Zentraleinheit kann z.B. Mittel zum Selektieren von Daten der Datenbank basierend auf den Elementen der Abfragemaske und/oder eines Benutzerprofils umfassen, welche Daten mittels eines Kommunikationsmoduls der Zentraleinheit an eine Kommunikationsvorrichtung eines Benutzers übermittelbar sind. Das Benutzerprofil kann z.B. benutzerspe- zifische Daten zu Netzwerkeigenschaften und/oder Daten zu Hardwareeigenschaften von Kommunikationsvorrichtung des Benutzers und/oder Daten zum Benutzerverhalten abgespeichert umfassen. Die Erfindung hat u.a. die Vorteile, daß eine geschwindigkeits- und speichereffiziente Verwaltung von Datenmengen in der Datenbank gewährleistet werden kann. Zudem kann die Datenbankstruktur und/oder Datenbank mittels der Vorrichtung dynamisch und individuell generiert werden und/oder angepaßt werden sein. Ebenso kann die Datenbank dynamisch an Medien wie CD-ROM, DVD-ROM angepasst oder dafür individualisiert und falls notwendig entsprechend segmentiert generiert werden. Dies ist so mit keinem bekannten Stand der Technik möglich. Weiter hat dies u.a. den Vorteil, dass die Erfindung kostengünstiger und schneller eine Verbesserung bringt, ohne dass der Benutzer bezüglich der Qualität oder Quantität der übermittelten Informationen eine Einschränkung erfahren würde. Ein anderer Vorteil ist, dass dem Benutzer das zeitaufwendige Suchen und zusammenstellen von Daten, insbesondere Multimediadaten, in grossen
£R$A7ZBLÄϊT (REGa 26) Netzwerken stark erleichtert wird und er zudem eine dynamische vom System erstellte, optimierte Selektion oder Zusammenstellung und eine von ihm direkt beeinflussbare Automation bei der Optimierung der Datenbank und/oder Datenbankstruktur erhalten kann. Grundsätzlich werden durch die Erfindung sowohl die Datenredundanz, -Integration und -Sicherheit der damit generierten Datenbanken bzw. Datenbanksystemen optimiert. Insbesondere wird mit der Erfindung eine bis anhin unmögliche Vermeidung von mehrfacher Speicherung ein- und derselben Information (Karteikarten, Auftragsverwaltungen etc.), (Redundanzvermeidung) erreicht. Ebenso wird mit der Erfindung in großem Masse eine Irrelevanz von der internen Form der Datenspeicherung, d.h. Datenunabhängigkeit erreicht, ohne daß die Optimierung dadurch tangiert würde. Der Datenschutz und Datensicherheit werde indirekt ebenfalls optimiert, da durch die Strukturoptimierung das System kleinst möglich wird. Dadurch werden ebenfalls Konzepte zur gemeinsame Nutzung von ein- und denselben Datensätzen (Transaktionskonzepte) mehr oder weniger hinfällig. Manipulationen und Abfragen können in einheitlicher Form (Schnittstellen/Anfragesprachen) realisiert sein. Die Datenintegration kann damit für einen bestimmten Zweck die größtmöglich Dichte erreichen. Die Daten liegen damit erfindungsgemäß als zentrale Komponente benutzerspezifisch optimiert vor, worauf die Anwendungsprogramme zugreifen. Ganz allgemein lässt sich insbesondere darafu hinweisen, dass mittels der Erfindung erstmals ein vollständig automatisiertes Datenbank-Prototyping möglich wird. Ebenfalls wird damit ein vollständig neues und automatisiertes System zum Analysieren und Typifizieren von unstrukturierten Daten, insbesondere in hetergenen Netzwerken, Speicherelementen und Datenbanken, geschaffen. Standard Datenbanken erhöhen ihre Zugriffsgeschwindigkeit und Effizienz typischerweise basierend auf möglichst optimierten Hashing-Modulen mit entsprechenden Routinen und Speicherelementen und möglichst effizienten Speichermodulen mit entsprechenden Routinen. Dies setzt einerseits bereits eine entsprechende Datenbankstruktur voraus, welche typischerweise erstellt werden mittels möglichst genauen Kenntnissen der zu Speicherten Daten bzw. deren Inhaltes. Im Stand der Technik werden diese Datenbankstrukturen vor Hand erstellt und an die zu speichernden Daten angepasst. Die Struktur bzw. Effizienz der Hashing-Modulen und/oder -tables und/oder Zugriffs- und/oder Abspeicher-
ERSATZBLATf (REGa 26) Routinen bestimmt die Leistung der typischen Datenbanken des Standes der Technik wesentlich. Das erfindungsgemässe System arbeitet jedoch mit unstrukturierten und/oder unsortierten Daten. Damit liegen die Vorteile nicht nur im Leistungs- und Geschwindigkeitsgewinn, sondern darin, dass die Erfindung im Gegensatz zum Stand der Technik keine vorbestimmten oder andersweitig selektierten und/oder gefilterten Daten voraussetzt, was üblicherweise viele Stunden intensiver und schwieriger Arbeitszeit erspart. Ebenso kann damit die Sicherheit vor Fehler im erkennen der inneren Struktur der zu erfassenden Daten minimiert werden und einen neue Flexibilität der Datenbank erreicht werden, was wiederum in Geschwindigkeits- und Leistungsgewinn resultiert. Weiter kann mittels der Erfindung das Schema und/oder die Struktur der Abfragemaske zum Prototyping der Datenbankstruktur verwendet werden, was ebenfalls im Stand der Technik so nicht bekannt ist. Damit kann eine vollständig neue Individualisierung der Datenbanken bzw. der Datenbankstrukturen erreicht werden. Mittels automatisiertem oder teilweise automatisiertem Erkennen und/oder Vergleichen der von den Benutzern eingegebenen Abfragemasken lässt auch eine neue Art von Verhaltensoptimierung, insbesondere für berufsspezifische und/oder anders charakterisierten Gruppen von Benutzern, der Datenbanken bzw. der Datenbankstrukturen zu.
In einer Ausführungsvariante umfasst das System ein Filtermodul zum Erzeugen von Metadaten, wobei die Metadaten basierend auf den Elementen der personifizierten Abfragemaske mindestens teilweise durch automatische Analyse der unstrukturierten Daten und/oder Datenrekords erzeugbar und den Daten zuordenbar sind, und wobei die Datenbankstruktur basierend auf den Metadaten und/oder den Elementen der personifizierten Abfragemaske dynamisch generierbar ist. Als Ausführungsvariante kann das Filtermodul z.B. auch Mittel zum mindestens teilweisen dynamischen Generieren der Metadaten umfassten, wobei die dynamische Generierung mindestens teilweise basierend auf den Elementen der personifizierten Abfragemaske erfolgt. Ebenso kann z.B. ein Benutzerprofil anhand von Benutzerinformationen erstellt werden, wobei die Generierung der Metadaten mindestens teilweise zusätzlich basierend auf dem Benutzerprofil erfolgt. Diese Ausführungsvariante hat u.a. die gleichen Vorteile wie die vorgehende. Einer der Vorteile der dynamischen Generierung liegt darin, dass die Metadaten
ERSAT2BLATT(FEGEL 26) fortwährend die für den Benutzer notwendige Aktualität aufweisen. Dies wird zudem ohne unnötigen Verschleiss von Systemressourcen erreicht.
In einer anderen Ausführungsvariante umfasst die Zentraleinheit ein Repackagingmodul, wobei die Daten der Datenbank mittels des Repackagingmoduls unter Berücksichtigung der Elemente der Abfragemaske und der Daten des Benutzerprofils contentorientierte und benutzerspezifisch optimierbar sind. Diese Ausführungsvariante hat ebenfalls die gleichen Vorteile wie die erste Ausführungsvariante.
In einer weiteren Ausführungsvariante umfaßt die Zentraleinheit ein Contentmodul, wobei die Daten der Datenbank dem Benutzer in einem permanenten Datenspeicher des Contentmoduls abgespeichert zugreifbar sind und welche Daten der Datenspeichers durch den Benutzer modifizierbar sind. Die Ausführungsvariante hat u.a. den Vorteil, dass die einmal generierte Datenbank bei Gebrauch durch den Benutzer es erlaubt, einen schnellen Zugriff auf die gewünschten Daten unter Einsparung von Rechenleistung zu gewährleisten. Insbesondere wird das Suchen von Daten basierend auf der optimierten Datenbank und/oder anhand der generierten Metadaten bezüglich Zugriffszeit, Speicherbedarf und Rechenleistung verbessert. Dies gilt u.a. auch für die erste Ausführungsvatiante.
In einer wieder anderen Auführungsvariante umfassen die Daten des Benutzerprofils mindestens Teile, welche durch den Benutzer modifizierbar sind. Insbesondere ist dies sinnvoll für Ausführungsvarianten, wo der Benutzer mehrere Benutzerprofile für verschiedene Kommunikationsvorrichtungen definieren kann. Ein Vorteil dieser Ausführungsvariante ist, dass der Benutzer damit mehrere ganz unterschiedliche optimierte Datenbanken für unterschiedliche Kommunikationsgeräte zentral verwalten kann. Somit kann er z.B. über eine komfortable Schnittstelle eines Computersystems in der Zentraleinheit die bereitzustellenden Daten und/oder Datenbanken für eine andere Kommunikationsvorrichtung wie einem WAP- und/oder SMS-fähigen Mobilfunkgerät bestimmen und verwalten.
ERSArZBWTf-(REGa 2B) In einer Ausführungsvariante umfassen die im Datenspeicher des Contentmoduls dem Benutzer zugeordnet abgespeicherten Daten mindestens Teile, welche durch den Benutzer selber verwaltbar sind. Dies hat u.a. den Vorteil, dass der Benutzer das Speichern der Daten im Contentmodul direkt mitbeeinflussen kann.
In einer anderen Ausführungsvariante sind mittels des Repackagingmodul die Daten der Datenbank unter Berücksichtigung der Elemente der Abfragemaske und/oder der Benutzerdaten des Benutzerprofils benutzerspezifisch derart optimierbar, dass sie an die Anforderungen der Kommunikationsvorrichtung oder -Vorrichtungen des Benutzers und/oder die Kommunikationsverbindung von der Zentraleinheit zu der genannten Kommunikationsvorrichtung oder -Vorrichtungen angepasst sind. Dies hat den Vorteil, dass die Erfindung kostengünstiger und schneller eine Verbesserung bringt, ohne dass der Benutzer bezüglich der Qualität oder Quantität der übermittelten Informationen eine Einschränkung erfahren würde. Ein anderer Vorteil ist, dass dem Benutzer das zeitaufwendige Suchen und zusammenstellen von Daten, insbesondere in grossen Netzwerken stark erleichtert wird und er zudem eine dynamische vom System erstellte optimierte Selektion oder Zusammenstellung und eine von ihm direkt beeinflussbare Automation bei der Suche erhalten kann.
In einer weiteren Ausführungsvariante umfaßt das Benutzerprofil Zugriffsbedingungsdaten umfasst, welche einen vom Benutzer und/oder der Zentraleinheit definierbaren Geldbetragswert einer Kreditlimite festlegen, bis zu welcher Kreditlimite ein automatisches Billing der von der Datenbank basierend auf der Abfragemaske bezogenen Daten stattfindet. Dies hat u.a. den Vorteil, dass bei der Vergütung für den Zugriff auf contentorientierte und benutzerspezifisch optimierte Daten der Datenbank der Benutzer oder die Zentraleinheit frei festlegen kann, welche Art von Verrechnung bis zu welchen Beträgen erfolgen soll.
In einer wieder anderen Ausführungsvariante umfasst die Zentraleinheit eine Speichereinheit und entsprechende Mittel zum automatischen Erfassen von Daten zum Benutzerverhalten und zum dem
ERSATZBLATT-(REGa 26) Benutzerprofil zugeordneten Speichern der Daten. Dies hat z.B. den Vorteil, dass statistische Erhebungen über Benutzerverhalten zentral ausgeführt werden können und Dienstleistungsanbieter schnell auf verändertes Benutzerverhalten reagieren können.
In einer Ausführungsvariante umfasst das Benutzerprofil vom Benutzer und/oder der Zentraleinheit festlegbare Weiterverwendungsbedingungsdaten, basierend auf weichen Weiterverwendungsbedingungsdaten mittels der Zentraleinheit das Benutzerprofil und/oder die Datenbank und/oder Datenbankstruktur auswertbar und für Dritten zugreifbar ist. Diese Ausführungsvariante hat z.B. den Vorteil, dass der Benutzer festlegen kann, bis zu welcher Stufe Daten über seine Datenbank und/oder Datenbankstruktur und/oder sein Benutzerverhalten oder sein Benutzerprofil Dritten zugänglich gemacht werden darf und z.B. auch für statistische Erhebungen verwendet werden darf. Zum Beispiel kann so der Anbieter flexibel auf das Kundenverhalten und Kundenwünsche bei der Generierung generalisierter Datenbanken und/oder Datenbankstrukturen eingehen.
An dieser Stelle soll festgehalten werden, dass sich die vorliegende Erfindung neben dem erfindungsgemässen Verfahren auch auf ein System zur Ausführung dieses Verfahrens und ein entsprechendes Computerprogrammprodukt bezieht.
Nachfolgend werden Ausführungsvarianten der vorliegenden Erfindung anhand von Beispielen beschrieben. Die Beispiele der Ausführungen werden durch folgende beigelegte Figuren illustriert:
Figur 1 zeigt ein Blockdiagramm, welches schematisch ein Ausführungsbeispiel eines erfindungsgemässen System zur automatisierten Generierung von Datenbankstrukturen 13 und/oder Datenbanken 14 illustriert, wobei unstrukturierte Daten und/oder Datenrekords 30,...,32 mittels einer Zentraleinheit 10 basierend auf der Datenbankstruktur 13 erfasst und einander zugeordnet werden und wobei die Zentraleinheit 10 Mittel 15 zum Selektieren der Daten der Datenbank 14 basierend auf Benutzerinformationen.
EflSÄTZBLATT {REGEL 26} Figur 1 illustriert eine Architektur, die zur Realisierung der Erfindung verwendet werden kann. In diesem Ausführungsbeispiel werden zur automatisierten Generierung von Datenbankstrukturen 13 und den entsprechenden Datenbanken 14 unstrukturierte Daten und/oder Datenrekords 30,...,32 basierend auf der Datenbankstruktur 13 mittels der Zentraleinheit 10 erfasst und einander zugeordnet in der Datenbank 14 abgespeichert. Die unstrukturierte Daten und/oder Datenrekords 30,...,32 können z.B. auf dezentralisierten Datenbanken abgespeichert sein. Unter "unstrukturierten Daten" wird in diesem Zusammenhang verstanden, daß die Daten untereinander keine Ordnung und/oder strukturelle Bindung oder Anordnung umfassen müssen. Wohl können die Daten und/oder Datenrekords 30,...,32 einer speziellen Datenbank strukturiert sein und mit aller Wahrscheinlichkeit unter sich auch einen Zuordnung umfassen. Gesamthaft gesehen werden solche Strukturen von der Erfindung aber weder benötigt, noch bilden sie eine entsprechende Voraussetzung für das Funktionieren der Erfindung. Die dezentralisierten Datenbanken mit den Daten und/oder Datenrekords 30,...,32 können z.B. mittels einer entsprechenden Netzwerkschnittstelle 20,...,22 über ein Netzwerk 50 mit der Zentraleinheit 10 verbunden sein. Das Kommunikationsnetz 50 kann beispielsweise ein GSM- oder ein UMTS-Netz, oder ein satellitenbasiertes Mobilfunknetz, und/oder ein oder mehrere Festnetze, beispielsweise das öffentlich geschaltete Telefonnetz, das weltweite Internet oder ein geeignetes LAN (Local Area Network) oder WAN (Wide Area Network) sein. Insbesondere kann es auch ISDN- und XDSL-Verbindungen umfassen. Die Daten und/oder Datenrekords 30, ...,32 können insbesondere z.B. Multimediadaten umfassen wie u.a. digitale Daten wie Texte, Graphiken, Bilder, Karten, Animationen, bewegte Bilder, Video, Quicktime, Tonaufnahmen, Programme (Software), programmbegleitende Daten und Hyperlinks oder Verweise auf Multimediadaten. Dazu gehören z.B. auch MPx (MP3) oder MPEGx (MPEG4 oder 7) Standards, wie sie durch die Moving Picture Experts Group definiert werden. Die Daten und/oder Datenrekords 30, ...,32 können an unterschiedlichen Orten in unterschiedlichen Netzen oder lokal für die Zentraleinheit 10 zugreifbar abgespeichert sein. Die letztgenannten Netzwerke können z.B. ein LAN (Local Area Network) oder ein WAN (Wide Area Network), das Internet, Broadcastkabelnetze, PSTN, PLMN o.a. umfassen. Die Daten der Datenbank 14 sind basierend auf
Benutzerinformationen von der Datenbank 14 selektierbar und/oder abrufbar. Die Zentraleinheit 10 umfasst die dazu notwendigen Mittel, wie Datenbankinterface, z.B. basierend auf einer standardisierten Query Language wie z.B. SQL (Structured Query Language), und Kommunikationsmittel und - module. Die Zentraleinheit 10 umfasst neben der erfind ungsgemässe Datenbank bzw. Datenbankstruktur alle notwendigen entsprechend Software und/oder hardwaremäßig realisierte Datenbankverwaltungsmodule und - einheiten, insbesondere betreffend Dateiorganisation, (wie z.B. interne Formate von Dateien und Zugriffspfade) Datendefinition (wie z.B. konzeptionelle (ontologische) Datenschemata), Sichtdefinitionen (wie z.B. Definition von Benutzersichten (Ausgabeformate) etc.), Maskenbildung (wie z.B. Entwurf von Menüs und Masken für die Benutzer- oder Schnittstelleninteraktion), Datenmanipulationen (wie z.B. Operationen auf zugrundeliegenden Datenbanken), Anfragensprache (wie z.B: interaktiver Zugriff auf den Datenbestand etc.), Optimierungen (wie z.B. Module und/oder Mechanismen zur Erzeugung effizienter Datenbankzugriffe), Auswertung (wie z.B. Umsetzung (von optimierten) Zugriffen auf die zugrundeliegenden Dateien), Zugriffssteuerung (wie z.B. Durchführung von Zugriffen auf der betriebs- /systemnahen Ebenen) und Datenwörterbuch und entsprechender Datenspeicher (wie z.B. zentraler Katalog aller für die Datenbehandlung relevanten Informationen etc.).
Der Zugriff auf die Datenbank 14 kann bidirektional und/oder unidirektional erfolgen. Ebenso kann der Zugriff zugriffskontrolliert, verschlüsselt oder unverschlüsselt erfolgen. Mittels Elementen 111 eines Query-Generations-Modul 11 erzeugt und/oder modifiziert ein Benutzer 42 eine benutzerspezifische Abfragemaske 112 zur Suche entsprechender Daten. Die Elemente 111 können Module zur Erzeugung von Abfragetabelle, zum Sichten, zur Abfrage von Synonymen und Indexe und zur Bildung von System- /Katalogtabellen umfassen. Die Elemente können z.B. selbst standardisierten Query Language (wie z.B. das erwähnte SQL) erzeugen und/oder mittels solchen erzeugt und/oder modifiziert werden. Die Elemente 111 können z.B. auch mittels einer Data Definition Language (DDL) zum Aufsetzen einer Datenbankstruktur und/oder mittels einer Data Manipulation Language (DML)
- — 1
^RSATZBLATT (REGEL 26L zur Manipulation der enthaltenen Daten erzeugt und/oder entsprechende Elemente aus der generierten Abfragemaske selbst erzeugen. Die Elemente
111 können teilweise auch Domainsfunktionen umfassen zur Datentypdefinitionen für Werte, die in mehreren Tabellen in derselben Form vorkommen. Domains erleichtern somit die Erstellung von Tabellen in der Abfragemaske 112, da komplizierte Felddefinitionen nur einmal und nicht in jeder Tabelle aufs Neue vorgenommen werden müssen. Die Domains können z.B. mit einem Namen versehen werden und können dann unter diesem Namen in jeder Tabelle verwendet werden. Sinnvollerweise müssen die Domains vom Benutzer 42 vor der Definition der Tabelle erstellt werden, sonst wären sie ja bei der Generierung der Tabellen noch nicht bekannt. Die Elemente können weiter z.B. auf spezifischen Datentypen-Eigenschaften basieren. Für die einzelnen Spalten (= Attribute oder syn. Datenfelder) einer Tabelle könnten z.B. folgende Eigenschaften umfaßt sein: Datentyp, Vorgabewert (Literal, NULL oder angemeldeter USER), Nullwertdefinition (NOT NULL unterbindet Eintragungsverzicht), CHECK - Bedingung (zur Festlegung bestimmter Eingabekriterien), Zeichensatz und Sortierfolge. Die Mindestdefinition für eine spaltenbasiertes Element 111 kann z.B. aus der Vergabe einer Spaltenbezeichnung (=Feldname) und eines Datentyps. Alle anderen Möglichkeiten können optional ebenfalls umfaßt sein. Die Datenbankstruktur 13 wird dynamisch basierend auf den Elementen 111 der personifizierten Abfragemaske 112 und mindestens teilweise durch automatische Analyse der unstrukturierten Daten und/oder Datenrekords generiert. Die unstrukturierten
Daten und/oder Datenrekords 30 32 werden der Datenbankstruktur 13 bzw. in der Datenbank z.B. mittels den oben erwähnten entsprechenden Datenbankverwaltungsmodulen zugeordnet abgespeichert.
Basierend auf den Elementen 111 der personifizierten Abfragemaske
112 können z.B. auch mindestens teilweise durch automatische Analyse der unstrukturierten Daten und/oder Datenrekords 30,...,32 Metadaten 161 erzeugt werden und den Daten zugeordnet werden. Als Metadaten werden erfindungsgemäss alle jene Daten bezeichnet, die für die organisatorische Verwaltung der eigentlichen Daten zuständig sein können. Insbesondere Domain-Definitionen, Tabellendefinitionen, Views, Indexdefinitionen, Zugriffsrechte usw. Die Metadaten 161 können z.B. mindestens teilweise
ERSÄI ^BLATT (REbELEc^ anhand einer inhaltsbasierenden Indexingtechnik extrahiert werden und können Stichworte, Synonyme, Verweise auf Multimediadaten (z.B. auch Hyperlinks), Bild- und/oder Tonsequenzen etc. umfassen. Solche Systeme sind im Stand der Technik in unterschiedlichsten Variationen bekannt. Beispiele dafür sind die US-Patentschrift US 5414 644, welche eine Drei-File-Indexingtechnik beschreibt oder die US-Patentschrift US 5 210 868, welche bei dem Indexieren der Multimediadaten und Extrahieren der Metadaten zusätzlich auch Synonyme als Such-Keywords abspeichert. Im vorliegenden Ausführungsbeispiel können die Metadaten aber auch mindestens teilweise dynamisch (in Real-Time) basierend auf Benutzerdaten eines Benutzerprofils 162 erzeugt werden. Dies hat z.B. den Vorteil, dass die Metadaten immer die für den Benutzer 42 sinnvolle Aktualität und Genauigkeit besitzen. Vom Benutzerverhalten an der Kommunikationsvorrichtung 40/41 zum Filtermodul 16 zur Extraktion der Metadaten 161 kann also z.B. eine Art Feedbackmöglichkeit existieren, die die Extraktion der Metadaten 161 direkt beeinflussen kann. Es können aber auch insbesondere bei der Suche bestimmter Daten sog. Agents eingesetzt werden. Die Datenbankstruktur 13 kann in diesem Fall basierend auf den Metadaten 161 und/oder den Elementen 111 der personifizierten Abfragemaske 112 dynamisch generiert und zugeordnet werden. Die Metadaten 161 können z.B. mindestens teilweise dynamisch generiert werden, wobei die dynamische Generierung mindestens teilweise basierend auf den Elementen 111 der personifizierten Abfragemaske 112 erfolgt.
Als Ausführungsvariante kann z.B. ein Benutzerprofil 162 anhand von Benutzerinformationen erstellt werden, wobei die Generierung der Metadaten 161 mindestens teilweise zusätzlich basierend auf dem Benutzerprofil 162 erfolgen kann. Das genannte Benutzerprofil 162 wird anhand von Benutzerinformationen erstellt und kann z.B. in der Zentraleinheit 10 dem Benutzer zugeordnet abgespeichert werden. Die Daten der Datenbank 14 können mittels eines Repackagingmoduls 17 unter Berücksichtigung der Elemente 111 der Abfragemaske 112 und der Daten des Benutzerprofils 162 contentorientiert und benutzerspezifisch optimierte werden. Daten zum Benutzerverhalten können z.B. von der Zentraleinheit 10 automatisch erfasst und dem Benutzerprofil (162) zugeordnet abgespeichert werden.
ERSAlIBLATf (REGEL 28) Daten der Datenbank 14 können z.B. dem Benutzer 42 in einem permanenten Datenspeicher eines Contentmoduls 163 der Zentraleinheit 10 abgespeichert zur Verfügung gestellt werden. Die Daten des Datenspeichers können durch den Benutzer 42 modifizierbar sein. Die Daten des Benutzerprofils 162 können z.B. mindestens teilweise durch den Benutzer 42 modifizierbar sein. Der Benutzer 42 kann die im Datenspeicher des Contentmoduls 163 dem Benutzer zugeordnet abgespeicherten Daten mindestens teilweise selber verwaltet.
Die Daten der Datenbank 14 können basierend auf den Elementen 111 der Abfragemaske 112 und/oder dem Benutzerprofil 162 selektiert werden und von einer Zentraleinheit 10 an eine Kommunikationsvorrichtung 40/41 eines Benutzers 42 übermittelt werden. Mittels der Zentraleinheit 10 können z.B. basierend auf der Datenbank 14 gemäss dem Benutzerprofil 162 contentorientierte und benutzerspezifisch optimierte Daten bei einem entsprechenden Request an die Kommunikationsvorrichtung 40/41 eines Benutzers übermittelt werden. Das Benutzerprofil 162 kann z.B. permanent einem bestimmten Benutzer zugeordnet abgespeichert bleiben. Die Kommunikationsvorrichtung 40/41 des Benutzers kann beispielsweise ein PC (Personal Computer), TV, PDA (Personal Digital Assistant) oder ein Mobilfunkgerät sein (insbesondere z.B. in Kombination mit einem Broadcastempfänger). Das Benutzerprofil 162 kann Informationen über einen Benutzer wie z.B. Ort der Kommunikationseinheit 40/41 des Benutzers im Netzwerk, Identität des Benutzers, benutzerspezifische Netzwerkeigenschaften, benutzerspezifische Hardwareeigenschaften, Daten zum Benutzerverhalten etc. umfassen. Der Benutzer 42 kann insbesondere vorgängig mindestens Teile von Benutzerdaten des Benutzerprofils 161 festlegen und/oder modifizieren. Natürlich hat er auch die Möglichkeit auf die Daten der Datenbank 14 durch direkten Zugriff, also ohne Such- und Zusammenstellhilfe der Zentraleinheit 10 auf sie zuzugreifen. Die Daten des Benutzerprofils 161 können z.B. auch automatisch durch die Zentraleinheit 10, durch autorisierte Dritte oder ebenfalls vom Benutzer bestimmt sein. So kann die Zentraleinheit 10 z.B. automatische Anschlusserkennung, Benutzeridentifizierung und/oder automatisches Aufzeichnen und Auswerten des Benutzerverhaltens (Zeit des Zugriffs, Häufigkeit des Zugriffs etc.) umfassen. Diese Daten zum Benutzerverhalten
ERGATZBLAIT(REGa 28) können in einer Ausführungsvariante dann wiederum vom Benutzer 42 entsprechend seinen Wünschen modifizierbar sein.
Das Repackagingmodul 17 kann Mittel zum Optimieren der Daten der Datenbank 14 unter Berücksichtigung der Elemente 111 der Abfragemaske 112 und/oder der Benutzerdaten des Benutzerprofils 162 benutzerspezifisch derart umfassen, dass die Daten an die Anforderungen der Kommunikationsvorrichtung oder -Vorrichtungen 40/41 des Benutzers 42 und/oder die Kommunikationsverbindung von der Zentraleinheit 10 zu der genannten Kommunikationsvorrichtung oder -Vorrichtungen 40/41 angepasst sind. Das heißt, daß wie erwähnt von den selektierten Daten der Datenbank 14 mittels des Repackagingmoduls 17 unter Berücksichtigung des Benutzerprofils 162 und im speziellen entsprechenden Benutzerdaten contentorientierte und benutzerspezifisch optimierte Daten vor der Übermittlung erzeugt werden können. Zum Beispiel ist ein Benutzer 10 an Börsendaten (oder an einzelnen Teilinformationen der Börsendaten) interessiert, werden die gewünschten Daten aus den Netz gefundenen allgemeinen Daten extrahiert, die Datenbankstruktur dynamisch erzeugt oder angepasst, die Daten in der Datenbank zugeordnet abgespeichert, entsprechend zusammengestellt, und basierend auf dem Benutzerprofil 162 z.B. auf die benutzerspezifischen Hardwareeigenschaften oder den Netzwerkeigenschaften optimiert (z.B. komprimiert, sequenziert, Bildauflösung oder Tonqualität reduziert etc.). In einer Ausführungsvariante hat der Benutzer die Möglichkeit, Zugriffsrequestdaten vor dem Bezug von Daten im Benutzerprofil 162 z.B. auch mittels des Query- Generations-Moduls 11 festzulegen. Die Zugriffsrequestdaten können z.B. Zeit, Datum, Art, Bezeichnung, allgemeine Beschreibungen (z.B. auch Synonyme) und/oder Eigenschaften wie Auflösung etc. der gewünschten Daten umfassen. Dadurch, dass die Daten des Benutzerprofils 162 z.B. bezüglich Bildauflösung etc. nicht nur von der Zentraleinheit 10 bestimmt werden, sondern vom Benutzer 42 mindestens teilweise modifiziert werden können (z.B. Zugriffsrequestdaten), kann bei der Optimierung auch auf spezielle Benutzerwünsche (z.B. bezüglich Downloadzeiten) eingegangen werden. Unter Personifizieren von Daten ist u.a. der oben genannte Prozess der Auswahl von Daten und Sequenzen von Daten basierend auf der Abfragemaske 112 und/oder dem Benutzerprofil 162 oder gemäss direkten Angaben des
EB8A12BLΛTT (REGEL £6) Benutzers 42 gemeint. Es umfasst insbesondere eine content-bezogene Zusammenstellung von Daten, insbesondere Datenbank und/oder Datenbankstruktur. Unter benutzerspezifischem Optimieren der Daten kann u.a. das Optimieren auf z.B. benutzerspezifische Netzwerk- und/oder Hardwareeigenschaften und/oder Benutzerverhalten basierend auf der Abfragemaske 112 und/oder dem Benutzerprofil 162 gemeint sein.
Das Benutzerprofil 162 kann zusätzlich z.B. Zugriffsbedingungsdaten umfassen, welche einen vom Benutzer 42 und/oder der Zentraleinheit 10 definierbaren Geldbetragswert einer Kreditlimite festlegen, bis zu welcher Kreditlimite ein automatisches Billing der von der Datenbank basierend auf der Abfragemaske 112 bezogenen Daten stattfindet. Die Kreditlimite ist z.B. ein vom Benutzer 42 und/oder der Zentraleinheit 10 und/oder autorisierten Dritten (z.B. Banken, Kreditkartengesellschaften, Multimediadatenanbieter etc.) definierbarem Geldbetragswert und legt einen maximalen Geldbetragswert für den Bezug von kostenpflichtigen, contentorientierten und benutzerspezifisch optimierten Daten der Datenbank 14 und/oder der ganzen Datenbank 14 und/oder Datenbankstruktur 13 fest, bis zu welchem Geldbetragswert von der Zentraleinheit 10 ein automatisches Billing für den Bezug der Daten und/oder Datenbanken 14 etc. vorgenommen werden kann. Bei Überschreiten der Kreditlimite wird von der Zentraleinheit 10 beispielsweise eine Rückfrage an ein Bankinstitut bezüglich der Kreditwürdigkeit des Benutzers vorgenommen. Die Kreditlimite kann auch dem Benutzer 42 dazu dienen, ihn vor unvorhergesehenen Kosten für den Bezug der Leistung (Daten etc.) zu schützen. Insbesondere kann der Benutzer 42 über die Zentraleinheit 10 durch das Billing auch auf kostenpflichtige zugriffskontrollierte Daten und/oder Datenbanken 14 (Conditional Access) von Drittanbietern zugreifen. Das Handling und Verwalten der Verrechnung (Billing) und/oder der Zugriffsschlüssel kann z.B. von der Zentraleinheit 10 ausgeführt werden. Dekodieren und/oder Entschlüsseln der zugriffskontrollierten Daten und/oder Datenbanken 14 kann mittels eines Zugriffskontrollmodul der Zentraleinheit 10 oder des Repackagingmodul 17 erreicht werden, wobei z.B. Distribution Key und/oder Session Key (Schlüssel) nach dem ETSI-Standard verwendet werden können. Das Repackagingmodul 17 kann gemäss der Erfindung hardwaremässig oder softwaremässig ausgeführt sein. Für das Billing der bezogenen Daten und/oder Datenbanken
ERGATZBLATT (REGEL 26) und/oder Datenbankstrukturen, d.h. der Verrechnung des Bezugs der Leistung, können z.B. entsprechende Verrechnungsdaten von der Zentraleinheit 10 generiert werden, die z.B. Verrechnungsbelege (z.B. elektronisch signiert) umfassen, ähnlich wie CDR-Belege (CaII Data Records) bei sogenannten DUR- Belegen (DAB/DVB Usage Records). Die Verrechnungsbelege werden von der Zentraleinheit 10 z.B. an ein Clearingmodul einer Kreditkartengesellschaft übermittelt, wo sie weiter bearbeitet werden, oder die Zentraleinheit 10 kann z.B. die Verrechnung eigenständig durchführen. Mittels des Repackagingmoduls 17 können die contentorientierten und benutzerspezifisch optimierten Daten auch mit einem elektronischen Stempel, einer elektronische Signatur oder einem elektronischen Wasserzeichen versehen werden. Die elektronische Signatur erlaubt es, die contentorientierten und benutzerspezifisch optimierten Daten der Datenbank 14 zu einem beliebigen späteren Zeitpunkt dem Benutzer 42 zuzuordnen, welcher sie von der Zentraleinheit 10 und/oder der Datenbank 14 bezogen hat. Damit kann der Missbrauch von kostenpflichtigen Daten durch den Benutzer 42 oder Dritte verhindert werden.
Es kann z.B. auch sinnvoll sein , daß das Benutzerprofil 162 vom Benutzer 42 und/oder der Zentraleinheit 10 festlegbare Weiterverwendungsbedingungsdaten umfasst, basierend auf weichen Weiterverwendungsbedingungsdaten die Zentraleinheit 10 die Datenbank 14 und/oder die Datenbankstruktur 13 und/oder das Benutzerprofil 162 auswertet und Dritten zugänglich macht. Der Benutzer 42 kann so z.B. festlegen, bis zu welcher Stufe Daten über seine Datenbank 14 und/oder Datenbankstruktur 13 und/oder sein Benutzerverhalten oder sein Benutzerprofil 162 Dritten zugänglich gemacht werden darf und z.B. auch für statistische Erhebungen verwendet werden darf. Zum Beispiel kann so der Anbieter flexibel auf das Kundenverhalten und Kundenwünsche bei der Generierung generalisierter Datenbanken und/oder Datenbankstrukturen eingehen. Der Datenschutz ist dadurch durch den Benutzer 42 bestimmbar. Die Auswertung kann allgemein statistisch aber auch ganz individuell auf den spezifischen Benutzer 42 bezogen sein. Die Zentraleinheit 10 kann dabei als unabhängige Filterstation der Daten und/oder Datenbanken 14 und/oder Datenbankstrukturen 13 gemäss den Weiterverwendungsbedingungsdaten des Benutzers 42 wirken.
ERSATZBLÄrr(REGEL 26) Referenzliste
Zentraleinheit Query-Generations-Modul
1 11 Query-Elemente
112 Abfragemaske Extraktionsmodul Datenbankstruktur Datenbank Selektionsmittel Filtermodul
161 Metadaten
162 Benutzerprofil
163 Contentmodul Repackagingmodul /21/22 Netzwerkinterfaces und/oder Datenbankschnittstellenmodul /31/32 Daten/Datenrekords /41 Kommunikationsvorrichtung Benutzer Netzwerk
ER3A

Claims

Patentansprüche
1. System zur automatisierten Generierung von Datenbankstrukturen (13) und/oder Datenbanken (14), wobei unstrukturierte Daten und/oder Datenrekords (30,...,32) mittels einer Zentraleinheit (10) basierend auf der Datenbankstruktur (13) erfasst und einander zugeordnet sind und wobei die Zentraleinheit (10) Mittel (15) zum Selektieren der Daten der Datenbank (14) basierend auf Benutzerinformationen umfasst, dadurch gekennzeichnet,
dass die Zentraleinheit (10) ein Query-Generations-Modul (11) umfasst, wobei mittels durch einen Benutzer (42) selektierbaren Elementen
(111) des Query-Generations-Moduls (11) eine personifizierte Abfragemaske
(112) zur Suche entsprechender Daten erzeugbar und/oder modifizierbar ist,
dass das System ein Extraktionsmodul (12) umfasst, wobei die Datenbankstruktur mittels des Extraktionsmodul (12) dynamisch basierend auf den Elementen der personifizierten Abfragemaske (112) und mindestens teilweise durch automatische Analyse der unstrukturierten Daten und/oder Datenrekords (30,...,32) generierbar ist und die unstrukturierten Daten und/oder Datenrekords (30,...,32) der Datenbankstruktur (13) zugeordnet in einer Speichereinheit (14) des Systems abspeicherbar ist.
2. System nach Anspruch 1, dadurch gekennzeichnet, dass das System ein Filtermodul (16) zum Erzeugen von Metadaten (161) umfasst, wobei die Metadaten (161) basierend auf den Elementen (111) der personifizierten Abfragemaske (112) mindestens teilweise durch automatische Analyse der unstrukturierten Daten und/oder Datenrekords (30,....32) erzeugbar und den Daten zuordenbar sind, wobei die Datenbankstruktur (13) basierend auf den Metadaten (161 ) und/oder den Elementen der personifizierten Abfragemaske (112) dynamisch generierbar ist.
3. System nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, dass das Filtermodul (16) Mittel zum mindestens teilweisen dynamischen Generieren der Metadaten (161) umfasst, wobei die dynamische
BERtCHTIGTES BLATT (REGEL 91) ISA/EP Generierung mindestens teilweise basierend auf den Elementen (111) der personifizierten Abfragemaske (112) erfolgt.
4. System nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, dass das Filtermodul (16) ein Benutzerprofil (162) umfaßt, welches anhand von Benutzerinformationen erstellbar ist, wobei die Generierung der Metadaten (161) mindestens teilweise zusätzlich basierend auf dem Benutzerprofil (162) erfolgt.
5. System nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass die Zentraleinheit (10) ein Repackagingmodul (17) umfasst, wobei die Daten der Datenbank (14) mittels des Repackagingmoduls (17) unter Berücksichtigung der Elemente (111) der Abfragemaske (112) und der Daten des Benutzerprofils (162) contentorientierte und benutzerspezifisch optimierbar sind.
6. System nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass die Zentraleinheit ein Contentmodul (163) umfasst, wobei die Daten der Datenbank dem Benutzer (42) in einem permanenten Datenspeicher des Contentmoduls (163) abgespeichert zugreifbar sind und welche Daten der Datenspeichers durch den Benutzer (42) modifizierbar sind.
7. System nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass die Daten des Benutzerprofils (163) mindestens Teile umfassen, welche durch den Benutzer (42) modifizierbar sind.
8. System nach einem der Ansprüche 6 oder 7, dadurch gekennzeichnet, dass die im Datenspeicher des Contentmoduls (163) denn Benutzer zugeordnet abgespeicherten Daten mindestens Teile umfassen, welche durch den Benutzer (42) selber verwaltbar sind.
9. System nach einem der Ansprüche 1 oder 8, dadurch gekennzeichnet, dass die Zentraleinheit (10) Mittel zum Selektieren (15) von Daten der Datenbank (14) basierend auf den Elementen (111) der Abfragemaske (112) und/oder dem Benutzerprofil (162) umfasst, welche Daten
BERICHTJGTES BLATT (REGEL 91) ISA/EP mittels eines Kommunikationsmoduls der Zentraleinheit (10) an eine Kommunikationsvorrichtung (40/41) eines Benutzers (42) übermittelbar sind.
10. System nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass mittels des Repackagingmodul (17) die Daten der Datenbank (14) unter Berücksichtigung der Elemente (111) der Abfragemaske (112) und/oder der Benutzerdaten des Benutzerprofils (162) benutzerspezifisch derart optimierbar sind, dass sie an die Anforderungen der Kommunikationsvorrichtung oder -Vorrichtungen (40/41) des Benutzers (42) und/oder die Kommunikationsverbindung von der Zentraleinheit (10) zu der genannten Kommunikationsvorrichtung oder -Vorrichtungen (40/41) angepasst sind.
11. System nach Anspruch 9, dadurch gekennzeichnet, dass das Benutzerprofil (162) Zugriffsbedingungsdaten umfasst, welche einen vom Benutzer (42) und/oder der Zentraleinheit (10) definierbaren Geldbetragswert einer Kreditlimite festlegen, bis zu welcher Kreditlimite ein automatisches Billing der von der Datenbank (14) basierend auf der Abfragemaske (112) bezogenen Daten stattfindet.
12. System nach einem der Ansprüche 3 bis 11 , dadurch gekennzeichnet, dass die Zentraleinheit (10) eine Speichereinheit und entsprechende Mittel zum automatischen Erfassen von Daten zum Benutzerverhalten und zum dem Benutzerprofil (162) zugeordneten Speichern der Daten umfasst.
13. System nach einem der Ansprüche 3 bis 12, dadurch gekennzeichnet, dass das Benutzerprofil (162) vom Benutzer und/oder der Zentraleinheit (10) festlegbare Weiterverwendungsbedingungsdaten umfasst, basierend auf welchen Weiterverwendungsbedingungsdaten mittels der Zentraleinheit (10) die Datenbank (14) und/oder die Datenbankstruktur (13) und/oder das Benutzerprofil (112) auswertbar und für Dritten zugreifbar ist.
14. Verfahren zur automatisierten Generierung von
Datenbankstrukturen (13) und den entsprechenden Datenbanken (14), wobei unstrukturierte Daten und/oder Datenrekords (30,...,32) mittels der
BERICHTIGTES BLATT (REGEL 91) ISA/EP Datenbankstruktur (13) erfasst und einander zugeordnet werden, und wobei die Daten der Datenbank (14) basierend auf Benutzerinformationen seiektierbar sind, dadurch gekennzeichnet,
dass mittels Elementen (111) eines Query-Generations-Modul (11) ein Benutzer (42) eine benutzerspezifische Abfragemaske (112) zur Suche entsprechender Daten erzeugt und/oder modifiziert,
dass die Datenbankstruktur (13) dynamisch basierend auf den Elementen (111) der personifizierten Abfragemaske (112) und mindestens teilweise durch automatische Analyse der unstrukturierten Daten und/oder Datenrekords generiert wird und die unstrukturierten Daten und/oder Datenrekords (30,...,32) der Datenbankstruktur (13) zugeordnet abgespeichert werden.
15. Verfahren nach Anspruch 14, dadurch gekennzeichnet, dass basierend auf den Elementen (111 ) der personifizierten Abfragemaske (112) mindestens teilweise durch automatische Analyse der unstrukturierten Daten und/oder Datenrekords Metadaten (161) erzeugt und den Daten zugeordnet werden, wobei die Datenbankstruktur (13) basierend auf den Metadaten (161) und/oder den Elementen (111) der personifizierten Abfragemaske (112) dynamisch generiert und zugeordnet wird.
16. Verfahren nach einem der Ansprüche 14 oder 15, dadurch gekennzeichnet, dass die Metadaten (161) mindestens teilweise dynamisch generiert werden, wobei die dynamische Generierung mindestens teilweise basierend auf den Elementen (111) der personifizierten Abfragemaske (112) erfolgt.
17. Verfahren nach einem der Ansprüche 14 bis 15, dadurch gekennzeichnet, dass ein Benutzerprofil (162) anhand von Benutzerinformationen erstellt wird, wobei die Generierung der Metadaten (161) mindestens teilweise zusätzlich basierend auf dem Benutzerprofil (162) erfolgt.
BERICHTIGTES BLATT (REGEL 91) ISA/EP
18. Verfahren nach einem der Ansprüche 14 bis 17, dadurch gekennzeichnet, dass die Daten der Datenbank (14) mittels eines Repackagingmoduls (17) unter Berücksichtigung der Elemente (111) der Abfragemaske (112) und der Daten des Benutzerprofils (162) contentorientiert und benutzerspezifisch optimierte werden.
19. Verfahren nach einem der Ansprüche 14 bis 18, dadurch gekennzeichnet, dass die Daten der Datenbank (14) dem Benutzer (42) in einem permanenten Datenspeicher eines Contentmoduls (163) einer Zentraleinheit (10) abgespeichert zur Verfügung gestellt werden und welche Daten des Datenspeichers durch den Benutzer (42) modifizierbar sind.
20. Verfahren nach einem der Ansprüche 17 bis 19, dadurch gekennzeichnet, dass die Daten des Benutzerprofils (162) mindestens teilweise durch den Benutzer (42) modifizierbar sind.
21. Verfahren nach einem der Ansprüche 17 oder 20, dadurch gekennzeichnet, dass der Benutzer (42) die im dem Benutzer zugeordneten Datenspeicher des Contentmoduls (163) abgespeicherten Daten mindestens teilweise selber verwaltet.
22. Verfahren nach einem der Ansprüche 14 oder 21, dadurch gekennzeichnet, dass Daten der Datenbank (14) basierend auf den Elementen (111). der Abfragemaske (112) und/oder dem Benutzerprofil (162) selektiert werden und von einer Zentraleinheit (10) an eine Kommunikationsvorrichtung (40/41) eines Benutzers (42) übermittelt werden.
23. Verfahren nach einem der Ansprüche 14 bis 22, dadurch gekennzeichnet, dass das Repackagingmodul (17) die Daten der Datenbank (14) unter Berücksichtigung der Elemente (111) der Abfragemaske (112) und/oder der Benutzerdaten des Benutzerprofils (162) benutzerspezifisch derart optimiert, dass sie an die Anforderungen der Kommunikationsvorrichtung oder -Vorrichtungen (40/41) des Benutzers (42) und/oder die Kommunikationsverbindung von der Zentraleinheit (10) zu der genannten Kommunikationsvorrichtung oder -Vorrichtungen (40/41) angepasst sind.
BERICHTIGTES BLATT (REGEL 91) ISA/EP
24. Verfahren nach Anspruch 23, dadurch gekennzeichnet, dass das Benutzerprofil (162) Zugriffsbedingungsdaten umfasst, welche einen vom Benutzer (42) und/oder der Zentraleinheit (10) definierbaren Geldbetragswert einer Kreditlimite festlegen, bis zu welcher Kreditlimite ein automatisches Billing der von der Datenbank basierend auf der Abfragemaske (112) bezogenen Daten stattfindet.
25. Verfahren nach einem der Ansprüche 17 bis 24, dadurch gekennzeichnet, dass Daten zum Benutzerverhalten von der Zentraleinheit (10) automatisch erfasst und dem Benutzerprofil (162) zugeordnet abgespeichert werden.
26. Verfahren nach einem der Ansprüche 17 bis 25, dadurch gekennzeichnet, dass das Benutzerprofil (162) vom Benutzer (42) und/oder der Zentraleinheit (10) festlegbare Weiterverwendungsbedingungsdaten umfasst, basierend auf welchen Weiterverwendungsbedingungsdaten die Zentraleinheit (10) die Datenbank (14) und/oder die Datenbankstruktur (13) und/oder das Benutzerprofii (162) auswertet und Dritten zugänglich macht.
27. Computerprogrammprodukt, das direkt in den internen Speicher eines digitalen Computers geladen werden kann und Softwarecodeabschnitte umfasst, mit denen die Schritte gemäss einem der Ansprüche 14 bis 26 ausgeführt werden, wenn das Produkt auf einem Computer läuft.
BERICHTIGTES BLATT (REGEL 91) ISA/EP
PCT/EP2006/061175 2006-01-27 2006-03-30 System zur automatisierten generierung von datenbankstrukturen und/oder datenbanken und entsprechendes verfahren WO2007085304A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US76250106P 2006-01-27 2006-01-27
US60/762,501 2006-01-27

Publications (1)

Publication Number Publication Date
WO2007085304A1 true WO2007085304A1 (de) 2007-08-02

Family

ID=37143048

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2006/061175 WO2007085304A1 (de) 2006-01-27 2006-03-30 System zur automatisierten generierung von datenbankstrukturen und/oder datenbanken und entsprechendes verfahren

Country Status (1)

Country Link
WO (1) WO2007085304A1 (de)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19955717A1 (de) * 1998-11-11 2000-08-24 Ibm Umwandlung unstrukturierter Daten in strukturierte Daten
US20030037037A1 (en) * 2001-08-17 2003-02-20 Ec Outlook, Inc. Method of storing, maintaining and distributing computer intelligible electronic data
US20040024720A1 (en) * 2002-02-01 2004-02-05 John Fairweather System and method for managing knowledge

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19955717A1 (de) * 1998-11-11 2000-08-24 Ibm Umwandlung unstrukturierter Daten in strukturierte Daten
US20030037037A1 (en) * 2001-08-17 2003-02-20 Ec Outlook, Inc. Method of storing, maintaining and distributing computer intelligible electronic data
US20040024720A1 (en) * 2002-02-01 2004-02-05 John Fairweather System and method for managing knowledge

Similar Documents

Publication Publication Date Title
EP2100234B1 (de) System und verfahren zur benutzergesteuerten multidimensionalen navigation und/oder themenbasierten aggregation und/oder überwachung von multimediadaten
EP1877932B1 (de) System und verfahren zur aggregation und überwachung von dezentralisiert gespeicherten multimediadaten
DE202015009875U1 (de) Transparente Entdeckung eines semistrukturierten Datenschemas
US20110282854A1 (en) Virtual repository management
US20130218919A1 (en) Method and apparatus for managing content
CN102314497B (zh) 一种用于识别标记语言文件主体内容的方法和设备
EP1909198A2 (de) Semantische Partitionierung von Daten
WO2009149926A2 (de) System und verfahren zur rechnerbasierten analyse grosser datenmengen
DE102013200355A1 (de) Zusammenfügen von Dokumenten aud der Grundlage der Kenntnis eines Dokumentenschemas
EP3563261B1 (de) Bitsequenzbasiertes datenklassifikationssystem
WO2005057426A1 (de) System und verfahren zur aggregation und analyse von dezentralisiert gespeicherten multimediadaten
WO2018104274A1 (de) Datenbankindex aus mehreren feldern
DE102016224470A1 (de) Server-Computersystem zur Bereitstellung von Datensätzen
WO2007085304A1 (de) System zur automatisierten generierung von datenbankstrukturen und/oder datenbanken und entsprechendes verfahren
CN115168474B (zh) 一种基于大数据模型的物联中台系统搭建方法
WO2005050471A2 (de) Datenverarbeitungssystem und -vorrichtung
US20070255670A1 (en) Method and System for Automatically Producing Computer-Aided Control and Analysis Apparatuses
DE10215494A1 (de) Computersystem für das Wissensmanagement
Fenlon et al. Tooling the aggregator's workbench: Metadata visualization through statistical text analysis
WO2009140995A1 (de) System und verfahren zur aggregation und übermittlung von prozessmetadaten heterogener herstellungsprozessketten
CN113505172B (zh) 数据处理方法、装置、电子设备及可读存储介质
DE112011100951T5 (de) Hoch entwickelte funktionale Verhaltensweisen in einem Datenbankverwaltungssystem
DE102005056551A1 (de) Video Daten Verzeichnis
EP2124119B1 (de) System und Verfahren zur Aggregation und Übermittlung von Prozessmetadaten heterogener Herstellungsprozessketten
DE19958861C2 (de) Verfahren zum automatischen Registrieren bei einer Suchmaschine eines Computer-Netzwerks

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 06725428

Country of ref document: EP

Kind code of ref document: A1