DK176532B1 - Fremgangsmåde til integration af dokumenter med OLAP ved brug af sögning, computerlæsbart medium og computer - Google Patents

Fremgangsmåde til integration af dokumenter med OLAP ved brug af sögning, computerlæsbart medium og computer Download PDF

Info

Publication number
DK176532B1
DK176532B1 DK200600988A DKPA200600988A DK176532B1 DK 176532 B1 DK176532 B1 DK 176532B1 DK 200600988 A DK200600988 A DK 200600988A DK PA200600988 A DKPA200600988 A DK PA200600988A DK 176532 B1 DK176532 B1 DK 176532B1
Authority
DK
Denmark
Prior art keywords
search
metadata
computer
data
database
Prior art date
Application number
DK200600988A
Other languages
English (en)
Inventor
Morten Middelfart
Original Assignee
Targit As
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Targit As filed Critical Targit As
Priority to DK200600988A priority Critical patent/DK176532B1/da
Priority to US11/509,832 priority patent/US7949674B2/en
Priority to EP07388055A priority patent/EP1881429A3/en
Publication of DK200600988A publication Critical patent/DK200600988A/da
Priority to DKPA200800740A priority patent/DK177142B1/da
Application granted granted Critical
Publication of DK176532B1 publication Critical patent/DK176532B1/da

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

DK 176532 B1
Fremgangsmåde til integration af dokumenter med OLAP ved brug af søgning, computerSæsbart medium og computer
Teknisk område 5
Det tekniske område angår det at lave en præsentation af et datasæt med strukturerede data. De strukturerede data tiivejebringes fra en såkaldt OLAP-database, en første database, hvor numre og sammeniægninger af numre gemmes i en struktur, der defineres ved såkaldte "dimensions" og "measu-10 res”. Disse betegnelser er velkendte inden for databaseområdet. Metadata-elementer, såsom navne på ’’dimensions” (dimensioner), ’’measures” (mål) og kriterier definerer datatsættet i forhold tii et datasupersæt, der er gemt s den første database med strukturerede data, 15 Baggrund
Aktuelle datavarehus- og OLAP-teknoiogier kan anvendes tii at analysere de strukturerede data, som organisationer iagrer i deres databaser. Disse organisationer frembringer også mange dokumenter og bruger nettet som deres 20 største kilde ti! ekstern information. Eksempler på interne og eksterne kilder til information omfatter f.eks. rapporter om indkøbstendenser og markedsundersøgeiser.
Betegnelsen OLAP angiver en kategori af databaser, applikationer og tekno-25 logier, som tillader indsamling, lagring, håndtering og reproduktion af multi-dimensionale data med henblik på dataanalyse. Typisk omfatter OLAP-databaser en -- eller i det mindste færre - tabeller end en sammenlignelig relationel database. OLAP-databaser lagrer typisk forud beregnede sammenlægninger af data med henblik på at gøre sammenlagte tal umiddelbart til-30 gængelige til dataanalyseformål.
r 2 OK 176532 B1
Databaser til analyseformåi og tilhørende brugergrænseflader bliver i stigende grad anvendt af mennesker, som ikke har specialistviden om databaser som et potent værktøj til at fremlægge og analysere data, der er indsamiet inden for deres arbejdsområde. Disse mennesker tyr til databaserne, fordi de 5 ønsker mere effektivt at få indsigt i de fakta, som er relevante for deres profession.
Der ser imidlertid ud til at være et stadigt behov for, at ydeevnen af disse databaseværktøjer bliver større og større, og et behov for øget effektivitet ved 10 brug af disse værktøjer. Et enkeit, men meget relevant mål for effektivitet i brugen af sådanne værktøjer er det antai brugerinteraktioner, der kræves for at nå et ønsket resultat. Et andet mål er kompleksiteten af interaktioneme.
Hvis brugeren, som måske ikke er databaseekspert, oplever, at kompleksiteten af brugerinteraktionerne er relativt bøj og desuden ligger noget ved siden 15 af hans forventninger om, hvad der kræves for at nå frem til et ønsket resultat, vil brugeren have en tendens til at blive irriteret eller frustreret og opgiver måske at bruge databaseværktøjet.
Kendt teknik 20
Generelt kendes der forskellige systemer til søgning og genfinding af information.
I EP 1 477 909 beskrives der forskellige aspekter ved at identificere, lagre, 25 genfinde og på anden måde håndtere metadata i forhold til en multidimensional database, hvor der er lagret strukturerede data i databasen.
I ”A Relevance-Extended Multi-dimensional Mode! for a Data Warehouse Contextualized with documents” af Juan Manuel Perez og Torben Bach Pe-30 dersen et a!, 2005, beskrives en kombination af et traditionelt datavarehus og et dokumentdatavarehus, som resulterer i et kontekstusliseret varehus. Dette OK 178532 B1 3 - kontekstualiserede - varehus kan hoicle historisk styr på fakta, som beskrives af dataene, og deres kontekst som beskrevet af dokumenterne. En særlig OLAP kubus betegnet en R-kubus beskrives. R-kuber er kendetegnet ved to særlige dimensioner; en relevans-dimension, som måler relevansen af 5 hvert faktum i en valgt analysekontekst, og en kontekst-dimension, som relaterer hvert faktum til de dokumenter, som forklarer deres omstændigheder.
Der beskrives en arkitektur for integrationen af et datavarehus med strukturerede data med et dokumentvarehus med ustrukturerede dokumenter. Dokumentvarehusene kan bruges til af lagre ikke-struktureret information fra orga-10 nisationers interne og eksterne kilder f.eks, i et XML-format R-kuber forudsætter imidlertid en speciel struktur med yderligere dimensioner, som skal installeres med prækompileret information om dokumentreSe-vans. Dette medfører en yderligere indsats til at opsætte, opdatere og vedSi-15 geholde en R-kubus sammenlignet med en almindelig OLAP-kubus. Når der ankommer nye dokumenter eller de skal lagres i dokumentdatabasen, ser det ud til, at det er nødvendigt med genberegning af relevans-'measure".
En bruger, som ved, at der findes et relevant dokument, som endnu ikke er 20 lagret i dokumentdatabasen, vil opleve, at systemet har lav performance og begynder måske et lede efter dokumentet med det søgeværktøj, som han måtte have til rådighed, Brugeren vil dog sandsynligvis anse denne søgning for at ligge uden for hans forventninger til en R-kubus med hensyn til, hvad der kræves for at finde frem til det relevante dokument.
25
Kort beskrivelse
Der tilvejebringes en computer-implementeret fremgangsmåde, som er ejendommelig ved at omfatte; at konvertere metadata-elementerne til en søgefo-30 respørgsel, at rette søgeforespørgslen til en søgemaskine med henblik på at DK 176532 B1 4 søge efter dokumenter, der befinder sig i en anden database; optage søgeresultatet, og lave en præsentation af søgeresultatet.
En bruger slipper således for opgaven med at specificere søgeforespørgse-5 len ~ hvilket ofte medfører tidskrævende triai-and-error forsøg. Det antal bru-gerinteraktioner, der er nødvendigt for, at en bruger kan forberede en søgning, sænkes betydeligt.
Der drages nytte af det erkendte faktum, at metadata omfatter værdifuld in-10 formation ikke biot tii at genfinde strukturerede data, men også til at søge efter dokumenter. Derved bliver det muligt at søge automatisk efter dokumenter ved automatisk at frembringe søgeforespørgsier fra en kontekst, hvor der udføres dataanalyse af strukturerede data. Føigeiig forbedres funktionaii-teten af databasen betydeligt, samtidig med at effektiviteten også forbedres.
15 Idet søgningen efter dokumenter kan udvides til en anden database og ud over den første database, hvor der er gemt strukturerede data, bliver belastningen på opsætning og vedligeholdelse af den database, der indeholder de strukturerede data, stort set ikke øget, samtidig med at der tilvejebringes en langt mere dynamisk indfaldsvinkel til dokumentgenfinding i sammenhæng 20 med struktureret dataanalyse.
Datasupersættet kan lagres i en første database og de forskellige søgninger kan udføres s perifere datakilder. Den første database kan være en multidimensional database, eller en database som emuleres, så den ser ud som en 25 multidimensional database; .de perifere datakilder kan omfatte filservere, in~ ternetressourcer, osv.
Søgeforespørgsleme kan omfatte forespørgsler rettet mod en søgning efter metadata af dokumenter.
30 DK 176532 B1 5
P
Fremgangsmåden kan omfatte at konvertere et metadata-element, der relaterer sig til en tidsdimension, til en søgeforespørgsel, som adresserer metadata af dokumenter. Derved kan dokumenter, som (kun) matcher søgefore-spørgselen på deres metadata, blive fremfundet ved søgningen: dette er vig-5 tigt, idet det har vist sig, at information om tid sjæidenf er nyttig i en fritekstsøgning. Imidlertid vil metadata i dokumenterne otte afspejle tidsrelevansen af dokumentet.
Fremgangsmåden kan også omfatte at konvertere metadata-elementer til ord 10 og oversætte ordene fra ét sprog til et andet sprog. Derved kan et eller flere brugersprog, som er forskellige fra basissproget, understøttes. Desuden kan søgeforespørgslerne frembringes i forskellige sprogversioner for at udvide søgningens område til dokumentsamlinger på andre sprog.
15 Frembringelse af de forskellige søgeforespørgsler ved at fjerne og/eller ændre metadata-eiementerne fra metadatasæltet, der vælges for de forskellige søgeforespørgsler, kan også udføres. Derved bliver det muligt at automatisk udføre søgninger, som har forskelligt område; de forskellige områder og respektive resultater kan rangeres.
20
Modificering af et dokument for at forsyne det med indholdet af en søgeforespørgsel således at det sikres, at information forekommer både i søgefore-spørgselen og i dokumentet, kan også udføres. Derved bliver sandsynligheden for at være i stand til atter at genfinde dokumentet i samme kontekst 25 stærkt forbedret. Det er særligt vigtigt, idet en bruger måske har fundet et stærkt relevant dokument, som det måske ville være ønskeligt at kunne genfinde på et senere tidseiement - af samme bruger elier en anden bruger, som kunne drage nytte af, at en tidligere bruger tidligere har udført samme analyse. At indføre indholdet af søgefoæspørgselen i dokumentet kan udfø-30 res automatisk eller som svar på, at en bruger udtrykkeligt markerer dokumentet som relevant.
OK 176532 B1 6
Fremgangsmåden kan også omfatte at etablere et link fra søgeforespørgse-ien til dokumentet og/eiler fra dokumentet ti! søgeforespørgseten. Derved bliver det muligt at kortlægge søgeforespørgseten i forhold til et eller flere 5 link(s), som angiver dokumentets lokalitet. Det kan udføres automatisk eller som svar på, at en bruger udtrykkeligt markerer dokumentet som relevant.
Der tilvejebringes også et computerlæsbart medium, hvorpå er indkodet et program, som, når det køres på en computer, får computeren ti! at udføre 10 ovennævnte fremgangsmåde. Desuden tilvejebringes der en computer, hvorpå der er indkodet et program, som, når det køres på en computer, får computeren ti! at udføre fremgangsmåden.
Kort beskrivelse af tegningen 15
Der tilvejebringes en detaljeret beskrivelse, idet der henvises til tegningen, hvor:
Fig, 1 viser et procesdiagram over at frembringe og udføre en søgning ud fra 20 metadata;
Fig 2 viser et søjlediagram over et system med at frembringe og udføre en søgning ud fra metadata;
Fig. 3 viser et procesdiagram over at frembringe de forskellige søgninger; og Fig. 4 viseren visningsstruktur, 25
Detailbeskrivelse
En dimension er en samling af data af samme type; den tiliader strukturering af en multidimensional database. En multidimensional database defineres 30 typisk som en database med mindst tre uafhængige dimensioner, “Measures” er data struktureret efter dimensioner. I et "measure” er hver datacelle DK 176532 B1 7 forbundet med en enkelt position i en dimension. "Dimensions” og "measures” angives ved deres navne. "Dimensions” kan have parametre eller dimensionsværdier, som specificerer værdier eller værdiområder for den dimension for hvilken der vælges associerede værdier af “measures”. “Measu-5 res”, "dimensions” og dimensionsværdier benævnes også metadata-elementer og kan kombineres i et sæt af metadata-eiementer. Sådanne me* tadata-eiementer kan specificere et datasubsæt ud fra et datasupersæt, som er gemt i en database. Metadatasættet gøres ofte uafhængigt af enhver specifik forespørgselssyntaks, som måtte bruges i trinnet med faktisk at genfinde 10 datasubsættet fra databasen.
Der kan tilvejebringes særlige moduler til at transformere operationelle data fra en kildedatabase eller transaktionsdatabase til analytiske data I et datavarehus. I nogle situationer vil det være uhensigtsmæssigt at transformere de 15 operationelle data ti i analytiske data, som lagres i en anden database. Derfor kan den operationelle database, som typisk er en relationel database, emuleres, således at den viser en grænseflade, hvormed den operationelle database fremkommer og kan adresseres som en multidimensional database. ! nedenstående kan betegnelsen ’database’ angive enhver type database, 20 uanset om den er analytisk eller transaktionel.
På fig. 1 vises et procesdiagram over at frembringe og udføre en søgning ud fra metadata. I trin 101 indsamles der et sæt af metadata-eiementer, som definerer et datasæt ud fra et datasupersæt. Sættet af metadata-eiementer 25 kan indsamles ved hjælp af et system som vist på fig. 2, hvor sættet af metadata-eiementer kan være det sæt af metadata, som definerer de aktuelt viste data.
For eksempel kan sættet af metadata være som følger i et eksempel på for-30 mat: OK 170532 Bl 8
P
{REVENUE; T1ME__MONTH; CGUNTRY=’’Hungary”; PRODUCT^Jeans; TI M E__YEAR~'!200ø"} hvor elementer i metadatasættet omsluttes af krølleparenteser og adskilles af 5 semikoloner. Ordene med store bogstaver angiver navne på “measures” eller "dimensions” i den multidimensionale database, langs hvilken ”measure{s)” vises. Navnene på ’’dimensions’' efterfølges af et lighedstegn og en parameter, som angiver en dimensionsværds eller område af værdsen Databasen vil blive forberedt med information, der indeholder information om, hvilke navne, 10 der er “measures”, og hvilke, der er ’’dimensions”, i denne henseende er det således Ikke nødvendigt at tilvejebringe yderligere information i sættet af me-tadataelementer udover navnene og dimensionsværdierne. Formatet kan udvælges eller defineres, som det vil være en fagmand bekendt - det kan f.eks. være i overensstemmelse med XML 15
Det første element er "revenue”, som defineres af databasen som værede et “measure”. Det andet element specificerer, at "revenue" skal vises med månedlige intervaller, dvs. at TIMEJVIONTH defineres som værende en "dimension”. Dat tredje element specificerer det kriterium, at "revenue" skal be-20 grænses til værdier, hvor "country” {defineret som en "dimension”) er "Hungary”. Det fjerde element specificerer, at "revenue” skal begrænses til værdier, hvor "product” (defineret som en "dimension") er "Jeans".
Disse metadata indsamles eller hentes fra et lager, når en bruger får vist en 25 såkaldt visning og spørger efter en søgning efter dokumenter. En visning omfatter et eller flere præsentationsobjekter, men vil blive forklaret mere detaljeret i forbindelse med fig. 4. Faktisk svarer ovenstående eksempel til en situation, hvor visningsstrukturen kun omfatter et enkelt præsentationsobjekt. Det vil blive beskrevet nedenfor, hvorledes et sæt af metadataelementer med 30 elementer fra adskillige visninger håndteres. Metadatasættet specificerer de data, der vises ved visningen, og bliver således hurtigt til rådighed med hen- OK 178532 B1 9 blik på at blive forberedt til søgning efter dokumenter. Derved frigøres en bruger fra den opgave at skulle specificere indholdet af metadatasætfet eller dets lokatlon. Herved reduceres det antal brugerinteraktloner, som er nødvendigt for, at en bruger kan frembringe en søgning, meget.
5 Når sættet af metadata ifølge ovenstående eksempel er blevet hentet, frembringes der forskellige subsæt af metadataelemenfer (fra metadatasættet) i trin 102. Subsætiene kan frembringes på forskellige måder, men det ønskes generelt at prioritere eller rangere subsætiene ved at reducere og/eller ænd-10 re elementerne hen over de forskellige subsæt Subsætiene betegnes f.eks.
MSS-1, MSS-2.....MSS-n, hvor MSS-1 er et primært subsæt og MSS-2 til MSS-n er underordnede i forhold dertil. Det eksempelvise indhold af metada-tasættene MSS-1, MSS-2, MSS-3, MSS-4 vises nedenfor: i MSS-1 MSS-2 | MSS-3 MSS-4 f 1...........................................................
Revenue Revenue Revenue
COUNTRY
Hungary Hungary Hungary
PRODUCT
Jeans Jeans Jeans
YEAR I I
2006 2006 2006 | 2006 | 15
Efterfølgende frembringes der i trin 103 respektive, forskellige søgefore-spørgsler betegnet S-1, S-2, ..., S-π ud fra de forskellige subsæt af metadata (MSS-1, MSS-2, ..., MSS-n). Søgeforespørgsierne tilpasses i overensstemmelse med grænsefladen af en søgemaskine, f.eks. en grænseflade, som 20 tilvejebrlnger mulighed for fritekstsøgning. En søgemaskine kan være en hver type søgemaskine, der søger efter indhoid inden for området af en lokal computer, et privat computernetværk eller en del deraf eller et offentligt tilgængeligt netværk såsom Internettet.
r DK 176532 B1 10
Alt afhængigt af et ønsket omfang af søgningen kan der vælges en passende søgemaskine. Søgemaskinen kan f.eks. være Googte Desktop™, Microsoft Desktop™ eiier enhver anden søgemaskine, f.eks. de, der kategoriseres som 5 såkaldte ’’enterprise search engines". En "enterprise search engine” kan være eiier er ofte konfigureret til at søge i dokumenter, som er gemt inden for et privat netværk. Terminologien, som bruges i sådanne dokumenter, kan Signe den terminologi, der bruges i dataiageret, idet de ofte frembringes af samme organisation. Derved bliver sandsynligheden for at opnå søgeresultater fra en 10 relativt snæver eiier specifik søgeforespørgsei øget. Søgemaskinen kan søge efter dokumenter i forskellige formater, f.eks. i HTML-format, PDF-format, navnebeskyttede tekstbehandiingsformater, regnearksformater, e-mail-formater, osv. Dokumenterne kan have indhold f.eks. i form af tekst i et tekstbehandlingsdokument. Desuden kan disse dokumenter have forskellige 15 egenskaber og/eller forskellige typer egenskaber, f.eks. en egenskab, der angiver, på hvilken dato og/eller tidspunkt dokumentet blev modificeret og/eller oprettet, Disse egenskaber betegnes også metadata af dokumenterne eller dokumentmetadata.
20 De forskellige søgemaskiner kan udvise forskellige grænseflader, som kræver forskellig syntaks. Sådanne grænseflader kan udvise adgang udelukkende til indholdet af dokumenterne eller også adgang til dokumentmetadata eller en del af dokumentmetadataene.
25 1 fortsættelse af ovenstående eksempel frembringes nedenstående søgefo- respørgsier: Søgeforespørgsei: S-1 "revenue country Hungary product Jeans year 2006” 5-2 "revenue Hungary jeans 2006” r DK 176532 B1 11 S-3 “bungary jeans” S-4 “revenue” Søgeforespørgslerne formaleres til data af strengtypen, hvor mellemrum og f.eks. ASCIl-karakterer specificerer indholdet af søgeforespørgslerne. Det bemærkes, at søgeforespørgsierne S-3 og S-4 mangier ”20G6”-udsagnet 5 Imidlertid kan der bruges andre formater end strengtypen, f.eks. formater i henhold til XML eller SOAP (Simple Object Application Protocol).
Metadata, som formateres til søgemaskinen (eller dennes grænseflade) kan være en del af de forskellige søgeforespørgsler eller blot nogle af dem. Me~ 10 tadata til søgemaskinen kan formateres I overensstemmelse med en specifik syntaks, som kræves af søgegrænsefladen, f.eks. i henhold til XML eller SOAP. I eksemplet kan "2GG8”-udsagnet formateres i henhold til en given syntaks.
15 Det kan antages, at grænsefladen accepterer metadata med følgende syntaks: [m@tadata:date_modified:ddjmm„.yyyy], hvor metadata er et ord, der reserveres af grænsefladen, som identificerer, at der leveres metadata.; da~ ta__modified er et reserveret ord af en opregnet type og specificerer typen af metadata; og dd_mm_yyyy er en formatering af en data, som accepterer %-20 tegnet som wildcard. Således kan f.eks. S-3 og S-4 forsynes med udsagnet, M e ta d af a :date „mod If led: % %.___% %„20Qδ Således kan S-3 og S-4 være: 25 S~3* "hungsry jeans metadata;date__modified:%%__%%_2006”
S-4* “revenue metadata:date__modified:%%__%%„2006K
r DK 176532 B1 12
Der vælges en specifik type metadata: "datajmodsfied”. Denne specifikke type kan bestemmes af en systemadministrator eller sættes op af en burger.
I tilfælde af at de specifikke metadata er ukendte, kan systemet omfatte en liste af muiige metadataelementer for dokumenterne, som adresseres ved 5 ”trial~and-error*. Derved kan der udføres en metadatasøgning uden at kende det præcise navn på metadataelementet.
Når de forskellige søgeforespørgsler er blevet klargjort, udføres der i trin 104 en søgning efter dokumenter pr. søgeforespørgsel, Det kan udføres ved at 10 foretage søgeforespørgsieme som eksemplificeret ovenfor. Søgeforespørgs- lerne kan foretages konsekutivt og ubetinget på resultatet af en tidligere foretaget forespørgsel, eller der kan foretages en efterfølgende forespørgsel, hvis en given betingelse på det forudgående resultat blev opfyldt f.eks. ved at stoppe kæden af konsekutive søgninger, hvis en tidligere søgning afslørede 15 relevante søgeresultater. Her kan relevant bestemmes i henhold til en specificeret “measure”, som kendes inden for området med at hente information eller computerbaserede søgninger.
I tilfælde af at søgegrænsefladen ikke accepterer en syntaks til at søge i me-20 tadata, kunne det være en søgestrategi at foretage en søgeforespørgsel uden at specificere metadata. Det vil højst sandsynligt resultere s et større sæt af søgeresultater (dokumenter), Disse dokumenter kan hentes og efterbehandles med henblik på at adressere deres metadata (hvis de har nogen), hvor det er muligt, f.eks. ved at bruge viden om dokumenter med en spectfi-25 ceret metadatastruktur. Dokumenterne kan lagres i et depot, så søgningen foretages i depotet, I trin 105 bliver resultaterne R-1, R-2, R-n af de udførte søgninger efterfølgende fremfundet og ordnet for at muliggøre identifikation af den tilsvaren-30 de søgeforespørgsel.
OK 176532 B1 13
P
Stadigt efterfølgende og i trin 106 bliver resultaterne vist i prioriteret rækkefølge som angivet ved rangen af de tilsvarende metadatasæt som forklaret ovenfor. Det vil blive beskrevet mere detaljeret i det følgende, hvorledes dokumenterne skal vises.
5 Således kan brugeren være i gang med at frembringe en analyse på basis af en specifikation af data, som udgør analysens indhold. I den situation kan der ved analysen afdækkes Information, som det kræver yderligere information fra perifere datakilder at forstå eller undersøge nærmere. De numre og tal, 10 som frembringelse af dataanalysen baseres på, kan måske ikke tilvejebringe sådan yderligere information fra centrallageret. Det vil forstås, at det centrale lager indeholder datasupersættet og datasubsæltet, men ikke nødvendigvis (dvs. typisk) dokumenter til yderligere undersøgelse. Derfor kaldes kilderne til sådanne dokumenter perifere kilder. Uden at afvige fra denne definition kan 15 det centrale lager være fordelt på forskellige fysiske lokationer og/eller databaser. Det centrale lager kaldes også datalageret og det perifere lager kaldes også dokumentlageret.
Ifølge ovenstående kan sådan yderligere information fra perifere kilder hen-20 tes, samtidig med at brugeren interagerer med systemet for at udføre dataanalyse på basis af data fra den centrale kilde.
Idet specifikationen for de data, der indgår i dataanalysen, holdes ved hjælp af metadataelementer i et metadatasæt, og idet forskellige søgestrenge 25 frembringes fra forskellige subsæt af metadataelementerne, således at der kan udføres forskellige søgninger, bliver sandsynligheden for at finde søgeresultater, som er relevante for den pågældende dataanalyse, øget. Idet der frembringes forskellige søgninger, er det muligt at prioritere resultaterne deraf, Søgningerne kan initieres automatisk eller ved en enkelt brugerforespørg-30 sel (f.eks. ved et enkelt museklik). Efterfølgende kan en bruger udføre en dataanalyse og nemt opnå relevante resultater uden at specificere søge- 14 OK 176532 R1
ΪλΡ ϊ\ ϊ ί Vwvwv Μ7 S
strengene ved trial-and-error. Desuden behøver brugeren ikke bryde sin koncentration ved at skuile granske information ved en underordnet opgave med at formulere en søgeforespørgse! - hvilket ofte er en tidskrævende trial-and-error proces.
5 På fig. 2 vises et første søjlediagram over et system i henhoid til opfindelsen. Systemet 200 omfatter en brugergrænseflade 201 som arbejder i kombination med en middleware-komponent 221 og én database DB, 219 med en databasegrænseflade DB IF, 218.
10
Middleware-komponenten 221 tilvejebrsnger funktionalstet af brugergrænsefladen 201 og er konfigureret ti! at modtage input fra brugergrænsefladen og tilvejebringe output tii brugergrænsefladen 201. Middleware-komponten 221 tilvejebringer Indhold ti! brugergrænsefladen 201 ved hjælp af bl.a. databasen 15 219. Databasen 219 adresseres via databasegrænseftaden 218. Middleware- komponenten er også konfigureret til at foretage en forespørgsel tii databasen 219 via databasegrænsefladen 218 og hente et resultatdatasæt fra databasen 219 via databasegrænsefladen. Fortrinsvis omfatter databasegrænsefladen en cache-hukommelse ti! hurtig fremfinding af et tidligere fremfundet 20 datasæt.
Brugergrænsefladen 201 vises i form af et vindue, som har en styrebjælke 202 med styring tii at lukke, maksimere og minimere vinduet på en visning. Vinduet omfatter styrekomponenter i form af en inputtekstboks 207, en liste-25 boks 208 over besøgte steder, en præsøntationsboks 209 med valgmuligheder og en datarapport 203, hvori der er anbragt forskellige grafiske præsenta-tionsobjekter 204, 205, 208. Datarapporten kan således arrangeres som en beholder for præsentationsobjekterne. Denne datarappport olier beholder betegnes også en visning eller visningsstruktur. Forskellige grafiske præsen-30 tatsonsobjekter anbringes i visningen, f.eks. som vist et søjlediagram-objekt 204, et cirkeldiagram-objekt 25, et tabel-objekt 208, Disse grafiske præsenta- OK 176532 B1 15 tionsobjekter tilvejebringer hver især en præsentation af datasæt hentet fra databasen 219.
Brugergrænsefladen 201 og middleware-komponenten 221 tilvejebringer i 5 kombination følgende funktionaistet: I en første situation kan en bruger foretage en forespørgsel om et datasæt, som skal præsenteres ved hjælp af visningen eller datarapporters 203. Forespørgselen kan indleveres s form af et naturligt sprog eller et pseudonaturligt 10 sprog omfattende ord eller teksteiementer, der identificerer metadataeiemen-ter i databasen 219. Forespørgselen behandles af en metadatabestemmel-sesenhed 214 af middieware-komponenten 221, Metadatabestemmelsesen-heden 214 tilvejebringer et output med matadataeiementer til at identificere et datasæt i databasen 219. Metadatelementeme lagres i et register I en 15 THM {Track History Memory) 215. Desuden sendes metadataelementerne til en forespørselsskaber 217, som tiivejebrlnger en formel forespørgsel i hen-bold til en syntaks, som accepteres af databasegrænsefiaden 218. Databasegrænsefladen 218 henter det datasæt, som identificeres af metadataelementerne, ved hjælp af den formelle forespørgsel fra databasen.
20
Det hentede datasæt leveres til et rapportobjekt 220, som indsamler metadataelementerne til at identificere datasættet og præsentationsegenskaberne for at kunne gengive en præsentation af datasættet i visningen 203. Desuden tiivejebringer rapportobjektet fremgangsmåder til at interagere med visningen 25 af de grafiske præsentationsobjekter deraf.
Præsentationsegenskabeme tilvejebringes med en PPD (Presentation Properties Determining) -enhed 218, som har en første mode, hvor præsentationsegenskaber bestemmes automatisk fra metadataelementerne, MD, tilve-30 jebragt af metadatabestemmelsesenheden 214. i en anden mode modtager PPD-enheden 218 en brugers Input ti! at modificere præsentationsegenska- r 16 DK 178532 B1 beme via præsentationsboksen 209 med valgmuligheder. Derved kan præsentationen tilpasses en brugers præferencer. I en tredje mode tilvejebringes der en kombination af funktionalitet af den første og den anden mode.
5 De præsentafionsegenskaber. som tilvejebringes af PPD-enheden 216 bliver eventuelt gemt i det register, som indeholder mstadata-elementerne af præsentationen, Denne første situation beskrives mere detaljeret i offentliggjort patentansøgning nr. EP 1 477 909.
10 I en anden situation kan en bruger finde en tidligere forespørgsel efter data i form af metadataelementer lagret s et register. Brugeren kan foretage et valg med henblik på at vælge registeret fra THM’en 215 ved hjælp af historieliste-boksen 208 på brugergrænsefladen 201. Dette register kan bruges til at lave en præsentation eller få udført en søgning (se nedenfor). Dette beskrives 15 mere detaljeret i publiceret patentansøgning EP 1 659 503.
I en tredje situation kan en bruger efterspørge yderligere data ved en handling, som er rettet direkte mod et element af et grafisk præsentationsobjekt af visningen. Som svar på detektering af handlingen ændres datasæt af de in-20 dividuelle præsentationer af visningen til at tillade nærmere undersøgelse eller analyse af datasættene. Dette beskrives mere detaljeret i publiceret patentansøgning EP 1 577 808.
I en fjerde situation kan en bruger fortsætte enten fra ovenstående eller an-25 dre situationer ved at foretage en forespørgsel efter en søgning efter dokumenter som beskrevet i forbindelse med fig. 1 og 3. Forespørgslen kan være i form af en aktivering af en grafisk knap på brugergrænsefladen (eller en tast på et tastatur) eller en aktivering af enhver anden styring (objekt) på brugergrænsefladen.
30 DK 176532 B1 17 r Søgningen frembringes af en enhed, PS, 212 og i overensstemmelse med det på fig. 1 og 3 viste procesdiagram. Nar søgningen frembringes af enheden PS, 212 og der frembringes forskellige søgeforespørgsler, sendes søge-forespørgsierne til en grænseflade af en søgemaskine SIP, 213. Søgeresul-5 taterne, der returneres til søgemaskinen via søgegrænsefladen 214, tilvejebringes via enheden 212 til rapporfobjektet 220 med henblik på visning på brugergrænsefladen.
Tilbage til den første situation kan brugeren efterspørge data ved hjælp af 10 inputtekstboksen 207, hvori brugeren kan skrive et spørgsmål i naturligt sprog på et foretrukket sprog, f.eks. engelsk. Fra en brugers synsvinkel udgør dette spørgsmål en forespørgsel til databasen 213. Ifølge et eksempel på en udføre i sesform kan databasen 213 Indeholde følgende dataelementer, hvor dataelementerne kategoriseres som “measures” eller "dimensions” og 15 hvor en ’’dimension” findes på forskellige niveauer, såsom dag, måned og år: “measures”: j Dimensions: "REVENUE” I ’’time” (level 0: Year; level 1: Month; level 2: j Day \ “cost” ί “Customer* (level 0: Group; level 1: Name} “CONTRIBUTION MAR- I “Product (level 0: Group; level 1: Name)
GIN” I
“revenue” I “Country” “budget” I “BusinessUnif
Derved kan man f.eks. stille følgende spørgsmål: 1} I would like to see ’’cost” grouped by "time, month” 2) I would like to see “REVENUE” grouped by “time, month”, “customer, group” and “product, name” 20 18 DK 178532 B1 3} S would like to see “REVENUE” for year 2004 4) I would like to see “country”
Spørgsmål som ovenstående sendes til en metadatabestemmelsesenhed 5 214, som er indreltei til at identificere metadalaelementer og deres kategori og niveauer ved at parse spørgsmålet. Dimensionen ’’time” kan alternativt benævnes time__year; timejnonth; time__day. Derved kan konceptet om “niveauet undgås. Dette gælder også for de øvrige dimensioner med hensigtsmæssige ændringer.
10 På basis af de identificerede metadataelementer er metadatabestemmelses-enheden 214 i stand tii at siå op i en THM 215 over tidligere brugte kombinationer af metadata og præsentationsegenskaber. Indholdet af lagerhukommelsen 215 kan have følgende form som vist på tabel 1: 15
Data Præsentation i Frekvens I
....____________...................................................................................................j..............................*
Time, Level 1 Type-Barchart; legend-off; j 3 1 REVENUE !abels=off; 3D-effects=Orthogona! | j
Country; Type-map; legend-off; i 3 j CONTRIBUTION-MARGIN Labels=on; 3D-effects^None I |
Margin | j
Customer, Level 0; Type-Crosstab; legend-off; 12 I
REVENUE; Labels=off; SD-effects^None | I
> i
Cost; j i CONTRIBUTION-MARGIN | t
Margin j j fabel i
Ved at søge i lagerbukommelsen 210 med indhold som vist i ovenstående tabel 1 efter et match med de dataelementer og de niveauer, som identifies- DK 176532 B1 19 res ud fra spørgsmålet, er det muligt at bestemme, hvorvidt en tidligere præsentation, som matcher spørgsmålet, er blevet brugt. Derved kan der findes foretrukne præsentationsegenskaber. Hvis det f.eks. bestemmes, at et spørgsmål involverer dataelementet ’’time, level 1” og ’’REVENUE”, vil det 5 kunne udledes, at den foretrukne præsentation af disse dataelementer er et søjlediagram med egenskaber som vist i ovenstående tabei 1.
Præsentationsegenskaber bestemmes af præsentationsbestemmelsesenheden 218 på basis af resultatet af søgningen efter matchende dataelementer 10 og -niveauer. De bestemte præsentationsegenskaber gemmes i et præsen-tationshukommelsesobjekt 220.
Den metadatabestemmende enhed 214 konverterer spørgsmålet eller meta-dataene, alt efter hvad der måtte være tilfældet, til en forespørgsel, som kan 15 indleveres til en database 219 via en databaseforbindelse. Som svar på forespørgselen tiSvejebhnger databasen et resultatdatasæt. Dette resultatdatasæt sendes til et præsentationshukommelsesobjekt 220. Derved håndteres resui-tatdatasættet og præsentationsegenskaberne i samme hukommeisesobjekt 220.
20
Nu vendes der tilbage tii et mere generelt aspekt, hvor metadataelementerne er koder, som gør det muligt at identificere et datasuhsæt ud fra et datasu-persæt, som lagres i en database. For at populere, vedligeholde osv. mere intuitivt, konformerer databasen til et enkelt, såkaldt basissprog, som repræ-25 senterer et sprog af elementer i databasen. Dette basissprog kunne være engelsk, men kunne være ethvert sprog, herunder kunstige sprog. Metadata-elementerne gives grundlæggende af koder, som identificerer elementerne i databasen. For at fortsætte det intuitive aspekt gives koderne i grundsproget.
r DK 176532 B1 20 I det givne eksempel gives metadataeSemenierne ved koder i form af ord fra det engelske sprog. Det gør det mere intuitivt at efterspørge og fortolke data fundet via metadataeiementerne.
5 Ifølge en udførelsesform bruges der en elektronisk ordbog eller oversættel-sestjeneste ti! at oversætte ordene i metadataeiementerne ti! og fra et brugersprog, som kan være forskelligt fra basissproget. Dette vil blive beskrevet mere detaljeret nedenfor Brugersproget er typisk et naturligt sprog, f.eks. engelsk, tysk eller fransk, 10 På fig. 3 vises et procesdiagram over frembringelsen af forskeliige søgninger. Procesdiagrammet omfatter trin, der også vises i forbindelse med det på fig, 1 viste proceediagram. Sættet af metadata, MS, konverteres til forskellige søgeforespørgsler S-1, S-2, S-3 og S-4. De første to søgeforespørgsler 15 frembringes via en første rute 310 I procesdiagrammet og de to sidste søgeforespørgsler frembringes via en anden rute 311.
Den første rute omfatter et trin 301, hvor elementer fra metadatasættet, MS, vælges. For at frembringe den første søgeforespørgsei, S-1, er trin 301 i en 20 første mode, hvor alle elementer af metadatasættet, MS, vælges med henblik på at frembringe rnetadatasubsættet MMS-1. I det efterfølgende trin 302 bliver metadatsubsættet MSS-1 (som omfatter samtlige elementer) konverteret til en streng af ord, der adskilles af mellemrum. Ordene er navnene og parametrene (metadataeiementerne) af rnetadatasubsættet.
25 I tilfælde af, at der understøttes brugersprog, som er forskellige fra basissproget, udføres et trin 303 med at oversætte ordene (på basissproget) af strengen til ord (på brugersproget) til søgeforespørgselen S-1. Trinnet med at oversætte udføres i henhold til en angivelse af, hvilket brugersprog, der skal 30 oversættes til. Denne angivelse af brugersproget kan indstilles af systemadministratoren, Denne angivelse kan også omfatte information om, hvorvidt OK 176532 B1 21 sådanne brugersprog er understøttet Oversættelse kan udføres som beskrevet i patentansøgning EP 1 353 280. Som et resultat af oversættelsen frembringes den første søgeforaspørgsel S-1. Eksempler på Indhold af S-1 vil fremgå af ovenstående tabel. Det bemærkes, at databasen kan omfatte en 5 første type af ord eller metadatanavne eller parametre, som en databaseadministrator tilvejebringer på forskellige sprog; f.eks. navne på "measures” og ’’dimensions". Databasen kan også omfatte en anden type ord, som angiver forekomster af "dimensions”; i ovenstående eksempel f.eks. "Hungary”, "Jeans” og ”2008” (som det måske ikke er nødvendigt at oversætte). Ordene 10 kan oversættes i henhold til en sprogoversættelse med et begrænset antal af eller ingen synonymer I sidstnævnte tilfælde etableres der således en oversættelse baseret på en ordbog med ord-tll-ord-oversættelse.
Ifølge en udførelsesform kan der specificeres primære og underordnede bru-15 gersprog. I det tilfælde kan der frembringes en eller flere segeforespørgsler, f.eks. kan samtlige søgeforespørgsler frembringes i forskellige sprogversioner. Derved kan en bruger forsynes med søgeresultater på eksempelvis både engelsk og tysk. Især når der ikke opnås resultater fra alle sprogversioner af søgeforespørgslerne vil de, der giver resultater, kunne bruges i stedet for 20 at drage den konklusion, at der ikke opnåedes nogen resultater. Når et elier flere brugersprog specificeres, øges sandsynligheden for at fremfinde personlige dokumenter, f.eks. e-mails. Personlige dokumenter kan meget vel relateres til de data, der analyseres af brugeren, idet både dokumenter og analyser tilhører brugerens aktivitetsområde.
25
For at frembringe den anden søgeforespørgsei, S~2, er trin 301 i en anden mode, hvor samtlige elementer undtagen navne på “measures'’ i subdatasæt-tet, MS, vælges med henblik på at frembringe metadatsubsættet MSS-2, I efterfølgende trin 302 bliver mefadatasubsættet IV1SS-2 (som omfatter navne 30 på dimensioner og parametre) konverteret til en streng af ord, der adskilles af mellemrum. Ordene er navnene og parametrene (metadataelementerne) af DK 176532 B1 22 metadatasubsættet Som beskrevet ovenfor kan ordene oversættes med henblik på at korsformere med et brugersprog. Eksempel på indhold af S-2 vil fremgå af ovenstående tabel.
5 Den anden rute omfatter et thn 304, hvor samtlige parametre undtaget parametre på en tidsdimension fra metadaiasættet, MS, vælges. Til at frembringe den tredje søgeforespørgsel, S-3, er et trin 304 i en første mode, hvor samtlige parametre, undtaget parametre på en tidsdimension af metadaiasættet, MS, vælges for at frembringe metadatasubsættet MSS-3. Imidlertid vælges 10 parameteren/metrene på tidsdimensionen i trin 308, I trin 305 konverteres parametrene, undtaget parametrene på en tidsdimension, til en streng af ord som beskrevet ovenfor. Efterfølgende kan ordene oversættes som beskrevet ovenfor. Resultatet deraf kan være som vist for S-15 3 i ovenstående tabel.
I trin 309 bliver de valgte parametre på en tidsdimension konverteret til en metadataforespørgsel, som formateres i henhold ti! en grænseflade af søgemaskinen. Strengen og metadataforespørgslen tilvejebringes i kombination 20 som den tredje søgeforespørgsel. Resultatet deraf kan være som vist for ovenstående S~3\
For at frembringe den fjerde søgeforespørgsel, 8-4, er trin 304 i en anden mode, hvor samtlige navne på dimensioner af metadaiasættet, MS, vælges 25 for at frembringe metadatasubsættet MSS-4. i trin 308 bliver parameteren/metrene på tidsdimensionen valgt. Den fjerde søgeforespørgsei tilvejebringes ved at kombinere strengen og metadataforespørgseien, Resultatet deraf kan være som vist for S-4* ovenfor, 30 På fig. 4 vises en afbildning. Afbildningen viser den på fig. 1 viste afbildning mere detaljeret og idet der henvises til ovennævnte "measures” og "dimensi- DK 176532 B1 23 ons”. Afbild ningsstrukturen 401 omfatter et første grafisk præsentationsobjekt 402 af en søjlegraf-type, som viser værdier af “measures” "CONTRIBUTION-MARGIN” (skraverede søjler) og ’’Revenue” (tomme søjler) langs dimensionen ’TIME-MONTH”, Desuden omfatter visningsstrukturen 401 et andet geo 5 grafisk præsentationsobjekt 403 af cirkeidiagramtypen, som viser værdier for ’’measure” “CONTRIBUTION-MARGIN” langs dimensionen “BUSINESS-UNIT”. Stadigt videre omfatter visningsstrukturen 402 et tredje grafisk præsentationsobjekt 404 af en tabeltype, som viser “measures” "REVENUE" og ’’BUDGET” langs dimensionerne "BUSINESS-UNiT" og “PRODUCT-10 GROUPS”.
Afbildningen opnås under situation 1 som beskrevet i forbindelse med flg. 1, hvor der indtastes et spørgsmål for at identificere metadataeiementerne af visningen. Alternativt genetableres der en tidligere anvendt visning fra delvis 15 information om metadataene, som gives i spørgsmålet. Stadigt alternativt tilvejebringes visningen ved at genkalde en tidligere visning.
Data for visningen defineres ved hjælp af et sæt af metadataelementer for hvert præsentationsobjekt og et fælles sæt af elementer.
20 1, (REVENUE; CONTRIBUTION-MARGIN; TIME_MONTH; GOUN-TRY-'Hungary"; TIME-YEARJ'2006”} 2. {CONTRIBUTION-MARGIN, BUSINESS-UNIT; COUN- TRY~”Hungary”; TIME-YEAR="2006"} 25 3. {REVENUE; BUDGET; COUNTRY^’Hungary”; Ti ME.YEAR-’2006”) hvor elementerne COUNTRY=”Hungary” og TI!VfE__YEAR=”2006” tilhører det fælles sæt af elementer. Metadalasættene 1, 2 og 3 ovenfor kombineres ti! et enkeit sæt af metadataeiementer for at repræsentere dataene fra en visning 30 med tre objekter. Ifølge en udførelsesform konverteres elementerne til søgningen som beskrevet ovenfor, uanset hvilket af sættene 1, 2 og 3 de tilhø- r DK 176532 B1 24 rer. Således vil søgeforespørgslerne alt andet lige omfatte flere termer. Ifølge en anden udførelsesform kan en søgning som beskrevet ovenfor initieres kun for udvalgte blandt ovenstående sæt 1,2 og 3.
5 Dirnesionsværdlerne "Hungary” og "2006” på dimensionerne COUNTRY
henholdsvis TIME^YEAR betegnes også baggrundskriterier, idet de i eksemplet er fælles for præsentationerne af en visning svarende til ovenstående respektive metadatasæet 1-3. Det er imidlertid klart, at metadatasættene kan have Individuelle dimensionsværdier eller-kriterier, som også ville gælde for 10 et enkelt præsentationsobjekt. Disse aspekter beskrives mere detaljeret i offentliggjort patentansøgning EP 1 659 503.
Desuden omfatter visningen et grafisk præsentationsobjekt 408 af en type, som viser en liste over dokumenter. Listen over dokumenter omfatter doku-15 menter, som er opnået ved at udføre en søgning som beskrevet ovenfor. Do-kumenteme kan vises på listen som ønsket, f. eks. ved at vise dokumentnavnet og en titel på dokumentet. Et udsnit af dokumentet kan også vises, så brugeren mere umiddelbart bibringes en opfattelse af dokumentets indhold.
20 Dokumenterne betegnes D11, D12, D21, D31, D32. Det først ciffer illustrerer nummeret på det søgeresultat, hvor dokumentet fremfandtes. Det andet ciffer illustrerer rangen af dokumentet inden for søgeresultatet. De fire minuskier på figuren illustrerer, at dokumenternes titler vises. Dokumenterne kan adresseres direkte fra det grafiske præsentationsobjekt 408.
25
Det er muligt at tildele dokumenter eksplicit til en specifik del af dataanalysen. Den specifikke del af dataanalysen repræsenteres af indholdet af et me~ tadatasæt. Et sådant dokument kan frembringes af brugeren i sammenhæng med dataanalysen eller være et dokument, som f.eks, fremfindes i en søg-30 ning. Dokumentet kan tildeles ved at tilføre dokumentet information, som vil sikre, at det identificeres som faldende inden for omfanget af søgeforespørg- * DK 176532 B1 25 selen (idet det antages, at dokumentet findes). Alternativt kan sættet af metadata tildeles et link tli dokumentet.
Dokumenter kan tildeles til en specifik dei af dataanalysen via de dele 407 af 5 præsentatiorssobjekteme, som angives med minusklen Ϊ.
Betegnelsen OLAP angiver en kategori af databaser, applikationer og teknologier, som tillader indsamling, lagring, håndtering samt reproduktion af mul~ 10 tidimenssonale data med henblik på dataanalyse.
Metadata er information om et særligt datasæt, som f.eks. kan beskrive hvordan, hvornår og af hvem det blev modtaget, frembragt, adresseret og/eller modificeret, og hvorledes det formateres.
15

Claims (9)

1. Coroputerimpiementeret fremgangsmåde omfattende at lave en præsentation af et datasæt med strukturerede data; 5 at lagre metadataelementer, som definerer datasættet i forhold til et datasupersæt, som er gemt i en første database med strukturerede data, kendetegnet ved at omfatte: at konvertere metadataeiementerne til en søgeforespørgsel; at overbringe søgeforespørgsien ti! en søgemaskine med henblik 10 på at søge efter dokumenter, som befinder sig i anden database; at opfange søgeresultatet; og at lave en præsentation af søgeresultatet.
2. Computerimplementeret fremgangsmåde ifølge krav 1, hvor data- 15 supersættet gemmes i en første database, og hvor de forskellige søgninger udføres i en perifer datakilde.
3. Computerimplementeret fremgangsmåde ifølge et hvilket som helst af kravene 1 ti! 2, hvor søgeforespørgsierne omfatter forespørgsler rettet mod en 20 søgning efter metadata af dokumenter.
4. Computerimp!ementeret fremgangsmåde ifølge krav 3 omfattende trinnet at konvertere et metadataeiement relateret til en tidsdimension til en søgeforespørgsel, som adresserer metadata af dokumenter. 25
5 Computerimplementeret fremgangsmåde ifølge et hvilket som helst af kravene 1 til 4 omfattende trinnet at konvertere metadataelemerster til ord og oversætte ordene fra et sprog til et andet sprog.
6. Computerimplementeret fremgangsmåde ifølge et hvilket som helst af kra vene 1 ti! 5 omfattende trinnet at frembringe de forskellige søgeforespørgsler P DK 176532 B1 27 ved at fjerne og/eiier ændre de metadataeiemenier fra metadatasættet, som vælges til de forskellige segeforespørgsler,
7. Computenmplementeret fremgangsmåde ifølge et hvilket sem helst af kra-5 vene 1 til 6, som yderligere omfatter at modificere et dokument for at forsyne det med indhold af en sogeforespørgsel, så det sikres, at information optræder både i søgeforespørgslen og dokumentet. B. Computenmplementeret fremgangsmåde Ifølge et hvilket som helst af kra-10 vene 1 til 7, som yderligere omfatter at etablere et link fra søgeforespørgslen til dokumentet og/eiler fra dokumentet til søgeferespørgslen.
9. Computerlæsbart medium, hvorpå er indkodet et program, som, når det indlæses på en computer, får computeren til at udføre fremgangsmåden iføl- 15 ge et hvilket som helst af kravene 1 til 8.
10. Computer, hvorpå er indkodet et program, som, når det Indlæses på computeren, får computeren til at udføre fremgangsmåden ifølge et hvilket som helst af kravene 1 til 9. 20
DK200600988A 2006-07-17 2006-07-17 Fremgangsmåde til integration af dokumenter med OLAP ved brug af sögning, computerlæsbart medium og computer DK176532B1 (da)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DK200600988A DK176532B1 (da) 2006-07-17 2006-07-17 Fremgangsmåde til integration af dokumenter med OLAP ved brug af sögning, computerlæsbart medium og computer
US11/509,832 US7949674B2 (en) 2006-07-17 2006-08-24 Integration of documents with OLAP using search
EP07388055A EP1881429A3 (en) 2006-07-17 2007-07-17 Integration of documents with OLAP using search
DKPA200800740A DK177142B1 (da) 2006-07-17 2008-05-30 Fremgangsmåde til præsentation af et datasæt ved brug af søgning, computerlæsbart medium og computer

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DK200600988 2006-07-17
DK200600988A DK176532B1 (da) 2006-07-17 2006-07-17 Fremgangsmåde til integration af dokumenter med OLAP ved brug af sögning, computerlæsbart medium og computer

Publications (2)

Publication Number Publication Date
DK200600988A DK200600988A (da) 2008-01-18
DK176532B1 true DK176532B1 (da) 2008-07-14

Family

ID=38950435

Family Applications (2)

Application Number Title Priority Date Filing Date
DK200600988A DK176532B1 (da) 2006-07-17 2006-07-17 Fremgangsmåde til integration af dokumenter med OLAP ved brug af sögning, computerlæsbart medium og computer
DKPA200800740A DK177142B1 (da) 2006-07-17 2008-05-30 Fremgangsmåde til præsentation af et datasæt ved brug af søgning, computerlæsbart medium og computer

Family Applications After (1)

Application Number Title Priority Date Filing Date
DKPA200800740A DK177142B1 (da) 2006-07-17 2008-05-30 Fremgangsmåde til præsentation af et datasæt ved brug af søgning, computerlæsbart medium og computer

Country Status (2)

Country Link
US (1) US7949674B2 (da)
DK (2) DK176532B1 (da)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE350715T1 (de) * 2003-05-15 2007-01-15 Targit As Methode und benutzerschnittstelle für das bilden einer darstellung von daten mit meta-morphing
US7779018B2 (en) * 2003-05-15 2010-08-17 Targit A/S Presentation of data using meta-morphing
US8468444B2 (en) * 2004-03-17 2013-06-18 Targit A/S Hyper related OLAP
US7774295B2 (en) * 2004-11-17 2010-08-10 Targit A/S Database track history
US20090187845A1 (en) * 2006-05-16 2009-07-23 Targit A/S Method of preparing an intelligent dashboard for data monitoring
US20080163264A1 (en) * 2006-12-28 2008-07-03 International Business Machines Corporation Directory Service that Provides Information from a Plurality of Disparate Data Sources
WO2008085989A1 (en) * 2007-01-10 2008-07-17 Richard Garfinkle A software method for data storage and retrieval
DK176516B1 (da) * 2007-04-30 2008-06-30 Targit As Computerimplementeret fremgangsmåde samt computersystem og et computerlæsbart medium til at lave videoer, podcasts eller slidepræsentationer fra en Business-Intelligence-application
US8606623B1 (en) * 2008-03-31 2013-12-10 Knowledgepoint 360 Group, LLC Organization and peer set metric for generating and displaying benchmarking information
CA2660748C (en) * 2009-03-31 2016-08-09 Trapeze Software Inc. System for aggregating data and a method for providing the same
US8204901B2 (en) * 2009-09-02 2012-06-19 International Business Machines Corporation Generating query predicates for processing multidimensional data
US8996544B2 (en) 2012-09-28 2015-03-31 Oracle International Corporation Pruning disk blocks of a clustered table in a relational database management system
US9507825B2 (en) 2012-09-28 2016-11-29 Oracle International Corporation Techniques for partition pruning based on aggregated zone map information
US9430550B2 (en) 2012-09-28 2016-08-30 Oracle International Corporation Clustering a table in a relational database management system
US10642837B2 (en) 2013-03-15 2020-05-05 Oracle International Corporation Relocating derived cache during data rebalance to maintain application performance
US20140365519A1 (en) * 2013-06-10 2014-12-11 Targit A/S Intelligent processing of user input to a business intelligence software application
US11086876B2 (en) 2017-09-29 2021-08-10 Oracle International Corporation Storing derived summaries on persistent memory of a storage device

Family Cites Families (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1982000726A1 (en) 1980-08-13 1982-03-04 Inc Comshare A machine for generating graphic charts
US4800510A (en) 1985-07-31 1989-01-24 Computer Associates International, Inc. Method and system for programmed control of computer generated graphics layout
JPH0594537A (ja) 1991-02-27 1993-04-16 Canon Inc グラフ処理方法
US5911138A (en) 1993-06-04 1999-06-08 International Business Machines Corporation Database search facility having improved user interface
US6160549A (en) 1994-07-29 2000-12-12 Oracle Corporation Method and apparatus for generating reports using declarative tools
AU6849196A (en) 1995-08-16 1997-03-19 Syracuse University Multilingual document retrieval system and method using semantic vector matching
US5692181A (en) 1995-10-12 1997-11-25 Ncr Corporation System and method for generating reports from a computer database
US6625617B2 (en) 1996-01-02 2003-09-23 Timeline, Inc. Modularized data retrieval method and apparatus with multiple source capability
US5836771A (en) 1996-12-02 1998-11-17 Ho; Chi Fai Learning method and system based on questioning
US6108657A (en) 1997-05-29 2000-08-22 Oracle Corporation Method, article of manufacture, and apparatus for generating a multi-dimensional record layout mapping
US5940518A (en) 1997-10-06 1999-08-17 Delco Electronics Corporation Method and apparatus for indicating speaker faults
US6154738A (en) 1998-03-27 2000-11-28 Call; Charles Gainor Methods and apparatus for disseminating product information via the internet using universal product codes
WO1999056192A2 (en) 1998-04-24 1999-11-04 Starmine Corporation Security analyst performance tracking and analysis system and method
US6138121A (en) 1998-05-29 2000-10-24 Hewlett-Packard Company Network management event storage and manipulation using relational database technology in a data warehouse
US6226647B1 (en) 1998-07-24 2001-05-01 Oracle Corporation Method, article of manufacture, and apparatus for constructing a multi-dimensional view containing two-pass value measure results
WO2000022549A1 (en) 1998-10-09 2000-04-20 Koninklijke Philips Electronics N.V. Automatic inquiry method and system
US20010013004A1 (en) 1998-11-03 2001-08-09 Jordan Haris Brand resource management system
US6920608B1 (en) 1999-05-21 2005-07-19 E Numerate Solutions, Inc. Chart view for reusable data markup language
US6415298B1 (en) 1999-07-15 2002-07-02 American Management Systems, Inc. Effective dated tree control in a component based-object oriented convergent customer care and billing system
AUPQ193199A0 (en) 1999-07-30 1999-08-26 Da Vinci Innovation Pty Limited Apparatus and method for implementing surveys
EP1081610A3 (en) 1999-09-03 2003-12-03 Cognos Incorporated Methods for transforming metadata models
US6484179B1 (en) * 1999-10-25 2002-11-19 Oracle Corporation Storing multidimensional data in a relational database management system
EP1428140A2 (en) 1999-11-09 2004-06-16 Brent David Tucker Systems and methods for collecting, storing, and analyzing database statistics
US6615172B1 (en) 1999-11-12 2003-09-02 Phoenix Solutions, Inc. Intelligent query engine for processing voice based queries
US6490590B1 (en) 2000-02-14 2002-12-03 Ncr Corporation Method of generating a logical data model, physical data model, extraction routines and load routines
US6768986B2 (en) 2000-04-03 2004-07-27 Business Objects, S.A. Mapping of an RDBMS schema onto a multidimensional data model
US6831668B2 (en) 2000-04-03 2004-12-14 Business Objects, S.A. Analytical reporting on top of multidimensional data model
US20020091681A1 (en) 2000-04-03 2002-07-11 Jean-Yves Cras Report then query capability for a multidimensional database model
AU2001257154A1 (en) 2000-04-21 2001-11-07 Leon R. Casaubon System and method of supply chain management
US20020070953A1 (en) 2000-05-04 2002-06-13 Barg Timothy A. Systems and methods for visualizing and analyzing conditioned data
US6995768B2 (en) 2000-05-10 2006-02-07 Cognos Incorporated Interactive business data visualization system
US20030009295A1 (en) 2001-03-14 2003-01-09 Victor Markowitz System and method for retrieving and using gene expression data from multiple sources
GB0015233D0 (en) 2000-06-21 2000-08-16 Canon Kk Indexing method and apparatus
US6684207B1 (en) * 2000-08-01 2004-01-27 Oracle International Corp. System and method for online analytical processing
US7111010B2 (en) 2000-09-25 2006-09-19 Hon Hai Precision Industry, Ltd. Method and system for managing event attributes
US20020038230A1 (en) 2000-09-25 2002-03-28 Li-Wen Chen User interface and method for analyzing customer behavior based upon event attributes
US6889230B1 (en) 2000-11-03 2005-05-03 Quality Data Management, Inc. System and method for presenting survey data over a network
US20020129004A1 (en) 2000-11-09 2002-09-12 Bassett Jimmy G. Software enabled wizards
US20040039707A9 (en) 2000-11-22 2004-02-26 Chris Ricci Method for distributing and licensing digital media
US6816879B1 (en) 2000-12-02 2004-11-09 Oracle International Corp. System and method for serving pre-generated presentation views of requested data
US6671689B2 (en) * 2001-01-19 2003-12-30 Ncr Corporation Data warehouse portal
US6643635B2 (en) 2001-03-15 2003-11-04 Sagemetrics Corporation Methods for dynamically accessing, processing, and presenting data acquired from disparate data sources
US20050076045A1 (en) 2001-03-19 2005-04-07 Pal Stenslet Method and system for handling multiple dimensions in relational databases
US7089184B2 (en) 2001-03-22 2006-08-08 Nurv Center Technologies, Inc. Speech recognition for recognizing speaker-independent, continuous speech
US6775675B1 (en) 2001-04-04 2004-08-10 Sagemetrics Corporation Methods for abstracting data from various data structures and managing the presentation of the data
CN1647070A (zh) 2001-06-22 2005-07-27 诺萨·欧莫贵 用于知识检索、管理、交付和表示的系统和方法
AU2002332556A1 (en) 2001-08-15 2003-03-03 Visa International Service Association Method and system for delivering multiple services electronically to customers via a centralized portal architecture
US20030061358A1 (en) 2001-08-28 2003-03-27 Yolande Piazza Method and system for presenting charge related data on a worldwide basis through a network
US20030061096A1 (en) 2001-09-05 2003-03-27 Gallivan Gerald J. System and method for use for linking primary market research data with secondary research data
US20030050825A1 (en) 2001-09-05 2003-03-13 Impactrx, Inc. Computerized pharmaceutical sales representative performance analysis system and method of use
DE10151250A1 (de) 2001-10-17 2003-05-08 Bayer Ag Verfahren zur Ermittlung eines komplexen Korrelationsmusters aus Verfahrens- und Anlagendaten
US7209876B2 (en) 2001-11-13 2007-04-24 Groove Unlimited, Llc System and method for automated answering of natural language questions and queries
US7587354B2 (en) 2001-11-27 2009-09-08 State Street Corporation Verification of net asset values
US7035877B2 (en) 2001-12-28 2006-04-25 Kimberly-Clark Worldwide, Inc. Quality management and intelligent manufacturing with labels and smart tags in event-based product manufacturing
US7170519B2 (en) 2002-03-29 2007-01-30 Sas Institute Inc. Computer-implemented system and method for generating data graphical displays
US7051038B1 (en) 2002-06-28 2006-05-23 Microsoft Corporation Method and system for a reporting information services architecture
US7668885B2 (en) 2002-09-25 2010-02-23 MindAgent, LLC System for timely delivery of personalized aggregations of, including currently-generated, knowledge
US7293031B1 (en) 2002-11-21 2007-11-06 Ncr Corp. Report specification generators and interfaces
US7103591B2 (en) 2002-12-02 2006-09-05 International Business Machines Corporation Method of describing business and technology information for utilization
US7269581B2 (en) 2003-03-28 2007-09-11 Microsoft Corporation Systems and methods for proactive caching utilizing OLAP variants
US7779018B2 (en) 2003-05-15 2010-08-17 Targit A/S Presentation of data using meta-morphing
ATE350715T1 (de) 2003-05-15 2007-01-15 Targit As Methode und benutzerschnittstelle für das bilden einer darstellung von daten mit meta-morphing
DE602004006485T2 (de) 2004-03-02 2008-01-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur automatisierten anmerkung von berichten mehrdimensionaler datenbanken mit informationsobjekten eines datenspeichers
US8468444B2 (en) 2004-03-17 2013-06-18 Targit A/S Hyper related OLAP
EP1577808A1 (en) 2004-03-17 2005-09-21 Targit A/S Hyper related OLAP
US7792954B2 (en) 2004-04-02 2010-09-07 Webtrends, Inc. Systems and methods for tracking web activity
DK1659503T3 (da) 2004-11-17 2010-10-04 Targit As Sporingshistorik til database
US7774295B2 (en) 2004-11-17 2010-08-10 Targit A/S Database track history
US7171335B2 (en) 2004-12-21 2007-01-30 Texas Instruments Incorporated System and method for the analysis of semiconductor test data
US20090187845A1 (en) 2006-05-16 2009-07-23 Targit A/S Method of preparing an intelligent dashboard for data monitoring
DK176516B1 (da) 2007-04-30 2008-06-30 Targit As Computerimplementeret fremgangsmåde samt computersystem og et computerlæsbart medium til at lave videoer, podcasts eller slidepræsentationer fra en Business-Intelligence-application

Also Published As

Publication number Publication date
DK200600988A (da) 2008-01-18
DK177142B1 (da) 2012-02-06
DK200800740A (da) 2008-05-30
US7949674B2 (en) 2011-05-24
US20080016035A1 (en) 2008-01-17

Similar Documents

Publication Publication Date Title
DK176532B1 (da) Fremgangsmåde til integration af dokumenter med OLAP ved brug af sögning, computerlæsbart medium og computer
US9519636B2 (en) Deduction of analytic context based on text and semantic layer
US9348871B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US7895197B2 (en) Hierarchical metadata generator for retrieval systems
US7584177B2 (en) Determination of a desired repository
US7562088B2 (en) Structure extraction from unstructured documents
JP5074378B2 (ja) クエリ用語および返答用語を含む情報ソースからのスニペットを有するファクトクエリエンジンのユーザインタフェース
US10552467B2 (en) System and method for language sensitive contextual searching
US20050081146A1 (en) Relation chart-creating program, relation chart-creating method, and relation chart-creating apparatus
US20080021891A1 (en) Searching a document using relevance feedback
US20120203778A1 (en) Inferring search category synonyms
WO2006061270A1 (en) Suggesting search engine keywords
US20100228714A1 (en) Analysing search results in a data retrieval system
US20110307247A1 (en) Method and system for lexical navigation of items
JP6533876B2 (ja) 商品情報表示システム、商品情報表示方法、及びプログラム
CN111223533B (zh) 一种医疗数据检索方法及系统
JP4569179B2 (ja) ドキュメント検索装置
JP2002288189A (ja) 文書分類方法及び文書分類装置並びに文書分類処理プログラムを記録した記録媒体
CN109213830B (zh) 专业性技术文档的文档检索系统
CN114402316A (zh) 利用动态选择和分布式相关性进行联合搜索的系统和方法
JP4146067B2 (ja) 文書検索システムおよび文書検索方法
WO2021210210A1 (ja) 文書検索装置、文書検索システムおよび文書検索方法
EP1881429A2 (en) Integration of documents with OLAP using search
JP5417359B2 (ja) 文書評価支援システム、及び文書評価支援方法
WO2024079833A1 (ja) 情報処理装置、出力方法、及び出力プログラム

Legal Events

Date Code Title Description
PBP Patent lapsed

Effective date: 20180717