DK177142B1 - Fremgangsmåde til præsentation af et datasæt ved brug af søgning, computerlæsbart medium og computer - Google Patents

Fremgangsmåde til præsentation af et datasæt ved brug af søgning, computerlæsbart medium og computer Download PDF

Info

Publication number
DK177142B1
DK177142B1 DKPA200800740A DKPA200800740A DK177142B1 DK 177142 B1 DK177142 B1 DK 177142B1 DK PA200800740 A DKPA200800740 A DK PA200800740A DK PA200800740 A DKPA200800740 A DK PA200800740A DK 177142 B1 DK177142 B1 DK 177142B1
Authority
DK
Denmark
Prior art keywords
search
metadata
computer
data
mss
Prior art date
Application number
DKPA200800740A
Other languages
English (en)
Inventor
Morten Middelfart
Original Assignee
Targit As
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Targit As filed Critical Targit As
Priority to DKPA200800740A priority Critical patent/DK177142B1/da
Publication of DK200800740A publication Critical patent/DK200800740A/da
Application granted granted Critical
Publication of DK177142B1 publication Critical patent/DK177142B1/da

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Der tilvejebringes en computerimplementeret fremgangsmåde omfattende: at anmode en søgemaskine om at udføre en søgning tildelt til en søgestreng med henblik på at tilvejebringe et søgeresultat; at opfange søgeresultatet; og lave en præsentation af søgeresultatet, hvor den computerimplementerede fremgangsmåde yderligere er omfatter, at søgestrengen frembringes ved:at tage et sæt af metadataelementer, som definerer et datasæt, i forhold til et datasupersæt; og frembringe forskellige søgeforespørgs fra forskellige subsæt af metadataelementerne til forskellige søgninger; hvor søgeresultatet omfatter forskellige resultatsæt. Derved bliver det muligt at søge automatisk efter dokumenter ved automatisk at forberede søgeforespørgs fra en kontekst, hvor der udføres dataanalyse af strukturerede data i f.eks. en OLAP database. Følgelig forbedres funktio naliteten af databasen meget, samtidig med at effektiviteten også forbedres.

Description

DK 177142 B1
Fremgangsmåde til præsentation af et datasæt ved brug af søgning, computerlæsbart medium og computer
Teknisk område 5
Det tekniske område angår det at lave en præsentation af et datasæt med strukturerede data. De strukturerede data tilvejebringes fra en såkaldt OLAP-database, en første database, hvor numre og sammenlægninger af numre gemmes i en struktur, der defineres ved såkaldte ’’dimensions” og “measu-10 res”. Disse betegnelser er velkendte inden for databaseområdet. Metadata-elementer, såsom navne på ’’dimensions” (dimensioner), “measures” (mål) og kriterier definerer datatsættet i forhold til et datasupersæt, der er gemt i den første database med strukturerede data.
15 Baggrund
Aktuelle datavarehus- og OLAP-teknologier kan anvendes til at analysere de strukturerede data, som organisationer lagrer i deres databaser. Disse organisationer frembringer også mange dokumenter og bruger nettet som deres 20 største kilde til ekstern information. Eksempler på interne og eksterne kilder til information omfatter f.eks. rapporter om indkøbstendenser og markedsundersøgelser.
Betegnelsen OLAP angiver en kategori af databaser, applikationer og tekno-25 logier, som tillader indsamling, lagring, håndtering og reproduktion af multi-dimensionale data med henblik på dataanalyse. Typisk omfatter OLAP-databaser en - eller i det mindste færre - tabeller end en sammenlignelig relationel database. OLAP-databaser lagrer typisk forud beregnede sammenlægninger af data med henblik på at gøre sammenlagte tal umiddelbart til-30 gængelige til dataanalyseformål.
2 DK 177142 B1
Databaser til analyseformål og tilhørende brugergrænseflader bliver i stigende grad anvendt af mennesker, som ikke har specialistviden om databaser som et potent værktøj til at fremlægge og analysere data, der er indsamlet inden for deres arbejdsområde. Disse mennesker tyr til databaserne, fordi de 5 ønsker mere effektivt at få indsigt i de fakta, som er relevante for deres profession.
Der ser imidlertid ud til at være et stadigt behov for, at ydeevnen af disse databaseværktøjer bliver større og større, og et behov for øget effektivitet ved 10 brug af disse værktøjer. Et enkelt, men meget relevant mål for effektivitet i brugen af sådanne værktøjer er det antal brugerinteraktioner, der kræves for at nå et ønsket resultat. Et andet mål er kompleksiteten af interaktioneme.
Hvis brugeren, som måske ikke er databaseekspert, oplever, at kompleksiteten af brugerinteraktionerne er relativt høj og desuden ligger noget ved siden 15 af hans forventninger om, hvad der kræves for at nå frem til et ønsket resultat, vil brugeren have en tendens til at blive irriteret eller frustreret og opgiver måske at bruge databaseværktøjet.
Kendt teknik 20
Generelt kendes der forskellige systemer til søgning og genfinding af information.
I EP 1 477 909 beskrives der forskellige aspekter ved at identificere, lagre, 25 genfinde og på anden måde håndtere metadata i forhold til en multidimensional database, hvor der er lagret strukturerede data i databasen.
I ”A Relevance-Extended Multi-dimensional Model for a Data Warehouse Contextualized with documents” af Juan Manuel Pérez og Torben Bach Pe-30 dersen et al, 2005, beskrives en kombination af et traditionelt datavarehus og et dokumentdatavarehus, som resulterer i et kontekstualiseret varehus. Dette 3 DK 177142 B1 - kontekstualiserede - varehus kan holde historisk styr på fakta, som beskrives af dataene, og deres kontekst som beskrevet af dokumenterne. En særlig OLAP kubus betegnet en R-kubus beskrives. R-kuber er kendetegnet ved to særlige dimensioner: en relevans-dimension, som måler relevansen af 5 hvert faktum i en valgt analysekontekst, og en kontekst-dimension, som relaterer hvert faktum til de dokumenter, som forklarer deres omstændigheder.
Der beskrives en arkitektur for integrationen af et datavarehus med strukturerede data med et dokumentvarehus med ustrukturerede dokumenter. Dokumentvarehusene kan bruges til at lagre ikke-struktureret information fra orga-10 nisationers interne og eksterne kilder f.eks. i et XML-format.
R-kuber forudsætter imidlertid en speciel struktur med yderligere dimensioner, som skal installeres med prækompileret information om dokumentrelevans. Dette medfører en yderligere indsats til at opsætte, opdatere og vedli-15 geholde en R-kubus sammenlignet med en almindelig OLAP-kubus. Når der ankommer nye dokumenter eller de skal lagres i dokumentdatabasen, ser det ud til, at det er nødvendigt med genberegning af relevans-”measure".
En bruger, som ved, at der findes et relevant dokument, som endnu ikke er 20 lagret i dokumentdatabasen, vil opleve, at systemet har lav performance og begynder måske et lede efter dokumentet med det søgeværktøj, som han måtte have til rådighed. Brugeren vil dog sandsynligvis anse denne søgning for at ligge uden for hans forventninger til en R-kubus med hensyn til, hvad der kræves for at finde frem til det relevante dokument.
25
Kort beskrivelse
Der tilvejebringes en computer-implementeret fremgangsmåde, som er ejendommelig ved at omfatte: at konvertere metadata-elementerne til en søgefo-30 respørgsel, at rette søgeforespørgselen til en søgemaskine med henblik på 4 DK 177142 B1 at søge efter dokumenter, der befinder sig i en anden database; optage søgeresultatet, og lave en præsentation af søgeresultatet.
En bruger slipper således for opgaven med at specificere søgeforespørgse-5 len - hvilket ofte medfører tidskrævende trial-and-error forsøg. Det antal bru-gerinteraktioner, der er nødvendigt for, at en bruger kan forberede en søgning, sænkes betydeligt.
Der drages nytte af det erkendte faktum, at metadata omfatter værdifuld in-10 formation ikke blot til at genfinde strukturerede data, men også til at søge efter dokumenter. Derved bliver det muligt at søge automatisk efter dokumenter ved automatisk at frembringe søgeforespørgsler fra en kontekst, hvor der udføres dataanalyse af strukturerede data. Følgelig forbedres funktionali-teten af databasen betydeligt, samtidig med at effektiviteten også forbedres.
15 Idet søgningen efter dokumenter kan udvides til en anden database og ud over den første database, hvor der er gemt strukturerede data, bliver belastningen på opsætning og vedligeholdelse af den database, der indeholder de strukturerede data, stort set ikke øget, samtidig med at der tilvejebringes en langt mere dynamisk indfaldsvinkel til dokumentgenfinding i sammenhæng 20 med struktureret dataanalyse.
Der tilvejebringes også en computerimplementeret fremgangsmåde, der omfatter: At anmode en søgemaskine om at udføre en søgning tildelt en søgestreng med henblik på at tilvejebringe et søgeresultat; at optage søgeresulta-25 tet; og at lave en præsentation af søgeresultatet. Fremgangsmåden er ejendommelig derved, at søgestrengen fremstilles ved: at tage et sæt af metada-ta-elementer, som definerer et datasæt fra et datasupersæt; og at frembringe forskellige søgeforespørgsler fra forskellige subsæt af metadata-elementerne til forskellige søgninger; hvor søgeresultatet omfatter forskellige resultatsæt.
30 5 DK 177142 B1
Derved kan der automatisk udføres en søgning - som letter brugeren for den mentale opgave at overveje, hvorledes en søgning skal udføres, og derefter faktisk udføre en søgning. Idet der drages nytte af, at metadata omfatter nyttig information med hensyn til dokumentsøgning og idet der udføres forskelli-5 ge søgninger, bliver sandsynligheden for at genfinde et dokument stærkt forbedret. Søgeforespørgselen kan udformes, så den har forskelligt omfang, hvilket gør det muligt for brugeren ganske enkelt at browse gennem resultater. Browsingen findes at være langt mere relevant for en bruger end faktisk at udføre søgningen, som anses for at ligge noget uden for det primære mål 10 med at identificere det relevante dokument.
Datasupersættet kan lagres i en første database og de forskellige søgninger kan udføres i perifere datakilder. Den første database kan være en multidi-mensionel database, eller en database som emuleres, så den ser ud som en 15 multidimensionel database; de perifere datakilder kan omfatte filservere, in-ternetressourcer, osv.
Søgeforespørgslerne kan omfatte forespørgsler rettet mod en søgning efter metadata af dokumenter.
20
Fremgangsmåden kan omfatte at konvertere et metadata-element, der relaterer sig til en tidsdimension, til en søgeforespørgsel, som adresserer metadata af dokumenter. Derved kan dokumenter, som (kun) matcher søgeforespørgselen på deres metadata, blive fremfundet ved søgningen; dette er vig-25 tigt, idet det har vist sig, at information om tid sjældent er nyttig i en fritekstsøgning. Imidlertid vil metadata i dokumenterne ofte afspejle tidsrelevansen af dokumentet.
Fremgangsmåden kan også omfatte at konvertere metadata-elementer til ord 30 og oversætte ordene fra ét sprog til et andet sprog. Derved kan et eller flere brugersprog, som er forskellige fra basissproget, understøttes. Desuden kan 6 DK 177142 B1 søgeforespørgslerne frembringes i forskellige sprogversioner for at udvide søgningens område til dokumentsamlinger på andre sprog.
Frembringelse af de forskellige søgeforespørgsler ved at fjerne og/eller ænd-5 re metadata-elementerne fra metadatasættet, der vælges for de forskellige søgeforespørgsler, kan også udføres. Derved bliver det muligt at automatisk udføre søgninger, som har forskelligt område; de forskellige områder og respektive resultater kan rangeres.
10 Modificering af et dokument for at forsyne det med indholdet af en søgefore-spørgsel således at det sikres, at information forekommer både i søgefore-spørgselen og i dokumentet, kan også udføres. Derved bliver sandsynligheden for at være i stand til atter at genfinde dokumentet i samme kontekst stærkt forbedret. Det er særligt vigtigt, idet en bruger måske har fundet et 15 stærkt relevant dokument, som det måske ville være ønskeligt at kunne genfinde på et senere tidselement - af samme bruger eller en anden bruger, som kunne drage nytte af, at en tidligere bruger tidligere har udført samme analyse. At indføre indholdet af søgeforespørgselen i dokumentet kan udføres automatisk eller som svar på, at en bruger udtrykkeligt markerer doku-20 mentet som relevant.
Fremgangsmåden kan også omfatte at etablere et link fra søgeforespørgselen til dokumentet og/eller fra dokumentet til søgeforespørgselen. Derved bliver det muligt at kortlægge søgeforespørgselen i forhold til et eller flere 25 link(s), som angiver dokumentets lokalitet. Det kan udføres automatisk eller som svar på, at en bruger udtrykkeligt markerer dokumentet som relevant.
Der tilvejebringes også et computerlæsbart medium, hvorpå er indkodet et program, som, når det køres på en computer, får computeren til at udføre 30 ovennævnte fremgangsmåde. Desuden tilvejebringes der en computer, 7 DK 177142 B1 hvorpå der er indkodet et program, som, når det køres på en computer, får computeren til at udføre fremgangsmåden.
Kort beskrivelse af tegningen 5
Der tilvejebringes en detaljeret beskrivelse, idet der henvises til tegningen, hvor:
Fig. 1 viser et procesdiagram over at frembringe og udføre en søgning ud fra 10 metadata;
Fig. 2 viser et søjlediagram over et system med at frembringe og udføre en søgning ud fra metadata;
Fig. 3 viser et procesdiagram over at frembringe de forskellige søgninger; og Fig. 4 viser en visningsstruktur.
15
Detailbeskrivelse
En dimension er en samling af data af samme type; den tillader strukturering af en multidimensional database. En multidimensional database defineres 20 typisk som en database med mindst tre uafhængige dimensioner. “Measures” er data struktureret efter dimensioner. I et “measure” er hver datacelle forbundet med en enkelt position i en dimension. ’’Dimensions” og “measures” angives ved deres navne. ’’Dimensions” kan have parametre eller dimensionsværdier, som specificerer værdier eller værdiområder for den di-25 mension for hvilken der vælges associerede værdier af “measures”. “Measures”, "dimensions” og dimensionsværdier benævnes også metadata-elementer og kan kombineres i et sæt af metadata-elementer. Sådanne me-tadata-elementer kan specificere et datasubsæt ud fra et datasupersæt, som er gemt i en database. Metadatasættet gøres ofte uafhængigt af enhver spe-30 cifik forespørgselssyntaks, som måtte bruges i trinnet med faktisk at genfinde datasubsættet fra databasen.
8 DK 177142 B1
Der kan tilvejebringes særlige moduler til at transformere operationelle data fra en kildedatabase eller transaktionsdatabase til analytiske data i et datavarehus. I nogle situationer vil det være uhensigtsmæssigt at transformere de 5 operationelle data til analytiske data, som lagres i en anden database. Derfor kan den operationelle database, som typisk er en relationel database, emuleres, således at den viser en grænseflade, hvormed den operationelle database fremkommer og kan adresseres som en multidimensional database. I nedenstående kan betegnelsen ’database’ angive enhver type database, 10 uanset om den er analytisk eller transaktionel.
På fig. 1 vises et procesdiagram over at frembringe og udføre en søgning ud fra metadata. I trin 101 indsamles der et sæt af metadata-elementer, som definerer et datasæt ud fra et datasupersæt. Sættet af metadata-elementer 15 kan indsamles ved hjælp af et system som vist på fig. 2, hvor sættet af metadata-elementer kan være det sæt af metadata, som definerer de aktuelt viste data.
For eksempel kan sættet af metadata være som følger i et eksempel på for-20 mat: {REVENUE; TIME_MONTH; COUNTRY="Hungary”; PRODUCT="Jeans; TIME_YEAR=’’2006”} 25 hvor elementer i metadatasættet omsluttes af krølleparenteser og adskilles af semikoloner. Ordene med store bogstaver angiver navne på “measures” eller "dimensions” i den multidimensionale database, langs hvilken “measure(s)” vises. Navnene på ’’dimensions” efterfølges af et lighedstegn og en parameter, som angiver en dimensionsværdi eller område af værdier. Databasen vil 30 blive forberedt med information, der indeholder information om, hvilke navne, der er “measures”, og hvilke, der er "dimensions”. I denne henseende er det 9 DK 177142 B1 således ikke nødvendigt at tilvejebringe yderligere information i sættet af me-tadataelementer udover navnene og dimensionsværdierne. Formatet kan udvælges eller defineres, som det vil være en fagmand bekendt - det kan f.eks. være i overensstemmelse med XML.
5
Det første element er ’’revenue”, som defineres af databasen som værede et “measure”. Det andet element specificerer, at "revenue” skal vises med månedlige intervaller, dvs. at TIME_MONTH defineres som værende en "dimension”. Det tredje element specificerer det kriterium, at ’’revenue” skal be-10 grænses til værdier, hvor ’’country” (defineret som en "dimension”) er "Hungary”. Det fjende element specificerer, at "revenue” skal begrænses til værdier, hvor ’’product” (defineret som en "dimension") er "Jeans”.
Disse metadata indsamles eller hentes fra et lager, når en bruger får vist en 15 såkaldt visning og spørger efter en søgning efter dokumenter. En visning omfatter et eller flere præsentationsobjekter, men vil blive forklaret mere detaljeret i forbindelse med fig. 4. Faktisk svarer ovenstående eksempel til en situation, hvor visningsstrukturen kun omfatter et enkelt præsentationsobjekt. Det vil blive beskrevet nedenfor, hvorledes et sæt af metadataelementer med 20 elementer fra adskillige visninger håndteres. Metadatasættet specificerer de data, der vises ved visningen, og bliver således hurtigt til rådighed med henblik på at blive forberedt til søgning efter dokumenter. Derved frigøres en bruger fra den opgave at skulle specificere indholdet af metadatasættet eller dets lokation. Herved reduceres det antal brugerinteraktioner, som er nød-25 vendigt for, at en bruger kan frembringe en søgning, meget.
Når sættet af metadata ifølge ovenstående eksempel er blevet hentet, frembringes der forskellige subsæt af metadataelementer (fra metadatasættet) i trin 102. Subsættene kan frembringes på forskellige måder, men det ønskes 30 generelt at prioritere eller rangere subsættene ved at reducere og/eller ændre elementerne hen over de forskellige subsæt. Subsættene betegnes f.eks.
10 DK 177142 B1 MSS-1, MSS-2, MSS-n, hvor MSS-1 er et primært subsæt og MSS-2 til MSS-n er underordnede i forhold dertil. Det eksempelvise indhold af metada-tasættene MSS-1, MSS-2, MSS-3, MSS-4 vises nedenfor: MSS-1 MSS-2 MSS-3 MSS-4
Revenue Revenue Revenue
COUNTRY
Hungary Hungary Hungary
PRODUCT
Jeans Jeans Jeans
YEAR
2006 2006 2006 2006 5
Efterfølgende frembringes der i trin 103 respektive, forskellige søgefore-spørgsler betegnet S-1, S-2, ..S-n ud fra de forskellige subsæt af metadata (MSS-1, MSS-2.....MSS-n). Søgeforespørgsleme tilpasses i overensstem melse med grænsefladen af en søgemaskine, f.eks. en grænseflade, som 10 tilvejebringer mulighed for fritekstsøgning. En søgemaskine kan være en hver type søgemaskine, der søger efter indhold inden for området af en lokal computer, et privat computernetværk eller en del deraf eller et offentligt tilgængeligt netværk såsom Internettet.
15 Alt afhængigt af et ønsket omfang af søgningen kan der vælges en passende søgemaskine. Søgemaskinen kan f.eks. være Google Desktop™, Microsoft Desktop™ eller enhver anden søgemaskine, f.eks. de, der kategoriseres som såkaldte "enterprise search engines". En ’’enterprise search engine" kan være eller er ofte konfigureret til at søge i dokumenter, som er gemt inden for et 20 privat netværk. Terminologien, som bruges i sådanne dokumenter, kan ligne den terminologi, der bruges i datalageret, idet de ofte frembringes af samme organisation. Derved bliver sandsynligheden for at opnå søgeresultater fra en relativt snæver eller specifik søgeforespørgsel øget. Søgemaskinen kan sø- 11 DK 177142 B1 ge efter dokumenter i forskellige formater, f.eks. i HTML-format, PDF-format, navnebeskyttede tekstbehandlingsformater, regnearksformater, e-mailformater, osv. Dokumenterne kan have indhold f.eks. i form af tekst i et tekstbehandlingsdokument. Desuden kan disse dokumenter have forskellige 5 egenskaber og/eller forskellige typer egenskaber, f.eks. en egenskab, der angiver, på hvilken dato og/eller tidspunkt dokumentet blev modificeret og/eller oprettet. Disse egenskaber betegnes også metadata af dokumenterne eller dokumentmetadata.
10 De forskellige søgemaskiner kan udvise forskellige grænseflader, som kræver forskellig syntaks. Sådanne grænseflader kan udvise adgang udelukkende til indholdet af dokumenterne eller også adgang til dokumentmetadata eller en del af dokumentmetadataene.
15 I fortsættelse af ovenstående eksempel frembringes nedenstående søgefo-respørgsler: Søgeforespørgsel: S-1 ’’revenue country hungary product Jeans year 2006” S-2 “revenue hungary jeans 2006” S-3 “hungary jeans” S-4 "revenue” Søgeforespørgslerne formateres til data af strengtypen, hvor mellemrum og 20 f.eks. ASCIl-karakterer specificerer indholdet af søgeforespørgslerne. Det bemærkes, at søgeforespørgslerne S-3 og S-4 mangler ”2006”-udsagnet. Imidlertid kan der bruges andre formater end strengtypen, f.eks. formater i henhold til XML eller SOAP (Simple Object Application Protocol).
25 Metadata, som formateres til søgemaskinen (eller dennes grænseflade) kan være en del af de forskellige søgeforespørgsler eller blot nogle af dem. Me- 12 DK 177142 B1 tadata til søgemaskinen kan formateres i overensstemmelse med en specifik syntaks, som kræves af søgegrænsefladen, f.eks. i henhold til XML eller SOAP. I eksemplet kan ”2006”-udsagnet formateres i henhold til en given syntaks.
5
Det kan antages, at grænsefladen accepterer metadata med følgende syn-taks: [metadata:date_modified:dd_mm_yyyy], hvor metadata er et ord, der reserveres af grænsefladen, som identificerer, at der leveres metadata.; da-tajrtodified er et reserveret ord af en opregnet type og specificerer typen af 10 metadata; og dd_mm_yyyy er en formatering af en data, som accepterer %-tegnet som wildcard. Således kan f.eks. S-3 og S-4 forsynes med udsagnet.
Metadata:date_modified:%%_%%_2006 15 Således kan S-3 og S-4 være: S-3* "hungary jeans metadata:date_modified:%%_%%_2006” S-4* “revenue metadata:date_modified:%%_%%_2006”
Der vælges en specifik type metadata: “datamodified”. Denne specifikke type kan bestemmes af en systemadministrator eller sættes op af en burger.
20 I tilfælde af at de specifikke metadata er ukendte, kan systemet omfatte en liste af mulige metadataelementer for dokumenterne, som adresseres ved '’trial-and-error”. Derved kan der udføres en metadatasøgning uden at kende det præcise navn på metadataelementet.
25 Når de forskellige søgeforespørgsler er blevet klargjort, udføres der i trin 104 en søgning efter dokumenter pr. søgeforespørgsel. Det kan udføres ved at foretage søgeforespørgslerne som eksemplificeret ovenfor. Søgeforespørgs-lerne kan foretages konsekutivt og ubetinget på resultatet af en tidligere foretaget forespørgsel, eller der kan foretages en efterfølgende forespørgsel, 13 DK 177142 B1 hvis en given betingelse på det forudgående resultat blev opfyldt f.eks. ved at stoppe kæden af konsekutive søgninger, hvis en tidligere søgning afslørede relevante søgeresultater. Her kan relevant bestemmes i henhold til en specificeret “measure”, som kendes inden for området med at hente information 5 eller computerbaserede søgninger.
I tilfælde af at søgegrænsefladen ikke accepterer en syntaks til at søge i metadata, kunne det være en søgestrategi at foretage en søgeforespørgsel uden at specificere metadata. Det vil højst sandsynligt resultere i et større 10 sæt af søgeresultater (dokumenter). Disse dokumenter kan hentes og efterbehandles med henblik på at adressere deres metadata (hvis de har nogen), hvor det er muligt, f.eks. ved at bruge viden om dokumenter med en specificeret metadatastruktur. Dokumenterne kan lagres i et depot, så søgningen foretages i depotet.
15 I trin 105 bliver resultaterne R-1, R-2, .... R-n af de udførte søgninger efterfølgende fremfundet og ordnet for at muliggøre identifikation af den tilsvarende søgeforespørgsel.
20 Stadigt efterfølgende og i trin 106 bliver resultaterne vist i prioriteret rækkefølge som angivet ved rangen af de tilsvarende metadatasæt som forklaret ovenfor. Det vil blive beskrevet mere detaljeret i det følgende, hvorledes dokumenterne skal vises.
25 Således kan brugeren være i gang med at frembringe en analyse på basis af en specifikation af data, som udgør analysens indhold. I den situation kan der ved analysen afdækkes information, som det kræver yderligere information fra perifere datakilder at forstå eller undersøge nærmere. De numre og tal, som frembringelse af dataanalysen baseres på, kan måske ikke tilvejebringe 30 sådan yderligere information fra centrallageret. Det vil forstås, at det centrale lager indeholder datasupersættet og datasubsættet, men ikke nødvendigvis 14 DK 177142 B1 (dvs. typisk) dokumenter til yderligere undersøgelse. Derfor kaldes kilderne til sådanne dokumenter perifere kilder. Uden at afvige fra denne definition kan det centrale lager være fordelt på forskellige fysiske lokationer og/eller databaser. Det centrale lager kaldes også datalageret og det perifere lager kaldes 5 også dokumentlageret.
Ifølge ovenstående kan sådan yderligere information fra perifere kilder hentes, samtidig med at brugeren interagerer med systemet for at udføre dataanalyse på basis af data fra den centrale kilde.
10
Idet specifikationen for de data, der indgår i dataanalysen, holdes ved hjælp af metadataelementer i et metadatasæt, og idet forskellige søgestrenge frembringes fra forskellige subsæt af metadataelementerne, således at der kan udføres forskellige søgninger, bliver sandsynligheden for at finde søge- 15 resultater, som er relevante for den pågældende dataanalyse, øget. Idet der frembringes forskellige søgninger, er det muligt at prioritere resultaterne deraf. Søgningerne kan initieres automatisk eller ved en enkelt brugerforespørgsel (f.eks. ved et enkelt museklik). Efterfølgende kan en bruger udføre en dataanalyse og nemt opnå relevante resultater uden at specificere søge- 20 strengene ved trial-and-error. Desuden behøver brugeren ikke bryde sin koncentration ved at skulle granske information ved en underordnet opgave med at formulere en søgeforespørgsel - hvilket ofte er en tidskrævende trial-and-error proces.
25 På fig. 2 vises et første søjlediagram over et system i henhold til opfindelsen. Systemet 200 omfatter en brugergrænseflade 201, som arbejder i kombination med en middleware-komponent 221 og én database DB, 219 med en databasegrænseflade DB IF, 218.
30 Middleware-komponenten 221 tilvejebringer funktionalitet af brugergrænsefladen 201 og er konfigureret til at modtage input fra brugergrænsefladen og 15 DK 177142 B1 tilvejebringe output til brugergrænsefladen 201. Middleware-komponten 221 tilvejebringer indhold til brugergrænsefladen 201 ved hjælp af bl.a. databasen 219. Databasen 219 adresseres via databasegrænsefladen 218. Middleware-komponenten er også konfigureret til at foretage en forespørgsel til databa-5 sen 219 via databasegrænsefladen 218 og hente et resultatdatasæt fra databasen 219 via databasegrænsefladen. Fortrinsvis omfatter databasegrænsefladen en cache-hukommelse til hurtig fremfinding af et tidligere fremfundet datasæt.
10 Brugergrænsefladen 201 vises i form af et vindue, som har en styrebjælke 202 med styring til at lukke, maksimere og minimere vinduet på en visning. Vinduet omfatter styrekomponenter i form af en inputtekstboks 207, en listeboks 208 over besøgte steder, en præsentationsboks 209 med valgmuligheder og en datarapport 203, hvori der er anbragt forskellige grafiske præsenta-15 tionsobjekter 204, 205, 206. Datarapporten kan således arrangeres som en beholder for præsentationsobjekterne. Denne datarappport eller beholder betegnes også en visning eller visningsstruktur. Forskellige grafiske præsentationsobjekter anbringes i visningen, f.eks. som vist et søjlediagram-objekt 204, et cirkeldiagram-objekt 25, et tabel-objekt 206. Disse grafiske præsenta-20 tionsobjekter tilvejebringer hver især en præsentation af datasæt hentet fra databasen 219.
Brugergrænsefladen 201 og middleware-komponenten 221 tilvejebringer i kombination følgende funktionalitet: 25 I en første situation kan en bruger foretage en forespørgsel om et datasæt, som skal præsenteres ved hjælp af visningen eller datarapporten 203. Forespørgselen kan indleveres i form af et naturligt sprog eller et pseudonaturligt sprog omfattende ord eller tekstelementer, der identificerer metadataelemen-30 ter i databasen 219. Forespørgselen behandles af en metadatabestemmel-sesenhed 214 af middleware-komponenten 221. Metadatabestemmelsesen- 16 DK 177142 B1 heden 214 tilvejebringer et output med metadataelementer til at identificere et datasæt i databasen 219. Metadatelementeme lagres i et register i en THM (Track History Memory) 215. Desuden sendes metadataelementerne til en forespørselsskaber 217, som tilvejebringer en formel forespørgsel i hen-5 hold til en syntaks, som accepteres af databasegrænsefladen 218. Databasegrænsefladen 218 henter det datasæt, som identificeres af metadataelementerne, ved hjælp af den formelle forespørgsel fra databasen.
Det hentede datasæt leveres til et rapportobjekt 220, som indsamler metada-10 taelementerne til at identificere datasættet og præsentationsegenskaberne for at kunne gengive en præsentation af datasættet i visningen 203. Desuden tilvejebringer rapportobjektet fremgangsmåder til at interagere med visningen af de grafiske præsentationsobjekter deraf.
15 Præsentationsegenskabeme tilvejebringes med en PPD (Presentation Properties Determining) -enhed 216, som har en første mode, hvor præsentationsegenskaber bestemmes automatisk fra metadataelementerne, MD, tilvejebragt af metadatabestemmelsesenheden 214. I en anden mode modtager PPD-enheden 216 en brugers input til at modificere præsentationsegenska-20 berne via præsentationsboksen 209 med valgmuligheder. Derved kan præsentationen tilpasses en brugers præferencer. I en tredje mode tilvejebringes der en kombination af funktionalitet af den første og den anden mode.
De præsentationsegenskaber, som tilvejebringes af PPD-enheden 216 bliver 25 eventuelt gemt i det register, som indeholder metadata-elementerne af præsentationen. Denne første situation beskrives mere detaljeret i offentliggjort patentansøgning nr. EP 1 477 909.
I en anden situation kan en bruger finde en tidligere forespørgsel efter data i 30 form af metadataelementer lagret i et register. Brugeren kan foretage et valg med henblik på at vælge registeret fra THM’en 215 ved hjælp af historieliste- 17 DK 177142 B1 boksen 208 på brugergrænsefladen 201. Dette register kan bruges til at lave en præsentation eller få udført en søgning (se nedenfor). Dette beskrives mere detaljeret i publiceret patentansøgning EP 1 659 503.
5 I en tredje situation kan en bruger efterspørge yderligere data ved en handling, som er rettet direkte mod et element af et grafisk præsentationsobjekt af visningen. Som svar på detektering af handlingen ændres datasæt af de individuelle præsentationer af visningen til at tillade nærmere undersøgelse eller analyse af datasættene. Dette beskrives mere detaljeret i publiceret pa-10 tentansøgning EP 1 577 808.
I en fjerde situation kan en bruger fortsætte enten fra ovenstående eller andre situationer ved at foretage en forespørgsel efter en søgning efter dokumenter som beskrevet i forbindelse med fig. 1 og 3. Forespørgslen kan være 15 i form af en aktivering af en grafisk knap på brugergrænsefladen (eller en tast på et tastatur) eller en aktivering af enhver anden styring (objekt) på brugergrænsefladen.
Søgningen frembringes af en enhed, PS, 212 og i overensstemmelse med 20 det på fig. 1 og 3 viste procesdiagram. Når søgningen frembringes af enheden PS, 212 og der frembringes forskellige søgeforespørgsler, sendes søge-forespørgslerne til en grænseflade af en søgemaskine SIF, 213. Søgeresultaterne, der returneres til søgemaskinen via søgegrænsefladen 214, tilvejebringes via enheden 212 til rapportobjektet 220 med henblik på visning på 25 brugergrænsefladen.
Tilbage til den første situation kan brugeren efterspørge data ved hjælp af inputtekstboksen 207, hvori brugeren kan skrive et spørgsmål i naturligt sprog på et foretrukket sprog, f.eks. engelsk. Fra en brugers synsvinkel ud-30 gør dette spørgsmål en forespørgsel til databasen 213. Ifølge et eksempel på en udførelsesform kan databasen 213 indeholde følgende dataelementer, 18 DK 177142 B1 hvor dataelementerne kategoriseres som “measures” eller ’’dimensions” og hvor en ’’dimension” findes på forskellige niveauer, såsom dag, måned og år: “measures”: Dimensions: ’’REVENUE” ’’time” (level 0: Year; level 1: Month; level 2:
Day “cost” “Customer” (level 0: Group; level 1: Name) “CONTRIBUTION MAR- “Product (level 0: Group; level 1: Name) GIN” “revenue” “Country” "budget” “BusinessUnit” 5
Derved kan man f.eks. stille følgende spørgsmål: 1) I would like to see ’’cost” grouped by ’’time, month” 2) I would like to see “REVENUE” grouped by “time, month”, “customer, 10 group" and “product, name” 3) I would like to see “REVENUE” for year 2004 4) I would like to see “country”
Spørgsmål som ovenstående sendes til en metadatabestemmelsesenhed 15 214, som er indrettet til at identificere metadataelementer og deres kategori og niveauer ved at parse spørgsmålet. Dimensionen "time” kan alternativt benævnes time_year; timemonth; time_day. Derved kan konceptet om “niveauet undgås. Dette gælder også for de øvrige dimensioner med hensigtsmæssige ændringer.
På basis af de identificerede metadataelementer er metadatabestemmelses-enheden 214 i stand til at slå op i en THM 215 over tidligere brugte kombina- 20 19 DK 177142 B1 tioner af metadata og præsentationsegenskaber. Indholdet af lagerhukommelsen 215 kan have følgende form som vist på tabel 1:
Data Præsentation Frekvens
Time, Level 1 Type=Barchart; legend=off; 3 REVENUE labels=off; 3D-effects=Orthogonal
Country; Type=map; legend=off; 3 CONTRIBUTION-MARGIN Labels=on; 3D-effects=None Margin
Customer, Level 0; Type=Crosstab; iegend=off; 2 REVENUE; Labels=off; 3D-effects=None
Cost;
CONTRIBUTION-MARGIN
Margin
Tabel 1 5
Ved at søge i lagerhukommelsen 210 med indhold som vist i ovenstående tabel 1 efter et match med de dataelementer og de niveauer, som identificeres ud fra spørgsmålet, er det muligt at bestemme, hvorvidt en tidligere præsentation, som matcher spørgsmålet, er blevet brugt. Derved kan der findes 10 foretrukne præsentationsegenskaber. Hvis det f.eks. bestemmes, at et spørgsmål involverer dataelementet "time, level Γ og "REVENUE", vil det kunne udledes, at den foretrukne præsentation af disse dataelementer er et søjlediagram med egenskaber som vist i ovenstående tabel 1.
15 Præsentationsegenskaber bestemmes af præsentationsbestemmelsesenheden 216 på basis af resultatet af søgningen efter matchende dataelementer og -niveauer. De bestemte præsentationsegenskaber gemmes i et præsentationshukommelsesobjekt 220.
20 DK 177142 B1
Den metadatabestemmende enhed 214 konverterer spørgsmålet eller meta-dataene, alt efter hvad der måtte være tilfældet, til en forespørgsel, som kan indleveres til en database 219 via en databaseforbindelse. Som svar på forespørgselen tilvejebringer databasen et resultatdatasæt. Dette resultatdatasæt 5 sendes til et præsentationshukommelsesobjekt 220. Derved håndteres resultatdatasættet og præsentationsegenskabeme i samme hukommelsesobjekt 220.
Nu vendes der tilbage til et mere generelt aspekt, hvor metadataelementerne 10 er koder, som gør det muligt at identificere et datasubsæt ud fra et datasu-persæt, som lagres i en database. For at populere, vedligeholde osv. mere intuitivt, konformerer databasen til et enkelt, såkaldt basissprog, som repræsenterer et sprog af elementer i databasen. Dette basissprog kunne være engelsk, men kunne være ethvert sprog, herunder kunstige sprog. Metadata-15 elementerne gives grundlæggende af koder, som identificerer elementerne i databasen. For at fortsætte det intuitive aspekt gives koderne i grundsproget.
I det givne eksempel gives metadataelementerne ved koder i form af ord fra det engelske sprog. Det gør det mere intuitivt at efterspørge og fortolke data 20 fundet via metadataelementerne.
Ifølge en udførelsesform bruges der en elektronisk ordbog eller oversættelsestjeneste til at oversætte ordene i metadataelementerne til og fra et brugersprog, som kan være forskelligt fra basissproget. Dette vil blive beskrevet 25 mere detaljeret nedenfor. Brugersproget er typisk et naturligt sprog, f.eks. engelsk, tysk eller fransk.
På tig. 3 vises et procesdiagram over frembringelsen af forskellige søgninger. Procesdiagrammet omfatter trin, der også vises i forbindelse med det på fig.
30 1 viste procesdiagram. Sættet af metadata, MS, konverteres til forskellige søgeforespørgsler S-1, S-2, S-3 og S-4. De første to søgeforespørgsler DK 177142 B1 21 frembringes via en første rute 310 i procesdiagrammet og de to sidste søge-forespørgsler frembringes via en anden rute 311.
Den første rute omfatter et trin 301, hvor elementer fra metadatasættet, MS, 5 vælges. For at frembringe den første søgeforespørgsel, S-1, er trin 301 i en første mode, hvor alle elementer af metadatasættet, MS, vælges med henblik på at frembringe metadatasubsættet MMS-1. I det efterfølgende trin 302 bliver metadatsubsættet MSS-1 (som omfatter samtlige elementer) konverteret til en streng af ord, der adskilles af mellemrum. Ordene er navnene og para-10 metrene (metadataelementerne) af metadatasubsættet.
I tilfælde af, at der understøttes brugersprog, som er forskellige fra basissproget, udføres et trin 303 med at oversætte ordene (på basissproget) af strengen til ord (på brugersproget) til søgeforespørgselen S-1. Trinnet med at 15 oversætte udføres i henhold til en angivelse af, hvilket brugersprog, der skal oversættes til. Denne angivelse af brugersproget kan indstilles af systemadministratoren. Denne angivelse kan også omfatte information om, hvorvidt sådanne brugersprog er understøttet. Oversættelse kan udføres som beskrevet i patentansøgning EP 1 353 280. Som et resultat af oversættelsen 20 frembringes den første søgeforespørgsel S-1. Eksempler på indhold af S-1 vil fremgå af ovenstående tabel. Det bemærkes, at databasen kan omfatte en første type af ord eller metadatanavne eller parametre, som en databaseadministrator tilvejebringer på forskellige sprog; f.eks. navne på “measures” og "dimensions”. Databasen kan også omfatte en anden type ord, som angiver 25 forekomster af "dimensions”; i ovenstående eksempel f.eks. "Hungary”, "Jeans” og ”2006” (som det måske ikke er nødvendigt at oversætte). Ordene kan oversættes i henhold til en sprogoversættelse med et begrænset antal af eller ingen synonymer. I sidstnævnte tilfælde etableres der således en oversættelse baseret på en ordbog med ord-til-ord-oversættelse.
30 22 DK 177142 B1
Ifølge en udføre I sesfonn kan der specificeres primære og underordnede brugersprog. I det tilfælde kan der frembringes en eller flere søgeforespørgsler, f.eks. kan samtlige søgeforespørgsler frembringes i forskellige sprogversioner. Derved kan en bruger forsynes med søgeresultater på eksempelvis bå-5 de engelsk og tysk. Især når der ikke opnås resultater fra alle sprogversioner af søgeforespørgslerne vil de, der giver resultater, kunne bruges i stedet for at drage den konklusion, at der ikke opnåedes nogen resultater. Når et eller flere brugersprog specificeres, øges sandsynligheden for at fremfinde personlige dokumenter, f.eks. e-mails. Personlige dokumenter kan meget vel 10 relateres til de data, der analyseres af brugeren, idet både dokumenter og analyser tilhører brugerens aktivitetsområde.
For at frembringe den anden søgeforespørgsel, S-2, er trin 301 i en anden mode, hvor samtlige elementer undtagen navne på “measures” i subdatasæt-15 tet, MS, vælges med henblik på at frembringe metadatsubsættet MSS-2. I efterfølgende trin 302 bliver metadatasubsættet MSS-2 (som omfatter navne på dimensioner og parametre) konverteret til en streng af ord, der adskilles af mellemrum. Ordene er navnene og parametrene (metadataelementerne) af metadatasubsættet. Som beskrevet ovenfor kan ordene oversættes med 20 henblik på at konformere med et brugersprog. Eksempel på indhold af S-2 vil fremgå af ovenstående tabel.
Den anden rute omfatter et trin 304, hvor samtlige parametre undtaget parametre på en tidsdimension fra metadatasættet, MS, vælges. Til at frembringe 25 den tredje søgeforespørgsel, S-3, er et trin 304 i en første mode, hvor samtlige parametre, undtaget parametre på en tidsdimension af metadatasættet, MS, vælges for at frembringe metadatasubsættet MSS-3. Imidlertid vælges parameteren/metrene på tidsdimensionen i trin 308.
30 I trin 305 konverteres parametrene, undtaget parametrene på en tidsdimension, til en streng af ord som beskrevet ovenfor. Efterfølgende kan ordene 23 DK 177142 B1 oversættes som beskrevet ovenfor. Resultatet deraf kan være som vist for S-3 i ovenstående tabel.
I trin 309 bliver de valgte parametre på en tidsdimension konverteret til en 5 metadataforespørgsel, som formateres i henhold til en grænseflade af søgemaskinen. Strengen og metadataforespørgsien tilvejebringes i kombination som den tredje søgeforespørgsel. Resultatet deraf kan være som vist for ovenstående S-3*.
10 For at frembringe den fjerde søgeforespørgsel, S-4, er trin 304 i en anden mode, hvor samtlige navne på dimensioner af metadatasættet, MS, vælges for at frembringe metadatasubsættet MSS-4. I trin 308 bliver paramete-ren/metrene på tidsdimensionen valgt. Den fjerde søgeforespørgsel tilvejebringes ved at kombinere strengen og metadataforespørgselen. Resultatet 15 deraf kan være som vist for S-4* ovenfor.
På fig. 4 vises en afbildning. Afbildningen viser den på fig. 1 viste afbildning mere detaljeret og idet der henvises til ovennævnte “measures” og "dimensions”. Afbildningsstrukturen 401 omfatter et første grafisk præsentationsobjekt 20 402 af en søjlegraf-type, som viser værdier af “measures” ’’CONTRIBUTION- MARGIN” (skraverede søjler) og ’’Revenue” (tomme søjler) langs dimensionen ’TIME-MONTH". Desuden omfatter visningsstrukturen 401 et andet geografisk præsentationsobjekt 403 af cirkeldiagramtypen, som viser værdier for "measure” ’’CONTRIBUTION-MARGIN” langs dimensionen ’’BUSINESS-25 UNIT”. Stadigt videre omfatter visningsstrukturen 402 et tredje grafisk præsentationsobjekt 404 af en tabeltype, som viser “measures” ’’REVENUE” og ’’BUDGET” langs dimensionerne ’’BUSINESS-UNIT” og ’’PRODUCT-GROUPS”.
30 Afbildningen opnås under situation 1 som beskrevet i forbindelse med fig. 1, hvor der indtastes et spørgsmål for at identificere metadataelementerne af DK 177142 B1 24 visningen. Alternativt genetableres der en tidligere anvendt visning fra delvis information om metadataene, som gives i spørgsmålet. Stadigt alternativt tilvejebringes visningen ved at genkalde en tidligere visning.
5 Data for visningen defineres ved hjælp af et sæt af metadataelementer for hvert præsentationsobjekt og et fælles sæt af elementer.
1. {REVENUE; CONTRIBUTION-MARGIN; TIME_MONTH; COUN-TRY-’Hungary”; TIME-YEAR_”2006”} 10 2. {CONTRIBUTION-MARGIN, BUSINESS-UNIT; COUN- TRY-’Hungary"; TIME-YEAR=’'2006"} 3. {REVENUE; BUDGET; COUNTRY=”Hungary”; TIME_YEAR=”2006”} hvor elementerne COUNTRY=”Hungary” og TIME_YEAR=”2006” tilhører det 15 fælles sæt af elementer. Metadatasættene 1, 2 og 3 ovenfor kombineres til et enkelt sæt af metadataelementer for at repræsentere dataene fra en visning med tre objekter. Ifølge en udførelsesform konverteres elementerne til søgningen som beskrevet ovenfor, uanset hvilket af sættene 1, 2 og 3 de tilhører. Således vil søgeforespørgslerne alt andet lige omfatte flere termer. Ifølge 20 en anden udførelsesform kan en søgning som beskrevet ovenfor initieres kun for udvalgte blandt ovenstående sæt 1, 2 og 3.
Dimesionsværdierne ’’Hungary” og ”2006” på dimensionerne COUNTRY henholdsvis TIME_YEAR betegnes også baggrundskriterier, idet de i eksem-25 plet er fælles for præsentationerne af en visning svarende til ovenstående respektive metadatasæet 1-3. Det er imidlertid klart, at metadatasættene kan have individuelle dimensionsværdier eller -kriterier, som også ville gælde for et enkelt præsentationsobjekt. Disse aspekter beskrives mere detaljeret i offentliggjort patentansøgning EP 1 659 503.
30 DK 177142 B1 25
Desuden omfatter visningen et grafisk præsentationsobjekt 408 af en type, som viser en liste over dokumenter. Listen over dokumenter omfatter dokumenter, som er opnået ved at udføre en søgning som beskrevet ovenfor. Dokumenterne kan vises på listen som ønsket, f. eks. ved at vise dokument-5 navnet og en titel på dokumentet. Et udsnit af dokumentet kan også vises, så brugeren mere umiddelbart bibringes en opfattelse af dokumentets indhold.
Dokumenterne betegnes D11, D12, D21, D31, D32. Det først ciffer illustrerer nummeret på det søgeresultat, hvor dokumentet fremfandtes. Det andet ciffer 10 illustrerer rangen af dokumentet inden for søgeresultatet. De fire minuskier på figuren illustrerer, at dokumenternes titler vises. Dokumenterne kan adresseres direkte fra det grafiske præsentationsobjekt 408.
Det er muligt at tildele dokumenter eksplicit til en specifik del af dataanaly-15 sen. Den specifikke del af dataanalysen repræsenteres af indholdet af et me-tadatasæt. Et sådant dokument kan frembringes af brugeren i sammenhæng med dataanalysen eller være et dokument, som f.eks. fremfindes i en søgning. Dokumentet kan tildeles ved at tilføre dokumentet information, som vil sikre, at det identificeres som faldende inden for omfanget af søgeforespørg-20 selen (idet det antages, at dokumentet findes). Alternativt kan sættet af metadata tildeles et link til dokumentet.
Dokumenter kan tildeles til en specifik del af dataanalysen via de dele 407 af præsentationsobjekterne, som angives med minusklen Ί’.
25
Betegnelsen OLAP angiver en kategori af databaser, applikationer og teknologier, som tillader indsamling, lagring, håndtering samt reproduktion af mul-tidimensionale data med henblik på dataanalyse.
30 26 DK 177142 B1
Metadata er information om et særligt datasæt, som f.eks. kan beskrive hvordan, hvornår og af hvem det blev modtaget, frembragt, adresseret og/eller modificeret, og hvorledes det formateres.
5 Et aspekt omhandler en computerimplementeret fremgangsmåde omfattende at lave en præsentation af et datasæt med strukturerede data; at lagre meta-dataelementer, som definerer datasættet i forhold til et datasupersæt, som er gemt i en første database med strukturerede data, hvor den computerimplementerede fremgangsmåde yderligere omfatter: at konvertere metadataele-10 menterne ti! en søgeforespørgsel; at overbringe søgeforespørgslen til en søgemaskine med henblik på at søge efter dokumenter, som befinder sig i anden database; at opfange søgeresultatet; og at lave en præsentation af søgeresultatet.

Claims (14)

  1. 27 DK 177142 B1
  2. 1. Computerimplementeret fremgangsmåde omfattende at anmode en søgemaskine om at udføre en søgning tildelt til en 5 søgestreng med henblik på at tilvejebringe et søgeresultat; at opfange søgeresultatet; og lave en præsentation af søgeresultatet, kendetegnet ved at søgestrengen frembringes ved: at tage et sæt af metadataelementer, som definerer et datasæt i 10 forhold til et datasupersæt; og frembringe forskellige søgeforespørgsler fra forskellige subsæt af metadataelementerne til forskellige søgninger; hvor søgeresultatet omfatter forskellige resultatsæt.
  3. 2. Computerimplementeret fremgangsmåde ifølge krav 1, hvor datasuper-15 sættet gemmes i en første database, og hvor de forskellige søgninger udføres i en perifer datakilde.
  4. 3. Computerimplementeret fremgangsmåde ifølge et hvilket som helst af kravene 1 til 2, hvor søgeforespørgslerne omfatter forespørgsler rettet mod en 20 søgning efter metadata af dokumenter.
  5. 4. Computerimplementeret fremgangsmåde ifølge krav 3 omfattende trinnet at konvertere et metadataelement relateret til en tidsdimension til en søgefo-respørgsel, som adresserer metadata af dokumenter. 25
  6. 5. Computerimplementeret fremgangsmåde ifølge et hvilket som helst af kravene 1 til 4 omfattende trinnet at konvertere metadataelementer til ord og oversætte ordene fra et sprog til et andet sprog.
  7. 6. Computerimplementeret fremgangsmåde ifølge et hvilket som helst af kra vene 1 til 5 omfattende trinnet at frembringe de forskellige søgeforespørgsler 28 DK 177142 B1 ved at fjerne og/eller ændre de metadataelementer fra metadatasættet, som vælges til de forskellige søgeforespørgsler.
  8. 7. Computerimplementeret fremgangsmåde ifølge et hvilket som helst af kra-5 vene 1 til 6, som yderligere omfatter at modificere et dokument for at forsyne det med indhold af en søgeforespørgsel, så det sikres, at information optræder både i søgeforespørgslen og dokumentet.
  9. 8. Computerimplementeret fremgangsmåde ifølge et hvilket som helst af kra-10 vene 1 til 7, som yderligere omfatter at etablere et link fra søgeforespørgslen til dokumentet og/eller fra dokumentet til søgeforespørgslen.
  10. 9. Computerlæsbart medium, hvorpå er indkodet et program, som, når det indlæses på en computer, får computeren til at udføre fremgangsmåden iføl- 15 ge et hvilket som helst af kravene 1 til 8.
  11. 10. Computer, hvorpå er indkodet et program, som, når det indlæses på computeren, får computeren til at udføre fremgangsmåden ifølge et hvilket som helst af kravene 1 til 8. 1/4 DK 177142 B1 Indsamling af et sæt af / / metadataelementer, som definereret ^ / ^g / datasæt ud fra et datasupersæt ^7 — / 101 / / i-j Frembring forskellige subsæt af metadataelementer fra sættet af metadataelementer 102 m T - ~> / MSS-1 / / MSS-2 / ... / MSS-n / Frembring forskellige søgeforespørgsler for de forskellige subsæt af metadataelementer 103 * ~ '1' ~ “3_ / S-1 / / S-2 / ... / S-n / T Udfør en søgning efter dokumenter pr. søgeforespørgsel 104 _Ϊ_ Fremfind resultat afsøgning pr. søgeforespørgsel 105 i ΓΤ ^ R-1 J ^ R-2 ^ ... j R-n ^ ▼ Vis resultater i prioriteret rækkefølge Fig. 1 ordnet efter søgeforespørgsler 106 2/4 DK 177142 B1 202—\ / 200 x utm / I 205 s I 201A /2M C£\ 203-\ __Π □ »» __ X I— — — —i/206 * I lB HLB POB 209 207 208 — I i i | -r---------------;
  12. 213. L „ i- ' — 212 Ί ,-! , -ί-MD - I PPD S ' S MDD -n r-V 216 Γ ! ! 214 pp [ Lrn- ! 991—. i THM Rapport Obj. i
  13. 215 H ! i -J i j .. -^ M 220 m— ] ' \-— -' | Forespørger DS - J i 217 j i i I I I_______________________________________________I v | DB IF 218 b DB 219 ^—li—J Fig. 2 3/4 DK 177142 B1 ^ MS ^ I I I - 310 I I I Vælg elementer I I ^ 501 ] I I
  14. 1. I _ ! / 7 Konverter til _ 1 / 7 / MSS-1 /_ streng Oversæt |_ / S_1 / I / MSS-2 / 303 i 7 S'2 / I / / 302 — ] / / I I i i L______________—_____________________i f----------------------------------------j ' - 3H I ! i I ^ Vælg elementer | i ^ 304 i 307^ ! ! / ' V Konverter til Oversæt I / 7 / MSS-3' / streng Oversæt 7 Λ J / S-3 / / MSS-4' / J 7 S~4 / i r i i tidsdimension(er) / MSS-3" / metadata- _j 1 I ^ 7 MSS-4" 7^ forespørgsel 1 1 3Q§ / / 309 ] Fig. 3 DK 177142 B1 4/4 —401 Γ'—402 r^—403 r~r~]~~L--------------------\ m·- n 1 > 1 v ] - ! Y/·—407 11 i'^^^4Q61 ! ! ! ' 1 1 » / [ < v________________________✓ \_____________________' ^—404 408 I · N ^ N i - ] ! ) BU PG T Bi] i i----I ' ! j PG1 ] ] ] I-- I I I ! PG2 xxx ! ! ! i BU1---i ] i i PG3 ii i I I I i I i i i i PG4 i ] i i i I i i - i I I '___________________________________' V____________' Fig.4
DKPA200800740A 2006-07-17 2008-05-30 Fremgangsmåde til præsentation af et datasæt ved brug af søgning, computerlæsbart medium og computer DK177142B1 (da)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DKPA200800740A DK177142B1 (da) 2006-07-17 2008-05-30 Fremgangsmåde til præsentation af et datasæt ved brug af søgning, computerlæsbart medium og computer

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
DK200600988A DK176532B1 (da) 2006-07-17 2006-07-17 Fremgangsmåde til integration af dokumenter med OLAP ved brug af sögning, computerlæsbart medium og computer
DK200600988 2006-07-17
DKPA200800740A DK177142B1 (da) 2006-07-17 2008-05-30 Fremgangsmåde til præsentation af et datasæt ved brug af søgning, computerlæsbart medium og computer
DK200800740 2008-05-30

Publications (2)

Publication Number Publication Date
DK200800740A DK200800740A (da) 2008-05-30
DK177142B1 true DK177142B1 (da) 2012-02-06

Family

ID=38950435

Family Applications (2)

Application Number Title Priority Date Filing Date
DK200600988A DK176532B1 (da) 2006-07-17 2006-07-17 Fremgangsmåde til integration af dokumenter med OLAP ved brug af sögning, computerlæsbart medium og computer
DKPA200800740A DK177142B1 (da) 2006-07-17 2008-05-30 Fremgangsmåde til præsentation af et datasæt ved brug af søgning, computerlæsbart medium og computer

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DK200600988A DK176532B1 (da) 2006-07-17 2006-07-17 Fremgangsmåde til integration af dokumenter med OLAP ved brug af sögning, computerlæsbart medium og computer

Country Status (2)

Country Link
US (1) US7949674B2 (da)
DK (2) DK176532B1 (da)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60310881T2 (de) * 2003-05-15 2007-04-19 Targit A/S Methode und Benutzerschnittstelle für das Bilden einer Darstellung von Daten mit Meta-morphing
US7779018B2 (en) * 2003-05-15 2010-08-17 Targit A/S Presentation of data using meta-morphing
US8468444B2 (en) * 2004-03-17 2013-06-18 Targit A/S Hyper related OLAP
US7774295B2 (en) * 2004-11-17 2010-08-10 Targit A/S Database track history
WO2007131510A2 (en) * 2006-05-16 2007-11-22 Targit A/S A method of preparing an intelligent dashboard for data monitoring
US20080163264A1 (en) * 2006-12-28 2008-07-03 International Business Machines Corporation Directory Service that Provides Information from a Plurality of Disparate Data Sources
WO2008085989A1 (en) * 2007-01-10 2008-07-17 Richard Garfinkle A software method for data storage and retrieval
DK176516B1 (da) * 2007-04-30 2008-06-30 Targit As Computerimplementeret fremgangsmåde samt computersystem og et computerlæsbart medium til at lave videoer, podcasts eller slidepræsentationer fra en Business-Intelligence-application
US8606623B1 (en) * 2008-03-31 2013-12-10 Knowledgepoint 360 Group, LLC Organization and peer set metric for generating and displaying benchmarking information
CA2660748C (en) * 2009-03-31 2016-08-09 Trapeze Software Inc. System for aggregating data and a method for providing the same
US8204901B2 (en) * 2009-09-02 2012-06-19 International Business Machines Corporation Generating query predicates for processing multidimensional data
US8996544B2 (en) 2012-09-28 2015-03-31 Oracle International Corporation Pruning disk blocks of a clustered table in a relational database management system
US9507825B2 (en) 2012-09-28 2016-11-29 Oracle International Corporation Techniques for partition pruning based on aggregated zone map information
US9430550B2 (en) 2012-09-28 2016-08-30 Oracle International Corporation Clustering a table in a relational database management system
US10642837B2 (en) 2013-03-15 2020-05-05 Oracle International Corporation Relocating derived cache during data rebalance to maintain application performance
US20140365519A1 (en) * 2013-06-10 2014-12-11 Targit A/S Intelligent processing of user input to a business intelligence software application
US11086876B2 (en) 2017-09-29 2021-08-10 Oracle International Corporation Storing derived summaries on persistent memory of a storage device

Family Cites Families (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1982000726A1 (en) 1980-08-13 1982-03-04 Inc Comshare A machine for generating graphic charts
US4800510A (en) 1985-07-31 1989-01-24 Computer Associates International, Inc. Method and system for programmed control of computer generated graphics layout
JPH0594537A (ja) 1991-02-27 1993-04-16 Canon Inc グラフ処理方法
US5911138A (en) 1993-06-04 1999-06-08 International Business Machines Corporation Database search facility having improved user interface
US5809266A (en) 1994-07-29 1998-09-15 Oracle Corporation Method and apparatus for generating reports using declarative tools
EP0856175A4 (en) 1995-08-16 2000-05-24 Univ Syracuse SYSTEM AND METHOD FOR RETURNING MULTI-LANGUAGE DOCUMENTS USING A SEMANTIC VECTOR COMPARISON
US5692181A (en) 1995-10-12 1997-11-25 Ncr Corporation System and method for generating reports from a computer database
US6625617B2 (en) 1996-01-02 2003-09-23 Timeline, Inc. Modularized data retrieval method and apparatus with multiple source capability
US5836771A (en) 1996-12-02 1998-11-17 Ho; Chi Fai Learning method and system based on questioning
US6108657A (en) 1997-05-29 2000-08-22 Oracle Corporation Method, article of manufacture, and apparatus for generating a multi-dimensional record layout mapping
US5940518A (en) 1997-10-06 1999-08-17 Delco Electronics Corporation Method and apparatus for indicating speaker faults
US6154738A (en) * 1998-03-27 2000-11-28 Call; Charles Gainor Methods and apparatus for disseminating product information via the internet using universal product codes
AU3966099A (en) 1998-04-24 1999-11-16 Starmine, L.L.C. Security analyst performance tracking and analysis system and method
US6138121A (en) 1998-05-29 2000-10-24 Hewlett-Packard Company Network management event storage and manipulation using relational database technology in a data warehouse
US6226647B1 (en) 1998-07-24 2001-05-01 Oracle Corporation Method, article of manufacture, and apparatus for constructing a multi-dimensional view containing two-pass value measure results
WO2000022549A1 (en) 1998-10-09 2000-04-20 Koninklijke Philips Electronics N.V. Automatic inquiry method and system
US20010013004A1 (en) 1998-11-03 2001-08-09 Jordan Haris Brand resource management system
US6920608B1 (en) 1999-05-21 2005-07-19 E Numerate Solutions, Inc. Chart view for reusable data markup language
US6415298B1 (en) 1999-07-15 2002-07-02 American Management Systems, Inc. Effective dated tree control in a component based-object oriented convergent customer care and billing system
AUPQ193199A0 (en) 1999-07-30 1999-08-26 Da Vinci Innovation Pty Limited Apparatus and method for implementing surveys
EP1081610A3 (en) 1999-09-03 2003-12-03 Cognos Incorporated Methods for transforming metadata models
US6484179B1 (en) * 1999-10-25 2002-11-19 Oracle Corporation Storing multidimensional data in a relational database management system
AU1591201A (en) 1999-11-09 2001-06-06 James Frederick Koopmann Systems and methods for collecting, storing, and analyzing database statistics
US6615172B1 (en) 1999-11-12 2003-09-02 Phoenix Solutions, Inc. Intelligent query engine for processing voice based queries
US6490590B1 (en) * 2000-02-14 2002-12-03 Ncr Corporation Method of generating a logical data model, physical data model, extraction routines and load routines
US6768986B2 (en) 2000-04-03 2004-07-27 Business Objects, S.A. Mapping of an RDBMS schema onto a multidimensional data model
US20020091681A1 (en) 2000-04-03 2002-07-11 Jean-Yves Cras Report then query capability for a multidimensional database model
US6831668B2 (en) 2000-04-03 2004-12-14 Business Objects, S.A. Analytical reporting on top of multidimensional data model
AU2001257154A1 (en) 2000-04-21 2001-11-07 Leon R. Casaubon System and method of supply chain management
US20020070953A1 (en) 2000-05-04 2002-06-13 Barg Timothy A. Systems and methods for visualizing and analyzing conditioned data
US6995768B2 (en) * 2000-05-10 2006-02-07 Cognos Incorporated Interactive business data visualization system
GB0015233D0 (en) 2000-06-21 2000-08-16 Canon Kk Indexing method and apparatus
US6684207B1 (en) * 2000-08-01 2004-01-27 Oracle International Corp. System and method for online analytical processing
US7111010B2 (en) 2000-09-25 2006-09-19 Hon Hai Precision Industry, Ltd. Method and system for managing event attributes
US20020038230A1 (en) 2000-09-25 2002-03-28 Li-Wen Chen User interface and method for analyzing customer behavior based upon event attributes
US6889230B1 (en) 2000-11-03 2005-05-03 Quality Data Management, Inc. System and method for presenting survey data over a network
WO2002077900A2 (en) 2000-11-09 2002-10-03 Eastman Chemical Company Software enabled wizards
US20040039707A9 (en) 2000-11-22 2004-02-26 Chris Ricci Method for distributing and licensing digital media
US6816879B1 (en) 2000-12-02 2004-11-09 Oracle International Corp. System and method for serving pre-generated presentation views of requested data
US6671689B2 (en) * 2001-01-19 2003-12-30 Ncr Corporation Data warehouse portal
WO2002073504A1 (en) 2001-03-14 2002-09-19 Gene Logic, Inc. A system and method for retrieving and using gene expression data from multiple sources
US6643635B2 (en) 2001-03-15 2003-11-04 Sagemetrics Corporation Methods for dynamically accessing, processing, and presenting data acquired from disparate data sources
EP1370976A1 (en) 2001-03-19 2003-12-17 Exie AS Methods and system for handling mulitple dimensions in relational databases
US7089184B2 (en) 2001-03-22 2006-08-08 Nurv Center Technologies, Inc. Speech recognition for recognizing speaker-independent, continuous speech
US6775675B1 (en) 2001-04-04 2004-08-10 Sagemetrics Corporation Methods for abstracting data from various data structures and managing the presentation of the data
MXPA03011976A (es) 2001-06-22 2005-07-01 Nervana Inc Sistema y metodo para la recuperacion, manejo, entrega y presentacion de conocimientos.
US20030120593A1 (en) * 2001-08-15 2003-06-26 Visa U.S.A. Method and system for delivering multiple services electronically to customers via a centralized portal architecture
WO2003021385A2 (en) 2001-08-28 2003-03-13 Diners Club International Ltd. Method and system for presenting charge related data on a worldwide basis through a network
US20030061096A1 (en) 2001-09-05 2003-03-27 Gallivan Gerald J. System and method for use for linking primary market research data with secondary research data
US20030050825A1 (en) 2001-09-05 2003-03-13 Impactrx, Inc. Computerized pharmaceutical sales representative performance analysis system and method of use
DE10151250A1 (de) 2001-10-17 2003-05-08 Bayer Ag Verfahren zur Ermittlung eines komplexen Korrelationsmusters aus Verfahrens- und Anlagendaten
US7209876B2 (en) 2001-11-13 2007-04-24 Groove Unlimited, Llc System and method for automated answering of natural language questions and queries
US7587354B2 (en) 2001-11-27 2009-09-08 State Street Corporation Verification of net asset values
US7035877B2 (en) 2001-12-28 2006-04-25 Kimberly-Clark Worldwide, Inc. Quality management and intelligent manufacturing with labels and smart tags in event-based product manufacturing
US7170519B2 (en) 2002-03-29 2007-01-30 Sas Institute Inc. Computer-implemented system and method for generating data graphical displays
US7051038B1 (en) 2002-06-28 2006-05-23 Microsoft Corporation Method and system for a reporting information services architecture
US7668885B2 (en) 2002-09-25 2010-02-23 MindAgent, LLC System for timely delivery of personalized aggregations of, including currently-generated, knowledge
US7293031B1 (en) 2002-11-21 2007-11-06 Ncr Corp. Report specification generators and interfaces
US7103591B2 (en) 2002-12-02 2006-09-05 International Business Machines Corporation Method of describing business and technology information for utilization
US7269581B2 (en) 2003-03-28 2007-09-11 Microsoft Corporation Systems and methods for proactive caching utilizing OLAP variants
US7779018B2 (en) 2003-05-15 2010-08-17 Targit A/S Presentation of data using meta-morphing
DE60310881T2 (de) 2003-05-15 2007-04-19 Targit A/S Methode und Benutzerschnittstelle für das Bilden einer Darstellung von Daten mit Meta-morphing
DE602004006485T2 (de) 2004-03-02 2008-01-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur automatisierten anmerkung von berichten mehrdimensionaler datenbanken mit informationsobjekten eines datenspeichers
EP1577808A1 (en) 2004-03-17 2005-09-21 Targit A/S Hyper related OLAP
US8468444B2 (en) 2004-03-17 2013-06-18 Targit A/S Hyper related OLAP
US7792954B2 (en) 2004-04-02 2010-09-07 Webtrends, Inc. Systems and methods for tracking web activity
DK1659503T3 (da) 2004-11-17 2010-10-04 Targit As Sporingshistorik til database
US7774295B2 (en) 2004-11-17 2010-08-10 Targit A/S Database track history
US7171335B2 (en) 2004-12-21 2007-01-30 Texas Instruments Incorporated System and method for the analysis of semiconductor test data
WO2007131510A2 (en) 2006-05-16 2007-11-22 Targit A/S A method of preparing an intelligent dashboard for data monitoring
DK176516B1 (da) 2007-04-30 2008-06-30 Targit As Computerimplementeret fremgangsmåde samt computersystem og et computerlæsbart medium til at lave videoer, podcasts eller slidepræsentationer fra en Business-Intelligence-application

Also Published As

Publication number Publication date
US7949674B2 (en) 2011-05-24
DK200600988A (da) 2008-01-18
DK200800740A (da) 2008-05-30
DK176532B1 (da) 2008-07-14
US20080016035A1 (en) 2008-01-17

Similar Documents

Publication Publication Date Title
DK177142B1 (da) Fremgangsmåde til præsentation af et datasæt ved brug af søgning, computerlæsbart medium og computer
JP3597370B2 (ja) 文書処理装置および記録媒体
US11288242B2 (en) Similarity-based search engine
US8185509B2 (en) Association of semantic objects with linguistic entity categories
US7092936B1 (en) System and method for search and recommendation based on usage mining
US7885918B2 (en) Creating a taxonomy from business-oriented metadata content
JP5435568B2 (ja) データアクセス及びプレゼンテーション要素を再利用する方法及び装置
US10552467B2 (en) System and method for language sensitive contextual searching
US20040186824A1 (en) Storing and/or retrieving a document within a knowledge base or document repository
EP1952287A2 (en) Inferring search category synonyms from user logs
JP2008535095A (ja) クエリ用語および返答用語を含む情報ソースからのスニペットを有するファクトクエリエンジンのユーザインタフェース
US20100228714A1 (en) Analysing search results in a data retrieval system
JP2004178421A (ja) 文書検索装置、文書検索方法、プログラムおよび記録媒体
JPH1145267A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US20100211562A1 (en) Multi-part record searches
JP2020064482A (ja) 属性抽出装置および属性抽出方法
WO2023278638A1 (en) Digital data processing systems and methods for commerce-related digital content retrieval and generation
JP3249743B2 (ja) 文書検索システム
CN109213830B (zh) 专业性技术文档的文档检索系统
CN114402316A (zh) 利用动态选择和分布式相关性进行联合搜索的系统和方法
JP4146067B2 (ja) 文書検索システムおよび文書検索方法
JP2002312389A (ja) 情報検索装置および情報検索方法
WO2024079833A1 (ja) 情報処理装置、出力方法、及び出力プログラム
EP1881429A2 (en) Integration of documents with OLAP using search
WO2021210210A1 (ja) 文書検索装置、文書検索システムおよび文書検索方法

Legal Events

Date Code Title Description
PBP Patent lapsed

Effective date: 20180717