NO327324B1 - Informasjonstilgang med bruksdrevet metadatatilbakekobling - Google Patents

Informasjonstilgang med bruksdrevet metadatatilbakekobling Download PDF

Info

Publication number
NO327324B1
NO327324B1 NO20064649A NO20064649A NO327324B1 NO 327324 B1 NO327324 B1 NO 327324B1 NO 20064649 A NO20064649 A NO 20064649A NO 20064649 A NO20064649 A NO 20064649A NO 327324 B1 NO327324 B1 NO 327324B1
Authority
NO
Norway
Prior art keywords
metadata
document
search
documents
information
Prior art date
Application number
NO20064649A
Other languages
English (en)
Other versions
NO20064649L (no
Inventor
Bjorn Olstad
Christian Moen
Original Assignee
Fast Search & Transfer As
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from NO20054720A external-priority patent/NO20054720L/no
Application filed by Fast Search & Transfer As filed Critical Fast Search & Transfer As
Priority to NO20064649A priority Critical patent/NO327324B1/no
Publication of NO20064649L publication Critical patent/NO20064649L/no
Publication of NO327324B1 publication Critical patent/NO327324B1/no

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

I en fremgangmåte til visning og fanging av metadata for dokumenter innefor resultatpresentasjoner i systemer for informasjonsaksess eller informasjonssøking, benyttes en metadatatjener for å lagre metadata forbundet med ethvert søkbart dokument, og sluttbrukere gis muligheten til 'a betrakte og editere metadata forbundet med dokumenter returnert fra metadatatjeneren som er i stand til automatisk å danne metadataobjekter assosiert med enhver kombinasjon av dokumentsøkespørsmål og dokumentposisjon i en resultatmengde for ett gitt søkespørsmål. En søkemotor i stand til å implementere fremgangsmåten omfatter en metadatatjener som en del av eller forbundet med dens kjernesøkemotor.

Description

Oppfinnelsen angår en fremgangsmåte for visning, fanging og bruk av dokumentmetadata innen resultatfremlegging i systemer for informasjonsaksess eller informasjonssøking, hvor fremgangsmåten omfatter trinn for å benytte et søkespørsmål på et sett av dokumenter, å identifisere tilsvarende dokumenter, og å danne en resultatside med minst ett av de mest relevante dokumenter, hvor fremgangsmåten dessuten innbefatter å benytte en metadatatjener i stand til å lagre metadata forbundet med ethvert søkbart dokument, og å anordne midler innenfor resultatsiden for sluttbrukere av informasjonsaksess- eller informasjonssøkesystemer for å betrakte og editere metadata forbundet med det returnerte dokument fra metadatatj eneren.
Oppfinnelsen angår også en søkemotor som er i stand til å støtte og implementere fremgangsmåten i henhold til oppfinnelsen i systemer for informasjonsaksess eller informasjonssøking, hvor søkemotoren benyttes til å aksessere, søke, gjenfinne og analysere informasjon fra innholdsmagasiner tilgjengelig over datakommunikasjonsnettverk innbefattet ekstranett og intranett, og å fremlegge søke- og analyseresultatene for sluttbrukere.
Utførelser av den foreliggende oppfinnelse angår
informasjonsgjenfinningsmetoder og systemer hvor et brukerspørsmål benyttes til å hente objekter eller dokumenter fra et dokumentlager. Begrepet "dokument" skal overalt i det følgende benyttes til å betegne enhver søkbar størrelse og kunne derfor f.eks. bety et tekstdokument, multimediagjenstand, en databaseinnførsel eller en XML-struktur.
Systemer kjent i teknikken er blitt utført for å danne og vedlikeholde metadata forbundet med dokumenter. Spesielt er
dokumenthåndteringssystemer utført for å håndtere metadata og benytte denne informasjon for bedre å støtte arbeidsflyten omkring de modellerte dokumenter. Dokumenthåndteringsverktøy skaffer også søkemetoder for å aksessere både dokumentinnhold og forbundne metadata. Eksempelvis viser internasjonal publisert patentsøknad WO2005/091175Al et søkesystem som tillater brukere å annotere og betrakte dokumenter påtruffet i en mengde av disse, innbefattet de returnert i en søking av mengden. Annotasjonene kan innbefatte metadata forbundet med dokumentene, og metadataene kan aggregeres og benyttes til å generere søkeresultater.
Imidlertid er det et behov for å gjøre håndteringen av metadata mer effektiv og lette brukerens byrde og spesielt å unngå tungvint og tidkrevende annotasj onsprosedyrer.
I lys av dette er det en hovedhensikt med den foreliggende oppfinnelse å skaffe en direkte innbefattet håndtering innenfor rammen for skumlesing i et informasjonsaksessystem eller -søkesystem.
Det er også en hensikt med den foreliggende oppfinnelse å lette bruken av metadatahåndtering på en omfattende mengde av søkbare størrelser.
En ytterligere hensikt med den foreliggende oppfinnelse er å automatisere metadatahåndteringen.
Nok en ytterligere hensikt med den foreliggende oppfinnelse er å tillate en bruker å benytte metadata for å forbedre relevansen av returnerte dokumenter og oppdagelse for informasjonsaksess eller -søkesystemer generelt.
Endelig er det en hensikt med den foreliggende oppfinnelse å skaffe en søkemotor for å implementere fremgangsmåten i henhold til oppfinnelsen i informasjonsaksess eller søkesystemer generelt.
De ovennevnte hensikter så vel som ytterligere trekk og fordeler realiseres med en fremgangsmåte i henhold til den foreliggende oppfinnelse som er kjennetegnet ved å benytte metadatatj eneren for automatisk å danne metadataobjekter forbundet med enhver kombinasjon av dokument, spørsmål og dokumentposisjon i resultatmengden for søkespørsmålet.
De ovennevnte hensikter så vel som ytterligere trekk og fordeler realiseres også med en søkemotor i henhold til den foreliggende oppfinnelse som er kjennetegnet ved at den omfatter en metadatatjener forbundet med eller som utfører en del av en kjernesøkemotor, for å lagre, editere og fremlegge metadata for sluttbrukere.
I en fordelaktig utførelse av fremgangsmåten i henhold til den foreliggende oppfinnelse benyttes aksessrettigheter for å styre betraktnings- og editeringsmuligheter for metadataene, hvorved foretrukne dokumentaksessrettigheter i LD AP eller Active Directory benyttes til å styre betraktnings- og editeringsmulighetene for de forbundne metadata, og hvor foretrukket brukerdefinerte grupper kan dele betraktning og editering av dokumentmetadata på en sikker måte innenfor fellesskap.
En annen fordelaktig utførelse av fremgangsmåten i henhold til den foreliggende oppfinnelse gjør bruk av midler for å forbedre informasjonsaksesskvaliteten, idet midlene omfatter å analysere metadata og utledete attributter relevant for søking, og å sette informasjonsaksessystemet i stand til å reagere på de relevante attributter, idet analysen av metadataen foretrukket innbefatter å eksponere fri tekst og søkbare attributter for ytterligere innholdsforbedring og indeksering i systemet for informasjonsaksess eller informasjonssøking.
I nok en annen fordelaktig utførelse av fremgangsmåten i henhold til den foreliggende oppfinnelse gjøres det bruk av midler for å benytte de betraktede og editerte metadata fra identifiserte brukere eller sesjoner som basis for filtreringsanalyse ved samarbeid og/eller midler for å benytte søk på alle metadata forbundet med alle dokumenter i en resultatmengde, og/eller midler for informasjonsoppdagelse på attributter eksplisitt representert i metadataene forbundet med alle dokumenter i en resultatmengde, og/eller midler for informasjonsoppdagelse og attributter beregnet fra metadata forbundet med alle dokumenter i en resultatmengde.
En ytterligere fordelaktig utførelse av fremgangsmåten i henhold til den foreliggende oppfinnelse er kjennetegnet ved å omfatte trinn for å detektere og fjerne uønsket innhold i fangede metadata, foretrukket ved å fremlegge en såkalt "menneskelig utfordring" for å unngå datamaskingenererte metadata og/eller detektere og fjerne foretrukket støtende metadatainnførsler.
Øvrige trekk og fordeler ved fremgangsmåten i henhold til den foreliggende oppfinnelse vil dessuten fremgå av de øvrige, vedføyde uselvstendige krav rettet mot nevnte fremgangsmåte.
Nå skal forskjellige foretrukkede utførelser av den foreliggende oppfinnelse forklares mer detaljert i det følgende og vil bedre forstås lest i samband med den vedføyde tegning, på hvilken
fig. 1 viser et blokkdiagram av en eksemplifiserende søkemotorarkitektur som kan benyttes med fremgangsmåten i henhold til den foreliggende oppfinnelse,
fig. 2 hvordan dokumentattributter kan oppsummeres over en resultatmengde på forskjellige måter,
fig. 3 en eksemplifiserende inngangstekst som inneholder tekstuelle data og visuelle formateringselementer,
fig. 4 hvordan eksempelteksten på fig. 3 kan automatisk oppspaltes i semantiske underseksjoner,
fig. 5 en typisk taksonomistruktur og et eksempelsystem for å håndtere taksonomiske egenskaper,
fig. 6 del av en talemerking som finner de mest sannsynlige grammatiske representasjoner av inngangsteksten,
fig. 7 hvordan eksempelteksten på fig. 3 kan analyseres automatisk for å identifisere både globale egenskaper så som en kategori og egenskaper som er lokalisert innenfor dokumentkonteksten,
fig. 8 semantisk oppspalting av teksten i et avsnitt som inneholder multiple setninger med lokaliserte egenskaper innenfor setningene,
fig. 9 hvordan et spørsmål kan analyseres og normaliseres med lingvistiske metoder for å forbedre den påfølgende innhenting og/eller presisjon til et søk med normaliserte termer,
fig. 10 både en semantisk oppspalting av en tekst med dokumentegenskapene innbefattet i den semantiske struktur og en fremgangsmåte for å omdanne spørsmål i naturlig språk til strukturerte spørsmål som benytter den semantiske dokumentstruktur og forbundne egenskaper,
fig. 11 en eksempeltekst formatert som XML,
fig. 12 hvordan sammendragsinformasjon over resultatsett kan benyttes til å muliggjøre navigasjonserfaringer,
fig. 13 hvordan et sett av fritt formaterte brukeranmeldelser kan vurderes med en sentimentanalyseteknologi,
fig. 14 hvordan sentimentanalysemetoder kan utvides til å differensiere mellom andre typer av sammenlignbare begreper,
fig. 15 en eksemplifiserende applikasjon hvor sentimenter skåres for alle dokumenter i en resultatmengde og benyttes til å skaffe statistikk og trendanalyse,
fig. 16 hvordan en søkefrontende i et informasjonsaksessystem kan spesifiseres,
fig. 17 en generisk resultatside i et informasjonsaksessystem,
fig. 18 et eksempel for hvordan dokumentmetadata kan integreres med blogger i en resultatside slik at sluttbrukere kan betrakte, editere og analysere informasjon,
fig. 19 hvordan wikier kan benyttes i stedet for blogger på en tilsvarende brukererfaring som på fig. 18,
fig. 20 hvordan metadata kan representeres som RDF i en Dublin Core-versjon og en W3C-vCard-versjon,
fig. 21 hvordan sentimentanalyse kan identifisere termer, begreper og deler av tale med prediktive muligheter for sentimentskåring, og fig. 22 hvordan typiske produktanvendelsessteder er organisert.
Fig. 1 viser nøkkelkomponenter i en søkemotor slik den kan benyttes for å implementere fremgangsmåten i henhold til den foreliggende oppfinnelse. Aksessert, søkt og gjenfunnet informasjon skaffes fra innholds- eller dokumentmagasiner i et innholdsdomene hvorfra innhold eller dokumenter enten aktivt kan skyves inn i søkemotoren eller via en datakobling trekkes inn i søkemotoren. Typiske magasiner innbefatter databaser, kilder tilgjengelig via ETL-verktøy så som Informatica, ethvert XML-formatert lager, filer fra filtjenere, filer fra vevtjenere, dokumenthåndteringssystemer, innholdshåndteringssystemer, e-postsystemer, kommunikasjonssystemer, samarbeidssystemer og rike media så som audio, bilder og video. Dokumentene leveres til søkemotoren via applikasjonsprogrammert grensesnitt 102 for innhold (innholds-API 102). Deretter blir dokumenter analysert i et innholdsanalysetrinn 103 for å forberede innholdet for forbedrede søke- og oppdagelsesoperasjoner. Typisk er utgangen fra trinnet 103 en XML-representasjon av det inngitte dokument. Utdata fra innholdsanalysen benyttes til å mate kjernesøkemotoren 101. Kjernesøkemotoren 101 kan typisk anbringes spredt over en tjenerfarm på en desentralisert måte for å tillate behandling av store dokumentmengder og høye søkespørsmålsbelastninger. Kjernesøkemotoren 101 kan akseptere brukeranmodninger og frembringe lister over tilsvarende dokumenter.
Dokumentbestillingen blir vanligvis bestemt i henhold til en relevansmodell som måler den sannsynlige betydning av et gitt dokument i forhold til spørsmålet. I tillegg kan kjernesøkemotoren 101 frembringe metadata for resultatmengden, så som sammendragsinformasjon for dokumentattributter. Alternativt kan data fra innholdsanalysetrinnet 103 mates til varslingsmotoren 104. Varslingsmotoren vil ha lagret en mengde av spørsmål og kan bestemme hvilke spørsmål som vil akseptere de foreliggende inngitte dokumenter. En søkemotor kan aksesseres fra mange forskjellig klienter eller applikasjoner i et klientdomene som eksempelvis rommer mobile og datamaskinbaserte klientapplikasjoner. Disse klientene vil levere anmodninger til et applikasjonsprogrammert grensesnitt 107 for søkespørsmål (søkespørsmåls-API 107) i søkemotoren 100. Søkemotoren 100 vil ha et trinn 105 (søkespørsmålsanalysetrinn 105) for å analysere og forbedre søkespørsmålet for å konstruere en avledet spørsmål som kan utlede mer meningsfull informasjon. Endelig blir utgangen fra kjernesøkemotoren 101 typisk ytterligere analysert i et resultatanalysetrinn 106 for å skaffe informasjon eller visualiseringer som benyttes av klienter i klientdomenet.
For å håndtere metadata på en måte som implementerer fremgangsmåten i henhold til den foreliggende oppfinnelse i en søkemotor, kan søkemotoren som er gjengitt på fig. 1, også omfatte en metadatatjener. Denne metadatatjener er ikke spesifikt vist, da den kan være en del av kjernesøkemotoren 101. Den kan imidlertid også være forbundet med kjernesøkemotoren, men behøver heller ikke da å være noe annet enn en del av kjernesøkemotoren, fordi kjernesøkemotoren i seg selv kan være fysisk implementert på en rekke desentraliserte tjenere forbundet i et datakommunikasjonsnettverk eller en klynge av slike tjenere som fysisk for eksempel er realisert som en klynge arbeidsstasjoner.
I de sistnevnte tilfeller kan naturligvis en metadatatjener også være implementert på én eller flere desentraliserte tjenere eller tjenerklynger som utgjør kjernesøkemotoren eller implementert som én eller flere dedikerte tjenere blant tjenere som danner kjernesøkemotoren.
Som bakgrunn for og for å lette forståelsen av fremgangsmåten i henhold til den foreliggende oppfinnelse er det på fig. 2 vist hvordan et eksemplifiserende informasjonsaksessystem beregner
sammendragsinformasjon for dokumenter. Søkespørsmålet blir først evaluert
og returnerer en mengde av N overensstemmende dokumenter. Relevansmodellen blir deretter benyttet til å rangere dokumentene fra de mest verdifulle til de minst verdifulle relativt til søkespørsmålet (D1>D2>...DN). Typisk blir et gitt antall av de høyest rangerte dokumenter returnert tri klienten og benyttet til å konstruere en resultatside. Attributtene forbundet med dokumenter kan være både metadata fra det opprinnelige innholdsmagasin eller metadata som er blitt oppdaget innenfor innholdsanalysetrinnet 103. Sammendragsinformasjonen blir enten beregnet basert på et visst antall av de høyest rangerte dokumenter eller på alle dokumenter som tilfredsstiller søkespørsmålet. Fig. 2 viser noen eksempler på sammendragsinformasjon så som frekvens, histogrammer og statistiske parametere.
Innhold eller dokumenter som analyseres, kan som beskrevet for fig. 1 komme fra mange kilder innbefattet databaser, kilder gjort tilgjengelig via ETL-verktøy så som Informatica, hvilket som helst XML-formatert magasin, filer fra filtjenere, filer fra vevtjenere, dokumenthåndteringssystemer, innholdshåndteringssystemer, e-postsystemer, kommunikasjonssystemer, samarbeidssystemer, og rike media så som audio, bilder og video. Mange av disse datakildene kan ytterligere forbedres for søking og oppdagelse ved å utføre målrettet innholdsanalyse 103. Som en kasusstudie av forberedelse av innhold og søkespørsmål i søkemotorer, illustrerer den etterfølgende drøftelse noen typiske analysetrinn.
Helt generelt utført angår den foreliggende oppfinnelse en framgangsmåte og en søkemotor for å vise og fange metadata for dokumenter fra sluttbrukere av et informasjonsaksessystem. Det skal angis en rekke forskjellige metoder for å assosiere metadata med dokumenter innenfor en søkeresultatkontekst. En aktiv og samarbeidet sluttbrukererfaring dannes ved tett å integrere brukertilbakemelding og metadatadannelse innenfor en søkekontekst.
I en generelt foretrukket utførelse av fremgangsmåten i henhold til den foreliggende oppfinnelse benyttes dynamisk tilbakemelding fra metadataoppdateringer ved sluttbrukere for å forbedre kvaliteten på informasjonsaksessystemet. Oppfinnelsen viser spesifikke fremgangsmåter for å bedre gjenkall og relevans, og for å danne nye paradigmer for informasjonsoppdagelse basert på tilbakemelding mellom metadata og dokumentrepresentasjoner.
Spesielt fordelaktig vil fremgangsmåten i henhold til den forliggende oppfinnelse kunne benyttes ved forbrukersøking etter vevsider, multimediainnhold, produkter, mobilinnhold og tilsvarende innholdstyper. Den forbedrede mekanisme for innhenting, relevans og oppdagelse vil bedre brukererfaringen med tanke på forbrukersøk. Et eksempel er søking i multimediainnhold som er begrenset av forholdsvis lite tekstuell annotasjon og fravær av vevsidelenkekardinalitet som et primært relevansverktøy. Den foreliggende oppfinnelse vil generere både ytterligere tekstuell annotering og etablere en støttebasert erstatning av lenkekardinalitet som viktigste relevanskomponent. Ytterligere vil samarbeidstiltak som vist i den foreliggende oppfinnelse berike steder med heftende muligheter for fellesskap.
Det skal nå gis en mer detaljert drøftelse av hvordan søk med metadataoppdagelse og representasjon av de oppdagede metadata for sluttbrukere utføres med vekt på tilbakemeldinger til sluttbrukere for dernest å høyne søkesystemets kvalitet. Fig. 3 viser et eksempel på innlegging av en artikkel som inneholder implisitte visuelle strukturer så som titler, tilknytninger etc. Innenfor innholdsanalysetrinnet 103 kan automatiske midler være anbrakt for å gjenkjenne semantiske strukturer ved å benytte regler som reagerer på vokabularer, grammatiske mønstre, formatering og visuell layout. Fig. 4 viser hvordan inngangsteksten fra fig. 3 er blitt analysert og teksten oppspaltes i semantiske informasjonsblokker så som tittelseksjon 401, forfatterseksjon 402, tilknytningsseksjon 403, og sammendraget 404. Fig. 5 viser et eksempel på hvordan en kategori fra en relevant taksonomi tilordnes dokumentet. Et eksempel på hierarkisk taksonomi er angitt ved 501. Fig. 5 angir en typiske brukerfrontende for hvorledes slike taksonomier kan håndteres, oppdateres og læres opp. Fig. 6 viser hvordan tekstuelt innhold kan analyseres med deler av taleanalyse for å bestemme både den mulige og den mest sannsynlige grammatiske tolkning av termene i dokumentet. Resultatet av en slik analyse kan benyttes til å identifisere dokumentegenskaper for generelle formål, så som substantiv-substantivuttrykk. Ytterligere analyser kan rette generiske grammatiske tolkninger mot spesifikke termer, begreper og uttrykksmønstre som kan kode høyt målrangerte dokumentattributter på en kontekstuell måte. Fig. 7 illustrerer hvordan en global attributt så som kategoritilordningen "medisinsk" forbindes med inngangsdokumentet. Videre blir tre eksempelstørrelser identifisert med konteksten til det opprinnelige dokument. Fig. 7 viser hvordan forfatternavn 702, forskningsinstitusjoner 703 og vitenskapelige begreper 704 er blitt identifisert med det opprinnelige inngangsdokument.
Den ovenfor drøftede fig. 4 viser hvordan inngangsteksten kan oppspaltes til semantiske strukturer som er applikasjonsspesifikke. Disse strukturene er eksempelvis de ovennevnte semantiske informasjonsblokker og skal som vist på fig. 8 muliggjøre automatisk identifikasjon av generiske, semantiske begreper som titler, kapitler, visuelle blokker, avsnitt, setninger og størrelsesinformasjon. Fig. 8 viser avsnittsoppspaltning 801 av et dokument med flere setningssegmenter 803 innenfor avsnittet og forskjellige størrelser 804 anbrakt innenfor setningsstrukturene. Den semantiske oppspaltning kan benytte enkle elementer som identifikasjon av merker, f.eks. mellomrom i setninger og avsnittsmellomrom, i tillegg til forskjellige teknologier som står til rådighet for å gjenkjenne størrelser. Mer omstendelige mønstre kodet i grammatikken kan også sammenlignes med teksten, og de overensstemmende relasjoner mellom tekst og noder i grammatikken kan benyttes til å danne en kontekstuell oppspaltning av dokumentet. Fig. 9 viser hvordan forskjellige lingvistiske teknikker i et konkret eksempel kan benyttes til å skrive om, normalisere eller utvide brukersøkespørsmålet. Denne analyse vil typisk finne sted innenfor søkespørsmålsanalysetrinnet 105 og frembringe en modifisert søkespørsmål som deretter sendes til søkemotoren 101. Fig. 10 viser dokument- og søkespørsmålsanalyse i en eksemplarisk søkemotor. Figuren viser også hvordan behandling av søkespørsmål i naturlig språk kan forbedres ved aksess til kontekstuell sammendragsinformasjon. Et inndokument 1002 spaltes i avsnitt 1010 som ytterligere spaltes i setninger 1008. Innenfor setningene markeres områder som dokumentegenskaper med spesifikke verdier 1006 og 1007. Dokumentegenskaper kan registreres både i full/original form og en tilknyttet basisform. Fig. 10 viser to eksempler på dette. 1009 viser et eksempel hvor dato registreres i den opprinnelige form (mars 2002) og en normalisert basisform (2002-02-XX). Den normaliserte basisform forenkler profilering og områdesøk og robust generering av sammendragsinformasjon. Eksempler på dokumentegenskaper som kan gjenkjennes på en tilsvarende måte innbefatter personnavn, firmanavn, steder, akronymer, filnavn, URLer, telefonnumre, postnumre, e-postadresser, universiteter, aviser, prisinformasjon, produktinformasjon, nummeriske attributter og børskoder. Dokumentegenskapene kan enten forbindes med et gitt sted i dokumentet, et intervall eller et område i dokumentet, et tidspunkt eller tidsintervall i audio, video, eller en struktur i en XML-representasjon av dokumentet. Fig. 11 viser et typisk XML-inngang. Dokumentet er representert på en hierarkisk måte og tekstuelle så vel som andre attributtyper kan kodes på et vilkårlig nivå. XPath og XQuery er eksempler på strukturerte søkespørsmålsspråk som kan identifisere dokumenter og dokumentunderstrukturer med spesifikke egenskaper. I dette eksempel er det f.eks. mulig å lete etter taler hvor taleren er Cleopatra, og det forekommer en linje som nevner Caesar. XML-strukturen vist på fig. 11 kan enten være strukturen til inngangsdokumentet eller en struktur som beregnes og kodes i innholdsanalysetrinnet 103 for innhold av hvilken som helst art. Fig. 12 viser hvordan et navnesøk 1201 i tillegg til søkeresultatet 1202 benytter sammendragsinformasjon for å navigere i og utforske resultatmengden. 1203 viser forbundne navn, 1204 geografiske steder forbundet med navn, 1205 potensielle tolkninger av fornavn, og endelig 1206 potensielle tolkninger av etternavnet. I en høyt organisert database kan denne type sammendragsinformasjon beregnes basert på globale dokumentattributter. Kontekstuell sammendragsinformasjon muliggjør en lignende erfaring, selv for navn, adresser og telefonnumre "skjult" innenfor større tekstdokumenter.
Det skal nå gis en omtale av hvordan sentimentanalyse utføres og benyttes i kjent teknikk med eksempler hentet fra omtaler av tilbudstjenester.
Fig. 13 viser et eksempel på hvordan en mengde av fritt formaterte brukeroversikter for et hotell 1301 kan automatisk rangeres som vist ved 1303 ved hjelp av sentimentanalyseteknologi. En måte å implementere sentimentanalyse er basert på Turneys klassifikasjonsalgoritme. Deler av taleanalyse og maskinell læring benyttes for å identifisere tekstelementer med prediktiv informasjon for sentimentskåring. Fig. 21 viser hvordan sentimentanalyse kan identifisere termer, begreper og deler av tale med prediktiv mulighet for sentimentskåring. Fig. 22 viser hvordan et typisk produktomtalested som ePinion er organisert. Sammendragsinformasjon over alle oversiktene er vist i 2201 og individuelle oversikter segmenteres til (a) sammendragsinformasjon med skåring av relevante attributter 2202, og (b) en komplett fritekstoversikt 2203. Fig. 14 viser hvordan
sentimentanalysemetoder kan utvides for å differensiere mellom andre typer av sammenlignbare begreper. Den maskinelle læringsalgoritmen har i dette tilfellet erstattet læringssampler "positive/negative" med enten "global threat"/"local threat" 1402 eller "imminent threat"/"distant threat" 1403.
Fig. 15 illustrerer et eksempel på en applikasjon hvor sentimenter skåres for alle dokumenter i en resultatmengde og benyttes til å skaffe statistikker og trendanalyser. 1501 angir sammendragsstatistikk for sentimenter over resultatmengden, og 1502 visualiserer trender i gjennomsnittlig sentimentskårer som en funksjon av tid. Fig. 16 viser hvordan en søkefrontende i et informasjonsaksessystem kan spesifiseres. Konfigurasjonsstudioet for søkefrontenden tillater brukeren å velge virtuelle grensesnittelementer (VGE, "widgets") for resultater og oppdagelser med tilhørende formatering. Aksess og visning drevet av innholdsskjemaer kan også spesifiseres. Et eksempel på et sluttresultat for en slik frontendespesialtilpasning er gitt på fig. 17 som viser en generisk resultatside 1701 i et informasjonsaksessystem. Figuren viser søkeinngangsområde 1702, søkeknapp 1703, skjermareal for "flash-in"-informasjon (slik som børsinformasjon for et børskodesøk eller vær for værsøk etc.) 1704, skjermareal for sponsede lenker (betalt oppføring) 1705, det aktuelle søkeresultat (vanligvis en tittel, statistikk eller en dynamisk "teaser/snippet", dokumentreferanse og potensielt en grafisk tommelnegl) 1706/1707, midler til å bevege seg mellom resultatsider 1708, og global eller kontekstuell sammendragsinformasjon for resultatmengden 1709 som tillater brukeren å begrense resultatmengden til emner av interesse. Fig. 18 viser et eksempel på hvordan dokumentmetadata kan integreres med blogger i en resultatside slik at sluttbrukere kan betrakte, editere og analysere informasjon. Fig. 18 illustrerer en blogganriket resultatside 1801 i et informasjonsaksessystem. Figuren viser søkeinngangsarealet 1802, søkeknappen 1803, skjermareal for "flash-in"-informasjon (så som børsinformasjon for børskodesøk, eller vær for værsøk etc.) 1804, skjermareal for sponsede lenker (betalt oppføring) 1805, midler til å bevege seg mellom resultatsider 1810, og global eller kontekstuell sammendragsinformasjon for resultatmengden 1801 som gjør brukerne i stand til å begrense resultatmengden til emner av interesse. 1806 og 1809 viser eksempler på søkeresultater. 1806 har i tillegg til det normale søkeresultatet ytterligere visualisering av forbundne metadata i form av en blogg 1807. Det er innlysende en rekke måter hvormed blogger eller metadata generelt kan visuelt assosieres med søkeresultatene. Hvert søkeresultat kan ha innbefattet metadatavisning (som på fig. 18), mus-over/hovring kan aktivere aksess til metadata eller et aktivt resultatbegrep kan benyttes til å befolke en delt metadata-VGE for den fullstendige resultatside. Blogger er bare en av de mange måter hvormed dokumentmetadata kan visualiseres og editeres. Sluttbrukerne kan også postere nye innførsler til bloggen eller vurdere innholdet 1808. Informasjonsoppdagelsen 1811 er blitt utvidet med oppdagelse på metadata enten eksplisitt fanget i 1807 eller utledet gjennom analyse av fangede dokumentmetadata. 1812 gir et eksempel på hvordan emner funnet i alle blogger forbundet med dokumenter i den fullstendige resultatmengde kan visualiseres. 1813 viser hvordan alle personer som bidrar til bloggene forbundet med dokumentene i den fullstendige resultatmengde kan visualiseres. Eksemplene i 1812, 1813 kan benyttes på all eksplisitt informasjon/attributter i metadataobjektet så vel som implisitte attributter identifisert av innholdsforfining tilsvarende dokumentanalysen i trinn 103. Blogginnførsler er typisk ordnet kronografisk, og en kalendervisning 1814 kan benyttes til å visualisere og utforske blogger over den fullstendige resultatmengde. Spesifikke søkemidler kan også benyttes for å utforske alle blogger forbundet med dokumentene i den fullstandige resultatmengde 1815. Fig. 19 viser hvordan wikier kan benyttes i stedet for blogger i en tilsvarende brukererfaring som på fig. 18. Figuren viser de wikihåndterte metadata 1908 og typisk hvordan brukere kan editere/oppdatere wiki-informasjon 1907. Wikipedia er et eksempel på hvordan wikibegreper kan benyttes for å tillate brukere til å oppdatere artikler i et leksikon. Fig. 19 viser hvordan det samme konsept kan benyttes til å håndtere metadata forbundet med dokumenter innenfor en søkeresultatkontekst. Fig. 20 viser hvordan metadata kan representeres med RDF i en Dublin Core-versjon eller en W3C vCard-versjon. "Semantic Web" henviser til en
samling av standarder, produkter og pågående prosjekter under ledelse av World Wide Web Consortium (W3C) som tar sikte på å gjøre det mulig for datamaskiner å utveksle og handle på basis av informasjon - spesielt vevdokumenter. Det XML-baserte Resource Definition Framework (RDF) og Web Ontology Language (OWL) er spesielt viktige komponenter i Semantic Web da de tillater vevsideforfattere å fremlegge informasjon på en maskinanvendelig måte. 2001 viser et eksempel på Dublin Core-skjema tiltenkt katalogisering av elektroniske ressurser. En av RDFs fordeler er evnen til å benytte flere skjemaer. 2002 viser et eksempel på W3C vCard-skjema for å fremlegge ytterligere metadata og forbinde dem med "Joe Somebody".
Fremgangsmåten i henhold til den foreliggende oppfinnelse implementeres på en søkemotor som omfatter en metadatatjener som drøftet ovenfor i forbindelse med fig. 1. Som sådan vil en metadatatjener, som er innbefattet i en søkemotor eller en informasjonsaksess eller -søkesystem, ved å implementere fremgangsmåten i henhold til oppfinnelsen skaffe en mer effektiv og sluttbrukervennlig måte for å håndtere metadata generelt, men spesielt vil en metadatatjener som benyttet ved fremgangsmåten i henhold til den foreliggende oppfinnelse, berike søkeerfaringen med interaktiv betraktning og editering av dokumentmetadata.
Blogger og wikier er to eksempler på etablerte teknologier for å håndtere ustrukturerte metadata. Tilsvarende er databaser ofte benyttet til å fange strukturerte metadata. Både strukturerte og ustrukturerte metadata kan kombineres i et felles magasin via et informasjonsaksessystem. Metadatatj eneren benyttet i denne oppfinnelse danner automatisk synbare og oppdaterbare metadata for enhver søkbar størrelse i det tilknyttede søk. Normalt vil metadatatj eneren derfor danne et tomt metadataobjekt med ethvert indeksert dokument ID eller benytte en lat ("lazy") evaluering og etablere metadataobjekter ettersom de behøves i visningen av søkeresultatene. Ved å lenke metadataobjekter til dokumenter, vil metadataene følge objektene uavhengig av hvilket søkespørsmål som ble behandlet når metadataene ble oppdatert. Alternativt kan metadataobjekter danne lenker til en kombinasjon av de forbundne dokumenter og søkespørsmålet utført når metadata ble oppdatert. Denne tilnærming vil frembringe mer kontekstspesifikke metadata. Endelig kan dokumentposisjonen i resultatmengden benyttes til enten å frembringe eller annotere metadataoppdateringer. Et typisk eksempel på dette vil være å la brukeren påvirke rangeringen ved å være positiv eller negativ til den foreliggende rangering av et konkret søkeresultat.
Metadata kan også forbindes med dokumentunderseksjoner. Eksempler innbefatter å forbinde metadata til begrepsmessige enheter innenfor dokumentet så som avsnittene, tittel, forfatter, tilknytning, og sammendrag på fig. 4, å forbinde metadata med spesifikke steder innfor dokumentet som vist ved størrelser på fig. 10, å identifisere bilder eller scener representert av tidspunkter og tidsintervall innenfor audio og video, samt direkte tilknytning til semantiske elementer fanget i en XML-representasjon av dokumenter som vist på fig. 11.
Metadatatj eneren kan håndtere en blanding av metadatatyper innbefattet fritekst, audioklipp, videoklipp, bilder, forhåndsdefinerte innførsler, følelsesikoner, verdier på forhåndsdefinerte attributter, brukerdefinerte attributter med assosierte verdier, lenker til forbundne dokumenter eller lenker til tilknyttede personer. Passende UI-elementer må være anordnet for å tillate sluttbrukeren å effektivt betrakte og editere de forskjellige metadatatyper.
Brukeraksessrettigheter kan også aktiveres for aksess til betraktning og editering av metadata. Da metadata er assosiert med dokumenter, vil det vanligvis være mulig å benytte dokumentaksessrettigheter (f.eks. opprettholdt i LD AP eller Active Directory) for også å påvirke det forbundne metadataobjektet. Alternativt kan spesifikke brukeraksessrettigheter opprettholdes i informasjonsaksessystemet slik at forskjellige grupper kan dele metaobjekter på en sikker måte.
Aksessrettigheter og brukeraksess er spesielt relevante når den foreliggende oppfinnelse benyttes i bedriftssøkeapplikasjoner så som på intranett, i kunnskapshåndtering og forskjellige former for forretningsetterretning. Innenfor en slik gruppe av tillitsnytende likemenn viser den foreliggende oppfinnelse fremgangsmåter for å forenkle datahåndtering, ekspertlokalisering, samarbeidstiltak og frembringer dynamiske og forbedrede informasjonsaksessystemer.
De fangede metadata kan benyttes til dynamisk å forbedre innhenting, relevans og oppdagelse- eller funnmuligheter for informasjonsaksessystemet. Dokumentinnhenting kan forbedres ved å tilføye metadatainnholdet til den søkbare informasjon forbundet med et dokument. Dette innbefatter metadata som fritekst og eksplisitte attributter. Multimedia og mobilapplikasjoner er to eksempler på applikasjoner hvor innholdet typisk har begrenset tekstuell annotasjon. Å forbinde annotasjoner fra søkebruken som søkbar informasjon vil forbedre innhentingen dramatisk. Innholdet i metadataobjektet kan analyseres innenfor et trinn for forfining av innholdet 103 på samme måte som de originale dokumenter. Således vil metoder og eksempler beskrevet i konteksten av figurene 1-15 og 21-22 også gjelde analysen av metadataobjekter. Typisk kan et metadataobj ekt innholde flere brukerinndata som f.eks. separate blogginnførsler som kan analyseres som separate dokumenter og kombineres til å gi sammendrag for gjennomsnittlige oppfatninger. I tillegg til den økte innhenting vil utledede attributter fra metadataobjekter også berike informasjonsoppdagelsesprosessen som vist på fig. 18.
Relevans eller søkepresisjon kan også forbedres ved å innbefatte brukeraktivitet med dokumentmetadata innenfor rammen av rangering. Eksempler innbefatter de følgende: Bruk av mengden av metadatabetraktning og editeringsaktivitet til å øke relevansen av det tilknyttede dokument.
Bruk av antall nylige oppdateringer i metadata for å øke relevansen av det tilknyttede dokument.
Rangering av treff i nylige metadataoppdateringer høyere enn treff i gamle metadataoppdateringer.
Bruk av eksplisitte brukerstøtter for å forandre rangering for dokumenter relativt til søkekonteksten hvor støttene ble fanget.
Utføre sentimentanalyse på fritekst av metadata for å utlede en automatisk sentimentskåre for å øke relevansen eller sortere de forbundne dokumenter.
Den foreliggende oppfinnelse kan benyttes i lukkede miljøer så som bedriftssøk for betrodde kolleger eller likemenn. I forbrukersøkanvendelser av den foreliggende oppfinnelse kan metadata forurenses av forskjellige former for spamkilder. Disse anvendelser drar fordel av metoder som detekterer og fjerner uønskede data i de fangede metadata. Et eksempel på slike metoder er presentasjonen av en "menneskelig utfordring" for å sette brukeren i stand til å oppdatere hvilke som helst metadata. En "menneskelig utfordring" kan f.eks. være å be brukeren om å skrive ned teksten innenfor et forvrengt bilde. Metadataobjekter kan også klassifiseres i støtende og ikke-støtende kategorier ved å benytte algoritmer i henhold til kjent teknikk for tekstkategorisering.
Metadataobjektene kan også fremstille eksplisitte lenker (så som vist i fig. 20) og implisitte lenker så som vist i fig. 10 for personer. Metadatatj eneren kan innlysende også fange identiteten til personen som oppdaterte metadataene. Søk og analyse av personer over alle metadataobjekter forbundet med dokumenter i et søkeresultat vil derfor være en dynamisk og effektiv måte for å modellere ekspertområder. Effektiv ekspertlokalisering innenfor bedrifter er et av eksemplene på bruk til identifikasjon av relevante personer. Et annet brukseksempel er dannelsen av samarbeidede brukererfaringer i forbrukersøkapplikasjoner.
En særlig foretrukket utførelse av fremgangsmåten i henhold til den foreliggende oppfinnelse angår samarbeidet filtrering hvor sluttbrukers vekselvirkning med dokumentmetadata innenfor en søkekontekst benyttes til å frembringe støttesystemer og personlige optimeringer.
Samarbeidet filtrering er en metode som muliggjør dannelse av virtuelle "handleposer" av forbundne dokumenter. Innenfor den foreliggende oppfinnelses kontekst kan "handleposer" f.eks. dannes av alle dokumentmetadata oppdatert av samme bruker. Disse handleposer kan gjøres søkbare med enten et spesifikt dokument eller metadata som inndata eller en annen "handlepose" som kan representere den personlige profil. Tilsvarende "handleposer" blir deretter identifisert, og statistisk sammendragsinformasjon kan beregnes over de overensstemmende handleposer som vist på fig. 2 for et normalt dokumentsøk. Den statistiske sammendragsinformasjon vil identifisere forbundne dokumenter basert på bruk (så som Amazons "personer som kjøpte denne boken kjøpte også ...") og personlige anbefalinger.
Den foreslåtte tette integrasjon mellom brukeroppdaterbare metadata og søkeresultater kan også benyttes til å forbedre stedsbaserte søketjenester. Metadataobj ektene kan benyttes i en stedskontekst hvis de forbundne dokumenter har en geolokalisering enten ved lengde/bredde-koordinater eller semantiske steder så som en stat eller et land.
Fra den foregående drøftelse av utførelse og applikasjoner ses det at den foreliggende oppfinnelse benytter et søkesentrisk tilnærmelse og vil i høy grad berike søkeerfaringen ved å innbefatte metadatahåndtering direkte i skumleseopplegget for et informasjonsaksessystem eller søkesystem. Sammenlignet med dokumenthåndtering i kjent teknikk skaffer den foreliggende oppfinnelse muligheten av å benytte metadatahåndtering på en meget mer omfattende mengde av søkbare størrelser (innbefattet rader i databaser), og bruken blir dermed dramatisk forenklet, da all metadatahåndtering automatiseres og aksesseres via søkefunksjonaliteten. Videre tillater den foreliggende oppfinnelse sluttbrukerinteraksjon med metadataene for å forbedre innhenting, relevans og funnmuligheter i informasj onsaksessy stemet.
Fremgangsmåten i henhold til den foreliggende oppfinnelse kan muliggjøre en alternativ søkesentrisk tilnærming til dokumenthåndtering ved å innbefatte metadatahåndtering direkte innefor rammen for skumlesning i et informasjonsaksessystem. Sammenlignet med dokumenthåndtering i kjent teknikk viser den foreliggende oppfinnelse metoder for å benytte metadatahåndtering på en langt mer omfattende mengde av søkbare størrelser (innbefattet rader i databaser), og bruken blir dramatisk forenklet da all metadatahåndtering automatiseres og aksesseres via søkefunksjonaliteten.
Fordelaktig kan fremgangsmåten i henhold til den foreliggende oppfinnelse benyttes til mobilsøkeapplikasjoner. Mobilsøkeapplikasjoner er ofte begrenset av samme fravær av rik tekstuell annotasjon og gode relevansmodeller som multimediasøking. Videre krever mobile applikasjoner ekstrem presisjon i søkefunksjonen, og dynamisk samarbeidede brukererfaringer har vist seg å være en effektiv brukerinteraksjonsmodell. Innenfor rammen av fremgangsmåten i henhold til oppfinnelsen er det vist metoder som vil forbedre både innhenting og presisjon, samt sanntids- og samarbeidsmuligheter for mobilsøk.
Den foreliggende oppfinnelse viser hvordan en søkeerfaring kan forvandles til en mer aktiv og samarbeidet erfaring som vil påvirke brukertilfredshet både for forbrukeren og bedrifters anvendelser av informasjonsaksessystemer eller informasjonssøkesystemer.
Videre benytter den foreliggende oppfinnelse brukerinteraksjon med metadata innlagt i søkeresultatene til å danne en unik informasjonskilde for ytterligere tjenester, innbefattet ekspertlokalisering med høy kvalitet, stedsbasert søk, trendanalyse, fellesskapsdannelse og samarbeidende filtrering for anbefalinger eller personlig presentasjoner.
Mens oppfinnelsen er blitt beskrevet med henvisning til visse utførelser, skal det forstås av fagfolk at forskjellige forandringer kan gjøres og ekvivalenter kan benyttes uten å avvike fra oppfinnelsens ramme. I tillegg kan mange modifikasjoner gjøres for å tilpasse en bestemt situasjon eller et bestemt materiale til oppfinnelsens lære uten å avvike fra dens ramme. Det er derfor ment at oppfinnelsen ikke skal være begrenset til de bestemte, viste utførelser, men at oppfinnelsen skal innbefatte alle utførelser som faller innenfor rammen av de vedføyde krav.

Claims (15)

1. Fremgangsmåte for visning, fanging og bruk av dokumentmetadata innen resultatfremlegging i systemer for informasjonsaksess eller informasjonssøking, hvor fremgangsmåten omfatter trinn for å benytte et søkespørsmål på et sett av dokumenter, å identifisere tilsvarende dokumenter, og å danne en resultatside med minst ett av de mest relevante dokumenter, hvor fremgangsmåten dessuten innbefatter å benytte en metadatatjener i stand til å lagre metadata forbundet med ethvert søkbart dokument, og å anordne midler innenfor resultatsiden for sluttbrukere av informasjonsaksess- eller informasj onssøkesystemer for å betrakte og editere metadata forbundet med det returnerte dokument fra metadatatj eneren, og hvor fremgangsmåten er karakterisert ved å benytte metadatatj eneren for automatisk å danne metadataobjekter forbundet med enhver kombinasjon av dokument, spørsmål og dokumentposisjon i resultatmengden for søkespørsmålet.
2. Fremgangsmåte i henhold til krav 1, karakterisert ved å la metadatatj eneren og betraktningen/editeringen av metadata skaffe midler til å forbinde metadata med en dokumentunderseksjon.
3. Fremgangsmåte i henhold til krav 2, karakterisert ved å la dokumentunder seksjonen svare til et område eller et merke i en XML-representasjon av dokumentet, eller et spesifikt tidspunkt, eller et tidsintervall innenfor audio eller video.
4. Fremgangsmåte i henhold til krav 1, karakterisert ved å benytte blogger og/eller wikier i metadatatj eneren for å danne, betrakte, editere og lagre metadataobjekter.
5. Fremgangsmåte i henhold til krav 1, karakterisert ved å innbefatte som metadataobj ekt håndtert av metadatatj eneren minst én blant fritekst, audioklipp, videoklipp, bilder, forhåndsdefinerte innførsler, sentimentikoner, verdier for forhåndsdefinerte attributter, brukerdefinerte attributter med forbundne verdier, lenker til forbundne dokumenter eller lenker til forbundne personer, og fortrinnsvis er da RDF eller OWL benyttet som mekanismer for å kode metadataene.
6. Fremgangsmåte i henhold til krav 1, karakterisert ved å benytte aksessrettigheter for å styre betraktnings- og editeringsmuligheter for metadataene, hvorved foretrukne dokumentaksessrettigheter i LDAP eller Active Directory benyttes til å styre betraktnings- og editeringsmulighetene for de assosierte metadata, og hvor foretrukket brukerdefinerte grupper kan dele betraktning og editering av dokumentmetadata på en sikker måte innenfor fellesskap.
7. Fremgangsmåte i henhold til krav 1, karakterisert ved å omfatte midler for å forbedre informasjonsaksesskvaliteten, idet midlene omfatter å analysere metadata og utledede attributter relevant for søking, og å sette informasjonsaksessystemet i stand til å reagere på de relevante attributter, idet analysen av metadataen foretrukket innbefatter å eksponere fritekst og søkbare attributter for ytterligere innholdsforbedring og indeksering i systemet for informasjonsaksess eller informasjonssøking.
8. Fremgangsmåte i henhold til krav 7, karakterisert ved å modifisere informasjonsaksessystemet eller -søkesystemet til å reagere på de utledede attributter fra de forbundne metadataobj ekter.
9. Fremgangsmåte i henhold til krav 7, karakterisert ved å danne en rangering av relevante dokumenter som reagerer på metadata forbundet med dokumentene, og foretrukket å forsterke relevansen til de forbundne dokumenter med en eller flere blant en rekke betraktnings- og editeringsaktiviteter for metadata, et antall nylige oppdateringer i metadataene, et antall eksplisitte, positive støtter eller en sentimentanalyse av friteksten til metadataene for å utlede en automatisk følelsesskåre.
10. Fremgangsmåte i henhold til krav 5 eller krav 9, karakterisert ved å identifisere relevante personer med eksplisitte lenker til forbundne personer eller implisitte lenker generert når brukere danner metadata.
11. Fremgangsmåte i henhold til krav 9, karakterisert ved å omfatte midler for å benytte de betraktede og editerte metadata fra identifiserte brukere eller sesjoner som basis for filtreringsanalyse ved samarbeid og/eller midler for å benytte søk på alle metadata forbundet med alle dokumenter i en resultatmengde, og/eller midler for informasjonsoppdagelse på attributter eksplisitt representert i metadataene forbundet med alle dokumenter i en resultatmengde, og/eller midler for informasjonsoppdagelse og attributter beregnet fra metadata forbundet med alle dokumenter i en resultatmengde.
12. Fremgangsmåte i henhold til krav 11, karakterisert ved at de nevnte midler ytterligere omfatter stedsbasert søking og oppdagelse ved å forbinde metadataobjekter med en stedsverdi som annoterer det tilsvarende dokument.
13. Fremgangsmåte i henhold til krav 1, karakterisert ved å omfatte trinn for å detektere og fjerne uønsket innhold i fangede metadata, fortrinnsvis ved å fremlegge en såkalt "menneskelig utfordring" for å unngå datamaskingenererte metadata og/eller detektere og fjerne foretrukket støtende metadatainnførsler.
14. Søkemotor (100) i stand til å støtte og implementere fremgangsmåten i henhold til et eller flere av de foregående krav i informasjonsaksess eller søkesystemer, hvor søkemotoren benyttes til å aksessere, søke, gjenfinne og analysere informasjon fra innholdsmagasiner tilgjengelig via datakommunikasjonsnettverk, innbefattet et ekstran ett og intranett, og å presentere søke- og analyseresultater for sluttbrukere, og hvor søkemotoren omfatter minst en kjernesøkemotor (101), et brukerprogrammert grensesnitt (102) for innhold forbundet med kjernesøkemotoren (101) via et innholdsanalysetrinn (103), og et brukerprogrammert grensesnitt (107) for søkespørsmål forbundet med kjernesøkemotoren (101) og via respektive innholdsanalyse og søkespørsmålsanalysetrinn (105; 106), karakterisert ved at søkemotoren (100) omfatter en metadatatjener forbundet med eller som utgjør en del av kjernesøkemotoren (101) for å lagre, editere og fremlegge metadata for sluttbrukere.
15. Søkemotor i henhold til krav 14, karakterisert ved at den omfatter en varselmotor (104) forbundet i parallell med kjernesøkemotoren (101) og mellom henholdsvis innholdsanalysetrinnet (103) og trinnene for søkespørsmåls- og resultatanalyse (105;106).
NO20064649A 2005-10-13 2006-10-13 Informasjonstilgang med bruksdrevet metadatatilbakekobling NO327324B1 (no)

Priority Applications (1)

Application Number Priority Date Filing Date Title
NO20064649A NO327324B1 (no) 2005-10-13 2006-10-13 Informasjonstilgang med bruksdrevet metadatatilbakekobling

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
NO20054720A NO20054720L (no) 2005-10-13 2005-10-13 Informasjonstilgang med bruksdrevet metadatatilbakekobling
NO20064649A NO327324B1 (no) 2005-10-13 2006-10-13 Informasjonstilgang med bruksdrevet metadatatilbakekobling

Publications (2)

Publication Number Publication Date
NO20064649L NO20064649L (no) 2007-04-16
NO327324B1 true NO327324B1 (no) 2009-06-08

Family

ID=38091633

Family Applications (1)

Application Number Title Priority Date Filing Date
NO20064649A NO327324B1 (no) 2005-10-13 2006-10-13 Informasjonstilgang med bruksdrevet metadatatilbakekobling

Country Status (1)

Country Link
NO (1) NO327324B1 (no)

Also Published As

Publication number Publication date
NO20064649L (no) 2007-04-16

Similar Documents

Publication Publication Date Title
US8135669B2 (en) Information access with usage-driven metadata feedback
US11409777B2 (en) Entity-centric knowledge discovery
US9305100B2 (en) Object oriented data and metadata based search
US8060513B2 (en) Information processing with integrated semantic contexts
US9659084B1 (en) System, methods, and user interface for presenting information from unstructured data
US9020950B2 (en) System and method for generating, updating, and using meaningful tags
JP4857333B2 (ja) 諸文書にわたる文脈要約情報の決定方法
US8131684B2 (en) Adaptive archive data management
US8166013B2 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
US9990368B2 (en) System and method for automatic generation of information-rich content from multiple microblogs, each microblog containing only sparse information
US20100005087A1 (en) Facilitating collaborative searching using semantic contexts associated with information
US20090119572A1 (en) Systems and methods for finding information resources
US11971940B2 (en) Data processing system for data search and retrieval augmentation and enhanced data storage
US20070198246A1 (en) Interactive system for building, organising, and sharing one's own encyclopedia in one or more languages
Yi et al. Revisiting the syntactical and structural analysis of Library of Congress Subject Headings for the digital environment
WO2021111400A1 (en) System and method for enabling a search platform to users
Pham et al. Recommendation system based on multilingual entity matching on linked open data
Zenkert et al. Discovering contextual knowledge with associated information in dimensional structured knowledge bases
US11250076B1 (en) Topical search portal
NO327324B1 (no) Informasjonstilgang med bruksdrevet metadatatilbakekobling
Verma et al. Multi-structured data analytics using interactive visualization to aid business decision making
US20220164679A1 (en) Multi-hop search for entity relationships
Alby iD Check for Analyzing the Web: Are Top Websites Lists a Good Choice for Research? Tom Alby iD and Robert Jäschke iD Humboldt-Universität zu Berlin, Berlin, Germany
Mudgal et al. STATE OF THE ART CONTENT MINING USING SCAN TECHNOLOGY
Hamilton et al. Enabling Technology for Collaborative Semantic Search (CSS)

Legal Events

Date Code Title Description
CREP Change of representative

Representative=s name: BRYN AARFLOT AS, POSTBOKS 449 SENTRUM, 0104 OSLO,

MM1K Lapsed by not paying the annual fees