NO337806B1 - Systemer og fremgangsmåter for gruppering av søkeresultater - Google Patents

Systemer og fremgangsmåter for gruppering av søkeresultater Download PDF

Info

Publication number
NO337806B1
NO337806B1 NO20061794A NO20061794A NO337806B1 NO 337806 B1 NO337806 B1 NO 337806B1 NO 20061794 A NO20061794 A NO 20061794A NO 20061794 A NO20061794 A NO 20061794A NO 337806 B1 NO337806 B1 NO 337806B1
Authority
NO
Norway
Prior art keywords
documents
groups
geographic
interest
area
Prior art date
Application number
NO20061794A
Other languages
English (en)
Other versions
NO20061794L (no
Inventor
Adam Smith
Xianping Ge
Elizabeth Hamon Reid
Abhishek Parmar
Original Assignee
Google Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google Inc filed Critical Google Inc
Publication of NO20061794L publication Critical patent/NO20061794L/no
Publication of NO337806B1 publication Critical patent/NO337806B1/no

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

Teknisk område
Foreliggende oppfinnelse angår generelt systemer for innhenting av informasjon og mer spesielt systemer og fremgangsmåter for gruppering av søkeresultater etter adresse og/eller telefonnummer.
Beskrivelse av kjent teknikk
Verdensveven (The World Wide Web, "web" eller "nettet") inneholder en uhyre mengde med informasjon. Lokalisering av en ønsket del av informasjonen kan imidlertid være utfordrene. Dette problemet er sammensatt fordi informasjonsmengden på nettet og antallet nye brukere som er uerfarne når det gjelder søking på nettet, vokser hurtig. Søkemotorer forsøker å returnere hyperlinker til nettdokumenter som en bruker er interessert i. Søkemotorer baserer generelt sin bestemmelse av brukerens interesse på søketermer (kalt et søkespørsmål eller et søk) innført av brukeren. Målet med søkemotoren er å tilveiebringe lenker til relevante resultater med høy kvalitet til brukeren basert på søkespørsmålet. Søkemotoren gjennomfører vanligvis dette ved å tilpasse termene i søkespørsmålet til en mengde forhåndslagrede nettdokumenter. Nettdokumenter som inneholder brukerens søkespørsmål er "treff" og blir returnert til brukeren.
Noen nettdokumenter kan være av spesiell interesse for brukere som befinner seg i visse geografiske områder. Nettdokumenter tilknyttet lokale forretninger eller organisasjoner kan for eksempel ha mest relevans for individer som befinner seg i det geografiske området til de lokale
forretningene/organisasjonene.
Fra US2002/0078035A1 er det kjent et system og en metode for å danne grupper etter adresse, hvor gruppering etter adresse skjer ved at systemet mottar et søkespørsmål og identifisere et geografisk område av interesse basert på søkespørsmålet, å identifisere dokumenter som er tilknyttet adresser som befinner seg innenfor det geografiske området av interesse, å gruppere de identifiserte dokumentene i grupper basert på de adressene, og å presentere gruppene som søkeresultater.
Når en bruker ønsker informasjon vedrørende en forretningstype (for eksempel en restaurant, en jernvarebutikk, et apotek, osv.) innenfor et vist geografisk område, kan brukeren tilveiebringe et eller flere nøkkelord forbundet med forretningstypen og det geografiske området til søkemotor. Søkemotoren returnerer søkeresultater som innbefatter nettdokumenter tilknyttet forretningstypen.
Et problem med disse søkeresultatene er at søkeresultatene vanligvis ikke vil innbefatte nettdokumenter tilknyttet forretninger eller organisasjoner utenfor det geografiske området som er identifisert av brukeren, selv om disse forretningene eller organisasjonene befinner seg i et område som er geografisk nært (eller i nærheten av) det geografiske området som er identifisert av brukeren. Et annet problem med disse søkeresultatene er at søkeresultatene typisk innbefatter mer enn et, og ofte mange, nettdokumenter tilknyttet det samme forretningsstedet, noe som eventuelt krever at brukeren gjennomsøker mange nettdokumenter i søkeresultatene som irrelevante for den forretningen som er av interesse, før lokalisering av alle nettdokumentene som er tilknyttet den forretningen som av interesse.
Følgelig er det behov for systemer og fremgangsmåter for organisering av søkeresultater på en måte som er meningsfylt for null og hundrevis av nettdokumenter som beskriver hvert sted.
Oppsummering av oppfinnelsen.
Systemer og fremgangsmåter i overensstemmelse med prinsippene bak oppfinnelsen, grupperer nettdokumenter basert i det minste delvis på adresser (eller telefonnumre) innbefattet i nettdokumentene.
I samsvar med et aspekt i forbindelse med prinsippene bak oppfinnelsen, er det tilveiebrakt en fremgangsmåte for gruppering av adresser. Fremgangsmåten er kjennetegnet ved å motta et søkespørsmål som innbefatter et eller flere nøkkelord;
å fremskaffe en eller flere geografiske identifikatorer;
å identifisere et interesseområde basert på en eller flere geografiske indikatorer,;
der størrelsen på det interessante området er dynamisk satt basert på et eller flere nøkkelord;
identifisere dokumenter som adresser som er plassert innenfor interesseområdet
bestemmelse om et eller flere identifiserte dokumenter stemmer overens med det ene eller de flere nøkkelordene, som relevante dokumenter;
gruppering av de relevante dokumentene i grupper basert på de adressene assosiert med de relevante dokumentene;
hver av et flertall grupper tilsvarende en av adressene;
å tilegne poengsummer til hver gruppe basert på en avstandsfaktor og en relevansfaktor,
hvori avstandsfaktoren til en av de gruppene refererer til en avstand der en adresse relatert til den en av de gruppene er fra et geografiske sentrum av området som er av interesse,
og å presentere gruppene basert på tilegnete poengsummene.
I henhold til et annet aspekt er det tilveiebrakt et system for å danne søkeresultater. Systemet kan innbefatte en prosessor og et lager konfigurert for å lagre informasjonen som assosierer dokumenter med adresser som er innbefattet i dokumentene. Prosessoren er utformet for å motta et søkespørsmål, bestemme et geografisk område av interesse basert i det miste delvis på søkespørsmålet, og å identifisere dokumenter som innbefatter adresser som befinner seg innenfor det geografiske området av interesse, i det minste delvis basert på den informasjonene som lagret i lageret. Prosessoren er også konfigurert for å gruppere de identifiserte dokumentene i grupper som i det miste delvis er basert på de adressene som befinner seg innenfor det geografiske området av interesse, og tilveiebringer gruppene som søkeresultater.
I følge ytterligere andre aspekter er det tilveiebrakt en fremgangsmåte for å danne søkeresultater. Fremgangsmåten kan innbefatte å motta et søkespørsmål som innbefatter minst en del av et telefonnummer og som identifiserer dokumenter som innbefatter telefonnumre som stemmer med den minst ene del av telefonnummeret. Fremgangsmåten kan også innbefatte å gruppere de identifiserte dokumentene i grupper basert på de telefunnumre som innbefattet i de identifisert dokumentene og å presentere gruppene som søkeresultatene.
Ytterligere fordelaktige trekk ved fremgangsmåten fremgår av de uselvstendige fremgangsmåtekravene.
I henhold til et ytterligere aspekt er det tilveiebrakt et system for å frembringe søkeresultater, hvilket system innbefatter: et lager konfigurert for å lagre informasjon som tilordner dokumenter til adresser tilknyttet dokumentene; og
en prosessor koblet til lageret og utformet for:
å motta et søkespørsmål som inkluderer en eller flere geografiske identifikatorer,
å bestemme et geografisk område av interesse basert på en eller flere av de geografiske indikatorene,
å identifisere dokumenter som er tilknyttet adresser lokalisert innefor det geografiske området av interesse, basert på den informasjon som er lagret i lageret,
å gruppere de identifiserte dokumentene i grupper, basert på de adressene assosiert med de identifiserte dokumentene,
der hver av et flertall av grupper tilsvarer en av adressene, å tilegne poengsummer til hver gruppe basert på en avstandsfaktor og en relevansfaktor,
hvori avstandsfaktoren til en av de gruppene refererer til en avstand der en adresse relatert til den en av de gruppene er fra et geografiske sentrum av området som er av interesse, og
hvori avstandsfaktoren eller relevansfaktoren blir vektet basert på en spesifisitet for nevnte en eller flere geografiske identifikatorene, og
å levere gruppene som søkeresultater basert på tilegnede poengsummer. Ytterligere foirdelaktige trekk ved systemete er angitt i de uselvstendige systemkravene.
Kort beskrivelse av tegningene.
De vedføyde tegningene som er inkorporert i og utgjør en del av beskrivelsen, illustrerer en utførelsesform av oppfinnelsen, og forklarer sammen med beskrivelsen, oppfinnelsen. På tegningene er
Figur 1 et diagram over et nettverkseksempel hvor systemer og fremgangsmåter i forbindelse med prinsippene bak en utførelsesform av oppfinnelsen kan implementeres; Figur 2 er eksempel på et skjema over en klient og/eller en server på figur 1 i en implementering som er i overensstemmelse med prinsippene bak oppfinnelsen; Figur 3 er et diagram over et eksempel på et datamaskinlesbart medium som brukes av en server på figur 1 i henhold til en implementering i overensstemmelse med prinsippene bak foreliggende oppfinnelse; Figurene 4 A og 4 B er flytskjemaer over behandlingseksemplerfor gruppering av søkeresultater etter adresser i henhold til en realisering i henhold til prinsippene bak foreliggende oppfinnelse; Figur 5 er et funksjonsblokkskjema over en del av en server i henhold til utførelseseksempelet i forbindelse med prinsippene bak oppfinnelsen; Figur 6 A er et skjema over et eksempel på en resultatliste i henhold til en implementering i overensstemmelse med foreliggende oppfinnelse; Figur 6 B er et diagram over et eksempel på en resultatliste i henhold en annen implementering i overensstemmelse med prinsippene bak oppfinnelsen.
Detaljert beskrivelse.
Den følgende detaljerte beskrivelse av oppfinnelsen refererer til de vedføyde tegningene. De samme henvisningstall på forskjellige figurer kan identifisere de samme eller lignende elementer. Den følgende detaljerte beskrivelse begrenser for øvrig ikke oppfinnelsen.
Systemer og fremgangsmåter i overensstemmelse med prinsippene bak oppfinnelsen, kan tilveiebringe søkeresultater som er gruppert etter adresse (eller telefonnummer) for å tilveiebringe søkeresultater som er av betydning for brukere som søker etter informasjon tilknyttet spesielle geografiske områder. Søkeresultatene kan også være mer meningsfylte for brukere fordi de kan innbefatte informasjon tilknyttet andre geografiske steder som er geografisk nært den geografiske posisjonen hvor brukerne er interessert.
Eksempel på nettkonfigurasjon.
Figur 1. er et eksempel på et skjema over et nett 100 hvor systemer og fremgangsmåter i overensstemmelse med prinsippene bak oppfinnelsen kan implementeres. Nettet 100 kan innbefattet flere klienter 110 koblet til flere servere 120-140 via et nett 150. Nettet 150 kan innbefatte et lokalnett (LAN), et regionnett (WAN), et telefonnett slik som det offentlige svitsjede telefonnettet (PSTN), et intranett, internett, en lagringsanordning, en annen type nett eller en kombinasjon av nett. To klienter 110 og tre servere 120-140 e blitt illustrert som koblet til nettet 150 for enkelhets skyld. I praksis kan det være flere eller færre klienter og servere. I noen tilfeller kan en klient også utføre funksjonene til en server og en server kan utføre funksjonene til klient.
Klienten 110 kan innbefatte kliententiteter. En entitet kan defineres som en anordning, slik som en trådløs telefon, en personlig datamaskin, en personlig digital assistent (PDA), en bærbar datamaskin, eller en annen type beregnings-eller kommunikasjons- anordning, en tråd eller prosess som kjøres på en av disse anordningene og/eller et objekt som kan utføres av en av disse anordningene. Serverne 120-140 kan innbefatte serverentiteter som samler, behandler, søker og/eller opprettholder dokumenter på en måte som i overensstemmelse med prinsippene bak oppfinnelsen. Klientene 110 og serverne 120-140 kan være koblet til nettet 150 via ledningsforbindelser, trådløse forbindelser og/eller optiske forbindelser.
I en implementering i overensstemmelse med prinsippene bake oppfinnelsen, kan serverne 120 eventuelt innbefatte en søkemotor 125 som kan brukes av klienter 110. Serveren 120 kan krympe dokumenter (f. eks nettsider) og lagre informasjon i forbindelse med disse dokumentene i et lager med krympede dokumenter. Serverne 130 og 140 kan lagre eller opprettholde dokumenter som kan være krympet av serveren 120. Selv om serverne 120-140 er vist som separate entiteter, kan det være mulig at en eller flere av serverne 120-140 ufører en eller flere av funksjonene til en eller flere av de andre serverne 120-140. Det kan være mulig at to eller flere servere 120-140 er implementert som en enkelt server eller at en av serverne 120-140 er implementert som flere dataanordninger.
Eksempel på klient/server-arkitektur
Figur 2. er et eksempel på et skjema over en klient- eller service-entitet ( heretter kalt "klient/server- entitet"), som kan svare til en eller flere av klientene 110 og serverne 120-140 i henhold til en implementering i samsvar med prinsippene bak oppfinnelsen. Klient/server- entiteten kan innbefatte buss 210, en prosessor 220, et hovedlager 230, et leselager (ROM) 240, en lagringsanordning 250, en eller flere innmatingsanordninger 260, en eller flere utmatingsanordninger 270 og et kommunikasjonsgrensesnitt 280. Bussen 210 kan innbefatte en eller flere ledere som muliggjør kommunikasjon blant komponentene i klient/server- entiteten.
Prosessoren 220 kan innbefatte en konvensjonell prosessor eller mikroprosessor av en hvilken som helst type som tolker og utfører instruksjoner. Hovedlageret 230 kan innbefatte et direkte lager (RAM) eller annen type dynamisk lagringsanordning som lagrer informasjon og instruksjoner for utførelse av prosessoren 220. ROM 240 kan innbefatte en konvensjonell ROM-anordning eller an annen type statisk lagringsanordning som lagrer statisk informasjon og instruksjoner for bruk av prosessoren 220. Lagringsanordningen 250 kan innbefatte et magnetisk og/eller optisk registreringsmedium og dets tilsvarende drivkrets.
Innmatingsanordningen eller anordningene 260 kan innbefatte en eller flere konvensjonelle mekanismer som gjør det mulig for en operatør å mate inn informasjon til klient/server- entiteten, slik som et tastatur, en mus, en penn, en talegjenkjenningsanordning og/eller biometriske mekanismer, o.s.v. Utmatingsanordningen eller anordningene 270 kan innbefatte en eller flere konvensjonelle mekanismer som mater ut informasjon til operatøren, innbefattende en visningsskjerm, en skriver, en høyttaler, o.s.v. Kommunikasjonsgrensesnittet 280 kan innbefatte en hver sender/mottaker-liknende mekanisme som gjør det mulig for klient/server- entiteten å kommunisere med andre anordninger og/eller systemer. Kommunikasjonsgrensesnittet 280 kan for eksempel innbefatte mekanismer for å kommunisere med en annen anordning eller systemer via et nett, slik som nettet 150.
Som beskrevet i detalj nedenfor, utfører klient/server- entiteten i overensstemmelse med prinsippene bak oppfinnelsen, visse søkerelaterte operasjoner. Klient/server- entiteten kan uføre disse operasjonene som reaksjon på prosessoren 220 som utfører programvareinstruksjoner som befinner seg i et datamaskinlesbart medium, slik som et lager 230. Et datamaskinlesbart medium kan defineres som en eller flere fysike eller logiske lagringsanordninger og/eller bærebølger.
Programvareinstruksjonene kan leses inn i lageret 230 fra et annet datamaskinlesbart medium, slik som datalagringsanordningen 250, eller fra en annen anordning via kommunikasjonsgrensesnittet 280. Programvareinstruksjonene som befinner seg i lageret 230, får prosessoren 220 til å utføre prosesser som vil bli beskrevet senere. Alternativt kan ledningsførte kretser brukes i stedet for eller i kombinasjon med programvareinstruksjoner til å implementere prosesser i overensstemmelse med prinsippene bak oppfinnelsen. Implementeringer i overensstemmelse med prinsippene bak oppfinnelsen, er derfor ikke begrenset til noen spesiell kombinasjon av ledningsførte kretser og programvare.
Eksempel på datamaskinlesbart medium
Figur 3 er et eksempel på et datamaskinlesbart medium som kan være tilknyttet en server, slik som serveren 120 på figur 1, i henhold til en implementering i overensstemmelse med prinsippene bak oppfinnelsen. Innholdet til det datamaskinlesbare mediet kan fysisk befinne seg i en eller flere lagringsanordninger som er tilgjengelige for serverne 120.
Det datamaskinlesbare mediet kan innbefatte en database 300 over innføringer i overensstemmelse med dokumenter med tilknyttede adresser (for eksempel
postadresser). Severen 120 kan for eksempel analysere et lager over krympede dokumenter for å lokalisere dokumenter som inneholder en eller flere adresser. Serveren 120 kan så identifisere og ekstrahere adressene fra dokumentene ved å bruke en teknikk slik som den som er beskrevet i US - patentsøknad nummer 10/664902, med tittel "ADDRESS GEOCODING", inngitt 22. september 2003. I en annen implementering kan adressene være manuelt ekstrahert fra dokumentene.
I nok en annen implementering kan adressen i forbindelse med et dokument være utledet fra andre informasjonskilder. De geografiske posisjonene til folk som aksesserer dokumentet, kan for eksempel brukes til å utlede dokumentets adresse. De geografiske posisjonene til folk som aksesserer dokumentet, kan bestemmes basert på deres IP- adresser. Hvis de fleste folk som aksesserer et dokument, er i samme byen, kan det utledes at dokumentet har en adresse tilknyttet byen. Etforretningsnavn innbefattet i dokumentet kan også brukes til å utlede adressen til dokumentet. Fra forretningsnavnet kan en adresse bestemmes ved for eksempel å bruke data fra gule sider. Den geografiske posisjonen til serveren som er vert for dokumentet, kan også brukes til å utlede adressen til dokumentet. Disse og andre teknikker for å utlede en adresse i et dokument er beskrevet i US- patentsøknad nr. 10/665359, med tittel
"DETERMENING GEOGRAPHICAL RELEVANCE OF WEB DOCUMENTS",
INNGITT 22. SEPTEMBER 2003. I alle fall kan serveren 120 bruke disse adressene til å befolke databasen 300.
Hver av innføringene i databasen 300 kan innbefatte et
dokumentidentifikatorfelt 310 og adressefelt 320, som kan være søkbare hver for seg. I andre implementeringer i overensstemmelse med prinsippene bak oppfinnelsen, kan innføringene i databasen 300 innbefatte flere felter, slik ytterligere adressefelter, og/eller forskjellige felter slik som telefonnummerfelter og/eller felter for bredde- og lengde- koordinator svarende til informasjonen i adressefeltet 320.
Dokumentidentifikatorfeltet 310 kan innbefatte informasjon som entydig identifiserer dokumentene. I en implementering innbefatter dokumentidentifikatorfeltet 310 en uniform ressurslokalisator (URL) tilknyttet et dokument. Adressefeltet 320 kan innbefatte informasjon vedrørende en adresse tilknyttet et dokument. Adressefeltet 320 kan innbefatte informasjon vedrørende en adresse tilknyttet det tilsvarende dokumentet. Det kan være gunstig å legge merke til at den samme adressen kan tilknyttes mer enn et dokument. For eksempel, som vist på figur 3, er adresse _K tilknyttet dokument doc_1 og dokument doc_2. Det kan med andre ord være mellom null og hundrevis av dokumenter som har den tilknyttede adressen.
Eksempel på behandling
Figurene 4A og 4B er flytskjema over behandlingseksempler for gruppering av søkeresultater etter adresse i henhold til en implementering i overensstemmelse med prinsippene bak oppfinnelsen. Behandling kan begynne med serveren 120 som mottar et søkespørsmål fra en bruker (handling 410)( Figur 4A). En bruker kan for eksempel bruke en konvensjonell nettleserprogramvare på klienten 110 til å aksessere søkemotoren 125 i serveren 120. Brukeren kan så innføre søkestrengen via et grafisk brukergrensesnitt tilveiebrakt av serveren 120.
Søkespørsmålet kan ha forskjellige former. Søkespørsmålet kan for eksempel innbefatte en eller flere nøkkelord vedrørende en forretning eller en organisasjon som brukeren er interessert i, og eventuelt en eller flere geografiske identifikatorer vedrørende et sted hvor forretningen eller organisasjonen befinner seg. Nøkkelordet eller nøkkelordene kan innbefatte en eller flere termer tilknyttet forretningen eller organisasjonen som brukeren er interessert i. Hvis for eksempel brukeren ser etter et apotek, kan brukeren innbefatte utrykket "apotek" som et nøkkelord. Hvis brukeren likeledes ser etter restauranter som serverer pizza, kan brukeren innbefatte utrykket "pizza" som et nøkkelord.
Den geografiske identifikatoren eller identifikatorene kan innbefatte posisjonsspesifikk informasjon som tilnærmet identifiserer posisjonen til forretningen eller organisasjonen som brukeren er interessert i. Den eller de geografiske identifikatorene innbefatter informasjon, slik som en hel eller delvis adresse eller et helt eller delvist telefonnummer tilknyttet en forretning eller organisasjon av interesse. Brukeren kan for eksempel spesifisere adressespesifikke data, slik som staten, byen, postnummeret, gatenavnet, eller kombinasjoner av denne informasjonen. Alternativt kan brukeren spesifisere telefonspesifikke data slik som retningsnummer, prefiks eller en eller annen kombinasjon av denne informasjonen.
Både adressespesifikke data og de telefonspesifikke data innbefatter informasjon ved hjelp av hvilken serveren 120 kan bestemme et geografisk sted. Det geografiske stedet kan være så bredt som en stat, en by, en postkode eller en område kode, eller så spesifikt som en gateadresse eller en områdekode og prefiks. Serveren 120 kan bestemme et geografisk sentrum for det geografiske stedet (handling 420). Hvis for eksempel brukeren spesifiserte "Palo Alto", så kan serveren 120 identifisere det geografiske sentret i Palo Alto. Hvis brukeren likeledes spesifiserte postkoden 22030, så kan serveren identifisere det geografiske sentret til det området som dekkes av denne postkoden. Serveren 120 kan utrykke det geografiske sentrum ved hjelp av det bredde- og lengde- koordinater.
I andre implementeringer kan serveren 120 identifisere et relevant geografisk sentrum basert på informasjon forskjellig fra den som eksplisitt leveres av brukeren. Brukerens IP-adresse eller nettlesingshistorie kan brukes til å anslå et geografisk sentrum. Alternativt kan brukeren registrere en "hjemmeposisjon" for brukeren i serveren 120.
Serveren 120 kan så identifisere et område som dekker posisjoner innefor en viss avstand fra det geografiske sentrum, som et område av interesse, (handling 430). Serveren 120 kan for eksempel i virkeligheten tegne en sirkel med en viss radius omkring det geografiske sentrum og identifisere området innenfor sirkelen som det området som er av interesse. Radien kan være en forutbestemt radius, slik som 8 kilometer eller 16 kilometer. I en annen implementering kan serveren 120 bestemme radien basert i det minste delvis på hvor spesifikke den geografiske identifikatoren eller identifikatorene er. Serveren 120 kan for eksempel tilveiebringe en mindre radius når den eller de geografiske identifikatorene svarer til en spesifikk adresse (for eksempel en gateadresse) og en større radius når den eller de geografiske identifikatorene svarer til en meget generell adresse (for eksempel en stat). I nok en annen utførelsesform kan serveren 120 tillate brukeren å definere radien. Dette kan være en dynamisk egenskap. Hvis brukeren for eksempel ikke er fornøyd med søkeresultatene (for eksempel de søkeresultatene som leverer for mange eller for få resultater), kan brukeren få mulighet til enten å øke eller minske radien. I en ytterligere implementering kan radien størrelse fastsettes dynamisk basert på type nøkkelord som brukeren har benyttet. Radien kan for eksempel fastsettes ved 8 kilometer for et restaurantsøk og 20 kilometer for et søk etter en bilforhandler.
I stedet for å bruke en radius kan serveren 120 bruke kjøreavstand for å identifisere det området som er av interesse. Alternativt kan serverne 120 bruke avstand (enten rettlinjet avstand eller kjøreavstand) til en kjørerute for å identifisere det området som er av interesse. Serveren 120 kan for eksempel spesifisere område av interesse som "langs Highway 101 ved å kjøre fra Mountain View til San Francisco". Serveren 120 kan bruke ytterligere andre måter til å identifisere det området som er av interesse.
Serveren 120 kan identifisere dokumenter som er tilknyttet en eller flere adresser plassert innenfor det området som er av interesse, som potensielle "treff" (handling 440). Serveren 120 kan foreksempel bruke en database som tilpasser dokumenter fra lageret over krympede dokumenter til deres tilknyttede adresser, slik som database 300 (figur 3), for å identifisere dokumenter som er tilknyttet en eller flere adresser som befinner seg innfor området av interesse. For å lette dokumentidentifikasjonen, kan serveren 120 søke i databasen 300 etter adresser som faller innenfor det området som er av interesse, og så identifisere de dokumentene som er tilknyttet disse adressene.
Serveren 120 kan så identifisere dokumenter blant de potensielle treffene, som innbefatter det ene eller de flere nøkkelordene som brukeren har benyttet, som relevante resultater (handling 450). Serveren 120 kan for eksempel analysere ordene i dokumentene og bestemme om disse ordene stemmer med det ene eller de flere nøkkelordene. Dokumenter som har ord som stemmer med det ene eller de flere nøkkelordene, kan klassifiseres som relevante resultater.
I en annen implementering i henhold til prinsippene bak foreliggende oppfinnelse, kan handlingene 440 og 450 reverseres. Serveren 120 kan for eksempel bestemme dokumenter som stemmer med det ene eller de flere nøkkelordene og så bestemme hvilke av disse dokumentene som tilknyttet en adresse innenfor det området som er av interesse. I nok en annen implementering kan handlingen 440 og 450 utføres samtidig. I dette tilfellet kan serveren 120 bestemme skjæringen mellom de to separat identifiserte gruppene med dokumenter for å identifisere de dokumentene som er tilknyttet en adresse innenfor det området som er av interesse. I alle fall kan et sett med dokumenter identifiseres som relevante resultater.
Serveren 120 kan analysere de relevante resultatene (handling 460) (figur 4B). Serveren 120 kan bruke forskjellige faktorer ved analysering av de relevante resultatene. Serveren 120 kan foreksempel ta i betraktning avstand og/eller relevans ved bestemmelse av poengsummen for et dokument. Avstand kan referere til den avstanden som adressen til et dokument er fra det geografiske sentrum. Dokumenter tilknyttet adresser nærmere det geografiske sentrum kan gis en høyere poengsum enn dokumenter tilknyttet adresser lenger fra det geografiske sentrum. Relevans kan referere til antallet nøkkelord som dokumentet inneholder, og/eller hvor prominent det ene eller de flere nøkkelordene er presentert i dokumentet. Dokumenter som inneholder alle av de ene eller flere nøkkelordene kan gis en høyere poengsum enn dokumenter som inneholder færre enn alle av det ene eller de flere nøkkelordene. Dokumenter som inneholder det ene eller de flere nøkkelordene i en mer fremhevet posisjon, slik som i en tittel, kan gis en høyere poengsum enn dokumenter som inneholder det ene eller de flere nøkkelordene på et mindre fremtredende sted, slik som med liten skrift.
Serverne 120 kan gruppere dokumenter i henhold til de relevante resultatene, i forbindelse med samme adressen (handling 470). For å lette dette, kan serverne 120 eventuelt sortere dokumentene basert på deres poengsummer. Serveren 120 kan betrakte en adresse tilknyttet et første av dokumentene (for eksempel et høyest skårende dokument) og bestemme om det er noen andre dokumenter som er tilknyttet denne samme adressen. Serveren 120 kan så gruppere disse dokumentene sammen som tilknyttet den samme adressen. Serveren 120 kan så betrakte en annen adresse tilknyttet det første dokumentet hvis det er et som også er lokalisert innenfor det som er av interesse, eller en adresse tilknyttet et annet av dokumentene (for eksempel et dokument som skårer nest høyest) og bestemme om det er noen andre dokumenter som er tilknyttet denne samme adressen. Serveren 120 kan så gruppere disse dokumentene sammen. Serveren 120 kan fortsette inntil alle dokumentene er blitt innbefattet i minst en gruppe, selv om gruppen er en gruppe med et (som vil inntreffe når dokumentet er tilknyttet en adresse som ikke er tilknyttet noen annet dokument). Serveren 120 kan sortere dokumentene innenfor hver av gruppene basert på deres poengsummer, hvis de ikke allerede er i rekkefølge fra en tidligere sortering (beskrevet ovenfor).
Serveren 120 kan rangere gruppene for å danne en resultatliste (handling 480). Serveren 120 kan bruke forsjellige faktorer i rangeringen av gruppene. Serveren 120 kan for eksempel ta hensyn til avstand og relevans ved rangering av gruppene. Avstand for en gruppe kan referer til avstanden til den adressen som er tilknyttet gruppen fra det geografiske sentrum. Grupper med adresser nærmere det geografiske sentrum kan rangeres høyere enn grupper med adresser lenger vekk fra det geografiske sentrum.
Relevans for en gruppe kan referere til antallet nøkkelord som dokumentet i gruppen inneholder og/eller hvor fremtredende det ene eller de flere nøkkelordene er presentert i dokumentene. Under betraktning av dokumentene i en gruppe kan serveren 120 ta hensyn til et forutbestemt antall (for eksempel et, tre, alle, osv) av de høyest skårende dokumentene i gruppen. Grupper med et eller flere dokumenter som inneholder alle blant det ene eller de flere nøkkelordene, kan rangeres høyere enn grupper med et eller flere dokumenter som inneholder færre enn alle av de ene eller flere nøkkelordene. Videre kan grupper med et eller flere dokumenter som inneholder det ene eller de flere nøkkelordene i en mer fremtredende posisjon, slik som i en tittel, rangeres høyere enn grupper med dokumenter som inneholder det ene eller de flere nøkkelordene på et mindre fremtredende sted, slik med liten skrift.
Serveren 120 kan gi mer vekt til enten avstand eller relevans basert i det minstedelvis på for eksempel hvor spesifikk den eller de geografiske identifikatorene er. For eksempel den eller de geografiske identifikatorene er brede (for eksempel når den eller de geografiske identifikatorene svarer til et stort geografisk område, slik som en stat eller en stor by), så kan serveren 120 gi relevans mer vekt. Hvis den eller de geografiske identifikatorene er smale (for eksempel når den eller de geografiske identifikatorene svarer til et lite geografisk område slik som en liten by, en nøyaktig adresse eller en nesten nøyaktig adresse), så kan serveren 120 gi avstand mer vekt.
I stedet for den ovenfor beskrevne rangeringsmåten kan serveren 120 rangere gruppene basert på poengsummene til dokumentene som de inneholder. Ved bestemmelse av rangeringen til en gruppe, kan serveren 120 betrakte et forutbestemt antall (for eksempel et, tre, alle, osv) av de høyest skårende dokumentene i gruppen. Serveren 120 kan tilføye poengsummen til disse dokumentene for å bruke en annen teknikk, slik som en
gjennomsnittsberegningsteknikk, til å bestemme grupperangeringen.
Serveren 120 kan så sortere og presentere resultatlisten for brukeren (handling 490). Serveren 120 kan for eksempel sortere gruppene basert på deres rangering. Serveren 120 kan så skape en resultatutmating for hver gruppe, som kan presenteres for brukeren. En resultatutgang for en gruppe kan innbefatte tittelen (som kan inneholde en hypertekstlenke som vil dirigere brukeren, når den velges, til det aktuelle dokumentet) og et utklipp (for eksempel et tekstutdrag) fra det høyest skårende dokumentet i gruppen. Resultatutmatingen kan innbefatte titler (for eksempel hypertekstlenker) for et eller flere av de nest høyest skårende dokumentene, eventuelt også med et utklipp eller URUene tilknyttet disse dokumentene. Utgangsresultatet kan videre innbefatte en "se mer"-valgmulighet som, når den velges av brukeren, kan vise titler, utdrag og/eller URUer for ytterligere av de gjenværende dokumentene i gruppen. Serveren kan presentere utgangsresultatene sammen med et kart som illustrerer steder som svarer til de adressene som er tilknyttet utgangsresultatene.
I en annen implementering kan utgangsresultatet for en gruppe innbefatte et forretnings- eller organisasjons- navn tilknyttet gruppen, eventuelt sammen med den adressen som er tilknyttet gruppen. Serveren 120 kan analysere ordene i dokumentene i gruppen for å bestemme en bedrift eller en organisasjon som svarer til den adressen som er tilknyttet gruppen. Utgangsresultatet kan i denne implementeringen også innbefatte en tittel, et utdrag og/eller URL for et forutbestemt antall (for eksempel fire)av de høyest skårende dokumentene i gruppen. Utgangsresultatet i denne implementering kan videre innbefatte en "se mer" -mulighet som når den velges av brukeren, kan vise titler, utdrag og/eller URL'er for ytterligere av de gjenværende dokumentene i gruppen. Serveren 120 kan presentere utgangsresultatene sammen med et kart som illustrerer de steder som svarer til de adressene som er tilknyttet utgangsresultatene.
Det kan være gunstig å legge merke til at godt resultat ikke nødvendigvis må innbefatte det eller de ordene som utgjør den eller de geografiske identifikatorene. Et godt resultat kan med andre ord være forbundet med et sted som er forskjellig fra stedet for den eller de geografiske identifikatorene (men likevel innefor det området som er av interesse). Det kan også være gunstig å legge merke til at for at et dokument skal ekskluderes fra resultatlisten, behøver dokumentet ikke å være tilknyttet en adresse som befinner seg innenfor det området som er av interesse eller noen av de nøkkelordene som er angitt av brukeren.
Eksempel
Anta at en bruker ønske å finne restauranter som serverer pizza i Palo Alto-området. Brukeren kan gå inn på en server ved å bruke konvensjonell nettleserprogramvare. Anta at brukeren avgir følgende søkespørsmål: "pizza Palo Alto". Serveren kan gjenkjenne søkespørsmålet som et søk etter en forretning eller en organisasjon i et vist område basert i det minste delvis på forekomsten av et eller flere av nøkkelordene ("pizza") og en eller flere geografiske identifikatorer ("Palo Alto").
Figur 5. er et funksjonsblokkskjema over en del av serveren i henhold til dette utførelseseksempelet i overensstemmelse med prinsippene bak oppfinnelsen. Serveren kan bestemme det geografiske sentrum i Palo Alto, eventuelt uttrykt ved dets bredde- og lengde- koordinater. Serveren kan så identifisere det området som er av interesse. Anta at radien blir satt til 16 kilometer. Servene kan bestemme det området som er av interesse til å innbefatte det området som er innefor en sirkel sentrert på det geografiske sentrum i Palo Alto med en radius på 16 kilometer.
Serveren kan analysere dokumenter fra lagre med krympede dokumenter for å identifisere dokumenter som er tilknyttet en eller flere adresser som befinner seg innenfor det området som er av interesse, som potensielle treff. Anta at de potensielle treff innbefatter 50 dokumenter: dokumentene 1 til 50. Noen av disse dokumentene kan være tilknyttet mer enn en adresse som befinner seg innefor det området som er av interesse. Dokument 1 er for eksempel tilknyttet fire adresser, hvor av tre befinner seg innenfor det området som er av interesse. Den skraverte blokken indikerer en adresse som ikke befinner seg innenfor det området som er av interesse. Dokument 2 er likeledes tilknyttet tre adresser som alle befinner seg innenfor det området som er av interesse. Dokument 50 er tilknyttet tre adresser, hvorav to befinner seg innenfor det området er av interesse.
Serveren kan så identifisere hvilke av dokumentene 1 til 50 som innbefatter nøkkelordet "pizza". For eksempel kan serveren analysere ordene i dokumentene og bestemme om noen av disse ordene stemmer med nøkkelordet "pizza". Dokumenter som innbefatter ordet "pizza" kan klassifiseres som relevante resultater. Anta at bare dokumentene 1 til 25 innbefatter ordet "pizza" og dermed utgjør de relevante resultatene.
Servere kan analysere de relevante resultatene basert på for eksempel avstand og/eller relevans. Anta at dokument 1 inneholder en adresse som er nærmest det geografiske sentrum i Palo Alto og innbefatter ordet "pizza" på en fremtredende plass, slik som i tittelen. Serveren kan så gi dokument 1 høyere poengsum enn resten av dokumentene. Anta videre at dokument 25 inneholder en eneste adresse som er lengst fra det geografiske sentrum og som innbefatter ordet "pizza" med meget liten skrift. Serveren kan gi dokument 25 lavere poengsum enn resten av dokumentene.
Serveren kan gruppere dokumentene 1 til 25 basert på den adressen de inneholder. Serveren kan sortere dokumentene basert på deres poengsummer og av hensyn til en adresse tilknyttet et av dokumentene (for eksempel dokument 1) for å bestemme om det er noen andre som er tilknyttet denne samme adressen. Anta at dokumentene 3 og 12 er tilknyttet den samme adressen. Serveren kan gruppere dokumentene 1,3 og 12 som tilknyttet den samme adressen.
Serveren kan så betrakte en annen adresse, slik som en annen adresse tilknyttet dokument 1 eller et annet dokument. Serveren kan så bestemme om det er noen andre dokumenter som er tilknyttet denne adressen. Anta at det er flere dokumenter som er tilknyttet den adressen hvor dokument 1 et. Serveren kan så gruppere dokumentene 1,...,25 som tilknyttet den samme adressen.
Serveren kan fortsette denne prosessen inntil ingen ytterligere grupper kan dannes. Det skal være en gruppe dannet for hver distinkt adresse i et eller flere av dokumentene 1 til 25. Anta at det er 10 distinkte adresser, og dermed 10 dannede grupper. Som vist på figur 5. kan noen av gruppene innbefatte de samme dokumentene. Både gruppe 1 og 2 innbefatter for eksempel dokument 1.
Serveren kan så rangere og sortere gruppene for å danne en resultatliste og presentere resultatlisten for brukeren. Figur 6A er et eksempel på en resultatliste i henhold til en utførelsesform i henhold til prinsippene bak foreliggende oppfinnelse. Som vist på figur 6A inneholder resultatlisten to utgangsresultater 610 og 620, som svarer til to grupper. Utgangsresultatet 610 refererer til fire dokumenter 612, 614, 616 og 618 i gruppen. Dokument 612 kan svare til det høyest skårende dokumentet i gruppen. For dokument 612 kan serveren innbefatte tittelen og et utdrag. Dokumentene 614-618 kan svare til lavere skårende dokumenter. Som vist på figur 6A kan serveren innbefatte tittelen og/eller URL-adressen som er tilknyttet disse dokumentene.
Figur 6B er et diagram over et eksempel på en resultatliste i henhold til en annen implementering i overensstemmelse med prinsippene bak oppfinnelsen. Som vist på figur 6B inneholder resultatlisten to utgangsresultater 650 og 660, svarende til to grupper. Utgangsresultatet 650 innbefatter et forretningsnavn og eventuelt den adressen som er tilknyttet gruppen 652, og referer til tre dokumenter 654, 656 og 658 i gruppen. Dokumentene 654-658 kan være ordnet etter deres poengsummer. Som vist på figur 6B kan serveren innbefatte tittelen og/eller den URL som er tilknyttet disse dokumentene.
Konklusjon
Systemer og fremgangsmåter i overensstemmelse med prinsippene bak oppfinnelsen grupperer søkeresultater basert på posisjoner (eller telefonnummer) av interesse for brukere. Brukerne kan levere data tilknyttet en forretning eller en organisasjon, og eventuelt en posisjon for forretningen eller organisasjonen. Brukerne kan levere posisjonsdataene så brede eller smale som de ønsker. De kan også dynamisk utvide eller innsnevre posisjonsdataene for å oppnå flere eller færres resultater.
Den foregående beskrivelse av foretrukne utførelsesformer av foreliggende oppfinnelse utgjør en illustrasjon og en beskrivelse, men er ikke ment å være uttømmende eller å begrense oppfinnelsen til den nøyaktig beskrevne formen. Modifikasjoner og variasjoner er mulige i lys av den ovenfor beskrevne lære eller kan oppnås ved praktisering av oppfinnelsen. Selv om en rekke handlinger er blitt beskrevet i forbindelse 4A og 4B, kan for eksempel rekkefølgen av handlingene modifiseres i andre implementeringer i overensstemmelse med prinsippene bak oppfinnelsen. Ikke avhengige handlinger kan også utføres parallelt.
Gruppering er så langt også blitt beskrevet som gruppering av dokumenter basert på adresser som de er tilordnet. I andre implementeringer i overensstemmelse med oppfinnelsen, kan gruppering utføres for å gruppere dokumenter basert på telefonnumre som de er tilknyttet. En bruker kan for eksempel levere et delvis telefonnummer i søkespørsmålet. Serveren kan identifisere dokumenter som er tilknyttet det delvise telefonnummeret og som stemmer overens med eventuelle nøkkelord som også er innbefattet i søkespørsmålet. Serveren kan så gruppere dokumentene basert på telefonnumrene som de tilknyttet og presentere gruppene som søkeresultater for brukeren.
Selv om den foregående beskrivelse videre er fokusert på å generere søkeresultater som har menig for en bruker, er den ikke begrenset til dette. De tidligere beskrevne handlingene kan for eksempel brukes til å treffe og eventuelt gruppere, reklame til brukere. Nøkkelordet eller nøkkelordene og en eller flere geografiske identifikatorer kan brukes til å bestemme interesser og bosteder for brukerne. Serveren kan bruke disse interessene og bostedene til å identifisere reklame som skal presenteres for brukerne sammen med søkeresultatene. I det eksempelet hvor en bruker søker restauranter som serverer pizza i Palo Alto-området, kan serveren presentere brukeren for reklame vedrørende andre restauranter (kanskje noen som ikke serverer pizza) i Palo Alto- området (eller innefor det området som er av interesse). Disse eller andre annonser kan grupperes å på en måte som er lik den som er beskrevet ovenfor.

Claims (27)

1. Fremgangsmåte for gruppering etter adresse, der fremgangsmåten omfatter følgende trinn: å motta et søkespørsmål som innbefatter et eller flere nøkkelord; å fremskaffe en eller flere geografiske identifikatorer; å identifisere et interesseområde basert på en eller flere geografiske indikatorer,; der størrelsen på det interessante området er dynamisk satt basert på et eller flere nøkkelord; identifisere dokumenter som adresser som er plassert innenfor interesseområdet bestemmelse om et eller flere identifiserte dokumenter stemmer overens med det ene eller de flere nøkkelordene, som relevante dokumenter; gruppering av de relevante dokumentene i grupper basert på de adressene assosiert med de relevante dokumentene; hver av et flertall grupper tilsvarende en av adressene;karakterisert vedat fremgangsmåten også omfatter å tilegne poengsummer til hver gruppe basert på en avstandsfaktor og en relevansfaktor, hvori avstandsfaktoren til en av de gruppene refererer til en avstand der en adresse relatert til den en av de gruppene er fra et geografiske sentrum av området som er av interesse, og å presentere gruppene basert på tilegnete poengsummene.
2. Fremgangsmåte i følge krav 1, hvor en eller flere av de geografiske identifikatorene blir mottatt som en del av søkespørsmålet.
3. Fremgangsmåte i følge kravl, hvor en eller flere av de geografiske identifikatorene blir utledet uavhengig av søkespørsmålet.
4. Fremgangsmåte i følge krav 1, hvor det ene eller de flere nøkkelordene angår en forretning eller organisasjon.
5. Fremgangsmåt i følge krav 4, hvor den ene eller de flere geografiske identifikatorene innbefatter posisjonsspesifikke informasjoner som tilnærmet identifiserer et sted for forretningen eller organisasjonen.
6. Fremgangsmåte i følge krav 1, hvor den ene eller de flere geografiske identifikatorene innbefatter minst en av en delvis adresse, et delvis telefonnummer, en fullstendig adresse eller et fullstendig telefonnummer.
7. Fremgangsmåte i følge krav 1, hvor identifiseringen av området av interesse innbefatter: Å bestemme en geografisk posisjon basert på den ene eller de flere geografiske identifikatorene, å bestemme et geografisk sentrum for den geografiske posisjonen, og å identifisere steder innenfor en viss avstand fra det geografiske sentrum, av det geografiske stedet, som det området som er av interesse, der avstanden er dynamisk satt basert på et av nøkkelordene.
8. Fremgangsmåte i følge krav 7, hvor identifiseringen av stedene innbefatter: Å bestemme en radiustilsvarende den visse avstanden, og å identifisere det området som er av interesse, som en sirkel sentrert på det geografiske^av det geografiske stedet, sentrum med den bestemte radien.
9. Fremgangsmåte i følge krav 1, hvor identifiseringen av dokumentene innbefatter: Å aksessere en database som tilordner dokumenter fra et lager med krympede dokumenter til adresser tilknyttet dokumentene.
10. Fremgangsmåte i følge krav 1, der poengsummenstilegning inkluderer: Å gi de relevante dokumentene poeng basert på minst en av en bestemt avstandsfaktor eller en bestemt relevansfaktor.
11. Fremgangsmåte i følge krav 10, hvor den bestemte avstandsfaktoren for et av de relevante dokumentene refererer til en avstand som en adresse tilknyttet det ene av de relevante dokumentene, er fra det geografiske sentrum for det området som er av interesse.
12. Fremgangsmåte ifølge krav 10, hvor den bestemte relevansfaktoren for et av de relevante dokumentene referer til minst en av et antall av det ene eller de flere nøkkelord som er tilstede i det ene av de relevante dokumentene, eller hvor fremtredende det ene eller de flere nøkkelordene opptrer i et av de relevante dokumentene.
13. Fremgangsmåte i følge krav 1, hvor grupperingen av de relevante dokumentene i gruppene innbefatter: å danne en separat av gruppene for hver av de adressene som befinner seg innfor det området som er av interesse.
14. Fremgangsmåte i følge krav 1, hvor grupperingen av relevante dokumenter i gruppene, innbefatter: å identifisere en første av adressene som er tilknyttet et første av de relevante dokumentene, å bestemme en eller flere andre av de relevante dokumentene som også er tilknyttet den første av adressene, og å gruppere det første relevante dokumentet og et eller flere av de andre dokumentene i en gruppe.
15. Fremgangsmåte i følge krav 1, hvor grupperingen av de relevante dokumentene i gruppene innbefatter: å plassere hvert av de relevante dokumentene i minst en gruppe.
16. Fremgangsmåte i følge krav 1, hvor grupperingen av de relevante dokumentene i gruppene innbefatter: å plassere minst et av de relevante dokumentene i antall av gruppene.
17. Fremgangsmåte i følge krav 1, hvor presenteringen av gruppene innbefatter: å generere poengsummer for de relevante dokumentene innefor hver av gruppene, og å sortere de relevante dokumentene innfor hver av gruppene basert på poengsummene.
18. Fremgangsmåte ifølge krav 1, hvor relevansfaktoren for den en av de gruppene refererer til minst et av et antall av det ene eller de flere nøkkelord som er tilstede i minst et av de relevante dokumentene i en av gruppene eller hvor fremtredende det ene eller de flere nøkkelordene opptrer i minst et av de relevante dokumentene i den gruppen.
19. Fremgangsmåte i følge krav 1, hvor presenteringen av gruppene videre innbefatter: å veie avstandsfaktoren og relevansfaktoren forskjellig, basert på en spesifitet foren eller flere geografiske identifikatorer..
20. Fremgangsmåte i følge krav 1, hvor presenteringen av gruppene innbefatter: å danne et utgangsresultat for hver av gruppene, hvor utgangsresultatet innbefatter minst en av en tittel eller et utdrag for et av de relevante dokumentene i gruppen, og en tittel for en eller flere av de andre relevante dokumentene i gruppen.
21. Fremgangsmåte i følge krav 1, hvor presenteringen av gruppene innbefatter: å danne et utgangsresultat for hver av gruppene, hvor utgangsresultatet innbefatter et navn på en forretning eller organisasjon, og en tittel for en eller flere av de relevante dokumentene i gruppen.
22. System for å danne søkeresultater, der systemet omfatter: et lager konfigurert for å lagre informasjon som tilordner dokumenter til adresser tilknyttet dokumentene; og en prosessor koblet til lageret og utformet for: å motta et søkespørsmål som inkluderer en eller flere geografiske identifikatorer, å bestemme et geografisk område av interesse basert på en eller flere av de geografiske indikatorene, å identifisere dokumenter som er tilknyttet adresser lokalisert innefor det geografiske området av interesse, basert på den informasjon som er lagret i lageret, å gruppere de identifiserte dokumentene i grupper, basert på de adressene assosiert med de identifiserte dokumentene, der hver av et flertall av grupper tilsvarer en av adressene,karakterisert vedat systemet også omfatter å tilegne poengsummer til hver gruppe basert på en avstandsfaktor og en relevansfaktor, hvori avstandsfaktoren til en av de gruppene refererer til en avstand der en adresse relatert til den en av de gruppene er fra et geografiske sentrum av området som er av interesse, og hvori avstandsfaktoren eller relevansfaktoren blir vektet basert på en spesifisitet for nevnte en eller flere geografiske identifikatorene, og å levere gruppene som søkeresultater basert på tilegnede poengsummer.
23. Datamaskinlesbar minneinnretning omfattende datamaskinutførbare instruksjoner som utfører fremgangsmåte ifølge kravene 1-17 og 20-23.
24. System ifølge krav 22, der søket også inkluderer et eller flere nøkkelord.
25. System ifølge krav 22, der, ved bestemmelsen av et geografisk interesseområde, prosessoren er konfigurert til å: bestemme en geografisk plassering basert på en eller flere geografiske identifikatorer, bestemme et geografisk sentrum for den geografiske plasseringen, og identifisere plasseringer innen en bestemt avstand fra det geografiske senteret av det geografiske stedet som et interesseområde, hvori den bestemte avstanden er dynamisk satt basert på et eller flere nøkkelord.
26. System ifølge krav 25, der, ved identifiseringen av steder innen den bestemte avstanden fra det geografiske senteret som interesseområde, prosessoren er konfigurert til å: bestemme en radius tilsvarende den bestemte avstanden, og identifisere interesseområdet som en sirkel sentrert på det geografiske senteret av det geografiske stedet, der radien tilsvarer den bestemte avstanden.
27. System ifølge krav 22, der relevansfaktoren for den en av gruppene refererer til minst en av: et antall av en eller flere nøkkelord tilstede i dokumentene til en av gruppene, eller hvor tydelig et eller flere av nøkkelordene fremstår i dokumentene til en av gruppene.
NO20061794A 2003-09-22 2006-04-24 Systemer og fremgangsmåter for gruppering av søkeresultater NO337806B1 (no)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/664,929 US8346770B2 (en) 2003-09-22 2003-09-22 Systems and methods for clustering search results
PCT/US2004/030983 WO2005031614A1 (en) 2003-09-22 2004-09-20 Systems and methods for clustering search results

Publications (2)

Publication Number Publication Date
NO20061794L NO20061794L (no) 2006-04-24
NO337806B1 true NO337806B1 (no) 2016-06-27

Family

ID=34312824

Family Applications (1)

Application Number Title Priority Date Filing Date
NO20061794A NO337806B1 (no) 2003-09-22 2006-04-24 Systemer og fremgangsmåter for gruppering av søkeresultater

Country Status (5)

Country Link
US (1) US8346770B2 (no)
EP (1) EP1665101A1 (no)
KR (1) KR100814667B1 (no)
NO (1) NO337806B1 (no)
WO (1) WO2005031614A1 (no)

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7334195B2 (en) * 2003-10-14 2008-02-19 Microsoft Corporation System and process for presenting search results in a histogram/cluster format
US8676790B1 (en) * 2003-12-05 2014-03-18 Google Inc. Methods and systems for improving search rankings using advertising data
US7302645B1 (en) 2003-12-10 2007-11-27 Google Inc. Methods and systems for identifying manipulated articles
EP1704387B1 (en) * 2003-12-19 2013-03-27 DeCarta Inc. Geocoding locations near a specified city
US8953887B2 (en) 2004-07-09 2015-02-10 Terrago Technologies, Inc. Processing time-based geospatial data
US8675995B2 (en) * 2004-07-09 2014-03-18 Terrago Technologies, Inc. Precisely locating features on geospatial imagery
US7657519B2 (en) * 2004-09-30 2010-02-02 Microsoft Corporation Forming intent-based clusters and employing same by search
US7831438B2 (en) * 2004-12-30 2010-11-09 Google Inc. Local item extraction
US7574530B2 (en) * 2005-03-10 2009-08-11 Microsoft Corporation Method and system for web resource location classification and detection
US7353034B2 (en) 2005-04-04 2008-04-01 X One, Inc. Location sharing and tracking using mobile phones or other wireless devices
US7822751B2 (en) * 2005-05-27 2010-10-26 Google Inc. Scoring local search results based on location prominence
US7424472B2 (en) * 2005-05-27 2008-09-09 Microsoft Corporation Search query dominant location detection
US7933929B1 (en) 2005-06-27 2011-04-26 Google Inc. Network link for providing dynamic data layer in a geographic information system
US7933897B2 (en) 2005-10-12 2011-04-26 Google Inc. Entity display priority in a distributed geographic information system
US20070156671A1 (en) * 2005-12-30 2007-07-05 Yip Kai K K Category search for structured documents
US7644373B2 (en) 2006-01-23 2010-01-05 Microsoft Corporation User interface for viewing clusters of images
US8122013B1 (en) 2006-01-27 2012-02-21 Google Inc. Title based local search ranking
US7606875B2 (en) * 2006-03-28 2009-10-20 Microsoft Corporation Detecting serving area of a web resource
KR100842080B1 (ko) * 2006-05-03 2008-06-30 중앙대학교 산학협력단 문서의 그룹별 분류방법
US8874592B2 (en) 2006-06-28 2014-10-28 Microsoft Corporation Search guided by location and context
US9396269B2 (en) 2006-06-28 2016-07-19 Microsoft Technology Licensing, Llc Search engine that identifies and uses social networks in communications, retrieval, and electronic commerce
US9141704B2 (en) * 2006-06-28 2015-09-22 Microsoft Technology Licensing, Llc Data management in social networks
US8666821B2 (en) 2006-08-28 2014-03-04 Microsoft Corporation Selecting advertisements based on serving area and map area
US7650431B2 (en) * 2006-08-28 2010-01-19 Microsoft Corporation Serving locally relevant advertisements
KR100868379B1 (ko) 2006-10-25 2008-11-12 활로 커뮤니케이션즈(주) 전화번호 데이터베이스를 활용한 전화번호 검색순위 및/또는 경제동향지수 제공 방법 및 시스템
US8005822B2 (en) * 2007-01-17 2011-08-23 Google Inc. Location in search queries
US20080189177A1 (en) * 2007-02-02 2008-08-07 Anderton Jared M Systems and methods for providing advertisements
US20080208847A1 (en) * 2007-02-26 2008-08-28 Fabian Moerchen Relevance ranking for document retrieval
US20090037403A1 (en) * 2007-07-31 2009-02-05 Microsoft Corporation Generalized location identification
US8825683B2 (en) * 2007-11-26 2014-09-02 Urban Mapping, Inc. Generating geographical keywords for geotargeting search engine-offered advertisements
KR100932843B1 (ko) * 2008-01-29 2009-12-21 엔에이치엔(주) 검색결과간의 연관도에 기초하여 클러스터링된 검색결과를제공하는 방법 및 시스템 그리고 검색결과를클러스터링하는 방법 및 시스템
US8051083B2 (en) * 2008-04-16 2011-11-01 Microsoft Corporation Forum web page clustering based on repetitive regions
US9092454B2 (en) * 2008-04-22 2015-07-28 Microsoft Technology Licensing, Llc Discovering co-located queries in geographic search logs
US8670617B2 (en) * 2008-05-14 2014-03-11 Terrago Technologies, Inc. Systems and methods for linking content to individual image features
US8423536B2 (en) 2008-08-05 2013-04-16 Yellowpages.Com Llc Systems and methods to sort information related to entities having different locations
US8631007B1 (en) 2008-12-09 2014-01-14 Google Inc. Disambiguating keywords and other query terms used to select sponsored content
US20110078101A1 (en) * 2009-09-25 2011-03-31 International Business Machines Corporation Recommending one or more existing notes related to a current analytic activity of a user
US20110078160A1 (en) * 2009-09-25 2011-03-31 International Business Machines Corporation Recommending one or more concepts related to a current analytic activity of a user
US8635228B2 (en) * 2009-11-16 2014-01-21 Terrago Technologies, Inc. Dynamically linking relevant documents to regions of interest
JP2011138197A (ja) * 2009-12-25 2011-07-14 Sony Corp 情報処理装置、関連度評価方法及びプログラム
US8756231B2 (en) * 2010-01-28 2014-06-17 International Business Machines Corporation Search using proximity for clustering information
US8600875B2 (en) 2010-04-12 2013-12-03 Visa International Service Association Authentication process using search technology
US8463772B1 (en) 2010-05-13 2013-06-11 Google Inc. Varied-importance proximity values
US10037357B1 (en) * 2010-08-17 2018-07-31 Google Llc Selecting between global and location-specific search results
US9158790B2 (en) 2010-12-07 2015-10-13 Rakuten, Inc. Server, dictionary creation method, dictionary creation program, and computer-readable recording medium recording the program
JP4828653B1 (ja) * 2010-12-07 2011-11-30 楽天株式会社 サーバ、辞書生成方法、辞書生成プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
US8666973B2 (en) * 2011-02-23 2014-03-04 Novell, Inc. Structured relevance—a mechanism to reveal how data is related
US9201964B2 (en) * 2012-01-23 2015-12-01 Microsoft Technology Licensing, Llc Identifying related entities
US9110959B2 (en) * 2012-05-03 2015-08-18 Salesforce.Com, Inc. System and method for geo-location data type searching in an on demand environment
CN103425659B (zh) * 2012-05-15 2017-06-09 阿里巴巴集团控股有限公司 基于地理位置的信息搜索方法及服务器
US8855281B2 (en) 2012-06-08 2014-10-07 International Business Machines Corporation Systems for retrieving content in a unified communications environment
US9418156B2 (en) * 2012-08-10 2016-08-16 Google Inc. Providing local data with search results
US9298358B1 (en) * 2012-08-21 2016-03-29 Google Inc. Scrollable notifications
US9462015B2 (en) * 2012-10-31 2016-10-04 Virtualbeam, Inc. Distributed association engine
US9047368B1 (en) * 2013-02-19 2015-06-02 Symantec Corporation Self-organizing user-centric document vault
US9483522B2 (en) * 2013-03-07 2016-11-01 Ricoh Company, Ltd. Form aggregation based on marks in graphic form fields
US10599738B1 (en) 2013-04-09 2020-03-24 Google Llc Real-time generation of an improved graphical user interface for overlapping electronic content
US11222084B2 (en) 2013-10-22 2022-01-11 Steven Michael VITTORIO Content search and results
US11238114B2 (en) 2013-10-22 2022-02-01 Steven Michael VITTORIO Educational content search and results
US9858291B1 (en) 2013-10-30 2018-01-02 Google Inc. Detection of related local entities
US10025830B1 (en) 2013-10-30 2018-07-17 Google Llc Aggregation of disparate entity lists for local entities
US9515984B1 (en) 2013-11-19 2016-12-06 El Toro.Com, Llc Determining and utilizing one or more attributes of IP addresses
US10348842B1 (en) 2013-11-19 2019-07-09 El Toro.Com, Llc Generating content based on a captured IP address associated with a visit to an electronic resource
US10505893B1 (en) * 2013-11-19 2019-12-10 El Toro.Com, Llc Generating content based on search instances
US10333890B1 (en) 2013-11-19 2019-06-25 El Toro.Com, Llc Determining IP addresses that are associated with physical locations with new occupants and providing advertisements tailored to new movers to one or more of those IP addresses
US11586680B2 (en) * 2014-03-31 2023-02-21 International Business Machines Corporation Fast and accurate geomapping
US11250008B2 (en) * 2015-04-17 2022-02-15 Steven Michael VITTORIO Content search and results
US20160321346A1 (en) * 2015-05-01 2016-11-03 Kevin A. Li Clustering Search Results
KR101688829B1 (ko) * 2015-07-24 2016-12-22 삼성에스디에스 주식회사 사용자 패턴을 반영한 문서 제공 방법 및 그 장치
WO2017034518A1 (en) * 2015-08-21 2017-03-02 Hewlett-Packard Development Company, L.P. Identifying documents
US20170099342A1 (en) * 2015-10-04 2017-04-06 Anthony Ko-Ping Chien Dynamically Served Content
CN107305577B (zh) * 2016-04-25 2020-12-22 北京京东尚科信息技术有限公司 基于K-means的妥投地址数据处理方法和系统
US10747800B2 (en) * 2017-06-29 2020-08-18 Microsoft Technology Licensing, Llc Clustering search results in an enterprise search system
US10932118B1 (en) 2018-05-25 2021-02-23 El Toro.Com, Llc Systems, methods, and apparatuses for providing content according to geolocation
KR102185703B1 (ko) * 2019-04-05 2020-12-02 연세대학교 산학협력단 공간 지식 베이스 기반의 집단 키워드 질의 처리 방법 및 장치
US11803603B2 (en) * 2019-06-03 2023-10-31 Overwatch Systems, Ltd. Integrating platform for managing GIS data and images
US11934416B2 (en) * 2021-04-13 2024-03-19 UiPath, Inc. Task and process mining by robotic process automations across a computing environment

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020078035A1 (en) * 2000-02-22 2002-06-20 Frank John R. Spatially coding and displaying information

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US87505A (en) * 1869-03-02 Improved cotton-press
US11270A (en) * 1854-07-11 Improvement in the construction of inkstands
US78035A (en) * 1868-05-19 H a e v b t w e b st e e
US5875446A (en) 1997-02-24 1999-02-23 International Business Machines Corporation System and method for hierarchically grouping and ranking a set of objects in a query context based on one or more relationships
US6101496A (en) * 1998-06-08 2000-08-08 Mapinfo Corporation Ordered information geocoding method and apparatus
US6701307B2 (en) 1998-10-28 2004-03-02 Microsoft Corporation Method and apparatus of expanding web searching capabilities
GB2356948A (en) 1999-11-30 2001-06-06 Saeed Mohamed Moghul Search system
AUPQ599700A0 (en) 2000-03-03 2000-03-23 Super Internet Site System Pty Ltd On-line geographical directory
US20010044837A1 (en) 2000-03-30 2001-11-22 Iqbal Talib Methods and systems for searching an information directory
JP2004513413A (ja) * 2000-06-30 2004-04-30 トロイ シュルツ リアルタイムの広告を使用するgisベースの検索エンジンのための方法および装置
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
US20020042789A1 (en) * 2000-10-04 2002-04-11 Zbigniew Michalewicz Internet search engine with interactive search criteria construction
KR20020046494A (ko) 2000-12-14 2002-06-21 박은수 지역단위 검색 시스템을 이용한 상거래 방법
US6868396B2 (en) 2000-12-29 2005-03-15 Nortel Networks Limited Method and apparatus for monitoring internet based sales transactions by local vendors

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020078035A1 (en) * 2000-02-22 2002-06-20 Frank John R. Spatially coding and displaying information

Also Published As

Publication number Publication date
NO20061794L (no) 2006-04-24
WO2005031614A1 (en) 2005-04-07
EP1665101A1 (en) 2006-06-07
KR100814667B1 (ko) 2008-03-18
US8346770B2 (en) 2013-01-01
KR20060095979A (ko) 2006-09-05
US20050065959A1 (en) 2005-03-24

Similar Documents

Publication Publication Date Title
NO337806B1 (no) Systemer og fremgangsmåter for gruppering av søkeresultater
US8108383B2 (en) Enhanced search results
US9189496B2 (en) Indexing documents according to geographical relevance
US8046371B2 (en) Scoring local search results based on location prominence
US7483881B2 (en) Determining unambiguous geographic references
US7523099B1 (en) Category suggestions relating to a search
US8972371B2 (en) Search engine and indexing technique
JP5572596B2 (ja) 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ
US20090222440A1 (en) Search engine for carrying out a location-dependent search
US10474685B1 (en) Mobile to non-mobile document correlation
US8595225B1 (en) Systems and methods for correlating document topicality and popularity
GB2460045A (en) Analysing multiple data sources for a user request using business and geographical data, with selected rule sets to filter the data on the databases.

Legal Events

Date Code Title Description
MM1K Lapsed by not paying the annual fees