BR112015023786B1 - Método e sistema que recuperam as entidades associadas a uma localização geográfica, e, suporte de armazenamento - Google Patents

Método e sistema que recuperam as entidades associadas a uma localização geográfica, e, suporte de armazenamento Download PDF

Info

Publication number
BR112015023786B1
BR112015023786B1 BR112015023786-0A BR112015023786A BR112015023786B1 BR 112015023786 B1 BR112015023786 B1 BR 112015023786B1 BR 112015023786 A BR112015023786 A BR 112015023786A BR 112015023786 B1 BR112015023786 B1 BR 112015023786B1
Authority
BR
Brazil
Prior art keywords
address
data
query
location
geographic
Prior art date
Application number
BR112015023786-0A
Other languages
English (en)
Other versions
BR112015023786A2 (pt
Inventor
Anthony J. Scriffignano
Michael Klein
Warwick Matthews
Original Assignee
The Dun & Bradstreet Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by The Dun & Bradstreet Corporation filed Critical The Dun & Bradstreet Corporation
Publication of BR112015023786A2 publication Critical patent/BR112015023786A2/pt
Publication of BR112015023786B1 publication Critical patent/BR112015023786B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Generation (AREA)
  • Navigation (AREA)

Abstract

DESAMBIGUAÇÃO NÃO-DETERMINÍSTICA E CASAMENTO DE DADOS LOCAIS EMPRESARIAIS. É fornecido um método que inclui (a) receber dados que descrevem uma localização, (b) extrapolar, a partir dos dados, um endereço associado com a localização, (c) identificar um segmento de uma via que inclui o endereço, (d) definir um polígono que possui um perímetro que engloba uma região geográfica que está em uma vizinhança do segmento, (e) obter coordenadas geográficas de um ponto dentro do polígono, (f) identificar um endereço nas coordenadas geográficas, e (g) identificar uma entidade que está associada com o endereço nas coordenadas geográficas. Também é fornecido um sistema que executa o método, e um dispositivo de armazenamento que contém instruções que controlam um processador para executar o método.

Description

REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS
[0001] O presente pedido reivindica a prioridade do Pedido de Patente Provisório U.S. No. 61/792.762, depositado em 15 de março de 2013, cujo conteúdo é incorporado aqui por referência.
CAMPO DA INVENÇÃO
[0002] A presente invenção refere-se a uma criação de novas modalidades de identificação de empresas baseadas em endereço, também chamadas de capacidades, para definir as associações de empresas a uma localização física, usando métodos que estão além das capacidades padrão relacionadas a endereço. Neste caso, o termo “modalidade” refere-se ao modo pelo qual os endereços que são definidos de forma diferente, por exemplo, o número e nome da rua, coordenadas de latitude/laterais, ou o nome do edifício, podem ser associados ao mesmo local ou localização física. Essa capacidade poderia ser usada em resposta a uma consulta, iniciada por um usuário final, um sistema, um aplicativo, ou qualquer outro método, que se destine a identificar as entidades empresariais usando informação de endereço que compreende um ou mais campos de dados, por exemplo, nome da rua e número, como um atributa de consulta. Essa capacidade pode ser executada usando diferentes abordagens não determinísticas, incluindo, por exemplo, faixa, nome, e desambiguação geoespacial baseada em polígono. Neste contexto, o termo “não- determinístico” significa o modo pelo qual os endereços serão definidos em uma consulta, incluindo o uso de múltiplas formas de se usar diferentes componentes de dados chamados de indícios alternativos flexíveis, e a abordagem pela qual eles serão associados aos locais físicos, não é predeterminada e limitada. O resultado do processamento tal como tal consulta inclui o retorno que reflete a qualidade inferida, modalidade de casamento, e outros atributos para determinar uma conexão de empresas ao endereço da consulta e a localização física associada.
[0003] Um exemplo dessa capacidade seria permitir uma associação de uma empresa a um local que é diferente da localização física e endereço da empresa, por exemplo, (a) um negócio em um shopping center, que pode ser visto como uma localização física horizontal, (b) uma empresa em um edifício de escritórios de múltiplos andares, que pode ser visto como uma localização física vertical, ou (c) uma empresa que está associada a uma área baseada em perímetro, por exemplo, um lote fiscal específico.
FUNDAMENTOS DA INVENÇÃO
[0004] As abordagens descritas nesta seção são abordagens que poderiam ser seguidas, mas não necessariamente abordagens que foram concebidas ou seguidas previamente. Portanto, a menos que indicado de outra forma, essas abordagens podem não ser da técnica anterior relacionada às reivindicações neste pedido e não são permitidas à técnica anterior através da inclusão nesta seção.
[0005] O acesso eficiente ao banco de dados e as capacidades de busca são importantes para o uso eficaz de dados que são mantidos em bancos de dados referenciais. Crucial para esse objetivo é a capacidade de permitir uma recuperação eficiente de um resultado de casamento, ou seja, um resultado do casamento de dados de referência a uma consulta que inclui indícios de local, para identificar e selecionar os resultados de casamento de uma forma eficiente e eficaz, e para fornecer um retorno que pode ser usado para tomar decisões com relação ao uso dos resultados do casamento.
[0006] Com o intuito de identificar uma entidade empresarial em uma localização geográfica, a tecnologia existente considera um número específico e finito de campos de dados, por exemplo, um “endereço da rua” físico registrado, publicado ou de outra forma associado da entidade empresarial. A tecnologia existente é geralmente baseada em pressupostos que a) os endereços da entidade empresarial, ou seja, informação de localização, serão representados consistentemente, e b) que as metodologias de recuperação para uma representação particular de uma localização, tal como um único endereço de rua para um edifício com múltiplos andares, serão limitadas necessariamente à recuperação desses candidatos que compartilham a representação mencionada acima da localização geográfica. Como um exemplo, essa tecnologia existente é geralmente baseada em comparações heurísticas “número rua + nome da rua + cidade”, que produzem opiniões de precisão com base em (a) similaridade de caracteres entre uma consulta e um candidato, (b) número de caracteres casados ou outra informação correlativa básica após considerar variações ortográficas predefinidas, tal como múltiplas formas de soletrar uma palavra específica incluindo o uso de hifenização, capitalização, separação de sílabas, pontuação, abreviações conhecidas, e sinônimos, ou (c) outras abordagens usadas para comparar os componentes de dados. Como um resultado, essa tecnologia existente pode não resultar em um resultado satisfatório, quando uma localização pode ser descrita de diferentes formas, por exemplo, quando uma localização pode ter múltiplos endereços.
[0007] Como outro exemplo, a tecnologia existente pode usar latitude e longitude para associar diferentes endereços à mesma localização física. Isso pode não resultar em um resultado satisfatório, quando uma localização é espalhada sobre uma ampla área geográfica, por exemplo, um centro comercial ou shopping center, e o uso de latitude/longitude como um identificador pode associar as entidades incorretas que não estão associadas ao shopping, mas estão na mesma área geográfica. SUMÁRIO DA INVENÇÃO
[0008] Existe uma necessidade de melhorar os sistemas e métodos de casamento e busca existentes, incluindo (1) o processo pelo qual uma consulta é tratada de modo a compilar e sintetizar os indícios de consulta para maximizar a oportunidade de identificar candidatos satisfatórios, (2) o processo pelo qual os dados de referência mantidos em um banco de dados ou uma série de bancos de dados são acessados, avaliados e usados para identificar os casamentos candidatos para a consulta, (3) o processo pelo qual os candidatos são avaliados, selecionados, e priorizados, e (4) o processo pelo qual um resultado do casamento e os dados com relação à experiência de casamento são fornecidos a um consultor ou um sistema de consulta, incluindo indicadores de confiança que descrevem uma força relativa do casamento para a consulta, e atributos para indicar um retorno sobre os dados usados para propagar o casamento.
[0009] Para satisfazer essas necessidades, é fornecido um método que inclui (a) receber dados que descrevem uma localização, (b) extrapolar, a partir dos ditos dados, um endereço associado com a localização; (c) identificar um segmento de uma via que inclui o dito endereço; (d) definir um polígono que possui um perímetro que engloba uma região geográfica que está em uma vizinhança do dito segmento; (e) obter coordenadas geográficas de um ponto no interior do dito polígono; (f) identificar um endereço nas coordenadas geográficas; e (g) identificar uma entidade que está associada com o dito endereço nas coordenadas geográficas. Também é fornecido um sistema que executa o método, e um dispositivo de armazenamento que contém instruções para controlar um processador para executar o método.
[0010] A presente descrição é um afastamento da técnica anterior em que o objetivo do processo descrito aqui é identificar aquelas entidades empresariais que têm como um atributo a localização de consulta, tal identificação será baseada em valores tais como faixa, nome e desambiguação geoespacial baseada em polígono e indícios alternativos e flexíveis onde os dados de consulta de entrada são a descrição de uma entidade de endereço suposta (“localização”) na qual uma ou mais entidades empresariais estão localizadas.
[0011] O presente documento descreve um sistema e método automatizados para diferenciar dentre os casamentos de máquinas, ou seja, casando dados de referência a uma consulta, sem intervenção humana, permitindo assim a consistência e escalabilidade, e permitindo que os seres humanos se concentrem em situações onde a percepção ou busca adicional é necessária para efetuar a administração de dados apropriada. O termo “escalabilidade” significa que essa abordagem não é limitada por uma tecnologia específica à solução técnica.
[0012] As técnicas descritas aqui incluem capacidades que não são abordadas pela técnica anterior. Especificamente, as técnicas aqui descritas fornecem flexibilidade no acesso, retenção e uso de valor alto, elementos de dados preditivos ou outros indícios derivados associados a uma localização geográfica, e que foram validados e agregados previamente em bancos de dados de localizações e características específicas da localização, indícios ou símbolos, a serem usados por todo o processo de casamento. As técnicas descritas aqui permitem que essa flexibilidade seja determinada quando os elementos de dados são colocados disponíveis para o banco de dados com relação ao valor relativo desses dados, e como esses dados serão usados durante a experiência de casamento em identificar casamentos e atributos associados que podem ser usados pelo usuário final para tomar decisões com relação ao uso desses dados e indícios derivados.
BREVE DESCRIÇÃO DOS DESENHOS
[0013] As Figuras 1A e 1B, em conjunto, são um fluxograma de um método que recupera as entidades associadas a uma localização geográfica.
[0014] A Figura 2 é um diagrama de blocos de um sistema que emprega os métodos descritos aqui.
DESCRIÇÃO DETALHADA DA INVENÇÃO
[0015] Nos seguintes vários parágrafos, há definições de vários termos que são usados aqui.
[0016] O local é uma localização física, que pode incluir múltiplos endereços descritos de diferentes formas, e que pode incluir endereços associados a uma entidade tal como uma empresa ou residência, endereços nos quais não há nenhum edifício físico ou empresa operacional, ou combinações de localizações físicas.
[0017] A faixa é uma forma de associar os endereços com base na distância geográfica entre os endereços físicos, tal como “123-131 Main Street”.
[0018] Nome é uma forma de identificar uma localização de empresa, além do endereço padrão, tal como pelo nome do edifício, por exemplo, “1 New York Plaza” ou “The Mall at Short Hills”.
[0019] A desambiguação geoespacial baseada em polígono é uma forma de determinar a proximidade geográfica entre múltiplos endereços usando fórmulas matemáticas e algoritmos. Esse é o conceito subjacente por trás de sistemas de informação geográfica (GIS), tal como um sistema de posicionamento global (GPS).
[0020] A área baseada em perímetro, que também pode ser chamada de uma segmentação, é uma abordagem para associar os diferentes endereços a um identificador de localização comum, por exemplo, um complexo habitacional ou um campo empresarial com múltiplas empresas, edifícios, lotes fiscais, áreas abertas, ou outras unidades similares.
[0021] Uma modalidade de identificação é uma forma de determinar um grau de similaridade entre dois valores diferentes, tais como entre um endereço de consulta com base no número e nome da rua, e um endereço que tem uma latitude e longitude específicas. Isso inclui tanto os próprios valores de dados, bem como os metadados relativos àqueles valores. Um exemplo de metadados, que são dados descritivos sobre dados, neste caso, indicaria que um nome e número de consulta é um endereço da rua.
[0022] A modalidade de casamento refere-se a diferentes processos que podem ser executados para usar os dados a partir de uma consulta para identificar os dados a partir de um banco de dados ou outra fonte, usando processos que são familiares àqueles versados na técnica; isso pode incluir “casar”, “buscar”, “consultar”, ou outros processos que associam uma consulta a um banco de dados ou outra fonte.
[0023] Indício é um termo geral que se refere aos dados. Indícios alternativos são dados diferentes que podem ser usados para identificar uma característica, por exemplo, “província” que pode ser usado como um valor alternativo para “estado”. Os indícios derivados são informações que podem ser calculadas ou inferidas a partir de outros dados, por exemplo, latitude e longitude que podem ser derivadas do endereço da rua, cidade, e estado.
[0024] Flexível significa que o tipo de os indícios que são usados para identificar as características de uma entidade ou de uma consulta por entidades podem ser diferentes para diferentes consultas ou entidades.
[0025] O retorno (feedback) é a informação sobre os resultados de uma experiência de casamento, tais como a qualidade inferida e o resultado dessa experiência. Esse retorno pode ser usado para permitir que um usuário final tome decisões com relação ao consumo dos resultados da experiência.
[0026] Os bancos de dados referenciais são repositórios de dados que cumpriram os critérios baseados em qualidade em relação aos dados, por exemplo, integridade de dados, integridade, precisão e pontualidade. O termo “banco de dados de referência” pode se referir a um ou mais tais repositórios.
[0027] Estratégia é uma abordagem para aceitar uma consulta, usando dados de consulta para identificar candidatos a partir de um banco de dados de referência, e fornecer os candidatos a partir desse banco de dados de referência que podem ser aceitáveis para um usuário final.
[0028] O conceito de “empresa”, como usado aqui, é um exemplo de um tipo de entidade em uma localização. No entanto, a presente descrição não está limitada aos tipos de entidades que possam ser de interesse do usuário final; outros exemplos incluem habitações residenciais, lotes fiscais, e áreas abertas sem qualquer desenvolvimento.
[0029] O sistema descrito aqui (a) recebe uma consulta para iniciar uma busca por uma entidade associada a uma localização geográfica particular, (b) usar a consulta para determinar uma estratégia para executar a busca, (c) identificar as entidades candidatas associadas à localização geográfica, e (d) identificar as entidades e enviar informação relacionada ao processo, incluindo o grau e a qualidade dos candidatos que se referem à consulta.
[0030] Os exemplos descritos aqui assumem uma consulta que inclui tanto os dados do nome quanto os dados de endereço da entidade. Este é um exemplo. Esta capacidade pode ser usada para processar uma consulta que inclui somente um endereço, de modo a identificar outros endereços associados ao endereço da consulta, ou entidades nos endereços de consulta e em outros endereços que estão associados ao endereço de consulta. Assim, uma consulta pode incluir um nome e endereço para encontrar um negócio específico, ou somente um endereço para encontrar múltiplas empresas nesse endereço.
[0031] As Figuras 1A e 1B, em conjunto, são um fluxograma de um método 100 que recupera as entidades associadas a uma localização geográfica. A Figura 1A é conectada à Figura 1B por um conector chamado de “1A”.
[0032] Em resumo, o método 100 recebe uma consulta 110 a partir de um usuário 101, e executa os processos 120, 130 e 140 para extrair, gerar, reconhecer e qualificar as localizações e entidades relacionadas que são então enviadas para recuperação de candidato usando os processos 150, 160, 170 e 180. Este conjunto de processos pode recuperar múltiplos registros de casamento, que serão então de-duplicados e refinados no processo 181, e em seguida, classificados de forma qualitativa, tanto objetivamente quanto entre eles, nos processos 193 e 194. Uma saída, ou seja, um resultado 196, é gerada e retornada para o usuário 101 no processo 195.
[0033] O processo 100 usa regras de processamento 135, uma tabela de atributos de entidade de dados geográficos 137, regras de extrusão 145, um banco de dados de referência de segmento 155, um banco de dados de referência de coordenadas geográficas 165, um banco de dados de referência de entidade empresarial 185, uma lista de candidatos 189, regras de escore 190, regras de classificação 191 e regras de decisão 192.
[0034] A tabela de atributos entidade de dados geográficos 137 é uma tabela de atributos reconhecidos, ou seja, campos de dados que poderiam ser associados aos dados que podem identificar uma localização geográfica.
[0035] As regras de extrusão 145 incluem uma lógica que é usada para definir os endereços viáveis específicos com base em um valor de entrada, por exemplo, nos Estados Unidos, os endereços de um lado de uma rua são todos números ímpares ou pares.
[0036] O banco de dados de referência de segmento 155 inclui informação relacionada a uma localização específica, por exemplo, para identificar uma seção contígua de estrada ou outra via entre pontos significativos tais como ruas que se cruzam.
[0037] O banco de dados de referência de coordenadas geográficas 165 inclui a informação geoespacial expressa como coordenadas geográficas, por exemplo, latitude e longitude, para endereços específicos.
[0038] O banco de dados de referência da entidade empresarial 185 é uma lista de entidades empresariais que são associadas aos endereços específicos.
[0039] A lista de candidatos 189 inclui uma lista de empresas a partir do banco de dados de referência da entidade empresarial 185 que estão localizadas fisicamente nos endereços e localizações que são identificados a partir do banco de dados de referência de coordenadas geográficas 165.
[0040] As regras de escore 190 incluem regras que são usadas para atribuir um escore qualitativo para cada item na lista de candidatos 189 com base em sua similaridade à consulta 110.
[0041] As regras de classificação 191 incluem regras que determinam como os itens na lista de candidatos 189 são classificados com base em escores que são derivados usando regras de escore 190.
[0042] As regras de decisão 192 incluem regras que determinam quais itens da lista de candidatos 189 deveriam ser apresentados ao usuário com base nas classificações derivadas das regras de classificação 191.
[0043] A consulta 110 é uma solicitação que inicia uma busca por informação sobre uma localização específica. A busca será baseada em indícios que estão incluídos na consulta 110. A consulta 110 inclui uma pluralidade de elementos de dados que, por sua vez, incluem informação específica relativa à localização em termos de campos de dados que são todos, ou um subconjunto de, campos de dados que podem ter sido solicitados a partir do usuário final por um sistema ou aplicativo que faz interface com o processo 100, e também poderia incluir potencialmente indícios virtualmente ilimitados e adicionais sobre a localização. A consulta 110 pode ser fornecida ao método 100 pelo usuário 101, ou seja, um usuário humano ou um processo automatizado, por exemplo, derivado de arquivos enviados usando as capacidades de máquina em lote, ou a partir de uma consulta individual processada usando telas de entrada de dados em linha direta. A consulta 110 inclui indícios de consulta que podem ser constituídos por um ou mais elementos de dados, por exemplo, indícios de consulta podem ser expressos como um campo concatenado de número de rua, nome de rua e cidade, ou campos de dados separados de (1) número da rua, (2) nome da rua, e (3) da cidade.
[0044] Como um exemplo, a consulta 110 pode incluir campos de dados separados com a informação na Tabela 1.
Figure img0001
[0045] O método 100 começa com o processo 120.
[0046] O processo 120 recebe a consulta 110, que inclui dados, ou seja, os indícios de consulta, que descrevem uma localização. O processo 120 estrutura e interpreta os indícios de consulta em um formato comum, ou seja, em dados 122.
[0047] Como um exemplo, os dados 122 podem incluir a informação na Tabela 2.
Figure img0002
[0048] A partir do processo 120, o método 100 avança para o processo 130.
[0049] O processo 130 analisa os dados 122 para identificar os campos de dados específicos que estão associados aos atributos na tabela de atributos da entidade de dados geográficos 137, de modo a melhorar a oportunidade de identificar casamentos a partir do banco de dados de referência de entidade empresarial 185 usando esses campos de dados individualmente ou em pluralidades. Como um exemplo, esse pode separar o número da rua (121-131) do nome da rua (Main Street). Nesse aspecto, o processo 130 extrai, a partir dos dados 122, os atributos que são relevantes para uma busca por candidatos que são similares à consulta, produzindo assim valores para os atributos 132.
[0050] Como mencionado acima, a tabela de atributos da entidade de dados geográficos 137 é uma tabela de atributos reconhecíveis, isto é, campos de dados, que poderiam estar associados aos dados que podem identificar uma localização geográfica. A tabela de atributos da entidade de dados geográficos 137 inclui dados para atribuir uma ponderação preditiva (K) a cada atributo (x) para suportar um cálculo de K(x), onde K(x) é a ponderação preditiva de elemento x, bem como outra informação relacionada a cada atributo.
[0051] Como um exemplo, a tabela de atributos da entidade de dados geográficos 137 pode incluir a informação na Tabela 3.
Figure img0003
[0052] Como um exemplo, os atributos 132 podem incluir a informação na Tabela 4.
Figure img0004
[0053] O processo 130 usa regras de processamento 135 para analisar os atributos 132, que podem também fornecer a entrada para formular novas regras de metadados e de negócios que posteriormente serão armazenados nas regras de processamento 135, onde uma futura execução do processo 130 poderia usar as novas regras de processamento.
[0054] Por exemplo, uma regra de metadados pode indicar que para um endereço nos Estados Unidos, um campo de 2 caracteres que está em letras maiúsculas é uma abreviatura do estado, ou que um campo alfabético que segue um número é um nome de rua.
[0055] As regras de processamento 135 incluem regras de metadados e entidade relacionadas a endereço repetíveis e automatizadas com base em processos de normalização e padronização que incluem lógica de desambiguação semântica e numérica para interpretar os indícios de consulta para cada componente de um endereço. Um exemplo de regras de processamento 135 para padronização e normalização pode incluir a informação na Tabela 5.
Figure img0005
[0056] Um exemplo de uma nova regra para regras de processamento 135 pode incluir a informação na Tabela 6.
Figure img0006
[0057] As regras de processamento 135 também podem incluir informação para limpar, analisar e padronizar todos os componentes de atributos 132.
[0058] A limpeza envolve a remoção de valores estranhos a partir dos dados 122, tais como pontuação e outras formas de caracteres não valiosos, por exemplo, pontuação em abreviação de ruas ou vírgulas e preenchimentos de linhas ou retornos de carro usados como delimitadores.
[0059] Um exemplo de uma regra de limpeza para as regras de processamento 135 pode incluir a informação na Tabela 7.
Figure img0007
[0060] A análise inclui dados de particionamento 122 para aumentar a oportunidade de identificar o casamento e/ou entidades relacionadas ao endereço associadas à consulta 110. Isso pode incluir analisar os indícios de consulta em elementos de dados separados, por exemplo, dividindo um endereço em seus elementos constituintes significativos.
[0061] Um exemplo de uma regra de análise para regras de processamento 135 pode incluir a informação na Tabela 8, que está mostrando como um valor concatenado de um código postal e de estado é dividido em dois valores separados.
Figure img0008
[0062] A padronização inclui associar valores alternativos aos dados 122, de modo a aumentar a oportunidade de identificar casamentos.
[0063] Um exemplo de uma regra de padronização para regras de processamento 135 pode incluir a informação na Tabela 9.
Figure img0009
[0064] O método 100 avança do processo 130 para o processo 140.
[0065] O processo 140 usa regras de extrusão 145 para processar os atributos 132, como combinações, coleções e/ou elementos individuais, para derivar múltiplas entidades potenciais relativas a endereços a partir dos atributos de consulta originais 132, obtendo assim os valores extrudados 142. Assim, o processo 140 extrapola, a partir de atributos 132, um ou mais endereços associados à localização apresentada na consulta 110. Extrapolar significa formar uma opinião ou fazer uma estimativa sobre algo a partir de fatos conhecidos. O termo “extrapolar” e o termo “extrudar” são usados aqui de forma intercambiada. Um exemplo de um endereço extrapolado é a geração de “123 Main Street” a partir de “121-131 Main Street”. Neste exemplo, a extrapolação é mais do que a extração de dados a partir da consulta 110 e, por exemplo, também pode incluir ainda a extrapolação de “140 Main Street”, resultante da análise pelo processo 140 de atributos 132, mesmo que “140 Main Street” não seja sem enumerado explicitamente na consulta 110 (um exemplo de enumeração explícita é “131 Main Street”), nem inerentemente implícito por ele (um exemplo de implicação inerente é “123 Main Street”).
[0066] O processo 140 usa, por exemplo, um cálculo baseado em algoritmo heurístico dos endereços inerentes em um endereço de rua que é expresso como uma faixa, e que fornece a orientação para a qual os endereços seriam válidos para o caso, por exemplo, somente números ímpares no mesmo lado de certas ruas. Por exemplo, visto que se sabe que nos Estados Unidos os endereços de um lado da rua são todos pares ou ímpares, e que dois números separados por um traço indicam um ponto de início e de fim, o cálculo baseado em algoritmo heurístico determina que há potencialmente outros endereços que estão entre o endereço de início e de fim, e que aqueles endereços são ou todos pares ou todos ímpares, com base em se os endereços de início e de fim são pares ou ímpares. Os valores extrudados 142 são indícios de consulta adicionais que podem ser usados no processo 170 para identificar candidatos a partir do banco de dados de referência de entidade empresarial 185.
[0067] Um exemplo de uma regra de extrusão para as regras de extrusão 145 pode incluir a informação na Tabela 10.
Figure img0010
[0068] O método 100 avança do processo 140 para o processo 150.
[0069] O processo 150 recebe os valores extrudados 142, e identifica um segmento de uma via que inclui o endereço. Ou seja, o processo 150 tendo referência ao banco de dados de referência de segmento 155, calcula um segmento de endereço (isto é, uma seção contígua de estrada ou outra via entre pontos de passagem significativos, tais como cruzamentos, que frequentemente serão o terminador de outros segmentos) associado a cada um dos endereços contidos nos valores extrudados 142, e em seguida, recupera a partir do banco de dados de referência de segmento 155 o endereço ou os endereços associados a cada um desses segmentos, e os emite como dados de endereço 152, que agora incluem tanto os dados de endereço de rua quanto os dados de localização geoespacial, tais como longitude e latitude (esses dados geoespaciais também são chamados de “códigos geográficos” ou “dados geocodificados”). O banco de dados de referência de segmento 155 inclui dados que associam os endereços por área geográfica, também chamados de “perímetros” e os dados com base no perímetro de coleção são conhecidos como “dados de referência de perímetro”. Nesse aspecto, o processo 150 define um polígono que tem um perímetro que engloba uma região geográfica que está em uma vizinhança do segmento.
[0070] Um exemplo dos dados de referência de segmento dentro do banco de dados de referência de segmento 155 pode incluir a informação na Tabela 11.
Figure img0011
[0071] A Tabela 11 mostra um exemplo de endereços existentes ao longo de segmentos particulares (mostrados na primeira coluna) como uma coleção de atributos incluindo as faixas de números de rua (colunas 4 e 6), nomes de ruas (coluna 3) e de coordenadas cartesianas dos terminadores de segmento (mostradas em formato codificado nas colunas 5 e 7).
[0072] Um exemplo de dados de referência de perímetro dentro do banco de dados de referência de segmento 155 pode incluir a informação na Tabela 12.
Figure img0012
[0073] A Tabela 12 mostra um exemplo de uma representação de dados de referência de perímetro, com um único identificador para cada perímetro (coluna 1), uma descrição do tipo de perímetro (coluna 2) e uma versão codificada das coordenadas cartesianas do perímetro (coluna 3).
[0074] Considera-se novamente algumas das operações executadas pelos processos 140 e 150, de modo a definir o polígono. O processo 140, durante o processo de extrapolação, obtém um primeiro atributo associado ao endereço (por exemplo, 123 Cecil Avenue, que é um endereço em uma extremidade de um segmento). O processo 150, quando identificando o segmento, obtém um segundo atributo associado ao segmento (por exemplo, esses endereços no segmento têm números de andar associados a ele) e, portanto, definem o polígono, definem um tamanho e uma forma do polígono com base no primeiro e no segundo atributo. Um exemplo da definição do polígono seria para o processo 150 usar o primeiro e o segundo atributo para construir um lado do polígono para percorrer o comprimento inteiro do segmento.
[0075] Como mencionado acima, um edifício de escritórios de múltiplos andares pode ser visto como uma localização vertical. Em tal caso, o processo 150, em vez de meramente definir um polígono, definiria ao invés um poliedro com base no primeiro e no segundo atributo, onde o polígono é uma seção transversal do poliedro. Um exemplo da definição de um poliedro seria para o processo 150 usar o primeiro e o segundo atributo para construir o poliedro para ter uma elevação calculada com base no número máximo de andares associados ao segmento.
[0076] O método 100 avança do processo 150 para o processo 160.
[0077] O processo 160 recebe dados de endereço 152, e obtém as coordenadas geográficas de um ponto dentro do polígono, e identifica um endereço nas coordenadas geográficas. Ou seja, o processo 160, tendo referência ao banco de dados de referência das coordenadas geográficas 165, recupera as coordenadas geográficas (por exemplo, latitude e longitude), para cada um dos endereços, e em seguida, recupera, a partir do banco de dados de referência de entidade empresarial 185, o endereço ou os endereços associados a cada uma dessas coordenadas, produzindo assim dados de endereço 162. Dessa forma, o processo 160 identifica outros valores de endereços existentes para o valor extrudado 142.
[0078] Um exemplo dos outros endereços em dados de endereços 162 identificados pelo processo 160 a partir de dados de endereços 152 e do banco de dados de referência de coordenadas geográficas 165 pode incluir a informação na Tabela 13.
Figure img0013
[0079] O método 100 avança do processo 160 para o processo 170.
[0080] O processo 170 recebe, como entrada, dados de endereço 162, e identifica uma entidade que está associada ao endereço nas coordenadas geográficas. Mais especificamente, o processo 170 recebe o conjunto de códigos geográficos (dados pertencentes às localizações geoespaciais, tais como latitude e longitude), que são atributos dos endereços nos dados de endereço 162, e executa a recuperação de empresas associadas com aqueles endereços através do emprego de várias modalidades de processos de casamento a partir do banco de dados de referência de entidade empresarial 185, produzindo assim os dados de endereço 172. O banco de dados de referência de entidade empresarial 185 pode ou não ter uma empresa associada a cada endereço resultante do processo 160.
[0081] A saída do processo 170 é a atribuição de dados de entidade empresarial a dados de endereço 162 para criar os dados de endereço 172.
[0082] Um exemplo de um subconjunto de dados de endereços recuperados a partir do banco de dados de referência de entidade empresarial 185 empregando os endereços resultantes do processo 160 e adicionados aos dados de endereço 172 pode incluir a informação na Tabela 14. “HQ” é uma abreviação para “matrizes”.
Figure img0014
[0083] O método 100 avança do processo 170 para o processo 180.
[0084] O processo 180 recebe os dados de endereço 172, e usando os endereços em dados de endereços 172 como entradas, emprega várias metodologias (tais como consultas baseadas em texto) para distinguir os candidatos (ou seja, entidades similares às entidades associadas aos endereços em dados de endereços 172) no banco de dados de referência de entidade empresarial 185, produzindo assim um conjunto de dados 182.
[0085] A Tabela 15 mostra um exemplo do conjunto de dados 182 produzido pelo processo 180 a partir do banco de dados de referência de entidade empresarial 185.
Figure img0015
[0086] O processo 181 é um processo recursivo que instancia o processo 150 até 180 em uma forma recursiva até que um ou mais de um conjunto definido de critérios são alcançados, por exemplo, uma iteração de recuperação fica abaixo de certos níveis quantitativos e qualitativos. O resultado é a lista de candidatos189.
[0087] A Tabela 16 fornece exemplo de critérios quantitativos e qualitativos que podem ser usados no processo 181.
Figure img0016
[0088] O método 100 avança do processo 180 para o processo 193 mostrado na Figura 1B. A lista de candidatos 189 é representada em ambas as Figuras 1A e 1B.
[0089] O processo 193 recebe a lista de candidatos 189, e usa as regras de escore 190 para produzir uma lista de candidatos qualitativamente diferenciada, produzindo assim uma lista 193A. Exemplos de regras de escore 190 podem incluir regras que discriminam o uso de escores com base, entre outros, (a) na natureza das modalidades de recuperação usadas nos processos 150 a 180, para incluir uma entrada de endereço particular ou entidade empresarial na lista de candidatos 189 (isto é, qual método ou combinações de métodos foram empregados no discernimento dos candidatos individuais na lista de candidatos 189) e (b) na extensão de extrapolação (por exemplo, se um endereço particular foi recuperado pela operação direta de uma modalidade de recuperação durante a consulta 110 ou ao invés de um endereço que foi recuperado em uma iteração anterior do processo recursivo 181) ou abstração (por exemplo, a distância em metros que um endereço recuperado encontra-se a partir de um conjunto nominal de coordenadas associado à consulta 110) usados nas modalidades de recuperação.
[0090] O processo 193 emprega uma abordagem de ponderação relativa com base na tabela de atributos de entidade de dados geográficos 137 e regras de escore 190 para produzir um conjunto de subescores ponderados para cada entrada na lista de candidatos 189, subescores que são usados na lista de candidatos qualitativamente classificados 189. Essa ponderação considera múltiplas características com relação a metadados e valores de dados reais de modo que uma ponderação para um candidato pode considerar critérios tais como a sequência de iteração que produziu o candidato, a modalidade de recuperação ou modalidades usadas no discernimento do candidato (e que pode incluir matrizes que atribuem escores às combinações de modalidades de recuperação, números de iteração, etc.), e outras avaliações qualitativas da similaridade entre cada entrada na lista de candidatos 189 e a consulta de origem 110 (por exemplo, uma medida da distância de edição entre o nome da rua da consulta 110 e a entrada na lista de candidatos 189). Por exemplo, um candidato C1 recuperado usando tanto análise de segmentação (processo 150) quanto recuperação baseada em nome (processos 170 e 180) pode receber o escore 100 para o subescore S1, onde o candidato C2 recuperado usando a recuperação baseada em coordenadas geográficas (processo 160) pode receber somente o escore 90 para o subescore S1.
[0091] A Tabela 17 é um exemplo de subescores ponderados usados pelas regras de escore 190 e o processo 193.
Figure img0017
[0092] Para a tabela anterior, a coluna 1 refere-se a um candidato na lista de candidatos 189 e as colunas restantes representam escores baseados nas interações das modalidades de recuperação no discernimento do candidato (coluna 2), uma avaliação da densidade de edifícios do endereço do candidato (coluna 3), o grau de corroboração do endereço através de múltiplas metodologias de localização geoespacial (coluna 4), e o escore que mostrando o nível de extrapolação ou abstração associado às metodologias de recuperação específicas empregadas para discernir o candidato (coluna 5).
[0093] O conjunto de subescores gerados no processo 193 (e exemplificados na Tabela 17) para cada candidato, por sua vez, será organizado e classificado usando as regras de classificação 191.
[0094] A Tabela 18 é um exemplo do resultado final da execução de regras de classificação 191.
Figure img0018
[0095] O método 100 avança do processo 193 para o processo 194.
[0096] O processo 194 recebe a lista de candidatos classificados, ou seja, a lista 193A, a partir do processo 193, e refina a dita lista 193A removendo aqueles candidatos cuja classificação, escores, subescores ou uma combinação dos mesmos não cumprem os critérios de inclusão e/ou exclusão definidos nas regras de decisão 192, produzindo, assim, uma lista 194A.
[0097] A Tabela 19 é um exemplo de ponderação relativa de fatores de escore usados no processo 194.
Figure img0019
[0098] A Tabela 20 é um exemplo de regras de inclusão/exclusão no processo 194
Figure img0020
[0099] A Tabela 21 é um exemplo dos resultados do processo 194, isto é, a lista 194A.
Figure img0021
[0100] O método 100 avança do processo 194 para o processo 195.
[0101] O processo 195 recebe a lista 194A, ou seja, a lista de candidatos qualificados C1...CT, onde CT é o candidato de menor qualidade considerado aceitável para a inclusão nos resultados a serem retornados pelo método 100.
[0102] A Tabela 22 é um exemplo da lista de candidatos resultante 189, com os candidatos C002 e C003 excluídos porque falharam na execução das regras, embora ambos tenham sido classificados em um nível que alcança os critérios de aceitação qualitativos:
Figure img0022
[0103] O processo 195 reúne e retorna o resultado 196, que inclui uma lista de candidatos 197 e o retorno 198. O retorno 198 é a informação com relação a um grau de similaridade entre a consulta 110 e cada candidato dentro da lista de candidatos 197.
[0104] O retorno 198 é incluído no resultado 196 para indicar a qualidade de cada candidato dentro de lista de candidatos 197, por exemplo, um nível de confiança onde o melhor candidato Cn é uma entidade empresarial localizada na localização(ões) de endereços atribuída(s) à consulta 110. O retorno 198 pode também incluir um grau relativo de similaridade expresso por uma correlação relativa entre cada campo nos dados 122 e cada componente de cada candidato dentro lista de candidatos 197, bem como a fonte dos dados específicos que foi usada para preencher o banco de dados de referência de entidade empresarial 185 com componentes de cada candidato na lista de candidatos 197.
[0105] A Tabela 23 é um exemplo de retorno 198.
Figure img0023
[0106] A Tabela 23 mostra uma entidade empresarial (coluna 1), um endereço associado a essa entidade (coluna 2), um escore que representa a similaridade entre esse endereço e um candidato na lista de candidatos 197 (coluna 3), uma sequência de caracteres com significado embutido representando a natureza da similaridade (também chamada de correlação) de endereço (coluna 4) e uma sequência contendo o significado embutido que descreve os atributos do endereço (coluna 5).
[0107] Assim, em resumo, o método 100 inclui 1) receber uma consulta para iniciar uma busca por entidades empresariais, cada uma das quais está associada a uma localização geográfica específica, 2) limpar, analisar e padronizar a consulta, 3) extrudar endereços adicionais com base em um endereço de consulta, 4) determinar métodos otimizados para buscar os bancos de dados de referência com base em um ou uma pluralidade de indícios de consulta limpos, analisados e padronizados; 5) recuperar os candidatos e selecionar entidades de banco de dados de referência que casam com a consulta; e 6) retornar os candidatos a partir do banco de dados de referência com base em um grau de similaridade com a consulta ou dados derivados da consulta, com retorno com relação ao grau de similaridade.
[0108] O processo 100 inclui as etapas de 1) receber os dados de entrada que compreendem uma sequência de busca tendo uma pluralidade de elementos, 2) converter um subconjunto da pluralidade de elementos em um conjunto de termos, 3) recuperar os dados de referência armazenados com base nos termos para identificar os candidatos mais prováveis para casar com os dados de entrada, 4) inferir a possibilidade de predição da capacidade de identificar um conjunto de candidatos casados usando indícios flexíveis com base em uma consulta de usuário final, incluindo tanto os dados que são esperados como parte de uma consulta, quanto dados alternativos que podem ser fornecidos pelo usuário final, e dados que são derivados dos dados de consulta, 5) selecionar um ou mais candidatos de casamento com base na possibilidade de predição inferida, e 6) fornecer os resultados de casamento e o retorno que permitem que o usuário final decida como usar esses resultados.
[0109] O método 100 inclui funcionalidade para identificar as entidades empresariais associadas às localizações geográficas usando um conjunto finito, mas ilimitado temporalmente de indícios que podem ser usados pelos subprocessos dentro de método 100, para formar uma opinião de similaridade entre uma consulta e os candidatos casados. O método 100 abrange certos problemas inerentes em reconhecer e qualificar exclusivamente uma localização geográfica e sua associação a uma ou mais entidades empresariais, incluindo 1) a imprecisão e a variação natural na conceitualização e expressão de indícios de endereço geográfico, 2) a ausência de identificadores ambíguos ou chaves persistentes para localizações geográficas, e 3) as variações muito amplas no nível de detalhe geralmente considerado em uso da empresa para compreender um endereço “completo”. Ao estender um conjunto flexível e variável de atributos de identificação e de casamento para uma localização geográfica, esses desafios podem ser abordados. A flexibilidade da técnica inclui tanto os metadados quanto os valores de dados reais, e seria usada tanto em 1) preencher um banco de dados com informação relacionada às localizações geográficas e conexões entre as mesmas e as entidades empresariais, bem como em 2) selecionar as entidades empresariais a partir do banco de dados com base em consultas e regras que gerenciam o limite de aceitação para os dados propósitos.
[0110] O método 100 pode resolver um caso de uma entidade única em um local, por exemplo, uma única entidade em um único edifício, ou um caso de múltiplas entidades na única localização, por exemplo, múltiplos inquilinos em um shopping center. Para o caso de múltiplas entidades em uma única localização, cada uma das entidades pode, no entanto, ter um endereço que é diferente das outras entidades.
[0111] Para o caso de uma única entidade, o método 100:
[0112] (a) no processo 120, recebe os dados, ou seja, a consulta 110, que descreve uma localização;
[0113] (b) no processo 140, extrapola, a partir dos dados, um endereço associado à localização;
[0114] (c) no processo 150, identifica um segmento de uma via que inclui o endereço;
[0115] (d) no processo 150, define um polígono que tem um perímetro que abrange uma região geográfica que está em uma vizinhança do segmento;
[0116] (e) no processo 160, obtém as coordenadas geográficas de um ponto dentro do polígono;
[0117] (f) no processo 160, identifica um endereço nas coordenadas geográficas; e
[0118] (g) no processo 170, identifica uma entidade que está associada ao endereço nas coordenadas geográficas.
[0119] Para o caso de múltiplas entidades na única localização, considera-se uma situação de duas entidades que são inquilinas em um shopping center, onde cada entidade tem um endereço que é diferente da outra entidade. No processo 150, o polígono teria um perímetro que abrange o shopping center. Consequentemente, assume-se que as coordenadas geográficas mencionadas acima são as primeiras coordenadas geográficas, o ponto mencionado acima é um primeiro ponto, o endereço mencionado acima nas coordenadas geográficas é um primeiro endereço nas coordenadas geográficas, e a entidade mencionada acima é uma primeira entidade. Quando o processo 160 é executado, ele obtém as segundas coordenadas geográficas de um segundo ponto dentro do polígono, e identifica um segundo endereço nas segundas coordenadas geográficas. O processo 170 então identifica uma segunda entidade que está associada ao segundo endereço.
[0120] A Figura 2 é um diagrama de blocos de um sistema 200 que emprega os métodos descritos aqui. O sistema 200 inclui um computador 205 acoplado a uma rede de comunicação de dados, ou seja, uma rede 230, tal como a Internet.
[0121] O computador 205 inclui uma interface de usuário 210, um processador 215 e uma memória 220. Embora o computador 205 seja representado aqui como um dispositivo autônomo, ele não está limitado a esse, pelo contrário, ele pode ser acoplado a outros dispositivos (não mostrados) em um sistema de processamento distribuído.
[0122] A interface de usuário 210 inclui um dispositivo de entrada, tal como um teclado ou um subsistema de reconhecimento de voz, para permitir que o usuário 101 comunique a informação e seleções de comando ao processador 215. A interface de usuário 210 também inclui um dispositivo de saída, tal como uma tela ou uma impressora. Um controle de cursor, tal como um mouse, trackball ou comando de jogos, permite que o usuário 101 manipule um cursor na tela para comunicar informação adicional e seleções de comando ao processador 215.
[0123] O sistema 200 também inclui um dispositivo de usuário 240 que está acoplado de forma comunicativa ao computador 205 via a rede 230. O usuário 101 pode interagir com o computador 205 através do dispositivo de usuário 240, tal como uma alternativa para operá-lo por meio da interface de usuário 210.
[0124] O processador 215 é um dispositivo eletrônico configurado de circuito lógico que responde e executa as instruções.
[0125] A memória 220 é um dispositivo legível por computador não transitório codificado com um programa de computador. Nesse aspecto, a memória 220 armazena os dados e instruções que podem ser lidas e executadas pelo processador 215, para controlar a operação do processador 215. A memória 220 pode ser implementada em uma memória de acesso aleatório (RAM), uma unidade de disco rígido, uma memória somente de leitura (ROM), ou uma combinação dessas. Um dos componentes de memória 220 é um módulo de programa 225.
[0126] O módulo de programa 225 contém instruções para controlar o processador 215 para executar os métodos descritos aqui. Por exemplo, sob o controle do módulo de programa 225, o processador 215 executa os processos do método 100. O termo “módulo” é usado aqui para denotar uma operação funcional que pode ser incorporada ou como um componente autônomo ou como uma configuração integrada de uma pluralidade de componentes subordenados. Assim, o módulo de programa 225 pode ser implementado como um módulo único ou como uma pluralidade de módulos que operam em cooperação uns com os outros. Ademais, embora o módulo de programa 225 seja descrito aqui como estando instalado na memória 220, e, portanto, implementado em software, ele poderia ser implementado em qualquer um dentre hardware (por exemplo, circuitos eletrônicos), suporte lógico inalterável (firmware), software ou uma combinação desses.
[0127] O processador 215 recebe a consulta 110 ou através da rede 230 ou da interface de usuário 210. O processador 215 acessa as regras de processamento 135, a tabela de atributos de entidade geográfica, as regras de extrusão 145, o banco de dados de referência de segmento 155, o banco de dados de referência de coordenadas geográficas 165, e o banco de dados de referência de entidade empresarial 185, as regras de escore 190, as regras de classificação 191, e as regras de decisão 192, que podem ser os componentes do computador 205, por exemplo, armazenados dentro da memória 220, ou podem ser externos ao computador 205, onde o computador os acessa via uma rede local (não mostrada), ou via a rede 230. O processador 215 acessa os processos 120, 130, 140, 150, 160, 170, 180, 181, 193, e 194, que podem ser componentes do computador 205, por exemplo, armazenados dentro da memória 220, ou podem ser externos ao computador 205, onde o computador 205 os acessa via uma rede local ou via a rede 230. O processador 215 retorna o resultado 196 para o usuário 101 no processo 195.
[0128] Enquanto o módulo de programa 225 é indicado como já carregado na memória 220, ele pode ser configurado em um dispositivo de armazenamento 235 para o subsequente carregamento na memória 220. O dispositivo de armazenamento 235 é também um dispositivo legível por computador não transitório codificado com um programa de computador, e pode ser qualquer dispositivo de armazenamento convencional que armazena o módulo de programa 225. Exemplos de dispositivo de armazenamento 235 incluem um disquete, um disco compacto, uma fita magnética, uma memória somente de leitura, um suporte (media) de armazenamento óptico, unidade rápida de barramento serial universal (USB), um disco digital versátil, ou uma unidade zip. O dispositivo de armazenamento 235 também pode ser uma memória de acesso aleatório, ou outro tipo de armazenamento eletrônico localizado em um sistema de armazenamento remoto e acoplado ao computador 205 via a rede 230.
[0129] As técnicas descritas aqui são exemplificadas, e não deveriam ser interpretadas como implicando em qualquer limitação particular à presente descrição. Dever-se-ia entender que várias alternativas, combinações e modificações poderiam ser planejadas pelos versados na técnica. Por exemplo, as etapas associadas aos processos descritos aqui podem ser executadas em qualquer ordem, a menos que especificadas de outra forma ou ditadas pelas próprias etapas. A presente descrição destina-se a englobar todas tais alternativas, modificações e variações que estão dentro do escopo das reivindicações em anexo.
[0130] Os termos “compreende” ou “compreendendo” serão interpretados como especificando a presença de características, inteiros, etapas ou componentes estabelecidos, mas não excluem a presença de uma ou mais outras características, inteiros, etapas, componentes ou grupos dos mesmos.

Claims (5)

1. Método que recupera as entidades associadas a uma localização geográfica que compreende: (a) receber dados que descrevem uma localização; (b) extrapolar, a partir dos ditos dados, um endereço associado com a dita localização; caracterizado pelo fato de que compreende: (c) executar um processo que gera uma lista de candidatos, em que o dito processo inclui: identificar um segmento de uma via que inclui o dito endereço; obter coordenadas geográficas de um ponto que corresponde ao dito endereço; definir um polígono que possui um perímetro que engloba uma região geográfica que inclui ditas coordenadas geográficas; identificar uma entidade que está associada com o dito endereço nas ditas coordenadas geográficas; incluir dita entidade na dita lista de candidatos; e identificar um endereço adicional englobado pelo dito polígono; (d) enviar dito endereço adicional de forma recursiva para dentro do dito processo até que um critério seja alcançado; e (e) retornar a dita lista de candidatos.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a dita extrapolação inclui a obtenção de um primeiro atributo associado com o dito endereço, em que a dita identificação do dito segmento inclui a obtenção de um segundo atributo associado com o dito segmento, e em que a dita definição compreende definir um tamanho e uma forma do dito polígono com base nos ditos primeiro e segundo atributos.
3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a dita extrapolação inclui a obtenção de um primeiro atributo associado com o dito endereço, em que a dita identificação do dito segmento inclui a obtenção de um segundo atributo associado com o dito segmento, em que o dito definir dito polígono inclui definir um tamanho e uma forma de um poliedro com base nos ditos primeiro e segundo atributos, e em que o dito polígono é uma seção transversal do dito poliedro.
4. Sistema que recupera as entidades associadas a uma localização geográfica caracterizado pelo fato de que compreende: um processador; e um suporte de armazenamento que contém instruções legíveis por computador que, quando executadas pelo processador, fazem com que o processador execute o método definido em qualquer uma das reivindicações 1 a 3.
5. Suporte de armazenamento caracterizado pelo fato de que compreende instruções que, quando executadas, efetuam o método definido em qualquer uma das reivindicações 1 a 3.
BR112015023786-0A 2013-03-15 2014-03-14 Método e sistema que recuperam as entidades associadas a uma localização geográfica, e, suporte de armazenamento BR112015023786B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361792762P 2013-03-15 2013-03-15
US61/792,762 2013-03-15
PCT/US2014/029282 WO2014144745A1 (en) 2013-03-15 2014-03-14 Non-deterministic disambiguation and matching of business locale data

Publications (2)

Publication Number Publication Date
BR112015023786A2 BR112015023786A2 (pt) 2017-07-18
BR112015023786B1 true BR112015023786B1 (pt) 2022-05-03

Family

ID=51533154

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112015023786-0A BR112015023786B1 (pt) 2013-03-15 2014-03-14 Método e sistema que recuperam as entidades associadas a uma localização geográfica, e, suporte de armazenamento

Country Status (13)

Country Link
US (1) US9183223B2 (pt)
EP (1) EP2972092A4 (pt)
JP (1) JP6205477B2 (pt)
KR (1) KR101835576B1 (pt)
CN (1) CN105209858B (pt)
AU (1) AU2014228754C1 (pt)
BR (1) BR112015023786B1 (pt)
CA (1) CA2906767A1 (pt)
HK (1) HK1217756A1 (pt)
PH (1) PH12015502104B1 (pt)
RU (1) RU2598165C1 (pt)
SG (1) SG11201507599VA (pt)
WO (1) WO2014144745A1 (pt)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2540817A (en) * 2015-07-30 2017-02-01 Ford Global Tech Llc Improvements in or relating to distributed vehicular data management systems
US20170039258A1 (en) * 2015-08-05 2017-02-09 Microsoft Technology Licensing, Llc Efficient Location-Based Entity Record Conflation
US10234295B2 (en) * 2015-11-06 2019-03-19 Sap Se Address remediation using geo-coordinates
US11284215B2 (en) * 2019-02-20 2022-03-22 Level 3 Communications, Llc Service area determination in a telecommunications network
US11631047B2 (en) * 2019-04-12 2023-04-18 Flipkart Internet Pvt. Ltd. System and method of geocoding
CN110175216B (zh) * 2019-05-15 2021-05-11 腾讯科技(深圳)有限公司 坐标纠错方法、装置和计算机设备
KR102342929B1 (ko) 2019-12-26 2021-12-28 한국국토정보공사 사고 발생패턴 분석을 통한 사고 취약지 분석 장치 및 방법
US11914553B2 (en) 2021-10-07 2024-02-27 T-Mobile Innovations Llc Methods and systems for analyzing similarities across tables and databases to perform de-duplication in a storage server
US11934367B2 (en) * 2021-10-07 2024-03-19 T-Mobile Innovations Llc Data management and de-duplication at a storage server

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7006881B1 (en) * 1991-12-23 2006-02-28 Steven Hoffberg Media recording device with remote graphic user interface
JP3206491B2 (ja) * 1997-05-08 2001-09-10 松下電器産業株式会社 地図情報検索装置
JP2001304891A (ja) * 2000-04-27 2001-10-31 Toshiba Corp 道路交通状況の予測システム、車載用ナビゲーションシステム及び道路状況予測方法
US6895126B2 (en) * 2000-10-06 2005-05-17 Enrico Di Bernardo System and method for creating, storing, and utilizing composite images of a geographic location
EP1485825A4 (en) * 2002-02-04 2008-03-19 Cataphora Inc DETAILED EXPLORATION TECHNIQUE OF SOCIOLOGICAL DATA AND CORRESPONDING APPARATUS
US7376636B1 (en) * 2002-06-07 2008-05-20 Oracle International Corporation Geocoding using a relational database
US7324666B2 (en) * 2002-11-15 2008-01-29 Whitegold Solutions, Inc. Methods for assigning geocodes to street addressable entities
JP3770325B2 (ja) * 2003-09-09 2006-04-26 アイシン・エィ・ダブリュ株式会社 ナビゲーション装置
US7373244B2 (en) * 2004-04-20 2008-05-13 Keith Kreft Information mapping approaches
US8670925B2 (en) * 2005-06-21 2014-03-11 Calabrese Holdings L.L.C. Navigation system and method
JP5002140B2 (ja) * 2005-08-24 2012-08-15 クラリオン株式会社 ナビゲーション装置およびナビゲーション処理方法
US7606582B2 (en) * 2005-12-13 2009-10-20 Yahoo! Inc. System and method for populating a geo-coding database
US7616964B2 (en) * 2005-12-13 2009-11-10 Yahoo! Inc. System and method for providing geo-relevant information based on a mobile device
US7606581B2 (en) * 2005-12-13 2009-10-20 Yahoo! Inc. System and method for providing geo-relevant information based on a location
US20070150199A1 (en) * 2005-12-13 2007-06-28 Soren Riise System and method for geo-coding using spatial geometry
US8050689B2 (en) * 2005-12-13 2011-11-01 Yahoo! Inc. System and method for creating minimum bounding rectangles for use in a geo-coding system
EP2538356A1 (en) * 2006-01-27 2012-12-26 Google Inc. Geographic coding for location search queries
US20070185649A1 (en) * 2006-02-08 2007-08-09 Tele Atlas North America, Inc. Map database having address points for determining destinations
US7643673B2 (en) * 2006-06-12 2010-01-05 Google Inc. Markup language for interactive geographic information system
JP4822986B2 (ja) * 2006-08-25 2011-11-24 アルパイン株式会社 ナビゲーション装置および行き先検索方法
US7551126B2 (en) * 2007-03-08 2009-06-23 Trimble Navigation Limited GNSS sample processor for determining the location of an event
US20110179066A1 (en) * 2008-06-20 2011-07-21 Business Intelligence Solutions Safe B.V. Methods, apparatus and systems for data visualization and related applications
US20100125560A1 (en) * 2008-11-17 2010-05-20 Michael Asher Uncertainty-based geocoding for risk management
CN101769758A (zh) * 2008-12-30 2010-07-07 英华达(上海)科技有限公司 兴趣点搜寻范围的规划方法
US20100306287A1 (en) * 2009-05-26 2010-12-02 Nabil Raafat Mahrous Raphaeil Method and apparatus for global addressing of parcels of land
KR101516858B1 (ko) * 2009-07-07 2015-05-04 구글 인코포레이티드 지도 검색을 위한 쿼리 파싱 방법
RU2415456C1 (ru) * 2009-11-13 2011-03-27 Открытое акционерное общество "Научно-производственное предприятие "Рубин" (ОАО "НПП "Рубин") Модуль планирования
US8930245B2 (en) * 2010-06-23 2015-01-06 Justin Streich Methods, systems and machines for identifying geospatial compatibility between consumers and providers of goods or services
CN101882163A (zh) * 2010-06-30 2010-11-10 中国科学院地理科学与资源研究所 一种基于匹配规则的模糊中文地址地理赋值方法
US8442716B2 (en) * 2010-10-31 2013-05-14 Microsoft Corporation Identifying physical locations of entities
US20130035853A1 (en) * 2011-08-03 2013-02-07 Google Inc. Prominence-Based Generation and Rendering of Map Features
EP2565583B1 (en) * 2011-08-29 2018-08-01 Harman Becker Automotive Systems GmbH Navigation device, method of outputting a map, and method of generating a database

Also Published As

Publication number Publication date
CN105209858A (zh) 2015-12-30
PH12015502104A1 (en) 2016-01-18
CA2906767A1 (en) 2014-09-18
US9183223B2 (en) 2015-11-10
RU2598165C1 (ru) 2016-09-20
AU2014228754A1 (en) 2015-10-22
KR101835576B1 (ko) 2018-03-08
CN105209858B (zh) 2018-11-16
HK1217756A1 (zh) 2017-01-20
WO2014144745A1 (en) 2014-09-18
PH12015502104B1 (en) 2016-01-18
KR20150138222A (ko) 2015-12-09
BR112015023786A2 (pt) 2017-07-18
EP2972092A1 (en) 2016-01-20
SG11201507599VA (en) 2015-10-29
AU2014228754B2 (en) 2015-12-24
EP2972092A4 (en) 2016-08-24
US20140280160A1 (en) 2014-09-18
JP6205477B2 (ja) 2017-09-27
AU2014228754C1 (en) 2016-04-28
JP2016515697A (ja) 2016-05-30

Similar Documents

Publication Publication Date Title
BR112015023786B1 (pt) Método e sistema que recuperam as entidades associadas a uma localização geográfica, e, suporte de armazenamento
US10025819B2 (en) Generating a query statement based on unstructured input
US9881037B2 (en) Method for systematic mass normalization of titles
US20170161375A1 (en) Clustering documents based on textual content
US9239875B2 (en) Method for disambiguated features in unstructured text
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
US11397855B2 (en) Data standardization rules generation
BR112012026345A2 (pt) imputação de atributos acionáveis a dados que descrevem uma identidade pessoal
WO2020074017A1 (zh) 基于深度学习的医学文献中关键词筛选方法及装置
KR20150036566A (ko) 다중 언어 문서 클러스터링
CN105335378A (zh) 多数据源的信息处理装置、服务器及方法
JP2022024102A (ja) 検索モデルのトレーニング方法、目標対象の検索方法及びその装置
US10866944B2 (en) Reconciled data storage system
JP6145562B2 (ja) 情報構造化システム及び情報構造化方法
CN115687773A (zh) 一种基于知识图谱的跨环境元数据匹配方法及系统
Knoblock et al. Automatic spatio-temporal indexing to integrate and analyze the data of an organization
Dorssers et al. Ranking triples using entity links in a large web crawl-the chicory triple scorer at wsdm cup 2017
Plum et al. Toponym detection in the bio-medical domain: A hybrid approach with deep learning
CN112579841A (zh) 一种多模态数据库建立方法、检索方法及系统
KR101127795B1 (ko) 색인어의 근접도를 이용하는 검색 방법 및 검색 시스템
KR20130070665A (ko) 네트워크 상의 정보 주소 관리 방법 및 장치

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 14/03/2014, OBSERVADAS AS CONDICOES LEGAIS.