BR102014027639A8 - método para resolver as entidades de uma pluralidade de documentos, e sistema de resolução de entidade para a resolução de entidade de uma pluralidade de documentos - Google Patents

método para resolver as entidades de uma pluralidade de documentos, e sistema de resolução de entidade para a resolução de entidade de uma pluralidade de documentos

Info

Publication number
BR102014027639A8
BR102014027639A8 BR102014027639A BR102014027639A BR102014027639A8 BR 102014027639 A8 BR102014027639 A8 BR 102014027639A8 BR 102014027639 A BR102014027639 A BR 102014027639A BR 102014027639 A BR102014027639 A BR 102014027639A BR 102014027639 A8 BR102014027639 A8 BR 102014027639A8
Authority
BR
Brazil
Prior art keywords
documents
entity
entity resolution
merged
document
Prior art date
Application number
BR102014027639A
Other languages
English (en)
Other versions
BR102014027639B1 (pt
BR102014027639A2 (pt
Inventor
Shroff Gautam
Malhotra Pankaj
Agarwal Puneet
Original Assignee
Tata Consultancy Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tata Consultancy Services Ltd filed Critical Tata Consultancy Services Ltd
Publication of BR102014027639A2 publication Critical patent/BR102014027639A2/pt
Publication of BR102014027639A8 publication Critical patent/BR102014027639A8/pt
Publication of BR102014027639B1 publication Critical patent/BR102014027639B1/pt

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/131Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

todo para resolver as entidades de uma pluralidade de documentos; e sistema de resolução de entidade para a resolução de entidade de uma pluralidade de documentos. trata-se de urna resolução de entidade e, particularmente, ao fornecimento de urna resolução de entidade a partir de documentos. o método compreende obter a pluralidade de documentos a partir de pelo menos urna fonte de dados. a pluralidade de documentos é bloqueada em pelo menos urna partição com base na similaridade textual e nas referências entre documentos dentre a pluralidade de documentos. ademais, no interior de cada partição, um documento mesclado para cada entidade pode ser criado com base em um conjunto de procedimento de mescla de correspondência interativa. o conjunto de procedimento de mescla de correspondência interativa identifica, a partir da pluralidade de documentos, pelo menos urn par correspondente de documentos e mescla o pelo menos urn par correspondente de documentos para criar o documento mesclado para cada entidade. os documentos mesclados podem ser mesclados para gerar urn documento de entidade resolvida para cada entidade com base em um conj unto de procedimento de aglomeração de gráficos.
BR102014027639-4A 2014-01-17 2014-11-05 Método para resolver as entidades de uma pluralidade de documentos, e sistema de resolução de entidade para a resolução de entidade de uma pluralidade de documentos BR102014027639B1 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN169MU2014 IN2014MU00169A (pt) 2014-01-17 2014-01-17
IN169/MUM/2014 2014-01-17

Publications (3)

Publication Number Publication Date
BR102014027639A2 BR102014027639A2 (pt) 2016-05-24
BR102014027639A8 true BR102014027639A8 (pt) 2021-08-24
BR102014027639B1 BR102014027639B1 (pt) 2022-05-03

Family

ID=51625852

Family Applications (1)

Application Number Title Priority Date Filing Date
BR102014027639-4A BR102014027639B1 (pt) 2014-01-17 2014-11-05 Método para resolver as entidades de uma pluralidade de documentos, e sistema de resolução de entidade para a resolução de entidade de uma pluralidade de documentos

Country Status (7)

Country Link
US (1) US10311093B2 (pt)
EP (1) EP2897054A3 (pt)
AU (1) AU2014253497B2 (pt)
BR (1) BR102014027639B1 (pt)
CA (1) CA2868540C (pt)
IN (1) IN2014MU00169A (pt)
MX (1) MX355195B (pt)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165291B (zh) * 2018-06-29 2021-07-09 厦门快商通信息技术有限公司 一种文本匹配方法及电子设备
CN109635114A (zh) * 2018-12-17 2019-04-16 北京百度网讯科技有限公司 用于处理信息的方法和装置
FR3104282B1 (fr) * 2019-12-05 2024-01-19 Codexo Sauvegarde de documents en blocs
US20210342541A1 (en) * 2020-05-01 2021-11-04 Salesforce.Com, Inc. Stable identification of entity mentions
CN111882165A (zh) * 2020-07-01 2020-11-03 国网河北省电力有限公司经济技术研究院 一种综合项目造价分析数据拆分装置及方法
WO2024036394A1 (en) * 2022-08-18 2024-02-22 9197-1168 Québec Inc. Systems and methods for identifying documents and references

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7213198B1 (en) * 1999-08-12 2007-05-01 Google Inc. Link based clustering of hyperlinked documents
AU2003298616A1 (en) * 2002-11-06 2004-06-03 International Business Machines Corporation Confidential data sharing and anonymous entity resolution
US8683312B2 (en) * 2005-06-16 2014-03-25 Adobe Systems Incorporated Inter-document links involving embedded documents
US20090204590A1 (en) * 2008-02-11 2009-08-13 Queplix Corp. System and method for an integrated enterprise search
US8805861B2 (en) * 2008-12-09 2014-08-12 Google Inc. Methods and systems to train models to extract and integrate information from data sources
US20110119268A1 (en) * 2009-11-13 2011-05-19 Rajaram Shyam Sundar Method and system for segmenting query urls
EP2524299A4 (en) * 2010-01-11 2013-11-13 Panjiva Inc EVALUATION OF PUBLIC ARCHIVES OF SUPPLY TRANSACTIONS FOR DECISION MAKING OF FINANCIAL INVESTMENTS
CN102906736B (zh) * 2010-03-12 2018-03-23 爱立信(中国)通信有限公司 用于匹配实体的系统和方法及其中使用的同义词群组织器
US9189473B2 (en) * 2012-05-18 2015-11-17 Xerox Corporation System and method for resolving entity coreference
US9442929B2 (en) * 2013-02-12 2016-09-13 Microsoft Technology Licensing, Llc Determining documents that match a query
US10140664B2 (en) * 2013-03-14 2018-11-27 Palantir Technologies Inc. Resolving similar entities from a transaction database

Also Published As

Publication number Publication date
US20150205803A1 (en) 2015-07-23
MX2014013314A (es) 2016-03-15
MX355195B (es) 2018-04-06
CA2868540A1 (en) 2015-07-17
AU2014253497A1 (en) 2015-08-06
EP2897054A3 (en) 2015-09-16
EP2897054A2 (en) 2015-07-22
AU2014253497B2 (en) 2020-05-28
US10311093B2 (en) 2019-06-04
CA2868540C (en) 2020-09-22
BR102014027639B1 (pt) 2022-05-03
IN2014MU00169A (pt) 2015-08-28
BR102014027639A2 (pt) 2016-05-24

Similar Documents

Publication Publication Date Title
BR102014027639A8 (pt) método para resolver as entidades de uma pluralidade de documentos, e sistema de resolução de entidade para a resolução de entidade de uma pluralidade de documentos
BR112018077198A2 (pt) sistemas e métodos para identificar conteúdos correspondentes
BR112015030417A8 (pt) Sistema de computador, método implementado por computador e sistema para resultados de busca de linguagem natural para consultas de intenção
BR112017026670A2 (pt) sistema e método para fornecer informações contextuais para uma localização
BR112017009666A2 (pt) método e dispositivo para mineração de dados com base em plataforma social
BR112015003406A8 (pt) Método implementado por computador e sistema de computação
WO2015200110A3 (en) Techniques for machine language translation of text from an image based on non-textual context information from the image
BR112017013687A2 (pt) impressão digital geométrica para localização de um dispositivo
MX2018003490A (es) Traduccion universal.
BR112016024885A2 (pt) identificação de intenção de pesquisa
BR112018011458A2 (pt) detecção de nuvem em imagens de sensoriamento remoto
BR112016014522A2 (pt) Sistema e método para estabilizar a exibição de uma caixa de rastreamento de objeto
BR112015015904A2 (pt) renderização de linguagem natural de consultas de busca estruturadas
BR112015024773A2 (pt) método e sistema para comparação de imagens
BR112017008453A2 (pt) detecção automática de incompatibilidade de esquema
BR112015016352A2 (pt) sistema e método para motores de consulta distribuída a bancos de dados
BR112015010802A2 (pt) modelo gramatical para consultas de busca estruturadas
BR112013028501A2 (pt) aparelho e método para processamento de dados seguro baseado em hardware utilizando regras de faixa de endereço de memória de armazenamento temporário
BR112015023219A2 (pt) sistema de desenho de objeto assistido por computador, meio não transitório de armazenamento legível em computador e método de fabrico de objeto
AR097623A1 (es) Método, aparato y dispositivo informático para gestionar representaciones de color para un mapa digital
CL2015001952A1 (es) Procedimiento de reconocimiento de caracteres, que comprende lectura de una imagen de caracter, procesamiento de imagen, segmentacion de caracter, extraccion de borde, extraccion de caracteristicas de cada punto de borde de cada caracter mediante las distancias desde los puntos de borde de apoyo, procesamiento de caracteristicas, calculo de coincidencia de plantilla.
BR112015022133A8 (pt) método, meios legíveis por computador e sistema relacionados a repositórios temáticos para o gerenciamneto de transações
AR095134A1 (es) Dispositivo informático, sistema y método relacionado con gráficos y tarjetas de actividad
BR112015013917A2 (pt) método, unidade de computação, e sistema
BR112017000097A2 (pt) métodos de geração de mensagens vitais implementado por computador em um sistema de bordo de um veículo, sistemas para gerar mensagens vitais e aparelho para gerar mensagens vitais em um sistema

Legal Events

Date Code Title Description
B03A Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B03H Publication of an application: rectification [chapter 3.8 patent gazette]

Free format text: REFERENTE A RPI 2368 DE 24/05/2016, QUANTO AO ITEM (54).

B09A Decision: intention to grant [chapter 9.1 patent gazette]
B15K Others concerning applications: alteration of classification

Free format text: AS CLASSIFICACOES ANTERIORES ERAM: G06F 17/22 , G06F 17/27 , G06F 17/30

Ipc: G06F 16/35 (2006.01), G06F 16/901 (2006.01), G06F

B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 05/11/2014, OBSERVADAS AS CONDICOES LEGAIS.