BR102014027639A8 - método para resolver as entidades de uma pluralidade de documentos, e sistema de resolução de entidade para a resolução de entidade de uma pluralidade de documentos - Google Patents
método para resolver as entidades de uma pluralidade de documentos, e sistema de resolução de entidade para a resolução de entidade de uma pluralidade de documentosInfo
- Publication number
- BR102014027639A8 BR102014027639A8 BR102014027639A BR102014027639A BR102014027639A8 BR 102014027639 A8 BR102014027639 A8 BR 102014027639A8 BR 102014027639 A BR102014027639 A BR 102014027639A BR 102014027639 A BR102014027639 A BR 102014027639A BR 102014027639 A8 BR102014027639 A8 BR 102014027639A8
- Authority
- BR
- Brazil
- Prior art keywords
- documents
- entity
- entity resolution
- merged
- document
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/131—Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
todo para resolver as entidades de uma pluralidade de documentos; e sistema de resolução de entidade para a resolução de entidade de uma pluralidade de documentos. trata-se de urna resolução de entidade e, particularmente, ao fornecimento de urna resolução de entidade a partir de documentos. o método compreende obter a pluralidade de documentos a partir de pelo menos urna fonte de dados. a pluralidade de documentos é bloqueada em pelo menos urna partição com base na similaridade textual e nas referências entre documentos dentre a pluralidade de documentos. ademais, no interior de cada partição, um documento mesclado para cada entidade pode ser criado com base em um conjunto de procedimento de mescla de correspondência interativa. o conjunto de procedimento de mescla de correspondência interativa identifica, a partir da pluralidade de documentos, pelo menos urn par correspondente de documentos e mescla o pelo menos urn par correspondente de documentos para criar o documento mesclado para cada entidade. os documentos mesclados podem ser mesclados para gerar urn documento de entidade resolvida para cada entidade com base em um conj unto de procedimento de aglomeração de gráficos.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IN169MU2014 IN2014MU00169A (pt) | 2014-01-17 | 2014-01-17 | |
IN169/MUM/2014 | 2014-01-17 |
Publications (3)
Publication Number | Publication Date |
---|---|
BR102014027639A2 BR102014027639A2 (pt) | 2016-05-24 |
BR102014027639A8 true BR102014027639A8 (pt) | 2021-08-24 |
BR102014027639B1 BR102014027639B1 (pt) | 2022-05-03 |
Family
ID=51625852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR102014027639-4A BR102014027639B1 (pt) | 2014-01-17 | 2014-11-05 | Método para resolver as entidades de uma pluralidade de documentos, e sistema de resolução de entidade para a resolução de entidade de uma pluralidade de documentos |
Country Status (7)
Country | Link |
---|---|
US (1) | US10311093B2 (pt) |
EP (1) | EP2897054A3 (pt) |
AU (1) | AU2014253497B2 (pt) |
BR (1) | BR102014027639B1 (pt) |
CA (1) | CA2868540C (pt) |
IN (1) | IN2014MU00169A (pt) |
MX (1) | MX355195B (pt) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109165291B (zh) * | 2018-06-29 | 2021-07-09 | 厦门快商通信息技术有限公司 | 一种文本匹配方法及电子设备 |
CN109635114A (zh) * | 2018-12-17 | 2019-04-16 | 北京百度网讯科技有限公司 | 用于处理信息的方法和装置 |
FR3104282B1 (fr) * | 2019-12-05 | 2024-01-19 | Codexo | Sauvegarde de documents en blocs |
US20210342541A1 (en) * | 2020-05-01 | 2021-11-04 | Salesforce.Com, Inc. | Stable identification of entity mentions |
CN111882165A (zh) * | 2020-07-01 | 2020-11-03 | 国网河北省电力有限公司经济技术研究院 | 一种综合项目造价分析数据拆分装置及方法 |
WO2024036394A1 (en) * | 2022-08-18 | 2024-02-22 | 9197-1168 Québec Inc. | Systems and methods for identifying documents and references |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7213198B1 (en) * | 1999-08-12 | 2007-05-01 | Google Inc. | Link based clustering of hyperlinked documents |
AU2003298616A1 (en) * | 2002-11-06 | 2004-06-03 | International Business Machines Corporation | Confidential data sharing and anonymous entity resolution |
US8683312B2 (en) * | 2005-06-16 | 2014-03-25 | Adobe Systems Incorporated | Inter-document links involving embedded documents |
US20090204590A1 (en) * | 2008-02-11 | 2009-08-13 | Queplix Corp. | System and method for an integrated enterprise search |
US8805861B2 (en) * | 2008-12-09 | 2014-08-12 | Google Inc. | Methods and systems to train models to extract and integrate information from data sources |
US20110119268A1 (en) * | 2009-11-13 | 2011-05-19 | Rajaram Shyam Sundar | Method and system for segmenting query urls |
EP2524299A4 (en) * | 2010-01-11 | 2013-11-13 | Panjiva Inc | EVALUATION OF PUBLIC ARCHIVES OF SUPPLY TRANSACTIONS FOR DECISION MAKING OF FINANCIAL INVESTMENTS |
CN102906736B (zh) * | 2010-03-12 | 2018-03-23 | 爱立信(中国)通信有限公司 | 用于匹配实体的系统和方法及其中使用的同义词群组织器 |
US9189473B2 (en) * | 2012-05-18 | 2015-11-17 | Xerox Corporation | System and method for resolving entity coreference |
US9442929B2 (en) * | 2013-02-12 | 2016-09-13 | Microsoft Technology Licensing, Llc | Determining documents that match a query |
US10140664B2 (en) * | 2013-03-14 | 2018-11-27 | Palantir Technologies Inc. | Resolving similar entities from a transaction database |
-
2014
- 2014-01-17 IN IN169MU2014 patent/IN2014MU00169A/en unknown
- 2014-09-24 EP EP14186280.5A patent/EP2897054A3/en not_active Ceased
- 2014-10-22 AU AU2014253497A patent/AU2014253497B2/en active Active
- 2014-10-24 CA CA2868540A patent/CA2868540C/en active Active
- 2014-11-03 MX MX2014013314A patent/MX355195B/es active IP Right Grant
- 2014-11-05 US US14/533,866 patent/US10311093B2/en active Active
- 2014-11-05 BR BR102014027639-4A patent/BR102014027639B1/pt active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
US20150205803A1 (en) | 2015-07-23 |
MX2014013314A (es) | 2016-03-15 |
MX355195B (es) | 2018-04-06 |
CA2868540A1 (en) | 2015-07-17 |
AU2014253497A1 (en) | 2015-08-06 |
EP2897054A3 (en) | 2015-09-16 |
EP2897054A2 (en) | 2015-07-22 |
AU2014253497B2 (en) | 2020-05-28 |
US10311093B2 (en) | 2019-06-04 |
CA2868540C (en) | 2020-09-22 |
BR102014027639B1 (pt) | 2022-05-03 |
IN2014MU00169A (pt) | 2015-08-28 |
BR102014027639A2 (pt) | 2016-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR102014027639A8 (pt) | método para resolver as entidades de uma pluralidade de documentos, e sistema de resolução de entidade para a resolução de entidade de uma pluralidade de documentos | |
BR112018077198A2 (pt) | sistemas e métodos para identificar conteúdos correspondentes | |
BR112015030417A8 (pt) | Sistema de computador, método implementado por computador e sistema para resultados de busca de linguagem natural para consultas de intenção | |
BR112017026670A2 (pt) | sistema e método para fornecer informações contextuais para uma localização | |
BR112017009666A2 (pt) | método e dispositivo para mineração de dados com base em plataforma social | |
BR112015003406A8 (pt) | Método implementado por computador e sistema de computação | |
WO2015200110A3 (en) | Techniques for machine language translation of text from an image based on non-textual context information from the image | |
BR112017013687A2 (pt) | impressão digital geométrica para localização de um dispositivo | |
MX2018003490A (es) | Traduccion universal. | |
BR112016024885A2 (pt) | identificação de intenção de pesquisa | |
BR112018011458A2 (pt) | detecção de nuvem em imagens de sensoriamento remoto | |
BR112016014522A2 (pt) | Sistema e método para estabilizar a exibição de uma caixa de rastreamento de objeto | |
BR112015015904A2 (pt) | renderização de linguagem natural de consultas de busca estruturadas | |
BR112015024773A2 (pt) | método e sistema para comparação de imagens | |
BR112017008453A2 (pt) | detecção automática de incompatibilidade de esquema | |
BR112015016352A2 (pt) | sistema e método para motores de consulta distribuída a bancos de dados | |
BR112015010802A2 (pt) | modelo gramatical para consultas de busca estruturadas | |
BR112013028501A2 (pt) | aparelho e método para processamento de dados seguro baseado em hardware utilizando regras de faixa de endereço de memória de armazenamento temporário | |
BR112015023219A2 (pt) | sistema de desenho de objeto assistido por computador, meio não transitório de armazenamento legível em computador e método de fabrico de objeto | |
AR097623A1 (es) | Método, aparato y dispositivo informático para gestionar representaciones de color para un mapa digital | |
CL2015001952A1 (es) | Procedimiento de reconocimiento de caracteres, que comprende lectura de una imagen de caracter, procesamiento de imagen, segmentacion de caracter, extraccion de borde, extraccion de caracteristicas de cada punto de borde de cada caracter mediante las distancias desde los puntos de borde de apoyo, procesamiento de caracteristicas, calculo de coincidencia de plantilla. | |
BR112015022133A8 (pt) | método, meios legíveis por computador e sistema relacionados a repositórios temáticos para o gerenciamneto de transações | |
AR095134A1 (es) | Dispositivo informático, sistema y método relacionado con gráficos y tarjetas de actividad | |
BR112015013917A2 (pt) | método, unidade de computação, e sistema | |
BR112017000097A2 (pt) | métodos de geração de mensagens vitais implementado por computador em um sistema de bordo de um veículo, sistemas para gerar mensagens vitais e aparelho para gerar mensagens vitais em um sistema |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B03A | Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette] | ||
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B03H | Publication of an application: rectification [chapter 3.8 patent gazette] |
Free format text: REFERENTE A RPI 2368 DE 24/05/2016, QUANTO AO ITEM (54). |
|
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B15K | Others concerning applications: alteration of classification |
Free format text: AS CLASSIFICACOES ANTERIORES ERAM: G06F 17/22 , G06F 17/27 , G06F 17/30 Ipc: G06F 16/35 (2006.01), G06F 16/901 (2006.01), G06F |
|
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 05/11/2014, OBSERVADAS AS CONDICOES LEGAIS. |