CN105988988A - 文本地址处理方法及装置 - Google Patents
文本地址处理方法及装置 Download PDFInfo
- Publication number
- CN105988988A CN105988988A CN201510079914.6A CN201510079914A CN105988988A CN 105988988 A CN105988988 A CN 105988988A CN 201510079914 A CN201510079914 A CN 201510079914A CN 105988988 A CN105988988 A CN 105988988A
- Authority
- CN
- China
- Prior art keywords
- address
- urtext
- text
- feature
- normalized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
- G06F16/9574—Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Priority Applications (8)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201510079914.6A CN105988988A (zh) | 2015-02-13 | 2015-02-13 | 文本地址处理方法及装置 |
| PCT/CN2016/073441 WO2016127904A1 (zh) | 2015-02-13 | 2016-02-04 | 文本地址处理方法及装置 |
| EP16748705.7A EP3258397A1 (en) | 2015-02-13 | 2016-02-04 | Text address processing method and apparatus |
| JP2017542458A JP6594988B2 (ja) | 2015-02-13 | 2016-02-04 | 住所テキストを処理する方法及び機器 |
| KR1020177025509A KR102079860B1 (ko) | 2015-02-13 | 2016-02-04 | 텍스트 주소 처리 방법 및 장치 |
| SG10201907254XA SG10201907254XA (en) | 2015-02-13 | 2016-02-04 | Text address processing method and apparatus |
| SG11201706625YA SG11201706625YA (en) | 2015-02-13 | 2016-02-04 | Text address processing method and apparatus |
| US15/675,177 US10795964B2 (en) | 2015-02-13 | 2017-08-11 | Text address processing method and apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201510079914.6A CN105988988A (zh) | 2015-02-13 | 2015-02-13 | 文本地址处理方法及装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN105988988A true CN105988988A (zh) | 2016-10-05 |
Family
ID=56615030
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201510079914.6A Pending CN105988988A (zh) | 2015-02-13 | 2015-02-13 | 文本地址处理方法及装置 |
Country Status (7)
| Country | Link |
|---|---|
| US (1) | US10795964B2 (https=) |
| EP (1) | EP3258397A1 (https=) |
| JP (1) | JP6594988B2 (https=) |
| KR (1) | KR102079860B1 (https=) |
| CN (1) | CN105988988A (https=) |
| SG (2) | SG11201706625YA (https=) |
| WO (1) | WO2016127904A1 (https=) |
Cited By (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108460046A (zh) * | 2017-02-21 | 2018-08-28 | 菜鸟智能物流控股有限公司 | 一种地址聚合的方法以及设备 |
| CN108536657A (zh) * | 2018-04-10 | 2018-09-14 | 百融金融信息服务股份有限公司 | 人为填写的地址文本相似度处理方法和系统 |
| CN108804398A (zh) * | 2017-05-03 | 2018-11-13 | 阿里巴巴集团控股有限公司 | 地址文本的相似度计算方法及装置 |
| CN108876440A (zh) * | 2018-05-29 | 2018-11-23 | 阿里巴巴集团控股有限公司 | 区域划分方法和服务器 |
| CN109033225A (zh) * | 2018-06-29 | 2018-12-18 | 福州大学 | 中文地址识别系统 |
| CN109388634A (zh) * | 2018-09-18 | 2019-02-26 | 平安科技(深圳)有限公司 | 地址信息的处理方法、终端设备及计算机可读存储介质 |
| CN111488334A (zh) * | 2019-01-29 | 2020-08-04 | 阿里巴巴集团控股有限公司 | 数据处理方法及电子设备 |
| CN111723164A (zh) * | 2019-03-18 | 2020-09-29 | 阿里巴巴集团控股有限公司 | 地址信息的处理方法和装置 |
| CN112287671A (zh) * | 2020-09-29 | 2021-01-29 | 深圳市跨越新科技有限公司 | 基于simhash的地址解析方法及系统 |
| CN113761867A (zh) * | 2020-12-29 | 2021-12-07 | 京东城市(北京)数字科技有限公司 | 地址识别方法、装置、计算机设备及存储介质 |
| CN116402050A (zh) * | 2022-12-26 | 2023-07-07 | 北京码牛科技股份有限公司 | 一种地址归一化及补充方法、装置、电子设备及存储介质 |
Families Citing this family (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105988988A (zh) | 2015-02-13 | 2016-10-05 | 阿里巴巴集团控股有限公司 | 文本地址处理方法及装置 |
| CN110417841B (zh) * | 2018-04-28 | 2022-01-18 | 阿里巴巴集团控股有限公司 | 地址归一化处理方法、装置和系统、数据处理方法 |
| CN111274811B (zh) * | 2018-11-19 | 2023-04-18 | 阿里巴巴集团控股有限公司 | 地址文本相似度确定方法以及地址搜索方法 |
| CN109635063A (zh) * | 2018-12-06 | 2019-04-16 | 拉扎斯网络科技(上海)有限公司 | 地址库的信息处理方法、装置、电子设备和存储介质 |
| CN111435360B (zh) * | 2019-01-15 | 2023-08-29 | 菜鸟智能物流控股有限公司 | 地址类型识别方法和装置以及电子设备 |
| CN110598791B (zh) * | 2019-09-12 | 2024-12-10 | 深圳前海微众银行股份有限公司 | 地址相似度评价方法、装置、设备及介质 |
| CN110851669A (zh) * | 2019-10-17 | 2020-02-28 | 清华大学 | 基于地理位置信息的机构命名排歧方法及装置 |
| CN111522901B (zh) * | 2020-03-18 | 2023-10-20 | 大箴(杭州)科技有限公司 | 文本中地址信息的处理方法及装置 |
| US11159458B1 (en) | 2020-06-10 | 2021-10-26 | Capital One Services, Llc | Systems and methods for combining and summarizing emoji responses to generate a text reaction from the emoji responses |
| CN112711950A (zh) * | 2020-12-23 | 2021-04-27 | 深圳壹账通智能科技有限公司 | 地址信息抽取方法、装置、设备及存储介质 |
| CN114723353B (zh) * | 2021-01-06 | 2025-09-05 | 顺丰科技有限公司 | 地址信息提取方法、装置、计算机设备和存储介质 |
| CN115225609B (zh) * | 2021-04-20 | 2024-06-25 | 大金(中国)投资有限公司 | 用户数据处理方法及装置、服务器 |
| CN114048797A (zh) * | 2021-10-20 | 2022-02-15 | 盐城金堤科技有限公司 | 确定地址相似度的方法、装置、介质及电子设备 |
| CN114880412B (zh) * | 2022-03-28 | 2025-06-24 | 京东城市(北京)数字科技有限公司 | 地址库构建方法和装置 |
| CN115952779B (zh) * | 2023-03-13 | 2023-09-29 | 中规院(北京)规划设计有限公司 | 一种位置名称校准方法、装置、计算机设备及存储介质 |
| CN117828011A (zh) * | 2023-10-19 | 2024-04-05 | 深圳市美的支付科技有限公司 | 地址文本查询方法、电子设备及计算机可读存储介质 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102024024A (zh) * | 2010-11-10 | 2011-04-20 | 百度在线网络技术(北京)有限公司 | 地址数据库的建构方法及装置 |
| CN102682128A (zh) * | 2012-05-17 | 2012-09-19 | 厦门雅迅网络股份有限公司 | 一种用于兴趣点信息的排重方法 |
| CN103428164A (zh) * | 2012-05-15 | 2013-12-04 | 腾讯科技(深圳)有限公司 | 用户社交网络关系圈划分方法和系统 |
| CN103425648A (zh) * | 2012-05-15 | 2013-12-04 | 腾讯科技(深圳)有限公司 | 关系圈的处理方法和系统 |
| US20140108442A1 (en) * | 2012-10-16 | 2014-04-17 | Google Inc. | Person-based information aggregation |
| CN105320657A (zh) * | 2014-05-30 | 2016-02-10 | 中国电信股份有限公司 | 兴趣点数据融合方法和系统 |
Family Cites Families (24)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003067596A (ja) | 2001-08-30 | 2003-03-07 | Fujitsu Ltd | 売り手買い手の場所マッチング装置 |
| JP3803961B2 (ja) * | 2001-12-05 | 2006-08-02 | 日本電信電話株式会社 | データベース生成装置、データベース生成処理方法及びデータベース生成プログラム |
| US7885901B2 (en) * | 2004-01-29 | 2011-02-08 | Yahoo! Inc. | Method and system for seeding online social network contacts |
| US7743048B2 (en) * | 2004-10-29 | 2010-06-22 | Microsoft Corporation | System and method for providing a geographic search function |
| JP4687089B2 (ja) * | 2004-12-08 | 2011-05-25 | 日本電気株式会社 | 重複レコード検出システム、および重複レコード検出プログラム |
| US20140230030A1 (en) * | 2006-11-22 | 2014-08-14 | Raj Abhyanker | Method and apparatus for geo-spatial and social relationship analysis |
| US8050690B2 (en) * | 2007-08-14 | 2011-11-01 | Mpanion, Inc. | Location based presence and privacy management |
| US20090319515A1 (en) * | 2008-06-02 | 2009-12-24 | Steven Minton | System and method for managing entity knowledgebases |
| US20120317217A1 (en) * | 2009-06-22 | 2012-12-13 | United Parents Online Ltd. | Methods and systems for managing virtual identities |
| US20120051657A1 (en) * | 2010-08-30 | 2012-03-01 | Microsoft Corporation | Containment coefficient for identifying textual subsets |
| CN101996247B (zh) * | 2010-11-10 | 2013-02-20 | 百度在线网络技术(北京)有限公司 | 地址数据库的建构方法及装置 |
| KR101556714B1 (ko) * | 2011-01-03 | 2015-10-02 | 네이버 주식회사 | 검색결과 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 |
| US20120215853A1 (en) * | 2011-02-17 | 2012-08-23 | Microsoft Corporation | Managing Unwanted Communications Using Template Generation And Fingerprint Comparison Features |
| KR20120124581A (ko) | 2011-05-04 | 2012-11-14 | 엔에이치엔(주) | 개선된 유사 문서 탐지 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 |
| US8676937B2 (en) * | 2011-05-12 | 2014-03-18 | Jeffrey Alan Rapaport | Social-topical adaptive networking (STAN) system allowing for group based contextual transaction offers and acceptances and hot topic watchdogging |
| US8515964B2 (en) * | 2011-07-25 | 2013-08-20 | Yahoo! Inc. | Method and system for fast similarity computation in high dimensional space |
| CN102955832B (zh) * | 2011-08-31 | 2015-11-25 | 深圳市华傲数据技术有限公司 | 一种通讯地址识别、标准化的系统 |
| JP5866176B2 (ja) * | 2011-10-31 | 2016-02-17 | 日本郵便株式会社 | 住所録管理システム、住所録管理方法及び住所録管理プログラム |
| JP5676517B2 (ja) | 2012-04-12 | 2015-02-25 | 日本電信電話株式会社 | 文字列類似度計算装置、方法、及びプログラム |
| US20140214895A1 (en) * | 2013-01-31 | 2014-07-31 | Inplore | Systems and method for the privacy-maintaining strategic integration of public and multi-user personal electronic data and history |
| CN103473289A (zh) * | 2013-08-30 | 2013-12-25 | 深圳市华傲数据技术有限公司 | 一种通信地址补全的装置及方法 |
| CN104660581A (zh) * | 2014-11-28 | 2015-05-27 | 华为技术有限公司 | 一种为业务策略确定目标用户的方法、装置及系统 |
| CN105988988A (zh) | 2015-02-13 | 2016-10-05 | 阿里巴巴集团控股有限公司 | 文本地址处理方法及装置 |
| US10002292B2 (en) * | 2015-09-30 | 2018-06-19 | Microsoft Technology Licensing, Llc | Organizational logo enrichment |
-
2015
- 2015-02-13 CN CN201510079914.6A patent/CN105988988A/zh active Pending
-
2016
- 2016-02-04 SG SG11201706625YA patent/SG11201706625YA/en unknown
- 2016-02-04 EP EP16748705.7A patent/EP3258397A1/en not_active Withdrawn
- 2016-02-04 WO PCT/CN2016/073441 patent/WO2016127904A1/zh not_active Ceased
- 2016-02-04 JP JP2017542458A patent/JP6594988B2/ja active Active
- 2016-02-04 SG SG10201907254XA patent/SG10201907254XA/en unknown
- 2016-02-04 KR KR1020177025509A patent/KR102079860B1/ko active Active
-
2017
- 2017-08-11 US US15/675,177 patent/US10795964B2/en active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102024024A (zh) * | 2010-11-10 | 2011-04-20 | 百度在线网络技术(北京)有限公司 | 地址数据库的建构方法及装置 |
| CN103428164A (zh) * | 2012-05-15 | 2013-12-04 | 腾讯科技(深圳)有限公司 | 用户社交网络关系圈划分方法和系统 |
| CN103425648A (zh) * | 2012-05-15 | 2013-12-04 | 腾讯科技(深圳)有限公司 | 关系圈的处理方法和系统 |
| CN102682128A (zh) * | 2012-05-17 | 2012-09-19 | 厦门雅迅网络股份有限公司 | 一种用于兴趣点信息的排重方法 |
| US20140108442A1 (en) * | 2012-10-16 | 2014-04-17 | Google Inc. | Person-based information aggregation |
| CN105320657A (zh) * | 2014-05-30 | 2016-02-10 | 中国电信股份有限公司 | 兴趣点数据融合方法和系统 |
Non-Patent Citations (4)
| Title |
|---|
| PETER CHRISTEN1 等: "A Probabilistic Geocoding System", 《SPRINGER BERLIN HEIDELBERG》 * |
| 刘哲 等: "一种中文地址类相似重复信息的检测方法", 《小型微型计算机系统》 * |
| 张巍 等: "基于相似度模型的可融合兴趣点分类研究", 《中国海洋大学学报》 * |
| 戴冬冬: "基于地址匹配方法的POI数据更新研究", 《电脑知识与技术》 * |
Cited By (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108460046A (zh) * | 2017-02-21 | 2018-08-28 | 菜鸟智能物流控股有限公司 | 一种地址聚合的方法以及设备 |
| CN108804398A (zh) * | 2017-05-03 | 2018-11-13 | 阿里巴巴集团控股有限公司 | 地址文本的相似度计算方法及装置 |
| CN108536657A (zh) * | 2018-04-10 | 2018-09-14 | 百融金融信息服务股份有限公司 | 人为填写的地址文本相似度处理方法和系统 |
| CN113591453B (zh) * | 2018-04-10 | 2026-01-09 | 百融云创科技股份有限公司 | 人为填写的地址文本相似度处理方法和系统 |
| CN113591453A (zh) * | 2018-04-10 | 2021-11-02 | 百融云创科技股份有限公司 | 人为填写的地址文本相似度处理方法和系统 |
| CN108536657B (zh) * | 2018-04-10 | 2021-09-21 | 百融云创科技股份有限公司 | 人为填写的地址文本相似度处理方法和系统 |
| CN108876440B (zh) * | 2018-05-29 | 2021-09-03 | 创新先进技术有限公司 | 区域划分方法和服务器 |
| CN108876440A (zh) * | 2018-05-29 | 2018-11-23 | 阿里巴巴集团控股有限公司 | 区域划分方法和服务器 |
| CN109033225A (zh) * | 2018-06-29 | 2018-12-18 | 福州大学 | 中文地址识别系统 |
| CN109388634A (zh) * | 2018-09-18 | 2019-02-26 | 平安科技(深圳)有限公司 | 地址信息的处理方法、终端设备及计算机可读存储介质 |
| CN109388634B (zh) * | 2018-09-18 | 2024-05-03 | 平安科技(深圳)有限公司 | 地址信息的处理方法、终端设备及计算机可读存储介质 |
| CN111488334B (zh) * | 2019-01-29 | 2023-04-14 | 阿里巴巴集团控股有限公司 | 数据处理方法及电子设备 |
| CN111488334A (zh) * | 2019-01-29 | 2020-08-04 | 阿里巴巴集团控股有限公司 | 数据处理方法及电子设备 |
| CN111723164A (zh) * | 2019-03-18 | 2020-09-29 | 阿里巴巴集团控股有限公司 | 地址信息的处理方法和装置 |
| CN111723164B (zh) * | 2019-03-18 | 2023-12-12 | 阿里巴巴集团控股有限公司 | 地址信息的处理方法和装置 |
| CN112287671A (zh) * | 2020-09-29 | 2021-01-29 | 深圳市跨越新科技有限公司 | 基于simhash的地址解析方法及系统 |
| CN113761867A (zh) * | 2020-12-29 | 2021-12-07 | 京东城市(北京)数字科技有限公司 | 地址识别方法、装置、计算机设备及存储介质 |
| CN113761867B (zh) * | 2020-12-29 | 2025-03-18 | 京东城市(北京)数字科技有限公司 | 地址识别方法、装置、计算机设备及存储介质 |
| CN116402050A (zh) * | 2022-12-26 | 2023-07-07 | 北京码牛科技股份有限公司 | 一种地址归一化及补充方法、装置、电子设备及存储介质 |
| CN116402050B (zh) * | 2022-12-26 | 2023-11-10 | 北京码牛科技股份有限公司 | 一种地址归一化及补充方法、装置、电子设备及存储介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP3258397A4 (en) | 2017-12-20 |
| US10795964B2 (en) | 2020-10-06 |
| US20170337292A1 (en) | 2017-11-23 |
| WO2016127904A1 (zh) | 2016-08-18 |
| JP6594988B2 (ja) | 2019-10-23 |
| EP3258397A1 (en) | 2017-12-20 |
| KR102079860B1 (ko) | 2020-02-20 |
| KR20170117481A (ko) | 2017-10-23 |
| SG11201706625YA (en) | 2017-09-28 |
| SG10201907254XA (en) | 2019-09-27 |
| JP2018510410A (ja) | 2018-04-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN105988988A (zh) | 文本地址处理方法及装置 | |
| WO2020186901A1 (zh) | 基于区块链的数据核对系统、方法、计算设备及存储介质 | |
| CN113412608B (zh) | 内容推送方法、装置、服务端及存储介质 | |
| WO2019196549A1 (zh) | 确定高风险用户的方法及装置 | |
| CN106301978A (zh) | 团伙成员账号的识别方法、装置及设备 | |
| US20240354192A1 (en) | Storage Network with Audit Records Aggregation and Methods for Use Therewith | |
| CN110324314B (zh) | 用户注册方法及装置、存储介质、电子设备 | |
| US10992972B1 (en) | Automatic identification of impermissable account sharing | |
| WO2016101811A1 (zh) | 一种信息排序方法及装置 | |
| CN110705851A (zh) | 交易风险控制方法、装置及电子设备 | |
| CN110135978A (zh) | 用户金融风险评估方法、装置、电子设备和可读介质 | |
| CN106294524A (zh) | 一种关系数据的处理方法和装置 | |
| CN110148053A (zh) | 用户信贷额度评估方法、装置、电子设备和可读介质 | |
| CN106960391A (zh) | 一种用户信息聚合方法、系统和装置 | |
| US10943016B2 (en) | System and method for managing data including identifying a data protection pool based on a data classification analysis | |
| JP2019530046A (ja) | コンピュータシステムからのユーザ情報の収集 | |
| CN115145587A (zh) | 一种产品参数校验方法、装置、电子设备及存储介质 | |
| CN112528327A (zh) | 数据脱敏方法及装置、数据还原方法及装置 | |
| CN110288358A (zh) | 一种设备团体确定方法、装置、设备及介质 | |
| CN110175833A (zh) | 一种绑定银行卡信息的计算机装置、方法、系统及介质 | |
| KR102375144B1 (ko) | 블록체인을 이용하여 개인키를 관리하는 장치, 방법, 시스템 및 컴퓨터 판독가능 저장 매체 | |
| CN107295086B (zh) | 集群会话防丢失方法及系统 | |
| CN108234454A (zh) | 一种身份认证方法、服务器及客户端设备 | |
| CN110599278B (zh) | 聚合设备标识符的方法、装置和计算机存储介质 | |
| CN115688199A (zh) | 智能设备的密钥生成方法、装置、电子设备及介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| RJ01 | Rejection of invention patent application after publication | ||
| RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161005 |