CN108197188A - 地址信息处理方法及装置 - Google Patents
地址信息处理方法及装置 Download PDFInfo
- Publication number
- CN108197188A CN108197188A CN201711436074.XA CN201711436074A CN108197188A CN 108197188 A CN108197188 A CN 108197188A CN 201711436074 A CN201711436074 A CN 201711436074A CN 108197188 A CN108197188 A CN 108197188A
- Authority
- CN
- China
- Prior art keywords
- address information
- address
- style
- described address
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
Abstract
本发明实施例提供一种地址信息处理方法及装置,涉及数据挖掘领域。其中,所述方法包括:获取地址信息;根据所述地址信息和设定的正则表达式进行匹配处理,其中,所述正则表达式包含地址类型及其判定条件;根据所述匹配结果确定所述地址信息所属的地址类型。本发明实施例提供的技术方案能够自动且准确地确定地址类型。
Description
技术领域
本发明实施例涉及数据挖掘领域,尤其涉及一种地址信息处理方法及装置。
背景技术
互联网技术的不断发展已经大大改变了人们的生活方式,比如人们的出行方式、购物方式、配送方式等都在发生巨大变化,为满足用户的各种需求,开发出了各种相应的应用(Application,简称APP)。
随着个性化推荐技术的发展,在例如以外卖场景为例的多种场景下,各种应用需要根据用户地址进行个性化推荐服务。然而,现有技术环境下通常由用户指定用户地址相关的信息(例如,地址类型),却未意识到用户指定所存在的局限性已经难以满足用户日益提高的体验要求,并且,也无法满足信息处理自动化的需求。
发明内容
本发明实施例提供一种地址信息处理方法及装置,用以解决现有技术用户体验差、无法自动且准确地确定地址类型的技术问题。
第一方面,本发明实施例中提供了一种地址信息处理方法,包括:
获取地址信息;
根据所述地址信息和设定的正则表达式进行匹配处理,其中,所述正则表达式包含地址类型及其判定条件,所述判定条件包括满足所述地址类型的地址信息应当包含的文字、数字或文字与数字的组合方式;
根据所述匹配结果确定所述地址信息所属的地址类型。
结合第一方面,本发明在第一方面的第一种实现方式中,所述方法还包括:
根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理。
结合第一方面或第一方面的第一实现方式,本发明在第一方面的第二种实现方式中,所述根据所述地址信息和设定的正则表达式进行匹配处理包括:
将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。
结合第一方面或第一方面的第一实现方式,本发明在第一方面的第三种实现方式中,所述根据所述地址信息和设定的正则表达式进行匹配处理包括:
将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。
结合第一方面的第三种实现方式,本发明在第一方面的第四种实现方式中,所述根据所述匹配结果确定所述地址信息所属的地址类型,包括:
根据所述地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。
第二方面,本发明实施例提供了一种地址信息处理装置,包括:
获取模块,用于获取地址信息;
匹配模块,用于根据所述地址信息和设定的正则表达式进行匹配处理,其中,所述正则表达式包含地址类型及其判定条件,所述判定条件包括满足所述地址类型的地址信息应当包含的文字、数字或文字与数字的组合方式;
确定模块,用于根据所述匹配结果确定所述地址信息所属的地址类型。
结合第二方面,本发明在第二方面的第一种实现方式中,所述装置还包括:
信息处理模块,用于根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理。
结合第二方面或第二方面的第一种实现方式,本发明在第二方面的第二种实现方式中,所述匹配模块包括:
第一匹配子模块,用于将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。
结合第二方面或第二方面的第一种实现方式,本发明在第二方面的第三种实现方式中,所述匹配模块包括:
第二匹配子模块,用于将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。
结合第二方面的第三种实现方式,本发明在第二方面的第四种实现方式中,所述确定模块具体用于:
根据地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。
第三方面,本发明实施例提供了一种电子设备,包括存储器和处理器;其中,
所述存储器用于存储一条或多条计算机指令,所述一条或多条计算机指令供所述处理器调用执行;
所述处理器用于执行所述一条或多条计算机指令从而实现如前述第一方面或其实现方式提供的地址信息处理方法。
第四方面,本发明实施例提供了一种计算机存储介质,所述计算机存储介质存储有一条或多条计算机指令,所述计算机指令被执行时实现如前述第一方面或其实现方式提供的地址信息处理方法。
本发明实施例能够自动、准确地确定地址类型。
本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明一个实施例的地址信息处理方法的流程示意图;
图2示出了根据本发明另一个实施例的地址信息处理方法的流程示意图;
图3示出了根据本发明再一个实施例的地址信息处理方法的流程示意图;
图4示出了根据本发明一个实施例的地址信息处理装置的框图;
图5示出了图4所示地址信息处理装置的匹配模块的框图的一例;
图6示出了根据本发明另一个实施例的地址信息处理装置的框图;
图7示出了图6所示地址信息处理装置的匹配模块的框图的一例;
图8示出了根据本发明一个实施例的电子设备的框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例所获得的所有其他实施例,都属于本发明保护的范围。
图1是根据本发明一个实施例的地址信息处理方法的流程示意图,参照图1,所述方法包括:
100:获取地址信息。
在本发明中,所述地址信息可以是文字,也可以是具有文字含义的字符、符号等。
102:根据所述地址信息和设定的正则表达式进行匹配处理。其中,所述正则表达式包含地址类型及其判定条件。所述判定条件包括满足所述地址类型的地址信息应当包含的信息,包括文字、数字或文字与数字的组合方式。
104:根据所述匹配结果确定所述地址信息所属的地址类型。
采用本实施例提供的方法,通过正则表达式对地址信息进行匹配处理进而确定地址类型,有利于自动且准确地确定地址类型。
可选地,在本实施例的一种实现方式中,所述处理102采用以下方式实现:将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。其中,所述一个与所述地址信息匹配的地址类型即后续在104中确定的所述地址信息所属的地址类型。
可选地,在本实施例的一种实现方式中,所述处理102采用以下方式实现:将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。所述地址类型集包括一个或一个以上的地址类型。在所述地址类型集仅包含一个地址类型时,则在处理104中,该一个地址类型即所述地址信息所属的地址类型;在所述地址类型集仅包含一个以上地址类型时,在处理104中,根据所述地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。
可选地,在本实施例的一种实现方式中,不对所述地址信息进行诸如分词、切词等处理,降低数据处理量。
图2示出了根据本发明一个实施例的地址信息处理方法的流程示意图,参照图1,所述方法包括:
200:获取地址信息。
在本发明中,所述地址信息可以是文字,也可以是具有文字含义的字符、符号等。
202:根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息。
204:根据所述部分地址信息和设定的正则表达式进行匹配处理。其中,所述正则表达式包含地址类型及其判定条件。所述判定条件包括满足所述地址类型的地址信息应当包含的信息,包括文字、数字或文字与数字的组合。
206:根据所述匹配结果确定所述地址信息所属的地址类型。
采用本实施例提供的方法,通过正则表达式对地址信息进行匹配处理进而确定地址类型,有利于自动且准确地确定地址类型。并且,通过根据方位词选取部分地址信息进行处理,有利于提高处理效率。
可选地,在本实施例的一种实现方式中,在处理202中,方位词包括:“旁边”、“附近”、“对面”等。所述部分地址信息为所述地址信息中位于所述方位词后面的部分。
可选地,在本实施例的一种实现方式中,所述处理204采用以下方式实现:将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。其中,所述一个与所述地址信息匹配的地址类型即后续在206中确定的所述地址信息所属的地址类型。
可选地,在本实施例的一种实现方式中,所述处理204采用以下方式实现:将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。所述地址类型集包括一个或一个以上的地址类型。在所述地址类型集仅包含一个地址类型时,则在处理206中,该一个地址类型即所述地址信息所属的地址类型;在所述地址类型集仅包含一个以上地址类型时,在处理206中,根据所述地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。
可选地,在本实施例的一种实现方式中,除了选取部分地址信息之外,不对所述地址信息进行诸如分词、切词等处理,降低数据处理量。
图3示出了根据本发明一个实施例的地址信息处理方法的流程示意图。参照图3,所述方法包括:
300:划分地址类型。
具体而言,在本实施例中,将用户地址类型划分为:办公场所、住宅、学校、医院、酒店、娱乐场所、其他这七大类。具体描述如下表1所示。
办公场所 | 指的是写字楼等白领工作地址。 |
住宅 | 指的是小区等用户所住地址。 |
学校 | 指的是大学等学生学习地址。 |
医院 | 包括医院、小诊所等看病地址。 |
酒店 | 指的是宾馆、酒店等临时外出所住地址。 |
娱乐场所 | 指网吧、ktv等用户娱乐的地址。 |
其他 | 指的是除上述之外的其他地址。 |
在本实施例,通过正则匹配的方式来识别地址,即通过定义每个地址类型的正则表达式,然后通过正则表达式来匹配地址类型,其中,正则表达式可以看做是查找串。
302:确定每个地址类型的正则表达式。
令Rep(x)表示x的正则表达式,根据现有地址数据,将上述六种地址类型的正则表示式确定如下:
Rep(办公场所)=大厦|商厦|写字楼|办公楼|公司|银行|.座|集团|软件园|研究院|产业园|.店|.中心
Rep(住宅)=住宅|小区|家园|嘉园|家苑|家属院|((区|园|苑).+(号楼|栋|幢|排))|单元|公寓|嘉苑
Rep(学校)=学校|大学|宿舍|学院|中学|小学|校区|教学楼|学生公寓|幼儿园
Rep(医院)=医院|门诊|附属医院|护士站|手术室|急诊|(放射|妇|内|外|产|儿|骨|检验)科|住院部|病区|医生|住院楼|护理|手术室|病房
Rep(娱乐场所)=网吧|网咖|ktv|酒吧|酒楼|洗浴
Rep(酒店)=酒店|宾馆|旅馆|旅店
正则表达式的具体含义如下:
|表示或,如:Rep(x)=大厦|商厦表示匹配到大厦或者商厦。
.表示匹配到任何文字。
+表示匹配到前面的文字一次或无限次,
如:Rep(x)=((区|园|苑).+(号楼|栋|幢|排))表示匹配到xx区xx栋或者xx园xx号楼等文字模式。
304:确定分类候选集合C。
对每一个收餐地址,先判定地址中是否有旁边、对面、附近这三个词,如果有,则截取这三个词后面的词作为收餐地址,(如收餐地址为湖南大学对面的7天酒店,则选择7天酒店作为地址),然后循环判定是否匹配步骤302中的六个正则表达式,每匹配到一个,则将对应分类加入候选集合C中。如C的可能取值为【办公场所、学校】,这表示用户的地址同时满足正则表达式Rep(办公场所)和Rep(学校)。
306:从候选集C中选择优先级较高的分类作为地址类型。
可选地,在本实施例中,各地址类型的优先级顺序如下:
娱乐场所>酒店>医院>学校>办公场所>住宅>其他
如C=【办公场所、学校】,则将该地址类型定为学校。
如上,对本发明各种实施例及其实现方式进行了详细说明。为了验证本发明的效果,发明人随机从采用本发明各实施例提供的方法所判定的订单中抽取200个地址进行人工判定,其中正确分类的地址数为185个,正确率达到92.5%。因此,采用本发明各实施例或其实现方式所提供的方法,能够高效、自动且准确地确定地址类型。
图4是根据本发明一个实施例的地址信息处理装置的框图。参照图4,地址信息处理装置包括获取模块40、匹配模块42和确定模块44。下面进行详细说明。
在本实施例中,获取模块40用于获取地址信息。
其中,所述地址信息可以是文字,也可以是具有文字含义的字符、符号等。
在本实施例中,匹配模块42用于根据所述地址信息和设定的正则表达式进行匹配处理。其中,所述正则表达式包含地址类型及其判定条件。所述判定条件包括满足所述地址类型的地址信息应当包含的信息,包括文字、数字或文字与数字的组合。
在本实施例中,确定模块44用于根据所述匹配结果确定所述地址信息所属的地址类型。
采用本实施例提供的装置,通过正则表达式对地址信息进行匹配处理进而确定地址类型,有利于自动且准确地确定地址类型。
可选地,在本实施例的一种实现方式中,如图5所示,所述匹配模块42包括第一匹配子模块420,用于将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。其中,所述一个与所述地址信息匹配的地址类型即后续由确定模块44确定的所述地址信息所属的地址类型。
可选地,在本实施例的一种实现方式中,如图5所示,所述匹配模块42包括第二匹配子模块422,用于将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。在所述地址类型集仅包含一个地址类型时,则确定模块44将该一个地址类型确定为所述地址信息所属的地址类型;在所述地址类型集仅包含一个以上地址类型时,则确定模块44根据所述地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。
图6是根据本发明一个实施例的地址信息处理装置的框图。参照图6,地址信息处理装置包括获取模块60、信息处理模块61、匹配模块62和确定模块64。下面进行详细说明。
在本实施例中,获取模块60用于获取地址信息。
其中,所述地址信息可以是文字,也可以是具有文字含义的字符、符号等。
在本实施例中,信息处理模块61用于根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理。示例性地,所述方位词包括“对面”、“附近”等,所述部分地址信息为所述方位词后面的信息。
在本实施例中,匹配模块62用于根据所述部分地址信息和设定的正则表达式进行匹配处理。其中,所述正则表达式包含地址类型及其判定条件。所述判定条件包括满足所述地址类型的地址信息应当包含的信息,包括文字、数字或文字与数字的组合。
在本实施例中,确定模块64用于根据所述匹配结果确定所述地址信息所属的地址类型。
采用本实施例提供的装置,通过正则表达式对地址信息进行匹配处理进而确定地址类型,有利于自动且准确地确定地址类型。
可选地,在本实施例的一种实现方式中,如图7所示,所述匹配模块62包括第一匹配子模块620,用于将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。其中,所述一个与所述地址信息匹配的地址类型即后续由确定模块64确定的所述地址信息所属的地址类型。
可选地,在本实施例的一种实现方式中,如图7所示,所述匹配模块62包括第二匹配子模块622,用于将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。在所述地址类型集仅包含一个地址类型时,则确定模块64将该一个地址类型确定为所述地址信息所属的地址类型;在所述地址类型集仅包含一个以上地址类型时,则确定模块44根据所述地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。
图8示出了根据本发明一个实施例的电子设备(例如,计算机等)的框图。参照图8,所述电子设备包括一个或多个存储器80和一个或多个处理器82。其中,所述一个或多个存储器80用于存储一条或多条计算机指令;所述一个或多个处理器82用于调用和执行所述一条或多条计算机指令从而实现本发明各个实施例或其实现方式所提供的地址信息处理方法。
可选地,在本实施例的一种实现方式中,如图8中虚线框所示,所述电子设备还包括用于进行数据通信的输入输出接口。
除了以上所述的实施例之外,本发明的一种实施例还提供一种计算机存储介质,存储有一条或多条计算机指令,所述一条户多条计算机指令被执行时实现本发明各个实施例或其实现方式所提供的地址信息处理方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
本发明公开A1.一种地址信息处理方法,包括:
获取地址信息;
根据所述地址信息和设定的正则表达式进行匹配处理,其中,所述正则表达式包含地址类型及其判定条件,所述判定条件包括满足所述地址类型的地址信息应当包含的文字、数字或文字与数字的组合方式;
根据所述匹配结果确定所述地址信息所属的地址类型。
A2.如A1所述的方法,所述方法还包括:
根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理。
A3.如A1或A2所述的方法,所述根据所述地址信息和设定的正则表达式进行匹配处理包括:
将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。
A4.如A1或A2所述的方法,所述根据所述地址信息和设定的正则表达式进行匹配处理包括:
将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。
A5.如A4所述的方法,所述根据所述匹配结果确定所述地址信息所属的地址类型,包括:
根据所述地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。
本发明还公开B6.一种地址信息处理装置,包括:
获取模块,用于获取地址信息;
匹配模块,用于根据所述地址信息和设定的正则表达式进行匹配处理,其中,所述正则表达式包含地址类型及其判定条件,所述判定条件包括满足所述地址类型的地址信息应当包含的文字、数字或文字与数字的组合方式;
确定模块,用于根据所述匹配结果确定所述地址信息所属的地址类型。
B7.如B6所述的装置,所述装置还包括:
信息处理模块,用于根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理。
B8.如B6或B7所述的装置,所述匹配模块包括:
第一匹配子模块,用于将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。
B9.如B6或B7所述的装置,所述匹配模块包括:
第二匹配子模块,用于将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。
B10.如B9所述的装置,所述确定模块具体用于:
根据地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。
本发明还公开C11.一种计算机存储介质,存储有一条或多条计算机指令,所述一条或多条计算机指令被执行时实现如A1-A5中任一项所述的方法。
本发明还公开D12.一种电子设备,包括:
一个或多个存储器,用于存储一条或多条计算机指令;
一个或多个处理器,用于调用和执行所述一条或多条计算机指令,从而实现如A1-A5中任一项所述的方法。
Claims (10)
1.一种地址信息处理方法,其特征在于,包括:
获取地址信息;
根据所述地址信息和设定的正则表达式进行匹配处理,其中,所述正则表达式包含地址类型及其判定条件,所述判定条件包括满足所述地址类型的地址信息应当包含的文字、数字或文字与数字的组合方式;
根据所述匹配结果确定所述地址信息所属的地址类型。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理。
3.如权利要求1或2所述的方法,其特征在于,所述根据所述地址信息和设定的正则表达式进行匹配处理包括:
将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。
4.如权利要求1或2所述的方法,其特征在于,所述根据所述地址信息和设定的正则表达式进行匹配处理包括:
将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。
5.如权利要求4所述的方法,其特征在于,所述根据所述匹配结果确定所述地址信息所属的地址类型,包括:
根据所述地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。
6.一种地址信息处理装置,其特征在于,包括:
获取模块,用于获取地址信息;
匹配模块,用于根据所述地址信息和设定的正则表达式进行匹配处理,其中,所述正则表达式包含地址类型及其判定条件,所述判定条件包括满足所述地址类型的地址信息应当包含的文字、数字或文字与数字的组合方式;
确定模块,用于根据所述匹配结果确定所述地址信息所属的地址类型。
7.如权利要求6所述的装置,其特征在于,所述装置还包括:
信息处理模块,用于根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理。
8.如权利要求6或7所述的装置,其特征在于,所述匹配模块包括:
第一匹配子模块,用于将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。
9.如权利要求6或7所述的装置,其特征在于,所述匹配模块包括:
第二匹配子模块,用于将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。
10.如权利要求9所述的装置,其特征在于,所述确定模块具体用于:
根据地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711436074.XA CN108197188B (zh) | 2017-12-26 | 2017-12-26 | 地址信息处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711436074.XA CN108197188B (zh) | 2017-12-26 | 2017-12-26 | 地址信息处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108197188A true CN108197188A (zh) | 2018-06-22 |
CN108197188B CN108197188B (zh) | 2020-06-30 |
Family
ID=62584356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711436074.XA Active CN108197188B (zh) | 2017-12-26 | 2017-12-26 | 地址信息处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108197188B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109359249A (zh) * | 2018-09-29 | 2019-02-19 | 清华大学 | 基于学者科研成果挖掘的学者精准定位方法及装置 |
CN109657163A (zh) * | 2018-12-19 | 2019-04-19 | 拉扎斯网络科技(上海)有限公司 | 目的地址确定方法、装置、电子设备和存储介质 |
CN111784215A (zh) * | 2019-04-03 | 2020-10-16 | 北京京东尚科信息技术有限公司 | 一种获取站点信息的方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060074852A1 (en) * | 2002-07-29 | 2006-04-06 | Microsoft Corporation | Method and data structure for performing regular expression searches in a fixed length word language |
CN102902780A (zh) * | 2012-09-28 | 2013-01-30 | 五八有限公司 | 一种统一资源定位符url动态匹配方法及装置 |
CN104899252A (zh) * | 2015-05-12 | 2015-09-09 | 北京嘀嘀无限科技发展有限公司 | 一种信息推送的方法及装置 |
CN105528372A (zh) * | 2014-09-30 | 2016-04-27 | 华为技术有限公司 | 一种地址搜索方法和设备 |
CN107145577A (zh) * | 2017-05-08 | 2017-09-08 | 上海东方网络金融服务有限公司 | 地址标准化方法、装置、存储介质及计算机 |
-
2017
- 2017-12-26 CN CN201711436074.XA patent/CN108197188B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060074852A1 (en) * | 2002-07-29 | 2006-04-06 | Microsoft Corporation | Method and data structure for performing regular expression searches in a fixed length word language |
CN102902780A (zh) * | 2012-09-28 | 2013-01-30 | 五八有限公司 | 一种统一资源定位符url动态匹配方法及装置 |
CN105528372A (zh) * | 2014-09-30 | 2016-04-27 | 华为技术有限公司 | 一种地址搜索方法和设备 |
CN104899252A (zh) * | 2015-05-12 | 2015-09-09 | 北京嘀嘀无限科技发展有限公司 | 一种信息推送的方法及装置 |
CN107145577A (zh) * | 2017-05-08 | 2017-09-08 | 上海东方网络金融服务有限公司 | 地址标准化方法、装置、存储介质及计算机 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109359249A (zh) * | 2018-09-29 | 2019-02-19 | 清华大学 | 基于学者科研成果挖掘的学者精准定位方法及装置 |
CN109359249B (zh) * | 2018-09-29 | 2020-07-10 | 清华大学 | 基于学者科研成果挖掘的学者精准定位方法及装置 |
CN109657163A (zh) * | 2018-12-19 | 2019-04-19 | 拉扎斯网络科技(上海)有限公司 | 目的地址确定方法、装置、电子设备和存储介质 |
CN109657163B (zh) * | 2018-12-19 | 2022-01-18 | 拉扎斯网络科技(上海)有限公司 | 目的地址确定方法、装置、电子设备和存储介质 |
CN111784215A (zh) * | 2019-04-03 | 2020-10-16 | 北京京东尚科信息技术有限公司 | 一种获取站点信息的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108197188B (zh) | 2020-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105335409B (zh) | 一种目标用户的确定方法、设备和网络服务器 | |
CN107133345A (zh) | 基于人工智能的交互方法和装置 | |
CN110060090A (zh) | 推荐商品组合的方法、装置、电子设备及可读存储介质 | |
CN106991576A (zh) | 一种地理区域的热力展现方法和装置 | |
CN104954410A (zh) | 消息推送方法、装置及服务器 | |
CN105283845A (zh) | 显示对象预生成 | |
CN106503006A (zh) | 应用App中子应用的排序方法及装置 | |
CN108197188A (zh) | 地址信息处理方法及装置 | |
CN104866522A (zh) | 一种为提问者提供回答信息的方法与装置 | |
CN103019730B (zh) | 一种界面元素展示的方法及电子设备 | |
CN107944481A (zh) | 用于生成信息的方法和装置 | |
CN107292365A (zh) | 商品标签的绑定方法、装置、设备及计算机可读存储介质 | |
CN109902713A (zh) | 基于数据分析的楼盘推荐方法、设备、存储介质及装置 | |
CN108153719A (zh) | 合并电子表格的方法和装置 | |
CN109033266A (zh) | 信息投放方法、装置、电子设备及计算机可读介质 | |
CN106027633A (zh) | 应用推送方法、应用推送系统及终端设备 | |
CN104079640A (zh) | 一种用户服务提供方法及系统 | |
CN105812423B (zh) | 一种云系统配置方法、服务器及装置 | |
CN107562942A (zh) | 内容推荐方法及其装置、设备以及计算机可读存储介质 | |
CN109428977A (zh) | 互动式语音应答交互方法和装置 | |
CN107274042A (zh) | 一种业务参与对象的风险识别方法及装置 | |
CN106919703A (zh) | 电影信息搜索方法及装置 | |
CN106779115A (zh) | 酒店自助服务方法及装置 | |
CN102687158A (zh) | 搜索项安全性 | |
CN104102328B (zh) | 信息处理方法和信息处理设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100085 Beijing, Haidian District on the road to the information on the ground floor of the 1 to the 3 floor of the 2 floor, room 11, 202 Applicant after: Beijing Xingxuan Technology Co., Ltd. Address before: 100085 Beijing, Haidian District on the road to the information on the ground floor of the 1 to the 3 floor of the 2 floor, room 11, 202 Applicant before: BEIJING XIAODU INFORMATION TECHNOLOGY CO., LTD. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |