CN110381115B - 信息推送方法、装置、计算机可读存储介质和计算机设备 - Google Patents

信息推送方法、装置、计算机可读存储介质和计算机设备 Download PDF

Info

Publication number
CN110381115B
CN110381115B CN201910517834.2A CN201910517834A CN110381115B CN 110381115 B CN110381115 B CN 110381115B CN 201910517834 A CN201910517834 A CN 201910517834A CN 110381115 B CN110381115 B CN 110381115B
Authority
CN
China
Prior art keywords
similarity
participles
word
digital
candidate user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910517834.2A
Other languages
English (en)
Other versions
CN110381115A (zh
Inventor
张二红
朱娜
郑哲青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910517834.2A priority Critical patent/CN110381115B/zh
Priority to PCT/CN2019/103023 priority patent/WO2020248377A1/zh
Publication of CN110381115A publication Critical patent/CN110381115A/zh
Application granted granted Critical
Publication of CN110381115B publication Critical patent/CN110381115B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种信息推送方法、装置、计算机可读存储介质和计算机设备,应用于数据分析技术领域。所述的方法包括:获取候选用户的公司全称;对所述候选用户的公司全称进行分词,获得所述候选用户的分词集合;将所述候选用户的分词集合中各个分词转换为对应的数字标识,获得所述候选用户的数字标识集合;将所述候选用户的数字标识集合与目标用户的数字标识集合进行匹配;所述目标用户的数字标识集合通过同一方式对所述目标用户的公司全称处理得到;若匹配一致,将所述候选用户的信息推送给所述目标用户。本申请实施例提高了公司名称匹配的计算效率。

Description

信息推送方法、装置、计算机可读存储介质和计算机设备
技术领域
本申请涉及数据分析技术领域,具体而言,本申请涉及一种信息推送方法、装置、计算机可读存储介质和计算机设备。
背景技术
信息推送是当今互联网非常火热的一个技术方向。所谓信息推送,就是"web(World Wide Web,万维网)广播",是通过一定的技术标准或协议,在互联网上通过定期传送用户需要的信息来减少信息过载的一项新技术。推送技术通过自动传送信息给用户,来减少用于网络上搜索的时间。它根据用户的兴趣来搜索、过滤信息,并将其定期推给用户,帮助用户高效率地发掘有价值的信息。
基于对信息推送的准确性的需求,用户之间的关系亲密度变得越来越重要,尤其是用户之间的同事关系亲密度。服务器通常需要基于同事之间的亲密度来进行信息推送,比如,将其中一个用户关注的信息推送给与该用户具有同事关系且亲密度较高的其它用户。
目前在判断同事之间的亲密度时,采用的方式为将目标用户的公司全称和候选用户的公司全称进行匹配,若是公司全称相同,则判定亲密度较高,将候选用户的信息推送给目标用户,否则判定亲密度较低,不执行候选用户的信息推送,但是该种方式存在计算效率较低的缺陷。
发明内容
本申请针对现有方式的缺点,提出一种信息推送方法、装置、计算机可读存储介质和计算机设备,以提高公司名称匹配的计算效率。
本申请的实施例根据第一个方面,提供了一种信息推送方法,包括:
获取候选用户的公司全称;
对所述候选用户的公司全称进行分词,获得所述候选用户的分词集合;
将所述候选用户的分词集合中各个分词转换为对应的数字标识,获得所述候选用户的数字标识集合;
将所述候选用户的数字标识集合与目标用户的数字标识集合进行匹配;所述目标用户的数字标识集合通过同一方式对所述目标用户的公司全称处理得到;
若匹配一致,将所述候选用户的信息推送给所述目标用户。
在一个实施例中,所述对所述候选用户的公司全称进行分词,获得所述候选用户的分词集合,包括:
根据预先设置的表征地域的词库,从所述候选用户的公司全称中筛选出地域分词;
根据预先设置的表征行业的词库,从所述候选用户的公司全称中筛选出行业分词;
根据预先设置的表征结束语的词库,从所述候选用户的公司全称中筛选出结束语分词;所述结束语用于描述公司的组织形式;
将从所述候选用户的公司全称中去除所述地域分词、所述行业分词和所述结束语分词之后得到的分词作为商号分词;
由所述候选用户的地域分词、行业分词、结束语分词和商号分词构成所述候选用户的分词集合。
在一个实施例中,所述将所述候选用户的数字标识集合与目标用户的数字标识集合进行匹配,包括:
将所述候选用户的数字标识集合中的地域分词的数字标识、行业分词的数字标识、结束语分词的数字标识、商号分词的数字标识,与所述目标用户的数字标识集合中的地域分词的数字标识、行业分词的数字标识、结束语分词的数字标识、商号分词的数字标识进行同类匹配,获得地域分词的相似度、行业分词的相似度、结束语分词的相似度和商号分词的相似度;
计算所述地域分词的相似度、所述行业分词的相似度、所述结束语分词的相似度和商号分词的相似度的权重和;所述商号分词的相似度对应的权重、所述行业分词的相似度对应的权重、所述地域分词的相似度对应的权重和所述结束语分词的相似度对应的权重依次降低;
若所述权重和大于第一预设值,判定匹配一致,否则判定不匹配。
在一个实施例中,所述将所述候选用户的分词集合中各个分词转换为对应的数字标识,获得所述候选用户的数字标识集合,包括:
将预先设置的表征地域的词库的数字标识与所述地域分词在表征地域的词库中的位置序号组合,得到所述地域分词的数字标识;
将预先设置的表征行业的词库的数字标识与所述行业分词在表征行业的词库中的位置序号组合,得到所述行业分词的数字标识;
将预先设置的表征结束语的词库的数字标识与所述结束语分词在表征结束语的词库中的位置序号组合,得到所述结束语分词的数字标识;
获取所述商号分词的汉语拼音,将所述汉语拼音中各个字母在汉语拼音字母表中的位置序号组合,得到所述商号分词的数字标识;
由所述地域分词的数字标识、所述行业分词的数字标识、所述结束语分词的数字标识和所述商号分词的数字标识构成所述候选用户的数字标识集合。
在一个实施例中,所述将所述候选用户的信息推送给所述目标用户,包括:
获取所述候选用户在其公司全称所指示公司的工作信息,以及所述目标用户在其公司全称所指示公司的工作信息;
计算所述候选用户的工作信息与所述目标用户的工作信息之间的相似度;
若相似度大于第二预设值,将所述候选用户的信息推送给所述目标用户。
在一个实施例中,所述计算所述候选用户的工作信息与所述目标用户的工作信息之间的相似度,包括:
获取所述候选用户的互动关系信息和所述目标用户的互动关系信息;
计算所述候选用户的互动关系信息和所述目标用户的互动关系信息之间的相似度;
根据工作信息之间的相似度和互动关系信息之间的相似度,获得所述候选用户和所述目标用户之间最终的相似度。
在一个实施例中,所述工作信息包括在职年份、岗位、项目名称、工作经历和工作城市;
所述计算所述候选用户的工作信息与所述目标用户的工作信息之间的相似度,包括:
将所述候选用户的在职年份、岗位、项目名称、工作经历和工作城市和所述目标用户的在职年份、岗位、项目名称、工作经历和工作城市进行同类匹配,获得在职年份的相似度、岗位的相似度、项目名称的相似度、工作经历的相似度和工作城市的相似度;
计算所述在职年份的相似度、所述岗位的相似度、所述项目名称的相似度、所述工作经历的相似度和所述工作城市的相似度的权重和,得到所述候选用户的工作信息与所述目标用户的工作信息之间的相似度。
本申请的实施例根据第二个方面,还提供了一种信息推送装置,包括:
公司全称获取模块,用于获取候选用户的公司全称;
分词模块,用于对所述候选用户的公司全称进行分词,获得所述候选用户的分词集合;
数字标识转换模块,用于将所述候选用户的分词集合中各个分词转换为对应的数字标识,获得所述候选用户的数字标识集合;
匹配模块,用于将所述候选用户的数字标识集合与目标用户的数字标识集合进行匹配;所述目标用户的数字标识集合通过同一方式对所述目标用户的公司全称处理得到;
信息推送模块,用于在匹配一致时,将所述候选用户的信息推送给所述目标用户。
本申请的实施例根据第三个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任意一项所述的信息推送方法。
本申请的实施例根据第四个方面,还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一项所述的信息推送方法。
上述的信息推送方法、装置、计算机可读存储介质和计算机设备,将公司全称转换成数字标识集合,通过分词的数字标识匹配代替公司全称的匹配,由于数字标识的匹配效率要高于汉字字符的匹配效率,因此通过该种方式大大提高了公司名称匹配的计算效率。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请一个实施例的信息推送方法的示意图;
图2为本申请一个实施例的信息推送装置的示意图;
图3为本申请一个实施例的计算机设备的示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
如图1所示,为一实施例的信息推送方法的示意图,该方法包括:
S110、获取候选用户的公司全称。
本申请中,目标用户为被推送信息的对象,候选用户为可能的向目标用户推送信息的对象。在需要确定是否可以向目标用户推送候选用户的信息时,首先获取候选用户的公司全称。公司全称的数据来源可以是候选用户在求职网站上填写的信息,也可以是候选用户直接在界面中输入的信息等等。
S120、对所述候选用户的公司全称进行分词,获得所述候选用户的分词集合。
分词(Word Segmentation)指的是将一个汉字序列切分成一个个单独的词。对公司全称进行分词,获得公司全称的若干个单独的词,该若干个单独的词构成分词集合。
S130、将所述候选用户的分词集合中各个分词转换为对应的数字标识,获得所述候选用户的数字标识集合。
考虑到数字标识的匹配效率一般高于汉字字符的匹配效率,因此得到候选用户的分词集合后,将分词集合中各个字符按照一定的方式转换成数字标识,得到候选用户的数字标识集合。
S140、将所述候选用户的数字标识集合与目标用户的数字标识集合进行匹配;所述目标用户的数字标识集合通过同一方式对所述目标用户的公司全称处理得到。
通过同一方式对目标用户的公司全称进行处理,获得目标用户的数字标识集合,即按照相同的分词规则对目标用户的公司全称进行分词,获得目标用户的分词集合,按照相同的转换规则将目标用户的分词集合中各个分词转换为对应的数字标识,获得候选用户的数字标识集合。为了判定目标用户和候选用户是否属于同一个公司,将候选用户的数字标识集合和目标用户的数字标识集合进行匹配。
S150、若匹配一致,将所述候选用户的信息推送给所述目标用户。
如果匹配一致,说明候选用户与目标用户属于同一个公司,将候选用户的信息,例如候选用户的身份信息,或者候选用户关注的产品信息,等等,推送给目标用户。否则,不将候选用户的信息推送给目标用户。
本实施例将公司全称转换成数字标识集合,通过分词的数字标识匹配代替公司全称的匹配,由于数字标识的匹配效率要高于汉字字符的匹配效率,因此通过该种方式大大提高了计算效率。
本申请的申请人经研究发现,公司全称一般由地域、商号、行业和结束语构成,因此,在一个实施例中,所述对所述候选用户的公司全称进行分词,获得所述候选用户的分词集合,包括:
S1201、根据预先设置的表征地域的词库,从所述候选用户的公司全称中筛选出地域分词。
地域指的是地理位置信息。考虑到地域的数量有限性,对于地域,可以预先建立地域的词库,例如国家、省份、城市等。从候选用户的公司全称中筛选出与该地域的词库中某一词语匹配的字符,该字符即为地域分词。
S1202、根据预先设置的表征行业的词库,从所述候选用户的公司全称中筛选出行业分词。
行业是指从事国民经济中同性质的生产或其他经济社会的经营单位或者个体的组织结构体系。考虑到行业的数量有限性,对于行业,可以预先建立行业的词库,例如食品、通信、金融等等。从候选用户的公司全称中筛选出与该行业的词库中某一词语匹配的字符,该字符即为行业分词。
S1203、根据预先设置的表征结束语的词库,从所述候选用户的公司全称中筛选出结束语分词;所述结束语用于描述公司的组织形式。
结束语用于描述公司的组织形式,一般为公司全称中的后面几个字符。考虑到结束语的数量有限性,对于结束语,可以预先建立结束语的词库,例如总公司、集团、分公司、有限公司等等。从候选用户的公司全称中筛选出与该结束语的词库中某一词语匹配的字符,该字符即为结束语分词。
S1204、将从所述候选用户的公司全称中去除所述地域分词、所述行业分词和所述结束语分词之后得到的分词作为商号分词。
商号作为企业特定化的标志,是企业具有法律人格的表现。考虑到商号的多样性,对于商号,将公司全称去除地域分词、行业分词和结束语分词后剩余的部分字段作为商号分词。
S1205、由所述候选用户的地域分词、行业分词、结束语分词和商号分词构成所述候选用户的分词集合。
同理,目标用户的分词集合同样可以按照地域、商号、行业和结束语的划分规则进行划分。
为了提高数字标识转换的效率,在一个实施例中,所述将所述候选用户的分词集合中各个分词转换为对应的数字标识,获得所述候选用户的数字标识集合,包括:
S1301、将预先设置的表征地域的词库的数字标识与所述地域分词在表征地域的词库中的位置序号组合,得到所述地域分词的数字标识。
可以预先为地域词库、行业词库、结束语词库设置各自的数字身份标识,用于唯一标识对应的词库,例如,将地域词库的数字标识设置为1,将行业词库的数字标识设置为2,将结束语词库的数字标识设置为3。地域词库中的各个词语按照一定的顺序排列,每个词语都有自己唯一的位置序号,在该位置序号前面加上地域词库的数字标识,就得到地域分词的数字标识。例如,地域词库的数字标识为1,地域分词在地域词库中的位置序号为13,则地域分词的数字标识为113。
S1302、将预先设置的表征行业的词库的数字标识与所述行业分词在表征行业的词库中的位置序号组合,得到所述行业分词的数字标识。
预先为行业词库设置数字身份标识,用于唯一标识行业词库。行业词库中的各个词语按照一定的顺序排列,每个词语都有自己唯一的位置序号,在该位置序号前面加上行业词库的数字标识,就得到行业分词的数字标识。例如,行业词库的数字标识为2,地域分词在地域词库中的位置序号为13,则地域分词的数字标识为213。
S1303、将预先设置的表征结束语的词库的数字标识与所述结束语分词在表征结束语的词库中的位置序号组合,得到所述结束语分词的数字标识。
预先为结束语词库设置数字身份标识,用于唯一标识结束语词库。结束语词库中的各个词语按照一定的顺序排列,每个词语都有自己唯一的位置序号,在该位置序号前面加上结束语词库的数字标识,就得到结束语分词的数字标识。例如,结束语词库的数字标识为3,结束语分词在结束语词库中的位置序号为13,则地域分词的数字标识为313。
S1304、获取所述商号分词的汉语拼音,将所述汉语拼音中各个字母在汉语拼音字母表中的位置序号组合,得到所述商号分词的数字标识。
预先设置汉语拼音字母表,汉语拼音字母表中各个字母按照一定的顺序排列,每个字母都有自己唯一的位置序号。获取商号分词的汉语拼音,然后通过该汉语拼音字母表查找商号分词的汉语拼音中每个字母在汉语拼音字母表中的位置序号,按照商号分词的汉语拼音的顺序对这些位置序号进行组合,就得到商号分词的数字标识。
S1305、由所述地域分词的数字标识、所述行业分词的数字标识、所述结束语分词的数字标识和所述商号分词的数字标识构成所述候选用户的数字标识集合。
在一个实施例中,所述将所述候选用户的数字标识集合与目标用户的数字标识集合进行匹配,包括:
S1401、将所述候选用户的数字标识集合中的地域分词的数字标识、行业分词的数字标识、结束语分词的数字标识、商号分词的数字标识,与所述目标用户的数字标识集合中的地域分词的数字标识、行业分词的数字标识、结束语分词的数字标识、商号分词的数字标识进行同类匹配,获得地域分词的相似度、行业分词的相似度、结束语分词的相似度和商号分词的相似度。
同类匹配指的是:候选用户的地域分词的数字标识与目标用户的地域分词的数字标识进行匹配,得到地域分词的相似度;候选用户的商号分词的数字标识与目标用户的商号分词的数字标识进行匹配,得到商号分词的相似度;候选用户的行业分词的数字标识与目标用户的行业分词的数字标识进行匹配,得到行业分词的相似度;候选用户的结束语分词的数字标识与目标用户的结束语分词的数字标识进行匹配,得到结束语分词的相似度。
S1402、计算所述地域分词的相似度、所述行业分词的相似度、所述结束语分词的相似度和商号分词的相似度的权重和;所述商号分词的相似度对应的权重、所述行业分词的相似度对应的权重、所述地域分词的相似度对应的权重和所述结束语分词的相似度对应的权重依次降低。
为了提高信息推送的准确性,设置权重大小的规则为:商号分词>行业分词>地域分词>结束语分词。根据下述公式计算出权重和:权重和=商号分词的权重*商号分词的相似度+行业分词的权重*行业分词的相似度+地域分词的权重*地域分词的相似度+结束语分词的权重*结束语分词的相似度。
S1403、若所述权重和大于第一预设值,判定匹配一致,否则判定不匹配。
两个用户称之为同事,首选需要保证两个用户的公司名称相同,在此基础上,结合其它信息确定亲密度,以进一步提高信息推送的准确性。这里的同事可以是当前就职单位的同事,也可以是前公司的同事。确定目标用户和候选用户的公司全称是否相同,即将目标用户的公司全称与候选用户的公司全称进行比较,若两者一致,则属于同一个公司,否则不属于同一个公司。
因此,在一个实施例中,所述将所述候选用户的信息推送给所述目标用户,包括:
S1501、获取所述候选用户在其公司全称所指示公司的工作信息,以及所述目标用户在其公司全称所指示公司的工作信息。
同事关系亲密度用于表征同事之间的亲疏程度。本申请从工作信息方面考虑,获取候选用户的工作信息和目标用户的工作信息。可选的,工作信息包括在职年份、岗位、项目名称、工作经历和工作城市等等。获取的工作信息与上述步骤用到的公司名称可以以特征向量的形式进行存储,例如,[公司名称,在职年份,岗位,项目名称,工作经历,工作城市]。
S1502、计算所述候选用户的工作信息与所述目标用户的工作信息之间的相似度。
可以采用现有技术中已有的方式计算候选用户的工作信息和目标用户的工作信息之间的相似度。
S1503、若相似度大于第二预设值,将所述候选用户的信息推送给所述目标用户。
如果工作信息包括多项内容,如工作信息包括在职年份、岗位、项目名称、工作经历和工作城市,则在一个实施例中,所述计算所述候选用户的工作信息与所述目标用户的工作信息之间的相似度,包括:
S1502a、将所述候选用户的在职年份、岗位、项目名称、工作经历和工作城市和所述目标用户的在职年份、岗位、项目名称、工作经历和工作城市进行同类匹配,获得在职年份的相似度、岗位的相似度、项目名称的相似度、工作经历的相似度和工作城市的相似度。
同类匹配指的是:候选用户的在职年份与目标用户的在职年份进行匹配,获得在职年份的相似度;候选用户的岗位与目标用户的岗位进行匹配,获得岗位的相似度;候选用户的项目名称与目标用户的项目名称进行匹配,获得项目名称的相似度;候选用户的工作经历与目标用户的工作经历进行匹配,获得工作经历的相似度;候选用户的工作城市与目标用户的工作城市进行匹配,获得工作城市的相似度。
S1502b、计算所述在职年份的相似度、所述岗位的相似度、所述项目名称的相似度、所述工作经历的相似度和所述工作城市的相似度的权重和,得到所述候选用户的工作信息与所述目标用户的工作信息之间的相似度。
可以为工作信息统一设置一个权重,也可以为工作信息所包含的不同内容分别设置不同的权重,例如为在职年份、岗位、项目名称、工作经历和工作城市设置不同的权重。可以根据计算公式:∑工作信息包含的某一项内容的权重*该项内容的相似度,计算出目标用户和候选用户之间工作信息的相似度。
可选的,在计算在职年份的相似度时,可以根据在职年份重叠年份的个数确定相似度,如目标用户和候选用户在职重叠年份为3年,则相似度为3。
可选的,在计算岗位的相似度时,生成岗位的向量,计算两个岗位的向量之间的相似度,具体计算的方法可以根据现有技术中已有的方式实现。
可选的,在计算项目名称的相似度时,生成项目名称的向量,计算两个项目名称的向量之间的相似度;或者,将项目名称完全相同的相似度设置为1,其余的全部设置为0;或者,将项目名称完全相同的相似度设置为1,其余的判断是否属于与目标用户的项目名称有关联的项目名称,如果属于有关联的项目名称,则相似度设置为小于1且大于0的某一个值,否则设置为0,等等。
可选的,在计算工作经历的相似度时,提取工作经历中的工作职责,生成工作职责的向量,计算两个工作职责向量之间的相似度。
可选的,在计算工作城市的相似度时,将工作城市完全相同的相似度设置为1,其余的全部设置为0。
互动关系信息用于描述与一个用户有互动的其它用户,例如一个用户的职位内推人,或者一个用户的背景调查证明人等。为了进一步提高信息推送的准确度,还可以结合互动关系信息,将该互动关系信息结合工作信息作为确定是否进行信息推送的数据源。因此,在一个实施例中,所述计算所述候选用户的工作信息与所述目标用户的工作信息之间的相似度,包括:
S15021、获取所述候选用户的互动关系信息和所述目标用户的互动关系信息。
S15022、计算所述候选用户的互动关系信息和所述目标用户的互动关系信息之间的相似度。
互动关系信息的相似度计算有多种方式。例如,在计算职位内推人的相似度时,如果候选用户的职位内推人与目标用户的职位内推人相同,则相似度设置为1,否则设置为0。但是考虑到目标用户有可能是候选用户的职位内推人,或者候选用户有可能是目标用户的职位内推人,该种情况下两者的亲密度较高,因此可以在计算相似度之前先判断其中一个用户是否为另一个用户的职位内推人,如果是,直接将相似度设置为一个较大的值,例如2,如果不是,再判断候选用户的职位内推人和目标用户的职位内推人是否相同,相同则相似度设置为1,否则相似度设置为0。互动关系信息中其它信息的相似度计算方式类似。
S15023、根据工作信息之间的相似度和互动关系信息之间的相似度,获得所述候选用户和所述目标用户之间最终的相似度。
根据工作信息之间的相似度和互动关系信息之间的相似度得到最终的相似度的方式有很多,例如,将工作信息之间的相似度和互动关系信息之间的相似度相加,得到最终的相似度,或者,将工作信息之间的相似度和互动关系信息之间的相似度相乘,得到最终的相似度,等等。
基于同一发明构思,本申请还提供了一种信息推送装置,下面结合附图对本申请装置的具体实施方式进行详细介绍。
如图2所示,为一实施例的信息推送装置的示意图,该装置包括:
公司全称获取模块210,用于获取候选用户的公司全称;
分词模块220,用于对所述候选用户的公司全称进行分词,获得所述候选用户的分词集合;
数字标识转换模块230,用于将所述候选用户的分词集合中各个分词转换为对应的数字标识,获得所述候选用户的数字标识集合;
匹配模块240,用于将所述候选用户的数字标识集合与目标用户的数字标识集合进行匹配;所述目标用户的数字标识集合通过同一方式对所述目标用户的公司全称处理得到;
信息推送模块250,用于在匹配一致时,将所述候选用户的信息推送给所述目标用户。
在一个实施例中,分词模块220包括:
地域分词获取模块,用于根据预先设置的表征地域的词库,从所述候选用户的公司全称中筛选出地域分词;
行业分词获取模块,用于根据预先设置的表征行业的词库,从所述候选用户的公司全称中筛选出行业分词;
结束语分词获取模块,用于根据预先设置的表征结束语的词库,从所述候选用户的公司全称中筛选出结束语分词;所述结束语用于描述公司的组织形式;
商号分词获取模块,用于将从所述候选用户的公司全称中去除所述地域分词、所述行业分词和所述结束语分词之后得到的分词作为商号分词;
组合模块,用于由所述候选用户的地域分词、行业分词、结束语分词和商号分词构成所述候选用户的分词集合。
在一个实施例中,匹配模块240包括:
匹配单元,用于将所述候选用户的数字标识集合中的地域分词的数字标识、行业分词的数字标识、结束语分词的数字标识、商号分词的数字标识,与所述目标用户的数字标识集合中的地域分词的数字标识、行业分词的数字标识、结束语分词的数字标识、商号分词的数字标识进行同类匹配,获得地域分词的相似度、行业分词的相似度、结束语分词的相似度和商号分词的相似度;
权重和计算单元,用于计算所述地域分词的相似度、所述行业分词的相似度、所述结束语分词的相似度和商号分词的相似度的权重和;所述商号分词的相似度对应的权重、所述行业分词的相似度对应的权重、所述地域分词的相似度对应的权重和所述结束语分词的相似度对应的权重依次降低;
判断单元,用于在所述权重和大于第一预设值时,判定匹配一致,否则判定不匹配。
在一个实施例中,数字标识转换模块230包括:
地域分词数字标识获得单元,用于将预先设置的表征地域的词库的数字标识与所述地域分词在表征地域的词库中的位置序号组合,得到所述地域分词的数字标识;
行业分词数字标识获得单元,用于将预先设置的表征行业的词库的数字标识与所述行业分词在表征行业的词库中的位置序号组合,得到所述行业分词的数字标识;
结束语分词数字标识获得单元,用于将预先设置的表征结束语的词库的数字标识与所述结束语分词在表征结束语的词库中的位置序号组合,得到所述结束语分词的数字标识;
商号分词数字标识获得单元,用于获取所述商号分词的汉语拼音,将所述汉语拼音中各个字母在汉语拼音字母表中的位置序号组合,得到所述商号分词的数字标识;
组合单元,用于由所述地域分词的数字标识、所述行业分词的数字标识、所述结束语分词的数字标识和所述商号分词的数字标识构成所述候选用户的数字标识集合。
在一个实施例中,信息推送模块250包括:
工作信息获取单元,用于获取所述候选用户在其公司全称所指示公司的工作信息,以及所述目标用户在其公司全称所指示公司的工作信息;
相似度计算单元,用于计算所述候选用户的工作信息与所述目标用户的工作信息之间的相似度;
推送单元,用于在相似度大于第二预设值时,将所述候选用户的信息推送给所述目标用户。
在一个实施例中,相似度计算单元包括:
互动信息获取子单元,用于获取所述候选用户的互动关系信息和所述目标用户的互动关系信息;
第一相似度计算子单元,用于计算所述候选用户的互动关系信息和所述目标用户的互动关系信息之间的相似度;
第二相似度计算子单元,用于根据工作信息之间的相似度和互动关系信息之间的相似度,获得所述候选用户和所述目标用户之间最终的相似度。
在一个实施例中,所述工作信息包括在职年份、岗位、项目名称、工作经历和工作城市;相似度计算单元包括:
匹配子单元,用于将所述候选用户的在职年份、岗位、项目名称、工作经历和工作城市和所述目标用户的在职年份、岗位、项目名称、工作经历和工作城市进行同类匹配,获得在职年份的相似度、岗位的相似度、项目名称的相似度、工作经历的相似度和工作城市的相似度;
权重和计算子单元,用于计算所述在职年份的相似度、所述岗位的相似度、所述项目名称的相似度、所述工作经历的相似度和所述工作城市的相似度的权重和,得到所述候选用户的工作信息与所述目标用户的工作信息之间的相似度。
上述信息推送装置的其它技术特征与上述信息推送方法的技术特征相同,在此不予赘述。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任意一项所述的信息推送方法。其中,所述存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random AcceSS Memory,随即存储器)、EPROM(EraSable ProgrammableRead-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically EraSableProgrammable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。可以是只读存储器,磁盘或光盘等。
本申请实施例还提供一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一项所述的信息推送方法。
图3为本申请计算机设备的结构示意图,包括处理器320、存储装置330、输入单元340以及显示单元350等器件。本领域技术人员可以理解,图3示出的结构器件并不构成对所有计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件。存储装置330可用于存储应用程序310以及各功能模块,处理器320运行存储在存储装置330的应用程序310,从而执行设备的各种功能应用以及数据处理。存储装置330可以是内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本申请所公开的存储装置包括但不限于这些类型的存储装置。本申请所公开的存储装置330只作为例子而非作为限定。
输入单元340用于接收信号的输入,以及公司全称等。输入单元340可包括触控面板以及其它输入设备。触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程序驱动相应的连接装置;其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元350可用于显示用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元350可采用液晶显示器、有机发光二极管等形式。处理器320是计算机设备的控制中心,利用各种接口和线路连接整个电脑的各个部分,通过运行或执行存储在存储装置330内的软件程序和/或模块,以及调用存储在存储装置内的数据,执行各种功能和处理数据。
在一实施方式中,计算机设备包括一个或多个处理器320,以及一个或多个存储装置330,一个或多个应用程序310,其中所述一个或多个应用程序310被存储在存储装置330中并被配置为由所述一个或多个处理器320执行,所述一个或多个应用程序310配置用于执行以上实施例所述的信息推送方法。
上述信息推送方法、装置、计算机可读存储介质和计算机设备,与现有技术相互比较时,具备以下优点:
1、通过分词的数字标识匹配代替公司全称的匹配,由于数字标识的匹配效率要高于汉字字符的匹配效率,因此通过该种方式大大提高了计算效率。
2、在公司全称匹配的基础上,引入在职年份、岗位、项目名称、工作经历、工作城市等工作信息维度、以及职位内推、证明人等互动关系信息,并赋予不同权重,实现了对前同事关系亲密度的准确量化,进而提高了信息推送的准确性。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
应该理解的是,在本申请各实施例中的各功能单元可集成在一个处理模块中,也可以各个单元单独物理存在,也可以两个或两个以上单元集成于一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (9)

1.一种信息推送方法,其特征在于,包括:
获取候选用户的公司全称;
对所述候选用户的公司全称进行分词,获得所述候选用户的分词集合,所述分词集合包括所述候选用户的公司全称中的地域分词、行业分词、结束语分词和商号分词;
将所述候选用户的分词集合中各个分词转换为对应的数字标识,获得所述候选用户的数字标识集合;
将所述候选用户的数字标识集合与目标用户的数字标识集合进行匹配;所述目标用户的数字标识集合通过同一方式对所述目标用户的公司全称处理得到;
若匹配一致,将所述候选用户的信息推送给所述目标用户,
其中,所述将所述候选用户的分词集合中各个分词转换为对应的数字标识,获得所述候选用户的数字标识集合,包括:
将预先设置的表征地域的词库的数字标识与所述地域分词在表征地域的词库中的位置序号组合,得到所述地域分词的数字标识;
将预先设置的表征行业的词库的数字标识与所述行业分词在表征行业的词库中的位置序号组合,得到所述行业分词的数字标识;
将预先设置的表征结束语的词库的数字标识与所述结束语分词在表征结束语的词库中的位置序号组合,得到所述结束语分词的数字标识;
获取所述商号分词的汉语拼音,将所述汉语拼音中各个字母在汉语拼音字母表中的位置序号组合,得到所述商号分词的数字标识。
2.根据权利要求1所述的信息推送方法,其特征在于,所述对所述候选用户的公司全称进行分词,获得所述候选用户的分词集合,包括:
根据预先设置的表征地域的词库,从所述候选用户的公司全称中筛选出地域分词;
根据预先设置的表征行业的词库,从所述候选用户的公司全称中筛选出行业分词;
根据预先设置的表征结束语的词库,从所述候选用户的公司全称中筛选出结束语分词;所述结束语用于描述公司的组织形式;
将从所述候选用户的公司全称中去除所述地域分词、所述行业分词和所述结束语分词之后得到的分词作为商号分词;
由所述候选用户的地域分词、行业分词、结束语分词和商号分词构成所述候选用户的分词集合。
3.根据权利要求2所述的信息推送方法,其特征在于,所述将所述候选用户的数字标识集合与目标用户的数字标识集合进行匹配,包括:
将所述候选用户的数字标识集合中的地域分词的数字标识、行业分词的数字标识、结束语分词的数字标识、商号分词的数字标识,与所述目标用户的数字标识集合中的地域分词的数字标识、行业分词的数字标识、结束语分词的数字标识、商号分词的数字标识进行同类匹配,获得地域分词的相似度、行业分词的相似度、结束语分词的相似度和商号分词的相似度;
计算所述地域分词的相似度、所述行业分词的相似度、所述结束语分词的相似度和商号分词的相似度的权重和;所述商号分词的相似度对应的权重、所述行业分词的相似度对应的权重、所述地域分词的相似度对应的权重和所述结束语分词的相似度对应的权重依次降低;
若所述权重和大于第一预设值,判定匹配一致,否则判定不匹配。
4.根据权利要求1至3任意一项所述的信息推送方法,其特征在于,所述将所述候选用户的信息推送给所述目标用户,包括:
获取所述候选用户在其公司全称所指示公司的工作信息,以及所述目标用户在其公司全称所指示公司的工作信息;
计算所述候选用户的工作信息与所述目标用户的工作信息之间的相似度;
若相似度大于第二预设值,将所述候选用户的信息推送给所述目标用户。
5.根据权利要求4所述的信息推送方法,其特征在于,所述计算所述候选用户的工作信息与所述目标用户的工作信息之间的相似度,包括:
获取所述候选用户的互动关系信息和所述目标用户的互动关系信息;
计算所述候选用户的互动关系信息和所述目标用户的互动关系信息之间的相似度;
根据工作信息之间的相似度和互动关系信息之间的相似度,获得所述候选用户和所述目标用户之间最终的相似度。
6.根据权利要求4所述的信息推送方法,其特征在于,所述工作信息包括在职年份、岗位、项目名称、工作经历和工作城市;
所述计算所述候选用户的工作信息与所述目标用户的工作信息之间的相似度,包括:
将所述候选用户的在职年份、岗位、项目名称、工作经历和工作城市和所述目标用户的在职年份、岗位、项目名称、工作经历和工作城市进行同类匹配,获得在职年份的相似度、岗位的相似度、项目名称的相似度、工作经历的相似度和工作城市的相似度;
计算所述在职年份的相似度、所述岗位的相似度、所述项目名称的相似度、所述工作经历的相似度和所述工作城市的相似度的权重和,得到所述候选用户的工作信息与所述目标用户的工作信息之间的相似度。
7.一种信息推送装置,其特征在于,包括:
公司全称获取模块,用于获取候选用户的公司全称;
分词模块,用于对所述候选用户的公司全称进行分词,获得所述候选用户的分词集合,所述分词集合包括所述候选用户的公司全称中的地域分词、行业分词、结束语分词和商号分词;
数字标识转换模块,用于将所述候选用户的分词集合中各个分词转换为对应的数字标识,获得所述候选用户的数字标识集合;
匹配模块,用于将所述候选用户的数字标识集合与目标用户的数字标识集合进行匹配;所述目标用户的数字标识集合通过同一方式对所述目标用户的公司全称处理得到;
信息推送模块,用于在匹配一致时,将所述候选用户的信息推送给所述目标用户,
所述数字标识转换模块,还用于:
将预先设置的表征地域的词库的数字标识与所述地域分词在表征地域的词库中的位置序号组合,得到所述地域分词的数字标识;
将预先设置的表征行业的词库的数字标识与所述行业分词在表征行业的词库中的位置序号组合,得到所述行业分词的数字标识;
将预先设置的表征结束语的词库的数字标识与所述结束语分词在表征结束语的词库中的位置序号组合,得到所述结束语分词的数字标识;
获取所述商号分词的汉语拼音,将所述汉语拼音中各个字母在汉语拼音字母表中的位置序号组合,得到所述商号分词的数字标识。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任意一项所述的信息推送方法。
9.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至6中任意一项所述的信息推送方法。
CN201910517834.2A 2019-06-14 2019-06-14 信息推送方法、装置、计算机可读存储介质和计算机设备 Active CN110381115B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910517834.2A CN110381115B (zh) 2019-06-14 2019-06-14 信息推送方法、装置、计算机可读存储介质和计算机设备
PCT/CN2019/103023 WO2020248377A1 (zh) 2019-06-14 2019-08-28 信息推送方法、装置、计算机可读存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910517834.2A CN110381115B (zh) 2019-06-14 2019-06-14 信息推送方法、装置、计算机可读存储介质和计算机设备

Publications (2)

Publication Number Publication Date
CN110381115A CN110381115A (zh) 2019-10-25
CN110381115B true CN110381115B (zh) 2022-03-11

Family

ID=68250434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910517834.2A Active CN110381115B (zh) 2019-06-14 2019-06-14 信息推送方法、装置、计算机可读存储介质和计算机设备

Country Status (2)

Country Link
CN (1) CN110381115B (zh)
WO (1) WO2020248377A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079434B (zh) * 2019-12-05 2023-10-20 企查查科技股份有限公司 公司简称自动对应公司全称的方法、设备和存储介质
CN111800513B (zh) * 2020-07-09 2022-09-27 北京字节跳动网络技术有限公司 用于推送信息的方法、装置、电子设备计算机可读介质
CN111898378B (zh) * 2020-07-31 2023-09-19 中国联合网络通信集团有限公司 政企客户的行业分类方法和装置、电子设备、存储介质
CN112182140B (zh) * 2020-08-17 2024-06-18 北京来也网络科技有限公司 结合rpa和ai的信息录入方法、装置、计算机设备和介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956192A (zh) * 2016-06-15 2016-09-21 中国互联网络信息中心 一种基于网站首页信息获取组织机构名简称的方法及系统
CN106302104A (zh) * 2015-06-26 2017-01-04 阿里巴巴集团控股有限公司 一种用户关系识别方法及装置
CN107357916A (zh) * 2017-07-19 2017-11-17 北京金堤科技有限公司 数据处理方法及系统
CN108460014A (zh) * 2018-02-07 2018-08-28 百度在线网络技术(北京)有限公司 企业实体的识别方法、装置、计算机设备及存储介质
CN109522417A (zh) * 2018-10-26 2019-03-26 浪潮软件股份有限公司 一种公司名的商号抽取方法
CN109561132A (zh) * 2018-10-23 2019-04-02 平安医疗健康管理股份有限公司 一种信息推送方法、装置、服务器及终端

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101493841A (zh) * 2009-02-23 2009-07-29 深圳市中科新业信息科技发展有限公司 一种搜索方法及搜索装置
CN103838789A (zh) * 2012-11-27 2014-06-04 大连灵动科技发展有限公司 一种文本相似度计算方法
WO2016141075A1 (en) * 2015-03-02 2016-09-09 Ajuba, Llc Push notification system for advertising
CN106095867B (zh) * 2016-06-03 2019-08-23 北京奇虎科技有限公司 一种基于行业分析的图书推荐方法及装置
CN106446100A (zh) * 2016-09-13 2017-02-22 乐视控股(北京)有限公司 一种内容推荐方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106302104A (zh) * 2015-06-26 2017-01-04 阿里巴巴集团控股有限公司 一种用户关系识别方法及装置
CN105956192A (zh) * 2016-06-15 2016-09-21 中国互联网络信息中心 一种基于网站首页信息获取组织机构名简称的方法及系统
CN107357916A (zh) * 2017-07-19 2017-11-17 北京金堤科技有限公司 数据处理方法及系统
CN108460014A (zh) * 2018-02-07 2018-08-28 百度在线网络技术(北京)有限公司 企业实体的识别方法、装置、计算机设备及存储介质
CN109561132A (zh) * 2018-10-23 2019-04-02 平安医疗健康管理股份有限公司 一种信息推送方法、装置、服务器及终端
CN109522417A (zh) * 2018-10-26 2019-03-26 浪潮软件股份有限公司 一种公司名的商号抽取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
企业名称登记管理规定;国家工商行政管理局;《中华人民共和国国家工商行政管理局第7号令》;19910722;全文 *

Also Published As

Publication number Publication date
CN110381115A (zh) 2019-10-25
WO2020248377A1 (zh) 2020-12-17

Similar Documents

Publication Publication Date Title
CN110381115B (zh) 信息推送方法、装置、计算机可读存储介质和计算机设备
CN109947909B (zh) 智能客服应答方法、设备、存储介质及装置
JP6893209B2 (ja) 構造化されたマルチフィールドファイルのレイアウトの自動解釈
KR101276602B1 (ko) 표의문자적 내용을 가지는 데이터를 서치하고 매칭하기위한 시스템 및 방법
US20120102002A1 (en) Automatic data validation and correction
CN111125343A (zh) 适用于人岗匹配推荐系统的文本解析方法及装置
US20080097937A1 (en) Distributed method for integrating data mining and text categorization techniques
KR101511656B1 (ko) 퍼스널 아이덴티티를 기술하는 데이터에 대한 액셔너블 속성의 애스클라이빙
CN111406262A (zh) 认知文档图像数字化
CN108959643B (zh) 生成标签的方法、装置、服务器和存储介质
CN105095878A (zh) 网络查询中的在线手写识别系统和方法
CN110941702A (zh) 一种法律法规和法条的检索方法及装置、可读存储介质
CN105653547A (zh) 一种提取文本关键词的方法和装置
CN109299215A (zh) 倒排索引查询的资源分配方法、装置及存储介质、服务器
CN114222000B (zh) 信息推送方法、装置、计算机设备和存储介质
CN113326363B (zh) 搜索方法及装置、预测模型训练方法及装置、电子设备
CN112860850B (zh) 人机交互方法、装置、设备及存储介质
CN113076758B (zh) 一种面向任务型对话的多域请求式意图识别方法
CN117420998A (zh) 一种客户端ui交互组件生成方法、装置、终端及介质
CN113361240A (zh) 用于生成目标文章的方法、装置、设备和可读存储介质
CN112052672A (zh) 基于地址文本的单元区域识别方法、装置和计算机设备
US8793279B2 (en) Name characteristic analysis software and methods
JP6763967B2 (ja) データ変換装置とデータ変換方法
CN112328653B (zh) 数据识别方法、装置、电子设备及存储介质
US20090210380A1 (en) Data search system, method and program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant