CN107918672A - 信息处理方法、装置、计算机设备和存储介质 - Google Patents

信息处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN107918672A
CN107918672A CN201711229916.4A CN201711229916A CN107918672A CN 107918672 A CN107918672 A CN 107918672A CN 201711229916 A CN201711229916 A CN 201711229916A CN 107918672 A CN107918672 A CN 107918672A
Authority
CN
China
Prior art keywords
customer
mark
existing customer
client
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711229916.4A
Other languages
English (en)
Other versions
CN107918672B (zh
Inventor
吴思佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Pension Insurance Corp
Original Assignee
Ping An Pension Insurance Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Pension Insurance Corp filed Critical Ping An Pension Insurance Corp
Priority to CN201711229916.4A priority Critical patent/CN107918672B/zh
Publication of CN107918672A publication Critical patent/CN107918672A/zh
Application granted granted Critical
Publication of CN107918672B publication Critical patent/CN107918672B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及一种信息处理方法、装置、计算机设备和存储介质,所述方法包括:获取当前客户标识;根据所述当前客户标识获取对应的目标网页;对所述目标网页对应的目标内容进行结构化处理,得到结构化内容;根据预设的属性词从所述结构化内容中获取与所述当前客户标识存在关联关系的关联客户标识;根据所述关联客户标识获取对应的客户相关信息;将所述客户相关信息作为所述当前客户标识对应的客户推送信息。上述方法可以能够节约计算机网络资源以及用户时间。

Description

信息处理方法、装置、计算机设备和存储介质
技术领域
本发明涉及互联网技术领域,特别是涉及信息处理方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的发展,人们对互联网的使用越来越频繁,越来越多的用户通过网络获取信息。例如,通过互联网查找客户信息。传统技术中,当业务员通过互联网查找客户时,可以在搜索引擎上输入相关关键字例如行业、地理位置等进行查找,然而这种查找方法针对性不强且效率低下,需要多次查找导致终端设备和服务器之间频繁交互,浪费计算机网络资源以及用户时间。
发明内容
基于此,有必要针对上述的问题,提供一种信息处理方法、装置、计算机设备和存储介质,可通过当前已有的当前客户标识查找与当前客户标识对应的目标网页,进行结构化处理后得到当前客户关联的关联客户标识对应的客户信息作为当前客户对应的客户推送信息,针对性强且效率高,能够节约计算机网络资源以及用户时间。
一种信息处理方法,所述方法包括:获取当前客户标识;根据所述当前客户标识获取对应的目标网页;对所述目标网页对应的目标内容进行结构化处理,得到结构化内容;根据预设的属性词从所述结构化内容中获取与所述当前客户标识存在关联关系的关联客户标识;根据所述关联客户标识获取对应的客户相关信息;将所述客户相关信息作为所述当前客户标识对应的客户推送信息。
在其中一个实施例中,所述对所述目标网页对应的目标内容进行结构化处理,得到结构化内容的步骤包括:获取所述目标网页对应的源代码;根据所述源代码构造包括多个节点的对象树,并根据所述对象树各个节点对应的源代码的属性设置节点之间的关系;所述根据预设的属性词从所述结构化内容中获取与所述当前客户标识存在关联关系的关联客户标识的步骤包括:根据所述预设的属性词从所述对象树中获取匹配的节点关系;根据所述匹配的节点关系获取对应的目标节点;根据所述目标节点获取对应的客户标识,作为与所述当前客户标识存在关联关系的关联客户标识。
在其中一个实施例中,所述方法还包括:根据所述目标节点在所述匹配的节点关系中的节点类型以及所述关联关系的类型确定关联客户相对于当前客户的关联身份;所述将所述客户相关信息作为所述当前客户标识对应的客户推送信息的步骤包括:将所述客户相关信息以及所述关联客户相对于所述当前客户的关联身份作为所述当前客户标识对应的客户推送信息。
在其中一个实施例中,所述对所述目标网页对应的目标内容进行结构化处理,得到结构化内容的步骤包括:对所述目标网页上的文本信息进行分词,得到结构化语句;所述根据预设的属性词从所述结构化内容中获取与所述当前客户标识存在关联关系的关联客户标识的步骤包括:根据所述预设的属性词以及所述结构化语句的句法结构从所述结构化语句中获取与所述当前客户标识存在关联关系的关联客户标识。
在其中一个实施例中,所述根据预设的属性词从所述结构化内容中获取与所述当前客户标识存在关联关系的关联客户标识的步骤包括:根据预设的属性词从所述结构化内容中获取与所述当前客户标识存在关联关系的候选客户标识以及所述候选客户标识对应的关联强度;根据所述各个候选客户标识对应的关联强度从所述候选客户标识中筛选出所述关联客户标识。
一种信息处理装置,所述装置包括:当前标识获取模块,用于获取当前客户标识;网页得到模块,用于根据所述当前客户标识获取对应的目标网页;结构化处理模块,用于对所述目标网页对应的目标内容进行结构化处理,得到结构化内容;关联标识得到模块,用于根据预设的属性词从所述结构化内容中获取与所述当前客户标识存在关联关系的关联客户标识;信息获取模块,用于根据所述关联客户标识获取对应的客户相关信息;推送信息得到模块,将所述客户相关信息作为所述当前客户标识对应的客户推送信息。
在其中一个实施例中,所述结构化处理模块包括:代码获取单元,用于获取所述目标网页对应的源代码;对象树构造单元,用于根据所述源代码构造包括多个节点的对象树,并根据所述对象树各个节点对应的源代码的属性设置节点之间的关系;所述关联标识得到模块包括:匹配关系获取单元,用于根据所述预设的属性词从所述对象树中获取匹配的节点关系;目标节点得到模块,用于根据所述匹配的节点关系获取对应的目标节点;关联标识得到模块,用于根据所述目标节点获取对应的客户标识,作为与所述当前客户标识存在关联关系的关联客户标识。
在其中一个实施例中,所述装置还包括:身份确定模块,用于根据所述目标节点在所述匹配的节点关系中的节点类型以及所述关联关系的类型确定关联客户相对于当前客户的关联身份;所述推送信息得到模块用于:将所述客户相关信息以及所述关联客户相对于所述当前客户的关联身份作为所述当前客户标识对应的客户推送信息。
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述信息处理方法的步骤。
一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述信息处理方法的步骤。
上述信息处理方法、装置、计算机设备和存储介质,通过获取当前客户标识,根据当前客户标识获取对应的目标网页,对目标网页对应的目标内容进行结构化处理,得到结构化内容,然后根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识,根据关联客户标识获取对应的客户相关信息,将客户相关信息作为当前客户标识对应的客户推送信息。由于可通过当前已有的当前客户标识查找与当前客户标识对应的目标网页,进行结构化处理后得到当前客户关联的客户信息作为当前客户对应的客户推送信息,针对性强且效率高,能够节约计算机网络资源以及用户时间。
附图说明
图1为一个实施例中提供的信息处理方法的应用环境图;
图2为一个实施例中信息处理方法的流程图;
图3A为一个实施例中对目标网页对应的目标内容进行结构化处理,得到结构化内容的流程图;
图3B一个实施例中对象树的示意图;
图4为一个实施例中根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识的流程图;
图5为一个实施例中信息处理方法的流程图;
图6为一个实施例中对目标网页对应的目标内容进行结构化处理,得到结构化内容的流程图;
图7为一个实施例中信息处理装置的结构框图;
图8为一个实施例中结构化处理模块的结构框图;
图9为一个实施例中关联标识得到模块的结构框图;
图10为一个实施例中信息处理装置的结构框图;
图11为一个实施例中关联标识得到模块的结构框图;
图12为一个实施例中计算机设备的内部结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为一个实施例中提供的信息处理方法的应用环境图,如图1所示,在该应用环境中,包括终端110以及计算机设备120。计算机设备120可以获取当前客户标识,然后根据当前客户标识获取对应的目标网页,对目标网页对应的目标内容进行结构化处理以得到结构化内容,然后根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识,根据关联客户标识获取对应的客户相关信息,将客户相关信息作为当前客户标识对应的客户推送信息。当用户需要获取客户推送信息时,可以通过终端110发送客户推送信息获取请求,客户信息推送请求中携带有当前客户标识,计算机设备120获取当前客户标识对应的客户推送信息并推送给终端110。可以理解,计算机设备120也可以定期或随机向终端110发送客户推送信息。
计算机设备120可以是独立的物理服务器或终端,也可以是多个物理服务器构成的服务器集群,可以是提供云服务器、云数据库、云存储和CDN等基础云计算服务的云服务器。终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。。计算机设备120以及终端110可以通过蓝牙、USB(Universal SerialBus,通用串行总线)或者网络等通讯连接方式进行连接,本发明在此不做限制。
如图2所示,在一个实施例中,提出了一种信息处理方法,该信息处理方法可以应用于上述的计算机设备120中,具体可以包括以下步骤:
步骤S202,获取当前客户标识。
具体地,客户标识用于标识客户。当客户为企业时,客户标识可以是企业的统一社会信用代码、组织机构代码、税务登记号以及企业名称等。当前客户标识可以是接收到终端发送的携带当前客户标识的客户推送信息获取请求后实时获取的,也可以是计算机设备上预先存储的。例如,对于业务系统如金融保险系统,当前客户标识可以是业务系统上已经进行过投保的客户的标识,当需要得到客户推送信息时,可以获取业务系统上已经投保的客户的标识作为当前客户标识。
步骤S204,根据当前客户标识获取对应的目标网页。
具体地,目标网页是指包括当前客户标识的网页。获取到当前客户标识后,可以利用网页爬虫技术爬取互联网或者内网上的网页,将包括当前客户标识的网页作为目标网页。在进行网页爬取时,可以设置网页爬取的范围,例如,爬取范围可以为国家组织机构代码数据服务中心的网页,以增加爬取的效率以及获取的信息的准确性。
步骤S206,对目标网页对应的目标内容进行结构化处理,得到结构化内容。
具体地,目标网页对应的目标内容可以是目标网页上的文本、图片、视频或者音频中的一种或多种,也可以是目标网页对应的源代码。结构化处理是指将内容经过分析后分解成多个关联的组成部分。关联可以指各个组成部分之间均互相关联,也可以是各个组成部分在结构化内容中都存在关联关系的其他组成部分。得到目标网页后,对目标网页对应的目标内容进行结构化处理,得到结构化内容。结构化处理的方式具体可以预先设置。
在一个实施例中,可以将目标内容经过分析后形成对象树,对象树包括多个节点,节点与节点之间存在关联关系,即对象树的根节点与一级节点关联,一级节点又与其下一层节点关联。例如,当目标内容为源代码时,可以根据源代码的结构构造对象树,并根据源代码的内容设置对象树中节点与节点之间的关系。举个实际例子,若根据网页的源代码的结构以及内容得到网页是关于A公司的,网页内容包括A公司的债务人以及投资的机构。则对象树的根节点为A公司,一级节点包括债务人以及投资的机构,节点关系分别为借贷关系以及投资关系。
在一个实施例中,若目标内容为一段句子或者一篇文章,还可以将目标内容进行分词后分解成多个词语,词语与词语之间组成包含语法关系的结构化语句,语法关系例如可以为主谓关系、动宾关系。例如,对于“A公司成为B公司的股东”,进行分词以及文本过滤后得到的结构化语句可以为“A公司/成为/B公司/股东”。其中,词语成分可以依次表示为主语、谓语、宾语以及补语。
步骤S208,根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识。
具体地,关联关系可以包括投资关系、担保关系、债权债务关系的一种或多种。预设的属性词可以是根据要获取的关联关系设置的,具体可以根据实际进行设置。关联客户标识可以是企业的统一社会信用代码、组织机构代码、税务登记号以及企业名称等。得到结构化内容后,将预设的属性词与结构化内容进行匹配,若在结构化内容中有匹配的词语,则获取对应的客户标识作为与当前客户标识对应的关联客户标识。例如,要获取股东关系,则预设的属性词可以是“收购”或者“投资”。假设当前客户标识为阿里巴巴,结构化内容为“阿里巴巴/收购/石基零售”,结构化语句中的“收购”与预设属性词匹配,可以得到主语为阿里巴巴、动词为收购,宾语为石基零售,则石基零售为关联客户标识。
步骤S210,根据关联客户标识获取对应的客户相关信息。
具体地,客户相关信息指与关联客户标识对应的关联客户的相关信息,客户相关信息可以是在结构化内容中得到的,也可以通过其他方式得到的。例如,当结构化内容中包括关联客户标识对应的组织机构代码时,则可以获取关联客户标识对应的组织机构代码作为客户相关信息。也可以利用关联客户标识到预先存储的企业信息数据库中查找,得到与关联客户标识对应的客户相关信息。客户相关信息可以包括客户名称。以客户为企业为例,还可以包括企业的招聘人数、招聘指数、企业的规模、企业的利润以及企业的级别等一个或多个信息。招聘指数可以根据该企业上一年的员工人数以及当前的员工人数得到。例如,招聘指数为上一年与当前的员工人数差与上一年的员工人数的比例,具体可以根据实际需要设置。
步骤S212,将客户相关信息作为当前客户标识对应的客户推送信息。
具体地,得到客户相关信息后,可以将客户相关信息作为当前客户标识对应的客户推送信息实时地推送给终端。也可以将客户相关信息与当前客户标识关联存储,在接收到终端发送的客户推送信息获取请求后推送到终端或者在预设时间推送给终端。本发明实施例对推送的时机不做限制。
在一个实施例中,目标内容可以包括目标网页对应的源代码,如图3A所示,步骤S206即对目标网页对应的目标内容进行结构化处理,得到结构化内容可以包括以下步骤:
步骤S302,获取目标网页对应的源代码。
具体地,源代码可以为XML(Extensible Markup Language,可扩展标记语言)代码或者HTML(HyperTextMarkup Language、超文本标记语言)代码。本发明对源代码使用的语言不做限制。获取到目标网页后,得到目标网页的源代码。
步骤S304,根据源代码构造包括多个节点的对象树,并根据对象树各个节点对应的源代码的属性设置节点之间的关系。
具体地,可以采用dom(document object model,文档对象模型)解析器解析代码生成文本对象树结构,dom定义了一组与平台和语言无关的接口,以便程序和脚本能够动态访问和修改员代码中的内容、结构及样式。因此可以根据网页源代码的结构构建对象树,并根据节点对应的源代码的属性标注节点与节点之间的关系。源代码的属性可以是源代码的标签,也可以根据各个目标网页的结构预先设置源代码的属性。
建立对象树的过程可示例如下,在一个目标网页的源代码中,<xx>表示源代码一个标签的开始,而若标签前加上“/”则表示标签结束,即</xx>表示标签结束。因此,假设源代码为<div><a><a1></a1><a2></a2></a><b></b></div>,在该源代码中,div节点有两个子节点,a以及b,而a下面还a1节点以及a2节点,因此,在遍历该源代码时,得到父节点为div,div的子节点为a以及b,a的子节点为a1以及a2,得到的对象树可如图3B所示。又例如,在源代码
<src="http://localhost/phpwind6/zx/6.GIF"id="imgs"lang="en-us"alt="测试">中,src、id、lang以及alt为源代码的属性。
如图4所示,步骤S208即根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识的步骤包括:
步骤S402,根据预设的属性词从对象树中获取匹配的节点关系。
具体地,得到对象树后,根据预设的属性词获取对象树中与预设的属性词匹配的节点关系。例如,假设属性词为invest,则在对象树中搜索为“invest”的节点关系。又例如,假设要获取担保关系,而在某一网站中表示担保的属性名称为“assur”,因此,建立对象树之后,可以对对象树的节点关系进行解析,得到“assur”关系对应的节点。
步骤S404,根据匹配的节点关系获取对应的目标节点。
具体地,获取到匹配的节点关系后,从对象树中获取匹配的节点关系对应的目标节点。匹配关系对应的目标节点可以是匹配关系中的父节点或者子节点中的一个。例如,若匹配关系对应的节点中父节点为当前客户标识所在的节点,则目标节点为匹配关系对应的节点中的子节点。例如,获取到“invest”为匹配的节点关系后,该节点关系对应的子节点可以为目标节点。
步骤S406,根据目标节点获取对应的客户标识,作为与当前客户标识存在关联关系的关联客户标识。
具体地,得到目标节点后,将目标节点上的客户标识作为与当前客户标识存在关联关系的关联客户标识。
例如,假设要获取担保关系,而观察到在某一网站中表示担保的属性名称为“assur”,因此,建立对象树之后,可以对象树的关系进行解析,获取“assur”关系对应的目标节点,将目标节点上的客户标识作为与当前客户标识存在关联关系的关联客户标识。
在一个实施例中,如图5所示,信息处理方法还可以包括步骤S502:根据目标节点在匹配的节点关系中的节点类型以及关联关系的类型确定关联客户相对于当前客户的关联身份。步骤S212即将客户相关信息作为当前客户标识对应的客户推送信息的步骤包括:将客户相关信息以及关联客户相对于当前客户的关联身份作为当前客户标识对应的客户推送信息。
具体地,节点类型可以包括父节点以及子节点,关联关系的类型可以包括担保关系以及投资关系。关联客户指关联客户标识对应的客户,当前客户指当前客户标识对应的客户。得到目标节点后,根据目标节点的节点类型以及关联关系的类型确定关联客户相对于当前客户的关联身份。例如,当关联关系的类型为担保关系时,若目标节点为担保关系中的父节点,则关联客户为当前客户的担保人,若目标节点为担保关系中的子节点,则关联客户为当前客户的被担保人。假设某一网站中股东关系的属性为“holder”,那么利用“holder”的这一属性词得到“holder”关系对应的目标节点,若目标节点为“holder”关系的父节点,则关联客户为当前客户的股东,若目标节点为“holder”关系的子节点,则关联客户为当前客户的被投资对象。得到关联客户相对于当前客户的关联身份后,将客户相关信息以及关联客户相对于当前客户的关联身份作为当前客户标识对应的客户推送信息。关联身份可以用文字表示,也可以用图表等其他方式表示。例如,以当前客户为箭头的起点,箭头由当前客户指向关联客户,表示当前客户为关联客户的股东。
在一个实施例中,步骤S206即对目标网页对应的目标内容进行结构化处理,得到结构化内容的步骤包括:对目标网页上的文本信息进行分词,得到结构化语句。步骤S208即根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识的步骤包括:根据预设的属性词以及结构化语句的句法结构从结构化语句中获取与当前客户标识存在关联关系的关联客户标识。
具体地,分词是将一个字序列切分成单独的词的过程,可以采用基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法等方法中的一种多种对文本信息进行分词。句法结构是指句子之间的语法关系,例如可以为主谓结构、动宾结构等。预设的属性词具体可以根据实际需求进行设置,例如,若要获取投资关系,则属性词可以为收购、投资以及兼并等。得到目标网页后,可以获取目标网页上的全部或者部分文本信息,例如,可以获取目标网页上的文章标题进行分词。得到目标网页上的文本信息后,对文本信息进行分词。以得到结构化的语句。
在一个实施例中,还可以对文本信息的一些词语例如叹词等进行过滤,例如,对于“阿里巴巴今天收购石基零售38%股份”的文本信息,进行分词以及文本过滤后得到的结构化语句可以为“阿里巴巴/收购/石基零售”。得到结构化语句后,搜索包括预设属性词的结构化语句,然后根据结构化语句的句法结构得到关联客户标识。例如,若当前客户标识为阿里巴巴,则由“阿里巴巴/收购/石基零售”可以得到主语为阿里巴巴、动词为收购,宾语为石基零售。则与当前客户标识存在关联关系的关联客户标识包括石基零售。
在一个实施例中,可以将根据网页的文本信息进行结构化处理后得到的与当前客户关联的客户标识以及根据网页的源代码进行结构化处理后得到的与当前客户关联的客户标识进行对比,若比对一致,则作为当前客户标识对应的关联客户标识。否则,需要进一步通过其他方法例如人工验证确认关联的客户标识是否准确,以提高获取的当前客户标识对应的关联客户标识的准确性。
在一个实施例中,如图6所示,步骤S208即根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识的步骤包括:
步骤S602,根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的候选客户标识以及候选客户标识对应的关联强度。
具体地,关联强度用于表示客户与客户的关联的程度,关联强度大,则关联程度高。例如,若结构化语句为“阿里巴巴收购石基零售38%股份”,则阿里巴巴与实际零售的关联强度可以为0.38。当然,也可以设置股份比例与关联强度的对应关系,例如,可以设置0~10的股份比例对应的关联强度为1,10~30的股份比例对应的关联强度为2等等。
步骤S604,根据各个候选客户标识对应的关联强度从候选客户标识中筛选出关联客户标识。
具体地,得到关联强度后,筛选出关联强度大于预设阈值或者排序在预设排序内的候选客户标识作为关联客户标识。例如,当当前客户标识对应的关联客户标识过多时,还可以获取投资比例或者担保金额,将投资比例或者担保金额排名在前的客户的客户标识作为目标客户标识。
在一个实施例中,客户类型可以包括准客户、推荐用户以及已有客户,将已有客户作为当前客户,获取当前客户对应的关联客户作为推荐用户,推送到终端中进行显示,每一个推荐客户都可以对应有一个添加操作控件,当接收到用户通过添加操作控件发送的添加指令后,将添加指令对应的客户的客户类型由推荐客户更改为准客户,以对客户类型进行管理。
进一步地,可以在后台实时监控各个客户对应的流程变化,根据流程变化对应修改客户的类型。例如,准客户包括的流程包括开拓活动,提交活动审批信息,询价,出单四个流程,可以在后台实时监控各个流程变化,然后根据出单生效时间以及出单的客户信息例如统一社会信用代码、组织机构代码、税务登记号优先顺序来匹配客户,将匹配的已经出单的客户由准客户类型更改为已有客户类型。
如图7所示,在一个实施例中,提供了一种信息处理装置,该信息处理装置可以集成于上述的计算机设备120中,装置包括:
当前标识获取模块702,用于获取当前客户标识。
网页得到模块704,用于根据当前客户标识获取对应的目标网页。
结构化处理模块706,用于对目标网页对应的目标内容进行结构化处理,得到结构化内容。
关联标识得到模块708,用于根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识。
信息获取模块710,用于根据关联客户标识获取对应的客户相关信息,客户相关信息包括客户名称。
推送信息得到模块712,用于将客户相关信息作为当前客户标识对应的客户推送信息。
在一个实施例中,如图8所示,结构化处理模块706包括:
代码获取单元706A,用于获取目标网页对应的源代码。
对象树构造单元706B,用于根据源代码构造包括多个节点的对象树,并根据对象树各个节点对应的源代码的属性设置节点之间的关系。
如图9所示,关联标识得到模块708包括:
匹配关系获取单元708A,用于根据预设的属性词从对象树中获取匹配的节点关系。
目标节点得到单元708B,用于根据匹配的节点关系获取对应的目标节点。
关联标识得到单元708C,用于根据目标节点获取对应的客户标识,作为与当前客户标识存在关联关系的关联客户标识。
如图10所示,在一个实施例中,装置还包括:
身份确定模块1002,用于根据目标节点在匹配的节点关系中的节点类型以及关联关系的类型确定关联客户相对于当前客户的关联身份。
推送信息得到模块712用于:将客户相关信息以及关联客户相对于当前客户的关联身份作为当前客户标识对应的客户推送信息。
在一个实施例中,结构化处理模块706用于对目标网页上的文本信息进行分词,得到结构化语句。关联标识得到模块708用于:根据预设的属性词以及结构化语句的句法结构从结构化语句中获取与当前客户标识存在关联关系的关联客户标识。
如图11所示,在一个实施例中,关联标识得到模块708包括:
候选信息获取单元1102,用于根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的候选客户标识以及候选客户标识对应的关联强度。
关联标识筛选单元1104,用于根据各个候选客户标识对应的关联强度从候选客户标识中筛选出关联客户标识。
如图12所示,为一个实施例中计算机设备的内部结构图,该计算机设备通过系统连接总线连接处理器、非易失性存储介质、内存储器和网络接口。其中,该计算机设备的非易失性存储介质可存储操作系统和计算机程序,该计算机程序被执行时,可使得处理器执行一种信息处理方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该内存储器中可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行一种信息处理方法。计算机设备的网络接口用于进行网络通信,如获取目标网页等等。本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的信息处理装置可以实现为一种计算机程序的形式,计算机程序可在如图12所示的计算机设备上运行,计算机设备的非易失性存储介质可存储组成该信息处理装置的各个程序模块,比如图7中的当前标识获取模块702、网页得到模块704、结构化处理模块706、关联标识得到模块708、信息获取模块710和推送信息得到模块712。各个程序模块中包括计算机程序,计算机程序用于使计算机设备执行本说明书中描述的本申请各个实施例的信息处理方法中的步骤,例如,计算机设备可以通过如图7所示的当前标识获取模块702获取当前客户标识。通过网页得到模块704根据当前客户标识获取对应的目标网页。通过结构化处理模块706对目标网页对应的目标内容进行结构化处理,得到结构化内容。通过关联标识得到模块708根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识。通过信息获取模块710根据关联客户标识获取对应的客户相关信息,客户相关信息包括客户名称。通过推送信息得到模块712,用于将客户相关信息作为当前客户标识对应的客户推送信息。
在一个实施例中,提出了一种计算机设备,计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取当前客户标识;根据当前客户标识获取对应的目标网页;对目标网页对应的目标内容进行结构化处理,得到结构化内容;根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识;根据关联客户标识获取对应的客户相关信息;将客户相关信息作为当前客户标识对应的客户推送信息。
在其中一个实施例中,处理器所执行的对目标网页对应的目标内容进行结构化处理,得到结构化内容的步骤包括:获取目标网页对应的源代码;根据源代码构造包括多个节点的对象树,并根据对象树各个节点对应的源代码的属性设置节点之间的关系;根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识的步骤包括:根据预设的属性词从对象树中获取匹配的节点关系;根据匹配的节点关系获取对应的目标节点;根据目标节点获取对应的客户标识,作为与当前客户标识存在关联关系的关联客户标识。
在其中一个实施例中,处理器执行计算机程序时还执行以下步骤:根据目标节点在匹配的节点关系中的节点类型以及关联关系的类型确定关联客户相对于当前客户的关联身份;将客户相关信息作为当前客户标识对应的客户推送信息的步骤包括:将客户相关信息以及关联客户相对于当前客户的关联身份作为当前客户标识对应的客户推送信息。
在其中一个实施例中,处理器所执行的对目标网页对应的目标内容进行结构化处理,得到结构化内容的步骤包括:对目标网页上的文本信息进行分词,得到结构化语句;根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识的步骤包括:根据预设的属性词以及结构化语句的句法结构从结构化语句中获取与当前客户标识存在关联关系的关联客户标识。
在其中一个实施例中,处理器所执行的根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识的步骤包括:根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的候选客户标识以及候选客户标识对应的关联强度;根据各个候选客户标识对应的关联强度从候选客户标识中筛选出关联客户标识。
在一个实施例中,提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:获取当前客户标识;根据当前客户标识获取对应的目标网页;对目标网页对应的目标内容进行结构化处理,得到结构化内容;根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识;根据关联客户标识获取对应的客户相关信息;将客户相关信息作为当前客户标识对应的客户推送信息。
在其中一个实施例中,处理器所执行的对目标网页对应的目标内容进行结构化处理,得到结构化内容的步骤包括:获取目标网页对应的源代码;根据源代码构造包括多个节点的对象树,并根据对象树各个节点对应的源代码的属性设置节点之间的关系;根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识的步骤包括:根据预设的属性词从对象树中获取匹配的节点关系;根据匹配的节点关系获取对应的目标节点;根据目标节点获取对应的客户标识,作为与当前客户标识存在关联关系的关联客户标识。
在其中一个实施例中,处理器执行计算机程序时还执行以下步骤:根据目标节点在匹配的节点关系中的节点类型以及关联关系的类型确定关联客户相对于当前客户的关联身份;将客户相关信息作为当前客户标识对应的客户推送信息的步骤包括:将客户相关信息以及关联客户相对于当前客户的关联身份作为当前客户标识对应的客户推送信息。
在其中一个实施例中,处理器所执行的对目标网页对应的目标内容进行结构化处理,得到结构化内容的步骤包括:对目标网页上的文本信息进行分词,得到结构化语句;根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识的步骤包括:根据预设的属性词以及结构化语句的句法结构从结构化语句中获取与当前客户标识存在关联关系的关联客户标识。
在其中一个实施例中,处理器所执行的根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的关联客户标识的步骤包括:根据预设的属性词从结构化内容中获取与当前客户标识存在关联关系的候选客户标识以及候选客户标识对应的关联强度;根据各个候选客户标识对应的关联强度从候选客户标识中筛选出关联客户标识。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种信息处理方法,其特征在于,所述方法包括:
获取当前客户标识;
根据所述当前客户标识获取对应的目标网页;
对所述目标网页对应的目标内容进行结构化处理,得到结构化内容;
根据预设的属性词从所述结构化内容中获取与所述当前客户标识存在关联关系的关联客户标识;
根据所述关联客户标识获取对应的客户相关信息;
将所述客户相关信息作为所述当前客户标识对应的客户推送信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标网页对应的目标内容进行结构化处理,得到结构化内容的步骤包括:
获取所述目标网页对应的源代码;
根据所述源代码构造包括多个节点的对象树,并根据所述对象树各个节点对应的源代码的属性设置节点之间的关系;
所述根据预设的属性词从所述结构化内容中获取与所述当前客户标识存在关联关系的关联客户标识的步骤包括:
根据所述预设的属性词从所述对象树中获取匹配的节点关系;
根据所述匹配的节点关系获取对应的目标节点;
根据所述目标节点获取对应的客户标识,作为与所述当前客户标识存在关联关系的关联客户标识。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据所述目标节点在所述匹配的节点关系中的节点类型以及所述关联关系的类型确定关联客户相对于当前客户的关联身份;
所述将所述客户相关信息作为所述当前客户标识对应的客户推送信息的步骤包括:
将所述客户相关信息以及所述关联客户相对于所述当前客户的关联身份作为所述当前客户标识对应的客户推送信息。
4.根据权利要求1所述的方法,其特征在于,所述对所述目标网页对应的目标内容进行结构化处理,得到结构化内容的步骤包括:
对所述目标网页上的文本信息进行分词,得到结构化语句;
所述根据预设的属性词从所述结构化内容中获取与所述当前客户标识存在关联关系的关联客户标识的步骤包括:
根据所述预设的属性词以及所述结构化语句的句法结构从所述结构化语句中获取与所述当前客户标识存在关联关系的关联客户标识。
5.根据权利要求1所述的方法,其特征在于,所述根据预设的属性词从所述结构化内容中获取与所述当前客户标识存在关联关系的关联客户标识的步骤包括:
根据预设的属性词从所述结构化内容中获取与所述当前客户标识存在关联关系的候选客户标识以及所述候选客户标识对应的关联强度;
根据所述各个候选客户标识对应的关联强度从所述候选客户标识中筛选出所述关联客户标识。
6.一种信息处理装置,其特征在于,所述装置包括:
当前标识获取模块,用于获取当前客户标识;
网页得到模块,用于根据所述当前客户标识获取对应的目标网页;
结构化处理模块,用于对所述目标网页对应的目标内容进行结构化处理,得到结构化内容;
关联标识得到模块,用于根据预设的属性词从所述结构化内容中获取与所述当前客户标识存在关联关系的关联客户标识;
信息获取模块,用于根据所述关联客户标识获取对应的客户相关信息;
推送信息得到模块,用于将所述客户相关信息作为所述当前客户标识对应的客户推送信息。
7.根据权利要求6所述的装置,其特征在于,所述结构化处理模块包括:
代码获取单元,用于获取所述目标网页对应的源代码;
对象树构造单元,用于根据所述源代码构造包括多个节点的对象树,并根据所述对象树各个节点对应的源代码的属性设置节点之间的关系;
所述关联标识得到模块包括:
匹配关系获取单元,用于根据所述预设的属性词从所述对象树中获取匹配的节点关系;
目标节点得到单元,用于根据所述匹配的节点关系获取对应的目标节点;
关联标识得到单元,用于根据所述目标节点获取对应的客户标识,作为与所述当前客户标识存在关联关系的关联客户标识。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
身份确定模块,用于根据所述目标节点在所述匹配的节点关系中的节点类型以及所述关联关系的类型确定关联客户相对于当前客户的关联身份;
所述推送信息得到模块用于:
将所述客户相关信息以及所述关联客户相对于所述当前客户的关联身份作为所述当前客户标识对应的客户推送信息。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至5中任一项权利要求所述信息处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1至5中任一项权利要求所述信息处理方法的步骤。
CN201711229916.4A 2017-11-29 2017-11-29 信息处理方法、装置、计算机设备和存储介质 Active CN107918672B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711229916.4A CN107918672B (zh) 2017-11-29 2017-11-29 信息处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711229916.4A CN107918672B (zh) 2017-11-29 2017-11-29 信息处理方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN107918672A true CN107918672A (zh) 2018-04-17
CN107918672B CN107918672B (zh) 2021-04-02

Family

ID=61898110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711229916.4A Active CN107918672B (zh) 2017-11-29 2017-11-29 信息处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN107918672B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140108431A1 (en) * 2008-07-24 2014-04-17 Alibaba Group Holding Limited Correlated information recommendation
CN104899268A (zh) * 2015-05-25 2015-09-09 浪潮集团有限公司 一种分布式企业信息垂直搜索方法
CN107342976A (zh) * 2017-05-18 2017-11-10 辛柯俊 针对企业产业链分析的移动应用平台与方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140108431A1 (en) * 2008-07-24 2014-04-17 Alibaba Group Holding Limited Correlated information recommendation
CN104899268A (zh) * 2015-05-25 2015-09-09 浪潮集团有限公司 一种分布式企业信息垂直搜索方法
CN107342976A (zh) * 2017-05-18 2017-11-10 辛柯俊 针对企业产业链分析的移动应用平台与方法

Also Published As

Publication number Publication date
CN107918672B (zh) 2021-04-02

Similar Documents

Publication Publication Date Title
JP7291713B2 (ja) 向上したビジネスリスティングのための知識検索エンジンプラットフォーム
CN104834668B (zh) 基于知识库的职位推荐系统
Shema et al. Do blog citations correlate with a higher number of future citations? Research blogs as a potential source for alternative metrics
US8166013B2 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
US7937383B2 (en) Generating anonymous log entries
US11238233B2 (en) Artificial intelligence engine for generating semantic directions for websites for automated entity targeting to mapped identities
US9576046B2 (en) Methods for integrating semantic search, query, and analysis across heterogeneous data types and devices thereof
US20090106307A1 (en) System of a knowledge management and networking environment and method for providing advanced functions therefor
JP6906419B2 (ja) 情報提供装置、情報提供方法、およびプログラム
Barbier et al. Provenance data in social media
CN103294781B (zh) 一种用于处理页面数据的方法与设备
US20080160490A1 (en) Seeking Answers to Questions
US20100057772A1 (en) Automatic determination of an entity&#39;s searchable social network using role-based inferences
CN110597962B (zh) 搜索结果展示方法、装置、介质及电子设备
US8099430B2 (en) Computer method and apparatus of information management and navigation
CN102483756A (zh) 使用社区交流的语义分析的助理顾问
US9607091B2 (en) Methods, systems, and computer program products for implementing intelligent agent services
US20110208715A1 (en) Automatically mining intents of a group of queries
US9069880B2 (en) Prediction and isolation of patterns across datasets
US11392589B2 (en) Multi-vertical entity-based search system
JP2007219655A (ja) 施設情報管理システム、施設情報管理方法および施設情報管理プログラム
Muttaqien et al. Modeling aggregated expertise of user contributions to assess the credibility of OpenStreetMap features
CN110688407B (zh) 一种社会关系挖掘的方法
CN103226567A (zh) 旅行管理
Jiang et al. HyOASAM: A hybrid open API selection approach for mashup development

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant