CN110019700B - 数据处理方法和设备 - Google Patents

数据处理方法和设备 Download PDF

Info

Publication number
CN110019700B
CN110019700B CN201710821415.9A CN201710821415A CN110019700B CN 110019700 B CN110019700 B CN 110019700B CN 201710821415 A CN201710821415 A CN 201710821415A CN 110019700 B CN110019700 B CN 110019700B
Authority
CN
China
Prior art keywords
attribute name
digital
attribute
consultation
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710821415.9A
Other languages
English (en)
Other versions
CN110019700A (zh
Inventor
赵中州
陈海青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201710821415.9A priority Critical patent/CN110019700B/zh
Publication of CN110019700A publication Critical patent/CN110019700A/zh
Application granted granted Critical
Publication of CN110019700B publication Critical patent/CN110019700B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种数据处理方法和设备,该方法包括:识别咨询语句中包含的数字特征;根据数字特征是否满足属性名称对应的预设取值条件,确定与咨询语句中包含的数字特征具有搭配关系的属性名称;输出与由具有搭配关系的数字特征和属性名称构成的咨询关键字对应的回复语句,以完成向用户的自动回复。通过本方案,可以基于属性名称对应的预设取值条件,为咨询语句中包含的数字特征确定与之具有搭配关系的属性名称,从而可以简单、准确地识别用户的咨询关键字,以便准确对用户的咨询问题进行自动应答。

Description

数据处理方法和设备
技术领域
本发明涉及互联网技术领域,尤其涉及一种数据处理方法和设备。
背景技术
买家可以通过电子商务平台购买卖家所销售的商品。在买家购买卖家的商品的过程中,买家可能需要就比如所要购买衣物的尺寸、鞋码等问题进行咨询,为了满足买家的咨询需求,电子商务平台提供了买家与卖家可以交互的交互工具,比如内置在网页中的在线交互工具,以方便买家可以通过该交互工具与卖家进行交互,进行问题咨询。另外,如果买家的咨询都是基于人工回复的方式进行解答,随着咨询数量的不断增加,答复及时性将大打折扣,为此,还提供了自动问答功能,以自动答复买家的咨询问题。
一种常见的买家在线购物时的咨询场景是:诸如“我身高176,体重55应该穿多大码”,“我爸1米七150斤穿多大码”这样的与尺码相关的咨询。因此,准确识别出用户咨询问题中的尺码相关信息是自动给出推荐尺码的回复的前提。
在上述场景下,目前一种常用的尺码信息识别方法是:基于规则模板的识别方法。例如定义规则模板:身高xx和体重xx,可以识别:…身高是180,体重70这样的咨询问题中的尺码信息。此时,如果咨询问题中尺码的表达方式已经被模板覆盖则可以基于模板识别出对应的数值。
但是,该识别方法一方面需要部署大量的模板,因为买家的表达方式可能多种多样;另一方面,也可能会存在模板间冲突导致识别出错的可能性很高,比如针对咨询问题:体重150身高170和150体重170身高,模板1:体重xx和模板2:xx体重识别到的结果完全不同。
发明内容
有鉴于此,本发明实施例提供一种数据处理方法和设备,用以提高数据处理的准确性。
第一方面,本发明实施例提供一种数据处理方法,包括:
识别咨询语句中包含的数字特征;
根据所述数字特征是否满足属性名称对应的预设取值条件,确定与所述数字特征具有搭配关系的属性名称;
输出与由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字对应的回复语句。
另外,本发明实施例提供一种数据处理装置,包括:
识别模块,用于识别咨询语句中包含的数字特征;
第一确定模块,用于根据所述数字特征是否满足属性名称对应的预设取值条件,确定与所述数字特征具有搭配关系的属性名称;
输出模块,用于输出与由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字对应的回复语句。
第二方面,本发明实施例还提供一种电子设备,与上述数据处理装置对应,包括处理器和存储器;所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如第一方面所述的数据处理方法。所述电子设备还可以包括通信接口,用于该电子设备与其他设备或通信网络通信。
本发明实施例提供了一种计算机存储介质,用于储存电子设备所用的计算机软件指令,其包含用于执行上述第一方面中数据处理方法所涉及的程序。
第三方面,本发明实施例提供另一种数据处理方法,包括:
识别数据中包含的数字特征和属性名称;
根据所述数字特征是否满足属性名称对应的预设取值条件,确定与所述数字特征具有搭配关系的属性名称;
输出具有搭配关系的数字特征和属性名称。
第四方面,本发明实施例提供一种电子设备,包括存储器和处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如第三方面所述的数据处理方法。
第五方面,本发明实施例提供另一种数据处理方法,应用于服务器中,包括:
接收客户端发送的咨询语句,识别所述咨询语句中包含的数字特征和属性名称;
根据所述数字特征是否满足属性名称对应的预设取值条件,确定与所述数字特征具有搭配关系的属性名称;
获取与由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字对应的回复语句;
将所述回复语句发送至所述客户端,以使所述客户端展示所述回复语句。
第六方面,本发明实施例提供一种电子设备,包括存储器和处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如第五方面所述的数据处理方法。
第七方面,本发明实施例提供另一种数据处理方法,应用于客户端中,包括:
将包括数字特征和属性名称的咨询语句发送至服务器,以供所述服务器根据所述数字特征是否满足属性名称对应的预设取值条件,确定与所述数字特征具有搭配关系的属性名称;
接收所述服务器发送的回复语句,所述回复语句是所述服务器根据由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字查询获得的;
展示所述回复语句。
第八方面,本发明实施例提供一种电子设备,包括存储器和处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如第七方面所述的数据处理方法。
第九方面,本发明实施例提供另一种数据处理方法,应用于客户端中,包括:
识别用户输入的咨询语句中包含的数字特征和属性名称;
根据所述数字特征是否满足属性名称对应的预设取值条件,确定与所述数字特征具有搭配关系的属性名称;
将由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字发送至服务器;
接收所述服务器发送的与所述咨询关键字对应的回复语句;
展示所述回复语句。
第十方面,本发明实施例提供一种电子设备,包括存储器和处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如第九方面所述的数据处理方法。
第十一方面,本发明实施例提供另一种数据处理方法,应用于服务器中,包括:
接收客户端发送的与咨询语句对应的咨询关键字,所述咨询关键字由具有所述搭配关系的数字特征和属性名称构成,其中,与所述数字特征具有搭配关系的属性名称是所述客户端根据所述数字特征是否满足属性名称对应的预设取值条件确定的;
获取与所述咨询关键字对应的回复语句;
将所述回复语句发送至所述客户端,以使所述客户端展示所述回复语句。
第十二方面,本发明实施例提供一种电子设备,包括存储器和处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如第十一方面所述的数据处理方法。
本发明实施例提供的数据处理方法和设备,当用户输入咨询语句后,首先识别该咨询语句中包含的数字特征,进而,针对识别出的每个数字特征,根据数字特征是否满足属性名称对应的预设取值条件,确定与数字特征具有搭配关系的属性名称。具体地,若某个数字特征满足某属性名称对应的预设取值条件,则确定该数字特征与该属性名称具有搭配关系。最后,具有搭配关系的数字特征和属性名称将会构成咨询关键字,以获取并输出与该咨询关键字对应的回复语句,以完成向用户的自动回复。通过本方案,可以基于属性名称对应的预设取值条件,为咨询语句中包含的数字特征确定与之具有搭配关系的属性名称,从而可以简单、准确地识别用户的咨询关键字,以便准确对用户的咨询问题进行自动应答。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的数据处理方法实施例一的流程图;
图2为图1所示实施例中步骤102的一种实现方式的流程图;
图3为图1所示实施例中步骤102的另一种实现方式的流程图;
图4为本发明实施例提供的一种数据处理方法的交互流程图;
图5为本发明实施例提供的另一种数据处理方法的交互流程图;
图6为本发明实施例提供的数据处理装置的结构示意图;
图7为本发明实施例提供的与数据处理装置对应的电子设备的结构示意图;
图8为本发明实施例提供的数据处理方法实施例二的流程图;
图9为执行图8所示数据处理方法的数据处理装置的结构示意图;
图10为与图9所示数据处理装置对应的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述XXX,但这些XXX不应限于这些术语。这些术语仅用来将XXX区分开。例如,在不脱离本发明实施例范围的情况下,第一XXX也可以被称为第二XXX,类似地,第二XXX也可以被称为第一XXX。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
另外,下述各方法实施例中的步骤时序仅为一种举例,而非严格限定。
图1为本发明实施例提供的数据处理方法实施例一的流程图,本实施例提供的该数据处理方法可以由一数据处理装置来执行,该数据处理装置可以实现为软件,或者实现为软件和硬件的组合,该数据处理装置可以设置在安装有新版软件的电子设备中。如图1所示,该方法包括如下步骤:
101、识别咨询语句中包含的数字特征和属性名称。
102、根据数字特征是否满足属性名称对应的预设取值条件,确定与咨询语句中包含的数字特征具有搭配关系的属性名称。
103、输出与由具有搭配关系的数字特征和属性名称构成的咨询关键字对应的回复语句。
以用户通过电子商务平台进行网上购物的应用场景为例,用户在购买衣服、鞋子等时,可能会需要向商家咨询自己适合穿多大的尺寸,此时,用户可以通过电子商务平台提供的在线交互工具输入自己的咨询问题。一般地,用户的咨询问题中会包括诸如身高、体重、脚长、胸围等特征信息,以便电子商务平台基于识别出的这些信息为用户自动推荐合适的衣服、鞋子尺码,进行自动回复。
本发明实施例中,可以将用户的咨询语句中包含的特征信息划分为数字特征和属性名称。可选地,数字特征可以包括数值以及与该数值相邻的度量单位,比如165cm、105斤,属性名称则可以为数字特征对应的属性的名称,比如身高、体重。
实际应用中,用户的咨询语句的表达方式各种各样,比如可以是:我身高165cm,体重50kg应该穿多大码?也可以是:我身高165,105斤该穿多大的?还可以是:165的,105斤穿多大?等等。因此,若想准确识别出用户的咨询语句中包含的全部特征信息,以这些特征信息构成咨询关键字,就需要准确确定数字特征与属性名称之间的搭配关系,因为数字特征和与其具有搭配关系的属性名称才会形成一个完整的特征信息,比如身高165cm为由具有搭配关系的属性名称:身高,以及数字特征165cm形成的一个特征信息;体重50kg为由具有搭配关系的属性名称:体重,以及数字特征50kg形成的一个特征信息,而咨询关键字可以为身高:165cm,体重:50kg。
综上,为了能够自动对用户的咨询语句进行应答,首先需要获取到用户咨询语句中包含的咨询关键字,进而确定并输出与该咨询关键字对应的回复语句。可以理解的是,该回复语句中会包含与咨询关键字对应的应答关键字,比如在进行衣服尺码咨询的场景中,与咨询关键字身高:165cm,体重:50kg对应的应答关键字为L码,则回复语句可以是:为您推荐L码。而获取咨询关键字的关键在于确定与咨询语句中各数字特征分别具有搭配关系的属性名称。因此,当接收到用户输入的咨询语句后,可以通过识别该咨询语句中包含的数值、度量单位、属性名称的描述,来识别咨询语句中包括的数字特征和属性名称。
另外,实际应用中,用户的表达方式可能多种多样,比如针对数值来说,用户可能会以阿拉伯数字的方式进行表达,比如165,还可能会以中文数字的方式进行表达,比如一米六五。再比如针对度量单位来说,用于度量重量的单位可能会有斤、公斤、kg等表达方式。再比如针对身高这一属性名称来说,可能会表达为身高,也可能会表达为个头。因此,一方面,为了准确识别出咨询语句中包括的数字特征和属性名称,可以针对应用场景,预先设置覆盖全面的识别规则即覆盖数字特征和属性名称的各种常用表达方式,以准确识别出咨询语句中包括的数字特征和属性名称;另一方面,为了避免不同表达方式对后续确定与数字特征具有搭配关系的属性名称的不利影响,当发现识别出的数字特征、属性名称不符合预设的标准表达方式时,对识别出的数字特征、属性名称进行表达形式归一化处理。
在进行表达方式归一化处理过程中,可选地,可以首先进行比如将中文数字转换为阿拉伯数字,全角数字转半角数字,属性名称的表达转换为标准化表达等预处理。比如:一米八转换为1米8;165高108斤转换为165高108斤;个头转换为身高。之后,可以进行同单位数字的合并处理以及度量单位的归一化处理。
具体地,若识别到相邻两个数字之间夹有度量单位,则合并相邻两个数字和度量单位;将合并结果转换为与度量单位对应的归一化表达形式。
举例来说,假设咨询语句为:我一米八,80体重穿多大。经上述预处理后,数字特征:一米、八,将被转换为1米、8。由于1和8中间夹着度量单位米,合并相邻两个数字和该度量单位则为1米8,进而将度量单位米转换为对应的归一化表达形式cm,则转换为180cm。从而,经过上述的归一化处理后,识别得到的数字特征为180cm,80;属性名称为体重,基于此,进行后续的处理。
值得说明的是,本实施例中,识别咨询语句中包含的数字特征和属性名称的步骤,并非意味着当前接收到的咨询语句中一定包含数字特征和属性名称,而只是强调对咨询语句执行识别这一处理,以将其中可能包含的数字特征和属性名称识别出来,而识别结果中是否包含属性名称则取决于咨询语句中是否包含属性名称的描述。也就是说,咨询语句中一定会包含数字特征,而并不一定包含属性名称,并且,包含的数字特征中可能仅包含数值,而不包含度量单位。比如,若当前接收到的咨询语句表达为:165,105穿多大码,该咨询语句中仅包含数值,则识别结果将仅包括165、105这两个数值。
从而,通过识别咨询语句中包含的数字特征和属性名称,一种可能的识别结果是:咨询语句中可能既包含了数字特征,也包含了属性名称。而另一种可能的识别结果是:咨询语句中可能仅包含了数字特征,而不包含属性名称。而且,识别结果中的数字特征还可能是仅是部分数字特征,比如当数字特征被定义为可用包括数值和度量单位时,识别结果中可能仅包括数值,而不包括度量单位。
不管识别结果是上述哪种情形,本发明实施例中,针对识别出的数字特征,在确定与其具有搭配关系的属性名称时,都是基于数字特征是否满足属性名称对应的预设取值条件这一判断原则实现的。只是,不同的识别结果情形下,作为识别出的数字特征的判断对象的属性名称来源不同。概括来说,当识别结果中既有数字特征又有属性名称时,对于识别出的数字特征,首先要从识别出的属性名称中确定与其具有搭配关系的属性名称。而当识别结果中仅包含数字特征时,则需要结合咨询语句所对应的应用场景,获取该应用场景下可能涉及到的属性名称,进而从中为识别出的数字特征确定具有搭配关系的属性名称。
下面结合图2和图3所示实施例,介绍不同识别结果的情形下,确定与识别出的数字特征具有搭配关系的属性名称的过程。
当识别结果中包含属性名称时,如图2所示,确定与识别出的数字特征具有搭配关系的属性名称的过程可以包括如下步骤:
201、在咨询语句中扫描数字特征前后预设数量词语中是否存在属性名称,若存在,则执行步骤202,否则,执行步骤204。
202、判断数字特征是否满足扫描到的属性名称对应的预设取值条件,若满足,则执行步骤203,否则,执行步骤204。
203、确定数字特征与扫描到的属性名称具有搭配关系。
204、识别咨询语句对应的应用场景,获取与应用场景对应的属性名称集合。
205、从属性名称集合中去除包含于咨询语句中的属性名称。
206、从属性名称集合剩余的属性名称中,根据数字特征是否满足剩余的属性名称对应的预设取值条件,选择与数字特征具有搭配关系的属性名称。
咨询语句中包括的数字特征数量可能是一个,也可能不止一个,因此,在实际实现中,可以依次遍历从咨询语句中识别出的各数字特征,对于当前遍历到的数字特征,扫描该数字特征前后预设数量词语中是否存在属性名称。其中,预设数量词语,比如为2个词语、3个词语。可选地,针对当前遍历到的数字特征,可以以该数字特征为中心,分别扫描其前后的数量词语中前后是否存在属性名称。如果存在,说明扫描到的属性名称很有可能是与该数字特征具有搭配关系的属性名称;如果不存在,则可以认为咨询语句中不存在于该数字特征具有搭配关系的属性名称,进而执行步骤204-206的处理过程。
结合用户的实际表达习惯,一般来说,如果咨询语句中包含属性名称,则与该属性名称搭配的数字特征与该属性名称往往是紧邻的,因此,如果某数字特征前后预设数量词语中未扫描到属性名称,则可以认为咨询语句中不包含于该数字特征具有搭配关系的属性名称。
另外,对于当前遍历到的数字特征,如果在其前后扫描到属性名称时,扫描到的属性名称可能为一个,也可能不止一个,为了准确确定与该数字特征具有搭配关系的属性名称,还需要基于该数字特征是否满足扫描到的属性名称所对应的预设取值条件来确定扫描到的属性名称中是否存在与该数字特征具有搭配关系的属性名称。如果该数字特征满足扫描到的某个属性名称对应的预设取值条件,则确定该属性名称与该数字特征具有搭配关系。
可以预先设定各属性名称对应的取值条件,比如针对身高这个属性名称来说,其对应的预设取值条件可以为150cm-200cm。
具体地,针对当前遍历到的数字特征以及在该数字特征前后扫描到的某属性名称来说,如果该数字特征对应的数值包含于该属性名称对应的预设数值范围,并且该数字特征对应的度量单位与该属性名称对应的预设度量单位匹配,则确定该数字特征与该属性名称具有搭配关系。
值得说明的是,当前遍历到的该数字特征中可能仅有数值而缺失度量单位,此时,可以直接认为该数字特征对应的度量单位与该属性名称对应的预设度量单位匹配,从而仅需判断该数字特征对应的数值是否包含于上述属性名称对应的预设数值范围内。
举例来说,第一个例子,假设咨询语句为:我70kg,身高180。识别出该咨询语句中包括的数字特征为70kg,180,属性名称为身高。首先遍历到数字特征70kg,假设预设数量词语为2个词语,则70kg前后扫描两个词语,扫描到身高这个属性名称。假设身高的预设取值条件为150cm-200cm,则在进行70kg是否满足身高的预设取值条件的判断时发现:70未落入150-200的取值范围内,而且kg这个单位也与身高对应的预设度量单位cm不匹配,从而判定身高不是与70kg具有搭配关系的属性名称,从而,需要结合上述步骤204-206的过程确定与70kg具有搭配关系的属性名称。之后,遍历到第二个数字特征180,同样地,扫描其前后预设数量词语中是否存在属性名称,发现存在属性名称身高。进而,在进行180是否满足身高的预设取值条件的判断时发现:180未落入150-200的取值范围内,而且由于180其后未紧邻有度量单位,直接认为与身高对应的预设度量单位cm匹配,从而判定身高是与180具有搭配关系的属性名称。
另外,结合上述举例来说,咨询语句中识别出的数字特征可能仅包含数值而不包含度量单位,比如上述的180,针对此情形,可选地,若识别出数字特征中缺失度量单位,则可以将与该数字特征具有搭配关系的属性名称所对应的预设度量单位确定为与数字特征对应的度量单位。上述举例中,当确定出与180具有搭配关系的属性名称为身高后,可以将身高对应的预设度量单位cm赋给180,从而实现度量单位的补全。
第二个例子,假设咨询语句为:我是180身高和70的体重。识别出的数字特征为180、70,属性名称为:身高、体重。依次遍历数字特征时,对于首先遍历的数字特征180来说,在其前后扫描预设数量词语比如为2个词语,则扫描到的属性名称为身高,假设通过判断确定180符合身高的预设取值条件,则确定与180具有搭配关系的属性名称为身高,进而,以身高对应的预设度量单位cm为数字特征180补全度量单位,得到完整的数字特征180cm。之后,由于身高已经被确定为是与180具有搭配关系的属性名称,则后续遍历第二个数字特征70时,则无需再考虑身高这个属性名称,从而,在70前后扫描预设数量词语时,可以从扫描出的身高、体重两个属性名称中去除身高,从而仅判断70是否满足体重的预设取值条件。
本实施例中,针对咨询语句中的某数字特征,如果在该数字特征的前后预设数量词语中没有扫描到属性名称,或者扫描到的属性名称经判断后确定与该数字特征不具有搭配关系,则说明咨询语句中不存在与该数字特征具有搭配关系的属性名称,比如上述第一个举例中的70kg。此时,可以结合咨询语句的上下文,识别该咨询语句对应的应用场景,从而根据该应用场景中可能涉及到的属性名称推断与该数字特征70kg具有搭配关系的属性名称。
可选地,咨询语句的上下文可以包括咨询语句中包括的场景关键字,或者,可以是用户输入咨询语句前的操作路径。
举例来说,假设咨询语句为:我平时穿42的皮鞋,其中,皮鞋作为场景关键字,可以据此确定应用场景为鞋类购买场景。再比如,假设通过记录用户的操作路径发现用户是通过点击鞋这个分类标签最终进入的咨询语句输入界面,则根据该分类标签确定应用场景为鞋类购买场景。可以预先为不同应用场景设置相应的属性名称以及属性名称对应的预设取值条件。比如针对鞋类购买的应用场景,该场景中可以包括脚长和鞋码两个属性名称,脚长的预设取值条件比如为:225cm-280cm,鞋码的预设取值条件比如为:34-44。再比如针对衣服购买的应用场景,该场景中可以包括身高和体重两个属性名称,身高的预设取值条件比如为:150cm-200cm,体重的预设取值条件比如为:40kg-90kg。
本实施例中,假设识别出咨询语句对应的应用场景为衣服购买的应用场景,获取该与应用场景对应的属性名称集合,则该集合中将包括身高和体重两个属性名称。进而,可以从获得的属性名称集合中去除包含于咨询语句中的属性名称,因为包含于咨询语句中的属性名称经过前述步骤201-203的过程将会被匹配给某个数字特征。结合上述第一个举例来说,从属性名称集合中去除咨询语句中包含的属性名称:身高,则剩余的属性名称为体重。进而,针对未从咨询语句中获得具有搭配关系的属性名称的数字特征即上述例子中的70kg来说,从属性名称集合剩余的属性名称中,根据数字特征是否满足剩余的属性名称对应的预设取值条件,选择与数字特征具有搭配关系的属性名称。由于此时属性名称集合剩余的属性名称为体重,则判断70kg是否满足体重对应的预设取值条件。由于70包含于体重的取值范围40-90,并且度量单位kg也与体重的预设度量单位匹配,则确定体重为与数字特征70kg具有搭配关系的属性名称。
综上,通过上述过程即可在咨询语句中包含有属性名称的情况下,确定与咨询语句中包含的各数字特征分别具有搭配关系的属性名称。
而当咨询语句的识别结果中不包含属性名称时,如图3所示,确定与识别出的数字特征具有搭配关系的属性名称的过程可以包括如下步骤:
301、识别咨询语句对应的应用场景,获取与应用场景对应的属性名称集合。
302、从属性名称集合包含的属性名称中,根据数字特征是否满足剩余的属性名称对应的预设取值条件,选择与识别出的数字特征具有搭配关系的属性名称。
此时,假设咨询语句为:我180,70应该穿多大的。通过识别咨询语句发现该咨询语句中仅包括180和70两个数字特征,而不包含属性名称。此时,可以根据咨询语句的上下文确定咨询语句对应的应用场景,假设应用场景为衣服购买的应用场景。进而,获得预先设置的与该应用场景对应的属性名称集合,假设该属性名称集合中包括身高和体重两个属性名称,并且假设身高的预设取值条件为:150cm-200cm,体重的预设取值条件为:40kg-90kg。通过进行数字特征是否满足属性名称对应的预设取值条件的判断发现:180满足身高的预设取值条件,70满足体重的预设取值条件,则确定与180具有搭配关系的属性名称为身高,与70具有搭配关系的属性名称为体重。进而,可选地,还可以根据身高和体重分别对应的预设度量单位cm和kg对这两个数字特征进行度量单位的补全。
另外,需要说明的是,在某些应用场景下,不同属性名称对应的预设取值条件之间可能会具有一定的约束关系,比如身高和体重具有一定的比例约束关系。假设咨询语句中包含的两个数字特征都满足同一个属性名称的预设取值条件时,可以基于该约束关系确定两个数字特征中与该属性名称具有搭配关系的数字特征。比如,假设咨询语句中的两个数字特征180和150均满足身高的预设取值条件,且该应用场景下对应的属性名称集合中假设包括身高和体重两个属性名称,则根据身高和体重的约束关系,认为数值较大的180与身高具有搭配关系,从而,150与体重具有搭配关系。
综上,本发明实施例中,当用户输入咨询语句后,首先识别该咨询语句中包含的数字特征,进而,针对识别出的每个数字特征,根据数字特征是否满足属性名称对应的预设取值条件,确定与数字特征具有搭配关系的属性名称。具体地,若某个数字特征满足某属性名称对应的预设取值条件,则确定该数字特征与该属性名称具有搭配关系。最后,具有搭配关系的数字特征和属性名称将会构成咨询关键字,以获取并输出与该咨询关键字对应的回复语句,以完成向用户的自动回复。通过本方案,可以基于属性名称对应的预设取值条件,为咨询语句中包含的数字特征确定与之具有搭配关系的属性名称,从而可以简单、准确地识别用户的咨询关键字,以便准确对用户的咨询问题进行自动应答。
下面结合图4和图5对本发明实施例提供的数据处理方法在实际应用中可以实现的不同形式进行介绍。
图4为本发明实施例提供的一种数据处理方法的交互流程图,如图4所示,该方法包括如下步骤:
401、客户端将包括数字特征和属性名称的咨询语句发送至服务器。
客户端接收用户输入的包括数字特征和属性名称的咨询语句,并将该咨询语句发送至服务器,以供服务器确定与其中的数字特征具有搭配关系的属性名称。
402、服务器识别接收自客户端的咨询语句中包含的数字特征和属性名称。
403、服务器根据数字特征是否满足属性名称对应的预设取值条件,确定与咨询语句中包含的数字特征具有搭配关系的属性名称。
404、服务器获取与由具有搭配关系的数字特征和属性名称构成的咨询关键字对应的回复语句。
405、服务器将回复语句发送至客户端。
406、客户端展示回复语句。
由此可知,本实施例中,主要是由服务器进行数字特征与属性名称间搭配关系的确定。本实施例中未详细展开描述的内容请参加前述各实施例中的相关说明,在此不赘述。
图5为本发明实施例提供的另一种数据处理方法的交互流程图,如图5所示,该方法包括如下步骤:
501、客户端识别用户输入的咨询语句中包含的数字特征和属性名称。
502、客户端根据数字特征是否满足属性名称对应的预设取值条件,确定与咨询语句中包含的数字特征具有搭配关系的属性名称。
503、客户端将由具有搭配关系的数字特征和属性名称构成的咨询关键字发送至服务器。
504、服务器获取与咨询关键字对应的回复语句。
505、服务器将回复语句发送至客户端。
506、客户端展示回复语句。
由此可知,本实施例中,主要是由客户端进行数字特征与属性名称间搭配关系的确定。本实施例中未详细展开描述的内容请参加前述各实施例中的相关说明,在此不赘述。
另外,值得说明的是,数字特征与属性名称间搭配关系的确定也可以在客户端侧执行部分,在服务器侧执行另一部分。具体而言,可选地,结合前述实施例中的介绍,可以在客户端侧进行咨询语句中已经包含的属性名称与数字特征的搭配关系的确定。举例来说,比如咨询语句中包含了3个数字特征,而仅包含2个属性名称,此时,客户端侧可以针对这2个属性名称,确定这2个属性名称分别与哪个数字特征具有搭配关系,而与剩余的一个数字特征具有搭配关系的属性名称的确定则可以由服务器侧完成,即服务器通过识别咨询语句对应的应用场景,结合该应用场景对应的属性名称集合进行与剩余数字特征具有搭配关系的属性名称的确定。
以下将详细描述本发明的一个或多个实施例的数据处理装置。本领域技术人员可以理解,这些数据处理装置均可使用市售的硬件组件通过本方案所教导的步骤进行配置来构成。
图6为本发明实施例提供的数据处理装置的结构示意图,该数据处理装置可以位于服务器中。如图6所示,该装置包括:识别模块11、第一确定模块12、输出模块13。
识别模块11,用于识别咨询语句中包含的数字特征和属性名称。
第一确定模块12,用于根据所述数字特征是否满足属性名称对应的预设取值条件,确定与所述数字特征具有搭配关系的属性名称。
输出模块13,用于输出与由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字对应的回复语句。
在一可选实施方式中,所述第一确定模块12包括:扫描单元121、确定单元122。
扫描单元121,用于在所述咨询语句中扫描所述数字特征前后预设窗口内是否存在属性名称。
确定单元122,用于响应于所述扫描单元扫描到所述数字特征前后预设窗口内存在属性名称,若所述数字特征满足所述属性名称对应的预设取值条件,则确定所述数字特征与所述属性名称具有搭配关系。
在一可选实施方式中,所述第一确定模块12包括:识别单元123、获取单元124、去除单元125、选择单元126。
识别单元123,用于响应于所述扫描单元扫描到所述数字特征前后预设窗口内不存在属性名称,识别所述咨询语句对应的应用场景。
获取单元124,用于获取与所述应用场景对应的属性名称集合。
去除单元125,用于从所述属性名称集合中去除包含于所述咨询语句中的属性名称。
选择单元126,用于从所述属性名称集合剩余的属性名称中,根据所述数字特征是否满足所述剩余的属性名称对应的预设取值条件,选择与所述数字特征具有搭配关系的属性名称。
可选地,所述数字特征包括数值和与所述数值相邻的度量单位;所述预设取值条件包括:所述数字特征对应的数值包含于所述属性类型对应的预设数值范围,并且所述数字特征对应的度量单位与所述属性类型对应的预设度量单位匹配。
可选地,该装置还包括:归一化处理模块14。
归一化处理模块14,用于对识别出的所述数字特征和所述属性名称进行表达形式归一化处理。
可选地,所述归一化处理模块14具体用于:
若识别到相邻两个数字之间夹有度量单位,则合并所述相邻两个数字和所述度量单位;将合并结果转换为与所述度量单位对应的归一化表达形式。
可选地,该装置还包括:第二确定模块15,用于若识别出所述数字特征中缺失度量单位,则将与所述数字特征具有搭配关系的属性名称所对应的预设度量单位确定为与所述数字特征对应的度量单位。
图6所示装置可以执行图1-图3所示实施例的方法,本实施例未详细描述的部分,可参考对图1-图3所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1-图3所示实施例中的描述,在此不再赘述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
以上描述了数据处理装置的内部功能和结构,在一个可能的设计中,数据处理装置的结构可实现为一电子设备,该电子设备比如为服务器,如图7所示,该电子设备可以包括:处理器21和存储器22。其中,所述存储器22用于存储支持数据处理装置执行上述任一实施例中提供的数据处理方法的程序,所述处理器21被配置为用于执行所述存储器22中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器21执行时能够实现如下步骤:
识别咨询语句中包含的数字特征和属性名称;
根据所述数字特征是否满足属性名称对应的预设取值条件,确定与所述数字特征具有搭配关系的属性名称;
输出与由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字对应的回复语句。
可选地,所述处理器21还用于执行前述各方法步骤中的全部或部分步骤。
其中,所述数据处理装置的结构中还可以包括通信接口23,用于数据处理装置与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存数据处理装置所用的计算机软件指令,其包含用于执行上述图1-图3所示方法实施例中数据处理方法所涉及的程序。
除此之外,对应于上述图4所示实施例,本发明实施例还提供一种承载有上述客户端的电子设备——终端设备以及对应于服务器的电子设备。
其中,终端设备中包括:处理器和存储器。其中,所述存储器用于存储支持该终端设备执行上述图4所示实施例中客户端所涉及步骤的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时能够实现如下步骤:
将包括数字特征和属性名称的咨询语句发送至服务器,以供所述服务器根据所述数字特征是否满足属性名称对应的预设取值条件,确定与所述数字特征具有搭配关系的属性名称;
接收所述服务器发送的回复语句,所述回复语句是所述服务器根据由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字查询获得的;
展示所述回复语句。
其中,所述终端设备的结构中还可以包括通信接口,用于终端设备与其他设备比如服务器通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存终端设备所用的计算机软件指令,其包含用于执行上述各方法实施例中客户端执行数据处理方法所涉及的程序。
其中,服务器中包括:处理器和存储器。其中,所述存储器用于存储支持该服务器执行上述图4所示实施例中服务器所涉及步骤的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时能够实现如下步骤:
识别接收自客户端的咨询语句中包含的数字特征和属性名称;
根据所述数字特征是否满足属性名称对应的预设取值条件,确定与所述数字特征具有搭配关系的属性名称;
获取与由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字对应的回复语句;
将所述回复语句发送至所述客户端,以使所述客户端展示所述回复语句。
其中,所述服务器的结构中还可以包括通信接口,用于服务器与其他设备比如终端设备通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存服务器所用的计算机软件指令,其包含用于执行上述各方法实施例中服务器执行数据处理方法所涉及的程序。同样地,对应于上述图5所示实施例,本发明实施例也可以提供一种承载有上述客户端的电子设备——终端设备以及对应于服务器的电子设备。
其中,终端设备中包括:处理器和存储器。其中,所述存储器用于存储支持该终端设备执行上述图5所示实施例中客户端所涉及步骤的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时能够实现如下步骤:
识别用户输入的咨询语句中包含的数字特征和属性名称;
根据所述数字特征是否满足属性名称对应的预设取值条件,确定与所述数字特征具有搭配关系的属性名称;
将由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字发送至服务器;
接收所述服务器发送的与所述咨询关键字对应的回复语句;
展示所述回复语句。
其中,所述终端设备的结构中还可以包括通信接口,用于终端设备与其他设备比如服务器通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存终端设备所用的计算机软件指令,其包含用于执行上述各方法实施例中客户端执行数据处理方法所涉及的程序。
其中,服务器中包括:处理器和存储器。其中,所述存储器用于存储支持该服务器执行上述图5所示实施例中服务器所涉及步骤的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时能够实现如下步骤:
接收客户端发送的与咨询语句对应的咨询关键字,所述咨询关键字由具有所述搭配关系的数字特征和属性名称构成,其中,与所述数字特征具有搭配关系的属性名称是所述客户端根据所述数字特征是否满足属性名称对应的预设取值条件确定的;
获取与所述咨询关键字对应的回复语句;
将所述回复语句发送至所述客户端,以使所述客户端展示所述回复语句。
其中,所述服务器的结构中还可以包括通信接口,用于服务器与其他设备比如终端设备通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存服务器所用的计算机软件指令,其包含用于执行上述各方法实施例中服务器执行数据处理方法所涉及的程序。上述各实施例提供的数据处理方法都是在咨询场景中进行介绍的,而实际应用中,除了咨询场景中会涉及到数字特征与属性名称的搭配关系的确定外,还可能会存在其他应用场景也会涉及到数字特征与属性名称的搭配关系的确定,比如某些涉及到用户画像的应用场景。基于此,本发明实施例还提供一种普遍适用的数据处理方法,目的在于确定与数据中包含的数字特征具有搭配关系的属性名称。如图8所示,该方法包括如下步骤:
801、识别数据中包含的数字特征和属性名称。
802、根据数字特征是否满足属性名称对应的预设取值条件,确定与数字特征具有搭配关系的属性名称。
803、输出具有搭配关系的数字特征和属性名称。
其中,上述数字特征和属性名称的识别过程,以及与数字特征具有搭配关系的属性名称的确定过程,可以参见前述实施例中的相关说明,在此不赘述。
图9为执行图8所示数据处理方法的数据处理装置的结构示意图,如图9所示,该装置包括:识别模块31、确定模块32、输出模块33。
识别模块31,用于识别数据中包含的数字特征和属性名称。
确定模块32,用于根据数字特征是否满足属性名称对应的预设取值条件,确定与数字特征具有搭配关系的属性名称。
输出模块33,用于输出具有搭配关系的数字特征和属性名称。
在一个可能的设计中,图9所示数据处理装置的结构可实现为一电子设备,该电子设备比如为服务器,如图10所示,该电子设备可以包括:处理器41和存储器42。其中,所述存储器42用于存储支持数据处理装置执行上述图8所示实施例中提供的数据处理方法的程序,所述处理器41被配置为用于执行所述存储器22中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器21执行时能够实现如下步骤:
识别数据中包含的数字特征和属性名称。
根据数字特征是否满足属性名称对应的预设取值条件,确定与数字特征具有搭配关系的属性名称。
输出具有搭配关系的数字特征和属性名称。
可选地,所述处理器41还用于执行前述各方法步骤中的全部或部分步骤。
其中,所述数据处理装置的结构中还可以包括通信接口43,用于数据处理装置与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存数据处理装置所用的计算机软件指令,其包含用于执行上述图8所示方法实施例中数据处理方法所涉及的程序。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和软件结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (16)

1.一种数据处理方法,其特征在于,包括:
识别咨询语句中包含的数字特征和属性名称;
若在所述咨询语句中扫描到所述数字特征前后预设数量词语中存在属性名称,且所述数字特征满足所述属性名称对应的预设取值条件,则确定所述数字特征与所述属性名称具有搭配关系;
若在所述咨询语句中扫描到所述数字特征前后预设数量词语中不存在属性名称,或者,扫描到所述数字特征前后预设数量词语中存在属性名称但所述数字特征不满足所述属性名称对应的预设取值条件,或者,所述咨询语句中不包含属性名称,则识别所述咨询语句对应的应用场景,获取与所述应用场景对应的属性名称集合,从所述属性名称集合中去除包含于所述咨询语句中的属性名称,以及,从所述属性名称集合剩余的属性名称中,根据所述数字特征是否满足所述剩余的属性名称对应的预设取值条件,选择与所述数字特征具有搭配关系的属性名称;
输出与由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字对应的回复语句。
2.根据权利要求1所述的方法,其特征在于,所述数字特征包括数值和与所述数值相邻的度量单位;所述预设取值条件包括:
所述数值包含于所述属性名称对应的预设数值范围,并且所述度量单位与所述属性名称对应的预设度量单位匹配。
3.根据权利要求2所述的方法,其特征在于,所述输出与由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字对应的回复语句之前,还包括:
若识别出所述数字特征中缺失度量单位,则将与所述数字特征具有搭配关系的属性名称所对应的预设度量单位确定为与所述数字特征对应的度量单位。
4.根据权利要求2所述的方法,其特征在于,所述识别咨询语句中包含的数字特征和属性名称之后,还包括:
对识别出的所述数字特征和所述属性名称进行表达形式归一化处理。
5.根据权利要求4所述的方法,其特征在于,所述对识别出的所述数字特征和所述属性名称进行表达形式归一化处理,包括:
若识别到相邻两个数字之间夹有度量单位,则合并所述相邻两个数字和所述度量单位;
将合并结果转换为与所述度量单位对应的归一化表达形式。
6.一种电子设备,其特征在于,包括存储器和处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求1至5中任一项所述的数据处理方法。
7.一种数据处理方法,其特征在于,包括:
识别数据中包含的数字特征和属性名称;
若在所述数据中扫描到所述数字特征前后预设数量词语中存在属性名称,且所述数字特征满足所述属性名称对应的预设取值条件,则确定所述数字特征与所述属性名称具有搭配关系;
若在所述数据中扫描到所述数字特征前后预设数量词语中不存在属性名称,或者,扫描到所述数字特征前后预设数量词语中存在属性名称但所述数字特征不满足所述属性名称对应的预设取值条件,或者,所述数据中不包含属性名称,则识别所述数据对应的应用场景,获取与所述应用场景对应的属性名称集合,从所述属性名称集合中去除包含于所述数据中的属性名称,以及,从所述属性名称集合剩余的属性名称中,根据所述数字特征是否满足所述剩余的属性名称对应的预设取值条件,选择与所述数字特征具有搭配关系的属性名称;
输出具有搭配关系的数字特征和属性名称。
8.一种电子设备,其特征在于,包括存储器和处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求7所述的数据处理方法。
9.一种数据处理方法,其特征在于,包括:
识别接收自客户端的咨询语句中包含的数字特征和属性名称;
若在所述咨询语句中扫描到所述数字特征前后预设数量词语中存在属性名称,且所述数字特征满足所述属性名称对应的预设取值条件,则确定所述数字特征与所述属性名称具有搭配关系;
若在所述咨询语句中扫描到所述数字特征前后预设数量词语中不存在属性名称,或者,扫描到所述数字特征前后预设数量词语中存在属性名称但所述数字特征不满足所述属性名称对应的预设取值条件,或者,所述咨询语句中不包含属性名称,则识别所述咨询语句对应的应用场景,获取与所述应用场景对应的属性名称集合,从所述属性名称集合中去除包含于所述咨询语句中的属性名称,以及,从所述属性名称集合剩余的属性名称中,根据所述数字特征是否满足所述剩余的属性名称对应的预设取值条件,选择与所述数字特征具有搭配关系的属性名称;
获取与由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字对应的回复语句;
将所述回复语句发送至所述客户端,以使所述客户端展示所述回复语句。
10.一种电子设备,其特征在于,包括存储器和处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求9所述的数据处理方法。
11.一种数据处理方法,其特征在于,包括:
将包括数字特征的咨询语句发送至服务器,以供所述服务器确定与所述数字特征具有搭配关系的属性名称;
接收所述服务器发送的回复语句,所述回复语句是所述服务器根据由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字查询获得的;
展示所述回复语句;
其中,所述服务器根据如下步骤确定与所述数字特征具有搭配关系的属性名称:识别咨询语句中包含的数字特征和属性名称;若在所述咨询语句中扫描到所述数字特征前后预设数量词语中存在属性名称,且所述数字特征满足所述属性名称对应的预设取值条件,则确定所述数字特征与所述属性名称具有搭配关系;若在所述咨询语句中扫描到所述数字特征前后预设数量词语中不存在属性名称,或者,扫描到所述数字特征前后预设数量词语中存在属性名称但所述数字特征不满足所述属性名称对应的预设取值条件,或者,所述咨询语句中不包含属性名称,则识别所述咨询语句对应的应用场景,获取与所述应用场景对应的属性名称集合,从所述属性名称集合中去除包含于所述咨询语句中的属性名称,以及,从所述属性名称集合剩余的属性名称中,根据所述数字特征是否满足所述剩余的属性名称对应的预设取值条件,选择与所述数字特征具有搭配关系的属性名称。
12.一种电子设备,其特征在于,包括存储器和处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求11所述的数据处理方法。
13.一种数据处理方法,其特征在于,包括:
识别用户输入的咨询语句中包含的数字特征和属性名称;
若在所述咨询语句中扫描到所述数字特征前后预设数量词语中存在属性名称,且所述数字特征满足所述属性名称对应的预设取值条件,则确定所述数字特征与所述属性名称具有搭配关系;
若在所述咨询语句中扫描到所述数字特征前后预设数量词语中不存在属性名称,或者,扫描到所述数字特征前后预设数量词语中存在属性名称但所述数字特征不满足所述属性名称对应的预设取值条件,或者,所述咨询语句中不包含属性名称,则识别所述咨询语句对应的应用场景,获取与所述应用场景对应的属性名称集合,从所述属性名称集合中去除包含于所述咨询语句中的属性名称,以及,从所述属性名称集合剩余的属性名称中,根据所述数字特征是否满足所述剩余的属性名称对应的预设取值条件,选择与所述数字特征具有搭配关系的属性名称;
将由具有所述搭配关系的所述数字特征和所述属性名称构成的咨询关键字发送至服务器;
接收所述服务器发送的与所述咨询关键字对应的回复语句;
展示所述回复语句。
14.一种电子设备,其特征在于,包括存储器和处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求13所述的数据处理方法。
15.一种数据处理方法,其特征在于,包括:
接收客户端发送的与咨询语句对应的咨询关键字,所述咨询关键字由具有搭配关系的数字特征和属性名称构成;
获取与所述咨询关键字对应的回复语句;
将所述回复语句发送至所述客户端,以使所述客户端展示所述回复语句;
其中,所述客户端根据如下步骤确定具有所述搭配关系的数字特征和属性名称:识别所述咨询语句中包含的数字特征和属性名称;若在所述咨询语句中扫描到所述数字特征前后预设数量词语中存在属性名称,且所述数字特征满足所述属性名称对应的预设取值条件,则确定所述数字特征与所述属性名称具有搭配关系;若在所述咨询语句中扫描到所述数字特征前后预设数量词语中不存在属性名称,或者,扫描到所述数字特征前后预设数量词语中存在属性名称但所述数字特征不满足所述属性名称对应的预设取值条件,或者,所述咨询语句中不包含属性名称,则识别所述咨询语句对应的应用场景,获取与所述应用场景对应的属性名称集合,从所述属性名称集合中去除包含于所述咨询语句中的属性名称,以及,从所述属性名称集合剩余的属性名称中,根据所述数字特征是否满足所述剩余的属性名称对应的预设取值条件,选择与所述数字特征具有搭配关系的属性名称。
16.一种电子设备,其特征在于,包括存储器和处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求15所述的数据处理方法。
CN201710821415.9A 2017-09-13 2017-09-13 数据处理方法和设备 Active CN110019700B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710821415.9A CN110019700B (zh) 2017-09-13 2017-09-13 数据处理方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710821415.9A CN110019700B (zh) 2017-09-13 2017-09-13 数据处理方法和设备

Publications (2)

Publication Number Publication Date
CN110019700A CN110019700A (zh) 2019-07-16
CN110019700B true CN110019700B (zh) 2023-01-17

Family

ID=67186269

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710821415.9A Active CN110019700B (zh) 2017-09-13 2017-09-13 数据处理方法和设备

Country Status (1)

Country Link
CN (1) CN110019700B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103890761A (zh) * 2011-09-08 2014-06-25 阿克塞尔斯普林格数字电视指导有限责任公司 自动生成推荐的方法和装置
CN104598579A (zh) * 2015-01-14 2015-05-06 北京京东尚科信息技术有限公司 一种自动问答方法及系统
CN104714969A (zh) * 2013-12-16 2015-06-17 阿里巴巴集团控股有限公司 一种属性值的检测方法和检测装置
CN105809170A (zh) * 2016-03-04 2016-07-27 东软集团股份有限公司 字符识别方法和装置
CN105930367A (zh) * 2016-04-12 2016-09-07 华南师范大学 智能聊天机器人控制方法及控制装置
CN106997375A (zh) * 2017-02-28 2017-08-01 浙江大学 基于深度学习的客服回复推荐方法
CN107066628A (zh) * 2017-05-15 2017-08-18 京东方科技集团股份有限公司 穿衣推荐方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001075736A1 (en) * 2000-03-31 2001-10-11 Liquid Engines, Inc. Electronic matching engine for matching desired characteristics with item attributes
US10210218B2 (en) * 2015-06-16 2019-02-19 Salesforce.Com, Inc. Processing a file to generate a recommendation using a database system

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103890761A (zh) * 2011-09-08 2014-06-25 阿克塞尔斯普林格数字电视指导有限责任公司 自动生成推荐的方法和装置
CN104714969A (zh) * 2013-12-16 2015-06-17 阿里巴巴集团控股有限公司 一种属性值的检测方法和检测装置
CN104598579A (zh) * 2015-01-14 2015-05-06 北京京东尚科信息技术有限公司 一种自动问答方法及系统
CN105809170A (zh) * 2016-03-04 2016-07-27 东软集团股份有限公司 字符识别方法和装置
CN105930367A (zh) * 2016-04-12 2016-09-07 华南师范大学 智能聊天机器人控制方法及控制装置
CN106997375A (zh) * 2017-02-28 2017-08-01 浙江大学 基于深度学习的客服回复推荐方法
CN107066628A (zh) * 2017-05-15 2017-08-18 京东方科技集团股份有限公司 穿衣推荐方法及装置

Also Published As

Publication number Publication date
CN110019700A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN107633416B (zh) 一种业务对象的推荐方法、装置和系统
CN103970761A (zh) 一种商品数据搜索方法及装置
US20240095490A1 (en) Aspect Pre-selection using Machine Learning
CN111125376B (zh) 知识图谱生成方法、装置、数据处理设备及存储介质
CN114666670B (zh) 数据监控方法、装置、设备及计算机可读介质
US20160343004A1 (en) Process journey sentiment analysis
JP2020504879A (ja) ネットワーク化環境における不正コンテンツに関連するデータを収集するためのシステムおよび方法
CN111090739A (zh) 信息处理方法、装置以及电子设备、存储介质
KR102307517B1 (ko) 네트워크 기반 상품 추천 방법 및 장치
CN110347887B (zh) 获取业务场景时序数据的方法及装置
US10606832B2 (en) Search system, search method, and program
US20130304539A1 (en) User recommendation method and device
CN110689407A (zh) 一种选品比价方法、计算机可读存储介质
CN111292153A (zh) 信息推荐方法、装置、系统和存储介质
CN110515929B (zh) 书籍展示方法、计算设备及存储介质
KR101764361B1 (ko) 소셜 네트워크 서비스 기반 쇼핑몰 서비스 제공 방법 및 이를 위한 장치
CN110019700B (zh) 数据处理方法和设备
CN112395398A (zh) 问答处理方法、装置、设备
KR20220026709A (ko) 구매자 의사결정을 위한 상품 관련 정보 자동 제공 방법 및 장치
JP6686208B1 (ja) 情報処理装置、情報処理方法、及びプログラム
US11087218B2 (en) Electronic device, presentation method for decision-making process module and computer readable medium
KR20180092053A (ko) 지능형 쇼핑 관리시스템
CN113011955A (zh) 一种数据处理方法和装置,存储介质和电子设备
CN111582905A (zh) 一种目标对象获取方法、装置、电子设备以及存储介质
CN110597967B (zh) 订单定位方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant