CN115795289A - 特征识别方法、装置、电子设备及存储介质 - Google Patents
特征识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115795289A CN115795289A CN202211538717.2A CN202211538717A CN115795289A CN 115795289 A CN115795289 A CN 115795289A CN 202211538717 A CN202211538717 A CN 202211538717A CN 115795289 A CN115795289 A CN 115795289A
- Authority
- CN
- China
- Prior art keywords
- data
- target
- decision tree
- recognizer
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000003860 storage Methods 0.000 title claims abstract description 29
- 238000003066 decision tree Methods 0.000 claims abstract description 157
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 50
- 238000012549 training Methods 0.000 claims abstract description 37
- 238000004590 computer program Methods 0.000 claims description 18
- 238000004140 cleaning Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 abstract description 16
- 230000006870 function Effects 0.000 description 10
- 230000003287 optical effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 230000001960 triggered effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例涉及数据处理技术领域,公开了一种特征识别方法、装置、电子设备及存储介质,所述方法包括:获取目标对象的对象数据;其中,对象数据包括目标对象在服务器内的内部数据以及在服务器外的外部数据;将对象数据输入至预设的决策树识别器,通过决策树识别器识别目标对象是否具有目标特征;其中,决策树识别器执行预设的决策树算法;决策树识别器为根据服务器内的历史数据训练得到的;历史数据包括具有目标特征的正例数据以及不具有目标特征的负例数据。本申请实施例在获取到对象数据后,利用预先训练好的决策树识别器识别对象数据是否具有目标特征,提高了识别效率,可以更加快速、精准、有效地确定目标对象。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,本申请涉及一种特征识别方法、装置、电子设备及存储介质。
背景技术
客户分层一直是客户管理系统(Customer Relationship Management,简称CRM)最核心的功能点,为匹配目标客户方面发挥着重要的作用。目前主流CRM系统都会重点实现对线索的获取、存储和处理,结合机器学习技术对线索进行定制化的分类识别,而对有些客户来讲可能会单独开发自己的客户SASS(全称Syntactically Awesome Stylesheets),都会提供类似的客户分层功能。
CRM系统意在获取有目标特征的客户,结合自身行业数据特点,更好的满足客户的需求。目前CRM系统主要集中在大公司以及规模较小的猎头公司,规模大的企业倾向于自建CRM,而猎头倾向于购买专业SASS服务,无一列外都会非常重视线索客户的分层。如一些大公司的CRM系统都会结合自己行业的特点和自家优势,通过站内站外获取客户信息,并依据客户行为特征为客户进行意向度分层,便于进一步与客户建立联系。
现有的CRM系统倾向于使用经验规则来进行识别,而人工识别容易受限于决策人的经验判断,造成实际使用方和识别方的断裂,使得无法有效地使用分层结果进一步与客户建立联系;同时经验规则识别会影响召回,会丢掉很多依其他特征可以提权的意向客户;最后模型客户分层样本目前普遍都比较稀疏,无法对高质量客户进行泛化,影响高质客户的召回。因此,现有的CRM系统难以准确地识别目标客户。
发明内容
本申请实施例提供了一种特征识别方法,以解决现有技术中,CRM系统难以准确地识别目标客户的问题。
相应的,本申请实施例还提供了一种特征识别装置、一种电子设备、一种计算机可读存储介质以及一种计算机程序产品,用以保证上述方法的实现及应用。
为了解决上述问题,本申请实施例公开了一种特征识别方法,所述方法包括:
获取目标对象的对象数据;其中,所述对象数据包括所述目标对象在服务器内的内部数据以及在服务器外的外部数据;
将所述对象数据输入至预设的决策树识别器,通过所述决策树识别器识别所述目标对象是否具有目标特征;
其中,所述决策树识别器执行预设的决策树算法;
所述决策树识别器为根据所述服务器内的历史数据训练得到的;所述历史数据包括具有所述目标特征的正例数据以及不具有所述目标特征的负例数据。
本申请实施例还公开了一种特征识别装置,所述装置包括:
数据获取模块,用于获取目标对象的对象数据;其中,所述对象数据包括所述目标对象在服务器内的内部数据以及在服务器外的外部数据;
数据识别模块,用于将所述对象数据输入至预设的决策树识别器,通过所述决策树识别器识别所述目标对象是否具有目标特征;
其中,所述决策树识别器执行预设的决策树算法;
所述决策树识别器为根据所述服务器内的历史数据训练得到的;所述历史数据包括具有所述目标特征的正例数据以及不具有所述目标特征的负例数据。
本申请实施例还公开了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现本申请第一方面所示的特征识别方法。
本申请实施例还公开了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现如本申请实施例中一个或多个所述的方法。
本申请实施例还公开了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如本申请实施例中一个或多个所述的方法。
本申请实施例提供的技术方案带来的有益效果是:
本申请实施例中,获取目标对象的对象数据;其中,所述对象数据包括所述目标对象在服务器内的内部数据以及在服务器外的外部数据;将所述对象数据输入至预设的决策树识别器,通过所述决策树识别器识别所述目标对象是否具有目标特征;其中,所述决策树识别器执行预设的决策树算法;所述决策树识别器为根据所述服务器内的历史数据训练得到的;所述历史数据包括具有所述目标特征的正例数据以及不具有所述目标特征的负例数据。可以在获取到对象数据后,利用预先训练好的决策树识别器识别对象数据是否具有目标特征,提高了识别效率,可以更加快速、精准、有效地确定目标对象。
本申请实施例附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例提供的特征识别方法的流程图;
图2为本申请实施例提供的一种特征识别方法的应用流程图;
图3为本申请实施例提供的模型训练的流程图;
图4为本申请实施例提供的一种特征识别装置的结构示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组合。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本申请实施例所提供的方案可以由任一电子设备执行,如可以是终端设备,也可以是服务器,其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。对于现有技术中所存在的技术问题,本申请提供的特征识别方法、装置、电子设备及存储介质,旨在解决现有技术的技术问题中的至少一项。
下面以具体实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
本申请实施例提供了一种可能的实现方式,如图1所示,提供了一种特征识别方法的流程图,该方案可以由任一电子设备执行,可选的,可以在服务器端或终端设备执行。
本申请实施例中可应用于数据处理领域,在特征识别的过程中,通过预先训练得到的决策树识别器识别对象数据,确定目标对象有无目标特征,可快速、精准地获取到有目标特征的目标对象。
如图1中所示,该方法可以包括以下步骤:
步骤101,获取目标对象的对象数据;其中,所述对象数据包括所述目标对象在服务器内的内部数据以及在服务器外的外部数据。
其中,该方法可以应用于应用程序,用户在应用程序注册后,会在应用程序上触发相应的操作,如查看其他用户的信息等,该应用程序的服务器可以获取用户的信息,并根据所需的特征对用户的信息进行处理,生成内部数据。应用程序的服务器也可以在其他应用程序或网站等获取用户的信息,作为外部数据。
作为第一示例,应用程序的用户可以为企业、企业员工等。企业或企业员工在应用程序注册后,会触发相应的操作,如填写企业资料、发布信息等。服务器会根据上述信息进行整理,进而获取到所需的数据,这些数据可以为内部数据。除此之外,服务器可以根据企业用户注册或填写的资料,从网页或其他软件获取到外部数据;如从该企业合作过的,或与其有对立关系的企业获取该企业的信息;还可以从其他网页等上面获取注册资本、员工规模、是否上市、是否小微企业、公司形式、融资轮次、实缴资本、是否有官网、是否有号码、城市、行业类型、是否风口行业、站外获取的核心工种数(近7天/15天/30天/60天/一年)、站外获取的产技运数(近30天/60天/一年)等信息。
步骤102,将所述对象数据输入至预设的决策树识别器,通过所述决策树识别器识别所述目标对象是否具有目标特征。
其中,所述决策树识别器执行预设的决策树算法。具体地,决策树算法可以如LightGBM算法。
所述决策树识别器为根据所述服务器内的历史数据训练得到的;所述历史数据包括具有所述目标特征的正例数据以及不具有所述目标特征的负例数据。
在生成决策树识别器的过程中,首先要获取历史数据,所述的历史数据包括若干跟进记录;跟进记录例如目标对象的参数特征,服务器每次确定目标对象是否有目标特征时,需要首先获取到目标对象的参数特征,所述参数特征包括目标对象在服务器对应的应用程序上发生行为后被记录的特征,以及服务器从其他服务器或软件上获取到的关于目标对象的其他特征。除此之外,跟进记录还包括目标对象的分类结果,即所述目标对象是否具有目标特征。所述的分类结果是目标对象已发生或已获得的结果,如,若目标对象与服务器建立了目标关联关系,则将该目标对象的分类结果确定为有目标特征;若目标对象与服务器没有建立目标关联关系,则将该目标对象的分类结果确定为无目标特征。其中,所述的目标关联关系可以为合作关系。
服务器可以将上述的参数特征根据具体所需的类别进行整理,并对应记录目标对象的分类结果,生成跟进记录。
服务器中可以包括多条跟进记录,在获取历史数据时,可以统计预设时间段内的跟进记录,如统计从2022年1月1日到至今的跟进记录,然后,根据跟进记录中的分类结果,将有目标特征的跟进记录作为正例数据,将无目标特征的跟进记录作为负例数据,然后结合正例数据和负例数据,生成历史数据。
本实施例中,可以将上述生成的历史数据输入决策树算法,所述的决策树算法为神经网络算法,可以包括多个参数,决策树算法运行时,可以调整参数,进行多轮迭代,以生成召唤率、准确率较高的训练结果,以生成精度较高的决策树识别器。其中,为了保证决策树算法的泛化,防止过拟合,具体的参数如下:
本实施例中,可以在损失值达到全局最小时结束决策树算法的训练,得到决策树识别器。其中,损失达到全局最小时,决策树算法的召回可以为70%-100%之间,准确率可以为90%-100%之间。
最终得到的决策树识别器可以部署在服务器上直接使用,具体地,获取目标对象的对象数据,然后将对象数据输入至决策树识别器,最后,决策树识别器输出识别结果,所述的识别结果为所述目标对象是否具有目标特征。
可选的,利用决策树识别器识别对象数据,可以包括线上识别和线下识别。
线上识别的方法具体可以如下:
当服务器检测到目标对象,则可以从服务器中直接获取目标对象对应的内部数据,以及从其他应用程序或网页中获取目标对象对于的外部数据,并将包括内部数据和外部数据的对象数据存储在数据库中。然后通过目标对象的用户名或id从数据库中查询得到对应的对象数据。最后将对象数据输入至决策树识别器,通过决策树识别器识别出该目标对象是否具有目标特征。服务器可以根据决策树识别器的识别结果对所述目标对象进行标记,如,识别出该目标对象有目标特征,则标记为可选对象,放入公海,以便工作人员从公海中直接获取有目标特征的目标对象进入私海。
线下识别的方法具体可以如下:
可以直接获取公海中的目标对象,在获取公海中的目标对象时,可以根据预设的筛选规则进行筛选,排除掉不匹配的对象,如,筛选规则可以为公海、跟进记录未在一个月以内、已合作主子客户等,将排除后剩余的对象作为目标对象。然后可以根据目标对象获取对应的对象数据,并将一条或多条对象数据输入决策树识别器,通过决策树识别器识别出该目标对象是否具有目标特征。若识别出该目标对象有目标特征,则服务器将该目标对象分配给工作人员进行进一步跟进。
作为第二示例,如图2所示,本实施例中应用该方法时的具体步骤如下:
步骤201,开始时,获取内部数据和外部数据;
步骤202,模型预测,即将内部数据和外部数据输入决策树识别器,通过决策树识别器识别出具有目标特征的目标对象;
步骤203,目标对象推送,即将目标对象推送给相应的工作人员,然后结束流程。
本申请实施例中,获取目标对象的对象数据;其中,所述对象数据包括所述目标对象在服务器内的内部数据以及在服务器外的外部数据;将所述对象数据输入至预设的决策树识别器,通过所述决策树识别器识别所述目标对象是否具有目标特征;其中,所述决策树识别器执行预设的决策树算法;所述决策树识别器为根据所述服务器内的历史数据训练得到的;所述历史数据包括具有所述目标特征的正例数据以及不具有所述目标特征的负例数据。可以在获取到对象数据后,利用预先训练好的决策树识别器识别对象数据是否具有目标特征,提高了识别效率,可以更加快速、精准、有效地确定目标对象。
在一个可选实施例中,所述方法还包括:
对所述历史数据进行清洗,获取目标样本;其中,所述目标样本中包括一个或多个关联特征,所述关联特征与所述目标特征的关联度大于关联度阈值;
根据所述目标样本,生成所述决策树识别器。
历史数据可以包括服务器从服务器内部或其他软件、网站等地方获取到的各种参数特征,但历史数据中每条跟进记录对应的目标对象不一定是实际所需的目标对象,而这些跟进记录会干扰决策树算法的训练精度,为了确保决策树算法的训练精度,需要将这些跟进记录筛选出来,并剔除掉。如,应用程序中获取到的某一类企业不是实际所需的企业,但这一类企业的历史数据可能对决策树算法的训练结果造成一定的影响,因此,需要对历史数据进行清洗,即剔除掉这类企业对应的跟进记录。除此之外,由于受到各种限制,服务器获取到的目标对象对于的某一类参数特征缺失,当缺失该类参数特征的目标对象数量过多时,也会影响决策树算法的训练精度,因此,需要对历史数据进一步进行清洗,以提高决策树算法的训练精度。
对历史数据清洗完成后,即可生成所需的目标样本,然后利用目标样本训练决策树算法,并将训练好的决策树算法作为决策树识别器。
可选地,生成决策树识别器的过程如图3所示,首先进行样本选择,然后进行特征处理,从处理后的特征中进行特征选择,然后进行模型训练,其中,上述步骤经过多次迭代,训练完成后生成决策树识别器。
其中,样本选择,即根据上述方式获取历史数据。
特征处理,可以将历史数据中的一类数据作为一个特征,如,对应公司名称的数据可以作为一个特征,对应公司注册时间的数据可以作为另一个特征,可以将历史数据中的每一个特征进行处理,如删除该特征或处理成预设的格式等。
特征选择,在特征处理后剩余的特征中选择对决策树算法的训练结果有较大影响的特征,然后根据选择的特征生成训练样本。
模型训练,将训练样本输入决策树算法,进行决策树算法模型的训练,其中,训练过程中不断迭代,上述步骤,以提高训练精度。
在一个可选实施例中,所述历史数据包括至少一条跟进记录;所述跟进记录包括一个或多个参数特征,所述对所述历史数据进行清洗,获取目标样本,包括:
判断所述跟进记录的所述参数特征中是否存在预设剔除特征;
若不存在,则对所述跟进记录进行清洗,生成所述目标样本。
可选的,预设剔除特征可以包括匹配不上公司信息的目标对象、某些特征较弱的目标对象、某些类型的目标对象等。预设剔除特征可以根据实际需要进行设置,以获得较为可靠、有效的目标样本。
具体地,可以对历史数据中的每一条跟进记录进行判断分析,确定所述跟进记录中是否存在预设剔除的特征。更具体地,若目标对象为企业,可以利用行业分类或关键词去识别,若在跟进记录中未识别到预设剔除特征,则对该跟进记录进行进一步清洗,以生成目标样本。如,跟进记录中存在的某一类参数特征与分类结果没有关系,则可以将跟进记录中的该参数特征剔除。
在一个可选实施例中,所述对所述历史数据进行清洗,还包括:
若所述跟进记录的所述参数特征中存在预设剔除特征,则删除所述跟进记录。将历史数据中所有跟进记录中的该参数特征删除,以确保决策树算法训练结果的可靠性。
在一个可选实施例中,所述对所述跟进记录进行清洗,生成所述目标样本,包括:
确定所述参数特征的缺失度小于或等于预设缺失值,将所述参数特征作为待定参数特征;
从所述待定参数特征中获取所述关联特征;
根据所述关联特征生成所述目标样本。
所述的缺失度为历史数据中对应的参数特征缺失的跟进记录条数与历史数据中跟进记录总数的比值。所述的预设缺失值可以为70%、或其他数值,本实施例中不做限定。
服务器可以统计历史数据中参数特征对应的缺失度,如,若历史数据中总共有100条跟进记录,而缺失该参数特征的跟进记录为80条,则服务器可以统计得到该参数特征的缺失度为80%,若预设缺失值为70%,则说明该参数特征的缺失度过大,会对决策树算法的训练精度造成影响。
本实施例中,当参数特征的缺失度小于或等于预设缺失值时,说明该参数特征的缺失度较小,因此,可以将该参数特征作为待定参数特征,然后从所有待定参数特征中获取关联特征,以生成目标样本。
其中,从历史数据中获取到的待定参数特征可能比较多,且这些待定参数特征之间存在冗余,同时可能存在一些待定参数特征对决策树算法的训练的贡献不会太大或者无关,因此,可以从待定参数特征中获取到对决策树算法的贡献相对较大的关联特征,以提高决策树算法的训练的效率以及精度。
在一个可选实施例中,所述从所述待定参数特征中获取关联特征,包括:
计算所述待定参数特征与所述目标特征的相关度;
若所述待定参数特征与所述目标特征的相关度大于或等于关联阈值,则将所述待定参数特征作为所述关联特征。
每条历史数据中均包括分类结果,所述的分类结果可以是有目标特征或无目标特征。而决策树算法以有无目标特征的分类结果作为输出,待定参数特征与目标特征的相关度越高,说明待定参数特征直接影响决策树算法的输出。因此,通过计算待定参数特征与目标特征的相关度,然后获取相关度大于或等于关联阈值的待定参数特征作为关联参数,可以确保关联参数与分类结果的关联度较高,进而确保输入决策树算法的数据较为可靠。而利用可靠的关联特征生成的目标样本训练决策树算法,可以提高训练效率,也可以提高决策树算法的准确率与召回率。
其中,可以通过互信息、卡方、相关系数、协方差等方式计算计算待定参数特征与目标特征的相关度。
除此之外,本实施例中,还可以对历史数据中数值型的参数特征进行分桶处理,如,根据分位值进行分桶处理,例如:历史数据中总共有10条跟进记录,每条跟进记录中对应的数值型参数特征分别为1、1、1、2、2、2、3、4、5、6;可以将上述数据按照10,20,30,40,……90分位划分数据,在某个分位区间的归位一类;则上述数据对于的分位值为1、1、1.7、2、2、2.4、3.3、4.2、5.1;最后,可以将小于或等于1的划分为第一类;将大于1且小于或等于2的划分为第二类;将大于2且小于等于3的划分为第三类,以此类推。
作为另一种实施方式,本实施例中可以包括多个决策树识别器,如,可以按照需求、预算、是否有kp(关键岗位)、认知四个方面设置四个决策树识别器,第一个决策树识别器用于识别目标对象是否具有第一目标特征,第一目标特征可以为需求等;第二个决策树识别器用于识别目标对象是否具有第二目标特征,第二目标特征可以为预算足够等;第三个决策树识别器用于识别目标对象是否具有第三目标特征,所述第三目标特征可以为kp等;第四个决策树识别器用于识别目标对象是否具有第四目标特征,所述第四目标特征可以为认知度等。除此之外,还可以设置第五个决策树识别器,以第一个决策树识别器、第二个决策树识别器、第三个决策树识别器以及第四个决策树识别器的识别结果作为第五个决策树识别器的输入,通过第五个决策树识别器输出识别结果,即确定目标对象是否具有目标特征。
使用多个决策树识别器分别针对多个不同的方面进行识别,然后将识别结果输入最后的决策树识别器进一步进行识别,得到最终的识别结果,这种方式中,多个决策树识别器可以“分工”进行识别,提高了识别的效率,也便于使用者理解,进而提高使用者对决策树识别器的接受度。
作为另一种实施方式,本实施例中也可以包括三个决策树识别器,第一个决策树识别器对服务器内的内部数据进行识别,确定内部数据中对应的目标对象是否具有第一目标特征;第二个决策树识别器对服务器外的外部数据进行识别,确定外部数据中对应的目标对象是否具有第二目标特征;然后将第一个决策树识别器的识别结果和第二决策树识别器的识别结果作为第三个决策树识别器的输入,通过第三个决策树识别器输出识别结果,即确定目标对象是否具有目标特征。
使用多个决策树识别器分别针对内部数据和外部数据进行识别,然后将识别结果输入最后的决策树识别器进一步进行识别,得到最终的识别结果,这种方式中,多个决策树识别器可以“分工”进行识别,提高了识别的效率,也便于使用者理解,进而提高使用者对决策树识别器的接受度。
本申请实施例中,获取目标对象的对象数据;其中,所述对象数据包括所述目标对象在服务器内的内部数据以及在服务器外的外部数据;将所述对象数据输入至预设的决策树识别器,通过所述决策树识别器识别所述目标对象是否具有目标特征;其中,所述决策树识别器执行预设的决策树算法;所述决策树识别器为根据所述服务器内的历史数据训练得到的;所述历史数据包括具有所述目标特征的正例数据以及不具有所述目标特征的负例数据。可以在获取到对象数据后,利用预先训练好的决策树识别器识别对象数据是否具有目标特征,提高了识别效率,可以更加快速、精准、有效地确定目标对象。
基于与本申请实施例所提供的方法相同的原理,本申请实施例还提供了一种特征识别装置,如图4所示,该装置包括:
数据获取模块401,用于获取目标对象的对象数据;其中,所述对象数据包括所述目标对象在服务器内的内部数据以及在服务器外的外部数据。
其中,该方法可以应用于应用程序,用户在应用程序注册后,会在应用程序上触发相应的操作,如查看其他用户的信息等,该应用程序的服务器可以获取用户的信息,并根据所需的特征对用户的信息进行处理,生成内部数据。应用程序的服务器也可以在其他应用程序或网站等获取用户的信息,作为外部数据。
作为第一示例,应用程序的用户可以为企业、企业员工等。企业或企业员工在应用程序注册后,会触发相应的操作,如填写企业资料、发布信息等。服务器会根据上述信息进行整理,进而获取到所需的数据,这些数据可以为内部数据。除此之外,服务器可以根据企业用户注册或填写的资料,从网页或其他软件获取到外部数据;如从该企业合作过的,或与其有对立关系的企业获取该企业的信息;还可以从其他网页等上面获取注册资本、员工规模、是否上市、是否小微企业、公司形式、融资轮次、实缴资本、是否有官网、是否有号码、城市、行业类型、是否风口行业、站外获取的核心工种数(近7天/15天/30天/60天/一年)、站外获取的产技运数(近30天/60天/一年)等信息。
步骤102,将所述对象数据输入至预设的决策树识别器,通过所述决策树识别器识别所述目标对象是否具有目标特征。
其中,所述决策树识别器执行预设的决策树算法。具体地,决策树算法可以如LightGBM算法。
所述决策树识别器为根据所述服务器内的历史数据训练得到的;所述历史数据包括具有所述目标特征的正例数据以及不具有所述目标特征的负例数据。
在生成决策树识别器的过程中,首先要获取历史数据,所述的历史数据包括若干跟进记录;跟进记录例如目标对象的参数特征,服务器每次确定目标对象是否有目标特征时,需要首先获取到目标对象的参数特征,所述参数特征包括目标对象在服务器对应的应用程序上发生行为后被记录的特征,以及服务器从其他服务器或软件上获取到的关于目标对象的其他特征。除此之外,跟进记录还包括目标对象的分类结果,即所述目标对象是否具有目标特征。所述的分类结果是目标对象已发生或已获得的结果,如,若目标对象与服务器建立了目标关联关系,则将该目标对象的分类结果确定为有目标特征;若目标对象与服务器没有建立目标关联关系,则将该目标对象的分类结果确定为无目标特征。其中,所述的目标关联关系可以为合作关系。
服务器可以将上述的参数特征根据具体所需的类别进行整理,并对应记录目标对象的分类结果,生成跟进记录。
服务器中可以包括多条跟进记录,在获取历史数据时,可以统计预设时间段内的跟进记录,如统计从2022年1月1日到至今的跟进记录,然后,根据跟进记录中的分类结果,将有目标特征的跟进记录作为正例数据,将无目标特征的跟进记录作为负例数据,然后结合正例数据和负例数据,生成历史数据。
本实施例中,可以将上述生成的历史数据输入决策树算法,所述的决策树算法为神经网络算法,可以包括多个参数,决策树算法运行时,可以调整参数,进行多轮迭代,以生成召唤率、准确率较高的训练结果,以生成精度较高的决策树识别器。其中,为了保证决策树算法的泛化,防止过拟合,具体的参数如下:
本实施例中,可以在损失值达到全局最小时结束决策树算法的训练,得到决策树识别器。其中,损失达到全局最小时,决策树算法的召回可以为70%-100%之间,准确率可以为90%-100%之间。
最终得到的决策树识别器可以部署在服务器上直接使用,具体地,获取目标对象的对象数据,然后将对象数据输入至决策树识别器,最后,决策树识别器输出识别结果,所述的识别结果为所述目标对象是否具有目标特征。
可选的,利用决策树识别器识别对象数据,可以包括线上识别和线下识别。
线上识别的方法具体可以如下:
当服务器检测到目标对象,则可以从服务器中直接获取目标对象对应的内部数据,以及从其他应用程序或网页中获取目标对象对于的外部数据,并将包括内部数据和外部数据的对象数据存储在数据库中。然后通过目标对象的用户名或id从数据库中查询得到对应的对象数据。最后将对象数据输入至决策树识别器,通过决策树识别器识别出该目标对象是否具有目标特征。服务器可以根据决策树识别器的识别结果对所述目标对象进行标记,如,识别出该目标对象有目标特征,则标记为可选对象,放入公海,以便工作人员从公海中直接获取有目标特征的目标对象进入私海。
线下识别的方法具体可以如下:
可以直接获取公海中的目标对象,在获取公海中的目标对象时,可以根据预设的筛选规则进行筛选,排除掉不匹配的对象,如,筛选规则可以为公海、跟进记录未在一个月以内、已合作主子客户等,将排除后剩余的对象作为目标对象。然后可以根据目标对象获取对应的对象数据,并将一条或多条对象数据输入决策树识别器,通过决策树识别器识别出该目标对象是否具有目标特征。若识别出该目标对象有目标特征,则服务器将该目标对象分配给工作人员进行进一步跟进。
本申请一个可选实施例中,所述装置还包括:
数据处理模块,用于对所述历史数据进行清洗,获取目标样本;其中,所述目标样本中包括一个或多个关联特征,所述关联特征与所述目标特征的关联度大于关联度阈值;
识别器生成模块,用于根据所述目标样本,生成所述决策树识别器。
本申请一个可选实施例中,所述历史数据包括至少一条跟进记录;所述跟进记录包括一个或多个参数特征,所述数据处理模块包括:
跟进记录判断模块,用于判断所述跟进记录的所述参数特征中是否存在预设剔除特征;
跟进记录处理模块,若不存在,则用于对所述跟进记录进行清洗,生成所述目标样本。
本申请一个可选实施例中,所述跟进记录处理模块包括:
参数特征处理模块,用于确定所述参数特征的缺失度小于或等于预设缺失值,将所述参数特征作为待定参数特征;
关联特征获取模块,用于从所述待定参数特征中获取所述关联特征;
样本生成模块,用于根据所述关联特征生成所述目标样本。
本申请一个可选实施例中,所述关联特征获取模块包括:
相关计算子模块,用于计算所述待定参数特征与所述目标特征的相关度;
关联特征获取子模块,若所述待定参数特征与所述目标特征的相关度大于或等于关联阈值,则用于将所述待定参数特征作为所述关联特征。
本申请一个可选实施例中,所述数据处理模块还包括:
跟进记录删除模块,若所述跟进记录的所述参数特征中存在预设剔除特征,则用于删除所述跟进记录。
本申请实施例提供的特征识别装置能够实现图1至图3的方法实施例中实现的各个过程,为避免重复,这里不再赘述。
本申请提供的特征识别装置,数据获取模块401获取目标对象的对象数据;其中,所述对象数据包括所述目标对象在服务器内的内部数据以及在服务器外的外部数据;数据识别模块402将所述对象数据输入至预设的决策树识别器,通过所述决策树识别器识别所述目标对象是否具有目标特征;其中,所述决策树识别器执行预设的决策树算法;所述决策树识别器为根据所述服务器内的历史数据训练得到的;所述历史数据包括具有所述目标特征的正例数据以及不具有所述目标特征的负例数据。可以在获取到对象数据后,利用预先训练好的决策树识别器识别对象数据是否具有目标特征,提高了识别效率,可以更加快速、精准、有效地确定目标对象。
本申请实施例的特征识别装置可执行本申请实施例所提供的特征识别方法,其实现原理相类似,本申请各实施例中的特征识别装置中的各模块、单元所执行的动作是与本申请各实施例中的特征识别方法中的步骤相对应的,对于特征识别装置的各模块的详细功能描述具体可以参见前文中所示的对应的特征识别方法中的描述,此处不再赘述。
基于与本申请的实施例中所示的方法相同的原理,本申请实施例还提供了一种电子设备,该电子设备可以包括但不限于:处理器和存储器;存储器,用于存储计算机程序;处理器,用于通过调用计算机程序执行本申请任一可选实施例所示的特征识别方法。与现有技术相比,本申请提供的特征识别方法,通过获取目标对象的对象数据;其中,所述对象数据包括所述目标对象在服务器内的内部数据以及在服务器外的外部数据;将所述对象数据输入至预设的决策树识别器,通过所述决策树识别器识别所述目标对象是否具有目标特征;其中,所述决策树识别器执行预设的决策树算法;所述决策树识别器为根据所述服务器内的历史数据训练得到的;所述历史数据包括具有所述目标特征的正例数据以及不具有所述目标特征的负例数据。可以在获取到对象数据后,利用预先训练好的决策树识别器识别对象数据是否具有目标特征,提高了识别效率,可以更加快速、精准、有效地确定目标对象。
在一个可选实施例中,还提供了一种电子设备,如图5所示,图5所示的电子设备5000可以为服务器,包括:处理器5001和存储器5003。其中,处理器5001和存储器5003相连,如通过总线5002相连。可选地,电子设备5000还可以包括收发器5004。需要说明的是,实际应用中收发器5004不限于一个,该电子设备5000的结构并不构成对本申请实施例的限定。
处理器5001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器5001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线5002可包括一通路,在上述组件之间传送信息。总线5002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线5002可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器5003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器5003用于存储执行本申请方案的应用程序代码,并由处理器5001来控制执行。处理器5001用于执行存储器5003中存储的应用程序代码,以实现前述方法实施例所示的内容。
其中,电子设备包括但不限于:移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
本申请提供的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
需要说明的是,本申请上述的计算机可读存储介质还可以是计算机可读信号介质或者计算机可读存储介质与计算机可读存储介质的组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例所示的方法。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的特征识别方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模块本身的限定,例如,数据获取模块还可以被描述为“用于获取目标对象的对象数据的数据获取模块”。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种特征识别方法,其特征在于,所述方法包括:
获取目标对象的对象数据;其中,所述对象数据包括所述目标对象在服务器内的内部数据以及在服务器外的外部数据;
将所述对象数据输入至预设的决策树识别器,通过所述决策树识别器识别所述目标对象是否具有目标特征;
其中,所述决策树识别器执行预设的决策树算法;
所述决策树识别器为根据所述服务器内的历史数据训练得到的;所述历史数据包括具有所述目标特征的正例数据以及不具有所述目标特征的负例数据。
2.根据权利要求1所述的特征识别方法,其特征在于,所述方法还包括:
对所述历史数据进行清洗,获取目标样本;其中,所述目标样本中包括一个或多个关联特征,所述关联特征与所述目标特征的关联度大于关联度阈值;
根据所述目标样本,生成所述决策树识别器。
3.根据权利要求2所述的特征识别方法,其特征在于,所述历史数据包括至少一条跟进记录;所述跟进记录包括一个或多个参数特征,所述对所述历史数据进行清洗,获取目标样本,包括:
判断所述跟进记录的所述参数特征中是否存在预设剔除特征;
若不存在,则对所述跟进记录进行清洗,生成所述目标样本。
4.根据权利要求3所述的特征识别方法,其特征在于,所述对所述跟进记录进行清洗,生成所述目标样本,包括:
确定所述参数特征的缺失度小于或等于预设缺失值,将所述参数特征作为待定参数特征;
从所述待定参数特征中获取所述关联特征;
根据所述关联特征生成所述目标样本。
5.根据权利要求4所述的特征识别方法,其特征在于,所述从所述待定参数特征中获取关联特征,包括:
计算所述待定参数特征与所述目标特征的相关度;
若所述待定参数特征与所述目标特征的相关度大于或等于关联阈值,则将所述待定参数特征作为所述关联特征。
6.根据权利要求3所述的特征识别方法,其特征在于,所述对所述历史数据进行清洗,还包括:
若所述跟进记录的所述参数特征中存在预设剔除特征,则删除所述跟进记录。
7.一种特征识别装置,其特征在于,所述装置包括:
数据获取模块,用于获取目标对象的对象数据;其中,所述对象数据包括所述目标对象在服务器内的内部数据以及在服务器外的外部数据;
数据识别模块,用于将所述对象数据输入至预设的决策树识别器,通过所述决策树识别器识别所述目标对象是否具有目标特征;
其中,所述决策树识别器执行预设的决策树算法;
所述决策树识别器为根据所述服务器内的历史数据训练得到的;所述历史数据包括具有所述目标特征的正例数据以及不具有所述目标特征的负例数据。
8.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至6中任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211538717.2A CN115795289B (zh) | 2022-12-01 | 特征识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211538717.2A CN115795289B (zh) | 2022-12-01 | 特征识别方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115795289A true CN115795289A (zh) | 2023-03-14 |
CN115795289B CN115795289B (zh) | 2024-05-28 |
Family
ID=
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107451748A (zh) * | 2017-08-10 | 2017-12-08 | 北京奇鱼时代科技有限公司 | 一种客户关系管理系统中客户公海管理方法 |
US20190080205A1 (en) * | 2016-09-16 | 2019-03-14 | Deep Learning Analytics, LLC | Systems and Methods for Deep Model Translation Generation |
CN110489556A (zh) * | 2019-08-22 | 2019-11-22 | 重庆锐云科技有限公司 | 关于跟进记录的质量评价方法、装置、服务器及存储介质 |
CN110598157A (zh) * | 2019-09-20 | 2019-12-20 | 北京字节跳动网络技术有限公司 | 目标信息识别方法、装置、设备及存储介质 |
CN110659396A (zh) * | 2019-08-14 | 2020-01-07 | 平安科技(深圳)有限公司 | 缺失属性信息补全方法、装置、计算机设备和存储介质 |
US20210264291A1 (en) * | 2018-10-17 | 2021-08-26 | Advanced New Technologies Co., Ltd. | Model training method and apparatus based on gradient boosting decision tree |
CN114692871A (zh) * | 2022-03-29 | 2022-07-01 | 西安京东天鸿科技有限公司 | 决策树训练方法、运单类型识别方法及装置、设备、介质 |
CN115081538A (zh) * | 2022-07-19 | 2022-09-20 | 平安银行股份有限公司 | 基于机器学习的客户关系识别方法、装置、设备及介质 |
CN115099344A (zh) * | 2022-06-28 | 2022-09-23 | 中国平安人寿保险股份有限公司 | 模型训练方法和装置、用户画像生成方法和装置、设备 |
CN115269681A (zh) * | 2022-07-18 | 2022-11-01 | 同济大学 | 一种面向多维特性数据的缺失值检测及填补方法 |
CN115271976A (zh) * | 2022-06-17 | 2022-11-01 | 深圳手回科技集团有限公司 | 一种顾问推荐的方法、装置及计算机可读存储介质 |
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190080205A1 (en) * | 2016-09-16 | 2019-03-14 | Deep Learning Analytics, LLC | Systems and Methods for Deep Model Translation Generation |
CN107451748A (zh) * | 2017-08-10 | 2017-12-08 | 北京奇鱼时代科技有限公司 | 一种客户关系管理系统中客户公海管理方法 |
US20210264291A1 (en) * | 2018-10-17 | 2021-08-26 | Advanced New Technologies Co., Ltd. | Model training method and apparatus based on gradient boosting decision tree |
CN110659396A (zh) * | 2019-08-14 | 2020-01-07 | 平安科技(深圳)有限公司 | 缺失属性信息补全方法、装置、计算机设备和存储介质 |
CN110489556A (zh) * | 2019-08-22 | 2019-11-22 | 重庆锐云科技有限公司 | 关于跟进记录的质量评价方法、装置、服务器及存储介质 |
CN110598157A (zh) * | 2019-09-20 | 2019-12-20 | 北京字节跳动网络技术有限公司 | 目标信息识别方法、装置、设备及存储介质 |
CN114692871A (zh) * | 2022-03-29 | 2022-07-01 | 西安京东天鸿科技有限公司 | 决策树训练方法、运单类型识别方法及装置、设备、介质 |
CN115271976A (zh) * | 2022-06-17 | 2022-11-01 | 深圳手回科技集团有限公司 | 一种顾问推荐的方法、装置及计算机可读存储介质 |
CN115099344A (zh) * | 2022-06-28 | 2022-09-23 | 中国平安人寿保险股份有限公司 | 模型训练方法和装置、用户画像生成方法和装置、设备 |
CN115269681A (zh) * | 2022-07-18 | 2022-11-01 | 同济大学 | 一种面向多维特性数据的缺失值检测及填补方法 |
CN115081538A (zh) * | 2022-07-19 | 2022-09-20 | 平安银行股份有限公司 | 基于机器学习的客户关系识别方法、装置、设备及介质 |
Non-Patent Citations (2)
Title |
---|
HAO KANG ET AL.: "The Description of Optimal Decision Tree Algorithm and Its Application in Customer Consumption Behavior", 《2020 IEEE INTERNATIONAL CONFERENCE ON INFORMATION TECHNOLOGY,BIG DATA AND ARTIFICIAL INTELLIGENCE (ICIBA)》, pages 655 - 659 * |
李祥民等: "分类模式挖掘在属性预测中的应用", 《无线电工程》, vol. 40, no. 09, pages 44 - 47 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112785397B (zh) | 一种产品推荐方法、装置及存储介质 | |
US20190164015A1 (en) | Machine learning techniques for evaluating entities | |
CN110390408B (zh) | 交易对象预测方法和装置 | |
WO2020123421A2 (en) | Systems and methods for managing online campaigns | |
CN114547475B (zh) | 一种资源推荐方法、装置及系统 | |
Fu et al. | A sentiment-aware trading volume prediction model for P2P market using LSTM | |
CN112241458B (zh) | 文本的知识结构化处理方法、装置、设备和可读存储介质 | |
CN112749238A (zh) | 搜索排序方法、装置、电子设备以及计算机可读存储介质 | |
CN117216393A (zh) | 信息推荐方法、信息推荐模型的训练方法及装置、设备 | |
CN111353728A (zh) | 一种风险分析方法和系统 | |
CN115795345A (zh) | 信息处理方法、装置、设备及存储介质 | |
CN115795289B (zh) | 特征识别方法、装置、电子设备及存储介质 | |
CN115795289A (zh) | 特征识别方法、装置、电子设备及存储介质 | |
CN114493853A (zh) | 信用等级评价方法、装置、电子设备及存储介质 | |
CN114529399A (zh) | 用户数据处理方法、装置、计算机设备和存储介质 | |
CN113641903A (zh) | 基于人工智能的业务匹配方法及服务器 | |
CN111401641A (zh) | 业务数据处理方法、装置及电子设备 | |
CN117172632B (zh) | 一种企业异常行为检测方法、装置、设备及存储介质 | |
Baryev et al. | New approach to feature generation by complex-valued econometrics and sentiment analysis for stock-market prediction | |
CN112115258A (zh) | 一种用户的信用评价方法、装置、服务器及存储介质 | |
CN116933800B (zh) | 一种基于模版的生成式意图识别方法及装置 | |
CN116383883B (zh) | 一种基于大数据的数据管理权限处理方法及系统 | |
CN114417944B (zh) | 识别模型训练方法及装置、用户异常行为识别方法及装置 | |
Bremmer | Predicting tomorrow’s cryptocurrency price using a LSTM model, historical prices and Reddit comments | |
CN113706174A (zh) | 基于机器学习算法的违约预测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100083 Room B-3202, Building 2, No. 5, Xueyuan Road, Haidian District, Beijing Applicant after: Beijing taoyoutianxia Technology Co.,Ltd. Address before: 100083 Room B-3202, Flat 2, No. A5, Xueyuan Road, Haidian District, Beijing Applicant before: Beijing taoyoutianxia Technology Co.,Ltd. |
|
GR01 | Patent grant |