CN107092618A - 一种信息处理方法及装置 - Google Patents

一种信息处理方法及装置 Download PDF

Info

Publication number
CN107092618A
CN107092618A CN201610956064.8A CN201610956064A CN107092618A CN 107092618 A CN107092618 A CN 107092618A CN 201610956064 A CN201610956064 A CN 201610956064A CN 107092618 A CN107092618 A CN 107092618A
Authority
CN
China
Prior art keywords
information
coding
classification
total
mrow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610956064.8A
Other languages
English (en)
Inventor
龚廖安
梁福坤
马超
杜洪先
崔代锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaodu Information Technology Co Ltd
Original Assignee
Beijing Xiaodu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaodu Information Technology Co Ltd filed Critical Beijing Xiaodu Information Technology Co Ltd
Priority to CN201610956064.8A priority Critical patent/CN107092618A/zh
Publication of CN107092618A publication Critical patent/CN107092618A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种信息处理方法及装置,其中的方法包括:获取第一信息的多种分类及分类规则,其中每种分类对应一个编码;根据所述分类规则对每个对象的第一信息进行分类;根据所述对象所涉及的分类对应的编码,生成所述对象的总编码;对所有总编码进行聚类以完成信息处理。数据挖掘的重要步骤是数据的聚类,为了对网络信息平台上的对象进行聚类,本发明实施例通过处理得到每个对象的多个编码,再对每个对象的多个编码进行整合,从而得到每个对象的总编码。这样便可以对众多总编码实施聚类,从而实现了对象的聚类,进而大大了提高网络信息平台上的数据挖掘的效率,节省了信息处理时间。

Description

一种信息处理方法及装置
技术领域
本发明涉及网络数据挖掘技术领域,尤其涉及一种信息处理方法及装置。
背景技术
随着信息技术的不断发展,互联网已深入到各个领域,涌现出大量的购物平台、外卖平台、打车平台等网络信息平台。这些网络信息平台上活动(例如各种促销活动)众多,所产生的数据(即活动描述信息)往往种类繁多,信息量很大,若要从中挖掘出有价值的内容并非易事。
在现有技术中,为了从众多数据中挖掘出有价值的内容,往往需要动用人工进行调研和分析,经过数据筛选最后提炼出有价值的信息。发明人在实现本发明的过程中发现,由于分析的工作量很大,使得现有技术中的这类方案成本较高,且周期较长,时效性差,无法应对当前网络信息的快速变化。
发明内容
本发明提供一种信息处理方法及装置,以提高网络信息平台上的数据挖掘效率。
根据本发明实施例的第一方面,提供一种信息处理方法,所述方法包括:
获取第一信息的多种分类及分类规则,其中每种分类对应一个编码;
根据所述分类规则对每个对象的第一信息进行分类;
根据所述对象所涉及的分类对应的编码,生成所述对象的总编码;
对所有总编码进行聚类以完成信息处理。
可选的,所述第一信息为用于描述所述对象所涉及的活动的活动描述信息。
可选的,所述获取第一信息的多种分类和分类规则,包括:
收集所述第一信息;
对所述第一信息进行文本规整处理;
从经过文本规整处理后的第一信息中抽取出关键词;
根据所述关键词确定所述第一信息的多种分类及分类规则。
可选的,所述编码采用二进制比特位的编码方式。
可选的,所述根据所述对象所涉及的分类对应的编码,生成所述对象的总编码,包括:
根据预设规则将所述对象所涉及的分类对应的编码进行叠加或串联,以得到所述对象的总编码。
可选的,所述对所有总编码进行聚类,包括:
根据
获取总编码两两之间的距离d(x,y),其中,i=0,1,…,n-1,n为总编码的比特位总数,x[i]、y[i]分别表示两个总编码第i比特位上的值,w[i]表示第i比特位对应的权重,表示按位与;
根据总编码两两之间的距离,对总编码进行聚类。
根据本发明实施例的第二方面,提供一种信息处理装置,所述装置包括:
分类准备模块,用于获取第一信息的多种分类及分类规则,其中每种分类对应一个编码;
分类模块,用于根据所述分类规则对每个对象的第一信息进行分类;
编码模块,用于根据所述对象所涉及的分类对应的编码,生成所述对象的总编码;
聚类模块,用于对所有总编码进行聚类以完成信息处理。
可选的,所述第一信息为用于描述所述对象所涉及的活动的活动描述信息。
可选的,所述分类准备模块包括:
信息收集子模块,用于收集所述第一信息;
文本规整子模块,用于对所述第一信息进行文本规整处理;
关键词抽取子模块,用于从经过文本规整处理后的第一信息中抽取出关键词;
分类及规则确定子模块,用于根据所述关键词确定所述第一信息的多种分类及分类规则。
可选的,所述编码采用二进制比特位的编码方式。
可选的,所述编码模块用于:
根据预设规则将所述对象所涉及的分类对应的编码进行叠加或串联,以得到所述对象的总编码。
可选的,所述聚类模块用于:
根据
获取总编码两两之间的距离d(x,y),其中,i=0,1,…,n-1,n为总编码的比特位总数,x[i]、y[i]分别表示两个总编码第i比特位上的值,w[i]表示第i比特位对应的权重,表示按位与;
根据总编码两两之间的距离,对总编码进行聚类。
本发明的实施例提供的技术方案可以包括以下有益效果:
发明人在实现本发明的过程中发现,数据挖掘的重要步骤是数据的聚类,当实现了聚类后再进行分析就方便很多了。因此本发明实施例对网络信息平台上所产生的第一信息(例如活动描述信息)进行分类并获取每种分类的分类规则,且对为每种分类定义各自的编码,然后根据分类规则得到每个对象(例如商家)的第一信息的分类,进而得到每个对象的多个编码,再对每个对象的多个编码进行整合,从而得到每个对象的总编码。这样便可以对众多总编码实施聚类,从而实现了对象的聚类,进而可大大提高网络信息平台上的数据挖掘的效率,节省信息处理时间。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。此外,这些介绍并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是根据本发明一示例性实施例示出的一种信息处理方法的流程图;
图2是根据本发明一示例性实施例示出的一种信息处理方法的流程图;
图3是根据本发明一示例性实施例示出的一种信息处理装置的示意图;
图4是根据本发明一示例性实施例示出的一种信息处理装置的示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据本发明一示例性实施例示出的一种信息处理方法的流程图。该方法例如可以用于个人电脑或服务器等设备。
参见图1所示,该方法可以包括如下步骤:
步骤S101,获取第一信息的多种分类及分类规则,其中每种分类对应一个编码。
对于各种网络信息平台,例如购物平台、外卖平台、打车平台等,这些网络信息平台上会经常产生活动,如各种促销活动,或者说是营销活动。营销活动,通常是指商家为提高单量、流水、知名度而提供的满减、立减、新用户立减、打折、专送、免配送费等刺激用户消费而推出的优惠活动。
这些网络平台上可以有众多对象。作为示例,对象可以是网络信息平台上的商品\服务的提供方,如商家等。所述第一信息可以为用于描述所述对象所涉及的活动的活动描述信息。
对于这些活动,虽然表面上看是营销,但是实际上从技术上看则是信息或信息集合,换句话说,一个活动其实就是使用一种信息或一组信息来描述的事物,本实施例中将用于对活动进行描述的一种信息或一组信息称为活动描述信息,对活动的处理反映到技术上其实就是对活动描述信息的处理。活动描述信息例如可以以“文字”结合“数值”等形式存在,如“立减20”、“打85折”等。可以通过人工收集网络信息平台上的各对象的各种活动描述信息,也可以通过网络爬虫自动收集,等等。
可以获取到(例如预设)这些活动描述信息的分类(例如分类可以归为“新用户活动”、“立减活动”、“在线支付活动”等多种类型),以及每种分类的分类规则。对于具体的分类及每种分类的分类规则本实施例并不进行限制,本领域技术人员可以根据不同需求\不同场景而自行设计,可以在此处使用的这些设计都没有背离本发明的精神和保护范围。
作为示例可参见图2所示,获取第一信息的多种分类及分类规则,可以包括以下子步骤:
步骤S1011,收集所述第一信息。
例如,可以通过人工收集网络信息平台上的第一信息,也可以通过网络爬虫自动收集,等等。
步骤S1012,对所述第一信息进行文本规整处理。
例如,文本规整处理可以包括切词处理、停止词剔除处理,等等。
步骤S1013,从经过文本规整处理后的第一信息中抽取出关键词。
例如,可以从“新用户首单立减10元(在线支付专享)”这一活动描述信息中抽取出“新用户”、“首单”、“立减N”、“在线支付”、“专享”等关键词,其中N以变量的形式代表立减的数值。
步骤S1014,根据所述关键词确定所述第一信息的多种分类及分类规则。
例如,将得到的关键词合并后可以生成“新用户活动”、“立减活动”、“在线支付活动”等活动分类。活动分类确定后,根据每类所含活动描述信息,可以进一步生成具体的分类规则。
举例来讲,满减活动的一条分类规则可以配置为“菜&&满X&&减N”,即如果活动描述信息中同时出现“某某菜品”、“满X”“减N”则满足满减活动的提取规则,则该活动描述信息即属于满减活动这一分类。
步骤S102,根据所述分类规则对每个对象的第一信息进行分类。
活动描述信息及其分类通常都是通过文字表述的,不利于聚类计算。为了实现聚类,本发明中对每种分类定义各自的编码,然后以编码代替每类活动描述信息,从而参与聚类。对于编码的形式本实施例也并不进行限制,例如可以是数字编码、字符编码等。
步骤S103,根据所述对象所涉及的分类对应的编码,生成所述对象的总编码。
例如,一个对象可以开展各种活动,故一个对象可以拥有一条或多条活动描述信息,分类后便可以得到一个或多个编码,进而一个对象可以涉及一个或多个编码。根据一个对象所涉及的一个或多个编码可以进一步得到该对象的总编码。
步骤S104,对所有总编码进行聚类以完成信息处理。
对于聚类时所采用的具体聚类算法,本实施例并不进行限制,本领域技术人员可以根据不同需求\不同场景而自行设计,可以在此处使用的这些设计都没有背离本发明的精神和保护范围。
对总编码聚类后,也即对众多对象聚类后,便可以采取进一步的分析处理。
举例来讲,可以进行销售线索挖掘。销售线索挖掘是在营销活动聚类的基础上挖掘出有价值的销售线索。例如可以进行:
1)营销活动比对。在不同城市、商圈、营业时间、商户类型、竞争对手平台等层面进行营销活动类型和力度的比对,将比对的结果按营销活动差异的程度进行排序和存储。
2)销售线索发现。配置销售线索发现的规则,用这些规则去检索营销活动比对生成的结果,自动产出销售线索。例如可以配置当竞争对手活动力度大于本产品商户时,即可以产生营销活动力度优化的销售线索。
3)营销活动可视化。在城市、商圈、竞争对手平台等层面可视化展示商户的营销活动的情况,方便城市经理了解商户的营销活动,人工提取出销售线索。
实现聚类是数据挖掘中非常重要的步骤,为此本实施例对活动描述信息进行分类并获取每种分类的分类规则,并对为每种分类定义各自的编码,然后根据分类规则得到每个对象(例如商家)的活动描述信息的分类,进而得到每个对象的多个编码,再对每个对象的多个编码进行整合,得到每个对象的总编码,这样便可以对众多总编码实施聚类,从而大大提高了数据挖掘的效率,节省了信息处理时间。
进一步的,随着餐饮外卖O2O等的发展,新的模式提供了新的销售线索挖掘方式,基于销售活动聚类的销售线索挖掘能够在下面几个方面带来收益:
营销活动及时跟踪。能够迅速跟踪本平台商户和竞争对手平台商户营销活动的变化和差异,及时调整营销活动策略。
活动力度精细化运营。可以根据竞争对手商户和商圈内同类型商户的营销活动力度推出适当的活动力度,避免资源浪费。
销售线索自动挖掘。由于对营销活动进行了整合和聚类,产出的数据可以根据销售线索规则进行检索,自动挖掘销售线索。
实施例二
本实施例基于实施例一,是在实施例一基础上所作的进一步深化或优化。
在本实施例中,所述编码可以采用二进制比特位的编码方式。
作为示例,可以为每种活动分类设置一个Type值,具体如下:
表1
Type值即是该活动分类对应的二进制的bit位,例如满减活动对应编码的右起第一个bit位,活动编码值为1,折扣活动对应第三个bit位,活动编码为4。
进一步的,还可以定义活动优先级。基于需要及活动的重要性,不同活动的优先级可以是不一样的。例如可以定义低bit位的活动优先级高,高bit位的活动优先级低,在后续进行聚类的时候,可以令低bit位的活动的权值大于高bit位的权值。
在本实施例中或本发明其他某些实施例中,根据所述对象所涉及的分类对应的编码,生成所述对象的总编码,可以包括:
根据预设规则将所述对象所涉及的分类对应的编码进行叠加或串联,以得到所述对象的总编码。
例如,可以规定每个编码和总编码的bit位数量都一样,例如都为10位,如果一个商家的活动编码有0000001000和0000000011,那么叠加之后便可以得到该商家的总编码为0000001011。
又例如,可以规定活动编码bit位为3位,每个商家的活动不超过3个,总编码为9位,那么如果一个商家的活动编码有010、100、101,则串联后得到的该商家的总编码可以为010100101。
对于编码、总编码的具体定义,以及如何通过叠加或串联或其他方式得到总编码,本实施例均不进行限制,本领域技术人员完全可以根据不同需求\不同场景而自行设计,可以在此处使用的这些设计都没有背离本发明的精神和保护范围。
在本实施例中或本发明其他某些实施例中,所述对所有总编码进行聚类,可以包括:
根据
获取总编码两两之间的距离d(x,y),其中,i=0,1,…,n-1,n为总编码的比特位总数,x[i]、y[i]分别表示两个总编码第i比特位上的值,w[i]表示第i比特位对应的权重,表示按位与;
根据总编码两两之间的距离,对总编码进行聚类。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
实施例三
图3是根据本发明一示例性实施例示出的一种信息处理装置的示意图。该装置例如可以用于个人电脑或服务器等设备。
参见图3所示,该装置可以包括:
分类准备模块301,用于获取第一信息的多种分类及分类规则,其中每种分类对应一个编码。
对于各种网络信息平台,例如购物平台、外卖平台、打车平台等,这些网络信息平台上会经常产生活动,如各种促销活动,或者说是营销活动。营销活动,通常是指商家为提高单量、流水、知名度而提供的满减、立减、新用户立减、打折、专送、免配送费等刺激用户消费而推出的优惠活动。
这些网络平台上可以有众多对象。作为示例,对象可以是网络信息平台上的商品\服务的提供方,如商家等。所述第一信息可以为用于描述所述对象所涉及的活动的活动描述信息。
在本实施例或本发明其他某些实施例中,所述编码可以采用二进制比特位的编码方式。
分类模块302,用于根据所述分类规则对每个对象的第一信息进行分类。
活动描述信息及其分类通常都是通过文字表述的,不利于聚类计算。为了实现聚类,本发明中对每种分类定义各自的编码,然后以编码代替每类活动描述信息,从而参与聚类。对于编码的形式本实施例也并不进行限制,例如可以是数字编码、字符编码等。
编码模块303,用于根据所述对象所涉及的分类对应的编码,生成所述对象的总编码。
例如,一个对象可以开展各种活动,故一个对象可以拥有一条或多条活动描述信息,分类后便可以得到一个或多个编码,进而一个对象可以涉及一个或多个编码。根据一个对象所涉及的一个或多个编码可以进一步得到该对象的总编码。
聚类模块304,用于对所有总编码进行聚类以完成信息处理。
对于聚类时所采用的具体聚类算法,本实施例并不进行限制,本领域技术人员可以根据不同需求\不同场景而自行设计,可以在此处使用的这些设计都没有背离本发明的精神和保护范围。
参见图4所示,在本实施例或本发明其他某些实施例中,所述分类准备模块301可以包括:
信息收集子模块3011,用于收集所述第一信息。
例如,可以通过人工收集网络信息平台上的第一信息,也可以通过网络爬虫自动收集,等等。
文本规整子模块3012,用于对所述第一信息进行文本规整处理。
例如,文本规整处理可以包括切词处理、停止词剔除处理,等等。
关键词抽取子模块3013,用于从经过文本规整处理后的第一信息中抽取出关键词。
例如,可以从“新用户首单立减10元(在线支付专享)”这一活动描述信息中抽取出“新用户”、“首单”、“立减N”、“在线支付”、“专享”等关键词,其中N以变量的形式代表立减的数值。
分类及规则确定子模块3014,用于根据所述关键词确定所述第一信息的多种分类及分类规则。
例如,将得到的关键词合并后可以生成“新用户活动”、“立减活动”、“在线支付活动”等活动分类。活动分类确定后,根据每类所含活动描述信息,可以进一步生成具体的分类规则。
在本实施例或本发明其他某些实施例中,所述编码模块303可以用于:
根据预设规则将所述对象所涉及的分类对应的编码进行叠加或串联,以得到所述对象的总编码。
对于编码、总编码的具体定义,以及如何通过叠加或串联或其他方式得到总编码,本实施例均不进行限制,本领域技术人员完全可以根据不同需求\不同场景而自行设计,可以在此处使用的这些设计都没有背离本发明的精神和保护范围。
在本实施例或本发明其他某些实施例中,所述聚类模块304可以用于:
根据
获取总编码两两之间的距离d(x,y),其中,i=0,1,…,n-1,n为总编码的比特位总数,x[i]、y[i]分别表示两个总编码第i比特位上的值,w[i]表示第i比特位对应的权重,表示按位与;
根据总编码两两之间的距离,对总编码进行聚类。
实现聚类是数据挖掘中非常重要的步骤,为此本实施例对活动描述信息进行分类并获取每种分类的分类规则,并对为每种分类定义各自的编码,然后根据分类规则得到每个对象(例如商家)的活动描述信息的分类,进而得到每个对象的多个编码,再对每个对象的多个编码进行整合,得到每个对象的总编码,这样便可以对众多总编码实施聚类,从而大大提高了数据挖掘的效率,节省了信息处理时间。
关于上述实施例中的装置,其中各个单元\模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由所附的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (12)

1.一种信息处理方法,其特征在于,所述方法包括:
获取第一信息的多种分类及分类规则,其中每种分类对应一个编码;
根据所述分类规则对每个对象的第一信息进行分类;
根据所述对象所涉及的分类对应的编码,生成所述对象的总编码;
对所有总编码进行聚类以完成信息处理。
2.根据权利要求1所述的方法,其特征在于,所述第一信息为用于描述所述对象所涉及的活动的活动描述信息。
3.根据权利要求1所述的方法,其特征在于,所述获取第一信息的多种分类和分类规则,包括:
收集所述第一信息;
对所述第一信息进行文本规整处理;
从经过文本规整处理后的第一信息中抽取出关键词;
根据所述关键词确定所述第一信息的多种分类及分类规则。
4.根据权利要求1所述的方法,其特征在于,所述编码采用二进制比特位的编码方式。
5.根据权利要求4所述的方法,其特征在于,所述根据所述对象所涉及的分类对应的编码,生成所述对象的总编码,包括:
根据预设规则将所述对象所涉及的分类对应的编码进行叠加或串联,以得到所述对象的总编码。
6.根据权利要求5所述的方法,其特征在于,所述对所有总编码进行聚类,包括:
根据
<mrow> <mi>d</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>&amp;Sigma;</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>&amp;lsqb;</mo> <mi>i</mi> <mo>&amp;rsqb;</mo> <mo>&amp;CirclePlus;</mo> <mi>y</mi> <mo>&amp;lsqb;</mo> <mi>i</mi> <mo>&amp;rsqb;</mo> <mo>)</mo> </mrow> <mi>w</mi> <mo>&amp;lsqb;</mo> <mi>i</mi> <mo>&amp;rsqb;</mo> </mrow>
获取总编码两两之间的距离d(x,y),其中,i=0,1,…,n-1,n为总编码的比特位总数,x[i]、y[i]分别表示两个总编码第i比特位上的值,w[i]表示第i比特位对应的权重,表示按位与;
根据总编码两两之间的距离,对总编码进行聚类。
7.一种信息处理装置,其特征在于,所述装置包括:
分类准备模块,用于获取第一信息的多种分类及分类规则,其中每种分类对应一个编码;
分类模块,用于根据所述分类规则对每个对象的第一信息进行分类;
编码模块,用于根据所述对象所涉及的分类对应的编码,生成所述对象的总编码;
聚类模块,用于对所有总编码进行聚类以完成信息处理。
8.根据权利要求7所述的装置,其特征在于,所述第一信息为用于描述所述对象所涉及的活动的活动描述信息。
9.根据权利要求7所述的装置,其特征在于,所述分类准备模块包括:
信息收集子模块,用于收集所述第一信息;
文本规整子模块,用于对所述第一信息进行文本规整处理;
关键词抽取子模块,用于从经过文本规整处理后的第一信息中抽取出关键词;
分类及规则确定子模块,用于根据所述关键词确定所述第一信息的多种分类及分类规则。
10.根据权利要求7所述的装置,其特征在于,所述编码采用二进制比特位的编码方式。
11.根据权利要求10所述的装置,其特征在于,所述编码模块用于:
根据预设规则将所述对象所涉及的分类对应的编码进行叠加或串联,以得到所述对象的总编码。
12.根据权利要求11所述的装置,其特征在于,所述聚类模块用于:
根据
<mrow> <mi>d</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>&amp;Sigma;</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>&amp;lsqb;</mo> <mi>i</mi> <mo>&amp;rsqb;</mo> <mo>&amp;CirclePlus;</mo> <mi>y</mi> <mo>&amp;lsqb;</mo> <mi>i</mi> <mo>&amp;rsqb;</mo> <mo>)</mo> </mrow> <mi>w</mi> <mo>&amp;lsqb;</mo> <mi>i</mi> <mo>&amp;rsqb;</mo> </mrow>
获取总编码两两之间的距离d(x,y),其中,i=0,1,…,n-1,n为总编码的比特位总数,x[i]、y[i]分别表示两个总编码第i比特位上的值,w[i]表示第i比特位对应的权重,表示按位与;
根据总编码两两之间的距离,对总编码进行聚类。
CN201610956064.8A 2016-10-27 2016-10-27 一种信息处理方法及装置 Pending CN107092618A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610956064.8A CN107092618A (zh) 2016-10-27 2016-10-27 一种信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610956064.8A CN107092618A (zh) 2016-10-27 2016-10-27 一种信息处理方法及装置

Publications (1)

Publication Number Publication Date
CN107092618A true CN107092618A (zh) 2017-08-25

Family

ID=59649254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610956064.8A Pending CN107092618A (zh) 2016-10-27 2016-10-27 一种信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN107092618A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309376A (zh) * 2019-07-10 2019-10-08 深圳市友华软件科技有限公司 嵌入式平台的配置条目管理方法
CN112785729A (zh) * 2020-12-30 2021-05-11 深圳市顺易通信息科技有限公司 一种停车费减免的处理方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110029525A1 (en) * 2009-07-28 2011-02-03 Knight William C System And Method For Providing A Classification Suggestion For Electronically Stored Information
CN101996213A (zh) * 2009-08-27 2011-03-30 顾海松 一种实时客户购物行为分析系统及其方法
CN102591882A (zh) * 2011-01-17 2012-07-18 英华达(上海)科技有限公司 知识分类系统
CN102750609A (zh) * 2012-05-23 2012-10-24 索菲亚家居股份有限公司 定制家居组件的管理方法
CN103927545A (zh) * 2014-03-14 2014-07-16 小米科技有限责任公司 聚类方法及相关装置
CN104182465A (zh) * 2014-07-21 2014-12-03 安徽华贞信息科技有限公司 一种基于网络的大数据处理方法
CN105426425A (zh) * 2015-11-04 2016-03-23 华中科技大学 一种基于移动信令的大数据营销方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110029525A1 (en) * 2009-07-28 2011-02-03 Knight William C System And Method For Providing A Classification Suggestion For Electronically Stored Information
CN101996213A (zh) * 2009-08-27 2011-03-30 顾海松 一种实时客户购物行为分析系统及其方法
CN102591882A (zh) * 2011-01-17 2012-07-18 英华达(上海)科技有限公司 知识分类系统
CN102750609A (zh) * 2012-05-23 2012-10-24 索菲亚家居股份有限公司 定制家居组件的管理方法
CN103927545A (zh) * 2014-03-14 2014-07-16 小米科技有限责任公司 聚类方法及相关装置
CN104182465A (zh) * 2014-07-21 2014-12-03 安徽华贞信息科技有限公司 一种基于网络的大数据处理方法
CN105426425A (zh) * 2015-11-04 2016-03-23 华中科技大学 一种基于移动信令的大数据营销方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309376A (zh) * 2019-07-10 2019-10-08 深圳市友华软件科技有限公司 嵌入式平台的配置条目管理方法
CN112785729A (zh) * 2020-12-30 2021-05-11 深圳市顺易通信息科技有限公司 一种停车费减免的处理方法及装置

Similar Documents

Publication Publication Date Title
CN104050196B (zh) 一种兴趣点数据冗余检测方法及装置
CN103473230B (zh) 服务范围确定方法、物流服务提供方推荐方法及相应装置
CN109446281B (zh) 基于ArcGIS的在线智能制图系统构建方法、系统与制图方法
CN106681996B (zh) 确定地理范围内兴趣区域、兴趣点的方法和装置
CN106097095B (zh) 确定信用的方法及装置
CN107424043A (zh) 一种产品推荐方法及装置,电子设备
CN107679189A (zh) 一种兴趣点更新方法、装置、服务器和介质
CN105975483A (zh) 一种基于用户偏好的消息推送方法和平台
CN104035927A (zh) 一种基于用户行为的搜索方法及系统
CN110009379A (zh) 一种选址模型构建和选址方法、装置及设备
CN106849353B (zh) 输变电工程环保监测与敏感区域预测系统及方法
CN106855851A (zh) 知识抽取方法及装置
CN107423998B (zh) 一种基于SaaS平台的可视化销售数据管理方法及系统
CN105138590A (zh) 轨迹预测方法和装置
CN109087030A (zh) 实现c2c通用移动众包的方法、通用移动众包服务器及系统
CN108446351A (zh) Ota平台的基于用户偏好的酒店筛选方法及系统
CN110322281A (zh) 相似用户的挖掘方法及装置
CN107395680A (zh) 店铺群信息推送和输出方法及装置、设备
WO2021208685A1 (zh) 执行自动机器学习过程的方法、装置及设备
CN104899602A (zh) 一种基于K-means算法的用户聚类分析系统
CN104933621A (zh) 一种担保圈的大数据分析系统和方法
CN107710246A (zh) 用以促进描述位置的用户图像的提交的系统和方法
CN111639253A (zh) 一种数据判重方法、装置、设备及存储介质
CN110232133A (zh) 一种基于特征融合和款式分类的服装图像检索方法和系统
CN105160546A (zh) 一种构建和分析社交网络的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100085 Beijing, Haidian District on the road to the information on the ground floor of the 1 to the 3 floor of the 2 floor, room 11, 202

Applicant after: Beijing Xingxuan Technology Co.,Ltd.

Address before: 100085 Beijing, Haidian District on the road to the information on the ground floor of the 1 to the 3 floor of the 2 floor, room 11, 202

Applicant before: Beijing Xiaodu Information Technology Co.,Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20170825

RJ01 Rejection of invention patent application after publication