CN103023747A - 基于消息内容的信息推荐方法和系统 - Google Patents
基于消息内容的信息推荐方法和系统 Download PDFInfo
- Publication number
- CN103023747A CN103023747A CN2011102875381A CN201110287538A CN103023747A CN 103023747 A CN103023747 A CN 103023747A CN 2011102875381 A CN2011102875381 A CN 2011102875381A CN 201110287538 A CN201110287538 A CN 201110287538A CN 103023747 A CN103023747 A CN 103023747A
- Authority
- CN
- China
- Prior art keywords
- message
- classification
- information
- level
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种基于消息内容的信息推荐方法和系统,该方法包括以下步骤:在用户端查看消息时,为用户提供引导选项;如果用户触发该引导选项,则对该消息进行一级分类或多级分类,以得到类别信息;以及服务器将该类别信息相关的信息回传给用户端。
Description
技术领域
本发明涉及一种信息推荐方法和系统,更具体地,本发明涉及一种基于消息内容的信息推荐方法和系统。
背景技术
随着信息技术的发展,人们对各种信息的需求日益增加,信息提供商也希望通过有效的渠道将其信息提供给用户,从而实现商品推荐、企业宣传、信息推广等目的。人们希望接收到与自己的需求尽量匹配的信息,从而避免大量不需要的“垃圾信息”的困扰,信息提供商则希望能够为目标人群提供有针对性的信息,从而提高推荐效率,节约成本,提高用户的满意度。
然而,目前的信息推荐方法和系统提供的信息与用户的需求之间的匹配度还远远不够,难以实现以上目的。因此,就需要一种能够提供与用户需求精确匹配的信息推荐方法和系统。
发明内容
本发明的目的是提出了一种基于消息内容的信息推荐方法和系统,其能够分析用户收到的消息内容,并得出该消息所属的类别及其所对应的潜在用户需求,从而以此为依据有针对性的进行相关的信息推荐。系统一方面为用户提供了感兴趣的信息,另一方面为商家创造了定位精准的信息投放平台,可以很大程度上减少用户的反感,提高用户从查看广告到商品购买的转化率。
根据本发明的一方面提出了一种基于消息内容的信息推荐方法,该方法包括以下步骤:
A)在用户端查看消息时,为用户提供引导选项;
B)如果用户触发该引导选项,则对该消息进行一级分类或多级分类,以得到类别信息;以及
C)服务器将该类别信息相关的信息回传给用户端。
优选地,所述多级分类包括二级分类,该二级分类包括以下步骤:
B1)对该消息进行预处理,去除噪声信息;
B2)对消息的发送号码进行判断,若经判断确定了消息的一级类别,则进入步骤B3),否则进入步骤B4);
B3)进行二级类别判断,该二级类别判断包括:用对应于确定的该一级类别的各个二级类别的关键词对消息进行扫描,找出消息中含有的二级类别的关键词,不计算重复的关键词,根据每个关键词的权重值,计算出该消息中对应于各个二级类别的关键词的权重值之和作为各个二级类别的权重和,如果某二级类别的权重和达到或超过该二级类别设定的阈值,则判断该消息属于该二级类别;
B4)如果经过对消息的发送号码的判断无法确定消息的一级类别,则进行如下判断,包括:按照各一级类别的顺序,依次用所有关键词对消息进行扫描,找出消息中含有哪些各个一级类别的关键词,不计算重复的关键词,计算该消息中对应于各个一级类别的关键词的权重值之和作为各个一级类别的权重和,如果某一一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息属于该一级类别,并进入步骤B5),若无一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息为其他类;以及
B5)采用步骤B3,判断该消息的二级类别。
优选地,所述多级分类包括二级分类,该二级分类包括以下步骤:
B1)对该消息进行预处理,去除噪声信息;
B2)对消息的发送号码进行判断,若经判断确定了消息的一级类别,则进入步骤B3),否则进入步骤B4);
B3)进行二级类别判断,该二级类别判断包括:用对应于确定的该一级类别的各个二级类别的关键词对消息进行扫描,找出消息中含有的二级类别的关键词,不计算重复的关键词,根据每个关键词的权重值,计算出该消息中对应于各个二级类别的关键词的权重值之和作为各个二级类别的权重和,如果某一二级类别的权重和达到或超过该二级类别设定的阈值,则判断该消息属于该二级类别;
B4)如果经过对消息的发送号码的判断无法确定消息的一级类别,则进行如下判断,包括:在按照各一级类别的顺序,依次用所有关键词对消息进行扫描的过程中,同时计算在该消息中,对应于各个一级类别的已经扫描得到的关键词的权重值之和作为各个一级类别的权重和,一旦对于某一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息属于该一级类别,同时停止扫描,完成对一级类别的判断,并进入步骤B5,若无一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息为其他类,该二级分类结束;以及
B5)采用步骤B3,判断该消息的二级类别。
优选地,所述关键词、所述权重值、以及所述阈值可通过事先人工分析大量消息来选取设定。
优选地,对所述关键词进行编号,以表示其类别和权重值。
优选地,所述消息和所述信息具有不同的数据格式。
根据本发明的另一方面,提出了一种基于消息内容的信息推荐系统,该系统包括用户端装置和服务器端装置,其特征在于,该用户端装置包括用户端接收模块、用户端界面、引导模块、分析模块、用户端发送模块,服务器端包括服务器端接收模块、服务器端发送模块和数据库;当在用户端查看消息时,所述引导模块提供的引导选项,并将该引导选项显示在用户端界面上,如果用户触发该引导选项,所述分析模块中的分类器开始对消息进行一级分类或多级分类,以得到类别信息,所述用户端发送模块将类别信息发送给服务器端装置;以及所述服务器端接收模块接收该类别信息,通过所述服务器端发送模块,将所述数据库中该类别信息相关的信息传回用户端装置。
优选地,该分类器对消息进行二级分类,其中,分类器预先将关键词及其对应的类别信息载入,消息进入分类器后首先进行预处理,去除消息中的噪声信息,之后对消息的发送号码进行判断,若经判断确定了消息的一级类别,则继续确定消息的二级类别,包括用对应于该一级类别的各个二级类别的关键词对消息进行扫描,找出消息中含有的二级类别的关键词,不计算重复的关键词例,根据每个关键词的权重值,计算出该消息中对应于各个二级类别的关键词的权重值之和作为各个二级类别的权重和,如果某一二级类别的权重和达到或超过该二级类别设定的阈值,则判断该消息属于该二级类别;以及如果经过对消息的号码的判断无法确定消息的一级类别,则按照各一级类别的顺序,依次用所有关键词对消息进行扫描,计算该消息中对应于各个一级类别的关键词的权重值之和作为各个一级类别的权重和,如果某一一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息属于该一级类别,确定消息的一级类别之后,再通过所述确定消息的二级类别的过程确定消息的二级类别,若无一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息为其他类。
优选地,用户端发送模块将消息的所述类别信息和用户相关信息进行拼装、压缩、加密得到发送数据,再通过网络将该发送数据发送至服务器端装置,服务器端接收器接收到数据后,对所述发送数据进行相对应的解密、解压、解析,获得所述类别信息和用户相关信息,根据所述类别信息在所述数据库中进行检索,得到对应于该类别信息的多条信息,服务器端发送装置对所述多条信息进行拼装、压缩、加密,再通过网络发送给用户端装置,用户端接收装置经过相应的解密、解压、解析,获得所述多条信息,并将该信息显示在用户端界面上。
根据本发明的又一方面,提出了一种基于消息内容的信息推荐系统,该系统包括用户端装置和服务器端装置,其特征在于,该用户端装置包括用户端接收模块、用户端界面、引导模块、用户端发送模块,服务器端包括服务器端接收模块、分析模块、服务器端发送模块和数据库;所述引导模块向用户提供的引导选项,并将该引导选项显示在用户端界面上;用户触发该引导选项时,所述用户端发送模块将消息内容发送给服务器端装置;所述服务器端的分析模块包括分类器,所述分类器对消息进行一级分类或多级分类,以得到类别信息;以及所述服务器端发送模块将所述数据库中与该类别信息相关的信息传回用户端装置。
优选地,该分类器对消息进行二级分类,其中,分类器预先将关键词及其对应的类别信息载入,消息进入分类器后首先进行预处理,去除消息中的噪声信息,之后对消息的发送号码进行判断,若经判断确定了消息的一级类别,则继续确定消息的二级类别,包括用对应于该一级类别的各个二级类别的关键词对消息进行扫描,找出消息中含有的二级类别的关键词,不计算重复的关键词例,根据每个关键词的权重值,计算出该消息中对应于各个二级类别的关键词的权重值之和作为各个二级类别的权重和,如果某一二级类别的权重和达到或超过该二级类别设定的阈值,则判断该消息属于该二级类别;以及如果经过对消息的号码的判断无法确定消息的一级类别,则在按照各一级类别的顺序,依次用所有关键词对消息进行扫描的过程中,同时计算在该消息中,对应于各个一级类别的已经扫描得到的关键词的权重值之和作为各个一级类别的权重和,一旦对于某一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息属于该一级类别,同时停止扫描,完成对一级类别的判断,确定消息的一级类别之后,再通过所述确定消息的二级类别的过程确定消息的二级类别,若无一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息为其他类。
优选地,用户端发送模块将消息的内容和用户相关信息进行拼装、压缩、加密得到发送数据,再通过网络将该发送数据发送至服务器端装置,服务器端接收器接收到数据后,对所述发送数据进行相对应的解密、解压、解析,判断出所述类别信息和用户相关信息,根据所述类别信息在所述数据库中进行检索,得到对应于该类别信息的多条信息,服务器端发送装置对所述多条信息进行拼装、压缩、加密,再通过网络发送给用户端,用户端接收装置经过相应的解密、解压、解析,获得所述多条信息,并将该信息显示在用户端界面上。
附图说明
图1显示了根据本发明的基于消息内容的信息推荐系统的一个实施例的框图;
图2显示了根据图1所示的本发明的基于消息内容的信息推荐系统的一个实施例的操作流程图;
图3显示了根据本发明的基于消息内容的信息推荐系统的另一个实施例的框图;
图4显示了根据图3所示的本发明的基于消息内容的信息推荐系统的另一个实施例的操作流程图;
图5显示了在用户端的分析模块的分类器中进行消息的二级分类的操作流程图;
图6显示了服务器端装置返回的信息与用户端消息类别的对应关系图;
图7显示了用户端装置与服务器端装置数据交互的一个实施例的示例性流程图;
图8显示了用户端装置与服务器端装置数据交互的另一个实施例的示例性流程图;
图9显示了根据本发明的基于消息内容的信息推荐方法的流程图。
具体实施方式
图1显示了根据本发明的基于消息内容的信息推荐系统的一个实施例的框图。该系统包括用户端装置1和服务器端装置2。用户端装置1包括接收模块101,用户端界面102、引导模块103、分析模块104、发送模块105。图2显示了根据图1所示的本发明的基于消息内容的信息推荐系统的一个实施例的操作流程图。当在用户端装置1查看消息时,引导模块103会提供例如“我感兴趣”或“查看同类信息”的引导选项,并将该引导选项显示在用户端界面102上。如果用户的确感兴趣,并施加“触发”行为(例如点击该引导选项),响应于该触发行为,分析模块104开始对消息进行分析。可选的,“触发”不限于行为,例如用户停留在短信读取状态超过3分钟则触发。可将消息所包含的信息(包括消息内容、发送号码等)传入分析模块104中的分类器106,分类器106可进行一级分类或多级分类,判断该条消息所属的多级类别,随着类别级数的增加,分类标准逐渐细化。例如可对消息进行二级分类,确定消息所属的一级类别和二级类别,一级类别主要对应于消息的内容领域,二级类别主要对应于需求细分,每个一级类别下面对应着若干个二级类别。然后用户端装置1将此分类器106输出的类别信息通过发送模块105发送给服务器端装置2。
服务器端装置2包括接收模块201,发送模块202,和数据库203。信息的提供商提供的各种信息事先按照各自的类别和需求进行分类存储在类别体系划分完整的数据库203中。接收模块201接收用户端装置1的类别信息,通过发送模块202,将数据库203中该类别相关的若干条信息(可包括信息本身或者相应的链接)传回用户端装置1,从而供用户进行浏览,完成最终的信息推荐。
图3显示了根据本发明的基于消息内容的信息推荐系统另一个实施例的框图,与图1所述的实施例不同的是,分析模块104位于服务器端装置2中,即用户端装置1包括接收模块101、用户端界面102、引导模块103、发送模块105,服务器端装置2包括接收模块201、分析模块104、发送模块202和数据库203。
图4显示了根据图3所示的本发明的基于消息内容的信息推荐系统的另一实施例的工作流程。该引导模块103向用户提供的引导选项,并将该引导选项显示在用户端界面102上;用户触发该引导选项时,所述用户端发送模块105将消息内容发送给服务器端装置2;所述服务器端装置的分析模块104包括分类器106,所述分类器106对消息进行一级分类或多级分类,以得到类别信息;所述服务器端发送模块202将所述数据库中与该类别信息相关的信息传回用户端装置从而供用户进行浏览,完成最终的信息推荐。
为简化表述,在下文中以二级分类为例,描述分类器106的操作的具体实施例,本领域技术人员应理解,本发明所述的方法和系统可延伸到二级以上的多级分类。
图5显示了在用户端装置1的分析模块104的分类器106中进行消息的二级分类的操作流程图。分类器106预先已将关键词及其对应的类别信息载入。消息进入分类器106后首先进行预处理,例如去除标点符号等“噪声信息”。之后对消息的发送号码进行判断,若经判断确定了消息的一级类别,则再用对应于该一级类别的各个二级类别的关键词对消息进行扫描,扫描的过程实质就是找出消息中含有的二级类别的关键词(重复的关键词不算)。例如,如果消息的发送号码为银行类发送号码(通常为955*或106*955*),则经判断可知该消息的一级类别属于“银行类”。然后再用对应于该一级类别(银行类)的二级类别的关键词,例如“理财”、“信用卡”等,对消息进行扫描。
每个关键词都具有权重值,扫描过后,计算出该消息中对应于各个二级类别的关键词的权重值之和作为各个二级类别的权重和,如果某二级类别的权重和达到或超过该二级类别设定的阈值,则判断该消息属于该二级类别。
如果经过对消息的号码的判断无法确定消息的一级类别,则进行如下判断:可按照各一级类别的顺序,依次用所有关键词对消息进行扫描,找出消息中含有哪些各个一级类别的关键词(重复的关键词不算),计算该消息中对应于各个一级类别的关键词的权重值之和作为各个一级类别的权重和,如果对于某一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息属于该一级类别。若无一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息为其他类。确定消息的一级类别之后,再通过与上文中介绍的确定二级类别的过程同样的过程来确定消息的二级类别,得到最终的消息分类信息。
优选地,关键词及其权重值、以及各一、二级类别的阈值可通过事先人工分析大量信息来选取设定。优选地,可对各关键词进行编号,从而便于分析。
优选地,可在按照各一级类别的顺序,依次用所有关键词对消息进行扫描的过程中,同时计算在该消息中,对应于各个一级类别的已经扫描得到的关键词的权重值之和作为各个一级类别的权重和,一旦对于某一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息属于该一级类别,同时停止扫描,完成对一级类别的判断,从而缩短判断所需的时间。
作为示例,表1给出了一种二级分类的分类体系,其中一级类别“1汽车类”下面,还包括“1.1、售车;1.2、二手车交易;1.3、汽车租赁;1.4、售后维修保养;1.5、汽车保险;1.6、汽车用品;1.7、违章;1.8、非法”八个二级类别。
表1
下面参考表2以一条消息为例详细说明上述分类判别的过程。在该实施例中,分析模块已经预先载入关键词及其编号,包括:广本1.0.0;飞度1.0.0;购车1.1.0;展厅1.0.0;试驾1.1.0;等等,关键词后面的编号代表该关键词对应各个级别类别。比如,购车:1.1.0,第一个“1”表示属于一级类别中的第一大类“汽车类”;第二个1表示属于与汽车类对应的二级类别中的第一小类“售车类”(商家相对于用户出售汽车);第三个0:由于“售车类”下没有子类(三级类别),故第三位编号为“0”。同时该关键词对于相应类别的权重值也可依次得出:关键词购车1.1.0,对于一级类别的权重值为1,对于二级类别的权重值为1+1,因为一级类别总是包含二级类别,所以二级类别的权重值的计算是包含它的一级类别的权重值加上该二级类别的自身的权重值之和。
表2
在根据该消息的号码无法判断该消息的一级类别的情况下,首先进行一级类别判断:在短信中扫描各类别的所有关键词。发现该短信共出现了汽车类的关键词五个“广本”“飞度”“购车”“展厅”“试驾”,属于一级类别汽车类的权重和为1+1+1+1+1=5,超过“汽车类”设定的阈值4,因此一级类别为“汽车类”。
接下来进行二级类别判定:在对应于汽车类二级类别的中进行归类。扫描汽车类的所有二级类别的关键词,发现短信中出现了“购车”“展厅”“试驾”,其对应于二级类别“售车类”的权重和为“(1+1)+(1+1)+(1+1)=6”,超过“售车类”的阈值4,故二级类别为“售车类”。
这样得到该短信最终的类别信息即为1.1,也就是属于一级类别“汽车类”中的二级类别“售车类”。
上述示例仅提供了示例性的分类方法,实际上,关键词的编号方式,权重值的设置和计算方式,以及阈值的设置等,均可根据实际应用进行修改。
图6显示了服务器端装置返回的信息与用户端消息类别的对应关系图。
服务器2端会根据用户端装置1发来的信息类别返回与之对应的信息。按照预先设定的类别体系,信息可以属于汽车、文化活动、银行、其他等多个大类(一级类别),每个大类又有若干个小类(二级类别)。以汽车类为例,就包括出售、租赁、车险、其他等多个小类。
针对一级类别中的“其他”类,服务器端装置2只返回简单的提示语例如“暂无此类信息”或者不返回信息,针对其他一级类别或二级类别,服务器端装置2都会根据消息类型从服务器端装置返回与之相对应的信息,满足用户的兴趣需求,完成信息的精准投放。
在这里,所谓的“消息”包括短信、在线即时消息、电子邮件等多种类型,所谓的“信息”包括广告、新闻、商户信息等多种信息。“消息”和“信息”可具有不同的数据格式。
在分析模块位于用户端的情况下,在用户端装置与服务器端装置进行数据交互的过程中,用户端装置的发送装置可将消息的类别信息和用户相关信息进行适当的拼装、压缩、加密等处理,再通过网络将处理后的数据发送至服务器端装置,服务器端的接收装置接收到数据后,采用相应的解密、解压、解析等对数据进行处理,获得其中的消息类别信息和用户相关信息,根据消息的类别信息在服务器端的数据库中进行检索,得到对应于该类别信息的若干条信息,服务器端的发送装置可对该信息进行拼装、压缩、加密等处理,再通过网络发送给用户端装置,用户端的接收装置经过相应的解密、解压、解析等处理,即可获得信息,并可将该信息显示在用户端界面上。
在分析模块位于服务器端的情况下,在用户端装置与服务器端装置进行数据交互的过程中,用户端装置的发送装置可将消息的内容和用户相关信息进行适当的拼装、压缩、加密等处理,再通过网络将处理后的数据发送至服务器端装置,服务器端的接收装置接收到数据后,采用相应的解密、解压、解析等对数据进行处理,判断出其中的消息类别信息和用户相关信息,根据消息的类别信息在服务器端的数据库中进行检索,得到对应于该类别信息的若干条信息,服务器端的发送装置可对该信息进行拼装、压缩、加密等处理,再通过网络发送给用户端装置,用户端的接收装置经过相应的解密、解压、解析等处理,即可获得信息,并可将该信息显示在用户端界面上。
图7显示了用户端装置与服务器端装置数据交互的一个实施例的示例性流程图,在该具体实施例中,以基于短信的广告服务为例,其中在用户端按照如上文所述的过程进行短信的分类。用户端装置首先会把短信的类别信息和用户相关信息拼装成XML文件,之后分别采用例如deflate压缩算法和md5加密算法对文件进行压缩加密,通过网络(例如gprs或wifi)将数据传至服务器端装置,服务器端装置接收到数据后,再分别采用例如md5解密算法和infalte解压算法进行解密解压处理,得到XML原始文件,获得其中包含的用户和短信类别信息,根据短信类别编号可以去广告信息库中进行检索,将检索到的该类别的若干条(默认是5,可以根据用户的设定而变化)广告信息(包括广告标题,内容概要和详细链接)拼装成XML文件格式,压缩加密后通过网络发送给用户端装置,用户端装置进行解密解压处理和XML解析即可将广告信息展示到用户的界面上,供其选择浏览。
图8显示了用户端装置与服务器端装置数据交互的另一个实施例的示例性流程图,在该具体实施例中,以基于短信的广告服务为例,其中在服务器端按照如上文所述的过程进行短信的分类。用户端装置首先会把短信的内容和用户相关信息拼装成XML文件,之后分别采用例如deflate压缩算法和md5加密算法对文件进行压缩加密,通过网络(例如gprs或wifi)将数据传至服务器端装置,服务器端装置接收到数据后,再分别采用例如md5解密算法和infalte解压算法进行解密解压处理,得到XML原始文件,判断出其中包含的用户和短信类别信息,根据短信类别编号可以去广告信息库中进行检索,将检索到的该类别的若干条(默认是5,可以根据用户的设定而变化)广告信息(包括广告标题,内容概要和详细链接)拼装成XML文件格式,压缩加密后通过网络发送给用户端装置,用户端装置进行解密解压处理和XML解析即可将广告信息展示到用户的界面上,供其选择浏览。
图9显示了根据本发明的基于消息内容的信息推荐方法的流程图。该方法包括:
步骤S101在用户端查看消息时,为用户提供例如“我感兴趣”或“查看同类信息”的引导选项;
步骤S102如果用户触发该引导选项,则对该消息进行一级分类或多级分类,得到消息的类别信息;
步骤S103服务器将该类别信息相关的若干条信息,可包括信息本身或者相应的链接,回传给用户端,从而供用户进行浏览,完成最终的信息推荐。
下面以二级分类为例,描述步骤S102中的分类过程,本领域技术人员应理解,该分类过程可延伸到二级以上的多级分类。该分类过程包括以下步骤:
S1021,对消息进行预处理,例如去除标点符号等“噪声信息”
S1022,之后对消息的发送号码进行判断,若经判断确定了消息的一级类别,则进入步骤S1023,否则进入步骤S1024;
S1023,用对应于确定的该一级类别的各个二级类别的关键词对消息进行扫描,扫描的过程实质就是找出消息中含有的二级类别的关键词(重复的关键词不算),由于每个关键词具有权重值,计算出该消息中对应于各个二级类别的关键词的权重值之和作为各个二级类别的权重和,如果某二级类别的权重和达到或超过该二级类别设定的阈值,则判断该消息属于该二级类别;
S1024,如果经过对消息的发送号码的判断无法确定消息的一级类别,进行如下判断:可按照各一级类别的顺序,依次用所有关键词对消息进行扫描,找出消息中含有哪些各个二级类别的关键词(重复的关键词不算),计算该消息中对应于各个一级类别的关键词的权重值之和作为各个一级类别的权重和,如果某一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息属于该一级类别,并进入S1025,若无一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息为其他类;
S1025,确定消息的一级类别之后,再通过与步骤S1023同样的方法来确定消息的二级类别,得到最终的消息分类信息,该过程结束。
优选地,在步骤S1024中,可在按照各一级类别的顺序,依次用所有关键词对消息进行扫描的过程中,同时计算在该消息中,对应于各个一级类别的已经扫描得到的关键词的权重值之和作为各个一级类别的权重和,一旦对于某一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息属于该一级类别,同时停止扫描,完成对一级类别的判断,从而缩短判断所需的时间。
上述实施例是用于例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此项技术的人士均可在不违背本发明的精神及范畴下,对上述实施例进行修改。因此本发明的保护范围,应如本发明的权利要求书所列。
Claims (12)
1.一种基于消息内容的信息推荐方法,该方法包括以下步骤:
A)在用户端查看消息时,为用户提供引导选项;
B)如果用户触发该引导选项,则对该消息进行一级分类或多级分类,以得到类别信息;以及
C)服务器将该类别信息相关的信息回传给用户端。
2.根据权利要求1所述的基于消息内容的信息推荐方法,其特征在于,所述多级分类包括二级分类,该二级分类包括以下步骤:
B1)对该消息进行预处理,去除噪声信息;
B2)对消息的发送号码进行判断,若经判断确定了消息的一级类别,则进入步骤B3),否则进入步骤B4);
B3)进行二级类别判断,该二级类别判断包括:用对应于确定的该一级类别的各个二级类别的关键词对消息进行扫描,找出消息中含有的二级类别的关键词,不计算重复的关键词,根据每个关键词的权重值,计算出该消息中对应于各个二级类别的关键词的权重值之和作为各个二级类别的权重和,如果某二级类别的权重和达到或超过该二级类别设定的阈值,则判断该消息属于该二级类别;
B4)如果经过对消息的发送号码的判断无法确定消息的一级类别,则进行如下判断,包括:按照各一级类别的顺序,依次用所有关键词对消息进行扫描,找出消息中含有一级类别的关键词,不计算重复的关键词,计算该消息中对应于各个一级类别的关键词的权重值之和作为各个一级类别的权重和,如果某一一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息属于该一级类别,并进入步骤B5),若无一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息为其他类;以及
B5)采用步骤B3,判断该消息的二级类别。
3.根据权利要求1所述的基于消息内容的信息推荐方法,其特征在于,所述多级分类包括二级分类,该二级分类包括以下步骤:
B1)对该消息进行预处理,去除噪声信息;
B2)对消息的发送号码进行判断,若经判断确定了消息的一级类别,则进入步骤B3),否则进入步骤B4);
B3)进行二级类别判断,该二级类别判断包括:用对应于确定的该一级类别的各个二级类别的关键词对消息进行扫描,找出消息中含有的二级类别的关键词,不计算重复的关键词,根据每个关键词的权重值,计算出该消息中对应于各个二级类别的关键词的权重值之和作为各个二级类别的权重和,如果某一二级类别的权重和达到或超过该二级类别设定的阈值,则判断该消息属于该二级类别;
B4)如果经过对消息的发送号码的判断无法确定消息的一级类别,则进行如下判断,包括:在按照各一级类别的顺序,依次用所有关键词对消息进行扫描的过程中,同时计算在该消息中,对应于各个一级类别的已经扫描得到的关键词的权重值之和作为各个一级类别的权重和,一旦对于某一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息属于该一级类别,同时停止扫描,完成对一级类别的判断,并进入步骤B5,若无一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息为其他类,该二级分类结束;以及
B5)采用步骤B3,判断该消息的二级类别。
4.根据权利要求2或3所述的基于消息内容的信息推荐方法,其特征在于,所述关键词、所述权重值、以及所述阈值可通过事先人工分析大量消息来选取设定。
5.根据权利要求2或3所述的基于消息内容的信息推荐方法,其特征在于,对所述关键词进行编号,以表示其类别和权重值。
6.根据权利要求1至3中任意一项所述的基于消息内容的信息推荐方法,其特征在于,所述消息和所述信息具有不同的数据格式。
7.一种基于消息内容的信息推荐系统,该系统包括用户端装置和服务器端装置,其特征在于,
该用户端装置包括用户端接收模块、用户端界面、引导模块、分析模块、用户端发送模块,服务器端装置包括服务器端接收模块、服务器端发送模块和数据库;
当在用户端装置查看消息时,所述引导模块提供的引导选项,并将该引导选项显示在用户端界面上,如果用户触发该引导选项,所述分析模块中的分类器开始对消息进行一级分类或多级分类,以得到类别信息,所述用户端发送模块将类别信息发送给服务器端装置;以及
所述服务器端接收模块接收该类别信息,通过所述服务器端发送模块,将所述数据库中该类别信息相关的信息传回用户端装置。
8.根据权利要求7所述的基于消息内容的信息推荐系统,其特征在于,该分类器对消息进行二级分类,
其中,分类器预先将关键词及其对应的类别信息载入,消息进入分类器后首先进行预处理,去除消息中的噪声信息,之后对消息的发送号码进行判断,若经判断确定了消息的一级类别,则继续确定消息的二级类别,包括用对应于该一级类别的各个二级类别的关键词对消息进行扫描,找出消息中含有的二级类别的关键词,不计算重复的关键词例,根据每个关键词的权重值,计算出该消息中对应于各个二级类别的关键词的权重值之和作为各个二级类别的权重和,如果某一二级类别的权重和达到或超过该二级类别设定的阈值,则判断该消息属于该二级类别;以及
如果经过对消息的号码的判断无法确定消息的一级类别,则按照各一级类别的顺序,依次用所有关键词对消息进行扫描,计算该消息中对应于各个一级类别的关键词的权重值之和作为各个一级类别的权重和,如果某一一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息属于该一级类别,确定消息的一级类别之后,再通过所述确定消息的二级类别的过程确定消息的二级类别,若无一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息为其他类。
9.根据权利要求7所述的基于消息内容的信息推荐系统,其特征在于,用户端发送模块将消息的所述类别信息和用户相关信息进行拼装、压缩、加密得到发送数据,再通过网络将该发送数据发送至服务器端装置,服务器端接收器接收到数据后,对所述发送数据进行相对应的解密、解压、解析,获得所述类别信息和用户相关信息,根据所述类别信息在所述数据库中进行检索,得到对应于该类别信息的多条信息,服务器端发送装置对所述多条信息进行拼装、压缩、加密,再通过网络发送给用户端装置,用户端接收装置经过相应的解密、解压、解析,获得所述多条信息,并将该信息显示在用户端界面上。
10.一种基于消息内容的信息推荐系统,该系统包括用户端装置和服务器端装置,其特征在于,
该用户端装置包括用户端接收模块、用户端界面、引导模块、用户端发送模块,服务器端装置包括服务器端接收模块、分析模块、服务器端发送模块和数据库;
所述引导模块向用户提供的引导选项,并将该引导选项显示在用户端界面上;
用户触发该引导选项时,所述用户端发送模块将消息内容发送给服务器端装置;
所述服务器端装置的分析模块包括分类器,所述分类器对消息进行一级分类或多级分类,以得到类别信息;以及
所述服务器端发送模块将所述数据库中与该类别信息相关的信息传回用户端装置。
11.根据权利要求10所述的基于消息内容的信息推荐系统,其特征在于,该分类器对消息进行二级分类,
其中,分类器预先将关键词及其对应的类别信息载入,消息进入分类器后首先进行预处理,去除消息中的噪声信息,之后对消息的发送号码进行判断,若经判断确定了消息的一级类别,则继续确定消息的二级类别,包括用对应于该一级类别的各个二级类别的关键词对消息进行扫描,找出消息中含有的二级类别的关键词,不计算重复的关键词例,根据每个关键词的权重值,计算出该消息中对应于各个二级类别的关键词的权重值之和作为各个二级类别的权重和,如果某一二级类别的权重和达到或超过该二级类别设定的阈值,则判断该消息属于该二级类别;以及
如果经过对消息的号码的判断无法确定消息的一级类别,则在按照各一级类别的顺序,依次用所有关键词对消息进行扫描的过程中,同时计算在该消息中,对应于各个一级类别的已经扫描得到的关键词的权重值之和作为各个一级类别的权重和,一旦对于某一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息属于该一级类别,同时停止扫描,完成对一级类别的判断,确定消息的一级类别之后,再通过所述确定消息的二级类别的过程确定消息的二级类别,若无一级类别的权重和达到或超过该一级类别设定的阈值,则判断该消息为其他类。
12.根据权利要求10所述的基于消息内容的信息推荐系统,其特征在于,用户端发送模块将消息的内容和用户相关信息进行拼装、压缩、加密得到发送数据,再通过网络将该发送数据发送至服务器端装置,服务器端接收器接收到数据后,对所述发送数据进行相对应的解密、解压、解析,判断出所述类别信息和用户相关信息,根据所述类别信息在所述数据库中进行检索,得到对应于该类别信息的多条信息,服务器端发送装置对所述多条信息进行拼装、压缩、加密,再通过网络发送给用户端装置,用户端接收装置经过相应的解密、解压、解析,获得所述多条信息,并将该信息显示在用户端界面上。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110287538.1A CN103023747B (zh) | 2011-09-26 | 2011-09-26 | 基于消息内容的信息推荐方法和系统 |
US14/129,693 US20140214847A1 (en) | 2011-09-26 | 2012-09-24 | Information recommendation method and system based on message content |
PCT/CN2012/081835 WO2013044769A1 (zh) | 2011-09-26 | 2012-09-24 | 基于消息内容的信息推荐方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110287538.1A CN103023747B (zh) | 2011-09-26 | 2011-09-26 | 基于消息内容的信息推荐方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103023747A true CN103023747A (zh) | 2013-04-03 |
CN103023747B CN103023747B (zh) | 2015-07-15 |
Family
ID=47971897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110287538.1A Expired - Fee Related CN103023747B (zh) | 2011-09-26 | 2011-09-26 | 基于消息内容的信息推荐方法和系统 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20140214847A1 (zh) |
CN (1) | CN103023747B (zh) |
WO (1) | WO2013044769A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103455580A (zh) * | 2013-08-26 | 2013-12-18 | 华为技术有限公司 | 一种推荐信息的方法和装置 |
CN104484431A (zh) * | 2014-12-19 | 2015-04-01 | 合肥工业大学 | 一种基于领域本体的多源个性化新闻网页推荐方法 |
CN104486201A (zh) * | 2014-12-03 | 2015-04-01 | 小米科技有限责任公司 | 消息处理方法及装置 |
CN104615655A (zh) * | 2014-12-31 | 2015-05-13 | 小米科技有限责任公司 | 信息推荐方法和装置 |
CN104809165A (zh) * | 2015-04-02 | 2015-07-29 | 海信集团有限公司 | 一种多媒体文件相关度的确定方法及设备 |
CN105718184A (zh) * | 2014-12-05 | 2016-06-29 | 北京搜狗科技发展有限公司 | 一种数据处理方法和装置 |
CN107171939A (zh) * | 2017-05-26 | 2017-09-15 | 北京小米移动软件有限公司 | 短信分类方法及装置 |
CN110460514A (zh) * | 2019-08-19 | 2019-11-15 | 广州华多网络科技有限公司 | 即时通信工具的消息发送方法、装置、存储介质及设备 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105915701A (zh) * | 2015-12-31 | 2016-08-31 | 乐视移动智能信息技术(北京)有限公司 | 一种信息推荐方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101196923A (zh) * | 2006-11-28 | 2008-06-11 | 株式会社Opms | 基于分类的广告系统和方法 |
CN101968802A (zh) * | 2010-09-30 | 2011-02-09 | 百度在线网络技术(北京)有限公司 | 一种基于用户浏览行为进行互联网内容推荐的方法与设备 |
CN102054003A (zh) * | 2009-11-04 | 2011-05-11 | 北京搜狗科技发展有限公司 | 网络信息推荐、建立网络资源索引的方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5375235A (en) * | 1991-11-05 | 1994-12-20 | Northern Telecom Limited | Method of indexing keywords for searching in a database recorded on an information recording medium |
US5886645A (en) * | 1995-11-24 | 1999-03-23 | Motorola, Inc. | Method and apparatus for providing duplicate messages in an acknowledge-back communication system |
US5951638A (en) * | 1997-03-21 | 1999-09-14 | International Business Machines Corporation | Integrated multimedia messaging system |
US6362837B1 (en) * | 1997-05-06 | 2002-03-26 | Michael Ginn | Method and apparatus for simultaneously indicating rating value for the first document and display of second document in response to the selection |
US7996456B2 (en) * | 2006-09-20 | 2011-08-09 | John Nicholas and Kristin Gross Trust | Document distribution recommender system and method |
US7836061B1 (en) * | 2007-12-29 | 2010-11-16 | Kaspersky Lab, Zao | Method and system for classifying electronic text messages and spam messages |
US20110295958A1 (en) * | 2010-05-26 | 2011-12-01 | Research In Motion Limited | Email system providing conversation update features and related methods |
-
2011
- 2011-09-26 CN CN201110287538.1A patent/CN103023747B/zh not_active Expired - Fee Related
-
2012
- 2012-09-24 WO PCT/CN2012/081835 patent/WO2013044769A1/zh active Application Filing
- 2012-09-24 US US14/129,693 patent/US20140214847A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101196923A (zh) * | 2006-11-28 | 2008-06-11 | 株式会社Opms | 基于分类的广告系统和方法 |
CN102054003A (zh) * | 2009-11-04 | 2011-05-11 | 北京搜狗科技发展有限公司 | 网络信息推荐、建立网络资源索引的方法及系统 |
CN101968802A (zh) * | 2010-09-30 | 2011-02-09 | 百度在线网络技术(北京)有限公司 | 一种基于用户浏览行为进行互联网内容推荐的方法与设备 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103455580A (zh) * | 2013-08-26 | 2013-12-18 | 华为技术有限公司 | 一种推荐信息的方法和装置 |
CN104486201A (zh) * | 2014-12-03 | 2015-04-01 | 小米科技有限责任公司 | 消息处理方法及装置 |
CN104486201B (zh) * | 2014-12-03 | 2018-04-24 | 小米科技有限责任公司 | 消息处理方法及装置 |
CN105718184A (zh) * | 2014-12-05 | 2016-06-29 | 北京搜狗科技发展有限公司 | 一种数据处理方法和装置 |
CN104484431A (zh) * | 2014-12-19 | 2015-04-01 | 合肥工业大学 | 一种基于领域本体的多源个性化新闻网页推荐方法 |
CN104484431B (zh) * | 2014-12-19 | 2017-07-21 | 合肥工业大学 | 一种基于领域本体的多源个性化新闻网页推荐方法 |
CN104615655A (zh) * | 2014-12-31 | 2015-05-13 | 小米科技有限责任公司 | 信息推荐方法和装置 |
CN104615655B (zh) * | 2014-12-31 | 2019-04-23 | 小米科技有限责任公司 | 信息推荐方法和装置 |
CN104809165A (zh) * | 2015-04-02 | 2015-07-29 | 海信集团有限公司 | 一种多媒体文件相关度的确定方法及设备 |
CN104809165B (zh) * | 2015-04-02 | 2018-09-25 | 海信集团有限公司 | 一种多媒体文件相关度的确定方法及设备 |
CN107171939A (zh) * | 2017-05-26 | 2017-09-15 | 北京小米移动软件有限公司 | 短信分类方法及装置 |
CN110460514A (zh) * | 2019-08-19 | 2019-11-15 | 广州华多网络科技有限公司 | 即时通信工具的消息发送方法、装置、存储介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2013044769A1 (zh) | 2013-04-04 |
US20140214847A1 (en) | 2014-07-31 |
CN103023747B (zh) | 2015-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103023747B (zh) | 基于消息内容的信息推荐方法和系统 | |
Frick et al. | Do online environments promote sufficiency or overconsumption? Online advertisement and social media effects on clothing, digital devices, and air travel consumption | |
Dommett et al. | The political economy of Facebook advertising: Election spending, regulation and targeting online | |
Fang et al. | Towards effective online review systems in the Chinese context: A cross-cultural empirical study | |
Blum et al. | Does the internet defy the law of gravity? | |
Rui et al. | Whose and what chatter matters? The effect of tweets on movie sales | |
Butt et al. | Using technology acceptance model to study adoption of online shopping in an emerging economy | |
CN103890798A (zh) | 识别活动中缺少的语言 | |
Hadadi et al. | The impact of online Advertising on Proton Sales among expatriates in Malaysia | |
Dewenter et al. | More ads more revs: A note on media bias in review likelihood | |
CN104462438A (zh) | 一种信息处理方法及装置 | |
Kagan | Bricks, mortar, and google: defining the relevant antitrust market for internet-based companies | |
CN101551796A (zh) | 一种根据载体内容发布信息的控制系统及相应的控制方法 | |
CN113327132A (zh) | 多媒体推荐方法、装置、设备及存储介质 | |
US10679227B2 (en) | Systems and methods for mapping online data to data of interest | |
Peng et al. | How cloudy a crystal ball: A psychometric assessment of concept testing | |
CN115618120A (zh) | 一种公众号信息推送方法、系统、终端设备及存储介质 | |
Roshandel Arbatani et al. | Selecting media mix in advertising campaigns: The insurance industry | |
Fang et al. | An empirical analysis of the impact of online reviews on product sales in the Chinese context | |
US20200126117A1 (en) | Systems and methods for triggering marketing operations | |
KR20090124858A (ko) | 광고 매칭 시스템 | |
KR20150046816A (ko) | 구매이력 정보를 기반으로 최저가 가격비교목록을 제공하기 위한 서비스 장치, 시스템 및 방법 | |
KR101407207B1 (ko) | 카테고리 별 추천 아이템을 분류/제공하는 아이템 추천 서버 및 그 방법 | |
Montero Vega et al. | Consumers Acceptance for Autonomous Delivery Robots as a Last-Mile Delivery Solution in USA, Europe, and Asia | |
Tsao et al. | How to Respond to Customer Complaints-from the Perspective of Argument Strength |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150715 Termination date: 20180926 |