CN104636381B - 信息的处理方法及装置 - Google Patents
信息的处理方法及装置 Download PDFInfo
- Publication number
- CN104636381B CN104636381B CN201310565741.XA CN201310565741A CN104636381B CN 104636381 B CN104636381 B CN 104636381B CN 201310565741 A CN201310565741 A CN 201310565741A CN 104636381 B CN104636381 B CN 104636381B
- Authority
- CN
- China
- Prior art keywords
- information
- described information
- value
- keyword
- junk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种信息的处理方法及装置,涉及信息技术领域,可以提高垃圾信息的判断准确率。所述方法包括:客户端首先接收信息,然后获取信息对应的垃圾程度值及接受程度值,最后根据信息对应的垃圾程度值及接受程度值,判断信息是否为垃圾信息。本发明适用于判断信息是否为垃圾信息。
Description
技术领域
本发明涉及信息技术领域,特别涉及一种信息的处理方法及装置。
背景技术
随着信息技术的不断发展,用户所接收的信息中包含的信息种类越来越多,其中,接收的信息中包含的垃圾信息也越来越多,从而影响用户对需要查阅的信息的获取。例如,垃圾信息可以为无针对性的广告信息、商家针对部分用户发送的服务信息等。
目前为了过滤上述垃圾信息,终端设备通常是根据信息中的某些关键词判断该信息是否为垃圾信息,若是垃圾信息,则进行过滤。然而目前根据信息中的关键词判断该信息是否为垃圾信息的方式,仅针对信息中包括的内容关键词进行判断,没有对信息的由来及用户查阅信息的特点进行分析,从而造成垃圾信息的判断准确率较低。
发明内容
本发明实施例提供一种信息的处理方法及装置,可以提高垃圾信息的判断准确率。
本发明实施例采用的技术方案为:
一种信息的处理方法,包括:
接收信息;
获取所述信息对应的垃圾程度值,并获取所述信息对应的接受程度值;
根据所述信息对应的垃圾程度值及所述信息对应的接受程度值,判断所述信息是否为垃圾信息。
一种信息的处理装置,包括:
接收单元,用于接收信息;
获取单元,用于获取所述接收单元接收的所述信息对应的垃圾程度值,并获取所述信息对应的接受程度值;
判断单元,用于根据所述获取单元获取的所述信息对应的垃圾程度值及所述信息对应的接受程度值,判断所述信息是否为垃圾信息。
本发明实施例提供的信息的处理方法及装置,客户端首先接收信息,然后获取信息对应的垃圾程度值及接受程度值,最后根据信息对应的垃圾程度值及接受程度值,判断信息是否为垃圾信息。与目前根据信息中的某些关键词直接判断该信息是否为垃圾信息相比,本发明实施例能够根据信息中的关键词对信息的由来及用户查阅信息的特点进行分析,从而可以判断信息是否为垃圾信息,进而可以提高垃圾信息的判断准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例一提供的一种信息的处理方法流程图;
图2为本发明实施例一提供的一种信息的处理结构示意图;
图3为本发明实施例二提供的一种信息的处理方法流程图;
图4为本发明实施例二提供的一种信息的处理结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
为使本发明技术方案的优点更加清楚,下面结合附图和实施例对本发明作详细说明。
实施例一
本发明实施例提供一种信息的处理方法,如图1所示,所述方法包括:
101、客户端接收信息。
其中,信息可以为短消息或者邮件等,本发明实施例不做限定。在本发明实施例,客户端可以安装在PC(Personal Computer,个人计算机)、手机、平板电脑等。
102、客户端获取信息对应的垃圾程度值,并获取信息对应的接受程度值。
对于本发明实施例,客户端通过信息对应的垃圾程度值,能够根据信息的垃圾程度值判断该信息是垃圾信息的概率。其中,当信息对应的垃圾程度值越高时,该信息是垃圾信息的概率越大。同时,客户端通过信息对应的接受程度值,能够根据信息的接受程度值判断该信息不是垃圾信息的概率。具体地,当信息对应的接受程度值越高时,该信息不是垃圾信息的概率越大。
对于本发明实施例,步骤102之前还可以包括,客户端提取信息中包括的各个关键词,并根据信息中包括的各个关键词判断信息是否有可能为垃圾信息。若信息有可能为垃圾信息,则将信息暂时拦截。在本发明实施例中,客户端通过预先判断信息是否有可能为垃圾信息,并对有可能为垃圾信息的信息进行进一步更准确地判断,从而可以仅对有可能为垃圾信息的信息进行判断处理,进而可以降低信息的处理复杂度。
具体地,客户端可以首先从接收到的信息中提取信息中包括的各个关键词,然后获取信息中包括的各个关键词为垃圾信息的关键词对应的各个概率值,最后获取各个概率值中最大的概率值作为信息为垃圾信息的概率值,并将该概率值与预设概率值进行比较,若该概率值大于或者等于预设概率值,则确定该信息有可能为垃圾信息。其中,预设概率值可以由服务器预先进行配置。例如,若预设概率值为0.3,客户端从接收到的信息中提取到三个关键词,这三个关键词为垃圾信息的关键词对应的概率值分别为0.2、0.3、0.35,则获取最大概率值0.35作为信息为垃圾信息的概率值,并与预设概率值0.3进行比较,该最大概率值大于预设概率值,因此确定该信息有可能为垃圾信息。
其中,垃圾信息的关键词对应的概率值可以由服务器预先根据用户对垃圾信息的反馈进行获取。
103、客户端根据信息对应的垃圾程度值及信息对应的接受程度值,判断信息是否为垃圾信息。
对于本发明实施例,客户端通过获取信息对应的垃圾程度值及信息对应的接受程度值,能够根据信息中包括的内容及用户的需求对信息是否为垃圾信息进行判断,从而可以提高垃圾信息的判断准确率。
可选地,步骤103之后还可以包括,若信息为垃圾信息,则客户端过滤该垃圾信息。在本发明实施例中,客户端对垃圾信息进行过滤之后,可以向服务器进行反馈,以使得服务器能够实时地获取用户对包括各个关键词的信息的处理情况。
进一步地,作为图1所示方法的具体实现,本发明实施例提供了一种信息的处理装置,如图2所示,所述装置的实体可以为客户端,例如PC(Personal Computer,个人计算机)、手机、平板电脑等,所述装置包括:接收单元21、获取单元22、判断单元23。
接收单元21,用于接收信息。
获取单元22,用于获取接收单元21接收的信息对应的垃圾程度值,并获取信息对应的接受程度值。
判断单元23,用于根据获取单元22获取的信息对应的垃圾程度值及信息对应的接受程度值,判断信息是否为垃圾信息。
需要说明的是,本发明实施例中提供的信息的处理装置中各功能单元所对应的其他相应描述,可以参考图1中的对应描述,在此不再赘述。
本发明实施例提供的信息的处理方法及装置,客户端首先接收信息,然后获取信息对应的垃圾程度值及接受程度值,最后根据信息对应的垃圾程度值及接受程度值,判断信息是否为垃圾信息。与目前根据信息中的某些关键词直接判断该信息是否为垃圾信息相比,本发明实施例能够根据信息中的关键词对信息的由来及用户查阅信息的特点进行分析,从而可以判断信息是否为垃圾信息,进而可以提高垃圾信息的判断准确率。
实施例二
本发明实施例提供一种信息的处理方法,如图3所示,所述方法包括:
301、客户端接收信息。
其中,信息可以为短消息或者邮件等,本发明实施例不做限定。在本发明实施例,客户端可以安装在PC、手机、平板电脑等。
302、客户端提取信息中包括的各个关键词。
其中,各个关键词可以保存在数据库中。在本发明实施例中,客户端可以通过将数据库中保存的关键词与接收到的信息中的词语进行词义相似度计算,若该词义相似度大于或者等于预设词义相似度,则将该词语作为从该信息中提取的关键词。其中,预设词义相似度可以由客户端预先进行配置。
例如,数据库中保存有关键词:汇款、银行账号、房地产、限时特价等,客户端接收到的信息为:请速往我的银行账号汇款两万元人民币。客户端通过将该信息中的词语与数据库中保存的关键词进行词义相似度计算,获取到接收到的信息中的词语银行账号和汇款,与数据库中保存的关键词银行账号和汇款的词义相似度大于或者等于预设词义相似度,则客户端从接收到的信息中提取的关键词分别为银行账号和汇款。
对于本发明实施例,步骤302之后还可以包括,客户端提取信息中包括的各个关键词,并根据信息中包括的各个关键词判断信息是否有可能为垃圾信息。若信息有可能为垃圾信息,则将信息暂时拦截。在本发明实施例中,客户端通过预先判断信息是否有可能为垃圾信息,并对有可能为垃圾信息的信息进行进一步更准确地判断,从而可以仅对有可能为垃圾信息的信息进行判断处理,进而可以降低信息的处理复杂度。
具体地,客户端可以首先从接收到的信息中提取关键词,然后获取这些关键词为垃圾信息的关键词对应的各个概率值,最后选取各个概率值中的最大概率值作为该信息为垃圾信息的概率值,并将该概率值与预设概率值进行比较,若该概率值大于或者等于预设概率值,则确定该信息有可能为垃圾信息。其中,预设概率值可以由服务器预先进行配置。例如,若预设概率值为0.2,客户端从接收到的信息中提取到两个关键词,这两个关键词为垃圾信息的关键词对应的概率值分别为0.15和0.3,则获取最大概率值0.3作为该信息为垃圾信息的概率值,并与预设概率值0.2进行比较,该最大概率值大于预设概率值,则确定该信息有可能为垃圾信息。
303、客户端根据信息中包括的各个关键词匹配信息对应的信息模型。
其中,信息模型中可以包括多个类别,每个类别中可以对应多个关键词。在本发明实施例中,信息模型可以由服务器预先进行配置并保存在数据库中。例如,某个与房地产相关的信息模型可以包括类别:地点、户型、房屋种类,地点类别对应的关键词可以为:北京、上海、广州等,户型类别对应的关键词可以为:平层户型、跃层户型、复式户型等,房屋种类对应的关键词可以为:产权房、商品房、经济适用房、集资房等。
对于本发明实施例,步骤303具体可以为,客户端首先根据提取的各个关键词,获取关键词对应的类别,然后将这些类别分别与数据库中保存的各个信息模型中的类别进行匹配,若某个信息模型中的各个类别包括该信息中提取的关键词对应的全部类别,则客户端获取该信息模型作为该信息对应的信息模型。
例如,数据库中保存的信息模型有:包括人名、银行名称、银行卡号的信息模型;包括地点、房屋种类、户型的信息模型;包括时间、购物网站、折扣、积分的信息模型等。客户端接收的信息为:倾情奉献北京五环内跃层户型,欲购从速。客户端从该信息中提取的关键词为:北京和跃层户型,这些关键词对应的类别分别为地点和户型,将这些类别与数据库中保存的各个信息模型中包括的类别进行匹配,在包括地点、房屋种类、户型的信息模型中,包括信息中提取的关键词对应的全部类别,则客户端获取该信息模型作为该信息的信息模型。
304、客户端获取信息对应的匹配结果。
对于本发明实施例,客户端通过根据提取的各个关键词填补信息对应的信息模型,能够获取对应的匹配结果。例如,若客户端提取的各个关键词分别为:国庆期间、淘宝网、五折优惠,客户端获取的信息模型为:包括时间、购物网站、折扣、积分的信息模型,则客户端获取的匹配结果为:时间信息为国庆期间、购物网站信息为淘宝网、折扣信息为五折优惠、积分信息为无。
305、客户端获取信息对应的匹配结果的垃圾程度值。
其中,信息对应的匹配结果的垃圾程度值可以由服务器预先进行计算,并保存在数据库中。
对于本发明实施例,客户端还可以通过获取信息对应的发送者,并根据信息对应的发送者获取信息对应的垃圾程度值。在本发明实施例中,客户端通过获取发送者对应的垃圾程度值,从而可以进一步提高垃圾信息的判断准确率。
其中,信息对应的发送者可以是信息对应的发送号码,也可以是信息对应的发送邮件地址等,本发明实施例不做限定。发送者对应的垃圾程度值可以为,该发送者发送的全部信息中垃圾信息所占的比例。
对于本发明实施例,各个发送者对应的垃圾程度值可以由服务器预先根据用户反馈进行获取,并保存在服务器中。例如,在某个发送者发送的1000条信息中,用户反馈为垃圾信息的信息有900条,则该发送者发送对应的垃圾程度值为0.9;在另一个发送者发送的2000条信息中,用户反馈为垃圾信息的信息有500条,则该发送者对应的垃圾程度值为0.25。
306、客户端提取信息中包括的各个由来关键词。
其中,信息中包括的各个由来关键词可以由服务器预先进行配置,并保存在数据库中。例如,由来关键词可以为:取暖、水电费、物业、意外保险、失业保险、晴天、降温等。
307、客户端根据信息中包括的各个由来关键词,获取信息的由来类型。
其中,各个由来关键词分别对应的由来类型可以由服务器预先进行配置,并保存在数据库中。例如,由来关键词取暖、水电费、物业对应的由来类型可以为物业公司,由来关键词意外保险、失业保险对应的由来类型可以为保险公司,由来关键词晴天、降温对应的由来类型可以为天气预报。
308、客户端根据信息的由来类型,获取信息的由来类型对应的接受程度值。
其中,各个不同的由来类型分别对应不同的接受程度值。各个由来类型对应的接受程度值可以由服务器预先根据用户反馈进行获取,并保存在服务器中。
对于本发明实施例,若客户端提取的各个由来关键词对应多个由来类型,则客户端获取各个由来类型对应的接受程度值中最大的接受程度值,作为信息的由来类型对应的接受程度值。
309、客户端提取信息中包括的各个喜好关键词。
其中,信息中包括的各个喜好关键词可以由服务器预先进行配置,并保存在数据库中。例如,由来关键词可以为:衣服鞋帽、家具、会员积分、双人游、户外、购房、二手房、观景别墅等。
310、客户端根据信息中包括的各个喜好关键词,获取信息的喜好类型。
其中,各个喜好关键词分别对应的喜好类型可以由服务器预先进行配置,并保存在数据库中。例如,喜好关键词衣服鞋帽、家具、会员积分对应的喜好类型可以为购物,喜好关键词双人游、户外对应的喜好类型可以为旅游,喜好关键词购房、二手房、观景别墅对应的由来类型可以为房地产。
311、客户端根据信息的喜好类型,获取信息的喜好类型对应的接受程度值。
其中,各个不同的喜好类型分别对应不同的接受程度值。各个喜好类型对应的接受程度值可以由服务器预先根据用户反馈进行获取,并保存在服务器中。
312、客户端根据公式γ=p-m·α-n·β计算信息为垃圾信息的概率值。
其中,γ为信息为垃圾信息的概率值,p为信息对应的垃圾程度值,m为信息的由来类型对应的接受程度值,α为信息的由来类型对应的计算权重值,n为信息的喜好类型对应的接受程度值,β为信息的喜好类型对应的计算权重值。
对于本发明实施例,各个由来类型对应的计算权重值及各个喜好类型对应的计算权重值可以由服务器预先根据用户反馈进行配置,并保存在数据库中。在本发明实施例中,客户端通过预先分别设置信息由来类性对应的计算权重值及喜好类性对应的计算权重值,从而可以根据用户需求对各个类性的重要程度进行区分,实现不同用户的个性化设置;同时,通过对该信息对应的垃圾程度值、该信息的由来及用户查阅信息的特点进行综合考虑,从而可以提高垃圾信息的判断准确率。
313、若信息为垃圾信息的概率值大于或者等于预设值,则客户端确定信息为垃圾信息。
对于本发明实施例,步骤313之后还可以包括,若信息为垃圾信息,则客户端过滤该垃圾信息。在本发明实施例中,客户端对垃圾信息进行过滤之后,可以向服务器进行反馈,以使得服务器能够实时地获取用户对包括各个关键词的信息的处理情况。
可选地,步骤310还可以为,客户端根据信息中包括的各个喜好关键词,获取信息的各个喜好类型。在本发明实施例中,对应的步骤313可以为,客户端根据公式γ=p-m·α-n1·β1-…ni·βi…-nq·βq计算信息为垃圾信息的概率值。其中,ni为信息的第i个喜好类型对应的接受程度值,βi为信息的第i个喜好类型对应的计算权重值,q为信息的喜好类型个数。
对于本发明实施例,客户端可以通过获取喜好关键词对应的多个喜好类型,并综合考虑多个喜好类型的接受程度值,从而可以进一步提高垃圾信息的判断准确率。
进一步地,作为图3所示方法的具体实现,本发明实施例提供了一种信息的处理装置,如图4所示,所述装置的实体可以为客户端,例如PC(Personal Computer,个人计算机)、手机、平板电脑等,所述装置包括:接收单元41、获取单元42、判断单元43。
接收单元41,用于接收信息。
获取单元42,用于获取接收单元41接收的信息对应的垃圾程度值,并获取信息对应的接受程度值。
判断单元43,用于根据获取单元42获取的信息对应的垃圾程度值及信息对应的接受程度值,判断信息是否为垃圾信息。
获取单元42包括:提取模块4201、匹配模块4202、获取模块4203。
提取模块4201,用于提取信息中包括的各个关键词。
匹配模块4202,用于根据提取模块4201提取的信息中包括的各个关键词匹配信息对应的信息模型。
获取模块4203,用于获取匹配模块4202匹配的信息对应的匹配结果。
获取模块4203,还用于获取匹配模块4202匹配的信息对应的匹配结果的垃圾程度值。
获取单元42,还用于获取接收单元41接收的信息对应的发送者。
获取单元42,还用于根据信息对应的发送者获取信息对应的垃圾程度值。
可选地,所述装置还可以包括:提取单元44。
提取单元44,用于提取接收单元41接收的信息中包括的各个由来关键词。
获取单元42,还用于根据提取单元44提取的信息中包括的各个由来关键词,获取信息的由来类型。
获取单元42,还用于根据信息的由来类型,获取信息的由来类型对应的接受程度值。
提取单元41,还用于提取接收单元41接收的信息中包括的各个喜好关键词。
获取单元42,还用于根据提取单元41提取的信息中包括的各个喜好关键词,获取信息的喜好类型。
获取单元42,还用于根据信息的喜好类型,获取信息的喜好类型对应的接受程度值。
判断单元43包括:计算模块4301、确定模块4302。
计算模块4301,用于根据公式γ=p-m·α-n·β计算信息为垃圾信息的概率值。
其中,γ为信息为垃圾信息的概率值,p为信息对应的垃圾程度值,m为信息的由来类型对应的接受程度值,α为信息的由来类型对应的计算权重值,n为信息的喜好类型对应的接受程度值,β为信息的喜好类型对应的计算权重值。
确定模块4302,用于当计算模块4301计算的信息为垃圾信息的概率值大于或者等于预设值时,确定信息为垃圾信息。
获取单元42,还用于根据提取单元41提取的信息中包括的各个喜好关键词,获取信息的各个喜好类型。
计算模块4301,还用于根据公式γ=p-m·α-n1·β1-…ni·βi…-nq·βq计算信息为垃圾信息的概率值。
其中,ni为信息的第i个喜好类型对应的接受程度值,βi为信息的第i个喜好类型对应的计算权重值,q为信息的喜好类型个数。
需要说明的是,本发明实施例中提供的信息的处理装置中各功能单元所对应的其他相应描述,可以参考图3中的对应描述,在此不再赘述。
本发明实施例提供的信息的处理方法及装置,客户端首先接收信息,然后获取信息对应的垃圾程度值及接受程度值,最后根据信息对应的垃圾程度值及接受程度值,判断信息是否为垃圾信息。与目前根据信息中的某些关键词直接判断该信息是否为垃圾信息相比,本发明实施例能够根据信息中的关键词对信息的由来及用户查阅信息的特点进行分析,从而可以判断信息是否为垃圾信息,进而可以提高垃圾信息的判断准确率。
本发明实施例提供的信息的处理装置可以实现上述提供的方法实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。本发明实施例提供的信息的处理方法及装置可以适用于判断信息是否为垃圾信息,但不仅限于此。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (14)
1.一种信息的处理方法,其特征在于,包括:
接收信息;
获取所述信息对应的垃圾程度值,并获取所述信息对应的接受程度值;所述垃圾程度值根据所述信息的各个关键词确定,所述接受程度值根据所述信息的由来关键词和喜好关键词确定;
根据所述信息对应的垃圾程度值及所述信息对应的接受程度值,判断所述信息是否为垃圾信息。
2.根据权利要求1所述的信息的处理方法,其特征在于,所述获取所述信息对应的垃圾程度值的步骤包括:
提取所述信息中包括的各个关键词;
根据所述信息中包括的各个关键词匹配所述信息对应的信息模型;
获取所述信息对应的匹配结果;
获取所述信息对应的匹配结果的垃圾程度值。
3.根据权利要求1所述的信息的处理方法,其特征在于,所述获取所述信息对应的垃圾程度值的步骤包括:
获取所述信息对应的发送者;
根据所述信息对应的发送者获取所述信息对应的垃圾程度值。
4.根据权利要求1所述的信息的处理方法,其特征在于,所述获取所述信息对应的接受程度值的步骤之前,还包括:
提取所述信息中包括的各个由来关键词;
根据所述信息中包括的各个由来关键词,获取所述信息的由来类型;
所述获取所述信息对应的接受程度值的步骤包括:
根据所述信息的由来类型,获取所述信息的由来类型对应的接受程度值。
5.根据权利要求1所述的信息的处理方法,其特征在于,所述获取所述信息对应的接受程度值的步骤之前,还包括:
提取所述信息中包括的各个喜好关键词;
根据所述信息中包括的各个喜好关键词,获取所述信息的喜好类型;
所述获取所述信息对应的接受程度值的步骤包括:
根据所述信息的喜好类型,获取所述信息的喜好类型对应的接受程度值。
6.根据权利要求4或5所述的信息的处理方法,其特征在于,所述根据所述信息对应的垃圾程度值及所述信息对应的接受程度值,判断所述信息是否为垃圾信息的步骤包括:
根据公式γ=p-m·α-n·β计算所述信息为垃圾信息的概率值,其中,γ为所述信息为垃圾信息的概率值,p为所述信息对应的垃圾程度值,m为信息的由来类型对应的接受程度值,α为所述信息的由来类型对应的计算权重值,n为信息的喜好类型对应的接受程度值,β为所述信息的喜好类型对应的计算权重值;
若所述信息为垃圾信息的概率值大于或者等于预设值,则确定所述信息为垃圾信息。
7.根据权利要求6所述的信息的处理方法,其特征在于,根据所述信息中包括的各个喜好关键词,获取所述信息的喜好类型的步骤包括:
根据所述信息中包括的各个喜好关键词,获取所述信息的各个喜好类型;
所述根据公式γ=p-m·α-n·β计算所述信息为垃圾信息的概率值的步骤包括:
根据公式γ=p-m·α-n1·β1-…ni·βi…-nq·βq计算所述信息为垃圾信息的概率值,其中,ni为所述信息的第i个喜好类型对应的接受程度值,βi为所述信息的第i个喜好类型对应的计算权重值,q为所述信息的喜好类型个数。
8.一种信息的处理装置,其特征在于,包括:
接收单元,用于接收信息;
获取单元,用于获取所述接收单元接收的所述信息对应的垃圾程度值,并获取所述信息对应的接受程度值;所述垃圾程度值根据所述信息的各个关键词确定,所述接受程度值根据所述信息的由来关键词和喜好关键词确定;
判断单元,用于根据所述获取单元获取的所述信息对应的垃圾程度值及所述信息对应的接受程度值,判断所述信息是否为垃圾信息。
9.根据权利要求8所述的信息的处理装置,其特征在于,所述获取单元包括:
提取模块,用于提取所述信息中包括的各个关键词;
匹配模块,用于根据所述提取模块提取的所述信息中包括的各个关键词匹配所述信息对应的信息模型;
获取模块,用于获取所述匹配模块匹配的所述信息对应的匹配结果;
所述获取模块,还用于获取所述匹配模块匹配的所述信息对应的匹配结果的垃圾程度值。
10.根据权利要求8所述的信息的处理装置,其特征在于,
所述获取单元,还用于获取所述接收单元接收的所述信息对应的发送者;
所述获取单元,还用于根据所述信息对应的发送者获取所述信息对应的垃圾程度值。
11.根据权利要求8所述的信息的处理装置,其特征在于,所述装置还包括:
提取单元,用于提取所述接收单元接收的所述信息中包括的各个由来关键词;
所述获取单元,还用于根据所述提取单元提取的所述信息中包括的各个由来关键词,获取所述信息的由来类型;
所述获取单元,还用于根据所述信息的由来类型,获取所述信息的由来类型对应的接受程度值。
12.根据权利要求8所述的信息的处理装置,其特征在于,
提取单元,还用于提取所述接收单元接收的所述信息中包括的各个喜好关键词;
所述获取单元,还用于根据所述提取单元提取的所述信息中包括的各个喜好关键词,获取所述信息的喜好类型;
所述获取单元,还用于根据所述信息的喜好类型,获取所述信息的喜好类型对应的接受程度值。
13.根据权利要求11或12所述的信息的处理装置,其特征在于,所述判断单元包括:
计算模块,用于根据公式γ=p-m·α-n·β计算所述信息为垃圾信息的概率值,其中,γ为所述信息为垃圾信息的概率值,p为所述信息对应的垃圾程度值,m为信息的由来类型对应的接受程度值,α为所述信息的由来类型对应的计算权重值,n为信息的喜好类型对应的接受程度值,β为所述信息的喜好类型对应的计算权重值;
确定模块,用于当所述计算模块计算的所述信息为垃圾信息的概率值大于或者等于预设值时,确定所述信息为垃圾信息。
14.根据权利要求13所述的信息的处理装置,其特征在于,
所述获取单元,还用于根据所述提取单元提取的所述信息中包括的各个喜好关键词,获取所述信息的各个喜好类型;
所述计算模块,还用于根据公式γ=p-m·α-n1·β1-…ni·βi…-nq·βq计算所述信息为垃圾信息的概率值,其中,ni为所述信息的第i个喜好类型对应的接受程度值,βi为所述信息的第i个喜好类型对应的计算权重值,q为所述信息的喜好类型个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310565741.XA CN104636381B (zh) | 2013-11-14 | 2013-11-14 | 信息的处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310565741.XA CN104636381B (zh) | 2013-11-14 | 2013-11-14 | 信息的处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104636381A CN104636381A (zh) | 2015-05-20 |
CN104636381B true CN104636381B (zh) | 2018-02-27 |
Family
ID=53215145
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310565741.XA Active CN104636381B (zh) | 2013-11-14 | 2013-11-14 | 信息的处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104636381B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491374B (zh) * | 2018-02-12 | 2022-05-27 | 郑长敬 | 基于房地产行业的词库构建方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101060421A (zh) * | 2006-04-19 | 2007-10-24 | 腾讯科技(深圳)有限公司 | 一种垃圾邮件处理系统及分检垃圾邮件的方法 |
CN102098638A (zh) * | 2010-12-15 | 2011-06-15 | 成都市华为赛门铁克科技有限公司 | 短信分类处理方法、装置和终端 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7523096B2 (en) * | 2003-12-03 | 2009-04-21 | Google Inc. | Methods and systems for personalized network searching |
-
2013
- 2013-11-14 CN CN201310565741.XA patent/CN104636381B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101060421A (zh) * | 2006-04-19 | 2007-10-24 | 腾讯科技(深圳)有限公司 | 一种垃圾邮件处理系统及分检垃圾邮件的方法 |
CN102098638A (zh) * | 2010-12-15 | 2011-06-15 | 成都市华为赛门铁克科技有限公司 | 短信分类处理方法、装置和终端 |
Also Published As
Publication number | Publication date |
---|---|
CN104636381A (zh) | 2015-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106384273B (zh) | 恶意刷单检测系统及方法 | |
US8538806B2 (en) | Systems and methods for establishing transactions utilizing a data store of billing information | |
CN107563757B (zh) | 数据风险识别的方法及装置 | |
US11232447B2 (en) | System and method for enhanced transaction authorization | |
CN103279868B (zh) | 一种自动识别欺诈订单的方法和装置 | |
WO2017143934A1 (zh) | 网络访问行为识别方法和装置、服务器和存储介质 | |
CN107230133B (zh) | 一种数据处理方法、设备和计算机存储介质 | |
CN106651603A (zh) | 基于位置服务的风险评估方法及装置 | |
CN107077551A (zh) | 基于传感器输入的可缩放验证过程选择 | |
CN107026831A (zh) | 一种身份识别方法和装置 | |
CN105956801A (zh) | 快递代收方法 | |
CN103942255A (zh) | 个性化信息推荐系统及其推荐方法 | |
CN109919607A (zh) | 基于离线乘车码的换乘优惠方法及装置和电子设备 | |
US20220391913A1 (en) | Techniques to improve fraud detection at financial terminals | |
CN109961309A (zh) | 业务推荐方法和系统 | |
CN107798534A (zh) | 一种信息记录方法及装置、终端和可读存储介质 | |
CN107741958A (zh) | 一种数据处理方法及系统 | |
CN102057376A (zh) | 用于进行分布式搜索的方法 | |
CN109598575B (zh) | 一种账单生成方法、装置、电子设备及介质 | |
CN108830106A (zh) | 一种隐私数据提供方法及装置 | |
CN105978722B (zh) | 用户属性挖掘方法及装置 | |
CN106330657A (zh) | 一种好友处理方法和装置 | |
CN104636381B (zh) | 信息的处理方法及装置 | |
CN111582873B (zh) | 评估交互事件的方法及装置、电子设备、存储介质 | |
CN103841532B (zh) | 一种短信过滤的方法以及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |