CN107729499A - 信息处理方法、介质、系统和电子设备 - Google Patents
信息处理方法、介质、系统和电子设备 Download PDFInfo
- Publication number
- CN107729499A CN107729499A CN201710985433.0A CN201710985433A CN107729499A CN 107729499 A CN107729499 A CN 107729499A CN 201710985433 A CN201710985433 A CN 201710985433A CN 107729499 A CN107729499 A CN 107729499A
- Authority
- CN
- China
- Prior art keywords
- information
- classification
- issue source
- present
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 47
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 41
- 230000003542 behavioural effect Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 17
- 210000003813 thumb Anatomy 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 8
- 238000011161 development Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000007812 deficiency Effects 0.000 description 4
- 239000004744 fabric Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
- G06F16/337—Profile generation, learning or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明的实施方式提供了一种信息处理方法。该信息处理方法包括,获取第一信息,其中,所述第一信息包括文本,所述文本的字符数量不大于阈值,获取与所述第一信息相关的第二信息,以及基于所述第一信息以及所述第二信息,确定所述第一信息所属的类目。通过借助第二信息辅助识别第一信息,本发明的方法能够更精确地分析出内容类目,便于与用户模型相匹配,完成精准的个性化内容推送。此外,本发明的实施方式提供了一种信息处理系统以及电子设备。
Description
技术领域
本发明的实施方式涉及互联网领域,更具体地,本发明的实施方式涉及一种信息处理方法、介质、系统和电子设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
在整个互联网领域,随着通信技术的发展,终端包含了越来越多的应用程序,推荐与用户兴趣点匹配的内容可以提高应用程序的用户体验。因此推荐系统越来越重要,例如短讯息的推荐。
现有的推荐系统,大多通过识别文本中的关键词来判断内容类目,用于将文本推送给与所判断的内容类目相匹配的用户。
发明内容
但是,出于短资讯文本字数较少的原因,能够分析抽取的关键词较少。
因此在现有技术中,文本分析抽取关键词的方法并不能完全满足需求,出现匹配精度不足或匹配错误的情况。这是非常令人烦恼的过程。
为此,非常需要一种改进的方法,以使分析出的内容类目与兴趣点更加精准,便于完成精准的个性化内容推送。
在本上下文中,本发明的实施方式期望提供一种在短文本字数不足以分析,通过借助其他相关内容辅助识别短文本,能够更精准地分析出内容类目,便于与用户模型相结合,完成精准的个性化内容推送的方法。
在本发明实施方式的第一方面中,提供了一种信息处理方法,包括,获取第一信息,其中,所述第一信息包括文本,所述文本的字符数量不大于阈值,获取与所述第一信息相关的第二信息,以及基于所述第一信息以及所述第二信息,确定所述第一信息所属的类目。
在本发明的一个实施例中,该所述获取与所述第一信息相关的第二信息包括,获取所述第一信息的发布源,以及根据所述发布源,获取所述第二信息。
在本发明的一个实施例中,该所述根据所述发布源,获取所述第二信息包括,获取所述发布源的属性信息作为第二信息,以及/或者获取所述发布源的历史发布信息作为第二信息。
在本发明的一个实施例中,该所述基于所述第一信息以及所述第二信息,确定所述第一信息所属的类目包括,根据所述发布源的属性信息和/或历史发布信息,确定所述发布源所属的第一类目,以及根据所述发布源所属的第一类目,确定所述第一信息所属的类目为第一类目。
在本发明的另一实施例中,该所述获取与所述第一信息相关的第二信息包括,获取与所述第一信息相关的评论信息作为第二信息。
在本发明的又一个实施例中,该方法包括,根据所述第一信息的类目,推荐所述第一信息。
在本发明的又一个实施例中,该所述根据所述第一信息的类目,推荐所述第一信息包括,获取与所述第一信息相关的行为信息,其中,所述行为信息包括点赞数量、分享数量或评论信息中的至少一种,以及基于所述第一信息的类目以及所述行为信息,推荐所述第一信息。
在本发明实施方式的第二方面中,提供了一种介质,其上存储有可执行指令,所述指令被处理单元执行时使所述处理单元执行上述任一项所述的方法。
在本发明实施方式的第三方面中,提供了一种信息处理系统,包括,第一获取模块,用于获取第一信息,其中,所述第一信息包括文本,所述文本的字符数量不大于阈值,第二获取模块,用于获取与所述第一信息相关的第二信息,以及确定模块,用于基于所述第一信息以及所述第二信息,确定所述第一信息所属的类目。
在本发明的一个实施例中,所述第二获取模块包括,第一获取子模块,用于获取所述第一信息的发布源,以及第二获取子模块,用于根据所述发布源,获取所述第二信息。
在本发明的一个实施例中,所述第二获取子模块包括,第一获取子单元,用于获取所述发布源的属性信息作为第二信息,以及/或者第二获取子单元,用于获取所述发布源的历史发布信息作为第二信息。
在本发明的一个实施例中,所述确定模块包括,第一确定子模块,用于根据所述发布源的属性信息和/或历史发布信息,确定所述发布源所属的第一类目,以及第二确定子模块,用于根据所述发布源所属的第一类目,确定所述第一信息所属的类目为第一类目。
在本发明的另一个实施例中,所述第二获取模块包括,第三获取子模块,用于获取与所述第一信息相关的评论信息作为第二信息。
在本发明的又一个实施例中,所述的系统,还包括,推荐模块,用于根据所述第一信息的类目,推荐所述第一信息。
在本发明的又一个实施例中,所述推荐模块包括,第四获取子模块,用于获取与所述第一信息相关的行为信息,其中,所述行为信息包括点赞数量、分享数量或评论信息中的至少一种,以及推荐子模块,用于基于所述第一信息的类目以及所述行为信息,推荐所述第一信息。
在本发明实施方式的第四方面中,提供了一种电子设备,包括,处理单元,以及存储单元,其上存储有可执行指令,所述指令被所述处理单元执行时使所述处理单元执行如上所述的方法。
根据本发明实施方式的信息处理方法、系统以及电子设备,可以更精准地分析出内容类目,便于与用户模型相匹配,完成精准的个性化内容推送,为用户带来了更好的体验。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示意性地示出了根据本发明实施方式的信息处理方法可以在其中实现的环境;
图2示意性地示出了根据本发明示例性实施例的信息处理方法的流程图;
图3示意性地示出了根据本发明示例性实施例的所述获取与所述第一信息相关的第二信息的流程图;
图4示意性地示出了根据本发明另一示例性实施例的信息处理方法的流程图;
图5示意性地示出了根据本发明又一示例性实施例的信息处理方法的流程图;
图6示意性地示出了根据本发明又一示例性实施例的信息处理方法的流程图;
图7示意性地示出了根据本发明示例性实施例的所述根据所述第一信息的类目,推荐所述第一信息的流程图;
图8示意性地示出了根据本发明示例性实施例的计算机可读存储介质的示意图;
图9示意性地示出了根据本发明示例性实施例的信息处理系统的框图;
图10示意性地示出了根据本发明示例性实施例的第二获取模块的框图;
图11示意性地示出了根据本发明另一示例性实施例的信息处理系统的框图;
图12示意性地示出了根据本发明又一示例性实施例的信息处理系统的框图;
图13示意性地示出了根据本发明又一示例性实施例的信息处理系统的框图;
图14示意性地示出了根据本发明示例性实施例的推荐模块的框图;以及
图15示意性地示出了根据本发明示例性实施例的电子设备的方框图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种信息处理的方法、介质、系统和电子设备。
此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
发明概述
本发明人发现,在一些情况下,例如将文本字数少于250字的短资讯推送给感兴趣用户,现有的推送方法会出现因对短资讯的内容分析不充分,判断的短资讯的内容类目不精确、从而无法与用户匹配或匹配错误的情况。为了解决这一问题,本发明示例性实施例提供了一种信息处理方法,通过寻求相关内容辅助内容建模,包括短资讯的发布源属性、发布源的历史发布信息以及行为信息,完善内容建模,从而在短文本字数不足、关键词无法精准提炼的情况下,能够更精准地分析出内容类目,便于与用户模型相匹配,完成精准的个性化内容推送。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
应用场景总览
首先参考图1,图1示意性示出了根据本公开实施例的可以应用信息处理方法的环境100。
如图1所示,根据该实施例的环境100可以包括终端设备101、102、103、网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种客户端应用,例如新闻资讯类应用、购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持应用浏览和操作的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的信息处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的信息处理系统一般可以设置于服务器105中。本公开实施例所提供的信息处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的信息处理系统也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
示例性方法
下面结合图1的环境,参考图2来描述根据本发明示例性实施方式的信息处理的方法。需要注意的是,上述环境仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
图2示意性地示出了根据本发明示例性实施例的信息处理方法的流程图。
如图2所示,该方法包括操作S210~S230。
在操作S210,获取第一信息,其中,所述第一信息包括文本,所述文本的字符数量不大于阈值。
在操作S220,获取与所述第一信息相关的第二信息。
在操作S230,基于所述第一信息以及所述第二信息,确定所述第一信息所属的类目。
该方法在短文本字数不足分析、关键词无法精准提炼的情况下,通过借助其他相关内容辅助识别短文本,能够更精准地分析出内容类目,便于与用户模型相匹配,完成精准的个性化内容推送。
根据本发明示例性实施例,获取第一信息,例如,图1所示例的环境中的服务器105获取了第一信息,所述第一信息包括文本。例如获取的第一信息为一段文本“科技金融超市落地中关村生命园,其将可为金融机构提供产业发展方面的专业分析”,又例如,获取的第一信息为一段文本和一图片。所述获取的第一信息的文本的字符数量不大于阈值,例如阈值设为250字符,则获取的第一信息的文本的字符数量低于250。
根据本发明示例性实施例,获取与所述第一信息相关的第二信息。所述相关的第二信息例如,包括第一信息的发布源的属性信息、发布时间、编辑人、发布源的历史发布信息等。
根据本发明示例性实施例,基于所述第一信息以及所述第二信息,确定所述第一信息所属的类目。所述第一信息所属的类目,例如所属领域,例如,经济类目、文学类目、娱乐类目等。该类目可以是不同层次的类目,例如可以是经济类目下的金融类目、国际贸易类目或产业经济类目等。例如上述情景中,获取的第一信息为一段文本“科技金融超市落地中关村生命园,其将可为金融机构提供产业发展方面的专业分析”,并且获取了与第一信息相关的第二信息,例如发布源的账号简介,确定该第一信息属于经济类目。又例如,获取的第一信息为一段文本“秋风起兮白云飞,蓝天下的方泽坛”,通过获取的第一信息并不能确定该文本所属的类目,获取第一信息相关的第二信息,例如发布源的账号简介为北京美景,根据第一信息与第二信息确定第一信息所属类目为风景旅游类目。
图3示意性地示出了根据本发明示例性实施例的所述获取与所述第一信息相关的第二信息的流程图。
如图3所示,该方法包括操作S310和S320。
在操作S310,获取所述第一信息的发布源。
在操作S320,根据所述发布源,获取所述第二信息。
该方法通过获取发布源的相关信息,扩大了对文本的分析范围,从而能够对文本多方面的分析,至少部分地减轻了短文本信息较少,分析不足导致的推送不精确的弊端。
例如,对于上述操作S210和操作S230中的情景,获取所述第一信息的发布源,例如上述文本是由账号名为“金融社会”的账号发布的信息,因此获取所述第一信息的发布源为账号“金融社会”。
根据本发明示例性实施例,在操作S320,根据所述发布源,即,该“金融社会”账号,获取所述第二信息,所述第二信息例如可以是发布源的账号名称、简介、领域分类、主管单位、读者对象等。例如,在上述情景中,根据发布源获取所述第二信息为“金融社会”的简介,又例如为“金融社会”的关注者。
根据本发明示例性实施例,所述根据所述发布源,获取所述第二信息包括,获取所述发布源的属性信息作为第二信息,以及/或者获取所述发布源的历史发布信息作为第二信息。
根据本发明示例性实施例,获取所述发布源的属性信息作为第二信息,所述属性信息包括,发布源的简介、所属领域、主管单位等能够对发布源描述的信息。
根据本发明示例性实施例,获取所述发布源的历史发布信息作为第二信息。例如,在上述情景中,获取该“金融社会”账号的历史发布信息。
该方法通过获取发布源的属性信息以及/或者发布源的历史发布信息作为第二信息,辅助确定第一信息例如文本的类目,提高了对文本的类目的判断精确度。
图4示意性地示出了根据本发明另一示例性实施例的信息处理方法的流程图。
如图4所示,该方法包括操作S210、S220、S410以及S420。其中,操作S210、S220与前述实施例类似,此处不再赘述。
在操作S410,根据所述发布源的属性信息和/或历史发布信息,确定所述发布源所属的第一类目。
在操作S420,根据所述发布源所属的第一类目,确定所述第一信息所属的类目为第一类目。
该方法能够更加精确的定位第一信息涉及的领域,针对性地推送给匹配用户。
根据本发明示例性实施例,在操作S410,根据所述发布源的属性信息和/或历史发布信息,确定所述发布源所属的第一类目。所述确定所述发布源所属的第一类目,可以是确定发布源所属的领域。例如,在上述场景中,根据发布源“金融社会”的第二信息,例如“金融社会”的属性信息简介为“关注社会需求,把握社会财富”,确定所述发布源所属领域为经济类。又例如,发布源“金融社会”的第二信息包括历史发布信息,通过分析历史发布信息,确定发布源“金融社会”的所属的领域为经济类。从而确定所述发布源“金融社会”所属的第一类目为经济类。
根据本发明示例性实施例,在操作S420,根据所述发布源所属的第一类目,确定所述第一信息所属的类目为第一类目。例如,在上述情景中,通过所述发布源所属的经济类目,确定所述第一信息“科技金融超市落地中关村生命园,其将可为金融机构提供产业发展方面的专业分析”为经济类目。
图5示意性地示出了根据本发明又一示例性实施例的信息处理方法的流程图。
如图5所示,该方法包括操作S210、S510和S230。其中,操作S210、S230与前述实施例类似,此处不再赘述。在操作S510,获取与所述第一信息相关的评论信息作为第二信息。
该方法能够通过用户行为的反馈,修正对第一信息所属类目的判断,便于推荐兴趣点匹配的用户。
根据本发明示例性实施例,获取与所述第一信息相关的评论信息作为第二信息,其中,所述与所述第一信息相关的评论信息是指用户在阅读该信息后对该信息做出的针对性地评论的内容,例如获取的第一信息为一段文本“秋风起兮白云飞,蓝天下的方泽坛”,针对该第一信息,用户的评论内容大多集中在景色美、旅游胜地等与旅游相关的词语,根据获取与第一信息相关的评论信息作为第二信息,上述情景中的景色美、旅游胜地等评论内容,可以确定第一信息的类目为风景旅游类目。
图6示意性地示出了根据本发明又一示例性实施例的信息处理方法的流程图。
如图6所示,该方法包括S210、S220、S230和S610。其中,操作S210、S220和S230与前述实施例类似,此处不再赘述。
在操作S610,根据所述第一信息的类目,推荐所述第一信息。
根据本发明示例性实施例,根据所述第一信息的类目,推荐给与此第一信息类目相匹配的用户,能够实现个性化内容的推荐。
图7示意性地示出了根据本发明又一示例性实施例的所述根据所述第一信息的类目,推荐所述第一信息的流程图。
如图7所示,该方法包括S611和S612。
在操作S611,获取与所述第一信息相关的行为信息,其中,所述行为信息包括点赞数量、分享数量或评论信息中的至少一种。
在操作S612,基于所述第一信息的类目以及所述行为信息,推荐所述第一信息。
该方法能够根据用户反馈,针对性地推荐用户感兴趣的内容。
根据本发明示例性实施例,获取与所述第一信息相关的行为信息,其中,所述行为信息包括点赞数量、分享数量或评论信息中的至少一种。例如,在上述情景中,获取文本“科技金融超市落地中关村生命园,其将可为金融机构提供产业发展方面的专业分析。”的点赞数量为10000次。
根据本发明示例性实施例,基于所述第一信息的类目以及所述行为信息,在上述情景中,基于产业发展类目以及点赞数量,推荐所述第一信息。例如,基于产业发展类目推荐给与此类目相匹配的用户,并根据点赞数量较高,将此第一信息首先推荐给匹配用户。
示例性介质
在介绍了本发明示例性实施方式的方法之后,接下来,参考图8对本发明示例性实施方式的一种计算机可读存储介质进行说明。本发明示例性实施方式提供了一种计算机可读存储介质,其上存储有可执行指令,所述指令被处理单元执行时使所述处理单元执行上文所述的方法。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算设备上运行时,所述程序代码用于使所述计算设备执行本说明书上述“示例性方法”部分中描述的方法中的步骤,例如,所述计算设备可以执行如图2中所示的步骤S210:获取第一信息,其中,所述第一信息包括文本,所述文本的字符数量不大于阈值;步骤S220:获取与所述第一信息相关的第二信息;步骤S230:基于所述第一信息以及所述第二信息,确定所述第一信息所属的类目。
所述程序产品可以采用一个或多个可读介质的任意组合的形式。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
如图8所示,描述了根据本发明的实施方式的用于信息处理的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)的形式,并包括程序代码,并可以在计算设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆,RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言——诸如Java,C++等,还包括常规的过程式程序设计语言——诸如“C”,语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)一连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
示例性系统
在介绍了本发明示例性实施方式的介质之后,接下来,参考图9对本发明示例性实施方式的信息处理系统进行说明。
图9示意性地示出了根据本发明示例性实施例的信息处理系统900的框图。
如图9所示,信息处理系统900包括第一获取模块910、第二获取模块920以及确定模块930。
第一获取模块910,例如执行上文参考图2描述的操作S210,用于获取第一信息,其中,所述第一信息包括文本,所述文本的字符数量不大于阈值。
第二获取模块920,例如执行上文参考图2描述的操作S220,用于获取与所述第一信息相关的第二信息。
确定模块930,例如执行上文参考图2描述的操作S230,用于基于所述第一信息以及所述第二信息,确定所述第一信息所属的类目。
图10示意性地示出了根据本发明示例性实施例的第二获取模块920的框图。
如图10所示,第二获取模块920包括第一获取子模块1010和第二获取子模块1020。
第一获取子模块1010,例如执行上文参考图3描述的操作S310,用于获取所述第一信息的发布源。
第二获取子模块1020,例如执行上文参考图3描述的操作S320,用于根据所述发布源,获取所述第二信息。
根据本发明示例性实施例,第二获取子模块1020包括,第一获取子单元,用于获取所述发布源的属性信息作为第二信息,以及/或者第二获取子单元,用于获取所述发布源的历史发布信息作为第二信息。
图11示意性地示出了根据本发明另一示例性实施例的信息处理系统1100的框图。
如图11所示,信息处理系统1100包括第一获取模块910、第二获取子模块920、第一确定子模块1110和第二确定子模块1120。
第一确定子模块1110,例如执行上文参考图4描述的操作S410,用于根据所述发布源的属性信息和/或历史发布信息,确定所述发布源所属的第一类目。
第二确定子模块1120,例如执行上文参考图4描述的操作S420,用于根据所述发布源所属的第一类目,确定所述第一信息所属的类目为第一类目。
图12示意性地示出了根据本发明又一示例性实施例的信息处理系统1200的框图。
如图12所示,信息处理系统1200包括第一获取模块910、第三获取子模块1210和确定模块930。其中,第一获取模块910、确定模块930与前述实施例类似,此处不再赘述。
第三获取子模块1210,例如执行上文参考图5描述的操作S510,用于获取与所述第一信息相关的评论信息作为第二信息。
图13示意性地示出了根据本发明又一示例性实施例的信息处理系统1300的框图。
如图13所示,信息处理系统1300包括第一获取模块910、第二获取模块920、确定模块930和推荐模块1310。其中,第一获取模块910、第二获取模块920、确定模块930与前述实施例类似,此处不再赘述。
推荐模块1310,例如执行上文参考图6描述的操作S610,用于根据所述第一信息的类目,推荐所述第一信息。
图14示意性地示出了根据本发明示例性实施例的推荐模块1310的框图。
如图14所示,推荐模块1310包括第四获取子模块1410和推荐子模块1420。
第四获取子模块1410,例如执行上文参考图7描述的操作S611,用于获取与所述第一信息相关的行为信息,其中,所述行为信息包括点赞数量、分享数量或评论信息中的至少一种。
推荐子模块1420,例如执行上文参考图7描述的操作S612,用于基于所述第一信息的类目以及所述行为信息,推荐所述第一信息。
示例性电子设备
在介绍了本发明示例性实施方式的方法、介质和系统之后,接下来,参考图15对本发明示例性实施方式信息处理的电子设备进行说明。
本发明实施例还提供了一种信息处理的电子设备。所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本发明的信息处理的电子设备可以至少包括至少一个处理单元、以及至少一个存储单元。其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的信息处理方法中的步骤。例如,所述处理单元可以执行如图2中所示的步骤S210:获取第一信息,其中,所述第一信息包括文本,所述文本的字符数量不大于阈值;步骤S220:获取与所述第一信息相关的第二信息;步骤S230:基于所述第一信息以及所述第二信息,确定所述第一信息所属的类目。
下面参照图15来描述根据本发明的这种实施方式的用于信息处理的电子设备1500。如图15所示的电子设备1500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图15所示,电子设备1500以通用计算设备的形式表现。电子设备1500的组件可以包括但不限于:上述至少一个处理单元1510、上述至少一个存储单元1520、连接不同系统组件(包括存储单元1520和处理单元1510)的总线1530。
总线1530包括数据总线、地址总线和控制总线。
存储单元1520可以包括易失性存储器,例如随机存取存储器(RAM)1521和/或高速缓存存储器1522,还可以进一步包括只读存储器(ROM)1523。
存储单元1520还可以包括具有一组(至少一个)程序模块1524的程序/实用工具1525,这样的程序模块1524包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算设备1500也可以与一个或多个外部设备1540(例如键盘、指向设备、蓝牙设备等)通信,这种通信可以通过输入/输出(I/0)接口1550进行。并且,计算设备1500还可以通过网络适配器1560与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1560通过总线1530与计算设备1500的其它模块通信。应当明白,尽管图中未示出,可以结合计算设备1500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了信息处理系统的若干单元/模块或子单元/子模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
Claims (10)
1.一种信息处理方法,包括:
获取第一信息,其中,所述第一信息包括文本,所述文本的字符数量不大于阈值;
获取与所述第一信息相关的第二信息;以及
基于所述第一信息以及所述第二信息,确定所述第一信息所属的类目。
2.根据权利要求1所述的方法,其中,所述获取与所述第一信息相关的第二信息包括:
获取所述第一信息的发布源;以及
根据所述发布源,获取所述第二信息。
3.根据权利要求2所述的方法,其中,所述根据所述发布源,获取所述第二信息包括:
获取所述发布源的属性信息作为第二信息;以及/或者
获取所述发布源的历史发布信息作为第二信息。
4.根据权利要求3所述的方法,其中,所述基于所述第一信息以及所述第二信息,确定所述第一信息所属的类目包括:
根据所述发布源的属性信息和/或历史发布信息,确定所述发布源所属的第一类目;以及
根据所述发布源所属的第一类目,确定所述第一信息所属的类目为第一类目。
5.根据权利要求1所述的方法,其中,所述获取与所述第一信息相关的第二信息包括:
获取与所述第一信息相关的评论信息作为第二信息。
6.根据权利要求1所述的方法,还包括:
根据所述第一信息的类目,推荐所述第一信息。
7.根据权利要求6所述的方法,其中,所述根据所述第一信息的类目,推荐所述第一信息包括:
获取与所述第一信息相关的行为信息,其中,所述行为信息包括点赞数量、分享数量或评论信息中的至少一种;以及
基于所述第一信息的类目以及所述行为信息,推荐所述第一信息。
8.一种计算机可读存储介质,其上存储有可执行指令,所述指令被处理单元执行时使所述处理单元执行根据权利要求1-7中任一项所述的方法。
9.一种信息处理系统,包括:
第一获取模块,用于获取第一信息,其中,所述第一信息包括文本,所述文本的字符数量不大于阈值;
第二获取模块,用于获取与所述第一信息相关的第二信息;以及
确定模块,用于基于所述第一信息以及所述第二信息,确定所述第一信息所属的类目。
10.一种电子设备,包括:
处理单元;以及
存储单元,其上存储有可执行指令,所述指令被所述处理单元执行时使所述处理单元执行根据权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710985433.0A CN107729499A (zh) | 2017-10-20 | 2017-10-20 | 信息处理方法、介质、系统和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710985433.0A CN107729499A (zh) | 2017-10-20 | 2017-10-20 | 信息处理方法、介质、系统和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107729499A true CN107729499A (zh) | 2018-02-23 |
Family
ID=61213006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710985433.0A Pending CN107729499A (zh) | 2017-10-20 | 2017-10-20 | 信息处理方法、介质、系统和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107729499A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679230A (zh) * | 2017-10-23 | 2018-02-09 | 网易传媒科技(北京)有限公司 | 信息处理方法及其系统、介质和计算设备 |
CN111046252A (zh) * | 2019-11-20 | 2020-04-21 | 北京字节跳动网络技术有限公司 | 一种信息处理的方法、装置、介质、电子设备和系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073707A (zh) * | 2010-12-22 | 2011-05-25 | 百度在线网络技术(北京)有限公司 | 用于实时识别短文本类别信息的方法、装置及计算机设备 |
CN102567290A (zh) * | 2010-12-30 | 2012-07-11 | 百度在线网络技术(北京)有限公司 | 用于对待处理的短文本信息进行扩展的方法、装置和设备 |
CN103914551A (zh) * | 2014-04-13 | 2014-07-09 | 北京工业大学 | 一种微博语义信息扩充和特征选取方法 |
-
2017
- 2017-10-20 CN CN201710985433.0A patent/CN107729499A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073707A (zh) * | 2010-12-22 | 2011-05-25 | 百度在线网络技术(北京)有限公司 | 用于实时识别短文本类别信息的方法、装置及计算机设备 |
CN102567290A (zh) * | 2010-12-30 | 2012-07-11 | 百度在线网络技术(北京)有限公司 | 用于对待处理的短文本信息进行扩展的方法、装置和设备 |
CN103914551A (zh) * | 2014-04-13 | 2014-07-09 | 北京工业大学 | 一种微博语义信息扩充和特征选取方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679230A (zh) * | 2017-10-23 | 2018-02-09 | 网易传媒科技(北京)有限公司 | 信息处理方法及其系统、介质和计算设备 |
CN111046252A (zh) * | 2019-11-20 | 2020-04-21 | 北京字节跳动网络技术有限公司 | 一种信息处理的方法、装置、介质、电子设备和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bonzanini | Mastering social media mining with Python | |
CN107480162B (zh) | 基于人工智能的搜索方法、装置、设备及计算机可读存储介质 | |
US20190220490A1 (en) | Combining website characteristics in an automatically generated website | |
CN108140018A (zh) | 创作用于基于文本的文档的视觉表示 | |
CN104462056B (zh) | 用于呈现基于知识的信息的方法和信息操纵系统 | |
CN111680221A (zh) | 信息推荐方法、装置、设备及计算机可读存储介质 | |
CN109308254B (zh) | 一种测试方法、装置及测试设备 | |
CN108509569A (zh) | 企业画像的生成方法、装置、电子设备以及存储介质 | |
KR20150036106A (ko) | 데이터를 소비 가능한 컨텐츠로 변환 시에 변형을 생성하는 방법 | |
CN108121814B (zh) | 搜索结果排序模型生成方法和装置 | |
CN115982376B (zh) | 基于文本、多模数据和知识训练模型的方法和装置 | |
WO2024099457A1 (zh) | 一种信息推荐方法、装置、存储介质及电子设备 | |
Cirillo | Rstudio for R statistical computing cookbook | |
CN117389890A (zh) | 测试用例的生成方法、装置、电子设备和存储介质 | |
CN107404426A (zh) | 即时通讯工具中的批量添加好友的方法、装置及电子设备 | |
CN111444335B (zh) | 中心词的提取方法及装置 | |
Todi et al. | Conversations with guis | |
US20230315990A1 (en) | Text detection method and apparatus, electronic device, and storage medium | |
CN107729499A (zh) | 信息处理方法、介质、系统和电子设备 | |
CN107735785A (zh) | 自动信息检索 | |
KR20200080737A (ko) | 다중 접속 통합 콘텐츠 서비스 방법 및 시스템 | |
CN110489563B (zh) | 图结构的表示方法、装置、设备及计算机可读存储介质 | |
CN117667979A (zh) | 基于大语言模型的数据挖掘方法、装置、设备及介质 | |
CN110362688B (zh) | 试题标注方法、装置、设备及计算机可读存储介质 | |
KR20210084641A (ko) | 정보를 송신하는 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180223 |