CN110019885A - 一种表情数据推荐方法及装置 - Google Patents

一种表情数据推荐方法及装置 Download PDF

Info

Publication number
CN110019885A
CN110019885A CN201710648056.1A CN201710648056A CN110019885A CN 110019885 A CN110019885 A CN 110019885A CN 201710648056 A CN201710648056 A CN 201710648056A CN 110019885 A CN110019885 A CN 110019885A
Authority
CN
China
Prior art keywords
expression
input
user
data
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710648056.1A
Other languages
English (en)
Other versions
CN110019885B (zh
Inventor
刘鑫
张扬
涂畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201710648056.1A priority Critical patent/CN110019885B/zh
Publication of CN110019885A publication Critical patent/CN110019885A/zh
Application granted granted Critical
Publication of CN110019885B publication Critical patent/CN110019885B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种表情数据推荐方法和装置,所述方法包括:根据用户历史输入数据确定表情输入关键词,所述表情输入关键词为与表情数据具有强关联关系的词语;接收用户输入信息,判断所述用户输入信息是否与预先存储的表情输入关键词匹配;若判断所述用户输入信息与预先存储的表情输入关键词匹配,获取与所述表情输入关键词关联的表情数据;显示所述表情数据。本发明实施例可以判断用户具有表情输入意图时,获取并向用户推荐对应的表情数据,无需用户主动搜索表情数据,减少了用户操作,提高了用户输入表情数据的效率。

Description

一种表情数据推荐方法及装置
技术领域
本发明实施例涉及计算机技术领域,具体涉及一种表情数据推荐方法及装置。
背景技术
随着信息技术的发展,智能终端具有强大的信息处理功能,用户可以使用智能终端收发电子邮件、收发短信或者使用即时通信软件进行通讯等。用户在通讯过程中,常常会需要输入表情图片来表达自己的情感。现有技术中,用户可以预先下载表情图片并保存在智能终端中。当用户需要输入表情图片时,可以查找已下载的表情图片并选择要发送的表情图片实现表情图片的输入。随着所保存的表情图片数量的增长,用户查找图片的时间成本增大、查找效率降低。为了提高用户的查找效率,现有技术提供了一种搜索表情图片的方法,用户可以输入搜索词以搜索匹配的表情图片。这种方式一定程度上提高了用户查找图片的效率,但仍需要用户执行搜索请求的触发、搜索词的输入等繁琐操作,才能够为用户展示表情图片,存在操作繁琐、效率低的缺陷。
发明内容
本发明实施例提供了一种表情数据推荐方法及装置,可以在根据用户输入判断用户具有表情输入意图时,获取并向用户推荐对应的表情数据,无需用户主动搜索表情数据,减少了用户操作,提高了用户输入表情数据的效率。
为此,本发明实施例提供如下技术方案:
第一方面,本发明实施例提供了一种表情数据推荐方法,包括:根据用户历史输入数据确定表情输入关键词,所述表情输入关键词为与表情数据具有强关联关系的词语;接收用户输入信息,判断所述用户输入信息是否与所述表情输入关键词匹配;若判断所述用户输入信息与所述表情输入关键词匹配,获取与所述表情输入关键词关联的表情数据。
第二方面,本发明实施例提供了一种表情数据推荐装置,包括:确定单元,用于根据用户历史输入数据确定表情输入关键词,所述表情输入关键词为与表情数据具有强关联关系的词语;第一判断单元,用于接收用户输入信息,判断所述用户输入信息是否与所述表情输入关键词匹配;获取单元,用于若判断所述用户输入信息与所述表情输入关键词匹配,获取与所述表情输入关键词关联的表情数据。
第三方面,本发明实施例提供了一种用于表情数据推荐的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:根据用户历史输入数据确定表情输入关键词,所述表情输入关键词为与表情数据具有强关联关系的词语;接收用户输入信息,判断所述用户输入信息是否与所述表情输入关键词匹配;若判断所述用户输入信息与所述表情输入关键词匹配,获取与所述表情输入关键词关联的表情数据。
第四方面,本发明实施例提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如第一方面所示的表情数据推荐方法。
本发明实施例提供的表情数据推荐方法及装置,可以根据用户历史输入数据确定与表情数据关联程度高的表情输入关键词,在判断所述用户输入信息与所述表情输入关键词匹配时,获取并显示与所述表情输入关键词关联的表情数据,为用户进行表情数据推荐。本发明实施例提供的方法通过上述方式在用户输入信息与所述表情输入关键词匹配时,可以自动、智能地识别出用户具有表情输入的意图,并向用户推荐显示符合其输入意图的表情数据,无需用户进行主动搜索,即可以实现表情数据的展示、输入,减少了用户操作,提高了输入效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的表情数据推荐方法流程图;
图2为本发明另一实施例提供的表情数据推荐方法流程图;
图3为本发明一实施例提供的表情数据推荐装置示意图;
图4是根据一示例性实施例示出的一种用于表情数据推荐装置的框图;
图5是根据一示例性实施例示出的服务器的框图。
具体实施方式
本发明实施例提供了一种表情推荐方法及装置,可以根据用户输入判断用户具有表情输入意图时,获取并向用户推荐对应的表情数据,无需用户主动搜索表情数据,减少了用户操作,提高了用户输入表情数据的效率。
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
下面将结合附图1至附图2对本发明示例性实施例示出的表情数据推荐方法进行介绍。
参见图1,为本发明一实施例提供的表情数据推荐方法流程图。如图1所示,可以包括:
S101,根据用户历史输入数据确定表情输入关键词,所述表情输入关键词为与表情数据具有强关联关系的词语。
具体实现时,为了识别用户是否具有表情输入意图,可以通过用户历史输入数据确定与表情数据具有强关联关系的表情输入关键词,便于在判断用户输入信息与所述表情输入关键词匹配时,确定用户具有表情输入意图,进而为用户推荐表情数据。其中,表情数据可以包括不限于表情图片数据、表情动画数据、emoji表情数据、语音表情数据、文本表情数据等。其中,关联关系一般指一个对象和另一个对象具有联系。强关联关系一般指两个对象之间具有紧密的关联。在本发明实施例中,可以通过计算两个对象之间的关联程度值来确定两个对象间是否具有强关联关系,例如关联程度值符合预设条件的两个对象之间具有强关联关系。
需要说明的是,所述用户历史输入数据可以是一位用户的数据,也可以是基于大数据的、全网用户的数据,也可以是基于特定人群收集得到的数据。若是基于特定人群收集得到的数据,例如可以是针对特定职业、特定性别、特定年龄层等不同维度的人群收集得到的数据。所述用户历史输入数据可以是用户历史文本输入数据,也可以是用户历史语音输入数据,在此不进行限定。
在一些实施方式中,所述根据用户历史输入数据确定表情输入关键词包括:根据用户历史输入数据计算用户输入与表情数据的关联程度值;将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词。根据计算关联程度值方式的不同,本发明实施例具有不同的实现方式。其中,预设条件可以是关联程度值大于设定阈值、关联程度值符合设定的阈值区间或者关联程度值小于另一设定阈值等,在此不进行限定。
在一种可能的实现方式中,所述根据用户历史输入数据计算用户输入与表情数据的关联程度值包括:获取用户历史搜索数据,根据用户历史搜索数据确定搜索关键词,计算与所述搜索关键词对应的表情数据点击率作为用户输入与表情数据的关联程度值。需要说明的是,表情数据点击率可以从一定程度上反映图片与关键词的关联程度。
具体地,表情数据点击率通过以下方式确定:
(1)确定搜索关键词的搜索次数以及所述搜索关键词对应的表情数据的点击次数,将所述表情数据的点击次数与所述搜索次数的比值作为表情数据点击率。举例说明,可以获取用户执行表情数据搜索的历史搜索数据,确定用户输入的搜索关键词以及对搜索结果的反馈,例如用户是否点击了搜索结果中的表情数据。之后,计算每个搜索关键词的搜索次数、用户点击对应的表情数据的点击次数,将搜索次数与点击次数的比值作为表情数据的点击率。
(2)确定搜索关键词的搜索人数以及所述搜索关键词对应的表情数据的点击人数,将所述表情数据的点击人数与所述搜索人数的比值作为表情数据点击率。举例说明,可以获取用户执行表情数据搜索的历史搜索数据,确定用户输入的搜索关键词以及对搜索结果的反馈,例如用户是否点击了搜索结果中的表情数据。之后,计算每个搜索关键词的搜索人数、点击对应的表情数据的点击人数,将搜索人数与点击人数的比值作为表情数据的点击率。其中,每个用户只记为1人,排除了某个用户多次搜索、点击同一关键词对应的表情对整个结果的影响。
其中,所述将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词包括:判断表情数据点击率是否大于第一阈值,若判断结果为是,将与所述表情数据点击率对应的搜索关键词确定为表情输入关键词。需要说明的是,可以预先设定第一阈值,若表情数据点击率大于第一阈值,说明用户在输入对应的搜索关键词时,输入表情数据的概率较高,这时该搜索关键词就与对应的表情数据具有强关联关系。这样,用户再次输入搜索关键词时,有很多概率用户具有输入表情数据的意图,这时可以主动为用户提示或推荐表情数据。
在另一种可能的实现方式中,所述根据用户历史输入数据计算用户输入与表情数据的关联程度值包括:获取用户历史表情输入数据,确定与所述表情输入数据对应的上文输入;计算所述上文输入的单文本词汇频率-逆文本频率(英文全称为term frequency–inverse document frequency,英文缩写为TF-IDF)值,将所述TF-IDF值作为所述上文输入与表情数据的关联程度值;所述将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词包括:判断所述TF-IDF值是否大于第二设定阈值,若判断结果为是,将所述上文输入确定为表情输入关键词。在这一实现方式中,可以通过用户历史表情输入数据,确定在用户输入中关联表情输入数据的上文输入,生成“上文输入-表情数据”对。例如,用户输入“生日快乐”,后面紧接着输入表情数据“蛋糕”,这时可以生成“生日快乐-表情蛋糕”对。将指向同一表情的上文输入作为一类,将上文输入视为词语或者文本,统计各上文输入出现在各个类别的词频以及上述输入所述出现的类别数,计算TF-IDF值,过滤掉TF-IDF值小于第二设定阈值的部分。下面的实施例中以将是上文输入视为文本为例进行说明。
具体实现时,TF-IDF值为TF值与IDF值的乘积。其中,TF值是单文本词汇频率,一般用于表示一个上文输入在某个表情的上文的出现频率。一般地,若将上文输入视为文本,可以通过下述公式计算TF值:
其中,ni,j代表第i个文本(也就是上文输入)在表情j的上文中出现的次数,TFi,j则代表着出现表情j后,上文输入是i的概率值。而分母代表的是在出现表情j的情况下,所有文本(也就是上文输入)的出现次数之和。K为正整数,nk,j代表第k个文本在表情j的上文中出现的次数。如表情EX的上文输入有三个文本A,B,C,其中A出现3次,B出现2次,C出现1次,那么上文输入A在表情数据EX中的频率tf值就是3/(3+2+1)=0.5,即出现了表情EX,有0.5的概率上文会是文本A。
逆向文件频率(inverse document frequency,IDF)是一个词语或文本普遍重要性的度量。某一特定文本的IDF,可以由总文件数目除以包含该文本之文件的数目,再将得到的商取对数得到:
具体到本发明实施例,IDFi为第i个文本的逆向文件频率值,|D|代表着数据集中表情数据的数量,dj代表第j个表情数据所对应的上文文本的集合,ti则是第i个文本。如总共的表情数目是10个,文本A在第1,2,4个表情的上文中均出现过,那么idfA的值就是log(10/3)。一般地,IDFi的值越小,说明这句文本的普遍性越高,即这句话后面可能接着更多种类的表情。如“哈哈”后面可能接“大笑”、“微笑”表情,“生日快乐”后面可能接“蛋糕”,那么“哈哈”的IDFi值就会比“生日快乐”更小。
然后,再利用得到的TF值和IDF值的乘积得到某一词语或文本的TF-IDF值。
通过计算TF与IDF的乘积可以得到对于每个文本在每个表情中的TF-IDF得分,代表着这个文本与表情的关联强度。TF值代表着表情上文是这个文本的强度,IDF值代表文本所映射表情数量的多少的强度,表情上文是这个文本的概率高,文本后所出现的表情数量少,就说明这个文本与表情的关联性高。过滤掉TF-IDF值低的相当于把那种表情上文出现频率低以及文本出现后可以接各种各样表情的文本过滤掉了。其中,表情上文出现频率低的情形,例如可以是很少有用户在输入该上文后紧接着输入这个表情。此外,若用户输入该上文后可能会输入不同的表情,表明上文和表情的关联程度不是很高。通过这种方式,可以将TF-IDF值大于第二设定阈值的上文输入确定为与表情数据关联程度高的表情输入关键词。
在另一种可能的实现方式中,还可以对TF-IDF值大于第二设定阈值的上文输入进行过滤处理,获得过滤处理后的上文输入;所述将所述上文输入确定为表情输入关键词包括:将过滤处理后的上文输入确定为表情输入关键词。其中,所述对TF-IDF值大于第二设定阈值的上文输入进行过滤处理包括下述任意一种或多种方式的组合:
(1)获取所述上文输入的输入频次,将输入频次小于第三设定阈值的上文输入去除。
(2)获取所述上文输入的输入频次,将输入频次大于第四设定阈值的上文输入去除。
(3)获取所述上文输入在对应的表情数据中的出现频次,将出现频次小于第五设定阈值的上文输入去除。
在又一种可能的实现方式中,还可以结合表情数据点击率与TF-IDF值共同确定表情输入关键词。在这一实现方式中,所述根据用户历史输入数据计算用户输入与表情数据的关联程度值包括:获取用户历史搜索数据,根据用户历史搜索数据确定搜索关键词,计算与所述搜索关键词对应的表情数据点击率作为用户输入与表情数据的关联程度值。所述方法还包括:获取用户历史表情输入数据,确定与所述表情输入数据对应的上文输入;计算所述上文输入的单文本词汇频率-逆文本频率值;判断所述TF-IDF值是否大于第二设定阈值,若判断结果为是,获取所述TF-IDF值大于第二设定阈值的上文输入;所述将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词包括:判断表情数据点击率是否大于第一阈值,若判断结果为是,将所述表情数据点击率大于第一阈值的搜索关键词确定为表情输入关键词;和/或,获取表情数据点击率不大于第一阈值的搜索关键词与TF-IDF值大于第二设定阈值的上文输入的交集,将所述交集中的输入作为表情输入关键词。在这一实现方式中,可以将表情数据点击率大于第一阈值的搜索关键词确定为表情输入关键词。进一步,还可以计算具有表情的上文输入的TF-IDF值,获取TF-IDF值大于第二设定阈值的上文输入以及表情数据点击率不大于第一阈值的搜索关键词,获取二者的交集作为表情输入关键词。在图2的实施例中将对这种方式进行详细地介绍。
S102,接收用户输入信息,判断所述用户输入信息是否与所述表情输入关键词匹配。
具体实现时,判断所述用户输入信息是否与所述表情输入关键词匹配的判断策略可以包括:判断所述输入信息是否与表情输入关键词完全匹配、部分匹配或者模糊匹配。其中,模糊匹配可以通过计算相似度的方式确定。举例说明,完全匹配可以是整句命中。例如,表情输入关键词为“厉害了我的哥”,用户输入是“厉害了我的哥”,则为整句命中完全匹配。若用户输入“真是厉害了我的哥”则是部分匹配。若用户输入“厉害了我滴哥”则是模糊匹配。具体的匹配策略可以根据需要设置,在此不进行限定。其中,用户输入信息可以是文本输入,也可以是语音输入。
S103,若判断所述用户输入信息与所述表情输入关键词匹配,获取与所述表情输入关键词关联的表情数据。
若判断用户输入信息与所述表情输入关键词匹配,则认为用户具有输入表情的意图,这时可以获取相应的表情数据推荐给用户。具体地,在判断所述用户输入信息与所述表情输入关键词匹配之后,在获取与所述表情输入关键词关联的表情数据之前,所述方法还包括:显示提示信息,用于提示用户是否需要发送表情数据;所述获取与所述表情输入关键词关联的表情数据包括:响应于用户针对所述提示信息的确认操作,获取与所述表情输入关键词关联的表情数据。举例说明,可以通过文本提示用户是否需要发送相应的表情,若用户点击确认了提示信息,则获取相应的表情数据。需要说明的是,文本提示的方式可以进一步确认用户是否具有发送表情数据的意图,用户点击了提示则可以向用户展示对应的表情数据。相对于直接展示表情图片数据的方式,占用的空间更小、数据量更小。
在一些实施方式中,在获取与所述表情输入关键词关联的表情数据包括:向表情数据搜索服务器发送表情数据搜索请求,所述表情数据搜索请求包含所述表情输入关键词;接收所述表情数据搜索服务器发送的与所述表情输入关键词关联的表情数据。在这一实现方式中,表情数据并不需要预先存储在用户终端设备中,减少了用户操作,并节省了设备的存储空间,提高了设备的响应速度。此外,现有技术预先下载表情包的方式存在表情种类单一、不能及时更新的缺陷。而在本发明中,由于是向表情数据搜索服务器发送搜索请求,搜索得到的表情数据更加丰富多样,用户无需收藏即可获得实时、海量、丰富的表情数据。
可选地,S104,显示所述表情数据。图中虚线表示所示步骤不是必须的,而是可选的步骤。
在显示表情数据后,还可以接收用户针对所述表情数据的选择操作,发送表情数据。
为了便于本领域技术人员更清楚地理解本发明在具体场景下的实施方式,下面以一个具体示例对本发明实施方式进行介绍。需要说明的是,该具体示例仅为使得本领域技术人员更清楚地了解本发明,但本发明的实施方式不限于该具体示例。
参见图2,为本发明另一实施例提供的表情数据推荐方法流程图。所示方法可以包括:
S201,获取用户历史表情输入数据,确定与所述表情输入数据对应的上文输入。
举例说明,可以通过用户历史表情输入数据,确定在用户输入中关联表情输入数据的上文输入,生成“上文输入-表情数据”对。例如,用户输入“生日快乐”,后面紧接着输入表情数据“蛋糕”,这时可以生成“生日快乐-表情蛋糕”对。又如,用户输入“哈哈”,后面紧接着输入表情数据“大笑”,这时可以生成“哈哈-表情大笑”对。其中,表情数据也可以用表情数据对应的标识表示。
S202,计算所述上文输入的TF-IDF值,作为所述上文输入与表情数据的关联程度值。
通过计算TF-IDF值可以得到对于每个文本(也就是上文输入)在每个表情中的TF-IDF值得分,代表着这个文本与表情的关联强度。TF值代表着表情上文是这个文本的强度,IDF值代表文本所映射表情数量的多少的强度,表情上文是这个文本的概率高,文本后所出现的表情数量少,就说明这个文本与表情的关联性高。举例说明,假设对于生日蛋糕这个表情,其上文输入有2个文本“生日快乐”“Happy birthday”,其中,文本“生日快乐”出现了4次,文本“happy birthday”出行了1次,那么文本“生日快乐”在表情数据生日蛋糕中的文本频率TF值就是0.8,表示当出现表情生日蛋糕时,其上文输入是“生日快乐”的概率是0.8;而文本“生日快乐”只在1个表情的上文出现过,那么其IDF值就高,由此得到的TF-IDF值较大,说明文本“生日快乐”与表情“蛋糕”的关联程度越高。过滤掉TF-IDF值值低的相当于把那种表情上文出现频率低以及文本出现后可以接各种各样表情的文本过滤掉了。其中,表情上文出现频率低的情形,例如可以是很少有用户在输入该上文后紧接着输入这个表情。此外,若用户输入该上文后可能会输入不同的表情,表明上文和表情的关联程度不是很高。例如,用户输入“哈哈”,可能会接“大笑”“微笑”“偷笑”“龇牙”“笑哭”等各种表情,说明上文“哈哈”与这些表情的关联程度不是很高。通过这种方式,可以将TF-IDF值大于第二设定阈值的上文输入确定为与表情数据关联程度高的表情输入关键词。
S203,判断所述TF-IDF值是否大于第二设定阈值,若判断结果为否,去除TF-IDF值小于设定阈值的上文输入。
S204,对TF-IDF值大于第二设定阈值的上文输入进行过滤处理,获得过滤处理后的上文输入作为初步表情输入关键词。
具体实现时,可以获取所述上文输入的输入频次,将输入频次小于第三设定阈值的上文输入去除。进一步地,还可以获取所述上文输入在对应的表情数据中的出现频次,将出现频次小于第五设定阈值的上文输入去除。将过滤处理后的上文输入作为初步表情输入关键词,并按照用户输入的频次进行排序。
举例说明,可以将初步表情输入关键词按照频次排序,排在前列的输入频次较高。之所以按照频次排序是为了更好的评估一个表情输入关键词在用户输入中出现的次数,过滤掉特例以及实现一些产品需求。例如,可能有特别的用户输入一个人的人名然后接一个很少用的表情,那么这一个<文本,表情>既满足这个表情的上文出现这个文本的概率高且输入文本后面接表情的种类少的条件,因为这个表情很少有人发,被特别的用户输入后,上文就成了高概率的了,又因为是人名,本身出现频次就低。这一种情况在比较TF-IDF值的时候无法去除,因为TF和IDF得分都很高,因此通过去除用户输入频次小于第三设定阈值以及上文输入在对应的表情数据中的出现频次小于第五设定阈值的上文输入的方式可以去除掉这些噪音。在一些实施方式中,还可以获取所述上文输入的输入频次,将输入频次大于第四设定阈值的上文输入去除。这是因为若用户高频输入的词语会频繁触发表情推荐,一方面会造成服务器的频繁响应造成负载压力增大,另一方面可能会对用户造成过多干扰。当然,也可以不过滤高频输入关键词,可以根据用户的反馈以及服务器的响应情况进行适应性地调整。
S205,获取用户历史搜索数据。
S206,根据用户历史搜索数据确定搜索关键词,计算与所述搜索关键词对应的表情数据点击率作为用户输入与表情数据的关联程度值。
具体地实现与图1所示实施例中介绍的方法相同,在此不再赘述。
S207,判断表情数据点击率是否大于第一阈值,若判断结果为是,将与所述表情数据点击率对应的搜索关键词确定为第一表情输入关键词。
S208,获取表情数据点击率不大于第一阈值的用户输入与初步表情输入关键词的交集,将所述交集中的输入作为第二表情输入关键词。
在这一实现方式中,可以将表情数据点击率不大于第一阈值的用户输入与在S204中生成的初步表情输入数据进行比对,提取公共高频部分作为表情输入关键词。
S209,利用第一表情输入关键词与第二表情输入关键词生成表情输入关键词集合。
具体实现时,还可以对第一表情输入关键词与第二表情输入关键词进行过滤处理,过滤掉一些不适宜推荐的表情输入关键词。例如,可以设置过滤条件,符合过滤条件的表情输入关键词则被去除。所述过滤条件可以是与预设的关键词集合匹配,所述预设的关键词集合可以包括不适合出现的敏感词、不文明用语、不符合法律规定的词语或者不符合少数民族风俗习惯的用语等,具体可以根据需要设置。
S210,接收用户输入信息,判断所述用户输入信息是否与所述表情输入关键词匹配。
S211,若判断所述用户输入信息与所述表情输入关键词匹配,显示提示信息。
具体实现时,在通过判断所述用户输入信息与所述表情输入关键词匹配识别出用户具有输入表情的意图后,可以显示文本提示用户该表情输入关键词具有对应的表情数据。当然,在其他实现方式中,也可以直接展示与该表情输入关键词对应的表情数据。
S212,响应于用户针对所述提示信息的确认操作,向表情数据搜索服务器发送表情数据搜索请求。
S213,接收所述表情数据搜索服务器发送的与所述表情输入关键词关联的表情数据。
需要说明的是,在其他实现方式中,若判断所述用户输入信息与所述表情输入关键词匹配,可以直接向表情数据搜索服务器例如图片搜索服务器发送搜索请求,若图片搜索服务器返回对应的表情数据,则可以显示文本提示用户该表情输入关键词具有对应的表情数据。然后,响应于用户针对文本提示的确认操作,显示对应的表情数据供用户浏览、上屏或发送。
S214,显示所述表情数据。
在这一实施例中,可以通过判断所述用户输入信息是否与所述表情输入关键词匹配的方式识别用户是否具有表情输入意图,并可以提示用户具有相应的表情数据,用户只需要点击一次提示信息即可以完成文字向图片的转换,节省了用户的操作、提高了输入效率。进一步地,本发明实施例中在判断所述用户输入信息与所述表情输入关键词匹配进而判断用户具有表情输入意图后,可以向表情数据搜索服务器发送搜索请求,搜索得到的表情数据更加丰富多样,用户无需收藏可以获得实时、海量、丰富的表情数据。
参见图3,为本发明一实施例提供的表情数据推荐装置示意图。
一种表情数据推荐装置300,包括:
确定单元301,用于根据用户历史输入数据确定表情输入关键词,所述表情输入关键词为与表情数据具有强关联关系的词语。其中,确定单元301的具体实现可以参照图1所示方法的S101而实现。
第一判断单元302,用于接收用户输入信息,判断所述用户输入信息是否与所述表情输入关键词匹配;其中,第一判断单元302的具体实现可以参照图1所示方法的S102而实现。
获取单元303,用于若判断所述用户输入信息与所述表情输入关键词匹配,获取与所述表情输入关键词关联的表情数据;其中,获取单元303的具体实现可以参照图1所示方法的S103而实现。
在一些实施方式中,所述确定单元301具体包括:
计算子单元,用于根据用户历史输入数据计算用户输入与表情数据的关联程度值;
确定子单元,用于将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词。
在一些实施方式中,所述计算子单元具体包括:
第一计算子单元,用于获取用户历史搜索数据,根据用户历史搜索数据确定搜索关键词,计算与所述搜索关键词对应的表情数据点击率作为用户输入与表情数据的关联程度值。
在一些实施方式中,所述确定子单元具体包括:
第一确定子单元,用于判断表情数据点击率是否大于第一阈值,若判断结果为是,将与所述表情数据点击率对应的搜索关键词确定为表情输入关键词。
在一些实施方式中,所述装置还包括:
TF-IDF值计算单元,用于获取用户历史表情输入数据,确定与所述表情输入数据对应的上文输入;计算所述上文输入的单文本词汇频率-逆文本频率TF-IDF值;
第二判断单元,用于判断所述TF-IDF值是否大于第二设定阈值,若判断结果为是,获取所述TF-IDF值大于第二设定阈值的上文输入;
所述确定子单元具体包括:
第二确定子单元,用于判断表情数据点击率是否大于第一阈值,若判断结果为是,将所述表情数据点击率大于第一阈值的搜索关键词确定为表情输入关键词;和/或,获取表情数据点击率不大于第一阈值的搜索关键词与TF-IDF值大于第二设定阈值的上文输入的交集,将所述交集中的输入作为表情输入关键词。
在一些实施方式中,第一计算子单元具体用于:确定搜索关键词的搜索次数以及所述搜索关键词对应的表情数据的点击次数,计算所述表情数据的点击次数与所述搜索次数的比值作为表情数据点击率;或者,确定搜索关键词的搜索人数以及所述搜索关键词对应的表情数据的点击人数,计算所述表情数据的点击人数与所述搜索人数的比值作为表情数据点击率。
在一些实施方式中,所述计算子单元具体包括:
第二计算子单元,用于获取用户历史表情输入数据,确定与所述表情输入数据对应的上文输入;计算所述上文输入的单文本词汇频率-逆文本频率TF-IDF值,将所述TF-IDF值作为所述上文输入与表情数据的关联程度值;
所述确定子单元具体包括:
第二确定子单元,用于判断所述TF-IDF值是否大于第二设定阈值,若判断结果为是,将所述上文输入确定为表情输入关键词。
在一些实施方式中,所述装置还包括:
过滤单元,用于对TF-IDF值大于第二设定阈值的上文输入进行过滤处理,获得过滤处理后的上文输入;
所述第二确定子单元具体用于将过滤处理后的上文输入确定为表情输入关键词。
在一些实施方式中,所述过滤单元具体包括:
第一过滤子单元,用于获取所述上文输入的输入频次,将输入频次小于第三设定阈值的上文输入去除;和/或,
第二过滤子单元,获取所述上文输入的输入频次,将输入频次大于第四设定阈值的上文输入去除;和/或,
第三过滤子单元,获取所述上文输入在对应的表情数据中的出现频次,将出现频次小于第五设定阈值的上文输入去除。
在一些实施方式中,所述装置还包括:
提示单元,用于在判断所述用户输入信息与所述表情输入关键词匹配之后,在获取与所述表情输入关键词关联的表情数据之前,显示提示信息,用于提示用户是否需要发送表情数据;
所述获取单元303具体用于响应于用户针对所述提示信息的确认操作,获取与所述表情输入关键词关联的表情数据。
在一些实施方式中,所述获取单元303具体用于:向表情数据搜索服务器发送表情数据搜索请求,所述表情数据搜索请求包含所述表情输入关键词;接收所述表情数据搜索服务器发送的与所述表情输入关键词关联的表情数据。
其中,本发明装置各单元或模块的设置可以参照图1至图2所示的方法而实现,在此不赘述。
参见图4,为根据一示例性实施例示出的一种用于表情数据推荐装置的框图。例如,装置400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置400可以包括以下一个或多个组件:处理组件402,存储器404,电源组件406,多媒体组件408,音频组件410,输入/输出(I/O)的接口412,传感器组件414,以及通信组件416。
处理组件402通常控制装置400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理部件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。
存储器404被配置为存储各种类型的数据以支持在设备400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理系统,一个或多个电源,及其他与为装置400生成、管理和分配电力相关联的组件。
多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件408包括一个前置摄像头和/或后置摄像头。当设备400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(MIC),当装置400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
I/O接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件414包括一个或多个传感器,用于为装置400提供各个方面的状态评估。例如,传感器组件414可以检测到设备400的打开/关闭状态,组件的相对定位,例如所述组件为装置400的显示器和小键盘,传感器组件414还可以检测装置400或装置400一个组件的位置改变,用户与装置400接触的存在或不存在,装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件414经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件414还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
具体地,本发明实施例提供了一种表情数据推荐装置400,包括有存储器404,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器404中,且经配置以由一个或者一个以上处理器420执行所述一个或者一个以上程序包含用于进行以下操作的指令:根据用户历史输入数据确定表情输入关键词,所述表情输入关键词为与表情数据具有强关联关系的词语;接收用户输入信息,判断所述用户输入信息是否与所述表情输入关键词匹配;若判断所述用户输入信息与所述表情输入关键词匹配,获取与所述表情输入关键词关联的表情数据。
进一步地,所述处理器420执行根据用户历史输入数据确定表情输入关键词的操作具体包括:根据用户历史输入数据计算用户输入与表情数据的关联程度值;将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词。
进一步地,所述处理器420执行根据用户历史输入数据计算用户输入与表情数据的关联程度值的操作的指令具体包括:获取用户历史搜索数据,根据用户历史搜索数据确定搜索关键词,计算与所述搜索关键词对应的表情数据点击率作为用户输入与表情数据的关联程度值。
进一步地,所述处理器420执行将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词具体包括:判断表情数据点击率是否大于第一阈值,若判断结果为是,将与所述表情数据点击率对应的搜索关键词确定为表情输入关键词。
进一步地,所述处理器420还用于执行以下操作的指令:获取用户历史表情输入数据,确定与所述表情输入数据对应的上文输入;计算所述上文输入的单文本词汇频率-逆文本频率值;判断所述TF-IDF值是否大于第二设定阈值,若判断结果为是,获取所述TF-IDF值大于第二设定阈值的上文输入;
所述处理器420执行将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词具体包括:判断表情数据点击率是否大于第一阈值,若判断结果为是,将所述表情数据点击率大于第一阈值的搜索关键词确定为表情输入关键词;和/或,获取表情数据点击率不大于第一阈值的搜索关键词与TF-IDF值大于第二设定阈值的上文输入的交集,将所述交集中的输入作为表情输入关键词。
进一步地,所述处理器420执行计算与所述搜索关键词对应的表情数据点击率具体包括:确定搜索关键词的搜索次数以及所述搜索关键词对应的表情数据的点击次数,计算所述表情数据的点击次数与所述搜索次数的比值作为表情数据点击率;或者,确定搜索关键词的搜索人数以及所述搜索关键词对应的表情数据的点击人数,计算所述表情数据的点击人数与所述搜索人数的比值作为表情数据点击率。
进一步地,所述处理器420执行根据用户历史输入数据计算用户输入与表情数据的关联程度值具体包括:获取用户历史表情输入数据,确定与所述表情输入数据对应的上文输入;计算所述上文输入的单文本词汇频率-逆文本频率值,将所述单文本词汇频率-逆文本频率TF-IDF值作为所述上文输入与表情数据的关联程度值;所述将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词包括:判断所述TF-IDF值是否大于第二设定阈值,若判断结果为是,将所述上文输入确定为表情输入关键词。
进一步地,所述处理器420还用于执行以下操作的指令:对TF-IDF值大于第二设定阈值的上文输入进行过滤处理,获得过滤处理后的上文输入。
进一步地,所述处理器420用于执行对TF-IDF值大于第二设定阈值的上文输入进行过滤处理具体包括:获取所述上文输入的输入频次,将输入频次小于第三设定阈值的上文输入去除;和/或,获取所述上文输入的输入频次,将输入频次大于第四设定阈值的上文输入去除;和/或,获取所述上文输入在对应的表情数据中的出现频次,将出现频次小于第五设定阈值的上文输入去除。
进一步地,所述处理器420还用于执行以下操作的指令:在判断所述用户输入信息与所述表情输入关键词匹配之后,在获取与所述表情输入关键词关联的表情数据之前,显示提示信息,用于提示用户是否需要发送表情数据。
进一步地,所述处理器420执行获取与所述表情输入关键词关联的表情数据的操作具体包括:响应于用户针对所述提示信息的确认操作,获取与所述表情输入关键词关联的表情数据。
进一步地,所述处理器420执行获取与所述表情输入关键词关联的表情数据的操作具体包括:向表情数据搜索服务器发送表情数据搜索请求,所述表情数据搜索请求包含所述表情输入关键词;接收所述表情数据搜索服务器发送的与所述表情输入关键词关联的表情数据。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由装置400的处理器420执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种机器可读介质,例如该机器可读介质可以为非临时性计算机可读存储介质,当所述介质中的指令由装置(终端或者服务器)的处理器执行时,使得装置能够执行一种表情数据推荐方法,所述方法包括:根据用户历史输入数据确定表情输入关键词,所述表情输入关键词为与表情数据具有强关联关系的词语;接收用户输入信息,判断所述用户输入信息是否与所述表情输入关键词匹配;若判断所述用户输入信息与所述表情输入关键词匹配,获取与所述表情输入关键词关联的表情数据;显示所述表情数据。
可选地,所述根据用户历史输入数据确定表情输入关键词包括:根据用户历史输入数据计算用户输入与表情数据的关联程度值;将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词。
可选地,所述根据用户历史输入数据计算用户输入与表情数据的关联程度值包括:获取用户历史搜索数据,根据用户历史搜索数据确定搜索关键词,计算与所述搜索关键词对应的表情数据点击率作为用户输入与表情数据的关联程度值;
所述将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词包括:判断表情数据点击率是否大于第一阈值,若判断结果为是,将与所述表情数据点击率对应的搜索关键词确定为表情输入关键词。
可选地,所述方法还包括:获取用户历史表情输入数据,确定与所述表情输入数据对应的上文输入;计算所述上文输入的单文本词汇频率-逆文本频率TF-IDF值;判断所述TF-IDF值是否大于第二设定阈值,若判断结果为是,获取所述TF-IDF值大于第二设定阈值的上文输入;所述将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词包括:判断表情数据点击率是否大于第一阈值,若判断结果为是,将所述表情数据点击率大于第一阈值的搜索关键词确定为表情输入关键词;和/或,获取表情数据点击率不大于第一阈值的搜索关键词与TF-IDF值大于第二设定阈值的上文输入的交集,将所述交集中的输入作为表情输入关键词。
可选地,所述计算与所述搜索关键词对应的表情数据点击率包括:确定搜索关键词的搜索次数以及所述搜索关键词对应的表情数据的点击次数,计算所述表情数据的点击次数与所述搜索次数的比值作为表情数据点击率;或者,确定搜索关键词的搜索人数以及所述搜索关键词对应的表情数据的点击人数,计算所述表情数据的点击人数与所述搜索人数的比值作为表情数据点击率。
可选地,所述根据用户历史输入数据计算用户输入与表情数据的关联程度值包括:获取用户历史表情输入数据,确定与所述表情输入数据对应的上文输入;计算所述上文输入的单文本词汇频率-逆文本频率TF-IDF值,将所述TF-IDF值作为所述上文输入与表情数据的关联程度值;所述将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词包括:判断所述TF-IDF值是否大于第二设定阈值,若判断结果为是,将所述上文输入确定为表情输入关键词。
可选地,所述方法还包括:对TF-IDF值大于第二设定阈值的上文输入进行过滤处理,获得过滤处理后的上文输入;所述将所述上文输入确定为表情输入关键词包括:将过滤处理后的上文输入确定为表情输入关键词。
可选地,所述对TF-IDF值大于第二设定阈值的上文输入进行过滤处理包括:获取所述上文输入的输入频次,将输入频次小于第三设定阈值的上文输入去除;和/或,获取所述上文输入的输入频次,将输入频次大于第四设定阈值的上文输入去除;和/或,获取所述上文输入在对应的表情数据中的出现频次,将出现频次小于第五设定阈值的上文输入去除。
可选地,在判断所述用户输入信息与所述表情输入关键词匹配之后,在获取与所述表情输入关键词关联的表情数据之前,所述方法还包括:显示提示信息,用于提示用户是否需要发送表情数据;所述获取与所述表情输入关键词关联的表情数据包括:响应于用户针对所述提示信息的确认操作,获取与所述表情输入关键词关联的表情数据。
可选地,所述获取与所述表情输入关键词关联的表情数据包括:向表情数据搜索服务器发送表情数据搜索请求,所述表情数据搜索请求包含所述表情输入关键词;接收所述表情数据搜索服务器发送的与所述表情输入关键词关联的表情数据。
图5是本发明实施例中服务器的结构示意图。该服务器500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessing units,CPU)522(例如,一个或一个以上处理器)和存储器532,一个或一个以上存储应用程序542或数据544的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器532和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器522可以设置为与存储介质530通信,在服务器500上执行存储介质530中的一系列指令操作。
服务器500还可以包括一个或一个以上电源526,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口558,一个或一个以上键盘556,和/或,一个或一个以上操作系统541,例如Windows ServerTM,Mac OSXTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (14)

1.一种表情数据推荐方法,其特征在于,包括:
根据用户历史输入数据确定表情输入关键词,所述表情输入关键词为与表情数据具有强关联关系的词语;
接收用户输入信息,判断所述用户输入信息是否与所述表情输入关键词匹配;
若判断所述用户输入信息与所述表情输入关键词匹配,获取与所述表情输入关键词关联的表情数据。
2.根据权利要求1所述的方法,其特征在于,所述根据用户历史输入数据确定表情输入关键词包括:
根据用户历史输入数据计算用户输入与表情数据的关联程度值;
将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词。
3.根据权利要求2所述的方法,其特征在于,所述根据用户历史输入数据计算用户输入与表情数据的关联程度值包括:
获取用户历史搜索数据,根据用户历史搜索数据确定搜索关键词,计算与所述搜索关键词对应的表情数据点击率作为用户输入与表情数据的关联程度值。
4.根据权利要求3所述的方法,其特征在于,所述将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词包括:
判断表情数据点击率是否大于第一阈值,若判断结果为是,将与所述表情数据点击率对应的搜索关键词确定为表情输入关键词。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取用户历史表情输入数据,确定与所述表情输入数据对应的上文输入;
计算所述上文输入的单文本词汇频率-逆文本频率TF-IDF值;
判断所述TF-IDF值是否大于第二设定阈值,若判断结果为是,获取所述TF-IDF值大于第二设定阈值的上文输入;
所述将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词包括:
判断表情数据点击率是否大于第一阈值,若判断结果为是,将所述表情数据点击率大于第一阈值的搜索关键词确定为表情输入关键词;和/或,
获取表情数据点击率不大于第一阈值的搜索关键词与TF-IDF值大于第二设定阈值的上文输入的交集,将所述交集中的输入作为表情输入关键词。
6.根据权利要求3所述的方法,其特征在于,所述计算与所述搜索关键词对应的表情数据点击率包括:
确定搜索关键词的搜索次数以及所述搜索关键词对应的表情数据的点击次数,计算所述表情数据的点击次数与所述搜索次数的比值作为表情数据点击率;或者,
确定搜索关键词的搜索人数以及所述搜索关键词对应的表情数据的点击人数,计算所述表情数据的点击人数与所述搜索人数的比值作为表情数据点击率。
7.根据权利要求2所述的方法,其特征在于,所述根据用户历史输入数据计算用户输入与表情数据的关联程度值包括:
获取用户历史表情输入数据,确定与所述表情输入数据对应的上文输入;
计算所述上文输入的单文本词汇频率-逆文本频率TF-IDF值,将所述TF-IDF值作为所述上文输入与表情数据的关联程度值;
所述将与表情数据的关联程度值符合预设条件的用户输入确定为表情输入关键词包括:
判断所述TF-IDF值是否大于第二设定阈值,若判断结果为是,将所述上文输入确定为表情输入关键词。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
对TF-IDF值大于第二设定阈值的上文输入进行过滤处理,获得过滤处理后的上文输入;
所述将所述上文输入确定为表情输入关键词包括:
将过滤处理后的上文输入确定为表情输入关键词。
9.根据权利要求8所述的方法,其特征在于,所述对TF-IDF值大于第二设定阈值的上文输入进行过滤处理包括:
获取所述上文输入的输入频次,将输入频次小于第三设定阈值的上文输入去除;和/或,
获取所述上文输入的输入频次,将输入频次大于第四设定阈值的上文输入去除;和/或,
获取所述上文输入在对应的表情数据中的出现频次,将出现频次小于第五设定阈值的上文输入去除。
10.根据权利要求1所述的方法,其特征在于,在判断所述用户输入信息与预先存储的表情输入关键词匹配之后,在获取与所述表情输入关键词关联的表情数据之前,所述方法还包括:
显示提示信息,用于提示用户是否需要发送表情数据;
所述获取与所述表情输入关键词关联的表情数据包括:
响应于用户针对所述提示信息的确认操作,获取与所述表情输入关键词关联的表情数据。
11.根据权利要求1或10所述的方法,其特征在于,所述获取与所述表情输入关键词关联的表情数据包括:
向表情数据搜索服务器发送表情数据搜索请求,所述表情数据搜索请求包含所述表情输入关键词;
接收所述表情数据搜索服务器发送的与所述表情输入关键词关联的表情数据。
12.一种表情数据推荐装置,其特征在于,包括:
确定单元,用于根据用户历史输入数据确定表情输入关键词,所述表情输入关键词为与表情数据具有强关联关系的词语;
第一判断单元,用于接收用户输入信息,判断所述用户输入信息是否与所述表情输入关键词匹配;
获取单元,用于若判断所述用户输入信息与所述表情输入关键词匹配,获取与所述表情输入关键词关联的表情数据。
13.一种用于表情数据推荐的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
根据用户历史输入数据确定表情输入关键词,所述表情输入关键词为与表情数据具有强关联关系的词语;
接收用户输入信息,判断所述用户输入信息是否与所述表情输入关键词匹配;
若判断所述用户输入信息与所述表情输入关键词匹配,获取与所述表情输入关键词关联的表情数据。
14.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至11中一个或多个所述的表情数据推荐方法。
CN201710648056.1A 2017-08-01 2017-08-01 一种表情数据推荐方法及装置 Active CN110019885B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710648056.1A CN110019885B (zh) 2017-08-01 2017-08-01 一种表情数据推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710648056.1A CN110019885B (zh) 2017-08-01 2017-08-01 一种表情数据推荐方法及装置

Publications (2)

Publication Number Publication Date
CN110019885A true CN110019885A (zh) 2019-07-16
CN110019885B CN110019885B (zh) 2021-10-15

Family

ID=67186115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710648056.1A Active CN110019885B (zh) 2017-08-01 2017-08-01 一种表情数据推荐方法及装置

Country Status (1)

Country Link
CN (1) CN110019885B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110582020A (zh) * 2019-09-03 2019-12-17 北京达佳互联信息技术有限公司 视频生成方法、装置、电子设备及存储介质
CN112148133A (zh) * 2020-09-10 2020-12-29 北京百度网讯科技有限公司 确定推荐表情的方法、装置、设备和计算机存储介质
CN112308016A (zh) * 2020-11-19 2021-02-02 网易(杭州)网络有限公司 表情图像获取方法、装置、电子设备及存储介质
CN112532507A (zh) * 2019-09-17 2021-03-19 上海掌门科技有限公司 用于呈现表情图像、用于发送表情图像的方法和设备

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120143907A1 (en) * 2007-03-21 2012-06-07 The Regents Of The University Of California Generating audio annotations for search and retrieval
CN103823561A (zh) * 2014-02-27 2014-05-28 广州华多网络科技有限公司 表情输入方法和装置
CN104063427A (zh) * 2014-06-06 2014-09-24 北京搜狗科技发展有限公司 一种基于语义理解的表情输入方法和装置
CN104076944A (zh) * 2014-06-06 2014-10-01 北京搜狗科技发展有限公司 一种聊天表情输入的方法和装置
CN104298429A (zh) * 2014-09-25 2015-01-21 北京搜狗科技发展有限公司 一种基于输入的信息展示方法和输入法系统
CN104394057A (zh) * 2013-11-04 2015-03-04 贵阳朗玛信息技术股份有限公司 表情推荐方法及装置
CN104618222A (zh) * 2015-01-07 2015-05-13 腾讯科技(深圳)有限公司 一种匹配表情图像的方法及装置
US20150269163A1 (en) * 2014-03-21 2015-09-24 Alibaba Group Holding Limited Providing search recommendation
CN105718147A (zh) * 2016-01-22 2016-06-29 百度在线网络技术(北京)有限公司 输入法面板启用方法和装置以及输入方法和输入法系统
CN105718534A (zh) * 2016-01-14 2016-06-29 广州市动景计算机科技有限公司 信息推送装置、信息推送方法以及客户端
CN105975563A (zh) * 2016-04-29 2016-09-28 腾讯科技(深圳)有限公司 表情推荐方法及装置
US20160342689A1 (en) * 2014-01-27 2016-11-24 Beijing Qihoo Technology Company Limited Method, device and system for loading recommendation information and detecting web address
CN106293120A (zh) * 2016-07-29 2017-01-04 维沃移动通信有限公司 表情输入方法及移动终端
CN106372059A (zh) * 2016-08-30 2017-02-01 北京百度网讯科技有限公司 信息输入方法和装置
CN106570106A (zh) * 2016-11-01 2017-04-19 北京百度网讯科技有限公司 一种输入过程中将语音信息转化为表情的方法和装置
CN106897323A (zh) * 2015-12-21 2017-06-27 北京奇虎科技有限公司 消息的处理方法及装置
CN106971004A (zh) * 2017-04-26 2017-07-21 百度在线网络技术(北京)有限公司 搜索结果提供方法及装置

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120143907A1 (en) * 2007-03-21 2012-06-07 The Regents Of The University Of California Generating audio annotations for search and retrieval
CN104394057A (zh) * 2013-11-04 2015-03-04 贵阳朗玛信息技术股份有限公司 表情推荐方法及装置
US20160342689A1 (en) * 2014-01-27 2016-11-24 Beijing Qihoo Technology Company Limited Method, device and system for loading recommendation information and detecting web address
CN103823561A (zh) * 2014-02-27 2014-05-28 广州华多网络科技有限公司 表情输入方法和装置
US20150269163A1 (en) * 2014-03-21 2015-09-24 Alibaba Group Holding Limited Providing search recommendation
CN104933113A (zh) * 2014-06-06 2015-09-23 北京搜狗科技发展有限公司 一种基于语义理解的表情输入方法和装置
CN104076944A (zh) * 2014-06-06 2014-10-01 北京搜狗科技发展有限公司 一种聊天表情输入的方法和装置
CN104063427A (zh) * 2014-06-06 2014-09-24 北京搜狗科技发展有限公司 一种基于语义理解的表情输入方法和装置
CN104298429A (zh) * 2014-09-25 2015-01-21 北京搜狗科技发展有限公司 一种基于输入的信息展示方法和输入法系统
CN104618222A (zh) * 2015-01-07 2015-05-13 腾讯科技(深圳)有限公司 一种匹配表情图像的方法及装置
CN106897323A (zh) * 2015-12-21 2017-06-27 北京奇虎科技有限公司 消息的处理方法及装置
CN105718534A (zh) * 2016-01-14 2016-06-29 广州市动景计算机科技有限公司 信息推送装置、信息推送方法以及客户端
CN105718147A (zh) * 2016-01-22 2016-06-29 百度在线网络技术(北京)有限公司 输入法面板启用方法和装置以及输入方法和输入法系统
CN105975563A (zh) * 2016-04-29 2016-09-28 腾讯科技(深圳)有限公司 表情推荐方法及装置
CN106293120A (zh) * 2016-07-29 2017-01-04 维沃移动通信有限公司 表情输入方法及移动终端
CN106372059A (zh) * 2016-08-30 2017-02-01 北京百度网讯科技有限公司 信息输入方法和装置
CN106570106A (zh) * 2016-11-01 2017-04-19 北京百度网讯科技有限公司 一种输入过程中将语音信息转化为表情的方法和装置
CN106971004A (zh) * 2017-04-26 2017-07-21 百度在线网络技术(北京)有限公司 搜索结果提供方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MAHESH BABU MARIAPPAN 等: "FaceFetch: A User Emotion Driven Multimedia Content Recommendation System Based on Facial Expression Recognition", 《2012 IEEE INTERNATIONAL SYMPOSIUM ON MULTIMEDIA》 *
黄军: "社交网络热点话题公众情感极性实时计算研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110582020A (zh) * 2019-09-03 2019-12-17 北京达佳互联信息技术有限公司 视频生成方法、装置、电子设备及存储介质
CN110582020B (zh) * 2019-09-03 2022-03-01 北京达佳互联信息技术有限公司 视频生成方法、装置、电子设备及存储介质
CN112532507A (zh) * 2019-09-17 2021-03-19 上海掌门科技有限公司 用于呈现表情图像、用于发送表情图像的方法和设备
CN112148133A (zh) * 2020-09-10 2020-12-29 北京百度网讯科技有限公司 确定推荐表情的方法、装置、设备和计算机存储介质
CN112148133B (zh) * 2020-09-10 2024-01-23 北京百度网讯科技有限公司 确定推荐表情的方法、装置、设备和计算机存储介质
CN112308016A (zh) * 2020-11-19 2021-02-02 网易(杭州)网络有限公司 表情图像获取方法、装置、电子设备及存储介质
CN112308016B (zh) * 2020-11-19 2024-02-27 网易(杭州)网络有限公司 表情图像获取方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN110019885B (zh) 2021-10-15

Similar Documents

Publication Publication Date Title
CN105099877B (zh) 即时通信消息处理方法和装置
US11520824B2 (en) Method for displaying information, electronic device and system
CN105426152B (zh) 弹幕的显示方法和装置
CN104933170B (zh) 信息展示方法及装置
JP2017530431A (ja) 迷惑電話番号確定方法、装置及びシステム
CN104035995B (zh) 群标签生成方法及装置
CN104331503B (zh) 信息推送的方法及装置
CN105912630A (zh) 一种信息扩展方法及装置
CN110019885A (zh) 一种表情数据推荐方法及装置
CN108345610A (zh) 一种获取数据资源的方法和装置、用于获取数据资源的装置
CN105893493A (zh) 搜索方法及装置
CN108874939A (zh) 一种信息搜索方法及装置
CN108038102A (zh) 表情图像的推荐方法、装置、终端及存储介质
CN108073606A (zh) 一种新闻推荐方法和装置、一种用于新闻推荐的装置
CN109002184A (zh) 一种输入法候选词的联想方法和装置
CN110222256A (zh) 一种信息推荐方法、装置和用于信息推荐的装置
CN107346182A (zh) 一种构建用户词库的方法、及用于构建用户词库的装置
CN108717403B (zh) 一种处理方法、装置和用于处理的装置
CN109213942A (zh) 一种搜索结果展示方法及装置
CN109582768A (zh) 一种文本输入方法和装置
CN107291772A (zh) 一种搜索访问方法、装置及电子设备
CN106777016A (zh) 基于即时通信进行信息推荐的方法及装置
CN109388699A (zh) 输入方法、装置、设备及存储介质
CN109634913A (zh) 文档的存储方法、装置及电子设备
CN110110204A (zh) 一种信息推荐方法、装置和用于信息推荐的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant