CN104951435A - 聊天过程中智能显示关键词的方法及装置 - Google Patents

聊天过程中智能显示关键词的方法及装置 Download PDF

Info

Publication number
CN104951435A
CN104951435A CN201510447176.6A CN201510447176A CN104951435A CN 104951435 A CN104951435 A CN 104951435A CN 201510447176 A CN201510447176 A CN 201510447176A CN 104951435 A CN104951435 A CN 104951435A
Authority
CN
China
Prior art keywords
keyword
text
chat
characteristic item
chatting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510447176.6A
Other languages
English (en)
Inventor
陈包容
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201510447176.6A priority Critical patent/CN104951435A/zh
Publication of CN104951435A publication Critical patent/CN104951435A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种聊天过程中智能显示关键词的方法及装置,通过获取历史聊天文本,对历史聊天文本进行分析获得关键词,判断当前聊天文本是否包含关键词,当前聊天文本为聊天过程中距离当前系统时间最短的历史聊天文本,若是,则将关键词进行高亮显示,解决了在聊天过程中通过预先设置关键词来高亮显示关键词的方式智能化程度低,导致用户体验不佳的技术问题,实现了根据历史聊天文本智能提取关键词,使得提取的关键词更具有个性化,提升了用户体验。

Description

聊天过程中智能显示关键词的方法及装置
技术领域
本发明涉及通讯领域,特别地,涉及一种聊天过程中智能显示关键词的方法及装置。
背景技术
随着通信技术的发展,越来越多的用户喜欢在移动终端与好友进行聊天,且在聊天过程中会经常出现一些系统设置的高亮显示的关键词,并在点击这些高亮显示的关键词时能弹框显示与关键词对应的搜索结果页面。例如采用QQ即时通讯聊天工具聊天时,当聊天文本包括类似“百度”、“工作”、“智联招聘”“10086”等特定词时,系统会将这些特定词进行高亮显示,并在用户点击这些高亮显示的关键词时弹框显示与关键词对应的搜索结果页面。
但这种在聊天过程中通过预先设置关键词来高亮显示关键词的方式智能化程度低,例如用户可能对系统预先设置的关键词并不感兴趣,又或者用户希望系统能显示比预先设置的关键词更多的其他关键词。因此,亟需提供一种能在聊天过程中智能显示关键词的方法及装置。
发明内容
本发明提供了一种聊天过程中智能显示关键词的方法及装置,以解决在聊天过程中通过预先设置关键词来高亮显示关键词的方式智能化程度低,导致用户体验不佳的技术问题。
根据本发明的一方面,提供了一种聊天过程中智能显示关键词的方法,包括:
获取历史聊天文本;
对历史聊天文本进行分析获得关键词;
判断当前聊天文本是否包含关键词,当前聊天文本为聊天过程中距离当前系统时间最短的历史聊天文本,若是,则将关键词进行高亮显示。
进一步地,判断当前聊天文本是否包含关键词还包括:
判断当前聊天文本是否包含预设的预设关键词,若是,则将预设关键词进行高亮显示。
进一步地,对历史聊天文本进行分析获得关键词包括:
对历史聊天文本进行预处理,获得特征项文本,预处理包括分词、去除停用词;
统计特征项文本的词频数;
计算特征项文本的平均聊天时间差,平均聊天时间差为每一个特征项文本所处的历史聊天文本对应的系统时间与当前聊天文本对应的系统时间的平均时间差;
基于特征项文本的词频数和平均聊天时间差获取关键词。
进一步地,基于特征项文本的词频数和平均聊天时间差获取关键词包括:
    根据特征项文本的平均聊天时间差计算特征项文本的聊天时间系数,聊天时间系数的计算公式为:,其中代表聊天时间系数,代表特征项文本的平均聊天时间差;
将特征项文本的词频数与其对应的聊天时间系数的乘积作为特征项文本的关键度;
选取关键度大于预设阈值的特征项文本作为关键词。
进一步地,将关键词进行高亮显示之后还包括:
在检测到进行高亮的关键词被交互时,在预先建立的数据库和/或互联网上搜索与关键词对应的搜索结果页面;
弹框显示搜索结果页面。
进一步地,在预先建立的数据库和/或互联网上搜索与关键词对应的搜索结果页面包括:
利用预先建立的语义信息库对关键词进行语义匹配,获得关键词的同义词或关联词,语义信息库包括:基本概念库、常识知识库、句型关系模板库、用户综合信息库、互联网信息库、自定义预输入信息库以及与基本概念库、常识知识库、句型关系模板库、用户综合信息库、互联网信息库、自定义预输入信息库相关联的语义关系库;
利用预先建立的语义信息库以及语义规则库,对关键词进行语义推理,获得关键词的推理词,语义规则库包括:自然语义分析规则库、分类规则库、匹配规则库、数理逻辑推导规则库、处理策略库、用户行为分析规则库,其中自然语义分析规则库包括文本语境处理、词法分析、句法分析、语义分析以及篇章分析规则;
结合关键词、同义词、关联词、推理词中的任意一个或多个在预先建立的数据库和/或互联网上搜索对应的搜索结果页面。
进一步地,用户综合信息库包括:用户的个人信息、网上购物信息、上网足迹信息数据。
进一步地,历史聊天文本为与当前聊天对象的历史聊天文本,和/或与其他聊天对象的历史聊天文本。
根据本发明的另一方面,提供了一种聊天过程中智能显示关键词的装置,包括:
历史聊天文本获取装置,用于获取历史聊天文本;
关键词提取装置,用于对历史聊天文本进行分析获得关键词;
显示装置,用于判断当前聊天文本是否包含关键词,当前聊天文本为聊天过程中距离当前系统时间最短的历史聊天文本,若是,则将关键词进行高亮显示。
进一步地,关键词提取装置,包括:
预处理装置,用于对历史聊天文本进行预处理,获得特征项文本,预处理包括分词、去除停用词;
词频数统计装置,用于统计特征项文本的词频数;
平均时间差计算装置,用于计算特征项文本的平均聊天时间差,平均聊天时间差为每一个特征项文本所处的历史聊天文本对应的系统时间与当前聊天文本对应的系统时间的平均时间差;
关键词获取装置,用于基于特征项文本的词频数和平均聊天时间差获取关键词。
本发明具有以下有益效果:
本发明公开的聊天过程中智能显示关键词的方法及装置,通过获取历史聊天文本,对历史聊天文本进行分析获得关键词,判断当前聊天文本是否包含关键词,当前聊天文本为聊天过程中距离当前系统时间最短的历史聊天文本,若是,则将关键词进行高亮显示,解决了在聊天过程中通过预先设置关键词来高亮显示关键词的方式智能化程度低,导致用户体验不佳的技术问题,实现了根据历史聊天文本智能提取关键词,使得提取的关键词更具有个性化,提升了用户体验。
除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明优选实施例的聊天过程中智能显示关键词的方法的流程图;
图2是本发明优选实施例对历史聊天文本进行分析获得关键词的方法的流程图;
图3是本发明优选实施例的聊天过程中智能显示关键词的装置的结构示意图。
附图标记说明:
10、历史聊天文本获取装置;20、关键词提取装置;30显示装置。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
参照图1,本发明的优选实施例提供了一种聊天过程中智能显示关键词的方法,包括:
步骤S101,获取历史聊天文本;
步骤S102,对历史聊天文本进行分析获得关键词;
步骤S103,判断当前聊天文本是否包含关键词,当前聊天文本为聊天过程中距离当前系统时间最短的历史聊天文本,若是,则将关键词进行高亮显示。
本发明优选实施例的聊天过程中智能显示关键词的方法,通过获取历史聊天文本,对历史聊天文本进行分析获得关键词,判断当前聊天文本是否包含关键词,当前聊天文本为聊天过程中距离当前系统时间最短的历史聊天文本,若是,则将关键词进行高亮显示,解决了在聊天过程中通过预先设置关键词来高亮显示关键词的方式智能化程度低,导致用户体验不佳的技术问题,实现了根据历史聊天文本智能提取关键词,使得提取的关键词更具有个性化,提升了用户体验。
本实施例中的当前聊天文本为聊天过程中距离当前系统时间最短的聊天文本,具体地,由于本实施例为一种聊天过程中智能显示关键词的方法,故本实施例针对的情景为正在聊天的聊天背景,且当前聊天文本也可以理解为最新接收成功的那一条聊天文本。本实施例中的历史聊天文本处于实时更新的状态,即只要接收成功的聊天文本都属于历史聊天文本,但在具体的实施过程中,可以仅仅取近期(近一周、近一个月)的聊天文本作为历史聊天文本、也可以是用户自定义的任一时间段内的聊天文作为历史聊天文本。
可选地,判断当前聊天文本是否包含关键词还包括:判断当前聊天文本是否包含预设的预设关键词,若是,则将预设关键词进行高亮显示。本实施例除了根据对历史聊天文本进行分析获得关键词外,还可以通过预先设定的方式确定关键词,并且在检测到当前聊天文本包含预设关键词时将其高亮显示。
可选地,对历史聊天文本进行分析获得关键词包括:
对历史聊天文本进行预处理,获得特征项文本,预处理包括分词、去除停用词;
统计特征项文本的词频数;
计算特征项文本的平均聊天时间差,平均聊天时间差为每一个特征项文本所处的历史聊天文本对应的系统时间与当前聊天文本对应的系统时间的平均时间差;
基于特征项文本的词频数和平均聊天时间差获取关键词。
由于仅仅根据历史聊天文本分词后的特征项文本的词频数作为关键词提取的指标,可能会出现一些过时的或用户不感兴趣的关键词。例如当两个对电视剧都感兴趣的聊天双方于2014年主要讨论的电视剧为“来自星星的你”,而于2015年主要讨论的电视剧为“武则天”,故经分词后的有关“武则天”电视剧的特征项文本(例如“范冰冰”)的词频数可能远远小于2014年的“来自星星的你”的特征项文本(例如“炸鸡、啤酒”)的词频数,而类似“炸鸡、啤酒”的流行度在2015年已经消退了,故用户对这种尽管词频数较大的关键词并不感兴趣。
针对该问题,本实施例较新颖的提出将特征项文本所处的历史聊天文本对应的系统时间与当前聊天文本对应的系统时间的平均时间差作为获取关键词的另一重要指标,解决了对历史聊天文本进行分析提取关键词仅仅考虑特征项文本的词频数可能导致提取的关键词不准确或并非是聊天双方真正感兴趣的关键词的技术问题,实现了结合多项指标进行关键词的提取以及提取的关键词具有与时俱进的个性化特点,提高了关键词提取的准确性。
此外,本实施例采用正向最大匹配法或逆向最大匹配法对历史聊天文本进行分词,其中正向最大匹配法的具体过程为,首先预先设置对历史聊天文本分词用的词典,然后从待切分的历史聊天文本中按自左到右的顺序截取一个定长的文字串,通常为6至8个文字(或长度为词典中的最大词长),这个字符串的长度称为最大词长。将这个具有最大词长的字符串与词典中的词进行匹配,若匹配成功,则可确定这个字符串为词,计算机程序的指针向后移动与给定最大词长相应个数的文字,继续进行匹配,否则,把该字符串从右边逐次减去一个文字,再与词典中的词进行匹配,直到成功为止。逆向最大匹配法的基本原理与正向最大匹配法的基本原理相同,所不同的是分词时对待切分历史聊天文本的扫描方向。具体地,逆向最大匹配法从待切分历史聊天文本中截取字符串的方向是从右至左,且在与词典匹配不成功时,将所截取的字符串从左至右逐次减去一个文字,再与词典中的词进行匹配,直到匹配成功。
可选地,基于特征项文本的词频数和平均聊天时间差获取关键词包括:
    根据特征项文本的平均聊天时间差计算特征项文本的聊天时间系数,聊天时间系数的计算公式为:,其中代表聊天时间系数,代表特征项文本的平均聊天时间差;
将特征项文本的词频数与其对应的聊天时间系数的乘积作为特征项文本的关键度;
选取关键度大于预设阈值的特征项文本作为关键词。
本实施例基于特征项文本的平均聊天时间差计算特征项文本的聊天时间系数,其中聊天时间系数的计算公式为:,其中代表聊天时间系数,代表特征项文本的平均聊天时间差,本实施例设计的聊天时间系数的计算函数为一个递减函数,即随着特征项文本的平均聊天时间差的增大而减小。在获得特征项文本的聊天时间系数后,将特征项文本的词频数与其对应的聊天时间系数的乘积作为特征项文本的关键度,并选取关键度大于预设阈值的特征项文本作为关键词。由此可见,本实施例结合两个指标计算出的关键度获取最终的关键词,提高了关键词提取的准确度。
本实施例中最终的关键词可以为一个也可以为多个,具体的可以根据设置不同的预设阈值来获取,在具体的实施过程中,本实施例也可以提高多个关键词供用户选择,并将用户选择的一个或多个关键词作为最终的关键词,大大的提升了用户体验。此外,本实施例中根据特征项文本的平均聊天时间差计算特征项文本的聊天时间系数函数不限于采用本实施例的计算公式,也可以是其他关于随特征项文本的平均聊天时间差递减的函数。
将关键词进行高亮显示之后还包括:
在检测到进行高亮的关键词被交互时,在预先建立的数据库和/或互联网上搜索与关键词对应的搜索结果页面;
弹框显示搜索结果页面。
由于在实际聊天情况中,用户希望系统不仅仅能高亮显示关键词,还能显示与该关键词相关联的信息,故本实施例在检测到进行高亮的关键词被交互时,在预先建立的数据库和/或互联网上搜索与关键词对应的搜索结果页面。本实施例中进行高亮的关键词被交互的具体方式可以是单击、双击或长按等方式。
本实施例将关键词进行高亮的作用一方面是为了提示聊天双方,另一方面是用于加载搜索结果页面,即当系统检测到高亮的关键词被交互时,则弹框显示加载的搜索结果页面,也即当关键词没有高亮时,与该关键词进行交互并不会加载和弹框显示搜索结果页面。本实施例将关键词进行高亮只是将该关键词突出的一种形式,但本实施例不限于采用该种突出显示形式,例如本实施例还可以通过将关键词进行字体颜色改变、字体字形改变等多种方式进行突出。
此外,本实施例在弹框显示搜索结果页面时,可以预先设定排序规则,即在搜索到与关键词对应的搜索结果时,先将搜索结果按照预设的排序规则进行排序(例如按照搜索点击热度、搜索相关度、搜索时间等),然后再弹框显示排序好的搜索结果页面,从而更方便了用户查看搜索结果页面,提升了用户体验。
可选地,在预先建立的数据库和/或互联网上搜索与关键词对应的搜索结果页面包括:
利用预先建立的语义信息库对关键词进行语义匹配,获得关键词的同义词或关联词,语义信息库包括:基本概念库、常识知识库、句型关系模板库、用户综合信息库、互联网信息库、自定义预输入信息库以及与基本概念库、常识知识库、句型关系模板库、用户综合信息库、互联网信息库、自定义预输入信息库相关联的语义关系库;
利用预先建立的语义信息库以及语义规则库,对关键词进行语义推理,获得关键词的推理词,语义规则库包括:自然语义分析规则库、分类规则库、匹配规则库、数理逻辑推导规则库、处理策略库、用户行为分析规则库,其中自然语义分析规则库包括文本语境处理、词法分析、句法分析、语义分析以及篇章分析规则;
结合关键词、同义词、关联词、推理词中的任意一个或多个在预先建立的数据库和/或互联网上搜索对应的搜索结果页面。
由于单纯根据历史聊天文本进行分析获得关键词进行搜索可能出现搜索范围太多,不够精准的问题。例如当性别信息为“女”,职业信息为“学生”的用户想了解其感兴趣的“包”的一些相关信息,则仅仅以该关键词“包”作为弹框显示的搜索页面的搜索关键词,则可能出现大量的跟“包”有关的搜索结果,从而导致搜索速度慢、效率低且搜索结果不准确。针对该问题,本实施例除了依据对历史聊天文本进行分析获得的关键词外,还结合关键词、同义词、关联词、推理词中的任意一个或多个在预先建立的数据库和/或互联网上搜索对应的搜索结果页面。例如当提取的感兴趣关键词为“苹果”,则系统可以通过预先设置合适的语义信息库以及语义规则库,获取到“苹果”的同义词、关联词或推理词,例如“水果”、“价格”、“品种”等等;又例如当提取的感兴趣关键词为“聚餐”,则系统可以通过预先设置合适的语义信息库以及语义规则库,获取到“聚餐”的同义词、关联词或推理词,例如“自助餐”、“酒店”、“娱乐会所”等等。
本实施例采用对感兴趣关键词进行语义分析和推理,获得关键词的同义词、关联词、推理词,让搜索时采用的搜索词更准确和更全面,避免了关键词提取不准确的问题,同时通过结合同义词、关联词、推理词,提高了根据关键词获取搜索结果页面的搜索速度和搜索效率。
可选地,用户综合信息库包括:用户的个人信息、网上购物信息、上网足迹信息数据。其中用户的个人信息可以包括职业信息、性别信息、地域信息、年龄信息、兴趣爱好信息中的任意一种或多种组合。需要说明的是,上述信息仅仅是举例说明,在具体的实现过程中并不局限于上述信息。
可选地,历史聊天文本为与当前聊天对象的历史聊天文本,和/或与其他聊天对象的历史聊天文本。
在具体的实施过程中,历史聊天文本可以仅仅为用户与当前聊天对象的历史聊天文本,或者仅仅为用户与其他聊天对象的历史聊天文本,或者既包含用户与当前聊天对象的历史聊天文本,又包含用户与其他聊天对象的历史聊天文本。同时,用户与当前聊天对象的聊天文本可以是近期(近一周、近一个月)的历史聊天文本、也可以是用户自定义的任一时间段内的聊天文本;用户与其他聊天对象的历史聊天文本可以是用户与所有的聊天对象的历史聊天文本,也可以是用户与部分聊天对象的历史聊天文本。本实施例通过将用户与其他聊天对象的历史聊天文本作为提取关键词的历史聊天文本,增大了关键词提取的历史聊天文本数量,不仅能提取出用户与当前聊天对象同时感兴趣的关键词,还能提取用户与其他聊天对象同时感兴趣的关键词,扩大了关键词的提取范围及领域,提高了用户体验。
可选地,将关键词进行高亮显示包括:
判断关键词是否均包含于当前聊天双方的历史聊天文本中,若是,则将关键词在聊天双方的当前聊天文本中同时进行高亮显示,
若否,则只在发送包含关键词的当前聊天文本对应的聊天方进行高亮显示。
由于历史聊天文本可以为与当前聊天对象的历史聊天文本,也可以为与其他聊天对象的历史聊天文本,故当历史聊天文本包括与其他聊天对象的历史聊天文本时,可能出现提取的关键词仅仅为其中一方的关键词,即对分析出的关键词不感兴趣的聊天方并不希望高亮该关键词。针对这个问题,本实施例判断关键词是否均包含于当前聊天双方的历史聊天文本中,若是,则将关键词在当前聊天双方的当前聊天文本中同时进行高亮显示,若否,则只在发送包含关键词的当前聊天文本对应的聊天方进行高亮显示。通过判断提取出的关键词是否均包含于当前聊天双方的历史聊天文本中,从而可知该关键词是否为当前聊天双方均感兴趣的内容,若是,则将关键词在当前聊天双方的当前聊天文本中同时进行高亮显示,否则,只在发送包含关键词的当前聊天文本对应的聊天方进行高亮显示,从而增强了关键词的个性化显示,提升了用户体验。
下面以一个精简的实施例对本实施例的对历史聊天文本进行分析获得关键词的方法进行更进一步的说明,参照图2,该方法主要包括以下步骤:
步骤S201,对历史聊天文本进行预处理,获得特征项文本,预处理包括分词、去除停用词。
步骤S202,统计特征项文本的词频数。
步骤S203,计算特征项文本的平均聊天时间差,平均聊天时间差为每一个特征项文本所处的历史聊天文本对应的系统时间与当前聊天文本对应的系统时间的平均时间差。本实施例假设当前的系统时间为2015年7月10日(本实施例以日为最小时间单位,处于同一日的特征项文本所处的历史聊天文本对应的系统时间相同),且假设经过对历史聊天文本进行预处理后,得到的特征项文本、特征项文本的词频数以及特征项文本所处的历史聊天文本对应的系统时间如表1所示,表1列举了三个特征项文本的词频数,及其每一个特征项文本所处的历史聊天文本对应的系统时间。根据表1所述的数据,可以得到特征项文本的平均聊天时间差。
表1
步骤S204,根据特征项文本的平均聊天时间差计算特征项文本的聊天时间系数,聊天时间系数的计算公式为:,其中代表聊天时间系数,代表特征项文本的平均聊天时间差。通过计算公式,可以得到特征项文本的聊天时间系数如表2所示。
步骤S205,将特征项文本的词频数与其对应的聊天时间系数的乘积作为特征项文本的关键度,计算结果见表2所示。从表2可以看出,尽管词频数最大的特征项文本为t1,但从表1中可知特征项文本t1所处的历史聊天文本对应的系统时间主要集中在2014年,如果仅仅根据特征项文本的词频数为指标选取关键词,可能会得到并非聊天双方真正感兴趣的关键词,此外,表2中尽管特征项文本t2和特征项文本t3的词频数都为3,但特征项文本t3对应的关键度大于特征项文本t2对应的关键度,这是由于根据其各自所处的历史聊天文本对应的系统时间来看,特征项文本t3对应的系统时间较特征项文本t2对应的系统时间更接近当前系统时间,故通过结合聊天时间系数求取的关键度获取关键词更加合理、个性化以及更加与时俱进。
本实施例将特征项文本的词频数与其对应的聊天时间系数的乘积作为关键词的选取指标,提高了关键词提取的准确度,且选取的关键词也更具有个性化以及更与时俱进。
表2
特征项文本的词频数 特征项文本的平均聊天时间差 聊天时间系数 关键度
t1=6 434.67 0.38 2.28
t2=3 66.67 0.55 1.65
t3=3 17.67 0.79 2.37
步骤S206,选取关键度大于预设阈值的特征项文本作为关键词。在具体的实施过程中,既可以通过预设阈值获取关键词,还可以先根据关键度对特征项文本进行排序,然后通过设置选取前若干个特征项文本作为关键词。
参照图3,本实施例提供了一种聊天过程中智能显示关键词的装置,包括:
历史聊天文本获取装置10,用于获取历史聊天文本;
关键词提取装置20,用于对历史聊天文本进行分析获得关键词;
显示装置30,用于判断当前聊天文本是否包含关键词,当前聊天文本为聊天过程中距离当前系统时间最短的历史聊天文本;若是,则将关键词进行高亮显示。
本发明优选实施例的聊天过程中智能显示关键词的装置,通过获取历史聊天文本,对历史聊天文本进行分析获得关键词,判断当前聊天文本是否包含关键词,当前聊天文本为聊天过程中距离当前系统时间最短的历史聊天文本,若是,则将关键词进行高亮显示,解决了在聊天过程中通过预先设置关键词来高亮显示关键词的方式智能化程度低,导致用户体验不佳的技术问题,实现了根据历史聊天文本智能提取关键词,使得提取的关键词更具有个性化,提升了用户体验。
可选地,关键词提取装置20包括:
     预处理装置,用于对历史聊天文本进行预处理,获得特征项文本,预处理包括分词、去除停用词;
    词频数统计装置,用于统计特征项文本的词频数;
    平均时间差计算装置,用于计算特征项文本的平均聊天时间差,平均聊天时间差为每一个特征项文本所处的历史聊天文本对应的系统时间与当前聊天文本对应的系统时间的平均时间差;
关键词获取装置,用于基于特征项文本的词频数和平均聊天时间差获取关键词。
本实施例的聊天过程中智能显示关键词的装置的具体工作过程和工作原理可参照本实施例中的聊天过程中智能显示关键词的方法的工作过程和工作原理。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种聊天过程中智能显示关键词的方法,其特征在于,包括:
获取历史聊天文本;
对所述历史聊天文本进行分析获得关键词;
判断当前聊天文本是否包含所述关键词,所述当前聊天文本为聊天过程中距离当前系统时间最短的历史聊天文本,若是,则将所述关键词进行高亮显示。
2.根据权利要求1所述的聊天过程中智能显示关键词的方法,其特征在于,判断当前聊天文本是否包含所述关键词还包括:
    判断当前聊天文本是否包含预设的预设关键词,若是,则将所述预设关键词进行高亮显示。
3.根据权利要求1所述的聊天过程中智能显示关键词的方法,其特征在于,对所述历史聊天文本进行分析获得关键词包括:
对所述历史聊天文本进行预处理,获得特征项文本,所述预处理包括分词、去除停用词;
统计所述特征项文本的词频数;
计算所述特征项文本的平均聊天时间差,所述平均聊天时间差为每一个所述特征项文本所处的历史聊天文本对应的系统时间与当前聊天文本对应的系统时间的平均时间差;
基于所述特征项文本的词频数和平均聊天时间差获取关键词。
4.根据权利要求3所述的聊天过程中智能显示关键词的方法,其特征在于,基于所述特征项文本的词频数和平均聊天时间差获取关键词包括:
    根据所述特征项文本的平均聊天时间差计算所述特征项文本的聊天时间系数,所述聊天时间系数的计算公式为:,其中代表聊天时间系数,代表所述特征项文本的平均聊天时间差;
将所述特征项文本的词频数与其对应的聊天时间系数的乘积作为所述特征项文本的关键度;
选取所述关键度大于预设阈值的特征项文本作为关键词。
5.根据权利要求1-4任一所述的聊天过程中智能显示关键词的方法,其特征在于,将所述关键词进行高亮显示之后还包括:
在检测到进行高亮的所述关键词被交互时,在预先建立的数据库和/或互联网上搜索与所述关键词对应的搜索结果页面;
弹框显示所述搜索结果页面。
6.根据权利要求5述的聊天过程中智能显示关键词的方法,其特征在于,在预先建立的数据库和/或互联网上搜索与所述关键词对应的搜索结果页面包括:
利用预先建立的语义信息库对所述关键词进行语义匹配,获得所述关键词的同义词或关联词,所述语义信息库包括:基本概念库、常识知识库、句型关系模板库、用户综合信息库、互联网信息库、自定义预输入信息库以及与所述基本概念库、所述常识知识库、所述句型关系模板库、所述用户综合信息库、所述互联网信息库、所述自定义预输入信息库相关联的语义关系库;
利用预先建立的所述语义信息库以及语义规则库,对所述关键词进行语义推理,获得所述关键词的推理词,所述语义规则库包括:自然语义分析规则库、分类规则库、匹配规则库、数理逻辑推导规则库、处理策略库、用户行为分析规则库,其中所述自然语义分析规则库包括文本语境处理、词法分析、句法分析、语义分析以及篇章分析规则;
结合所述关键词、所述同义词、所述关联词、所述推理词中的任意一个或多个在预先建立的数据库和/或互联网上搜索对应的搜索结果页面。
7.根据权利要求6所述的聊天过程中智能显示关键词的方法,其特征在于,
所述用户综合信息库包括:用户的个人信息、网上购物信息、上网足迹信息数据。
8.根据权利要求7所述的聊天过程中智能显示关键词的方法,其特征在于,所述历史聊天文本为与当前聊天对象的历史聊天文本,和/或与其他聊天对象的历史聊天文本。
9.一种聊天过程中智能显示关键词的装置,其特征在于,包括:
历史聊天文本获取装置(10),用于获取历史聊天文本;
关键词提取装置(20),用于对所述历史聊天文本进行分析获得关键词;
显示装置(30),用于判断当前聊天文本是否包含所述关键词,所述当前聊天文本为聊天过程中距离当前系统时间最短的历史聊天文本,若是,则将所述关键词进行高亮显示。
10.根据权利要求9所述的聊天过程中智能显示关键词的装置,其特征在于,所述关键词提取装置(20),包括:
预处理装置,用于对所述历史聊天文本进行预处理,获得特征项文本,所述预处理包括分词、去除停用词;
词频数统计装置,用于统计所述特征项文本的词频数;
平均时间差计算装置,用于计算所述特征项文本的平均聊天时间差,所述平均聊天时间差为每一个所述特征项文本所处的历史聊天文本对应的系统时间与当前聊天文本对应的系统时间的平均时间差;
关键词获取装置,用于基于所述特征项文本的词频数和平均聊天时间差获取关键词。
CN201510447176.6A 2015-07-28 2015-07-28 聊天过程中智能显示关键词的方法及装置 Pending CN104951435A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510447176.6A CN104951435A (zh) 2015-07-28 2015-07-28 聊天过程中智能显示关键词的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510447176.6A CN104951435A (zh) 2015-07-28 2015-07-28 聊天过程中智能显示关键词的方法及装置

Publications (1)

Publication Number Publication Date
CN104951435A true CN104951435A (zh) 2015-09-30

Family

ID=54166098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510447176.6A Pending CN104951435A (zh) 2015-07-28 2015-07-28 聊天过程中智能显示关键词的方法及装置

Country Status (1)

Country Link
CN (1) CN104951435A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106656732A (zh) * 2015-11-04 2017-05-10 陈包容 一种基于场景信息获取聊天回复内容的方法及装置
CN107180098A (zh) * 2017-05-16 2017-09-19 武汉斗鱼网络科技有限公司 一种信息搜索中关键词淘汰方法及装置
CN107506348A (zh) * 2017-07-22 2017-12-22 长沙兔子代跑网络科技有限公司 一种基于聊天内容挖掘代跑客户的方法及装置
CN108288240A (zh) * 2017-06-29 2018-07-17 广州华多网络科技有限公司 一种基于在线教育提问显示的方法及装置
CN108874787A (zh) * 2018-06-12 2018-11-23 深圳市合言信息科技有限公司 一种分析语音意图并进行深度翻译解说的方法
CN109120781A (zh) * 2018-08-03 2019-01-01 Oppo广东移动通信有限公司 信息提示方法、电子装置及计算机可读存储介质
CN109542288A (zh) * 2018-11-29 2019-03-29 深圳市口袋网络科技有限公司 一种信息显示的方法、系统及相关组件
CN109547648A (zh) * 2019-01-17 2019-03-29 维沃移动通信有限公司 一种信息的获取方法及终端
CN109582846A (zh) * 2018-11-21 2019-04-05 百度在线网络技术(北京)有限公司 通过文章进行搜索的方法、装置、电子设备及存储介质
CN114550430A (zh) * 2022-04-27 2022-05-27 北京亮亮视野科技有限公司 基于ar技术的文字提醒方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167398A (en) * 1997-01-30 2000-12-26 British Telecommunications Public Limited Company Information retrieval system and method that generates weighted comparison results to analyze the degree of dissimilarity between a reference corpus and a candidate document
CN103514213A (zh) * 2012-06-28 2014-01-15 华为技术有限公司 词语提取方法及装置
CN103955470A (zh) * 2014-03-28 2014-07-30 华为技术有限公司 热点话题推送方法和装置
CN104092814A (zh) * 2014-05-16 2014-10-08 陈包容 一种在手机通信中弹窗显示联系人信息或/和其数据分析结果的方法
US20140372403A1 (en) * 2013-06-13 2014-12-18 Tencent Technology (Shenzhen) Company Limited Methods and systems for information matching
CN104679768A (zh) * 2013-11-29 2015-06-03 百度在线网络技术(北京)有限公司 从文档中提取关键词的方法和设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167398A (en) * 1997-01-30 2000-12-26 British Telecommunications Public Limited Company Information retrieval system and method that generates weighted comparison results to analyze the degree of dissimilarity between a reference corpus and a candidate document
CN103514213A (zh) * 2012-06-28 2014-01-15 华为技术有限公司 词语提取方法及装置
US20140372403A1 (en) * 2013-06-13 2014-12-18 Tencent Technology (Shenzhen) Company Limited Methods and systems for information matching
CN104679768A (zh) * 2013-11-29 2015-06-03 百度在线网络技术(北京)有限公司 从文档中提取关键词的方法和设备
CN103955470A (zh) * 2014-03-28 2014-07-30 华为技术有限公司 热点话题推送方法和装置
CN104092814A (zh) * 2014-05-16 2014-10-08 陈包容 一种在手机通信中弹窗显示联系人信息或/和其数据分析结果的方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106656732A (zh) * 2015-11-04 2017-05-10 陈包容 一种基于场景信息获取聊天回复内容的方法及装置
CN107180098A (zh) * 2017-05-16 2017-09-19 武汉斗鱼网络科技有限公司 一种信息搜索中关键词淘汰方法及装置
CN107180098B (zh) * 2017-05-16 2019-11-12 武汉斗鱼网络科技有限公司 一种信息搜索中关键词淘汰方法及装置
CN108288240A (zh) * 2017-06-29 2018-07-17 广州华多网络科技有限公司 一种基于在线教育提问显示的方法及装置
CN107506348A (zh) * 2017-07-22 2017-12-22 长沙兔子代跑网络科技有限公司 一种基于聊天内容挖掘代跑客户的方法及装置
CN108874787A (zh) * 2018-06-12 2018-11-23 深圳市合言信息科技有限公司 一种分析语音意图并进行深度翻译解说的方法
CN109120781A (zh) * 2018-08-03 2019-01-01 Oppo广东移动通信有限公司 信息提示方法、电子装置及计算机可读存储介质
CN109582846A (zh) * 2018-11-21 2019-04-05 百度在线网络技术(北京)有限公司 通过文章进行搜索的方法、装置、电子设备及存储介质
CN109542288A (zh) * 2018-11-29 2019-03-29 深圳市口袋网络科技有限公司 一种信息显示的方法、系统及相关组件
CN109542288B (zh) * 2018-11-29 2021-10-22 深圳市口袋网络科技有限公司 一种信息显示的方法、系统及相关组件
CN109547648A (zh) * 2019-01-17 2019-03-29 维沃移动通信有限公司 一种信息的获取方法及终端
CN109547648B (zh) * 2019-01-17 2020-11-03 维沃移动通信有限公司 一种信息的获取方法及终端
CN114550430A (zh) * 2022-04-27 2022-05-27 北京亮亮视野科技有限公司 基于ar技术的文字提醒方法和装置

Similar Documents

Publication Publication Date Title
CN104951435A (zh) 聊天过程中智能显示关键词的方法及装置
CN106709040B (zh) 一种应用搜索方法和服务器
CN110162593B (zh) 一种搜索结果处理、相似度模型训练方法及装置
CN109815308B (zh) 意图识别模型的确定及检索意图识别方法、装置
US10423648B2 (en) Method, system, and computer readable medium for interest tag recommendation
US11429680B2 (en) Topic subscription method and apparatus, and storage medium
Burger et al. Discriminating gender on Twitter
CN108628833B (zh) 原创内容摘要确定方法及装置,原创内容推荐方法及装置
CN110019658B (zh) 检索项的生成方法及相关装置
US11514063B2 (en) Method and apparatus of recommending information based on fused relationship network, and device and medium
US20180053234A1 (en) Description information generation and presentation systems, methods, and devices
CN106951494A (zh) 一种信息推荐方法及装置
CN107330057B (zh) 一种ElasticSearch搜索相关度算法优化方法及系统
CN104011712A (zh) 对跨语言查询建议的查询翻译进行评价
JP2005122533A (ja) 質問応答システムおよび質問応答処理方法
CA3059929C (en) Text searching method, apparatus, and non-transitory computer-readable storage medium
CN104408191A (zh) 关键词的关联关键词的获取方法和装置
Petz et al. On text preprocessing for opinion mining outside of laboratory environments
WO2018058118A1 (en) Method, apparatus and client of processing information recommendation
CN105005555A (zh) 基于聊天时间的关键词提取方法及装置
CN110674365A (zh) 一种搜索方法、装置、设备及存储介质
CN113934941A (zh) 一种基于多维度信息的用户推荐系统及方法
CN103279504A (zh) 一种基于歧义消解的搜索方法及装置
Yao et al. Online deception detection refueled by real world data collection
Wei et al. Online education recommendation model based on user behavior data analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150930

WD01 Invention patent application deemed withdrawn after publication