聊天记录的快速识别方法及其装置
技术领域
本发明涉及通信领域,特别涉及一种聊天记录的快速识别方法及装置。
背景技术
随着通信技术的快速发展,人们越来越多地使用终端装置进行聊天,例如使用手机互发短信进行聊天,或者使用电脑或手机上的即时通信类应用(APP)互发消息进行聊天。以往,通常只允许用户对在聊天过程中输入过的文字信息进行关键词检索。这种检索只是一种简单的关键词匹配,有着很大的局限性。
例如,在聊天过程中,用户A向用户B发送了一段文字信息:“原名周树人,字豫才,浙江绍兴人。中国现代伟大的文学家、思想家和革命家,早年曾留学日本,五四时期提倡新思想、新文化、新道德,发表了中国现代文学史上第一篇白话小说《狂人日记》,成为新文化运动的主力军。1927年后定居上海,领导中国左翼作家联盟,粉碎国民党文化围剿,以笔代戈,奋笔疾书,战斗一生,被誉为民族魂”。很显然,这段信息所记载的内容实际上是中国现代伟大文学家鲁迅先生的生平简介。如果用户B在收到这条聊天记录之后,过了很长时间(例如半年),想在以往的聊天记录中找出这条聊天记录,由于只能输入关键词进行简单的匹配,如果用户B无法回想起这段聊天记录中的某个关键词,而只记得“鲁迅简介”这样的简单信息,那么用户B在检索时无论是输入“鲁迅”还是输入“简介”,由于在聊天记录中没有出现过“鲁迅”和“简介”这两个词,都无法从聊天记录历史中将这条聊天记录找出来。
除此之外,如果聊天记录的形式是图片、语音、链接等等非文字类的信息的话,则直接无法进行检索,后续也没有办法进行补救。
发明内容
本发明的目的在于提供一种聊天记录的快速识别方法及其装置,为聊天记录添加作为作为备注的关键词,让用户可以弥补之前的遗漏,节约后续查找的时间,从而可以从聊天记录历史中快速识别出任意类型的聊天记录。
为解决上述技术问题,本发明的实施方式公开了一种聊天记录的快速识别方法,为用户的聊天记录添加备注,从而在检索时可通过对备注的匹配检索到相应的聊天记录,该方法包括以下步骤:
为用户的聊天记录添加相应的备注;
将添加的备注和聊天记录进行关联后存储于服务器;以及
将用户检索的关键词与所有存储于服务器的备注匹配,与匹配成功的备注所关联的聊天记录被返回给用户作为检索结果。
本发明的实施方式还公开了一种聊天记录的快速识别装置,包括:
添加单元,用于为用户的聊天记录的类型添加相应的备注;
存储单元,用于将添加单元所添加的备注和聊天记录进行关联后存储于服务器;以及
匹配单元,用于将用户检索的关键词与所有存储于服务器的备注匹配,与匹配成功的备注所关联的聊天记录被返回给用户作为检索结果。
本发明实施方式与现有技术相比,主要区别及其效果在于:
为用户的聊天记录添加备注,从而在检索时可通过对备注的匹配检索到相应的聊天记录,无须用户对于聊天记录的实际内容进行记忆,只要有大致印象就能快速识别出聊天记录。
进一步地,根据聊天记录的类型,用不同的方式自动获取关键词,从而能对应各种类型的聊天记录,弥补了现有技术不能对非文字类聊天记录进行搜索的缺陷。
进一步地,可采集用户手动添加的内容作为备注,进一步提高了备注的准确性,从而提高了搜索精度。
附图说明
图1是本发明第一实施方式中一种聊天记录的快速识别方法的流程示意图。
图2是本发明第二实施方式中一种聊天记录的快速识别装置的结构示意图。
具体实施方式
在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请各权利要求所要求保护的技术方案。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的实施方式作进一步地详细描述。
本发明第一实施方式涉及一种聊天记录的快速识别方法。图1是该聊天记录的快速识别方法的流程示意图。
具体地说,该聊天记录的快速识别方法为用户的聊天记录添加备注,从而在检索时可通过对备注的匹配检索到相应的聊天记录。如图1所示,该快速识别方法包括以下步骤:
在步骤S101中,为用户的聊天记录添加相应的备注。
此后进入步骤S102,将添加的备注和聊天记录进行关联后存储于服务器。
此后进入步骤S103,将用户检索的关键词与所有存储于服务器的备注匹配,与匹配成功的备注所关联的聊天记录被返回给用户作为检索结果。
此后结束本流程。
可以理解,步骤S101中可以为任意类型的聊天记录添加相应的步骤,例如文字、图片、语音、链接、视频等等,而并不局限于文字这一种类型。
例如,判别用户的聊天记录的类型,当聊天记录的类型判别为文字时,则可以通过句法分析得到关键词,将得到的关键词作为备注。以上述背景技术部分所举的例子来说,对于这条聊天记录,其类型为文字,此时对整条聊天记录进行句法分析,根据其中的一些特定名词,如“周树人”、“狂人日记”等等,得到类似于“鲁迅简介”这样的关键字作为备注与该条聊天记录相关联后存储于服务器。如此一来,用户B根本无需去记忆这条聊天记录中的具体信息,只需要大致上记得起内容讲的是鲁迅的简介,就可以通过输入例如“鲁迅”这样的检索关键词而与服务器上的“鲁迅简介”的备注匹配成功,找出这条聊天记录。
例如,判别用户的聊天记录的类型,当聊天记录的类型判别为图片时,则可以通过图像识别得到关键词,将得到的关键词作为备注。如在聊天过程中,用户A向用户B发送了一张日出的风景照片,对于该条聊天记录,其类型为图片,此时对其进行图像识别,得到类似于“日出”这样的关键字作为备注与该条聊天记录相关联后存储于服务器。如此一来,用户B只需要大致上记得起内容是一张日出的照片,就可以通过输入例如“日出”这样的检索关键词而与服务器上的“日出”的备注匹配成功,找出这条聊天记录。
例如,判别用户的聊天记录的类型,当聊天记录的类型判别为语音时,则可以通过语音识别和句法分析得到关键词,将得到的关键词作为备注。以上述背景技术部分所举的例子来说,假设用户A是以一段语音而非文字的方式将这段内容发送给用户B,对于该条聊天记录,其类型为语音,此时对其进行语音识别得到其对应的文字,再对文字进行句法分析,根据其中的一些特定名词,如“周树人”、“狂人日记”等等,得到类似于“鲁迅简介”这样的关键字作为备注与该条聊天记录相关联后存储于服务器。如此一来,用户B根本无需去记忆这条聊天记录中的具体信息,只需要大致上记得起用户A曾经向自己发送过一段语音,语音讲的是鲁迅的简介,就可以通过输入例如“鲁迅”这样的检索关键词而与服务器上的“鲁迅简介”的备注匹配成功,找出这条聊天记录。
例如,判别用户的聊天记录的类型,当聊天记录的类型判别为链接时,则可以通过域名分析得到关键词,将得到的关键词作为备注。如在聊天过程中,用户A向用户B发送了一个链接“http://detail.tmall.com/item.htm?spm=a230r.1.14.2.6OVTD0&id=41740960494&ad_id=&am_id=&cm_id=140105335569ed55e27b&pm_id=&abbucket=11&sku_properties=”,对于该条聊天记录,其类型为链接,此时对其进行域名分析,得到类似于“天猫商城购买链接”这样的关键字作为备注与该条聊天记录相关联后存储于服务器。如此一来,用户B根本无需去记忆复杂的链接本身,只需要大致上记得起聊天的内容是天猫的链接,就可以通过输入例如“天猫”这样的检索关键词而与服务器上的“天猫商城购买链接”的备注匹配成功,找出这条聊天记录。
由此可见,根据聊天记录的类型,本发明的技术方案用不同的方式自动获取关键词,从而能对应各种类型的聊天记录,弥补了现有技术不能对非文字类聊天记录进行搜索的缺陷。
可选地,采集用户手动添加的内容作为备注,例如在上述天猫链接的例子中,用户B为了进一步提高备注的准确性,在收到该链接时直接输入“iphone6天猫商城购买链接”,则该输入的内容被采集作为备注与该条聊天记录相关联后存储于服务器,这样一来,除了“天猫”这个关键词以外,用户B将来进行检索时输入“iphone6”同样能够与服务器上的“iphone6天猫商城购买链接”的备注匹配成功,找出这条聊天记录。由此,进一步提高了搜索的准确度。
本发明的各方法实施方式均可以以软件、硬件、固件等方式实现。不管本发明是以软件、硬件、还是固件方式实现,指令代码都可以存储在任何类型的计算机可访问的存储器中(例如永久的或者可修改的,易失性的或者非易失性的,固态的或者非固态的,固定的或者可更换的介质等等)。同样,存储器可以例如是可编程阵列逻辑(Programmable ArrayLogic,简称“PAL”)、随机存取存储器(Random Access Memory,简称“RAM”)、可编程只读存储器(Programmable Read Only Memory,简称“PROM”)、只读存储器(Read-Only Memory,简称“ROM”)、电可擦除可编程只读存储器(Electrically Erasable Programmable ROM,简称“EEPROM”)、磁盘、光盘、数字通用光盘(Digital Versatile Disc,简称“DVD”)等等。
本发明第二实施方式涉及一种聊天记录的快速识别装置。图2是该聊天记录的快速识别装置的结构示意图。本发明的实际结构可以根据实际需要做出必要的调整,并不局限于图2中的结构。
具体地说,该聊天记录的快速识别装置为用户的聊天记录添加备注,从而在检索时可通过对备注的匹配检索到相应的聊天记录。如图2所示,该快速识别装置100包括:
添加单元101,用于为用户的聊天记录的类型添加相应的备注;
存储单元102,用于将添加单元所添加的备注和聊天记录进行关联后存储于服务器;以及
匹配单元103,用于将用户检索的关键词与所有存储于服务器的备注匹配,与匹配成功的备注所关联的聊天记录被返回给用户作为检索结果。
第一实施方式是与本实施方式相对应的方法实施方式,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
可选地,添加单元101中包括:文字记录添加单元201,用于聊天记录的类型判别为文字时通过句法分析得到关键词,将得到的关键词作为备注;图片记录添加单元202,用于聊天记录的类型判别为图片时通过图像识别得到关键词,将得到的关键词作为备注;语音记录添加单元203,用于聊天记录的类型判别为语音时通过语音识别和句法分析得到关键词,将得到的关键词作为备注;以及链接记录添加单元204,用于聊天记录的类型判别为链接时通过域名分析得到关键词,将得到的关键词作为备注。可以理解的是,添加单元101还可以包括其他结构,例如视频记录添加单元等,来对应其他类型的聊天记录,并不限于上述结构。由此可见,根据聊天记录的类型,本发明的技术方案用不同的方式自动获取关键词,从而能对应各种类型的聊天记录,弥补了现有技术不能对非文字类聊天记录进行搜索的缺陷。
可选地,快速识别装置100还包括采集单元104(在图2中未示出),用于采集用户手动添加的内容,当采集单元采集到用户手动添加的内容时,存储单元102将采集单元104所采集的内容代替添加单元所添加的备注和聊天记录进行关联。由此,进一步提高了搜索的准确度。
需要说明的是,本发明各设备实施方式中提到的各单元都是逻辑单元,在物理上,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现,这些逻辑单元本身的物理实现方式并不是最重要的,这些逻辑单元所实现的功能的组合才是解决本发明所提出的技术问题的关键。此外,为了突出本发明的创新部分,本发明上述各设备实施方式并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,这并不表明上述设备实施方式并不存在其它的单元。
需要说明的是,在本专利的权利要求和说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
虽然通过参照本发明的某些优选实施方式,已经对本发明进行了图示和描述,但本领域的普通技术人员应该明白,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。