CN108694168A - 一种称呼处理方法及装置、计算机装置及可读存储介质 - Google Patents
一种称呼处理方法及装置、计算机装置及可读存储介质 Download PDFInfo
- Publication number
- CN108694168A CN108694168A CN201810449482.7A CN201810449482A CN108694168A CN 108694168 A CN108694168 A CN 108694168A CN 201810449482 A CN201810449482 A CN 201810449482A CN 108694168 A CN108694168 A CN 108694168A
- Authority
- CN
- China
- Prior art keywords
- recipient
- character
- pet name
- communication message
- appellation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/258—Heading extraction; Automatic titling; Numbering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明实施例公开了一种称呼处理方法及装置,用于从用户应用数据库的通讯数据中自动提取用户昵称,提升昵称获取效率及准确率。本发明实施例方法包括:从应用数据库中提取通讯消息,通讯消息至少包括发送方与接收方;获取通讯消息中与接收方相关的第一通讯消息;从第一通讯消息中按照预设规则获取对接收方的昵称。本发明实施例还公开了一种称呼处理装置,用于从用户应用数据库的通讯数据中自动提取用户昵称,提升昵称获取效率及准确率。
Description
技术领域
本发明涉及数据通讯技术领域,尤其涉及一种称呼处理方法及装置、计算机装置及可读存储介质。
背景技术
人名昵称是人与人、应用与用户沟通交互时采用的一种非正式的称谓。人与人沟通过程中使用昵称,能够快速拉近彼此之间距离,建立亲密感。而在应用与用户交互的场景中使用昵称称呼用户,则可以极大提升用户的好感,给用户以惊喜,增强用户的使用黏性。比如,越来越多的应用都选择在给用户的各类系统提示信息、开屏欢迎词等地方加上用户昵称。
昵称的提供传统上一般依靠用户主动提供,比如在注册用户信息时让用户填写昵称条目,也有一些方法依靠一些简单的规则从人的正式姓名中挖掘出名字部分作为昵称,比如利用字符串处理的方法把姓氏去掉保留名字。
依靠用户主动提供昵称一方面会增加用户的负担,降低用户对应用的注册和使用率;另一方面,由用户主动提供的昵称出现在各类系统消息中,也降低了用户的惊喜感。
发明内容
本发明实施例提供了一种称呼处理方法及装置,计算机装置及可读存储介质,用于从用户应用数据库的通讯数据中自动提取用户昵称,提升昵称获取效率及准确率。
本发明实施例第一方面提供了一种称呼处理方法,包括:
从应用数据库中提取通讯消息,所述通讯消息至少包括发送方与接收方;
获取所述通讯消息中与所述接收方相关的第一通讯消息;
从所述第一通讯消息中按照预设规则获取对所述接收方的昵称。
优选的,第一通讯消息包括:
接收方的身份标识、接收方的真实姓名及所述接收方在预设时间段内接收到的通讯消息。
优选的,从所述第一通讯消息中按照预设规则获取对所述接收方的昵称,包括:
将所述第一通讯消息划分为多个句子;
判断每个句子中是否存在标点符号或空格;
当所述句子中存在标点符号或空格时,判断每个句子中第一次出现的标点符号或空格前的第一字符长度是否不大于预设值;
若是,则将第一字符设置为所述接收方的昵称。
优选的,在判断每个句子中是否存在标点符号或空格之后,该方法还包括:
当所述句子中不存在标点符号或空格时,将所述句子按顺序切分为多个预设长度的字符;
判断所述字符是否与所述接收方的真实姓名相关;
若是,则提取出与所述接收方的真实姓名相关的第二字符,并将所述第二字符设置为所述接收方的昵称。
优选的,该方法还包括:
设置特殊称谓表及错误称谓表,所述特殊称谓表用于存储被误判为非昵称的称谓,所述错误称谓表用于存储被误判为昵称的称谓;
当所述第一字符或所述第二字符存在于所述特殊称谓表或所述错误称谓表中时,则对所述第一字符或所述第二字符进行昵称更正。
优选的,该方法还包括:
统计所述第一字符或所述第二字符,被同一发送方和/或不同发送方使用的次数;
当所述次数超出预设的阈值时,将所述第一字符或所述第二字符设置为所述接收方的昵称。
优选的,该方法还包括:
将所述接收方的昵称,推送至与所述接收方的身份标识相关的系统消息中。
本发明实施例第二方面提供了一种称呼处理装置,包括:
提取单元,用于从应用数据库中提取通讯消息,所述通讯消息至少包括发送方与接收方;
第一获取单元,用于获取所述通讯消息中与所述接收方相关的第一通讯消息;
第二获取单元,用于从所述第一通讯消息中按照预设规则获取对所述接收方的昵称。
优选的,第二获取单元,包括:
划分模块,用于将所述第一通讯消息划分为多个句子;
第一判断模块,用于判断每个句子中是否存在标点符号或空格;
第二判断模块,用于在所述句子中存在标点符号或空格时,判断每个句子中第一次出现的标点符号或空格前的第一字符长度是否不大于预设值;
第一设置模块,用于在第一字符长度不大于预设值时,将第一字符设置为所述接收方的昵称。
优选的,第二获取单元,还包括:
切分模块,用于当所述句子中不存在标点符号或空格时,将所述句子按顺序切分为多个预设长度的字符;
第三判断模块,用于判断所述字符是否与所述接收方的真实姓名相关;
提取设置模块,用于在所述字符与接收方的真实姓名相关时,提取出与所述接收方的真实姓名相关的第二字符,并将所述第二字符设置为所述接收方的昵称。
优选的,该装置还包括:
第一设置单元,用于设置特殊称谓表及错误称谓表,所述特殊称谓表用于存储被误判为非昵称的称谓,所述错误称谓表用于存储被误判为昵称的称谓;
更正单元,用于当所述第一字符或所述第二字符存在于所述特殊称谓表或所述错误称谓表中时,则对所述第一字符或所述第二字符进行昵称更正。
优选的,该装置还包括:
统计单元,用于统计所述第一字符或所述第二字符,被同一发送方和/或不同发送方使用的次数;
第二设置单元,用于当所述次数超出预设的阈值时,将所述第一字符或所述第二字符设置为所述接收方的昵称。
优选的,该装置还包括:
推送单元,用于将所述接收方的昵称,推送至与所述接收方的身份标识相关的系统消息中。
本发明实施例还提供了一种计算机装置,包括处理器,该处理器在执行存储于存储器上的计算机程序时,用于实现本发明实施例第一方面所提供的称呼处理方法。
本发明实施例还提供了一种可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,用于实现本发明实施例第一方面所提供的称呼处理方法。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例中,从应用数据库中提取通讯消息,该通讯消息至少包括发送方及接收方,获取通讯消息中与接收方相关的第一通讯消息,从第一通讯消息中按照预设规则获取对接收方的昵称,本发明是从与接收方相关的第一通讯消息中,按照预设规则自动获取对接收方的昵称,故该昵称的获取效率更高,,且随着应用数据库中通讯消息的更新,获取到的用户昵称也是用户最新使用的昵称,故获取到的用户昵称也更准确。
附图说明
图1为移动办公应用云之家在语音助手的首页上使用用户昵称的示意图;
图2为本发明实施例中称呼处理方法的一个实施例示意图;
图3为本发明实施例中称呼处理方法的另一个实施例示意图;
图4为本发明实施例中称呼处理方法的另一个实施例示意图;
图5为本发明实施例中称呼处理方法的另一个实施例示意图;
图6为本发明实施例中称呼处理装置的一个实施例示意图。
具体实施方式
本发明实施例提供了一种称呼处理方法及装置,用于从用户应用数据库的通讯数据中自动提取用户昵称,提升昵称获取效率及准确率。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
人名昵称是人与人、应用与用户沟通交互时采用的一种非正式的称谓。人与人沟通过程中使用昵称,能够快速拉近彼此之间距离,建立亲密感。而在应用与用户交互的场景中使用昵称称呼用户,则可以极大提升用户的好感,给用户以惊喜,增强用户的使用黏性。比如,越来越多的应用都选择在给用户的各类系统提示信息、开屏欢迎词等地方加上用户昵称。图1所示为移动办公应用云之家在语音助手的首页上使用用户的昵称情形,“Hi可哥,我是小云”的欢迎词由于加上了用户昵称“可哥”,比“Hi我是小云”更具人性化和亲切感。
昵称的提供传统上一般依靠用户主动提供,比如在注册用户信息时让用户填写昵称条目,也有一些方法依靠一些简单的规则从人的正式姓名中挖掘出名字部分作为昵称,比如利用字符串处理的方法把姓氏去掉保留名字。
依靠用户主动提供昵称一方面会增加用户的负担,降低用户对应用的注册和使用率;另一方面,由用户主动提供的昵称出现在各类系统消息中,也降低了用户的惊喜感。
针对现有技术中依靠用户主动提供昵称,或依靠简单规则获取用户昵称从而降低用户使用体验的问题,本发明提出了一种称呼处理方法及装置,计算机装置及可读存储介质,用于从用户应用数据库的通讯数据中自动提取用户昵称,提升昵称获取效率及准确率,进而提高用户的使用体验。
为方便理解,下面来描述本发明实施例中的称呼处理方法,请参阅图2,本发明实施例中的称呼处理方法的一个实施例,包括:
201、从应用数据库中提取通讯消息,该通讯消息至少包括发送方与接收方;
为了提高获取用户昵称的准确率,可以从用户终端的应用数据库中提取通讯消息,并从用户的通讯消息中获取对不同用户的昵称,该通讯消息至少包括发送方及接收方。
容易理解的是,在终端提供的各种应用中,如微信、淘宝、飞鸽、QQ、移动办公软件等,都支持即时消息,即对话框消息,不同的用户之间可以通过该对话框消息随时进行语音或文字通讯,且该即时消息既支持用户之间一对一的交流,也支持多个用户之间的交流,即群消息,而用户的通讯消息也存储在对应应用软件的应用数据库中。
在进行语音或文字通讯时,为了明确通讯对象,用户往往会在通讯消息前,加入对对方的称呼,若用户之间的关系不同,用户之间也会使用不同的昵称,以区分不同的场合和使用场景,故可以通过应用数据库中存储的通讯消息,来提取对用户的不同昵称。
202、获取该通讯消息中与接收方相关的第一通讯消息;
在各种通讯消息中,不论是一对一的通讯消息,还是群通讯消息,用户在发送信息时,为了明确发送对象,都会在第一次发送的消息前,加上对应的称呼。
昵称,是发送方对接收方的一种称呼,而为了提取用户昵称,需要先收集与该用户相关的通讯消息,且在该通讯消息中,用户是作为接收方的,故在应用数据库中提取到通讯消息后,需要获取该通讯消息中与接收方相关的第一通讯消息,以便于从第一通讯消息中提取出对接收方的昵称。
具体的,第一通讯消息包括:接收方的身份标识、接收方的真实名称及接收方在预设时间段内接收到的通讯消息,其中,接收方的身份标识,是指在各种应用中,对该接收方身份的唯一标识,如微信中,接收方使用的微信号码;QQ中,接收方的QQ号码,移动办公软件中,接收方的用户ID等,在不同的应用中,接收方的身份标识可以相同也可以不同,但需要在同一应用中,保证用户身份标识的唯一性;接收方的真实姓名是指用户在注册应用时,提供的用户在实际生活中使用的真实姓名,可以用于帮助分析不同消息中发送方对接收方的不同昵称;接收方在预设时间段内接收到的通讯消息,主要用于提取不同发送方对接收方的昵称,而为了提高准确性,时间段设置的时间越长,提取结果一般会越准确,但数据越多,往往会增加处理器的运算负担,故可以根据实际需求,对预设时间段进行自定义,可以为一周、一个月或一年,此处不做具体限制。
203、从第一通讯消息中按照预设规则获取对接收方的昵称。
称呼处理装置获取到与接收方相关的第一通讯消息后,即可按照预设规则从第一通讯消息中,提取出对接收方的昵称,具体的,对于详细的提取过程,在下面的实施例中详细描述。
本发明实施例中,从应用数据库中提取通讯消息,该通讯消息至少包括发送方及接收方,获取通讯消息中与接收方相关的第一通讯消息,从第一通讯消息中按照预设规则获取对接收方的昵称,本发明是从与接收方相关的第一通讯消息中,按照预设规则自动获取对接收方的昵称,故该昵称的获取效率更高,且随着应用数据库中通讯消息的更新,获取到的用户昵称也是用户最新使用的昵称,故获取到的用户昵称也更准确。
基于图2所述的实施例,下面详细描述从第一通讯消息中提取对接收方昵称的过程,请参阅图3,本发明实施例中称呼处理方法的另一个实施例,包括:
301、将第一通讯消息划分为多个句子;
容易理解的是,在即时消息中,用户之间的沟通消息都是由发送方和接收方之间的多条消息语句组成的。如:
A:张宝,今天中午一起吃饭吧。
B:好的呀,具体地点是哪,要不要提前预约下呢?
A:放心吧,我已经约好了,稍后把具体地点发你哈。
B:小锤子,真是太好了,那中午见吧。
具体的,在每个应用中,发送方和接收方都有唯一的身份标识,可以根据发送方和接收方唯一的身份标识,对接收方在不同时间段的沟通消息进行提取。对于一对一的通讯消息,很容易根据发送方和接收方的身份标识,提取出与接收方相关的第一通讯消息,而对于群消息,则可以使用@功能,提取出与被@方,即接收方相关的第一通讯消息。
称呼处理装置获取到第一通讯消息后,其中,第一通讯消息一般是由多个消息语句组成,则将第一通讯消息划分为多个句子。具体的,句子的划分方法可以有很多种,可以是将发送方发送的每条信息视为一个句子,也可以是根据具体的标点符号,如句号,问号,省略号等,来将第一通讯消息划分为多个句子。此处句子的划分主要是用于方便提取对用户的昵称,而对句子的划分方法不做具体限制。
302、判断每个句子中是否存在标点符号或空格,若是,则执行步骤303,若否,则执行步骤305。
一般的,用户在发送消息时,都会在句首的位置加入对对方的称呼,且出于语言习惯,往往会在称呼后,加入对应的标点符号或空格,故可以通过每个句子中是否存在标点符号或空格,对用户的昵称进行辅助判断,并在该句子中存在标点符号或空格时,执行步骤303,而在该句子中不存在标点符号或空格时,执行步骤305。
需要说明的时,在发送消息时,一般为非正式的文字通讯,而不同的人为了方便,可能会使用不同的标点符号,故此处对标点符号的类型,不做具体限制,可以是逗号、冒号、句号、或感叹号等。
303、判断每个句子中第一次出现的标点符号或空格前的第一字符长度是否不大于预设值,若是,则执行步骤304,若否,则执行步骤308。
出于语言习惯,消息发送方在发送消息时,经常会在句首的位置加入对对方的称呼或昵称,且在称呼后加上标点符号或空格,而一般对用户的称呼也不会太长,故可以通过提取每个句子中第一次出现的标点符号或空格前的第一字符,并在第一字符的长度不大于预设值时,将该第一字符设置为接收方的昵称。
通常情况下,根据语言习惯,对用户的昵称一般小于3个字符,故可以将预设值设置为3,即判断每个句子中第一次出现的标点符号或空格前的第一字符的长度是否不大于3,并在判断结果为“是”时,执行步骤304;否则,执行步骤308。
需要说明的是,对于预设值大小,可以根据实际使用场景,进行更改,如在游戏场景中,用户的昵称一般比较长,则可以将预设值设置为5或者8,此处对预设值的大小不做具体限制。
304、将第一字符设置为接收方的昵称。
当句子中第一次出现的标点符号或空格前的第一字符长度不大于预设值时,则将第一字符设置为接收方的昵称。
305、将所述句子按顺序切分为多个预设长度的字符;
在实际消息发送中,有些用户没有使用标点符号或空格的习惯,故在判断步骤302中,当第一通讯消息中的句子中不存在标点符号或空格时,则可以将句子按顺序切分为多个预设长度的字符。
具体的,在切分过程中,可以使用自然语言分词处理工具,如Jieba、LTP等,在切分过程中,根据语言习惯,既可以将句子按语句顺序切分为2个字符长度的的字符,也可以是切分为3个字符长度的字符,此处对字符的预设长度不做具体限制。
306、判断所述字符是否与接收方的真实姓名相关,若是,则执行步骤307,若否,则执行步骤308。
将句子切分为预设长度的多个字符后,可以依次判断被切分后的每个字符是否与接收方的真实姓名相关,且根据语言习惯,用户更倾向于在句首的位置插入昵称,故可以优先判断位于句首位置的字符是否与接收方的真实姓名相关,若相关,则执行步骤307,若不相关,则执行步骤308。
如接收方的真实姓名为李春华,若切分出的字符与“李”、“春”、“华”三个字相关,则提取出与接收方真实姓名相关的字符。具体的,相关可以表现为同音、如小花;或出现同样的字形,如华姐、李姐、春春、春姐等;或可以联想到的其他相关等,此处对相关的形式不做具体限制。
在实际对语句进行切分的过程中,可能会出现用户昵称被切分开的情况,如当消息语句中出现“亲爱的春春”时,若将该语句切分为2个字符的词汇,则会将“春春”切分开来,则可以在词汇中分别出现与真实姓名相关的单个字符时,则将单个字符进行合并,以还原出用户的昵称;或者,在切分过程中,还会在切分词后,出现“爷”、“叔”、“哥”的称呼,在也需将该称呼与切分前的名称进行合并。
307、提取出与接收方真实姓名相关的第二字符,并将第二字符设置为接收方的昵称。
若切分后的字符与接收方的真实姓名相关,则该字符可能为接收方的昵称,则可以提取出与接收方真实姓名相关的第二字符,并将第二字符设置为接收方的昵称。
308、执行其他流程。
在判断步骤303及306中,若第一字符的长度大于预设长度,或所述预设长度的字符与接收方的姓名无关,则执行其他流程,此处不做具体限制。
本实施例中,描述了从与接收方相关的第一通讯消息中,提取出接收方昵称的具体方式,提高了本发明实施例的可操作性。
而为了进一步优化提取用户昵称的方案,防止出现用户昵称识别错误,还可以对用户昵称提取方案做进一步优化,请参阅图4,本发明实施例中称呼处理方法的另一个实施例,包括:
401、设置特殊称谓表及错误称谓表,特殊称谓表用于存储被误判为非昵称的称谓,错误称谓表用于存储被误判为昵称的称谓;
在提取用户昵称的过程中,往往会出现一些昵称词汇被误判的情况,如出现一些职称不被识别为昵称,具体的如师傅、总助、班长等,则需要在步骤305之后,对切分后的字符进行判断,若切分后的字符出现在特殊称谓表中,则需要提取出该字符,并进一步对用户的昵称进行更正;除此以外,还会出现一些被误判为昵称的,如“你好”,“谢谢”等,在步骤303中,当“你好”“谢谢”出现在句首时,则容易被识别为用户昵称,故需要设置一个错误称谓表,以防止在句首出现“你好”、“谢谢”等词汇时,被误判为用户昵称,故在步骤303之后,还需要进一步对第一字符进行判断,当第一字符出现在错误称谓表中时,则需要进一步对用户的昵称进行更正。
402、当第一字符或第二字符存在于特殊称谓表或错误称谓表中时,则对第一字符或第二字符进行昵称更正。
容易理解的时,当第一字符出现在错误称谓表中时,即出现“你好”“谢谢”的客气用语出现在句首时,为了排除该第一字符被误判为昵称的情况,则需要根据该第一字符对接收方的昵称进行更正;而为了防止“师傅”、“总助”“班长”等词不被识别为昵称,则当预设长度的字符出现在特殊称谓表中时,需要根据该预设长度的字符对接收方的昵称进行更正。
本发明实施例中,在提取到用户的昵称后,进一步根据特殊称谓表及错误称谓表对可能被误判为昵称的第一字符,及可能被误判为非昵称的字符做进一步的优化,提高了获取到用户昵称的准确性。
进一步,在对用户昵称进行优化后,还可以对优化后的用户昵称做更进一步的准确性判断,请参阅图5,本发明实施例中称呼处理方法的另一个实施例,包括:
501、统计第一字符或第二字符,被同一发送方和/或不同发送方使用的次数;
为了验证提取到的用户昵称的准确性,可以在提取到第一字符或第二字符后,对第一字符或第二字符的使用次数进行统计判断,一般情况下,该用户昵称被使用的次数越多,则说明该昵称的准确率就越高。
故在提取到第一字符或第二字符后,可以统计该第一字符或第二字符被同一发送方和/或不同发送方使用的次数,并在使用次数超出预设阈值时,判定该第一字符或第二字符为用户昵称。
502、当所述次数超出预设的阈值时,将第一字符或第二字符设置为接收方的昵称。
当提取到的第一字符或第二字符被同一发送方或不同发送方使用的次数超出预设的阈值时,则可以判定该第一字符或第二字符即为接收方的昵称。
503、将接收方的昵称,推送至与接收方的身份标识相关的系统消息中。
称呼处理装置在提取到接收方的昵称后,即可在与接收方的身份标识相关的系统消息中,推送接收方的昵称,从而提高用户对该称呼处理装置及与该称呼处理装置相关的应用软件的使用黏性。
本发明实施例中,在提取到第一字符或第二字符后,进一步对第一字符和第二字符被同一发送方或不同发送方使用的次数进行统计,并在使用次数超出预设阈值时,将该第一字符或第二字符设置为用户的昵称,提高了本发明实施例的可操作性。
上面描述了本发明实施例中的称呼处理方法,下面来描述本发明实施例中的称呼处理装置,请参阅图6,本发明实施例中称呼处理装置的一个实施例,包括:
提取单元601,用于从应用数据库中提取通讯消息,所述通讯消息至少包括发送方与接收方;
第一获取单元602,用于获取所述通讯消息中与所述接收方相关的第一通讯消息;
第二获取单元603,用于从所述第一通讯消息中按照预设规则获取对所述接收方的昵称。
优选的,第二获取单元603,包括:
划分模块6031,用于将所述第一通讯消息划分为多个句子;
第一判断模块6032,用于判断每个句子中是否存在标点符号或空格;
第二判断模块6033,用于在所述句子中存在标点符号或空格时,判断每个句子中第一次出现的标点符号或空格前的第一字符长度是否不大于预设值;
第一设置模块6034,用于在第一字符长度不大于预设值时,将第一字符设置为所述接收方的昵称。
优选的,第二获取单元,还包括:
切分模块6035,用于当所述句子中不存在标点符号或空格时,将所述句子按顺序切分为多个预设长度的字符;
第三判断模块6036,用于判断所述字符是否与所述接收方的真实姓名相关;
提取设置模块6037,用于在所述字符与接收方的真实姓名相关时,提取出与所述接收方的真实姓名相关的第二字符,并将所述第二字符设置为所述接收方的昵称。
优选的,该装置还包括:
第一设置单元604,用于设置特殊称谓表及错误称谓表,所述特殊称谓表用于存储被误判为非昵称的称谓,所述错误称谓表用于存储被误判为昵称的称谓;
更正单元605,用于当所述第一字符或所述第二字符存在于所述特殊称谓表或所述错误称谓表中时,则对所述第一字符或所述第二字符进行昵称更正。
优选的,该装置还包括:
统计单元606,用于统计所述第一字符或所述第二字符,被同一发送方和/或不同发送方使用的次数;
第二设置单元607,用于当所述次数超出预设的阈值时,将所述第一字符或所述第二字符设置为所述接收方的昵称。
优选的,该装置还包括:
推送单元608,用于将所述接收方的昵称,推送至与所述接收方的身份标识相关的系统消息中。
需要说明的时,本实施例中各单元及各模块的作用与图2、图3、图4及图5中所描述的称呼处理装置的作用类似,此处不再赘述。
本发明实施例中,通过提取单元601从应用数据库中提取通讯消息,该通讯消息至少包括发送方及接收方,第一获取单元602获取通讯消息中与接收方相关的第一通讯消息,第二获取单元603从第一通讯消息中按照预设规则获取对接收方的昵称,本发明是从与接收方相关的第一通讯消息中,按照预设规则自动获取对接收方的昵称,故该昵称的获取效率更高,且随着应用数据库中通讯消息的更新,获取到的用户昵称也是用户最新使用的昵称,故获取到的用户昵称也更准确。
其次,本实施例中,描述了从与接收方相关的第一通讯消息中,提取出接收方昵称的具体方式,及对接收方昵称进行优化和验证的方式,提高了本发明实施例的可操作性。
上面从模块化功能实体的角度对本发明实施例中的称呼处理装置进行了描述,下面从硬件处理的角度对本发明实施例中的计算机装置进行描述:
该计算机装置用于实现称呼处理装置的功能,本发明实施例中计算机装置一个实施例包括:
处理器以及存储器;
存储器用于存储计算机程序,处理器用于执行存储器中存储的计算机程序时,可以实现如下步骤:
从应用数据库中提取通讯消息,通讯消息至少包括发送方与接收方;
获取通讯消息中与所述接收方相关的第一通讯消息;
从第一通讯消息中按照预设规则获取对所述接收方的昵称。
在本发明的一些实施例中,处理器,还可以用于实现如下步骤:
将所述第一通讯消息划分为多个句子;
判断每个句子中是否存在标点符号或空格;
当所述句子中存在标点符号或空格时,判断每个句子中第一次出现的标点符号或空格前的第一字符长度是否不大于预设值;
若是,则将第一字符设置为所述接收方的昵称。
在本发明的一些实施例中,处理器,还可以用于实现如下步骤:
当所述句子中不存在标点符号或空格时,将所述句子按顺序切分为多个预设长度的字符;
判断所述字符是否与所述接收方的真实姓名相关;
若是,则提取出与所述接收方的真实姓名相关的第二字符,并将所述第二字符设置为所述接收方的昵称。
在本发明的一些实施例中,处理器,还可以用于实现如下步骤:
设置特殊称谓表及错误称谓表,所述特殊称谓表用于存储被误判为非昵称的称谓,所述错误称谓表用于存储被误判为昵称的称谓;
当所述第一字符或所述第二字符存在于所述特殊称谓表或所述错误称谓表中时,则对所述第一字符或所述第二字符进行昵称更正。
在本发明的一些实施例中,处理器,还可以用于实现如下步骤:
统计所述第一字符或所述第二字符,被同一发送方和/或不同发送方使用的次数;
当所述次数超出预设的阈值时,将所述第一字符或所述第二字符设置为所述接收方的昵称。
在本发明的一些实施例中,处理器,还可以用于实现如下步骤:
将所述接收方的昵称,推送至与所述接收方的身份标识相关的系统消息中。
可以理解的是,上述说明的计算机装置中的处理器执行所述计算机程序时,也可以实现上述对应的各装置实施例中各单元的功能,此处不再赘述。示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述称呼处理装置中的执行过程。例如,所述计算机程序可以被分割成上述称呼处理装置中的各单元,各单元可以实现如上述相应称呼处理装置说明的具体功能。
所述计算机装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机装置可包括但不仅限于处理器、存储器。本领域技术人员可以理解,处理器、存储器仅仅是计算机装置的示例,并不构成对计算机装置的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机装置还可以包括输入输出设备、网络接入设备、总线等。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本发明还提供了一种计算机可读存储介质,该计算机可读存储介质用于实现称呼处理装置的功能,其上存储有计算机程序,计算机程序被处理器执行时,处理器,可以用于执行如下步骤:
从应用数据库中提取通讯消息,通讯消息至少包括发送方与接收方;
获取通讯消息中与所述接收方相关的第一通讯消息;
从第一通讯消息中按照预设规则获取对所述接收方的昵称。
在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,可以用于执行如下步骤:
将所述第一通讯消息划分为多个句子;
判断每个句子中是否存在标点符号或空格;
当所述句子中存在标点符号或空格时,判断每个句子中第一次出现的标点符号或空格前的第一字符长度是否不大于预设值;
若是,则将第一字符设置为所述接收方的昵称。
在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,可以用于执行如下步骤:
当所述句子中不存在标点符号或空格时,将所述句子按顺序切分为多个预设长度的字符;
判断所述字符是否与所述接收方的真实姓名相关;
若是,则提取出与所述接收方的真实姓名相关的第二字符,并将所述第二字符设置为所述接收方的昵称。
在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,可以用于执行如下步骤:
设置特殊称谓表及错误称谓表,所述特殊称谓表用于存储被误判为非昵称的称谓,所述错误称谓表用于存储被误判为昵称的称谓;
当所述第一字符或所述第二字符存在于所述特殊称谓表或所述错误称谓表中时,则对所述第一字符或所述第二字符进行昵称更正。
在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,还可以用于执行如下步骤:
统计所述第一字符或所述第二字符,被同一发送方和/或不同发送方使用的次数;
当所述次数超出预设的阈值时,将所述第一字符或所述第二字符设置为所述接收方的昵称。
在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,还可以用于执行如下步骤:
将所述接收方的昵称,推送至与所述接收方的身份标识相关的系统消息中。
可以理解的是,所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在相应的一个计算机可读取存储介质中。基于这样的理解,本发明实现上述相应的实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种称呼处理方法,其特征在于,包括:
从应用数据库中提取通讯消息,所述通讯消息至少包括发送方与接收方;
获取所述通讯消息中与所述接收方相关的第一通讯消息;
从所述第一通讯消息中按照预设规则获取对所述接收方的昵称。
2.根据权利要求1所述的方法,其特征在于,所述第一通讯消息包括:
接收方的身份标识、接收方的真实姓名及所述接收方在预设时间段内接收到的通讯消息。
3.根据权利要求2所述的方法,其特征在于,所述从所述第一通讯消息中按照预设规则获取对所述接收方的昵称,包括:
将所述第一通讯消息划分为多个句子;
判断每个句子中是否存在标点符号或空格;
当所述句子中存在标点符号或空格时,判断每个句子中第一次出现的标点符号或空格前的第一字符长度是否不大于预设值;
若是,则将第一字符设置为所述接收方的昵称。
4.根据权利要求3所述的方法,其特征在于,在所述判断每个句子中是否存在标点符号或空格之后,所述方法还包括:
当所述句子中不存在标点符号或空格时,将所述句子按顺序切分为多个预设长度的字符;
判断所述字符是否与所述接收方的真实姓名相关;
若是,则提取出与所述接收方的真实姓名相关的第二字符,并将所述第二字符设置为所述接收方的昵称。
5.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
设置特殊称谓表及错误称谓表,所述特殊称谓表用于存储被误判为非昵称的称谓,所述错误称谓表用于存储被误判为昵称的称谓;
当所述第一字符或所述第二字符存在于所述特殊称谓表或所述错误称谓表中时,则对所述第一字符或所述第二字符进行昵称更正。
6.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
统计所述第一字符或所述第二字符,被同一发送方和/或不同发送方使用的次数;
当所述次数超出预设的阈值时,将所述第一字符或所述第二字符设置为所述接收方的昵称。
7.根据权利要求2所述的方法,其特征在于,所述方法还包括:
将所述接收方的昵称,推送至与所述接收方的身份标识相关的系统消息中。
8.一种称呼处理装置,其特征在于,包括:
提取单元,用于从应用数据库中提取通讯消息,所述通讯消息至少包括发送方与接收方;
第一获取单元,用于获取所述通讯消息中与所述接收方相关的第一通讯消息;
第二获取单元,用于从所述第一通讯消息中按照预设规则获取对所述接收方的昵称。
9.一种计算机装置,包括处理器,所述处理器在处理存储于存储器上的计算机程序时,用于实现如权利要求1至7中任一项所述的称呼处理方法。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,用于实现如权利要求1至7中任一项所述的称呼处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810449482.7A CN108694168A (zh) | 2018-05-11 | 2018-05-11 | 一种称呼处理方法及装置、计算机装置及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810449482.7A CN108694168A (zh) | 2018-05-11 | 2018-05-11 | 一种称呼处理方法及装置、计算机装置及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108694168A true CN108694168A (zh) | 2018-10-23 |
Family
ID=63847347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810449482.7A Pending CN108694168A (zh) | 2018-05-11 | 2018-05-11 | 一种称呼处理方法及装置、计算机装置及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108694168A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401083A (zh) * | 2019-01-02 | 2020-07-10 | 阿里巴巴集团控股有限公司 | 名称的识别方法及装置、存储介质和处理器 |
CN111814470A (zh) * | 2020-07-14 | 2020-10-23 | 混沌时代(北京)教育科技有限公司 | 一种基于互联网昵称提取称呼方法及系统 |
CN112527126A (zh) * | 2020-12-23 | 2021-03-19 | 北京百度网讯科技有限公司 | 信息获取方法、装置以及电子设备 |
WO2021185325A1 (zh) * | 2020-03-20 | 2021-09-23 | 维沃移动通信有限公司 | 一种通话处理方法及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101951432A (zh) * | 2010-08-30 | 2011-01-19 | 宇龙计算机通信科技(深圳)有限公司 | 一种在通信录中增加联系人信息的方法、装置及移动终端 |
CN103428341A (zh) * | 2012-05-18 | 2013-12-04 | 三星电子(中国)研发中心 | 手机联系人的搜索方法和装置 |
CN103514165A (zh) * | 2012-06-15 | 2014-01-15 | 佳能株式会社 | 用于识别对话中所提及的人的方法和装置 |
CN104023124A (zh) * | 2014-05-14 | 2014-09-03 | 上海卓悠网络科技有限公司 | 自动识别和提取短信中姓名的方法及装置 |
CN104994209A (zh) * | 2015-07-14 | 2015-10-21 | 谢蓓 | 基于通讯软件聊天记录的联系人信息获取方法及系统 |
CN105306711A (zh) * | 2015-10-23 | 2016-02-03 | 广东小天才科技有限公司 | 一种获取智能终端昵称的方法及装置 |
CN106534455A (zh) * | 2017-01-05 | 2017-03-22 | 青岛海信移动通信技术股份有限公司 | 一种移动通信终端存储通话联系人的方法和装置 |
-
2018
- 2018-05-11 CN CN201810449482.7A patent/CN108694168A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101951432A (zh) * | 2010-08-30 | 2011-01-19 | 宇龙计算机通信科技(深圳)有限公司 | 一种在通信录中增加联系人信息的方法、装置及移动终端 |
CN103428341A (zh) * | 2012-05-18 | 2013-12-04 | 三星电子(中国)研发中心 | 手机联系人的搜索方法和装置 |
CN103514165A (zh) * | 2012-06-15 | 2014-01-15 | 佳能株式会社 | 用于识别对话中所提及的人的方法和装置 |
CN104023124A (zh) * | 2014-05-14 | 2014-09-03 | 上海卓悠网络科技有限公司 | 自动识别和提取短信中姓名的方法及装置 |
CN104994209A (zh) * | 2015-07-14 | 2015-10-21 | 谢蓓 | 基于通讯软件聊天记录的联系人信息获取方法及系统 |
CN105306711A (zh) * | 2015-10-23 | 2016-02-03 | 广东小天才科技有限公司 | 一种获取智能终端昵称的方法及装置 |
CN106534455A (zh) * | 2017-01-05 | 2017-03-22 | 青岛海信移动通信技术股份有限公司 | 一种移动通信终端存储通话联系人的方法和装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401083A (zh) * | 2019-01-02 | 2020-07-10 | 阿里巴巴集团控股有限公司 | 名称的识别方法及装置、存储介质和处理器 |
CN111401083B (zh) * | 2019-01-02 | 2023-05-02 | 阿里巴巴集团控股有限公司 | 名称的识别方法及装置、存储介质和处理器 |
WO2021185325A1 (zh) * | 2020-03-20 | 2021-09-23 | 维沃移动通信有限公司 | 一种通话处理方法及电子设备 |
CN111814470A (zh) * | 2020-07-14 | 2020-10-23 | 混沌时代(北京)教育科技有限公司 | 一种基于互联网昵称提取称呼方法及系统 |
CN112527126A (zh) * | 2020-12-23 | 2021-03-19 | 北京百度网讯科技有限公司 | 信息获取方法、装置以及电子设备 |
CN112527126B (zh) * | 2020-12-23 | 2023-11-07 | 北京百度网讯科技有限公司 | 信息获取方法、装置以及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108694168A (zh) | 一种称呼处理方法及装置、计算机装置及可读存储介质 | |
CN102362271B (zh) | 用于合并在托管的会话系统中的会话的编辑的系统和方法 | |
CN107784051B (zh) | 在线客服应答系统及方法 | |
CN111158831B (zh) | 基于即时通讯应用的数据处理方法、装置、设备及介质 | |
CN103167167B (zh) | 一种移动终端及通信联系人信息的提取方法 | |
CN103975322A (zh) | 在文本消息中呈现情感的方法 | |
CN108062316A (zh) | 一种辅助客户服务的方法和装置 | |
CN103118346B (zh) | 一种发送短信的方法、装置及终端 | |
CN105898054A (zh) | 一种基于验证的消息显示方法及通信终端 | |
CN106598946A (zh) | 一种内容提取方法及装置 | |
CN109450776A (zh) | 亲密度计算方法、装置、设备和介质 | |
CN106331354B (zh) | 一种短信信息提取与分析方法 | |
CN102036198A (zh) | 一种在短信内容中增加附加信息的方法及装置 | |
CN110244885B (zh) | 输入方法、装置、设备及存储介质 | |
CN109862399A (zh) | 显示富媒体信息的方法、处理富媒体信息的方法、计算机装置及计算机可读存储介质 | |
CN105574112A (zh) | 一种通信过程的评论信息处理方法及系统 | |
CN109241075A (zh) | 指标基础数据的处理方法、设备及计算机可读存储介质 | |
CN102130997B (zh) | 一种消息传输的方法及装置 | |
CN101120598B (zh) | 感情图标消息转换系统及其方法 | |
CN108075905A (zh) | 消息发送方法及设备 | |
CN107423446A (zh) | 基于云存储的新媒体自动化可信部署系统和方法 | |
KR101196657B1 (ko) | 다수의 소셜 네트워크 서비스 간에 호환매개기능을 가지는 메시지 전달 시스템 | |
CN116681033A (zh) | 邮件编辑方法、装置、设备及介质 | |
CN107623620A (zh) | 随机性交互数据的处理方法、网络服务器及智能对话系统 | |
CN113705182A (zh) | 一种合同在线生成方法、装置及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181023 |
|
RJ01 | Rejection of invention patent application after publication |