CN110888539A - 输入法中的人名推荐方法、装置、设备及存储介质 - Google Patents

输入法中的人名推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110888539A
CN110888539A CN201911129231.1A CN201911129231A CN110888539A CN 110888539 A CN110888539 A CN 110888539A CN 201911129231 A CN201911129231 A CN 201911129231A CN 110888539 A CN110888539 A CN 110888539A
Authority
CN
China
Prior art keywords
name
content
input
social
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911129231.1A
Other languages
English (en)
Other versions
CN110888539B (zh
Inventor
田植良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201911129231.1A priority Critical patent/CN110888539B/zh
Publication of CN110888539A publication Critical patent/CN110888539A/zh
Application granted granted Critical
Publication of CN110888539B publication Critical patent/CN110888539B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items

Abstract

本申请公开了一种输入法中的人名推荐方法、装置、设备及存储介质,涉及输入法技术领域。该方法包括:获取基于当前用户账号在文字输入界面中输入的文字内容;以文字内容作为上文内容对下文内容类型进行预测;当预测到下文内容类型为人名类型时,根据上文内容以及当前用户账号的社交关系信息确定推荐人名;将推荐人名显示在输入法界面中进行推荐。本申请实施例中,基于当前用户账号在社交应用中的社交关系进行人名推荐,并不依赖输入法用户的历史输入记录;且相较于简单的姓氏匹配,基于社交关系进行人名推荐的准确率较高,有助于提高输入法用户的人名输入效率。

Description

输入法中的人名推荐方法、装置、设备及存储介质
技术领域
本申请实施例涉及输入法技术领域,特别涉及一种输入法中的人名推荐方法、装置、设备及存储介质。
背景技术
输入法作为终端中必备的应用程序,为用户提供快速准确的文字输入服务。
为了提高输入效率,越来越多的输入法开始具备文字预测功能,通过文字预测功能,输入法可以预测用户即将输入的内容,并显示在输入法界面中,方便用户通过点选操作直接输入。相关技术中,在实现对输入内容中人名的预测时,输入法首先会对用户历史输入的人名进行存储,当用户输入的内容中包含姓氏时,输入法即从存储的人名中查找与该姓氏匹配的候选人名,从而将候选人名显示在输入法界面,供用户选取。
然而,采用上述方式进行人名推荐时,基于历史输入记录进行简单的姓氏匹配,推荐的候选人名的准确率较低,导致人名推荐的效果较差。
发明内容
本申请实施例提供了一种输入法中的人名推荐方法、装置、设备及存储介质,可以解决相关技术中基于历史输入记录进行简单的姓氏匹配,推荐的候选人名的准确率较低,导致人名推荐的效果较差的问题。所述技术方案如下:
一方面,本申请实施例提供了一种输入法中的人名推荐方法,所述方法包括:
获取基于当前用户账号在文字输入界面中输入的文字内容;
以所述文字内容作为上文内容对下文内容类型进行预测;
当预测到所述下文内容类型为人名类型时,根据所述上文内容以及所述当前用户账号的社交关系信息确定推荐人名;
将所述推荐人名显示在输入法界面中进行推荐。
另一方面,本申请实施例提供了一种输入法中的人名推荐装置,所述装置包括:
第一获取模块,用于获取基于当前用户账号在文字输入界面中输入的文字内容;
第一预测模块,用于以所述文字内容作为上文内容对下文内容类型进行预测;
第二预测模块,用于当预测到所述下文内容类型为人名类型时,根据所述上文内容以及所述当前用户账号的社交关系信息确定推荐人名;
推荐模块,用于将所述推荐人名显示在输入法界面中进行推荐。
另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述方面所述的输入法中的人名推荐方法。
另一方面,提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述方面所述的输入法中的人名推荐方法。
另一方面,提供了一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得计算机执行如上述方面所述的输入法中的人名推荐方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
获取到基于当前用户账号在文字输入界面输入的文字内容后,以该文字内容为上文内容预测下文内容类型,若预测出下文内容类型为人名类型,则根据上文内容和当前用户账号的社交关系信息,确定出至少一个推荐人名并进行推荐,以便用户在输入法界面中选取推荐人名,完成人名输入;本申请实施例中,基于当前用户账号在社交应用中的社交关系进行人名推荐,并不依赖输入法用户的历史输入记录;且相较于简单的姓氏匹配,基于社交关系进行人名推荐的准确率较高,有助于提高输入法用户的人名输入效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请一个示例性实施例提供的实施环境的示意图;
图2示出了本申请一个示例性实施例提供的输入法中的人名推荐方法的流程图;
图3示出了本申请另一个示例性实施例提供的输入法中的人名推荐方法的流程图;
图4示出了本申请另一个示例性实施例提供的输入法中的人名推荐方法的流程图;
图5是本申请一个示例性实施例提供的人名推荐方法实施过程的原理示意图;
图6是本申请一个示例性实施例示出的人名预测模型训练过程的流程图;
图7是本申请一个示例性实施例提供的输入法中的人名推荐装置的结构框图;
图8示出了本申请一个示例性实施例提供的计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
相关技术中,在输入法中实现人名推荐时,依赖输入法用户的历史输入记录,且只有在输入法用户手动输入姓氏之后,输入法应用才能从历史输入记录中查找与姓氏匹配的人名,并进行推荐。
示意性的,输入法应用存储的历史输入记录中包括人名:张三、李四、王五、赵六、王小明以及赵四。当输入法用户在输入法界面中输入“我最好的朋友是王”时,输入法应用确定“王”为姓氏,从而根据该姓氏,在历史输入记录中查找与该姓氏匹配的人名,从而将匹配到的人名“王五”和“王小明”显示在输入法界面,供输入法用户选取。
可见,上述技术存在如下问题:1、依赖历史输入记录,在历史输入记录匮乏(即输入的人名较少时)的情况下,无法实现人名推荐;2、依赖用户输入的姓氏,在未输入姓氏的情况下,无法进行人名推荐;3、根据姓氏进行简单的人名匹配,无法结合实际的语境,导致人名推荐的准确率较低(尤其是根据姓氏匹配到多个人名时),影响用户的输入效率。
而本申请实施例提供的输入法中的人名推荐方法中,计算机设备获取已输入的文字内容后,可以以该文字内容为上文内容预测下文内容是否为人名,并在预测出下文内容为人名时,获取当前用户账号在社交应用中与其他社交用户之间的社交关系,从而基于该社交关系以及上文内容,从社交用户中确定出至少一个候选社交用户,并对候选社交用户对应的进行推荐。
上述人名推荐过程中,基于当前用户账号在社交应用中的社交关系进行人名推荐,并不依赖输入法用户的历史输入记录,即便输入法用户未输入过人名,也能够进行人名推荐;并且,计算机设备能够根据上文内容预测下文内容是否为人名,而不是简单进行姓氏检测,即便在上文内容中不包含姓氏的情况下,也能够准确预测出输入法用户即将输入人名;此外,计算机设备结合输入法用户的社交关系以及上文内容确定候选人名,提高了推荐人名与当前语境的匹配度,进而提高输入法用户的人名输入效率。
本申请实施例提供的人名推荐方法可以应用于终端或者服务器等计算机设备中。在一种可能的实施方式中,本申请实施例提供的人名推荐方法可以实现成为输入法应用或输入法应用的一部分,并被安装到终端中,从而在用户进行文字输入过程中进行人名推荐;或者,可以应用于输入法应用的后台服务器,从而由后台服务器为终端中的输入法应用提供人名推荐服务。为了方便表述,下述各个实施例中,以人名推荐方法应用于服务器为例进行说明,但并不对此构成限定。
请参考图1,其示出了本申请一个示例性实施例提供的实施环境的示意图。该实施环境中包括终端110和服务器120,其中,终端110与服务器120之间通过通信网络进行数据通信,可选地,通信网络可以是有线网络也可以是无线网络,且该通信网络可以是局域网、城域网以及广域网中的至少一种。
终端110是安装有输入法应用的电子设备,该电子设备可以是智能手机、平板电脑和个人便携式计算机等等,本申请实施例并不对此进行限定。该输入法应用可以中文输入法应用、英文输入法应用或日文输入法应用等等,为了方便表述,下述实施例中以输入法的语言为中文为例进行说明,但是并不对输入法应用的语言构成限定。并且,该输入法应用可以是终端110中的系统自带的原生输入法应用,或者通过网络下载的第三方输入法应用,本申请实施例并不对输入法应用的来源进行限定。
服务器120可以实现为一台服务器,也可以实现为一组服务器构成的服务器集群,其可以是物理服务器,也可以实现为云服务器。在一种可能的实施方式中,服务器120是终端110中输入法应用的后台服务器。
在一种可能的实施方式中,如图1所述,服务器120中设置有预先训练的下文预测模型121和人名预测模型122,其中,下文预测模型121用于根据上文内容预测下文内容的内容类型是否为人名,人名预测模型122用于在下文预测模型121预测下文内容为人名时,根据上文内容以及当前用户账号的用户画像,确定出至少一个候选人名。
在一种可能的应用场景下,输入法用户使用终端110中的输入法应用进行文字输入过程中,输入法应用将实时输入的文字内容(即上文内容)发送至服务器120,服务器120接收到文字内容后,通过下文预测模型121预测该文字内容(比如图1中的“我最好的朋友是”)的下文内容是否为人名,若预测结果指示下文内容为人名,则将文字内容以及输入法用户的用户画像输入人名预测模型 122,由人名预测模型122输出至少一个推荐人名(比如图1中王五、王小明和赵四)。进一步的,服务器120将推荐人名发送至终端110,以便输入法应用在输入法界面中推荐人名,供输入法用户进行选取输入。
在其他可能的应用场景中,上述下文预测模型121也可以设置在终端110 的输入法应用中,即在终端110处预测下文内容是否为人名,并在预测下文内容为人名时,向服务器120发送上文内容,由服务器120进行人名推荐。
为了方便表述,下述各个实施例以人名推荐方法由服务器执行为例进行说明。
请参考图2,其示出了本申请一个示例性实施例提供的输入法中的人名推荐方法的流程图。本实施例以该方法用于服务器为例进行说明,该方法包括如下步骤。
步骤201,获取基于当前用户账号在文字输入界面中输入的文字内容。
其中,该文字内容即文字输入界面中已输入的内容,该文字输入界面可以是即时通信应用的聊天界面、文本编辑应用的文本编辑界面等等,本实施例对此不做限定。在一种可能的实施方式中,终端中的输入法应用将当前输入法用户实时输出的文字内容发送至服务器,相应的,服务器接收该文字内容。
可选的,当前用户账号为当前登陆输入法应用时使用的账号。
可选的,由于本申请实施例提供的人名推荐方法需要使用到当前用户账号的社交关系信息,因此当终端的输入法应用启用人名推荐功能时,输入法应用才会将文字内容发送至服务器。
步骤202,以文字内容作为上文内容对下文内容类型进行预测。
下文内容即为上文内容后用户输入的文字内容,本申请实施例中,在输入法用户输入下文内容前,服务器即根据上文内容(即已输入的文字内容)预测下文内容的下文内容类型,若下文内容类型为人名类型,则执行步骤203,若下位内容类型为非人名类型,则持续进行下文内容预测。
需要说明的是,本步骤以服务器执行为例进行说明,在其他可能的实施方式中,也可以由终端根据上文内容预测下文内容的内容类型,并在预测到下文内容为人名时,向服务器发送上文内容,在预测到下文内容为非人名时,不再向服务器发送上文内容。
步骤203,当预测到下文内容类型为人名类型时,根据上文内容以及当前用户账号的社交关系信息确定推荐人名。
不同于相关技术中基于历史输入记录进行姓氏匹配,从而根据姓氏匹配结果进行人名推荐,本申请实施例中,服务器基于当前用户账号在社交应用中的社交关系信息,从与其具备社交关系的社交用户中,确定与当前语境相匹配的候选社交用户,从而对候选社交用户的候选人名进行推荐。
在一种可能的实施方式中,服务器预先获取各个输入法用户账号对应的社交账号,并根据该社交账号,从社交应用服务器处获取各个社交账号对应的社交信息,从而根据该社交信息分析出输入法用户与社交应用中各个社交用户之间的社交关系,并进行存储。后续进行人名预测时,服务器即根据上文内容以及当前用户账号的社交关系信息,确定出至少一个推荐人名。
采用上述方式,即便输入法用户未通过输入法应用输入过人名,服务器也能够基于输入法用户的社交关系进行人名预测,降低了对历史输入记录的依赖;并且,在进行人名预测时结合了上文内容,使得预测出的人名符合上文语境,有助于提高了人名预测的准确性。
步骤204,将推荐人名显示在输入法界面中进行推荐。
在一种可能的实施方式中,服务器将确定出的至少一个推荐人名(全部或者一部分)发送至终端,由终端将推荐人名显示在输入法界面中,后续输入法用户可以通过选取推荐人名进行人名输入,而不再需要进行人名拼写。
在一个示意性的例子中,采用上述人名推荐方法,服务器获取到的上文内容为“我最好的朋友是”,并确定该上位内容的下文内容为人名;服务器根据上文内容以及当前输入法用户的社交关系信息(比如基于与社交用户之间的联系频率),确定出推荐人名包括王五、王小明以及赵四,并反馈给终端,由终端将推荐人名显示在输入法界面中。而采用相关技术中的人名推荐方法,由于上位内容中并不包含姓氏,因此终端无法进行人名推荐。
综上所述,本申请实施例中,获取到基于当前用户账号在文字输入界面输入的文字内容后,以该文字内容为上文内容预测下文内容类型,若预测出下文内容类型为人名类型,则根据上文内容和当前用户账号的社交关系信息,确定出至少一个推荐人名并进行推荐,以便用户在输入法界面中选取推荐人名,完成人名输入;本申请实施例中,基于当前用户账号在社交应用中的社交关系进行人名推荐,并不依赖输入法用户的历史输入记录;且相较于简单的姓氏匹配,基于社交关系进行人名推荐的准确率较高,有助于提高输入法用户的人名输入效率。
在一种可能的实施方式中,服务器通过预训练的下文预测模型对下文内容的下文内容类型进行预测,通过预训练的人名预测模型进行人名预测,下面结合上述模型对人名推荐的过程进行说明。
请参考图3,其示出了本申请另一个示例性实施例提供的输入法中的人名推荐方法的流程图。本实施例以该方法用于服务器为例进行说明,该方法包括如下步骤。
步骤301,获取基于当前用户账号在文字输入界面中输入的文字内容。
本步骤的实施方式可以参考上述步骤201,本实施例在此不再赘述。
步骤302,将文字内容作为上文内容,并将上文内容转化为文本特征向量。
在一种可能的实施方式中,下文预测模型的模型输入采用向量的形式,因此根据上文内容进行下文内容预测前,服务器需要将上文内容转化为文本特征向量。
针对文本内容向量化的方式,可选的,服务器首先采用分词模型对上文内容进行分词(比如采用结巴分词模型),然后使用词向量(word to vector,word2vec) 模型将分词结果转换为各个词向量,进而根据各个词向量生成文本特征向量。本申请并不对文本内容向量化的具体方式构成限定。
步骤303,将文本特征向量输入下文预测模型,得到下文预测模型输出的人名概率,下文预测模型根据包含人名标注的文本训练得到。
完成文本内容向量化后,服务器将文本特征向量输入下文预测模型,并获取下文预测模型输出的人名概率。可选的,该下文预测模型基于(Deep Neural Networks,DNN)深度神经网络训练得到。
针对下文预测模型的训练方式,在一种可能的实施方式中,预先通过人工标注的方式,对文本中的人名进行标注,从而将文本作为训练样本输入下文预测模型,得到下文预测模型输出的预测结果(即文本的下文是否为人名),并以人名标注作为预测结果的监督数据,对下文预测模型进行训练。
比如,对于包含人名标注的文本“我关系最好的同事是[人名]”为例,服务器将“我关系最好的同事是”输入下文预测模型(文本也需要进行过向量化处理),得到下文预测模型输出的预测结果“40%”,从而根据人名标注对下文预测模型进行训练,使下文预测模型的预测结果趋向于“100%”。
步骤304,若人名概率大于第二概率阈值,则确定下文内容类型为人名类型。
可选的,若人名概率高于第二概率阈值,服务器执行下述步骤304;若人名概率低于第二概率阈值,服务器则停止进行人名预测。比如,该第二概率阈值为90%。
在一个示意性的例子中,服务器将上文内容“我最好的朋友是”输入下文预测模型,得到下文预测模型输出的人名概率为95%,确定下文内容类型为人名类型。
步骤305,将上文内容以及目标用户画像输入人名预测模型,得到人名预测模型输出的推荐人名的选取概率,目标用户画像用于表示当前用户账号在社交应用中的社交关系信息。
在一种可能的实施方式中,服务器中预先存储有输入法用户账号在社交应用中的用户画像,该用户画像用于表示输入法用户账号在社交应用中的社交关系信息。其中,该社交关系信息可以包括亲戚、同事和朋友中的至少一种。其中,该用户画像可以通过网络随机游走算法构建得到。
可选的,该用户画像中还可以包括与社交用户之间的社交亲密度、社交频率、社交次数、兴趣相似度、喜好相似度等等;或者,还可以包括社交用户(包括目标输入法用户和其他社交用户)的个人信息,比如年龄、性别、性格、职业、喜好等等,本申请实施例对此不做限定。
可选的,当预测出下文内容为人名时,服务器根据当前用户账号获取对应的目标用户画像,从而将上文内容和目标用户画像输入人名预测模型,得到输出的各个推荐人名的选取概率。
在一种可能的实施方式中,进行推荐人名概率预测的过程可以包括如下步骤。
步骤305A,将上文内容转化为文本特征向量。
本步骤的实施方式可以参考上述步骤302,本实施例在此不再赘述。
步骤305B,获取当前用户账号对应的目标用户特征向量,目标用户特征向量由目标用户画像向量化得到。
在一种可能的实施方式中,由于人名预测模型的输入采用向量的形式,因此服务器中的存储的用户画像需要转化为用户特征向量。相应的,在进行人名预测时,服务器获取当前用户账号对应的目标用户特征向量。
需要说明的是,步骤305A与步骤305B之间并不存在严格的先后时序,即步骤305A和305B可以同步执行,本申请实施例对此不做限定。
步骤305C,将文本特征向量和目标用户特征向量输入人名预测模型,得到人名预测模型输出的推荐人名的选取概率。
可选的,本申请实施例中的人名预测模型基于DNN训练得到,将文本特征向量和目标用户特征向量输入人名预测模型后,人名预测模型通过多层隐藏层 (hidden layer)对文本特征向量和目标用户特征向量进行处理,最终输出各个推荐人名的选取概率。其中,各个推荐人名对应的社交用户均与目标输入法用户存在社交关系。
在一种可能的实施方式中,人名预测模型输出的推荐人名为当前用户账号对应社交关系链上各个社交用户的人名。
在一个示意性的例子中,人名预测模型输出选取概率分别为:王五80%、王小明15%、赵四5%。
步骤306,根据选取概率将推荐人名显示在输入法界面中进行推荐。
在一种可能的实施方式中,服务器按照选取概率的降序对推荐人名进行排序,并选取前n个推荐人名进行人名推荐,n为大于等于1的整数。相应的,终端可以根据选取概率的降序,对接收到推荐人名进行显示,其中,选取概率越高,推荐人名在输入法界面的显示优先级越高。
步骤307,获取对推荐人名中目标人名的选取指令。
为了提高人名预测模型的预测准确性,在一种可能的实施方式中,终端接收到对目标人名的选取操作后,向服务器发送包含目标人名的选取指令,以便服务器根据用户实际选取的人名对人名预测模型进行优化。
步骤308,若目标人名对应的选取概率低于第一概率阈值,则根据目标人名、上文内容以及目标用户画像,对人名预测模型进行训练。
当目标输入法用户选取了选取概率较低的候选人名时,表示人名预测模型的预测准确率较低,因此在一种可能的实施方式中,服务器获取目标人名对应的选取概率,并在选取概率低于第一概率阈值时,确定需要对人名预测模型进行训练。
比如,当目标人名的选取概率低于50%时,服务器确定需要对人名预测模型进行训练。
针对训练人名预测模型的过程,在一种可能的实施方式中,服务器以上文内容和目标用户画像为样本输入,以目标人名为样本输出,对人名预测模型进行反向传播训练,以提高输出的目标人名的选取概率。
本实施例中,采用预训练的下文预测模型对下文内容类型进行预测,有助于提高人名预测的准确性;并且,基于输入法用户的用户画像,并结合上文内容进行人名预测,使得人名预测结果符合输入法用户的社交关系以及上文语境,提高了人名预测的准确性。
此外,本实施例中,服务器基于用户对推荐人名的选取操作,对人名预测模型不断进行优化,进一步提高了人名预测模型的预测准确性。
针对上述实施例中用户特征向量的获取方式,在一种可能的实施方式中,获取用户特征向量可以包括如下步骤。
一、获取当前用户账号的社交信息,社交信息包括各个社交用户账号的用户信息以及当前用户账号与社交用户之间的社交记录,社交用户账号与当前用户账号在社交应用中具备社交关系。
在一种可能的实施方式中,当输入法用户使用社交应用账号登陆输入法应用时,输入法应用的后台服务器可以与社交应用的后台服务器进行数据交互,从而获取输入法用户在社交应用中的社交信息。
比如,当开发商推出的即时通信应用A以及输入法应用B,输入法用户可以使用即时通信应用A的应用账号登陆输入法应用B,相应的,输入法应用B 的后台服务器可以获取用户在即时通信应用A中的社交信息。
可选的,该社交信息包括如下至少一种:社交用户列表(比如好友列表、关注列表等等)、社交记录(比如与好友的聊天频次)、社交用户的用户信息(比如好友的备注、职业、学校、生日、喜好、兴趣等等)。当然,除了获取上述社交信息外,服务器还可以获取其他层面的社交信息,本实施例对此并不构成限定。
二、根据社交信息构建目标用户画像,其中,不同用户画像的画像构建维度相同。
可选的,服务器对获取到的社交信息进行分析,根据预先设置的画像构建维度,构建相应的用户画像,使得不同用户的用户画像具备相同的画像维度。
可选的,该画像构建维度包括如下至少一种:与社交用户的社交关系、社交用户的喜好、社交用户的职业、社交用户的性格、与社交用户的亲密度。当然,除了上述画像构建维度外,服务器还可以基于其他维度进行画像构建,本申请并不对画像构建的具体维度进行限定。
三、将目标用户画像转化为目标用户特征向量,并对目标用户特征向量与当前用户账号进行关联存储。
进一步的,服务器将构建得到的用户画像转化为用户特征向量,由于不同用户画像的画像构建维度相同,因此转化得到的用户特征向量的向量维度相同。比如,服务器生成的用户特征向量均为300维向量。
为了方便后续人名预测时快速获取用户特征向量,服务器将用户特征向量与(输入法)用户账号进行关联存储。
需要说明的是,为了由于社交网络中用户的社交关系会不断发生变化,因此为了提高用户画像的时效性和准确性,可选的,服务器每隔预定时间间隔对用户画像进行更新。比如,服务器每隔15天对用户画像进行更新。
此外,为了避免造成社交信息泄露,在一种可能的实施方式中,输入法应用的后台服务器可以向社交应用的后台服务器发送用户画像生成请求,由社交应用的后台服务器直接将生成的用户特征向量发送给输入法应用的后台服务器,即社交应用中的实际社交信息并不会直接提供输入法应用,从而提高了社交信息的安全性。其中,社交应用的后台服务器生成用户特征向量的过程可以参考上述实施例,本实施例在此不再赘述。
在一个示意性的例子中,如图5所示,输入法应用的后台服务器首先从社交应用51的后台服务器处,获取各个输入法用户在社交应用中的社交信息52,然后通过分析社交信息52,构建各个输入法用户对应的用户画像53,并对构建得到的各个用户画像53进行向量化处理,得到各个输入法用户对应的用户特征向量。
在人名预测过程中,输入法用户张三在输入法界面中输入上文内容54后,上文内容54被发送至输入法应用的后台服务器,后台服务器首先对上文内容54 进行向量化,得到文本特征向量55,然后将文本特征向量55输入下文预测模型 56,得到下文预测模型56输出的人名概率。当人名概率指示下文内容为人名时,后台服务器从存储的用户特征向量中,获取输入法用户张三对应的用户特征向量,并将该用户特征向量与文本特征向量55输入人名预测模型56,得到人名预测模型56输出的各个候选人名的选取概率。
后台服务器根据选取概率向输入法应用发送候选人名,由输入法应用将候选人名显示在输入法界面中。
针对上述实施例中人名预测模型的训练过程,在一种可能的实施方式中,如图6所示,该方法还可以包括如下步骤。
步骤601,获取样本用户账号的历史输入记录,历史输入记录中包括样本上文内容和样本人名。
其中,该样本用户账号为使用输入法应用的真实用户的账号,相应的,历史输入记录即为真实的文本输入记录,且每条历史输入记录中均包含样本上文内容以及样本上文内容后的样本人名。
在一种可能的实施方式中,输入法应用检测到输入的文本内容中包含人名时,即该文本内容作为历史输入记录上传至服务器(样本用户账号同时上传),以便服务器基于历史输入记录进行模型训练。
需要说明的是,对于获取到的样本人名,服务器需要确定该样本人名对应的社交用户是否与样本用户账号具备社交关系,即确定样本人名是否位于样本用户账号的社交关系链中,并在具备社交关系时,执行下述训练步骤。
步骤602,根据样本上文内容、样本人名以及样本用户账号对应的样本用户画像,训练人名预测模型,其中,样本上文内容和样本用户画像为样本输入,样本人名为样本输出。
在一种可能的实施方式中,服务器将历史输入记录中的样本上文内容以及样本用户账号对应的样本用户画像(均需要经过向量化处理)作为样本输入,输入人名预测模型,得到输出的样本预测结果,从而以样本人名作为监督,对人名预测模型进行训练,使样本预测结果趋向于样本人名(即样本人名的选取概率趋向于1)。
采用上述模型训练方法,即便当前输入法用户未输入过人名,服务器也可以基于其他输入法用户的真实输入记录,训练出人名预测模型,进而根据当前输入法用户的用户画像以及输入上文内容进行人名预测,在输入法使用初期也能够达到良好的人名推荐效果。
图7是本申请一个示例性实施例提供的输入法中的人名推荐装置的结构框图,该装置可以设置于上述实施例所述的计算机设备,如图7所示,该装置包括:
第一获取模块701,用于获取基于当前用户账号在文字输入界面中输入的文字内容;
第一预测模块702,用于以所述文字内容作为上文内容对下文内容类型进行预测;
第二预测模块703,用于当预测到所述下文内容类型为人名类型时,根据所述上文内容以及所述当前用户账号的社交关系信息确定推荐人名;
推荐模块704,用于将所述推荐人名显示在输入法界面中进行推荐。
可选的,所述第二预测模块703,用于:
将所述上文内容以及目标用户画像输入人名预测模型,得到所述人名预测模型输出的所述推荐人名的选取概率,所述目标用户画像用于表示所述当前用户账号在所述社交应用中的社交关系信息;
所述推荐模块704,用于:
根据所述选取概率将所述推荐人名显示在输入法界面中进行推荐。
可选的,所述第二预测模块703,包括:
第一转化单元,用于将所述上文内容转化为文本特征向量;
获取单元,用于获取所述当前用户账号对应的目标用户特征向量,所述目标用户特征向量由所述目标用户画像向量化得到;
第一预测单元,用于将所述文本特征向量和所述目标用户特征向量输入所述人名预测模型,得到所述人名预测模型输出的所述推荐人名的所述选取概率。
可选的,所述装置还包括:
第二获取模块,用于获取所述当前用户账号的社交信息,所述社交信息包括各个社交用户账号的用户信息以及所述当前用户账号与所述社交用户账号之间的社交记录,所述社交用户账号与所述当前用户账号在所述社交应用中具备社交关系;
构建模块,用于根据所述社交信息构建所述目标用户画像,其中,不同用户画像的画像构建维度相同;
向量化模块,用于将所述目标用户画像转化为所述目标用户特征向量,并对所述目标用户特征向量与所述当前用户账号进行关联存储。
可选的,所述装置还包括:
第三获取模块,用于获取样本用户账号的历史输入记录,所述历史输入记录中包括样本上文内容和样本人名;
第一训练模块,用于根据所述样本上文内容、所述样本人名以及所述样本用户账号对应的样本用户画像,训练所述人名预测模型,其中,所述样本上文内容和所述样本用户画像为样本输入,所述样本人名为样本输出。
可选的,所述装置还包括:
第四获取模块,用于获取对所述候选人名中目标人名的选取指令;
第二训练模块,用于若所述目标人名对应的所述选取概率低于第一概率阈值,则根据所述目标人名、所述上文内容以及所述目标用户画像,对所述人名预测模型进行训练。
可选的,所述第一预测模块702,包括:
第二转化单元,用于将所述上文内容转化为文本特征向量;
第二预测单元,用于将所述文本特征向量输入下文预测模型,得到所述下文预测模型输出的人名概率,所述下文预测模型根据包含人名标注的文本训练得到;
确定单元,用于若所述人名概率大于第二概率阈值,则确定所述下文内容类型为所述人名类型。
可选的,所述人名预测模型基于DNN训练得到。
综上所述,本申请实施例中,获取到基于当前用户账号在文字输入界面输入的文字内容后,以该文字内容为上文内容预测下文内容类型,若预测出下文内容类型为人名类型,则根据上文内容和当前用户账号的社交关系信息,确定出至少一个推荐人名并进行推荐,以便用户在输入法界面中选取推荐人名,完成人名输入;本申请实施例中,基于当前用户账号在社交应用中的社交关系进行人名推荐,并不依赖输入法用户的历史输入记录;且相较于简单的姓氏匹配,基于社交关系进行人名推荐的准确率较高,有助于提高输入法用户的人名输入效率。
本实施例中,采用预训练的下文预测模型对下文内容类型进行预测,有助于提高人名预测的准确性;并且,基于输入法用户的用户画像,并结合上文内容进行人名预测,使得人名预测结果符合输入法用户的社交关系以及上文语境,提高了人名预测的准确性。
此外,本实施例中,服务器基于用户对推荐人名的选取操作,对人名预测模型不断进行优化,进一步提高了人名预测模型的预测准确性。
需要说明的是:上述实施例提供的装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的人名推荐装置与人名推荐方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图8,其示出了本申请一个示例性实施例提供的计算机设备的结构示意图。具体来讲:所述计算机设备1400包括中央处理单元(CPU)1401、包括随机存取存储器(RAM)1402和只读存储器(ROM)1403的系统存储器1404,以及连接系统存储器1404和中央处理单元1401的系统总线1405。所述计算机设备1400还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统 (I/O系统)1406,和用于存储操作系统1413、应用程序1414和其他程序模块 1415的大容量存储设备1407。
所述基本输入/输出系统1406包括有用于显示信息的显示器1408和用于用户输入信息的诸如鼠标、键盘之类的输入设备1409。其中所述显示器1408和输入设备1409都通过连接到系统总线1405的输入输出控制器1410连接到中央处理单元1401。所述基本输入/输出系统1406还可以包括输入输出控制器1410以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器1410还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备1407通过连接到系统总线1405的大容量存储控制器 (未示出)连接到中央处理单元1401。所述大容量存储设备1407及其相关联的计算机可读介质为计算机设备1400提供非易失性存储。也就是说,所述大容量存储设备1407可以包括诸如硬盘或者CD-ROI驱动器之类的计算机可读介质 (未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器1404和大容量存储设备1407可以统称为存储器。
存储器存储有一个或多个程序,一个或多个程序被配置成由一个或多个中央处理单元1401执行,一个或多个程序包含用于实现上述方法的指令,中央处理单元1401执行该一个或多个程序实现上述各个方法实施例提供的方法。
根据本申请的各种实施例,所述计算机设备1400还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备1400可以通过连接在所述系统总线1405上的网络接口单元1411连接到网络1412,或者说,也可以使用网络接口单元1411来连接到其他类型的网络或远程计算机系统(未示出)。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,所述一个或者一个以上程序包含用于进行本申请实施例提供的方法中由计算机设备所执行的步骤。
本申请实施例还提供一种计算机可读存储介质,该可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述任一实施例所述的输入法中的人名推荐方法。
本申请还提供了一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行上述各个方法实施例提供的输入法中的人名推荐方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,该计算机可读存储介质可以是上述实施例中的存储器中所包含的计算机可读存储介质;也可以是单独存在,未装配入终端中的计算机可读存储介质。该计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述任一方法实施例所述的输入法中的人名推荐方法。
可选地,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、固态硬盘(SSD, Solid State Drives)或光盘等。其中,随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM,ResistanceRandom Access Memory)和动态随机存取存储器 (DRAM,Dynamic Random AccessMemory)。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的示意性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种输入法中的人名推荐方法,其特征在于,所述方法包括:
获取基于当前用户账号在文字输入界面中输入的文字内容;
以所述文字内容作为上文内容对下文内容类型进行预测;
当预测到所述下文内容类型为人名类型时,根据所述上文内容以及所述当前用户账号的社交关系信息确定推荐人名;
将所述推荐人名显示在输入法界面中进行推荐。
2.根据权利要求1所述的方法,其特征在于,所述根据所述上文内容以及所述当前用户账号的社交关系信息确定推荐人名,包括:
将所述上文内容以及目标用户画像输入人名预测模型,得到所述人名预测模型输出的所述推荐人名的选取概率,所述目标用户画像用于表示所述当前用户账号在所述社交应用中的社交关系信息;
所述将所述推荐人名显示在输入法界面中进行推荐,包括:
根据所述选取概率将所述推荐人名显示在输入法界面中进行推荐。
3.根据权利要求2所述的方法,其特征在于,所述将所述上文内容以及目标用户画像输入人名预测模型,得到所述人名预测模型输出的所述推荐人名的选取概率,包括:
将所述上文内容转化为文本特征向量;
获取所述当前用户账号对应的目标用户特征向量,所述目标用户特征向量由所述目标用户画像向量化得到;
将所述文本特征向量和所述目标用户特征向量输入所述人名预测模型,得到所述人名预测模型输出的所述推荐人名的所述选取概率。
4.根据权利要求3所述的方法,其特征在于,所述获取基于当前用户账号在文字输入界面中输入的文字内容之前,所述方法还包括:
获取所述当前用户账号的社交信息,所述社交信息包括各个社交用户账号的用户信息以及所述当前用户账号与所述社交用户账号之间的社交记录,所述社交用户账号与所述当前用户账号在所述社交应用中具备社交关系;
根据所述社交信息构建所述目标用户画像,其中,不同用户画像的画像构建维度相同;
将所述目标用户画像转化为所述目标用户特征向量,并对所述目标用户特征向量与所述当前用户账号进行关联存储。
5.根据权利要求2所述的方法,其特征在于,所述获取基于当前用户账号在文字输入界面中输入的文字内容之前,所述方法还包括:
获取样本用户账号的历史输入记录,所述历史输入记录中包括样本上文内容和样本人名;
根据所述样本上文内容、所述样本人名以及所述样本用户账号对应的样本用户画像,训练所述人名预测模型,其中,所述样本上文内容和所述样本用户画像为样本输入,所述样本人名为样本输出。
6.根据权利要求2所述的方法,其特征在于,所述将所述推荐人名显示在输入法界面中进行推荐之后,所述方法还包括:
获取对所述推荐人名中目标人名的选取指令;
若所述目标人名对应的所述选取概率低于第一概率阈值,则根据所述目标人名、所述上文内容以及所述目标用户画像,对所述人名预测模型进行训练。
7.根据权利要求1至6任一所述的方法,其特征在于,所述以所述文字内容作为上文内容对下文内容类型进行预测,包括:
将所述上文内容转化为文本特征向量;
将所述文本特征向量输入下文预测模型,得到所述下文预测模型输出的人名概率,所述下文预测模型根据包含人名标注的文本训练得到;
若所述人名概率大于第二概率阈值,则确定所述下文内容类型为所述人名类型。
8.一种输入法中的人名推荐装置,其特征在于,所述装置包括:
第一获取模块,用于获取基于当前用户账号在文字输入界面中输入的文字内容;
第一预测模块,用于以所述文字内容作为上文内容对下文内容类型进行预测;
第二预测模块,用于当预测到所述下文内容类型为人名类型时,根据所述上文内容以及所述当前用户账号的社交关系信息确定推荐人名;
推荐模块,用于将所述推荐人名显示在输入法界面中进行推荐。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一所述的输入法中的人名推荐方法。
10.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至7任一所述的输入法中的人名推荐方法。
CN201911129231.1A 2019-11-18 2019-11-18 输入法中的人名推荐方法、装置、设备及存储介质 Active CN110888539B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911129231.1A CN110888539B (zh) 2019-11-18 2019-11-18 输入法中的人名推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911129231.1A CN110888539B (zh) 2019-11-18 2019-11-18 输入法中的人名推荐方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110888539A true CN110888539A (zh) 2020-03-17
CN110888539B CN110888539B (zh) 2024-03-26

Family

ID=69747881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911129231.1A Active CN110888539B (zh) 2019-11-18 2019-11-18 输入法中的人名推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110888539B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113515199A (zh) * 2021-04-15 2021-10-19 维沃移动通信有限公司 文本显示方法、装置、电子设备及存储介质
CN113515199B (zh) * 2021-04-15 2024-05-10 维沃移动通信有限公司 文本显示方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100312778A1 (en) * 2009-06-08 2010-12-09 Yumao Lu Predictive person name variants for web search
CN102164205A (zh) * 2011-03-02 2011-08-24 宇龙计算机通信科技(深圳)有限公司 联系人信息的快捷输入方法和移动终端
CA2809653A1 (en) * 2012-03-16 2013-09-16 Research In Motion Limited In-context word prediction and word correction
CN105190682A (zh) * 2013-03-01 2015-12-23 谷歌公司 基于内容发现社交联系
CN107943321A (zh) * 2017-12-18 2018-04-20 何治通 一种与通讯录相匹配的输入法以及系统
CN108449481A (zh) * 2018-05-09 2018-08-24 维沃移动通信有限公司 一种联系人信息推荐方法及终端
CN109002184A (zh) * 2017-06-07 2018-12-14 北京搜狗科技发展有限公司 一种输入法候选词的联想方法和装置
CN109074354A (zh) * 2016-07-22 2018-12-21 华为技术有限公司 展示候选项的方法和终端设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100312778A1 (en) * 2009-06-08 2010-12-09 Yumao Lu Predictive person name variants for web search
CN102164205A (zh) * 2011-03-02 2011-08-24 宇龙计算机通信科技(深圳)有限公司 联系人信息的快捷输入方法和移动终端
CA2809653A1 (en) * 2012-03-16 2013-09-16 Research In Motion Limited In-context word prediction and word correction
CN105190682A (zh) * 2013-03-01 2015-12-23 谷歌公司 基于内容发现社交联系
CN109074354A (zh) * 2016-07-22 2018-12-21 华为技术有限公司 展示候选项的方法和终端设备
CN109002184A (zh) * 2017-06-07 2018-12-14 北京搜狗科技发展有限公司 一种输入法候选词的联想方法和装置
CN107943321A (zh) * 2017-12-18 2018-04-20 何治通 一种与通讯录相匹配的输入法以及系统
CN108449481A (zh) * 2018-05-09 2018-08-24 维沃移动通信有限公司 一种联系人信息推荐方法及终端

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113515199A (zh) * 2021-04-15 2021-10-19 维沃移动通信有限公司 文本显示方法、装置、电子设备及存储介质
CN113515199B (zh) * 2021-04-15 2024-05-10 维沃移动通信有限公司 文本显示方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN110888539B (zh) 2024-03-26

Similar Documents

Publication Publication Date Title
CN111061946B (zh) 场景化内容推荐方法、装置、电子设备及存储介质
CN109376222B (zh) 问答匹配度计算方法、问答自动匹配方法及装置
CN107241260B (zh) 基于人工智能的新闻推送的方法和装置
US20170052946A1 (en) Semantic understanding based emoji input method and device
CN109034203B (zh) 表情推荐模型的训练、表情推荐方法、装置、设备及介质
US11238132B2 (en) Method and system for using existing models in connection with new model development
CN111552880A (zh) 基于知识图谱的数据处理方法、装置、介质及电子设备
CN112380331A (zh) 信息推送的方法和装置
CN110597965B (zh) 文章的情感极性分析方法、装置、电子设备及存储介质
CN111708876A (zh) 生成信息的方法和装置
US20180101521A1 (en) Avoiding sentiment model overfitting in a machine language model
CN113961666A (zh) 关键词识别方法、装置、设备、介质及计算机程序产品
CN112380421A (zh) 简历的搜索方法、装置、电子设备及计算机存储介质
US11501059B2 (en) Methods and systems for auto-filling fields of electronic documents
US11477302B2 (en) Computer-implemented system and method for distributed activity detection
CN113032676B (zh) 基于微反馈的推荐方法和系统
CN110826327A (zh) 情感分析方法、装置、计算机可读介质及电子设备
CN112597292B (zh) 问题回复推荐方法、装置、计算机设备和存储介质
CN114330704A (zh) 语句生成模型更新方法、装置、计算机设备和存储介质
CN110888539B (zh) 输入法中的人名推荐方法、装置、设备及存储介质
CN115618101A (zh) 基于负反馈的流媒体内容推荐方法、装置及电子设备
CN114398482A (zh) 一种词典构造方法、装置、电子设备及存储介质
US20220171985A1 (en) Item recommendation with application to automated artificial intelligence
CN113870998A (zh) 问诊方法、装置、电子设备和存储介质
CN113094584A (zh) 推荐学习资源的确定方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40022279

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant