CN109818737B - 个性化口令生成方法及系统 - Google Patents

个性化口令生成方法及系统 Download PDF

Info

Publication number
CN109818737B
CN109818737B CN201811583879.1A CN201811583879A CN109818737B CN 109818737 B CN109818737 B CN 109818737B CN 201811583879 A CN201811583879 A CN 201811583879A CN 109818737 B CN109818737 B CN 109818737B
Authority
CN
China
Prior art keywords
password
information
user
personalized
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811583879.1A
Other languages
English (en)
Other versions
CN109818737A (zh
Inventor
许丽
潘嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201811583879.1A priority Critical patent/CN109818737B/zh
Publication of CN109818737A publication Critical patent/CN109818737A/zh
Application granted granted Critical
Publication of CN109818737B publication Critical patent/CN109818737B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Storage Device Security (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一种个性化口令生成方法及系统,其中方法包括:接收由第一用户发送的口令;确定接收所述口令的第二用户,并获取第二用户信息;根据所述口令的信息和所述第二用户信息,生成针对第二用户的个性化口令。本发明使得口令信息与接收口令的第二用户息息相关,不再是千篇一律的统一形式,更由于附带了特定的接收方的属性信息,使口令本身相比现有的口令形式,能够发挥出成倍的优势并可以因此拓展到多个应用场景中,以满足接收方甚至发送方对于多样性、娱乐性、安全性、专属性等方面的需求,从而能够获得更佳的用户之间的交互效果,以此大大提升用户体验。

Description

个性化口令生成方法及系统
技术领域
本发明涉及电子信息处理领域,尤其涉及一种个性化口令生成方法及系统。
背景技术
随着智能设备的普及,花样繁多的手机应用层出不穷,给人们的生活带来便利的同时,也正在潜移默化的改变着人们的社交方式。本发明以红包口令为例但不作为本发明的应用限制:2014年的春节,微信首次推出了微信红包,一时间成为最热门的话题,发个红包祝福一下,或者在微信群里抢红包,成为了过年过节大家问候的方式和消遣的活动,乃至演变成一种习以为常的日常经济行为。在此基础上,很多应用还相继推出了口令红包。口令红包相对于普通红包更具有娱乐性和参与性。具体的操作是,发红包的用户发放红包时设置一个口令,抢红包的用户需要在对话框中输入或者语音输入对应的口令才能抢到红包。尤其是语音口令可以衍生出更多的趣味性,例如,通过方言、绕口令、生僻字等形式设置口令。
但是目前的口令红包功能是,抢红包的口令一旦设置后,所有抢红包用户接收到的口令都是相同的,这无疑在追求多样化和个性化体验的趋势下显得单调平淡,用户容易对该功能产生厌倦感,导致良好的用户体验不能延续。
发明内容
本发明旨在提供一种个性化口令生成方法及系统,解决生成的口令缺乏个性化的问题,从而能够获得更佳的用户之间的交互效果,以此提升用户体验。
本发明采用的技术方案如下:
一种个性化口令生成方法,包括:
接收由第一用户发送的口令;
确定接收所述口令的第二用户,并获取第二用户信息;
根据所述口令的信息和所述第二用户信息,生成针对第二用户的个性化口令。
可选地,所述方法还包括:
接收所述口令后,提取所述口令的文本特征;
根据所述文本特征以及预先训练的分类模型,确定所述口令的信息是否为开放类信息。
可选地,所述根据所述口令的信息和所述第二用户信息,生成针对第二用户的个性化口令包括:
若所述口令的信息为开放类信息,则提取所述口令中的主题;
根据所述主题以及第二用户的操作历史数据和/或地理位置信息,从预设的内容数据库中获取目标内容;
以所述目标内容作为所述个性化口令,或利用所述目标内容生成所述个性化口令。
可选地,所述根据所述主题以及第二用户的操作历史数据,从预设的内容数据库中获取目标内容包括:
基于所述主题,对所述操作历史数据进行过滤和统计,得到与所述主题相关的关键历史信息;
根据所述主题以及所述关键历史信息,在相应于所述主题的内容数据库中进行检索;
将相关性最高的检索结果作为所述目标内容。
可选地,所述根据所述主题以及第二用户的操作历史数据和/或地理位置信息,从预设的内容数据库中获取目标内容包括:
根据所述操作历史数据和/或所述地理位置信息,确定第二用户的惯用语言和/或语言风格;
根据所述主题以及所述惯用语言和/或所述语言风格,在相应于所述主题的内容数据库中进行检索;
将相关性最高的检索结果作为所述目标内容。
可选地,
所述获取第二用户信息包括获取第二用户的操作历史数据和/或地理位置信息;
所述根据所述口令的信息和所述第二用户信息,生成针对第二用户的个性化口令包括:
提取所述口令中的文本信息;
根据所述文本信息以及第二用户的操作历史数据和/或地理位置信息,生成所述个性化口令。
可选地,所述根据所述文本信息以及第二用户的操作历史数据和/或地理位置信息,生成所述个性化口令包括:
根据所述操作历史数据和/或所述地理位置信息,确定第二用户的惯用语言和/或语言风格;
根据所述文本信息以及所述惯用语言和/或所述语言风格,生成所述个性化口令。
一种个性化口令生成系统,包括:
口令接收模块,用于接收由第一用户发送的口令;
第二用户信息获取模块,用于确定接收所述口令的第二用户,并获取第二用户信息;
个性化口令生成模块,用于根据所述口令的信息和所述第二用户信息,生成针对第二用户的个性化口令。
可选地,所述系统还包括:
文本特征提取模块,用于接收所述口令后,提取所述口令的文本特征;
开放类信息确定模块,用于根据所述文本特征以及预先训练的分类模型,确定所述口令的信息是否为开放类信息。
可选地,所述个性化口令生成模块具体包括:
主题提取单元,用于当所述口令的信息为开放类信息时,则提取所述口令中的主题;
目标内容获取单元,用于根据所述主题以及第二用户的操作历史数据和/或地理位置信息,从预设的内容数据库中获取目标内容;
第一个性化口令生成单元,用于以所述目标内容作为所述个性化口令,或利用所述目标内容生成所述个性化口令。
可选地,所述目标内容获取单元具体包括:
关键历史信息获取子单元,用于基于所述主题,对所述操作历史数据进行过滤和统计,得到与所述主题相关的关键历史信息;
第一检索子单元,用于根据所述主题以及所述关键历史信息,在相应于所述主题的内容数据库中进行检索;
第一目标内容确定子单元,用于将相关性最高的检索结果作为所述目标内容。
可选地,所述目标内容获取单元具体包括:
第一语言特点确定子单元,用于根据所述操作历史数据和/或所述地理位置信息,确定第二用户的惯用语言和/或语言风格;
第二检索子单元,用于根据所述主题以及所述惯用语言和/或所述语言风格,在相应于所述主题的内容数据库中进行检索;
第二目标内容确定子单元,用于将相关性最高的检索结果作为所述目标内容。
可选地,
所述第二用户信息获取模块具体用于获取第二用户的操作历史数据和/或地理位置信息;
所述个性化口令生成模块具体包括:
文本信息提取单元,用于提取所述口令中的文本信息;
第二个性化口令生成单元,用于根据所述文本信息以及第二用户的操作历史数据和/或地理位置信息,生成所述个性化口令。
可选地,所述第二个性化口令生成单元具体包括:
第二语言特点确定子单元,用于根据所述操作历史数据和/或所述地理位置信息,确定第二用户的惯用语言和/或语言风格;
个性化口令生成子单元,用于根据所述文本信息以及所述惯用语言和/或所述语言风格,生成所述个性化口令。
本发明通过接收第一用户发送的口令,并确定接收所述口令的第二用户,获取第二用户信息;根据所述口令的信息和所述第二用户信息,生成针对第二用户的个性化口令,使得口令信息与接收口令的第二用户息息相关,不再是千篇一律的统一形式,更由于附带了特定的接收方的属性信息,使口令本身相比现有的口令形式,能够发挥出成倍的优势并可以因此拓展到多个应用场景中,以满足接收方甚至发送方对于多样性、娱乐性、安全性、专属性等方面的需求,从而能够获得更佳的用户之间的交互效果,以此大大提升用户体验。
附图说明
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步描述,其中:
图1为本发明提供的个性化口令生成方法的实施例的流程图;
图2为本发明提供的步骤S4的具体实施例的流程图;
图3为本发明提供的步骤S200的具体实施例的流程图;
图4为本发明提供的针对开放类口令的个性化口令生成方法的实施例的流程图;
图5为本发明提供的步骤S12的第一实施例的流程图;
图6为本发明提供的步骤S12的第二施例的流程图;
图7为本发明提供的个性化口令生成系统的实施例的方框示意图。
附图标记说明:
1口令接收模块2第二用户信息获取模块3个性化口令生成模块
具体实施方式
下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本发明提供了一种个性化口令生成方法的实施例,如图1所示,该方法可以包括如下步骤:
步骤S1、接收由第一用户发送的口令;
这里所称第一用户即是口令的发送方,此处所称口令,是作为后续生成最终个性化口令的基础,而非作为口令本体最终展示给下文中提到的第二用户(接收口令的对象),当然,该口令也可以在生成最终的个性化口令后,和个性化口令一同展示给第二用户,本发明对此不做限定。因而,“口令”应理解为第一用户需要以此作为条件生成至少一个面向特定第二用户的个性化口令,特定的第二用户可以是一个也可以是多个;为了便于说明,以口令红包场景为例解释所称口令:第一用户在其一侧制作红包并附带一条口令,例如作为提取红包金额的必要条件,请求作为红包接收对象的第二用户念出“祝XXX生日快乐”;当然,随着应用场景的不同,第一用户既可以是人也可以是计算机,而口令的形式既可以轻松娱乐也可以严肃正式。另外,关于本步骤中涉及到的接收第一用户口令的技术手段本身,可借鉴多种现有技术,例如由社交应用的红包业务服务器从第一用户的终端接收相应的请求等等,本发明对此不作限定。
步骤S2、确定接收口令的第二用户;
本步骤是基于本发明的设计初衷而提出的。本发明强调的个性化的对象是针对接收口令的一方,即特定的第二用户,那么就有必要明确第一用户所发出的口令面向的对象。以口令红包场景为例,第一用户发出红包可能是面向唯一的第二用户,也可能是面向多个第二用户,前者就是一个用户对一个用户的情形,较为容易确定出实际接收口令的对象。但后者就有可能出现较为复杂的情况,如群内的抢红包功能,第一用户发出的口令红包是针对多个用户,而群内多个用户不一定每个人都能够抢到红包成为所称第二用户,因而有必要在此步骤中明确第二用户的身份。在一种较佳实施例中,可以通过检测多个用户对红包的响应次序(例如判定点击红包的时间),并根据红包预设的分配人数确定该用户是否为第二用户,这与现有的群内抢红包的技术手段类似:判断用户抢红包动作是否有效,有效用户则确定为第二用户,并对该第二用户展开后续生成口令的处理操作。
当然,在完整的抢红包程序结束后,对于群内所有用户,包括没有成为所称第二用户的其他用户,开放同等的权限,即均可以通过进入到红包内查看/收听原始的口令及针对各第二用户生成的个性化口令,以及各第二用户对口令内容的执行情况,对此本发明不做限定。
步骤S3、获取第二用户信息;
接续前述步骤,在明确了第二用户身份后,即可以针对性地获取各第二用户的信息。所述第二用户信息是后续生成个性化口令的参考基础,可以根据场景的不同获取一种或多种第二用户信息,如通过GPS等定位设备获取到第二用户当前和/或历史的位置信息,这里所述位置信息可以是第二用户所在的国家、省市、当前具体的位置或周边地理标志建筑等等;还可以通过第二用户所用移动通信信息查询到第二用户的位置数据,例如通过手机号码获取第二用户的手机号归属地,或通过移动网络数据获知第二用户是否进入到某个省市地区等等;此外,可以通过第二用户常用的输入法程序获取到输入历史信息,如第二用户使用输入法时常用的语种、方言等识别信息,还可以包括第二用户使用该输入法输入的具体历史内容,如常用的字词、语句、语言风格等等;在一定开放权限的条件下,还可以获取到第二用户使用其他应用设备的历史信息,例如在电影订票APP中的订票记录、在外卖APP中的订餐记录等等,甚至在某些特殊的场景(非群内抢红包这类娱乐性质的场景)中,还可以基于合法及保密准则获取到第二用户较为隐私的个人信息,如姓名、生日、出生地等。对以上需说明两点,其一、上述信息的获取是为了判定第二用户的诸如兴趣、习惯、信用、语言、职业等,这样,后续生成的个性化口令才能更贴近第二用户的特点。其二、本实施例提出此步骤是基于整体技术方案而言,是用于后续生成个性化口令的前序技术手段,而在实际操作中具体采用何种“技术工具”去获取到上述信息,则非本发明关注的重点,实施时可借鉴现已公开的多种技术予以实现,本发明不对此作出限定。
步骤S4、根据口令的信息和第二用户信息,生成针对第二用户的个性化口令。
在获得上述两项条件之后,即可以根据不同的策略和相应的技术手段,生成具有针对性的个性化口令,也即是每个第二用户均得到与其自身相关的个性化口令,尤其当有多个第二用户时,各第二用户所需执行的个性化口令可以各不相同。对于可能出现相同个性化口令的特殊情形,在其他实施例中可以通过分配不同第二用户不同的条件信息的方式,或者设置不同的条件信息组合方式,以此避免出现相同个性化口令的情形。此外需指出,由于第一用户是开放型用户,其发送的口令存在多样性差异,因此会产生不同的类型以及相应的处理方案,本发明将在下文中提供多种可供实施参考的具体实施例。
综上,本发明使得口令本身与接收口令的第二用户息息相关,不再是千篇一律的统一形式,更由于附带了特定的接收方的属性信息,使口令本身相比现有的口令形式,能够发挥出成倍的优势并可因此拓展到多个应用场景中,以满足接收方(所称第二用户)甚至发送方(所称第一用户)对于多样性、娱乐性、安全性、专属性等方面的需求,从而能够获得更佳的用户之间的交互效果,以此大大提升用户(包括第一、第二用户,甚至包括相关的其他用户)体验。
关于前文中提及的口令的信息,上述实施例并不对此作出限制,也即是第一用户所发的口令可以是任何形式、类型、内容等,而本实施例则侧重于接收到该口令后,如何根据第二用户的信息获得个性化口令。据此,本发明提供了如下实施例以供参考,如图2所示,其中可以包括:
S100、提取口令中的文本信息;
无论是何种形式、类型的口令,均可以直接从口令信息中识别出所含内容。例如,请念出祝大家新的一年身体健康。那么根据句式规则,即可以将“祝大家新的一年身体健康”提取出来,当然,更为优选地是采用现有的文本提取模型,从口令中获取到准确的文本信息。对此本发明不作限定。
S200、根据文本信息以及第二用户的操作历史数据和/或地理位置信息,生成个性化口令。
如前文所述,第二用户的信息中操作历史数据和/或地理位置信息相对容易获取并且基于此也足以生成一定的个性化内容,因而可以将前步得到的文本信息与该具体的第二用户的信息相结合,直接生成最终的个性化口令。
经由统计和分析发现,一般而言对于第一用户发出的口令,可进行个性化拓展的方向,以如何念出口令内容的角度居多,因此本发明提供了一种针对这种口令生成方法的具体实施例,如图3所示,前述步骤S200可以具体为:
步骤S201、根据操作历史数据和/或地理位置信息,确定第二用户的惯用语言和/或语言风格;
例如由第二用户的当前和历史的GPS定位的所在国家、省市,使用拼音输入法时选择的键盘方言/语种和语音输入法选择的方言/语种历史记录。统计出最接近第二用户的惯用语言,这里所称惯用语言包括语种和/或方言。
而对于所述语言风格,是从语法和韵律角度判定出一种说话风格特色,例如“港台腔”、“甄嬛体”、“知乎体”、“王家卫体”等等。具体而言,可以根据第二用户使用输入法的历史数据,查询与之相近的表述风格,以此作为生成个性化口令条件之一,这里所称输入法(包括语音输入)的历史数据是指第二用户使用输入法进行社交沟通、搜索评论等语言活动时所输入的内容。
在实际操作中,还可以收集大量不同风格的语言文本,训练一个文本分类器;文本分类器的输入是不同风格的语言文本的word embedding矩阵,输出是对应的网络风格的one hot向量。例如,训练数据有三种网络语言风格,“港台腔”、“甄嬛体”、“知乎体”,他们的one hot向量分别是(0,0,0)、(0,1,0)、(0,0,1);例如在用甄嬛体“今日外面的天气是极好的”进行模型训练时,可将“今日外面的天气是极好的”这句话转成word embedding的矩阵W,那么文本分类器的输入是W,输出是(0,1,0)。之后,可将第二用户的历史数据,通过相同的方法转成word embedding的矩阵输入至文本分类器,得到分类结果,从而确定第二用户的语言风格。
步骤S202、根据文本信息以及惯用语言和/或语言风格,生成个性化口令。
具体的生成方式将在下文中具体说明,但这里可以指出的是,在生成个性化口令的过程中,正是由于采用了“和/或“关系,因而在某些实施例中可以使各种个性化条件整合为一体,例如最后生成的个性化口令为:请用闽南话的港台腔说出“祝大家新的一年身体健康”。
但是,本领域技术人员可知,上述仅为一种场景的示例,具体使用何种个性化信息以及何种组合策略生成最终的口令,取决于场景的差异。例如当银行向第二用户发送涉及金额变动的口令时,则生成的个性化口令不建议使用抢红包场景下的娱乐风格的口令,而可以是较为正式且更可能涉及个人信息的个性化口令。
而关于前文提及的由于口令存在多样性差异,因此会产生不同的处理方案,本发明特别针对一种开放性类型,也即是能够获得较为丰富且多样性的个性化口令的类型,进行如下具体阐述。
按个性化需求以及统计规律,第一用户设置的口令信息基本上可分为开放类信息或封闭类信息。所述开放类信息口令是指设定的口令并不需要(或不明确指出)第二用户按照口令内容直接输入一致内容,而是指定了一个或多个开放的主题,如第一用户可以设置口令为“请说一句电影台词”、“请用方言说一个绕口令”等;而具有封闭类信息的口令是指第一用户设置的口令就是第二用户需要直接输入的具体内容,该类口令与现有技术中的口令设置类似,如第一用户设置口令为“祝XXX生日快乐”、从后往前念“吃葡萄不吐葡萄皮”等,对于该封闭类同样可以按照前文提及的结合第二用户的诸如操作历史和/或地理位置等信息得到个性化口令,但此处不再赘述。
在实施时,可以通过识别口令的类型的方式,锁定前述开放类信息。实施时可以采用多种现有技术手段,因为口令通常具有一定的句式规则,因此优选基于特定规则的分类方法,对口令进行分类。这里需指出的是,该口令可以直接来自于第一用户的文本录入,也可以是将第一用户的语音数据转写成口令文本,本发明对此不做限定。
具体地,本实施例提供了一种利用预先构建的分类模型进行开放类信息的识别。其中,该分类模型可采用DNN等常规结构,并可以预先收集大量包括开放类信息和封闭类信息的口令文本,再由人工标出相应的类型,作为训练测试数据集。并且,该分类模型的输入可以是在接收到第一用户发送的口令后,提取该口令的文本特征,在实际操作中也可以将口令文本特征转成word embedding矩阵;而分类模型的输出则可以用0或1表示(比如0表示具有封闭类信息的口令,1表示具有开放类信息的口令)。具体关于模型的构建、训练、测试等皆可以参考现有技术,本发明不对此限定。但需指出,这里所称的开放类信息口令是指只要为含有开放类信息即可,无关乎该开放类信息占口令总信息的比重,举例而言:1)说一句电影台词,即为具有更多开放类信息的口令,例如以什么语言语种说、针对哪部电影、电影中的哪段台词等等;2)用潮州话说一句《厉害了我的国》里的台词,这条口令中所包含的开放类信息较少,但仍属于本实施例所称的为开放类信息的口令。
基于上述,本发明提供了一种针对口令的信息为开放类信息的较佳实施参考,如图4所示,可以包括如下步骤:
步骤S11、提取口令中的主题;
由于开放类信息口令不包含具体的口令内容主体,因而开放类信息中的主题即是获得相应内容主体的前提“线索”,而通常第一用户发送的开放类信息口令如“请说一句电影台词”、“请说一句歌词”、“请说一个绕口令”均具备可预测的句式规范,因此基于该原理并结合现有的技术工具能够提取到开放类信息口令中的主题,如示例中的“电影台词”、“歌词”、“绕口令”等。
关于前述主题内容的提取可以采用现有的关键词预测技术,本实施例中提供但不限于采用一种结合预先训练的主题特征提取模型的实施参考,通过该主题特征提取模型可以针对前述分类模型输出的具有开放类信息的口令,从中获取表征具体开放类信息的特征。通常而言,之所以开放是因为第一用户没有明确具体的口令内容,而是提供一种较为宽泛且可以进一步发散的主题,而该主题对应的具体内容则需要后续结合第二用户的属性确定针对第二用户的个性化的内容,因此有必要首先从第一用户的开放类口令(为便于说明,将具有开放类信息的口令统称为开放类口令)中明确主题是什么,只有在主题明确后才能在该主题下进行个性化挖掘。
该主题特征提取模型结构依然可以采用现有诸多结构,且输入可以是具有开放类信息的口令的word embedding矩阵,输出则可以是对应的主题的word embedding向量,构建模型时,通过大量获取具有开放类信息的口令数据,并根据标注的口令数据中的主题,对该模型的参数进行训练。
具体在运行阶段,首先将第一用户设置的开放类口令转成wordembedding矩阵并输入所述主题特征提取模型,得到主题的word embedding向量;随后计算得到的主题的word embedding向量与主题词库中所有主题词的word embedding向量的距离,选取与之距离最小的主题词作为该口令的主题,这里所称主题词库可以是训练数据中所有主题词去重后的集合;例如,主题词库中有三个主题词,分别是“电影台词”、“歌词”、“绕口令”,他们对应的word embedding向量分别是
Figure BDA0001918592930000121
口令通过主题特征提取模型得到的wordembedding向量是
Figure BDA0001918592930000123
分别计算
Figure BDA0001918592930000122
Figure BDA0001918592930000124
的距离,得到dva,dvb,dvc,假设dvc最小,则可以确定口令的主题是“绕口令”。
步骤S12、根据主题以及第二用户的操作历史数据和/或地理位置信息,从预设的内容数据库中获取目标内容;
虽然仅根据已明确的主题可以获取到与主题相关的任何内容,但最终生成的口令与个性化的口令无关,脱离了与接收方的关联,也失去了本发明的设计意义。因此,本步骤中强调了将已获得的主题与第二用户信息结合,这里所称第二用户信息可以包括上述操作历史数据和/或地理位置信息,在其他场景中还可以结合第二用户的个人信息。而所述从预设的内容数据库中获取目标内容,在另一个实施例中,可以先依据已明确的主题从多个不同主题下的内容数据库中筛选其中之一,并在该对应的内容数据库中获取目标内容。而在另一个较佳实施例中,可以通过从诸如互联网等媒介上爬取到的海量数据构建一个较大规模的内容数据库,并从中获取相应于主题的目标内容。
步骤S13、以目标内容作为个性化口令,或利用目标内容生成个性化口令。
最后,可以将获得的目标内容直接作为个性化口令的主体,得到针对第二用户的专属口令,或者再对该目标内容进行个性化处理,得到针对第二用户的专属口令,下文中将对此种情形做相应介绍。这里需说明的是,生成的个性化口令可以是文本形式也可以是语音、视频图片等多种形式,这取决于应用场景以及具体的口令;并且,如果口令中为文本或语音,生成的个性化口令优选经过语法处理,形成可读性强、友好和自然的内容,对此本发明不作限定。
关于前述步骤S12,由于第二用户的个人信息可能涉及隐私,因而能够有权施用的场景相对较少,因此本发明仅以涵盖较多应用场景的操作历史数据和/或地理位置信息的角度,对上述步骤S12做具体的示例性说明,但需指出,技术思路可以是完全相通的,因此下述具体实施方案中的技术手段同样适用于其他场景。
实施例一如图5所示,包括:
S121、基于主题,对操作历史数据进行过滤和统计,得到与主题相关的关键历史信息;
例如从开放类口令中提取到“电影台词”和“歌词”这类的主题,可以通过挖掘用户的操作历史数据,获知用户的兴趣偏好以此作为获取目标内容的依据。具体而言,可以根据主题构建一个过滤词表,利用该过滤词表可以从用户的操作历史数据中搜索到与主题相关的关键历史信息。该过滤词表的生成方式可以将该表中的过滤词设为主题所指事物的一个或多个上位词,并且可以根据语义先验知识,形成主题与过滤词的映射关系。例如“电影台词”的过滤词表中的过滤词可以包括“电影”,“歌词”的过滤词表中的过滤词可以包括“歌曲”、“音乐”等,这样设计的原因是,由于口令指令来自于第一用户,可能由于第一用户和第二用户的表达习惯不同,导致检索第二用户历史数据出现困难,可匹配内容不多等,因而上述方式在过滤历史数据时可以涵盖更多的相关数据,避免遗漏。
利用该过滤词表对第二用户的操作历史数据进行过滤,排除无关历史的干扰,得到候选历史数据;再结合如相似度、互信息、使用频次等预设标准,对候选历史数据进行筛选,最终得到与主题相关的关键历史信息。
例如,主题是“电影台词”,据此得到过滤词表,其中包括过滤词是“电影”;再用“电影”这个过滤词对第二用户的操作历史数据进行过滤,检索出历史数据中出现过20部电影名称,再统计这20部电影名称各自的出现次数,其中《厉害了我的国》出现的次数最多,则确定了《厉害了我的国》是与该主题相关的关键历史信息。
S122、根据主题以及关键历史信息,在相应于主题的内容数据库中进行检索;
结合主题(也即是第一用户设置的具体要求)以及前述得到的关键历史信息,在相应于主题的内容数据库中进行进一步检索。这里所称相应于主题的内容数据库即是经过了前文提到的从众多内容数据库筛选出的特定内容数据库。
结合前例,即可以是从经典电影数据库(或者经典台词数据库)中以《厉害了我的国》、“电影台词”作为检索词进行检索。
S123、将相关性最高的检索结果作为目标内容。
经上述检索后,得到了相关性最高的搜索结果,例如《厉害了我的国》中的经典台词“有一种骄傲,叫我是中国人”,于此,则可以利用该结果作为所述目标内容,也即是后续生成个性化口令的主体内容。而最终生成的个性化口令可以仅由“有一种骄傲,叫我是中国人”组成,或者如前文所述利用该目标内容,还可以进一步附加第二用户的其他信息生成更具个人特色的个性化口令,例如判定第二用户的语言风格为港台腔,则生成的个性化口令可以是:请用港台腔念出《厉害了我的国》中的台词“有一种骄傲,叫我是中国人”。
对于本实施例中提及的过滤词表,为了使过滤和统计更有效,可以将与过滤词语义相近的词也加入该过滤词表,得到扩展的过滤词列表。例如,可以将“歌手”、“专辑”加入“歌词”的过滤词列表,可以将“演员”、“导演”加入“电影台词”的过滤词列表。扩展的过滤词可以通过wordembedding聚类的方法得到,具体方法与现有方法一致,不再赘述。
实施例二如图6所示,包括:
S1201、根据操作历史数据和/或地理位置信息,确定第二用户的惯用语言和/或语言风格;
例如,从开放类口令中提取到“绕口令”这类的主题,可以根据第二用户的语言习惯生成。不同方言区的用户,在发音上有自己的特点,针对这些方言的发音特点生成的绕口令更有趣味性和挑战性。例如,四川方言的用户,一般发音不分平翘舌,那么可以生成个性化口令为“四是四,十是十,十四是十四,四十是四十”,福建方言的用户,一般发音分不清“h”和“f”,那么可以生成个性化口令为“黑化肥发挥,灰化肥发黑”。
具体可以是,综合第二用户的操作历史数据和/或地理位置信,使用基于统计的方法判断出第二用户的惯用语言和/或语言风格。例如,第二用户的手机号码属于福建,历史地理位置包括福建、北京、安徽,而当前地理位置北京,方言语音输入法的历史记录是闽南话(福建),综合上述信息,福建的出现次数是3,北京次数是2,安徽次数是1,则判断该第二用户的方言区是福建。
S1202、根据主题以及惯用语言和/或语言风格,在相应于主题的内容数据库中进行检索;
结合主题(也即是第一用户设置的具体要求)以及前述得到的第二用户的惯用语言和/或语言风格,查找与二者相关的内容数据库。以上例而言,则可以查询各地方言绕口令数据库,此类内容数据库可由人工根据各地方言发音特点收集特色绕口令。
S1203、将相关性最高的检索结果作为目标内容。
最后以相关性最高的检索结果作为输出,例如针对闽南话而言,绕口令数据库中与hf发音有关的绕口令最为相关,如将“黑化肥发挥,灰化肥发黑”作为目标内容。由于至此,已经根据个性化信息完成了相关元素的检索,因而在后续生成个性化口令时,则可以直接采用“黑化肥发挥,灰化肥发黑”作为最终的口令结果。
综合上述各实施例以及优选方案,本发明通过接收由第一用户发送的口令;确定接收所述口令的第二用户,并获取第二用户信息;根据所述口令的信息和所述第二用户信息,生成针对第二用户的个性化口令,使得口令信息与接收口令的第二用户息息相关,不再是千篇一律的统一形式,更由于附带了特定的接收方的属性信息,使口令本身相比现有的口令形式,能够发挥出成倍的优势并可以因此拓展到多个应用场景中,以满足接收方甚至发送方对于多样性、娱乐性、安全性、专属性等方面的需求,从而能够获得更佳的用户之间的交互效果,以此大大提升用户体验。
相应于前述各实施例及优选方案,本发明还提供了一种个性化口令生成系统,如图7所示,该系统可以包括至少一个用于存储相关指令的存储器以及至少一个与所述存储器连接并用于执行下述各模块的处理器(在其他实施例中一个或多个处理器也可以直接执行相应的步骤动作,而无需通过下述模块执行,例如处理器直接执行接收口令、确定口令类型、获取用户信息以及生成口令等操作):
口令接收模块1,用于接收由第一用户发送的口令;
第二用户信息获取模块2,用于确定接收所述口令的第二用户,并获取第二用户信息;
个性化口令生成模块3,用于根据所述口令的信息和所述第二用户信息,生成针对第二用户的个性化口令。
进一步地,所述系统还包括:
文本特征提取模块,用于接收所述口令后,提取所述口令的文本特征;
开放类信息确定模块,用于根据所述文本特征以及预先训练的分类模型,确定所述口令的信息是否为开放类信息。
进一步地,所述个性化口令生成模块具体包括:
主题提取单元,用于当所述口令的信息为开放类信息时,则提取所述口令中的主题;
目标内容获取单元,用于根据所述主题以及第二用户的操作历史数据和/或地理位置信息,从预设的内容数据库中获取目标内容;
第一个性化口令生成单元,用于以所述目标内容作为所述个性化口令,或利用所述目标内容生成所述个性化口令。
进一步地,所述目标内容获取单元具体包括:
关键历史信息获取子单元,用于基于所述主题,对所述操作历史数据进行过滤和统计,得到与所述主题相关的关键历史信息;
第一检索子单元,用于根据所述主题以及所述关键历史信息,在相应于所述主题的内容数据库中进行检索;
第一目标内容确定子单元,用于将相关性最高的检索结果作为所述目标内容。
进一步地,所述目标内容获取单元具体包括:
第一语言特点确定子单元,用于根据所述操作历史数据和/或所述地理位置信息,确定第二用户的惯用语言和/或语言风格;
第二检索子单元,用于根据所述主题以及所述惯用语言和/或所述语言风格,在相应于所述主题的内容数据库中进行检索;
第二目标内容确定子单元,用于将相关性最高的检索结果作为所述目标内容。
进一步地,
所述第二用户信息获取模块具体用于获取第二用户的操作历史数据和/或地理位置信息;
所述个性化口令生成模块具体包括:
文本信息提取单元,用于提取所述口令中的文本信息;
第二个性化口令生成单元,用于根据所述文本信息以及第二用户的操作历史数据和/或地理位置信息,生成所述个性化口令。
进一步地,所述第二个性化口令生成单元具体包括:
第二语言特点确定子单元,用于根据所述操作历史数据和/或所述地理位置信息,确定第二用户的惯用语言和/或语言风格;
个性化口令生成子单元,用于根据所述文本信息以及所述惯用语言和/或所述语言风格,生成所述个性化口令。
虽然上述系统实施例及优选方案的工作方式以及技术原理皆记载于前文,但仍需指出的是,本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,也可以把它们分成多个子模块或子单元或子组件予以实施。
以及,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上依据图式所示的实施例详细说明了本发明的构造、特征及作用效果,但以上仅为本发明的较佳实施例,需要言明的是,上述实施例及其优选方式所涉及的技术特征,本领域技术人员可以在不脱离、不改变本发明的设计思路以及技术效果的前提下,合理地组合搭配成多种等效方案;因此,本发明不以图面所示限定实施范围,凡是依照本发明的构想所作的改变,或修改为等同变化的等效实施例,仍未超出说明书与图示所涵盖的精神时,均应在本发明的保护范围内。

Claims (14)

1.一种个性化口令生成方法,其特征在于,包括:
接收由第一用户发送的口令;
确定接收所述口令的第二用户,并获取第二用户信息;
根据所述口令的信息和所述第二用户信息,生成针对第二用户的个性化口令。
2.根据权利要求1所述的个性化口令生成方法,其特征在于,所述方法还包括:
接收所述口令后,提取所述口令的文本特征;
根据所述文本特征以及预先训练的分类模型,确定所述口令的信息是否为开放类信息。
3.根据权利要求2所述的个性化口令生成方法,其特征在于,所述根据所述口令的信息和所述第二用户信息,生成针对第二用户的个性化口令包括:
若所述口令的信息为开放类信息,则提取所述口令中的主题;
根据所述主题以及第二用户的操作历史数据和/或地理位置信息,从预设的内容数据库中获取目标内容;
以所述目标内容作为所述个性化口令,或利用所述目标内容生成所述个性化口令。
4.根据权利要求3所述的个性化口令生成方法,其特征在于,所述根据所述主题以及第二用户的操作历史数据,从预设的内容数据库中获取目标内容包括:
基于所述主题,对所述操作历史数据进行过滤和统计,得到与所述主题相关的关键历史信息;
根据所述主题以及所述关键历史信息,在相应于所述主题的内容数据库中进行检索;
将相关性最高的检索结果作为所述目标内容。
5.根据权利要求3所述的个性化口令生成方法,其特征在于,所述根据所述主题以及第二用户的操作历史数据和/或地理位置信息,从预设的内容数据库中获取目标内容包括:
根据所述操作历史数据和/或所述地理位置信息,确定第二用户的惯用语言和/或语言风格;
根据所述主题以及所述惯用语言和/或所述语言风格,在相应于所述主题的内容数据库中进行检索;
将相关性最高的检索结果作为所述目标内容。
6.根据权利要求1所述的个性化口令生成方法,其特征在于,
所述获取第二用户信息包括获取第二用户的操作历史数据和/或地理位置信息;
所述根据所述口令的信息和所述第二用户信息,生成针对第二用户的个性化口令包括:
提取所述口令中的文本信息;
根据所述文本信息以及第二用户的操作历史数据和/或地理位置信息,生成所述个性化口令。
7.根据权利要求6所述的个性化口令生成方法,其特征在于,所述根据所述文本信息以及第二用户的操作历史数据和/或地理位置信息,生成所述个性化口令包括:
根据所述操作历史数据和/或所述地理位置信息,确定第二用户的惯用语言和/或语言风格;
根据所述文本信息以及所述惯用语言和/或所述语言风格,生成所述个性化口令。
8.一种个性化口令生成系统,其特征在于,包括:
口令接收模块,用于接收由第一用户发送的口令;
第二用户信息获取模块,用于确定接收所述口令的第二用户,并获取第二用户信息;
个性化口令生成模块,用于根据所述口令的信息和所述第二用户信息,生成针对第二用户的个性化口令。
9.根据权利要求8所述的个性化口令生成系统,其特征在于,所述系统还包括:
文本特征提取模块,用于接收所述口令后,提取所述口令的文本特征;
开放类信息确定模块,用于根据所述文本特征以及预先训练的分类模型,确定所述口令的信息是否为开放类信息。
10.根据权利要求9所述的个性化口令生成系统,其特征在于,所述个性化口令生成模块具体包括:
主题提取单元,用于当所述口令的信息为开放类信息时,则提取所述口令中的主题;
目标内容获取单元,用于根据所述主题以及第二用户的操作历史数据和/或地理位置信息,从预设的内容数据库中获取目标内容;
第一个性化口令生成单元,用于以所述目标内容作为所述个性化口令,或利用所述目标内容生成所述个性化口令。
11.根据权利要求10所述的个性化口令生成系统,其特征在于,所述目标内容获取单元具体包括:
关键历史信息获取子单元,用于基于所述主题,对所述操作历史数据进行过滤和统计,得到与所述主题相关的关键历史信息;
第一检索子单元,用于根据所述主题以及所述关键历史信息,在相应于所述主题的内容数据库中进行检索;
第一目标内容确定子单元,用于将相关性最高的检索结果作为所述目标内容。
12.根据权利要求10所述的个性化口令生成系统,其特征在于,所述目标内容获取单元具体包括:
第一语言特点确定子单元,用于根据所述操作历史数据和/或所述地理位置信息,确定第二用户的惯用语言和/或语言风格;
第二检索子单元,用于根据所述主题以及所述惯用语言和/或所述语言风格,在相应于所述主题的内容数据库中进行检索;
第二目标内容确定子单元,用于将相关性最高的检索结果作为所述目标内容。
13.根据权利要求8所述的个性化口令生成系统,其特征在于,
所述第二用户信息获取模块具体用于获取第二用户的操作历史数据和/或地理位置信息;
所述个性化口令生成模块具体包括:
文本信息提取单元,用于提取所述口令中的文本信息;
第二个性化口令生成单元,用于根据所述文本信息以及第二用户的操作历史数据和/或地理位置信息,生成所述个性化口令。
14.根据权利要求13所述的个性化口令生成系统,其特征在于,所述第二个性化口令生成单元具体包括:
第二语言特点确定子单元,用于根据所述操作历史数据和/或所述地理位置信息,确定第二用户的惯用语言和/或语言风格;
个性化口令生成子单元,用于根据所述文本信息以及所述惯用语言和/或所述语言风格,生成所述个性化口令。
CN201811583879.1A 2018-12-24 2018-12-24 个性化口令生成方法及系统 Active CN109818737B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811583879.1A CN109818737B (zh) 2018-12-24 2018-12-24 个性化口令生成方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811583879.1A CN109818737B (zh) 2018-12-24 2018-12-24 个性化口令生成方法及系统

Publications (2)

Publication Number Publication Date
CN109818737A CN109818737A (zh) 2019-05-28
CN109818737B true CN109818737B (zh) 2021-10-08

Family

ID=66602315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811583879.1A Active CN109818737B (zh) 2018-12-24 2018-12-24 个性化口令生成方法及系统

Country Status (1)

Country Link
CN (1) CN109818737B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111145721B (zh) * 2019-12-12 2024-02-13 科大讯飞股份有限公司 个性化提示语生成方法、装置和设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105827409A (zh) * 2016-02-29 2016-08-03 宇龙计算机通信科技(深圳)有限公司 一种身份验证的方法及装置
CN105989084A (zh) * 2015-02-11 2016-10-05 阿里巴巴集团控股有限公司 一种回复问题的方法和设备
CN109003600A (zh) * 2018-08-02 2018-12-14 科大讯飞股份有限公司 消息处理方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105094315B (zh) * 2015-06-25 2018-03-06 百度在线网络技术(北京)有限公司 基于人工智能的人机智能聊天的方法和装置
CN106959985A (zh) * 2016-01-08 2017-07-18 深圳市星电商科技有限公司 资源分享方法和装置
CN107025393B (zh) * 2016-12-08 2020-07-10 阿里巴巴集团控股有限公司 一种资源调用的方法及装置
CN108400926A (zh) * 2017-02-08 2018-08-14 腾讯科技(深圳)有限公司 一种信息处理的方法、相关设备以及系统
CN108764990A (zh) * 2018-05-22 2018-11-06 广州勇往科技有限公司 一种基于微信小程序发语音红包软件

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105989084A (zh) * 2015-02-11 2016-10-05 阿里巴巴集团控股有限公司 一种回复问题的方法和设备
CN105827409A (zh) * 2016-02-29 2016-08-03 宇龙计算机通信科技(深圳)有限公司 一种身份验证的方法及装置
CN109003600A (zh) * 2018-08-02 2018-12-14 科大讯飞股份有限公司 消息处理方法及装置

Also Published As

Publication number Publication date
CN109818737A (zh) 2019-05-28

Similar Documents

Publication Publication Date Title
CN109791767B (zh) 用于语音识别的系统和方法
CN107832286B (zh) 智能交互方法、设备及存储介质
CN104335160B (zh) 功能执行指示系统、以及功能执行指示方法
CN106601237B (zh) 交互式语音应答系统及其语音识别方法
US9047868B1 (en) Language model data collection
CN108255934B (zh) 一种语音控制方法及装置
US20190370398A1 (en) Method and apparatus for searching historical data
CN101309327B (zh) 语音聊天系统、信息处理装置、话语识别和关键字检测
CN114600114A (zh) 助理系统的设备上卷积神经网络模型
EP3032532A1 (en) Disambiguating heteronyms in speech synthesis
CN108989341A (zh) 语音自主注册方法、装置、计算机设备及存储介质
JP2016095383A (ja) 音声認識クライアント装置及びサーバ型音声認識装置
CN107818781A (zh) 智能交互方法、设备及存储介质
US9589563B2 (en) Speech recognition of partial proper names by natural language processing
US10224030B1 (en) Dynamic gazetteers for personalized entity recognition
CN108447471A (zh) 语音识别方法及语音识别装置
CN109509470A (zh) 语音交互方法、装置、计算机可读存储介质及终端设备
CN109887484A (zh) 一种基于对偶学习的语音识别与语音合成方法及装置
CN109801634A (zh) 一种声纹特征的融合方法及装置
CN109637520A (zh) 基于语音分析的敏感内容识别方法、装置、终端及介质
JP6927318B2 (ja) 情報処理装置、情報処理方法、及びプログラム
CN108304424B (zh) 文本关键词提取方法及文本关键词提取装置
CN110400563A (zh) 车载语音指令识别方法、装置、计算机设备及存储介质
KR102312993B1 (ko) 인공신경망을 이용한 대화형 메시지 구현 방법 및 그 장치
CN112527955A (zh) 一种数据处理的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant