CN108700952A

CN108700952A - 基于用户人口统计信息和情境信息预测文本输入

Info

Publication number: CN108700952A
Application number: CN201780013806.6A
Authority: CN
Inventors: 柳元皓; 宋熙俊
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2016-02-29
Filing date: 2017-02-27
Publication date: 2018-10-23
Also published as: KR20170101730A; KR102462365B1; US20190377425A1; US20170249017A1; US10921903B2; WO2017150860A1; EP3356914A1; US10423240B2; EP3356914A4

Abstract

提供由设备执行的用于推荐要通过键盘输入的至少一个词的方法。该方法显示用于在设备上输入至少一个字符或文本的键盘。该方法选择至少一个语言模型。该方法基于在键盘上输入的至少一个字符或文本和至少一个选择的语言模型来推荐与所输入的至少一个字符或文本有关的至少一个词，其中至少一个选择的语言模型包括基于设备的用户的人口统计特征的语言模型、基于设备的用户的文本输入历史的语言模型和基于运行键盘的情境的语言模型中的至少一个。

Description

基于用户人口统计信息和情境信息预测文本输入

技术领域

本公开涉及用于预测文本输入的方法和装置，并且更具体地涉及用于基于用户人口统计(demographic)信息和情境(context)信息来预测文本输入的方法和装置以及用于向用户推荐要输入的文本的方法和装置。

背景技术

随着移动设备变得更加紧凑，以硬件形式实现的接口正在被删除并被软件所取代。文本输入功能构成移动设备的大部分使用功能，并且移动设备的用户花费大量时间在输入文本上。

因此，不包括硬件型文本输入设备的移动设备需要有效的文本输入方法。

发明内容

技术问题

如上所述，不包括硬件型文本输入设备的移动设备需要有效的文本输入方法。

已经开发了预测用户输入文本的典型方法，以允许在移动设备中进行有效的文本输入，并且这些方法的示例可以包括自动完成、校正、预测、空白校正和表情符号输入。

然而，用户可以使用相同的语言模型，即向所有用户提供相同的推荐结果，或者当没有使用关于发生文本输入的情况的信息时不管文本输入情况如何都提供相同的推荐结果。因此，推荐词被选中的概率降低，这降低了提高文本输入效率的有效性。

技术解决方案

根据示例性实施例的一个方面，提供了一种推荐待通过虚拟键盘输入词的方法，其中该方法由设备执行并且包括：显示用于在设备上输入文本的虚拟键盘；选择至少一个语言模型；以及基于通过虚拟键盘输入的至少一个文本和至少一个选择的语言模型来推荐与所输入的至少一个文本有关的至少一个词，其中该语言模型包括基于设备的用户的人口统计特征的人口语言模型、基于设备的用户的文本输入历史的用户输入语言模型以及基于运行虚拟键盘的情境的情境语言模型中至少之一。

设备的用户的人口统计特征可以包括用户的性别、年龄、地区、职业、家乡、宗教和兴趣中的至少一个。

运行虚拟键盘的情境可以包括以下信息中至少之一：关于运行虚拟键盘的应用的信息、关于运行虚拟键盘的时间的信息以及关于运行虚拟键盘的地点的信息。

所述推荐可以包括从至少一个所选择的语言模型中包括的词当中推荐词，所述词包括所输入的文本并且已经由用户在之前输入了预定次数或更多次。

该方法可以进一步包括接收设备的用户的人口统计特征。

该方法可以进一步包括估计设备的用户的人口统计特征。

可以基于设备的用户的文本输入历史来估计设备的用户的人口统计特征。

可以基于关于用户的附加信息来估计设备的用户的人口统计特征。

该方法还可以包括：请求服务器传送语言模型；并从服务器接收所请求的语言模型。

该方法可以进一步包括：将用户信息传送到服务器；以及从服务器接收基于所传送的用户信息更新的语言模型。

推荐可以进一步包括确定至少一个推荐词的优先级。

根据另一示例性实施例的一方面，提供了一种用于推荐要通过虚拟键盘输入的词的装置，其中所述装置被设备使用并且包括：显示单元，被配置用于显示虚拟键盘以在设备上输入文本；以及词推荐单元，被配置用于选择至少一个语言模型并且基于通过虚拟键盘输入的至少一个输入文本和至少一个所选择的语言模型来推荐与所输入的至少一个文本有关的至少一个词，其中该语言模型包括基于设备的用户的人口统计特征的人口语言模型、基于设备的用户的文本输入历史的用户输入语言模型以及基于运行虚拟键盘的情境的情境语言模型中至少之一。

运行虚拟键盘的情境还可以包括以下信息中至少之一：关于运行虚拟键盘的应用的信息、关于运行虚拟键盘的时间的信息以及关于运行虚拟键盘的地点的信息。

推荐单元可以被配置用于从包括在至少一个所选择的语言模型中的词当中推荐词，所述词包括输入的文本并且已经由用户在之前输入预定次数或更多次。

该装置可以进一步包括被配置用于接收设备的用户的人口统计特征的输入单元。

词推荐单元可以被进一步配置用于估计设备的用户的人口统计特征。

词推荐单元可以进一步被配置用于请求服务器传送语言模型并且从服务器接收所请求的语言模型。

词推荐单元可以进一步被配置用于向服务器传送用户信息并且从服务器接收基于传送的用户信息更新的语言模型。

词推荐单元可以进一步被配置用于确定至少一个推荐词的优先级。

另外，还提供了一种记录有用于运行用于实现上述方法以及实现上述发明构思的其他方法和系统的计算机程序的非暂时性计算机可读记录介质。

在示例性实施例中，一种推荐要通过键盘输入的至少一个词的方法，所述方法由设备执行并且包括：显示用于在设备上输入至少一个字符或文本的键盘；选择至少一个语言模型；以及基于在键盘上输入的至少一个输入的字符或文本和至少一个所选择的语言模型，推荐与所输入的至少一个字符或文本有关的至少一个词，其中至少一个所选择的语言模型包括基于设备的用户的人口统计特征的语言模型、基于设备的用户的文本输入历史的语言模型以及基于运行键盘的情境的语言模型中的至少一个。

在另一个示例性实施例中，一种用于推荐要通过键盘输入的至少一个词的装置，所述装置被设备使用并且包括：显示单元，被配置用于显示键盘以在设备上输入至少一个字符或文本；以及词推荐单元，被配置用于选择至少一个语言模型以及基于在所述键盘上输入的至少一个的字符或文本和至少一个所选择的语言模型来推荐与所输入的至少一个字符或文本相关的至少一个词，其中至少一个所选择的语言模型包括基于设备的用户的人口统计特征的语言模型、基于设备的用户的文本输入历史的语言模型和基于运行键盘的情境的语言模型中的至少一个。

有益效果

提供了用于基于用户人口统计信息和情境信息来预测文本输入的方法和装置，其中与用户人口统计特征相对应的语言模型或与情境特征相关的语言模型被用于有效地预测和推荐输入文本。

其他方面将在下面的描述中部分阐述，并且部分将从描述中变得显而易见，或者可以通过实践所呈现的示例性实施例而了解。

附图说明

结合下面简要描述的附图，通过以下对示例性实施例的描述，这些和/或其他方面将变得明显且更易于理解。

图1示出根据示例性实施例的基于输入文本推荐要输入的词的方法。

图2A和图2B示出根据示例性实施例的基于用户人口统计特征频繁使用的词或语言。

图3示出根据示例性实施例的基于用户人口统计信息来推荐词。

图4A和图4B示出根据示例性实施例的基于情境信息推荐的词。

图5A和图5B示出根据示例性实施例的基于情境信息推荐的要输入的文本。

图6是根据示例性实施例的词推荐装置的具体结构图。

图7是根据示例性实施例的词推荐装置的操作流程图。

图8是图7中的示例性实施例的词推荐方法的详细流程图。

图9是根据另一示例性实施例的词推荐装置的操作流程图。

图10是图9中的示例性实施例的词推荐方法的详细流程图。

图11是根据另一示例性实施例的词推荐装置的操作流程图。

图12是图11中的示例性实施例的词推荐方法的详细流程图。

图13是图11中的示例性示例性实施例的词推荐方法的详细流程图。

图14是根据另一示例性实施例的词推荐装置的操作流程图。

图15是图14中的示例性实施例的词推荐方法的详细流程图。

图16是图14中的示例性实施例的词推荐方法的详细流程图。

图17是根据另一示例性实施例的词推荐装置的操作流程图。

图18示出根据示例性实施例的词推荐装置的设置。

图19是根据示例性实施例的词推荐系统的总体操作流程图。

图20是根据示例性实施例的词推荐装置的操作流程图。

具体实施方式

【最佳方式】

根据示例性实施例的一个方面，提供了一种推荐待通过虚拟键盘输入的词的方法，其中该方法由设备执行并且包括：显示虚拟键盘以用于在设备上输入文本；选择至少一个语言模型；以及基于通过虚拟键盘输入的至少一个输入文本和至少一个所选择的语言模型，推荐与该至少一个文本有关的至少一个词，其中该语言模型包括基于设备的用户的人口统计特征的人口统计语言模型、基于设备的用户的文本输入历史的用户输入语言模型以及基于虚拟键盘被运行的情境的情境语言模型中至少之一。

【发明方式】

现在将详细参考示例性实施例，其示例在附图中示出，其中相同的附图标记始终表示相同的元件。就这一点而言，本示例性实施例可以具有不同的形式，并且不应该被解释为限于这里阐述的描述。因此，下面仅通过参考附图来描述示例性实施例以解释各方面。诸如“至少一个”之类的表达当在元件列表之前时，修饰整个元件列表并且不修饰列表的单个元件。

现在将参照附图更充分地描述本发明构思，在附图中示出了本发明构思的示例性实施例。将详细描述示例性实施例，使得本领域的普通技术人员可以容易地实施本发明构思。应该理解，本发明构思的示例性实施例可以改变但不必相互排斥。

例如，在不脱离本发明构思的精神和范围的情况下，可以在其他示例性实施例中修改根据本说明书中描述的预定示例性实施例的特定形状、结构和性质。另外，在不脱离本发明构思的精神和范围的情况下，还可以修改每个示例性实施例的各个组件的位置或布置。因此，下面的详细描述不应被解释为具有有限的含义，而应被解释为涵盖权利要求的范围和与其等同的任何范围。

在附图中，相同的附图标记在各个方面表示相同的元件。此外，为了更清楚地描述本发明构思，在附图中省略了与描述无关的元件，并且在附图中相同的附图标记在整个说明书中表示相同的元件。

在下文中，将参照附图更充分地描述本发明构思，其中示出了本发明构思的示例性实施例，使得本领域的普通技术人员可以容易地实施本发明构思。然而，本发明构思可以以许多不同形式来体现，并且不应该被解释为限于这里阐述的示例性实施例。

在本说明书中，当组成元件“连接”或“被连接”到另一组成元件时，组成元件不仅直接接触或连接到另一组成元件，而且还通过插入其间的至少一个其它组成元件。另外，除非另有指定，否则当一个部分可以“包括”某个组成元件时，其不可以被解释为排除另一个组成元件，而是可以被解释为还包括其他组成元件。

现在将参考附图更充分地描述本发明构思。

图1示出根据示例性实施例的基于输入文本推荐要输入的词的方法。在其他示例性实施例中，可以输入字符、字母、符号(symbol)、标号(sign)、键(key)等。在其他示例性实施例中，可以输入词、表达、短语等。

随着集成电路技术和相关技术的进步，移动设备越来越紧凑，迄今为止在相关技术中的不同和分离的设备上实现的功能已越来越多地在移动设备上实现。相应地，用户已经从空间限制中获得了自由，例如，在旅途中他们能够使用包括在移动设备中的相机拍摄照片并且通过使用移动设备编辑和传送照片或者起草文档。

移动设备的一个代表性例子是智能电话，但确保移动性的其他各种移动电子设备(例如平板个人计算机(PC)和智能手表)也是其他示例。

虽然移动设备具有多种不同的功能，但是在移动设备的全部功能和应用中，文本输入功能是最频繁使用的。然而，移动设备通常不包括用于文本输入的物理硬件键，并且在这种情况下，当用户执行输入文本的操作(例如，选择文本输入窗口)时，在屏幕上显示虚拟键盘。在其他示例性实施例中，物理键盘可以与移动设备或计算机一起使用。

尽管集成电路技术和电池技术的发展已经允许移动设备的紧凑尺寸，但是如果移动设备的屏幕被缩小到预定尺寸或更小，则用户可能在通过使用虚拟键盘输入文本时感到不方便。另外，由于通常是移动设备的用户一手拿着设备而另一只手输入文本，因此需要更方便的用于文本输入的用户界面。

在这方面，许多移动设备都包括用于推荐要输入的词的词推荐功能，以便为用户提供更方便的文本输入方法。

如下执行推荐要输入的词的词推荐功能。当用户执行输入文本的操作时，在屏幕上显示虚拟键盘120和显示先前输入的文本的显示窗口110。当用户通过虚拟键盘120输入“Good to”时，则基于输入文本“Good to”，显示出确定在上述文本之后有很大概率要输入的词(诸如“hear”、“see”、和“be”)(130)。

如果用户下一个想要输入的词被包括在显示的推荐词130中，则用户可以从显示的推荐词130中选择词而不是触摸虚拟键盘，由此减少为了文本输入屏幕需要被触摸的次数。

如上所述为了推荐词或文本输入，使用语言模型(LM)。语言模型是指对人类语言(例如英语、韩语等)进行建模以计算哪些词串与实际使用的语言匹配以及匹配到什么程度。语言模型用于语言生成和信息搜索。使用基于英语和韩语的示例来描述和说明本公开中的示例性实施例，但是不限于此。可以使用其他语言来实现本公开中描述和示出的示例性实施例。

语言模型是通过收集语料库生成的。语料库指的是语言材料，其中文本以计算机可读形式收集，用于语言研究，并且是一目了然地展示语言如何被真正使用的文档的集合。根据诸如媒介、时间、空间、解释水平等的标准存在各种类型的语料库。语料库字面意思是可以被视为单一块的一堆词。

生成语言模型涉及连续收集作为大量文本数据的语料库，并且基于语料库来生成语言模型用于文本预测。

然而，在相关技术的词推荐方法中，当生成语言模型时，不考虑关于用户的人口统计特征或关于文本输入的情境特征，因此用户想要输入的词被推荐的概率很低。如果使用反映关于用户的人口统计特征或关于文本输入的情境特征的语言模型，则可以推荐更准确的输入文本。

用户的人口统计特征表示在人口统计方面作为用于输入文本的代理的用户的特征，并且这些特征例如可以指用户的性别、年龄、职业、地区方言、家乡、住宅信息、物理位置、宗教或用户的一个或多个兴趣。

关于文本输入的情境特征是指输入文本所处的情形或情境，并且可以是例如关于输入文本的时间的信息、关于输入文本的地方的信息或关于通过其输入文本的应用的信息。在示例性实施例中，地点也可以指代物理位置或者可以指文本在设备的屏幕上输入的位置、相对于屏幕上显示的GUI元素输入文本的位置。物理位置可以由GPS坐标信息或基于WLAN、蜂窝网络或其他无线网络的其他位置信息来指示。

换句话说或者另外地，关于文本输入的情境特征可以指由每个用户输入的文本的情境特征。例如，情境特征可以指关于根据时区由预定用户输入的文本的模式(pattern)信息、关于根据地点由预定用户输入的文本的模式信息或关于根据应用由预定用户输入的文本的模式信息。

图2A和2B示出了基于用户人口统计特征频繁使用的词或语言的示例。

图2A图示了根据作为用户人口统计特征之一的性别的频繁使用的词的例子。

例如，男性可能频繁使用与体育比赛(例如足球或棒球)有关的词语，并且经常使用与游戏相关的词或与IT设备和技术相关的词(例如电池或绑定(tethering))。因此，通过向男性用户推荐与体育比赛、与游戏相关的词或与IT相关的词，或者为这些词分配更高的优先级，可以提高男性用户要输入的词被包括在推荐词中的概率。

再例如，女性可能经常使用与家人和朋友相关的词(例如姐姐、哥哥或妈妈)以及与他们最喜欢的名人有关的词(如'deok-jil'(在韩语俚语中意思是“痴迷某事的行为)、粉丝签名会)、或者与化妆品或诸如箱包的物品相关的词。因此，通过向女性用户推荐与家庭、娱乐等相关的词或者为这些词分配高优先级，可以增加在推荐的词中包括女性用户想要输入的词的概率。

如上所述，由于频繁使用的词和语言依赖性别而变化，因此可以通过使用根据用户的性别基于人口统计信息编译的语言模型来增加用户想要输入的词被包括在推荐词中的概率。

图2B图示了根据作为用户人口统计特征之一的年龄组的频繁使用的用表达方式的示例。

例如，青少年频繁使用的表达方式可以用缩略语、俚语、特定的说话风格或韩语的文字修饰(finishing)风格(例如eum-seum-che)来表征。例如，20多岁的人频繁使用的表达方式可以通过指代某些情况的新创造的词而不是简单的缩略词来表征。30多岁的人频繁使用的表达方式可以根据人群的类型而以各种不同的方式变化，并且可能在很大程度上与家庭有关。

如上所述，由于频繁使用的词和表达方式根据年龄组而变化，因此可以通过使用根据用户的年龄组基于人口统计信息编译的语言模型来增加用户想要输入的词被包括在推荐词中的概率。

图3示出根据示例性实施例的基于用户人口统计信息推荐的词的结果。

当基于根据用户人口统计信息编辑的人口统计语言模型预测字符或文本输入时，推荐的词根据用户通过虚拟键盘输入的文本和各个用户的人口统计特征而变化，如图3所示。

如果用户是女性青少年并且通过虚拟键盘输入了(310)，则反映关于年龄组和性别的人口统计特征的推荐词311可以是例如(妈妈)、(兄弟)、(姐妹)、(晚上学习)、(我的班主任)。

如果用户是三十多岁的男性并且通过虚拟键盘输入了(320)，则反映关于年龄组和性别的人口统计特征的推荐词321可以是例如(棒球)'、(妻子)、(今天)和(电影)。

如果用户是生活在釜山(使用区域方言的韩国城市)的男性并且通过虚拟键盘输入了(330)，则反映关于区域和性别的人口统计特征的推荐词331可以是例如(“mwolakano”，意思是'你在说什么'？')、 (“maimula”，意思是'你自己随意，多吃点')和(“mwohano”，意思是'你在做什么？')。

如果用户是二十多岁的女性并且通过虚拟键盘输入了英文字符'b'(320)，则反映关于年龄组和性别的人口统计特征的推荐词可以是例如“宝贝”、“包”、“手镯”、“兄弟”和“老板”。

如果用户是二十多岁的男性并且通过虚拟键盘输入了英文字符'b'(320)，则反映关于年龄组和性别的人口统计特征的推荐词可以是例如“棒球”、“篮球”、“自行车”、“老板”和“电池”。

在此，在反映人口统计特征的词推荐方法中，可以选择基于人口统计特征推荐的词。根据另一示例性实施例，可以执行所述词推荐方法以确定户修改基于人口统计特征推荐的词的优先级。

图4A和图4B示出根据示例性实施例的基于情境信息推荐的词。

当基于根据情境信息编译的情境语言模型来预测字符或文本输入时，推荐词根据用户通过虚拟键盘输入的字符或文本和情境特征而变化，如图4A和4B所示。

图4A示出根据示例性实施例的根据文本被输入的时间的频繁使用的词，所述时间是关于文本的情境特征之一。

移动设备用户可能频繁通过社交网络服务(SNS)告知其他人，他们正在上下班或上下学途中、决定菜单或预约午餐或晚餐。因此，如果用户向虚拟键盘输入韩文字符则可推荐诸如(地铁)、(午餐)和(晚餐)之类的词作为推荐词。

这些词的使用次数可能会随着文本输入的时间而变化。

图4B示出根据示例性实施例的基于时间情境信息推荐的词。

在早上，通常情况下，人们会通过SMS告诉其他人他上班或上学的通勤情况，他们更愿意在午餐时间而不是晚上时间决定午餐菜单或通过SNS预约午餐。因此，如果在早晨时间在虚拟键盘上输入韩文字符则诸如(地铁)、(午餐)、(晚餐)之类的词会以此顺序被频繁使用。

类似地，在午餐时间里，(午餐)、(晚餐)、(地铁)会以此顺序被频繁使用，而在晚上时间，(晚餐)、(地铁)、(午餐)会以此顺序被频繁使用。

因此，如果用户在虚拟键盘上输入了并且选择(地铁)、(午餐)和(晚餐)作为推荐词，则推荐词的优先级被按照文本的输入时间而修改。

例如，如果在人们通勤上班的早晨时间输入(410)，则反映时间情境特征的推荐优先级411可以按照(地铁)和(午餐)的顺序。

如果在午餐时间输入(420)，则反映时间情境特征的推荐优先级421可以按(午餐)和(晚餐)的顺序。如果在晚上时间中输入(430)，则反映时间情境特征的推荐优先级431可以按照(晚餐)和(地铁)的顺序。

对于其他示例性实施例，如果用户已经向虚拟键盘输入了英文字符's'，那么诸如“地铁”、“股票价格”、“学校”、“晚餐”和“三明治”之类的词。这些词的使用次数可能会随着文本输入的时间而变化。

在早上时间，如果在早上时间在虚拟键盘上输入英文字符's'，则诸如“地铁”、“学校”和“股票价格”之类的词可能以此顺序被频繁使用。类似地，在午餐时间里，“三明治”、“学校”和“地铁”可能以此顺序被频繁使用，而在晚上时间里，“晚餐”、“地铁”和“睡眠”可能以此顺序被频繁使用。

例如，如果在早上时间输入“s”，则反映时间情境特征的推荐特征可能是按照“地铁”和“学校”的顺序。

如果在午餐时间内输入's'，则反映时间情境特征的推荐特征可能是按照“三明治”和“学校”的顺序。如果在晚上时间输入“s”，则反映时间情境特征的推荐优先级可能是按照“晚餐”和“地铁”的顺序。

这里，在通过考虑情境特征来推荐词的方法中，如果根据情境特征推荐不同的词，则可以在包括不同词的同时确定推荐优先级。

在图4A和4B所示的示例性实施例中，时间情境信息限于一天的时间，例如早晨时间、午餐时间和晚上时间(即，时区)。在一些示例性实施例中，时间情境信息可以包括一天中的预定小时或小时范围。时间情境信息还可以包括月、周、季节、天、假日或纪念日。

图5A和5B示出根据示例性实施例的基于情境信息而推荐的要输入的文本。在示例性实施例中，可以推荐与运行键盘的应用相关的至少一个句子或句子的一部分。

图5A示出基于作为情境特征之一的向其输入文本的应用而推荐的要输入的句子。

根据应用，移动设备用户有不同的目的和不同的对话伙伴。因此，当用户已通过虚拟键盘输入文本时，输入到各个应用的词或句子可能具有不同的特征。

例如，当用户已在游戏应用中在虚拟键盘上输入文本时，用户经常与游戏伙伴就游戏的细节或用户关于游戏的情况进行通信。因此，如果在游戏应用的操作期间通过虚拟键盘输入韩文字符(510)，则以开始的句子例如(“Na oneul bappaseo geim manh-imothae”，意思是“今天我太忙了，没有足够的时间玩游戏”)可能会被推荐。

如果用户已在消息应用中通过虚拟键盘输入文本，则通常情况是用户想要与消息应用的伙伴就用户的情况进行通信。因此，如果在消息应用的操作期间在虚拟键盘上输入韩文字符(520)，则以开头的句子例如(“Najigeum chulgeun jung，jihacheol-iya”，意思是“我正在去上班的路上，在地铁上”)可能被推荐。

如果用户在联系人信息应用中在虚拟键盘上输入文本，则用户可能打算输入或搜索联系人信息。因此，当在运行联系人信息应用期间通过虚拟键盘输入韩文字符时(530)，例如名字(例如(“Na Gil Dong”))可以从存储在联系人信息中的名字当中搜索和推荐。在这种情况下，可根据搜索记录来确定推荐的名字。

对于其他示例性实施例，如果在游戏应用的操作期间通过虚拟键盘输入英文字符'i'，则可以推荐以'i'开头的句子，例如“I’m too busy to play game(我太忙而无法玩游戏)”。

如果在消息应用的操作期间在虚拟键盘上输入英文字符'i'，则可以推荐以“i”开头的句子，例如“I’m on my way to work.(我正在上班途中)”。

当在联系人信息应用的运行期间通过虚拟键盘输入英文字符'i'时，例如可以从存储在联系人信息中的名字中搜索并推荐名字'Ixx'(例如“Ian”)。在这种情况下，可以基于搜索记录来确定推荐的名字。

为每个应用推荐的句子可以基于大数据来确定，该大数据是关于通过相应的应用由各种设备的用户输入的文本的信息的集合。除了关于应用的情境信息之外，还可以通过考虑时间情境信息或用户人口统计信息来确定要推荐的句子。

图5B示出了基于关于应用的情境信息和用户的人口统计信息而推荐的文本输入。

例如，当在音乐应用的操作期间进行文本输入时(540)，并且如果用户是女性青少年，则基于关于应用的情境信息和用户的人口统计信息(诸如用户的年龄和性别)，例如(IU)、(Taeyeon)、'XIA'和(BigBang)的韩国流行歌手/流行乐队的名字被设置为推荐词541。这里，还可以额外地使用关于其他女性青少年用户的文本输入或选择或用户的输入历史的信息。

例如，当在购物应用的运行期间进行文本输入(550)并且用户是三十多岁的女性时，则基于关于应用的情境信息和用户的人口统计信息(诸如年龄和性别)，“衣服”、“尿布”和“护肤品”被设置为推荐词551。这里，也可以额外地使用关于其他三十多岁的女性用户的文本输入或选择或用户的输入历史的信息。

例如，当在运行游戏应用(560)期间进行文本输入时，基于关于应用的情境信息，与游戏应用的项目相关的词或在聊天期间频繁输入的诸如“骷髅侠”、“气球“和“帮助”的词被设置为推荐词561。这里，也可以额外地使用关于其他用户的文本输入或选择或用户的输入历史的信息。

根据另一示例性实施例，关于所选文本的输入或信息可以在预定应用中用作关于与预定应用相同类别的应用的情境信息。

例如，输入到预定购物应用的文本输入或选择的历史可以被存储为日志并且用作该购物类别的其他应用的情境信息，由此使得能够选择更准确的推荐词。

图6是根据示例性实施例的词推荐装置600的具体结构图。

如图6所示，根据本示例性实施例的词推荐装置600可以包括输入单元610、显示单元620、词推荐单元630、控制器640和存储单元650。

输入单元610接收通过显示单元620上显示的虚拟键盘输入的文本，并接收由词推荐单元630推荐并由用户选择的词。

当输入单元610被运行时，显示单元620显示虚拟键盘，并且当推荐词或推荐词的优先级由词推荐单元630确定时，显示单元620以基于优先级的顺序显示推荐词。

词推荐单元630基于用户通过显示单元620上显示的虚拟键盘输入的文本和存储在存储单元650中的语言模型词典来预测要由用户输入的词，并且确定要被推荐的词和词的优先级。

控制器640控制词推荐装置600的整体操作。控制器640控制输入单元610、显示单元620、词推荐单元630和存储单元650的操作，使得词推荐装置600可以基于经由输入单元610输入的文本和存储在存储单元650中的语言模型词典来预测并且推荐用户要输入的文本。

存储单元650可以根据诸如用户语言模型、人口统计语言模型或通用语言模型的相应的语言模型来存储语言模型词典，并且存储词推荐装置600所需的各种类型的信息以推荐词。

词推荐装置600(例如，词推荐单元)可以由移动设备内的一些内部组件来实现。如果词推荐装置600在不包括外部文本输入设备或硬键的移动设备中实现，则输入设备通常是虚拟键盘。

在下文中，为了便于描述，词推荐装置可以被称为“设备”并且输入设备可以被称为“虚拟键盘”，但是本发明构思的精神不限于此。

图7是根据示例性实施例的词推荐装置的操作流程图。

当设备的用户传送用于输入文本的命令时，在操作710，设备显示虚拟键盘以输入文本。当文本被输入时，设备在操作720中选择要用于词推荐的语言模型。该语言模型包括统一应用于所有用户的通用语言模型，并且可以包括以下模型中至少之一：反映用户的人口统计特征的人口统计语言模型、基于用户的文本输入历史的用户输入语言模型以及反映关于文本被输入的情形的情境特征的情境语言模型。

在操作730中，设备可以基于通过虚拟键盘输入的文本和选择的语言模型来预测很可能被用户输入的词并且推荐词。

根据另一示例性实施例，即使在没有通过虚拟键盘输入文本时或者甚至在文本被输入之前，可以基于选择的语言模型来推荐具有最高输入概率的词。

例如，如果在预定应用中预定词被初始输入的概率等于或高于预定程度，并且当应用运行虚拟键盘时，即使没有输入文本，也可以推荐该预定词。

根据另一示例性实施例，设备可以基于输入文本或选择的语言模型来推荐句子或句子的一部分。在又一示例性实施例中，设备可以推荐与其中运行键盘的应用相关的至少一个句子或句子的一部分。

图8是图7中的示例性实施例的词推荐方法的详细流程图。

设备100的用户200可以在操作210中选择在设备100上运行的预定应用，并且响应于用户200的选择，在操作110中在设备100上运行该应用。

在该应用的操作期间，当在操作220中用户选择文本输入窗口时，在操作120中，设备100运行输入设备并显示用于用户输入的虚拟键盘。

然后，设备100在操作130中选择推荐用户200要输入的词所需要的语言模型。语言模型包括适用于所有用户的通用语言模型，并且可以包括以下模型中至少一个：反映用户200的人口统计特征的人口统计语言模型、基于用户200的文本输入历史的用户输入语言模型以及反映关于其中文本被输入的情形的情境特征的情境语言模型。

当用户200在操作230中在虚拟键盘上输入文本时，设备100在操作140中基于用户200输入的文本和所选择的语言模型来确定要推荐的词，并在操作150将推荐词呈现给用户200。

根据示例性实施例，即使当没有文本通过虚拟键盘输入时或者甚至在输入文本之前，也可以基于选择的语言模型来推荐具有最高输入概率的词。

例如，如果在预定应用中初始输入预定词的概率等于或高于预定程度，并且当该应用运行虚拟键盘时，即使当未输入文本时，预定词也可以被推荐。

根据另一示例性实施例，设备100可基于输入文本或选择的语言模型来推荐句子或句子的一部分。在又一示例性实施例中，设备100可以推荐与其中运行键盘的应用相关的至少一个句子或句子的一部分。

图9是根据另一示例性实施例的词推荐装置的操作流程图。

图9中的示例性实施例的词推荐装置的操作类似与图8中的词推荐装置的操作，除了还包括确定所确定的推荐词中的优先级的操作930。

基于所选择的语言模型来确定词的优先级，使得将较高优先级分配给具有较高输入概率的词。例如，当选择情境语言模型并且选择了韩文字符时，可以在早上时间给予词(地铁)更高的优先级，并且在晚上时间可以给予(晚餐)更高的优先级。

图10是图9中的示例性实施例的词推荐方法的详细流程图。

图10中的示例性实施例的词推荐装置的操作类似于图7中词推荐装置的操作，除了进一步包括确定所确定的推荐词中的优先级的操作150。

因此，与图8中的词推荐方法相比，在设备100确定了推荐词之后，图10中的词推荐方法还包括确定所确定的推荐词中的优先级的操作150。

图11是根据另一示例性实施例的词推荐装置的操作流程图。

图11中的示例性实施例的词推荐装置的操作可以与图7中的词推荐装置的操作类似，除了进一步包括获取人口统计特征的操作1110。

如上所述，就人口统计而言，用户的人口统计特征表示作为输入文本的代理的用户的特征，并且可以是例如用户的性别、年龄、职业、地区或宗教。

获取人口统计特征的操作1110可以在设备的初始设置期间或者当预先决定使用人口统计特征时来执行并且被应用于所有应用。在示例性实施例中，对于操作1110在选择语言模型的操作1130之前执行以便获取人口统计特征的情况，操作1110可以以任何顺序执行。

人口统计特征可以由用户输入或由设备基于用户的文本输入历史等来估计。

图12是图11中的示例性实施例的词推荐方法的详细流程图。

详细地说，图12是根据图11中的示例性实施例执行的词推荐方法的详细流程图，其中用户输入用户的人口统计特征。

图12中的示例性实施例的词推荐装置的操作与图7中的词推荐装置的操作类似，除了进一步包括获取人口统计特征的操作。

因此，与图8中的词推荐方法相比，图12中的词推荐方法还包括传送由用户200在操作210中输入的人口统计特征并且利用设备100在操作110中存储人口统计特征。

如以上参照图10所述的，人口统计特征可以在设备的初始设置期间或者当预先决定使用人口统计特征时获取并且应用于所有应用。在示例性实施例中，对于在操作140中设备选择语言模型之前获取人口统计特征的情况，可以以任何顺序执行人口统计特征的获取。

图13是根据图11中的另一示例性实施例的词推荐方法的详细流程图。

详细地说，图13是根据图11中的示例性实施例执行的词推荐方法的详细流程图，其中设备估计人口统计特征。

图13中的示例性实施例的词推荐装置的操作与图7的词推荐装置类似，除了还包括获取人口统计特征的操作。

因此，与图8的词推荐方法相比，图13中的词推荐方法进一步包括通过使用设备100在操作210中存储当用户200输入文本时的文本输入历史，并且通过使用设备100在操作110中基于文本输入历史来估计用户200的人口统计特征并且通过使用设备100在操作120中存储所估计的人口统计特征。

如以上参照图10所述的，人口统计特征可以在设备的初始设置期间或者当预先决定使用人口统计特征时获取并且应用于所有应用。在示例性实施例中，对于在操作150中设备选择语言模型之前获取人口统计特征的情况，可以以任何顺序执行人口统计特征的获取。

图14是根据另一示例性实施例的词推荐装置的操作流程图。

建立语言模型需要持续收集和检查作为大量文本数据的语料库，因此往往难以通过使用具有有限存储容量和功耗的设备来处理该过程。因此，收集语料库和建立语言模型通常通过服务器进行。

在示例性实施例中，如果语言模型未被存储在设备中或者存储在设备中的语言模型必须被更新，则设备可以请求服务器传送语言模型并且可以接收该语言模型。

当在图14中的示例性实施例中设备的用户传送用于文本输入的命令时，在操作1410，设备显示用于文本输入的虚拟键盘，并且选择语言模型用于词推荐。

在操作1420中，如果与所选择的语言模型相对应的语言模型词典文件未被存储在设备中，则设备请求服务器传送词典文件。

在操作1430，当接收到由服务器传送的语言模型词典文件时，在操作1440，设备基于语言模型词典文件来预测很可能由用户输入的词并且推荐词。

图15是图14中的示例性实施例的词推荐方法的详细流程图。

图15中的词推荐方法包括与图8中的词推荐方法相同的操作，直到选择语言模型的操作130。在选择语言模型之后，如果所选择的语言模型的词典没有存储在设备100中，则设备100请求服务器300传送语言模型词典文件。响应于来自设备的传送语言模型词典文件的请求，服务器300将语言模型词典文件传送到设备100，并且设备100存储从服务器300传送的语言模型词典文件。

图15的方法的操作130之后的其他后续操作与图8的方法的那些相同。

图16是根据另一个示例性实施例的图14的词推荐方法的详细流程图。

图16是词推荐方法的操作流程图，其中一个用户使用若干设备，例如当用户使用两个设备(设备A和设备B)时。

设备的操作和关于用户文本输入的服务器的操作类似于图15中的词推荐方法的详细流程图的操作。

例如，设备A可以被假定为主要由用户使用的智能电话。用户主要使用设备A来输入文本，因此大多数文本输入历史可以存储在设备A中。如果使用设备B(其例如是用户偶尔使用的平板PC)进行文本输入预测，则用户的不充分的输入历史可能增加错误的词推荐的概率。

因此，通过将设备A和设备B的输入历史传送到服务器以集成方式控制用户的输入历史并且基于集成的输入历史来传送语言模型词典到设备B，则可以改善利用设备B执行的文本输入预测的准确性。

图17是根据另一示例性实施例的词推荐装置的操作流程图。

图17中的词推荐设备的操作与图14中的词推荐装置的操作类似。

当设备的用户传送用于文本输入的命令时，设备在操作1710中显示用于文本输入的虚拟键盘并且选择词推荐所需的语言模型。

在即使与所选择的语言模型对应的语言模型词典文件被存储在设备中的情况下，如果确定需要更新语言模型词典文件，则在操作1720中设备请求服务器传送最新的词典文件。

一旦设备在操作1730中接收到由服务器传送的语言模型词典文件，则在操作1740中其将先前的语言模型词典更新为最新的语言模型词典，并且在操作1750中基于更新的语言模型词典来预测要由用户输入的词并且推荐词。

通过将存储在设备中的语言模型词典的版本与存储在服务器中的语言模型词典的版本进行比较或者通过检查存储在服务器中的语言模型词典是否被更新，可以有效地管理最新的语言模型词典。

图18示出根据示例性实施例的词推荐装置的设置。

键盘设置屏幕1810可以包括用户词典设置1811、用户信息1812和关于收集用户信息的协议的项目1813。

用户信息1812可以包括用户的年龄和性别等，并且可以进一步包括关于人口统计特征的信息，诸如地区或宗教。

用户信息可以由用户设置或者基于用户的文本输入历史或关于用户的附加信息来估计。如果估计的用户信息不准确，则用户稍后可以校正该信息，并且如果该信息被用户校正，则校正后的信息被视为比估计的信息更准确。

通过用户词典设置1811，可以选择是否使用用户词典1815，并且可以包括用于选择要使用的用户词典的用户词典选择菜单1814。

一旦进入用户词典选择菜单1814，则显示用户词典选择屏幕1820。

用户词典选择屏幕1820包含频繁使用的词典设置菜单1821和用户模式词典设置菜单1822。

在频繁使用的词典设置菜单1821中，用户可以基于用户的相应的人口统计特征来设置是否使用词典。例如，如果用户是二十多岁的女性，则可以设置是否使用用于二十多岁的人的词典1823以及用于女性的词典1824，并且此外可以进一步基于通用语言模型来设置是否使用最新的词典1825。

在用户模式词典设置1822中，用户可以基于情境特征来选择是否使用词典。例如，可以设置是否使用根据应用的词典1826或根据时区的词典1827。

当选择使用根据应用的词典时，显示用于选择使用根据应用的词典的菜单1830。在屏幕上显示经由其可以输入文本的应用，用于根据应用来选择是否使用词典，并且根据每个类别，可以包括社交网络类别(聊天)1831、社交网络类别(公告板)1832和搜索类别1833等。用户可以设置是否使用与屏幕上的每个应用对应的词典，用于根据应用来选择是否使用词典。

图19是根据示例性实施例的词推荐系统的总体操作流程图。

图19示出了通过使用用户输入日志并利用根据情境的输入模式(pattern)来估计人口统计特征的方法。

在示例性实施例中，当用户运行输入设备时，在操作1910中用于预测文本输入的引擎预测并推荐要输入的文本。当在操作1920中用户选择推荐结果中的一个或输入预定的附加文本时，在操作1930中由用户输入的字符或选择的推荐结果被传送到文本输入引擎。

在操作1940中对输入字符执行自动完成、校正、空白校正等并且执行下一词的预测。当用户输入完成时，在操作1950中将关于用户输入的信息传送到日志存储设备，从而在操作1960中将该信息存储为用户日志数据。

在操作1970中，关于完成的输入的信息被反映在用户语言模型中，并且如果输入了新词，则将新词作为新的节点添加到哈希树，并且如果输入了先前输入的词，则增大这些词的生成概率值。

在操作1980中日志分析器周期性地执行日志数据分析，并且如果收集具有预定大小或更大的日志，则日志分析器计算日志数据与人口统计语言模型词典之间的相似度。如果计算的相似度等于或高于预定值，则在操作1990中可以将用户的人口统计特征估计为人口统计语言模型词典的特征。因此，可以设置，通过使用具有针对用户的预定的人口统计特征的语言模型词典来预测文本输入。

语言模型同步模块周期性地检查语言模型服务器的语言模型是否被更新，并且如果存在新的更新，则在操作1991中语言模型同步模块将新的更新与设备同步，以便更新设备的语言模型词典。

图19中的示例性实施例的用户日志数据包括关于应用和由用户输入文本的时间的情境信息并且构成用户语言模型。用户语言模型也可以包括哈希树、像通用语言模型那样的n-Gram词典，并且还存储每个文本被输入的时间或应用信息等。

人口统计语言模型是指特别针对诸如性别、年龄或地区等人口统计特征的语言模型。当获取用户人口统计特征时，根据用户人口统计特征来预测词。

通用语言模块是未获取用户人口统计特征时使用的，并且可以包括用于自动完成、校正等的哈希树结构和用于词预测的n-Gram词典。

图20是根据示例性实施例的词推荐装置的操作流程图。

当在操作2010中用户操作输入设备时，词推荐装置从各个语言模型中选择词。

当基于情境特征从用户语言模型开始输入时，在操作2020中基于输入文本的情境特征来搜索用户语言模型中的最频繁输入的词。

如果获取并设置关于用户的人口统计特征，则在操作2030中基于所设置的人口统计特征来搜索人口统计语言模型中最频繁输入的词。

如果用户语言模型未被设置为要使用，并且未设置用户人口统计特征信息，则在操作2040中输入以通用语言模型开始，并且在通用语言模型中搜索最频繁输入的词。

在操作2050中将优先级分配给从语言模型中选择的词，并且将属于较上范围的n个词选择为输入预测词。如果在操作2060中用户选择推荐词或者用户已经输入了字符串，则在操作2070中完成用户输入，并且通过使用由用户输入的字符串和先前输入的字符串，在操作2080中再次重新搜索用户语言词典、人口统计语言词典和通用语言词典以设置预测的词。当在操作2080中设置新的预测词时，可以向用户提供新的推荐结果，并且当用户选择推荐词时，完成用户输入。

由于用户输入完成，于是在操作2090中记录用户输入日志，由此完成词推荐装置的操作。

如上所述，根据示例性实施例，由于频繁使用的词和语言根据诸如性别或年龄组的用户人口统计特征而变化，所以当使用基于关于用户的人口统计信息编译的语言模型时，可能会增加用户想要输入的词被包括在推荐词中的概率。

另外，由于频繁使用的词和句子模式根据诸如经由其输入文本的应用或时区的情境特征而变化，所以当使用基于关于文本输入的情境特征编译的语言模型时，可以增加用户想要输入的词被包含在推荐词中的概率。

上述示例性实施例可以被实现为可以使用各种计算机组件执行的程序指令，并且可以被写入非暂时性计算机可读记录介质。非暂时性计算机可读记录介质可以单独或组合地包括程序指令、数据文件、数据结构等。写入非暂时性计算机可读记录介质的程序指令可以针对本发明构思的示例性实施例进行具体设计和配置，或者可以是本领域普通技术人员所熟知和可用的。非暂时性计算机可读记录介质的示例包括磁存储介质(例如硬盘、软盘、磁带等)、光学记录介质(例如CD-ROM或DVD)、磁光介质(例如软光盘)以及专门配置用于存储和执行程序指令(例如ROM、RAM、闪存等)的硬件设备。程序指令的示例不仅包括通过使用编辑器生成的机器码，而且还包括可以通过使用编译器等在计算机上执行的高级语言码。硬件设备可以被修改为至少一个软件模块以便执行根据示例性实施例的处理，反之亦然。

虽然已经参考本发明的示例性实施例具体示出和描述了本发明构思，但是本领域的普通技术人员将理解，可以在其中进行形式和细节上的各种改变而不脱离由所附权利要求限定的发明构思的精神和范围。这里描述的示例性实施例应该仅被认为是描述性的而不是为了限制的目的。因此，本发明构思的范围不是由本发明构思的详细描述而是由所附权利要求来限定，并且范围内的所有差异将被解释为包括在本发明构思中。

Claims

1.一种推荐要通过键盘输入的至少一个词的方法，所述方法由设备执行并且包括：

显示键盘以用于在所述设备上输入至少一个字符或文本；

选择至少一个语言模型；和

基于在所述键盘上输入的至少一个字符或文本和所述至少一个选择的语言模型，推荐与所输入的至少一个字符或文本有关的至少一个词，

其中，所述至少一个选择的语言模型包括基于所述设备的用户的人口统计特征的语言模型、基于所述设备的用户的文本输入历史的语言模型以及基于键盘所运行的情境的语言模型中的至少一个。

2.如权利要求1所述的方法，其中，所述设备的用户的人口统计特征包括以下各项之一：用户的性别、年龄、地区方言、职业、家乡、宗教以及一项或多项兴趣。

3.如权利要求1所述的方法，其中，键盘所运行的情境包括以下信息中至少之一：关于运行键盘的应用的信息、关于运行键盘的时间的信息以及关于运行键盘的地点的信息。

4.如权利要求1所述的方法，其中，所述推荐包括：从包括在所述至少一个选择的语言模型中的词当中推荐词，所述词包括至少一个所输入的文本并且已经由用户在之前输入了预定次数。

5.如权利要求1所述的方法，还包括接收所述设备的用户的人口统计特征。

6.如权利要求1所述的方法，还包括估计所述设备的用户的人口统计特征。

7.如权利要求6所述的方法，其中，基于所述设备的用户的文本输入历史来估计所述设备的用户的人口统计特征。

8.如权利要求6所述的方法，其中，基于关于所述用户的附加信息来估计所述设备的用户的人口统计特征。

9.如权利要求1所述的方法，还包括：

请求服务器传送语言模型；和

从服务器接收所请求的语言模型。

10.如权利要求9所述的方法，还包括：

将用户信息传送到服务器；和

从服务器接收基于所传送的用户信息更新的语言模型。

11.如权利要求1所述的方法，其中所述推荐进一步包括确定至少一个推荐词的优先级。

12.一种用于推荐要通过键盘输入的至少一个词的装置，所述装置由设备使用并且包括：

显示单元，被配置用于显示键盘以在设备上输入至少一个字符或文本；和

词推荐单元，被配置用于选择至少一个语言模型并且基于在键盘上输入的至少一个字符或文本以及至少一个选择的语言模型来推荐与所输入的至少一个字符或文本有关的至少一个词，

13.如权利要求12所述的装置，其中所述设备的用户的人口统计特征包括以下各项中的至少之一：用户的性别、年龄、地区方言、职业、家乡、宗教以及一项或多项兴趣。

14.如权利要求12所述的装置，其中键盘所运行的情境包括以下信息中至少之一：关于运行键盘的应用的信息、关于运行键盘的时间的信息和关于运行键盘的地点的信息。

15.一种非暂时性计算机可读记录介质，其上记录有用于运行权利要求1所述的方法的计算机程序。