CN105138143A - 词语数据库的获取方法及装置 - Google Patents

词语数据库的获取方法及装置 Download PDF

Info

Publication number
CN105138143A
CN105138143A CN201510542063.4A CN201510542063A CN105138143A CN 105138143 A CN105138143 A CN 105138143A CN 201510542063 A CN201510542063 A CN 201510542063A CN 105138143 A CN105138143 A CN 105138143A
Authority
CN
China
Prior art keywords
described user
user
term database
input
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510542063.4A
Other languages
English (en)
Inventor
陈锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510542063.4A priority Critical patent/CN105138143A/zh
Publication of CN105138143A publication Critical patent/CN105138143A/zh
Pending legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供一种词语数据库的获取方法及装置。本发明实施例通过获取用户的输入特征数据,所述用户的输入特征数据包括所述用户的属性特征信息和所述用户当前所使用的应用的软件环境信息,进而根据所述用户的输入特征数据,获得所述用户的词语数据库,使得能够对所述用户的词语数据库,进行存储处理,无需用户参与,操作简单,而且正确率高,从而提高了词语数据库的获取的效率和可靠性。

Description

词语数据库的获取方法及装置
【技术领域】
本发明涉及输入法技术,尤其涉及一种词语数据库的获取方法及装置。
【背景技术】
输入法,是指为将各种字符输入终端而采用的编码方法,不同语言、国家、或地区,有多种不同的输入法,例如,搜狗拼音输入法、百度输入法、QQ拼音输入法等。一般来说,输入法应用可以将用户所选择的一个或多个词语数据库,加载到终端中。输入法应用可以根据用户的输入信息,在所加载的词语数据库进行检索,以获得匹配的候选词条,以供用户进行上屏选择。
然而,由于需要根据用户所执行的选择操作,加载用户所需要的词语数据库,因此,操作复杂,而且容易出错,从而导致了词语数据库的获取的效率和可靠性的降低。
【发明内容】
本发明的多个方面提供一种词语数据库的获取方法及装置,用以提高词语数据库的获取的效率和可靠性。
本发明的一方面,提供一种词语数据库的获取方法,包括:
获取用户的输入特征数据,所述用户的输入特征数据包括所述用户的属性特征信息和所述用户当前所使用的应用的软件环境信息;
根据所述用户的输入特征数据,获得所述用户的词语数据库;
对所述用户的词语数据库,进行存储处理。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获取用户的输入特征数据,包括:
获取所述用户的输入行为信息;以及根据所述用户的输入行为信息,获得所述用户的属性特征信息;或者
获取所述用户当前所使用的应用的应用信息;以及根据所述应用的应用信息,获得所述用户的软件环境信息。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述用户的输入特征数据,获得所述用户的词语数据库,包括:
根据所述用户的输入特征数据,获得所述用户的输入意图;
根据所述用户的输入意图,获得所述用户的词语数据库。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述用户的输入特征数据,获得所述用户的词语数据库,包括:
根据所述用户的输入特征数据和预先设置的至少一个候选数据库的输入特征数据,获得所述至少一个候选数据库的匹配度;
根据所述至少一个匹配度的匹配度,选择至少一个候选数据库,以作为所述用户的词语数据库。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述对所述用户的词语数据库,进行存储处理,包括:
将所述用户的词语数据库,存储在终端的存储设备上。
本发明的另一方面,提供一种词语数据库的获取装置,包括:
获取单元,用于获取用户的输入特征数据,所述用户的输入特征数据包括所述用户的属性特征信息和所述用户当前所使用的应用的软件环境信息;
匹配单元,用于根据所述用户的输入特征数据,获得所述用户的词语数据库;
存储单元,用于对所述用户的词语数据库,进行存储处理。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获取单元,具体用于
获取所述用户的输入行为信息;以及根据所述用户的输入行为信息,获得所述用户的属性特征信息;或者
获取所述用户当前所使用的应用的应用信息;以及根据所述应用的应用信息,获得所述用户的软件环境信息。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述匹配单元,具体用于
根据所述用户的输入特征数据,获得所述用户的输入意图;以及
根据所述用户的输入意图,获得所述用户的词语数据库。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述匹配单元,具体用于
根据所述用户的输入特征数据和预先设置的至少一个候选数据库的输入特征数据,获得所述至少一个候选数据库的匹配度;以及
根据所述至少一个匹配度的匹配度,选择至少一个候选数据库,以作为所述用户的词语数据库。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述存储单元,具体用于
将所述用户的词语数据库,存储在终端的存储设备上。
由上述技术方案可知,本发明实施例通过获取用户的输入特征数据,所述用户的输入特征数据包括所述用户的属性特征信息和所述用户当前所使用的应用的软件环境信息,进而根据所述用户的输入特征数据,获得所述用户的词语数据库,使得能够对所述用户的词语数据库,进行存储处理,无需用户参与,操作简单,而且正确率高,从而提高了词语数据库的获取的效率和可靠性。
另外,采用本发明提供的技术方案,通过自动获得用户所需要的词语数据库,使得所加载的词语数据库基本满足用户的输入意图,因此,能够有效提高用户的输入效率,同时提高了词语数据库的准确率。
【附图说明】
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的词语数据库的获取方法的流程示意图;
图2为本发明另一实施例提供的词语数据库的获取装置的结构示意图。
【具体实施方式】
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本发明保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于手机、个人数字助理(PersonalDigitalAssistant,PDA)、无线手持设备、平板电脑(TabletComputer)、个人电脑(PersonalComputer,PC)、MP3播放器、MP4播放器、可穿戴设备(例如,智能眼镜、智能手表、智能手环等)等。
图1为本发明一实施例提供的词语数据库的获取方法的流程示意图,如图1所示。
101、获取用户的输入特征数据,所述用户的输入特征数据包括所述用户的属性特征信息和所述用户当前所使用的应用的软件环境信息。
102、根据所述用户的输入特征数据,获得所述用户的词语数据库。
103、对所述用户的词语数据库,进行存储处理。
需要说明的是,101~103的执行主体的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(SoftwareDevelopmentKit,SDK)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行限定。该应用可以为输入法应用,或者还可以为与输入法应用不同的其他应用,本实施例对此不进行特别限定。
这样,通过获取用户的输入特征数据,所述用户的输入特征数据包括所述用户的属性特征信息和所述用户当前所使用的应用的软件环境信息,进而根据所述用户的输入特征数据,获得所述用户的词语数据库,使得能够对所述用户的词语数据库,进行存储处理,无需用户参与,操作简单,而且正确率高,从而提高了词语数据库的获取的效率和可靠性。
可选地,在本实施例的一个可能的实现方式中,在101中,具体可以获取所述用户的输入行为信息;以及根据所述用户的输入行为信息,获得所述用户的属性特征信息。
其中,所述用户的属性特征信息可以包括但不限于以下信息中的一种或多种:用户的性别、用户的年龄、用户的爱好和用户的职业等,本实施例对此不进行特别限定。
一般来说,输入法应用的一个最基本的应用,就是将指定字符输入到终端的待输入位置。输入法应用可以根据用户所输入的输入数据,在指定的词语数据库进行检索,以获得匹配的候选上屏信息即候选词条。由于输入法应用的展示空间的限制,每个页面只能展示指定数量例如,6个候选上屏信息,因此,所获得的候选上屏信息往往需要多个页面才能完整展示。其中,排序权重越大的候选上屏信息,其位置则越靠前。
在一个具体的实现过程中,所述用户的输入行为信息,可以为用户在输入法应用所提供的输入框中所输入的历史输入数据或当前输入数据,例如,用户在简体中文输入法应用所提供的输入框中所输入的输入数据为“shangpin”;或者还可以为用户利用输入法应用所实现上屏的历史上屏数据或当前上屏数据,例如,用户在简体中文输入法应用所提供的输入框中输入“shangpin”,然后通过选择操作所实现上屏的上屏数据为“商品”,本实施例对此不进行特别限定。
例如,用户利用输入法应用所实现上屏的历史上屏数据,大多数为一些流行词语,则可以判断这个用户的爱好为流行元素。这样,一旦有新的网络流行词语数据库出现,则可以根据所判断的用户的爱好,获得该网络流行词语数据库出现,以作为所述用户的词语数据库。
或者,再例如,用户利用输入法应用所实现上屏的历史上屏数据,大多数为“上课”、“老师”、“考试”等,则可以判断这个用户的职业为学生。这样,则可以根据所判断的用户的职业,获得学生词语数据库,以作为所述用户的词语数据库。
在另一个具体的实现过程中,所述用户的输入行为信息,可以为用户在输入法应用所提供的注册流程中所提供的注册数据。
例如,用户在输入法应用所提供的注册流程中所提供的注册数据为“专利顾问”,则可以判断这个用户的职业为专利相关。这样,则可以根据所判断的用户的职业,获得专利词语数据库,以作为所述用户的词语数据库。
在另一个具体的实现过程中,所述用户的输入行为信息,可以为输入法应用根据用户的历史上屏数据,所上传的高频词条数据。
例如,输入法应用根据用户的历史上屏数据,所上传的高频词条数据大多数为“医院”、“呼吸道”、“癌症”等,则可以判断这个用户的职业为医生。这样,则可以根据所判断的用户的职业,获得医学词语数据库,以作为所述用户的词语数据库。
可选地,在本实施例的一个可能的实现方式中,在101中,具体可以获取所述用户当前所使用的应用的应用信息。进而,则可以根据所述应用的应用信息,获得所述用户的软件环境信息。
其中,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行限定。例如,在智能手机中,利用输入法应用进行信息输入的应用程序(Application,APP),或利用输入法应用进行信息输入的浏览器的一个网页程序;或者,再例如,在个人电脑(PersonalComputer,PC)中,利用输入法应用进行信息输入的应用程序,或利用输入法应用进行信息输入的浏览器的一个网页程序,等等。
在一个具体的实现过程,所述应用的应用信息,可以为用户利用输入法应用,正在进行信息输入的应用的名称信息、该应用所提供服务的服务信息等。为了与输入法应用相互区别,可以将利用输入法应用,正在进行信息输入的应用,称为调用应用。
在另一个具体的实现过程,所述应用的应用信息,具体可以为所在终端上所运行或安装的其他应用的名称信息、该其他应用所提供服务的服务信息等,例如,除了调用应用之外,终端后台所运行的其他应用的名称信息、所提供服务的服务信息等。
具体地,具体可以采用现有技术中的各种方案,获取应用的应用信息,本实施例对此不进行特别限定。
例如,具体可以直接读取应用的名称信息,以作为软件环境信息,例如,当当应用、淘宝应用或百度影音应用、百度导航等。
或者,再例如,具体可以向浏览器发送请求,以获得浏览器的当前网页所属网站的名称信息,以作为软件环境信息,例如,微博、亚马逊(amazon)或搜狐视频等。
所谓的网站(Website),是指在互联网上,根据一定的规则,使用编程语言构建的用于展示特定内容的相关网页的集合。网站是一种沟通工具,可以通过网站来发布自己想要公开的内容,或者利用网站来提供相关的业务。互联网用户可以通过浏览器应用或网站所对应的特定应用(Application,APP)来访问网站,获取自己需要的内容或者使用业务。
或者,再例如,例如,用户当前所使用的应用为“百度导航应用”,则可以获得该应用所提供服务的服务信息为“导航”,然后,则可以将该应用所提供服务的服务信息“导航”,作为该应用的软件环境信息。这样,则可以根据所获得的“导航”这一软件环境信息,将该用户周围(例如,1km范围之内)的地点名称,动态生成一个词语数据库。
或者,再例如,用户当前所使用的应用为“湘菜大全应用”,则可以获得该应用所提供服务的服务信息为“湘菜”、“湘菜餐厅”、“湘菜食谱”等,然后,则可以将该应用所提供服务的服务信息“湘菜”、“湘菜餐厅”、“湘菜食谱”,作为该应用的软件环境信。这样,则可以根据所获得的“湘菜”、“湘菜餐厅”、“湘菜食谱”等这些软件环境信息,将与湘菜、湘菜餐厅、湘菜食谱等相关的词语,动态生成一个词语数据库。
可选地,在本实施例的一个可能的实现方式中,在102中,具体可以根据所述用户的输入特征数据,获得所述用户的输入意图;进而,则可以根据所述用户的输入意图,获得所述用户的词语数据库。
例如,假设属性特性信息为“学生”,则可以根据“学生”这一属性特性信息,确定用户的行为意图为“查询或下载学习资料”
或者,再例如,假设软件环境信息为“淘宝应用”,则可以根据“淘宝应用”这一软件环境信息,确定用户的行为意图为“查询或购买商品”。
或者,再例如,假设软件环境信息为“应用搜索”,则可以根据“应用搜索”这一软件环境信息,确定用户的行为意图为“查询或下载应用程序”。
在一个具体的实现过程中,具体可以根据所述用户的输入意图,直接获得一个现有的词语数据库,以为作为所述用户的词语数据库。这样,能够获取个性化的词语数据库,从而有效提高了词语数据库的获取的个性化。
在另一个具体的实现过程中,具体可以根据所述用户的输入意图,获得若干个词语,然后,则可以将这些词语组成一个词语数据库,以作为所述用户的词语数据库。这样,能够获取动态的词语数据库,从而有效提高了词语数据库的获取的灵活性。
可选地,在本实施例的一个可能的实现方式中,在102中,具体可以根据所述用户的输入特征数据和预先设置的至少一个候选数据库的输入特征数据,获得所述至少一个候选数据库的匹配度;进而,则可以根据所述至少一个匹配度的匹配度,选择至少一个候选数据库,以作为所述用户的词语数据库。
所谓的候选数据库,是指根据指定分类规则例如,科学领域等,对现有的词语进行分类处理,所形成的词语数据库,例如,医学词语数据库、电学词语数据库等。
在一个具体的实现过程中,具体可以采用文本相似度的计算方法,获得所述至少一个候选数据库中每个候选数据库的匹配度。
在另一个具体的实现过程中,具体可以将所获得的每个候选数据库的匹配度,按照从大到小进行排序,选择排在前面N位的候选数据库,N为大于或等于1的整数,以作为所述用户的词语数据库。
在另一个具体的实现过程中,具体可以选择匹配度大于预先设置的匹配阈值的候选数据库,作为所述用户的词语数据库。
可选地,在本实施例的一个可能的实现方式中,在103中,具体可以对所述用户的词语数据库,进行存储处理。这样,输入法应用则可以根据用户输入的输入数据,在用户的词语数据库中进行匹配,以获得候选词条。
具体地,具体可以将所述用户的词语数据库,存储在终端的存储设备上。
在一个具体的实现过程中,所述终端的存储设备可以慢速存储设备,具体可以为计算机系统的硬盘,或者还可以为手机的非运行内存即物理内存,例如,只读存储器(Read-OnlyMemory,ROM)和内存卡等,本实施例对此不进行特别限定。
在另一个具体的实现过程中,所述终端的存储设备还可以为快速存储设备,具体可以为计算机系统的内存,或者还可以为手机的运行内存即系统内存,例如,随机存储器(RandomAccessMemory,RAM)等,本实施例对此不进行特别限定。
具体地,具体还可以将所述用户的词语数据库,存储在云端,与该用户进行关联,这样,就能够实现该用户的云输入。
需要说明的是,在进行所述存储处理之前,还可以进一步获取输入法应用的硬件环境信息,进而,则可以根据所述输入法应用的硬件环境信息,确定所进行的存储处理的位置,例如,终端设备上或云端。
其中,所述输入法应用的硬件环境信息可以包括但不限于以下信息中的一种或多种:输入法应用所运行的终端的设备类型信息、终端的操作系统信息、终端的网络信息、终端的地理位置信息。例如,终端的类型信息可以包括手机、平板电脑(TabletComputer)、个人电脑(PersonalComputer,PC)等。终端的操作系统信息例如,可以为苹果的ios操作系统、谷歌的安卓操作系统或者微软的WindowsPhone操作系统或者其他的移动终端操作系统。终端的网络信息例如,为3G网络或无线相容性认证(WirelessFidelity,WiFi)网络或者其他的无线网络。另外,获取所述输入法应用的硬件环境信息,可以采用现有技术中的各种方案,此处不再赘述。
例如,假设硬件环境信息为“电脑,WiFi网络”,则可以确定所进行的存储处理的位置为电脑。
或者,再例如,假设硬件环境信息为“手机,ios操作系统,WiFi网络”,则可以确定所进行的存储处理的位置为云端。这样,能够节省手机的存储空间。
本实施例中,通过获取用户的输入特征数据,所述用户的输入特征数据包括所述用户的属性特征信息和所述用户当前所使用的应用的软件环境信息,进而根据所述用户的输入特征数据,获得所述用户的词语数据库,使得能够对所述用户的词语数据库,进行存储处理,无需用户参与,操作简单,而且正确率高,从而提高了词语数据库的获取的效率和可靠性。
另外,采用本发明提供的技术方案,通过自动获得用户所需要的词语数据库,使得所加载的词语数据库基本满足用户的输入意图,因此,能够有效提高用户的输入效率,同时提高了词语数据库的准确率。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图2为本发明另一实施例提供的词语数据库的获取装置的结构示意图,如图2所示。本实施例的词语数据库的获取装置可以包括获取单元21、匹配单元22和存储单元23。其中,获取单元21,用于获取用户的输入特征数据,所述用户的输入特征数据包括所述用户的属性特征信息和所述用户当前所使用的应用的软件环境信息;匹配单元22,用于根据所述用户的输入特征数据,获得所述用户的词语数据库;存储单元23,用于对所述用户的词语数据库,进行存储处理。
需要说明的是,本实施例所提供的词语数据库的获取装置的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(SoftwareDevelopmentKit,SDK)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行限定。该应用可以为输入法应用,或者还可以为与输入法应用不同的其他应用,本实施例对此不进行特别限定。
可选地,在本实施例的一个可能的实现方式中,所述获取单元21,具体可以用于获取所述用户的输入行为信息;以及根据所述用户的输入行为信息,获得所述用户的属性特征信息。
可选地,在本实施例的一个可能的实现方式中,所述获取单元21,具体可以用于获取所述用户当前所使用的应用的应用信息;以及根据所述应用的应用信息,获得所述用户的软件环境信息。
可选地,在本实施例的一个可能的实现方式中,所述匹配单元22,具体可以用于根据所述用户的输入特征数据,获得所述用户的输入意图;以及根据所述用户的输入意图,获得所述用户的词语数据库。
可选地,在本实施例的一个可能的实现方式中,所述匹配单元22,具体可以用于根据所述用户的输入特征数据和预先设置的至少一个候选数据库的输入特征数据,获得所述至少一个候选数据库的匹配度;以及根据所述至少一个匹配度的匹配度,选择至少一个候选数据库,以作为所述用户的词语数据库。
可选地,在本实施例的一个可能的实现方式中,所述存储单元23,具体可以用于将所述用户的词语数据库,存储在终端的存储设备上。
需要说明的是,图1对应的实施例中方法,可以由本实施例提供的词语数据库的获取装置实现。详细描述可以参见图1对应的实施例中的相关内容,此处不再赘述。
本实施例中,通过获取单元获取用户的输入特征数据,所述用户的输入特征数据包括所述用户的属性特征信息和所述用户当前所使用的应用的软件环境信息,进而由匹配单元根据所述用户的输入特征数据,获得所述用户的词语数据库,使得存储单元能够对所述用户的词语数据库,进行存储处理,无需用户参与,操作简单,而且正确率高,从而提高了词语数据库的获取的效率和可靠性。
另外,采用本发明提供的技术方案,通过自动获得用户所需要的词语数据库,使得所加载的词语数据库基本满足用户的输入意图,因此,能够有效提高用户的输入效率,同时提高了词语数据库的准确率。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种词语数据库的获取方法,其特征在于,包括:
获取用户的输入特征数据,所述用户的输入特征数据包括所述用户的属性特征信息和所述用户当前所使用的应用的软件环境信息;
根据所述用户的输入特征数据,获得所述用户的词语数据库;
对所述用户的词语数据库,进行存储处理。
2.根据权利要求1所述的方法,其特征在于,所述获取用户的输入特征数据,包括:
获取所述用户的输入行为信息;以及根据所述用户的输入行为信息,获得所述用户的属性特征信息;或者
获取所述用户当前所使用的应用的应用信息;以及根据所述应用的应用信息,获得所述用户的软件环境信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述用户的输入特征数据,获得所述用户的词语数据库,包括:
根据所述用户的输入特征数据,获得所述用户的输入意图;
根据所述用户的输入意图,获得所述用户的词语数据库。
4.根据权利要求1所述的方法,其特征在于,所述根据所述用户的输入特征数据,获得所述用户的词语数据库,包括:
根据所述用户的输入特征数据和预先设置的至少一个候选数据库的输入特征数据,获得所述至少一个候选数据库的匹配度;
根据所述至少一个匹配度的匹配度,选择至少一个候选数据库,以作为所述用户的词语数据库。
5.根据权利要求1~4任一权利要求所述的方法,其特征在于,所述对所述用户的词语数据库,进行存储处理,包括:
将所述用户的词语数据库,存储在终端的存储设备上。
6.一种词语数据库的获取装置,其特征在于,包括:
获取单元,用于获取用户的输入特征数据,所述用户的输入特征数据包括所述用户的属性特征信息和所述用户当前所使用的应用的软件环境信息;
匹配单元,用于根据所述用户的输入特征数据,获得所述用户的词语数据库;
存储单元,用于对所述用户的词语数据库,进行存储处理。
7.根据权利要求6所述的装置,其特征在于,所述获取单元,具体用于
获取所述用户的输入行为信息;以及根据所述用户的输入行为信息,获得所述用户的属性特征信息;或者
获取所述用户当前所使用的应用的应用信息;以及根据所述应用的应用信息,获得所述用户的软件环境信息。
8.根据权利要求6所述的装置,其特征在于,所述匹配单元,具体用于
根据所述用户的输入特征数据,获得所述用户的输入意图;以及
根据所述用户的输入意图,获得所述用户的词语数据库。
9.根据权利要求6所述的装置,其特征在于,所述匹配单元,具体用于
根据所述用户的输入特征数据和预先设置的至少一个候选数据库的输入特征数据,获得所述至少一个候选数据库的匹配度;以及
根据所述至少一个匹配度的匹配度,选择至少一个候选数据库,以作为所述用户的词语数据库。
10.根据权利要求6~9任一权利要求所述的装置,其特征在于,所述存储单元,具体用于
将所述用户的词语数据库,存储在终端的存储设备上。
CN201510542063.4A 2015-08-28 2015-08-28 词语数据库的获取方法及装置 Pending CN105138143A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510542063.4A CN105138143A (zh) 2015-08-28 2015-08-28 词语数据库的获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510542063.4A CN105138143A (zh) 2015-08-28 2015-08-28 词语数据库的获取方法及装置

Publications (1)

Publication Number Publication Date
CN105138143A true CN105138143A (zh) 2015-12-09

Family

ID=54723514

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510542063.4A Pending CN105138143A (zh) 2015-08-28 2015-08-28 词语数据库的获取方法及装置

Country Status (1)

Country Link
CN (1) CN105138143A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376174A (zh) * 2018-12-30 2019-02-22 北京奇艺世纪科技有限公司 一种选择数据库的方法和装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183351A (zh) * 2007-12-07 2008-05-21 腾讯科技(深圳)有限公司 一种文字输入方法及其系统
CN101329674A (zh) * 2007-06-18 2008-12-24 北京搜狗科技发展有限公司 一种提供个性化搜索的系统和方法
CN101373468A (zh) * 2007-08-20 2009-02-25 北京搜狗科技发展有限公司 一种加载词库的方法、字符输入的方法和输入法系统
CN101420313A (zh) * 2007-10-22 2009-04-29 北京搜狗科技发展有限公司 一种针对客户端用户群进行聚类的方法和系统
CN101470732A (zh) * 2007-12-26 2009-07-01 北京搜狗科技发展有限公司 一种辅助词库的生成方法和装置
CN101571758A (zh) * 2009-06-04 2009-11-04 腾讯科技(深圳)有限公司 一种输入法系统、方法和装置
CN101650605A (zh) * 2009-09-25 2010-02-17 中国电信股份有限公司 一种智能汉字输入方法和系统
CN102314222A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 一种自适应输入方法、设备及系统
CN103246703A (zh) * 2013-04-03 2013-08-14 百度在线网络技术(北京)有限公司 一种用于确定应用词库的方法和设备
CN103886090A (zh) * 2014-03-31 2014-06-25 北京搜狗科技发展有限公司 基于用户喜好的内容推荐方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101329674A (zh) * 2007-06-18 2008-12-24 北京搜狗科技发展有限公司 一种提供个性化搜索的系统和方法
CN101373468A (zh) * 2007-08-20 2009-02-25 北京搜狗科技发展有限公司 一种加载词库的方法、字符输入的方法和输入法系统
CN101420313A (zh) * 2007-10-22 2009-04-29 北京搜狗科技发展有限公司 一种针对客户端用户群进行聚类的方法和系统
CN101183351A (zh) * 2007-12-07 2008-05-21 腾讯科技(深圳)有限公司 一种文字输入方法及其系统
CN101470732A (zh) * 2007-12-26 2009-07-01 北京搜狗科技发展有限公司 一种辅助词库的生成方法和装置
CN101571758A (zh) * 2009-06-04 2009-11-04 腾讯科技(深圳)有限公司 一种输入法系统、方法和装置
CN101650605A (zh) * 2009-09-25 2010-02-17 中国电信股份有限公司 一种智能汉字输入方法和系统
CN102314222A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 一种自适应输入方法、设备及系统
CN103246703A (zh) * 2013-04-03 2013-08-14 百度在线网络技术(北京)有限公司 一种用于确定应用词库的方法和设备
CN103886090A (zh) * 2014-03-31 2014-06-25 北京搜狗科技发展有限公司 基于用户喜好的内容推荐方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376174A (zh) * 2018-12-30 2019-02-22 北京奇艺世纪科技有限公司 一种选择数据库的方法和装置

Similar Documents

Publication Publication Date Title
US10332184B2 (en) Personalized application recommendations
EP3306486A1 (en) Pushed information processing method, apparatus, and device, and non-volatile computer storage medium
CN105550173A (zh) 文本校正方法和装置
KR102087807B1 (ko) 문자 입력 방법 및 장치
CN107133263B (zh) Poi推荐方法、装置、设备及计算机可读存储介质
JP7119124B2 (ja) 検索動作出力要素のアクションインジケータ
CN103714141A (zh) 信息推送方法及装置
CN104216898A (zh) 一种浏览器导航方法、装置及终端设备
CN108932320B (zh) 文章搜索方法、装置及电子设备
CN103870553A (zh) 一种输入资源推送方法及系统
JP2021120867A (ja) 融合関係ネットワークの構築方法、融合関係ネットワークの構築装置、電子デバイス、記憶媒体及びプログラム
US10769372B2 (en) Synonymy tag obtaining method and apparatus, device and computer readable storage medium
CN110489563B (zh) 图结构的表示方法、装置、设备及计算机可读存储介质
CN103778232A (zh) 个性化信息的处理方法及装置
US20180081884A1 (en) Method and apparatus for processing input sequence, apparatus and non-volatile computer storage medium
CN107832373B (zh) 数据的查找及显示方法及其系统、存储介质、电子设备
CN105677926A (zh) 一种本地搜索结果展示方法、装置及电子设备
CN114265777B (zh) 应用程序的测试方法、装置、电子设备及存储介质
US9135095B2 (en) Methods and systems for inter-application communication
CN105242965A (zh) 一种云计算方法、云服务器及终端
CN105138143A (zh) 词语数据库的获取方法及装置
CN114222317A (zh) 数据处理方法及装置、电子设备和存储介质
CN107729499A (zh) 信息处理方法、介质、系统和电子设备
CN114020245A (zh) 页面构建方法及装置、设备和介质
CN111310016B (zh) 标签挖掘方法、装置、服务器和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151209