CN106933801B - 一种词库的更新方法和装置 - Google Patents
一种词库的更新方法和装置 Download PDFInfo
- Publication number
- CN106933801B CN106933801B CN201710076866.4A CN201710076866A CN106933801B CN 106933801 B CN106933801 B CN 106933801B CN 201710076866 A CN201710076866 A CN 201710076866A CN 106933801 B CN106933801 B CN 106933801B
- Authority
- CN
- China
- Prior art keywords
- application
- information
- classification
- application classification
- updating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Stored Programmes (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例提供了一种词库的更新方法和装置,该方法包括:确定移动终端中应用归属的应用分类;采集所述应用分类中应用的应用信息;根据所述应用信息更新所述应用分类对应的词库。通过用户安装应用的个性化行为控制词库的更新,可以适时地提高用户偏好的应用类别对应的词库的更新频率,降低其他词库的更新频率,减少词库的更新量,保证词库的容量在较低的水平,进而保证输入法系统的词库仍然在现有的词库容量级别上,大大减少了词库中词条的数量,保证用户在这些应用输入时的首选词的准确率,并且,保证CPU、内存等计算设备的资源的占用在合理的水平。
Description
技术领域
本发明涉及输入法的技术领域,特别是涉及一种词库的更新方法和一种词库的更新装置。
背景技术
随着计算机技术的普及与发展,输入法已经成为用户与计算机交互的重要工具,不同专业领域、不同兴趣以及使用习惯的用户对于输入法的智能性要求越来越高。
目前输入法的词库一般覆盖用户使用的一部分词汇,通常主要包括一些人们普遍的常用词汇,还有一部分词汇是输入法的词库未覆盖的。
如果将其他没有覆盖词汇都更新至词库里,会占用大量的存储空间,那么输入法系统的词库容量将在数百万的量级。
词库过大,同音字过多,候选项增加,这些词汇本身在总体用户中的使用概率比较低,不需要使用这些词汇的用户会受到干扰,导致用户在输入时的首选词准确率较低。
并且,容量大的词库会大幅占用CPU(Central Processing Unit,中央处理器)、内存等计算设备的资源。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种词库的更新方法和相应的一种词库的更新装置。
依据本发明的一个方面,提供了一种词库的更新方法,包括:
确定移动终端中应用归属的应用分类;
采集所述应用分类中应用的应用信息;
根据所述应用信息更新所述应用分类对应的词库。
可选地,所述采集所述应用分类中应用的应用信息的步骤包括:
统计所述应用分类中应用的数量。
可选地,所述采集所述应用分类中应用的应用信息的步骤包括:
当检测到所述应用分类中的应用运行时,采集所述应用在运行时的运行信息。
可选地,所述根据所述应用信息更新所述应用分类对应的词库的步骤包括:
采用所述应用信息确定所述应用分类的优先级;
按照所述优先级更新所述应用分类对应的词库。
可选地,所述应用分类中应用的数量与所述应用分类的优先级正相关;
所述应用分类中应用的运行信息包括运行时长,所述运行时长与所述应用分类的优先级正相关。
可选地,还包括:
当检测到应用启动时,确定所述应用归属的应用分类;
加载所述应用分类对应的词库。
可选地,还包括:
接收输入的字符串;
在加载的词库中查找与字符串匹配的候选项;
当检测到选择操作时,将所述选择操作对应的候选项进行上屏输出。
可选地,还包括:
查找上屏输出的候选项的词条信息;
将所述词条信息发送至服务器,以在所述词条信息满足预设的推送条件时,推送至目标终端中所述候选项所属应用分类对应的词库。
根据本发明的另一方面,提供了一种词库的更新装置,包括:
应用分类确定模块,适于确定移动终端中应用归属的应用分类;
应用信息采集模块,适于采集所述应用分类中应用的应用信息;
词库更新模块,适于根据所述应用信息更新所述应用分类对应的词库。
可选地,所述应用信息采集模块包括:
数量统计子模块,适于统计所述应用分类中应用的数量。
可选地,所述应用信息采集模块包括:
运行信息采集子模块,适于在检测到所述应用分类中的应用运行时,采集所述应用在运行时的运行信息。
可选地,所述词库更新模块包括:
优先级确定子模块,适于采用所述应用信息确定所述应用分类的优先级;
优先级更新子模块,适于按照所述优先级更新所述应用分类对应的词库。
可选地,所述应用分类中应用的数量与所述应用分类的优先级正相关;
所述应用分类中应用的运行信息包括运行时长,所述运行时长与所述应用分类的优先级正相关。
可选地,还包括:
应用启动检测模块,适于在检测到应用启动时,确定所述应用归属的应用分类;
词库加载模块,适于加载所述应用分类对应的词库。
可选地,还包括:
字符串接收模块,适于接收输入的字符串;
候选项查找模块,适于在加载的词库中查找与字符串匹配的候选项;
候选项上屏模块,适于在检测到选择操作时,将所述选择操作对应的候选项进行上屏输出。
可选地,还包括:
词条信息查找模块,适于查找上屏输出的候选项的词条信息;
词条信息上传模块,适于将所述词条信息发送至服务器,以在所述词条信息满足预设的推送条件时,推送至目标终端中所述候选项所属应用分类对应的词库。
本发明实施例对应用划分应用分类,并对这些应用分类配置一个或多个词库,在移动终端中确定安装的应用所属的应用分类,按照这些应用分类中应用的应用信息对这些应用分类对应的词库进行更新,通过用户安装应用的个性化行为控制词库的更新,可以适时地提高用户偏好的应用类别对应的词库的更新频率,降低其他词库的更新频率,减少词库的更新量,保证词库的容量在较低的水平,进而保证输入法系统的词库仍然在现有的词库容量级别上,大大减少了词库中词条的数量,保证用户在这些应用输入时的首选词的准确率,并且,保证CPU、内存等计算设备的资源的占用在合理的水平。
本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的词库的更新方法的步骤流程图;
图2示出了根据本发明另一个实施例的词库的更新方法的步骤流程图;
图3示出了根据本发明一个实施例的词库的更新装置的结构框图;以及
图4示出了根据本发明另一个实施例的词库的更新装置的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图1,示出了根据本发明一个实施例的词库的更新方法的步骤流程图,具体可以包括如下步骤:
步骤101,确定移动终端中应用归属的应用分类。
在具体实现中,本发明实施例可以应用于输入法系统中,该输入法系统可以安装在移动终端中,例如,手机、PDA(Personal Digital Assistant,个人数字助理)、膝上型计算机、掌上电脑等等,本发明实施例对此不加以限制。
这些移动终端通常可以支持Windows、Android(安卓)、IOS、WindowsPhone等操作系统,可以在输入法系统中通过虚拟键盘、物理键盘、语音等方式输入字词。
为了满足使用需求,用户在移动终端中往往会安装许多应用,例如,购物应用、支付应用、浏览器、视频播放器、电子邮箱客户端等等。
由于这些应用在一定程度上可以提现用户的行为习惯,输入法系统可以检测移动终端中安装的应用归属的应用分类,例如,学习、影音、游戏、阅读,等等,从而挖掘移动终端所属用户的行为习惯。
在具体实现中,服务器可以对应用划分一级或多级应用分类,在后台维护一张应用分类表,该应用分类表中记录了应用分类,及该应用分类下的应用的应用标识,如名称、包名,等等。
服务器将这张应用分类表下发至移动终端的输入法系统中,输入法系统可以检测在移动终端中安装的应用的应用标识,从而在该应用分类表中查询该应用所属的应用分类。
由于第三方应用一般为用户主动安装的,而操作系统自带的应用一般并非用户主动安装的,因此,为了提高移动终端所属用户的行为习惯的挖掘精确度,可以识别于第三方的应用所属的应用分类,而忽略操作系统自带的应用。
在Android系统中,输入法系统可以通过如下方式检测在移动终端中安装的第三方应用:
1、通过获取的安装包,对其包信息(android.content.pm.PackageInfo)的包名(packageName)进行过滤。
2、枚举\data\app文件夹,其下的*.apk文件是移动终端安装的应用,而\system\App下的*.apk文件就是操作系统自带的应用。
3、通过应用在安装时由操心系统分配的包(package)的编号(uid)来过滤操作系统的安装包,因为android系统中的应用编号(uid)从1000~9999是给操作系统自带的应用保留的,因此,判断包(package)的编号(uid)是否大于10000即可判定该应用是否是操作系统自带的应用。
当然,上述第三方应用的检测方式只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他第三方应用的检测方式,本发明实施例对此不加以限制。另外,除了上述第三方应用的检测方式外,本领域技术人员还可以根据实际需要采用其它第三方应用的检测方式,本发明实施例对此也不加以限制。
步骤102,采集所述应用分类中应用的应用信息。
本发明实施例中,可以采集应用分类中应用的应用信息(即与该应用相关的信息),以识别用户对该应用分类的整体使用情况。
在本发明实施例的一个示例中,该应用的应用信息可以为应用的数量,因此,在本示例中,可以统计应用分类中应用的数量。
在本发明实施例的另一个示例中,该应用的应用信息可以为应用的运行信息,例如,应用的总运行时长、应用的前端运行时长、应用的使用频率等等。
因此,在本示例中,当检测到应用分类中的应用运行时,采集应用在运行时的运行信息。
当然,上述应用信息只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他应用信息,本发明实施例对此不加以限制。另外,除了上述应用信息外,本领域技术人员还可以根据实际需要采用其它应用信息,本发明实施例对此也不加以限制。
另外,为了保证用户的隐私权和知情权,可以先检查该当前用户是否加入了指定计划,如用户体验计划。如果当前用户加入了指定计划,则确认当前用户对输入法系统采集应用信息的行为进行了授权,输入法系统可以执行采集操作,如果当前用户没有加入指定计划,则确认当前用户未对输入法系统采集应用信息的行为进行授权,输入法系统禁止执行采集操作。
步骤103,根据所述应用信息更新所述应用分类对应的词库。
在输入法系统中,针对不同的输入需求,可以设置如下的一个或多个词库:
1、记载基础字词的系统词库。
2、记载扩展字词的细胞词库(细胞词库中的字词至少具有一个共同属性)。
例如,记载某个游戏专用字词的细胞词库、记载生物专用字词的细胞词库等。
3、记载用户个性化字词(如自造词)的用户词库。
4、记载通讯录信息的通讯录词库。
当然,上述词库只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他词库,本发明实施例对此不加以限制。
在本发明实施例中,可以针对应用分类配置一个或多个词库,如细胞词库,该词库通常为某一特定群体或某一部分人使用,其存储的词条具有该应用分类的属性。
例如,划分城市信息大全、电子游戏、自然科学、人文科学、社会科学、工程与应用科学、农林鱼畜、医学等大类。
在工程与应用科学的大类中,可以划分建筑、化工、造纸、包装、计算机、机械工程、电子工程、钢铁冶金等小类。
在化工的小类中,包含石油(词条包括油气地质勘探、钻井工程、海洋石油技术、油气藏、油气田等)、电池(词条包括电池、电容、低电池电压检测、电池检测、电池测量、谐波失真等)、纯碱化工(词条包括安全栅柜、氨二泵、氨二泥、氨二泥桶、氨二泥压榨机、氨分等)等词库。
由于应用分类的应用信息可以表征用户的行为习惯,为了满足用户个性化的输入需求,因此,可以基于这些应用分类的应用信息对相关的词库进行更新。
如果输入法系统中未存储该应用分类对应的词库,则可以请求服务器分发相关的词库;或者,从服务器下载相关词库的信息提示用户,并按照用户的选择从服务器下载相关的词库。
如果输入法系统中存储有该应用分类对应的词库,则可以依据已存储的词库,从服务器端下载词库的更新数据,对输入法系统中的词库进行更新。
进一步而言,输入法系统将应用分类对应的词库的信息列表,与服务器发布词库的信息进行比较,在输入法系统的词库版本较旧、词条更新时间较旧等情况下,从服务器端下载最新的词库的更新数据,对输入法系统中的词库进行更新。
其中,更新数据可以为整个词库,也可以为词库中的已更新的词条,服务器还可以将多个词库中发生变化的词条合并成为一个新词库,作为更新数据,本发明实施例对此不加以限制。
若词库的更新数据(包括词条)下载完成,则输入法系统可以将下载的词条添加至词库中。
如果词条的数据量较小,词库的更新能够在较短时间(如1秒)内完成,由于影响不大,则可以直接实时更新词库。
如果词条的数据量较大,词库的更新无法在较短时间(如1秒)内无法完成,以致可能影响用户的输入操作,则词库的更新可以在一个独立的缓存词库中进行。当缓存词库创建完毕后,替换输入法系统原来的词库即可,由于这个替换过程速度较快,降低了对用户的输入操作造成的干扰。
在本发明的一个实施例中,步骤103可以包括如下子步骤:
子步骤S11,采用所述应用信息确定所述应用分类的优先级;
子步骤S12,按照所述优先级更新所述应用分类对应的词库。
在本发明实施例中,可以划分多个优先级,基于应用信息确定应用分类所属的优先级。
一般情况下,如果从应用信息挖掘出用户对该应用分类的偏好更高,则可以提高该应用分类的优先级,反之,如果从应用信息挖掘出用户对该应用分类的偏好更低,则可以降低该应用分类的优先级。
在一个示例中,应用分类中应用的数量与应用分类的优先级正相关,即应用分类中应用的越多,该应用分类的优先级越高,反之,应用分类中应用的越少,该应用分类的优先级越低。
在另一个示例中,应用分类中应用的运行信息包括运行时长,运行时长与应用分类的优先级正相关,即运行应用分类中应用的时间越长,该应用分类的优先级越高,反之,运行应用分类中应用的时间越短,该应用分类的优先级越低。
当然,上述优先级的确定方式只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他优先级的确定方式,本发明实施例对此不加以限制。另外,除了上述优先级的确定方式外,本领域技术人员还可以根据实际需要采用其它优先级的确定方式,本发明实施例对此也不加以限制。
在本发明实施例中,优先级与更新的频率正相关,即应用分类的优先级越高,更新的频率越高,反之,应用分类的优先级越低,更新的频率越低。
本发明实施例对应用划分应用分类,并对这些应用分类配置一个或多个词库,在移动终端中确定安装的应用所属的应用分类,按照这些应用分类中应用的应用信息对这些应用分类对应的词库进行更新,通过用户安装应用的个性化行为控制词库的更新,可以适时地提高用户偏好的应用类别对应的词库的更新频率,降低其他词库的更新频率,减少词库的更新量,保证词库的容量在较低的水平,进而保证输入法系统的词库仍然在现有的词库容量级别上,大大减少了词库中词条的数量,保证用户在这些应用输入时的首选词的准确率,并且,保证CPU、内存等计算设备的资源的占用在合理的水平。
参照图2,示出了根据本发明另一个实施例的词库的更新方法的步骤流程图,具体可以包括如下步骤:
步骤201,确定移动终端中应用归属的应用分类。
步骤202,采集所述应用分类中应用的应用信息。
步骤203,根据所述应用信息更新所述应用分类对应的词库。
步骤204,当检测到应用启动时,确定所述应用归属的应用分类。
在移动终端中,大多数应用都是由几个或者几十个甚至更多的控件来组成,除了主窗口以外,还有输入法窗口、各种各样的弹出窗口以及自定义样式的子窗口。
由于系统界面的操作位置比较少,在系统界面一般只有一个应用进行操作,其位于最上层的窗口。
因此,在本发明实施例中,可以检测移动终端的操作系统中,最上层的窗口,查询最上层的窗口所属的应用,从而确定该应用所属的应用分类。
以Android为例,可以通过窗口管理器ActivityManager获取操作系统中正在运行的进程列表getRunningTasks,从进程列表getRunningTasks中获取最上层窗口的组件名称task.get(0).topActivity,通过循环判断该最上层窗口的组件名称所属的包名getPackageName是否与正在运行的进程(应用)所属的包名相同,如果相同则返回正在运行的进程的上下文对象,即获知了最上层的窗口所属的应用。
步骤205,加载所述应用分类对应的词库。
在本发明实施例中,可以将应用分类对应的词库加载至缓存中,这样,用户在后续进行输入操作时,输入法系统在检索系统词库等基本的词库的同时检索该应用分类对应的词库。
例如,如果用户启动某个游戏,则可以加载存储有该游戏中特定术语(如武器名称、任务名称、人物名称等)的词库,方便用户输入特定术语进行聊天。
又例如,如果用户启动某个视频播放器,则可以加载存储有电视剧相关术语(如电视剧名称、演员名称等)的词库,方便用户输入相关术语发送弹幕。
步骤206,接收输入的字符串。
在实际应用中,在输入法系统进行输入的虚拟键盘、物理键盘等键盘可以包括九宫格键盘、全键盘(如QWERTY键盘)等等。
这些键盘具有一个或多个按键,该按键经常被复用,映射一个或多个字符,若按键被触发(如按下、点击、滑动等),可以将其映射的字符输入至输入法系统,输入法系统将这些字符组成字符串。
对于不同的语言,如中文、英文、日文等等,虚拟键盘、物理键盘等键盘的按键所映射的字符会有所不同,具体可以包括、但不限于数字字符、英文字符、中文字符(如拼音字符、笔画字符等)和符号字符中的至少一个。
这些字符串可以显示在输入法系统界面中的编码栏中,以提示用户所输入的字符串。
步骤207,在加载的词库中查找与字符串匹配的候选项。
在中文、日语等语言里,作为基本语言单位的汉字、日文等文字一般不直接与键盘上的按键进行映射,因此,在输入时一般需要进行字符串与词条的转换。
在具体实现中,可以在词库中查找与字符串匹配的编码信息,提取编码信息映射的词条,作为候选项。
需要说明的是,这些词库可以包括系统词库、细胞词库、用户词库、通讯录词库、临时词库等等,其中包括应用分类对应的词库。
以汉字的拼音输入为例,用户将汉字的拼音通过键盘输入至输入法系统中,由输入法系统进行解码,具体可以包括如下步骤:
1、拼音切分
在此步骤中,输入法系统可以将字符串切分为拼音的音节。
例如,将字符串“aoyunhui”切分为“ao’yun’hui”。
2、音节解码
在此步骤中,输入法系统可以在词库中查找音节对应的词条。
例如,查找“ao’yun’hui”对应的词条“奥运会”。
在本发明实施例中,如果同时在该应用分类对应的词库,以及其他词库中同时检索到匹配的候选项,此时可以提高该应用分类对应的词库的排序。
步骤208,当检测到选择操作时,将所述选择操作对应的候选项进行上屏输出。
在具体实现中,如果用户输入编码信息,则输入法系统可以将相关的候选项记载至候选栏中,待用户选择。
如果用户选定候选项,则可以输出该候选至其他应用,将候选项输出的过程可以称之为上屏。
步骤209,查找上屏输出的候选项的词条信息。
步骤210,将所述词条信息发送至服务器,以在所述词条信息满足预设的推送条件时,推送至目标终端中所述候选项所属应用分类对应的词库。
如果用户上屏某个词条(即候选项),则可以查找该词条(即候选项)的词条信息,即与该词条相关的信息,包括词条本身、编码信息、词条属性(如展示的次数、上屏的概率、存储的时间等等),并将这些词条信息上传至服务器。
服务器可以设置推送条件,如一定时间内上屏的频次超过阈值、基于协同过滤查找与当前用户匹配的其他用户等等,将这些词条信息推送至目标终端中的输入法系统,该目标终端的输入法系统将该词条信息存储至相同应用分类的词库中,方便目标终端的用户进行输入操作。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图3,示出了根据本发明一个实施例的词库的更新装置的结构框图,具体可以包括如下模块:
应用分类确定模块301,适于确定移动终端中应用归属的应用分类;
应用信息采集模块302,适于采集所述应用分类中应用的应用信息;
词库更新模块303,适于根据所述应用信息更新所述应用分类对应的词库。
在本发明的一个实施例中,所述应用信息采集模块302包括:
数量统计子模块,适于统计所述应用分类中应用的数量。
在本发明的一个实施例中,所述应用信息采集模块302包括:
运行信息采集子模块,适于在检测到所述应用分类中的应用运行时,采集所述应用在运行时的运行信息。
在本发明的一个实施例中,所述词库更新模块303包括:
优先级确定子模块,适于采用所述应用信息确定所述应用分类的优先级;
优先级更新子模块,适于按照所述优先级更新所述应用分类对应的词库。
在具体实现中,所述应用分类中应用的数量与所述应用分类的优先级正相关;
所述应用分类中应用的运行信息包括运行时长,所述运行时长与所述应用分类的优先级正相关。
参照图4,示出了根据本发明另一个实施例的词库的更新装置的结构框图,具体可以包括如下模块:
应用分类确定模块401,适于确定移动终端中应用归属的应用分类;
应用信息采集模块402,适于采集所述应用分类中应用的应用信息;
词库更新模块403,适于根据所述应用信息更新所述应用分类对应的词库。
应用启动检测模块404,适于在检测到应用启动时,确定所述应用归属的应用分类;
词库加载模块405,适于加载所述应用分类对应的词库。
字符串接收模块406,适于接收输入的字符串;
候选项查找模块407,适于在加载的词库中查找与字符串匹配的候选项;
候选项上屏模块408,适于在检测到选择操作时,将所述选择操作对应的候选项进行上屏输出。
词条信息查找模块409,适于查找上屏输出的候选项的词条信息;
词条信息上传模块410,适于将所述词条信息发送至服务器,以在所述词条信息满足预设的推送条件时,推送至目标终端中所述候选项所属应用分类对应的词库。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的词库的更新设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (14)
1.一种词库的更新方法,包括:
确定移动终端中应用归属的应用分类,所述应用为移动终端中安装的第三方应用;
采集所述应用分类中应用的应用信息,其中,所述应用信息表征用户的行为习惯,所述应用分类中应用的应用信息包括所述应用分类中应用的数量或应用的运行信息;
根据所述应用信息更新所述应用分类对应的词库;
其中,所述根据所述应用信息更新所述应用分类对应的词库具体包括:子步骤S11,采用所述应用信息确定所述应用分类的优先级;子步骤S12,按照所述优先级更新所述应用分类对应的词库,且更新的频率与所述优先级正相关。
2.如权利要求1所述的方法,其特征在于,所述采集所述应用分类中应用的应用信息的步骤包括:
统计所述应用分类中应用的数量。
3.如权利要求1所述的方法,其特征在于,所述采集所述应用分类中应用的应用信息的步骤包括:
当检测到所述应用分类中的应用运行时,采集所述应用在运行时的运行信息。
4.如权利要求1所述的方法,其特征在于,所述应用分类中应用的数量与所述应用分类的优先级正相关;
所述应用分类中应用的运行信息包括运行时长,所述运行时长与所述应用分类的优先级正相关。
5.如权利要求1或2或3所述的方法,其特征在于,还包括:
当检测到应用启动时,确定所述应用归属的应用分类;
加载所述应用分类对应的词库。
6.如权利要求5所述的方法,其特征在于,还包括:
接收输入的字符串;
在加载的词库中查找与字符串匹配的候选项;
当检测到选择操作时,将所述选择操作对应的候选项进行上屏输出。
7.如权利要求6所述的方法,其特征在于,还包括:
查找上屏输出的候选项的词条信息;
将所述词条信息发送至服务器,以在所述词条信息满足预设的推送条件时,推送至目标终端中所述候选项所属应用分类对应的词库。
8.一种词库的更新装置,包括:
应用分类确定模块,适于确定移动终端中应用归属的应用分类,所述应用为移动终端中安装的第三方应用;
应用信息采集模块,适于采集所述应用分类中应用的应用信息,其中,所述应用信息表征用户的行为习惯,所述应用分类中应用的应用信息包括所述应用分类中应用的数量或应用的运行信息;
词库更新模块,适于根据所述应用信息更新所述应用分类对应的词库,其中,所述根据所述应用信息更新所述应用分类对应的词库具体包括:采用所述应用信息确定所述应用分类的优先级;按照所述优先级更新所述应用分类对应的词库,且更新的频率与所述优先级正相关;
所述词库更新模块,适于在独立的缓存词库中更新所述应用分类对应的词库,当更新完成后,利用缓存词库替换所述应用分类对应的原有词库。
9.如权利要求8所述的装置,其特征在于,所述应用信息采集模块包括:
数量统计子模块,适于统计所述应用分类中应用的数量。
10.如权利要求8所述的装置,其特征在于,所述应用信息采集模块包括:
运行信息采集子模块,适于在检测到所述应用分类中的应用运行时,采集所述应用在运行时的运行信息。
11.如权利要求8所述的装置,其特征在于,所述应用分类中应用的数量与所述应用分类的优先级正相关;
所述应用分类中应用的运行信息包括运行时长,所述运行时长与所述应用分类的优先级正相关。
12.如权利要求8或9或10所述的装置,其特征在于,还包括:
应用启动检测模块,适于在检测到应用启动时,确定所述应用归属的应用分类;
词库加载模块,适于加载所述应用分类对应的词库。
13.如权利要求12所述的装置,其特征在于,还包括:
字符串接收模块,适于接收输入的字符串;
候选项查找模块,适于在加载的词库中查找与字符串匹配的候选项;
候选项上屏模块,适于在检测到选择操作时,将所述选择操作对应的候选项进行上屏输出。
14.如权利要求13所述的装置,其特征在于,还包括:
词条信息查找模块,适于查找上屏输出的候选项的词条信息;
词条信息上传模块,适于将所述词条信息发送至服务器,以在所述词条信息满足预设的推送条件时,推送至目标终端中所述候选项所属应用分类对应的词库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710076866.4A CN106933801B (zh) | 2017-02-13 | 2017-02-13 | 一种词库的更新方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710076866.4A CN106933801B (zh) | 2017-02-13 | 2017-02-13 | 一种词库的更新方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106933801A CN106933801A (zh) | 2017-07-07 |
CN106933801B true CN106933801B (zh) | 2021-02-05 |
Family
ID=59422987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710076866.4A Active CN106933801B (zh) | 2017-02-13 | 2017-02-13 | 一种词库的更新方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106933801B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107798094A (zh) * | 2017-10-26 | 2018-03-13 | 北京百度网讯科技有限公司 | 用于输入字词的方法和装置 |
CN110083253A (zh) * | 2018-01-25 | 2019-08-02 | 北京搜狗科技发展有限公司 | 一种输入方法和装置 |
CN111061744B (zh) * | 2018-10-17 | 2023-08-01 | 百度在线网络技术(北京)有限公司 | 图数据的更新方法、装置、计算机设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101373468A (zh) * | 2007-08-20 | 2009-02-25 | 北京搜狗科技发展有限公司 | 一种加载词库的方法、字符输入的方法和输入法系统 |
CN101645087A (zh) * | 2009-09-01 | 2010-02-10 | 腾讯科技(深圳)有限公司 | 一种分类词库系统及其更新和维护方法、以及客户端 |
CN103246703A (zh) * | 2013-04-03 | 2013-08-14 | 百度在线网络技术(北京)有限公司 | 一种用于确定应用词库的方法和设备 |
CN104375663A (zh) * | 2014-11-11 | 2015-02-25 | 广东欧珀移动通信有限公司 | 一种联想输入方法及装置 |
CN105718147A (zh) * | 2016-01-22 | 2016-06-29 | 百度在线网络技术(北京)有限公司 | 输入法面板启用方法和装置以及输入方法和输入法系统 |
CN106201010A (zh) * | 2016-06-29 | 2016-12-07 | 百度在线网络技术(北京)有限公司 | 词库添加方法和装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100483416C (zh) * | 2007-05-22 | 2009-04-29 | 北京搜狗科技发展有限公司 | 一种字符输入的方法、输入法系统及词库更新的方法 |
CN101388011B (zh) * | 2007-09-13 | 2011-07-20 | 北京搜狗科技发展有限公司 | 一种向用户词库中记录信息的方法和装置 |
CN102982070A (zh) * | 2012-10-26 | 2013-03-20 | 北京百度网讯科技有限公司 | 用于输入法应用程序的词库更新方法、系统和云端服务器 |
CN106095128B (zh) * | 2016-06-14 | 2020-06-09 | 维沃移动通信有限公司 | 一种移动终端的文字输入方法及移动终端 |
-
2017
- 2017-02-13 CN CN201710076866.4A patent/CN106933801B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101373468A (zh) * | 2007-08-20 | 2009-02-25 | 北京搜狗科技发展有限公司 | 一种加载词库的方法、字符输入的方法和输入法系统 |
CN101645087A (zh) * | 2009-09-01 | 2010-02-10 | 腾讯科技(深圳)有限公司 | 一种分类词库系统及其更新和维护方法、以及客户端 |
CN103246703A (zh) * | 2013-04-03 | 2013-08-14 | 百度在线网络技术(北京)有限公司 | 一种用于确定应用词库的方法和设备 |
CN104375663A (zh) * | 2014-11-11 | 2015-02-25 | 广东欧珀移动通信有限公司 | 一种联想输入方法及装置 |
CN105718147A (zh) * | 2016-01-22 | 2016-06-29 | 百度在线网络技术(北京)有限公司 | 输入法面板启用方法和装置以及输入方法和输入法系统 |
CN106201010A (zh) * | 2016-06-29 | 2016-12-07 | 百度在线网络技术(北京)有限公司 | 词库添加方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN106933801A (zh) | 2017-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111488426B (zh) | 一种查询意图确定方法、装置及处理设备 | |
US9384262B2 (en) | Internal linking co-convergence using clustering with hierarchy | |
CN112632385A (zh) | 课程推荐方法、装置、计算机设备及介质 | |
CN101645088B (zh) | 确定需要加载的辅助词库的方法、装置及输入法系统 | |
CN109947909A (zh) | 智能客服应答方法、设备、存储介质及装置 | |
US8316006B2 (en) | Creating an ontology using an online encyclopedia and tag cloud | |
US20130339840A1 (en) | System and method for logical chunking and restructuring websites | |
CN104809125A (zh) | 一种网页类别的识别方法和装置 | |
CN110325987B (zh) | 语境语音驱动深度书签 | |
US9135361B1 (en) | Updating taxonomy based on webpage | |
CN106933801B (zh) | 一种词库的更新方法和装置 | |
CN110069724A (zh) | 应用程序快捷跳转方法、装置、电子设备和存储介质 | |
CN109634436A (zh) | 输入法的联想方法、装置、设备及可读存储介质 | |
CN110275952A (zh) | 基于用户短期兴趣的新闻推荐方法、装置及介质 | |
CN112328909A (zh) | 信息推荐方法、装置、计算机设备及介质 | |
CN111488510B (zh) | 小程序相关词的确定方法、装置、处理设备及搜索系统 | |
CN112417133A (zh) | 排序模型的训练方法和装置 | |
CN102016782B (zh) | 操作支援装置以及操作支援方法 | |
CN103631796A (zh) | 网址分类管理方法及电子装置 | |
CN109543091B (zh) | 应用程序的推送方法、装置及终端 | |
CN116225567A (zh) | 页面加载方法、装置、存储介质及计算机设备 | |
CN111259259B (zh) | 大学生新闻推荐方法、装置、设备及存储介质 | |
CN111291186B (zh) | 一种基于聚类算法的上下文挖掘方法、装置和电子设备 | |
US20170024405A1 (en) | Method for automatically generating dynamic index for content displayed on electronic device | |
CN114416664A (zh) | 信息显示方法、信息显示装置、电子设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20170801 Address after: 100102, 18 floor, building 2, Wangjing street, Beijing, Chaoyang District, 1801 Applicant after: BEIJING ANYUN SHIJI SCIENCE AND TECHNOLOGY CO., LTD. Address before: 100088 Beijing city Xicheng District xinjiekouwai Street 28, block D room 112 (Desheng Park) Applicant before: Beijing Qihu Technology Co., Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |