CN110597800A - 一种注释信息确定、前缀树构建方法及装置 - Google Patents

一种注释信息确定、前缀树构建方法及装置 Download PDF

Info

Publication number
CN110597800A
CN110597800A CN201810500276.4A CN201810500276A CN110597800A CN 110597800 A CN110597800 A CN 110597800A CN 201810500276 A CN201810500276 A CN 201810500276A CN 110597800 A CN110597800 A CN 110597800A
Authority
CN
China
Prior art keywords
node
added
character
level
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810500276.4A
Other languages
English (en)
Inventor
邱星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201810500276.4A priority Critical patent/CN110597800A/zh
Priority to PCT/CN2019/087223 priority patent/WO2019223597A1/zh
Publication of CN110597800A publication Critical patent/CN110597800A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing

Abstract

本申请实施例提供了一种注释信息确定、前缀树构建方法及装置,方法包括:获取待补全拼音缩写;将待补全拼音缩写中第一级别的字符作为当前级别的待补全字符,将预设前缀树中第一级别的所有节点作为待补全候选节点;从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点;判断待补全拼音缩写中的所有字符是否匹配完成;如果否,则将下一级别的字符作为当前级别的待补全字符,将当前待补全节点对应的下一级别的所有节点作为待补全候选节点。应用本申请实施例,在确定注释信息时,能够提高查询效率,降低人工成本。

Description

一种注释信息确定、前缀树构建方法及装置
技术领域
本申请涉及计算机技术技术领域,特别是涉及一种注释信息确定、前缀树构建方法及装置。
背景技术
为满足便于记忆、书写方便等需求,人们常常采用拼音缩写来表达一个词组。例如,身份证号采用SFZH来表达,审批时间采用SPHJ来表达等。这使得拼音缩写随处可见。而为了便于人们理解拼音缩写的含义,需要对拼音缩写进行描述。这里,拼音缩写的描述信息即为上述拼音缩写所要表达的词组,也可以称为拼音缩写的注释信息。
目前,拼音缩写的注释信息主要是靠人工查找数据库来的确定的。其中数据库中存储有大量的拼音缩写与注释信息的对应关系。人工需要逐条查找数据库中包括的对应关系,以确定需要的拼音缩写的注释信息。这使得查询人工成本较高,查询效率较低。
发明内容
本申请实施例的目的在于提供一种注释信息确定、前缀树构建方法及装置,以在注释信息确定时,降低人工成本,提高查询效率。具体技术方案如下:
为实现上述目的,本申请实施例提供了一种注释信息确定方法,所述方法包括:
获取待补全拼音缩写;其中,所述待补全拼音缩写中的各个字符与预设前缀树中的各个级别一一对应,所述预设前缀树中每一分支的最后一级别的节点的值为注释信息,所述预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符;
将所述待补全拼音缩写中第一级别的字符作为当前级别的待补全字符,将所述预设前缀树中第一级别的所有节点作为待补全候选节点;
从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点;
判断所述待补全拼音缩写中的所有字符是否匹配完成;
如果否,则将所述待补全拼音缩写中下一级别的字符作为当前级别的待补全字符,将所述预设前缀树中当前待补全节点对应的下一级别的所有节点作为待补全候选节点,返回执行所述从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点的步骤。
可选的,所述获取待补全拼音缩写的步骤,包括:
获取用户输入的拼音缩写;
对所述用户输入的拼音缩写进行标准化处理,得到待补全拼音缩写。
可选的,所述对所述用户输入的拼音缩写进行标准化处理的步骤,包括:
去除所述用户输入的拼音缩写的前缀;和/或
对所述用户输入的拼音缩写进行归一化处理。
可选的,所述方法还包括:
若判定所述待补全拼音缩写中的所有字符匹配完成,则将所述预设前缀树中当前待补全节点对应的最后一级别的节点的值,确定为所述待补全拼音缩写的注释信息。
可选的,所述将所述预设前缀树中当前待补全节点对应的最后一级别的节点的值,确定为所述待补全拼音缩写的注释信息的步骤,包括:
判断所述预设前缀树中当前待补全节点对应的下一级别的节点中是否存在结束字符节点;所述结束字符节点的值为表示字符串结束的字符;
如果是,则将所述结束字符节点对应的最后一级别的节点的值,确定为所述待补全拼音缩写的注释信息。
可选的,所述方法还包括:
若所述预设前缀树中当前待补全节点对应的下一级别的节点中不存在结束字符节点,则输出提示信息,所述提示信息用于指示未确定所述待补全拼音缩写的注释信息。
可选的,所述方法还包括:
若所述预设前缀树中当前待补全节点对应的下一级别的节点中不存在结束字符节点,则判断目标数量是否大于预设数量阈值;所述目标数量为所述预设前缀树中当前待补全节点对应的最后一级别的节点的数量;
如果否,则将所述预设前缀树中当前待补全节点对应的最后一级别的节点的值,作为所述待补全拼音缩写的注释信息;
如果是,则输出提示信息,所述提示信息用于指示未确定所述待补全拼音缩写的注释信息。
可选的,所述方法还包括:
若各个待补全候选节点中不存在值为当前级别的待补全字符的待补全候选节点,则输出提示信息,所述提示信息用于指示未确定所述待补全拼音缩写的注释信息。
可选的,所述方法还包括:
获取待添加拼音缩写,并获取所述待添加拼音缩写对应的待添加注释信息;所述待添加拼音缩写中的各个字符与所述预设前缀树中的各个级别一一对应;
将所述待添加拼音缩写中第一级别的字符作为当前级别的待添加字符,将所述预设前缀树中第一级别的所有节点作为待添加候选节点;
判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点;
如果不存在值为当前级别的待添加字符的待添加候选节点,则创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点;
判断所述待添加拼音缩写中的所有字符是否匹配完成;
如果匹配未完成,则将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的节点作为待添加候选节点,返回执行所述创建值为当前级别的待添加字符、且级别为当前级别的待添加候选节点,作为当前待添加节点的步骤;
如果匹配完成,则创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点。
可选的,所述方法还包括:
如果存在值为当前级别的待添加字符的待添加候选节点,则将值为当前级别的待添加字符的待添加候选节点,确定为当前待添加节点;
判断所述待添加拼音缩写中的所有字符是否匹配完成;
如果匹配未完成,则将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的所有节点作为待添加候选节点,返回执行所述判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点的步骤;
如果匹配完成,则判断所述预设前缀树中当前待添加节点对应的最后一级别的节点中是否值为所述待添加注释信息的节点;
如果不存在值为所述待添加注释信息的节点,则创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点。
可选的,所述创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点的步骤,包括:
创建当前待添加节点对应的下一级别的结束字符节点;所述结束字符节点的值为表示字符串结束的字符;
创建值为所述待添加注释信息、且所述结束字符节点对应的最后一级别的节点。
为实现上述目的,本申请实施例还提供了一种前缀树构建方法,所述方法包括:
获取待添加拼音缩写,并获取所述待添加拼音缩写对应的待添加注释信息;所述待添加拼音缩写中的各个字符与预设前缀树中的各个级别一一对应;所述预设前缀树中每一分支的最后一级别的节点的值为注释信息,所述预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符;
将所述待添加拼音缩写中第一级别的字符作为当前级别的待添加字符,将所述预设前缀树中第一级别的所有节点作为待添加候选节点;
判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点;
如果不存在值为当前级别的待添加字符的待添加候选节点,则创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点;
判断所述待添加拼音缩写中的所有字符是否匹配完成;
如果匹配未完成,则将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的节点作为待添加候选节点,返回执行所述创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点的步骤。
可选的,所述获取待添加拼音缩写的步骤,包括:
获取待处理拼音缩写;
对所述待处理拼音缩写进行标准化处理,得到待添加拼音缩写。
可选的,所述对所述待处理拼音缩写进行标准化处理的步骤,包括:
去除所述待处理拼音缩写的前缀;和/或
对所述待处理拼音缩写进行归一化处理。
可选的,所述方法还包括:
若判定所述待添加拼音缩写中的所有字符匹配完成,则创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点。
可选的,所述方法还包括:
如果存在值为当前级别的待添加字符的待添加候选节点,则将值为当前级别的待添加字符的待添加候选节点,确定为当前待添加节点;
判断所述待添加拼音缩写中的所有字符是否匹配完成;
如果匹配未完成,则将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的所有节点作为待添加候选节点,返回执行所述判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点的步骤;
如果匹配完成,则判断所述预设前缀树中当前节点对应的最后一级别的节点中是否值为所述待添加注释信息的节点;
如果不存在值为所述待添加注释信息的节点,则创建值为所述待添加注释信息、且当前节点对应的最后一级别的节点。
可选的,所述创建值为所述待添加注释信息、且当前节点对应的最后一级别的节点的步骤,包括:
创建当前待添加节点对应的下一级别的结束字符节点;所述结束字符节点的值为表示字符串结束的字符;
创建值为所述待添加注释信息、且所述结束字符节点对应的最后一级别的节点。
为实现上述目的,本申请实施例还提供一种注释信息确定装置,所述装置包括:
第一获取单元,用于获取待补全拼音缩写;其中,所述待补全拼音缩写中的各个字符与预设前缀树中的各个级别一一对应,所述预设前缀树中每一分支的最后一级别的节点的值为注释信息,所述预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符;
第一确定单元,用于将所述待补全拼音缩写中第一级别的字符作为当前级别的待补全字符,将所述预设前缀树中第一级别的所有节点作为待补全候选节点;
选择单元,用于从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点;
第一判断单元,用于判断所述待补全拼音缩写中的所有字符是否匹配完成;
第二确定单元,用于在所述第一判断单元的判断结果为否的情况下,将所述待补全拼音缩写中下一级别的字符作为当前级别的待补全字符,将所述预设前缀树中当前待补全节点对应的下一级别的所有节点作为待补全候选节点。
可选的,所述第一获取单元,具体用于:
获取用户输入的拼音缩写;
对所述用户输入的拼音缩写进行标准化处理,得到待补全拼音缩写。
可选的,所述第一获取单元,具体用于:
去除所述用户输入的拼音缩写的前缀;和/或对所述用户输入的拼音缩写进行归一化处理。
可选的,所述装置还包括:
第三确定单元,用于在所述第一判断单元的判断结果为是的情况下,将所述预设前缀树中当前待补全节点对应的最后一级别的节点的值,确定为所述待补全拼音缩写的注释信息。
可选的,所述第三确定单元,具体用于:
判断所述预设前缀树中当前待补全节点对应的下一级别的节点中是否存在结束字符节点;所述结束字符节点的值为表示字符串结束的字符;
如果是,则将所述结束字符节点对应的最后一级别的节点的值,确定为所述待补全拼音缩写的注释信息。
可选的,所述第三确定单元,还用于:
若所述预设前缀树中当前待补全节点对应的下一级别的节点中不存在结束字符节点,则输出提示信息,所述提示信息用于指示未确定所述待补全拼音缩写的注释信息。
可选的,所述第三确定单元,还用于:
若所述预设前缀树中当前待补全节点对应的下一级别的节点中不存在结束字符节点,则判断目标数量是否大于预设数量阈值;所述目标数量为所述预设前缀树中当前待补全节点对应的最后一级别的节点的数量;
如果否,则将所述预设前缀树中当前待补全节点对应的最后一级别的节点的值,作为所述待补全拼音缩写的注释信息;
如果是,则输出提示信息,所述提示信息用于指示未确定所述待补全拼音缩写的注释信息。
可选的,所述装置还包括:输出单元,用于若各个待补全候选节点中不存在值为当前级别的待补全字符的待补全候选节点,则输出提示信息,所述提示信息用于指示未确定所述待补全拼音缩写的注释信息。
可选的,所述装置还包括:
第二获取单元,用于获取待添加拼音缩写,并获取所述待添加拼音缩写对应的待添加注释信息;所述待添加拼音缩写中的各个字符与所述预设前缀树中的各个级别一一对应;
第四确定单元,用于将所述待添加拼音缩写中第一级别的字符作为当前级别的待添加字符,将所述预设前缀树中第一级别的所有节点作为待添加候选节点;
第二判断单元,用于判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点;
第一创建单元,用于在所述第二判断单元的判断结果为否的情况下,创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点;
第三判断单元,用于判断所述待添加拼音缩写中的所有字符是否匹配完成;
第五确定单元,用于在所述第三判断单元的判断结果为否的情况下,将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的节点作为待添加候选节点;
第二创建单元,用于在所述第三判断单元的判断结果为是的情况下,创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点。
可选的,所述装置还包括:
第六确定单元,用于在所述第二判断单元的判断结果为是的情况下,将值为当前级别的待添加字符的待添加候选节点,确定为当前待添加节点;
第四判断单元,用于判断所述待添加拼音缩写中的所有字符是否匹配完成;
第七确定单元,用于在所述第四判断单元的判断结果为否的情况下,将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的所有节点作为待添加候选节点;
第五判断单元,用于在所述第四判断单元的判断结果为是的情况下,判断所述预设前缀树中当前待添加节点对应的最后一级别的节点中是否值为所述待添加注释信息的节点;
所述第二创建单元,还用于在所述第五判断单元的判断结果为是的情况下,创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点。
可选的,所述第二创建单元,具体用于:
创建当前待添加节点对应的下一级别的结束字符节点,所述结束字符节点的值为表示字符串结束的字符;创建值为所述待添加注释信息、且所述结束字符节点对应的最后一级别的节点。
为实现上述目的,本申请实施例还提供了一种前缀树构建装置,所述装置包括:
获取单元,用于获取待添加拼音缩写,并获取所述待添加拼音缩写对应的待添加注释信息;所述待添加拼音缩写中的各个字符与预设前缀树中的各个级别一一对应;所述预设前缀树中每一分支的最后一级别的节点的值为注释信息,所述预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符;
第一确定单元,用于将所述待添加拼音缩写中第一级别的字符作为当前级别的待添加字符,将所述预设前缀树中第一级别的所有节点作为待添加候选节点;
第一判断单元,用于判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点;
第一创建单元,用于在所述第一判断单元的判断结果为否的情况下,创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点;
第二判断单元,用于判断所述待添加拼音缩写中的所有字符是否匹配完成;
第二确定单元,用于在所述第二判断单元的判断结果为否的情况下,将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的节点作为待添加候选节点。
可选的,所述获取单元,具体用于:
获取待处理拼音缩写;
对所述待处理拼音缩写进行标准化处理,得到待添加拼音缩写。
可选的,所述获取单元,具体用于:
去除所述待处理拼音缩写的前缀;和/或对所述待处理拼音缩写进行归一化处理。
可选的,所述装置还包括:
第二创建单元,用于在所述第二判断单元的判断结果为是的情况下,创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点。
可选的,所述装置还包括:
第三确定单元,用于在所述第一判断单元的判断结果为是的情况下,将值为当前级别的待添加字符的待添加候选节点,确定为当前待添加节点;
第三判断单元,用于判断所述待添加拼音缩写中的所有字符是否匹配完成;
第四确定单元,用于在所述第三判断单元的判断结果为否的情况下,将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的所有节点作为待添加候选节点;
第四判断单元,用于在所述第三判断单元的判断结果为是的情况下,判断所述预设前缀树中当前待添加节点对应的最后一级别的节点中是否值为所述待添加注释信息的节点;
第二创建单元,用于在所述第四判断单元的判断结果为是的情况下,创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点。
可选的,所述第二创建单元,具体用于:
创建当前待添加节点对应的下一级别的结束字符节点,所述结束字符节点的值为表示字符串结束的字符;创建值为所述待添加注释信息、且所述结束字符节点对应的最后一级别的节点。
为实现上述目的,本申请实施例还提供了一种电子设备,包括处理器和存储器;所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存放的程序,实现上述任一注释信息确定方法步骤。
为实现上述目的,本申请实施例还提供了一种电子设备,包括处理器和存储器;所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存放的程序,实现上述任一前缀树构建方法步骤。
为实现上述目的,本申请实施例还提供了一种机器可读存储介质,所述机器可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一注释信息确定方法步骤。
为实现上述目的,本申请实施例还提供了一种机器可读存储介质,所述机器可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一前缀树构建方法步骤。
本申请实施例中,预设有前缀树,前缀树中每一分支的最后一级别的节点的值为注释信息,前缀树中除每一分支的最后一级别的节点外的节点的值为字符。基于前缀树,将待补全拼音缩写的字符划分为多个级别,逐级的查询待补全拼音缩写的字符,进而确定待补全拼音缩写的注释信息。这样就不必逐条查找数据库中包括的对应关系,有效提高了查询效率。另外,基于前缀树确定注释信息,可由电子设备实现,不必人工查询数据库实现,能够在注释信息确定时,降低人工成本。当然,实施本申请的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的前缀树构建方法的第一种流程示意图;
图2为本申请实施例提供的前缀树的一种示意图;
图3为基于图2所示前缀树的一种示意图;
图4为基于图2所示前缀树的另一种示意图;
图5为本申请实施例提供的前缀树构建方法的第二种流程示意图;
图6为基于图2所示前缀树的再一种示意图;
图7为本申请实施例提供的前缀树构建方法的第三种流程示意图;
图8为本申请实施例提供的注释信息确定方法的第一种流程示意图;
图9为本申请实施例提供的注释信息确定方法的第二种流程示意图;
图10为本申请实施例提供的前缀树构建装置的第一种结构示意图;
图11为本申请实施例提供的前缀树构建装置的第二种结构示意图;
图12为本申请实施例提供的前缀树构建装置的第三种结构示意图;
图13为本申请实施例提供的注释信息确定装置的第一种结构示意图;
图14为本申请实施例提供的注释信息确定装置的第二种结构示意图;
图15为本申请实施例提供的电子设备的第一种结构示意图;
图16为本申请实施例提供的电子设备的第二种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为便于理解,下面对本申请实施例中出现的词语进行解释。
拼音缩写:为一个字符串。拼音缩写可以为汉语拼音的首字母缩写,例如身份证号的拼音缩写为SFZH。拼音缩写也可以为英文单词的首字母的缩写,例如,InternetProtocol(网络协议)的拼音缩写为IP。本申请实施例中,拼音缩写也可以为其他形式的缩写,本申请实施例不进行限定。
为了在注释信息确定时,降低人工成本,提高查询效率,本申请实施例提供了一种注释信息确定方法及装置、前缀树构建方法及装置。该注释信息确定方法及装置和前缀树构建方法及装置可以应用于手机、电脑等电子设备。
上述注释信息确定方法中,预设有前缀树,前缀树中每一分支的最后一级别的节点的值为注释信息,前缀树中除每一分支的最后一级别的节点外的节点的值为字符。基于前缀树将待补全拼音缩写的字符划分为多个级别,逐级的查询待补全拼音缩写的字符,进而确定待补全拼音缩写的注释信息。这样就不必逐条查找数据库中包括的对应关系,有效提高了查询效率。另外,基于前缀树确定注释信息,可由电子设备实现,不必人工查询数据库实现,能够在注释信息确定时,降低人工成本。
下面通过具体实施例,对本申请进行详细说明。
参考图1,图1为本申请实施例提供的前缀树构建方法的第一种流程示意图,该方法包括如下步骤。
步骤101:获取待添加拼音缩写,并获取待添加拼音缩写对应的待添加注释信息。其中,待添加拼音缩写中的各个字符与预设前缀树中的各个级别一一对应;预设前缀树中每一分支的最后一级别的节点的值为注释信息,预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符。
本申请实施例中,按照待添加拼音缩写中字母的顺序,划分字母的级别。例如待添加拼音缩写为SFZH,则字符S对应第一级别,字符F对应第二级别,字符Z对应第三级别,字符H对应第四级别。
预设前缀树可以为空树,即预设前缀树仅包括根节点。预设前缀树也可以加载的已有前缀树,即预设前缀树中包括多个级别的节点。
本申请的一个实施例中,可以通过网络爬手等工具从网络中获取待添加拼音缩写,以及待添加拼音缩写对应的待添加注释信息。也可以由用户输入待添加拼音缩写,以及待添加拼音缩写对应的待添加注释信息。
在本申请的另一个实施例中,为了便于后续处理,在获取到拼音缩写后,例如从网络中获取到拼音缩写或获取到用户输入的拼音缩写后,将获取的拼音缩写作为待处理拼音缩写,并对待处理拼音缩写进行标准化处理,得到待添加拼音缩写。其中,标准化处理后的待处理拼音缩写即为待添加拼音缩写。
在本申请的一个实施例中,对待处理拼音缩写进行标准化处理,可以为:去除待处理拼音缩写的前缀。例如,待处理拼音缩写为X_SFZH,其中,“X_”为前缀。对X_SFZH进行标准化处理,即为去除前缀“X_”,得到待添加拼音缩写为SFZH。
在本申请的另一个实施例中,对待处理拼音缩写进行标准化处理,可以为:对待添加拼音缩写进行归一化处理。这里,归一化处理可以为:统一同一注释信息对应的拼音缩写的字符大小写。例如SFZH和sfzh的注释信息均为身份证号,则可以将SFZH和sfzh归一为SFZH。
本申请实施例中,还可以结合上面两种标准化方式对待处理拼音缩写进行标准化处理,得到待添加拼音缩写。本申请实施例对此不进行限定。
步骤102:将待添加拼音缩写中第一级别的字符作为当前级别的待添加字符,将预设前缀树中第一级别的所有节点作为待添加候选节点。
这里,预设前缀树中第一级别的节点为预设前缀树中,根节点的下一级别的节点。
例如,待添加拼音缩写为SFZH,则将SFZH中第一级别的字符S作为当前级别的待添加字符。
如图2所示的前缀树,根节点下包括的3个第一级别的节点:值为A的节点1,值为B的节点2,值为C的节点3。此时,可以将节点1、节点2和节点3均确定为待添加候选节点。
步骤103:判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点。如果否,则执行步骤104。
步骤104:创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点。
仍以图2为例进行说,当前级别为第一级别。待添加候选节点包括:节点1、节点2和节点3。
若当前级别的待添加字符为S,节点1、节点2和节点3中不存在值为S的节点,则如图3所示,创建值为S的节点19,作为待添加候选节点,也就是,创建值为S的、第一级别的待添加候选节点,作为当前待添加候选节点。
步骤105:判断待添加拼音缩写中的所有字符是否匹配完成。如果否,则执行步骤106。
一种实现方式中,检测待添加拼音缩写中当前级别的待添加字符后是否还有字符。如果有字符,则判定匹配未完成。如果没有字符,则判定匹配完成。
例如,待添加拼音缩写为SFZH。若当前级别的待添加字符为S,待添加拼音缩写SFZH中S之后还有字符F、Z和H,则确定匹配未完成。若当前级别的待添加字符为H,待添加拼音缩写SFZH中H之后没有字符了,则可以确定匹配完成。
步骤106:将待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将预设前缀树中当前待添加节点对应的下一级别的节点作为待添加候选节点。返回执行步骤104。
以步骤104中的例子进行说明。待添加拼音缩写为SFZH,当前级别为第一级别。若判断SFZH中的所有字符匹配未完成,则将SFZH中第二级别的字符作为当前级别的待添加字符,也就是,将F作为当前级别的待添加字符。
另外,将预设前缀树中当前待添加节点对应的第二级别的节点作为待添加候选节点。这里,如图3所示,第一级别的节点19为新创建的节点,不能找到节点19对应的第二级别的节点,也就是,不能找到待添加候选节点,待添加候选节点为空。
之后,重新执行步骤104,如图4所示,创建值为F的节点20作为待添加候选节点,也就是,创建值为F的、第二级别的待添加候选节点,作为当前待添加节点。
本申请实施例中,以第一节点为例,第一节点对应的下一级别的节点,即为第一节点的子节点。
在本申请的一个实施例中,参考图5所示的前缀树构建方法的第二种流程示意图,基于图1,该方法包括如下步骤。
步骤501:获取待添加拼音缩写,并获取待添加拼音缩写对应的待添加注释信息。其中,待添加拼音缩写中的各个字符与预设前缀树中的各个级别一一对应;预设前缀树中每一分支的最后一级别的节点的值为注释信息,预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符。
步骤502:将待添加拼音缩写中第一级别的字符作为当前级别的待添加字符,将预设前缀树中第一级别的所有节点作为待添加候选节点。
步骤503:判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点。如果否,则执行步骤504。
步骤504:创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点。
步骤505:判断待添加拼音缩写中的所有字符是否匹配完成。如果否,则执行步骤506。如果是,则执行步骤507。
步骤506:将待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将预设前缀树中当前待添加节点对应的下一级别的节点作为待添加候选节点。返回执行步骤504。
步骤501-506与步骤101-106相同,此处不再赘述。
步骤507:创建值为待添加注释信息、且当前待添加节点对应的最后一级别的节点。
若判断待添加拼音缩写中的所有字符的匹配完成,则创建值为待添加注释信息的节点,该创建的节点为当前待添加节点对应的最后一级别的节点。此时,该待添加拼音缩写添加完成。
在本申请的一个实施例中,若判断待添加拼音缩写中的所有字符的匹配完成,则创建当前待添加节点对应的下一级别的结束字符节点。其中,结束字符节点的值为表示字符串结束的字符。例如,表示字符串结束的字符可以“/”。
之后,创建值为待添加注释信息、且所创建的结束字符节点对应的下一级别的节点。这里,所创建的结束字符节点对应的下一级别的节点之后,不再创建下一级别的节点,所以,所创建的结束字符节点对应的下一级别的节点为最后一级别的节点。
例如,待添加拼音缩写为SFZH,待添加注释信息为身份证号。在图2所示的前缀树的基础上,如图6所示,在SFZH添加完成后,创建字符H对应的下一级别的节点23,节点23为结束字符节点,之后再创建值为“身份证号”、且节点23对应的下一级别的节点24。
在本申请的一个实施例中,参考图7所示的前缀树构建方法的第三种流程示意图,在图5的基础上,该方法可包括步骤。
步骤701:获取待添加拼音缩写,并获取待添加拼音缩写对应的待添加注释信息。
步骤702:将待添加拼音缩写中第一级别的字符作为当前级别的待添加字符,将预设前缀树中第一级别的所有节点作为待添加候选节点。
步骤703:判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点。如果否,则执行步骤704。如果是,则执行步骤708。
步骤704:创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点。
步骤705:判断待添加拼音缩写中的所有字符是否匹配完成。如果否,则执行步骤706。如果是,则执行步骤707。
步骤706:将待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将预设前缀树中当前待添加节点对应的下一级别的节点作为待添加候选节点。返回执行步骤704。
步骤707:创建值为待添加注释信息、且当前待添加节点对应的最后一级别的节点。
步骤701-707与步骤501-507相同。
步骤708:将值为当前级别的待添加字符的待添加候选节点,确定为当前待添加节点。
以图2所示前缀树为例。若当前级别为第一级别,则确定节点1、节点2和节点3为待添加候选节点。若当前级别的待添加字符为A,则将节点1确定为当前待添加节点。
步骤709:判断待添加拼音缩写中的所有字符是否匹配完成。如果否,则执行步骤710。如果是,则执行步骤711。
步骤709的相关描述,可参考步骤705。
步骤710:将待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将预设前缀树中当前待添加节点对应的下一级别的所有节点作为待添加候选节点。返回执行步骤703。
步骤710的相关描述,可参考步骤706。
步骤711:判断预设前缀树中当前节点对应的最后一级别的节点中是否值为待添加注释信息的节点。如果否,则执行步骤712。如果是,则结束对待添加拼音缩写的添加。
步骤712:创建值为待添加注释信息、且当前节点对应的最后一级别的节点。
若判断待添加拼音缩写中的所有字符的匹配完成,则创建值为待添加注释信息的节点,该创建的节点为当前待添加节点对应的最后一级别的节点。此时,该待添加拼音缩写添加完成。
在本申请的一个实施例中,若判断待添加拼音缩写中的所有字符的匹配完成,则创建当前待添加节点对应的下一级别的结束字符节点。其中,结束字符节点的值为表示字符串结束的字符。
之后,创建值为待添加注释信息、且所创建的结束字符节点对应的下一级别的节点。这里,所创建的结束字符节点对应的下一级别的节点之后,不再创建下一级别的节点,所以,所创建的结束字符节点对应的下一级别的节点为最后一级别的节点。
在本申请的一个实施例中,在将待添加拼音缩写添加至前缀树中之后,可以将前缀树存储至磁盘中。这样,前缀树可以持久化。当需要更新前缀树,可以直接从磁盘中加载已有前缀树,不必重新创建前缀树,提高了构建前缀树的效率。
本申请实施例中,预先构建前缀树,前缀树中每一分支的最后一级别的节点的值为注释信息,前缀树中除每一分支的最后一级别的节点外的节点的值为字符。这样,就可以基于前缀树将待补全拼音缩写的字符划分为多个级别,逐级的查询待补全拼音缩写的字符,进而确定待补全拼音缩写的注释信息。不必逐条查找数据库中包括的对应关系,有效提高了查询效率。另外,基于前缀树确定注释信息,可由电子设备实现,不必人工查询数据库实现,能够在注释信息确定时,降低人工成本。
基于预设前缀树,本申请实施例提供了一种注释信息确定方法。参考图8,图8为本申请实施例提供的注释信息确定方法的第一种流程示意图。该方法包括如下步骤。
步骤801:获取待补全拼音缩写。其中,待补全拼音缩写中的各个字符与预设前缀树中的各个级别一一对应,预设前缀树中每一分支的最后一级别的节点的值为注释信息,预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符。
本申请实施例中,获取的待补全拼音缩写,可以根据用户输入的拼音缩写确定。
在本申请的一个实施例中,在获取到用户输入的拼音缩写后,将用户输入的拼音缩写确定为待补全拼音缩写。
在本申请的另一个实施例中,为了便于后续处理,在获取到用户输入的拼音缩写后,对用户输入的拼音缩写进行标准化处理,得到待补全拼音缩写。其中,标准化处理后的拼音缩写即为待补全拼音缩写。
在本申请的一个实施例中,对拼音缩写进行标准化处理,可以为:去除拼音缩写的前缀。例如,拼音缩写为X_SFZH,其中,“X_”为前缀。对X_SFZH进行标准化处理,即为去除前缀“X_”,得到待补全拼音缩写为SFZH。
在本申请的另一个实施例中,对拼音缩写进行标准化处理,可以为:对拼音缩写进行归一化处理。这里,归一化处理可以为:统一同一注释信息对应的拼音缩写的字符大小写。例如SFZH和sfzh的注释信息均为身份证号,则可以将SFZH和sfzh归一为SFZH。
本申请实施例中,还可以结合上面两种标准化方式对拼音缩写进行标准化处理,得到待补全拼音缩写。本申请实施例对此不进行限定。
本申请实施例中,预设前缀树的构建可参看图1-图7所示的实施例。此处不再赘述。
步骤802:将待补全拼音缩写中第一级别的字符作为当前级别的待补全字符,将预设前缀树中第一级别的所有节点作为待补全候选节点。
例如,待补全拼音缩写为ABC,则将ABC中第一级别的字符A确定为当前级别的待补全字符。
如图2所示的前缀树,根节点下包括3个第一级别的节点:节点1、节点2和节点3。此时,可以将节点1、节点2和节点3均确定为待补全候选节点。
步骤803:从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点。
在本申请的一个实施例中,若各个待补全候选节点中不存在值为当前级别的待补全字符的待补全候选节点,则输出提示信息。该提示信息用于指示未确定待补全拼音缩写的注释信息。
仍以步骤802中的例子进行说明。如图2所示,待补全候选节点包括:节点1、节点2和节点3。若当前级别的待补全字符为A,则可以确定节点1为当前待补全节点。若若当前级别的待补全字符为S,则可以确定找不到待补全拼音缩写的注释信息,输入提示信息。
步骤804:判断待补全拼音缩写中的所有字符是否匹配完成。如果否,则执行步骤805。
一种实现方式中,检测待添加拼音缩写中当前级别的待添加字符后是否还有字符。如果有字符,则判定匹配未完成。如果没有字符,则判定匹配完成。
步骤805:将待补全拼音缩写中下一级别的字符作为当前级别的待补全字符,将预设前缀树中当前待补全节点对应的下一级别的所有节点作为待补全候选节点。返回执行步骤803。
例如,当前级别为第一级别。若判断待补全拼音缩写中的所有字符的匹配未完成,则将待添加拼音缩写中第二级别的字符作为当前级别的待添加字符,将预设前缀树中当前待添加节点对应的第二级别的节点作为待添加候选节点。
在本申请的一个实施例中,参考图9所示的注释信息确定方法的第二种流程示意图,基于图8,该方法包括如下步骤。
步骤901:获取待补全拼音缩写。其中,待补全拼音缩写中的各个字符与预设前缀树中的各个级别一一对应,预设前缀树中每一分支的最后一级别的节点的值为注释信息,预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符。
步骤902:将待补全拼音缩写中第一级别的字符作为当前级别的待补全字符,将预设前缀树中第一级别的所有节点作为待补全候选节点。
步骤903:从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点。
步骤904:判断待补全拼音缩写中的所有字符是否匹配完成。如果否,则执行步骤905。如果是,则执行步骤906。
步骤905:将待补全拼音缩写中下一级别的字符作为当前级别的待补全字符,将预设前缀树中当前待补全节点对应的下一级别的所有节点作为待补全候选节点。返回执行步骤903。
步骤901-905与步骤801-805相同,此处步骤赘述。
步骤906:将预设前缀树中当前待补全节点对应的最后一级别的节点的值,确定为待补全拼音缩写的注释信息。
仍以图2所示的前缀树为例。若待补全拼音缩写为ABC,当待补全拼音缩写的所有字符匹配完成时,当前待补全节点为节点7。
如图2所示,节点7对应的最后一级别的节点包括:值为注释信息1的节点14,值为注释信息2的节点17,以及值为注释信息3的节点18。则可以将注释信息1、注释信息2和注释信息3均作为待补全拼音缩写的注释信息。
在本申请的一个实施例中,在确定待补全拼音缩写的注释信息时,当待补全拼音缩写的所有字符匹配完成时,判断预设前缀树中当前待补全节点对应的下一级别的节点中是否存在结束字符节点;结束字符节点的值为表示字符串结束的字符。如果存在结束字符节点,则将结束字符节点对应的最后一级别的节点的值,确定为待补全拼音缩写的注释信息。
仍以图2所示的前缀树为例。若待补全拼音缩写为ABC,当待补全拼音缩写的所有字符匹配完成时,当前待补全节点为节点7。
如图2所示,预设前缀树中,节点7对应的下一级别的节点中,节点10为结束字符节点,则将节点10对应的下一级别的节点,也就是,节点14的值(注释信息1)确定为待补全拼音缩写的注释信息。
在本申请的另一个实施例中,若判定预设前缀树中当前待补全节点对应的下一级别的节点中不存在结束字符节点,则输出提示信息,该提示信息用于指示未确定待补全拼音缩写的注释信息。
在本申请的另一个实施例中,若判定预设前缀树中当前待补全节点对应的下一级别的节点中不存在结束字符节点,则判断目标数量是否大于预设数量阈值;其中,目标数量为所述预设前缀树中当前待补全节点对应的最后一级别的所有节点的数量。
如果目标数量不大于预设数量阈值,则将预设前缀树中当前待补全节点对应的最后一级别的所有节点的值,作为待补全拼音缩写的注释信息。
如果目标数量大于预设数量阈值,则输出提示信息,该提示信息用于指示未确定待补全拼音缩写的注释信息。
仍以图2所示的前缀树为例。若待补全拼音缩写为ABC,当待补全拼音缩写的所有字符匹配完成时,当前待补全节点为节点7。
如图2所示,节点7对应的最后一级别的节点包括:值为注释信息1的节点14,值为注释信息2的节点17,以及值为注释信息3的节点18。此时,注释信息的数量为3。
若预设数量阈值为4,3<4,则将注释信息1、注释信息2和注释信息3均作为待补全拼音缩写的注释信息。用户可以从注释信息1、注释信息2和注释信息3中确定出待补全拼音缩写的注释信息。
若预设数量阈值为2,3>2,则说明确定的注释信息数量过多,用户无法从确定的注释信息,确定出待补全拼音缩写的注释信息,因此,输出提示信息,指示未确定待补全拼音缩写的注释信息。
本申请实施例中,预设有前缀树,前缀树中每一分支的最后一级别的节点的值为注释信息,前缀树中除每一分支的最后一级别的节点外的节点的值为字符。基于前缀树,将待补全拼音缩写的字符划分为多个级别,逐级的查询待补全拼音缩写的字符,进而确定待补全拼音缩写的注释信息。这样就不必逐条查找数据库中包括的对应关系,有效提高了查询效率。另外,基于前缀树确定注释信息,可由电子设备实现,不必人工查询数据库实现,能够在注释信息确定时,降低人工成本。
基于相同的发明构思,根据上述前缀树构建方法,本申请实施例还提供了一种前缀树构建装置。参考图10,图10为本申请实施例提供的前缀树构建装置的第一种结构示意图。该装置包括:
获取单元1001,用于获取待添加拼音缩写,并获取待添加拼音缩写对应的待添加注释信息;待添加拼音缩写中的各个字符与预设前缀树中的各个级别一一对应;预设前缀树中每一分支的最后一级别的节点的值为注释信息,预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符;
第一确定单元1002,用于将待添加拼音缩写中第一级别的字符作为当前级别的待添加字符,将预设前缀树中第一级别的所有节点作为待添加候选节点;
第一判断单元1003,用于判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点;
第一创建单元1004,用于在第一判断单元1003的判断结果为否的情况下,创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点;
第二判断单元1005,用于判断待添加拼音缩写中的所有字符是否匹配完成;
第二确定单元1006,用于在第二判断单元1005的判断结果为否的情况下,将待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将预设前缀树中当前待添加节点对应的下一级别的节点作为待添加候选节点。
在本申请的一个实施例中,获取单元1001,具体可以用于:
获取待处理拼音缩写;
对待处理拼音缩写进行标准化处理,得到待添加拼音缩写。
在本申请的一个实施例中,获取单元1001,具体可以用于:
去除待处理拼音缩写的前缀;和/或对待处理拼音缩写进行归一化处理。
在本申请的一个实施例中,参考图11所示的前缀树构建装置的第二种结构示意图,基于图10,该装置还可以包括:
第二创建单元1007,用于在第二判断单元1005的判断结果为是的情况下,创建值为待添加注释信息、且当前待添加节点对应的最后一级别的节点。
在本申请的一个实施例中,参考图12所示的前缀树构建装置的第三种结构示意图,基于图10,该装置还可以包括:
第三确定单元1008,用于在第一判断单元的判断结果为是的情况下,将值为当前级别的待添加字符的待添加候选节点,确定为当前待添加节点;
第三判断单元1009,用于判断待添加拼音缩写中的所有字符是否匹配完成;
第四确定单元1010,用于在第三判断单元1009的判断结果为否的情况下,将待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将预设前缀树中当前待添加节点对应的下一级别的所有节点作为待添加候选节点;
第四判断单元1011,用于在第三判断单元1009的判断结果为是的情况下,判断预设前缀树中当前待添加节点对应的最后一级别的节点中是否值为待添加注释信息的节点;
第二创建单元1007,还用于在第四判断单元1011的判断结果为是的情况下,创建值为待添加注释信息、且当前待添加节点对应的最后一级别的节点。
在本申请的一个实施例中,第二创建单元1007,具体可以用于:
创建当前待添加节点对应的下一级别的结束字符节点,结束字符节点的值为表示字符串结束的字符;创建值为待添加注释信息、且结束字符节点对应的最后一级别的节点。
本申请实施例中,预先构建前缀树,前缀树中每一分支的最后一级别的节点的值为注释信息,前缀树中除每一分支的最后一级别的节点外的节点的值为字符。这样,就可以基于前缀树将待补全拼音缩写的字符划分为多个级别,逐级的查询待补全拼音缩写的字符,进而确定待补全拼音缩写的注释信息。不必逐条查找数据库中包括的对应关系,有效提高了查询效率。另外,基于前缀树确定注释信息,可由电子设备实现,不必人工查询数据库实现,能够在注释信息确定时,降低人工成本。
基于相同的发明构思,根据上述注释信息确定方法,本申请实施例还提供了一种注释信息确定装置。参考图13,图13为本申请实施例提供的注释信息确定装置的第一种结构示意图。该装置包括:
第一获取单元1301,用于获取待补全拼音缩写;其中,待补全拼音缩写中的各个字符与预设前缀树中的各个级别一一对应,预设前缀树中每一分支的最后一级别的节点的值为注释信息,预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符;
第一确定单元1302,用于将待补全拼音缩写中第一级别的字符作为当前级别的待补全字符,将预设前缀树中第一级别的所有节点作为待补全候选节点;
选择单元1303,用于从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点;
第一判断单元1304,用于判断待补全拼音缩写中的所有字符是否匹配完成;
第二确定单元1305,用于在第一判断单元1304的判断结果为否的情况下,将待补全拼音缩写中下一级别的字符作为当前级别的待补全字符,将预设前缀树中当前待补全节点对应的下一级别的所有节点作为待补全候选节点。
在本申请的一个实施例中,第一获取单元1301,具体可以用于:
获取用户输入的拼音缩写;
对用户输入的拼音缩写进行标准化处理,得到待补全拼音缩写。
在本申请的一个实施例中,第一获取单元1301,具体可以用于:
去除用户输入的拼音缩写的前缀;和/或对用户输入的拼音缩写进行归一化处理。
在本申请的一个实施例中,参考14所示的注释信息确定装置的第二种结构示意图,基于图13,该装置还可以包括:
第三确定单元1306,用于在第一判断单元1304的判断结果为是的情况下,将预设前缀树中当前待补全节点对应的最后一级别的节点的值,确定为待补全拼音缩写的注释信息。
在本申请的一个实施例中,第三确定单元1306,具体可以用于:
判断预设前缀树中当前待补全节点对应的下一级别的节点中是否存在结束字符节点;结束字符节点的值为表示字符串结束的字符;
如果是,则将结束字符节点对应的最后一级别的节点的值,确定为待补全拼音缩写的注释信息。
在本申请的一个实施例中,第三确定单元1306,还可以用于:
若预设前缀树中当前待补全节点对应的下一级别的节点中不存在结束字符节点,则输出提示信息,提示信息用于指示未确定待补全拼音缩写的注释信息。
在本申请的一个实施例中,第三确定单元1306,还可以用于:
若预设前缀树中当前待补全节点对应的下一级别的节点中不存在结束字符节点,则判断目标数量是否大于预设数量阈值;目标数量为预设前缀树中当前待补全节点对应的最后一级别的节点的数量;
如果否,则将预设前缀树中当前待补全节点对应的最后一级别的节点的值,作为待补全拼音缩写的注释信息;
如果是,则输出提示信息,提示信息用于指示未确定待补全拼音缩写的注释信息。
在本申请的一个实施例中,上述注释信息确定装置还可以包括:输出单元,用于若各个待补全候选节点中不存在值为当前级别的待补全字符的待补全候选节点,则输出提示信息,该提示信息用于指示未确定待补全拼音缩写的注释信息。
在本申请的一个实施例中,上述注释信息确定装置还可以包括:
第二获取单元,用于获取待添加拼音缩写,并获取待添加拼音缩写对应的待添加注释信息;待添加拼音缩写中的各个字符与预设前缀树中的各个级别一一对应;
第四确定单元,用于将待添加拼音缩写中第一级别的字符作为当前级别的待添加字符,将预设前缀树中第一级别的所有节点作为待添加候选节点;
第二判断单元,用于判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点;
第一创建单元,用于在第二判断单元的判断结果为否的情况下,创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点;
第三判断单元,用于判断待添加拼音缩写中的所有字符是否匹配完成;
第五确定单元,用于在第三判断单元的判断结果为否的情况下,将待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将预设前缀树中当前待添加节点对应的下一级别的节点作为待添加候选节点;
第二创建单元,用于在第三判断单元的判断结果为是的情况下,创建值为待添加注释信息、且当前待添加节点对应的最后一级别的节点。
在本申请的一个实施例中,上述注释信息确定装置还可以包括:
第六确定单元,用于在第二判断单元的判断结果为是的情况下,将值为当前级别的待添加字符的待添加候选节点,确定为当前待添加节点;
第四判断单元,用于判断待添加拼音缩写中的所有字符是否匹配完成;
第七确定单元,用于在第四判断单元的判断结果为否的情况下,将待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将预设前缀树中当前待添加节点对应的下一级别的所有节点作为待添加候选节点;
第五判断单元,用于在第四判断单元的判断结果为是的情况下,判断预设前缀树中当前待添加节点对应的最后一级别的节点中是否值为待添加注释信息的节点;
第二创建单元,还用于在第五判断单元的判断结果为是的情况下,创建值为待添加注释信息、且当前待添加节点对应的最后一级别的节点。
在本申请的一个实施例中,第二创建单元,具体可以用于:
创建当前待添加节点对应的下一级别的结束字符节点,结束字符节点的值为表示字符串结束的字符;创建值为待添加注释信息、且结束字符节点对应的最后一级别的节点。
本申请实施例中,预设有前缀树,前缀树中每一分支的最后一级别的节点的值为注释信息,前缀树中除每一分支的最后一级别的节点外的节点的值为字符。基于前缀树,将待补全拼音缩写的字符划分为多个级别,逐级的查询待补全拼音缩写的字符,进而确定待补全拼音缩写的注释信息。这样就不必逐条查找数据库中包括的对应关系,有效提高了查询效率。另外,基于前缀树确定注释信息,可由电子设备实现,不必人工查询数据库实现,能够在注释信息确定时,降低人工成本。
基于相同的发明构思,根据上述前缀树构建方法,本申请实施例还提供了一种电子设备,如图15所示,包括处理器1501和存储器1502。
其中,存储器1502,用于存放计算机程序;
处理器1501,用于执行存储器1502上所存放的计算机程序时,实现如下步骤:
获取待添加拼音缩写,并获取待添加拼音缩写对应的待添加注释信息;待添加拼音缩写中的各个字符与预设前缀树中的各个级别一一对应;预设前缀树中每一分支的最后一级别的节点的值为注释信息,预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符;
将待添加拼音缩写中第一级别的字符作为当前级别的待添加字符,将预设前缀树中第一级别的所有节点作为待添加候选节点;
判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点;
如果不存在值为当前级别的待添加字符的待添加候选节点,则创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点;
判断待添加拼音缩写中的所有字符是否匹配完成;
如果匹配未完成,则将待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将预设前缀树中当前待添加节点对应的下一级别的节点作为待添加候选节点,返回执行创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点的步骤。
本申请实施例中,预先构建前缀树,前缀树中每一分支的最后一级别的节点的值为注释信息,前缀树中除每一分支的最后一级别的节点外的节点的值为字符。这样,就可以基于前缀树将待补全拼音缩写的字符划分为多个级别,逐级的查询待补全拼音缩写的字符,进而确定待补全拼音缩写的注释信息。不必逐条查找数据库中包括的对应关系,有效提高了查询效率。另外,基于前缀树确定注释信息,可由电子设备实现,不必人工查询数据库实现,能够在注释信息确定时,降低人工成本。
基于相同的发明构思,根据上述注释信息确定方法,本申请实施例还提供了一种电子设备,如图16所示,包括处理器1601和存储器1602。
其中,存储器1602,用于存放计算机程序;
处理器1601,用于执行存储器1602上所存放的计算机程序时,实现如下步骤:
获取待补全拼音缩写;其中,待补全拼音缩写中的各个字符与预设前缀树中的各个级别一一对应,预设前缀树中每一分支的最后一级别的节点的值为注释信息,预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符;
将待补全拼音缩写中第一级别的字符作为当前级别的待补全字符,将预设前缀树中第一级别的所有节点作为待补全候选节点;
从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点;
判断待补全拼音缩写中的所有字符是否匹配完成;
如果否,则将待补全拼音缩写中下一级别的字符作为当前级别的待补全字符,将预设前缀树中当前待补全节点对应的下一级别的所有节点作为待补全候选节点,返回执行从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点的步骤。
本申请实施例中,预设有前缀树,前缀树中每一分支的最后一级别的节点的值为注释信息,前缀树中除每一分支的最后一级别的节点外的节点的值为字符。基于前缀树,将待补全拼音缩写的字符划分为多个级别,逐级的查询待补全拼音缩写的字符,进而确定待补全拼音缩写的注释信息。这样就不必逐条查找数据库中包括的对应关系,有效提高了查询效率。另外,基于前缀树确定注释信息,可由电子设备实现,不必人工查询数据库实现,能够在注释信息确定时,降低人工成本。
上述存储器可包括RAM(Random Access Memory,随机存取存储器),也可以包括NVM(Non-Volatile Memory,非易失性存储器),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可是通用处理器,包括CPU(Central Processing Unit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(Digital Signal Processing,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
基于相同的发明构思,根据上述前缀树构建方法,本申请实施例还提供了一种机器可读存储介质,机器可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一前缀树构建方法实施例。
基于相同的发明构思,根据上述注释信息确定方法,本申请实施例还提供了一种机器可读存储介质,机器可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一注释信息确定方法实施例。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于注释信息确定装置、前缀树构建装置、电子设备和机器可读存储介质实施例而言,由于其基本相似于注释信息确定方法好前缀树构建方法实施例,所以描述的比较简单,相关之处参见注释信息确定方法好前缀树构建方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。

Claims (34)

1.一种注释信息确定方法,其特征在于,所述方法包括:
获取待补全拼音缩写;其中,所述待补全拼音缩写中的各个字符与预设前缀树中的各个级别一一对应,所述预设前缀树中每一分支的最后一级别的节点的值为注释信息,所述预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符;
将所述待补全拼音缩写中第一级别的字符作为当前级别的待补全字符,将所述预设前缀树中第一级别的所有节点作为待补全候选节点;
从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点;
判断所述待补全拼音缩写中的所有字符是否匹配完成;
如果否,则将所述待补全拼音缩写中下一级别的字符作为当前级别的待补全字符,将所述预设前缀树中当前待补全节点对应的下一级别的所有节点作为待补全候选节点,返回执行所述从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点的步骤。
2.根据权利要求1所述的方法,其特征在于,所述获取待补全拼音缩写的步骤,包括:
获取用户输入的拼音缩写;
对所述用户输入的拼音缩写进行标准化处理,得到待补全拼音缩写。
3.根据权利要求2所述的方法,其特征在于,所述对所述用户输入的拼音缩写进行标准化处理的步骤,包括:
去除所述用户输入的拼音缩写的前缀;和/或
对所述用户输入的拼音缩写进行归一化处理。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若判定所述待补全拼音缩写中的所有字符匹配完成,则将所述预设前缀树中当前待补全节点对应的最后一级别的节点的值,确定为所述待补全拼音缩写的注释信息。
5.根据权利要求4所述的方法,其特征在于,所述将所述预设前缀树中当前待补全节点对应的最后一级别的节点的值,确定为所述待补全拼音缩写的注释信息的步骤,包括:
判断所述预设前缀树中当前待补全节点对应的下一级别的节点中是否存在结束字符节点;所述结束字符节点的值为表示字符串结束的字符;
如果是,则将所述结束字符节点对应的最后一级别的节点的值,确定为所述待补全拼音缩写的注释信息。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若所述预设前缀树中当前待补全节点对应的下一级别的节点中不存在结束字符节点,则输出提示信息,所述提示信息用于指示未确定所述待补全拼音缩写的注释信息。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若所述预设前缀树中当前待补全节点对应的下一级别的节点中不存在结束字符节点,则判断目标数量是否大于预设数量阈值;所述目标数量为所述预设前缀树中当前待补全节点对应的最后一级别的节点的数量;
如果否,则将所述预设前缀树中当前待补全节点对应的最后一级别的节点的值,作为所述待补全拼音缩写的注释信息;
如果是,则输出提示信息,所述提示信息用于指示未确定所述待补全拼音缩写的注释信息。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若各个待补全候选节点中不存在值为当前级别的待补全字符的待补全候选节点,则输出提示信息,所述提示信息用于指示未确定所述待补全拼音缩写的注释信息。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取待添加拼音缩写,并获取所述待添加拼音缩写对应的待添加注释信息;所述待添加拼音缩写中的各个字符与所述预设前缀树中的各个级别一一对应;
将所述待添加拼音缩写中第一级别的字符作为当前级别的待添加字符,将所述预设前缀树中第一级别的所有节点作为待添加候选节点;
判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点;
如果不存在值为当前级别的待添加字符的待添加候选节点,则创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点;
判断所述待添加拼音缩写中的所有字符是否匹配完成;
如果匹配未完成,则将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的节点作为待添加候选节点,返回执行所述创建值为当前级别的待添加字符、且级别为当前级别的待添加候选节点,作为当前待添加节点的步骤;
如果匹配完成,则创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
如果存在值为当前级别的待添加字符的待添加候选节点,则将值为当前级别的待添加字符的待添加候选节点,确定为当前待添加节点;
判断所述待添加拼音缩写中的所有字符是否匹配完成;
如果匹配未完成,则将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的所有节点作为待添加候选节点,返回执行所述判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点的步骤;
如果匹配完成,则判断所述预设前缀树中当前待添加节点对应的最后一级别的节点中是否值为所述待添加注释信息的节点;
如果不存在值为所述待添加注释信息的节点,则创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点。
11.根据权利要求9或10所述的方法,其特征在于,所述创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点的步骤,包括:
创建当前待添加节点对应的下一级别的结束字符节点;所述结束字符节点的值为表示字符串结束的字符;
创建值为所述待添加注释信息、且所述结束字符节点对应的最后一级别的节点。
12.一种前缀树构建方法,其特征在于,所述方法包括:
获取待添加拼音缩写,并获取所述待添加拼音缩写对应的待添加注释信息;所述待添加拼音缩写中的各个字符与预设前缀树中的各个级别一一对应;所述预设前缀树中每一分支的最后一级别的节点的值为注释信息,所述预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符;
将所述待添加拼音缩写中第一级别的字符作为当前级别的待添加字符,将所述预设前缀树中第一级别的所有节点作为待添加候选节点;
判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点;
如果不存在值为当前级别的待添加字符的待添加候选节点,则创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点;
判断所述待添加拼音缩写中的所有字符是否匹配完成;
如果匹配未完成,则将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的节点作为待添加候选节点,返回执行所述创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点的步骤。
13.根据权利要求12所述的方法,其特征在于,所述获取待添加拼音缩写的步骤,包括:
获取待处理拼音缩写;
对所述待处理拼音缩写进行标准化处理,得到待添加拼音缩写。
14.根据权利要求13所述的方法,其特征在于,所述对所述待处理拼音缩写进行标准化处理的步骤,包括:
去除所述待处理拼音缩写的前缀;和/或
对所述待处理拼音缩写进行归一化处理。
15.根据权利要求12所述的方法,其特征在于,所述方法还包括:
若判定所述待添加拼音缩写中的所有字符匹配完成,则创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点。
16.根据权利要求12所述的方法,其特征在于,所述方法还包括:
如果存在值为当前级别的待添加字符的待添加候选节点,则将值为当前级别的待添加字符的待添加候选节点,确定为当前待添加节点;
判断所述待添加拼音缩写中的所有字符是否匹配完成;
如果匹配未完成,则将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的所有节点作为待添加候选节点,返回执行所述判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点的步骤;
如果匹配完成,则判断所述预设前缀树中当前节点对应的最后一级别的节点中是否值为所述待添加注释信息的节点;
如果不存在值为所述待添加注释信息的节点,则创建值为所述待添加注释信息、且当前节点对应的最后一级别的节点。
17.根据权利要求15或16所述的方法,其特征在于,所述创建值为所述待添加注释信息、且当前节点对应的最后一级别的节点的步骤,包括:
创建当前待添加节点对应的下一级别的结束字符节点;所述结束字符节点的值为表示字符串结束的字符;
创建值为所述待添加注释信息、且所述结束字符节点对应的最后一级别的节点。
18.一种注释信息确定装置,其特征在于,所述装置包括:
第一获取单元,用于获取待补全拼音缩写;其中,所述待补全拼音缩写中的各个字符与预设前缀树中的各个级别一一对应,所述预设前缀树中每一分支的最后一级别的节点的值为注释信息,所述预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符;
第一确定单元,用于将所述待补全拼音缩写中第一级别的字符作为当前级别的待补全字符,将所述预设前缀树中第一级别的所有节点作为待补全候选节点;
选择单元,用于从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点;
第一判断单元,用于判断所述待补全拼音缩写中的所有字符是否匹配完成;
第二确定单元,用于在所述第一判断单元的判断结果为否的情况下,将所述待补全拼音缩写中下一级别的字符作为当前级别的待补全字符,将所述预设前缀树中当前待补全节点对应的下一级别的所有节点作为待补全候选节点。
19.根据权利要求18所述的装置,其特征在于,所述第一获取单元,具体用于:
获取用户输入的拼音缩写;
对所述用户输入的拼音缩写进行标准化处理,得到待补全拼音缩写。
20.根据权利要求19所述的装置,其特征在于,所述第一获取单元,具体用于:
去除所述用户输入的拼音缩写的前缀;和/或对所述用户输入的拼音缩写进行归一化处理。
21.根据权利要求18所述的装置,其特征在于,所述装置还包括:
第三确定单元,用于在所述第一判断单元的判断结果为是的情况下,将所述预设前缀树中当前待补全节点对应的最后一级别的节点的值,确定为所述待补全拼音缩写的注释信息。
22.根据权利要求21所述的装置,其特征在于,所述第三确定单元,具体用于:
判断所述预设前缀树中当前待补全节点对应的下一级别的节点中是否存在结束字符节点;所述结束字符节点的值为表示字符串结束的字符;
如果是,则将所述结束字符节点对应的最后一级别的节点的值,确定为所述待补全拼音缩写的注释信息。
23.根据权利要求22所述的装置,其特征在于,所述第三确定单元,还用于:
若所述预设前缀树中当前待补全节点对应的下一级别的节点中不存在结束字符节点,则输出提示信息,所述提示信息用于指示未确定所述待补全拼音缩写的注释信息。
24.根据权利要求22所述的装置,其特征在于,所述第三确定单元,还用于:
若所述预设前缀树中当前待补全节点对应的下一级别的节点中不存在结束字符节点,则判断目标数量是否大于预设数量阈值;所述目标数量为所述预设前缀树中当前待补全节点对应的最后一级别的节点的数量;
如果否,则将所述预设前缀树中当前待补全节点对应的最后一级别的节点的值,作为所述待补全拼音缩写的注释信息;
如果是,则输出提示信息,所述提示信息用于指示未确定所述待补全拼音缩写的注释信息。
25.根据权利要求18所述的装置,其特征在于,所述装置还包括:输出单元,用于若各个待补全候选节点中不存在值为当前级别的待补全字符的待补全候选节点,则输出提示信息,所述提示信息用于指示未确定所述待补全拼音缩写的注释信息。
26.根据权利要求18所述的装置,其特征在于,所述装置还包括:
第二获取单元,用于获取待添加拼音缩写,并获取所述待添加拼音缩写对应的待添加注释信息;所述待添加拼音缩写中的各个字符与所述预设前缀树中的各个级别一一对应;
第四确定单元,用于将所述待添加拼音缩写中第一级别的字符作为当前级别的待添加字符,将所述预设前缀树中第一级别的所有节点作为待添加候选节点;
第二判断单元,用于判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点;
第一创建单元,用于在所述第二判断单元的判断结果为否的情况下,创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点;
第三判断单元,用于判断所述待添加拼音缩写中的所有字符是否匹配完成;
第五确定单元,用于在所述第三判断单元的判断结果为否的情况下,将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的节点作为待添加候选节点;
第二创建单元,用于在所述第三判断单元的判断结果为是的情况下,创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点。
27.根据权利要求26所述的装置,其特征在于,所述装置还包括:
第六确定单元,用于在所述第二判断单元的判断结果为是的情况下,将值为当前级别的待添加字符的待添加候选节点,确定为当前待添加节点;
第四判断单元,用于判断所述待添加拼音缩写中的所有字符是否匹配完成;
第七确定单元,用于在所述第四判断单元的判断结果为否的情况下,将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的所有节点作为待添加候选节点;
第五判断单元,用于在所述第四判断单元的判断结果为是的情况下,判断所述预设前缀树中当前待添加节点对应的最后一级别的节点中是否值为所述待添加注释信息的节点;
所述第二创建单元,还用于在所述第五判断单元的判断结果为是的情况下,创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点。
28.根据权利要求26或27所述的装置,其特征在于,所述第二创建单元,具体用于:
创建当前待添加节点对应的下一级别的结束字符节点,所述结束字符节点的值为表示字符串结束的字符;创建值为所述待添加注释信息、且所述结束字符节点对应的最后一级别的节点。
29.一种前缀树构建装置,其特征在于,所述装置包括:
获取单元,用于获取待添加拼音缩写,并获取所述待添加拼音缩写对应的待添加注释信息;所述待添加拼音缩写中的各个字符与预设前缀树中的各个级别一一对应;所述预设前缀树中每一分支的最后一级别的节点的值为注释信息,所述预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符;
第一确定单元,用于将所述待添加拼音缩写中第一级别的字符作为当前级别的待添加字符,将所述预设前缀树中第一级别的所有节点作为待添加候选节点;
第一判断单元,用于判断各个待添加候选节点中是否存在值为当前级别的待添加字符的待添加候选节点;
第一创建单元,用于在所述第一判断单元的判断结果为否的情况下,创建值为当前级别的待添加字符的待添加候选节点,作为当前待添加节点;
第二判断单元,用于判断所述待添加拼音缩写中的所有字符是否匹配完成;
第二确定单元,用于在所述第二判断单元的判断结果为否的情况下,将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的节点作为待添加候选节点。
30.根据权利要求29所述的装置,其特征在于,所述获取单元,具体用于:
获取待处理拼音缩写;
对所述待处理拼音缩写进行标准化处理,得到待添加拼音缩写。
31.根据权利要求30所述的装置,其特征在于,所述获取单元,具体用于:
去除所述待处理拼音缩写的前缀;和/或对所述待处理拼音缩写进行归一化处理。
32.根据权利要求29所述的装置,其特征在于,所述装置还包括:
第二创建单元,用于在所述第二判断单元的判断结果为是的情况下,创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点。
33.根据权利要求29所述的装置,其特征在于,所述装置还包括:
第三确定单元,用于在所述第一判断单元的判断结果为是的情况下,将值为当前级别的待添加字符的待添加候选节点,确定为当前待添加节点;
第三判断单元,用于判断所述待添加拼音缩写中的所有字符是否匹配完成;
第四确定单元,用于在所述第三判断单元的判断结果为否的情况下,将所述待添加拼音缩写中下一级别的字符作为当前级别的待添加字符,将所述预设前缀树中当前待添加节点对应的下一级别的所有节点作为待添加候选节点;
第四判断单元,用于在所述第三判断单元的判断结果为是的情况下,判断所述预设前缀树中当前待添加节点对应的最后一级别的节点中是否值为所述待添加注释信息的节点;
第二创建单元,用于在所述第四判断单元的判断结果为是的情况下,创建值为所述待添加注释信息、且当前待添加节点对应的最后一级别的节点。
34.根据权利要求32或33所述的装置,其特征在于,所述第二创建单元,具体用于:
创建当前待添加节点对应的下一级别的结束字符节点,所述结束字符节点的值为表示字符串结束的字符;创建值为所述待添加注释信息、且所述结束字符节点对应的最后一级别的节点。
CN201810500276.4A 2018-05-23 2018-05-23 一种注释信息确定、前缀树构建方法及装置 Pending CN110597800A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810500276.4A CN110597800A (zh) 2018-05-23 2018-05-23 一种注释信息确定、前缀树构建方法及装置
PCT/CN2019/087223 WO2019223597A1 (zh) 2018-05-23 2019-05-16 一种注释信息确定、前缀树构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810500276.4A CN110597800A (zh) 2018-05-23 2018-05-23 一种注释信息确定、前缀树构建方法及装置

Publications (1)

Publication Number Publication Date
CN110597800A true CN110597800A (zh) 2019-12-20

Family

ID=68616189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810500276.4A Pending CN110597800A (zh) 2018-05-23 2018-05-23 一种注释信息确定、前缀树构建方法及装置

Country Status (2)

Country Link
CN (1) CN110597800A (zh)
WO (1) WO2019223597A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111275122A (zh) * 2020-02-03 2020-06-12 腾讯医疗健康(深圳)有限公司 标签标注方法、装置、设备及可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1889080A (zh) * 2006-07-31 2007-01-03 浙江大学 一种用于检索字符串的方法
CN101075262A (zh) * 2007-06-12 2007-11-21 腾讯科技(深圳)有限公司 一种计算机汉字输入方法及系统
CN101727271A (zh) * 2008-10-22 2010-06-09 北京搜狗科技发展有限公司 一种提供纠错提示的方法、装置及输入法系统
US20110055233A1 (en) * 2009-08-25 2011-03-03 Lutz Weber Methods, Computer Systems, Software and Storage Media for Handling Many Data Elements for Search and Annotation
CN103383699A (zh) * 2013-06-28 2013-11-06 安徽科大讯飞信息科技股份有限公司 字符串检索方法及系统
CN103823814A (zh) * 2012-11-19 2014-05-28 腾讯科技(深圳)有限公司 一种信息处理方法及装置
CN104268157A (zh) * 2014-09-03 2015-01-07 乐视网信息技术(北京)股份有限公司 一种数据搜索中的纠错装置及其方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU631276B2 (en) * 1989-12-22 1992-11-19 Bull Hn Information Systems Inc. Name resolution in a directory database
CN101593179B (zh) * 2008-05-26 2011-08-10 国际商业机器公司 文档搜索方法和装置及文档处理器
CN101930435B (zh) * 2009-10-27 2013-03-20 深圳市北科瑞声科技有限公司 机构名称检索方法及系统
CN106528835B (zh) * 2016-11-18 2019-12-20 百度在线网络技术(北京)有限公司 信息获取方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1889080A (zh) * 2006-07-31 2007-01-03 浙江大学 一种用于检索字符串的方法
CN101075262A (zh) * 2007-06-12 2007-11-21 腾讯科技(深圳)有限公司 一种计算机汉字输入方法及系统
CN101727271A (zh) * 2008-10-22 2010-06-09 北京搜狗科技发展有限公司 一种提供纠错提示的方法、装置及输入法系统
US20110055233A1 (en) * 2009-08-25 2011-03-03 Lutz Weber Methods, Computer Systems, Software and Storage Media for Handling Many Data Elements for Search and Annotation
CN103823814A (zh) * 2012-11-19 2014-05-28 腾讯科技(深圳)有限公司 一种信息处理方法及装置
CN103383699A (zh) * 2013-06-28 2013-11-06 安徽科大讯飞信息科技股份有限公司 字符串检索方法及系统
CN104268157A (zh) * 2014-09-03 2015-01-07 乐视网信息技术(北京)股份有限公司 一种数据搜索中的纠错装置及其方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111275122A (zh) * 2020-02-03 2020-06-12 腾讯医疗健康(深圳)有限公司 标签标注方法、装置、设备及可读存储介质
CN111275122B (zh) * 2020-02-03 2023-08-11 腾讯医疗健康(深圳)有限公司 标签标注方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
WO2019223597A1 (zh) 2019-11-28

Similar Documents

Publication Publication Date Title
US10783171B2 (en) Address search method and device
CN107590214B (zh) 搜索关键词的推荐方法、装置及电子设备
US10705748B2 (en) Method and device for file name identification and file cleaning
CN109948122B (zh) 输入文本的纠错方法、装置及电子设备
CN109582155B (zh) 输入联想词的推荐方法、装置、存储介质及电子设备
CN105404625A (zh) 应用程序的查找方法与系统
US20190005057A1 (en) Methods and Devices for File Folder Path Identification and File Folder Cleaning
CN109086348B (zh) 超链接的处理方法和装置及存储介质
KR20170141246A (ko) 대상 검색 방법, 장치 및 서버
CN108399125B (zh) 自动化测试方法、装置、计算机设备和存储介质
CN110895533B (zh) 一种表单映射方法、装置、计算机设备和存储介质
CN111563199A (zh) 一种数据处理方法及装置
CN113961768A (zh) 敏感词检测方法、装置、计算机设备和存储介质
CN110597800A (zh) 一种注释信息确定、前缀树构建方法及装置
CN106844406B (zh) 检索方法和检索装置
CN116418705A (zh) 基于机器学习的网络资产识别方法、系统、终端及介质
CN110598115A (zh) 一种基于人工智能多引擎的敏感网页识别方法及系统
CN104850608A (zh) 在信息展示页面上检索关键字的方法
CN112131435B (zh) 超级节点确定方法、装置、电子设备和存储介质
CN110674330B (zh) 表情管理的方法、装置、电子设备及存储介质
CN115309968A (zh) 一种基于资源搜索引擎生成网页指纹规则的方法、装置
CN110990611B (zh) 图片缓存方法、装置、电子设备及存储介质
CN108304433B (zh) 一种数据搜索方法及其设备、存储介质、服务器
CN109635175B (zh) 页面数据拼接方法、装置、可读存储介质和电子设备
CN110941765A (zh) 搜索意图识别方法、信息搜索方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination