CN109635075A - 一种文本内容划词标识的方法及装置 - Google Patents

一种文本内容划词标识的方法及装置 Download PDF

Info

Publication number
CN109635075A
CN109635075A CN201811516013.9A CN201811516013A CN109635075A CN 109635075 A CN109635075 A CN 109635075A CN 201811516013 A CN201811516013 A CN 201811516013A CN 109635075 A CN109635075 A CN 109635075A
Authority
CN
China
Prior art keywords
content
dimension
label
user
matching result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811516013.9A
Other languages
English (en)
Other versions
CN109635075B (zh
Inventor
成洪山
吴忠辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GUANGZHOU CCM INFORMATION SCIENCE AND Tech CO Ltd
Original Assignee
GUANGZHOU CCM INFORMATION SCIENCE AND Tech CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GUANGZHOU CCM INFORMATION SCIENCE AND Tech CO Ltd filed Critical GUANGZHOU CCM INFORMATION SCIENCE AND Tech CO Ltd
Priority to CN201811516013.9A priority Critical patent/CN109635075B/zh
Publication of CN109635075A publication Critical patent/CN109635075A/zh
Application granted granted Critical
Publication of CN109635075B publication Critical patent/CN109635075B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures

Abstract

本发明公开了一种文本内容划词标识的方法及装置,所述方法包括:识别鼠标手势;在预定义库中查询与所述鼠标手势对应的维度,并确定与所述维度对应的目标表和匹配方法;将所述鼠标手势所选定的字符串作为关键词,在所述目标表中使用所述匹配方法,对所述关键词进行匹配,并将匹配结果呈现给用户;根据选定的匹配结果,生成标签,并将所述标签存入用户页面缓存区;重复上述步骤,直至响应用户的保存指令,将所述用户页面缓存区的所有标签插入到数据库表中,作为文本内容的标识数据。本发明能够提高内容文本人工标识的速度和准确率。

Description

一种文本内容划词标识的方法及装置
技术领域
本发明涉及资源共享技术领域,尤其涉及一种文本内容划词标识的方法及装置。
背景技术
内容标识又称内容标引,即给内容添加关键字标签或分类标签,是内容检索、分类基础。总体来说,内容标识分为人工标识、计算机自动标识、计算机辅助标识(推荐标识,让人工进一步选择确认)。
近年来,随着自然语言处理技术的发展,文本内容的计算机自动标识技术取得了长足的进步,在通用领域如财经、体育有着较高的准确度。但在许多应用场景、特别是垂直行业领域,依然是人工标识的方法。
手势的应用在移动设备上应用较多,但基本都是对应预设的指令,比如翻页、解锁,切换等动作。
鼠标手势(按住鼠标左键或右键,移动鼠标形成轨迹)应用相对较少,但也全都是对应指定的动作。划词功能在搜索上应用较多,但在内容标识上未见报道。
现有技术中,自动标识系统在垂直行业的应用有以下难点:
1.准确度不高,无法满足企业高标准的需求。
2.第三方开放平台无法满足企业的个性化需求。
垂直行业领域,需要建立专门的行业本体,并需求大量的行业语料做样本训练,才可以做关键词提取、内容分类。腾讯、阿里、百度到那个第三方NLP(自然语言处理)类开放平台虽然可以对普通内容(财经、体育等)进行关键词提取,但这些企业作为通用性开放平台,没有强大的市场需求和预期收益(不是单个企业能承受的),是不会做就某些垂直行业建行业本体和语料库。
应用第三方开发平台提取的关键词无法与企业应用系统直接关联(比如提取的关键词是A,企业想要的是数据库定义的A的近义词A’)。
3.企业应用自动标识系统的结果后无法将修正的内容反馈到第三方平台,以便下一次得到更准确的标识。
4.定制化部署的内容自动标识系统成本高,技术门槛高,实施周期长,中小型企业无法承受。
常规人工标识需要人工手动选择分类属性,输入关键词,效率低。
发明内容
本发明实施例所要解决的技术问题在于,提供一种文本内容划词标识的方法及装置,能够提高内容文本人工标识的速度和准确率,且技术成本低。
为解决上述问题,本发明的一个实施例提供的一种文本内容划词标识的方法,适于在计算设备中执行,至少包括如下步骤:
识别鼠标手势;
在预定义库中查询与所述鼠标手势对应的维度,并确定与所述维度对应的目标表和匹配方法;
将所述鼠标手势所选定的字符串作为关键词,在所述目标表中使用所述匹配方法,对所述关键词进行匹配,并将匹配结果呈现给用户;
根据选定的匹配结果,生成标签,并将所述标签存入用户页面缓存区;
重复上述步骤,直至响应用户的保存指令,将所述用户页面缓存区的所有标签插入到数据库表中,作为文本内容的标识数据。
进一步地,当用户只选定匹配结果时,所述标签为二元组标签,包括维度和属性值;当用户同时选定匹配结果和关联度时,所述标签为三元组标签,包括维度、属性值和关联度。
进一步地,所述的文本内容划词标识的方法,在识别鼠标手势之前,还包括:
预定义鼠标手势和维度的关系,以及维度与目标表和匹配方法的关系。
进一步地,所述鼠标手势为以选定文本内容中的部分连续字符串区域为起始位置,划词的移动轨迹。
进一步地,所述的文本内容划词标识的方法,在所述将所述鼠标手势所选定的字符串作为关键词,在所述目标表中使用所述匹配方法,对所述关键词进行匹配,并将匹配结果呈现给用户之后,还包括:
当所述匹配结果为两个及以上时,根据用户选定的匹配结果获取数据表中对应的ID;
当所述匹配结果为一个时,直接选定该匹配结果,并获取数据表中对应的ID。
进一步地,所述标识数据的标签记录表包括内容ID、维度ID、属性值ID、属性值和关联度;当匹配结果为空时,所述属性值ID为空。
本发明的另一个实施例还提供了一种文本内容划词标识的装置,包括:
识别模块,用于识别鼠标手势;
查询模块,用于在预定义库中查询与所述鼠标手势对应的维度,并确定与所述维度对应的目标表和匹配方法;
匹配模块,用于将所述鼠标手势所选定的字符串作为关键词,在所述目标表中使用所述匹配方法,对所述关键词进行匹配,并将匹配结果呈现给用户;
标签生成模块,根据选定的匹配结果,生成标签,并将所述标签存入用户页面缓存区;
存储模块,用于重复上述步骤,直至响应用户的保存指令,将所述用户页面缓存区的所有标签插入到数据库表中,作为文本内容的标识数据。
进一步地,当用户只选定匹配结果时,所述标签为二元组标签,包括维度和属性值;当用户同时选定匹配结果和关联度时,所述标签为三元组标签,包括维度、属性值和关联度;所述鼠标手势为以选定文本内容中的部分连续字符串区域为起始位置,划词的移动轨迹。
进一步地,所述的文本内容划词标识的装置,还包括:
预定义模块,用于预定义鼠标手势和维度的关系,以及维度与目标表和匹配方法的关系。
进一步地,所述的文本内容划词标识的装置,在所述将所述鼠标手势所选定的字符串作为关键词,在所述目标表中使用所述匹配方法,对所述关键词进行匹配,并将匹配结果呈现给用户之后,还包括:
当所述匹配结果为两个及以上时,根据用户选定的匹配结果获取数据表中对应的ID;
当所述匹配结果为一个时,直接选定该匹配结果,并获取数据表中对应的ID。
本发明实施例提供的一种文本内容划词标识的方法及装置,技术成本低,通过预先定义鼠标手势与标识维度的关系;维度与目标表、匹配方法的关系,然后选定关键词后的划词鼠标手势的操作为,以选定的字符串为关键词,从鼠标手势对应的表中去搜索匹配此关键词,即此过程完成了关键词输入、维度表(属性类别)选择的过程,从而能够提高内容文本人工标识的速度和准确率,满足企业高标准的需求和个性化需求。
附图说明
图1是本发明的一个实施例提供的一种文本内容划词标识的方法的流程示意图;
图2是本发明的一个实施例提供的一种文本内容划词标识的方法的另一流程示意图;
图3是本发明的一个实施例提供的标识数据的标签记录表;
图4是本发明的一个实施例提供的一种文本内容划词标识的装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当说明的是,实施例各个步骤前的序号仅是为了方便说明,不应当视为对各个步骤执行顺序的限定。
第一方面,请参阅图1-3。
本发明的一个实施例提供的一种文本内容划词标识的方法,适于在计算设备中执行,至少包括如下步骤:
S1、识别鼠标手势。
其中,所述鼠标手势为以选定文本内容中的部分连续字符串区域为起始位置,划词的移动轨迹。
即,用鼠标选定文本内容中的部分连续字符串,以选定字符串区域为起始位置,按住鼠标(左键或右键,预先定义)移动鼠标形成的轨迹(屏幕上显示此轨迹便于用户区别)。
在识别鼠标手势之前,还包括:预定义鼠标手势和维度的关系,以及维度与目标表和匹配方法的关系。
具体的,定义鼠标手势与维度(属性类别)的关系(鼠标手势维度关系表),定义每个维度对应标签值(属性值)所在的目标表、字符的匹配方法。其中,匹配方法如首字匹配,中间开始匹配,完全匹配,区分大小写,中文拼音匹配、输入多少字符以内不匹配(为了性能)等。
S2、在预定义库中查询与所述鼠标手势对应的维度,并确定与所述维度对应的目标表和匹配方法。
在具体的实施例当中,系统将划词移动的鼠标轨迹与定义的鼠标手势维度关系表进行匹配,取得对应的维度(属性类别),确定待搜索的目标表和搜索/匹配方法。需要说明的是,维度值就是目标表名。搜索的目的是为了确认关键词在预定义库中的ID,便于不同内容间数据关联。
S3、将所述鼠标手势所选定的字符串作为关键词,在所述目标表中使用所述匹配方法,对所述关键词进行匹配,并将匹配结果呈现给用户。
当所述匹配结果为两个及以上时,根据用户选定的匹配结果获取数据表中对应的ID;当所述匹配结果为一个时,直接选定该匹配结果,并获取数据表中对应的ID。
在具体的实施例当中,为了更好的标识内容,也为了便于不同内容之间的相互关联,内容需要在不同的维度(属性类别)进行标识,而这些维度的属性值有数据表进行维护。不同维度及为维度属性值可以用一个二元组<A,V>表示,如<“行业”,“磷化工”>、<“行业”,“农业”>、<“产品”,“钛白粉”>、<“产品”,“汽车”>、<“企业”,“浙江新安化工集团股份有限公司”>、<“企业”,“南通江山农药股份有限公司”>。当然,为了便于管理,这些维度、维度属性值都是数据库(预定义库)预先定义并独立维护的,内容标识存储的是这些维度、维度属性值的ID。
其中,所述标识数据的标签记录表包括内容ID、维度ID、属性值ID、属性值和关联度;当匹配结果为空时,所述属性值ID为空。如图3所示。
S4、根据选定的匹配结果,生成标签,并将所述标签存入用户页面缓存区。
其中,当用户只选定匹配结果时,所述标签为二元组标签<类型,值>,包括维度和属性值;当用户同时选定匹配结果和关联度时,所述标签为三元组标签,包括维度、属性值和关联度<类型,值,关联度>。从而对文本内容进行多维度标识的方法,属性值是查数据库匹配,保存对应的ID(匹配不出来ID为空,后期可以更新,维护此属性下相应的关键词对象),便于不同内容关联。
关联度是1-5的自然数,数字越大,代表关联度越强。
需要说明的是,匹配出结果待用户选择确认,选择关联度加入到标签缓存区,继续下一步循环动作。即重复上述步骤,或移除缓存区。
S5、重复上述步骤,直至响应用户的保存指令,将所述用户页面缓存区的所有标签插入到数据库表中,作为文本内容的标识数据。
全部完成后,点击保存。将缓存区的所有标签{<维度1,属性值1,关联度>,<维度1,属性值2,关联度>,……<维度1,属性值n,关联度>,<维度2,属性值1,关联度>,<维度2,属性值1,关联度>……<维度2,属性值n,关联度>,……<维度m,属性值1,关联度>,<维度m,属性值2,关联度>,……<维度m,属性值n,关联度>}插入到数据库表,作为文本内容的标识数据。
本实施例定义了水平方向从左到右(自西向东)的鼠标手势与产品维度关联。产品维度对应的表是Product_Def,搜索(匹配)方法定义为任意位置连续匹配(字符和空格作为整体,不按空格分词)。用户在待标引文本中选定“海关服务器”,并按住鼠标从左往右划词,系统捕获到鼠标轨迹到的动作,将轨迹与预先定义的轨迹做对比(捕获方法和轨迹对比匹配算法不是本发明重点),匹配出鼠标手势对应的维度属性(用户欲选择的维度),会发送“海关服务器”关键词到Product_Def表用预定义的搜索方法匹配。匹配出结果待用户选择确认,选择关联度加入到标签缓存区,继续下一步循环动作。
根据本实施例提供的一种文本内容划词标识的方法,内容文本人工标识的速度和准确率得到很大的提升。不同标引内容间的相互关联。比如定义A企业名与B企业名的关联关系,某内容含有A企业名的标签,那么可以查找相关的带B企业标签的相关内容。
第二方面,请参阅图4。
本发明的另一个实施例还提供了一种文本内容划词标识的装置,包括:
识别模块21,用于识别鼠标手势。
其中,所述鼠标手势为以选定文本内容中的部分连续字符串区域为起始位置,划词的移动轨迹。
即,用鼠标选定文本内容中的部分连续字符串,以选定字符串区域为起始位置,按住鼠标(左键或右键,预先定义)移动鼠标形成的轨迹(屏幕上显示此轨迹便于用户区别)。
在识别鼠标手势之前,预定义模块20,用于预定义鼠标手势和维度的关系,以及维度与目标表和匹配方法的关系。
具体的,定义鼠标手势与维度(属性类别)的关系(鼠标手势维度关系表),定义每个维度对应标签值(属性值)所在的目标表、字符的匹配方法。其中,匹配方法如首字匹配,中间开始匹配,完全匹配,区分大小写,中文拼音匹配、输入多少字符以内不匹配(为了性能)等。
查询模块22,用于在预定义库中查询与所述鼠标手势对应的维度,并确定与所述维度对应的目标表和匹配方法。
在具体的实施例当中,系统将划词移动的鼠标轨迹与定义的鼠标手势维度关系表进行匹配,取得对应的维度(属性类别),确定待搜索的目标表和搜索/匹配方法。需要说明的是,维度值就是目标表名。搜索的目的是为了确认关键词在预定义库中的ID,便于不同内容间数据关联。
匹配模块23,用于将所述鼠标手势所选定的字符串作为关键词,在所述目标表中使用所述匹配方法,对所述关键词进行匹配,并将匹配结果呈现给用户。
当所述匹配结果为两个及以上时,根据用户选定的匹配结果获取数据表中对应的ID;当所述匹配结果为一个时,直接选定该匹配结果,并获取数据表中对应的ID。
在具体的实施例当中,为了更好的标识内容,也为了便于不同内容之间的相互关联,内容需要在不同的维度(属性类别)进行标识,而这些维度的属性值有数据表进行维护。不同维度及为维度属性值可以用一个二元组<A,V>表示,如<“行业”,“磷化工”>、<“行业”,“农业”>、<“产品”,“钛白粉”>、<“产品”,“汽车”>、<“企业”,“浙江新安化工集团股份有限公司”>、<“企业”,“南通江山农药股份有限公司”>。当然,为了便于管理,这些维度、维度属性值都是数据库(预定义库)预先定义并独立维护的,内容标识存储的是这些维度、维度属性值的ID。
其中,所述标识数据的标签记录表包括内容ID、维度ID、属性值ID、属性值和关联度;当匹配结果为空时,所述属性值ID为空。如图3所示。
标签生成模块24,根据选定的匹配结果,生成标签,并将所述标签存入用户页面缓存区。
其中,当用户只选定匹配结果时,所述标签为二元组标签<类型,值>,包括维度和属性值;当用户同时选定匹配结果和关联度时,所述标签为三元组标签,包括维度、属性值和关联度<类型,值,关联度>。从而对文本内容进行多维度标识的方法,属性值是查数据库匹配,保存对应的ID(匹配不出来ID为空,后期可以更新,维护此属性下相应的关键词对象),便于不同内容关联。
关联度是1-5的自然数,数字越大,代表关联度越强。
需要说明的是,匹配出结果待用户选择确认,选择关联度加入到标签缓存区,继续下一步循环动作。即重复上述步骤,或移除缓存区。
存储模块25,用于重复上述步骤,直至响应用户的保存指令,将所述用户页面缓存区的所有标签插入到数据库表中,作为文本内容的标识数据。
全部完成后,点击保存。将缓存区的所有标签{<维度1,属性值1,关联度>,<维度1,属性值2,关联度>,……<维度1,属性值n,关联度>,<维度2,属性值1,关联度>,<维度2,属性值1,关联度>……<维度2,属性值n,关联度>,……<维度m,属性值1,关联度>,<维度m,属性值2,关联度>,……<维度m,属性值n,关联度>}插入到数据库表,作为文本内容的标识数据。
本实施例定义了水平方向从左到右(自西向东)的鼠标手势与产品维度关联。产品维度对应的表是Product_Def,搜索(匹配)方法定义为任意位置连续匹配(字符和空格作为整体,不按空格分词)。用户在待标引文本中选定“海关服务器”,并按住鼠标从左往右划词,系统捕获到鼠标轨迹到的动作,将轨迹与预先定义的轨迹做对比(捕获方法和轨迹对比匹配算法不是本发明重点),匹配出鼠标手势对应的维度属性(用户欲选择的维度),会发送“海关服务器”关键词到Product_Def表用预定义的搜索方法匹配。匹配出结果待用户选择确认,选择关联度加入到标签缓存区,继续下一步循环动作。
根据本实施例提供的一种文本内容划词标识的装置,通过预先定义鼠标手势与标识维度的关系;维度与目标表、匹配方法的关系,然后选定关键词后的划词鼠标手势的操作为,以选定的字符串为关键词,从鼠标手势对应的表中去搜索匹配此关键词,即此过程完成了关键词输入、维度表(属性类别)选择的过程,从而能够提高内容文本人工标识的速度和准确率,满足企业高标准的需求和个性化需求。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和变形,这些改进和变形也视为本发明的保护范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。

Claims (10)

1.一种文本内容划词标识的方法,适于在计算设备中执行,其特征在于,至少包括如下步骤:
识别鼠标手势;
在预定义库中查询与所述鼠标手势对应的维度,并确定与所述维度对应的目标表和匹配方法;
将所述鼠标手势所选定的字符串作为关键词,在所述目标表中使用所述匹配方法,对所述关键词进行匹配,并将匹配结果呈现给用户;
根据选定的匹配结果,生成标签,并将所述标签存入用户页面缓存区;
重复上述步骤,直至响应用户的保存指令,将所述用户页面缓存区的所有标签插入到数据库表中,作为文本内容的标识数据。
2.根据权利要求1所述的文本内容划词标识的方法,其特征在于,当用户只选定匹配结果时,所述标签为二元组标签,包括维度和属性值;当用户同时选定匹配结果和关联度时,所述标签为三元组标签,包括维度、属性值和关联度。
3.根据权利要求1所述的文本内容划词标识的方法,其特征在于,在识别鼠标手势之前,还包括:
预定义鼠标手势和维度的关系,以及维度与目标表和匹配方法的关系。
4.根据权利要求1所述的文本内容划词标识的方法,其特征在于,所述鼠标手势为以选定文本内容中的部分连续字符串区域为起始位置,划词的移动轨迹。
5.根据权利要求1所述的文本内容划词标识的方法,其特征在于,在所述将所述鼠标手势所选定的字符串作为关键词,在所述目标表中使用所述匹配方法,对所述关键词进行匹配,并将匹配结果呈现给用户之后,还包括:
当所述匹配结果为两个及以上时,根据用户选定的匹配结果获取数据表中对应的ID;
当所述匹配结果为一个时,直接选定该匹配结果,并获取数据表中对应的ID。
6.根据权利要求1所述的文本内容划词标识的方法,其特征在于,所述标识数据的标签记录表包括内容ID、维度ID、属性值ID、属性值和关联度;当匹配结果为空时,所述属性值ID为空。
7.一种文本内容划词标识的装置,其特征在于,包括:
识别模块,用于识别鼠标手势;
查询模块,用于在预定义库中查询与所述鼠标手势对应的维度,并确定与所述维度对应的目标表和匹配方法;
匹配模块,用于将所述鼠标手势所选定的字符串作为关键词,在所述目标表中使用所述匹配方法,对所述关键词进行匹配,并将匹配结果呈现给用户;
标签生成模块,根据选定的匹配结果,生成标签,并将所述标签存入用户页面缓存区;
存储模块,用于重复上述步骤,直至响应用户的保存指令,将所述用户页面缓存区的所有标签插入到数据库表中,作为文本内容的标识数据。
8.根据权利要求7所述的文本内容划词标识的装置,其特征在于,当用户只选定匹配结果时,所述标签为二元组标签,包括维度和属性值;当用户同时选定匹配结果和关联度时,所述标签为三元组标签,包括维度、属性值和关联度;所述鼠标手势为以选定文本内容中的部分连续字符串区域为起始位置,划词的移动轨迹。
9.根据权利要求7所述的文本内容划词标识的装置,其特征在于,还包括:
预定义模块,用于预定义鼠标手势和维度的关系,以及维度与目标表和匹配方法的关系。
10.根据权利要求7所述的文本内容划词标识的装置,其特征在于,在所述将所述鼠标手势所选定的字符串作为关键词,在所述目标表中使用所述匹配方法,对所述关键词进行匹配,并将匹配结果呈现给用户之后,还包括:
当所述匹配结果为两个及以上时,根据用户选定的匹配结果获取数据表中对应的ID;
当所述匹配结果为一个时,直接选定该匹配结果,并获取数据表中对应的ID。
CN201811516013.9A 2018-12-11 2018-12-11 一种文本内容划词标识的方法及装置 Active CN109635075B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811516013.9A CN109635075B (zh) 2018-12-11 2018-12-11 一种文本内容划词标识的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811516013.9A CN109635075B (zh) 2018-12-11 2018-12-11 一种文本内容划词标识的方法及装置

Publications (2)

Publication Number Publication Date
CN109635075A true CN109635075A (zh) 2019-04-16
CN109635075B CN109635075B (zh) 2023-02-07

Family

ID=66073166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811516013.9A Active CN109635075B (zh) 2018-12-11 2018-12-11 一种文本内容划词标识的方法及装置

Country Status (1)

Country Link
CN (1) CN109635075B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027281A (zh) * 2019-11-20 2020-04-17 北京字节跳动网络技术有限公司 划词方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1797301A (zh) * 2004-12-30 2006-07-05 陈沛 数字化信息搜索方法及其系统
CN101178737A (zh) * 2006-12-12 2008-05-14 北京搜狗科技发展有限公司 一种互联网关键字符相关信息的发布方法和系统
CN103677402A (zh) * 2012-09-19 2014-03-26 柯尼卡美能达株式会社 图像处理装置、操作标准化方法以及操作标准化程序
CN103678281A (zh) * 2013-12-31 2014-03-26 北京百度网讯科技有限公司 对文本进行自动标注的方法和装置
CN103902164A (zh) * 2014-04-11 2014-07-02 魏新成 在浏览器窗口进行鼠标左键单击取词搜索的系统和方法
US20160246784A1 (en) * 2015-02-25 2016-08-25 Palantir Technologies Inc. Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags
CN108874926A (zh) * 2018-05-31 2018-11-23 康键信息技术(深圳)有限公司 海量数据查询方法、装置、计算机设备和存储介质
CN108932257A (zh) * 2017-05-25 2018-12-04 北京国双科技有限公司 多维度数据的查询方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1797301A (zh) * 2004-12-30 2006-07-05 陈沛 数字化信息搜索方法及其系统
CN101178737A (zh) * 2006-12-12 2008-05-14 北京搜狗科技发展有限公司 一种互联网关键字符相关信息的发布方法和系统
CN103677402A (zh) * 2012-09-19 2014-03-26 柯尼卡美能达株式会社 图像处理装置、操作标准化方法以及操作标准化程序
CN103678281A (zh) * 2013-12-31 2014-03-26 北京百度网讯科技有限公司 对文本进行自动标注的方法和装置
CN103902164A (zh) * 2014-04-11 2014-07-02 魏新成 在浏览器窗口进行鼠标左键单击取词搜索的系统和方法
US20160246784A1 (en) * 2015-02-25 2016-08-25 Palantir Technologies Inc. Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags
CN108932257A (zh) * 2017-05-25 2018-12-04 北京国双科技有限公司 多维度数据的查询方法及装置
CN108874926A (zh) * 2018-05-31 2018-11-23 康键信息技术(深圳)有限公司 海量数据查询方法、装置、计算机设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027281A (zh) * 2019-11-20 2020-04-17 北京字节跳动网络技术有限公司 划词方法、装置、设备及存储介质
CN111027281B (zh) * 2019-11-20 2023-06-06 北京字节跳动网络技术有限公司 划词方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN109635075B (zh) 2023-02-07

Similar Documents

Publication Publication Date Title
CN104376406B (zh) 一种基于大数据的企业创新资源管理与分析方法
CN107590174B (zh) 页面访问方法及装置
CN108647276B (zh) 一种搜索方法
US10482146B2 (en) Systems and methods for automatic customization of content filtering
TW201322021A (zh) 圖片搜索方法以及圖片搜索裝置
Fakhari et al. Combination of classification and regression in decision tree for multi-labeling image annotation and retrieval
CN107085583B (zh) 一种基于内容的电子文档管理方法及装置
CN114549874B (zh) 多目标图文匹配模型的训练方法、图文检索方法及装置
CN107193892B (zh) 一种文档主题确定方法及装置
CN110515896B (zh) 模型资源管理方法、模型文件制作方法、装置和系统
CN103760991A (zh) 一种实体输入方法和装置
CA3155715A1 (en) Method of and device for generating query strategy for commodity searching
CN109857957B (zh) 建立标签库的方法、电子设备及计算机存储介质
CN112818230B (zh) 内容推荐方法、装置、电子设备和存储介质
CN111563382A (zh) 文本信息的获取方法、装置、存储介质及计算机设备
CN110008306A (zh) 一种数据关系分析方法、装置及数据服务系统
CN112699232A (zh) 文本标签提取方法、装置、设备和存储介质
CN106708813A (zh) 一种标题处理方法及设备
CN105159898B (zh) 一种搜索的方法和装置
CN110532415A (zh) 图像搜索处理方法、装置、设备及存储介质
CN104778232B (zh) 一种基于长查询的搜索结果的优化方法和装置
CN109783599A (zh) 基于多种存储介质的知识图谱检索方法及系统
CN111753195B (zh) 标签体系构建方法、装置、设备以及存储介质
CN109635075A (zh) 一种文本内容划词标识的方法及装置
CN112579729A (zh) 文档质量评价模型的训练方法、装置、电子设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant