CN111291208A - 前端页面元素的命名方法、装置及电子设备 - Google Patents

前端页面元素的命名方法、装置及电子设备 Download PDF

Info

Publication number
CN111291208A
CN111291208A CN202010384139.6A CN202010384139A CN111291208A CN 111291208 A CN111291208 A CN 111291208A CN 202010384139 A CN202010384139 A CN 202010384139A CN 111291208 A CN111291208 A CN 111291208A
Authority
CN
China
Prior art keywords
target page
page element
image
name
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010384139.6A
Other languages
English (en)
Other versions
CN111291208B (zh
Inventor
谢杨易
崔恒斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010384139.6A priority Critical patent/CN111291208B/zh
Priority to CN202011325561.0A priority patent/CN112307235B/zh
Publication of CN111291208A publication Critical patent/CN111291208A/zh
Application granted granted Critical
Publication of CN111291208B publication Critical patent/CN111291208B/zh
Priority to PCT/CN2021/092136 priority patent/WO2021227951A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/38Creation or generation of source code for implementing user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请的一个或多个实施例提出前端页面元素的命名方法、装置及电子设备。上述方法包括,当目标页面元素为图像元素时,计算上述目标页面元素,与预设图像库中的各图像之间的相似度。确定计算出的上述相似度中的最大相似度。将计算上述最大相似度时对应的上述预设图像库中的图像的名称,确定为上述目标页面元素的名称。

Description

前端页面元素的命名方法、装置及电子设备
技术领域
本申请涉及计算机网络技术领域,尤其涉及一种前端页面元素的命名方法、装置及电子设备。
背景技术
在前端页面开发作业中,为了有助于提高前端页面代码的可读性,以及后期维护代码的便利性,开发人员通常需要针对前端页面元素进行命名。
目前,在对页面元素进行命名时,开发人员通常需要通过人工进行命名。而由于元素的命名有严格的规范,并且前端开发中包括的页面元素数量众多,因此,通过人工命名元素的方式,将可能出现命名效率低,命名时不能严格遵守命名规范,命名错误等问题。
发明内容
本申请提出一种前端页面元素的命名方法,上述方法包括:
当目标页面元素为图像元素时,计算上述目标页面元素,与预设图像库中的各图像之间的相似度;
确定计算出的上述相似度中的最大相似度;
将计算上述最大相似度时对应的上述预设图像库中的图像的名称,确定为上述目标页面元素的名称。
在示出的一实施例中,上述计算上述目标页面元素,与预设图像库中的各图像之间的相似度,包括:
将上述目标页面元素的元素数据输入预先训练的分类模型中进行计算,得到上述目标页面元素的分类结果;其中,上述分类模型为基于若干被标注了分类结果的样本训练得到的神经网络模型;
从预设图像库中,查找与上述目标页面元素的分类结果相同的图像;
计算上述目标页面元素,与查找出的各图像之间的相似度。
在示出的一实施例中,上述方法还包括:
当目标页面元素为文本元素时,将上述目标页面元素的元素数据输入预先训练的翻译模型中进行计算,得到与上述目标页面元素对应的英文字符串;
将上述英文字符串,确定为上述目标页面元素的名称。
在示出的一实施例中,上述方法还包括:
基于预先构建的映射算法,将上述目标页面元素中的繁体字转换为简体字。
在示出的一实施例中,上述将上述英文字符串,确定为上述目标页面元素的名称,包括:
将上述英文字符串输入预先训练的关键词提取模型中进行计算,得到与上述英文字符串对应的关键词;
将上述关键词,确定为上述目标页面元素的名称。
在示出的一实施例中,上述方法还包括:
如果上述目标页面元素为容器元素,则在上述目页面元素的名称中添加指示上述目标页面元素为容器元素的标识。
在示出的一实施例中,上述在上述目标页面元素的名称中添加指示上述目标页面元素为容器元素的标识,包括:
从上述容器元素中各元素的名称中,提取关键词;
将各关键词进行组合,得到上述目标页面元素的名称;
在上述名称中添加指示上述目标页面元素为容器元素的标识。
本申请还提出一种前端页面元素的命名装置,包括:
计算模块,当目标页面元素为图像元素时,计算上述目标页面元素,与预设图像库中的各图像之间的相似度;
第一确定模块,确定计算出的上述相似度中的最大相似度;
第二确定模块,将计算上述最大相似度时对应的上述预设图像库中的图像的名称,确定为上述目标页面元素的名称。
在示出的一实施例中,上述计算模块,包括:
将上述目标页面元素的元素数据输入预先训练的分类模型中进行计算,得到上述目标页面元素的分类结果;其中,上述分类模型为基于若干被标注了分类结果的样本训练得到的神经网络模型;
从预设图像库中,查找与上述目标页面元素的分类结果相同的图像;
计算上述目标页面元素,与查找出的各图像之间的相似度。
在示出的一实施例中,上述装置还包括:
模型计算模块,当目标页面元素为文本元素时,将上述目标页面元素的元素数据输入预先训练的翻译模型中进行计算,得到与上述目标页面元素对应的英文字符串;
第三确定模块,将上述英文字符串,确定为上述目标页面元素的名称。
在示出的一实施例中,上述装置还包括:
转换模块,基于预先构建的映射算法,将上述目标页面元素中的繁体字转换为简体字。
在示出的一实施例中,上述第三确定模块,包括:
将上述英文字符串输入预先训练的关键词提取模型中进行计算,得到与上述英文字符串对应的关键词;
将上述关键词,确定为上述目标页面元素的名称。
在示出的一实施例中,上述装置还包括:
添加模块,如果上述目标页面元素为容器元素,则在上述目页面元素的名称中添加指示上述目标页面元素为容器元素的标识。
在示出的一实施例中,上述添加模块,包括:
从上述容器元素中各元素的名称中,提取关键词;
将各关键词进行组合,得到上述目标页面元素的名称;
在上述名称中添加指示上述目标页面元素为容器元素的标识。
由上述技术方案可知,一方面,当元素为图像元素时,上述系统可以计算上述目标页面元素,与预设图像库中的各图像之间的相似度,并将上述预设图像库中,与计算出的相似度中的最大相似度对应的图像的名称,确定为上述目标页面元素的名称。
另一方面,当元素为文本元素时,上述系统可以从上述文本元素中提取关键词,并将提取的关键词作为上述文本元素的名称。
再一方面,当元素为容器元素时,上述系统可以在上述目页面元素的名称中添加指示上述目标页面元素为容器元素的标识,从而实现针对上述容器元素的命名。
因此,本申请公开的元素命名方法可以实现自动为元素命名,从而提升元素命名效率,元素命名规范度,以及正确性,避免由于人工参与而导致的命名效率低,命名时不能严格遵守命名规范,命名错误等问题。
附图说明
图1为本申请示出的一种前端页面元素的命名方法的方法流程图;
图2为本申请示出的文本元素命名方法的方法流程图;
图3为本申请示出的容器元素命名方法的方法流程图;
图4为本申请示出的一种前端页面元素的命名装置的结构图;
图5为本申请示出的一种前端页面元素的命名设备的硬件结构图。
具体实施方式
下面将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的设备和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“上述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。还应当理解,本文中所使用的词语“如果”,取决于语境,可以被解释成为“在……时”或“当……时”或“响应于确定”。
本申请旨在提出一种前端页面元素的命名方法,以使在确定页面元素名称时,由页面元素名称确定系统实现针对不同类型的页面元素进行命名,从而避免由于人工参与而导致的命名效率低,命名时不能严格遵守命名规范,命名错误等问题。
以下结合具体实施例对本申请公开的技术方案进行说明。
请参见图1,图1为本申请示出的一种前端页面元素的命名方法的方法流程图。应用于页面元素命名系统。如图1所示,上述方法包括:
S102,当目标页面元素为图像元素时,计算上述目标页面元素,与预设图像库中的各图像之间的相似度。
S104,确定计算出的上述相似度中的最大相似度。
S106,将计算上述最大相似度时对应的上述预设图像库中的图像的名称,确定为上述目标页面元素的名称。
上述页面元素命名系统(以下简称“系统”),具体可以是搭载在终端设备中的一段逻辑代码。上述页面元素命名系统在作为执行主体执行上述元素提取方法时,需要通过其搭载的终端设备提供算力。
在实际应用中,上述系统可以提供一个与开发人员进行交互的交互平台。通过该交互平台,一方面,开发人员可以将需要待命名的页面元素提供至上述系统,并向上述系统发起针对页面元素进行命名的相关指令;另一方面,当针对页面元素命名完毕后,上述系统可以将命名后的页面元素向开发人员输出。
上述前端页面图像,具体是由页面图像设计师设计的页面图像。在实际情形中,开发人员在进行前端页面开发时,通常需要参照页面图像设计师设计的页面图像来进行开发,从而使最终开发的前端页面的展示效果可以与上述页面图像相同。
上述前端页面元素(以下简称“元素”),具体是构成前端页面的主要组成部分,其可以包括图像元素、文本元素和容器元素。
上述图像元素,具体是指包括的内容为图像的元素。
上述文本元素,具体是指包括的内容为文字的元素。其中,上述文字可能包括繁体字或简体字。
上述容器元素,具体是指有若干元素的组成的元素集合。在实际应用中,若干图像元素可以组成一个容器元素。若干文本元素可以组成一个容器元素。若干文本元素和若干图像元素也可以共同组成一个容器元素。
可以理解的是,在实际应用中,不同类型的元素的命名规范也不一样。因此,在进行元素命名时,需要确定元素的元素类型。
在一实施例中,当开发人员需要针对某一元素进行命名时,开发人员可以通过上述系统提供的交互平台,将上述元素,以及该元素的元素类型提供至上述系统。
例如,上述交互平台可以提供一个窗口,用于为开发人员输入待命名元素的元素类型。当开发人员将上述元素的元素数据提供至上述系统时,开发人员还可以在上述窗口中,输入上述元素的元素类型,以供上述系统进行元素类型的识别。
在另一实施例中,为了提高元素命名效率,以及正确率。当开发人员需要针对某一元素进行命名时,开发人员可以通过上述系统提供的交互平台,仅将上述元素提供至上述系统即可。
在上述情形下,上述系统可以自动识别上述元素的元素类型。
在一种实现方式中,在识别上述元素的元素类型时,上述系统可以通过先针对上述元素对应的元素数据进行OCR识别,得到与上述元素对应的识别结果,然后再根据上述识别结果确定各元素的元素类型。
在介绍具体步骤前,本申请先介绍通过OCR识别确定元素类型的原理。
OCR(Optical Character Recognition,光学字符识别)技术,具体是将图像、照片上的文字内容,直接转换为可编辑文本的技术。其原理为,将目标图像的图像特征与已有的汉字库中的汉字的图像特征进行比较,并输出与目标图像的图像特征最匹配的汉字作为识别结果,以及上述识别结果的识别置信度。其中,上述识别置信度可以在一定程度上指示上述目标图像的图像特征与识别结果的相似程度。
例如,假如目标图像包括的文字内容为汉字“中”,此时由于上述目标图像包括的确实是一个汉字,因此经过OCR检测后得到的识别结果的识别置信度将会比较高。而假设目标图像包括的具体内容为一个类似汉字“中”的图案,此时在针对目标图像进行OCR识别后,虽然可以得到相应识别结果,但是由于上述目标图像包括的具体内容仅是类似汉字的图案,因此,上述识别置信度则会相对较低。
可见,在通过OCR识别的方式确定上述元素的元素类型时,可以在针对元素的元素图像进行OCR识别后,通过判断与该次识别结果对应的识别置信度是否达到预设阈值来确定上述元素的元素类型。其中,上述预设阈值,具体可以是开发人员根据经验设置,或通过大量的样本训练出的,在此不作限定。当上述识别置信度达到上述预设阈值,则确定上述元素的元素类型为文本元素;反之,则确定上述元素的元素类型为图像元素。
可以理解的是,在上述情形中,如果针对上述元素经过OCR识别后得到若干个识别结果,则说明上述元素为若干个文本元素或图像元素的集合,此时可以确定上述元素为容器元素。
在另一种实施方式中,上述系统在确定元素的元素类型时,可以将上述元素对应的元素数据输入预先训练的分类器进行计算,并基于计算结果确定上述元素的元素类型。
其中,上述分类器,具体可以是基于若干被标记了元素类型的元素图像样本进行训练得到的;上述元素类型包括图像元素,文本元素,容器元素。
在此需要说明的是,上述分类器的结构和类型在此不作限定。上述分类器可以是基于神经网络构建的多分类器。
上述图像库,具体可以是预先配置好的图像库。上述图像库通常可以包括若干张已命名的图像(根据命名规范命名的图像)。
在实际应用中,为了规范存储图像,以及提升命名精确度,上述图像库包括的图像可以进行分类存储。例如,上述图像库可以被分为若干存储空间;其中,每一存储空间可以存储同一图像类型的图像。
在一种配置图像库的方式中,开发人员可以获取包括若干常用元素图像的图像集合。然后,开发人员可以根据命名规范为上述图像集合中的各图像进行命名,并将命名好的图像进行分类(人工分类或通过分类器进行分类),存至上述图像库对应的存储空间。可以理解的是,配置好的图像库是可以被重复复制使用的,并非每次在为目标元素进行命名时均需要进行配置的。当然,配置好的图像库是可以被更新的。例如,添加新图像或更新已有图像的名称等。
当确定出目标元素为图像元素时,上述系统可以执行S102,计算上述目标元素,与预设图像库中的各图像之间的相似度。
在一实施例中,在计算上述目标元素,与预设图像库中的各图像之间的相似度时,上述系统可以先将上述目标元素的元素数据整理为特征向量的形式,从而便于进行相似度计算。
例如,上述系统可以先提取上述目标元素的图像特征(例如,Harris角点或SIFT特征),并形成相应的特征向量。
之后,上述系统可以针对上述预设图像库中的各图像执行以下步骤S1022-S1026:
S1022,提取上述图像的图像特征,形成特征向量。
S1024,在提取上述特征向量后,计算上述图像对应的各特征向量,与上述目标元素对应的各特征向量之间的欧式距离,并统计欧式距离小于预设基准阈值的特征向量的数量。
S1026,将统计的上述图像包括的特征向量中,与上述目标元素包括的特征向量之间的欧式距离小于预设基准阈值的数量,通过预设的映射算法(例如,归一化或标准化算法),将上述数量映射为上述图像与上述目标元素之间的相似度。
S1028,记录映射的上述相似度,与上述图像的对应关系。
在此,需要说明的是,在本申请不对计算相似度的方法进行限定。例如,上述计算相似度的方法还可以通过计算特征向量之间的余弦距离、曼哈顿距离、马氏距离等方式。
当针对上述预设图像库中的各图像完成上述步骤后,上述系统将会得到上述目标元素与上述各图像之间的相似度,以及上述相似度,与上述各图像的对应关系。
然后,上述系统可以执行S104-S106,确定计算出的上述相似度中的最大相似度,并将计算上述最大相似度时对应的上述预设图像库中的图像的名称,确定为上述目标页面元素的名称。
在一实施例中,为了提升确定上述最大相似度的效率,上述系统可以将得到的上述相似度推入大顶堆(大顶堆中的每个父节点对应的值都大于或等于其左右子节点对应的值)中。然后,上述系统可以读取上述大顶堆的根节点中存储的相似度,并将读取的上述相似度确定为最大相似度。
不难理解,由于大顶堆的特性为每个父节点对应的值都大于或等于其左右子节点对应的值,因此,大顶堆的根节点记录的是上述大顶堆中维护的最大值。可见,上述大顶堆的根节点中存储的相似度,则为得到的各相似度中的最大相似度。
当确定最大相似度后,上述系统可以从记录的上述对应关系中,确定与上述最大相似度对应的图像。在确定上述图像后,上述系统可以将上述图像的名称确定为上述目标元素的名称。
至此,上述系统则完成了针对目标元素的命名。
由上述技术方案可知,由于在对前端页面元素进行命名时,上述系统可以计算上述目标页面元素,与预设图像库中的各图像之间的相似度,并将上述预设图像库中,与计算出的相似度中的最大相似度对应的图像的名称,确定为上述目标页面元素的名称,因此,可以实现自动为元素命名,从而提升元素命名效率,元素命名规范度,以及正确性,避免由于人工参与而导致的命名效率低,命名时不能严格遵守命名规范,命名错误等问题。
在一实施例中,为了提升命名精确度,上述系统在执行S102,计算上述目标页面元素,与预设图像库中的各图像之间的相似度时,可以先将上述目标页面元素的元素数据输入预先训练的分类模型中进行计算,得到上述目标页面元素的分类结果。
其中,上述分类模型为基于若干被标注了分类结果的样本训练得到的神经网络模型。
在训练上述分类模型时,可以先获取若干被标注了分类结果的样本数据。在获取若干样本数据后,可以将上述样本数据输入分类模型中,进行迭代训练,直至上述分类模型收敛。此时,收敛的分类模型可以作为训练完毕的分类模型。
当确定上述目标元素的图像类型后,上述系统可以从预设图像库中,查找与上述目标页面元素的分类结果相同的图像,然后计算上述目标页面元素,与查找出的各图像之间的相似度。
在一种方式中,在查找与上述目标页面元素的分类结果相同的图像时,上述系统可以直接读取与上述分类结果对应的存储空间所记录的图像。
在另一种方式中,在查找与上述目标页面元素的分类结果相同的图像时,上述系统可以将上述预设图像库中的各图像的图像数据输入上述分类模型进行计算,从而得到各图像的图像类型。之后,上述系统可以将图像类型与上述目标元素的图像类型相同的图像,确定为与上述目标页面元素的分类结果相同的图像。
在确定上述目标元素与各图像之间的相似度后,上述系统可以继续执行S104-S106,确定计算出的上述相似度中的最大相似度;将计算上述最大相似度时对应的上述预设图像库中的图像的名称,确定为上述目标页面元素的名称(详细步骤可以参照前述内容,在此不作详述)。
在本实施例中,由于上述系统是在与目标元素的图像类型相同的图像中,确定与上述目标元素最相似的图像,并将上述最相似的图像的名称作为上述目标元素的名称,因此,可以提升元素命名精确度。
请参见图2,图2为本申请示出的文本元素命名方法的方法流程图。
当确定出目标元素为文本元素时,如图2所示,上述系统可以先将上述文本元素的文本内容进行繁简转换。
在实际应用中,上述系统中可以预先搭载繁体字转换为简体字的映射算法。通过该映射算法,上述系统可以将文本元素中的繁体字转为简体字。
例如,上述映射算法可以是基于hanlp工具构建的繁体字转换为简体字的算法。当接收到文本元素的文本内容后,该算法可以先将上述文本内容按照文字进行分割,然后逐一检测分割后的文字是否为繁体字,如果是,则将其转换为对应的简体字进行输出;如果否,则直接将该分割后的文字进行输出。当针对每一分割后的分组进行繁简转换后,上述算法可以将上述输出的简体字重新组合为上述文本元素的文本内容。
在此,需要说明的是,本申请不对上述映射算法进行限定。
当获取到经过繁简转换后的上述文本元素后,上述系统可以将上述目标页面元素的元素数据输入预先训练的翻译模型中进行计算,得到与上述目标页面元素对应的英文字符串。
在实际应用中,上述系统可以预先搭载训练好的翻译模型。通过该翻译模型可以将输入的中文文本内容,转换为英文文本内容。
例如,上述翻译模型可以是基于seq2seq的NLP(Natural Language Processing,自然语言处理)模型。当接收到文本元素的文本内容后,该模型可以先将上述文本内容按照文字进行分割,然后将分割后的文字作为输入进行语义编码,得到与上述文本内容对应的向量。在完成语义编码后,可以基于上述语义编码,以及英文单词库,将上述向量解码为英文文本内容。
在此,需要说明的是,本申请不对上述翻译模型进行限定。
当将上述文本元素的文本内容转化为英文文本内容(由英文字符串构成文本内容)后,上述系统可以从上述英文文本内容中选取出若干关键字,作为是文本元素的名称。
在实际应用中,上述系统可以预先搭载关键词提取模型。通过该关键词提取模型可以在输入的英文文本内容中,提取出关键词。
例如,上述关键词提取模型可以是基于TF-IDF算法构建的模型。当接收到文本元素的英文文本内容后,该模型可以先将上述英文文本中的各单词进行分割,然后统计分割后的单词在该文本中的出现频率(TF,Term Frequency,词频)。在统计出各单词的在本文本中出现的频率后,可以结合各单词在其他英文文本中出现的频率(IDF,Inverse DocumnetFrequency,逆文档频率),将各单词进行排序,并且排在前N位的单词作为关键词;其中,N为根据经验预设的正整数。
再例如,是关键词提取模型可以是基于textRank的NLP模型。当接收到文本元素的英文文本内容后,该模型可以先将上述英文文本中的各单词进行分割。在得到分割完毕后的单词后,上述系统可以将相邻两个分割后的单词进行两两组合,得到所有可能的组合,然后计算组合内的单词之间的连接权重。当计算出各组合内单词之间的连接权重后,上述系统可以计算每个单词对应的连接权重的和,并按照上述和的大小,对上述英文文本中的各单词进行排序。此时,上述系统可以将排在前N位的单词作为关键词;其中,N为根据经验预设的正整数。
在此,需要说明的是,本申请不对上述关键词提取模型进行限定。
在从上述文本元素的英文文本内容中确定出关键词后,上述系统可以将上述关键词确定为上述文本元素的名称。
当确定出目标元素为容器元素时,上述系统可以在上述目页面元素的名称中添加指示上述目标页面元素为容器元素的标识。
请参见图3,图3为本申请示出的容器元素命名方法的方法流程图。
当确定出目标元素为容器元素时,如图3所示,上述系统可以先确定上述容器元素中包括的各元素的元素类型。
在实际应用中,上述系统可以使用本申请中公开的确定元素类型的方法,逐一确定上述各元素的元素类型。
当上述容器元素中仅包括唯一本文元素时,上述系统可以使用本申请中公开的针对文本元素的命名方法,对上述容器元素中的文本元素进行命名。等到命名完成后,上述系统可以在上述文本元素的名称中添加指示上述目标页面元素为容器元素的标识,作为上述容器元素的名称。例如,在上述文本元素的名称前添加字符“contarner”。
当上述容器元素中包括若干本文元素时,在一实施例中,上述系统可以先从上述容器元素中,确定出用于命名的文本元素。然后,上述系统可以使用本申请中公开的针对文本元素的命名方法,对确定出的文本元素进行命名。等到命名完成后,上述系统可以在上述文本元素的名称中添加指示上述目标页面元素为容器元素的标识,作为上述容器元素的名称。
例如,上述系统可以将上述容器元素中处于首位(末位)的文本元素确定为用于命名的文本元素,并进行后续的命名。
再例如,上述系统可以将上述容器元素中数据量最大的文本元素确定为用于命名的本文元素,并进行后续的命名。
还例如,上述文本元素中携带指示上述文本元素重要性的标识(标识指示的数值越大,上述文本元素重要性越高)。上述系统可以将上述容器元素中携带的上述标识的数值最大的文本元素确定为用于命名的本文元素,并进行后续的命名。
在此,需要说明的是,确定用于命名的文本元素的方法可以根据实际情形进行设置,在此不作限定。
在另一实施例中,上述系统可以先使用本申请中公开的针对文本元素进行命名的方法,提取出各文本元素的关键词。然后,上述系统可以将各关键词进行组合得到组合后的关键词,并在组合后的关键词中添加指示上述目标页面元素为容器元素的标识,作为上述容器元素的名称。
在另一实施例中,上述系统可以先使用本申请中公开的针对文本元素进行命名的方法,提取出各文本元素的关键词。然后,上述系统可在提出的各关键词中,确定最重要的关键词,并在上述最重要的关键词中添加指示上述目标页面元素为容器元素的标识,作为上述容器元素的名称。
例如,在确定上述最重要的关键词时,上述系统可以将各关键词输入本申请记载的关键词提取模型中进行计算,然后,将计算结果作为上述最重要的关键词。
当上述容器元素中仅包括唯一图像元素时,上述系统可以使用本申请中公开的针对图像元素的命名方法,对上述容器元素中的文本元素进行命名。等到命名完成后,上述系统可以在上述图像元素的名称中添加指示上述目标页面元素为容器元素的标识,作为上述容器元素的名称。例如,在上述文本元素的名称前添加字符“contarner”。
当上述容器元素中包括若干图像元素时,在一实施例中,上述系统可以先从上述容器元素中,确定出用于命名的图像元素。然后,上述系统可以使用本申请中公开的针对文本元素的命名方法,对确定出的图像元素进行命名。等到命名完成后,上述系统可以在上述图像元素的名称中添加指示上述目标页面元素为容器元素的标识,作为上述容器元素的名称。
例如,上述系统可以将上述容器元素中处于首位(末位)的图像元素确定为用于命名的图像元素,并进行后续的命名。
再例如,上述系统可以将上述容器元素中数据量最大的图像元素确定为用于命名的图像元素,并进行后续的命名。
还例如,上述图像元素中携带指示上述图像元素重要性的标识(标识指示的数值越大,上述图像元素重要性越高)。上述系统可以将上述容器元素中携带的上述标识的数值最大的图像元素确定为用于命名的图像元素,并进行后续的命名。
在此,需要说明的是,确定用于命名的图像元素的方法可以根据实际情形进行设置,在此不作限定。
在另一实施例中,上述系统可以先使用本申请中公开的针对图像元素进行命名的方法,确定各图像元素的名称。然后,上述系统可以将各图像元素的名称进行组合得到组合后的名称,并在组合后的名称中添加指示上述目标页面元素为容器元素的标识,作为上述容器元素的名称。
在另一实施例中,上述系统可以先使用本申请中公开的针对图像元素进行命名的方法,确定各图像元素的名称。然后,上述系统可在确定的各图像元素的名称中,提取出关键词,并在上述关键词中添加指示上述目标页面元素为容器元素的标识,作为上述容器元素的名称。
例如,在提取上述关键词时,上述系统可以将各图像元素的名称输入本申请记载的关键词提取模型中进行计算,然后,将计算结果作为上述关键词。
需要说明的是,当上述容器元素既包括文本元素,也包括图像元素时, 针对上述容器元素的命名方法可以参照前述内容,在此不作详述。
当上述容器元素不包括任意元素时,上述系统可以将指示上述目标页面元素为容器元素的标识,与上述容器元素被分配的序号进行组合,并将组合后的结果作为上述容器元素的名称。
需要说明的是,上述容器元素被分配的序号,可以是根据实际情形进行分配的,在此不作限定。例如,在一种情形中,上述容器元素被分配的序号,可以指示上述容器元素被创建的顺序。在另一种情形中,上述容器元素被分配的序号,可以是人工分配的序号。
由上述技术方案可知,一方面,当元素为图像元素时,上述系统可以计算上述目标页面元素,与预设图像库中的各图像之间的相似度,并将上述预设图像库中,与计算出的相似度中的最大相似度对应的图像的名称,确定为上述目标页面元素的名称。
另一方面,当元素为文本元素时,上述系统可以从上述文本元素中提取关键词,并将提取的关键词作为上述文本元素的名称。
再一方面,当元素为容器元素时,上述系统可以在上述目页面元素的名称中添加指示上述目标页面元素为容器元素的标识,从而实现针对上述容器元素的命名。
因此,本申请公开的元素命名方法可以实现自动为元素命名,从而提升元素命名效率,元素命名规范度,以及正确性,避免由于人工参与而导致的命名效率低,命名时不能严格遵守命名规范,命名错误等问题。
相应地,本申请还提出一种前端页面元素的命名装置。请参见图4,图4为本申请示出的一种前端页面元素的命名装置的结构图。
如图4所示,上述装置400可以包括:
计算模块410,当目标页面元素为图像元素时,计算上述目标页面元素,与预设图像库中的各图像之间的相似度;
第一确定模块420,确定计算出的上述相似度中的最大相似度;
第二确定模块430,将计算上述最大相似度时对应的上述预设图像库中的图像的名称,确定为上述目标页面元素的名称。
在示出的一实施例中,上述计算模块410,包括:
将上述目标页面元素的元素数据输入预先训练的分类模型中进行计算,得到上述目标页面元素的分类结果;其中,上述分类模型为基于若干被标注了分类结果的样本训练得到的神经网络模型;
从预设图像库中,查找与上述目标页面元素的分类结果相同的图像;
计算上述目标页面元素,与查找出的各图像之间的相似度。
在示出的一实施例中,上述装置400还包括:
模型计算模块,当目标页面元素为文本元素时,将上述目标页面元素的元素数据输入预先训练的翻译模型中进行计算,得到与上述目标页面元素对应的英文字符串;
第三确定模块,将上述英文字符串,确定为上述目标页面元素的名称。
在示出的一实施例中,上述装置400还包括:
转换模块,基于预先构建的映射算法,将上述目标页面元素中的繁体字转换为简体字。
在示出的一实施例中,上述第三确定模块,包括:
将上述英文字符串输入预先训练的关键词提取模型中进行计算,得到与上述英文字符串对应的关键词;
将上述关键词,确定为上述目标页面元素的名称。
在示出的一实施例中,上述装置400还包括:
添加模块,如果上述目标页面元素为容器元素,则在上述目页面元素的名称中添加指示上述目标页面元素为容器元素的标识。
在示出的一实施例中,上述添加模块,包括:
从上述容器元素中各元素的名称中,提取关键词;
将各关键词进行组合,得到上述目标页面元素的名称;
在上述名称中添加指示上述目标页面元素为容器元素的标识。
本申请示出的前端页面元素的命名装置的实施例可以应用于前端页面元素的命名设备上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在电子设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图5所示,为本申请示出的一种前端页面元素的命名设备的硬件结构图,除了图5所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的电子设备通常根据该电子设备的实际功能,还可以包括其他硬件,对此不再赘述。
请参考图5所示的一种前端页面元素的命名设备,上述设备包括:处理器;
用于存储处理器可执行指令的存储器;
其中,上述处理器被配置为调用上述存储器中存储的可执行指令,实现权利要求1至14中任一项上述的前端页面元素的命名方法。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权限要求来限制。
以上上述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (15)

1.前端页面元素的命名方法,包括:
当目标页面元素为图像元素时,计算所述目标页面元素,与预设图像库中的各图像之间的相似度;
确定计算出的所述相似度中的最大相似度;
将计算所述最大相似度时对应的所述预设图像库中的图像的名称,确定为所述目标页面元素的名称。
2.根据权利要求1所述的方法,所述计算所述目标页面元素,与预设图像库中的各图像之间的相似度,包括:
将所述目标页面元素的元素数据输入预先训练的分类模型中进行计算,得到所述目标页面元素的分类结果;其中,所述分类模型为基于若干被标注了分类结果的样本训练得到的神经网络模型;
从预设图像库中,查找与所述目标页面元素的分类结果相同的图像;
计算所述目标页面元素,与查找出的各图像之间的相似度。
3.根据权利要求1所述的方法,还包括:
当目标页面元素为文本元素时,将所述目标页面元素的元素数据输入预先训练的翻译模型中进行计算,得到与所述目标页面元素对应的英文字符串;
将所述英文字符串,确定为所述目标页面元素的名称。
4.根据权利要求3所述的方法,还包括:
基于预先构建的映射算法,将所述目标页面元素中的繁体字转换为简体字。
5.根据权利要求3所述的方法,所述将所述英文字符串,确定为所述目标页面元素的名称,包括:
将所述英文字符串输入预先训练的关键词提取模型中进行计算,得到与所述英文字符串对应的关键词;
将所述关键词,确定为所述目标页面元素的名称。
6.根据权利要求1-5任一所述的方法,还包括:
如果所述目标页面元素为容器元素,则在所述目标页面元素的名称中添加指示所述目标页面元素为容器元素的标识。
7.根据权利要求6所述的方法,所述在所述目标页面元素的名称中添加指示所述目标页面元素为容器元素的标识,包括:
从所述容器元素中各元素的名称中,提取关键词;
将各关键词进行组合,得到所述目标页面元素的名称;
在所述名称中添加指示所述目标页面元素为容器元素的标识。
8.前端页面元素的命名装置,包括:
计算模块,当目标页面元素为图像元素时,计算所述目标页面元素,与预设图像库中的各图像之间的相似度;
第一确定模块,确定计算出的所述相似度中的最大相似度;
第二确定模块,将计算所述最大相似度时对应的所述预设图像库中的图像的名称,确定为所述目标页面元素的名称。
9.根据权利要求8所述的装置,所述计算模块,包括:
将所述目标页面元素的元素数据输入预先训练的分类模型中进行计算,得到所述目标页面元素的分类结果;其中,所述分类模型为基于若干被标注了分类结果的样本训练得到的神经网络模型;
从预设图像库中,查找与所述目标页面元素的分类结果相同的图像;
计算所述目标页面元素,与查找出的各图像之间的相似度。
10.根据权利要求8所述的装置,还包括:
模型计算模块,当目标页面元素为文本元素时,将所述目标页面元素的元素数据输入预先训练的翻译模型中进行计算,得到与所述目标页面元素对应的英文字符串;
第三确定模块,将所述英文字符串,确定为所述目标页面元素的名称。
11.根据权利要求10所述的装置,还包括:
转换模块,基于预先构建的映射算法,将所述目标页面元素中的繁体字转换为简体字。
12.根据权利要求10所述的装置,所述第三确定模块,包括:
将所述英文字符串输入预先训练的关键词提取模型中进行计算,得到与所述英文字符串对应的关键词;
将所述关键词,确定为所述目标页面元素的名称。
13.根据权利要求8-12任一所述的装置,还包括:
添加模块,如果所述目标页面元素为容器元素,则在所述目页面元素的名称中添加指示所述目标页面元素为容器元素的标识。
14.根据权利要求13所述的装置,所述添加模块,包括:
从所述容器元素中各元素的名称中,提取关键词;
将各关键词进行组合,得到所述目标页面元素的名称;
在所述名称中添加指示所述目标页面元素为容器元素的标识。
15.前端页面元素的命名设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器中存储的可执行指令,实现权利要求1至14中任一项所述的前端页面元素的命名方法。
CN202010384139.6A 2020-05-09 2020-05-09 前端页面元素的命名方法、装置及电子设备 Active CN111291208B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010384139.6A CN111291208B (zh) 2020-05-09 2020-05-09 前端页面元素的命名方法、装置及电子设备
CN202011325561.0A CN112307235B (zh) 2020-05-09 2020-05-09 前端页面元素的命名方法、装置及电子设备
PCT/CN2021/092136 WO2021227951A1 (zh) 2020-05-09 2021-05-07 前端页面元素的命名

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010384139.6A CN111291208B (zh) 2020-05-09 2020-05-09 前端页面元素的命名方法、装置及电子设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202011325561.0A Division CN112307235B (zh) 2020-05-09 2020-05-09 前端页面元素的命名方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111291208A true CN111291208A (zh) 2020-06-16
CN111291208B CN111291208B (zh) 2020-11-10

Family

ID=71021032

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010384139.6A Active CN111291208B (zh) 2020-05-09 2020-05-09 前端页面元素的命名方法、装置及电子设备
CN202011325561.0A Active CN112307235B (zh) 2020-05-09 2020-05-09 前端页面元素的命名方法、装置及电子设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202011325561.0A Active CN112307235B (zh) 2020-05-09 2020-05-09 前端页面元素的命名方法、装置及电子设备

Country Status (2)

Country Link
CN (2) CN111291208B (zh)
WO (1) WO2021227951A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021227951A1 (zh) * 2020-05-09 2021-11-18 支付宝(杭州)信息技术有限公司 前端页面元素的命名

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140189640A1 (en) * 2013-01-03 2014-07-03 International Business Machines Corporation Native Language IDE Code Assistance
CN106339479A (zh) * 2016-08-30 2017-01-18 深圳市金立通信设备有限公司 一种图片命名方法及终端
CN107239490A (zh) * 2017-04-24 2017-10-10 北京小米移动软件有限公司 一种命名人脸图像的方法、装置及计算机可读存储介质
CN107291430A (zh) * 2016-03-31 2017-10-24 富士通株式会社 命名方法和命名系统
CN107463683A (zh) * 2017-08-09 2017-12-12 上海壹账通金融科技有限公司 代码元素的命名方法及终端设备
US20180218208A1 (en) * 2017-01-30 2018-08-02 Canon Kabushiki Kaisha Image processing apparatus, control method therefor, and storage medium
CN109508191A (zh) * 2018-11-22 2019-03-22 北京腾云天下科技有限公司 一种代码生成方法及系统
CN109828748A (zh) * 2018-12-15 2019-05-31 深圳壹账通智能科技有限公司 代码命名方法、系统、计算机装置及计算机可读存储介质
CN109933528A (zh) * 2019-03-11 2019-06-25 恒生电子股份有限公司 一种自动化脚本封装的方法及装置
CN109992266A (zh) * 2017-12-29 2019-07-09 阿里巴巴集团控股有限公司 一种界面元素的处理方法和装置
CN110399586A (zh) * 2019-07-31 2019-11-01 深圳前海微众银行股份有限公司 web界面元素的自动化处理方法、装置、设备及介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9978025B2 (en) * 2013-03-20 2018-05-22 Cisco Technology, Inc. Ordered-element naming for name-based packet forwarding
WO2020068945A1 (en) * 2018-09-26 2020-04-02 Leverton Holding Llc Named entity recognition with convolutional networks
CN109543516A (zh) * 2018-10-16 2019-03-29 深圳壹账通智能科技有限公司 签约意向判断方法、装置、计算机设备和存储介质
CN111291208B (zh) * 2020-05-09 2020-11-10 支付宝(杭州)信息技术有限公司 前端页面元素的命名方法、装置及电子设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140189640A1 (en) * 2013-01-03 2014-07-03 International Business Machines Corporation Native Language IDE Code Assistance
CN107291430A (zh) * 2016-03-31 2017-10-24 富士通株式会社 命名方法和命名系统
CN106339479A (zh) * 2016-08-30 2017-01-18 深圳市金立通信设备有限公司 一种图片命名方法及终端
US20180218208A1 (en) * 2017-01-30 2018-08-02 Canon Kabushiki Kaisha Image processing apparatus, control method therefor, and storage medium
CN107239490A (zh) * 2017-04-24 2017-10-10 北京小米移动软件有限公司 一种命名人脸图像的方法、装置及计算机可读存储介质
CN107463683A (zh) * 2017-08-09 2017-12-12 上海壹账通金融科技有限公司 代码元素的命名方法及终端设备
CN109992266A (zh) * 2017-12-29 2019-07-09 阿里巴巴集团控股有限公司 一种界面元素的处理方法和装置
CN109508191A (zh) * 2018-11-22 2019-03-22 北京腾云天下科技有限公司 一种代码生成方法及系统
CN109828748A (zh) * 2018-12-15 2019-05-31 深圳壹账通智能科技有限公司 代码命名方法、系统、计算机装置及计算机可读存储介质
CN109933528A (zh) * 2019-03-11 2019-06-25 恒生电子股份有限公司 一种自动化脚本封装的方法及装置
CN110399586A (zh) * 2019-07-31 2019-11-01 深圳前海微众银行股份有限公司 web界面元素的自动化处理方法、装置、设备及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YIU-KAI D. NG 等: "Detecting Similar HTML Documents Using a Fuzzy Set Information Retrieval Approach", 《BRIGHAM YOUNG UNIVERSITY BYU SCHOLARSARCHIVE》 *
于海鹏 等: "基于Web的应用系统前端页面性能优化", 《福建电脑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021227951A1 (zh) * 2020-05-09 2021-11-18 支付宝(杭州)信息技术有限公司 前端页面元素的命名

Also Published As

Publication number Publication date
CN111291208B (zh) 2020-11-10
CN112307235A (zh) 2021-02-02
WO2021227951A1 (zh) 2021-11-18
CN112307235B (zh) 2024-02-20

Similar Documents

Publication Publication Date Title
EP3819785A1 (en) Feature word determining method, apparatus, and server
CN110580308B (zh) 信息审核方法及装置、电子设备、存储介质
WO2021068683A1 (zh) 正则表达式生成方法、装置、服务器及计算机可读存储介质
CN107229627B (zh) 一种文本处理方法、装置及计算设备
CN108027814B (zh) 停用词识别方法与装置
CN110334209B (zh) 文本分类方法、装置、介质及电子设备
WO2010088052A1 (en) Methods and systems for matching records and normalizing names
US11651014B2 (en) Source code retrieval
WO2019028990A1 (zh) 代码元素的命名方法、装置、电子设备及介质
CN109857957B (zh) 建立标签库的方法、电子设备及计算机存储介质
CN110263127A (zh) 基于用户查询词进行文本搜索方法及装置
CN111782892B (zh) 基于前缀树的相似字符识别方法、设备、装置和存储介质
CN113986950A (zh) 一种sql语句处理方法、装置、设备及存储介质
CN110941951A (zh) 文本相似度计算方法、装置、介质及电子设备
CN115953123A (zh) 机器人自动化流程的生成方法、装置、设备及存储介质
CN111291208B (zh) 前端页面元素的命名方法、装置及电子设备
CN116932730B (zh) 基于多叉树和大规模语言模型的文档问答方法及相关设备
CN109902162B (zh) 基于数字指纹的文本相似性的识别方法、存储介质及装置
Liao et al. Doctr: Document transformer for structured information extraction in documents
CN112328655A (zh) 文本标签挖掘方法、装置、设备及存储介质
CN115080748B (zh) 一种基于带噪标签学习的弱监督文本分类方法和装置
CN116578700A (zh) 日志分类方法、日志分类装置、设备及介质
CN115294593A (zh) 一种图像信息抽取方法、装置、计算机设备及存储介质
CN111310442B (zh) 形近字纠错语料挖掘方法、纠错方法、设备及存储介质
CN114492390A (zh) 基于关键词识别的数据扩充方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant