CN106897447B - 一种基于规则电气图纸箱号的自动化查找方法 - Google Patents
一种基于规则电气图纸箱号的自动化查找方法 Download PDFInfo
- Publication number
- CN106897447B CN106897447B CN201710121411.XA CN201710121411A CN106897447B CN 106897447 B CN106897447 B CN 106897447B CN 201710121411 A CN201710121411 A CN 201710121411A CN 106897447 B CN106897447 B CN 106897447B
- Authority
- CN
- China
- Prior art keywords
- text
- case number
- case
- candidate
- distribution box
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S50/00—Market activities related to the operation of systems integrating technologies related to power network operation or related to communication or information technologies
- Y04S50/14—Marketing, i.e. market research and analysis, surveying, promotions, advertising, buyer profiling, customer management or rewards
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基本规则的电气图纸箱号自动化查找方法,该方法包括:根据正则表达式和文本内容、数目、位置获取箱号候选文本集C、箱号可能文本集P;根据C和P的数量、内容、位置文本确定当前配电箱的箱号;根据图中各箱号的相似关系对可能找错箱号的配电箱进行重新查找箱号;对图内文本全局搜索,对当前的部分箱号进行补充。该方法通过多级优先权及依据箱号文本的关系进行修正及附加的方式,经过实践表明,具有很好的容错性、较高的准确率以及优良的可控性,可以显著提高成套电气报价员查找箱号的效率。
Description
技术领域
本发明涉及计算机软件领域,尤其涉及的是一种基于规则电气图纸箱号的自动化查找方法。
背景技术
在电气行业,成套电气报价员需要根据从用户拿到的CAD电气设计图给出成套电气设备的报价。成套电气报价员需要根据这一CAD图与用户进行多次沟通交流。报价员需要首先从CAD图中找出每个需要报价的配电箱的箱号,给出该配电箱的价格,最后汇总给出所有配电箱的报价列表。作为一个很繁琐但又需要有一定领域知识的环节,箱号的查找到目前为止,只能通过报价员自己从CAD图中找出来,或者通过一些扒图软件(如利驰扒图软件)手动抠出箱号文本。
这种传统的箱号查找方式的缺点主要有:
●很大程度上依赖于报价员的背景知识,需要报价员根据知识判断找出箱号文本
●如果一个工程有成百上千个的配电箱需要报价,那么箱号的查找过程也得重复那么多次
●由于报价员的疏忽,漏找了部分箱号,导致工程报价出现比较大的偏差,导致后期需要多次检验校对
●即使通过扒图软件给出了箱号的文本,如“AL2同AL1”,但由于没有格式化的输出这些箱号,扒图软件会得到“AL1AL2同AL1”作为箱号,而这个只能通过报价员自己后期对扒图软件给出的文本进行再次编辑,得到“AL1AL2”,过程繁琐
●不能自动化实现智能查找
因此,这种传统的只能通过人力去查找箱号的方式在一定程度上影响了报价员报价的速度与准确度,不能满足用户及公司的对快速精准报价方面要求,也影响了工程的进度。针对成套电气报价领域箱号查找的方式,目前领域内尚未有行之有效的自动化解决方案。
因此,现有技术存在缺陷,需要改进。
发明内容
本发明所要解决的技术问题是:提供一种通过计算机软件自动查找,提高工程报价的速度与精度的基本规则的电气图纸箱号自动化查找方法。
本发明的技术方案如下:
一种基于规则电气图纸箱号的自动化查找方法,包括S1:根据正则表达式和文本内容、数目、位置获取箱号候选文本集C、箱号可能文本集P;S2:根据箱号候选文本集C和箱号可能文本集P的数量、内容、位置文本确定当前配电箱的箱号;S3:根据图中各箱号的相似关系对可能找错箱号的配电箱进行重新查找箱号;S4:对图内文本全局搜索,对当前的部分箱号进行补充。
应用于上述技术方案中,所述的自动化查找方法中,步骤S1中,对于箱号候选文本集C,先通过正则表达式过滤出可能是箱号的文本集合,再删除掉全是中文的文本及在一个配电箱的范围内重复出现的文本;对于箱号可能文本集P,先是通过正则表达式删除掉不可能是箱号的文本,再删除掉全是中文的文本及在一个配电箱的范围内重复出现的文本。
应用于各个上述技术方案中,所述的自动化查找方法中,赋予箱号候选文本集C相对箱号可能文本集P更高的优先权。
应用于各个上述技术方案中,所述的自动化查找方法中,步骤S2中具体包括以下步骤:其中,用|C|表示箱号候选文本集C的文本数目,|P|表示箱号可能文本集P的文本数目;S21:当|C|=0,|P|=0;则规则电气图纸中最左上文本为箱号文本;S22:当|C|=0,|P|=1;箱号可能文本集P中的文本为箱号文本;S23:当|C|=0,|P|>1;如果规则电气图纸中最左上文本在箱号可能文本集P中,则最左上文本为箱号文本;如果规则电气图纸中最左下文本在箱号可能文本集P中,则最左下文本为箱号文本;否则,箱号可能文本集P中最左上的非中文文本为箱号文本;S24:当|C|=1;箱号候选文本集C中的文本为箱号文本;S25:当|C|>1;如果规则电气图纸中最左上文本在箱号候选文本集C中,则最左上文本为箱号文本;如果规则电气图纸中最左下文本在箱号候选文本集C中,则最左下文本为箱号文本;否则,箱号候选文本集C中最左上的非中文文本为箱号文本。
应用于各个上述技术方案中,所述的自动化查找方法中,步骤S2中,在得到具体的箱号文本后,需要对箱号文本进行处理,并附加与该箱号相似的文本同时构成箱号,再进行箱号后处理,以得到正确的并格式化的输出。
应用于各个上述技术方案中,所述的自动化查找方法中,步骤S3中,具体是根据同一张图中的配电箱的箱号之间的相似关系找出当前可能找错箱号的配电箱。
应用于各个上述技术方案中,所述的自动化查找方法中,步骤S4中,在图内全局范围内搜索,找出图中带有“…同…”的文本,对于每个这样的文本,查找当前图中配电箱的箱号中,是否与该文本有关联,如果有关联,则将该文本也附加到与该文本关联的配电箱的箱号中,最后格式化输出。
采用上述方案,本发明通过正则表达式及文本数目、内容、位置信息确定箱号的箱号候选文本集C(简称C)、箱号可行文本集P(简称P),并通过C和P的数量、内容、位置关系确定该配电箱最可能的箱号,最后利用图内各配电箱的箱号之间的关系对找错的箱号重新查找箱号。C内的文本为真实箱号文本的概率大于P内的文本为真实箱号文本的概率,在查找箱号的过程中对C和P查找顺序给了不同的优先级,以这种多级优先级查找方式比单纯只找出可能是箱号的文本进行查找的具有更好的容错性、更高的准确率以及更好的可控性。同时在后期中根据前面找出的箱号文本的内容、箱号之间的相似关系等对前面可能找错箱号的配电箱进行再次箱号查找,再次提高箱号查找的准确率。最后,通过图内文本全局搜索的方式,减少箱号找漏的情况的发生。
附图说明
图1为本发明的连接结构示意图。
具体实施方式
以下结合附图和具体实施例,对本发明进行详细说明。
本实施例提供了一种基于规则电气图纸箱号的自动化查找方法,配电箱箱号自动化查找方法的流程如图1所示,包括以下步骤:
S1:根据正则表达式和文本内容、数目、位置获取箱号候选文本集C、箱号可能文本集P,其中,箱号候选文本集C简称为C,箱号可能文本集P简称为P。
箱号候选文本集C比箱号可能文本集P的定义更严格。对于箱号候选文本集C,首先,通过正则表达式过滤出可能是箱号的文本集合,再删除掉全是中文的文本及在一个配电箱的范围内重复出现的文本;而对于箱号可能文本集P,先是通过正则表达式删除掉不可能是箱号的文本,再删除掉全是中文的文本及在一个配电箱的范围内重复出现的文本。由于C的定义比P更严格,C的文本是真实箱号的可能性比P的文本要大些,因此在方法中给C中的文本赋予了更高的优先权。
C内的文本为真实箱号文本的概率大于P内的文本为真实箱号文本的概率,在查找箱号的过程中对C和P查找顺序给了不同的优先级,以这种多级优先级查找方式比单纯只找出可能是箱号的文本进行查找的具有更好的容错性、更高的准确率以及更好的可控性。
S2:根据C和P的数量、内容、位置文本确定当前配电箱的箱号。
在这一步骤中,根据C和P的数量情况分开进行处理,为方便描述,用|C|示C的文本数目,|P|表示P的文本数目。
表1:
在得到具体的箱号文本后,需要对箱号文本进行处理,并附加与该箱号相似的文本同时构成箱号,再进行箱号后处理,以得到正确的并格式化的输出。
S3:根据图中各箱号的相似关系对可能找错箱号的配电箱进行重新查找箱号
在同一张图中,不同配电箱的箱号在格式上很可能是相似的,在前面进行箱号查找的时候,方法是对每个配电箱都独立地进行查找箱号,因此可以根据同一张图中的配电箱的箱号之间的相似关系找出当前可能找错箱号的配电箱,对这些配电箱的箱号进行重新查找。同时由于中文一般不会是真实的箱号,因此如果当前给出的箱号为中文时,需要对该配电箱进行重新箱号查找。
S4:对图内文本全局搜索,对当前的部分箱号进行补充
在图内全局范围内搜索,找出图中带有“…同…”的文本,对于每个这样的文本,查找当前图中配电箱的箱号中,是否与该文本有关联,如果有关联,则将该文本也附加到与该文本关联的配电箱的箱号中,最后格式化输出。
下面进一步详细描述上述各个步骤:
具体的,上述S1中,候选文本集C所用到正则表达式主要为“^.*A[A-Z]+.*$”,在可能文本集P中,用于删除掉不可能是箱号所用到正则表达式则要多的多,而这一部分就很大程度上依赖于领域知识,其中,最主要的几条正则表达式如表2所示:
表2:
由于箱号文本基本很少出现在配电箱的右侧,因此,需要去掉右侧的文本以减少搜索范围。根据测试,删除掉文本位置在靠近配电箱右侧1/3的文本是一个相对可靠的方法。
上面介绍了如何根据正则表达式及文本数目、位置信息找到候选文本集C及可能文本集P的方法,下面进一步介绍如何通过候选文本集C及可能文本集P得到箱号的方法。
具体的,上述S2中规则电气图纸中最左上文本及规则电气图纸中最左下文本的判断方法是通过文本的中心点与图纸配电箱的左上角、左下角的曼哈顿距离来度量,进行排序后得到的。由于给出的文本全部在配电箱的范围内,因此要查找与图纸配电箱最短的曼哈顿距离的文本可以直接通过文本的Y坐标减去X坐标后的值排序最最小距离得到。当然这里也可以用其它的距离度量方式,如欧几里得距离,而这些都是属于同样思想下的不同计算方式.,就不再赘述。
在得到具体的箱号文本后,需要对箱号文本进行处理,并附加与该箱号相似的文本同时构成箱号,这是因为有时箱号文本不止一个,而有前面的方法中只是找出了一个箱号文本,有时需要根据实际进行进一步的添加箱号文本,以构成完整的箱号。注意到,在一个箱体内的多个箱号文本在大多数情况下是相似的,但这种相似仅仅只是体现在格式上的相似,而不是内容上的相似。如“AL1-1和AC2-1”,这里采用的方法是将英文字母全部替换成”@”字符(其它字符也是可以的,只要不会与原来的文本发生冲突就可以了),将数字全部换成“*”字符。如果当前的箱号文本是在C中找到的,那么就将C中与当前箱号格式完全一致的文本也作为箱号文本,如果当前的箱号文本是在P中找到的,方法也是一样,将P中与当前箱号格式完全一致的文本也作为箱号文本。当得到箱号文本列表时,就需要对箱号文本列表组合成箱号,如方法中找出某个配电箱的箱号文本列表为“AL1箱”、“AL2配电箱”、“AL3(明装)”这三个箱号文本,为格式化输出,需要将这三条文本组合成“AL1、AL2、AL3”,具体的实现方法是通过正则表达式去掉非英文、数字、“-”字符的部分,并通过“、”号将格式化的文本进行连接输出。
具体的,上述S3中根据图中各箱号的相似关系对可能找错箱号的配电箱进行重新查找箱号的过程,这里对可能找错箱号的配电箱主要给出了三种情况:
第一种情况是:找出的箱号全是中文。由于真实的箱号一般不会全是中文,因此,如果一个配电箱的不包括英文、数字、-组合,或者只包含极少的大写英文字母,其中,一般不超过2个大写英文字母,那极有可能该配电箱的箱号查找出错,而这就需要去修正。
第二种情况是:某个配电箱的箱号与其它箱号文本的格式很不一致,如方法找出来的其它配电箱为“AL1”、“AL3”、“AL4”、“AL5”,而当前方法查找出来该箱的箱号为“ATSE”,这时,可以认为该箱的箱号很可能是找错了,需要重新查找箱号文本,因为在一般情况下,同一张图内不同配电箱的箱号在命名都会遵循同一种格式的命名规则。
第三种情况是:两个或多个配电箱的箱号相同、且箱号文本只包含英语、数字、-。将这种情况作为错误情况处理是因为一个正确的配电箱的箱号应该是唯一的,不能同时为两个或多个配电箱的箱号,因为如果出现这种情况,要么是CAD设计师的错误,要么就是箱号查找结果出错。
对于这三种情形的配电箱,需要重新进行箱号文本查找算法,由于这时可以利用其它的配电箱的箱号,因此,在重新进行箱号文本查找时,首先,将其它非中文格式的配电箱箱号取出,得到这些箱号的格式,然后直接将C和P中的文本依据优先级顺序与这些箱号格式进行匹配,如果发现格式是符合的,且该文本又没有与当前所已知的箱号发生冲突的,则将这个文本作为箱号文本,并将与这个文本格式一样的文本也加入箱号文本列表中。
具体的,上述S4中,找出图中“…同…”的文本,这里“…同…”的文本主要指两种情况:
第一种情况:“A与B相同”
第二种情况:“B同A”
对于这两种情况,我们需要分开处理,通过对文本的处理,进而得到A、B列表,然后通过循环查找当前所有的配电箱的箱号,如果发现A或B为某个配电箱的箱号,则将B也作为箱号文本附加到当前所查找的配电箱的箱号中去,以“、”+B的形式附加进去,这种方式可以在一定程度上避免箱号文本找漏情况的发生。
综上所述,本发现提出了一种自动化实现查找配电箱箱号的方法,描述了自动识别配电箱箱号的过程,通过多级优先权及依据箱号文本的关系进行修正及附加的方法具有很好的容错性、较高的准确率以及优良的可控性,可以达到企业对快速报价查找箱号方面的要求。
显然,本领域的技术人员应该理解,上述的本发明的各个模块及各个步骤可以用通用的计算系统实现,它们可以集中在单个计算系统上,或者分布在多个计算系统所组成的网络上,可选地,它们可以用不同的计算机语言来实现,从而,可以将它们存储在存储系统中由计算系统来执行。这样,本发明不限制于任何特定的硬件和软件结合。
以上仅为本发明的较佳实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于规则电气图纸箱号的自动化查找方法,包括,其特征在于:
S1:根据正则表达式和文本内容、数目、位置获取箱号候选文本集C、箱号可能文本集P;
其中,对于箱号候选文本集C的获取,先是通过正则表达式过滤出可能是箱号的文本集合,再删除掉全是中文的文本及在一个配电箱的范围内重复出现的文本;
其中,对于箱号可能文本集P的获取,先是通过正则表达式删除掉不可能是箱号的文本,再删除掉全是中文的文本及在一个配电箱的范围内重复出现的文本;
S2:根据箱号候选文本集C和箱号可能文本集P的数量、内容、位置文本确定当前配电箱的箱号;
其中,用|C|表示箱号候选文本集C的文本数目,|P|表示箱号可能文本集P的文本数目;
S21:当|C|=0,|P|=0;则规则电气图纸中最左上文本为箱号文本;
S22:当|C|=0,|P|=1;箱号可能文本集P中的文本为箱号文本;
S23:当|C|=0,|P|>1;如果规则电气图纸中最左上文本在箱号可能文本集P中,则最左上文本为箱号文本;如果规则电气图纸中最左下文本在箱号可能文本集P中,则最左下文本为箱号文本;否则,箱号可能文本集P中最左上的非中文文本为箱号文本;
S24:当|C|=1;箱号候选文本集C中的文本为箱号文本;
S25:当|C|>1;如果规则电气图纸中最左上文本在箱号候选文本集C中,则最左上文本为箱号文本;如果规则电气图纸中最左下文本在箱号候选文本集C中,则最左下文本为箱号文本;否则,箱号候选文本集C中最左上的非中文文本为箱号文本;
S3:根据图中各箱号的相似关系对可能找错箱号的配电箱进行重新查找箱号;其中,相似关系的第一种情况是:找出的箱号全是中文;第二种情况是:某个配电箱的箱号与其它箱号文本的格式不一致;第三种情况是:两个或多个配电箱的箱号相同、且箱号文本只包含英文字母、数字、-”;
S4:对图内文本全局搜索,对当前的部分箱号进行补充。
2.根据权利要求1所述的自动化查找方法,其特征在于:赋予箱号候选文本集C相对箱号可能文本集P更高的优先权。
3.根据权利要求1所述的自动化查找方法,其特征在于:步骤S2中,在得到具体的箱号文本后,需要对箱号文本进行处理,并附加与该箱号相似的文本同时构成箱号,再进行箱号后处理,以得到正确的并格式化的输出;
其中,在附加与该箱号相似的文本同时构成箱号时,其过程包括:如果当前的箱号文本是在箱号候选文本集C中找到的,那么就将箱号候选文本集C中与当前箱号格式完全一致的文本也作为箱号文本;如果当前的箱号文本是在箱号可能文本集P中找到的,方法也是一样,将箱号可能文本集P中与当前箱号格式完全一致的文本也作为箱号文本;当得到箱号文本列表时,就需要对箱号文本列表组合成箱号。
4.根据权利要求1所述的自动化查找方法,其特征在于:步骤S3中,具体是根据同一张图中的配电箱的箱号之间的相似关系找出当前可能找错箱号的配电箱。
5.根据权利要求1所述的自动化查找方法,其特征在于:步骤S4中,在图内全局范围内搜索,找出图中带有“…同…”的文本,对于每个这样的文本,查找当前图中配电箱的箱号中,是否与该文本有关联,如果有关联,则将该文本也附加到与该文本关联的配电箱的箱号中,最后格式化输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710121411.XA CN106897447B (zh) | 2017-03-02 | 2017-03-02 | 一种基于规则电气图纸箱号的自动化查找方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710121411.XA CN106897447B (zh) | 2017-03-02 | 2017-03-02 | 一种基于规则电气图纸箱号的自动化查找方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106897447A CN106897447A (zh) | 2017-06-27 |
CN106897447B true CN106897447B (zh) | 2018-02-16 |
Family
ID=59185779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710121411.XA Active CN106897447B (zh) | 2017-03-02 | 2017-03-02 | 一种基于规则电气图纸箱号的自动化查找方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106897447B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299675B (zh) * | 2018-09-07 | 2021-05-07 | 广州算易软件科技有限公司 | 一种基于电气图纸的配电箱识别方法和装置 |
CN113486808B (zh) * | 2021-07-08 | 2024-09-13 | 核工业井巷建设集团有限公司 | 一种基于卷积神经网络的配电箱隐患识别方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102637180B (zh) * | 2011-02-14 | 2014-06-18 | 汉王科技股份有限公司 | 基于正则表达式的文字后处理方法和装置 |
GB2490738A (en) * | 2011-05-13 | 2012-11-14 | En Twyn Ltd | A power line communications network controlled by an operating system in which network terminals include a processor. |
US9507563B2 (en) * | 2013-08-30 | 2016-11-29 | Cavium, Inc. | System and method to traverse a non-deterministic finite automata (NFA) graph generated for regular expression patterns with advanced features |
-
2017
- 2017-03-02 CN CN201710121411.XA patent/CN106897447B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN106897447A (zh) | 2017-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11475209B2 (en) | Device, system, and method for extracting named entities from sectioned documents | |
US20210150128A1 (en) | Method, device, and system, for identifying data elements in data structures | |
CA2777520C (en) | System and method for phrase identification | |
CN104699835B (zh) | 用于确定网页页面中包括兴趣点poi数据的方法及装置 | |
WO2016165538A1 (zh) | 一种地址数据的管理方法和装置 | |
CN108376160A (zh) | 一种中文知识图谱构建方法和系统 | |
CN104765729B (zh) | 一种跨平台微博社区账户匹配方法 | |
EP3256962A1 (en) | Finding documents describing solutions to computing issues | |
CN104750795A (zh) | 一种智能语义检索系统和方法 | |
CN113033198B (zh) | 相似文本推送方法、装置、电子设备及计算机存储介质 | |
BRPI0706740A2 (pt) | método e sistema para gerenciar dados de fretamento | |
CN105630884A (zh) | 一种微博热点事件的地理位置发现方法 | |
US20190102697A1 (en) | Creating machine learning models from structured intelligence databases | |
CN104008093A (zh) | 用于中文姓名音译的方法和系统 | |
CN113887941B (zh) | 业务流程生成方法、装置、电子设备及介质 | |
CN106897447B (zh) | 一种基于规则电气图纸箱号的自动化查找方法 | |
US10565188B2 (en) | System and method for performing a pattern matching search | |
CN116797195A (zh) | 工单处理方法、装置、计算机设备和计算机可读存储介质 | |
CN106155998A (zh) | 一种数据处理方法及装置 | |
CN112905746A (zh) | 一种基于知识图谱技术的制度档案知识挖掘处理方法 | |
CN113434413B (zh) | 基于数据差异的数据测试方法、装置、设备及存储介质 | |
CN113326363B (zh) | 搜索方法及装置、预测模型训练方法及装置、电子设备 | |
CN115114419A (zh) | 问答处理方法、装置、电子设备和计算机可读介质 | |
CN110309258B (zh) | 一种输入检查方法、服务器和计算机可读存储介质 | |
Mahmood et al. | Public bus commuter assistance through the named entity recognition of twitter feeds and intelligent route finding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CB03 | Change of inventor or designer information |
Inventor after: Zhan Jianzhou Inventor after: Wu Heyang Inventor after: Li Bendong Inventor after: Sun Eran Inventor before: Zhan Jianzhou Inventor before: Wu Heyang Inventor before: Li Bendong Inventor before: Sun Eran |
|
CB03 | Change of inventor or designer information |