CN114912002A - 电子元器件搜索方法、装置、电子设备及存储介质 - Google Patents
电子元器件搜索方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114912002A CN114912002A CN202210600432.0A CN202210600432A CN114912002A CN 114912002 A CN114912002 A CN 114912002A CN 202210600432 A CN202210600432 A CN 202210600432A CN 114912002 A CN114912002 A CN 114912002A
- Authority
- CN
- China
- Prior art keywords
- text
- search
- searched
- searching
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 238000004140 cleaning Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 239000003990 capacitor Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种电子元器件搜索方法、装置、电子设备及存储介质,属于文本处理领域,该方法包括:读取搜索框中的初始文本,并对初始文本进行预处理获得待搜索文本;基于待搜索文本的文本属性进入对应的搜索场景;基于待搜索文本从对应的搜索场景的数据库中进行搜索,获得多个元器件搜索结果;基于所述待搜索文本中各个搜索词的权重及元器件搜索结果中的的各个命中项进行打分,基于打分结果及热度将所述元器件搜索结果依次输出,每个所述元器件搜索结果包括一个或多个所述命中项。由此,确定搜索文本的文本属性后,在对应搜索场景中搜索,无需从庞大的原始数据库中搜索,可以极大的减轻搜索负担,提升搜索速度和搜索准确度。
Description
技术领域
本申请涉及文本处理领域,具体涉及一种电子元器件搜索方法、装置、电子设备及存储介质。
背景技术
电子元器件交易平台是电子元器件的线上交易市场,用户可以通过电子元器件平台挑选意向电子元器件。一般地,电子元器件交易平台根据用户输入的信息筛选出部分电子元器件以供用户挑选。然而用户输入的信息并没有统一的规范,还经常包含型号、参数等信息。由于型号、参数等信息的字符比较多且复杂,目前很多的电子元器件交易平台只会抓取用户输入的部分内容进行搜索,有时难以匹配出用户所需要的电子元器件产品,因此当前电子元器件的搜索存在准确性低的问题。
发明内容
有鉴于此,本申请提供了一种电子元器件搜索方法,解决了当前电子元器件搜索准确性低的技术问题。
根据本申请的一个方面,提出了一种电子元器件搜索方法,包括:读取搜索框中的初始文本,并对所述初始文本进行预处理获得待搜索文本;基于所述待搜索文本的文本属性进入对应的搜索场景;基于所述待搜索文本从对应的搜索场景数据库中进行搜索,获得多个元器件搜索结果;基于所述待搜索文本中各个搜索词的权重及元器件搜索结果中的的各个命中项进行打分,基于打分结果及热度将所述元器件搜索结果依次输出,每个所述元器件搜索结果包括一个或多个所述命中项。
在一可能实施例中,所述读取搜索框中的初始文本,并对所述初始文本进行预处理获得待搜索文本,包括:接收到搜索指令后,读取所述搜索框中的所述初始文本;按预设流程对所述初始文本进行清洗、分词、识别,获得待搜索文本。
在一可能实施例中,所述搜索场景包括分类词搜索场景、型号搜索场景、关键词搜索场景;所述基于所述待搜索文本的文本属性进入对应的搜索场景,包括:若所述待搜索文本仅包括分类词,则确定所述待搜索文本的所述文本属性为分类词属性,进入预先构建的分类词搜索场景;或者若所述待搜索文本仅包括型号,则确定所述待搜索文本的所述文本属性为型号属性,进入预先构建的型号搜索场景;或者若所述待搜索文本未包括所述分类词、所述型号中的任意一个,或者所述待搜索文本同时包括搜索分类词和搜索型号,则确定所述待搜索文本的所述文本属性为关键词分类属性,进入预先构建的关键词搜索场景。
在一可能实施例中,所述确定所述待搜索文本的所述文本属性为关键词分类属性,并进入预先构建的关键词搜索场景之后,还包括:获取所述待搜索文本的各个关键词,基于各个所述关键词的参数确定各个所述关键词的关键词属性;根据各个关键词属性的预设权重分别标注各个所述关键词的权重,以供基于各个所述关键词的所述权重进行搜索。
在一可能实施例中,所述基于所述待搜索文本中各个搜索词的权重对所述元器件搜索结果中的各个命中项进行打分,基于打分结果及热度将所述元器件搜索结果依次输出,包括:将所述元器件搜索结果出现的目标搜索词确定为命中项;基预设权重确定各个所述命中项的权重得分,将各个所述命中项的权重得分之和确定为对应器件搜索结果的打分结果;根据所述打分结果对各个所述元器件搜索结果进行初次排序,并根据热度对初次排序结果进行调整获得最终排序结果,基于所述最终排序结果依次输出所述元器件搜索结果。
在一可能实施例中,在所述读取搜索框中的初始文本,并对所述初始文本进行预处理获得待搜索文本之后,还包括:对所述待搜索文本进行错别字检测,若所述待搜索文本存在错别字,对所述错别字进行纠正,获得纠正后的待搜索文本。
在一可能实施例中,在所述基于所述待搜索文本从对应的所述搜索场景数据库中进行搜索,获得元器件搜索结果之后,还包括:若所述电子元器件搜索结果为空,则输出未搜索到匹配电子元器件产品的提示信息,并输出预设电子元器件产品的相关信息。
作为本申请的另一个方面,提出了一种电子元器件搜索装置,包括:读取模块,用于读取搜索框中的初始文本,并对所述初始文本进行预处理获得待搜索文本;搜索场景进入模块,基于所述待搜索文本的文本属性进入对应的搜索场景;搜索模块,基于所述待搜索文本从对应的搜索场景数据库中进行搜索,获得多个元器件搜索结果;打分模块,基于所述待搜索文本中各个搜索词的权重及元器件搜索结果中的的各个命中项进行打分,基于打分结果及热度将所述元器件搜索结果依次输出,每个所述元器件搜索结果包括一个或多个所述命中项。
作为本申请的第三个方面,一种电子设备,所述电子设备包括:处理器;以及用于存储所述处理器可执行信息的存储器;其中,所述处理器用于执行如上所述的电子元器件搜索方法。
作为本申请的第四个方面,提出了一种计算机可读存储介质,所述计算机可读存储介质上存储有电子元器件搜索程序,所述电子元器件搜索程序被处理器运行时实现如上所述的方法的步骤。
相比现有技术,本申请提供了一种电子元器件搜索方法、装置、电子设备及存储介质,该方法包括:读取搜索框中的初始文本,并对所述初始文本进行预处理获得待搜索文本;基于所述待搜索文本的文本属性进入对应的搜索场景;基于所述待搜索文本从对应的搜索场景数据库中进行搜索,获得多个元器件搜索结果;基于所述待搜索文本中各个搜索词的权重及元器件搜索结果中的的各个命中项进行打分,基于打分结果及热度将所述元器件搜索结果依次输出,每个所述元器件搜索结果包括一个或多个所述命中项景,在该所述搜索场景下中进行搜索,从而不需要从庞大的原始数据库中搜索,可以极大的减轻搜索负担,提升搜索速度,并且由于是在对应的场景下搜索,可以充分利用用户的信息进行搜索,也能提高搜索的准确度。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1所示为本申请一实施例提供的一种电子元器件搜索方法的流程示意图;
图2所示为本申请另一实施例提供的一种电子元器件搜索方法的流程示意图;
图3所示为本申请另一实施例提供的一种电子元器件搜索方法的流程示意图;
图4所示为本申请一实施例提供的电子元器件搜索装置的组成示意图;
图5所示为本申请一实施例提供的电子设备的结构示意图。
具体实施例方式
本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。本申请实施例中所有方向性指示(诸如上、下、左、右、前、后、顶、底……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
另外,在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1所示为本申请一实施例提供的一种电子元器件搜索方法的流程示意图。如图1所示,电子元器件搜索方法包括:
步骤S101:读取搜索框中的初始文本,并对所述初始文本进行预处理获得待搜索文本;
电子元器件交易平台汇聚各种类型的电子元器件的信息,用户可以在电子元器件交易平台上寻找所需要的电子元器件。一般地,电子元器件搜索平台设置有搜索框,以供用户在所述搜索框中输入所需要的电子元器件的相关信息,形成初始文本,用户输入完成后再点击预设的搜索按钮,则可触发搜索指令。
当电子元器件搜索装置接收到搜索指令后,读取搜索框中的初始文本,并对该初始文本进行预处理,获得便于在数据库中搜索的待搜索文本。一般的,待搜索文本去除了初始文本中的连接符、空格、制表符等没有实际意义的字符。
步骤S102:基于所述待搜索文本的文本属性进入对应的搜索场景;
本实施例中,文本属性包括分类词和型号,确定文本属性后,进入对应的搜索场景,具体地:
若所述待搜索文本包括分类词,则确定所述待搜索文本的所述文本属性为分类词属性,进入预先构建的分类词搜索场景;
电子元器件的分类词表示电子元器件类别,包括电阻、电容、电感、滤波器、晶振、二极管、光纤、光耦、隔离器等。若待搜索文本中包含分类词,则表明文本属性为分类词,并进入预先构建的分类词搜索场景。
在分类词场景中,每个分类词都对应于一个专属数据库,专属数据库中包括属于该分类的所有的电子元器件产品。在分类词搜索场景中,包括该分类词下的所有电子元器件,基于该分类词及其它相关信息即可搜索出用户所需要的电子元器件产品。
若所述待搜索文本包括型号,则确定所述待搜索文本的所述文本属性为型号属性,进入预先构建的型号搜索场景;
型号一般是字母与数字的组合,型号是以产品的一种或几种具有代表性的特性为主,对产品作出的代号性的表示,不同型号产品的功用可以是相同的也可以是不同的,相同功用的产品对于不同的生产厂商而言也可以使用不同的型号,即使技术参数完全相同,但不同厂家的型号可以不同。对于同一生产商,功用相同而型号不同的系列产品,通常其型号的使用必须遵守事先制订好的技术文件中约定的准则,这种情况下,每一型号产品的基本功用(或声明用途)必须是相同的,但可以基于配置和附件等诸方面的不同,在产品的附加和扩展功能上可以存在区别。通常,国家标准、行业标准或地方标准中不强行规定产品的通用型号。
一般的,同一个型号下可以包括一个或多个电子元器件产品。对于文本属性为型号属性的待搜索文本,基于型号一般能搜索出匹配度很高的电子元器件,但是若型号输入有误或者电子元器件交易平台未收录该型号的产品则会导致元器件搜索结果为空。
若所述待搜索文本未包括所述分类词、所述型号中的任意一个,或者所述待搜索文本同时包括搜索分类词和搜索型号,或者包括分类词及其他词、或者包括型号及其他词、或者既包括分类词、型号还包括其他词,则确定所述待搜索文本的所述文本属性为关键词分类属性,进入预先构建的关键词搜索场景;其中,其他词是指与电子元器件相关的描述词汇,但是不包括本实施例中提及的分类词、型号。
在所述关键词分类场景中,基于各个关键词、分类词、型号进行搜索。具体地,获取所述待搜索文本的各个关键词,基于各个所述关键词的参数确定各个所述关键词的关键词属性;其中关键词属性包括电容值、制造商、容量、功能等。
一般地,用户根据个人习惯在搜索框中输入文本,不同用户的输入方式、习惯均不相同。为了消除用户习惯对搜索造成的影响,本实施例根据各个关键词属性的预设权重分别标注各个所述关键词的权重,以供基于各个所述关键词的所述权重进行搜索。
为各个关键词属性标注预设权重,由此可以按权重从高到低的顺序进行搜索,例如将制造商的权重设置为5,将分类属性的权重设置为3,将电容值属性的权重设置为2,将型号属性的权重设置为60。
步骤S103:基于所述待搜索文本从对应的搜索场景数据库中进行搜索,获得元器件搜索结果;
确定搜索场景后,基于所述待搜索文本中各个词的权重从所述搜索场景对应的数据库中进行搜索,获得与待搜索文本对应的电子元器件及其咨询、加工等电子元器件搜索结果。对于关键词搜索场景,需要合理设置分类词、型号及关键词的权重,以供按文本的权重进行搜索。
由于本实施例中的搜索是在搜索场景对应的搜索场景数据库中搜索获得的,因此元器件搜索结果的总量会小于直接从原始数据库中搜索获得的结果,有助于用户快速获得所需要的电子产品。
本实施例中,型号对应的搜索场景是从原始数据库中,基于型号对电子产品的信息进行分类汇总,获得了型号搜索场景数据库;分类词对应的搜索场景是从原始数据库中,基于分类词对电子产品的信息进行分类汇总,获得了分类词搜索场景数据库;关键词搜索场景数据库包含分类词、型号以及其他词,是包含其余两个数据库中的所有数据。可以理解地,分类词、型号、关键词对应的搜索场景数据库中的很多数据是重合的,各个搜索场景数据库中没有清晰、严格的界限。
步骤S104:基于所述待搜索文本中各个搜索词的权重及元器件搜索结果中的的各个命中项进行打分,基于打分结果及热度将所述元器件搜索结果依次输出,每个所述元器件搜索结果包括一个或多个所述命中项。
具体地,将所述元器件搜索结果出现的目标搜索词确定为命中项;可以理解地每个元器件结果中都包括多个描述词,将与目标搜索词一致的一个或多个描述词确定为命中项。例如,若元器件搜索结果中包括与搜索词中一致的型号,则型号为命中项。可以理解地,若搜索词为多个,则对应的命中项的相数可以为一项或多项。
基预设权重确定各个所述命中项的权重得分,将各个所述命中项的权重得分之和确定为对应器件搜索结果的打分结果;
根据所述打分结果对各个所述元器件搜索结果进行初次排序,并根据热度对初次排序结果进行调整获得最终排序结果,基于所述最终排序结果依次输出所述元器件搜索结果。
本实施例根据权重得分、热度将所述电子元器件搜索结果进行排序后依次输出。其中,权重得分由元器件搜索结果中的命中个数及各个命中项的预设权重。
电子元器件产品的热度由浏览量、收藏量、咨询量、销量等数据决定。所述元器件搜索结果中的电子元器件产品的预设数据包括浏览量、收藏量、咨询量、销量。并且,各个数据的权重可以根据需要设置,例如将销量的权重设置为8,将收藏量的权重设置为5,本实施例可以将权重与对应数据的乘积作为该项数据的热度。
获得权重打分结果后,将元器件搜索结果中的各个电子元器件的按打分结果分进行初次排序:将打分结果中得分高的电子元器件产品排在前面,将相关性得分低的电子元器件产品排在后面。
进一步地,在初次排序后,再基于各个元器件搜索结果对元器件搜索结果进行最终排序:在初次排序的基础上,对应相同打分结果的元器件搜索结果,则将热度高的排在前面,如此对排序结果进行微调,获得最终排序结果。例如当有两个搜索结果的打分结果都是70,但是一个热度为9,一个为6,那么热度9的排在前面,热度6的排在后面。
如此,根据相关性得分输出电子元器件搜索结果,可以让用户获得自己所需要的电子元器件产品,又可以间接了解各个产品的热度,能更好的帮助用户筛选所需要的产品。
此外,若所述电子元器件搜索结果为空,则输出未搜索到匹配电子元器件产品的提示信息,并输出预设电子元器件产品的相关信息。若电子元器件交易平台未收录所述待搜索文本对应的电子产品则会导致元器件搜索结果为空。或者,若待搜索文本中的型号或其它参数有误,也会导致搜索不到对应的电子元器件产品。若元器件搜索结果为空,则输出未搜索到匹配电子元器件产品的提示信息,该提示信息包括文字、图片、声音中的一种或多种的结合。
预设电子元器件产品可以是热度排名前十的产品、平台主推的电子元器件产品、优惠力度大的电子元器件产品、新上架的电子元器件产品、销量排名前十的电子元器件产品等。或者,根据用户的历史搜索记录,将预设电子元器件产品设置为用户曾经搜索过的电子器件产品。
由此,确定搜索文本的文本属性后,进入对应的搜索场景,在该所述场景下对应的数据库中进行搜索,从而不需要从庞大的数据库中搜索,可以极大的减轻搜索负担,提升搜索速度,并且由于是在对应的场景下搜索,也能提高搜索的准确度。
图2所示为本申请另一实施例提供的一种电子元器件搜索方法的流程示意图。如图2所示,所述步骤S101包括:
步骤S1011:接收到搜索指令后,读取所述搜索框中的所述初始文本;
一般地,电子元器件搜索平台设置有搜索框,以供用户在所述搜索框中输入所需要的电子元器件的相关信息,形成初始文本,用户输入完成后再点击预设的搜索按钮,则可触发搜索指令。
当电子元器件搜索装置接收到搜索指令后,读取搜索框中的初始文本,并对该初始文本进行预处理,获得便于在数据库中搜索的待搜索文本。
步骤S1012:按预设流程对所述初始文本进行清洗、分词、识别,获得待搜索文本。
清洗是从所述初始文本中保留有价值的文本,并删除无价值的文本,本实施例可以通过去重、删除和标注等方式进行清洗,或者通过规则提取内容、正则表达式匹配、根据词性和命名实体提取、编写脚本或者代码批处理等方式进行清洗。
分词是将所述初始文本处理成最小单位粒度的词或者词语。本实施例可以采用基于字符串匹配的分词方法、基于理解的分词方法、基于统计的分词方法、基于规则的分词方法等分词方法进行分词。
识别是对清洗、分词后的文本进行识别,获得该文本的属性。
对所述初始文本进行清洗、分词、识别后获得的待搜索文本仅包括分类词、型号以及其它参数。因此,对初始文本进行预处理获得待搜索文本,可以去除初始文本中的多余字符,获得更加标准的待搜索文本,能提高搜索的效率及准确性。
图3所示为本申请另一实施例提供的一种电子元器件搜索方法的流程示意图。如图3所示,所述步骤S101之后,还包括:
步骤S1013:对所述待搜索文本进行错别字检测,若所述待搜索文本存在错别字,对所述错别字进行纠正,获得纠正后的待搜索文本。
每个用户的文本输入习惯不同,在搜索框中获得的待搜索文本难免会存在错字、别字,而错别字会直接影响元器件搜索结果。
本实施例基于自然语言处理领域中基于数据流编程(dataflow programming,数据流编程)的符号数学系统TensorFlow来对待搜索文本中的错别字进行检测并纠正。
首先构建语料库,所述语料库包括电子元器件领域内的所有分类、型号、名称、制造商、功能等词汇。然后将所述待搜索文本中的词汇与语料库中保存的词汇进行对比,将所述待搜索文本中未出现在语料库中的词汇确定为错别字。
进一步地,对错别字进行纠正。首先通过编辑距离(edit distance)为错别字创建一个正确的候选词列表,然后根据正确词汇的可能性,基于以下规则对正确词汇的候选词列表进行排序:
如果候选词的拼音与存在错别字词汇的拼音完全匹配,则将该候选词排在第一位,这意味着它们是最有可能被选中的短语;否则,如果候选词的第一个字的拼音与存在错别字词汇第一个字的拼音匹配,则将该候选词排在第二位,将其它候选词排在第三位。如此,即可将排在第一位的候选词作为纠正后的待搜索文本。
本实施例对基于自然语言处理对待搜索文本中的错别字进行检测,以获得正确的待搜索词汇,从而可以扫清搜索障碍,提高搜索效率和准确性。
作为本申请的另一方面,本申请提供了一种电子元器件搜索装置,图4所示为本申请提供的一种电子元器件搜索装置的组成示意图,其中,所述电子元器件搜索装置1包括:
读取模块11,用于读取搜索框中的初始文本,并对所述初始文本进行预处理获得待搜索文本;
搜索场景进入模块12,基于所述待搜索文本的文本属性进入对应的搜索场景;
搜索模块13,基于所述待搜索文本从对应的搜索场景数据库中进行搜索,获得多个元器件搜索结果;
打分模块14,基于所述待搜索文本中各个搜索词的权重及元器件搜索结果中的的各个命中项进行打分,基于打分结果及热度将所述元器件搜索结果依次输出,每个所述元器件搜索结果包括一个或多个所述命中项。
下面,参考图5来描述根据本申请实施例的电子设备。图5所示为本申请一实施例提供的电子设备的结构示意图。
如图5所示,电子设备600包括一个或多个处理器601和存储器602。
处理器601可以是中央处理单元(CPU)或者具有数据处理能力和/或信息执行能力的其他形式的处理单元,并且可以控制电子设备600中的其他组件以执行期望的功能。
存储器602可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序信息,处理器601可以运行所述程序信息,以实现上文所述的本申请的各个实施例的电子元器件搜索方法或者其他期望的功能。
在一个示例中,电子设备600还可以包括:输入装置603和输出装置604,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置603可以包括例如键盘、鼠标等等。
该输出装置604可以向外部输出各种信息。该输出装置604可以包括例如显示器、通信网络及其所连接的远程输出设备等等。
当然,为了简化,图5中仅示出了该电子设备600中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备600还可以包括任何其他适当的组件。
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序信息,所述计算机程序信息在被处理器运行时使得所述处理器执行本说明书中描述的根据本申请各种实施例的电子元器件搜索方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序信息,所述计算机程序信息在被处理器运行时使得所述处理器执行本说明书根据本申请各种实施例的电子元器件搜索方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此发明的原理和新颖的特征一致的最宽范围。
以上所述仅为本申请创造的较佳实施例而已,并不用以限制本申请创造,凡在本申请创造的精神和原则之内,所作的任何修改、等同替换等,均应包含在本申请创造的保护范围之内。
Claims (10)
1.一种电子元器件搜索方法,其特征在于,包括:
读取搜索框中的初始文本,并对所述初始文本进行预处理获得待搜索文本;
基于所述待搜索文本的文本属性进入对应的搜索场景;
基于所述待搜索文本从对应的搜索场景数据库中进行搜索,获得多个元器件搜索结果;
基于所述待搜索文本中各个搜索词的权重及元器件搜索结果中的的各个命中项进行打分,基于打分结果及热度将所述元器件搜索结果依次输出,每个所述元器件搜索结果包括一个或多个所述命中项。
2.根据权利要求1所述的方法,其特征在于,所述读取搜索框中的初始文本,并对所述初始文本进行预处理获得待搜索文本,包括:
接收到搜索指令后,读取所述搜索框中的所述初始文本;
按预设流程对所述初始文本进行清洗、分词、识别,获得待搜索文本。
3.根据权利要求1所述的方法,其特征在于,所述搜索场景包括分类词搜索场景、型号搜索场景、关键词搜索场景;
所述基于所述待搜索文本的文本属性进入对应的搜索场景,包括:
若所述待搜索文本仅包括分类词,则确定所述待搜索文本的所述文本属性为分类词属性,并进入预先构建的分类词搜索场景;或者
若所述待搜索文本仅包括型号,则确定所述待搜索文本的所述文本属性为型号属性,并进入预先构建的型号搜索场景;或者
若所述待搜索文本未包括所述分类词、所述型号中的任意一个,或者所述待搜索文本同时包括搜索分类词和搜索型号,则确定所述待搜索文本的所述文本属性为关键词分类属性,并进入预先构建的关键词搜索场景。
4.根据权利要求3所述的方法,其特征在于,在所述确定所述待搜索文本的所述文本属性为关键词分类属性,并进入预先构建的关键词搜索场景之后,还包括:
获取所述待搜索文本的各个关键词,基于各个所述关键词的参数确定各个所述关键词的关键词属性;
根据各个关键词属性的预设权重分别标注各个所述关键词的权重。
5.根据权利要求1所述的方法,其特征在于,所述基于所述待搜索文本中各个搜索词的权重对所述元器件搜索结果中的各个命中项进行打分,基于打分结果及热度将所述元器件搜索结果依次输出,包括:
将所述元器件搜索结果出现的目标搜索词确定为命中项;
基预设权重确定各个所述命中项的权重得分,将各个所述命中项的权重得分之和确定为对应器件搜索结果的打分结果;
根据所述打分结果对各个所述元器件搜索结果进行初次排序,并根据热度对初次排序结果进行调整获得最终排序结果,基于所述最终排序结果依次输出所述元器件搜索结果。
6.根据权利要求1所述的方法,其特征在于,所述读取搜索框中的初始文本,并对所述初始文本进行预处理获得待搜索文本之后,还包括:
对所述待搜索文本进行错别字检测,若所述待搜索文本存在错别字,对所述错别字进行纠正,获得纠正后的待搜索文本。
7.根据权利要求1所述的方法,其特征在于,在所述基于所述待搜索文本从对应的所述搜索场景数据库中进行搜索,获得元器件搜索结果之后,还包括:
若所述电子元器件搜索结果为空,则输出未搜索到匹配电子元器件产品的提示信息,并输出预设电子元器件产品的相关信息。
8.一种电子元器件搜索装置,其特征在于,包括:
读取模块,用于读取搜索框中的初始文本,并对所述初始文本进行预处理获得待搜索文本;
搜索场景进入模块,基于所述待搜索文本的文本属性进入对应的搜索场景;
搜索模块,基于所述待搜索文本从对应的搜索场景数据库中进行搜索,获得多个元器件搜索结果;
打分模块,基于所述待搜索文本中各个搜索词的权重及元器件搜索结果中的的各个命中项进行打分,基于打分结果及热度将所述元器件搜索结果依次输出,每个所述元器件搜索结果包括一个或多个所述命中项。
9.一种电子设备,其特征在于,所述电子设备包括:
处理器;以及
用于存储所述处理器可执行信息的存储器;
其中,所述处理器用于执行上述权利要求1-7任一项所述的电子元器件搜索方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有电子元器件搜索程序,所述电子元器件搜索程序被处理器运行时实现如权利要求1-7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210600432.0A CN114912002A (zh) | 2022-05-30 | 2022-05-30 | 电子元器件搜索方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210600432.0A CN114912002A (zh) | 2022-05-30 | 2022-05-30 | 电子元器件搜索方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114912002A true CN114912002A (zh) | 2022-08-16 |
Family
ID=82768804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210600432.0A Pending CN114912002A (zh) | 2022-05-30 | 2022-05-30 | 电子元器件搜索方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114912002A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116011396A (zh) * | 2023-01-13 | 2023-04-25 | 深圳市云采网络科技有限公司 | 一种搭建元器件模拟数据的方法、装置及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108831482A (zh) * | 2018-08-24 | 2018-11-16 | 深圳市云采网络科技有限公司 | 一种基于语音识别搜索电子元器件的方法 |
CN110674384A (zh) * | 2019-09-27 | 2020-01-10 | 厦门晶欣电子有限公司 | 一种元器件型号匹配方法 |
-
2022
- 2022-05-30 CN CN202210600432.0A patent/CN114912002A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108831482A (zh) * | 2018-08-24 | 2018-11-16 | 深圳市云采网络科技有限公司 | 一种基于语音识别搜索电子元器件的方法 |
CN110674384A (zh) * | 2019-09-27 | 2020-01-10 | 厦门晶欣电子有限公司 | 一种元器件型号匹配方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116011396A (zh) * | 2023-01-13 | 2023-04-25 | 深圳市云采网络科技有限公司 | 一种搭建元器件模拟数据的方法、装置及电子设备 |
CN116011396B (zh) * | 2023-01-13 | 2023-11-17 | 深圳市云采网络科技有限公司 | 一种搭建元器件模拟数据的方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110502621B (zh) | 问答方法、问答装置、计算机设备及存储介质 | |
KR102158352B1 (ko) | 정책정보 문서의 요지 정보 제공 방법, 정책정보 제공 시스템, 이를 위한 컴퓨터 프로그램 | |
US9489401B1 (en) | Methods and systems for object recognition | |
JP6177871B2 (ja) | 製品情報の公開 | |
KR100682897B1 (ko) | 사전 업데이트 방법 및 그 장치 | |
US9767144B2 (en) | Search system with query refinement | |
US7444325B2 (en) | Method and system for information extraction | |
US20170068660A1 (en) | Automatic Semantic Rating and Abstraction of Literature | |
EP1806694A1 (en) | Method, system and computer program product for identifying primary product objects | |
US20150032747A1 (en) | Method for systematic mass normalization of titles | |
US9558234B1 (en) | Automatic metadata identification | |
US20150302036A1 (en) | Method, system and computer program for information retrieval using content algebra | |
CN111506831A (zh) | 一种协同过滤的推荐模块、方法、电子设备及存储介质 | |
CN110750975B (zh) | 介绍文本生成方法及装置 | |
CN110597978A (zh) | 物品摘要生成方法、系统、电子设备及可读存储介质 | |
US8121970B1 (en) | Method for identifying primary product objects | |
JP3820878B2 (ja) | 情報検索装置,スコア決定装置,情報検索方法,スコア決定方法及びプログラム記録媒体 | |
US10922340B1 (en) | Content extraction for literary work recommendation | |
CN112749272A (zh) | 面向非结构化数据的新能源规划性文本智能推荐方法 | |
CN113988057A (zh) | 基于概念抽取的标题生成方法、装置、设备及介质 | |
CN113901173A (zh) | 一种检索方法、装置、电子设备及计算机存储介质 | |
CN114912002A (zh) | 电子元器件搜索方法、装置、电子设备及存储介质 | |
JP4959603B2 (ja) | ドキュメントを解析するためのプログラム,装置および方法 | |
KR20120038418A (ko) | 탐색 방법 및 디바이스 | |
CN114116736A (zh) | 知识库更新、更新验证和基于知识库的搜索方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |