CN116340627A - 词汇推荐方法、装置、电子设备及存储介质 - Google Patents
词汇推荐方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116340627A CN116340627A CN202310288186.4A CN202310288186A CN116340627A CN 116340627 A CN116340627 A CN 116340627A CN 202310288186 A CN202310288186 A CN 202310288186A CN 116340627 A CN116340627 A CN 116340627A
- Authority
- CN
- China
- Prior art keywords
- vocabulary
- searched
- dictionary
- word list
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/30—Creation or generation of source code
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提出一种词汇推荐方法、装置、电子设备及存储介质,词汇推荐方法包括:扫描项目包中接口的名称和接口注释文本,基于所述接口的名称和所述接口注释文本构建所述项目包的多个选项词典;实时接收待开发项目包中的待检索词汇,基于所述待开发项目包的名称和所述待检索词汇构建检索请求;依据所述检索请求从所述选项词典中选取目标词典,并利用所述待检索词汇从所述目标词典中进行模糊检索以获得可用词列表;计算所述待检索词汇与所述可用词列表中每个值的相似度,并依据所述相似度由大到小的顺序向用户推送所述可用词列表。该方法可以将项目开发中的术语存储为词典,从而能够提升项目开发过程中的用词规范度。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种词汇推荐方法、装置、电子设备及存储介质。
背景技术
在互联网系统架构越来越复杂的大环境下,为了系统职能清晰,一个大的系统往往会拆分成多个子系统分别由不同的开发组成员进行开发和维护,而不同的开发组往往使用不同的开发命名规范甚至没有规范,更甚者,英语水平不同的开发人员以及“不拘小节”的开发人员还会时不时用拼音。
一个系统域之间因为功能紧密配置,不管是系统对内对外提供的接口也好,还是针对某些接口或者方法、单元进行的注释也好,资源往往也是共享或者传递。而不同的命名规范导致系统接口的可读性、链路连贯性、清晰度等等都会有极大降低,沟通成本也迅速加大。
发明内容
鉴于以上内容,有必要提供一种词汇推荐方法、装置、电子设备及存储介质,以解决如何提高项目开发过程中接口命名的规范度这一技术问题。
本申请实施例提供一种词汇推荐方法,所述方法包括:
扫描项目包中多个接口的名称和接口注释文本,基于所述接口的名称和所述接口注释文本构建所述项目包的多个选项词典;
实时接收待开发项目包中的待检索词汇,基于所述待开发项目包的名称和所述待检索词汇构建检索请求;
依据所述检索请求从所述选项词典中选取目标词典,并利用所述待检索词汇从所述目标词典中进行模糊检索以获得可用词列表;
计算所述待检索词汇与所述可用词列表中每个值的相似度,并依据所述相似度由大到小的顺序向用户推送所述可用词列表。
在一些实施例中,所述基于所述接口的名称和所述接口注释文本构建所述项目包的多个选项词典,包括:
针对每个项目包中的所有接口,将所述接口注释文本输入预设的语义分类模型获得所述接口注释文本的语义类别;
将所述接口的名称作为键,并将所述语义类别作为值,以构建键值对;
针对每个所述项目包,联合存储所有所述接口的键值对以作为所述项目包对应的选项词典,并将所述项目包的名称作为所述选项词典的索引。
在一些实施例中,所述检索请求包括请求头和请求报文,所述请求头用于表征所述待开发项目包的名称,所述请求报文用于记录所述待检索词汇。
在一些实施例中,所述依据所述检索请求从所述选项词典中选取目标词典,具体包括:
依次将所述待开发项目包的名称和每个所述选项词典的索引进行对比,若所述待开发项目包的名称与所述选项词典的索引相同,则将所述选项词典作为目标词典。
在一些实施例中,所述利用所述待检索词汇从所述目标词典中进行模糊检索以获得可用词列表,具体包括:
所述待检索词汇包括至少一个待检索文本,针对每个所述待检索文本,对比所述待检索文本与所述目标词典中的每个值,若所述待检索文本存在于所述目标词典的值中,则将所述目标词典的值对应的键值对列为备选键值对;
联合存储所有备选键值对以作为所述待检索词汇的可用词列表。
在一些实施例中,所述计算所述待检索词汇与所述可用词列表中每个值的相似度,并依据所述相似度由大到小的顺序向用户推送所述可用词列表,具体包括:
所述可用词列表中的每个值包含多个文本,针对所述可用词列表中的每个值,将所述值中的文本与所述待检测文本相同的文本记为选定文本;
针对所述可用词列表中的每个值,将所述待检测文本的数量与所述值中文本的数量之和作为基准值;
计算所述选定文本的数量与所述基准值的商值,以作为所述待检索词汇与所述值的相似度;
依据所述相似度由大至小的顺序对所述可用词列表中的所有键值对进行排序,并向用户推送排序后的可用词列表。
在一些实施例中,所述获得可用词列表之后,所述方法还包括:
若所述可用词列表中最高的相似度低于预设的相似度阈值,则将所述待检索词汇存储至所述目标词典以更新所述目标词典。
本申请实施例还提供一种词汇推荐装置,所述装置包括:
第一构建单元,用于扫描项目包中多个接口的名称和接口注释文本,基于所述接口的名称和所述接口注释文本构建所述项目包的多个选项词典;
第二构建单元,用于实时接收待开发项目包中的待检索词汇,基于所述待开发项目包的名称和所述待检索词汇构建检索请求;
检索单元,用于依据所述检索请求从所述选项词典中选取目标词典,并利用所述待检索词汇从所述目标词典中进行模糊检索以获得可用词列表;
推荐单元,用于计算所述待检索词汇与所述可用词列表中每个值的相似度,并依据所述相似度由大到小的顺序向用户推送所述可用词列表。
本申请实施例还提供一种电子设备,所述电子设备包括:
存储器,存储计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现所述词汇推荐方法。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现所述词汇推荐方法。
上述词汇推荐方法通过扫描项目包中的接口名称和接口注释文本构建所述项目包的选项词典,并实时接收待开发项目包中的待检索词汇以构建检索请求;依据所述检索请求从所述选项词典中选取目标词典,并利用所述待检索词汇从所述目标词典中进行模糊检索以获得可用词列表,最终计算所述待检索词汇与所述可用词列表中每个值的相似度,并依据所述相似度由大到小的顺序向用户推送所述可用词列表,以选项词典的方式存储规范用语并向用户提供建议,从而能够提升项目开发过程中的用词规范度。
附图说明
图1是本申请所涉及的一种词汇推荐方法的较佳实施例的流程图。
图2是本申请实施例所涉及的可用词列表的示意图。
图3是本申请实施例所涉及的所述可用词列表和所述排序后的可用词列表的对比示意图。
图4是本申请所涉及的词汇推荐装置的较佳实施例的功能模块图。
图5是本申请所涉及的词汇推荐方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本申请的目的、特征和优点,下面结合附图和具体实施例对本申请进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互结合。在下面的描述中阐述了很多具体细节以便于充分理解本申请,所述描述的实施例仅是本申请一部分实施例,而不是全部的实施例。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本申请实施例提供一种词汇推荐方法,可应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴式设备等。
所述电子设备还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量主机或网络服务器构成的云。
所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
如图1所示,是本申请词汇推荐方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
S10,扫描项目包中多个接口的名称和接口注释文本,基于所述接口的名称和所述接口注释文本构建所述项目包的多个选项词典。
在一个可选的实施例中,所述基于所述接口名称和所述接口注释文本构建所述项目包的选项词典,包括:
针对每个项目包中的所有接口,将所述接口注释文本输入预设的语义分类模型获得所述接口注释文本的语义类别;
将所述接口的名称作为键,并将所述语义类别作为值,以构建键值对;
针对每个所述项目包,联合存储所有所述接口的键值对以作为所述项目包对应的选项词典,并将所述项目包的名称作为所述选项词典的索引。
该可选的实施例中,所述项目包指系统开发过程中多组程序的集合,每个所述项目包具备至少一个接口,所述接口指具备特定功能的代码的集合。
针对每个项目包,可查询所述项目包中所有接口的名称,并查询每个接口对应的接口注释文本。示例性的,当某一个接口中的程序为:“@PAFDoc(title="通过批量的申请行查询成本中心",author="XUSHUANG887",ver="20210428"”,则该接口的名称为PAFDoc,该接口对应的接口注释文本为:通过批量的申请行查询成本中心。
该可选的实施例中,针对每个接口,可将所述接口对应的注释文本输入预先训练的语义检测模型以获得所述接口对应的语义类别,所述语义类别用于表征所述接口的输出内容。
该可选的实施例中,可将所述接口名称作为键,并将所述语义类别作为值以构建每个所述接口对应的键值对。针对每个所述项目包,联合存储所述项目包中的所有接口对应的键值对从而获得每个所述项目包对应的选项词典。并可将所述项目包的名称作为所述选项词典的索引,以便于后续利用项目包的名称查询对应的选项词典。
如此,构建每个项目包对应的选项词典,能够为后续检索规范用语提供了数据支撑。
S11,实时接收待开发项目包中的待检索词汇,基于所述待开发项目包的名称和所述待检索词汇构建检索请求。
在一个可选的实施例中,所述检索请求包括请求头和请求报文,所述请求头用于表征所述待开发项目包的名称,所述请求报文用于记录所述待检索词汇。
该可选的实施例中,所述待开发项目包指用户在项目开发过程中编辑的项目包程序,所述待检索词汇指用户在所述待开发项目包中选中的词汇,该词汇用于表征用户将要编写的接口对应的语义类别,即用户将要编写的接口要输出的内容。
如此,基于待开发项目包的名称和待检索词汇生成检索请求,为后续查询待检索词汇对应的词汇列表提供了数据支撑,从而能够提升词汇检索的效率。
S12,依据所述检索请求从所述选项词典中选取目标词典,并利用所述待检索词汇从所述目标词典中进行模糊检索以获得可用词列表。
在一个可选的实施例中,所述依据所述检索请求从所述选项词典中选取目标词典,具体包括:
依次将所述待开发项目包的名称和每个所述选项词典的索引进行对比,若所述待开发项目包的名称与所述选项词典的索引相同,则将所述选项词典作为目标词典,并结束对比;
在一个可选的实施例中,若所述待开发项目包的名称与所有所述选项词典的索引均不相同,则扫描所述待开发项目包中所有接口的名称与每个接口的接口注释文本,以构建所述待开发项目包对应的选项词典。
示例性的,当所述待开发项目包的索引为“项目包A”,且所有所述选项词典的索引分别为“项目包A”、“项目包B”、“项目包C”、“项目包D”,则可将索引为“项目包A”的选项词典作为目标词典,后续可根据所述项目包A对应的选项字典进行词汇检索。
该可选的实施例中,若所述待开发项目包的名称与所有所述选项词典的索引均不相同,则表明所述待开发项目包中的接口未被扫描,且所述待开发项目包对应的选项词典未被建立,因此可依据所述待开发项目包中所有接口的名称与每个接口的接口注释文本构建所述待开发项目包的选项词典,并将所述待开发项目包的名称作为其对应的选项词典的索引。
在一个可选的实施例中,所述利用所述待检索词汇从所述目标词典中进行模糊检索以获得可用词列表,具体包括:
所述待检索词汇包括至少一个待检索文本,针对每个所述待检索文本,对比所述待检索文本与所述目标词典中的每个值,若所述待检索文本存在于所述目标词典的值中,则将所述目标词典的值对应的键值对列为备选键值对;
联合存储所有备选键值对以作为所述待检索词汇的可用词列表。
该可选的实施例中,所述待检索词汇包括至少一个待检索文本,示例性的,当所述待检索词汇为“专业公司”,则该待检索词汇包括四个待检索文本,且分别为“专”、“业”、“公”、“司”。
若所述待检索词汇中任意一个待检索文本存在于所述目标词典的值中,则将该值对应的键值对作为备选键值对。示例性的,当所述待检索文本分别为“专”、“业”、“公”、“司”,且所述目标词典中的值包括“专业”、“公司”、“专业公司”、“联系人”、“专业公司联系人”,则所述备选键值对包括“专业”、“公司”、“专业公司”、“专业公司联系人”对应的键值对。
该可选的实施例中,可联合存储所有备选键值对以作为所述待检索词汇的可用词列表,图2示出了当所述待检索词汇为“专业公司”时所述可用词列表的示意图。
如此,通过待开发项目包的名称和待检索词汇从所有选项字典中查询到与所述待检索词汇对应的备选键值对,联合存储所有备选键值对以获得可用词列表,能够为后续向用户提供接口命名建议提供数据支撑。
S13,计算所述待检索词汇与所述可用词列表中每个值的相似度,并依据所述相似度由大到小的顺序向用户推送所述可用词列表。
在一个可选的实施例中,所述计算所述待检索词汇与所述可用词列表中每个值的相似度,并依据所述相似度由大到小的顺序向用户推送所述可用词列表,具体包括:
所述可用词列表中的每个值包含多个文本,针对所述可用词列表中的每个值,将所述值中的文本与所述待检测文本相同的文本记为选定文本;
针对所述可用词列表中的每个值,将所述待检测文本的数量与所述值中文本的数量之和作为基准值;
计算所述选定文本的数量与所述基准值的商值,以作为所述待检索词汇与所述值的相似度;
依据所述相似度由大至小的顺序对所述可用词列表中的所有键值对进行排序,并向用户推送排序后的可用词列表。
该可选的实施例中,所述可用列表词汇中的值为至少一个词汇,包含至少一个文本。针对所述可用词列表中的每个值,将其多个文本中与所述待检索文本相同的文本作为选定文本,并将所述值和所述待检测词汇中所有文本的数量之和作为基准值。进一步可计算所述选定文本的数量与所述基准值的商值以作为所述待检索词汇与所述值的相似度。
示例性的,当所述待检测词汇包含四个待检测文本且分别为“专”、“业”、“公”、“司”,所述可用词列表中的值的文本为“专业公司联系人”,则所述选定文本的数量为4,且所述总文本数量为11,则所述相似度为4/11。
该可选的实施例中,所述可用词列表中的值与所述待检测词汇的相似度越大,则表明该值与所述待检测词汇越相似,可依据所述相似度由大至小的顺序对所述可用词列表进行排序,并将排序之后的可用词列表推送给用户,以确保用户能够便捷地选择与所述待检索词汇相似度较高的可用词汇。
图3示出了所述可用词列表和所述排序后的可用词列表的对比示意图。
在一个可选的实施例中,所述获得可用词列表之后,所述方法还包括:
若所述可用词列表中最高的相似度低于预设的相似度阈值,则将所述待检索词汇存储至所述目标词典以更新所述目标词典。
该可选的实施例中,当所述可用词列表中最高的相似度低于预设的相似度阈值时,表明所述可用词列表中的所有词汇与所述待检索词汇的相似度都较低,因此可将所述待检索词汇存储至所述目标词汇列表,以更新所述目标词汇列表。
如此,在开发项目的过程中不断更新目标词典,从而能够持续扩展选项词典中包含的内容,能够提升选项词典的丰富程度,进而提升项目开发过程中接口命名的规范程度。
上述基于人工智能的词汇推荐方法通过扫描项目包中的接口名称和接口注释文本构建所述项目包的选项词典,并实时接收待开发项目包中的待检索词汇以构建检索请求;依据所述检索请求从所述选项词典中选取目标词典,并利用所述待检索词汇从所述目标词典中进行模糊检索以获得可用词列表,最终计算所述待检索词汇与所述可用词列表中每个值的相似度,并依据所述相似度由大到小的顺序向用户推送所述可用词列表,以选项词典的方式存储规范用语并向用户提供建议,从而能够提升项目开发过程中的用词规范度。
如图4所示,是本申请实施例提供的词汇推荐装置的较佳实施例的功能模块图。词汇推荐装置11包括第一构建单元110、第二构建单元111、检索单元112、推荐单元113。本申请所称的模块/单元是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机程序段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
所述第一构建单元110,用于扫描项目包中多个接口的名称和接口注释文本,基于所述接口的名称和所述接口注释文本构建所述项目包的多个选项词典。
所述第二构建单元111,用于实时接收待开发项目包中的待检索词汇,基于所述待开发项目包的名称和所述待检索词汇构建检索请求。
所述检索单元112,用于依据所述检索请求从所述选项词典中选取目标词典,并利用所述待检索词汇从所述目标词典中进行模糊检索以获得可用词列表。
所述推荐单元113,用于计算所述待检索词汇与所述可用词列表中每个值的相似度,并依据所述相似度由大到小的顺序向用户推送所述可用词列表。
在一个可选的实施例中,所述第一构建单元110具体用于:
针对每个项目包中的所有接口,将所述接口注释文本输入预设的语义分类模型获得所述接口注释文本的语义类别;
将所述接口的名称作为键,并将所述语义类别作为值,以构建键值对;
针对每个所述项目包,联合存储所有所述接口的键值对以作为所述项目包对应的选项词典,并将所述项目包的名称作为所述选项词典的索引。
在一个可选的实施例中,所述检索单元112具体用于:
依次将所述待开发项目包的名称和每个所述选项词典的索引进行对比,若所述待开发项目包的名称与所述选项词典的索引相同,则将所述选项词典作为目标词典。
在一个可选的实施例中,所述检索单元112还用于:
所述待检索词汇包括至少一个待检索文本,针对每个所述待检索文本,对比所述待检索文本与所述目标词典中的每个值,若所述待检索文本存在于所述目标词典的值中,则将所述目标词典的值对应的键值对列为备选键值对;
联合存储所有备选键值对以作为所述待检索词汇的可用词列表。
在一个可选的实施例中,所述推荐单元113具体用于:
所述可用词列表中的每个值包含多个文本,针对所述可用词列表中的每个值,将所述值中的文本与所述待检测文本相同的文本记为选定文本;
针对所述可用词列表中的每个值,将所述待检测文本的数量与所述值中文本的数量之和作为基准值;
计算所述选定文本的数量与所述基准值的商值,以作为所述待检索词汇与所述值的相似度;
依据所述相似度由大至小的顺序对所述可用词列表中的所有键值对进行排序,并向用户推送排序后的可用词列表。
在一个可选的实施例中,所述获得可用词列表之后,所述推荐单元113还用于:
若所述可用词列表中最高的相似度低于预设的相似度阈值,则将所述待检索词汇存储至所述目标词典以更新所述目标词典。
如图5所示,是本申请实施例提供的一种电子设备的结构示意图。电子设备1包括存储器12和处理器13。存储器12用于存储计算机可读指令,处理器13用执行储器中存储的计算机可读指令以实现上述任一实施例的词汇推荐方法。
在一个可选的实施例中,电子设备1还包括总线、存储在存储器12中并可在处理器13上运行的计算机程序,例如词汇推荐程序。
图5仅示出了具有存储器12和处理器13的电子设备1,本领域技术人员可以理解的是,图5示出的结构并不构成对电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
结合图1,电子设备1中的存储器12存储多个计算机可读指令以实现一种词汇推荐方法,处理器13可执行多个指令从而实现:
扫描项目包中多个接口的名称和接口注释文本,基于所述接口的名称和所述接口注释文本构建所述项目包的多个选项词典;
实时接收待开发项目包中的待检索词汇,基于所述待开发项目包的名称和所述待检索词汇构建检索请求;
依据所述检索请求从所述选项词典中选取目标词典,并利用所述待检索词汇从所述目标词典中进行模糊检索以获得可用词列表;
计算所述待检索词汇与所述可用词列表中每个值的相似度,并依据所述相似度由大到小的顺序向用户推送所述可用词列表。
具体地,处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,电子设备1既可以是总线型结构,也可以是星形结构,电子设备1还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置,例如电子设备1还可以包括输入输出设备、网络接入设备等。
需要说明的是,电子设备1仅为举例,其他现有的或今后可能出现的电子产品如可适应于本申请,也应包含在本申请的保护范围以内,并以引用方式包含于此。
其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质可以是非易失性的,也可以是易失性的。所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,存储器12还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如词汇推荐程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是电子设备1的控制核心(Control Unit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在存储器12内的程序或者模块(例如执行词汇推荐程序等),以及调用存储在存储器12内的数据,以执行电子设备1的各种功能和处理数据。
所述处理器13执行电子设备1的操作系统以及安装的各类应用程序。处理器13执行所述应用程序以实现上述各个词汇推荐方法实施例中的步骤,例如图1所示的步骤。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在存储器12中,并由处理器13执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机程序在电子设备1中的执行过程。例如,所述计算机程序可以被分割成第一构建单元110、第二构建单元111、检索单元112、推荐单元113。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备,或者网络设备等)或处理器(processor)执行本申请各个实施例所述词汇推荐方法的部分。
电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指示相关的硬件设备来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存储器及其他存储器等。
进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
总线可以是外设部件互连标准(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,在图5中仅用一根箭头表示,但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现存储器12以及至少一个处理器13等之间的连接通信。
本申请实施例还提供一种计算机可读存储介质(图未示),计算机可读存储介质中存储有计算机可读指令,计算机可读指令被电子设备中的处理器执行以实现上述任一实施例所述的词汇推荐方法。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。说明书陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本申请的技术方案而非限制,尽管参照较佳实施例对本申请进行了详细说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或等同替换,而不脱离本申请技术方案的精神和范围。
Claims (10)
1.一种词汇推荐方法,其特征在于,所述方法包括:
扫描项目包中多个接口的名称和接口注释文本,基于所述接口的名称和所述接口注释文本构建所述项目包的多个选项词典;
实时接收待开发项目包中的待检索词汇,基于所述待开发项目包的名称和所述待检索词汇构建检索请求;
依据所述检索请求从所述选项词典中选取目标词典,并利用所述待检索词汇从所述目标词典中进行模糊检索以获得可用词列表;
计算所述待检索词汇与所述可用词列表中每个值的相似度,并依据所述相似度由大到小的顺序向用户推送所述可用词列表。
2.如权利要求1所述的词汇推荐方法,其特征在于,所述基于所述接口的名称和所述接口注释文本构建所述项目包的多个选项词典,包括:
针对每个项目包中的所有接口,将所述接口注释文本输入预设的语义分类模型获得所述接口注释文本的语义类别;
将所述接口的名称作为键,并将所述语义类别作为值,以构建键值对;
针对每个所述项目包,联合存储所有所述接口的键值对以作为所述项目包对应的选项词典,并将所述项目包的名称作为所述选项词典的索引。
3.如权利要求1所述的词汇推荐方法,其特征在于,所述检索请求包括请求头和请求报文,所述请求头用于表征所述待开发项目包的名称,所述请求报文用于记录所述待检索词汇。
4.如权利要求1所述的词汇推荐方法,其特征在于,所述依据所述检索请求从所述选项词典中选取目标词典,具体包括:
依次将所述待开发项目包的名称和每个所述选项词典的索引进行对比,若所述待开发项目包的名称与所述选项词典的索引相同,则将所述选项词典作为目标词典。
5.如权利要求1所述的词汇推荐方法,其特征在于,所述利用所述待检索词汇从所述目标词典中进行模糊检索以获得可用词列表,具体包括:
所述待检索词汇包括至少一个待检索文本,针对每个所述待检索文本,对比所述待检索文本与所述目标词典中的每个值,若所述待检索文本存在于所述目标词典的值中,则将所述目标词典的值对应的键值对列为备选键值对;
联合存储所有备选键值对以作为所述待检索词汇的可用词列表。
6.如权利要求1所述的词汇推荐方法,其特征在于,所述计算所述待检索词汇与所述可用词列表中每个值的相似度,并依据所述相似度由大到小的顺序向用户推送所述可用词列表,具体包括:
所述可用词列表中的每个值包含多个文本,针对所述可用词列表中的每个值,将所述值中的文本与所述待检测文本相同的文本记为选定文本;
针对所述可用词列表中的每个值,将所述待检测文本的数量与所述值中文本的数量之和作为基准值;
计算所述选定文本的数量与所述基准值的商值,以作为所述待检索词汇与所述值的相似度;
依据所述相似度由大至小的顺序对所述可用词列表中的所有键值对进行排序,并向用户推送排序后的可用词列表。
7.如权利要求1所述的词汇推荐方法,其特征在于,所述获得可用词列表之后,所述方法还包括:
若所述可用词列表中最高的相似度低于预设的相似度阈值,则将所述待检索词汇存储至所述目标词典以更新所述目标词典。
8.一种词汇推荐装置,其特征在于,所述装置包括:
第一构建单元,用于扫描项目包中多个接口的名称和接口注释文本,基于所述接口的名称和所述接口注释文本构建所述项目包的多个选项词典;
第二构建单元,用于实时接收待开发项目包中的待检索词汇,基于所述待开发项目包的名称和所述待检索词汇构建检索请求;
检索单元,用于依据所述检索请求从所述选项词典中选取目标词典,并利用所述待检索词汇从所述目标词典中进行模糊检索以获得可用词列表;
推荐单元,用于计算所述待检索词汇与所述可用词列表中每个值的相似度,并依据所述相似度由大到小的顺序向用户推送所述可用词列表。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现如权利要求1至7中任意一项所述的词汇推荐方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的词汇推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310288186.4A CN116340627A (zh) | 2023-03-15 | 2023-03-15 | 词汇推荐方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310288186.4A CN116340627A (zh) | 2023-03-15 | 2023-03-15 | 词汇推荐方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116340627A true CN116340627A (zh) | 2023-06-27 |
Family
ID=86880140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310288186.4A Pending CN116340627A (zh) | 2023-03-15 | 2023-03-15 | 词汇推荐方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116340627A (zh) |
-
2023
- 2023-03-15 CN CN202310288186.4A patent/CN116340627A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110647614B (zh) | 智能问答方法、装置、介质及电子设备 | |
CN107256267B (zh) | 查询方法和装置 | |
CN106844341B (zh) | 基于人工智能的新闻摘要提取方法及装置 | |
CN111898643B (zh) | 一种语义匹配方法及装置 | |
CN111566654A (zh) | 集成知识和自然语言处理的机器学习 | |
JP7451747B2 (ja) | コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体 | |
CN113204621B (zh) | 文档入库、文档检索方法,装置,设备以及存储介质 | |
US10083398B2 (en) | Framework for annotated-text search using indexed parallel fields | |
US11874798B2 (en) | Smart dataset collection system | |
US9690862B2 (en) | Realtime ingestion via multi-corpus knowledge base with weighting | |
CN112988784B (zh) | 数据查询方法、查询语句生成方法及其装置 | |
CN112100396A (zh) | 一种数据处理方法和装置 | |
CN112148701A (zh) | 一种文件检索的方法及设备 | |
CN116882372A (zh) | 文本生成方法、装置、电子设备以及存储介质 | |
US20120059786A1 (en) | Method and an apparatus for matching data network resources | |
Song et al. | Semi-automatic construction of a named entity dictionary for entity-based sentiment analysis in social media | |
US9720910B2 (en) | Using business process model to create machine translation dictionaries | |
CN110929526A (zh) | 样本生成方法、装置以及电子设备 | |
CN113591881B (zh) | 基于模型融合的意图识别方法、装置、电子设备及介质 | |
US10255349B2 (en) | Requesting enrichment for document corpora | |
CN116340627A (zh) | 词汇推荐方法、装置、电子设备及存储介质 | |
CN111368036B (zh) | 用于搜索信息的方法和装置 | |
CN114780712A (zh) | 一种基于质量评价的新闻专题生成方法及装置 | |
US11379669B2 (en) | Identifying ambiguity in semantic resources | |
CN109815312B (zh) | 一种文档查询的方法、装置、计算设备及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |