CN112562651A - 一种基于自然语言关键字智能识别关键字生成页面的方法 - Google Patents
一种基于自然语言关键字智能识别关键字生成页面的方法 Download PDFInfo
- Publication number
- CN112562651A CN112562651A CN202011348108.1A CN202011348108A CN112562651A CN 112562651 A CN112562651 A CN 112562651A CN 202011348108 A CN202011348108 A CN 202011348108A CN 112562651 A CN112562651 A CN 112562651A
- Authority
- CN
- China
- Prior art keywords
- page
- matching
- natural language
- elements
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 239000000203 mixture Substances 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 abstract description 12
- 239000000284 extract Substances 0.000 abstract description 5
- 230000009286 beneficial effect Effects 0.000 description 2
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本发明提出一种基于自然语言关键字智能识别关键字生成页面的方法,包括以下步骤:S1,识别获取自然语言中是否存在系统预设的条件判断关键字,若是将条件判断关键字作为生成页面的判断条件;S2,识别获取自然语言中组成页面的元素;S3,识别获取自然语言中组成页面的元素的属性;S4,根据自然语言的判断条件、元素和属性进行组合计算,生成系统页面。本发明根据自然语言关键字精准的提取用于构建页面的判断条件、元素和属性,并智能进行页面的构建,减少了页面构建过程中出现错误的概率,加快了页面构建的速率。
Description
技术领域
本发明涉及语音识别技术领域,尤其是一种基于自然语言关键字智能识别关键字生成页面的方法。
背景技术
目前,用户在构建系统时,往往需要进行关键字检索查找需要的系统组件,再将查询到的系统组件填充至系统界面的显示框架中,以此生成系统,需要花费大量的时间去查询,构建的速度较慢。例如,专利文献CN110990097A公开了一种UI界面生成方法、存储介质及智能终端,所述方法包括步骤:确定UI界面在终端屏幕上的显示区域;获取所述显示区域的屏幕尺寸和屏幕横向分辨率;根据所述屏幕尺寸和屏幕横向分辨率构建UI界面的显示框架;向所述显示框架内填充UI组件并调整所述UI组件的大小,生成所述UI界面。上述专利文献的不足之处在于向UI界面的显示框架内填充UI组件以此生成UI界面,需要一个个的填充UI组件,导致UI界面的构建速度较慢。
发明内容
本发明解决了现有技术中页面构建的速度较慢的问题,提出一种基于自然语言关键字智能识别关键字生成页面的方法,根据自然语言关键字精准的提取用于构建页面的判断条件、元素和属性,进而进行页面的构建,减少了页面构建过程中出现错误的概率,加快了页面构建的速率。
为实现上述目的,提出以下技术方案:
一种基于自然语言关键字智能识别关键字生成页面的方法,包括以下步骤:
S1,识别获取自然语言中是否存在系统预设的条件判断关键字,若是将条件判断关键字作为生成页面的判断条件;
S2,识别获取自然语言中组成页面的元素;
S3,识别获取自然语言中组成页面的元素的属性;
S4,根据自然语言的判断条件、元素和属性进行组合计算,生成系统页面。
本发明根据自然语言关键字精准的提取用于构建页面的判断条件、元素和属性,并智能进行页面的构建,减少了页面构建过程中出现错误的概率,加快了页面构建的速率。
作为优选,所述步骤S1具体包括以下步骤:通过词汇匹配、语境匹配识别自然语言中的条件判断关键字,所述条件判断关键字包括通过、利用、根据、将和整合。
作为优选,所述步骤S2体包括以下步骤:通过全匹配及最优匹配确定页面元素,所述全匹配指的是字符完全匹配,所述最优匹配指的是从字符最多匹配到最小字符匹配,具体包括:
A,将自然语言按照预设规则进行组合,获取组合字符串列表;
B,组合字符串列表中的字符串与系统预设的页面的元素名称进行全匹配,若比对成功,则将比对成功的字符串进行标识,并将系统预设的页面的元素名称作为识别出的页面的元素进行记录;
C,若全匹配比对失败,进行最优匹配,将组合字符串列表中的字符串按照顺序与系统预设的页面的元素名称进行局部匹配,若局部匹配的匹配度最高值大于等于设定阈值,则将匹配度最高值所对应的字符串进行标识,并将系统预设的页面的元素名称作为识别出的页面的元素进行记录,若局部匹配的匹配度最高值小于设定阈值,则提示用户输入语音指令错误。
作为优选,所述步骤A包括以下步骤:
S201,将自然语言语音文本信息,并去除语音文本信息中的符号字符;
S202,统计语音文本信息中剩余字符的字符数n;
S203,按顺序提取语文文本信息的Ni个字符组合成字符串,其中i=2,···,n;
S204,将字符串按字符数由多到少进行排序构成组合字符串列表。
作为优选,所述匹配度的计算公式为:S=l/k,其中,k为字符串中的字符总数,l为字符串中存在的字符在系统预设的页面的元素名称中出现的个数。
作为优选,所述步骤S3具体包括以下步骤:通过词汇匹配、语境匹配识别自然语言中的组成页面的元素的属性,所述组成页面的元素的属性包括求和、计数、去重计数、乘积和平均。
作为优选,所述步骤S4具体包括以下步骤:获取判断条件对应的组成页面的元素的数据源,根据识别获取的组成页面的元素的属性进行计算,将最终计算结果以表格的形式生成,将至少一个表格生成系统页面。
本发明的有益效果是:本发明根据自然语言关键字精准的提取用于构建页面的判断条件、元素和属性,并智能进行页面的构建,减少了页面构建过程中出现错误的概率,加快了页面构建的速率。
附图说明
图1是实施例的方法流程图。
具体实施方式
实施例:
本实施例提出一种基于自然语言关键字智能识别关键字生成页面的方法,参考图1,包括以下步骤:
S1,识别获取自然语言中是否存在系统预设的条件判断关键字,若是将条件判断关键字作为生成页面的判断条件;步骤S1具体包括以下步骤:通过词汇匹配、语境匹配识别自然语言中的条件判断关键字,条件判断关键字包括通过、利用、根据、将和整合。
S2,识别获取自然语言中组成页面的元素;
步骤S2体包括以下步骤:通过全匹配及最优匹配确定页面元素,全匹配指的是字符完全匹配,最优匹配指的是从字符最多匹配到最小字符匹配,具体包括:
A,将自然语言按照预设规则进行组合,获取组合字符串列表;
步骤A包括以下步骤:
S201,将自然语言语音文本信息,并去除语音文本信息中的符号字符;
S202,统计语音文本信息中剩余字符的字符数n;
S203,按顺序提取语文文本信息的Ni个字符组合成字符串,其中i=2,···,n;
S204,将字符串按字符数由多到少进行排序构成组合字符串列表。
B,组合字符串列表中的字符串与系统预设的页面的元素名称进行全匹配,若比对成功,则将比对成功的字符串进行标识,并将系统预设的页面的元素名称作为识别出的页面的元素进行记录;
C,若全匹配比对失败,进行最优匹配,将组合字符串列表中的字符串按照顺序与系统预设的页面的元素名称进行局部匹配,若局部匹配的匹配度最高值大于等于设定阈值,则将匹配度最高值所对应的字符串进行标识,并将系统预设的页面的元素名称作为识别出的页面的元素进行记录,若局部匹配的匹配度最高值小于设定阈值,则提示用户输入语音指令错误。匹配度的计算公式为:
S=l/k,
其中,k为字符串中的字符总数,l为字符串中存在的字符在系统预设的页面的元素名称中出现的个数。
S3,识别获取自然语言中组成页面的元素的属性;
步骤S3具体包括以下步骤:通过词汇匹配、语境匹配识别自然语言中的组成页面的元素的属性,组成页面的元素的属性包括求和、计数、去重计数、乘积和平均。
S4,根据自然语言的判断条件、元素和属性进行组合计算,生成系统页面。
步骤S4具体包括以下步骤:获取判断条件对应的组成页面的元素的数据源,根据识别获取的组成页面的元素的属性进行计算,将最终计算结果以表格的形式生成,将至少一个表格生成系统页面。
为了更加直观理解本发明的流程,以下以具体实施过程进行说明:
用户录入自然语言“根据2020年的每月销量求平均月销量”;
通过词汇匹配、语境匹配识别获取自然语言中存在系统预设的条件判断关键字为根据,将根据作为生成页面的判断条件;
识别获取自然语言中组成页面的元素,将自然语言按照预设规则进行组合,获取组合字符串列表;
组合字符串列表中的字符串与系统预设的页面的元素名称进行全匹配,若比对成功,则将比对成功的字符串进行标识,并将系统预设的页面的元素名称作为识别出的页面的元素进行记录;匹配出组成页面的元素“2020年”的“月销量”;
识别获取自然语言中组成页面的元素的属性,为“求平均”;
获取判断条件对应的组成页面的元素的数据源,根据识别获取的组成页面的元素的属性进行计算,将最终计算结果以表格的形式生成,将至少一个表格生成系统页面,获取2020年的月销量,并且对月销量进行求平均,并生成表格,参考表一,以表一生成系统页面。
表一2020年平均月销量
本发明的有益效果是:本发明根据自然语言关键字精准的提取用于构建页面的判断条件、元素和属性,并智能进行页面的构建,减少了页面构建过程中出现错误的概率,加快了页面构建的速率。
Claims (7)
1.一种基于自然语言关键字智能识别关键字生成页面的方法,其特征是,包括以下步骤:
S1,识别获取自然语言中是否存在系统预设的条件判断关键字,若是将条件判断关键字作为生成页面的判断条件;
S2,识别获取自然语言中组成页面的元素;
S3,识别获取自然语言中组成页面的元素的属性;
S4,根据自然语言的判断条件、元素和属性进行组合计算,生成系统页面。
2.根据权利要求1所述的一种基于自然语言关键字智能识别关键字生成页面的方法,其特征是,所述步骤S1具体包括以下步骤:通过词汇匹配、语境匹配识别自然语言中的条件判断关键字,所述条件判断关键字包括通过、利用、根据、将和整合。
3.根据权利要求1所述的一种基于自然语言关键字智能识别关键字生成页面的方法,其特征是,所述步骤S2体包括以下步骤:通过全匹配及最优匹配确定页面元素,所述全匹配指的是字符完全匹配,所述最优匹配指的是从字符最多匹配到最小字符匹配,具体包括:
A,将自然语言按照预设规则进行组合,获取组合字符串列表;
B,组合字符串列表中的字符串与系统预设的页面的元素名称进行全匹配,若比对成功,则将比对成功的字符串进行标识,并将系统预设的页面的元素名称作为识别出的页面的元素进行记录;
C,若全匹配比对失败,进行最优匹配,将组合字符串列表中的字符串按照顺序与系统预设的页面的元素名称进行局部匹配,若局部匹配的匹配度最高值大于等于设定阈值,则将匹配度最高值所对应的字符串进行标识,并将系统预设的页面的元素名称作为识别出的页面的元素进行记录,若局部匹配的匹配度最高值小于设定阈值,则提示用户输入语音指令错误。
4.根据权利要求3所述的一种基于自然语言关键字智能识别关键字生成页面的方法,其特征是,所述步骤A包括以下步骤:
S201,将自然语言语音文本信息,并去除语音文本信息中的符号字符;
S202,统计语音文本信息中剩余字符的字符数n;
S203,按顺序提取语文文本信息的Ni个字符组合成字符串,其中i=2,···,n;
S204,将字符串按字符数由多到少进行排序构成组合字符串列表。
5.根据权利要求4所述的一种基于自然语言关键字智能识别关键字生成页面的方法,其特征是,所述匹配度的计算公式为:S=l/k,其中,k为字符串中的字符总数,l为字符串中存在的字符在系统预设的页面的元素名称中出现的个数。
6.根据权利要求1所述的一种基于自然语言关键字智能识别关键字生成页面的方法,其特征是,所述步骤S3具体包括以下步骤:通过词汇匹配、语境匹配识别自然语言中的组成页面的元素的属性,所述组成页面的元素的属性包括求和、计数、去重计数、乘积和平均。
7.根据权利要求1所述的一种基于自然语言关键字智能识别关键字生成页面的方法,其特征是,所述步骤S4具体包括以下步骤:获取判断条件对应的组成页面的元素的数据源,根据识别获取的组成页面的元素的属性进行计算,将最终计算结果以表格的形式生成,将至少一个表格生成系统页面。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011348108.1A CN112562651A (zh) | 2020-11-26 | 2020-11-26 | 一种基于自然语言关键字智能识别关键字生成页面的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011348108.1A CN112562651A (zh) | 2020-11-26 | 2020-11-26 | 一种基于自然语言关键字智能识别关键字生成页面的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112562651A true CN112562651A (zh) | 2021-03-26 |
Family
ID=75046853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011348108.1A Pending CN112562651A (zh) | 2020-11-26 | 2020-11-26 | 一种基于自然语言关键字智能识别关键字生成页面的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112562651A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103021403A (zh) * | 2012-12-31 | 2013-04-03 | 威盛电子股份有限公司 | 基于语音识别的选择方法及其移动终端装置及信息系统 |
CN103699530A (zh) * | 2012-09-27 | 2014-04-02 | 百度在线网络技术(北京)有限公司 | 根据语音输入信息在目标应用中输入文本的方法与设备 |
CN103985382A (zh) * | 2014-05-23 | 2014-08-13 | 国家电网公司 | 一种基于语音识别技术的电网调度辅助交互方法 |
CN106953959A (zh) * | 2017-04-18 | 2017-07-14 | 深圳和家园网络科技有限公司 | 一种基于拼音匹配的电话拨号方法 |
CN110060674A (zh) * | 2019-03-15 | 2019-07-26 | 重庆小雨点小额贷款有限公司 | 表格管理方法、装置、终端和存储介质 |
-
2020
- 2020-11-26 CN CN202011348108.1A patent/CN112562651A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103699530A (zh) * | 2012-09-27 | 2014-04-02 | 百度在线网络技术(北京)有限公司 | 根据语音输入信息在目标应用中输入文本的方法与设备 |
CN103021403A (zh) * | 2012-12-31 | 2013-04-03 | 威盛电子股份有限公司 | 基于语音识别的选择方法及其移动终端装置及信息系统 |
CN103985382A (zh) * | 2014-05-23 | 2014-08-13 | 国家电网公司 | 一种基于语音识别技术的电网调度辅助交互方法 |
CN106953959A (zh) * | 2017-04-18 | 2017-07-14 | 深圳和家园网络科技有限公司 | 一种基于拼音匹配的电话拨号方法 |
CN110060674A (zh) * | 2019-03-15 | 2019-07-26 | 重庆小雨点小额贷款有限公司 | 表格管理方法、装置、终端和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109388795B (zh) | 一种命名实体识别方法、语言识别方法及系统 | |
US10521464B2 (en) | Method and system for extracting, verifying and cataloging technical information from unstructured documents | |
WO2020232861A1 (zh) | 命名实体识别方法、电子装置及存储介质 | |
CN107729314B (zh) | 一种中文时间识别方法、装置及存储介质、程序产品 | |
WO2017161899A1 (zh) | 一种文本处理方法、装置及计算设备 | |
CN107967250B (zh) | 一种信息处理方法及装置 | |
CN107679070B (zh) | 一种智能阅读推荐方法与装置、电子设备 | |
CN108399157B (zh) | 实体与属性关系的动态抽取方法、服务器及可读存储介质 | |
CN109522396B (zh) | 一种面向国防科技领域的知识处理方法及系统 | |
CN112784009A (zh) | 一种主题词挖掘方法、装置、电子设备及存储介质 | |
CN112434533A (zh) | 实体消歧方法、装置、电子设备及计算机可读存储介质 | |
US11429819B2 (en) | Packer classification apparatus and method using PE section information | |
CN112818693A (zh) | 一种电子元器件型号词的自动提取方法及系统 | |
KR102170844B1 (ko) | 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템 | |
CN109344388B (zh) | 一种垃圾评论识别方法、装置及计算机可读存储介质 | |
CN112562651A (zh) | 一种基于自然语言关键字智能识别关键字生成页面的方法 | |
CN110414000B (zh) | 一种基于模板文档对比的关键词提取方法及系统 | |
CN113886420A (zh) | Sql语句的生成方法、装置、电子设备及存储介质 | |
CN113157946A (zh) | 实体链接方法、装置、电子设备及存储介质 | |
CN112559739A (zh) | 电力设备绝缘状态数据处理方法 | |
CN114462364B (zh) | 录入信息的方法和装置 | |
CN113553410B (zh) | 长文档处理方法、处理装置、电子设备和存储介质 | |
CN114398463B (zh) | 一种语音跟踪方法及装置、存储介质、电子设备 | |
CN111046657B (zh) | 一种实现文本信息标准化的方法、装置及设备 | |
CN113066498B (zh) | 信息处理方法、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210326 |