CN112733674A - 一种公务员申论考试应用文智能批改方法及系统 - Google Patents
一种公务员申论考试应用文智能批改方法及系统 Download PDFInfo
- Publication number
- CN112733674A CN112733674A CN202011631792.4A CN202011631792A CN112733674A CN 112733674 A CN112733674 A CN 112733674A CN 202011631792 A CN202011631792 A CN 202011631792A CN 112733674 A CN112733674 A CN 112733674A
- Authority
- CN
- China
- Prior art keywords
- format
- text
- application
- intelligent
- official
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000012937 correction Methods 0.000 title claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 abstract 1
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Educational Administration (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Educational Technology (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及智能评分技术领域,具体涉及一种公务员申论考试应用文智能批改方法及系统,本发明根据标准答案中的格式要求提取格式转换后的文本格式段落;对比标准答案中的格式要求,按照格式要点分值进行判分;将提取的文本段落处理后得到短句列表,并根据短句列表进一步形成2gram用户答案短语列表;将标准答案中的关键句整理成为要点列表并与用户答案短语列表进行两轮匹配赋分;将格式得分和短句得分进行累加,作为应用文总分。其将格式要求纳入应用文智能批改中,基于答题要点的批改模型,将标准答案整理成要点的形式,将用户作答内容拆分成短句和答案要点进行深度语义匹配,能够根据格式、要点进行智能评分,评分更为科学客观,评语反馈更有针对性。
Description
技术领域
本发明涉及智能评分技术领域,具体涉及一种公务员申论考试应用文智能批改方法及系统。
背景技术
应用文是人类在长期的社会实践活动中形成的实用性文体,是国家机关、政党、社会团体、企业事业单位在日常工作、生活中处理各种事物时的重要工具,具有实用性、规范性、时效性的特点。
在线教育的发展,使得组织大规模在线考试成为现实的紧迫需求。尤其在公务员申论在线考试中,应用文的自动评分成为重要的支撑技术。
当前,主流的作文自动评分中,针对的是记叙文、议论文等文体,通常会采用传统机器学习方法,即先人工提取作文的各类特征,然后将提取的特征转换为特征向量,最后输入到回归模型中进行作文评分。
而应用文批改具有明显的格式要求规范、答题要点明确等特点,传统的作文自动评分技术并没有考虑这些特点。因此本文的应用文智能批改方法变得亟待需要。
发明内容
针对现有技术的不足,本发明公开了一种公务员申论考试应用文智能批改方法及系统,通过设置答案要点、格式要求等标准答案数据,能够根据格式、要点进行智能评分,评分更为科学客观,评语反馈更有针对性。
本发明通过以下技术方案予以实现:
第一方面,本发明公开一种公务员申论考试应用文智能批改方法,包括以下步骤:
S1录入公务员申论考试应用文的格式要求和答题要点,形成标准答案;
S2获取用户上传的应用文图片,并调用OCR接口进行文本识别转换为文本;
S3对文本进行分段处理,根据标准答案中的格式要求提取文本格式段落;
S4对比标准答案中的格式要求,按照格式要点分值进行判分;
S5将提取的文本段落处理后得到短句列表,并根据短句列表进一步形成2gram用户答案短语列表;
S6将标准答案中的关键句整理成为要点列表并与用户答案短语列表进行两轮匹配赋分;
S7将格式得分和短句得分进行累加,并作为应用文总分输出。
更进一步的,所述方法中,在标准答案中规定称呼内容并且分值为N,若用户答案中有称呼且称呼内容和标准答案相同,得N分,否则不得分,其中N为正整数。
更进一步的,所述方法中,将提取的文本格式段落根据标点符号切分成短句,组成短句列表。
更进一步的,所述方法中,将提取的文本中同一句话中相邻的短句合并组成2gram用户答案短语列表。
更进一步的,所述方法中,进行两轮匹配赋分时,第一轮针对每个要点依次和短语列表中的每个短句进行语义匹配,如果匹配上,则进行相应的赋分。
更进一步的,所述方法中,进行两轮匹配赋分时,第二轮针对组成2gram用户答案短语列表中的2gram短句依次进行语义匹配,如果匹配上,则进行赋分。
更进一步的,所述方法中,语义匹配时,将待匹配的两句话通过Bilstm进行编码得到两个句向量,拼接在一起后通过两层的全连接网络,最后通过sigmoid函数计算出0-1的相似度得分,大于0.5表示匹配上。
第二方面,本发明公开一种公务员申论考试应用文智能批改系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行计算机程序时实现第一方面所述的公务员申论考试应用文智能批改方法。
本发明的有益效果为:
本发明将格式要求纳入应用文智能批改中,基于答题要点的批改模型,将标准答案整理成要点的形式,将用户作答内容拆分成短句和答案要点进行深度语义匹配,能够根据格式、要点进行智能评分,评分更为科学客观,评语反馈更有针对性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是一种公务员申论考试应用文智能批改方法的原理步骤图;
图2是本发明实施例确定应用文标准答案图;
图3是本发明实施例应用文格式提取流程图;
图4是本发明实施例应用文批改流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本实施例公开如图1所示的一种公务员申论考试应用文智能批改方法,包括以下步骤:
S1录入公务员申论考试应用文的格式要求和答题要点,形成标准答案;
S2获取用户上传的应用文图片,并调用OCR接口进行文本识别转换为文本;
S3对文本进行分段处理,根据标准答案中的格式要求提取文本格式段落;
S4对比标准答案中的格式要求,按照格式要点分值进行判分;
S5将提取的文本段落处理后得到短句列表,并根据短句列表进一步形成2gram用户答案短语列表;
S6将标准答案中的关键句整理成为要点列表并与用户答案短语列表进行两轮匹配赋分;
S7将格式得分和短句得分进行累加,并作为应用文总分输出。
本实施例将格式要求纳入应用文智能批改中。针对应用文中称呼、标题、落款等格式要求,都做了相应的判断赋分。
本实施例基于答题要点的批改模型。将标准答案整理成要点的形式,将用户作答内容拆分成短句和答案要点进行深度语义匹配,批改更为全面客观。
实施例2
本实施例公开一种针对公务员申论考试应用文的自动批改技术,其整体流程图参见图4所示。包括如下步骤:
T1确定标准答案,包括格式要求和答题要点。如图2所示。
T2获取并识别待批改作文,从App上获取用户上传的作文图片,调用腾讯云OCR接口进行文本识别。
T3根据格式对文章进行预处理,将解析出的文本进行分段。根据标准答案中的格式要求提取格式段落,如图3所示。
T4格式判分,根据提取到的格式段落,对比标准答案中的格式要求,按照格式要点分值进行判分。如标准答案中规定称呼内容并且分值为2,若用户答案中有称呼且称呼内容和标准答案相同,得2分,否则不得分。
T5通过语义相似度模型进行要点判分,将用户答案的段落进一步根据标点符号切分成短句,组成短句列表,即userAnswerPhrases,同时,将同一句话中相邻的短句合并组成2gram列表,即2GramUserAnswerPhrases。将标准答案中的关键句整理成为要点列表,即standardAnswers。
然后进行两轮匹配赋分,第一轮,针对每个要点依次和userAnswerPhrases中的每个短句进行语义匹配,如果匹配上,则进行相应的赋分。
第二轮,针对第一轮中未匹配到的要点,进一步和2GramUserAnswerPhrases中的2gram短句依次进行语义匹配,如果匹配上,则进行赋分。
T6计算总分,将格式得分和短句得分加到一起,作为应用文总分。
本实施例中,语义匹配时,将待匹配的两句话通过Bilstm进行编码得到两个句向量,拼接在一起后通过两层的全连接网络,最后通过sigmoid函数计算出0-1的相似度得分,大于0.5表示匹配上。
实施例3
本实施例公开一种公务员申论考试应用文智能批改系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行计算机程序时实现公务员申论考试应用文智能批改方法。
综上,本发明将格式要求纳入应用文智能批改中,基于答题要点的批改模型,将标准答案整理成要点的形式,将用户作答内容拆分成短句和答案要点进行深度语义匹配,能够根据格式、要点进行智能评分,评分更为科学客观,评语反馈更有针对性。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种公务员申论考试应用文智能批改方法,其特征在于,所述方法包括以下步骤:
S1录入公务员申论考试应用文的格式要求和答题要点,形成标准答案;
S2获取用户上传的应用文图片,并调用OCR接口进行文本识别转换为文本;
S3对文本进行分段处理,根据标准答案中的格式要求提取文本格式段落;
S4对比标准答案中的格式要求,按照格式要点分值进行判分;
S5将提取的文本段落处理后得到短句列表,并根据短句列表进一步形成2gram用户答案短语列表;
S6将标准答案中的关键句整理成为要点列表并与用户答案短语列表进行两轮匹配赋分;
S7将格式得分和短句得分进行累加,并作为应用文总分输出。
2.根据权利要求1所述的公务员申论考试应用文智能批改方法,其特征在于,所述方法中,在标准答案中规定称呼内容并且分值为N,若用户答案中有称呼且称呼内容和标准答案相同,得N分,否则不得分,其中N为正整数。
3.根据权利要求1所述的公务员申论考试应用文智能批改方法,其特征在于,所述方法中,将提取的文本格式段落根据标点符号切分成短句,组成短句列表。
4.根据权利要求3所述的公务员申论考试应用文智能批改方法,其特征在于,所述方法中,将提取的文本中同一句话中相邻的短句合并组成2gram用户答案短语列表。
5.根据权利要求1所述的公务员申论考试应用文智能批改方法,其特征在于,所述方法中,进行两轮匹配赋分时,第一轮针对每个要点依次和短语列表中的每个短句进行语义匹配,如果匹配上,则进行相应的赋分。
6.根据权利要求1所述的公务员申论考试应用文智能批改方法,其特征在于,所述方法中,进行两轮匹配赋分时,第二轮针对组成2gram用户答案短语列表中的2gram短句依次进行语义匹配,如果匹配上,则进行赋分。
7.根据权利要求1所述的公务员申论考试应用文智能批改方法,其特征在于,所述方法中,语义匹配时,将待匹配的两句话通过Bilstm进行编码得到两个句向量,拼接在一起后通过两层的全连接网络,最后通过sigmoid函数计算出0-1的相似度得分,大于0.5表示匹配上。
8.一种公务员申论考试应用文智能批改系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行计算机程序时实现如权利要求1~7中任意一项所述的公务员申论考试应用文智能批改方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011631792.4A CN112733674A (zh) | 2020-12-31 | 2020-12-31 | 一种公务员申论考试应用文智能批改方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011631792.4A CN112733674A (zh) | 2020-12-31 | 2020-12-31 | 一种公务员申论考试应用文智能批改方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112733674A true CN112733674A (zh) | 2021-04-30 |
Family
ID=75608474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011631792.4A Pending CN112733674A (zh) | 2020-12-31 | 2020-12-31 | 一种公务员申论考试应用文智能批改方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112733674A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846203A (zh) * | 2017-03-09 | 2017-06-13 | 常州工学院 | 一种智能阅卷方法及系统 |
CN107506360A (zh) * | 2016-06-14 | 2017-12-22 | 科大讯飞股份有限公司 | 一种文章评分方法及系统 |
WO2018161917A1 (zh) * | 2017-03-07 | 2018-09-13 | 百度在线网络技术(北京)有限公司 | 智能评分方法及装置、计算机设备及计算机可读介质 |
CN108830267A (zh) * | 2018-05-08 | 2018-11-16 | 苏州友教习亦教育科技有限公司 | 一种基于图像识别进行阅卷的方法及系统 |
CN109190108A (zh) * | 2018-07-20 | 2019-01-11 | 北京理琪教育科技有限公司 | 语文作文自动批改方法和系统 |
CN109885672A (zh) * | 2019-03-04 | 2019-06-14 | 中国科学院软件研究所 | 一种面向在线教育的问答式智能检索系统及方法 |
CN110135879A (zh) * | 2018-11-17 | 2019-08-16 | 华南理工大学 | 基于自然语言处理的客服质量自动评分方法 |
CN111737968A (zh) * | 2019-03-20 | 2020-10-02 | 小船出海教育科技(北京)有限公司 | 一种作文自动批改及评分的方法及终端 |
-
2020
- 2020-12-31 CN CN202011631792.4A patent/CN112733674A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107506360A (zh) * | 2016-06-14 | 2017-12-22 | 科大讯飞股份有限公司 | 一种文章评分方法及系统 |
WO2018161917A1 (zh) * | 2017-03-07 | 2018-09-13 | 百度在线网络技术(北京)有限公司 | 智能评分方法及装置、计算机设备及计算机可读介质 |
CN106846203A (zh) * | 2017-03-09 | 2017-06-13 | 常州工学院 | 一种智能阅卷方法及系统 |
CN108830267A (zh) * | 2018-05-08 | 2018-11-16 | 苏州友教习亦教育科技有限公司 | 一种基于图像识别进行阅卷的方法及系统 |
CN109190108A (zh) * | 2018-07-20 | 2019-01-11 | 北京理琪教育科技有限公司 | 语文作文自动批改方法和系统 |
CN110135879A (zh) * | 2018-11-17 | 2019-08-16 | 华南理工大学 | 基于自然语言处理的客服质量自动评分方法 |
CN109885672A (zh) * | 2019-03-04 | 2019-06-14 | 中国科学院软件研究所 | 一种面向在线教育的问答式智能检索系统及方法 |
CN111737968A (zh) * | 2019-03-20 | 2020-10-02 | 小船出海教育科技(北京)有限公司 | 一种作文自动批改及评分的方法及终端 |
Non-Patent Citations (2)
Title |
---|
刘伟;亓子森;王目宣;: "主观题自动测评研究", 北京邮电大学学报(社会科学版), no. 04 * |
李学俊;: "基于人工智能的主观题自动评分算法实现", 江南大学学报(自然科学版), no. 03 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109213999B (zh) | 一种主观题评分方法 | |
CN109146610B (zh) | 一种智能保险推荐方法、装置及智能保险机器人设备 | |
US20190278846A1 (en) | Semantic extraction method and apparatus for natural language, and computer storage medium | |
CN111222305B (zh) | 一种信息结构化方法和装置 | |
CN107153965A (zh) | 一种多终端的智能客服解决方法 | |
CN110175229B (zh) | 一种基于自然语言进行在线培训的方法和系统 | |
CN107301170A (zh) | 基于人工智能的切分语句的方法和装置 | |
CN112215008A (zh) | 基于语义理解的实体识别方法、装置、计算机设备和介质 | |
CN110516057B (zh) | 一种信访问题答复方法及装置 | |
CN109740159B (zh) | 用于命名实体识别的处理方法及装置 | |
CN112380868B (zh) | 一种基于事件三元组的信访目的多分类装置及其方法 | |
CN112699645B (zh) | 语料标注方法、装置及设备 | |
CN112131881A (zh) | 信息抽取方法及装置、电子设备、存储介质 | |
CN111193657A (zh) | 聊天表情回复方法、装置及存储介质 | |
CN111798118B (zh) | 企业经营风险监控方法及装置 | |
CN117332072B (zh) | 对话处理、语音摘要提取以及目标对话模型训练方法 | |
CN113407677A (zh) | 评估咨询对话质量的方法、装置、设备和存储介质 | |
CN113627797A (zh) | 入职员工画像生成方法、装置、计算机设备及存储介质 | |
CN115600605A (zh) | 一种中文实体关系联合抽取方法、系统、设备及存储介质 | |
CN116882372A (zh) | 文本生成方法、装置、电子设备以及存储介质 | |
CN114491010A (zh) | 信息抽取模型的训练方法及装置 | |
CN111428472A (zh) | 一种基于自然语言处理及图像算法的文章自动生成系统和方法 | |
CN111460114A (zh) | 检索方法、装置、设备及计算机可读存储介质 | |
IT201900000526A1 (it) | Sistema di intelligenza artificiale per processi aziendali | |
CN110232328A (zh) | 一种征信报告解析方法、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |