CN114298058A - 文章替换词推荐方法、系统、计算机可读介质 - Google Patents

文章替换词推荐方法、系统、计算机可读介质 Download PDF

Info

Publication number
CN114298058A
CN114298058A CN202210012244.6A CN202210012244A CN114298058A CN 114298058 A CN114298058 A CN 114298058A CN 202210012244 A CN202210012244 A CN 202210012244A CN 114298058 A CN114298058 A CN 114298058A
Authority
CN
China
Prior art keywords
article
phrases
module
replacement
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210012244.6A
Other languages
English (en)
Other versions
CN114298058B (zh
Inventor
李根柱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Siyuan Zhitong Technology Co ltd
Original Assignee
Beijing Siyuan Zhitong Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Siyuan Zhitong Technology Co ltd filed Critical Beijing Siyuan Zhitong Technology Co ltd
Priority to CN202210012244.6A priority Critical patent/CN114298058B/zh
Publication of CN114298058A publication Critical patent/CN114298058A/zh
Application granted granted Critical
Publication of CN114298058B publication Critical patent/CN114298058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及计算机领域,且公开了文章替换词推荐方法、系统、计算机可读介质,包括以下步骤:Step1:采集网络词组,导入数据库内,进行保存分类;Step2:导入文章至程序内扫描,提取文章中的词组,进行一次标记;Step3:参照数据库词组信息,针对标记词组,生成第一候选同义词、第二候选同义词和第三候选同义词;Step4:用户选择被一次标记的词组,进行手动二次标记;Step5:显示出二次标记词组推荐的候选替换词,将原词组作为第一选择进行排列。本发明可为用户提供多个推荐替换词进行选择,辅助用户进行词组的替换,帮助用户对文章的质量进行润色加工,提升文章的质量,用户不必逐个对词组进行查找,帮助用户节省大量修改时间。

Description

文章替换词推荐方法、系统、计算机可读介质
技术领域
本发明涉及计算机技术领域,具体为文章替换词推荐方法、系统、计算机可读介质。
背景技术
用户在进行文章撰写的过程中,为了保证文章质量与美观度,需要对文章本身的语句进行润色与加工,从而提升文章的整体质量,使得通读更加顺畅,一般的文件处理软件都具备字句替换的功能,输入目标字句,在全文内进行提取,并输入对应替换语句进行替换;
但是,文章词组的替换只能依靠用户手动进行编辑替换,难以为用户提供多个推荐替换词进行选择,较为不便,无法为用户提供辅助,使得用户只能逐个进行查找,较为麻烦。
发明内容
(一)解决的技术问题
针对现有技术所存在的上述缺点,本发明提供了文章替换词推荐方法、系统、计算机可读介质,能够有效地解决现有技术文章词组的替换只能依靠用户手动进行编辑替换,难以为用户提供多个推荐替换词进行选择,较为不便,无法为用户提供辅助,使得用户只能逐个进行查找,较为麻烦的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
本发明公开了文章替换词推荐方法,包括以下步骤:
Step1:采集网络词组,导入数据库内,进行保存分类;
Step2:导入文章至程序内扫描,提取文章中的词组,进行一次标记;
Step3:参照数据库词组信息,针对标记词组,生成第一候选同义词、第二候选同义词和第三候选同义词;
Step4:用户选择被一次标记的词组,进行手动二次标记;
Step5:显示出二次标记词组推荐的候选替换词,将原词组作为第一选择进行排列;
Step6:采集用户二次标记的词组前后字句,进行分析处理,对语义契合度最高的词组进行三次标记,作为推荐选择项;
Step7:用户对原词组与候选替换词进行选择;
Step8:选择完毕后,检索文章相同段落,进行同步替换。
更进一步地,所述步骤Step1中的词组分类的依据,包括:字节长度、词组结构、添加时间、词组类型。
更进一步地,所述步骤2中的文章导入方式,包括:接入外部设备读取文档至数据库、手动编辑录入文档至数据库。
更进一步地,所述步骤3中的第一候选同义词、第二候选同义词与第三候选同义词以拼音首字母排列顺序进行排列。
更进一步地,所述步骤6中的契合度最高词组的选择属性,包括;网络采集信息中引用度的高低、作为候选替换词的历史选择量高低、历史选择跳过次数、字面相似度与拼音相似度;
其中,契合度最高的词组,在候选替换词的排列中,作为第二选择项进行排列。
更进一步地,所述步骤6中契合度的计算公式为:
Figure 17224DEST_PATH_IMAGE001
其中,C=文章集合;
N=总文章数目;
Na=含有替换词A的文章总数;
Nb=含有替换词B的文章总数;
Nab=含有(A+B)的文章总数。
更进一步地,所述步骤8中相同段落的检索属性为,词组前后连接的短语相同;
在全文扫描后,将所有可替换选项进行展示,用户进行选择后,确认是否替换。
一种文章替换词推荐系统,包括:
管理模块,用于总控系统的运行,执行发送的指令;
导入模块,用于对外部文档和手动编辑文档的进行读取导入;
采集模块,用于对网络数据信息进行收集;
存储模块,用于保存采集数据对导入数据,并镜像保存所有分析处理数据;
扫描模块,用于对导入的文档进行扫描,完成对词组的提取;
分析模块,用于运算数据解析,对文档中的可执行替换的词组进行分析;
标记模块,用于对可执行替换的词组与用户手动选择的词组进行标记;
处理模块,用于执行词组的选择与替换,完成确定;
同步模块,用于同步处理结果,在全文档中,进行相同段落的替换操作。
更进一步地,所述处理模块与同步模块通过无线网络交互连接;
所述处理模块的处理结果通过同步模块实时更新,递交至管理模块。
一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现文章替换词推荐的方法。
(三)有益效果
采用本发明提供的技术方案,与已知的公有技术相比,具有如下有益效果:
1、本发明通过为用户提供多个推荐替换词进行选择,辅助用户进行词组的替换,帮助用户对文章的质量进行润色加工,提升文章的质量,用户不必逐个对词组进行查找,帮助用户节省大量修改时间。
2、本发明可对已被修改的词句进行全文检索,对相同的段落,可进行同步的替换,进一步节省用户的修改时间,用户也可自主进行选择,减低使用时的局限性,能够对历史数据进行分析,进一步帮助用户选择较佳的选项。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为文章替换词推荐方法的流程示意图;
图2为本文章替换词推荐系统的结构示意图;
图3为本发明的架构示意图;
图中的标号分别代表:1、管理模块;2、导入模块;3、采集模块;4、存储模块;5、扫描模块;6、分析模块;7、标记模块;8、处理模块;9、同步模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合实施例对本发明作进一步的描述。
实施例1
本实施例的文章替换词推荐方法,如图1和3所示,包括以下步骤:
Step1:采集网络词组,导入数据库内,进行保存分类;
Step2:导入文章至程序内扫描,提取文章中的词组,进行一次标记;
Step3:参照数据库词组信息,针对标记词组,生成第一候选同义词、第二候选同义词和第三候选同义词;
Step4:用户选择被一次标记的词组,进行手动二次标记;
Step5:显示出二次标记词组推荐的候选替换词,将原词组作为第一选择进行排列;
Step6:采集用户二次标记的词组前后字句,进行分析处理,对语义契合度最高的词组进行三次标记,作为推荐选择项;
Step7:用户对原词组与候选替换词进行选择;
Step8:选择完毕后,检索文章相同段落,进行同步替换。
如图1所示,所述步骤Step1中的词组分类的依据,包括:字节长度、词组结构、添加时间、词组类型。
如图1所示,所述步骤2中的文章导入方式,包括:接入外部设备读取文档至数据库、手动编辑录入文档至数据库。
如图1所示,所述步骤3中的第一候选同义词、第二候选同义词与第三候选同义词以拼音首字母排列顺序进行排列。
如图1所示,所述步骤6中的契合度最高词组的选择属性,包括;网络采集信息中引用度的高低、作为候选替换词的历史选择量高低、历史选择跳过次数、字面相似度与拼音相似度;
其中,契合度最高的词组,在候选替换词的排列中,作为第二选择项进行排列。
如图1所示,所述步骤6中契合度的计算公式为:
Figure 386894DEST_PATH_IMAGE001
其中,C=文章集合;
N=总文章数目;
Na=含有替换词A的文章总数;
Nb=含有替换词B的文章总数;
Nab=含有(A+B)的文章总数。
如图1所示,所述步骤8中相同段落的检索属性为,词组前后连接的短语相同;
在全文扫描后,将所有可替换选项进行展示,用户进行选择后,确认是否替换。
经由此设置,本发明可为用户提供多个推荐替换词进行选择,辅助用户进行词组的替换,帮助用户对文章的质量进行润色加工,提升文章的质量,用户不必逐个对词组进行查找,帮助用户节省大量修改时间;
可对已被修改的词句进行全文检索,对相同的段落,可进行同步的替换,进一步节省用户的修改时间,用户也可自主进行选择,减低使用时的局限性,能够对历史数据进行分析,进一步帮助用户选择较佳的选项。
实施例2
在其他层面,本实施例还提供一种文章替换词推荐系统,如图2所示,包括:
管理模块1,用于总控系统的运行,执行发送的指令;
导入模块2,用于对外部文档和手动编辑文档的进行读取导入;
采集模块3,用于对网络数据信息进行收集;
存储模块4,用于保存采集数据对导入数据,并镜像保存所有分析处理数据;
扫描模块5,用于对导入的文档进行扫描,完成对词组的提取;
分析模块6,用于运算数据解析,对文档中的可执行替换的词组进行分析;
标记模块7,用于对可执行替换的词组与用户手动选择的词组进行标记;
处理模块8,用于执行词组的选择与替换,完成确定;
同步模块9,用于同步处理结果,在全文档中,进行相同段落的替换操作。
如图2所示,所述处理模块8与同步模块9通过无线网络交互连接;
所述处理模块8的处理结果通过同步模块9实时更新,递交至管理模块1。
本实施例在具体实施时,通过管理模块1总控全局,由导入模块2编辑导入文档,通过扫描模块5进行扫描,存储模块4负责保存数据,通过采集模块3对网络数据进行采集,有分析模块6对文档信息进行扫描,由标记模块7对可替换的词组进行标记,通过处理模块8执行替换操作,通过标记模块7同步替换操作。
实施例3
一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现文章替换词推荐的方法。
实施例4
本实施例中,首先得到需要计算语义相关度的两个词语,将它们放到搜索引擎中进行查询,得到包含这些词语的-系列文档,然后用这一系列文档建立文本向量,这个文本向量由出现在词语周围的词语组成,通过核函数的内积来计算语义相关度的值;
其次,使用搜索引擎,通过查询得到词语的页计数,通过页计数来计算词语的语义相关度;
当得到两个词语语义相关度的值后,分别从不同的角度表现了词语的相关度,通过过对这两个值进行线性叠加,得到最终的词语语义相关度值。
综上所述,本发明通过管理模块1总控全局,由导入模块2编辑导入文档,通过扫描模块5进行扫描,存储模块4负责保存数据,通过采集模块3对网络数据进行采集,有分析模块6对文档信息进行扫描,由标记模块7对可替换的词组进行标记,通过处理模块8执行替换操作,通过标记模块7同步替换操作;
可为用户提供多个推荐替换词进行选择,辅助用户进行词组的替换,帮助用户对文章的质量进行润色加工,提升文章的质量,用户不必逐个对词组进行查找,帮助用户节省大量修改时间;
可对已被修改的词句进行全文检索,对相同的段落,可进行同步的替换,进一步节省用户的修改时间,用户也可自主进行选择,减低使用时的局限性,能够对历史数据进行分析,进一步帮助用户选择较佳的选项。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.文章替换词推荐方法,其特征在于,包括以下步骤:
Step1:采集网络词组,导入数据库内,进行保存分类;
Step2:导入文章至程序内扫描,提取文章中的词组,进行一次标记;
Step3:参照数据库词组信息,针对标记词组,生成第一候选同义词、第二候选同义词和第三候选同义词;
Step4:用户选择被一次标记的词组,进行手动二次标记;
Step5:显示出二次标记词组推荐的候选替换词,将原词组作为第一选择进行排列;
Step6:采集用户二次标记的词组前后字句,进行分析处理,对语义契合度最高的词组进行三次标记,作为推荐选择项;
Step7:用户对原词组与候选替换词进行选择;
Step8:选择完毕后,检索文章相同段落,进行同步替换。
2.根据权利要求1所述的文章替换词推荐方法,其特征在于,所述步骤Step1中的词组分类的依据,包括:字节长度、词组结构、添加时间、词组类型。
3.根据权利要求1所述的文章替换词推荐方法,其特征在于,所述步骤2中的文章导入方式,包括:接入外部设备读取文档至数据库、手动编辑录入文档至数据库。
4.根据权利要求1所述的文章替换词推荐方法,其特征在于,所述步骤3中的第一候选同义词、第二候选同义词与第三候选同义词以拼音首字母排列顺序进行排列。
5.根据权利要求1所述的文章替换词推荐方法,其特征在于,所述步骤6中的契合度最高词组的选择属性,包括;网络采集信息中引用度的高低、作为候选替换词的历史选择量高低、历史选择跳过次数、字面相似度与拼音相似度;
其中,契合度最高的词组,在候选替换词的排列中,作为第二选择项进行排列。
6.根据权利要求1所述的文章替换词推荐方法,其特征在于,所述步骤6中契合度的计算公式为:
Figure DEST_PATH_IMAGE001
其中,C=文章集合;
N=总文章数目;
Na=含有替换词A的文章总数;
Nb=含有替换词B的文章总数;
Nab=含有(A+B)的文章总数。
7.根据权利要求1所述的文章替换词推荐方法,其特征在于,所述步骤8中相同段落的检索属性为,词组前后连接的短语相同;
在全文扫描后,将所有可替换选项进行展示,用户进行选择后,确认是否替换。
8.一种文章替换词推荐系统,其特征在于,包括:
管理模块(1),用于总控系统的运行,执行发送的指令;
导入模块(2),用于对外部文档和手动编辑文档的进行读取导入;
采集模块(3),用于对网络数据信息进行收集;
存储模块(4),用于保存采集数据对导入数据,并镜像保存所有分析处理数据;
扫描模块(5),用于对导入的文档进行扫描,完成对词组的提取;
分析模块(6),用于运算数据解析,对文档中的可执行替换的词组进行分析;
标记模块(7),用于对可执行替换的词组与用户手动选择的词组进行标记;
处理模块(8),用于执行词组的选择与替换,完成确定;
同步模块(9),用于同步处理结果,在全文档中,进行相同段落的替换操作。
9.一种文章替换词推荐系统,其特征在于,所述处理模块(8)与同步模块(9)通过无线网络交互连接;
所述处理模块(8)的处理结果通过同步模块(9)实时更新,递交至管理模块(1)。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任意一项所述的方法。
CN202210012244.6A 2022-01-07 2022-01-07 文章替换词推荐方法、系统、计算机可读介质 Active CN114298058B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210012244.6A CN114298058B (zh) 2022-01-07 2022-01-07 文章替换词推荐方法、系统、计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210012244.6A CN114298058B (zh) 2022-01-07 2022-01-07 文章替换词推荐方法、系统、计算机可读介质

Publications (2)

Publication Number Publication Date
CN114298058A true CN114298058A (zh) 2022-04-08
CN114298058B CN114298058B (zh) 2022-09-13

Family

ID=80975896

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210012244.6A Active CN114298058B (zh) 2022-01-07 2022-01-07 文章替换词推荐方法、系统、计算机可读介质

Country Status (1)

Country Link
CN (1) CN114298058B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115457557A (zh) * 2022-09-21 2022-12-09 深圳市学之友科技有限公司 一种扫描式翻译笔控制方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5099425A (en) * 1988-12-13 1992-03-24 Matsushita Electric Industrial Co., Ltd. Method and apparatus for analyzing the semantics and syntax of a sentence or a phrase
CN101400166A (zh) * 2007-09-27 2009-04-01 音乐会技术公司 用于基于上下文标记在移动装置中过滤内容的系统和方法
CN101593076A (zh) * 2008-05-28 2009-12-02 Lg电子株式会社 移动终端和用于修正其文本的方法
CN106650943A (zh) * 2016-10-28 2017-05-10 北京百度网讯科技有限公司 基于人工智能的辅助写作方法和装置
CN106951494A (zh) * 2017-03-14 2017-07-14 腾讯科技(深圳)有限公司 一种信息推荐方法及装置
CN107544726A (zh) * 2017-07-04 2018-01-05 百度在线网络技术(北京)有限公司 基于人工智能的语音识别结果纠错方法、装置及存储介质
WO2018016673A1 (ko) * 2016-07-21 2018-01-25 숭실대학교산학협력단 대체어 자동 추출 장치 및 방법, 이를 수행하기 위한 기록 매체
CN109242417A (zh) * 2018-08-20 2019-01-18 中国平安财产保险股份有限公司 保单批量修改方法、装置、计算机设备和存储介质
CN113254583A (zh) * 2021-05-28 2021-08-13 北京明略软件系统有限公司 一种基于语义向量的文档标记方法、装置及介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5099425A (en) * 1988-12-13 1992-03-24 Matsushita Electric Industrial Co., Ltd. Method and apparatus for analyzing the semantics and syntax of a sentence or a phrase
CN101400166A (zh) * 2007-09-27 2009-04-01 音乐会技术公司 用于基于上下文标记在移动装置中过滤内容的系统和方法
CN101593076A (zh) * 2008-05-28 2009-12-02 Lg电子株式会社 移动终端和用于修正其文本的方法
WO2018016673A1 (ko) * 2016-07-21 2018-01-25 숭실대학교산학협력단 대체어 자동 추출 장치 및 방법, 이를 수행하기 위한 기록 매체
CN106650943A (zh) * 2016-10-28 2017-05-10 北京百度网讯科技有限公司 基于人工智能的辅助写作方法和装置
CN106951494A (zh) * 2017-03-14 2017-07-14 腾讯科技(深圳)有限公司 一种信息推荐方法及装置
CN107544726A (zh) * 2017-07-04 2018-01-05 百度在线网络技术(北京)有限公司 基于人工智能的语音识别结果纠错方法、装置及存储介质
CN109242417A (zh) * 2018-08-20 2019-01-18 中国平安财产保险股份有限公司 保单批量修改方法、装置、计算机设备和存储介质
CN113254583A (zh) * 2021-05-28 2021-08-13 北京明略软件系统有限公司 一种基于语义向量的文档标记方法、装置及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GUANGZHI LI ET.AL: "Control plane design for reliable optical networks", 《 IEEE COMMUNICATIONS MAGAZINE》 *
柏峰等: "一种政府公文智能辅助写作系统", 《北京信息科技大学学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115457557A (zh) * 2022-09-21 2022-12-09 深圳市学之友科技有限公司 一种扫描式翻译笔控制方法及装置
CN115457557B (zh) * 2022-09-21 2024-03-05 惠州市学之友电子有限公司 一种扫描式翻译笔控制方法及装置

Also Published As

Publication number Publication date
CN114298058B (zh) 2022-09-13

Similar Documents

Publication Publication Date Title
CN110399457B (zh) 一种智能问答方法和系统
CN109754233B (zh) 一种智能推荐职位信息的方法和系统
CN109684448B (zh) 一种智能问答方法
CN105718586B (zh) 分词的方法及装置
US7739257B2 (en) Search engine
CN102737039B (zh) 索引建立方法、搜索方法和搜索结果排序方法及对应装置
CN110059271A (zh) 运用标签知识网络的搜索方法及装置
CN111324771B (zh) 视频标签的确定方法、装置、电子设备及存储介质
CN103425687A (zh) 一种基于关键词的检索方法和系统
CN108363691B (zh) 一种用于电力95598工单的领域术语识别系统及方法
CN112115252B (zh) 智能辅助写作处理方法、装置、电子设备及存储介质
CN114357127A (zh) 基于机器阅读理解及常用问题解答模型的智能问答方法
CN113886604A (zh) 一种职位知识图谱生成方法和系统
CN112765999A (zh) 机器翻译双语对照方法及系统
CN114298058B (zh) 文章替换词推荐方法、系统、计算机可读介质
CN112989811B (zh) 一种基于BiLSTM-CRF的历史典籍阅读辅助系统及其控制方法
EP2544100A2 (en) Method and system for making document modules
JP3612769B2 (ja) 情報検索装置および情報検索方法
CN112148735B (zh) 一种用于结构化表格数据知识图谱的构建方法
CN111597302A (zh) 文本事件的获取方法、装置、电子设备及存储介质
CN112651244B (zh) 一种基于论文摘要QA的TopK实体抽取方法与系统
CN115146030A (zh) 一种基于知识图谱的公务文书写作方法及系统
CN112487160B (zh) 技术文档溯源方法及装置、计算机设备、计算机存储介质
CN116595192B (zh) 科技前沿信息获取方法、装置、电子设备和可读存储介质
Liang et al. Fast and Accurate Resume Parsing Method Based on Multi-Task Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant