CN110717314A - 一种文献著录格式转换方法 - Google Patents
一种文献著录格式转换方法 Download PDFInfo
- Publication number
- CN110717314A CN110717314A CN201910989032.1A CN201910989032A CN110717314A CN 110717314 A CN110717314 A CN 110717314A CN 201910989032 A CN201910989032 A CN 201910989032A CN 110717314 A CN110717314 A CN 110717314A
- Authority
- CN
- China
- Prior art keywords
- document
- converted
- format
- target
- bibliographic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种文献著录格式转换方法,包括:S1、获取待转换文献列表及目标著录格式;S2、识别待转换文献列表中每条待转换文献的原始格式;S3、基于目标著录格式将待转换文献由原始格式转换为目标格式得到目标文献;S4、基于目标文献生成目标文献列表。通过本发明的方法,能够实现文献格式的自动转换,提高了转换效率,避免了人工转换容易出错的问题。
Description
技术领域
本发明涉及数据处理,具体涉及一种文献著录格式转换方法。
背景技术
专业文献的引用、写作通常需要遵从一定的文献引用著录标准,如我国的参考文献著录规则、APA(American Psychological Association)格式、 Chicago 格式、MLA(Modern Language Association)格式、Harvard格式、Vancouver格式等。不同的出版本物,往往采用不同的标准。这给文献引用带来一定的困难:一是需要将不同格式的参考文献按同一种标准进行编辑;二是当论文需要改投到采用不同著录格式的出版物时,需要对原有的参考文献重新编辑。
现有技术中,对文献著录格式的转换主要采用人工编辑的方式,然而人工编辑繁杂、工作量大,容易出错,且要求作者十分熟悉不同的著录格式。
因此,如何实现文献著录格式的自动转换成为了本领域技术人员急需解决的问题。
发明内容
针对现有技术存在的上述不足,本发明实际需要解决的问题是:如何实现文献著录格式的自动转换。
本发明采用了如下的技术方案:
一种文献著录格式转换方法,包括:
S1、获取待转换文献列表及目标著录格式;
S2、识别待转换文献列表中每条待转换文献的原始格式;
S3、基于目标著录格式将待转换文献由原始格式转换为目标格式得到目标文献;
S4、基于目标文献生成目标文献列表。
优选地,步骤S3包括:
当待转换文献的原始格式与目标著录格式相同,则将待转换文献作为目标文献,否则,基于待转换文献的原始格式将待转换文献分解为元数据,基于目标著录格式将元数据组合得到目标文献。
优选地,步骤S2至步骤S4具体包括:
S1001、识别待转换文献列表中待转换文献数量,待转换文献数量大于0时,执行步骤S1002,否则,执行步骤S1005;
S1002、识别待转换文献列表中第一条待转换文献的原始格式,执行步骤S1003;
S1003、当所述第一条待转换文献的原始格式与目标著录格式相同,则将所述第一条待转换文献作为目标文献,并将所述第一条待转换文献标记为已转换,返回执行步骤S1001,否则,基于所述第一条待转换文献的原始格式将所述第一条待转换文献分解为元数据,执行步骤S1005;
S1004、基于目标著录格式将元数据组合得到所述第一条待转换文献对应的目标文献,并将所述第一条待转换文献标记为已转换,返回执行步骤S1001;
S1005、将所有目标文献按待转换文献列表中的顺序生成目标文献列表。
优选地,识别待转换文献原始格式的方法包括:
获取文献格式规则;
将文献格式规则与待转换文献进行匹配并确定待转换文献的原始格式。
优选地,文献格式规则包括各种文献格式的识别特征,当待转换文献具有某种文献格式的识别特征时,则确定所述文献格式为待转换文献的原始格式。
优选地,元数据包括作者、文献标题、出版物名称、出版年、卷、期及页码中的任意一项或多项。
综上所述,本发明公开了一种文献著录格式转换方法,包括:S1、获取待转换文献列表及目标著录格式;S2、识别待转换文献列表中每条待转换文献的原始格式;S3、基于目标著录格式将待转换文献由原始格式转换为目标格式得到目标文献;S4、基于目标文献生成目标文献列表。通过本发明的方法,能够实现文献格式的自动转换,提高了转换效率,避免了人工转换容易出错的问题。
附图说明
图1是本发明中的一种文献著录格式转换方法的一具体实施方式的流程图;
图2是本发明中的一种文献著录格式转换方法的另一具体实施方式的流程图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述说明。
如图1所示,本发明公开了一种文献著录格式转换方法,包括:
S1、获取待转换文献列表及目标著录格式;
S2、识别待转换文献列表中每条待转换文献的原始格式;
S3、基于目标著录格式将待转换文献由原始格式转换为目标格式得到目标文献;
S4、基于目标文献生成目标文献列表。
通过本发明的方法,能够实现文献格式的自动转换,提高了转换效率,避免了人工转换容易出错的问题。
具体实施时,步骤S3包括:
当待转换文献的原始格式与目标著录格式相同,则将待转换文献作为目标文献,否则,基于待转换文献的原始格式将待转换文献分解为元数据,基于目标著录格式将元数据组合得到目标文献。
本发明中可预存各种文献格式的分解规则,分解规则中明确了各种格式的文献的每一部分的意义,在确定了待转换文献的原始格式之后,根据分解规则可将待转换文献分解为元数据,之后再根据目标著录格式进行组合即可得到对应的目标文献。通过这种分解再组合的行驶可以实现多种格式之间的灵活转换。并且,当原始格式与目标著录格式相同时,不再转换,直接将其作为目标文献,减少了数据的处理量。
具体实施时,步骤S2至步骤S4具体包括:
S1001、识别待转换文献列表中待转换文献数量,待转换文献数量大于0时,执行步骤S1002,否则,执行步骤S1005;
S1002、识别待转换文献列表中第一条待转换文献的原始格式,执行步骤S1003;
S1003、当所述第一条待转换文献的原始格式与目标著录格式相同,则将所述第一条待转换文献作为目标文献,并将所述第一条待转换文献标记为已转换,返回执行步骤S1001,否则,基于所述第一条待转换文献的原始格式将所述第一条待转换文献分解为元数据,执行步骤S1005;
S1004、基于目标著录格式将元数据组合得到所述第一条待转换文献对应的目标文献,并将所述第一条待转换文献标记为已转换,返回执行步骤S1001;
S1005、将所有目标文献按待转换文献列表中的顺序生成目标文献列表。
采取上述步骤,可以逐条实现待转换文献列表中的待转换文献的转换,防止重复转换及漏转的问题。
具体实施时,识别待转换文献原始格式的方法包括:
获取文献格式规则;
将文献格式规则与待转换文献进行匹配并确定待转换文献的原始格式。
本发明中通过预存的文献格式规则来与待转换文献进行匹配,从而实现待转换文献的原始格式的识别。文献格式规则可以是不同格式的文献的元数据的排列顺序,也可以是不同文献包括的不同的特征字符或信息。
具体实施时,文献格式规则包括各种文献格式的识别特征,当待转换文献具有某种文献格式的识别特征时,则确定所述文献格式为待转换文献的原始格式。
以下为常见几种文献著录格式及其特征字符(识别特征):
(1)China (国家标准《文后参考文献著录规则》):
作者. 文献标题[J]. 期刊名称, 出版年, 卷(期),页码.
特征字符:“[”
(2)APA (American Psychological Association):
作者. (出版年). 文献标题. 期刊名称, 卷(期), 页码.
特征字符:“. (”
(3)Harvard:
作者, 出版年. 文献标题. 期刊名称, 卷(期), pp.页码.
特征字符:“, pp.”
(4)Vancouver:
作者. 文献标题. 期刊名称. 出版年 月; 卷(期):页码.
特征字符:“):”
(5)MLA(Modern Language Association):
作者. “文献标题.” 期刊名称 卷.期 (出版年): 页码.
特征字符:“. "”且“):”
(6)Chicago:
作者. “文献标题.” 期刊名称 卷, no. 期 (出版年): 页码.
特征字符:“. “”且“, no.”且“):”
通过如图2所示的流程图,即可判断出待转换文献的原始格式。可根据预存的能够识别的各种格式,预设每种格式的判断顺序、特征字符及成立条件,这样可以以更少的特征字符及判断次数判断出各种格式,提高了格式的识别效率。
在判断上述6种格式时,首先判断是否含有“[”,若是,则认为是China格式,若不是,再判断是否含有“.(”,若是,则认为是APA格式,若不是,再判断是否含有“,pp.”,若是,则认为是Harvard格式,若不是,再判断是否含有“):”,若不是,则判断是其他格式,若无法判断出准确的格式,则可以进行报错,若是,再判断是否含有“. "”,若不是,则认为是Vancouver格式,若是,再判断是否含有“,pp.”,若不是,则认识是MLA格式,若是,则认为是Chicago格式。
采用上述方式,最多只需要6次判断即可实现格式的识别。
具体实施时,元数据包括作者、文献标题、出版物名称、出版年、卷、期及页码中的任意一项或多项。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管通过参照本发明的优选实施例已经对本发明进行了描述,但本领域的普通技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离所附权利要求书所限定的本发明的精神和范围。
Claims (6)
1.一种文献著录格式转换方法,其特征在于,包括:
S1、获取待转换文献列表及目标著录格式;
S2、识别待转换文献列表中每条待转换文献的原始格式;
S3、基于目标著录格式将待转换文献由原始格式转换为目标格式得到目标文献;
S4、基于目标文献生成目标文献列表。
2.如权利要求1所述的文献著录格式转换方法,其特征在于,步骤S3包括:
当待转换文献的原始格式与目标著录格式相同,则将待转换文献作为目标文献,否则,基于待转换文献的原始格式将待转换文献分解为元数据,基于目标著录格式将元数据组合得到目标文献。
3.如权利要求1或2所述的文献著录格式转换方法,其特征在于,步骤S2至步骤S4具体包括:
S1001、识别待转换文献列表中待转换文献数量,待转换文献数量大于0时,执行步骤S1002,否则,执行步骤S1005;
S1002、识别待转换文献列表中第一条待转换文献的原始格式,执行步骤S1003;
S1003、当所述第一条待转换文献的原始格式与目标著录格式相同,则将所述第一条待转换文献作为目标文献,并将所述第一条待转换文献标记为已转换,返回执行步骤S1001,否则,基于所述第一条待转换文献的原始格式将所述第一条待转换文献分解为元数据,执行步骤S1005;
S1004、基于目标著录格式将元数据组合得到所述第一条待转换文献对应的目标文献,并将所述第一条待转换文献标记为已转换,返回执行步骤S1001;
S1005、将所有目标文献按待转换文献列表中的顺序生成目标文献列表。
4.如权利要求1所述的文献著录格式转换方法,其特征在于,识别待转换文献原始格式的方法包括:
获取文献格式规则;
将文献格式规则与待转换文献进行匹配并确定待转换文献的原始格式。
5.如权利要求4所述的文献著录格式转换方法,其特征在于,文献格式规则包括各种文献格式的识别特征,当待转换文献具有某种文献格式的识别特征时,则确定所述文献格式为待转换文献的原始格式。
6.如权利要求1所述的文献著录格式转换方法,其特征在于,元数据包括作者、文献标题、出版物名称、出版年、卷、期及页码中的任意一项或多项。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910989032.1A CN110717314B (zh) | 2019-10-17 | 2019-10-17 | 一种文献著录格式转换方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910989032.1A CN110717314B (zh) | 2019-10-17 | 2019-10-17 | 一种文献著录格式转换方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110717314A true CN110717314A (zh) | 2020-01-21 |
CN110717314B CN110717314B (zh) | 2023-11-17 |
Family
ID=69211836
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910989032.1A Active CN110717314B (zh) | 2019-10-17 | 2019-10-17 | 一种文献著录格式转换方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110717314B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110750962A (zh) * | 2019-10-14 | 2020-02-04 | 深圳旗鱼体育传播有限公司 | 天气数据转换方法和系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101794278A (zh) * | 2009-09-21 | 2010-08-04 | 广东省标准化研究院 | 一种标准文献全文数字化方法及软件 |
CN101986294A (zh) * | 2010-10-18 | 2011-03-16 | 林桢 | 一种基于互联网Web2.0平台构建的在线文献管理系统 |
CN103399961A (zh) * | 2013-08-23 | 2013-11-20 | 北京中科嘉和科技发展有限公司 | 支持多版式的电子文献管理系统 |
CN105260727A (zh) * | 2015-11-12 | 2016-01-20 | 武汉大学 | 基于图像处理与序列标注的学术文献语义再结构化方法 |
CN105426546A (zh) * | 2015-12-28 | 2016-03-23 | 上海交通大学 | 专利智能检索方法及系统 |
CN105824791A (zh) * | 2016-03-17 | 2016-08-03 | 北京信息科技大学 | 一种参考文献格式检查方法 |
CN107862028A (zh) * | 2017-10-27 | 2018-03-30 | 湖北三新文化传媒有限公司 | 建立标准学术模型方法、服务器及存储介质 |
CN110110097A (zh) * | 2019-05-13 | 2019-08-09 | 江苏省质量技术监督信息中心 | 一种基于模式识别技术在标准化文献元数据提取实现方法 |
-
2019
- 2019-10-17 CN CN201910989032.1A patent/CN110717314B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101794278A (zh) * | 2009-09-21 | 2010-08-04 | 广东省标准化研究院 | 一种标准文献全文数字化方法及软件 |
CN101986294A (zh) * | 2010-10-18 | 2011-03-16 | 林桢 | 一种基于互联网Web2.0平台构建的在线文献管理系统 |
CN103399961A (zh) * | 2013-08-23 | 2013-11-20 | 北京中科嘉和科技发展有限公司 | 支持多版式的电子文献管理系统 |
CN105260727A (zh) * | 2015-11-12 | 2016-01-20 | 武汉大学 | 基于图像处理与序列标注的学术文献语义再结构化方法 |
CN105426546A (zh) * | 2015-12-28 | 2016-03-23 | 上海交通大学 | 专利智能检索方法及系统 |
CN105824791A (zh) * | 2016-03-17 | 2016-08-03 | 北京信息科技大学 | 一种参考文献格式检查方法 |
CN107862028A (zh) * | 2017-10-27 | 2018-03-30 | 湖北三新文化传媒有限公司 | 建立标准学术模型方法、服务器及存储介质 |
CN110110097A (zh) * | 2019-05-13 | 2019-08-09 | 江苏省质量技术监督信息中心 | 一种基于模式识别技术在标准化文献元数据提取实现方法 |
Non-Patent Citations (3)
Title |
---|
WHITE RYAN MACKENZIE: ""Administrative Data Format Standardization for Efficient Analytics"", 《INTERNATIONAL JOURNAL OF POPULATION DATA SCIENCE》 * |
黄俊贵: "关于文献目录著录标准格式问题", 《图书情报工作》 * |
黄俊贵: "关于文献目录著录标准格式问题", 《图书情报工作》, no. 03, 15 June 1980 (1980-06-15) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110750962A (zh) * | 2019-10-14 | 2020-02-04 | 深圳旗鱼体育传播有限公司 | 天气数据转换方法和系统 |
CN110750962B (zh) * | 2019-10-14 | 2020-08-28 | 深圳旗鱼体育传播有限公司 | 天气数据转换方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110717314B (zh) | 2023-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7796309B2 (en) | Integrating analog markups with electronic documents | |
JP4954978B2 (ja) | 提示可能なファイルのためのフィールドと、文献一覧および引用のための拡張マークアップ言語スキーマとの決定 | |
US8904283B2 (en) | Extendable meta-data support in final form presentation datastream print enterprises | |
US20100281353A1 (en) | Automated Annotating Hyperlinker | |
CN100543725C (zh) | 一种为电子印章定位的方法 | |
US20060112332A1 (en) | System and method for design checking | |
JP2022547895A (ja) | ユーザカスタマイズ型の文書自動作成方法、そのための装置及びサーバー | |
US20100010970A1 (en) | Document searching device, document searching method, document searching program | |
CN111950247A (zh) | 一种基于配置的Word文档生成方法 | |
JP2014010837A (ja) | 技術動向分析報告書生成システムおよび記録媒体 | |
Felicetti et al. | CIDOC CRM and Epigraphy: a Hermeneutic Challenge. | |
CN110717314A (zh) | 一种文献著录格式转换方法 | |
CN101714134A (zh) | 电子病历的修改处理方法和装置 | |
US20130332477A1 (en) | Record creating support apparatus and method | |
US9405749B2 (en) | Methods and data structures for improved searchable formatted documents including citation and corpus generation | |
CN107862083A (zh) | 一种扫描文件快速归档的方法 | |
US20080024806A1 (en) | In-process font activation | |
US20040205465A1 (en) | Method of electronically producing documents in a legal proceeding | |
US20060095838A1 (en) | Object-oriented processing of tab text | |
JP2008165386A (ja) | 文書管理装置、文書管理方法、文書管理プログラム | |
US8117527B2 (en) | Automated folio references | |
Haaf et al. | Historical newspapers & journals for the DTA | |
CN110941947A (zh) | 一种文档编辑的方法、装置、计算机存储介质及终端 | |
CN110457659B (zh) | 条款文档生成方法及终端设备 | |
JP2010170525A (ja) | 付加画像処理システム、画像形成装置及び付加画像追加方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |