CN106815482A - 一种字母与数字组合的中医术语编码方法 - Google Patents

一种字母与数字组合的中医术语编码方法 Download PDF

Info

Publication number
CN106815482A
CN106815482A CN201710038801.0A CN201710038801A CN106815482A CN 106815482 A CN106815482 A CN 106815482A CN 201710038801 A CN201710038801 A CN 201710038801A CN 106815482 A CN106815482 A CN 106815482A
Authority
CN
China
Prior art keywords
tcm
related terms
bit
identifiers
remainder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710038801.0A
Other languages
English (en)
Inventor
房敏
成福春
刘华
朱亮
冯佳
周蜜果
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yueyang Hospital of Integrated Traditional Chinese and Western Medicine Shanghai University of TCM
Original Assignee
Yueyang Hospital of Integrated Traditional Chinese and Western Medicine Shanghai University of TCM
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yueyang Hospital of Integrated Traditional Chinese and Western Medicine Shanghai University of TCM filed Critical Yueyang Hospital of Integrated Traditional Chinese and Western Medicine Shanghai University of TCM
Priority to CN201710038801.0A priority Critical patent/CN106815482A/zh
Publication of CN106815482A publication Critical patent/CN106815482A/zh
Pending legal-status Critical Current

Links

Classifications

    • G06F19/30

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及一种字母与数字组合的中医术语编码方法。所述的中医术语编码由英文字母和数字组成,包括8位项目标识符、7位维护机构标识符、2位表标识符、1位校验位。校验位算法为:对每一个特定的字母数字序列,按位加权累加,和mod 37,产生余数;权重系数序列:从最后一位开始,给予每一位字母或数字对应的权重,即2,4,8,16,32,27…,28,19,1;字母值对应序列为:A‑10,B‑11,C‑12…Z‑35;建立余数与字符对照表,若余数为36,给予一个特定的字符表示:Π,通过对照表,产生最后的校验位。本发明可校验出所有的一位错误和相邻两位交换错误;还可进行二次校验,从而使代码错误的发生率大大降低。

Description

一种字母与数字组合的中医术语编码方法
技术领域
本发明涉及专业术语编码领域,具体地说,涉及一种字母与数字组合的中医术语编码方法。
背景技术
当今生活中的诸多物品、物料、代号等都有其统一的编码,以便于标准化和统一管理。这些编码化的数据将在不同的系统间产生大量的数据交互。而在手工输入编码或者数据交互过程中有可能产生错误,例如,人们在录入数字或字母时,最容易犯的错误是一位错误,如“a”变成“b”,或者是相邻两位交换错误,如“ab”变成“ba”。以上两种错误,约占所有常见错误的90%以上。
一般的编码方法往往是字母与数字的组合,没有校验位,无法判断编码本身是否有错。例如中国人民保险机动车综合商业保险条款中的险种编号就是字母与数字的组合,如机动车损失保险:A01H2014102JZ01、机动车第三者责任保险:A01H2014102JZ02等。各地的汽车牌照也是字母与数字的组合。随着对编码认识的深入以及技术的发展,可按照一定的规则与算法,产生校验位,形成含校验位的完整编码。通过含校验位的编码算法,解决人们或机器在随机错误中最常见的一位或相邻两位交换错误问题。校验位算法相对比较复杂,因此,具有相应的防伪性。
在未来的系统中,所有的医学术语,包括中医术语,也需要统一的编码。国内目前尚无一套既具有信息技术特征,又具有中医学科本身特征的编码化的术语集。编码化中医术语集的制定将促进医学术语代码尤其是中医术语代码全国统一,对于中医走向国际化具有重要的意义。编码化中医术语集的制定过程中需要给每一个中医术语一个唯一的编码。通过中医术语编码校验位算法,可以验证其是否为有效的编码,以及是否存在一位错误或相邻两位交换错误,将大大地减少错误的产生率,提高数据的质量,进而提高医疗的质量,对于医疗系统的安全性也具有重要的意义。
中国期刊《中国中医药图书情报杂志》,2015年第4期刊出的论文“SNOMED编码校验位算法解析及其对中医术语编码的意义”,讨论了编码之中常用到的按位累加取模、多项式乘法累加取模等校验位算法的优缺点,尤其是对系统化医学术语集(SNOMED)编码采用二面体群D5校验位算法作了较深入的讨论,二面体群D5算法不仅可以校验出所有一位错误及相邻位置换位错误,而且不需要增加字母X,是一种非常理想的校验位算法,SNOMED编码采用二面体群D5校验位算法,对于中医术语编码具有重要的借鉴意义。
然而,中医术语数量庞大,保证信息的正确性非常重要,因此有必要提供一种新的错误率更低的中医术语编码方法及校验方法,目前尚未见相关报道。
发明内容
本发明的目的是针对现有技术中的不足,提供一种中医术语编码的校验位算法。
本发明的再一目的是,提供一种中医术语编码方法。
为实现上述第一个目的,本发明采取的技术方案是:
一种中医术语编码的校验位算法,所述的中医术语编码由英文字母A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y或Z和数字0,1,2,3,4,5,6,7,8或9组成,从左至右依次为8位项目标识符、7位维护机构标识符、2位表标识符、1位校验位,所述的校验位具体产生算法如下:
对每一个特定的字母数字序列,按位加权累加,和mod 37,产生余数;权重系数序列:2,4,8,16,32,27,…,28,19,1;字母与值对应关系为:
A B C D E F G H I J K L M
10 11 12 13 14 15 16 17 18 19 20 21 22
N O P Q R S T U V W X Y Z
23 24 25 26 27 28 29 30 31 32 33 34 35
建立余数与字符对照表,若余数为36,给予一个特定的字符表示:Π,通过该对照表,产生最后的校验位。
按照与上述相反的顺序进行解码。
所述的8位项目标识符由3位英文字母和5位数字组成。
所述的7位维护机构标识符由3位英文字母和4位数字组成。
为实现上述第二个目的,本发明采取的技术方案是:
一种中医术语编码方法,所述的中医术语编码由英文字母A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y或Z和数字0,1,2,3,4,5,6,7,8或9组成,从左至右依次为8位项目标识符、7位维护机构标识符、2位表标识符、1位校验位。
所述的校验位具体产生算法如下:
对每一个特定的字母数字序列,按位加权累加,和mod 37,产生余数;
权重系数序列:2,4,8,16,32,27,…,28,19,1;字母与值对应关系为:
A B C D E F G H I J K L M
10 11 12 13 14 15 16 17 18 19 20 21 22
N O P Q R S T U V W X Y Z
23 24 25 26 27 28 29 30 31 32 33 34 35
建立余数与字符对照表,若余数为36,给予一个特定的字符表示:Π,通过该对照表,产生最后的校验位。
所述的8位项目标识符由3位英文字母和5位数字组成。
所述的7位维护机构标识符由3位英文字母和4位数字组成。
本发明优点在于:
本发明的中医术语编码方法采用特定的编码方法,相应的位置具有内在的逻辑规则,还采用了特定的校验位算法,对每一个中医术语产生一位校验位,进行唯一地编码,在一次校验的基础上可以进行二次校验,如校验相应位置上是否为数字或字符,校验相应的字母数字序列是否在特定的表中,如维护机构代码。由于维护机构代码数量有限,按照最大似然定理,该编码还具有一定的纠错功能,从而使错误的发生率大大降低。一旦投入应用,将在不同应用系统之间采用统一的代码进行交互,每年将会产生数以亿次的校验位算法调用,将有利于更具备实用性的编码化中医术语集的制定,推动中医术语的标准化和中医的国际化。
附图说明
附图1是本发明的中医术语编码组成示意图。
具体实施方式
下面结合附图对本发明提供的具体实施方式作详细说明。
实施例1
请参照图1,图1是本发明的中医术语编码组成示意图。所述的中医术语编码由英文字母和数字组成,共18位,从左至右依次为8位项目标识符、7位维护机构标识符、2位表标识符、1位校验位。校验位具体产生算法如下:
由于有数字与字母,10个数字(0,1,2,3,4,5,6,7,8,9),26个大写字母(A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y,Z),共36个字符。对每一个特定的字母数字序列,按位加权累加,和mod 37,产生余数。
权重系数序列:2,4,8,16,32,27,…,28,19,1。
字母与值对应关系为:
A B C D E F G H I J K L M
10 11 12 13 14 15 16 17 18 19 20 21 22
N O P Q R S T U V W X Y Z
23 24 25 26 27 28 29 30 31 32 33 34 35
建立余数与字符对照表,若余数为36,给予一个特定的字符表示:Π,通过该对照表,产生最后的校验位。
如上所述产生校验位,进行完整编码。按照相反的顺序,进行解码。
本发明的特定的校验位算法,除了可识别所有一位错误和所有二位换位错误,还可识别大部分的三位及以上错误,在一次校验的基础上可以进行二次校验,如对维护机构标识符的校验等,从而使错误的发生率大大降低。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。

Claims (8)

1.一种中医术语编码的校验位算法,其特征在于,所述的中医术语编码由英文字母A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y或Z和数字0,1,2,3,4,5,6,7,8或9组成,从左至右依次为8位项目标识符、7位维护机构标识符、2位表标识符、1位校验位,所述的校验位具体产生算法如下:
对每一个特定的字母数字序列,按位加权累加,和mod 37,产生余数;权重系数序列:2,4,8,16,32,27,…,28,19,1;字母与值对应关系为:
A B C D E F G H I J K L M 10 11 12 13 14 15 16 17 18 19 20 21 22 N O P Q R S T U V W X Y Z 23 24 25 26 27 28 29 30 31 32 33 34 35
建立余数与字符对照表,若余数为36,给予一个特定的字符表示:Π,通过该对照表,产生最后的校验位。
2.根据权利要求1所述的中医术语编码的校验位算法,其特征在于,按照与上述相反的顺序进行解码。
3.根据权利要求1所述的中医术语编码的校验位算法,其特征在于,所述的8位项目标识符由3位英文字母和5位数字组成。
4.根据权利要求1所述的中医术语编码的校验位算法,其特征在于,所述的7位维护机构标识符由3位英文字母和4位数字组成。
5.一种中医术语编码方法,其特征在于,所述的中医术语编码由英文字母A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y或Z和数字0,1,2,3,4,5,6,7,8或9组成,从左至右依次为8位项目标识符、7位维护机构标识符、2位表标识符、1位校验位。
6.根据权利要求5所述的中医术语编码方法,其特征在于,所述的校验位具体产生算法如下:
对每一个特定的字母数字序列,加权累加和mod 37,产生余数;权重系数序列:2,4,8,16,32,27,…,28,19,1;字母与值对应关系为:
A B C D E F G H I J K L M 10 11 12 13 14 15 16 17 18 19 20 21 22 N O P Q R S T U V W X Y Z 23 24 25 26 27 28 29 30 31 32 33 34 35
建立余数与字符对照表,若余数为36,给予一个特定的字符表示:Π,通过该对照表,产生最后的校验位。
7.根据权利要求5所述的中医术语编码方法,其特征在于,所述的8位项目标识符由3位英文字母和5位数字组成。
8.根据权利要求5所述的中医术语编码方法,其特征在于,所述的7位维护机构标识符由3位英文字母和4位数字组成。
CN201710038801.0A 2017-01-19 2017-01-19 一种字母与数字组合的中医术语编码方法 Pending CN106815482A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710038801.0A CN106815482A (zh) 2017-01-19 2017-01-19 一种字母与数字组合的中医术语编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710038801.0A CN106815482A (zh) 2017-01-19 2017-01-19 一种字母与数字组合的中医术语编码方法

Publications (1)

Publication Number Publication Date
CN106815482A true CN106815482A (zh) 2017-06-09

Family

ID=59112401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710038801.0A Pending CN106815482A (zh) 2017-01-19 2017-01-19 一种字母与数字组合的中医术语编码方法

Country Status (1)

Country Link
CN (1) CN106815482A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109409401A (zh) * 2018-08-30 2019-03-01 深圳市买买提信息科技有限公司 一种信息核对方法、装置和系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109409401A (zh) * 2018-08-30 2019-03-01 深圳市买买提信息科技有限公司 一种信息核对方法、装置和系统

Similar Documents

Publication Publication Date Title
CN100369059C (zh) 一种矩阵式二维条码及其编码解码方法
CN104731976A (zh) 数据表中隐私数据的发现与分类方法
CN107301210A (zh) 一种数据处理方法
Gumm A new class of check-digit methods for arbitrary number systems (Corresp.)
CN1980180A (zh) 线速率学习和查找二层转发表项的方法和系统
CN106815482A (zh) 一种字母与数字组合的中医术语编码方法
US6463563B1 (en) Single symbol correction double symbol detection code employing a modular H-matrix
CN114077826A (zh) 一种数据处理的方法、装置及计算机可读介质
Rosenbaum et al. Multifont OCR postprocessing system
CN107562558A (zh) 一种错误信息的反馈方法及系统
CN102375994A (zh) 书写汉字笔顺正确性检测及还原的方法和装置
WO2010114526A1 (en) System for recovering data from an unreadable tag
CN105678434A (zh) Erp系统中校验信息发布的方法和系统
CN111950648B (zh) 一种快递包裹标签三段码校验方法及装置
CN110688457A (zh) 一种基于标识解析的汽摩行业文本信息录入方法
CN111414701B (zh) 用于提取cad文件元素并转换相对坐标的方法
CN101625678B (zh) 拼写检查系统及其方法
CN103995602A (zh) 证件多语种信息录入和纠错系统
CN101334810A (zh) 一种病理检查用条形码的处理方法
CN102576402B (zh) 规则揭示型鉴权方法和系统
CN113434650A (zh) 问答对扩展方法、装置、电子设备及可读存储介质
CN105094359A (zh) 一种数字序号输入法
CN106056223A (zh) 用于车辆远程诊断与备件检索的平台
CN103400176A (zh) 一种数字字符编码及其识别方法
Bowman et al. A chemically oriented information storage and retrieval system. I. storage and verification of structural information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170609

RJ01 Rejection of invention patent application after publication