CN106815482A

CN106815482A - 一种字母与数字组合的中医术语编码方法

Info

Publication number: CN106815482A
Application number: CN201710038801.0A
Authority: CN
Inventors: 房敏; 成福春; 刘华; 朱亮; 冯佳; 周蜜果
Original assignee: Yueyang Hospital of Integrated Traditional Chinese and Western Medicine Shanghai University of TCM
Current assignee: Yueyang Hospital of Integrated Traditional Chinese and Western Medicine Shanghai University of TCM
Priority date: 2017-01-19
Filing date: 2017-01-19
Publication date: 2017-06-09

Abstract

本发明涉及一种字母与数字组合的中医术语编码方法。所述的中医术语编码由英文字母和数字组成，包括8位项目标识符、7位维护机构标识符、2位表标识符、1位校验位。校验位算法为：对每一个特定的字母数字序列，按位加权累加，和mod 37，产生余数；权重系数序列：从最后一位开始，给予每一位字母或数字对应的权重，即2，4，8，16，32，27…，28，19，1；字母值对应序列为：A‑10，B‑11，C‑12…Z‑35；建立余数与字符对照表，若余数为36，给予一个特定的字符表示：Π，通过对照表，产生最后的校验位。本发明可校验出所有的一位错误和相邻两位交换错误；还可进行二次校验，从而使代码错误的发生率大大降低。

Description

一种字母与数字组合的中医术语编码方法

技术领域

本发明涉及专业术语编码领域，具体地说，涉及一种字母与数字组合的中医术语编码方法。

背景技术

当今生活中的诸多物品、物料、代号等都有其统一的编码，以便于标准化和统一管理。这些编码化的数据将在不同的系统间产生大量的数据交互。而在手工输入编码或者数据交互过程中有可能产生错误，例如，人们在录入数字或字母时，最容易犯的错误是一位错误，如“a”变成“b”，或者是相邻两位交换错误，如“ab”变成“ba”。以上两种错误，约占所有常见错误的90％以上。

一般的编码方法往往是字母与数字的组合，没有校验位，无法判断编码本身是否有错。例如中国人民保险机动车综合商业保险条款中的险种编号就是字母与数字的组合，如机动车损失保险：A01H2014102JZ01、机动车第三者责任保险：A01H2014102JZ02等。各地的汽车牌照也是字母与数字的组合。随着对编码认识的深入以及技术的发展，可按照一定的规则与算法，产生校验位，形成含校验位的完整编码。通过含校验位的编码算法，解决人们或机器在随机错误中最常见的一位或相邻两位交换错误问题。校验位算法相对比较复杂，因此，具有相应的防伪性。

在未来的系统中，所有的医学术语，包括中医术语，也需要统一的编码。国内目前尚无一套既具有信息技术特征，又具有中医学科本身特征的编码化的术语集。编码化中医术语集的制定将促进医学术语代码尤其是中医术语代码全国统一，对于中医走向国际化具有重要的意义。编码化中医术语集的制定过程中需要给每一个中医术语一个唯一的编码。通过中医术语编码校验位算法，可以验证其是否为有效的编码，以及是否存在一位错误或相邻两位交换错误，将大大地减少错误的产生率，提高数据的质量，进而提高医疗的质量，对于医疗系统的安全性也具有重要的意义。

中国期刊《中国中医药图书情报杂志》，2015年第4期刊出的论文“SNOMED编码校验位算法解析及其对中医术语编码的意义”，讨论了编码之中常用到的按位累加取模、多项式乘法累加取模等校验位算法的优缺点，尤其是对系统化医学术语集(SNOMED)编码采用二面体群D5校验位算法作了较深入的讨论，二面体群D5算法不仅可以校验出所有一位错误及相邻位置换位错误，而且不需要增加字母X，是一种非常理想的校验位算法，SNOMED编码采用二面体群D5校验位算法，对于中医术语编码具有重要的借鉴意义。

然而，中医术语数量庞大，保证信息的正确性非常重要，因此有必要提供一种新的错误率更低的中医术语编码方法及校验方法，目前尚未见相关报道。

发明内容

本发明的目的是针对现有技术中的不足，提供一种中医术语编码的校验位算法。

本发明的再一目的是，提供一种中医术语编码方法。

为实现上述第一个目的，本发明采取的技术方案是：

一种中医术语编码的校验位算法，所述的中医术语编码由英文字母A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y或Z和数字0,1,2,3,4,5,6,7,8或9组成，从左至右依次为8位项目标识符、7位维护机构标识符、2位表标识符、1位校验位，所述的校验位具体产生算法如下：

对每一个特定的字母数字序列，按位加权累加，和mod 37，产生余数；权重系数序列：2，4，8，16，32，27，…，28，19，1；字母与值对应关系为：

A	B	C	D	E	F	G	H	I	J	K	L	M
													10	11	12	13	14	15	16	17	18	19	20	21	22
N	O	P	Q	R	S	T	U	V	W	X	Y	Z
													23	24	25	26	27	28	29	30	31	32	33	34	35

建立余数与字符对照表，若余数为36，给予一个特定的字符表示：Π，通过该对照表，产生最后的校验位。

按照与上述相反的顺序进行解码。

所述的8位项目标识符由3位英文字母和5位数字组成。

所述的7位维护机构标识符由3位英文字母和4位数字组成。

为实现上述第二个目的，本发明采取的技术方案是：

一种中医术语编码方法，所述的中医术语编码由英文字母A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y或Z和数字0,1,2,3,4,5,6,7,8或9组成，从左至右依次为8位项目标识符、7位维护机构标识符、2位表标识符、1位校验位。

所述的校验位具体产生算法如下：

对每一个特定的字母数字序列，按位加权累加，和mod 37，产生余数；

权重系数序列：2，4，8，16，32，27，…，28，19，1；字母与值对应关系为：

所述的8位项目标识符由3位英文字母和5位数字组成。

所述的7位维护机构标识符由3位英文字母和4位数字组成。

本发明优点在于：

本发明的中医术语编码方法采用特定的编码方法，相应的位置具有内在的逻辑规则，还采用了特定的校验位算法，对每一个中医术语产生一位校验位，进行唯一地编码，在一次校验的基础上可以进行二次校验，如校验相应位置上是否为数字或字符，校验相应的字母数字序列是否在特定的表中，如维护机构代码。由于维护机构代码数量有限，按照最大似然定理，该编码还具有一定的纠错功能，从而使错误的发生率大大降低。一旦投入应用，将在不同应用系统之间采用统一的代码进行交互，每年将会产生数以亿次的校验位算法调用，将有利于更具备实用性的编码化中医术语集的制定，推动中医术语的标准化和中医的国际化。

附图说明

附图1是本发明的中医术语编码组成示意图。

具体实施方式

下面结合附图对本发明提供的具体实施方式作详细说明。

实施例1

请参照图1，图1是本发明的中医术语编码组成示意图。所述的中医术语编码由英文字母和数字组成，共18位，从左至右依次为8位项目标识符、7位维护机构标识符、2位表标识符、1位校验位。校验位具体产生算法如下：

由于有数字与字母，10个数字(0,1,2,3,4,5,6,7,8,9)，26个大写字母(A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y,Z)，共36个字符。对每一个特定的字母数字序列，按位加权累加，和mod 37，产生余数。

权重系数序列：2，4，8，16，32，27，…，28，19，1。

字母与值对应关系为：

如上所述产生校验位，进行完整编码。按照相反的顺序，进行解码。

本发明的特定的校验位算法，除了可识别所有一位错误和所有二位换位错误，还可识别大部分的三位及以上错误，在一次校验的基础上可以进行二次校验，如对维护机构标识符的校验等，从而使错误的发生率大大降低。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员，在不脱离本发明方法的前提下，还可以做出若干改进和补充，这些改进和补充也应视为本发明的保护范围。

Claims

1.一种中医术语编码的校验位算法，其特征在于，所述的中医术语编码由英文字母A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y或Z和数字0,1,2,3,4,5,6,7,8或9组成，从左至右依次为8位项目标识符、7位维护机构标识符、2位表标识符、1位校验位，所述的校验位具体产生算法如下：

2.根据权利要求1所述的中医术语编码的校验位算法，其特征在于，按照与上述相反的顺序进行解码。

3.根据权利要求1所述的中医术语编码的校验位算法，其特征在于，所述的8位项目标识符由3位英文字母和5位数字组成。

4.根据权利要求1所述的中医术语编码的校验位算法，其特征在于，所述的7位维护机构标识符由3位英文字母和4位数字组成。

5.一种中医术语编码方法，其特征在于，所述的中医术语编码由英文字母A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y或Z和数字0,1,2,3,4,5,6,7,8或9组成，从左至右依次为8位项目标识符、7位维护机构标识符、2位表标识符、1位校验位。

6.根据权利要求5所述的中医术语编码方法，其特征在于，所述的校验位具体产生算法如下：

对每一个特定的字母数字序列，加权累加和mod 37，产生余数；权重系数序列：2，4，8，16，32，27，…，28，19，1；字母与值对应关系为：

7.根据权利要求5所述的中医术语编码方法，其特征在于，所述的8位项目标识符由3位英文字母和5位数字组成。

8.根据权利要求5所述的中医术语编码方法，其特征在于，所述的7位维护机构标识符由3位英文字母和4位数字组成。