CN109086275A

CN109086275A - 实现机器智能的方法和装置

Info

Publication number: CN109086275A
Application number: CN201810635875.7A
Authority: CN
Inventors: 吴胜远
Original assignee: Individual
Current assignee: Individual
Priority date: 2018-06-20
Filing date: 2018-06-20
Publication date: 2018-12-25

Abstract

实现机器智能（Machine Intelligence）的方法和装置MI（Machine Intelligence）是机器自身具有智能，具有解决问题的能力。MI之前，机器所体现出的智能，都是AI；离开AI，机器本身什么智能也没有。牛顿定律激发了机械革命，解放了人的体力。图灵测试的误导，使人深陷AI的囹圄;AI让机器貌似有智能，MI让机器真有智能；AI将人变为机器的奴隶；MI能激发机器革命，解放人的脑力，将人变回主人。MI时代来了，世界IT大反转、大洗牌的时刻到了；许多理论和技术都要消亡或重生、各种程序序言、标记性语言等将消亡……。真正科学是简单的；MI比AI简单百倍；它能让你在大反转、大洗牌中，具有超强的竞争力；处于遥遥领先地位。

Description

实现机器智能的方法和装置

技术领域

本发明涉及数字数据处理领域。

背景技术

从计算机诞生以来，机器所体现出的智能，都是人工智能。离开人工智能，机器本身什么智能也没有，什么事情也干不了。

例如：如果没有人工智能为机器做自然语言理解，中文信息就无法处理；如果没有人工智能为机器做网页解析，就没有互联网；如果没有人工智能为机器做源程序解释或编译，所有的程序都无法运行。本文人工智能，是指：用人的智能为机器做翻译：如自然语言理解、网页解析和源程序解释或编译等。

机器智能，MI（Machine Intelligence），不同于人工智能，AI（ArtificialIntelligence）。

发明内容

数字数据实质上是比特序列；机器没有智能的根本原因在于：比特序列中不含机器区分对象的语义，也不含机器解析对象属性的语义；机器不懂得如何处理数据，即机器没有智能。

本发明的目的在于：让比特序列含有让机器能区分对象的语义；让比特序列含有机器能解析对象属性的语义；从而实现机器智能。

发明内容和具体实施方式

什么是机器智能；什么是智能

机器智能是机器自身具有的智能，即机器自身具有解决问题的能力；也就是，离开人工智能，机器自身所体现的智能。

机器之所以没有智能，是因为机器不懂得数据，不具有区分和解析数据的能力。

人具有区分和解析数据的能力，人有智能

例如：“会计师去银行开会”

数据对人来说，这是一个汉字串，是一个汉字字形串，人懂得字形，即认识汉字，人依据自己的知识、经验；人具有区分和解析能力，这就是人的智能，人的智能具有将这个汉字串区分为词对象的能力，具有解析汉字语音的能力。

例如：人能将上面汉字串区分为以下词对象：

“会计师去银行开会”

对机器来说，数据是一个比特串，一个字节序列。这句话是一个汉字编码序列。

对“会计师去银行开会”，机器不具有将一个字节序列区分为字节组的能力；即不具有分词能力，也不具有解析汉字语音的能力。

从计算机诞生以来，机器具有存、取和计算数据的能力；但是，没有区分和解析数据的能力；机器没有智能。因此，必须借助于人工智能为机器理解和翻译。

以下介绍，如何让机器具有记忆语义、关联、区分和解析能力，如何实现机器智能。

（一）如何让机器具有区分对象和解析对象的智能

个汉字编码（GB2312）为2字节，每个字节的最左一位用作标记位，均置为1；ASCHII码是1字节，最左一位也用作标记位，置为0。

这种用作标记的比特，称作标记比特。标记比特的取值也为0或1；但是，0或1不用作数值，仅用作标记。

这里的标记比特，使机器具有了区分汉字编码与SCHII编码的能力。但是，不具有将一个字节序列区分为字节组的能力。

通过标记比特与字节组相关联，字节组与对象相关联，让机器具有区分对象的能力；标记比特能使字节序列关联作者的语义，让机器能将作者的语义解析出来。

一种二进制比特序列数字数据的处理方法，在一个二进制比特字节序列中，一个或多个字节对应一个对象；与对象相对应的字节称为字节组；由于字节序列中不含区分字节组的信息，对象难以区分；其特征在于：每个字节的最左比特，用作标记比特，标记比特的0或1用作标记；其特征还在于至少包含以下步骤之一：

建立标记比特与字节组相关联的步骤：

设字节序列的字节组含有（n+1）字节，n=0，或正整数；通过标记比特关联字节组的步骤如下；

如果n不等于0，则将最右字节的标记比特置为0；其余n字节的标记比特置为1；

如果n=0；则将这个字节的标记比特置为0；

区分字节组步骤；通过扫描字节序列的标记比特区分字节组，根据三种不同情况，选择以下扫描区分字节组步骤：

从左向右扫描字节序列的标记比特区分字节组步骤；

如果第1个标记比特为1，继续扫描，直到为0的标记比特，则从第一个为1的标记比特的字节，到为0的标记比特字节，被区分为1个字节组；

如果第1个标记比特为0，则标记比特为0的字节被区分为1个字节组；

从区分出的字节组的右边字节，按上述规则，继续扫描和区分，直至序列结束，或至字节序列的某个字节组；

从右向左扫描字节序列的标记比特区分字节组步骤；

如果第1个标记比特为1，继续扫描，直到为0的标记比特；

继续扫描，如果下一个标记比特为0；则上一个标记比特为0的字节，被区分为一个字节组；

如果下一个标记比特为1，继续扫描，直到为0的标记比特；则从上一个为0的标记比特的字节，到下一个为0的标记比特的右边字节，被区分为1个字节组；

从区分出的字节组的左边字节，按上述规则，继续扫描和区分，直至序列结束，或至字节序列的某个字节组；

从字节序列某一个中间比特标记区分字节组的步骤：

区分第1个字节组的步骤如下：

如果这个中间标记比特为1，则从这个标记比特向左扫描：

如果下一个标记比特为1，继续向左扫描，直到为0的标记比特，

然后，向右扫描，直到为0的标记比特；

则将左边为0标记比特的字节的右边字节，到右边为0标记比特的字节，被区分为第1个字节组；

如果这个中间标记比特为0，则从这个标记比特向左扫描：

如果左边标记比特为0，则这个中间标记比特为0的字节，被区分为第1个字节组；

如果左边标记比特为1，继续向左扫描，直到为0的标记比特；则将左边为0标记比特的字节的右边字节，到右边第一个为0标记比特的字节，被区分为第1个字节组；

区分第1个字节组右边的字节组，按从左向右扫描区分字节组步骤区分；

区分第1个字节组左边的字节组，按从右向左扫描区分字节组步骤区分。

上述方法以装置方式描述如下。

一种二进制比特序列数字数据的处理的装置, 该装置的二进制比特字节序列中，一个或多个字节对应一个对象；与对象相对应的字节称为字节组；由于字节序列中不含区分字节组的信息，对象难以区分；其特征在于：每个字节的最左比特，用作标记比特，标记比特的0或1用作标记；其特征还在于：该装置包含以下装置之一：

建立标记比特与字节组相关联装置；

设该装置字节序列的字节组含有（n+1）字节，n=0，或正整数；通过标记比特关联字节组的步骤如下；

如果n=0；则将这个字节的标记比特置为0；

区分字节组装置；该装置通过扫描字节序列的标记比特区分字节组；根据三种不同情况，该装置至少含有以下三种装置之一：

从左向右区分字节组装置；

该装置从左向右扫描字节序列的标记比特，含有以下操作步骤：

从区分出的字节组的右边字节，按上述规则，继续扫描和区分，直至序列结束，或至某个字节组；

从右向左区分字节组装置；

该装置从右向左扫描字节序列的标记比特，含有以下操作步骤：

如果第1个标记比特为1，继续扫描，直到为0的标记比特；

从字节序列中间的某个比特标记区分字节组装置;

该装置含有以下操作步骤：

区分第1个字节组的步骤如下：

如果这个中间标记比特为1，则从这个标记比特向左扫描：

然后，向右扫描，直到为0的标记比特；

如果这个中间标记比特为0，则从这个标记比特向左扫描：

区分第1个字节组右边的字节组，用从左向右扫描区分字节组装置区分；

区分第1个字节组左边的字节组，用从右向左扫描区分字节组装置区分。

一个字节组对应一个对象，区分字节组，就是区分对象。

上面的“其特征还在于该装置至少包含以下装置之一：”，不是：“其特征还在于包含以下装置：”

；因为，保护范围会缩小。

一个中文词对象是一个2字节、4字节、6字节，……，的字节组，由于字节序列中不含区分字节组的比特信息，词对象难以区分，即机器本身没有能力区分词对象，以下是机器智能中文分词实例。

“乒乓球拍卖完了”，假定作者的分词意图为：“乒乓球，拍卖，完，了”

作者按词输入（或编辑）时，机器按照标记比特标注规则,根据作者的分词意图，对字节组作标注，让机器记住作者的意图。

“乒乓球拍卖完了”，这个字节串为14字节。作者按照分词意图：“乒乓球，拍卖，完，了”，分别输入4个词。1个词为1个字节组。机器按照标记比特标注规则，对每1个字节组的标记比特，标注如下：

对第1个字节组，6个字节的标记比特，分别标注为：1，1，1，1，1，0；

对第2个字节组，4个字节的标记比特，分别标注为：1，1，1，0；

对第3个字节组，2个字节的标记比特，分别标注为： 1，0；

对第4个字节组，2个字节的标记比特，分别标注为： 1，0。

标注前后的字节序列如图1(a)所示。

标注后的字节串和对应的标记比特如图1(b)所示；实验实例如图2所示。

机器根据标记比特扫描规则，区分字节组，将作者的意图解析出来

用户获取数据时，机器根据标记比特扫描规则，区分出每个字节组，1个字节组对应1个词对象。

根据标记比特扫描规则，扫描图2标记比特：0号标记比特为1，继续扫描， 1号标记比特为1，继续扫描，2号标记比特为1，继续扫描，3号标记比特为1，继续扫描，4号标记比特为1，继续扫描，5号标记比特为0；因此，0、1、2、3、4、5号字节被区分为1个字节组；这个字节组，对应词对象“乒乓球”；

继续扫描：6号标记比特为1，继续扫描， 7号标记比特为1，继续扫描，8号标记比特为1，继续扫描，9号标记比特为0；因此，6、7、8、9字节被区分为1个字节组；这个字节组，对应词对象“拍卖”；

继续扫描：a号标记比特为1，继续扫描， b号标记比特为0；因此，a、b字节被区分为1个字节组；这个字节组，对应词对象“完”；

继续扫描：c号标记比特为1，继续扫描， d号标记比特为0；因此，c、d字节被区分为1个字节组；这个字节组，对应词对象“了”。

扫描完毕，机器分词结果与作者输入的分词意图：“乒乓球，拍卖，完，了”，完全一样。

通过标记比特扫描，让机器具有将一个字节序列区分为字节组的能力，具有区分词的能力；机器具有了区分对象的能力，所以机器有了智能。

实例中，朗读这句话时，机器在两个词对象之间，增加了停顿，用户通过时间间隔，能区分词对象。

作者在创建文档（如输入或编辑）时，根据标记比特标注规则，标注比特标记：让机器将作者表达的精确分词意图存储起来，让机器具有了对作者意图的记忆能力。

用户获取数据时，根据标记比特扫描区分规则，扫描含有标记比特的字节串，让机器具有了获取作者意图的能力。

符合字节组标记比特标注规则的比特标记，称作Ubit（Ultra-bit，超比特）。超比特能使机器具有将一个字节序列区分为字节组的能力。

含有超比特的字节组；称作Ucode（Ultra-code，超编码）。区分字节组的扫描步骤，又称作超比特扫描区分规则。超编码是机器可区分的编码。一个超编码的长度为n个字节，n为正整数，即每个编码可以任意长。

标记比特与字节组相关联，即超比特与超编码相关联；通过扫描字节序列的标记比特区分字节组，即通过扫描超比特区分超编码。

在一个超编码序列中，超比特使得机器具有了区分不同长度编码的能力。上例，将“乒乓球拍卖完了”的汉字编码序列，通过超比特，将作者的分词意图：“乒乓球，拍卖，完，了”与超编码相关联。这里，超编码序列的4个超编码长度分别为6，4，2，2字节。实验实例如图2所示。

以上用超编码关联词对象；以下介绍如何关联对象或对象属性，机器如何区分对象和解析对象的属性。

（二）如何让机器具有区分对象和解析对象属性的智能

以HTML语言为例，网页的图形对象的三个基本属性，在网页上用标签和字符串标记和描述如下：

”红棕马.jpg” ALT=”¤红棕马¤”>

由于机器不懂得这些标签，不懂得如何区分对象，也不懂得如何解析对象的属性，因为对象的属性没有与机器懂的编码相关联。

以下通过对象或对象属性与超编码的关联，使得机器具有了区分对象和解析对象的能力。具体方法和装置如下：

一种二进制比特序列数字数据的处理方法，其特征在于：二进制比特字节序列为超编码序列；其特征还在于：至少包含以下步骤之一：

建立对象或对象属性与超编码的关联步骤；

建立对象与超编码相关联；一个对象与一个超编码相关联；

建立对象属性与超编码或部分超编码相关联，生成对象和属性与超编码的关联关系；

解析对象或对象属性包含以下步骤：

通过扫描字节序列的超比特，区分超编码，区分对象；

根据对象属性与超编码或部分超编码的关联关系，解析对象的属性。

上面的“其特征还在于至少包含以下步骤之一：”，不是：“其特征还在于包含以下步骤：”

；因为，保护范围会缩小。

上述方法以装置方式描述如下。

一种二进制比特序列数字数据的处理装置,其特征在于：该装置含有超编码序列；其特征还在于：至少包含以下装置之一：

建立对象或对象属性关联装置，该装置用于将对象或对象属性与超编码相关联；该装置包含以下装置：

建立对象与超编码相关联装置；一个对象与一个超编码相关联；

建立对象属性与超编码或部分超编码相关联装置，该装置含有对象属性与超编码的关联关系；

解析对象属性装置，该装置包含：

通过区分超编码区分对象的装置；该装置通过扫描字节序列的超比特，区分超编码，区分对象；

解析对象属性装置：根据对象属性与超编码或部分超编码的关联关系，解析对象的属性。

上面的“其特征还在于该装置至少包含以下装置之一：”，不是：“其特征还在于包含以下装置：”；因为，保护范围会缩小。

这里的“关联”有多种方式，例如：

第一，将对象或对象属性存储或嵌入到超编码；例如词对象中汉字的显示属性和语音属性；超编码或部分超编码直接指向对象或对象属性；这是一种直接关联方式；

第二，超编码或部分超编码存储的是指针，指向对象或对象属性的关联关系，由关联关系，机器能解析对象属性；这是间接关联关系。

这里的部分超编码是指：超编码中的1个或多个比特，一个或多个字节。

这里对象属性包含：

机器能懂得属性，机器能翻译给人的语义：如汉字的字形和语音；

机器能懂的属性，但无需翻译给人的语义。

实验实例：机器智能互联网实验网页实例

对象或对象属性的关联步骤

对象或对象属性与超编码或部分超编码相关联步骤的实例；

图像对象具有三个属性，将图像用1个3字节超编码“F1 A2 7C”相关联，第1字节，存储对象种类属性，这里的“F1”存储的是图像对象。这个超编码关联图像的显示属性。超编码的 2、3字节，关联图像的超链接为：”红棕马.jpg”。

图像、音频和视频对象与超编码的关联关系，如图3所示；图像、音频和视频对象，用3个字节的超编码关联或存储。超编码关联对象的显示属性，显示属性是为了让人懂的属性。例如：类似五线谱的符号∮表示音频；如：∮致爱丽丝∮；类似放映机的符号♂表示视频；如：♂猫和老鼠10♂；符号¤表示图像，如：¤红棕马¤。注意：这些符号，仅用来帮助人区分不同对象。

字节超编码分为两部份，第1字节用来关联对象的种类属性，例如：F1、F2、F3分别关联图像、音频和视频对象；它具有区分128种对象的能力。第2、3字节用来关联超链接属性。

机器解析对象或对象属性的步骤

根据对象或对象属性与超编码或部分超编码的的关联关系，机器区分对象和解析对象属性的步骤如下。

仍以图像为例，图3中，3字节超编码为，F1 A2 7C

机器根据图3的关联关系，根据该超编码关联的显示属性：¤红棕马¤；机器将该超编码在网页上显示为：¤红棕马¤；

该超编码的第1字节为F1，机器懂得该超编码对象的种类属性为图像对象；

该超编码的第2、3字节，关联的是对象的超链接属性，机器从服务器调取文件，显示该图像。

一个机器智能互联网实验网页

对象创建时，机器将作者的意图与超编码相关联

各种对象均通过一个输入法接口输入或编辑，将作者分词和语音意图与超编码相关联, 将图像、音频和视频等对象以及对象的属性与超编码相关联。

部分图像、音频和视频对象的超编码如图4(a)的第一行所示；超编码的关联关系如图3所示。

关联关系的建立有多种方式：

如，静态方式，由创建人事先建立。

又如：动态建立：，在创建过程中，自动建立。

网页输入或编辑完毕，生成超编码文件，一个超编码序列，如图4（a）所示。

在图4(a)的超编码中，偶数字节，如2字节为1字词，4字节为2字词，6字节为3字词，以此类推；其中的汉字编码与GB2312兼容（也可与日、韩、Unicode等各种语言字符兼容）。1字节超编码是ASCHII码字符，超编码与ASCHII码相同。图4(a)的超编码中,含有1、2、3、4、6字节不同长度的编码，机器具有区分不同长度超编码的能力；不同对象的编码相互兼容，互不冲突。机器还具有区分不同种类对象及对象属性的能力。5、7、9字节等长度的超编码可用于其他对象，例如:IP地址。

机器根据标记比特扫描规则，扫描图4网页(a) 超编码序列的标记比特, 区分超编码，解析超编码所关联的显示属性，显示网页。

机器将超编码序列对象的显示属性显示出来，看上去是一个字符串，实际是一个对象串，如图4（b）所示。

当用户访问网页时，将网页超编码文件下载到客户端。机器根据标记比特扫描规则，扫描超编码文件，00行：0-2为1个3字节的超编码；查询关联关系表（图3），查得该超编码关联的显示属性为：∮致爱丽丝∮；机器将此显示在客户端；同理，00行：3-5为1个3字节的超编码，查得该超编码关联的显示属性为：♂黑虎1♂；00行：6-8为1个3字节的超编码，查得该超编码关联的显示属性为：♂猫和老鼠10♂；00行：9-b 为1个3字节的超编码，查得该超编码关联的显示属性为：¤红棕马¤；00行：e-f为1个4字节的超编码，这是1个中文2字词，根据汉字编码，将字形显示为“乒乓”，00行显示完毕；其余省略。整个文件扫描完毕，机器智能将文件在客户端显示出来，如图4(b)所示。

当用户获取网页的对象时，机器根据标记比特扫描规则，扫描图4网页(a) 超编码序列的标记比特,识别和解析超编码，根据所关联的属性，解析网页；根据不同对象，以不同的方式“播放”。

实验实例中，如果用户选择“播放”网页所有的对象，机器扫描过程与上面类似，简述如下：

机器根据标记比特扫描规则，扫描该文件，00行：0-2为1个3字节的超编码，根据关联关系表，查得该超编码的种类字节为：F2，为音频对象；超编码的第2、3字节关联超链接为：“致爱丽丝.mp3”；机器从服务器调取该音频文件，用音频播放器播放该文件； 00行：3-5为1个3字节的超编码，查得该超编码的种类字节为：F3，为视频对象；超编码的第2、3字节关联超链接为：“黑虎1.mp4”；机器从服务器调取文件，用视频播放器播放该文件； 00行：6-8为1个3字节的超编码，为视频对象，机器从服务器调取文件，用视频播放器播放该文件；00行：9-b 为1个3字节的超编码，为图像对象，机器从服务器调取文件，显示该图像；00行：e-f为1个4字节的超编码，这是1个中文2字词，根据组成超编码的汉字编码与汉字语音的关联关系，机器解析其语音，播放语音；以此类推。

（三）如何让机器具有区分算法或程序的对象、解析算法或程序的对象和运行算法或程序的智能

现有的算法或程序都是用字符描述的，机器不懂得如何区分其中的对象，不懂得如何解析对象的语义，也不懂得如何执行；因此必须经过人工智能帮助机器翻译，这里的翻译称作编译或解释。

以下是机器智能如何能具有区分算法或程序的对象、解析算法或程序的对象和运行算法或程序的智能。

一种二进制比特序列数字数据的处理方法，其特征在于：比特字节序列为超编码序列，其特征还在于：至少包含以下步骤之一：

建立算法或程序的对象或对象属性与超编码的关联步骤；

建立对象与超编码相关联步骤；一个对象与一个超编码相关联；

解析算法或程序的对象或对象属性包含以下步骤：

通过扫描字节序列的超比特，区分超编码，区分对象；

根据对象属性与超编码的关联关系，解析对象或对象属性步骤。

机器边解析边运行步骤;该步骤包含以下步骤；

通过扫描字节序列的超比特，区分超编码，区分对象；

根据对象属性与超编码的关联关系，解析对象或对象属性,并运行算法或程序；

生成可执行文件步骤；包括：

通过扫描字节序列的超比特，区分超编码，区分对象；

根据对象属性与超编码的关联关系，解析对象或对象属性,并生成可执行文件。

上面的“其特征还在于至少包含以下步骤之一：”，不是：“其特征还在于包含以下步骤：”；因为，保护范围会缩小。

以下是上述方法描述为装置方式。

一种二进制比特序列数字数据的处理装置，其特征在于：比特字节序列为超编码序列；其特征还在于：至少包含以下装置之一：

算法或程序的对象或对象属性与超编码的关联装置；包括：

建立对象属性与超编码或超编码的部分相关联装置；

机器运行装置；该装置包含以下装置之一；

边解析边运行装置；该装置包括：

通过区分超编码区分对象装置；

根据对象属性与超编码的关联关系，解析对象或对象属性,并运行的装置；

生成可执行文件装置；该装置包括以下装置：

通过区分超编码区分对象装置；

可执行文件装置：根据对象属性与超编码的关联关系，解析对象属性,并生成可执行文件。

一个机器智能算法或程序示例：程序的创建和运行

机器智能程序的创建

假定作者输入以下程序： y = a+ b * c

在创建过程，机器提示输入变量名称（即显示属性），选择变量的类型；在算法或程序的创建过程中，机器将对象或对象属性与超编码相关联。关联步骤如下：

程序含4个变量，设置一临时变量： buffer。

每一个变量用1个超编码存储，创建过程根据人机交互，生成一个变量与变量属性与超编码的关联关系，如图5所示。这里12表示变量类型为长整型（4字节）

程序含3个运算符，一个运算符对应1个超编码，运算符与运算符属性与超编码的关联关系由系统定义，如图6所示。

对象或对象属性与超编码相关联关系，如图5-6所示。

程序创建完毕，生成一个机器懂得如何运行的程序，一个超编码序列，如下：

机器智能程序的运行

机器运行方式有两种：

第一，边解析边运行的方式；这类似现有的解释运行

第二，解析超编码序列所有的对象或对象属性，生成执行文件运行；这类似现有的编译运行。

机器运行程序，即运行一个Ucode序列。以下是边解析边运行的方式的说明。

机器区分Ucode，并根据对象或对象属性与Ucode的关联关系，解析对象或对象属性，运行程序。

程序创建完毕，机器解析对象的显示属性，程序显示如下：

下面说明程序的执行过程。

对于变量对象，根据其种类配置存储空间，如图5所示。

图5的存储地址，也可在运行时，根据变量的类型，动态配置。

根据对象的种类，机器区分出运算符对象，并比较运算符的优先级；

，Ucode22 ，Ucode23 分别对应运算符 = ，+ ，* ；Ucode23 ( * ) 优先级为3，最高; 其前后变量分别为Ucode13 ，Ucode14 ；机器分别从地址：0x0008，0x000C 取出4个字节，根据对应的机器指令，做乘法运算，将结果存入临时变量buffer，地址：0x000F；然后，比较剩下的运算符Ucode21 ， Ucode22 （ = ，+）的优先级；Ucode22 （ +）的优先级高，因此，机器将buffer的运算结果与Ucode12（地址：0x0004）的数值做加法运算。剩下的运算符Ucode21 （ = ）；机器将前面的运算结果存储到变量Ucode11 的地址：0x0000。然后，机器根据变量Ucode11和运算符 Ucode21的显示属性，将计算结果显示出来。

假定各个变量的初始值如图7所示，则机器的显示结果为：

（四）如何实现让机器具有处理中文语音的智能

这里，汉字属性主要指：字形和语音。

汉字语音的表达方法分为三种：

• 语音编码

汉字语音编码为2字节，11比特为拼音编码，3比特为音调编码。见图8。

• 拼音

拼音可有以下显示方式：只显示拼音字母，拼音字母中含带声调的字符，拼音字母中含表示声调的数字等

• 发音

发音指用音频表示的语音。

现有中文数据的处理过程中，只将编码与字形相关联，机器根据汉字编码的值，能够将字形显示出来；但是，机器不懂得汉字的语音。

以下机器在处理中文过程中，不仅将汉字编码与其字形相关联，而且，还要与语音相关联；因此，机器不仅懂得汉字对象的字形，还懂得汉字对象的语音。

一种二进制比特序列数字数据的处理方法，设一个汉字多音字含n+1个语音，n为正整数，将多音字的编码增加n个，其特征在于：该处理方法中含有汉字语音编码库、语音编码拼音库和语音编码发音库；或含有汉字拼音库和汉字发音库；其特征还在于：至少包含以下步骤之一：

建立汉字编码与字形属性和语音属性相关联步骤；

通过选择正确语音所对应的汉字，使汉字编码的值与汉字的字形和汉字的语音相关联；

解析汉字属性步骤，该步骤包含以下步骤：

根据汉字编码的值与字形属性的关联关系，解析汉字编码字形属性的步骤；

根据汉字编码的值与语音属性的关联关系，解析汉字编码语音属性的步骤。

汉字语音编码库、语音编码拼音库和语音编码发音库；或汉字拼音库和汉字发音库；见：图8汉字语音编码示意图；图9汉字编码与字形关系示意图；图10汉字编码与语音编码关系示意图：图11汉字语音编码与拼音关系示意图；图12 汉字语音编码与音频关系示意图；图13汉字编码与拼音关系示意图；图14汉字编码与音频关系示意图。

具体解析步骤如下：

解析汉字字形步骤；

机器根据汉字编码的值，从汉字字形库中提取汉字的字形；

解析汉字拼音步骤1；

机器根据汉字编码的值，从语音编码库中提取语音编码；根据语音编码的拼音编码部分，从语音编码拼音库中提取汉字的拼音；根据语音编码的声调编码部分，解析汉字拼音的声调；

解析汉字发音步骤1；

机器根据汉字编码的值，从汉字语音编码库中提取汉字语音编码；根据语音编码的值，从语音编码发音库中提取汉字的发音；

解析汉字拼音步骤2；

机器根据汉字编码的值，从汉字拼音库中提取汉字的拼音；

解析汉字发音步骤2；

机器根据汉字编码的值，从汉字发音库中提取汉字的发音。

以下是装置描述方式

一种二进制比特序列数字数据的处理装置，其特征在于：设一个汉字多音字含n+1个语音，n为正整数，将多音字的编码增加n个，其特征在于：该处理装置含有汉字语音编码库、语音编码拼音库和语音编码发音库；或含有汉字拼音库和汉字发音库；其特征还在于：至少包含以下装置之一：

建立汉字编码与字形属性和语音属性相关联的装置；

该装置通过选择正确语音所对应的汉字，使汉字编码的值与汉字的字形和汉字的语音相关联；

根据汉字编码与汉字属性的关联关系，解析汉字属性的装置；该装置包括：

根据汉字编码与汉字属性的关联关系，解析汉字编码字形属性的装置；

根据汉字编码与汉字属性的关联关系，解析汉字编码语音属性的装置。

具体解析装置如下：

解析汉字字形装置；

机器根据汉字编码的值，从汉字字形库中提取汉字的字形；

解析汉字拼音装置1；

解析汉字发音装置1；

解析汉字拼音装置2；

机器根据汉字编码的值，从汉字拼音库中提取汉字的拼音；

解析汉字发音装置2；

机器根据汉字编码的值，从汉字发音库中提取汉字的发音。

实验实例：

图15为“好事又读好事”，汉字编码与语音属性和字形属性相关联实验实例。

输入第一个“好”，是4声，选择“3”的“好事” (a,b,c,d,e分别对应于1，2，3，4声和轻声)。输入第2个“好事”，“好”是3声，选择“2”的“好事”。

图16 是图15实验实例的解析结果。

当用户获取数据时，机器根据汉字编码关联的语音属性和字形属性，解析字形和语音，解析的结果与作者的意图一致。

机器靠自身智能自动标注汉字的拼音，自动朗读，解析结果与作者的意图完全相同。

图17 实验实例：让机器具有区分中文词和解析汉字语音属性的能力

“会计师骑自行车去银行开会”

作者按词输入（或编辑），机器将作者分词和语音意图，与超编码相关联，让机器记住作者的意图

作者用拼音输入：“kuaijishi qi zixingche qu yinhang kaihui”

这里，即输入了分词信息，又输入了语音信息。

输入完毕，虽然显示的是：“会计师骑自行车去银行开会”；仍然是12个汉字（24个字节），却存储了作者正确的分词信息和语音信息。

这句话存储为6个超编码，每个超编码由组成词的汉字编码组成。

本实例中，每一个汉字的语音与相应的编码相关联，本例多音字“会，行，行，会”的正确语音与相应的编码相关联：“kuai, xing, hang, hui”（实际上，包含正确的音调）

例如：图17中，第一个“会”和最后一个“会”，对应的编码不同;关联的字形属性相同，但关联的语音属性不同。第一个编码“AD F0”关联的语音为“kuai”，而最后一个编码“BB61”关联的语音为“hui”。同理，图中第一个“行”和最后一个“行”的编码不同，关联的字形属性相同，但关联的语音属性不同。

图17中：“会计师骑自行车去银行开会”，超比特标注后存储的字节串，仍然是24个字节。

机器根据超编码，解析的分词为：“会计师骑自行车去银行开会”，与作者的意图一致。

机器根据超编码的汉字编码与语音的关联关系，解析的语音与作者的意图也一致。

如果，用户输入“hui”查询,查到的是“开会”；但是，查不到“会计师”，因为“会计师”中没有“hui”的语音。

附图说明

图1. 标注字节组和区分字节组示意图

根据作者的意图将字节序列标注为字节组序列示意图

通过标注，建立标记比特与字节组相关联。

通过扫描标记比特区分字节组，区分中文词对象示意图

图2 通过超编码与词对象及属性相关联实例

这里的词对象为：“乒乓球，拍卖，完，了”，每个词对象与一个超编码相关联，超编码中两个字节为一个汉字编码，关联了汉字的字形属性和语音属性。

根据超编码和词对象的关联关系，机器能区分词对象，能解析词对象的显示属性和语音属性。

机器具有区分超编码的能力，因此，具有了区分词的能力，其分词结果用不同颜色标注出来，

机器的区分和解析，与作者的意图一致。

图3 图像、音频和视频对象与超编码的关联关系示意图

网页的图像、音频和视频对象，用3个字节的超编码关联。超编码关联对象显示属性，例如：类似五线谱的符号∮表示音频；如：∮致爱丽丝∮；类似放映机的符号♂表示视频；如：♂猫和老鼠10♂；符号¤表示图像，如：¤红棕马¤。注意：这些符号，仅用来帮助人区分不同对象的。

字节超编码分为两部份，第1字节和第2、3字节，用来关联对象的种类属性，例如：F1、F2、F3分别关联图像、音频和视频对象。它具有区分128种对象的能力。第2、3字节，用来关联超链接属性。

图4 一个机器智能互联网实验网页

网页对应的超编码序列: 含有1、2、3、4、6字节不同长度的编码

网页的显示：对象的显示属性表示的对象串:包括音频、视频、图像，中文词对象、英文字符对象。

图5 变量与变量属性与超编码的关联关系示意图

图6 系统定义的运算符与运算符属性与超编码的关联关系示意图

程序含3个运算符，一个运算符对应1个超编码，运算符属性与超编码的关联关系由系统定义。

图7 变量的超编码，地址、初始值和最终值示意图

图 8. 汉字语音编码示意图

汉字语音编码为2字节，11比特为拼音编码，3比特为音调编码。要使语音编码与现有汉字编码能兼容，则每个字节的0比特可为1；要使语音编码与超编码能兼容，则第一个字节的0比特为1；第二个字节的0比特为0。要使语音编码与现有控制字符不冲突，则每个字节的1比特可置为1。

图9 汉字编码与字形关系示意图

每个汉字编码对应字形库的一个字形，通过汉字编码的值，机器能提取汉字的字形。其中扩展汉字编码为新增汉字编码。

图10 汉字编码与语音编码关系示意图

每个汉字编码对应语音编码库的一个2字节的语音编码；通过汉字编码的值，机器能提取汉字的语音编码，通过语音编码的值，借助于汉字语音编码与拼音关系；汉字语音编码与音频关系；机器能解析汉字的语音：生成拼音加声调，或者生成发音。其中扩展汉字编码为新增汉字编码。

图11 汉字语音编码与拼音关系示意图

每个语音编码对应相应拼音库中相应的拼音字母，通过汉字语音编码的值，机器能提取汉字的拼音；根据语音编码关联的3比特声调值，生成声调。

图12 汉字语音编码与音频关系示意图

每个汉字语音编码对应发音库的一个音频，通过汉字语音编码的值，机器能提取汉字的发音。

图13 汉字编码与拼音关系示意图

每个汉字编码对应拼音库的相应汉字的拼音字母和声调；通过汉字编码的值，机器能提取汉字的拼音字母和声调。其中扩展汉字编码为新增汉字编码。

图14 汉字编码与发音音频关系示意图

每个汉字编码对应发音库的一个音频；通过汉字编码的值，机器能提取汉字的音频。其中扩展汉字编码为新增汉字编码。

图15实验实例：汉字的语音和字形与汉字编码相关联

图16图15实验实例中：机器解析汉字编码的语音属性，自动标注拼音

图17实验实例：让机器具有区分中文词和汉字语音属性的超编码

超编码与词对象及属性相关联；超编码中的汉字编码与汉字的语音和字形属性相关联

这里的词对象为：“会计师骑自行车去银行开会”，每个词对象与一个超编码相关联，其中两个字节为一个汉字编码，关联了汉字的字形属性和语音属性。

根据超编码和词对象的关联关系，机器能区分词对象，能解析词对象的显示属性（字形属性）和语音属性。

机器的区分和解析，与作者的意图一致。

Claims

1.一种二进制比特序列数字数据的处理方法，在一个二进制比特字节序列中，一个或多个字节对应一个对象；与对象相对应的字节称为字节组；由于字节序列中不含区分字节组的信息，对象难以区分；其特征在于：每个字节的最左比特，用作标记比特，标记比特的0或1用作标记；其特征还在于至少包含以下步骤之一：

1)建立标记比特与字节组相关联的步骤：

如果n=0；则将这个字节的标记比特置为0；

2)区分字节组步骤；通过扫描字节序列的标记比特区分字节组，根据三种不同情况，选择以下扫描区分字节组步骤：

[1]从左向右扫描字节序列的标记比特区分字节组步骤；

[2]从右向左扫描字节序列的标记比特区分字节组步骤；

如果第1个标记比特为1，继续扫描，直到为0的标记比特；

[3]从字节序列某一个中间比特标记区分字节组的步骤：

A.区分第1个字节组的步骤如下：

如果这个中间标记比特为1，则从这个标记比特向左扫描：

然后，改为向右扫描，直到为0的标记比特；

如果这个中间标记比特为0，则从这个标记比特向左扫描：

B.区分第1个字节组右边的字节组，按从左向右扫描区分字节组步骤区分；

C.区分第1个字节组左边的字节组，按从右向左扫描区分字节组步骤区分。

2.一种二进制比特序列数字数据的处理的装置, 该装置的二进制比特字节序列中，一个或多个字节对应一个对象；与对象相对应的字节称为字节组；由于字节序列中不含区分字节组的信息，对象难以区分；其特征在于：每个字节的最左比特，用作标记比特，标记比特的0或1用作标记；其特征还在于：该装置包含以下装置之一：

1) 建立标记比特与字节组相关联装置；

如果n=0；则将这个字节的标记比特置为0；

2) 区分字节组装置；该装置通过扫描字节序列的标记比特区分字节组；根据三种不同情况，该装置至少含有以下三种装置之一：

[1]从左向右区分字节组装置；

[2]从右向左区分字节组装置；

如果第1个标记比特为1，继续扫描，直到为0的标记比特；

[3]从字节序列中间的某个比特标记区分字节组装置;

该装置含有以下操作步骤：

A.区分第1个字节组的步骤如下：

如果这个中间标记比特为1，则从这个标记比特向左扫描：

然后，改为向右扫描，直到为0的标记比特；

如果这个中间标记比特为0，则从这个标记比特向左扫描：

B.区分第1个字节组右边的字节组，用从左向右扫描区分字节组装置区分；

C.区分第1个字节组左边的字节组，用从右向左扫描区分字节组装置区分。

3.一种二进制比特序列数字数据的处理方法，其特征在于：二进制比特字节序列为超编码序列；其特征还在于：至少包含以下步骤之一：

1)建立对象或对象属性与超编码的关联步骤；

A.建立对象与超编码相关联；一个对象与一个超编码相关联；

B.建立对象属性与超编码或部分超编码相关联，生成对象和属性与超编码的关联关系；

2)解析对象或对象属性包含以下步骤：

A.通过扫描字节序列的超比特，区分超编码，区分对象；

B.根据对象属性与超编码或部分超编码的关联关系，解析对象的属性。

4.一种二进制比特序列数字数据的处理装置,其特征在于：该装置含有超编码序列；其特征还在于：至少包含以下装置之一：

1)建立对象或对象属性关联装置，该装置用于将对象或对象属性与超编码相关联；该装置包含以下装置：

A.建立对象与超编码相关联装置；一个对象与一个超编码相关联；

B.建立对象属性与超编码或部分超编码相关联装置，该装置含有对象属性与超编码的关联关系；

2)解析对象属性装置，该装置包含：

A.通过区分超编码区分对象的装置；该装置通过扫描字节序列的超比特，区分超编码，区分对象；

B.解析对象属性装置：根据对象属性与超编码或部分超编码的关联关系，解析对象的属性。

5.一种二进制比特序列数字数据的处理方法，其特征在于：比特字节序列为超编码序列，其特征还在于：至少包含以下步骤之一：

1)建立算法或程序的对象或对象属性与超编码的关联步骤；

A.建立对象与超编码相关联步骤；一个对象与一个超编码相关联；

2)解析算法或程序的对象或对象属性包含以下步骤：

A.通过扫描字节序列的超比特，区分超编码，区分对象；

B.根据对象属性与超编码的关联关系，解析对象或对象属性步骤；

3)机器边解析边运行步骤;该步骤包含以下步骤；

A.通过扫描字节序列的超比特，区分超编码，区分对象；

B.根据对象属性与超编码的关联关系，解析对象或对象属性,并运行算法或程序；

4)生成可执行文件步骤；包括：

A.通过扫描字节序列的超比特，区分超编码，区分对象；

B.根据对象属性与超编码的关联关系，解析对象或对象属性,并生成可执行文件。

6.一种二进制比特序列数字数据的处理装置，其特征在于：比特字节序列为超编码序列；其特征还在于：至少包含以下装置之一：

1)算法或程序的对象或对象属性与超编码的关联装置；包括：

B.建立对象属性与超编码或超编码的部分相关联装置；

2)机器运行装置；该装置包含以下装置之一；

1)边解析边运行装置；该装置包括：

A.通过区分超编码区分对象装置；

B.根据对象属性与超编码的关联关系，解析对象或对象属性,并运行的装置；

2)生成可执行文件装置；该装置包括以下装置：

A.通过区分超编码区分对象装置；

B.可执行文件装置：根据对象属性与超编码的关联关系，解析对象属性,并生成可执行文件。

7.一种二进制比特序列数字数据的处理方法，设一个汉字多音字含n+1个语音，n为正整数，将多音字的编码增加n个，其特征在于：该处理方法中含有汉字语音编码库、语音编码拼音库和语音编码发音库；或含有汉字拼音库和汉字发音库；其特征还在于：至少包含以下步骤之一：

1)建立汉字编码与字形属性和语音属性相关联步骤；

2)解析汉字属性步骤，该步骤包含以下步骤：

[1]根据汉字编码的值与字形属性的关联关系，解析汉字编码字形属性的步骤；

[2]根据汉字编码的值与语音属性的关联关系，解析汉字编码语音属性的步骤。

8.一种二进制比特序列数字数据的处理装置，其特征在于：设一个汉字多音字含n+1个语音，n为正整数，将多音字的编码增加n个，其特征在于：该处理装置含有汉字语音编码库、语音编码拼音库和语音编码发音库；或含有汉字拼音库和汉字发音库；其特征还在于：至少包含以下装置之一：

1)建立汉字编码与字形属性和语音属性相关联的装置；

2)根据汉字编码与汉字属性的关联关系，解析汉字属性的装置；该装置包括：

A.根据汉字编码与汉字属性的关联关系，解析汉字编码字形属性的装置；

B.根据汉字编码与汉字属性的关联关系，解析汉字编码语音属性的装置。