CN107483969A - 一种基于pca的数据传输方法及系统 - Google Patents

一种基于pca的数据传输方法及系统 Download PDF

Info

Publication number
CN107483969A
CN107483969A CN201710845000.5A CN201710845000A CN107483969A CN 107483969 A CN107483969 A CN 107483969A CN 201710845000 A CN201710845000 A CN 201710845000A CN 107483969 A CN107483969 A CN 107483969A
Authority
CN
China
Prior art keywords
data
characteristic
flow
code length
data flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710845000.5A
Other languages
English (en)
Inventor
刘小东
邓见章
蒋杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Aiyouwei Software Development Co Ltd
Original Assignee
Shanghai Aiyouwei Software Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Aiyouwei Software Development Co Ltd filed Critical Shanghai Aiyouwei Software Development Co Ltd
Priority to CN201710845000.5A priority Critical patent/CN107483969A/zh
Publication of CN107483969A publication Critical patent/CN107483969A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例公开了一种数据传输方法及系统,涉及智能终端技术领域。所述方法包括:获取高维度原始数据;利用PCA技术处理所述原始数据,得到特征数据;编码所述特征数据,得到数据流;传输所述数据流;解码所述数据流,得到所述特征数据;重构所述原始数据。本申请的数据传输方法及系统,利用PCA技术提取原始数据的特征数据,传输特征数据编码,再经解码重构原始数据,提高了传输效率,实现高效准确地传输数据。

Description

一种基于PCA的数据传输方法及系统
技术领域
本申请涉及智能终端技术领域,尤其涉及数据传输方法及系统。
背景技术
随着移动通信技术的飞速发展,人们的工作、生活与智能终端(例如,电子设备等)息息相关。用户利用终端传输数据,实现信息交互。目前,针对不失真地还原传输的数据,通常利用香农采样定理,要求采样频率应该不小于模拟信号频谱中最高频率的两倍;从而导致样本数量增多,传输效率低。此外,当原始数据量较大,则需要采集更多样本,进一步造成硬件存储资源的浪费。
主成分分析法(Principal ComponentsAnalysis,PCA)作为主要的降维方法之一,广泛应用于图像压缩、数据压缩、模式识别、消除冗余和消除数据噪音等领域。PCA技术主要在于分析原始数据的主要特征,将主要特征用于代替原始数据。
因此,期望提供一种数据传输方法及系统,利用PCA技术提取原始数据的特征数据,传输特征数据编码,再经解码重构原始数据,提高了传输效率,实现高效准确地传输数据。
发明内容
根据本申请的一些实施例的第一方面,提供了一种数据传输方法,应用于终端(例如,电子设备等)中,所述方法可以包括:获取高维度原始数据;利用PCA技术处理所述原始数据,得到特征数据;编码所述特征数据,得到数据流;传输所述数据流;解码所述数据流,得到所述特征数据;重构所述原始数据。
在一些实施例中,所述利用PCA技术处理所述原始数据进一步包括:中心化处理所述原始数据,计算所述原始数据中心化处理后的协方差矩阵;计算所述协方差矩阵的特征值;计算所述协方差矩阵的特征向量;提取所述原始数据中心化处理后的特征数据。
在一些实施例中,所述编码所述特征数据进一步包括:量化处理所述特征数据,得到数据流;对所述数据流进行熵编码,得到数据流编码;分组所述数据流编码。
在一些实施例中,所述分组所述数据流编码进一步包括:获取所述数据流编码的码长;确定所述数据流编码的最大码长;根据所述最大码长,分组所述数据流编码,得到码流;其中,不足最大码长的数据流编码末尾增补零码,以满足最大码长。
在一些实施例中,所述传输所述数据流进一步包括:传输所述数据流编码的码流,以及码长;控制传输所述码流和码长的缓冲过程。
在一些实施例中,所述解码所述数据流进一步包括:分解所述数据流;对所述数据流进行熵解码;反量化处理所述数据流,得到所述特征数据。
在一些实施例中,所述解码所述数据流进一步包括:根据所述最大码长解码所述数据流;其中,码长不足最大码长的数据流编码末尾删除零码。
在一些实施例中,所述重构所述原始数据进一步包括:获取所述特征数据;计算所述特征数据的特征向量;中心化逆变换所述特征数据,以及所述特征向量;重构所述原始数据。
在一些实施例中,所述特征数据为所述高维度原始数据的降维数据。
根据本申请的一些实施例的第二方面,提供了一个系统,包括:一个存储器,被配置为存储数据及指令;一个与存储器建立通信的处理器,其中,当执行存储器中的指令时,所述处理器被配置为:获取高维度原始数据;利用PCA技术处理所述原始数据,得到特征数据;编码所述特征数据,得到数据流;传输所述数据流;解码所述数据流,得到所述特征数据;重构所述原始数据。
因此,根据本申请的一些实施例的数据传输方法及系统,利用PCA技术提取原始数据的特征数据,传输特征数据编码,再经解码重构原始数据,提高了传输效率,实现高效准确地传输数据。
附图说明
为更好地理解并阐述本申请的一些实施例,以下将结合附图参考实施例的描述,在这些附图中,同样的数字编号在附图中指示相应的部分。
图1是根据本申请的一些实施例提供的网络环境系统的示例性示意图。
图2是根据本申请的一些实施例提供的电子设备功能配置的示例性单元示意图。
图3是根据本申请的一些实施例提供的数据传输方法的示例性流程图。
图4是根据本申请的一些实施例提供的PCA技术处理方法的示例性流程图。
图5是根据本申请的一些实施例提供的编码方法的示例性流程图。
图6是根据本申请的一些实施例提供的解码方法的示例性流程图。
图7是根据本申请的一些实施例提供的重构原始数据的示例性流程图。
具体实施方式
以下参考附图的描述为便于综合理解由权利要求及其等效内容所定义的本申请的各种实施例。这些实施例包括各种特定细节以便于理解,但这些仅被视为示例性的。因此,本领域技术人员可以理解对在此描述的各种实施例进行各种变化和修改而不会脱离本申请的范围和精神。另外,为简要并清楚地描述本申请,本申请将省略对公知功能和结构的描述。
在以下说明书和权利要求书中使用的术语和短语不限于字面含义,而是仅为能够清楚和一致地理解本申请。因此,对于本领域技术人员,可以理解,提供对本申请各种实施例的描述仅仅是为说明的目的,而不是限制所附权利要求及其等效定义的本申请。
下面将结合本申请一些实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一”、“一个”、“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请中使用的术语“和/或”是指并包含一个或多个相绑定的列出项目的任何或所有可能组合。表达“第一”、“第二”、“所述第一”和“所述第二”是用于修饰相应元件而不考虑顺序或者重要性,仅仅被用于区分一种元件与另一元件,而不限制相应元件。
根据本申请一些实施例的终端可以是电子设备,该电子设备可以包括智能手机、个人电脑(PC,例如平板电脑、台式电脑、笔记本、上网本、掌上电脑PDA)、移动电话、电子书阅读器、便携式多媒体播放器(PMP)、音频/视频播放器(MP3/MP4)、摄像机、虚拟现实设备(VR)和可穿戴设备等中的一种或几种的组合。根据本申请的一些实施例,所述可穿戴设备可以包括附件类型(例如手表、戒指、手环、眼镜、或头戴式装置(HMD))、集成类型(例如电子服装)、装饰类型(例如皮肤垫、纹身或内置电子装置)等,或几种的组合。在本申请的一些实施例中,所述电子设备可以是灵活的,不限于上述设备,或者可以是上述各种设备中的一种或几种的组合。在本申请中,术语“用户”可以指示使用电子设备的人或使用电子设备的设备(例如人工智能电子设备)。
本申请实施例提供了一种数据传输方法。为了便于理解本申请实施例,以下将参考附图对本申请实施例进行详细描述。
图1是根据本申请的一些实施例提供的网络环境系统100的示例性示意图。如图1所示,网络环境系统100可以包括电子设备110、网络120和服务器130等。电子设备110可以包括总线111、处理器112、存储器113、输入/输出模块114、显示器115、通信模块116和物理键117等。在本申请的一些实施例中,电子设备110可以省略一个或多个元件,或者可以进一步包括一个或多个其它元件。
总线111可以包括电路。所述电路可以互连电子设备110内的一个或多个元件(例如,总线111、处理器112、存储器113、输入/输出模块114、显示器115、通信模块116和物理键117)。所述电路也可以在电子设备110内的一个或多个元件之间实现通信(例如,获取和/或发送信息)。
处理器112可以包括一个或多个协处理器(Co-processor)、应用处理器(AP,Application Processor)和通信处理器(Communication Processor)。作为示例,处理器112可以执行与电子设备110的一个或多个元件的控制和/或数据处理(例如,启动数据传输等操作)。
存储器113可以存储数据。所述数据可以包括与电子设备110中的一个或多个其它元件相关的指令或数据。例如,所述数据可以包括处理器112处理前的原始数据,中间数据和/或处理后的数据。存储器113可以包括非永久记忆性存储器和/或永久记忆性存储器。作为示例,存储器113可以存储原始数据、特征数据、编码数据、解码数据等。
根据本申请的一些实施例,存储器113可以存储软件和/或程序。所述程序可以包括内核、中间件、应用编程接口(API,Application Programming Interface)和/或应用程序(或“应用”)。
所述内核、所述中间件或所述应用编程接口的至少一部分可以包括操作系统(OS,Operating System)。作为示例,所述内核可以控制或管理用于执行其他程序(例如,中间件、应用编程接口和应用程序)中实现的操作或功能的系统资源(例如,总线111、处理器112、存储器113等)。此外,所述内核可以提供接口。所述接口可以通过所述中间件、所述应用编程接口或所述应用程序访问电子设备110的一个或多个元件以控制或管理系统资源。
所述中间件可以作为数据传输的中间层。所述数据传输可以允许应用编程接口或应用程序与所述内核通信用以交换数据。作为示例,所述中间件可以处理从所述应用程序获取的一个或多个任务请求。例如,所述中间件可以向一个或多个应用程序分配电子设备110的系统资源(例如,总线111、处理器112、存储器113等)的优先级,以及处理所述一个或多个任务请求。所述应用编程接口可以是所述应用程序用于控制从所述内核或所述中间件提供功能的接口。所述应用编程接口也可以包括一个或多个接口或功能(例如,指令)。所述功能可以用于启动控制、数据通道控制、安全控制、通信控制、文件控制、窗口控制、文本控制、图像处理、信息处理等。
输入/输出模块114可以向电子设备110的其他元件发送从用户或外部设备输入的指令或数据。输入/输出模块114也可以将从电子设备110的其他元件获取的指令或数据输出给用户或外部设备。在一些实施例中,输入/输出模块114可以包括输入单元,用户可以通过所述输入单元输入信息或指令。
显示器115可以显示内容。所述内容可以向用户显示各种类型(例如,文本、图像、视频、图标和/或符号等,或几种的组合)。显示器115可以包括液晶显示器(LCD,LiquidCrystal Display)、发光二极管(LED,Light-Emitting Diode)显示器、有机发光二极管(OLED,Organic Light Emitting Diode)显示器、微型机电系统(MEMS,Micro ElectroMechanical Systems)显示器或电子纸显示器等,或几种的组合。显示器115可以包括显示屏、触摸屏等。所述显示屏可以显示原始数据,或重构的原始数据等。在一些实施例中,显示器115可以显示虚拟键。所述触摸屏可以获取所述虚拟键的输入。显示器115可以通过所述触摸屏获取输入。所述输入可以包括触摸输入、手势输入、动作输入、接近输入、电子笔或用户身体部分的输入(例如,悬停输入)。
通信模块116可以配置设备之间的通信。在一些实施例中,网络环境系统100可以进一步包括电子设备140。作为示例,所述设备之间的通信可以包括电子设备110和其他设备(例如,服务器130或电子设备140)之间的通信。例如,通信模块116可以通过无线通信或有线通信连接到网络120,与其他设备(例如,服务器130或电子设备140)实现通信。
所述无线通信可以包括微波通信和/或卫星通信等。所述无线通信可以包括蜂窝通信(例如,全球移动通信(GSM,Global System for Mobile Communications)、码分多址(CDMA,Code Division MultipleAccess)、第三代移动通信(3G,The 3rd GenerationTelecommunication)、第四代移动通信(4G)、第五代移动通信(5G)、长期演进技术(LTE,Long Term Evolution)、长期演进技术升级版(LTE-A,LTE-Advanced)、宽带码分多址(WCDMA,Wideband Code Division MultipleAccess)、通用移动通信系统(UMTS,UniversalMobile Telecommunications System)、无线宽带(WiBro,Wireless Broadband)等,或几种的组合。根据本申请的一些实施例,所述无线通信可以包括无线局域网(WiFi,WirelessFidelity)、蓝牙、低功耗蓝牙(BLE,Bluetooth Low Energy)、紫蜂协议(ZigBee)、近场通讯(NFC,Near Field Communication)、磁安全传输、射频和体域网(BAN,BodyAreaNetwork)等,或几种的组合。根据本申请的一些实施例,所述有线通信可以包括全球导航卫星系统(Glonass/GNSS,Global Navigation Satellite System)、全球定位系统(GPS,GlobalPosition System)、北斗导航卫星系统或伽利略(欧洲全球卫星导航系统)等。所述有线通信可以包括通用串行总线(USB,Universal Serial Bus)、高清多媒体接口(HDMI,High-Definition Multimedia Interface)、推荐标准232(RS-232,Recommend Standard 232)、和/或简易老式电话服务(POTS,Plain Old Telephone Service)等,或几种的组合。
物理键117可以用于用户交互。物理键117可以包括一个或多个实体键。在一些实施例中,用户可以自定义物理键117的功能。作为示例,物理键117可以发送指令。所述指令可以包括启动数据传输等。
在一些实施例中,电子设备110可以进一步包括传感器。所述传感器可以包括但不限于光敏传感器、声敏传感器、气敏传感器、化学传感器、压敏传感器、温敏传感器、流体传感器、生物传感器、激光传感器、霍尔传感器、智能传感器等,或几种的组合。
在一些实施例中,电子设备110可以进一步包括红外设备、图像采集设备等。作为示例,所述红外设备可以通过红外线投射方式,以及眨眼识别、注视识别等技术获取眼睛的信息。例如,所述红外设备通过采集用户的眨眼动作来认证用户信息。作为示例,所述图像采集设备可以包括摄像头、虹膜装置等。所述摄像头可以实现眼球追踪等功能。所述虹膜装置可以利用虹膜识别技术进行身份认证(例如,认证用户信息)。所述虹膜装置可以包括虹膜摄像头,所述虹膜摄像头可以获取虹膜信息,所述虹膜信息可以存储在存储器113中。
网络120可以包括通信网络。所述通信网络可以包括计算机网络(例如,局域网(LAN,Local Area Network)或广域网(WAN,WideArea Network))、互联网和/或电话网络等,或几种的组合。网络120可以向网络环境系统100中的其他设备(例如,电子设备110、服务器130、电子设备140等)发送信息。
服务器130可以通过网络120连接网络环境系统100中的其他设备(例如,电子设备110、电子设备140等)。在一些实施例中,服务器130可以通过网络120与电子设备110进行数据传输等。例如,服务器130可以通过网络120向电子设备110发送配置参数等数据,电子设备110可以通过网络120向服务器130发送信息等。
电子设备140可以与电子设备110相同或不同的类型。根据本申请的一些实施例,在电子设备110中执行的部分或全部操作可以在另一设备或多个设备(例如,电子设备140和/或服务器130)中执行。在一些实施例中,当电子设备110自动或响应于请求执行一种或多种功能和/或服务时,电子设备110可以请求其他设备(例如,电子设备140和/或服务器130)替代执行功能和/或服务。在一些实施例中,电子设备110除执行功能或服务外,进一步执行与其相关的一种或多种功能。在一些实施例中,其他设备(例如,电子设备140和/或服务器130)可以执行所请求的功能或其它相关的一种或多种功能,可以将执行结果发送给电子设备110。电子设备110可以重复执行结果或进一步处理执行结果,以提供所请求的功能或服务。作为示例,电子设备110可以使用云计算、分布式技术和/或客户端-服务端计算计算等,或几种的组合。在一些实施例中,根据云计算服务性质的不同,所述云计算可以包括公有云、私有云和混合云等。例如,电子设备110可以与电子设备140进行数据传输等。
需要说明的是,以上对于网络环境系统100的描述,仅为描述方便,并不能把本申请限制在所举实施例的范围之内。可以理解,对于本领域技术人员,基于本系统的原理,可能在不背离该原理的前提下,对各个元件进行任意组合,或者构成子系统与其他元件连接,对实施上述方法和系统的应用领域进行形式和细节上的各种修正和改变。例如,网络环境系统100可以进一步包括数据库等。又例如,电子设备110可以不包括物理键117等。诸如此类的变形,均在本申请的保护范围之内。
图2是根据本申请的一些实施例提供的电子设备功能配置的示例性单元框图。如图2所示,处理器112可以包括处理模块200,所述处理模块200可以包括获取单元210,处理单元220,控制单元230,计算单元240。
根据本申请的一些实施例,获取单元210可以获取数据。在一些实施例中,所述数据可以包括信息,所述信息可以包括但不限于文本、图像、音频、视频、动作、手势、声音、眼睛(例如,虹膜信息等)、气息、光等,或几种的组合。在一些实施例中,所述信息可以包括但不限于输入信息、系统信息和/或通信信息等。作为示例,获取单元210可以通过输入/输出模块114、显示器115的触摸屏、物理键117和/或传感器获取电子设备110的输入信息。所述输入信息可以包括其他设备(例如,电子设备140)和/或用户的输入,例如,按键输入、触控输入、手势输入、动作输入、远程输入、传输输入、眼睛输入、声音输入、气息输入、光输入等,或几种的组合。所述输入信息的获取部件可以包括但不限于红外设备、图像采集设备、传感器等,或几种的组合。作为示例,获取单元210可以通过传感器获取原始信息等。
在一些实施例中,获取单元210可以通过网络120获取通信信息。所述通信信息可以包括应用软件信息、通讯信号(例如,语音信号、视频信号等)、短消息等。在一些实施例中,获取单元210可以通过网络120、存储器113和/或传感器获取系统信息。所述系统信息可以包括但不限于电子设备110的系统状态、预设信息、存储器113存储的信息(例如,虹膜认证信息等)等,或几种的组合。
在一些实施例中,所述信息可以包括指令。所述指令包括用户指令和/或系统指令等,或几种的组合。所述指令可以包括触发指令、认证指令、填写指令等,或几种的组合。所述认证指令可以包括认证用户信息指令等。作为示例,当用户按下物理键(例如,快捷键等)时,电子设备110可以启动数据传输等。
根据本申请的一些实施例,处理单元220可以处理数据。在一些实施例中,处理单元220可以处理原始数据,例如,语音、文本、图像等数据。作为示例,处理单元220可以利用PCA技术将高纬度原始数据进行降维处理。例如,处理单元220可以对原始数据进行中心化处理等。又例如,处理单元220可以对原始数据进行中心化逆变换。在一些实施例中,处理单元220可以对数据进行编码和解码等。作为示例,处理单元220可以对数据进行熵编码和熵解码。
根据本申请的一些实施例,控制单元230可以控制数据传输。在一些实施例中,控制单元230可以控制传输所述码流和码长的缓冲过程等。在一些实施例中,控制单元230可以重构原始数据。在一些实施例中,控制单元230可以根据码长对数据编码的末尾进行增补或删除末尾零码等。在一些实施例中,控制单元230可以提取原始数据的特征数据等。
根据本申请的一些实施例,计算单元240可以计算数据。在一些实施例中,计算单元240可以计算数据的协方差矩阵,矩阵的特征值和/或特征向量等。
根据本申请的一些实施例,处理模块200可以进一步包括确定单元,所述确定单元可以用于确定数据编码的码长等。
需要说明的是,以上对于处理模块200中的单元描述,仅为描述方便,并不能把本申请限制在所举实施例的范围之内。可以理解,对于本领域技术人员,基于本系统的原理,可能在不背离该原理的前提下,对各个单元进行任意组合,或者构成子模块与其他单元连接,对实施上述模块和单元的功能进行形式和细节上的各种修正和改变。例如,处理模块200可以进一步包括确定单元,用于确定数据编码的码长;和/或分析单元,用于认证当前用户信息与存储用户信息的一致性等。又例如,处理模块200可以进一步包括存储单元,所述存储单元可以存储原始数据、中间数据等。诸如此类的变形,均在本申请的保护范围之内。
图3是根据本申请的一些实施例提供的数据传输方法的示例性流程图。如图3所示,流程300可以通过处理模块200实现。
在301,获取高纬度原始数据。操作301可以通过处理模块200的获取单元210实现。在一些实施例中,获取单元210可以通过输入/输出模块114获取数据。所述原始数据可以包括文字、语音、图像等数据类型。
在302,利用PCA技术处理所述原始数据,得到特征数据。操作302可以通过处理模块200的处理单元220实现。在一些实施例中,处理单元220可以利用PCA技术对所述原始数据进行降维处理。作为示例,所述特征数据可以为所述高维度原始数据的降维数据。
在303,编码所述特征数据,得到数据流。操作303可以通过处理模块200的处理单元220实现。在一些实施例中,处理单元220可以对所述特征数据进行熵编码。
在304,传输所述数据流。操作304可以通过处理模块200的控制单元230和/或输入/输出模块114实现。在一些实施例中,控制单元230可以控制传输数据编码的缓冲过程。所述数据编码可以包括码流和码长。
在305,解码所述数据流,得到所述特征数据。操作305可以通过处理模块200的处理单元220实现。在一些实施例中,处理单元220可以对所述数据流进行熵解码。
在306,重构所述原始数据。操作306可以通过处理模块200的处理单元220、控制单元230实现。在一些实施例中,控制单元230可以通过处理单元220处理的中间数据重构原始数据。
根据本申请的一些实施例,PCA技术可以包括:获取高纬度的样本数据,例如,所述样本数据为M个N维数据X=(X1,X2,…,XM),每个X可以包括N个分量。将X进行中心化处理后,如公式1所示:
在一些实施例中,PCA技术可以进一步包括:计算样本数据的协方差矩阵,如公式2所示:
在一些实施例中,求解样本数据的协方差矩阵,可以得到投影变换后的新坐标系为:{w1,w2,…,wN},其中,w为标准正交基,如公式3所示:
在一些实施例中,PCA技术可以进一步包括:将N维数据降维至D维,删除新坐标系中的部分坐标系,得到D维坐标系为{w1,w2,…,wD};则Xi在D维坐标系中的坐标为其中,是Xi在D维坐标系中第j维的坐标。
若使用Zi重构原始数据Xi,则重构的数据其中,W为标准正交基组成的矩阵。
其中,综合整个样本集,期望得到的重构原始数据与原始数据的误差足够小,如公式4、公式5所示:
利用拉格朗日乘子法,可以得到:
J(W)=-tr(WTXXTW)+λ(WTW-I) (公式6)
对W求导可以得到:
-XXTW+λW=0 (公式7)
当Zi=WTXi,可以将原始数据降维至最小投影D维数据集。
需要说明的是,以上对于流程300的描述,仅为描述方便,并不能把本申请限制在所举实施例的范围之内。可以理解,对于本领域技术人员,基于本系统的原理,可能在不背离该原理的前提下,对各个操作进行任意组合,或者构成子流程与其它操作组合,对实施上述流程和操作的功能进行形式和细节上的各种修正和改变。例如,流程300可以进一步包括数据编码分组等操作。诸如此类的变形,均在本申请的保护范围之内。
图4是根据本申请的一些实施例提供的数据传输方法的示例性流程图。如图4所示,流程400可以通过处理模块200实现。在一些实施例中,流程400可以是流程300中操作302的一种实现方式。
在401,中心化处理原始数据。操作401可以通过处理模块200的处理单元220实现。在一些实施例中,处理单元220可以对原始数据进行中心化处理。作为示例,所述中心化处理可以根据所述原始数据的分布,建立新坐标系。所述新坐标系的原点可以为所述原始数据分布的中心。
在402,计算所述原始数据中心化处理后的协方差矩阵。操作402可以通过处理模块200的计算单元240实现。在一些实施例中,计算单元240可以利用中心化处理后的原始数据,求解协方差矩阵。
在403,计算所述协方差矩阵的特征值。操作403可以通过处理模块200的计算单元240实现。在一些实施例中,计算单元240可以利用所述原始数据中心化处理后的协方差矩阵,求解特征值。
在404,计算所述协方差矩阵的特征向量。操作404可以通过处理模块200的计算单元240实现。在一些实施例中,计算单元240可以利用所述原始数据中心化处理后的协方差矩阵以及所述特征值,求解特征向量。
在405,提取所述原始数据中心化处理后的特征数据。操作405可以通过处理模块200的处理单元220、控制单元230实现。在一些实施例中,控制单元230可以根据所述特征值和特征向量,提取所述原始数据中心化处理后的特征数据。
需要说明的是,以上对于流程400的描述,仅为描述方便,并不能把本申请限制在所举实施例的范围之内。可以理解,对于本领域技术人员,基于本系统的原理,可能在不背离该原理的前提下,对各个操作进行任意组合,或者构成子流程与其它操作组合,对实施上述流程和操作的功能进行形式和细节上的各种修正和改变。例如,流程400可以同时执行操作402、操作403和/或操作404等操作。诸如此类的变形,均在本申请的保护范围之内。
图5是根据本申请的一些实施例提供的编码方法的示例性流程图。如图5所示,流程500可以通过处理模块200实现。在一些实施例中,流程500可以是流程300中操作303的一种实现方式。
在501,量化处理特征数据,得到数据流。操作501可以通过处理模块200的处理单元220实现。在一些实施例中,处理单元220可以量化处理特征数据,以得到数据流。所述量化处理可以为将数据量化为一定区间的数据集。例如,将x={1,3,5,7,9}转化为任意区间[x1,x2]的数据,可以通过如下公式8处理,这一过程可以为区间[x1,x2]的量化过程。
在502,对所述数据流进行熵编码。操作502可以通过处理模块200的处理单元220实现。在一些实施例中,处理单元220可以对数据流进行熵编码。所述熵编码可以为在编码过程中根据熵原理不丢失任何信息的编码。
在503,分组所述数据流编码。操作503可以通过处理模块200的处理单元220实现。在一些实施例中,处理单元220可以对数据流编码进行分组。所述分组数据流编码可以包括获取数据流编码的码长。根据所述数据流编码的码长可以确定最大码长。根据所述最大码长,分组所述数据流编码,得到码流。在一些实施例中,当数据流编码不足最大码长时可以在编码末尾增补零码,以满足最大码长。作为示例,若{A,B,C,D,E}编码结果为A-10(2位);B-01(2位);C-00(2位);D-111(3位);E-110(3位),其中,最大码长为3位,不足3位的在末尾增补0码,则A-10-100;B-01-010;C-00-000。例如,数据流{A,B,C,D,E}编码后的码流为100010000111110,码长为22233。
图6是根据本申请的一些实施例提供的解码方法的示例性流程图。如图6所示,流程600可以通过处理模块200实现。在一些实施例中,流程600可以是流程300中操作305的一种实现方式。
在601,分解数据流。操作601可以通过处理模块200的处理单元220实现。在一些实施例中,处理单元220可以分解数据流。在一些实施例中,所述数据流可以包括码流和码长。作为示例,若数据流{A,B,C,D,E}编码后的码流为100010000111110,码长为22233,根据最大码长3分解所述数据流。其中,码长不足最大码长3位的数据流编码末尾删除零码。例如,码流可以按3位码长分解为100010000111110;根据码长为22233,删除前三组的末位0码,可以得到100100111110。
在602,对所述数据流进行熵解码。操作602可以通过处理模块200的处理单元220实现。在一些实施例中,处理单元220可以对数据流进行熵解码。
在603,反量化处理所述数据流,得到特征数据。操作603可以通过处理模块200的处理单元220实现。在一些实施例中,处理单元220可以对解码后的数据流进行反量化处理。所述反量化处理可以为根据公式8的变化公式,由d求解x的反量化处理过程。
需要说明的是,以上对于流程500、流程600的描述,仅为描述方便,并不能把本申请限制在所举实施例的范围之内。可以理解,对于本领域技术人员,基于本系统的原理,可能在不背离该原理的前提下,对各个操作进行任意组合,或者构成子流程与其它操作组合,对实施上述流程和操作的功能进行形式和细节上的各种修正和改变。例如,流程500可以为流程300中数据流传输前的编码过程。又例如,流程600可以为流程300中数据流传输后的解码过程。诸如此类的变形,均在本申请的保护范围之内。
图7是根据本申请的一些实施例提供的重构原始数据的示例性流程图。如图7所示,流程700可以通过处理模块200实现。在一些实施例中,流程700可以是流程300中操作306的一种实现方式。
在701,获取特征数据。操作701可以通过处理模块200的获取单元210实现。在一些实施例中,获取单元210可以获取通过编码传输后解码的特征数据。
在702,计算所述特征数据的特征向量。操作702可以通过处理模块200的计算单元240实现。在一些实施例中,计算单元240可以计算特征数据的特征向量。
在703,中心化逆变换所述特征数据,以及所述特征向量。操作703可以通过处理模块200的处理单元220实现。在一些实施例中,处理单元220可以对特征数据以及特征向量进行中心化逆变换。所述中心化逆变换可以重建数据的初始坐标系。
在704,重构原始数据。操作704可以通过处理模块200的处理单元220、控制单元230实现。在一些实施例中,控制单元230可以重构原始数据。
需要说明的是,以上对于流程700的描述,仅为描述方便,并不能把本申请限制在所举实施例的范围之内。可以理解,对于本领域技术人员,基于本系统的原理,可能在不背离该原理的前提下,对各个操作进行任意组合,或者构成子流程与其它操作组合,对实施上述流程和操作的功能进行形式和细节上的各种修正和改变。例如,流程700可以为基于PCA的数据传输后的原始数据重构过程。诸如此类的变形,均在本申请的保护范围之内。
综上所述,根据本申请实施例的数据传输方法及系统,利用PCA技术提取原始数据的特征数据,传输特征数据编码,再经解码重构原始数据,提高了传输效率,实现高效准确地传输数据。
需要注意的是,上述的实施例仅仅是用作示例,本申请不限于这样的示例,而是可以进行各种变化。
需要说明的是,在本说明书中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
最后,还需要说明的是,上述一系列处理不仅包括以这里所述的顺序按时间序列执行的处理,而且包括并行或分别地、而不是按时间顺序执行的处理。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序指令相关的硬件来完成,所述的程序可存储于一计算机可读存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储器(Read-Only Memory,ROM)或随机存储器(RandomAccess Memory,RAM)等。
以上所揭露的仅为本申请一些优选的实施例,不能以此来限定本申请之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本申请权利要求所作的等同变化,仍属于发明所涵盖的范围。

Claims (10)

1.一种数据传输方法,其特征在于,包括:
获取高维度原始数据;
利用PCA技术处理所述原始数据,得到特征数据;
编码所述特征数据,得到数据流;
传输所述数据流;
解码所述数据流,得到所述特征数据;
重构所述原始数据。
2.根据权利要求1所述的数据传输方法,其特征在于,所述利用PCA技术处理所述原始数据进一步包括:
中心化处理所述原始数据,
计算所述原始数据中心化处理后的协方差矩阵;
计算所述协方差矩阵的特征值;
计算所述协方差矩阵的特征向量;
提取所述原始数据中心化处理后的特征数据。
3.根据权利要求1所述的数据传输方法,其特征在于,所述编码所述特征数据进一步包括:
量化处理所述特征数据,得到数据流;
对所述数据流进行熵编码,得到数据流编码;
分组所述数据流编码。
4.根据权利要求3所述的数据传输方法,其特征在于,所述分组所述数据流编码进一步包括:
获取所述数据流编码的码长;
确定所述数据流编码的最大码长;
根据所述最大码长,分组所述数据流编码,得到码流;
其中,不足最大码长的数据流编码末尾增补零码,以满足最大码长。
5.根据权利要求4所述的数据传输方法,其特征在于,所述传输所述数据流进一步包括:
传输所述数据流编码的码流,以及码长;
控制传输所述码流和码长的缓冲过程。
6.根据权利要求4所述的数据传输方法,其特征在于,所述解码所述数据流进一步包括:
分解所述数据流;
对所述数据流进行熵解码;
反量化处理所述数据流,得到所述特征数据。
7.根据权利要求6所述的数据传输方法,其特征在于,所述解码所述数据流进一步包括:
根据所述最大码长解码所述数据流;
其中,码长不足最大码长的数据流编码末尾删除零码。
8.根据权利要求1所述的数据传输方法,其特征在于,所述重构所述原始数据进一步包括:
获取所述特征数据;
计算所述特征数据的特征向量;
中心化逆变换所述特征数据,以及所述特征向量;
重构所述原始数据。
9.根据权利要求1所述的数据传输方法,其特征在于,所述特征数据为所述高维度原始数据的降维数据。
10.一个系统,其特征在于,包括:
一个存储器,被配置为存储数据及指令;
一个与存储器建立通信的处理器,其中,当执行存储器中的指令时,所述处理器被配置为:
获取高维度原始数据;
利用PCA技术处理所述原始数据,得到特征数据;
编码所述特征数据,得到数据流;
传输所述数据流;
解码所述数据流,得到所述特征数据;
重构所述原始数据。
CN201710845000.5A 2017-09-19 2017-09-19 一种基于pca的数据传输方法及系统 Pending CN107483969A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710845000.5A CN107483969A (zh) 2017-09-19 2017-09-19 一种基于pca的数据传输方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710845000.5A CN107483969A (zh) 2017-09-19 2017-09-19 一种基于pca的数据传输方法及系统

Publications (1)

Publication Number Publication Date
CN107483969A true CN107483969A (zh) 2017-12-15

Family

ID=60584979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710845000.5A Pending CN107483969A (zh) 2017-09-19 2017-09-19 一种基于pca的数据传输方法及系统

Country Status (1)

Country Link
CN (1) CN107483969A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763305A (zh) * 2018-04-20 2018-11-06 平安科技(深圳)有限公司 数据特征提取的方法、装置、计算机设备和存储介质
CN111163318A (zh) * 2020-01-09 2020-05-15 北京大学 一种基于反馈优化的人机视觉编码方法和装置
CN113592003A (zh) * 2021-08-04 2021-11-02 智道网联科技(北京)有限公司 一种图片传输方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103501438A (zh) * 2013-09-18 2014-01-08 浙江大学 一种基于主成分分析的内容自适应图像压缩方法
CN104253993A (zh) * 2013-06-28 2014-12-31 炬力集成电路设计有限公司 一种多媒体数据处理方法、电路及装置
CN104469374A (zh) * 2014-12-24 2015-03-25 广东省电信规划设计院有限公司 图像压缩方法
US9479799B1 (en) * 2014-09-05 2016-10-25 Quantenna Communications, Inc. Compression using an iterative data derived basis set

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104253993A (zh) * 2013-06-28 2014-12-31 炬力集成电路设计有限公司 一种多媒体数据处理方法、电路及装置
CN103501438A (zh) * 2013-09-18 2014-01-08 浙江大学 一种基于主成分分析的内容自适应图像压缩方法
US9479799B1 (en) * 2014-09-05 2016-10-25 Quantenna Communications, Inc. Compression using an iterative data derived basis set
CN104469374A (zh) * 2014-12-24 2015-03-25 广东省电信规划设计院有限公司 图像压缩方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杜洪 等: "基于PCA图像压缩算法研究与实现", 《四川大学学报(自然科学版)》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763305A (zh) * 2018-04-20 2018-11-06 平安科技(深圳)有限公司 数据特征提取的方法、装置、计算机设备和存储介质
CN111163318A (zh) * 2020-01-09 2020-05-15 北京大学 一种基于反馈优化的人机视觉编码方法和装置
WO2021139114A1 (zh) * 2020-01-09 2021-07-15 北京大学 一种基于反馈优化的人机视觉编码方法和装置
CN113592003A (zh) * 2021-08-04 2021-11-02 智道网联科技(北京)有限公司 一种图片传输方法、装置、设备及存储介质
CN113592003B (zh) * 2021-08-04 2023-12-26 智道网联科技(北京)有限公司 一种图片传输方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN107657953A (zh) 语音控制方法及系统
CN107609914A (zh) 一种智能菜单设计方法及系统
CN107483969A (zh) 一种基于pca的数据传输方法及系统
CN107835307A (zh) 用于终端的助睡眠方法及系统
CN107256353A (zh) 具备隐私保护功能的显示方法
CN109472122A (zh) 一种多媒体信息提示方法及系统
CN107315681A (zh) 应用程序自启动测试系统、媒质和方法
CN107423585A (zh) 一种应用的隐秘使用方法及系统
CN107786979A (zh) 一种多终端共享通信方法及系统
CN107734474A (zh) 绑定电话号码的应用统计方法及系统
CN107846508A (zh) 针对健忘人群的辅助记忆方法及系统
CN107341378A (zh) 用于设定应用的使用权限的方法
CN109379431A (zh) 一种联系人信息更新方法、云端服务器及终端
CN107220531A (zh) 一种便捷登录的信息处理方法
CN206908680U (zh) 具有安全登录功能的智能终端
CN107018153A (zh) 一种安全登录方法
CN107404484A (zh) 一种机械解锁权限的方法、装置及系统
CN107835117A (zh) 一种即时通信方法及系统
CN107623736A (zh) 一种设备连接方法及系统
CN107592398A (zh) 一种智能信息存储方法及系统
CN107566978A (zh) 一种基于智能神经网络的终端跟踪方法及系统
CN107451564A (zh) 一种人脸动作控制方法及系统
CN107690040A (zh) 自动拨号方法
CN207123813U (zh) 一种用于单指控制的指套装置
CN108184248A (zh) 一种终端的数据处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171215