CN106339341A - 一种片上并行SerDes系统及实现方法 - Google Patents
一种片上并行SerDes系统及实现方法 Download PDFInfo
- Publication number
- CN106339341A CN106339341A CN201610698624.4A CN201610698624A CN106339341A CN 106339341 A CN106339341 A CN 106339341A CN 201610698624 A CN201610698624 A CN 201610698624A CN 106339341 A CN106339341 A CN 106339341A
- Authority
- CN
- China
- Prior art keywords
- data
- parallel
- clock
- serial
- clock sclk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/382—Information transfer, e.g. on bus using universal interface adapter
- G06F13/387—Information transfer, e.g. on bus using universal interface adapter for adaptation of different data processing systems to different peripheral devices, e.g. protocol converters for incompatible systems, open system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2213/00—Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F2213/0002—Serial port, e.g. RS232C
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2213/00—Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F2213/0004—Parallel ports, e.g. centronics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2213/00—Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F2213/38—Universal adapter
- G06F2213/3852—Converter between protocols
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Dc Digital Transmission (AREA)
Abstract
本发明公开了一种片上并行SerDes系统及使用方法,所述系统包括数据发送端(1)、数据接收端(2),所述数据发送端(1)在系统时钟sclk的控制下将并行数据转换为串行数据,再发送数据接收端(2);数据接收端(2)将接收到的串行数据在系统时钟sclk的控制下转换为并行数据。本发明将大量的数据、地址、控制总线采用并行SerDes技术的方法进行数据传送,极大地节约了布线空间资源,为进一步提高GPU的数据带宽奠定了技术基础。该方法结构简洁、存储带宽高、可极大地提高数据的传输效率。
Description
技术领域
本发明涉及SerDes技术,特别涉及片上SerDes技术的系统及实现方法。
背景技术
随着高速图像处理技术的应用领域日益扩大,对图像的性能要求也越来越
高。经硬件设计人员的努力,从单核处理器系统实现图像处理到多核技术的迅猛发展实现图像处理,为高速图像的并行处理提供了一种新的研究方向和解决方法。软件设计人员将一些应用程序加速了超过100倍,但这只是在增强的算法得到了大量优化和调整后,从而使应用程序超过99.9%的执行时间都花费在并行执行部分上。一般来说,应用程序直接并行化可能会导致存储器(DRAM)带宽达到饱和,使得加速只能达到10倍。解决途径在于如何突破存储器带宽的限制,然而,如果要想突破这些限制,不但需要对代码进行进一步的优化,以限制片上存储器的容量。更需要GPU片上存储器结构的数据总线打破传统的观念,对大量的数据进行并行读写,以满足大量矩阵运算的需要。
特别是,CPU的芯片面积由缓存决定,而GPU的芯片面积则由数据通路和固定功能逻辑决定。GPU存储器接口更重视带宽而不是延时(大规模并行执行会隐藏延时)。事实上,GPU带宽已经超出CPU带宽许多倍,在最近的设计中已经超过190GB/s,但仍显不足,仍远达不到应用需求对GPU带宽的要求。
发明内容
本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种片上并行SerDes系统及实现方法,将大量的数据、地址、控制总线采用并行SerDes技术的方法进行数据传送,极大地节约了布线空间资源,为进一步提高GPU的数据带宽奠定了技术基础。该方法结构简洁、存储带宽高、可极大地提高数据的传输效率。SerDes是英文SERializer(串行器)/DESerializer(解串器)的简称,是一种主流的时分多路复用(TDM)、点对点(P2P)的串行通信技术。即在发送端多路低速并行信号被转换成高速串行信号,经过传输媒体(光缆或铜线),最后在接收端高速串行信号重新转换成低速并行信号。
为解决上述技术问题,本发明采用以下技术方案:
一种片上并行SerDes系统,包括:包括数据发送端、数据接收端,所述数据发送端在系统时钟sclk的控制下将并行数据转换为串行数据,再发送数据接收端;数据接收端将接收到的串行数据在系统时钟sclk的控制下转换为并行数据。
作为本发明的进一步改进:所述数据发送端包括:
发送端并行数据锁存器,完成对发送并行数据的暂存,工作时钟采用系统时钟sclk。
发送端串行器,完成并行数据到串行数据的转换,所述串行器的工作频率同系统时钟sclk,但占空比不同。
作为本发明的进一步改进:所述数据接收端,包括:
接收采样器,完成串行差分数据的采样接收,并将差分双端数据转换为单端数据;
接收并行器,完成串行数据到并行数据的转换,所述并行器的工作频率同系统时钟sclk,但占空比不同;
接收端并行数据锁存器,完成串行转并行数据的暂存,工作时钟采用系统时钟sclk。
作为本发明的进一步改进:还包括串并时钟生成器,系统时钟sclk为输入信号,生成串行器和并行器所需的16相clk-SerDes1-- clk-SerDes16。
作为本发明的进一步改进:所述串并时钟生成器占空比是1:15,相邻两个时钟的相位相差180°。
作为本发明的进一步改进:所述发送端串行器包括:
CMOS传输门组成的多路选择开关,每一路开关的控制信号都由串并时钟生成器生成。每一相控制时钟的占空比都是1:15,相邻两个时钟的相位相差180°,频率与工作时钟sclk相同。
作为本发明的进一步改进:所述接收端采样器和并行器包括:
RS锁存器和锁存器组成的装配电路,将16对差分串行数据装配成16位并行数据,锁存器的时钟控制信号都由串并时钟生成器生成。每一相控制时钟的占空比都是1:15,相邻两个时钟的相位相差180°,频率与系统时钟sclk相同。
一种片上并行SerDes系统的使用方法,由数据发送端在系统时钟sclk的控制下将并行数据转换为串行数据,再发送数据接收端;然后,数据接收端将接收到的串行数据在系统时钟sclk的控制下转换为并行数据。
与现有技术相比,本发明的优点在于:本发明提供了一种片上并行SerDes技术的实现方法,将大量的数据、地址、控制总线采用并行SerDes技术的方法进行数据传送,极大地节约了布线空间资源,为进一步提高GPU的数据带宽奠定了技术基础。该方法结构简洁、存储带宽高、可极大地提高数据的传输效率。
附图说明
图1是本发明的顶层拓扑结构示意图;
图2是本发明的逻辑结构原理示意图;
图3是本发明串行器的逻辑结构原理示意图;
图4是本发明并行器的逻辑结构原理示意图;
图5是本发明串并时钟生成器的时钟关系示意图。
具体实施方式
以下将结合说明书附图和具体实施例对本发明做进一步详细说明。
如图1所示,本发明的一种片上并行SerDes系统的顶层拓扑结构示意图。包括:数据发送端1,完成数据的并转串;数据接收端2,完成数据的串转并;串并时钟生成器3,生成串行器12和并行器22所需的16相时钟clk-SerDes1-- clk-SerDes16。其中,数据发送端1将输入的16位并行数据d15-d0,在系统时钟sclk的控制下,转换为串行数据d0,d1,...,d15,发送出去。先发送d0,再发送d1,最后发送d15。数据接收端2将接收到的串行数据d0,d1,...,d15,在系统时钟sclk的控制下,转换为并行数据d15-d0后,发送出去。系统时钟sclk负责发送端和接收端的时钟同步,与数据一起并行发送。
如图2所示,本发明的并行SerDes系统的结构原理示意图。
发送端并行数据锁存器11,将输入的16位并行数据d15-d0,在系统时钟sclk的控制下,完成对发送并行数据的暂存。
串行器12,将并行数据锁存器11输出的16位并行数据d15-d0,在系统时钟sclk的控制下,转换为串行数据d0,d1,...,d15,发送出去。先发送d0,再发送d1,最后发送d15。串行器12的工作频率同系统时钟sclk,但占空比不同,串行器12的时钟由串并时钟生成器3生成,占空比是1:15,相邻两个时钟的相位相差180°。
接收采样器21,将接收到的串行数据d0,d1,...,d15,完成串行差分数据的采样接收,并将数据的双端转换为单端。
接收端并行器22,接收采样器21采样到的16位串行数据d0,d1,...,d15,完成串行数据到并行数据的转换,并行器22的工作频率同系统时钟sclk,但占空比不同,并行器22的时钟由串并时钟生成器3生成,占空比是1:15,相邻两个时钟的相位相差180°。
接收端并行数据锁存器23,接收并行器22输出的16位并行数据d15-d0,完成并行数据的暂存,输出16位并行数据dout[15:0],工作时钟采用系统时钟sclk。
串并时钟生成器3,完成由系统时钟sclk生成的串行器12和并行器22所需的控制时钟clk-SerDes1-- clk-SerDes16,串并时钟生成器3所生成的时钟有16相,每一相的占空比都是1:15,相邻两个时钟的相位相差180°。
如图3所示,本发明串行器的逻辑结构原理示意图。
CMOS传输门121成的多路选择开关,实现并转串的功能。CMOS传输门121共有16套CMOS传输门,每一套CMOS传输门的逻辑结构完全一样。NMOS的源极与PMOS的源极相连,接数据的输入端。NMOS的漏极与PMOS的漏极相连,16套漏极线或在一起,作为串行数据的输出。NMOS的栅极连接占空比为1:15的串行时钟clk-SerDesi,正时钟,PMOS的栅级连接占空比为1:15的串行时钟#clk-SerDesi,负时钟。相邻两个时钟的相位相差180°,频率与系统时钟sclk相同。
如图4所示,本发明并行器的逻辑结构原理示意图。
RS锁存器211和锁存器221组成的数据接收装配电路,由16套RS锁存器和16套锁存器构成,16套RS锁存器将16对差分双端串行数据转换成16位单端数据,16套锁存器将16位串行数据装配成16位并行数据。16套RS锁存器的逻辑结构完全相同,RS锁存器的置位端(S)接差分数据的负端,复位端接差分数据的正端。16套锁存器的逻辑结构完全相同,每个锁存器的d端都连接接收采样器21的串行数据输出,锁存器的q端分别输出对应的并行数据,锁存器的clk端分别连接占空比为1:15的串行时钟clk-SerDesi,正时钟。锁存器的时钟控制信号都由1/16占空比产生器(3.1)生成,每一个控制时钟的占空比都是1:15,相邻两个时钟的相位相差180°,频率与系统时钟sclk相同。
如图5所示,本发明的串并时钟生成器3的时钟关系示意图。
系统时钟sclk作为串并时钟生成器3的输入信号,产生16相占空比为1:15的时钟clk-SerDes1--clk-SerDes16,相邻两个时钟的相位相差180°,频率与系统时钟sclk相同。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
Claims (9)
1.一种片上并行SerDes系统,其特征在于:包括数据发送端(1)、数据接收端(2),所述数据发送端(1)在系统时钟sclk的控制下将并行数据转换为串行数据,再发送数据接收端(2);数据接收端(2)将接收到的串行数据在系统时钟sclk的控制下转换为并行数据。
2.如权利要求1所述的一种片上并行SerDes系统,其特征在于:所述数据发送端(1)包括:
发送端并行数据锁存器(11),完成对发送并行数据的暂存,工作时钟采用系统时钟sclk;
发送端串行器(12),完成并行数据到串行数据的转换,所述串行器(12)的工作频率同系统时钟sclk,但占空比不同。
3.如权利要求1所述的一种片上并行SerDes系统,其特征在于:所述数据接收端(2)包括:
接收采样器(21),完成串行差分数据的采样接收,并将差分双端数据转换为单端数据;
接收端并行器(22),完成串行数据到并行数据的转换,所述并行器(22)的工作频率同系统时钟sclk,但占空比不同;
接收端并行数据锁存器(23),完成串行转并行数据的暂存,工作时钟采用系统时钟sclk。
4.如权利要求1所述的一种片上并行SerDes系统,其特征在于:还包括串并时钟生成器(3),系统时钟sclk为输入信号,生成串行器(12)和并行器(22)所需的16相clk-SerDes1--clk-SerDes16。
5.如权利要求1或4所述的一种片上并行SerDes系统,其特征在于:所述串并时钟生成器(3)占空比是1:15,相邻两个时钟的相位相差180°。
6.如权利要求2所述的一种片上并行SerDes系统,其特征在于:所述发送端串行器(12)包括:CMOS传输门(121)组成的多路选择开关,每一路开关的控制信号都由串并时钟生成器(3)生成。
7.如权利要求3所述的一种片上并行SerDes系统,其特征在于:所述接收端并行器(22)包括:锁存器(221)组成的装配电路,将16个串行数据装配成16个并行数据,锁存器的时钟控制信号都由串并时钟生成器(3)生成。
8.如权利要求6或7所述的一种片上并行SerDes系统,其特征在于:所述串并时钟生成器(3)占空比是1:15,相邻两个时钟的相位相差180°。
9.如权利要求1所述的一种片上并行SerDes系统的实现方法,其特征在于:包括:首先,由数据发送端(1)在系统时钟sclk的控制下将并行数据转换为串行数据,再发送数据接收端(2);然后,数据接收端(2)将接收到的串行数据在系统时钟sclk的控制下转换为并行数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610698624.4A CN106339341A (zh) | 2016-08-22 | 2016-08-22 | 一种片上并行SerDes系统及实现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610698624.4A CN106339341A (zh) | 2016-08-22 | 2016-08-22 | 一种片上并行SerDes系统及实现方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106339341A true CN106339341A (zh) | 2017-01-18 |
Family
ID=57824587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610698624.4A Pending CN106339341A (zh) | 2016-08-22 | 2016-08-22 | 一种片上并行SerDes系统及实现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106339341A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108184038A (zh) * | 2017-12-19 | 2018-06-19 | 重庆湃芯微电子有限公司 | 一种面向物联网的超高速数字cmos图像传感器的高速传输系统 |
CN110119683A (zh) * | 2019-04-10 | 2019-08-13 | 深兰科技(上海)有限公司 | 一种手脉识别设备及手脉数据处理系统 |
CN112383384B (zh) * | 2021-01-13 | 2021-04-06 | 成都铭科思微电子技术有限责任公司 | 一种基于片上串行数据通信的大尺寸芯片及其通信方法 |
CN112929584A (zh) * | 2021-02-23 | 2021-06-08 | 深圳市视显光电技术有限公司 | P2p信号采集转换方法、系统及p2p信号采集转换板 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1551507A (zh) * | 2003-05-09 | 2004-12-01 | �ձ�������ʽ���� | 串行和并行之间的数据格式转换器 |
JP2009253722A (ja) * | 2008-04-08 | 2009-10-29 | Kawasaki Microelectronics Inc | パラレル/シリアル変換回路 |
CN102447477A (zh) * | 2010-10-15 | 2012-05-09 | 珠海全志科技股份有限公司 | 跨异步时钟域的并串数据流实时转换传输方法和装置 |
CN103037222A (zh) * | 2012-12-04 | 2013-04-10 | 中国北方车辆研究所 | 一种并行数字视频信号的压缩传输装置和方法 |
-
2016
- 2016-08-22 CN CN201610698624.4A patent/CN106339341A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1551507A (zh) * | 2003-05-09 | 2004-12-01 | �ձ�������ʽ���� | 串行和并行之间的数据格式转换器 |
JP2009253722A (ja) * | 2008-04-08 | 2009-10-29 | Kawasaki Microelectronics Inc | パラレル/シリアル変換回路 |
CN102447477A (zh) * | 2010-10-15 | 2012-05-09 | 珠海全志科技股份有限公司 | 跨异步时钟域的并串数据流实时转换传输方法和装置 |
CN103037222A (zh) * | 2012-12-04 | 2013-04-10 | 中国北方车辆研究所 | 一种并行数字视频信号的压缩传输装置和方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108184038A (zh) * | 2017-12-19 | 2018-06-19 | 重庆湃芯微电子有限公司 | 一种面向物联网的超高速数字cmos图像传感器的高速传输系统 |
CN110119683A (zh) * | 2019-04-10 | 2019-08-13 | 深兰科技(上海)有限公司 | 一种手脉识别设备及手脉数据处理系统 |
CN112383384B (zh) * | 2021-01-13 | 2021-04-06 | 成都铭科思微电子技术有限责任公司 | 一种基于片上串行数据通信的大尺寸芯片及其通信方法 |
CN112929584A (zh) * | 2021-02-23 | 2021-06-08 | 深圳市视显光电技术有限公司 | P2p信号采集转换方法、系统及p2p信号采集转换板 |
CN112929584B (zh) * | 2021-02-23 | 2024-02-02 | 深圳市视显光电技术有限公司 | P2p信号采集转换方法、系统及p2p信号采集转换板 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106339341A (zh) | 一种片上并行SerDes系统及实现方法 | |
JP6433973B2 (ja) | データシンボル遷移ベースのクロッキングを用いたマルチワイヤシングルエンドプッシュプルリンク | |
CN101482856B (zh) | 基于现场可编程门阵列的串并行协议转换装置 | |
WO2018175248A1 (en) | Methods and apparatuses for signal translation in a buffered memory | |
CN108683536B (zh) | 异步片上网络的可配置双模式融合通信方法及其接口 | |
CN102710240A (zh) | 信号处理装置、方法、serdes 和处理器 | |
CN108462620B (zh) | 一种吉比特级SpaceWire总线系统 | |
US11343203B2 (en) | Hierarchical switching fabric and deadlock avoidance method for ultra high radix network routers | |
CN104579570A (zh) | 数据接收器、数据接收系统和数据传输系统 | |
CN108809642A (zh) | 一种基于fpga的多通道数据万兆加密认证高速传输实现方法 | |
CN103888147A (zh) | 一种串行转并行转换电路和转换器以及转换系统 | |
CN103401656A (zh) | 星载相控阵接收天线数据传输系统 | |
CN1728629A (zh) | 多路物理层接口复用传输装置 | |
CN103078667A (zh) | 一种基于超五类线的lvds高速数据传输方法 | |
CN111475460A (zh) | 基于NoC的高速数据采集系统与上位机通信接口控制器 | |
CN113765582A (zh) | 一种国产化设计的冗余光口单向传输数据实现系统和方法 | |
CN204362064U (zh) | 数据接收器、数据接收系统和数据传输系统 | |
CN103034610A (zh) | 在分体模块间进行axi总线信号发送接收的方法及装置 | |
CN208314763U (zh) | 一种用于PCIe信号机箱外部传输的Retimer板卡 | |
CN113986792B (zh) | 一种数据位宽转换方法及通信设备 | |
CN110008157A (zh) | 一种串行解串器的硬件架构 | |
CN107851077B (zh) | 采用嵌入式边带通信的串行总线 | |
CN203658995U (zh) | 一种串行数据传输系统 | |
KR100799684B1 (ko) | 통신 시스템 및 통신 시스템 제어방법 | |
CN1275434C (zh) | 传输异步串口数据的方法及其实施装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170118 |
|
RJ01 | Rejection of invention patent application after publication |