CN101196825A - 编译程序、编译程序装置和编译方法 - Google Patents

编译程序、编译程序装置和编译方法 Download PDF

Info

Publication number
CN101196825A
CN101196825A CNA2007100885255A CN200710088525A CN101196825A CN 101196825 A CN101196825 A CN 101196825A CN A2007100885255 A CNA2007100885255 A CN A2007100885255A CN 200710088525 A CN200710088525 A CN 200710088525A CN 101196825 A CN101196825 A CN 101196825A
Authority
CN
China
Prior art keywords
instruction
machine language
intermediate code
program
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007100885255A
Other languages
English (en)
Inventor
瓶子岳人
坂田俊幸
小川一
宫地凉子
宫阪修二
石川智一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN101196825A publication Critical patent/CN101196825A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/44Encoding
    • G06F8/443Optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/42Syntactic analysis
    • G06F8/425Lexical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/42Syntactic analysis
    • G06F8/427Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/44Encoding
    • G06F8/443Optimisation
    • G06F8/4441Reducing the execution time required by the program code

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Devices For Executing Special Programs (AREA)

Abstract

提供了在源程序101中包括的运算符定义文件102等和将源程序101翻译成机器语言程序105的编译程序100。运算符定义文件102包括由类定义对各种定点类型运算符的定义。编译程序100可以有效地产生处理器执行的高级和专用指令,并通过扩展函数等来作出改进,而不频繁地重复编译程序本身的版本的更新。编译程序100由产生中间编码的中间编码产生单元121、用机器语言指令替代引用由运算符定义文件102定义的类的中间编码的机器语言指令替代单元122和执行以包括替代的机器语言指令的中间编码为目标的优化的优化单元130组成。

Description

编译程序、编译程序装置和编译方法
本申请是2003年8月1日递交,2004年3月17日公开的,发明名称为“编译程序、编译程序装置和编译方法”,本申请人的第03152256.4号中国发明专利申请的分案申请。
技术领域
本发明涉及一种将以诸如C++语言的高级程序语言描述的源程序编译成机器语言的编译程序,尤其涉及编译程序的优化。
背景技术
随着处理器的功能在近些年来被极大地提高,强烈地寻求可以高效地开发处理器所具有的高度功能的高性能编译程序。换句话说,需要高效地产生由目标处理器执行的高级和专用指令的编译程序。
例如,开发了执行媒体处理、例如数字信号处理所需的各种定点格式的运算指令的处理器和执行SIMD(单指令多数据)类型指令的高性能处理器。需要以这样一个处理器为目标的编译程序通过高效地产生各种定点格式的运算指令和SIMD类型指令来优化代码大小和执行速度。
然而,无须说明的是,一个常规编译程序高效地产生处理器执行的关于以诸如C++语言的高级程序语言描述的源程序的高级和专用指令。因此,在用于媒体处理的应用和在代码大小和执行速度方面需要严格条件的其他应用的开发中,用户在当前条件下别无选择地只能描述汇编程序指令中的临界点。但存在一个问题,汇编程序指令的程序设计不仅需要更多的工时,在可维护性和可移植性上与采用诸如C++语言的高级程序语言的开发相比还非常低级。
另外,常规编译程序在其自身中具有用于产生处理器执行的高级和专用指令等的优化处理。换句话说,高效利用目标处理器的特征来用于优化的处理模块包括在编译程序自身内并集成。因此,当编译程序的功能被扩展或目标编译程序的说明书改变时,需要重新配置整个编译程序。这存在一个问题,必须每次重复编译程序的版本的升级等。
发明内容
考虑到上述问题,本发明的第一个目的是提供一个可以高效地产生处理器执行的高级和专用指令的编译程序。
此外,本发明的第二个目的是提供一个可以在不频繁地重复编译程序自身的版本的升级的情况下通过扩充功能等作出改进的编译程序。
依据本发明的编译程序将一个源程序翻译成一个机器语言程序,该程序包括运算定义信息,其中定义了对应于一个专用于一个目标处理器的机器语言指令的运算,编译程序包括:分析程序步骤,分析源程序;中间编码变换步骤,将分析的源程序变换成中间编码;优化步骤,优化变换的中间编码;以及,代码产生步骤,将优化的中间编码变换成机器语言指令,其中,中间编码变换步骤包括:检测子步骤,检测中间编码中的一个是否引用(refer to)在运算定义信息中定义的运算;以及,替代子步骤,当检测到中间编码时,用一个对应的机器语言指令替代中间编码,以及,在优化步骤中,优化中间编码,中间编码包括在替代子步骤中替代中间编码的机器语言指令。
例如,依据本发明的程序由源程序中包括的主文件(header file)和将源程序翻译成机器语言程序的编译程序组成;在主文件中,定义了一个由数据和方法组成的类;编译程序包括:分析程序步骤,分析源程序;中间编码变换步骤,将分析的源程序变换成中间编码;优化步骤,优化变换的中间编码;以及,代码产生步骤,将优化的中间编码变换成机器语言指令,其中,中间编码变换步骤包括:检测子步骤,检测中间编码中的一个是否引用在主文件中定义的类;以及,替代子步骤,当检测到中间编码时,用一个对应的机器语言指令替代中间编码,以及,在优化步骤中,优化中间编码,中间编码包括在替代子步骤中替代中间编码的机器语言指令。
从而,当有一个语句引用在源程序中的主文件中定义的类时,在中间编码被变换成机器语言指令之后对应于该语句的中间编码变成优化处理的目标,因此,中间编码可以与附近的机器语言指令一起被优化。另外,由于编译程序不仅由编译程序自身的功能性能执行优化(优化处理)而且与主文件中的定义相结合来执行优化,所以编译程序可以增加作为优化目标的语句并提高优化水平。
这里,可接受的是该类定义一个定点类型,并且,在检测子步骤中,检测使用定点类型数据的中间编码,并且,仍然可接受的是在类中的方法定义了以定点类型数据为目标的运算符,在检测子步骤中,检测是基于以一个运算为目标的一个运算符和数据类型集合是否适合方法中的定义来执行的,以及,在替代步骤中,其运算符和数据类型的集合适合定义的中间编码被用一个对应的机器语言指令来替代。
从而,由于由主文件定义的定点类型和运算符通过编译程序与普通类型类似地通过简单地在源程序中包括主文件而与普通类型类似地被变换成对应的中间编码和机器语言指令,所以用户可以声明和使用对应于专用于目标处理器的定点模式的类型。
此外,依据本发明的编译程序包括在源程序中包括的主文件和将源程序翻译成机器语言程序的编译程序;在主文件中定义一个函数(function);编译程序包括:分析程序步骤,分析源程序;中间编码变换步骤,将分析的源程序变换成中间编码;优化步骤,优化变换的中间编码;以及,代码产生步骤,将优化的中间编码变换成机器语言指令,其中,中间编码变换步骤包括:检测子步骤,检测中间编码中的一个是否引用在主文件中定义的函数;以及,替代子步骤,当检测到中间编码时,用一个对应的机器语言指令替代中间编码,以及,在优化步骤中,优化中间编码,中间编码包括在替代子步骤中替代中间编码的机器语言指令。
从而,当有一个语句引用在源程序中的主文件中定义的函数(内置函数)时,在中间编码被变换成由主文件定义的机器语言指令之后,对应于该语句的中间编码变成优化处理的目标,因此,中间编码可以与附近的机器语言指令一起被优化。另外,当用户想要使用专用于处理器的高函数指令(high-functional)时,他仅仅需要描述出主文件被包括在源程序中并且在源程序中调用所需要的内置函数。换句话说,将他从利用汇编程序指令编码中释放出来。
如上所述,采用依据本发明的编译程序,高效地产生目标处理器所执行的高函数和专用指令;以高水平执行优化;以及,通过主文件的灵活响应、例如函数扩展变为可能,因此,编译程序的实用价值非常高,尤其是作为用于需要代码大小和执行速度上的严格说明的媒体处理应用的开发工具。
应该注意,本发明不仅可以实现为类似这个的编译程序,也可以实现为采用在用于编译程序的程序中包括的步骤作为步骤的编译程序装置和其中记录有特征化的编译程序或主文件的计算机可读记录介质。然后,无须说明的是,类似这些的程序和数据文件可以通过诸如CD-ROM的记录介质或诸如因特网的传输媒介被广泛地分布。
作为关于这个申请的技术背景的进一步的信息,在2002年8月2日申请的日本专利申请No.2002-33668在这里被包含来作为参考。
附图说明
从下面结合附图的描述中,本发明的这些和其他目的、优点和特征将变得明显,其中附图显示了本发明的一个具体实施例。在附图中:
图1是显示依据本发明的编译程序的目标处理器的示意方框图。
图2是显示处理器的算术和逻辑/比较运算单元的示意图。
图3是显示处理器的桶形移位器的配置的方框图。
图4是显示处理器的变换器的配置的方框图。
图5是显示处理器的除法器的配置的方框图。
图6是显示处理器的乘积运算单元的乘法/求和的配置的方框图。
图7是显示处理器的指令控制单元的配置的方框图。
图8是显示处理器的通用寄存器(R0~R31)的配置的方框图。
图9是显示处理器的连接寄存器(LR)的配置的示意图。
图10是显示处理器的分支寄存器(TAR)的配置的示意图。
图11是显示处理器的程序状态寄存器(PSR)的配置的示意图。
图12是显示处理器的条件标志寄存器(CFR)的配置的示意图。
图13A和13B是显示处理器的累加器(M0,M1)的配置的示意图。
图14是显示处理器的程序计数器(PC)的配置的示意图。
图15是显示处理器的PC保存寄存器(IPC)的配置的示意图。
图16是显示处理器的PSR保存寄存器(IPSR)的配置的示意图。
图17是显示处理器的流水线行为的时序图。
图18是显示在执行一个指令时的处理器的流水线行为的每个阶段的时序图。
图19是显示处理器的并行行为的示意图。
图20是显示由处理器执行的指令的格式的示意图。
图21是解释一个属于类别“ALUadd(加法)系统”的指令的示意图。
图22是解释一个属于类别“ALUsub(减法)系统”的指令的示意图。
图23是解释一个属于类别“ALUlogic(逻辑运算)系统等”的指令的示意图。
图24是解释一个属于类别“CMP(比较运算)系统”的指令的示意图。
图25是解释一个属于类别“mul(乘法)系统”的指令的示意图。
图26是解释一个属于类别“mac(乘积和运算)系统”的指令的示意图。
图27是解释一个属于类别“msu(乘积差)系统”的指令的示意图。
图28是解释一个属于类别“MEMld(从存储器装入)系统”的指令的示意图。
图29是解释一个属于类别“MEMstore(存储在存储器中)系统”的指令的示意图。
图30是解释一个属于类别“BRA(分支)系统”的指令的示意图。
图31是解释一个属于类别“BSasl(算术桶形移位)系统等”的指令的示意图。
图32是解释一个属于类别“BSlsr(逻辑桶形移位)系统等”的指令的示意图。
图33是解释一个属于类别“CNVvaln(算术变换)系统”的指令的示意图。
图34是解释一个属于类别“CNV(普通变换)系统”的指令的示意图。
图35是解释一个属于类别“SATvlpk(饱和处理)系统”的指令的示意图。
图36是解释一个属于类别“ETC(等等)系统”的指令的示意图。
图37是显示依据本发明的编译程序的配置的功能方框图。
图38是显示在运算符定义文件中的清单的一部分的示意图。
图39是显示在运算符定义文件中的清单的一部分的示意图。
图40是显示在运算符定义文件中的清单的一部分的示意图。
图41是显示在运算符定义文件中的清单的一部分的示意图。
图42是显示在运算符定义文件中的清单的一部分的示意图。
图43是显示在运算符定义文件中的清单的一部分的示意图。
图44是显示在运算符定义文件中的清单的一部分的示意图。
图45是显示在运算符定义文件中的清单的一部分的示意图。
图46是显示在运算符定义文件中的清单的一部分的示意图。
图47是显示在运算符定义文件中的清单的一部分的示意图。
图48是显示在运算符定义文件中的清单的一部分的示意图。
图49是显示在运算符定义文件中的清单的一部分的示意图。
图50是显示在运算符定义文件中的清单的一部分的示意图。
图51是显示在运算符定义文件中的清单的一部分的示意图。
图52是显示在运算符定义文件中的清单的一部分的示意图。
图53是显示在运算符定义文件中的清单的一部分的示意图。
图54是显示在运算符定义文件中的清单的一部分的示意图。
图55是显示在运算符定义文件中的清单的一部分的示意图。
图56是显示在运算符定义文件中的清单的一部分的示意图。
图57是显示在运算符定义文件中的清单的一部分的示意图。
图58是显示在运算符定义文件中的清单的一部分的示意图。
图59是显示在运算符定义文件中的清单的一部分的示意图。
图60是显示在运算符定义文件中的清单的一部分的示意图。
图61是显示在运算符定义文件中的清单的一部分的示意图。
图62是显示在运算符定义文件中的清单的一部分的示意图。
图63是显示在运算符定义文件中的清单的一部分的示意图。
图64是显示在运算符定义文件中的清单的一部分的示意图。
图65是显示在运算符定义文件中的清单的一部分的示意图。
图66是显示在运算符定义文件中的清单的一部分的示意图。
图67是显示在运算符定义文件中的清单的一部分的示意图。
图68是显示在运算符定义文件中的清单的一部分的示意图。
图69是显示在内置函数定义文件中的清单的一部分的示意图。
图70是显示在内置函数定义文件中的清单的一部分的示意图。
图71是显示在内置函数定义文件中的清单的一部分的示意图。
图72是显示在内置函数定义文件中的清单的一部分的示意图。
图73是显示机器语言指令替代单元的行为的流程图。
图74是显示优化单元的变元优化单元的行为的流程图。
图75是显示一个算术树以解释优化单元的类型变换优化单元的行为的示意图。
图76是显示一个样本程序的例子以解释等待时间(latency)优化单元的行为的示意图。
图77是解释分析程序单元的定点模式切换单元的行为的示意图。
图78是解释采用一个类库(class library)的行为验证技术的示意图。
具体实施方式
下面采用附图详细解释依据本发明的本实施例的编译程序。
依据本实施例的编译程序是一个将以诸如C/C++语言的高级程序语言描述的源程序翻译成特定处理器(目标)可以执行的机器语言程序的交叉编译程序,其特征是它可以指定要产生的机器语言程序的代码大小和执行时间精密相关的优化的命令。
(处理器)
首先,采用图1到图36解释依据本实施例的编译程序的目标处理器的一个例子。
作为依据本实施例的编译程序的目标的处理器例如是一个已经开发的用在AV媒体信号处理技术领域的通用处理器,并且可执行指令与普通微计算机相比具有更高的并行性。
图1是显示本处理器的示意方框图。处理器1是一个运算(opentional)装置,其字长度是32位(一个字),由指令控制单元10、译码单元20、寄存器文件30、运算单元40、I/F单元50、指令存储器单元60、数据存储器单元70、扩充寄存器单元80和I/O接口单元90组成。运算单元40包括算术和逻辑/比较运算单元41~43、乘法/乘积和运算单元44、桶形移位器45、除法器46和变换器47来用于执行SIMD指令。乘法/乘积和运算单元44能够处理最大65位的累加以使得不降低位精度。乘法/乘积和运算单元44还能够与在算术和逻辑/比较运算单元41~43的情况中一样执行SIMD指令。此外,处理器1能够在最大三个数据单元上并行执行算术和逻辑/比较运算指令。
图2是显示算术和逻辑/比较运算单元41~43的示意图。算术和逻辑/比较运算单元41~43中的每一个由ALU单元41a、饱和处理单元41b和标志单元41c组成。ALU单元41a包括算术运算单元、逻辑运算单元、比较器和TST组成。要支持的运算数据的位宽度是8位(一个字节。此时,并行使用四个运算单元)、16位(半个字。此时,并行使用两个运算单元)和32位(一个字。此时,使用所有运算单元处理32位数据)。对于算术运算的结果,标志单元41c等检测一个溢出并产生一个条件标志。对于运算单元、比较器和TST中的每一个的结果,执行算术右移、由饱和处理单元41b进行的饱和、最大/最小值的检测、绝对值产生处理。
图3是显示桶形移位器45的配置的方框图。桶形移位器45由选择器45a和45b、高位移位器45c、低位移位器45d和饱和处理单元45e组成执行数据的算术移位(在2的补数系统中的移位)或数据的逻辑移位(无符号移位)。通常,32位或64位数据被输入到桶形移位器45或从桶形移位器45输出。存储在寄存器30a和30b中的目标数据的移位量由另一个寄存器指定或根据其立即值指定。对于数据执行左63位和右63位的范围中的算术或逻辑移位,然后以输入位长度输出。
桶形移位器45能够响应于一个SIMD指令移动8-、16-、32-和64-位数据。例如,桶形移位器45可以并行移位四条8位数据。
执行在2的补数系统中移位的算术移位来用于在加法和减法时对准小数点,以及用于乘以2的幂(2,2的2nd次幂,2的-1st次幂)和其他目的。
图4是显示变换器47的配置的方框图。变换器47由饱和块(SAT)47a、BSEQ块47b、MSKGEN块47c、VSUMB块47d、BCNT块47e和IL块47f组成。
饱和块(SAT)47a对输入数据执行饱和处理。具有用于32位数据的饱和处理的两个块使得能够支持一个对两个数据元素并行执行的SIMD指令。
BSEQ块47b从MSB开始对连续的0或1计数。
MSKGEN块47c将一个指定的位段输出为1,将其他位输出为0。
VSUMB块47d将输入数据分成指定位宽度,并输出其总和。
BCNT块47e对输入数据中指定为1的位数计数。
IL块47f将输入数据分成指定位宽度,并输出从交换每个数据块的的位置产生的值。
图5是显示除法器46的配置的方框图。使一个被除数是64位,一个除数是32位,除法器46输出32位分别作为商和模数。涉及34个周期来用于获得商和模数。除法器46可以处理有符号的和无符号的数据。然而,应该注意,对于用作被除数和除数的数据的符号的存在/不存在作出相同的设置。并且,除法器46具有输出一个溢出标志和一个0除法标志的能力。
图6是显示乘法/乘积和运算单元44的配置的方框图。乘法/乘积和运算单元44由两个32位乘法器(MUL)44a和44b、三个64位加法器(加法器)44c~44e、选择器44f和饱和处理单元(饱和)44g组成,执行下面的乘法和乘积和:
32×32位有符号乘法、乘积和与乘积差;
32×32位无符号乘法;
在两个数据元素上并行执行的16×16位有符号乘法、乘积和与乘积差;以及
在两个数据元素上并行执行的32×16位有符号乘法、乘积和与乘积差;
在以整数和定点格式的数据(h1、h2、w1和w2)上执行上面的运算。并且,对这些运算的结果进行四舍五入和饱和。
图7是显示指令控制单元10的配置的方框图。指令控制单元10由指令高速缓存10a、地址管理单元10b、指令缓冲器10c~10e、跳转缓冲器10f和旋转单元(旋转)10g组成,在平常时间和在分支点发出指令。具有三个128位指令缓冲器(指令缓冲器10c~10e)使得能够支持最大数目的并行指令执行。关于分支处理,指令控制单元10通过跳转缓冲器10f和其他在执行一个分支(settar指令)之前事先在下面描述的TAR寄存器中存储一个分支目的地址。分支采用存储在TAR寄存器中的分支目的地址来执行。
应该注意,处理器1是一个采用VLIW体系结构的处理器。VLIW体系结构是一种允许多个指令(例如,装入,存储,运算和分支)被存储在一单个指令字中并且这样的指令将在一次全部执行的体系结构。通过由程序员将可以并行执行的一组指令描述为一单个发行组(issue group),这种发行组可以被并行执行。在这个说明书中,发行组的分隔符由“;;”指示。下面描述了符号例子。
(例子1)
mov r1,0x23;;
这个指令描述指示只有一个指令“mov”应该被执行。
(例子2)
mov r1,0x38
add r0,r1,r2
sub r3,r1,r2;;
这些指令描述指示三个指令“mov”、“add”和“sub”应该被并行执行。
指令控制单元10识别一个发行组并将其发送到译码单元20。译码单元20对发行组中的指令译码,并控制用于执行这样的指令所需的资源。
接着,对于在处理器1中包括的寄存器给出解释。
下面的表1列出了处理器1的一组寄存器。
[表1]
 寄存器名   位宽度   寄存器数   用法
 R0~R31   32位   32   通用寄存器。在执行运算指令时用作数据存储器指针、数据存储器等。
 TAR   32位   1   分支寄存器。用作在分支点的分支地址存储器。
 LR   32位   1   连接寄存器。
 SVR   16位   2   保存寄存器。用于保存条件标志(CFR)和各种模式。
 M0~M1(MH0:ML0~MH1~ML1)   64位   2   运算寄存器。在执行运算指令时用作数据存储器。
下面的表2列出了处理器1的一组标志(在后面描述的条件标志寄存器等中管理的标志)。
[表2]
  标志名   位宽度   标志数   用法
  C0~C7   1   8   条件标志。指示条件是否建立。
VC0~VC3   1   4   用于媒体处理扩充指令的条件标志。指示条件是否建立。
OVS   1   1   溢出标志。在运算时检测溢出。
CAS   1   1   进位标志。在运算时检测进位。
BPO   5   1   指定位位置。指定在执行屏蔽处理指令时要处理的位位置。
ALN   2   1   指定的字节对准。
FXP   1   1   定点运算模式。
UDR   32   1   未定义的寄存器。
图8是显示通用寄存器(R0~R31)30a的配置的示意图。通用寄存器(R0~R31)30a是构成一个要执行的任务的上下文的主要部分并存储数据或地址的一组32位寄存器。应该注意,通用寄存器R30和R31分别通过硬件用作全局指针和堆栈指针。
图9是显示连接寄存器(LR)30c的配置的示意图。与这个连接寄存器(LR)30c相连,处理器1还具有一个在图中未显示的保存寄存器(SVR)。连接寄存器(LR)30c是一个用于在函数调用时存储返回地址的32位寄存器。应该注意,保存寄存器(SVR)是一个用于在函数调用时保存条件标志寄存器的条件标志(CFR.CF)的16位寄存器。与在后面将解释的分支寄存器(TAR)的情况中一样,连接寄存器(LR)30c还被用于提高循环速度的目的。作为较低的1位总是读出0,但在写操作时必须写入0。
例如,在执行“调用”(brl,jmpl)指令时,处理器1将一个返回地址保存在连接寄存器(LR)30c中,并将一个条件标志(CFR.CF)保存在保存寄存器(SVR)中。在执行“jmp”指令时,处理器1从连接寄存器(LR)30c取出返回地址(分支目的地址),并返回一个程序计数器(PC)。此外,在执行“ret(jmpr)”指令时,处理器1从连接寄存器(LR)30c取出分支目的地址(返回地址),并将其存储到程序计数器(PC)。此外,处理器1从保存寄存器(SVR)取出条件标志,以便将其存储(再存入)到条件标志寄存器(CFR)32中的条件标志区域CFR.CF。
图10是显示分支寄存器(TAR)30d的配置的示意图。分支寄存器(TAR)30d是一个用于存储分支目标地址的32位寄存器,主要用于提高循环速度的目的。作为较低的1位总是读出0,但在写操作时必须写入0。
例如,当执行“jmp”和“jloop”指令时,处理器1从分支寄存器(TAR)30d取出一个分支目的地址,并将其存储在程序计数器(PC)中。当由存储在分支寄存器(TAR)30d中的地址所指示的指令被存储在分支指令缓冲器中时,分支损失(penalty)将为0。通过将一个循环的顶端地址存储在分支寄存器(TAR)30d中,可以实现循环速度的提高。
图11是显示程序状态寄存器(PSR)31的配置的示意图。程序状态寄存器(PSR)31构成一个要执行的任务的上下文的主要部分,是一个用于存储下面的处理器状态信息的的32位寄存器:
位SWE:指示VMP(虚拟多处理器)到LP(逻辑处理器)的切换是被允许还是禁止。“0”指示到LP的切换被禁止,“1”指示到LP的切换被允许。
位FXP:指示一个定点模式。“0”指示模式0(在其中在假设在MSB和从MSB开始的第一位之间有小数点的情况下执行一个算术运算的模式。此后,也称为“_1系统”),“1”指示模式1(在其中在假设在从MSB开始的第一位和从MSB开始的第二位之间有小数点的情况下执行一个算术运算的模式。此后,也称为“_2系统”)。
位IH:是一个中断处理标志,指示可屏蔽的中断处理是否是正在进行的。“1”指示有一个正在进行的中断处理,“0”指示没有正在进行的中断处理。在一个中断出现时这个标志被自动设置。这个标志用于对在程序中的处理器响应于“rti”指令而返回的一点处正在进行中断处理还是程序处理作出区分。
位EH:是一个指示错误或NMI是否正在被处理的标志。“0”指示错误/NMI中断处理不是正在进行的,“1”指示错误/NMI中断处理是正在进行的。如果在EH=1时出现不同步错误或NMI,这个标志被屏蔽。同时,当VMP被允许时,VMP的板切换被屏蔽。
位PL[1:0]:指示一个特权级。“00”指示特权级0,即处理器抽象级,“01”指示特权级1(不可设置),“10”指示特权级2,即系统程序级,“11”指示特权级3,即用户程序级。
位LPIE3:指示LP专用中断3是被允许还是禁止。“1”指示一个中断被允许,“0”指示一个中断被禁止。
位LPIE2:指示LP专用中断2是被允许还是禁止。“1”指示一个中断被允许,“0”指示一个中断被禁止。
位LPIE1:指示LP专用中断1是被允许还是禁止。“1”指示一个中断被允许,“0”指示一个中断被禁止。
位LPIE0:指示LP专用中断0是被允许还是禁止。“1”指示一个中断被允许,“0”指示一个中断被禁止。
位AEE:指示一个未对准异常是被允许还是禁止。“1”指示一个未对准异常被允许,“0”指示一个未对准异常被禁止。
位IE:指示一个级别中断是被允许还是禁止。“1”指示一个级别中断被允许,“0”指示一个电平中断被禁止。
位IM[7:0]:指示一个中断屏蔽,并且范围是从级0~7,每个都能够在其自己的级别被屏蔽。级0是最高级。在未由任何IM屏蔽的中断请求中,只有具有最高级别的中断请求被处理器1接受。当一个中断请求被接受时,在所接受的级别之下的级别被硬件自动屏蔽。IM[0]代表级0的屏蔽,IM[1]代表级1的屏蔽,IM[2]代表级2的屏蔽,IM[3]代表级3的屏蔽,IM[4]代表级4的屏蔽,IM[5]代表级5的屏蔽,IM[6]代表级6的屏蔽,IM[7]代表级7的屏蔽。
保留:指示一个保留位。总是读出0。在写入时必须写0。
图12是显示条件标志寄存器(CFR)32的配置的示意图。条件标志寄存器(CFR)32构成一个要执行的任务的上下文的主要部分,是一个由条件标志、运算标志、向量条件标志、运算指令位位置说明字段和SIMD数据对准信息字段组成的32位寄存器。
位ALN[1:0]:指示一个对准模式。设置“valnvc”指令的对准模式。
位BPO[4:0]:指示一个位位置。它用在需要位位置说明的指令中。
位VC0~VC3:是向量条件标志。从LSB侧上的一个字节或半个字开始到MSB侧,每个对应于从VC0到VC3的范围内的一个标志。
位OVS:是一个溢出标志(总计)。它是在饱和和溢出的检测基础上设置的。如果未检测到,保持在执行指令之前的一个值。这个标志的清除需要由软件实现。
位CAS:是一个进位标志(总计)。它当在“addc”指令下出现一个进位时或当在“subc”指令下出现一个借位时被设置。如果在“addc”指令下未出现进位时或在“subc”指令下未出现借位,保持在执行指令之前的一个值。这个标志的清除需要由软件实现。
位C0~C7:是条件标志,指示一个带有条件的执行指令中的条件(TRUE/FALSE)。带有条件的执行指令的条件和位C0~C7之间的对应关系由指令中包括的判定位来决定。应该注意,标志C7的值总是1。对标志C7作出的FALSE条件的反映(写入0)被忽略。
保留:指示一个保留位。总是读出0。在写入时必须写入0。
图13A和13B是显示累加器(M0,M1)30b的配置的示意图。这种累加器(M0,M1)30b构成一个要执行的任务的上下文的主要部分,由图13A所示的32位寄存器MHO-MH1(用于乘法和除法/乘积和(高32位)的寄存器)和图13B所示的32位寄存器MLO-ML1(用于乘法和除法/乘积和(低32位)的寄存器)组成。
寄存器MHO-MH1在一个乘法指令时用于存储运算结果的高32位,而在一个乘积和指令时用作累加器的高32位。此外,在处理一个位流的情况下,寄存器MHO-MH1可以与通用寄存器结合使用。同时,寄存器MLO-ML1在一个乘法指令时用于存储运算结果的低32位,而在一个乘积和指令时用作累加器的低32位。
图14是显示程序计数器(PC)33的配置的示意图。这个程序计数器(PC)33构成一个要执行的任务的上下文的主要部分,是一个保存要执行的指令的地址的32位计数器。
图15是显示PC保存寄存器(IPC)34的配置的示意图。这个PC保存寄存器(IPC)34构成一个要执行的任务的上下文的主要部分,是一个32位寄存器。
图16是显示PSR保存寄存器(IPSR)35的配置的示意图。这个PSR保存寄存器(IPSR)35构成一个要执行的任务的上下文的主要部分,是一个用于保存程序状态寄存器(PSR)31的32位寄存器。作为对应于一个保留位的一部分总是读出0,但在写入时必须写入0。
接着,对于处理器1的存储空间给出解释,这是依据本实施例的编译程序的目标。例如,在处理器1中,带有4GB容量的线性存储空间被分成32段,并将一个指令SRAM(静态RAM)和一个数据SRAM分配给128MB段。采用一个128MB段用作一个块,在SAR(SRAM区域寄存器)中设置要访问的目标块。当所访问的地址是SAR中设置的段时,对指令SRAM/数据SRAM作出直接访问,但当这样的地址不是在SAR中设置的段时,访问请求应该被发到总线控制器(BCU)。片上存储器(OCM)、外部存储器、外部设备、I/O端口等连接到BUC。从这些设备的数据读取和向这些设备的数据写入是可能的。
图17是显示处理器1的流水线行为的时序图,这是依据本实施例的编译程序的目标。如图所示,处理器1的流水线基本上包括下面五个阶段:指令取出;指令分配(调度);译码;执行和写入。
图18是显示在执行一个指令时的处理器1的流水线行为的每个阶段的时序图。在指令取出阶段,对由程序计数器(PC)33所指定的地址所指示的指令存储器作出访问,并将指令传送到指令缓冲器10c~10e等。在指令分配阶段,实现响应于分支指令的分支目的地址信息的输出、输入寄存器控制信号的输出、可变长度指令的分配,随后将指令传送到指令寄存器(IR)。在译码阶段,将IR输入到译码单元20,并输出一个运算单元控制信号和一个存储器访问信号。在执行阶段,执行一个运算,运算的结果被输出到数据存储器或通用寄存器(R0~R31)30a。在写入阶段,将作为数据传送的结果而获得的值以及运算结果存储在通用寄存器中。
作为依据本实施例的编译程序的目标的处理器1的VLIW结构允许在最多三个数据元素上并行执行上面的处理。因此,处理器1以图19所示的定时并行执行图18所示的行为。
接着,对于由具有上述配置的处理器1执行的一组指令给出解释。
表3~5列出了要由作为依据本实施例的编译程序的目标的处理器1执行的分类的指令。
[表3]
  类别   运算单元   指令运算代码
  存储器传送指令(装入)   M   ld,ldh,ldhu,ldb,ldbu,ldp,ldhp,ldbp,ldbh,ldbuh,ldbhp,ldbuhp
  存储器传送指令(存储)   M   st,sth,stb,stp,sthp,stbp,stbh,stbhp
  存储器传送指令(其它)   M   dpref,ldstb
  外部寄存器传送指令   M   rd,rde,wt,wte
  分支指令   B   br,brl,call,jmp,jmpl,jmpr,ret,jmpf,jloop,setbb,setlr,settar
  软件中断指令   B   rti,pi0,pi0l,pi1,pi1l,pi2,pi2l,pi3,pi3l,pi4,pi4l,pi5,pi5l,pi6,pi6l,pi7,pi7l,sc0,sc1,sc2,sc3,sc4,sc5,sc6,sc7
  VMP/中断控制指令   B   intd,inte,vmpsleep,vmpsus,vmpswd,vmpswe,vmpwait
  算术运算指令   A   abs,absvh,absvw,add,addarvw,addc,addmsk,adds,addsr,addu,addvh,addvw,neg,negvh,negvw,rsub,s1add,s2add,sub,subc,submsk,subs,subvh,subvw,max,min
  逻辑运算指令   A   and,andn,or,sethi,xor,not
  比较指令   A   cmpCC,cmpCCa,cmpCCn,cmpCCo,tstn,tstna,tstnn,tstno,tstz,tstza,tstzn,tstzo
 类别   运算单元   指令运算代码
 移动指令   A   mov,movcf,mvclcas,mvclovs,setlo,vcchk
 NOP指令   A   nop
 移位指令1   S1   asl,aslvh,aslvw,asr,asrvh,asrvw,lsl,lsr,rol,ror
 移位指令2   S2   aslp,aslpvw,asrp,asrpvw,lslp,lsrp
[表4]
  类别   运算单元   指令运算代码
  提取指令   S2   ext,extb,extbu,exth,exthu,extr,extru,extu
  屏蔽指令   C   msk,mskgen
  饱和指令   C   sat12,sat9,satb,satbu,sath,satw
  变换指令   C   valn,valn1,valn2,valn3,valnvc1,valnvc2,valnvc3,valnvc4,vhpkb,vhpkh,vhunpkb,bhunpkh,vintlhb,vintlhh,bintllb,vintllh,vlpkb,vlpkbu,vlpkh,vlpkhu,vlunpkb,vlunpkbu,vlunpkh,vlunpkhu,vstovb,vstovh,vunpk1,vunpk2,vxchngh,vexth
  位计数指令   C   bcnt1,bseq,bseq0,bseq1
  其它   C   byterev,extw,mskbrvb,mskbrvh,rndvh,movp
  类别   运算单元   指令运算代码
  乘法指令1   X1   fmulhh,fmulhhr,fmulhw,fmulhww,hmul,lmul
  乘法指令2   X2   fmulww,mul,mulu
  乘积和指令1   X1   fmachh,fmachhr,fmachw,fmachww,hmac,lmac
  乘积和指令2   X2   fmacww,mac
  乘积差指令1   X1   fmsuhh,fmsuhhr,fmsuhw,fmsuww,hmsu,lmsu
  乘积差指令2   X2   fmsuww,msu
  除法指令   DIV   div,divu
  调试程序指令   DBGM   dbgm0,dbgm1,dbgm2,dbgm3
[表5]
  类别   运算单元   指令运算代码
  SIMD算术运算指令   A   vabshvh,vaddb,vaddh,vaddhvc,vaddhvh,vaddrhvc,vaddsb,vaddsh,vaddsrb,vaddsrh,vasubb,vcchk,vhaddh,vhaddhvh,vhsubh,vhsubhvh,vladdh,vladdhvh,vlsubh,vlsubhvh,vnegb,vnegh,vneghvh,vsaddb,vsaddh,vsgnh,vsrsubb,vsrsubh,vssubb,vssubh,vsubb,vsubh,vsubhvh,
  类别   运算单元  指令运算代码
 vsubsh,vsumh,vsumh2,vsumrh2,vxaddh,vxaddhvh,vxsubh,vxsubhvh,vmaxb,vmaxh,vminb,vminh,vmovt,vsel
  SIMD比较指令   A  vcmpeqb,vcmpeqh,vcmpgeb,vcmpgeh,vcmpgtb,vcmpgth,vcmpleb,vcmpleh,vcmpltb,vcmplth,vcmpneb,vcmpneh,vscmpeqb,vscmpeqh,vscmpgeb,vscmpgeh,vscmpgtb,vscmpgth,vscmpleb,vscmpleh,vscmpltb,vscmplth,vscmpneb,vscmpneh
  SIMD移位指令1   S1  vaslb,vaslh,vaslvh,vasrb,vasrh,vasrvh,vlslb,vlslh,vlsrb,vlsrh,vrolb,vrolh,vrorb,vrorh
  SIMD移位指令2   S2  vasl,vaslvw,vasr,vasrvw,vlsl,vlsr
  SIMD饱和指令   C  vsath,vsath12,vsath8,vsath8u,vsath9
  其它SIMD指令   C  vabssumb,vrndvh
  SIMD乘法指令   X2  vfmulh,vfmulhr,vfmulw,vhfmulh,vhfmulhr,vhfmulw,vhmul,vlfmulh,vlfmulhr,vlfmulw,vlmul,vmul,vpfmulhww,vxfmulh,vxfmulhr,vxfmulw,vxmul
  SIMD乘积和指令   X2  vfmach,vfmachr,vfmacw,vhfmach,vhfmachr,vhfmacw,vhmac,vlfmach,vlfmachr,vlfmacw,vlmac,vmac,vpfmachww,vxfmach,vxfmachr,vxfmacw,vxmac
  类别   运算单元   指令运算代码
  SIMD乘积差指令   X2   vfmsuh,vfmsuw,vhfmsuh,vhfmsuw,vhmsu,vlfmsuh,vlfmsuw,vlmsu,vmsu,vxfmsuh,vsfmsuw,vxmsu
应该注意,上面的表中的“运算单元”指的是用在各个指令中的运算单元。更具体地,“A”代表ALU指令,“B”代表分支指令,“C”代表变换指令,“DIV”代表除法指令,“DBGM”代表调试指令,“M”代表存储器访问指令,“S1”和“S2”代表移位指令,“X1”和“X2”代表乘法指令。
图20是显示由处理器1执行的指令的格式的示意图。
下面描述图中的首字母缩写词代表什么含义:“P”是判定(执行条件:指定八个条件标志C0~C7中的一个);“OP”是运算代码字段;“R”是寄存器字段;“I”是立即字段;“D”是位移字段。
图21~36是解释由处理器1执行的指令的概略功能的示意图。更具体地,图21解释一个属于类别“ALUadd(加法)系统”的指令;图22解释一个属于类别“ALUsub(减法)系统”的指令;图23解释一个属于类别“ALUlogic(逻辑运算)系统等”的指令;图24解释一个属于类别“CMP(比较运算)系统”的指令;图25解释一个属于类别“mul(乘法)系统”的指令;图26解释一个属于类别“mac(乘积和运算)系统”的指令;图27解释一个属于类别“msu(乘积差)系统”的指令;图28解释一个属于类别“MEMld(从存储器装入)系统”的指令;图29解释一个属于类别“MEMstore(存储在存储器中)系统”的指令;图30解释一个属于类别“BRA(分支)系统”的指令;图31解释一个属于类别“BSasl(算术桶形移位)系统等”的指令;图32解释一个属于类别“BSasl(逻辑桶形移位)系统等”的指令;图33解释一个属于类别“CNVvaln(算术变换)系统”的指令;图34解释一个属于类别“CNV(普通变换)系统”的指令;图35解释一个属于类别“SATvlpk(饱和处理)系统”的指令;图36解释一个属于类别“ETC(等等)系统”的指令。
图20是显示由处理器1执行的指令的格式的示意图。
下面描述图中的首字母缩写词代表什么含义:“P”是判定(执行条件:指定八个条件标志C0~C7中的一个);“OP”是运算代码字段;“R”是寄存器字段;“I”是立即字段;“D”是位移字段。
图21~36是解释由处理器1执行的指令的概略功能的示意图。更具体地,图21解释一个属于类别“ALUadd(加法)系统”的指令;图22解释一个属于类别“ALUsub(减法)系统”的指令;图23解释一个属于类别“ALUlogic(逻辑运算)系统等”的指令;图24解释一个属于类别“CMP(比较运算)系统”的指令;图25解释一个属于类别“mul(乘法)系统”的指令;图26解释一个属于类别“mac(乘积和运算)系统”的指令;图27解释一个属于类别“msu(乘积差)系统”的指令;图28解释一个属于类别“MEMld(从存储器装入)系统”的指令;图29解释一个属于类别“MEMstore(存储在存储器中)系统”的指令;图30解释一个属于类别“BRA(分支)系统”的指令;图31解释一个属于类别“BSasl(算术桶形移位)系统等”的指令;图32解释一个属于类别“BSasl(逻辑桶形移位)系统等”的指令;图33解释一个属于类别“CNVvaln(算术变换)系统”的指令;图34解释一个属于类别“CNV(普通变换)系统”的指令;图35解释一个属于类别“SATvlpk(饱和处理)系统”的指令;图36解释一个属于类别“ETC(等等)系统”的指令。
下面描述这些图中的每列的含义:“SIMD”指示一个指令的类型(在SISD(SINGLE)和SIMD之间区分);“大小”指示要作为运算目标的单个运算数的大小;“指令”指示一个运算的运算代码;“运算数”指示一个指令的运算数;“CFR”指示条件标志寄存器中的改变;“PSR”指示处理器状态寄存器中的改变;“典型行为”指示一个行为的概述;“运算单元”指示一个要使用的运算单元;以及,“3116”指示一个指令的大小。
下面解释涉及用在后面将描述的具体例子中的主要指令的处理器1的行为。
andn Rc,Ra,Rb
实现Ra和Rb之间的反转逻辑AND并将其存储在Rc中。
asl Rb,Ra,I5
执行向Ra左移立即值(I5)中的位数的算术移位。
and Rb,Ra,I8
实现Ra和值(I8)之间的逻辑AND并将其存储在Rb中。
bseq0 Rb,Ra
对从Ra的MSB开始的连续的0计数并将其存储在Rb中。
bseq1 Rb,Ra
对从Ra的MSB开始的连续的1计数并将其存储在Rb中。
bseq Rb,Ra
对从Ra的MSB之下1位开始的连续的符号位计数并将其存储在Rb中。当Ra是0时,输出0。
bcnt1 Rb,Ra
对Ra的1的个数计数并将其存储在Rb中。
extr Rc,Ra,Rb
由Rb指定一个位的位置,提取Ra的内容一部分,符号扩展并将其存储在Rc中。
extru Rc,Ra,Rb
由Rb指定一个位的位置,提取Ra的内容一部分,不带符号扩展地将其存储在Rc中。
fmulhh Mm,Rc,Ra,Rb
将Ra、Rb和Rc作为16位值来处理,将Mm(用于乘法的累加数)作为32位值来处理。将Ra和Rb与一定点相乘。将结果存储在Mm和Rc中。当结果不能由有符号的32位表示时,使其饱和。
fmulhw Mm,Rc,Ra,Rb
将Ra和Rb作为16位值来处理,将Mm和Rc作为32位值来处理。通过一定点将Ra和Rb相乘。将结果存储在Mm和Rc中。当结果不能由有符号的32位表示时,使其饱和。
mul Mm,Rc,Ra,Rb
将Ra和Rb与一整数相乘。将结果存储在Mm和Rc中。
mac Mm,Rc,Ra,Rb,Mn
将Ra和Rb与一整数相乘并将其加到Mn。将结果存储在Mm和Rc中。
mov Rb,Ra
将Ra传送到Rb。
or Rc,Ra,Rb
实现Ra和Rb之间的逻辑OR并将其存储在Rc中。
rde C0:C1,Rb,(Ra)
让Ra是一个外部寄存器数,将外部寄存器的值读入Rb。将读取的成功和失败分别输出到C0和C1(条件标志)。在失败的情况下,出现一个扩展寄存器错误的异常。
wte C0:C1,(Ra),Rb
让Ra是一个外部寄存器数,将Rb的值写入外部寄存器。将写入的成功和失败分别输出到C0和C1。在失败的情况下,出现一个扩展寄存器错误的异常。
vaddh Rc,Ra,Rb
以半个字向量格式对待每个寄存器。将Ra和Rb相加(SIMD直接)。
(一个编译程序)
接着,解释依据本实施例的、其目标是上述处理器1的一个编译程序。
图37是显示依据本实施例的编译程序100的配置的功能方框图。这个编译程序100是一个将以诸如C/C++语言的高级程序语言描述的源程序101翻译成其目标处理器是上述处理器1的机器语言程序105的交叉编译程序,由一个在诸如个人计算机的计算机上执行的程序实现,并主要被分成并带有分析程序单元110、中间编码变换单元120、优化单元130和代码产生单元140。
应该注意,有效地产生专用于上面提到的处理器1的专用指令的主文件(运算符定义文件102和内置函数定义文件103)在当前编译程序100中是准备好的。用户可以通过将这些主文件包括在源程序101中来获取为处理器1专门做(优化)的机器语言程序105。
如图38到图68中的清单例子所示,运算符定义文件102是一个定义了定义以定点和SIMD类型数据为目标的运算符的类的主文件。在该主文件中,图38~图40是定义了一个其目标主要是模式0(1系统)的16位定点的数据的运算符的部分的清单;图41和图42是定义了一个其目标主要是模式0(1系统)的32位定点的数据的运算符的部分的清单;图43~图45是定义了一个其目标主要是模式1(2系统)的16位定点的数据的运算符的部分的清单;图45~图47是其目标主要是模式1(2系统)的32位定点的数据的运算符的部分的清单;图48~图68是定义了其他函数的部分的清单。
如图69~图72中的清单例子所示,内置函数定义文件103是一个定义了执行各种运算来以专用于处理器1的机器语言指令代替函数的函数的主文件。在该主文件中,图69~图71是定义了一个以一个机器语言指令代替函数的函数的部分的清单;图72是定义了一个以两个或更多机器语言指令(机器语言指令序列)代替函数的函数的部分的清单。
应该注意,这些定义文件102和103中的asm(...){...}(...)是一个被称为优化asm的内置汇编程序指令,其处理如下。换句话说,优化asm语句的描述格式是
asm(《装入表达式的清单》){
《优化控制信息》
《指令指定单元》
}(《存储表达式的清单》);。
这里,“装入表达式的清单”是一个描述装入表达式的部分;“装入表达式”是一个存储C语言中的变量和诸如四个运算的表达式的结果的表达式;它被描述为类似“寄存器指定标识符=赋值表达式”;以及,它意味着在右边指示的值被传送到在左边指示的标识符。“存储表达式的清单”是一个描述存储表达式的部分;“存储表达式”被描述为类似“单项式=寄存器指定标识符”;以及,它意味着将左边的由单项式表示的值赋给由寄存器指定标识符表示的寄存器的值。
分析程序单元110是一个提取保留字(关键字)等的前处理单元;实现作为编译的目标的(包含要包括的主文件的)源程序101的词汇分析;以及,除了普通编译程序具有的分析函数之外,还具有一个支持在定点上的模式的切换的定点模式切换单元111。当定点模式切换单元111在源程序101中检测到一个保存和恢复定点模式的编译指示说明(例如,“pragma_save_fxpmode func”)时,它产生一个保存和恢复处理器1的PSR31的位FXP的机器语言指令。这实现了定点的模式0和模式1中的运算混合的程序设计。
应该注意,“编译指示(或编译指示说明)”是用户可以在源程序101中任意指定(放置)的对编译程序100的指示,是以“#pragma”开始的字符序列。
中间编码变换单元120是一个将从分析程序单元110传送的源程序101中的每个语句变换到中间编码的处理单元,由中间编码产生单元121和机器语言指令替代单元122组成。中间编码产生单元121根据一个预定规则变换源程序101中的每个语句。这里,中间编码典型地是以函数调用的格式表示的代码(例如,指示“+(int a,int b)”;指示“将一个整数a加到整数b”的代码)。但中间编码不仅包含具有函数调用格式的代码,还包含处理器1的机器语言指令。
机器语言指令替代单元122将由中间编码产生单元121产生的中间编码中的具有函数调用格式的中间编码变换成引用运算符定义文件102和内置函数定义文件103的对应的机器语言指令(或机器语言指令序列),将匹配由这些定义文件或内置函数定义的运算符(包括运算的目标数据的类型)的中间编码变换成遵循(follow)机器语言指令替代单元122在其自身内部具有的一个替代表122a或由这些定义文件定义的汇编程序指令变换成对应的机器语言指令(或机器语言指令序列),并将变换的机器语言指令输出到优化单元130。这允许优化单元130对这些中间编码执行各种优化,因为它们不是以内置函数的格式而是以机器语言指令的格式传到优化单元130。
附带地,替代表122a是一个存储对应于事先保留的运算符的运算和函数的机器语言指令(机器语言指令序列)的表。另外,机器语言指令替代单元22输出来自从中间编码产生单元121传送的中间编码的机器语言指令而不经过优化单元130。
优化单元130是一个处理单元,通过执行诸如合并指令、去除冗余、分类指令和分配寄存器的处理,对来自从中间编码变换单元120输出的中间编码的机器语言指令执行由用户选择的下面提到的三种类型的优化中的一种:(1)提高执行速度具有更高优先级的优化;(2)减小代码大小具有更高优先级的优化;以及(3)提高执行速度和减小代码大小的优化。优化单元130具有一个除了普通优化之外还执行对本编译程序100的特有优化(例如“循环展开”、“如果变换”和“成对存储器访问指令的产生”)的处理单元(变元优化单元131、类型变换优化单元132和等待时间优化单元133)。
变元优化单元131是一个根据内置函数(例如,extr,extru)的变元产生适当的指令或序列(算法)的处理单元。例如,当所有变元是常数时,变元优化单元131产生其运算数是通过保持在常数而获得的常数值的机器语言指令;当变元的一部分是常数时,产生其运算数是立即值的机器语言指令;当所有变元是变量时,产生其运算数是寄存器的一个指令序列。
类型变换优化单元132是一个基于在源程序101中的一个特定记号使得在不同类型之间的运算更有效的处理单元。例如,当希望一个16位数据和另一个16位数据的乘法结果被保持为一个32位数据时,如果在源程序101中有特定记号,类型变换优化单元132产生一个以这样一种类型的变换执行乘法的机器语言指令(“fmulhw”等)。
等待时间优化单元133基于在源程序101中结合的一个汇编程序指令中的关于等待时间的指示(周期数的指定),对准机器语言指令,以便一特定部分或一特定行动只花费指定周期数的执行时间。这使得一个程序员不必要完成他插入所需数目的“nop(空操作)”指令的常规工作,并使得能够通过插入其他机器语言指令而不是“nop”指令来执行优化。
附带地,“循环展开”是通过扩展循环的迭代(重复)并产生一对存储器访问指令(ldp/stp/ldhp/sthp等)以便同时执行多个迭代来提高并行执行循环的可能性的优化。另外,“如果转换”是通过为一个带有条件的执行机制产生一个指令(只有在指令中包括的条件(判定)匹配处理器1的状态(条件标志)时才执行的指令)来去除分支结构的优化。此外,“一对存储器访问指令的产生”是以一对寄存器(两个连续的寄存器)作为目标产生所述一对存储器访问指令(ldp/stp/ldhp/sthp等)的优化。
此外,优化单元130输出来自函数调用格式的中间编码的、不能被扩展的中间编码,而不经过代码产生单元140,因为不可能在上述机器语言指令级执行优化处理。
代码产生单元140参考内部保存的翻译表等产生机器语言程序105,代替从优化单元130输出的所有中间编码(包括函数调用格式的代码和优化的机器语言指令)。
接着,解释指示具体例子的如上所述配置的编译程序100的特征行为。
图73是显示机器语言指令替代单元122的行为的流程图。机器语言指令替代单元122重复下面的过程:(1)判断来自由中间编码产生单元121产生的中间编码的函数调用格式的代码是否匹配由运算符定义文件102定义的运算符(包括运算目标的数据类型)和由内置函数定义文件103定义的函数(步骤S102),以及,当它们匹配时(在步骤S102为是),(2)遵循由机器语言指令替代单元122a在其自身内部具有的替代表122a定义的汇编程序指令和这些定义文件102和103(步骤S100~S103),用机器语言指令替代运算符和函数(步骤S102)。
更具体地,不同类型之间的类型变换的隐含规则等由运算符定义文件102的定义(由构造符的定义)来规定;定义了下面四种类型的定点:
“FIX16_1”:有符号的16位,小数点在第14位和第15位(MSB)之间,
“FIX16_2”:有符号的16位,小数点在第13位和第14位之间,
“FIX32_1”:有符号的32位,小数点在第30位和第31位(MSB)之间,
“FIX32_2”:有符号的32位,小数点在第29位和第30位之间。因此,机器语言指令替代单元122例如将一个源程序
FIX16_1a,b,c;
c=a*b;
用一个机器语言指令
fmulhh m0,Rc,Ra,Rb(定点乘法运算指令)来替代。
因此,用户可以声明四种类型FIX16_1、FIX16_2、FIX32_1和FIX32_2与一个普通编译程序的标准类型类似并使用它们。然后,产生的包括相邻代码的机器语言指令变为优化单元130中的诸如合并指令、去除冗余、分类指令和分配寄存器的优化的目标,并且可以被优化。
类似地,不同类型之间的类型转换的隐含规则等由运算符定义文件102的定义(由构造符的定义)来规定;定义了下面四种类型的SIMD指令:
“VINT8×4”;4个并行的8位整数数据,
“VINT16×2”;2个并行的16位整数数据,
“VFIX161×2”;2个并行的模式0(_1系统)的16位定点数据,以及
“VFIX162×2”;2个并行的模式1(_2系统)的16位定点数据。因此,机器语言指令替代单元122例如将一个源程序
VINT16×2a,b,c;
c=a+b;
用一个机器语言指令
vaddh Rc,Ra,Rb(SIMD加法指令)替代。
从而,用户可以声明四种类型“VINT8×4”、“VINT16×2”、“VFIX161×2”和“VFIX162×2”与一个普通编译程序的标准类型类似并使用它们。然后,产生的包括相邻代码的机器语言指令变为优化单元130中的诸如合并指令、去除冗余、分类指令和分配寄存器的优化的目标,并且可以被优化。
另外,在内置函数定义文件103中,定义一个可以使用处理器1执行的高级指令的函数(例如,“_abs(a)”等)及其对应的高级指令(例如,一个机器语言指令“abs Rb,Ra”等)。因此,机器语言指令替代单元122例如将一个源程序
b=_abs(a);
用一个机器语言指令
abs Rb,Ra来替代。
从而,用户可以通过不以C++语言和汇编程序指令生成而是仅仅调用一个实现准备好的内置函数来实现一个复杂处理。然后,产生的包括相邻代码的机器语言指令变为优化单元130中的诸如合并指令、去除冗余、分类指令和分配寄存器的优化的目标,并且可以被优化。
类似地,在内置函数定义文件103中,定义一个可以使用处理器1执行的高级指令的函数(例如,“_div(a,b)”等)及其对应的高级指令(例如,一个机器语言指令序列“extw,aslp,div”等)。因此,机器语言指令替代单元122例如将一个源程序
c=_div(a,b);
用一个机器语言指令序列
extw Mn,Rc,Ra
aslp Mn,Rc,Mn,Rc,15
div MHm,Rc,MHn,Rc,Rb.
来替代。
从而,用户可以通过不以C++语言和汇编程序指令生成而是仅仅调用一个实现准备好的内置函数来实现一个复杂处理。然后,产生的包括相邻代码的机器语言指令变为优化单元130中的诸如合并指令、去除冗余、分类指令和分配寄存器的优化的目标,并且可以被优化。
应该注意,在内置函数定义文件103中列出的内置函数中,(1)被变换成一个机器语言指令的函数,(2)被变换成两个或更多机器语言指令(一个机器语言指令序列)的函数,以及(3)可以指定不是寄存器分配的目标的资源(例如累加器)的函数的代表性例子如下:
(1)被变换成一个机器语言指令的内置函数
“_bseq1(x)”:
这是检测从输入的MSB开始有多少个连续的位0的函数。其格式如下:
int_bseq1(FIX16_1val)//count 1
int_bseq1(FIX16_2val)//count 1
int_bseq1(FIX32_1val)//count 1
int_bseq1(FIX32_2val)//count 1
这些函数返回在要计数的“val”中的连续的0的个数(位数)的值。对应于这些函数的机器语言指令被定义在内置函数定义文件103中。
“_bseq0(x)”:
这是检测从输入的MSB开始有多少个连续的位0的函数。其格式如下:
int_bseq0(FIX16_1val)//count 0
int_bseq0(FIX16_2val)//count 0
int_bseq0(FIX32_1val)//count 0
int_bseq0(FIX32_2val)//count 0
这些函数返回在要计数的“val”中的连续的0的个数(位数)的值。对应于这些函数的机器语言指令被定义在内置函数定义文件103中。
“_bseq1(x)”:
这是检测从输入的MSB开始有多少个连续的位1的函数。其格式如下:
int_bseq1(FIX16_1val)//count 1
int_bseq1(FIX16_2val)//count 1
int_bseq1(FIX32_1val)//count 1
int_bseq1(FIX32_2val)//count 1
这些函数返回在要计数的“val”中的连续的1的个数(位数)的值。对应于这些函数的机器语言指令被定义在内置函数定义文件103中。
“_bseq(x)”:
这是检测从输入的MSB的下一位开始有多少个连续的与MSB具有相同值的位的函数。其格式如下:
int_bseq(FIX16_1val)
int_bseq(FIX16_2val)
int_bseq(FIX32_1val)
int_bseq(FIX32_2val)
这些函数返回“val”中的标准化的位的个数。对应于这些函数的机器语言指令被定义在内置函数定义文件103中。
“_bcnt1(x)”:
这是检测在输入的所有位中包括多少位1的函数。其格式如下:
int_bcnt1(FIX16_1val)
int_bcnt1(FIX16_2val)
int_bcnt1(FIX32_1val)
int_bcnt1(FIX32_2val)
这些函数返回在要计数的“val”中的1的个数的值。对应于这些函数的机器语言指令被定义在内置函数定义文件103中。
“_extr(a,i1,i2)”:
这是提取输入的预定位位置并进行符号扩展的函数。其格式如下:
int_extr(FIX16_1val1,int val2,int val3)
int_extr(FIX16_2val1,int val2,int val3)
int_extr(FIX32_1val1,int val2,int val3)
int_extr(FIX32_2val1,int val2,int val3)
这些函数返回从位位置val2到位位置val3所指示的val1的位字段被提取和符号扩展的结果。对应于这些函数的机器语言指令被定义在内置函数定义文件103中。
“_extru(a,i1,i2)”:
这是提取输入的预定位位置并进行零扩展的函数。其格式如下:
unsigned int_extru(FIX16_1val,int val2,int val3)
unsigned int_extru(FIX16_2val,int val2,int val3)
unsigned int_extru(FIX32_1val,int val2,int val3)
unsigned int_extru(FIX32_2val,int val2,int val3)
这些函数返回从位位置val2到位位置val3所指示的val1的位字段被提取和零扩展的结果。对应于这些函数的机器语言指令被定义在内置函数定义文件103中。
(2)被变换成两个或更多机器语言指令(一个机器语言指令序列)的内置函数
“_modulo_add()”:
这是执行模数寻址的地址更新的函数。其格式如下:
_modulo_add(void*addr,int imm,int mask,size_t size,void*base)
这里,每个变元的含义如下:
addr:更新之前的地址或低位地址(模数部分)
imm:相加值(数据的个数)
mask:屏蔽的宽度(模数的宽度)
size:数据的大小(2的幂)
base:基地址(阵列的首部地址)
这个函数返回由模数寻址只从地址addr加上相加值imm的结果。
对应于这个函数的机器语言指令被定义在内置函数定义文件103中。换句话说,这个函数使用用第二输入的预定位字段替代第一输入的预定位字段的指令(addmsk)来计算模数寻址。一个用法例子如下:
int array[MODULO];
p=array;
for(i=0;i<100;i++){
*q++=*p;
p=(int*)_modulo_add(p,1,N,sizeof(int),array);
}
这里,变量MODULO是2的幂(2^N)。在这个用法例子中,阵列的100个单元由MODULO*SIZE字节的对准来定位。
“_brev_add()”:
这是执行位反转寻址的地址更新的函数。其格式如下:
_brev_add(void*addr,int cnt,int imm,int mask,size_t size,void*base)
这里,每个变元的含义如下:
addr:更新之前的地址
cnt:位反转计数器
mm:相加值(数据的个数)
mask:屏蔽的宽度(反转的宽度)
size:数据的大小(2的幂)
base:基地址(阵列的首部地址)
这个函数返回由位反转寻址只从对应于位反转计数器cnt的地址addr加上相加值mm的结果。
对应于这个函数的机器语言指令被定义在内置函数定义文件103中。换句话说,这个函数使用执行到第一输入的预定位字段的逐位的位置反转的指令(mskbrvh)来计算位反转寻址。一个用法例子如下:
int array[BREV];
p=array;
for(i=0;i<100;i++){
*q++=*p;
p=(int*)_brev_add(p,i,1,N,sizeof(int),array);
}
这里,变量BREV是2的幂(2^N)。在这个用法例子中,阵列的100个单元用BREV*SIZE字节的对准来定位。
(3)可以指定不是寄存器分配的目标的资源(例如累加器)的函数
在内置函数定义文件103中,除了作为优化中的寄存器分配的目标资源的通用寄存器之外,还准备了(i)是更新不是寄存器分配的目标(是隐含资源)的累加器的运算(乘法和乘积和运算)的以及(ii)可以用一个累加器作为基准类型指定一个临时变量的内置函数(乘法:“_mul”和乘积和运算:“_mac”)。具体格式分别如下:
_mul(long &mh,long &ml,FIX16_1 &c,FIX16_1a,FIX16_1b);
这个函数将变量a和变量b一起相乘,将作为结果的64位数据的高32位设置到用于乘法的高位累加器MH,将64位数据的低32位设置到用于乘法ML的低位累加器ML,并且,进一步,将组合累加器MH的低16位和累加器ML的高16位的32位数据设置到变量c。
_mac(long &mh,long &ml,FIX16_1 &c,FIX16_1a,FIX16_1b);
这个函数将用于乘法的高位累加器MH和用于乘法的低位累加器ML的64位数据与通过将变量a和变量b相乘而获得的结果相加,并将作为结果的64位数据的高32位设置到用于乘法的高位累加器MH,将64位数据的低32位设置到用于乘法ML的低位累加器ML,并且,进一步,将组合累加器MH的低16位和累加器ML的高16位的32位数据设置到变量c。
一个用法例子如下:
机器语言指令替代单元122遵循在内置函数定义文件103中的定义将下面的源程序
long mh,ml;
_mul(mh,ml,dummy,a,b);
_mac(mh,ml,e,c,d);
用下面的机器语言指令
mul m0,Rx,Ra,Rb
mov r0,mh0
mov r1,mh1
mov mh0,r0
mov mh1,r1
mac m0,Re,Rc,Rd,m0
来替代。
应该注意,在上面提到的机器语言指令序列中,第一到第三行对应于函数_mul,第四到第六行对应于函数_mac。通过在优化单元130中去除冗余来删除象这样的第二到第五行机器语言指令序列,机器语言指令被优化到下面的机器语言指令序列
mul m0,Rx,Ra,Rb
mac m0,Re,Rc,Rd,m0。
如上所述,当使用可以指定不是寄存器分配的目标的资源(例如累加器)的函数时,通过编译程序(优化单元130)内的优化删除一组定义(值的存储)和使用(对该值的引用)是非常可能的,因此,象这样的内置函数在优化方面也是有效的。
接着,解释本编译程序100的特征行为中的优化单元130的行为。
图74是显示优化单元130的变元优化单元131的行为的流程图。为了依赖变元产生一个合适的指令或一个合适的序列(算法),变元优化单元131产生:
(1)当所有函数变元是常数时(步骤S110的左边),使用通过在下面设置的常数中折叠(fold)而获得的常数值作为运算数的机器语言指令(步骤S111);
(2)当变元的一部分是常数时(步骤S110的中间),立即值运算数的机器语言指令(步骤112);以及
(3)当所有变元是变量时(步骤S110的右边),寄存器运算数的机器语言指令序列(步骤113)。
例如,当所有变元是常数时,象
d=_extru(0xfff,7,4);
产生一个具有通过在常数中折叠而获得的常数值的机器语言指令,象
mov Rd,oxf。
另一方面,当变元的一部分是常数时,象
d=_extru(a,7,4);
产生一个立即运算数的机器语言指令,象
extru Rd,Ra,7,4。
进一步,当所有变元是变量时,象
d=_extru(a,b,c);
产生一个机器语言指令序列,象
aslRe,Rb,8
andRf,Rc,0x1f
orRg,Re,Rf
extruRd,Ra,Rg。
如刚才所描述的,从一个内置函数,不总是固定地产生相同的机器语言指令,而是由变元优化单元131产生依赖于变元性质而优化的机器语言指令(或机器语言指令序列)。
图75是显示一个算术树以解释优化单元130的类型变换优化单元132的行为的示意图。类型变换优化单元132对源程序中的特定记号的运算产生一个带有类型变换的机器语言指令(诸如fmulhw),以执行不同类型之间的有效运算。
在普通C语言中,16位×16位的结果的类型是16位。存在16位×16位→32位的指令,但如下所述产生两个不同的机器语言指令。例如,对于
f32=f16*f16;的描述,
产生两个指令:
fmulhh//16bit×16bit->16bit
asl//16bit->32bit的类型变换
因此,当在源程序中描述(FIX32)16位*(FIX32)16位时,类型变换优化单元132平常产生如图75A所示的算术树(产生类型变换的线-cord),但通过将这个算术树变换成图75B中所示的算术树产生一个16位×16位→32位的指令(fmulhw)。
图76是显示一个采样程序的例子以解释等待时间优化单元133的行为的示意图。等待优化单元133基于一个关于在源程序101中建立的汇编程序指令(优化的asm语句)中的等待时间(周期数的指定)的命令执行对机器语言指令的时间调度(schedule),以便在特定部分中的行为或特定行为中只花费指定周期数的执行时间。
用户可以用两种类型的指定方法设置等待时间。
一种方法是指定附连在特定指令上的标号之间的等待时间,就象图76A所示的程序中的指定(LATENCY L1,L2,2;)。在图76A的例子中,等待时间优化单元133执行对机器语言指令序列的分配的时间调度,以使得从处理器1执行指令wte开始直到执行指令rde只经过2个周期。
另一种方法是指定在访问扩展寄存器单元80的指令(rd,wt,rde,wte)上的直到指令下一次访问扩展寄存器单元80的等待时间,就象图76B所示的程序中的指定(指令wte内的LATENCY(2))。在图76B的例子中,等待时间优化单元133执行对机器语言指令序列的分配的时间调度,以便从处理器1执行指令wte和访问扩展存储器单元80开始直到再次访问扩展存储器单元80只经过2个周期。
采用象这样的等待时间的配置,可以在已经被成行(in-line)扩展的代码和还未被成行扩展的代码之间执行优化(合并指令,去除冗余,分类指令和分配寄存器),并保证所指定的指令或访问的等待时间。换句话说,常规上,用户必须明确地插入一个nop指令,而当用户使用编译程序100时,他所必须做的只是为一个必要的指令或一个必要的访问指定一个必要的等待时间。
图77是解释分析程序单元110的定点模式切换单元111的行为的示意图。
当定点模式切换单元111在源程序101中检测到一个编译指示来保存和返回定点模式(例如,“#pragma_save_fxpmode func”)时,定点模式切换单元111产生一个机器语言指令来保存和返回处理器1的PSR 31的位FXP。
应该注意,作为关于作为前提的定点的说明,存在1系统(FIX16_1,FIX32_1)类型和_2系统(FIX16_2,FIX32_2)类型;模式通过硬件(处理器1)中的PSR 31的一位(FXP)切换;以及,进一步,存在在一个函数中只能使用一单个系统的条件。
因此,作为用于切换和使用程序上的这两个系统的方法,给出一个规则来指定一个编译指示(“#pragma_save_fxpmode”函数名)作为可以由其他系统调用的函数。从而,定点模式切换开关单元111将对应于FIX类型的模式的保存和返回的代码插入到函数的头部和尾部。另外,搜索每个函数的FIX类型声明;决定通过哪一FIX类型声明来编译函数;以及,插入设置模式的代码。
图77A显示了一个带有编译指示的函数的例子。在图77A的右边写的注释是定点模式切换单元111的插入处理,其具体处理如图77B所示。
象这样的编译指示的一个应用例子如图77C所示。例如,关于四个函数f11、f21、f22和f23,当函数f11:_1系统调用函数f21:_2系统;函数f21:_2系统调用函数f22:_2系统;函数f22:_2系统调用函数f23:_2系统时,由于可以由其他模式调用的唯一的函数是f21,所以可以通过只对这个函数执行编译指示指定来切换到一个正常模式。
如上所述,采用依据本实施例的编译程序100,通过在运算符定义文件102、内置函数定义文件103和机器语言指令替代单元122之间的协作处理,用户可以声明和使用定点类型的模式0和模式1作为普通类型并有效产生处理器1通过在高级语言级调用内置函数执行的高功能机器语言指令。
另外,利用变元优化单元131对内置函数的变元的优化,产生带有有效运算数的机器语言指令。此外,利用类型变换优化单元132对类型变换的优化,将一个带有类型变换的运算变换成处理器1执行的一个高功能机器语言指令。此外,利用等待时间优化单元133对机器语言指令的时间调度,用户可以在不插入nop指令的情况下保证在特定指令之间的或到扩展寄存器的访问中的等待时间。
至此,已经根据实施例解释了依据本发明的编译程序,但本发明并不限于这个实施例。
例如,在本实施例中,定点的类型是16位或32位,小数点被放在MSB或其低数位,但本发明并不限于这样的格式,其定点是8位或64位并且其小数点被放在另一个数位的类型作为目标也是可以接受的。
另外,提供一个使用类库作为用于用户的开发支持工具的行为验证技术也是可以接受的。换句话说,如图78A所示,通常,依据本实施例对于目标机器(处理器1)采用交叉编译程序(编译程序100)来编译测试源和定义文件102和103;通过为带有专用模拟器的处理器1执行所获得的机器语言程序执行行为验证。作为替换,如图78B所示,准备一个其目标是用于开发的主机(例如,由英特尔公司制造的处理器)的类库(将运算符定义文件102和内置函数定义文件103分别与主机而非处理器1的机器语言指令联系起来的定义文件)并与测试源、定义文件102和103一起由本机编译程序(诸如Visual C++(R))编译并且主机执行所获得的机器语言程序as-is是可接受的。从而,可以在类似环境中高速执行一个模拟并执行行为验证。
此外,在本实施例中,与专用于目标处理器的机器语言指令相联系的运算符和内置函数被作为主文件(定义文件102和103)提供,但依据本发明的编译程序可以被配置为在编译程序本身中结合象这样的定义文件的信息。换句话说,依据本发明的编译程序是一个将上述定义文件102和103结合在其中的整体类型(integral-type)的程序,将编译程序配置为使得编译程序将源程序翻译成机器语言程序,该程序包括其中定义了对应于专用于一个目标处理器的机器语言指令的运算的运算定义信息,编译程序包括:分析程序步骤,分析源程序;中间编码变换步骤,将分析的源程序变换成中间编码;优化步骤,优化变换的中间编码;以及,代码产生步骤,将优化的中间编码变换成机器语言指令,其中,中间编码变换步骤包括:检测子步骤,检测中间编码中的一个是否引用在运算定义信息中定义的运算;以及,替代子步骤,当检测到中间编码时,用一个对应的机器语言指令替代中间编码,以及,在优化步骤中,优化中间编码,中间编码包括在替代子步骤中替代中间编码的机器语言指令。从而,用户不需要在源程序中包括定义文件。

Claims (1)

1.一种将一个源程序翻译成一个机器语言程序的编译程序,所述机器语言程序包括其中定义了对应于一个专用于一个目标处理器的机器语言指令的运算的运算定义信息,编译程序包括:
分析程序步骤,分析源程序;
中间编码变换步骤,将分析的源程序变换成中间编码;
优化步骤,优化变换的中间编码;以及,
代码产生步骤,将优化的中间编码变换成机器语言指令,
其中,中间编码变换步骤包括:
检测子步骤,检测任何中间编码是否引用在运算定义信息中定义的运算;以及,
替代子步骤,当检测到中间编码时,用一个对应的机器语言指令替代中间编码,以及,
在优化步骤中,优化中间编码,中间编码包括在替代子步骤中替代中间编码的机器语言指令。
CNA2007100885255A 2002-08-02 2003-08-01 编译程序、编译程序装置和编译方法 Pending CN101196825A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002226682A JP3801545B2 (ja) 2002-08-02 2002-08-02 コンパイラ用プログラム、コンパイラ装置及びコンパイル方法
JP226682/2002 2002-08-02

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB031522564A Division CN1312582C (zh) 2002-08-02 2003-08-01 编译装置和编译方法

Publications (1)

Publication Number Publication Date
CN101196825A true CN101196825A (zh) 2008-06-11

Family

ID=31185082

Family Applications (2)

Application Number Title Priority Date Filing Date
CNA2007100885255A Pending CN101196825A (zh) 2002-08-02 2003-08-01 编译程序、编译程序装置和编译方法
CNB031522564A Expired - Lifetime CN1312582C (zh) 2002-08-02 2003-08-01 编译装置和编译方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNB031522564A Expired - Lifetime CN1312582C (zh) 2002-08-02 2003-08-01 编译装置和编译方法

Country Status (4)

Country Link
US (2) US7284241B2 (zh)
EP (3) EP1837757A3 (zh)
JP (1) JP3801545B2 (zh)
CN (2) CN101196825A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268223A (zh) * 2013-04-26 2013-08-28 深圳中微电科技有限公司 在编译过程中改善乘加类指令执行性能的方法
CN107729018A (zh) * 2012-09-28 2018-02-23 英特尔公司 循环向量化方法和设备
CN109491307A (zh) * 2017-09-12 2019-03-19 欧姆龙株式会社 控制装置及控制方法
CN109976793A (zh) * 2019-03-15 2019-07-05 北京字节跳动网络技术有限公司 一种应用程序的运行方法、装置、设备和介质
CN111142848B (zh) * 2018-11-05 2023-09-19 深圳Tcl新技术有限公司 一种软件程序编译方法、执行方法及装置
CN118353973A (zh) * 2024-06-14 2024-07-16 深圳市顾美科技有限公司 Plc通信方法、装置、设备及存储介质

Families Citing this family (138)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7024666B1 (en) * 2002-01-28 2006-04-04 Roy-G-Biv Corporation Motion control systems and methods
US20010032278A1 (en) 1997-10-07 2001-10-18 Brown Stephen J. Remote generation and distribution of command programs for programmable devices
JP3801545B2 (ja) * 2002-08-02 2006-07-26 松下電器産業株式会社 コンパイラ用プログラム、コンパイラ装置及びコンパイル方法
US6830812B2 (en) * 2003-01-21 2004-12-14 Equity Enterprises Carbon material and process of manufacturing
US7210116B2 (en) * 2003-06-27 2007-04-24 Robert Zeidman Method and apparatus for synthesizing a hardware system from a software description
US20060064503A1 (en) * 2003-09-25 2006-03-23 Brown David W Data routing systems and methods
US8027349B2 (en) 2003-09-25 2011-09-27 Roy-G-Biv Corporation Database event driven motion systems
JP4157016B2 (ja) * 2003-11-05 2008-09-24 株式会社東芝 コンパイラ装置及びコンパイル方法
ATE466334T1 (de) * 2004-02-27 2010-05-15 Ericsson Telefon Ab L M Programmieren eines flash-speichers
JP2005284577A (ja) * 2004-03-29 2005-10-13 Matsushita Electric Ind Co Ltd コンパイラ
US7475392B2 (en) * 2004-06-07 2009-01-06 International Business Machines Corporation SIMD code generation for loops with mixed data lengths
US7395531B2 (en) * 2004-06-07 2008-07-01 International Business Machines Corporation Framework for efficient code generation using loop peeling for SIMD loop code with multiple misaligned statements
US7386842B2 (en) * 2004-06-07 2008-06-10 International Business Machines Corporation Efficient data reorganization to satisfy data alignment constraints
US7478377B2 (en) 2004-06-07 2009-01-13 International Business Machines Corporation SIMD code generation in the presence of optimized misaligned data reorganization
US7367026B2 (en) * 2004-06-07 2008-04-29 International Business Machines Corporation Framework for integrated intra- and inter-loop aggregation of contiguous memory accesses for SIMD vectorization
US8549501B2 (en) 2004-06-07 2013-10-01 International Business Machines Corporation Framework for generating mixed-mode operations in loop-level simdization
US7937172B2 (en) * 2004-07-28 2011-05-03 Mitsubishi Electric Corporation Program creating device for programmable controller, program creating method for programmable controller, and recording medium having program recorded thereon
US20060048118A1 (en) * 2004-08-30 2006-03-02 International Business Machines Corporation Method and apparatus for optimizing code with artificial statements
JP2006107338A (ja) * 2004-10-08 2006-04-20 Matsushita Electric Ind Co Ltd プログラム処理装置
US7529888B2 (en) * 2004-11-19 2009-05-05 Intel Corporation Software caching with bounded-error delayed update
JP2006243838A (ja) 2005-02-28 2006-09-14 Toshiba Corp プログラム開発装置
JP2006260096A (ja) * 2005-03-16 2006-09-28 Matsushita Electric Ind Co Ltd プログラム変換方法およびプログラム変換装置
US7669191B1 (en) * 2005-06-14 2010-02-23 Xilinx, Inc. Compile-time dispatch of operations on type-safe heterogeneous containers
US20090106744A1 (en) * 2005-08-05 2009-04-23 Jianhui Li Compiling and translating method and apparatus
US7779396B2 (en) * 2005-08-10 2010-08-17 Microsoft Corporation Syntactic program language translation
US9075630B1 (en) * 2005-11-14 2015-07-07 The Mathworks, Inc. Code evaluation of fixed-point math in the presence of customizable fixed-point typing rules
US7747565B2 (en) * 2005-12-07 2010-06-29 Microsoft Corporation Garbage collector support for transactional memory
US7926046B2 (en) * 2005-12-13 2011-04-12 Soorgoli Ashok Halambi Compiler method for extracting and accelerator template program
US8352925B2 (en) * 2007-01-16 2013-01-08 Oracle America, Inc. Mechanism for enabling a set of code intended for a first platform to be executed on a second platform
WO2008110411A1 (en) * 2007-03-14 2008-09-18 International Business Machines Corporation Automatic formatting of computer program source code
JP5226328B2 (ja) * 2007-03-27 2013-07-03 パナソニック株式会社 コード変換装置
US20080247532A1 (en) * 2007-04-06 2008-10-09 Waldean Allen Schulz Method and System for Representing Quantitative Properties in a Computer Program and for Validating Dimensional Integrity of Mathematical Expressions
US8225295B2 (en) * 2007-09-21 2012-07-17 Jens Palsberg Register allocation by puzzle solving
EP2202638A4 (en) * 2007-09-21 2011-12-14 Fujitsu Ltd TRANSLATION FACILITY, TRANSLATION PROCEDURE AND TRANSLATION PROGRAM AND PROCESSOR CONTROL SYSTEM AND PROCESSOR
US8326814B2 (en) 2007-12-05 2012-12-04 Box, Inc. Web-based file management system and service
JP2009187285A (ja) * 2008-02-06 2009-08-20 Panasonic Corp プログラム変換方法、プログラム変換装置およびプログラム
US8255886B2 (en) * 2008-06-30 2012-08-28 Intel Corporation Methods and apparatus for analyzing SIMD code
KR101645001B1 (ko) * 2009-02-18 2016-08-02 삼성전자주식회사 Vliw 명령어 생성 장치 및 그 방법과 vliw 명령어를 처리하는 vliw 프로세서 및 그 방법
US8732680B2 (en) * 2009-02-19 2014-05-20 International Business Machines Corporation Intermediate form for bitwidth sensitive applications and uses thereof
GB0907559D0 (en) * 2009-05-01 2009-06-10 Optos Plc Improvements relating to processing unit instruction sets
US8904366B2 (en) * 2009-05-15 2014-12-02 International Business Machines Corporation Use of vectorization instruction sets
US8448153B1 (en) 2009-10-29 2013-05-21 Ning Wang Encoding data and metadata for run-time checking of computer code and data serialization
US8856759B2 (en) * 2010-02-01 2014-10-07 Bull Hn Information Systems Inc. Method and apparatus providing COBOL decimal type arithmetic functions with improved performance
JP5496792B2 (ja) * 2010-06-29 2014-05-21 インターナショナル・ビジネス・マシーンズ・コーポレーション コード変換プログラム、方法及びシステム
WO2012099617A1 (en) 2011-01-20 2012-07-26 Box.Net, Inc. Real time notification of activities that occur in a web-based collaboration environment
US9015601B2 (en) 2011-06-21 2015-04-21 Box, Inc. Batch uploading of content to a web-based collaboration environment
US9063912B2 (en) 2011-06-22 2015-06-23 Box, Inc. Multimedia content preview rendering in a cloud content management system
US9978040B2 (en) 2011-07-08 2018-05-22 Box, Inc. Collaboration sessions in a workspace on a cloud-based content management system
WO2013009337A2 (en) 2011-07-08 2013-01-17 Arnold Goldberg Desktop application for access and interaction with workspaces in a cloud-based content management system and synchronization mechanisms thereof
US8656376B2 (en) * 2011-09-01 2014-02-18 National Tsing Hua University Compiler for providing intrinsic supports for VLIW PAC processors with distributed register files and method thereof
US9197718B2 (en) 2011-09-23 2015-11-24 Box, Inc. Central management and control of user-contributed content in a web-based collaboration environment and management console thereof
US8515902B2 (en) 2011-10-14 2013-08-20 Box, Inc. Automatic and semi-automatic tagging features of work items in a shared workspace for metadata tracking in a cloud-based content management system with selective or optional user contribution
US9098474B2 (en) * 2011-10-26 2015-08-04 Box, Inc. Preview pre-generation based on heuristics and algorithmic prediction/assessment of predicted user behavior for enhancement of user experience
WO2013062599A1 (en) 2011-10-26 2013-05-02 Box, Inc. Enhanced multimedia content preview rendering in a cloud content management system
US8990307B2 (en) 2011-11-16 2015-03-24 Box, Inc. Resource effective incremental updating of a remote client with events which occurred via a cloud-enabled platform
US9773051B2 (en) 2011-11-29 2017-09-26 Box, Inc. Mobile platform file and folder selection functionalities for offline access and synchronization
US9019123B2 (en) 2011-12-22 2015-04-28 Box, Inc. Health check services for web-based collaboration environments
US11232481B2 (en) 2012-01-30 2022-01-25 Box, Inc. Extended applications of multimedia content previews in the cloud-based content management system
US9965745B2 (en) 2012-02-24 2018-05-08 Box, Inc. System and method for promoting enterprise adoption of a web-based collaboration environment
US9195636B2 (en) 2012-03-07 2015-11-24 Box, Inc. Universal file type preview for mobile devices
US9054919B2 (en) 2012-04-05 2015-06-09 Box, Inc. Device pinning capability for enterprise cloud service and storage accounts
US9575981B2 (en) 2012-04-11 2017-02-21 Box, Inc. Cloud service enabled to handle a set of files depicted to a user as a single file in a native operating system
US9413587B2 (en) 2012-05-02 2016-08-09 Box, Inc. System and method for a third-party application to access content within a cloud-based platform
WO2013166520A1 (en) 2012-05-04 2013-11-07 Box, Inc. Repository redundancy implementation of a system which incrementally updates clients with events that occurred via cloud-enabled platform
US9691051B2 (en) 2012-05-21 2017-06-27 Box, Inc. Security enhancement through application access control
US9027108B2 (en) 2012-05-23 2015-05-05 Box, Inc. Systems and methods for secure file portability between mobile applications on a mobile device
US8914900B2 (en) 2012-05-23 2014-12-16 Box, Inc. Methods, architectures and security mechanisms for a third-party application to access content in a cloud-based platform
US9021099B2 (en) 2012-07-03 2015-04-28 Box, Inc. Load balancing secure FTP connections among multiple FTP servers
GB2505072A (en) 2012-07-06 2014-02-19 Box Inc Identifying users and collaborators as search results in a cloud-based system
US9712510B2 (en) 2012-07-06 2017-07-18 Box, Inc. Systems and methods for securely submitting comments among users via external messaging applications in a cloud-based platform
US9792320B2 (en) 2012-07-06 2017-10-17 Box, Inc. System and method for performing shard migration to support functions of a cloud-based service
US9237170B2 (en) 2012-07-19 2016-01-12 Box, Inc. Data loss prevention (DLP) methods and architectures by a cloud service
US8868574B2 (en) 2012-07-30 2014-10-21 Box, Inc. System and method for advanced search and filtering mechanisms for enterprise administrators in a cloud-based environment
US9794256B2 (en) 2012-07-30 2017-10-17 Box, Inc. System and method for advanced control tools for administrators in a cloud-based service
US9369520B2 (en) 2012-08-19 2016-06-14 Box, Inc. Enhancement of upload and/or download performance based on client and/or server feedback information
US8745267B2 (en) 2012-08-19 2014-06-03 Box, Inc. Enhancement of upload and/or download performance based on client and/or server feedback information
US9558202B2 (en) 2012-08-27 2017-01-31 Box, Inc. Server side techniques for reducing database workload in implementing selective subfolder synchronization in a cloud-based environment
US9135462B2 (en) 2012-08-29 2015-09-15 Box, Inc. Upload and download streaming encryption to/from a cloud-based platform
US9117087B2 (en) 2012-09-06 2015-08-25 Box, Inc. System and method for creating a secure channel for inter-application communication based on intents
US9195519B2 (en) 2012-09-06 2015-11-24 Box, Inc. Disabling the self-referential appearance of a mobile application in an intent via a background registration
US9311071B2 (en) 2012-09-06 2016-04-12 Box, Inc. Force upgrade of a mobile application via a server side configuration file
US9292833B2 (en) 2012-09-14 2016-03-22 Box, Inc. Batching notifications of activities that occur in a web-based collaboration environment
US10200256B2 (en) 2012-09-17 2019-02-05 Box, Inc. System and method of a manipulative handle in an interactive mobile user interface
US9553758B2 (en) 2012-09-18 2017-01-24 Box, Inc. Sandboxing individual applications to specific user folders in a cloud-based service
US10915492B2 (en) 2012-09-19 2021-02-09 Box, Inc. Cloud-based platform enabled with media content indexed for text-based searches and/or metadata extraction
US9959420B2 (en) 2012-10-02 2018-05-01 Box, Inc. System and method for enhanced security and management mechanisms for enterprise administrators in a cloud-based environment
US9495364B2 (en) 2012-10-04 2016-11-15 Box, Inc. Enhanced quick search features, low-barrier commenting/interactive features in a collaboration platform
US9705967B2 (en) 2012-10-04 2017-07-11 Box, Inc. Corporate user discovery and identification of recommended collaborators in a cloud platform
US9665349B2 (en) 2012-10-05 2017-05-30 Box, Inc. System and method for generating embeddable widgets which enable access to a cloud-based collaboration platform
US9628268B2 (en) 2012-10-17 2017-04-18 Box, Inc. Remote key management in a cloud-based environment
US9756022B2 (en) 2014-08-29 2017-09-05 Box, Inc. Enhanced remote key management for an enterprise in a cloud-based environment
US10235383B2 (en) 2012-12-19 2019-03-19 Box, Inc. Method and apparatus for synchronization of items with read-only permissions in a cloud-based environment
US9396245B2 (en) 2013-01-02 2016-07-19 Box, Inc. Race condition handling in a system which incrementally updates clients with events that occurred in a cloud-based collaboration platform
US9953036B2 (en) 2013-01-09 2018-04-24 Box, Inc. File system monitoring in a system which incrementally updates clients with events that occurred in a cloud-based collaboration platform
EP2755151A3 (en) 2013-01-11 2014-09-24 Box, Inc. Functionalities, features and user interface of a synchronization client to a cloud-based environment
US10599671B2 (en) 2013-01-17 2020-03-24 Box, Inc. Conflict resolution, retry condition management, and handling of problem files for the synchronization client to a cloud-based platform
US8935781B1 (en) * 2013-02-01 2015-01-13 Google Inc. Native code module security for arm 64-bit instruction set architectures
CN104063258B (zh) * 2013-03-21 2017-05-03 国际商业机器公司 用于调试过程中的代码动态切换的方法和系统
US9274931B2 (en) 2013-05-06 2016-03-01 International Business Machines Corporation Inserting implicit sequence points into computer program code to support debug operations
US10846074B2 (en) 2013-05-10 2020-11-24 Box, Inc. Identification and handling of items to be ignored for synchronization with a cloud-based platform by a synchronization client
US10725968B2 (en) 2013-05-10 2020-07-28 Box, Inc. Top down delete or unsynchronization on delete of and depiction of item synchronization with a synchronization client to a cloud-based platform
US20160132297A1 (en) * 2013-06-11 2016-05-12 Smart Research Limited Method and computer program for generating or manipulating source code
US9633037B2 (en) 2013-06-13 2017-04-25 Box, Inc Systems and methods for synchronization event building and/or collapsing by a synchronization component of a cloud-based platform
US9805050B2 (en) 2013-06-21 2017-10-31 Box, Inc. Maintaining and updating file system shadows on a local device by a synchronization client of a cloud-based platform
US10110656B2 (en) 2013-06-25 2018-10-23 Box, Inc. Systems and methods for providing shell communication in a cloud-based platform
US10229134B2 (en) 2013-06-25 2019-03-12 Box, Inc. Systems and methods for managing upgrades, migration of user data and improving performance of a cloud-based platform
US9535924B2 (en) 2013-07-30 2017-01-03 Box, Inc. Scalability improvement in a system which incrementally updates clients with events that occurred in a cloud-based collaboration platform
US9535909B2 (en) 2013-09-13 2017-01-03 Box, Inc. Configurable event-based automation architecture for cloud-based collaboration platforms
GB2518298A (en) 2013-09-13 2015-03-18 Box Inc High-availability architecture for a cloud-based concurrent-access collaboration platform
US10509527B2 (en) 2013-09-13 2019-12-17 Box, Inc. Systems and methods for configuring event-based automation in cloud-based collaboration platforms
US8892679B1 (en) 2013-09-13 2014-11-18 Box, Inc. Mobile device, methods and user interfaces thereof in a mobile device platform featuring multifunctional access and engagement in a collaborative environment provided by a cloud-based platform
US9704137B2 (en) 2013-09-13 2017-07-11 Box, Inc. Simultaneous editing/accessing of content by collaborator invitation through a web-based or mobile application to a cloud-based collaboration platform
US9213684B2 (en) 2013-09-13 2015-12-15 Box, Inc. System and method for rendering document in web browser or mobile device regardless of third-party plug-in software
US10866931B2 (en) 2013-10-22 2020-12-15 Box, Inc. Desktop application for accessing a cloud collaboration platform
US9501268B2 (en) * 2013-12-23 2016-11-22 International Business Machines Corporation Generating SIMD code from code statements that include non-isomorphic code statements
JP6245031B2 (ja) * 2014-03-27 2017-12-13 富士通株式会社 コンパイルプログラム、コンパイル方法およびコンパイル装置
US10530854B2 (en) 2014-05-30 2020-01-07 Box, Inc. Synchronization of permissioned content in cloud-based environments
US9602514B2 (en) 2014-06-16 2017-03-21 Box, Inc. Enterprise mobility management and verification of a managed application by a content provider
US10038731B2 (en) 2014-08-29 2018-07-31 Box, Inc. Managing flow-based interactions with cloud-based shared content
US9894119B2 (en) 2014-08-29 2018-02-13 Box, Inc. Configurable metadata-based automation and content classification architecture for cloud-based collaboration platforms
US10574442B2 (en) 2014-08-29 2020-02-25 Box, Inc. Enhanced remote key management for an enterprise in a cloud-based environment
US10210591B2 (en) * 2015-02-02 2019-02-19 Microsoft Technology Licensing, Llc Optimizing compilation of shaders
GB201505743D0 (en) * 2015-04-02 2015-05-20 Technion Res & Dev Foundation Field effect transistor device
KR102063966B1 (ko) * 2015-10-21 2020-01-09 엘에스산전 주식회사 Plc 명령어 컴파일 최적화 방법
US10180829B2 (en) * 2015-12-15 2019-01-15 Nxp Usa, Inc. System and method for modulo addressing vectorization with invariant code motion
CN107340995B (zh) * 2016-04-29 2020-11-20 中国铁道科学研究院 一种牵引控制应用软件开发系统及对平台无关代码的优化编译方法
US10908886B2 (en) * 2016-07-12 2021-02-02 Oracle International Corporation Accessing a migrated member in an updated type
US10558460B2 (en) * 2016-12-14 2020-02-11 Qualcomm Incorporated General purpose register allocation in streaming processor
US10726196B2 (en) * 2017-03-03 2020-07-28 Evolv Technology Solutions, Inc. Autonomous configuration of conversion code to control display and functionality of webpage portions
CN108304218A (zh) * 2018-03-14 2018-07-20 郑州云海信息技术有限公司 一种汇编代码的编写方法、装置、系统和可读存储介质
CN109352645A (zh) * 2018-09-28 2019-02-19 库壳教育科技有限公司 一种应用于机器人教育的简易编程方法及装置
CN110321130B (zh) * 2019-06-24 2021-04-16 大连理工大学 基于系统调用日志的不可重复编译定位方法
KR102319403B1 (ko) * 2019-11-21 2021-10-29 국방과학연구소 컴퓨터 장치 및 컴퓨터 장치의 바이너리 프로그램 실행 속도 측정방법
CN111078290B (zh) * 2019-12-17 2023-03-14 西安电子科技大学 一种用于可扩展指令集的编译器及编译方法
US11347488B2 (en) * 2020-05-18 2022-05-31 Fortinet, Inc. Compiling domain-specific language code to generate executable code targeting an appropriate type of processor of a network device
CN113127004B (zh) * 2021-05-06 2022-08-16 福建省天奕网络科技有限公司 一种安卓端vmp保护的实现方法及系统
CN114428630B (zh) * 2022-03-31 2022-07-01 浙江地芯引力科技有限公司 芯片算法升级方法、装置和芯片
CN116737175B (zh) * 2023-08-16 2023-12-08 通用技术集团机床工程研究院有限公司 译码方法、文件解析方法、解析器、系统及存储介质

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02236732A (ja) 1989-03-10 1990-09-19 Fujitsu Ltd ソースプログラム作成方式
JPH0594310A (ja) 1991-10-03 1993-04-16 Kobe Nippon Denki Software Kk 機械語コード生成方法
JPH0721033A (ja) * 1993-07-07 1995-01-24 Nec Corp 言語処理装置及びその方法
GB2279781A (en) 1993-07-10 1995-01-11 Ibm Defining topology of a data processing system
JPH0756745A (ja) * 1993-08-13 1995-03-03 Nec Corp 言語処理プログラムのコンパイラ処理方式
US5822588A (en) * 1995-06-09 1998-10-13 Sun Microsystem, Inc. System and method for checking the use of synchronization locks in a multi-threaded target program
US5815719A (en) 1996-05-07 1998-09-29 Sun Microsystems, Inc. Method and apparatus for easy insertion of assembler code for optimization
JPH10228382A (ja) * 1997-02-14 1998-08-25 Nec Corp コンパイル方式
US6247174B1 (en) * 1998-01-02 2001-06-12 Hewlett-Packard Company Optimization of source code with embedded machine instructions
CN1223402A (zh) * 1998-01-12 1999-07-21 日本电气株式会社 在优化中能减少中断处理的编译器及其优化方法
JP3246438B2 (ja) 1998-04-01 2002-01-15 日本電気株式会社 可変ターゲットコンパイル処理方法、その処理装置、そのプログラムの記憶媒体および変換テーブルの記憶媒体
US6427234B1 (en) * 1998-06-11 2002-07-30 University Of Washington System and method for performing selective dynamic compilation using run-time information
JP2000056981A (ja) 1998-08-06 2000-02-25 Matsushita Electric Ind Co Ltd プログラム変換装置
US6370685B1 (en) * 1999-01-06 2002-04-09 Intel Corporation Data-flow method of analyzing definitions and uses of L values in programs
US6330714B1 (en) * 1999-02-08 2001-12-11 International Business Machines Corporation Method and computer program product for implementing redundant lock avoidance
US6460177B1 (en) * 1999-09-22 2002-10-01 Lucent Technologies Inc. Method for target-specific development of fixed-point algorithms employing C++ class definitions
DE60041509D1 (de) * 1999-12-30 2009-03-19 Texas Instruments Inc Verfahren und Vorrichtung zur Programmverkleinerung in einem Prozessor mit offener Pipeline
JP2001273150A (ja) 2000-03-27 2001-10-05 Matsushita Electric Ind Co Ltd プログラム変換装置
US20030023960A1 (en) * 2001-07-25 2003-01-30 Shoab Khan Microprocessor instruction format using combination opcodes and destination prefixes
JP3707727B2 (ja) * 2000-10-30 2005-10-19 インターナショナル・ビジネス・マシーンズ・コーポレーション プログラムの最適化方法及びこれを用いたコンパイラ
GB0028079D0 (en) * 2000-11-17 2001-01-03 Imperial College System and method
US20020188830A1 (en) * 2001-06-01 2002-12-12 Brian Boles Bit replacement and extraction instructions
US6851040B2 (en) * 2001-08-15 2005-02-01 Transmeta Corporation Method and apparatus for improving segmented memory addressing
JP2004013190A (ja) 2002-06-03 2004-01-15 Matsushita Electric Ind Co Ltd ソフトウエア開発環境、シミュレータ及び記録媒体
US20040006667A1 (en) * 2002-06-21 2004-01-08 Bik Aart J.C. Apparatus and method for implementing adjacent, non-unit stride memory access patterns utilizing SIMD instructions
JP3801545B2 (ja) * 2002-08-02 2006-07-26 松下電器産業株式会社 コンパイラ用プログラム、コンパイラ装置及びコンパイル方法
US7530062B2 (en) * 2003-05-23 2009-05-05 Microsoft Corporation Optimizing compiler transforms for a high level shader language

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729018A (zh) * 2012-09-28 2018-02-23 英特尔公司 循环向量化方法和设备
US10884744B2 (en) 2012-09-28 2021-01-05 Intel Corporation System and method of loop vectorization by compressing indices and data elements from iterations based on a control mask
CN103268223A (zh) * 2013-04-26 2013-08-28 深圳中微电科技有限公司 在编译过程中改善乘加类指令执行性能的方法
CN103268223B (zh) * 2013-04-26 2016-06-29 深圳中微电科技有限公司 在编译过程中改善乘加类指令执行性能的方法
CN109491307A (zh) * 2017-09-12 2019-03-19 欧姆龙株式会社 控制装置及控制方法
CN109491307B (zh) * 2017-09-12 2022-02-15 欧姆龙株式会社 控制装置及控制方法
CN111142848B (zh) * 2018-11-05 2023-09-19 深圳Tcl新技术有限公司 一种软件程序编译方法、执行方法及装置
CN109976793A (zh) * 2019-03-15 2019-07-05 北京字节跳动网络技术有限公司 一种应用程序的运行方法、装置、设备和介质
CN109976793B (zh) * 2019-03-15 2022-05-10 北京字节跳动网络技术有限公司 一种应用程序的运行方法、装置、设备和介质
CN118353973A (zh) * 2024-06-14 2024-07-16 深圳市顾美科技有限公司 Plc通信方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN1482540A (zh) 2004-03-17
JP2004070531A (ja) 2004-03-04
EP1398695A3 (en) 2005-06-22
CN1312582C (zh) 2007-04-25
US7284241B2 (en) 2007-10-16
US20040025150A1 (en) 2004-02-05
EP1398695A2 (en) 2004-03-17
EP1837757A3 (en) 2009-05-06
JP3801545B2 (ja) 2006-07-26
EP1837757A2 (en) 2007-09-26
US8151254B2 (en) 2012-04-03
EP1837758A2 (en) 2007-09-26
US20070256065A1 (en) 2007-11-01
EP1837758A3 (en) 2009-08-05

Similar Documents

Publication Publication Date Title
CN1312582C (zh) 编译装置和编译方法
CN100483350C (zh) 适应性强具备最佳化功能的编译装置
CN100524204C (zh) 处理器
Leupers et al. Retargetable compiler technology for embedded systems: tools and applications
US5586323A (en) Compilier system using an intermediate abstract form and machine-specific installers
Sreraman et al. A vectorizing compiler for multimedia extensions
Leupers Code optimization techniques for embedded processors: Methods, algorithms, and tools
Wazlowski et al. PRISM-II compiler and architecture
Leupers Retargetable code generation for digital signal processors
US4667290A (en) Compilers using a universal intermediate language
EP1462933A2 (en) Processor with loop instruction, and compiler for the same
US20160321039A1 (en) Technology mapping onto code fragments
US20020019973A1 (en) Compiler and method for compiling easily adaptable to processor specifications
Huang et al. Generating instruction sets and microarchitectures from applications
Lin An optimizing compiler for the TMS 320 C 25 DSP processor.
Ogata Automatically extracting the correspondence between the natural language and the pseudo-code descriptions of instruction set manuals
Friedman A characterization of Prolog execution
Himmelbauer et al. The Vienna Architecture Description Language
CN114127684A (zh) 用于具有专用寄存器的risc处理器的编译器
Goessling et al. ISPMET: a study in automatic emulator generation
JP4879589B2 (ja) コンパイラ装置
Lee et al. Architecture selection of a flexible DSP core using reconfigurable system software
Leupers et al. Code Selection for Multimedia Processors
Dahl et al. Prototyping Compiler and Simulation Tools with PCCTS
Li Vector c-a programming language for vector processing (compiler, cyber 205, language design)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication