WO2020073200A1

WO2020073200A1 - 调试程序的方法和系统

Info

Publication number: WO2020073200A1
Application number: PCT/CN2018/109518
Authority: WO
Inventors: 唐玮玮; 沈灿泉; 张丰伟
Original assignee: 华为技术有限公司
Priority date: 2018-10-09
Filing date: 2018-10-09
Publication date: 2020-04-16
Also published as: CN112740187A

Abstract

本申请提供了一种调试程序的方法和系统。本申请实施例通过在函数的栈帧中增加用于标识该函数所属的线程的标识字段，当第一处理模块上运行的第一函数调用第二函数时，将该第一函数当前的栈帧保存到堆栈缓冲区中，使得堆栈缓冲区中保存的第一函数的栈帧与该第一函数所属的线程相关联，实现对同一个线程的堆栈信息的记录，基于此本申请实施例能够在调试过程中记录业务的端到端的流向，提高开发者定位问题的效率。

Description

调试程序的方法和系统

技术领域

本申请涉及计算机领域，并且更加具体的，涉及计算机领域中的调试程序的方法和系统。

背景技术

当前，异构计算正在成为并行计算的一种新形式。根据不同的业务场景，越来越多定制化的处理器已经问世。异构体系结构的产生，必然导致异构软件的调试需求。统一计算架构(compute unified device architecture,CUDA)-GDB(GNU debuger)是用于在Linux和Mac上运行CUDA应用程序的NVIDA的工具。CUDA-GDB是基于GNU开源组织发布的x86-64版本的GDB项目所移植的调试器，该工具为开发人员提供了一种调试在实际硬件上运行的CUDA应用程序的机制。

CUDA程序包含主机(host)和设备(device)侧代码，这两部分代码会运行在不同的设备上。作为举例，host侧代码可以是编译运行在X86侧的代码，device侧的代码可以是编译运行在图形处理器(graphic processing unit，GPU)上的代码。在进行调试的时候，当用户所设置的断点为host侧的断点时，程序在运行过程中命中host侧断点，当前现场包含host侧的堆栈信息。当用户所设置的断点为device侧的断点时，程序在运行过程中命中device侧断点时，当前现场只会包含device侧的堆栈信息。

因此，当前异构调试的工具，没有具备显示全栈的功能。特别在异构任务联动中，开发者无法感知业务整体数据流，造成调试人力增高。

发明内容

本申请提供一种调试程序的方法和系统，能够在调试过程中记录业务的端到端的流向，提高开发者定位问题的效率。

第一方面，提供了一种调试程序的方法，包括：

第一处理模块执行被调试程序的第一函数，其中，所述第一函数的栈帧包括第一标识，所述第一标识用于标识所述第一函数所属的线程；

在所述第一函数调用第二函数时，第二处理模块执行所述第二函数，所述第二函数的栈帧包括所述第一标识，所述第一标识用于标识所述第二函数所属的线程，其中，所述第二函数与所述第一函数属于相同的线程；

调试代理模块获取调度信息，所述调度信息用于指示所述第一函数调用所述第二函数；

所述调试代理模块向调试模块发送通知消息，所述通知消息用于通知所述第一函数调用所述第二函数；

所述调试模块将所述第一函数当前的第一栈帧保存到堆栈缓冲区。

因此，本申请实施例通过在函数的栈帧中增加用于标识该函数所属的线程的标识字段，当第一处理模块上运行的第一函数调用第二函数时，将该第一函数当前的栈帧保存到堆栈缓冲区中，使得堆栈缓冲区中保存的第一函数的栈帧与该第一函数所属的线程相关联，实现对同一个线程的堆栈信息的记录，基于此本申请实施例能够在调试过程中记录业务的端到端的流向，提高开发者定位问题的效率。

可选的，本申请实施例中，第一标识为第一函数和第二函数所属的线程的线程标识(thread_ID)。

结合第一方面，在第一方面的某些实现方式中，还包括：

在命中所述第二函数上的断点之后，获取所述第二函数当前的第二栈帧；

获取所述第二栈帧中包括的所述第一标识，并获取所述堆栈缓冲区中的包括所述第一标识的栈帧。

因此，本申请实施例中，在调试程序过程中当命中断点时，可以将堆栈缓冲区中与当前线程相关联的栈帧进行记录，从而能够提供直观的业务流程图，使得开发者在调试过程中能够获取业务的端到端的流向，提高开发者定位问题的效率。

结合第一方面，在第一方面的某些实现方式中，所述调试模块将所述第一函数当前的第一栈帧保存到堆栈缓冲区，包括：

所述调试模块将所述第一栈帧添加到所述堆栈缓冲区中的所述第一函数所述的线程对应的堆栈链表中。

结合第一方面，在第一方面的某些实现方式中，所述调试模块将所述第一函数当前的第一栈帧保存到堆栈缓冲区，包括：所述调试模块在所述堆栈缓冲区中建立所述第一函数所述的线程对应的堆栈链表，所述堆栈链表的初始节点为所述第一栈帧。

这样，在堆栈缓冲区中不存在该第一函数所属的线程对应的堆栈链表时，可以建立该堆栈链表。

结合第一方面，在第一方面的某些实现方式中，第一处理模块为主机侧处理器，所述第二处理模块为设备侧处理器。

本申请实施例中，调试代理模块和调试模块可以设置于处理器上，例如CPU或者GPU。具体的，该处理器可以为第一处理模块所在的处理器，或第二处理模块所在的处理器，或者调试代理模块和调试模块可以设置于单独的处理器上，本申请实施例对此不作限定。

第二方面，提供了一种调试程序的系统，用于执行上述第一方面或第一方面的任意可能的实现方式中的方法。具体地，该调试程序的系统包括用于执行上述第一方面或第一方面的任意可能的实现方式中的方法的模块。

第三方面，提供了一种计算机可读介质，用于存储计算机程序，该计算机程序包括用于执行上述第一方面的任意可能的实现方式中的方法的指令。

第四方面，提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序代码，当所述计算机程序代码被所述调试程序的系统中的处理模块或处理器运行时，使得该调试程序的系统执行上述第一方面的任意可能的实现方式中的方法。

附图说明

图1示出了一种堆栈结构的示意图。

图2示出了本申请实施例提供的一种异构调试的框架的示意图。

图3示出了本申请实施例提供的一种调试程序的方法的示意性流程图。

图4示出了本申请实施例提供的一种堆栈结构的示意图。

图5示出了本申请实施例提供的一种堆栈缓冲区的示意图。

图6示出了现有技术中的一种多线程业务流的示意图。

图7示出了本申请实施例提供的一种多线程业务流的示意图。

图8示出了本申请实施例提供的一个具体的调试程序的例子。

图9示出了本申请实施例提供的一种显示全栈信息的方法的示意性流程图。

图10示出了本申请实施例提供的一个具体的调试程序的例子。

图11示出了本申请实施例提供的一种调试程序的系统的示意性框图。

具体实施方式

下面将结合附图，对本申请中的技术方案进行描述。

图1示出了一种堆栈结构的示意图。如图1所示，堆栈的上面部分的为主(main)函数的栈帧(stack frame)，下面部分为Func(function)1函数的栈帧，即当前函数(被调用者)的栈帧，栈底在高地址，栈向下增长。栈帧是指为一个函数调用单独分配的那部分栈空间。比如，当运行中的程序调用另一个函数时，就要进入一个新的栈帧，原来函数的栈帧称为调用者的帧，新的栈帧称为当前帧。被调用的函数运行结束后当前帧全部收缩，回到调用者的帧。

具体的，主函数栈帧包括寄存器入栈，函数入参，局部变量，调用函数的参数。Func1函数的栈帧包括寄存器入栈，函数入参，局部变量，调用函数的参数。这里，寄存器用于记录当前正在运行的函数的一些重要信息，比如在刚进入一个新的函数开始执行的时候，寄存器保存的是上个函数的信息。寄存器例如包括程序计数(program counter,PC)寄存器，连接(link register,LR)寄存器，堆栈指针(stack pointer，SP)寄存器、栈帧指针(frame pointer，FP)寄存器等。其中，FP指向当前函数栈帧的栈底，SP则指向当前函数栈帧的栈顶。

当发生函数调用时，系统进行堆栈现场保存工作：第一步先将相关寄存器压栈，然后将函数的入参进行压栈，函数的局部变量进行压栈，最后将被调用的函数的参数压栈。这里，压栈指的是把数据从栈顶放入栈中，数据出栈的时候从栈顶取出。

图2示出了本申请实施例提供的一种异构调试的框架200的示意图。如图2所示，该异构调试的框架主要包含调试模块201，调试代理模块202，堆栈缓冲区203。

调试模块201：开发者直接交互的模块，提供基础的调试能力，负责与调试代理模块202进行通信，下发调试命令。

调试代理模块202：屏蔽底层硬件差异，提供统一的调试接口，实现对底层硬件的信息收集和设备的控制。这里，底层硬件例如可以包括中央处理器(central processing unit，CPU)204，图形处理器(graphic processing unit，GPU)205和众核处理器206。

本申请实施例中，CPU 204可以为主机(host)侧处理器，GPU 205和众核处理器206可以为设备(device)侧处理器，这里device例如为专用集成电路(application specific integrated circuit，ASIC)，本申请实施例对此不作限定。

堆栈缓冲区203：在双倍速率SDRAM(double data rate SDRAM，DDR)中分配一块特定内存，在本申请实施例中，承载存储异构处理器全局的堆栈信息。作为示例，该堆栈缓冲区203中可以包括栈帧(stack frame)0、栈帧1、栈帧2。

需要说明的是，本申请实施例中，仅以堆栈缓冲区203位于DDR中进行举例说明，可以理解，堆栈缓冲区203也可以位于其他存储结构或存储器中，例如高带宽内存(high bandwidth memory,HBM)，混合记忆体立方体(hybrid memory cube，HMC)，本申请实施例对此不作限定。另外，本申请实施例中，该堆栈缓冲区还可以具有其他命名，例如全局堆栈缓冲区，本申请实施例对此不作限定。

图3示出了本申请实施例提供的一种调试程序的方法的示意性流程图。作为示例，该方法可以由图2中的异构调试的框架200执行，本申请实施例对此不作限定。

310，第一处理模块执行被调试程序的第一函数，其中，所述第一函数的堆栈包括第一标识，所述第一标识用于标识所述第一函数所述的线程。作为举例，第一函数所属的线程可以为第一线程。

这里，第一处理模块为host侧设备或者device侧的设备。具体的，可以为上文中的CPU、GPU、众核处理器或者ASIC，本申请实施例对此不作限定。

具体的，被调试进程可以包括至少一个线程，例如包括第一线程，可选的，被调试进程还可以包括第二线程，本申请实施例对此不作限定。

可选的，第一标识可以为第一函数所述的线程的线程标识(thread_ID)。本申请实施例中，在原先的函数(例如主函数和被主函数调用的函数)的堆栈结构，例如图1所示的堆栈结构中，可以新增加该函数所属的线程的线程标识字段。具体而言，本申请实施例在每次建立栈帧的时候，可以将thread_ID作为一个字段，写入到堆栈结构中，作为堆栈链式结构的唯一标识符。

可选的，该thread_ID字段可以从host侧传下来，用来表征当前运行的函数的栈帧所属的线程。

图4示出了本申请实施例提供的一种堆栈结构的示意图。如图4所示，在主函数栈帧中新增加了线程ID(thread_ID)字段，表征主函数的栈帧所属的线程ID为thread_ID。在Func1函数栈帧中也新增加了thread_ID字段，表征Func1函数的栈帧所属的线程ID也为thread_ID。

320，在所述第一函数调用第二函数时，第二处理模块执行所述第二函数。

其中，所述第二函数的栈帧包括所述第一标识，此时所述第一标识用于标识所述第二函数所述的线程，即第一标识用于标识第二函数与第一函数属于相同的线程。一种实现方式中，第一标识可以由第一处理模块传给第二处理模块。

一种可能的实现方式中，第一处理模块为CPU，第一函数为主函数，第二处理模块为GPU或多核处理器，第二函数为被主函数调用的函数。

另一种可能的实现方式中，第一处理模块可以为GPU或多核处理器，第二处理模块为不同于第一处理模块的GPU或多核处理器，第二函数为被第一函数调用的函数。

330，调试代理模块获取调度信息，所述调度信息用于指示所述第一函数调用所述第二函数。

具体的，当发生核间调度的时候，被调试程序的调度框架会将任务调度发送给调试代理模块202，该任务调度相关的信息可以包含在上述调度信息中。

340，调试代理模块向调试模块发送第一通知消息，所述第一通知消息用于向所述调试模块通知所述第一函数调用所述第二函数。具体的，调试代理模块202收到330中调度框架发送的调度信息后，向调试模块201发送信号，以通知该核间调度。

350，所述调试模块将所述第一函数当前的第一栈帧保存到堆栈缓冲区。

本申请实施例中，然后，调试模块201将当前设备的栈帧按照该栈帧原先的格式，保存到堆栈缓冲区203。

可选的，一种实现方式，当堆栈缓冲区203存在第一函数所属的线程(例如第一线程)对应的堆栈列表时，调试模块201将所述第一栈帧添加到该第一线程的堆栈链表中。

可选的，另一种实现方式，当堆栈缓冲区203不存在第一线程的堆栈列表时，调试模块201在所该堆栈缓冲区中建立该第一线程的堆栈链表，此时该第一线程的堆栈链表的初始节点为第一栈帧。

具体而言，如果当前堆栈缓冲区203不存在需要保存的栈帧的thread_id对应的堆栈链表，则新建一个堆栈链表，将当前栈帧作为一个初始节点加入链表中。如果当前堆栈缓冲区203已经存在需要保存的栈帧的thread_id对应的堆栈链表，则将当前处理器的栈帧加入该thread_id对应的堆栈链表。

当不断发生栈帧插入后，作为示例，堆栈缓冲区203的形式可以如图5所示。具体的，此时堆栈缓冲区203中包括三个线程的堆栈链表，该三个堆栈链表的标识分别为线程0(thread_0)，线程1(thread_1)和线程2(thread_2)。其中，标识为thread_0的堆栈链表分别包括主机的栈帧、ASIC0的栈帧、ASIC4的栈帧、ASIC8的栈帧，标识为thread_1的堆栈链表分别包括主机的栈帧、ASIC1的栈帧、ASIC6的栈帧、ASIC9的栈帧，标识为thread_2的堆栈链表分别包括主机的栈帧、ASIC3的栈帧、ASIC7的栈帧、ASIC2的栈帧、ASIC5的栈帧。

可选的，本申请实施例中，在命中第二函数上的断点之后，获取第二函数当前的第二栈帧，然后，解析该第二栈帧，获取该第二栈帧中包括的所述第一标识，然后可以从所述堆栈缓冲区中获取包括所述第一标识的栈帧。

具体的，在命中预先设置的断点后，可以获取用户的显示堆栈信息的命令。此时，可以先将当前处理模块(例如第二处理模块)的栈帧显示出来，然后根据当前栈帧的thread_id信息，从堆栈缓冲区中查找对应的thread_id的堆栈链表，然后依次将该堆栈链表中的栈帧显示出来，从而获取到从程序开始到当前现场的全栈信息。

同理，可以根据步骤310至350的描述对被调试程序的第二线程采用相类似的操作。当用户进行切换核操作，进行第二线程的堆栈显示时，同样地，会根据以上描述的过程，将第二线程的完整的全栈信息显示出来，从而达到全栈显示的目的。

另外，本申请实施例中，可以将原先杂乱的，但是有内部关联的核间堆栈信息整理成树状结构，提供更直观的数据流图。图6示出了现有技术中的一种多线程业务流的示意图，图6中共显示了3个业务流信息，例如虚线所示的从host->ASIC 0->ASIC 4->ASIC 8的业务流信息，实线所示的从host->ASIC 1->ASIC 6->ASIC 9的业务流信息，点画线所示的从host->ASIC 3->ASIC 7->ASIC 2->ASIC 5的业务流信息。由于现有调试技术中，在业务的运行过程中没有关注核间的调用关系，对于用户而言，无法直观地获取到业务在处理器之间的调用关系，只能获取的某个核上的栈帧。比如，当命中ASIC 8上的断点时，当前只能获取到ASIC 8上的栈帧，但是却无法获取到从host->ASIC 0->ASIC 4->ASIC 8的业务流信息。

图7示出了本申请实施例提供的一种多线程业务流的示意图。如图7所示，本申请实施例在调试程序过程中当命中断点时，可以将堆栈缓冲区中与当前线程相关联的堆栈进行显示，例如当命中ASIC 8上的断点时，当前不仅可以获取到ASIC 8上的堆栈信息，还能够获取到从host->ASIC 0->ASIC 4->ASIC 8的业务流信息。当进行核切换时，还可以显示从host->ASIC 1->ASIC 6->ASIC 9的业务流信息，从host->ASIC 3->ASIC 7->ASIC 2->ASIC 5的业务流信息。从而本申请实施例能够提供直观的业务流程图，使得开发者在调试过程中能够获取业务的端到端的流向，提高开发者定位问题的效率。

图8示出了本申请实施例提供的一个具体的调试程序的例子。应理解，图8示出了调试程序的方法的步骤或操作，但这些步骤或操作仅是示例，本申请实施例还可以执行其他操作或者图8中的各个操作的变形。此外，图8中的各个步骤可以按照与图8呈现的不同的顺序来执行，并且有可能并非要执行图8中的全部操作。

本申请实施例中，被调试程序的代码主要分为以下3个部分：

main函数，为host侧的代码，编译运行在host侧；

asic0_fun函数，为device侧的代码，编译运行在ASIC 0侧；

asic1_fun函数，为device侧，编译运行在ASIC 1侧。

作为示例，被调试程序如下所示：

801，启动被调试程序。

具体的，调试模块建立调试代理进程，确定被调试进程。作为示例，调试模块在ASIC1侧的代码中设置断点。然后，调试模块可以通过调试代理模块向CPU发送启动调试命令。

802，CPU执行main函数。

具体的，被调试进程在运行过程中，先执行host侧的程序。假定此时运行的thread_id为0。此时，main函数的栈帧中包括标识thread_0。

803，main函数调用ASIC0上的asic0_func函数。

具体的，在执行host侧的程序的过程中，main函数会调用asic0_fun函数，将执行在ASIC0侧的业务。在此时，被调试程序的调度框架会将任务调度发送给调试代理模块。

804，调试代理模块通知调试模块核间调度。

调试代理模块收到该信息后，给调试模块发送信号，用于通知调试模块main函数对asic0_func函数进行调度。

805，调试模块保存CPU当前栈帧。

调试模块收到调试代理模块发送的该信号后，确认是任务调度信号，此时将当前设备的堆栈信息进行保存。具体而言，此时调试模块保存CPU中的main函数当前的栈帧。

此时为第一次在堆栈缓冲区存入栈帧，当前的堆栈缓冲区不存在需要保存的栈帧的thread_id为0对应的堆栈链表，因此需要新建一个堆栈链表，将当前该main函数的栈帧作为一个初始节点加入链表中，作为示例，该栈帧可以标示为栈帧0(stack frame_0)，该栈帧中的信息具体为int main()at xxx.cce:10。

806，ASIC 0执行asic0_func函数，此时业务在ASIC 0上继续执行。

807，asic0_func函数调用ASIC1上的asic1_func函数。

808，调试代理模块通知调试模块核间调度。

同理地，调试代理模块需要通过信号通知给调试模块，通知asic0_func函数对asic1_func函数进行调度。

809，调试模块保存ASIC 0当前栈帧。

具体的，调试模块将当前ASIC 0的栈帧加入堆栈链表中。具体的，在将ASIC 1上的asic1_func函数当前的栈帧加入堆栈链表时，会将当前ASIC 0的栈帧加到thread_id为0的堆栈中，即stack_main所在的链表。作为示例，该新加入的栈帧可以表示为栈帧1(stack frame_1)，该栈帧中的信息具体为void asic0_fun()at xxx.cce:6。

因此，本申请实施例通过在函数的栈帧中增加用于标识该函数所属的线程的标识字段，当第一处理模块上运行的第一函数调用第二设备上的第二函数时，将该第一函数当前的栈帧保存到堆栈缓冲区中，使得堆栈缓冲区中保存的第一函数的栈帧与该第一函数所属的线程相关联，实现对同一个线程的堆栈信息的记录，基于此本申请实施例能够在调试过程中记录业务的端到端的流向，提高开发者定位问题的效率。

图9示出了本申请实施例提供的一种显示全栈信息的方法的示意性流程图。应理解，图9示出了显示全栈信息的方法的步骤或操作，但这些步骤或操作仅是示例，本申请实施例还可以执行其他操作或者图9中的各个操作的变形。此外，图9中的各个步骤可以按照与图9呈现的不同的顺序来执行，并且有可能并非要执行图9中的全部操作。

图9中与图8中相同的模块或单元具有相同或相似的含义，为了简洁，这里不再描述。

901，命中ASIC 1上的断点。

902，在901之后，ASIC 1可以向调试模块上报断点事件。

903，调试模块调用backtrace命令。具体的，903可以包括9031、9032和9033三部分。

具体而言，在命中断点之后，可以返回用户的调试界面。当用户通过backtrace命令进行堆栈显示时，首先执行9031，将ASIC1上的栈帧显示出来。作为示例，ASIC 1上的栈帧为void asic1_fun()at xxx.cce:2。然后执行9032，获取ASIC 1上的栈帧上的标识thread_id，具体的，本申请实施例中可以得到thread_id为thread_0。然后，去堆栈缓冲区中查找thread_0的堆栈链表。此时，能够在堆栈缓冲区查找到thread_0的堆栈链表，本申请实施例中该堆栈链表包括stack frame_0和stack frame_1。作为示例，此时可以将该链表逆序输出，从而获取从ASIC 1->ASIC 0->host的全栈信息，如下所示：

本申请另一个实施例中，如果host侧为多线程程序，假设用户创建两个线程分别进行业务处理，该两个线程例如分别为线程0(thread_0)和线程1(thread_1)，用户在thread_0的ASIC2上打了断点。同时，thread_1的asic4上的业务耗时较久，在ASIC 2命中断点时，asic4仍会进行业务处理。

当thread_0调度到ASIC 0时，根据上文中的描述，会将thread_0的host侧的栈帧加入到全局堆栈缓冲区中，并新建一个以thread_0作为关键字的堆栈链表。

当thread_1调度到ASIC 3时，会将thread_1的host侧的栈帧加如到全局堆栈缓冲区中，并新建一个以thread_1作为关键字的堆栈链表。

当thread_0调度到ASIC 1时，ASIC 0的栈帧需要入栈，此时，由于在堆栈缓冲区中已经存在thread_0对应的堆栈链表，因此将ASIC 0的栈帧加入到thread_0对应的堆栈链表中。

当thread_1调度到ASIC 4时，ASIC 3的栈帧需要入栈，此时，由于在堆栈缓冲区中已经存在thread_1对应的堆栈链表，因此将ASIC 3的栈帧加入到thread_1对应的堆栈链表中。

当thread_0调度到ASIC 2时，将ASIC 1的堆栈加入到thread_0对应的堆栈链表中。当ASIC 2命中断点时，当前的堆栈缓冲区如图10所示，其中thread_0包含host/ASIC 0/ASIC 1的栈帧，并保留它们的调用顺序，thread_1包含host/ASIC 3的栈帧。

因此，本申请实施例通过在函数的栈帧中增加用于标识该函数所属的线程的标识字段，当第一处理模块上的第一函数调用第二函数时，将该第一函数当前的栈帧保存到堆栈缓冲区中，使得堆栈缓冲区中保存的第一函数的栈帧与该第一函数所属的线程相关联，实现对同一个线程的堆栈信息的记录，基于此本申请实施例能够在调试过程中记录业务的端到端的流向，提高开发者定位问题的效率。

本申请实施例中，当命中ASIC 2上的断点时，用户通过backtrace命令查看当前栈帧时，先获取ASIC 2设备上的栈帧，解析ASIC 2的栈帧中的thread_id字段时，本申请实施例中可以得到该thread_id为thread_0，然后从堆栈缓冲区中查找thread_0的堆栈，由于堆栈缓冲区中存在thread_0的堆栈链表，因此会依次将该堆栈链表解析，进而获取全部的堆栈信息，该堆栈信息如下所示：

如果用户这个时候进行了切换核的操作，比如切换到ASIC 4上，通过backtrace命令查看当前栈帧时，先获取ASIC 4上的堆栈信息，解析ASIC 4的栈帧中的thread_id字段是thread_1，会从堆栈缓冲区中查找thread_id为thread_1的堆栈，由于堆栈缓冲区存在thread_1的堆栈链表，因此会依次将该堆栈链表解析，进而获取到全栈信息，该全栈信息如下：

图11示出了本申请实施例提供的一种调试程序的系统1100的示意图。该系统1100包括第一处理模块1110、第二处理模块1120、调试代理模块1130、调试模块1140和堆栈缓冲区1150。

第一处理模块1100，用于执行被调试程序的第一函数，其中，所述第一函数的栈帧包括第一标识，所述第一标识用于标识所述第一函数所属的线程。

在所述第一处理模块1100上运行的第一函数调用第二函数时，第二处理模块1120，用于执行所述第二函数，所述第二函数的栈帧包括所述第一标识，所述第一标识用于标识所述第二函数所属的线程，其中，所述第二函数与所述第一函数属于相同的线程。

调试代理模块1130，用于获取调度信息，所述调度信息用于指示所述第一函数调用所述第二函数；

所述调试代理模块1130还用于向调试模块1140发送通知消息，所述通知消息用于通知所述第一函数调用所述第二函数；

所述调试模块1140用于将所述第一函数当前的第一栈帧保存到堆栈缓冲区1150。

可选的，该调试程序的系统1100还包括获取模块，用于：

可选的，所述调试模块1140具体用于：

将所述第一栈帧添加到所述堆栈缓冲区中的所述第一函数所属的线程对应的堆栈链表中。

可选的，所述调试模块1140具体用于：

在所述堆栈缓冲区中建立所述第一函数所属的线程对应的堆栈链表，所述堆栈链表的初始节点为所述第一栈帧。

可选的，第一处理模块1110为主机侧处理器，所述第二处理模块1120为设备侧处理器。

图11所示的调试程序的系统1100能够实现前述方法实施例对应的各个过程，具体的，该调试程序的系统1100中的各个模块可以参见上文中的描述，为避免重复，这里不再赘述。

本申请实施例还提供了一种计算机可读介质，用于存储计算机程序，该计算机程序包括用于执行上述调试程序的方法的指令。

本申请实施例还提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序代码，当所述计算机程序代码被所述调试程序的系统中的处理模块或处理器运行时，使得该调试程序的系统执行上述调试程序的方法。

应理解，本发明实施例中提及的处理器可以是CPU，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

还应理解，本发明实施例中提及的存储器或存储模块可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DR RAM)。

需要说明的是，当处理器为通用处理器、DSP、ASIC、FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件时，存储器(存储模块)集成在处理器中。

应理解，本申请实施例中出现的第一、第二等描述，仅作示意与区分描述对象之用，没有次序之分，也不表示本申请实施例中对设备个数的特别限定，不能构成对本申请实施例的任何限制。

还应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种调试程序的方法，其特征在于，包括：

第一处理模块执行被调试程序的第一函数，其中，所述第一函数的栈帧包括第一标识，所述第一标识用于标识所述第一函数所属的线程；

在所述第一函数调用第二函数时，第二处理模块执行所述第二函数，所述第二函数的栈帧包括所述第一标识，所述第一标识用于标识所述第二函数所属的线程，其中，所述第二函数与所述第一函数属于相同的线程；

调试代理模块获取调度信息，所述调度信息用于指示所述第一函数调用所述第二函数；

所述调试代理模块向调试模块发送通知消息，所述通知消息用于通知所述第一函数调用所述第二函数；

所述调试模块将所述第一函数当前的第一栈帧保存到堆栈缓冲区。
根据权利要求1所述的方法，其特征在于，还包括：

在命中所述第二函数上的断点之后，获取所述第二函数当前的第二栈帧；

获取所述第二栈帧中包括的所述第一标识，并获取所述堆栈缓冲区中的包括所述第一标识的栈帧。
根据权利要求1或2所述的方法，其特征在于，所述调试模块将所述第一函数当前的第一栈帧保存到堆栈缓冲区，包括：

所述调试模块将所述第一栈帧添加到所述堆栈缓冲区中的所述第一函数所属的线程对应的堆栈链表中。
根据权利要求1或2所述的方法，其特征在于，所述调试模块将所述第一函数当前的第一栈帧保存到堆栈缓冲区，包括：

所述调试模块在所述堆栈缓冲区中建立所述第一函数所属的线程对应的堆栈链表，所述堆栈链表的初始节点为所述第一栈帧。
根据权利要求1-4任一项所述的方法，其特征在于，第一处理模块为主机侧处理器，所述第二处理模块为设备侧处理器。
一种调试程序的系统，其特征在于，包括：

第一处理模块，用于执行被调试程序的第一函数，其中，所述第一函数的栈帧包括第一标识，所述第一标识用于标识所述第一函数所属的线程；

在所述第一处理模块上运行的第一函数调用第二函数时，第二处理模块，用于执行所述第二函数，所述第二函数的栈帧包括所述第一标识，所述第一标识用于标识所述第二函数所属的线程，其中，所述第二函数与所述第一函数属于相同的线程；

调试代理模块，用于获取调度信息，所述调度信息用于指示所述第一函数调用所述第二函数；

所述调试代理模块还用于向调试模块发送通知消息，所述通知消息用于通知所述第一函数调用所述第二函数；

所述调试模块用于将所述第一函数当前的第一栈帧保存到堆栈缓冲区。
根据权利要求6所述的系统，其特征在于，还包括获取模块，用于：

在命中所述第二函数上的断点之后，获取所述第二函数当前的第二栈帧；

获取所述第二栈帧中包括的所述第一标识，并获取所述堆栈缓冲区中的包括所述第一标识的栈帧。
根据权利要求6或7所述的系统，其特征在于，所述调试模块具体用于：

将所述第一栈帧添加到所述堆栈缓冲区中的所述第一函数所属的线程对应的堆栈链表中。
根据权利要求6或7所述的系统，其特征在于，所述调试模块具体用于：

在所述堆栈缓冲区中建立所述第一函数所属的线程对应的堆栈链表，所述堆栈链表的初始节点为所述第一栈帧。
根据权利要求6-9任一项所述的系统，其特征在于，第一处理模块为主机侧处理器，所述第二处理模块为设备侧处理器。