CN102902512B

CN102902512B - 一种基于多线程编程及消息队列的多线程并行处理方法

Info

Publication number: CN102902512B
Application number: CN201210316211.7A
Authority: CN
Inventors: 吴庆; 张清; 赵开勇
Original assignee: Inspur Electronic Information Industry Co Ltd
Current assignee: Inspur Electronic Information Industry Co Ltd
Priority date: 2012-08-31
Filing date: 2012-08-31
Publication date: 2015-12-16
Anticipated expiration: 2032-08-31
Also published as: CN102902512A

Abstract

本发明提供一种基于多线程编程及消息队列的多线程并行处理方法，属于计算机高性能计算领域。本发明对传统单线程串行软件的并行化进行改造，利用当前流行的多核CPU计算设备、pthread多线程并行计算技术及消息队列实现线程间通信的技术，其方法内容包括：在单节点内，创建三类pthread线程，分别为读、计算、写线程，并且各类线程数目灵活可配置，开辟多缓存，创建四个队列，用于线程间通信，调配计算任务及管理缓存空间资源。该方法广泛适用于具有多线程并行处理需求的应用场合，可指导软件开发人员对现有软件进行多线程化改造，实现软件对系统资源利用最优化，显著提高硬件资源利用率，提高软件的计算效率和软件整体性能。

Description

一种基于多线程编程及消息队列的多线程并行处理方法

技术领域

本发明涉及计算机应用技术领域,具体地说是一种基于多线程编程及消息队列的多线程并行处理方法。

背景技术

硬件系统在新技术的推动下进行着快速演进，表现出更好的性能、更低的价格，如传统CPU从单核向多核直至众核发展。但随着计算设备体系结构的多样化，多核化，软件系统仅仅依靠硬件的更新从而获得性能提升的方式已经不符合现有硬件的发展趋势，例如传统的单线程串行程序在多核计算设备下不能表现出更好的性能。硬件发展的最终目的是推动应用软件的表现，进而推进整个计算系统的性能。因此软件系统不能仅仅依靠硬件性能的发展，而应该同时针对硬件系统的发展进行软件系统的再次开发和更新。这也是目前计算架构下我们遇到的最大挑战，而软件系统的再次开发和改造则显得极为必要。目前国内外针对CPU多核体系结构的应用开发在CPU多核发展之初就如火如荼地展开了，并陆续开发或改造出相当数量的应用。随着多核体系结构处理器的普及，应用软件多线程并行处理方式将逐渐成为主流。

发明内容

本发明的目的是提供一种基于多线程编程及消息队列的多线程并行处理方法。

本发明的目的是按以下方式实现的，在单节点内，创建三类pthread线程，分别为读、计算、写线程，并且各类线程数目灵活可配置，开辟多缓存，创建四个队列，用于线程间通信，调配计算任务及管理缓存空间资源，具体步骤如下：

一、基于多缓冲和消息队列建立任务分发机制，包括：

1)计算任务的划分：任务划分的基本单位总的计算任务数是TOTAL_JOB，它可以被划分成多个子任务，定义每个子任务大小为JOB_SIZE，定义灵活的任务划分策略，软件有自动配置模式和用户手动配置模式；

2)任务分发、执行策略，包括：

(1)子任务实际由读线程来生成；读线程定义每个子任务的信息tmp_msg，包括：job_begin,job_size,buf_id；

其中：job_begin是该任务计数编号，通过它可以确定该任务的起始LINE号和CMP号；

job_size定义了该任务的大小，其上限是预先已经定义好的JOB_SIZE；

buf_id指明了该任务所在的BUF编号；

(2)任务信息tmp_msg的类型实际上就是消息队列成员的类型，被加入到各个队列中；

3)子任务执行所需资源的竞争策略完成一个子任务，需要如下几个步骤：

d)读线程根据当前读取进度CURRENT_READ_STEP及总作业大TOTAL_STEP，确定当前任务的起始job_begin,任务大小job_size，并且从空SR_BUF队列SR_BUF_EMPTY_QUEUE中获取一个空的SR_BUF_ID，将数据读入SR_BUF_ID对应的SR_BUF中,即SR_BUF[SR_BUF_ID]，然后将新生成的任务信息保存至tmp_msg中，并将tmp_msg加入新计算任务队列SR_BUF_FULL_QUEUE中；

e)计算线程需先从新计算任务队列SR_BUF_FULL_QUEUE中获取一个新计算任务，然后再从空闲目标缓冲队列DR_BUF_EMPTY_QUEUE中获取一个空闲DR_BUF_ID，之后才进行计算，计算源数据为SR_BUF[SR_BUF_ID]，计算结果存放于DR_BUF[DR_BUF_ID]中，计算结束后，释放SR_BUF_ID对应的源数据缓存，即将SR_BUF_ID加入SR_BUF_EMPTY_QUEUE队列中，并告知写线程进行输出，即将tmp_msg加入到待输出队列DR_BUF_FULL_QUEUE中；

f)写线程从待输出任务队列DR_BUF_FULL_QUEUE中获取一个写任务信息tmp_msg，该任务信息定义了数据存放的DR_BUF_ID以及该写任务需要写到的位置信息，即job_begin，以及写任务的规模job_size，写线程完成该输出任务后，需要告知计算线程DR_BUF[DR_BUF_ID]中的数据已经输出完毕，可重新用于存放计算结果,即将DR_BUF_ID加入DR_BUF_EMPTY_QUEUE队列中；

二、多缓冲设计

设计多个源数据缓冲SR_BUF和目标数据缓冲DR_BUF，缓冲的数目灵活可调，为了以最少的缓冲达到最高的效能，缓冲的个数有一个临限值，理论上，源缓冲与目标缓冲的数目至少为计算线程数的2倍，即：

SR_BUF_NUM>＝2*COMPUTE_THREAD_NUM，DR_BUF_NUM>＝2*COMPUTE_THREAD_NUM

考虑到实际生产中网络资源的竟争和不稳定因素，保证计算线程随时都能获得一个源缓冲和一个目标缓冲，软件为每个计算线程预留一个缓冲余量，默认将源数据缓冲和目标缓冲数都设置为计算线程数的3倍；

三、环形消息队列设计

为了实现上述任务分发策略，设计以下四个队列：

其中消息队列中存放的消息数据类型定义如下：

1>SR_BUF_FULL_QUEUE:新的计算任务队列新计算任务消息队列，记录作业信息JOB_INFO(包括JOB_BEGIN，JOB_SIZE，SR_BUF_ID)，由读线程写入(生产)，计算线程弹出(消费)当读线程向SR_BUF_ID读入新数据时，将JOB_INFO入队，计算线程弹出JOB_INFO时，计算SR_BUF_ID对应的源数据；

2>SR_BUF_EMPTY_QUEUE:存放当前空闲SR_BUF_ID号源缓冲释放消息队列，与SR_BUF_FULL_QUEUE功能相反，由计算线程写入，读线程弹出，当SR_BUF_ID对应的任务计算完毕时，释放SR_BUF_ID，告知读线程可对其更新数据；

3>DR_BUF_EMPTY_QUEUE:存放当前空闲DR_BUF_ID号目标缓冲为空消息队列，记录DR_BUF_ID号，由写线程写入，计算线程弹出；

当写线程对DR_BUF_ID数据输出完毕时，将DR_BUF_ID入队，告知计算线程，该DR_BUF_ID输出完毕可重新用于计算，计算线程弹出DR_BUF_ID时，启动计算，并将结果写入DR_BUF_ID对应的目标缓冲中；

4>DR_BUF_FULL_QUEUE:新的写任务队列新写任务消息队列，记录作业信息JOB_INFO，包括JOB_BEGIN，JOB_SIZE，DR_BUF_ID，由计算线程写入，写线程弹出；

当计算线程向DR_BUF_ID读入新数据时，将JOB_INFO入队，写线程弹出JOB_INFO时，对DR_BUF_ID对应的目标数据进行输出；

四、线程设计

1)主线程设计

(1)主线程功能及运行流程如下：

参数预处理；

定义读、计算、写线程数；

定义源、目标缓存数目，与计算线程数相关；

定义任务划分粒度，即子任务规模JOB_SIZE；

开辟源、目标缓冲内存空间；

创建并初始化消息队列、锁、信号量；

创建并启动读、计算、写线程；

等待所有线程退出；

其它处理；

程序退出；

(2)线程伪代码

1>INIT(PARA)；

2>SET(THREAD_NUM)；

3>SET(BUF_NUM)；

4>SET(JOB_SIZE)

5>CREATE(OUTPUT_FILE_LIST)；

6>MALLOC(BUF)；

7>INIT(QUEUE)；

8>INIT(MUTEX)；

9>INIT(SEM)；

10>INIT(PROGRESS,Total_Step)；

11>CREATE(THREADS)；

12>WHILEState_Flag&&！wasCancelled&&progress<＝Total_Step

13>IFPROGRESSS.wasCancelled()

14>wasCancelled＝true；

15>break；

16>ENDIF

17>IF！State_Flag

18>breadk

19>ENDIF

20>SEM_WAIT(progress_sm)；

21>progress+＝JOB_SIZE；

22>SET_PROGRESS(progress)；

23>DONE

24>JOIN(THREADS)；

25>IFState_Flag&&！wasCancelled

26>CREATESEIS_INDEX(OUTPUT_FILE_LIST)；

27>ELSE

28>DELETESEIS_OBJ(OUTPUT_FILE_LIST)；

29>ERROR_PROCESS()；

30>EXIT

31>ENDIF

32>DELETE(PROGRESS)；

33>DELETE(BUF)；

34>DESTROY(MUTEX)；

35>DESTROY(SEM)；

36>PRINTF(LOG)；

37>EXIT；

1)读线程设计

(1)线程数设计

根据实际应用需求，灵活设置读线程数，默认只设置一个读线程；

(2)线程功能及运行流程

1>参数初始化；

2>检查错误标志及用户行为，如果出错或被用户取消，则进入步骤9，否则进入步聚3；

3>检查当前任务进度READ_CURRENT_STEP，判断是否完成所有读任务，如果是，则进入步骤9，否则进入步聚4；

4>根据当前读进度READ_CURRENT_STEP和总任务数Total_Step，计算剩余任务数left_job，生成新任务起始job_begin及大小信息Job_size,job_size上限为JOB_SIZE，更新任务计数READ_CURRENT_STEP；

5>从SR_BUF_EMPTY_QUEUE队列中获得一个空闲SR_BUF_ID；

6>从源文件INPUT_FILE中读取任务源数据至源数据缓存SR_BUF[SR_BUF_ID]中；

7>将该任务信息tmp_msg加入新计算任务队列SR_BUF_FULL_QUEUE中；

8>返回步骤2；

9>线程退出；

(3)线程伪代码

a)INIT

b)WHILEState_Flag&&！wasCancelled

c)IFREAD_CURRENT_STEP<＝Total_Step

d)job_begin＝READ_CURRENT_STEP；

e)job_left＝Total_Step-READ_CURRENT_STEP；

f)IFjob_left>JOB_SIZE

g)job_size＝JOB_SIZE；

h)ELSE

i)job_size＝job_left；

j)READ_CURRENT_STEP+＝job_size；

k)tmp_msg＝SR_BUF_EMPTY_QUEUE.pop()；

l)SR_BUF_id＝tmp_msg.buf_id；

m)READ(INPUT_FILE,SR_BUF[SR_BUF_id])

n)tmp_msg(job_begin,job_size,SR_BUF_id)；

o)SR_BUF_FULL_QUEUE.push(tmp_msg)；

p)ELSE

q)pthread_exit()；

r)ENDIF

s)DONE

t)pthread_exit()；

2)计算线程设计

(1)线程数设计：

默认情况下，计算线程数为系统可用CPU核数，即SYS_CPU_CORE_NUM，用户通过宏COMPUTE_THREAD_NUM来定义计算线程数；

(2)线程功能及运行流程：

a)参数初始化；

b)检查错误标志及用户行为，如果出错或被用户取消，则进入步聚10，否则进入步聚3；

c)检查当前任务进度COMPUTE_CURRENT_STEP，判断是否完成所有读任务，如果是，则进入步骤10，否则进入步聚4；

d)从新计算任务队列SR_BUF_FULL_QUEUE中获取一个任务信息tmp_msg，其包含了任务的起始信息job_begin，大小信息job_size,以及任务数据存放源缓冲编号SR_BUF_ID，并更新任务计数COMPUTE_CURRENT_STEP；

e)从DR_BUF_EMPTY_QUEUE队列中获得一个空闲的DR_BUF_ID；

f)以SR_BUF[SR_BUF_ID]为数据输入缓存，以DR_BUF[DR_BUF_ID]为数据输出缓存进行计算；

g)将SR_BUF_ID加入SR_BUF_EMPTY_QUEUE中，表示SR_BUF[SR_BUF_ID]所存的数据计算完毕，需要重新加载源数据；

h)根据计算任务信息，生成写任务信息，并将其加入到DR_BUF_FULL_QUEUE队列中，表示需要写线程进行输出；

i)返回步骤2；

j)线程退出；

(3)线程伪代码

a)INIT

b)WHILEState_Flag&&！wasCancelled

c)IFCOMPUTE_CURRENT_STEP<＝Total_Step

d)tmp_msg＝SR_BUF_FULL_QUEUE.pop()

e)job_begin＝tmp_msg.job_begin；

f)job_size＝tmp_msg.job_size；

g)SR_BUF_id＝tmp_msg.buf_id；

h)COMPUTE_CURRENT_STEP+＝job_size；

i)tmp_msg＝DR_BUF_EMPTY_QUEUE.pop()；

j)DR_BUF_id＝tmp_msg.buf_id；

k)COMPUTE(INPUT_FILE,SR_BUF[SR_BUF_id],DR_BUF[DR_BUF_id])

l)tmp_msg(-1,-1,SR_BUF_id)；

m)SR_BUF_EMPTY_QUEUE.push(tmp_msg)；

n)tmp_msg(job_begin,job_size,DR_BUF_id)；

o)DR_BUF_FULL_QUEUE.push(tmp_msg)；

p)ELSE

q)pthread_exit()；

r)ENDIF

s)DONE

t)pthread_exit()；

4)写线程设计

(1)线程数设计

根据实际应用需求，灵活设置写线程数，默认只设置一个写线程；

(2)线程功能及运行流程

1>参数初始化；

3>检查当前任务进度WRITE_CURRENT_STEP，判断是否完成所有读任务，如果是，则进入步骤9，否则进入步聚4；

4>从新写任务队列DR_BUF_FULL_QUEUE中获取一个写任务信息tmp_msg，其包含了任务的起始信息job_begin，大小信息job_size,以及任务数据存放目标缓冲编号DR_BUF_ID，并更新任务计数WRITE_CURRENT_STEP；

5>将目标缓存DR_BUF[DR_BUF_ID]中的数据输出至OUTPUT_FILE；

6>将DR_BUF_ID加入DR_BUF_EMPTY_QUEUE中，表示DR_BUF[DR_BUF_ID]所存的数据输出完毕，需要重新加载计算结果；

7>向主线程发送更新进度条信号；

8>返回步骤2；

9>线程退出；

(1)线程伪代码

a.INIT

b.WHILEState_Flag&&！wasCancelled

c.IFWRITE_CURRENT_STEP<＝Total_Step

d.tmp_msg＝DR_BUF_FULL_QUEUE.pop()；

e.job_begin＝tmp_msg.job_begin；

f.job_size＝tmp_msg.job_size；

g.DR_BUF_id＝tmp_msg.buf_id；

h.WRITE_CURRENT_STEP+＝job_size；

i.WRITE(OUTPUT_FILE,DR_BUF[DR_BUF_id])

j.tmp_msg(-1,-1,DR_BUF_id)；

k.DR_BUF_EMPTY_QUEUE.push(tmp_msg)；

l.SEM_POST(progress_sem)；

m.ELSE

n.pthread_exit()；

o.ENDIF

p.DONE

q.pthread_exit()。

本发明的有益效果是：该方法广泛适用于具有多线程并行处理需求的应用场合，指导软件开发人员以较短的开发周期，较低的开发成本，快速高效地对现有软件进行多线程化改造，实现软件对系统资源利用最优化，读数据，计算，写回数据的互相掩盖，最大限度地缩短软件运行时间，显著提高硬件资源利用率，提高软件的计算效率和软件整体性能。

附图说明

图1是系统运行时序图；

图2是数据并发处理时序图。

具体实施方式

结合附图1和附图2对本发明的一种基于pthread及消息队列的多线程并行处理方法作进一步详细说明。

本发明的一种基于pthread及消息队列的多线程并行处理方法，是对传统单线程串行软件的并行化进行改造，利用当前流行的多核CPU计算设备、pthread多线程并行计算技术及消息队列实现线程间通信的技术，最大化提升硬件计算资源利用率，提升软件运行效能的通用方法。

本发明所提方法的内容包括：在单节点内，创建三类pthread线程，分别为读、计算、写线程，并且各类线程数目灵活可配置，开辟多缓存，创建四个队列，用于线程间通信，调配计算任务及管理缓存空间资源。

为了使本发明的目的、技术方案和优点更加清晰，下面详细描述本发明所述方法的实现过程。

一、基于多缓冲和消息队列建立任务分发机制

1)计算任务的划分

(1)任务划分的基本单位总的计算任务数是TOTAL_JOB，它可以被划分成多个子任务，我们定义，每个子任务大小为JOB_SIZE。

(2)子任务规模的制约因素及权衡考量

a)存储容量的限制

由于我们需要大量的源缓冲和目标缓冲，所以存储容量限制是定义JOB_SIZE的重要考量因素。

b)总任务规模限制

子任务大小的上限就是总任务规模，即整个作业当成一个子任务来完成。

c)计算线程数考量

合理确定任务划分粒度，尽量保证每个计算线程都能分到计算任务，最大限度地实现读、计算、写时间的掩盖。

综合以上考量，我们定义灵活的任务划分策略，软件有自动配置模式和用户手动配置模式。

2)任务分发、执行策略

(1)子任务实际由读线程来生成。

读线程定义每个子任务的信息tmp_msg，主要包括job_begin,job_size,buf_id,其中：

job_begin是该任务计数编号，通过它可以确定该任务的起始LINE号和CMP号。

job_size定义了该任务的大小，其上限是预先已经定义好的JOB_SIZE。

buf_id指明了该任务所在的BUF编号。

(2)任务信息tmp_msg的类型实际上就是消息队列成员的类型，被加入到各个队列中。

(3)子任务执行所需资源的竞争策略

完成一个子任务，需要如下几个步骤：

a)读线程根据当前读取进度CURRENT_READ_STEP及总作业大TOTAL_STEP，确定当前任务的起始job_begin,任务大小job_size，并且从空SR_BUF队列SR_BUF_EMPTY_QUEUE中获取一个空的SR_BUF_ID，将数据读入SR_BUF_ID对应的SR_BUF中,即SR_BUF[SR_BUF_ID]，然后将新生成的任务信息保存至tmp_msg中，并将tmp_msg加入新计算任务队列SR_BUF_FULL_QUEUE中。

b)计算线程需先从新计算任务队列SR_BUF_FULL_QUEUE中获取一个新计算任务，然后再从空闲目标缓冲队列DR_BUF_EMPTY_QUEUE中获取一个空闲DR_BUF_ID。之后才进行计算，计算源数据为SR_BUF[SR_BUF_ID]，计算结果存放于DR_BUF[DR_BUF_ID]中，计算结束后，释放SR_BUF_ID对应的源数据缓存，即将SR_BUF_ID加入SR_BUF_EMPTY_QUEUE队列中，并告知写线程进行输出，即将tmp_msg加入到待输出队列DR_BUF_FULL_QUEUE中。

c)写线程从待输出任务队列DR_BUF_FULL_QUEUE中获取一个写任务

信息tmp_msg，该任务信息定义了数据存放的DR_BUF_ID以及该写任务需要写到的位置信息，即job_begin，以及写任务的规模job_size。写线程完成该输出任务后，需要告知计算线程DR_BUF[DR_BUF_ID]中的数据已经输出完毕，可重新用于存放计算结果,即将DR_BUF_ID加入DR_BUF_EMPTY_QUEUE队列中。

二、多缓冲设计

设计多个源数据缓冲SR_BUF和目标数据缓冲DR_BUF，缓冲的数目灵活可调，为了以最少的缓冲达到最高的效能，缓冲的个数有一个临限值，理论上，源缓冲与目标缓冲的数目至少为计算线程数的2倍，即SR_BUF_NUM>＝2*COMPUTE_THREAD_NUM，DR_BUF_NUM>＝2*COMPUTE_THREAD_NUM。考虑到实际生产中网络资源的竟争和不稳定因素，保证计算线程随时都能获得一个源缓冲和一个目标缓冲，软件为每个计算线程预留一个缓冲余量，默认将源数据缓冲和目标缓冲数都设置为计算线程数的3倍。

三、环形消息队列设计

为了实现上述任务分发策略，我们设计以下四个队列：

其中消息队列中存放的消息数据类型定义如下：

1)SR_BUF_FULL_QUEUE:新的计算任务队列:新计算任务消息队列，记录作业信息JOB_INFO(包括JOB_BEGIN，JOB_SIZE，SR_BUF_ID)，由读线程写入(生产)，计算线程弹出(消费)当读线程向SR_BUF_ID读入新数据时，将JOB_INFO入队，计算线程弹出JOB_INFO时，计算SR_BUF_ID对应的源数据。

2)SR_BUF_EMPTY_QUEUE:存放当前空闲SR_BUF_ID号源缓冲释放消息队列，与SR_BUF_FULL_QUEUE功能相反，由计算线程写入(生产)，读线程弹出(消费)当SR_BUF_ID对应的任务计算完毕时，释放SR_BUF_ID，告知读线程可对其更新数据。

3)DR_BUF_EMPTY_QUEUE:存放当前空闲DR_BUF_ID号目标缓冲为空消息队列，记录DR_BUF_ID号，由写线程写入(生产)，计算线程弹出(消费)。

当写线程对DR_BUF_ID数据输出完毕时，将DR_BUF_ID入队，告知计算线程，该DR_BUF_ID输出完毕可重新用于计算，计算线程弹出DR_BUF_ID时，启动计算，并将结果写入DR_BUF_ID对应的目标缓冲中。

4)DR_BUF_FULL_QUEUE:新的写任务队列新写任务消息队列，记录作业信息JOB_INFO(包括JOB_BEGIN，JOB_SIZE，DR_BUF_ID)，由计算线程写入(生产)，写线程弹出(消费)。

当计算线程向DR_BUF_ID读入新数据时，将JOB_INFO入队，写线程弹出JOB_INFO时，对DR_BUF_ID对应的目标数据进行输出。

四、线程设计

1)主线程设计

(1)主线程功能及运行流程

A.参数预处理；

B.定义读、计算、写线程数；

C.定义源、目标缓存数目，与计算线程数相关；

D.定义任务划分粒度，即子任务规模JOB_SIZE；

E.开辟源、目标缓冲内存空间；

F.创建并初始化消息队列、锁、信号量；

G.创建并启动读、计算、写线程；

H.等待所有线程退出；

I.其它处理；

J.程序退出；

(2)线程伪代码

1>INIT(PARA)；

2>SET(THREAD_NUM)；

3>SET(BUF_NUM)；

4>SET(JOB_SIZE)

5>CREATE(OUTPUT_FILE_LIST)；

6>MALLOC(BUF)；

7>INIT(QUEUE)；

8>INIT(MUTEX)；

9>INIT(SEM)；

10>INIT(PROGRESS,Total_Step)；

11>CREATE(THREADS)；

12>WHILEState_Flag&&！wasCancelled&&progress<＝Total_Step

13>IFPROGRESSS.wasCancelled()

14>wasCancelled＝true；

15>break；

16>ENDIF

17>IF！State_Flag

18>breadk

19>ENDIF

20>SEM_WAIT(progress_sm)；

21>progress+＝JOB_SIZE；

22>SET_PROGRESS(progress)；

23>DONE

24>JOIN(THREADS)；

25>IFState_Flag&&！wasCancelled

26>CREATESEIS_INDEX(OUTPUT_FILE_LIST)；

27>ELSE

28>DELETESEIS_OBJ(OUTPUT_FILE_LIST)；

29>ERROR_PROCESS()；

30>EXIT

31>ENDIF

32>DELETE(PROGRESS)；

33>DELETE(BUF)；

34>DESTROY(MUTEX)；

35>DESTROY(SEM)；

36>PRINTF(LOG)；

37>EXIT

2)读线程设计

(1)线程数设计

根据实际应用需求，灵活设置读线程数，默认只设置一个读线程。

(2)线程功能及运行流程

1>参数初始化。

2>检查错误标志及用户行为，如果出错或被用户取消，则进入步骤9，否则进入步聚3。

3>检查当前任务进度READ_CURRENT_STEP，判断是否完成所有读任务，如果是，则进入步骤9，否则进入步聚4。

4>根据当前读进度READ_CURRENT_STEP和总任务数Total_Step，计算剩余任务数left_job，生成新任务起始job_begin及大小信息Job_size,job_size上限为JOB_SIZE，更新任务计READ_CURRENT_STEP。

5>从SR_BUF_EMPTY_QUEUE队列中获得一个空闲SR_BUF_ID。

6>从源文件INPUT_FILE中读取任务源数据至源数据缓存SR_BUF[SR_BUF_ID]中。

7>将该任务信息tmp_msg加入新计算任务队列SR_BUF_FULL_QUEUE中。

8>返回步骤2。

9>线程退出。

3)线程伪代码

1>.INIT

2>.WHILEState_Flag&&！wasCancelled

3>.IFREAD_CURRENT_STEP<＝Total_Step

4>.job_begin＝READ_CURRENT_STEP；

5>.job_left＝Total_Step-READ_CURRENT_STEP；

6>.IFjob_left>JOB_SIZE

7>.job_size＝JOB_SIZE；

8>.ELSE

9>.job_size＝job_left；

10>.READ_CURRENT_STEP+＝job_size；

11>.tmp_msg＝SR_BUF_EMPTY_QUEUE.pop()；

12>.SR_BUF_id＝tmp_msg.buf_id；

13>.READ(INPUT_FILE,SR_BUF[SR_BUF_id])

14>.tmp_msg(job_begin,job_size,SR_BUF_id)；

15>.SR_BUF_FULL_QUEUE.push(tmp_msg)；

16>.ELSE

17>.pthread_exit()；

18>.ENDIF

19>.DONE

20>.pthread_exit()；

4)计算线程设计

(1)线程数设计

默认情况下，计算线程数为系统可用CPU核数，即SYS_CPU_CORE_NUM。用户可以通过宏COMPUTE_THREAD_NUM来定义计算线程数。

(2)线程功能及运行流程

1>.参数初始化。

2>.检查错误标志及用户行为，如果出错或被用户取消，则进入步聚10，否则进入步聚3。

3>.检查当前任务进度COMPUTE_CURRENT_STEP，判断是否完成所有读任务，如果是，则进入步骤10，否则进入步聚4。

4>.从新计算任务队列SR_BUF_FULL_QUEUE中获取一个任务信息tmp_msg，其包含了任务的起始信息job_begin，大小信息job_size,以及任务数据存放源缓冲编号SR_BUF_ID，并更新任务计数COMPUTE_CURRENT_STEP。

5>.从DR_BUF_EMPTY_QUEUE队列中获得一个空闲的DR_BUF_ID。

6>.以SR_BUF[SR_BUF_ID]为数据输入缓存，以DR_BUF[DR_BUF_ID]为数据输出缓存进行计算。

7>.将SR_BUF_ID加入SR_BUF_EMPTY_QUEUE中，表示SR_BUF[SR_BUF_ID]所存的数据计算完毕，需要重新加载源数据。

8>.根据计算任务信息，生成写任务信息，并将其加入到DR_BUF_FULL_QUEUE队列中，表示需要写线程进行输出。

9>.返回步骤2。

10>.线程退出。

(3)线程伪代码

1>.INIT

2>.WHILEState_Flag&&！wasCancelled

3>.IFCOMPUTE_CURRENT_STEP<＝Total_Step

4>.tmp_msg＝SR_BUF_FULL_QUEUE.pop()

5>.job_begin＝tmp_msg.job_begin；

6>.job_size＝tmp_msg.job_size；

7>.SR_BUF_id＝tmp_msg.buf_id；

8>.COMPUTE_CURRENT_STEP+＝job_size；

9>.tmp_msg＝DR_BUF_EMPTY_QUEUE.pop()；

10>.DR_BUF_id＝tmp_msg.buf_id；

11>.COMPUTE(INPUT_FILE,SR_BUF[SR_BUF_id],DR_BUF[DR_BUF_id])

12>.tmp_msg(-1,-1,SR_BUF_id)；

13>.SR_BUF_EMPTY_QUEUE.push(tmp_msg)；

14>.tmp_msg(job_begin,job_size,DR_BUF_id)；

15>.DR_BUF_FULL_QUEUE.push(tmp_msg)；

16>.ELSE

17>.pthread_exit()；

18>.ENDIF

19>.DONE

20>.pthread_exit()；

5)写线程设计

(1)线程数设计

根据实际应用需求，灵活设置写线程数，默认只设置一个写线程。

(2)线程功能及运行流程

1>.参数初始化。

2>.检查错误标志及用户行为，如果出错或被用户取消，则进入步骤9，否则进入步聚3。

3>.检查当前任务进度WRITE_CURRENT_STEP，判断是否完成所有读任务，如果是，则进入步骤9，否则进入步聚4。

4>.从新写任务队列DR_BUF_FULL_QUEUE中获取一个写任务信息tmp_msg，其包含了任务的起始信息job_begin，大小信息job_size,以及任务数据存放目标缓冲编号DR_BUF_ID，并更新任务计数WRITE_CURRENT_STEP。

5>.将目标缓存DR_BUF[DR_BUF_ID]中的数据输出至OUTPUT_FILE。

6>.将DR_BUF_ID加入DR_BUF_EMPTY_QUEUE中，表示DR_BUF[DR_BUF_ID]所存的数据输出完毕，需要重新加载计算结果。

7>.向主线程发送更新进度条信号。

8>.返回步骤2。

9>.线程退出。

(3)线程伪代码

1>.INIT

2>.WHILEState_Flag&&！wasCancelled

3>.IFWRITE_CURRENT_STEP<＝Total_Step

4>.tmp_msg＝DR_BUF_FULL_QUEUE.pop()；

5>.job_begin＝tmp_msg.job_begin；

6>.job_size＝tmp_msg.job_size；

7>.DR_BUF_id＝tmp_msg.buf_id；

8>.WRITE_CURRENT_STEP+＝job_size；

9>.WRITE(OUTPUT_FILE,DR_BUF[DR_BUF_id])

10>.tmp_msg(-1,-1,DR_BUF_id)；

11>.DR_BUF_EMPTY_QUEUE.push(tmp_msg)；

12>.SEM_POST(progress_sem)；

13>.ELSE

14>.pthread_exit()；

15>.ENDIF

16>.DONE

17>.pthread_exit()；

5.性能测试及分析

将该方法应用于某个典型的石油行业应用软件模块多线程并行程序开发项目，并利用真实数据进行性能测试。

本次性能测试将针对不同规模的作业，利用不同规模的任务进行多次测试，并搜集测试数据，以进行性能分析。

1)测试环境及测试数据

测试环境包括硬件环境、软件环境。

(1)测试硬件环境

(2)软件环境

操作系统名称：RedHatLinux企业版，版本：5.3

编译器名称：Intel编译器，版本：10.1

数据库名称：Oracle数据库，版本：10g

应用系统名称：某地震资料解释软件模块

(3)测试数据及作业规模

测试数据为真实生产的3D实际数据。

作业规模：通过CMPline和CMP数来控制作业规模，下表为作业具体参数:

2)性能测试结果

在浪潮英信NF8520四路服务器上进行了不同规模作业的测试，测试结果如下：

3)性能测试结果分析

利用该方法对该软件模块进行多线程并行化改造后，显著地提升了该软件模块的运行效率，以较短的开发周期，获得了较高的性能加速比。

除说明书所述的技术特征外，均为本专业人员的已知技术。

Claims

1.一种基于多线程编程及消息队列的多线程并行处理方法，其特征在于在单节点内，创建三类pthread线程，分别为读、计算、写线程，并且各类线程数目灵活可配置，开辟多缓存，创建四个队列，用于线程间通信，调配计算任务及管理缓存空间资源，具体步骤如下：

一、基于多缓冲和消息队列建立任务分发机制，包括：

2)任务分发、执行策略，包括：

buf_id指明了该任务所在的BUF编号；

a)读线程根据当前读取进度CURRENT_READ_STEP及总作业大TOTAL_STEP，确定当前任务的起始job_begin,任务大小job_size，并且从空SR_BUF队列SR_BUF_EMPTY_QUEUE中获取一个空的SR_BUF_ID，将数据读入SR_BUF_ID对应的SR_BUF中,即SR_BUF[SR_BUF_ID]，然后将新生成的任务信息保存至tmp_msg中，并将tmp_msg加入新计算任务队列SR_BUF_FULL_QUEUE中；

b)计算线程需先从新计算任务队列SR_BUF_FULL_QUEUE中获取一个新计算任务，然后再从空闲目标缓冲队列DR_BUF_EMPTY_QUEUE中获取一个空闲DR_BUF_ID，之后才进行计算，计算源数据为SR_BUF[SR_BUF_ID]，计算结果存放于DR_BUF[DR_BUF_ID]中，计算结束后，释放SR_BUF_ID对应的源数据缓存，即将SR_BUF_ID加入SR_BUF_EMPTY_QUEUE队列中，并告知写线程进行输出，即将tmp_msg加入到待输出队列DR_BUF_FULL_QUEUE中；

c)写线程从待输出任务队列DR_BUF_FULL_QUEUE中获取一个写任务信息tmp_msg，该任务信息定义了数据存放的DR_BUF_ID以及该写任务需要写到的位置信息，即job_begin，以及写任务的规模job_size，写线程完成该输出任务后，需要告知计算线程DR_BUF[DR_BUF_ID]中的数据已经输出完毕，可重新用于存放计算结果,即将DR_BUF_ID加入DR_BUF_EMPTY_QUEUE队列中；

二、多缓冲设计

SR_BUF_NUM>＝2*COMPUTE_THREAD_NUM，DR_BUF_NUM>＝2*COMPUTE_THREAD_NUM

三、环形消息队列设计

为了实现上述任务分发策略，设计以下四个队列：

消息队列生产者消费者初始状态备注 SR_BUF_EMPTY_QUEUE COMPUTE_thread READ_thread SR_BUF_ID全部入队空SR_BUF队列 SR_BUF_FULL_QUEUE READ_thread COMPUTE_thread 空满SR_BUF队列 DR_BUF_EMPTY_QUEUE WRITE_thread COMPUTE_thread DR_BUF_ID全部入队空DR_BUF队列 DR_BUF_FULL_QUEUE COMPUTE_thread WRITE_thread 空满DR_BUF队列

其中消息队列中存放的消息数据类型定义如下：

1)SR_BUF_FULL_QUEUE:新的计算任务队列新计算任务消息队列，记录作业信息JOB_INFO,包括JOB_BEGIN，JOB_SIZE，SR_BUF_ID，由读线程写入(生产)，计算线程弹出(消费)当读线程向SR_BUF_ID读入新数据时，将JOB_INFO入队，计算线程弹出JOB_INFO时，计算SR_BUF_ID对应的源数据；

2)SR_BUF_EMPTY_QUEUE:存放当前空闲SR_BUF_ID号源缓冲释放消息队列，与SR_BUF_FULL_QUEUE功能相反，由计算线程写入，读线程弹出，当SR_BUF_ID对应的任务计算完毕时，释放SR_BUF_ID，告知读线程可对其更新数据；

3)DR_BUF_EMPTY_QUEUE:存放当前空闲DR_BUF_ID号目标缓冲为空消息队列，记录DR_BUF_ID号，由写线程写入，计算线程弹出；

4)DR_BUF_FULL_QUEUE:新的写任务队列新写任务消息队列，记录作业信息JOB_INFO，包括JOB_BEGIN，JOB_SIZE，DR_BUF_ID，由计算线程写入，写线程弹出；

四、线程设计

1)主线程设计

(1)主线程功能及运行流程如下：

1>参数预处理；

2>定义读、计算、写线程数；

3>定义源、目标缓存数目，与计算线程数相关；

4>定义任务划分粒度，即子任务规模JOB_SIZE；

5>开辟源、目标缓冲内存空间；

6>创建并初始化消息队列、锁、信号量；

7>创建并启动读、计算、写线程；

8>等待所有线程退出；

9>其它处理；

10>程序退出；

2)读线程设计

(1)线程数设计

(2)线程功能及运行流程

1>参数初始化；

5>从SR_BUF_EMPTY_QUEUE队列中获得一个空闲SR_BUF_ID；

7>将该任务信息tmp_msg加入新计算任务队列SR_BUF_FULL_QUEUE中；

8>返回步骤2；

9>线程退出；

3)计算线程设计

(1)线程数设计：

(2)线程功能及运行流程：

1>参数初始化；

2>检查错误标志及用户行为，如果出错或被用户取消，则进入步聚10，否则进入步聚3；

3>检查当前任务进度COMPUTE_CURRENT_STEP，判断是否完成所有读任务，如果是，则进入步骤10，否则进入步聚4；

4>从新计算任务队列SR_BUF_FULL_QUEUE中获取一个任务信息tmp_msg，其包含了任务的起始信息job_begin，大小信息job_size,以及任务数据存放源缓冲编号SR_BUF_ID，并更新任务计数COMPUTE_CURRENT_STEP；

5>从DR_BUF_EMPTY_QUEUE队列中获得一个空闲的DR_BUF_ID；

6>以SR_BUF[SR_BUF_ID]为数据输入缓存，以DR_BUF[DR_BUF_ID]为数据输出缓存进行计算；

7>将SR_BUF_ID加入SR_BUF_EMPTY_QUEUE中，表示SR_BUF[SR_BUF_ID]所存的数据计算完毕，需要重新加载源数据；

8>根据计算任务信息，生成写任务信息，并将其加入到DR_BUF_FULL_QUEUE队列中，表示需要写线程进行输出；

9>返回步骤2；

10>线程退出；

4)写线程设计

(1)线程数设计

(2)线程功能及运行流程

1>参数初始化；

5>将目标缓存DR_BUF[DR_BUF_ID]中的数据输出至OUTPUT_FILE；

7>向主线程发送更新进度条信号；

8>返回步骤2；

9>线程退出。