秒杀多线程第二篇多线程第一次亲热接触 CreateThread与

秒杀多线程第二篇多线程第一次亲热接触 CreateThread与_beginthreadex本质差别

阅读量：4927 次

发布时间：2019-06-11

本文共 7342 字，大约阅读时间需要 24 分钟。

本文将带领你与多线程作第一次亲热接触，并深入分析CreateThread与_beginthreadex的本质差别，相信阅读本文后你能轻松的使用多线程并能流畅准确的回答CreateThread与_beginthreadex究竟有什么差别，在实际的编程中究竟应该使用CreateThread还是_beginthreadex？

使用多线程事实上是很easy的，以下这个程序的主线程会创建了一个子线程并等待其执行完成，子线程就输出它的线程ID号然后输出一句经典名言——Hello World。整个程序的代码很简短，仅仅有区区几行。

//最简单的创建多线程实例#include 
     
      #include 
      
       //子线程函数DWORD WINAPI ThreadFun(LPVOID pM){	printf("子线程的线程ID号为：%d\n子线程输出Hello World\n", GetCurrentThreadId());	return 0;}//主函数，所谓主函数事实上就是主线程运行的函数。int main(){	printf("     最简单的创建多线程实例\n");	printf(" -- by MoreWindows( http://blog.csdn.net/MoreWindows ) --\n\n");	HANDLE handle = CreateThread(NULL, 0, ThreadFun, NULL, 0, NULL);	WaitForSingleObject(handle, INFINITE);	return 0;}

执行结果例如以下所看到的：

以下来细讲下代码中的一些函数

第一个 CreateThread

函数功能：创建线程

函数原型：

HANDLEWINAPICreateThread(

LPSECURITY_ATTRIBUTESlpThreadAttributes,

SIZE_TdwStackSize,

LPTHREAD_START_ROUTINElpStartAddress,

LPVOIDlpParameter,

DWORDdwCreationFlags,

LPDWORDlpThreadId

);

函数说明：

第一个參数表示线程内核对象的安全属性，一般传入NULL表示使用默认设置。

第二个參数表示线程栈空间大小。传入0表示使用默认大小（1MB）。

第三个參数表示新线程所执行的线程函数地址，多个线程能够使用同一个函数地址。

第四个參数是传给线程函数的參数。

第五个參数指定额外的标志来控制线程的创建，为0表示线程创建之后马上就能够进行调度，假设为CREATE_SUSPENDED则表示线程创建后暂停执行，这样它就无法调度，直到调用ResumeThread()。

第六个參数将返回线程的ID号，传入NULL表示不须要返回该线程ID号。

函数返回值：

成功返回新线程的句柄，失败返回NULL。

第二个 WaitForSingleObject

函数功能：等待函数 – 使线程进入等待状态，直到指定的内核对象被触发。

函数原形：

DWORDWINAPIWaitForSingleObject(

HANDLEhHandle,

DWORDdwMilliseconds

);

函数说明：

第一个參数为要等待的内核对象。

第二个參数为最长等待的时间，以毫秒为单位，如传入5000就表示5秒，传入0就马上返回，传入INFINITE表示无限等待。

由于线程的句柄在线程执行时是未触发的，线程结束执行，句柄处于触发状态。所以能够用WaitForSingleObject()来等待一个线程结束执行。

函数返回值：

在指定的时间内对象被触发，函数返回WAIT_OBJECT_0。超过最长等待时间对象仍未被触发返回WAIT_TIMEOUT。传入參数有错误将返回WAIT_FAILED

CreateThread()函数是Windows提供的API接口，在C/C++语言另有一个创建线程的函数_beginthreadex()，在非常多书上（包含《Windows核心编程》）提到过尽量使用_beginthreadex()来取代使用CreateThread()，这是为什么了？以下就来探索与发现它们的差别吧。

首先要从标准C执行库与多线程的矛盾说起，标准C执行库在1970年被实现了，由于当时没不论什么一个操作系统提供对多线程的支持。因此编写标准C执行库的程序猿根本没考虑多线程程序使用标准C执行库的情况。比方标准C执行库的全局变量errno。非常多执行库中的函数在出错时会将错误代号赋值给这个全局变量，这样能够方便调试。但假设有这种一个代码片段：

if (system("notepad.exe readme.txt") == -1){	switch(errno)	{		...//错误处理代码	}}

如果某个线程A在执行上面的代码，该线程在调用system()之后且尚未调用switch()语句时另外一个线程B启动了，这个线程B也调用了标准C执行库的函数，不幸的是这个函数执行出错了并将错误代号写入全局变量errno中。这样线程A一旦開始执行switch()语句时，它将訪问一个被B线程修改了的errno。这样的情况必需要加以避免！由于不单单是这一个变量会出问题，其他像strerror()、strtok()、tmpnam()、gmtime()、asctime()等函数也会遇到这样的由多个线程訪问修改导致的数据覆盖问题。

为了解决问题，Windows操作系统提供了这样的一种解决方式——每一个线程都将拥有自己专用的一块内存区域来供标准C执行库中全部有需要的函数使用。并且这块内存区域的创建就是由C/C++执行库函数_beginthreadex()来负责的。以下列出_beginthreadex()函数的源代码（我在这份代码中添加了一些凝视）以便读者更好的理解_beginthreadex()函数与CreateThread()函数的差别。

//_beginthreadex源代码整理By MoreWindows( http://blog.csdn.net/MoreWindows )_MCRTIMP uintptr_t __cdecl _beginthreadex(	void *security,	unsigned stacksize,	unsigned (__CLR_OR_STD_CALL * initialcode) (void *),	void * argument,	unsigned createflag,	unsigned *thrdaddr){	_ptiddata ptd;          //pointer to per-thread data 见注1	uintptr_t thdl;         //thread handle 线程句柄	unsigned long err = 0L; //Return from GetLastError()	unsigned dummyid;    //dummy returned thread ID 线程ID号		// validation section 检查initialcode是否为NULL	_VALIDATE_RETURN(initialcode != NULL, EINVAL, 0);	//Initialize FlsGetValue function pointer	__set_flsgetvalue();		//Allocate and initialize a per-thread data structure for the to-be-created thread.	//相当于new一个_tiddata结构，并赋给_ptiddata指针。	if ( (ptd = (_ptiddata)_calloc_crt(1, sizeof(struct _tiddata))) == NULL )		goto error_return;	// Initialize the per-thread data	//初始化线程的_tiddata块即CRT数据区域 见注2	_initptd(ptd, _getptd()->ptlocinfo);		//设置_tiddata结构中的其他数据，这样这块_tiddata块就与线程联系在一起了。	ptd->_initaddr = (void *) initialcode; //线程函数地址	ptd->_initarg = argument;              //传入的线程參数	ptd->_thandle = (uintptr_t)(-1);	#if defined (_M_CEE) || defined (MRTDLL)	if(!_getdomain(&(ptd->__initDomain))) //见注3	{		goto error_return;	}#endif  // defined (_M_CEE) || defined (MRTDLL)		// Make sure non-NULL thrdaddr is passed to CreateThread	if ( thrdaddr == NULL )//推断是否须要返回线程ID号		thrdaddr = &dummyid;	// Create the new thread using the parameters supplied by the caller.	//_beginthreadex()终于还是会调用CreateThread()来向系统申请创建线程	if ( (thdl = (uintptr_t)CreateThread(					(LPSECURITY_ATTRIBUTES)security,					stacksize,					_threadstartex,					(LPVOID)ptd,					createflag,					(LPDWORD)thrdaddr))		== (uintptr_t)0 )	{		err = GetLastError();		goto error_return;	}	//Good return	return(thdl); //线程创建成功,返回新线程的句柄.		//Error returnerror_return:	//Either ptd is NULL, or it points to the no-longer-necessary block	//calloc-ed for the _tiddata struct which should now be freed up.	//回收由_calloc_crt()申请的_tiddata块	_free_crt(ptd);	// Map the error, if necessary.	// Note: this routine returns 0 for failure, just like the Win32	// API CreateThread, but _beginthread() returns -1 for failure.	//校正错误代号(能够调用GetLastError()得到错误代号)	if ( err != 0L )		_dosmaperr(err);	return( (uintptr_t)0 ); //返回值为NULL的效句柄}

解说下部分代码：

注1．_ptiddataptd;中的_ptiddata是个结构体指针。在mtdll.h文件被定义：

typedefstruct_tiddata * _ptiddata

微软对它的凝视为Structure for each thread's data。这是一个很大的结构体，有许多成员。本文因为篇幅所限就不列出来了。

注2．_initptd(ptd, _getptd()->ptlocinfo);微软对这一句代码中的getptd()的说明为：

/* return address of per-thread CRT data */

_ptiddata __cdecl_getptd(void);

对_initptd()说明例如以下：

/* initialize a per-thread CRT data block */

void__cdecl_initptd(_Inout_ _ptiddata _Ptd,_In_opt_ pthreadlocinfo _Locale);

凝视中的CRT （C Runtime Library）即标准C执行库。

注3．if(!_getdomain(&(ptd->__initDomain)))中的_getdomain()函数代码能够在thread.c文件里找到，其主要功能是初始化COM环境。

由上面的源码可知，_beginthreadex()函数在创建新线程时会分配并初始化一个_tiddata块。这个_tiddata块自然是用来存放一些须要线程独享的数据。其实新线程执行时会首先将_tiddata块与自己进一步关联起来。然后新线程调用标准C执行库函数如strtok()时就会先取得_tiddata块的地址再将须要保护的数据存入_tiddata块中。这样每一个线程就仅仅会訪问和改动自己的数据而不会去篡改其他线程的数据了。因此，假设在代码中有使用标准C执行库中的函数时，尽量使用_beginthreadex()来取代CreateThread()。相信阅读到这里时，你会对这句简短的话有个很深刻的印象，假设有面试官问起，你也能够流畅准确的回答了^_^。

接下来，相似于上面的程序用CreateThread()创建输出“Hello World”的子线程，以下使用_beginthreadex()来创建多个子线程：

//创建多子个线程实例#include 
     
      #include 
      
       #include 
       
        //子线程函数unsigned int __stdcall ThreadFun(PVOID pM){	printf("线程ID号为%4d的子线程说：Hello World\n", GetCurrentThreadId());	return 0;}//主函数，所谓主函数事实上就是主线程运行的函数。int main(){	printf("     创建多个子线程实例 \n");	printf(" -- by MoreWindows( http://blog.csdn.net/MoreWindows ) --\n\n");		const int THREAD_NUM = 5;	HANDLE handle[THREAD_NUM];	for (int i = 0; i < THREAD_NUM; i++)		handle[i] = (HANDLE)_beginthreadex(NULL, 0, ThreadFun, NULL, 0, NULL);	WaitForMultipleObjects(THREAD_NUM, handle, TRUE, INFINITE);	return 0;}

执行结果例如以下：

图中每一个子线程说的都是同一句话，不太好看。能不能来一个线程报数功能，即第一个子线程输出1，第二个子线程输出2，第三个子线程输出3，……。要实现这个功能似乎很easy——每一个子线程对一个全局变量进行递增并输出就能够了。代码例如以下：

//子线程报数#include 
     
      #include 
      
       #include 
       
        int g_nCount;//子线程函数unsigned int __stdcall ThreadFun(PVOID pM){	g_nCount++;	printf("线程ID号为%4d的子线程报数%d\n", GetCurrentThreadId(), g_nCount);	return 0;}//主函数，所谓主函数事实上就是主线程运行的函数。int main(){	printf("     子线程报数 \n");	printf(" -- by MoreWindows( http://blog.csdn.net/MoreWindows ) --\n\n");		const int THREAD_NUM = 10;	HANDLE handle[THREAD_NUM];	g_nCount = 0;	for (int i = 0; i < THREAD_NUM; i++)		handle[i] = (HANDLE)_beginthreadex(NULL, 0, ThreadFun, NULL, 0, NULL);	WaitForMultipleObjects(THREAD_NUM, handle, TRUE, INFINITE);	return 0;}

对一次执行结果截图例如以下：