APUE学习笔记-线程

本章我们将了解如何使用多个控制线程在单进程环境中执行多个任务。一个进程中的所有线程都可以访问该进程的组成部件,如文件描述符和内存。

1.线程概念

(1)典型的UNIX进程可以看成只有一个控制线程:一个进程在某一时刻只能做一件事情。有了多个控制线程以后,就可以把进程设计成再某一时刻能够做不止一件事情,每个线程处理各自独立的任务。有如下好处:

  • 通过为每种事件类型分配单独的处理线程,可以简化处理异步事件的代码。
  • 多个进程必须使用操作系统提供的复杂机制才能实现内存和文件描述符的共享;而多个线程自动地可以访问相同的存储地址空间和文件描述符
  • 有些问题可以分解从而提高整个程序的吞吐量。
  • 交互的程序同样可以通过使用多线程来改善响应时间,多线程可以把程序中处理用户输入输出的部分与其他部分分开。

(2)每个线程都包含有表示执行环境所必需的信息,有线程ID、一组寄存器值、栈、调度优先级和策略、信号屏蔽字、errno变量以及线程私有数据

(3)一个进程的所有信息对该进程的所有线程都是共享的,包括可执行程序的代码、程序的全局内存和堆内存、栈以及文件描述符。

2.线程标识

(1)进程ID在整个系统中是唯一的,但线程ID不同,线程ID只有在它所属的进程上下文中才有意义。

(2)进程ID是用pid_t数据类型来表示的,是一个非负整数。线程ID是用pthread_t数据类型来表示的

两个线程ID比较:

线程可以通过调用pthread_self函数获得自身的线程ID:

3.线程创建

在POSIX线程(pthread)的情况下,程序开始运行时,它也是以单进程中的单个控制线程启动的。在创建多个控制线程以前,程序的行为与传统的进程并没有声明区别。新增的线程可以通过调用pthread_create函数创建。

(1)当函数成功返回时,新创建线程的线程ID会被设置成tidp指向的内存单元

(2)attr参数用于指定各种不同的线程属性,设置为NULL,表示创建一个具有默认属性的线程。

(3)新创建的线程从start_rtn函数的地址开始运行,该函数只有一个无类型指针参数,若果需要向start_rtn函数传递的参数有一个以上,那么需要把这些参数放到一个结构体中。

(4)线程创建时并不能保证哪个线程会先运行:是新创建的线程还是调用线程。

(5)示例:打印线程ID

编译输出:

1)上述代码,主线程需要休眠,如果主线程不休眠,它就可能退出,这样新线程还没有机会运行,整个进程可能就已经终止了。

4.线程终止

(1)如果进程中的任意线程调用了exit, _Exit或_exit,那么整个进程就会终止。而单个线程可以通过3种方式退出,因此可以在不终止整个进程的情况下,停止它的控制流:

  • 线程可以简单地从启动例程中返回,返回值是线程的退出码。
  • 线程可以被同一进程中的其他线程取消。
  • 线程调用pthread_exit。

rval_ptr参数是一个无类型指针,与传给启动例程的单个参数类似。进程中的其他线程也可以通过调用pthread_join函数访问到这个指针。

调用线程将一直阻塞,直到指定的线程调用pthread_exit、从启动例程中返回或者被取消。

(2)如下示例:如何获得已终止的线程的退出码:

编译运行得:

可以看到,当一个线程通过调用pthread_exit退出或简单地从启动例程中返回时,进程中的其他线程可以通过调用pthread_join函数获得该线程的退出状态。

(3)线程可以通过调用pthread_cancel函数来请求取消同一进程中的其他线程

在默认情况下,pthread_cancel函数会使得由tid标识的线程的行为表现为如同调用了参数为PTHREAD_CANCELED的pthread_exit函数,但是,线程可以选择忽略取消或者控制如何被取消。

(4)线程函数和进程函数之间的相似之处:

默认情况下,线程的终止状态会保存直到对该线程调用pthread_join。

(5)如果线程已经被分离,线程的底层存储资源可以在线程终止时立即被收回。在线程分离后,我们不能用pthread_join函数等待它的终止状态,因为对分离的线程调用pthread_join会产生未定义行为。

5.线程同步

当一个线程可以修改的变量,其他线程也可以读取或修改的时候,我们就需要对这些线程进行同步,确保它们在访问变量的存储内容时不会访问到无效的值。

两个或多个线程视图在同一时间修改同一变量时,也需要进行同步。考虑变量增量操作的情况,增量操作通常分解为以下3步:

  • 从内存单元读入寄存器
  • 在寄存器中对变量做增量操作。
  • 把新的值写回内存单元。

(1)互斥量

1)互斥量(mutex)从本质上说是一把锁,在访问共享资源前对互斥量进行设置(加锁),在访问完后释放(解锁)互斥量。

2)互斥量是用pthread_mutex_t数据类型表示的。在使用互斥量以前,必须首先对它进行初始化,可以把它设置为常量PTHREAD_MUTEX_INITIALIZER(只适用于静态分配的互斥量),也可以通过调用pthread_mutex_init函数进行初始化。如果动态分配互斥量(例如,malloc函数),在释放内存前需要调用pthread_mutex_destroy。

要用默认的属性初始化互斥量,只需要把attr设为NULL。

3)对互斥量进行加锁,需要调用pthread_mutex_lock;对互斥量解锁,需要调用pthread_mutex_unlock

如果线程不希望被阻塞,它可以使用pthread_mutex_trylock尝试对互斥量加锁。

(2)避免死锁

1)如果线程试图对同一个互斥量加锁两次,那么它自身就会陷入死锁状态。

2)但是使用互斥量时,还有其他不太明显的方式也能产生死锁。例如,程序中使用一个以上的互斥量时,如果允许一个线程一直占有第一个互斥量,并且在试图锁住第二个互斥量时处于阻塞状态,但是拥有第二个互斥量的线程也在试图锁住第一个互斥量。因为两个线程都在相互请求另一个线程拥有的资源,所有这两个线程都无法向前运行,于是产生死锁。

(3)函数pthread_mutex_timelock

当线程试图获取一个已加锁的互斥量时,pthread_mutex_timelock互斥量原语允许绑定线程阻塞时间。

pthread_mutex_timelock与pthread_mutex_lock是基本等价的,但是在达到超时时间值时,pthread_mutex_timelock不会对互斥量进行加锁,而是返回错误码ETIMEDOUT。

超时指定愿意等待的绝对时间。这个超时时间是用timespec结构来表示的,它用秒和纳秒来描述时间。

(4)读写锁

1)读写锁(reader-writer lock)与互斥量类似不过读写锁允许更高的并行性。互斥量要么是锁住状态,要么就是不加锁状态,而且一次只有一个线程可以对其加锁。

2)读写锁可以有3种状态:

  • 读模式下加锁状态
  • 写模式下加锁状态
  • 不加锁状态

一次只有一个线程可以占有写模式的读写锁,但是多个线程可以同时占有读模式的读写锁。

3)读写锁也叫共享互斥锁(shared-exclusive lock)。当读写锁是读模式锁住时,就可以说是以共享模式锁住的。当它是写模式锁住的时候,就可以说是以互斥模式锁住的。

4)与互斥量相比,读写锁在使用前必须初始化,在释放它们底层的内存之前必须销毁。

5)要在读模式下锁定读写锁,需要调用pthread_rwlock_rdlock;要在写模式下锁定读写锁,需要调用pthread_rwlock_wrlock。不管以何种方式锁住读写锁,都可以调用pthread_rwlock_unlock进行解锁。

(5)条件变量

1)条件变量是线程可用的另一种同步机制。条件本身是有互斥量保护的。线程在改变条件状态之前必须首先锁住互斥量。其他线程在获得互斥量之前不会觉察到这种改变,因为互斥量必须在锁定之后才能计算条件。

2)在使用条件变量之前,必须先对它进行初始化。由pthread_cond_t数据类型表示的条件变量可以用两种方式进行初始化。可以把常量PTHREAD_COND_INITIALIZER赋给静态分配的条件变量,但是如果条件变量是动态分配的,则需要使用pthread_cond_init函数对它进行初始化。

3)在释放条件变量底层的内存空间之前,可以使用pthread_cond_destroy函数对条件变量进行反初始化(deinitilaize)。

4)除非创建一个具有非默认属性的条件变量,否则pthread_cond_init函数的attr参数可以设置为NULL

5)使用pthread_cond_wait等待条件变量为真。如果在给定的时间内条件不能满足,那么会生成一个返回错误码的变量。

6)下面两个 函数可以用于通知线程条件已经满足:pthread_cond_signal函数至少能唤醒一个等待条件的线程,而pthread_cond_broadcast函数则能唤醒等待该条件的所有线程。

在调用pthread_cond_signal或者pthread_cond_broadcast时,我们说这是在给线程或者条件发信号。必须注意,一定要在改变条件状态以后再给线程发信号。

发表评论

电子邮件地址不会被公开。 必填项已用*标注