Python3 多线程知识点汇总 – 编程小白入门

Python3 多线程知识点汇总

编程小白也能轻松理解的多线程核心知识

通俗易懂 · 实例讲解 · 避坑指南

💡 一、什么是多线程？

线程是程序执行的最小单位。一个程序运行时默认只有一个主线程。

多线程就是让程序同时运行多个线程，让多个任务”同时”进行（其实是快速切换）。

📖 生活比喻：餐厅后厨

想象一个餐厅的后厨：

单线程：只有一个厨师，做完一道菜再做下一道，效率低
多线程：多个厨师同时做不同的菜，效率大大提高

在Python中，每个线程就像一个厨师，可以同时处理不同的任务。

🔄 二、线程 vs 进程

理解线程前，需要知道线程和进程的区别：

特性	进程	线程
资源占用	独立内存空间，资源占用多	共享内存空间，资源占用少
创建开销	创建和销毁开销大	创建和销毁开销小
数据共享	进程间通信复杂（管道、队列等）	线程间可直接读写共享数据
切换速度	切换慢	切换快

📖 生活比喻：公司运营

把操作系统看作一个公司：

进程：公司里的不同部门（财务部、技术部等），独立办公室，资源独立
线程：部门里的员工，共用部门资源，协同完成部门任务

🐍 三、Python中的多线程模块

Python主要通过threading模块实现多线程：

1. 创建线程的两种方式

# 方法1：直接创建Thread对象
import threading
import time

def task():
    print(“线程开始执行”)
    time.sleep(2)
    print(“线程执行结束”)

# 创建线程
t = threading.Thread(target=task)
t.start()  # 启动线程

# 方法2：继承Thread类
class MyThread(threading.Thread):
    def run(self):
        print(“自定义线程开始执行”)
        time.sleep(1)
        print(“自定义线程执行结束”)

mt = MyThread()
mt.start()
                

2. 线程常用方法

start()：启动线程
join([timeout])：等待线程结束
is_alive()：检查线程是否在运行
name：线程名称
daemon：守护线程设置

重要提示： Python中的线程是操作系统级别的线程（POSIX线程或Windows线程），不是”假线程”。

⏳ 四、线程的生命周期

一个线程从创建到销毁会经历多个状态：

1. 新建状态：线程对象创建完成，但还未启动

2. 就绪状态：调用start()后，等待CPU调度

3. 运行状态：获得CPU时间，执行任务

4. 阻塞状态：遇到I/O操作或等待锁时，暂停执行

5. 死亡状态：线程执行完毕或发生异常

📖 生活比喻：快递配送

想象一个快递配送流程：

新建：包裹打包好等待发货
就绪：包裹装上货车准备出发
运行：货车在路上行驶
阻塞：遇到红灯或堵车停下等待
死亡：包裹成功送达客户

🔒 五、线程同步与锁机制

多个线程操作共享数据时，可能引发竞态条件（race condition），需要使用锁来同步。

1. 互斥锁（Lock）

import threading

# 共享资源
counter = 0
lock = threading.Lock()

def increment():
    global counter
    for _ in range(100000):
        # 获取锁
        lock.acquire()
        try:
            counter += 1
        finally:
            # 释放锁
            lock.release()

# 创建两个线程
t1 = threading.Thread(target=increment)
t2 = threading.Thread(target=increment)

t1.start()
t2.start()
t1.join()
t2.join()

print(f”最终计数: {counter}”)  # 应为200000
                

2. 其他同步工具

RLock：可重入锁，同一个线程可以多次获取
Semaphore：信号量，控制同时访问资源的线程数量
Event：事件，线程间通信机制
Condition：条件变量，用于复杂的线程同步

重要提示： 使用锁时要避免死锁（两个线程互相等待对方释放锁），确保锁总是能被释放（使用try-finally）。

📬 六、线程间通信 – 队列

线程间安全传递数据的最佳方式是使用队列（Queue）：

import threading
import queue
import time

# 创建线程安全队列
q = queue.Queue()

def producer():
    for i in range(5):
        print(f”生产产品{i}”)
        q.put(i)  # 放入产品
        time.sleep(0.5)

def consumer():
    while True:
        item = q.get()  # 获取产品
        if item is None:  # 结束信号
            break
        print(f”消费产品{item}”)
        q.task_done()  # 标记任务完成

# 创建生产者线程和消费者线程
p = threading.Thread(target=producer)
c = threading.Thread(target=consumer)

c.start()
p.start()

p.join()        # 等待生产者完成
q.put(None)     # 发送结束信号
c.join()        # 等待消费者结束
                

队列是线程安全的，内部实现了锁机制，非常适合生产者-消费者模式。

🐢 七、全局解释器锁（GIL）

这是Python多线程中最重要也最常被误解的概念：

GIL是什么？

GIL（Global Interpreter Lock）是CPython解释器（Python官方实现）中的一个全局锁，它确保任何时候只有一个线程在执行Python字节码。

GIL的影响：

CPU密集型任务：多线程无法利用多核优势，性能不如多进程
I/O密集型任务：多线程可以显著提高效率，因为线程在I/O等待时会释放GIL

📖 生活比喻：独木桥

想象GIL就像一座独木桥：

一次只允许一个人（一个线程）通过
当人需要停下来休息（I/O等待）时，会让出独木桥
多人（多线程）需要过桥时，只能在桥头排队等待

重要提示： GIL只存在于CPython解释器，Jython、IronPython等其他实现没有GIL。对于CPU密集型任务，考虑使用多进程（multiprocessing模块）或C扩展。

🎯 八、多线程适用场景

了解何时使用多线程至关重要：

👍 适用场景

I/O密集型任务（文件读写、网络请求）
GUI应用中的后台任务
Web服务器处理并发请求
监控和定时任务
需要快速响应的交互式应用

👎 不适用场景

CPU密集型计算（科学计算、图像处理）
需要利用多核CPU的任务
需要精确并行计算的任务
对性能要求极高的场景

⚠️ 九、多线程注意事项

避免过度使用线程：线程创建和切换有开销，适量使用
线程安全：注意共享资源的访问，使用锁或线程安全数据结构
死锁预防：避免多个线程相互等待
守护线程：设置daemon=True可使线程在主线程结束时自动终止
资源清理：确保线程使用的资源正确释放
异常处理：线程内异常不会传递给主线程，需单独处理

💎 总结

Python多线程是处理I/O密集型任务的强大工具，但由于GIL的存在，不适合CPU密集型任务。核心要点：

使用threading模块创建和管理线程
使用锁解决线程同步问题
使用队列进行线程间通信
理解GIL的影响和限制
根据任务类型选择多线程或多进程

多线程是一个强大但需要谨慎使用的工具，正确使用时可以极大提升程序效率！