Python多线程核心技术解析与并发控制技巧

日期：2024-12-29 15:11:21 作者：创始人浏览：0

十分钟带你了解Python3多线程核心知识

Python3核心多线程知识概述：Python中的线程是应用程序中独立执行的主要群体。
每个线程都有自己的入口、执行顺序和出口，但在应用程序的控制下协同工作。
每个线程都有自己的上下文，包括指针和指针等CPU寄存器以及堆栈，它们反映了线程的执行状态和进程内存。
编程时，可以使用_stii模块的start_new_thread()来创建新线程，或者使用thread模块使用的线程类。
序列同步至关重要。
线程类的Lock和Rlock用于管理共享数据的同步，保证同一时刻只有一个线程可以访问特定的资源。
Python的Queue模块支持线程安全的队列，例如先进先出队列、后进先出队列LifoQueue和优先级队列PriorityQueue，它们通过原语锁实现多个线程之间的同步。
如果您需要等待线程完成后再继续，您可以使用join方法，它允许您给自己时间来逃离无限块。
总的来说，Python3多机机制支持服务的并发执行，通过线程类、机制和队列类同步来管理数据同步，为高效利用CPU资源和程序性能提供了有力的工具。

python多线程能开多少个(2023年最新整理)

简介：很多朋友都问过Python可以打开多少个线程的相关问题。
详细答案请参阅本文中的CTO注释。
希望这对大家有用！让我们来看看！

是否可以同时在Pythonpy文件中打开两个流？

可以。

Python多线程

多线程类似于同时运行多个不同的程序。
多线程具有以下优点：

使用线程。
可能需要很长时间。
程序中的任务在后台运行。

用户界面可能会更有吸引力：如果用户点击按钮来触发某些事件的处理，可能会出现一个进度条来显示处理进度。

程序可能会增加

流对于某些待处理的任务更有用，例如用户输入、读写文件以及通过网络发送和接收数据。
这样的话，我们就可以释放一些有价值的资源，比如内存使用等。

线程在运行时仍然与进程不同。
每个独立的进程都有一个程序执行的入口点、一个顺序执行序列和一个程序出口点。
但线程不能独立执行，必须存在于应用程序中，应用程序提供对多个线程执行的控制。

每个线程都有自己的一组CPU寄存器，称为线程上下文，它反映了最后运行的线程的CPU寄存器的状态。

指令指针和堆栈指针寄存器是线程上下文中最重要的两个寄存器。
线程始终在进程的上下文中运行。
这些地址用于指定进程地址空间中的内存。
拥有该分支机构。

线程可以被抢占（中断）。

当其他线程正在执行时，线程可以挂起（也称为休眠）——这就是线程让步。

多进程中有多少个线程同时运行Python模式

Python多进程模式下有多少个线程同时运行

通常是一个，因为没有真正的多线程，只有多个线程之间的快速切换

Python中使用多处理+协程以及为什么它使用

谈到了为什么在Python中建议使用多处理而不是多线程，但是多处理也有它的局限性：它比线程更麻烦并且切换时间更长，并且在Python多处理中，进程数量不建议超过CPU核心数（一个进程只有一个GIL，因此一个进程只能运行在一个CPU上），因为当一个进程占用一个CPU时，它可以充分利用机器的性能，但如果进程太多，就会出现频繁的进程切换，得不偿失。

但是，在特殊情况下（尤其是I/O密集型工作负载），多线程比多处理更容易使用。

例如：给你200万个URL，你需要捕获并保存每个URL对应的页面。
在这种情况下，只使用少数几个进程的效果肯定会很差。
为什么？

例如每个请求的超时时间为2秒，则如下（不包括CPU计算时间）：

1。
一个进程+一个线程：2秒*200W。
=400W秒==1111.11小时==46.3天，这个速度显然让人无法接受

2单进程+多线程：比如我。
在这个过程中，我们开启了10个多线程，比1个多线程快了10倍，意味着完成200万次爬取大约需要4.63天。
注意这里实际执行是这样的：线程1遇到阻塞，CPU切换到线程2执行，阻塞时切换到线程3，以此类推。
当所有10个线程都被阻塞后，进程被阻塞直到。
一旦线程被阻塞，进程可以继续运行，因此速度可以提高10倍左右（这里忽略线程切换带来的开销，实际情况提升应该不会有10x那么多），但是应该考虑到切换线程也是有开销的，所以不能无限地运行多个线程（开200万个线程肯定不靠谱）

3。
多处理+多线程：这太棒了。
一般来说，很多人都使用这种方法。
通过多处理，每个进程可以占用一个处理器，多线程在一定程度上绕过了它。
阻塞式等待，因此比单进程中的多线程要好。
比如我们开启10个进程，每个进程开启20万个线程，执行速度理论上比一个进程开启200万个线程快10倍以上（为什么这个是10多倍而不是10倍，主要是切换200万个线程的CPU消耗肯定比切换大很多20瓦工艺，考虑到这个成本是10倍以上）。

有更好的方法吗？答案是肯定的，那就是：

4。
协程，在使用之前，我们先来说一下what/why/how（它是什么/为什么使用/如何使用）

what：

协程是轻量级用户级线。
协程有自己的寄存器上下文和堆栈。
当协程调度切换时，寄存器上下文和堆栈保存在不同的位置。
当切换回来时，之前保存的寄存器上下文和堆栈将被恢复。
因此：

协程可以保存最后一次调用的状态（即所有本地状态的某种组合）。
进程每次重新进入系统，就相当于进入了上次调用的状态。
换句话说：输入上次中断的逻辑流程位置。

在并行编程中，协程类似于线程。
每个协程代表一个执行单元，拥有自己的本地数据，并与其他协程共享全局数据和其他资源。

原因：

目前，主要语言大多数情况下选择多线程作为并行执行的手段。
与线程相关的概念是抢占式多任务处理，与协程相关的概念是协作多任务处理。
。

无论是进程还是线程，每次阻塞或切换时，都必然会陷入系统调用中。
首先CPU运行操作系统调度程序，然后调度程序决定哪个进程。
（流）运行）。

而且由于无法确定抢占式调度的执行顺序，因此在使用线程时必须非常小心地处理同步问题，而协程则完全不存在这个问题（事件驱动和异步程序也有相同的优点）。

由于用户编写了协程的调度逻辑，对于CPU来说协程实际上是一个单线程，因此CPU不必考虑如何调度或切换上下文，从而无需CPU切换开销大，所以协程在一定程度上比多线程要好。

如何：

如何在Python中使用协程？答案是使用gevent。
如何使用：看这里

协程的使用不受线程开销的限制。
我曾经尝试在单个进程协程中执行200,000个URL，但没有引起任何问题。
全部。
。

所以最推荐的方式是多进程+协程（可以认是每个进程一个线程，那个单线程就是协程）

多进程+中协程，可以充分利用CPU切换和多CPU的开销。
这种方法可以显着提高扫描仪在处理大量数据和读写文件时的效率。

小例子：

[python]?viewplain?copy

#-*-?coding=utf-8?-*-

导入？查询

来自？多处理器？导入？进程

导入？gevent

from?gevent?import?monkey;?monkey.patch_all()

导入?sys

重新加载(sys)

sys.setdefaultencoding('utf8')

def?fetch(url):

尝试：

s?=?requests.Session()

r?=?s.get(url,timeout=1)#转到页面这里

例外？异常，e：

打印？e

返回？''

def?process_start(url_list):

tasks?=?[]

for?url?in?url_list:

tasks.append(gevent.spawn(fetch,url))

gevent.joinall(tasks)#使用协程执行

def?task_start(filepath,flag?=?100000):#为每个URL启动一个进程10W

使用?open(filepath,'r')?as?reader:#从给定文件URL读取

url?=?reader.readline().strip()

url_list?=?[]#这个列表是用来存放协程任务的

i?=?0?#Counter记录添加到协程队列的URL数量

while?url!='':

i?+=?1

url_list.append(url)#每次读取URL并添加到队列

if?i?==?flag:#启动进程并执行一定次数URL

p?=?Process(target=process_start,args=(url_list,))

p.start()

url_list?=?[]?#重置URL队列

i?=?0?#重置计数器

url?=?reader.readline().strip()

如果？url_list?not?[]:#如果之后退出循环，任务队列中还有剩余的URL

p?=?Process(target=process_start,args=(url_list,))#将所有剩余的URL放入最后一个进程中。
执行

p.start()

if?__name__?==?'__main__':

task_start('./testData.txt')#读取指定的file

细心的同学会注意到，上面的例子中存在一个隐藏的问题：process这个数字会随着URL数量的增加而不断增加。
我们之所以不使用multiprocessing.Pool来控制进程数，是因为multiprocessing.Pool与gevent冲突，不能同时使用。
然而，感兴趣的学生可能想研究一下协程池。

在Python中，这两个函数都打开10个线程。
执行顺序是什么？

总共有20个线程

执行顺序可能会相互重叠，不必按顺序执行

还要注意，Python线程有时被称为伪线程

Python支持多少个线程？

嗯，Python线程太慢了。
如果你想同时工作，请使用greenlet。
写起来又快又容易。

如果锁是synchronized的话，如果线程太多的话可能会比较慢。

ulimit-s返回线程堆栈的大小。
我的默认值是8192。
将其除以内存大小即可得到理论线程数。

管理线程数Python并发

如果Python线程不控制并发量，那么当启动的线程数量达到一定程度时，就会导致线程无法启动的错误。

有几种方法可以控制并发多线程执行量。
下面介绍使用队列来控制多线程并发执行量的方法。
python3

结论：以上是关于Python多线程可以打开多少个的全部信息，来自CTO的注释。
感谢您花时间阅读本网站的内容。
我希望如此。
对你有用。
了解更多请务必搜索此站点以获取有关可以打开多少个Python线程的信息。

标签： Python3多线程协程