23

【python】迭代器与生成器到底是什么?看完你就知道

 3 years ago
source link: http://www.cnblogs.com/pingguo-softwaretesting/p/13522910.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

迭代器跟生成器,与上篇文章讲的装饰器一样,都是属于我的一个老大难问题。

通常就是遇到的时候就去搜一下,结果在一大坨各种介绍博客中看了看,回头又忘记了。

你是不是也是这样呢?

俗话说:好记性不如烂笔头,虽然现在基本不咋用笔写字了,但是还是要好好整理下,起码以后我就不用搜了。

如果现在给你一个列表 list_a = [1, 2, 3, 4] ,让你去迭代它,相信大家都很熟悉,直接用for循环就完事儿,

list_a = [1, 2, 3, 4]

for i in list_a:
    print(i)

运行

1
2
3
4
[Finished in 0.1s]

可以看到,for循环迭代了列表中的每一个元素,打印了出来。

那么for循环背后都做了什么事情呢?

一、 容器、可迭代对象、迭代器

听起来陌生,但是你绝对熟悉的词儿。

在python中,一切都是对象,对象的抽象是类,而对象的集合就是容器。

使用python中常见的容器有很多,比如: 列表list:[0, 1, 2]集合set:([0, 1, 2])字典dict:{0:0, 1:1, 2:2} 以及 元组tuple(0, 1, 2)

这些都是多个元素集中在一起的单元,区别的是内部数据结构的实现方法。

所有的容器都是可以迭代的,你可以用for循环去迭代上述的容器试试。

那把一个个元素找出来,用到的就是迭代器。用iter()可以创建一个迭代器。

迭代器提供一个 next() 方法,这个方法你每次调用的时候会给你返回下一个对象,或者 StopIteration ,也就是没有对象可以给你了。

list_a = [1, 2, 3, 4]

it = iter(list_a) # 创建迭代器

print(next(it)) #调用next()
print(next(it))
print(next(it))
print(next(it))
print(next(it))

运行结果,前4个print可以正常返回,第5个时候就出现 StopIteration 错误了,因为列表中4个元素已经返回完了。

1
2
3
4
Traceback (most recent call last):
  File "D:\练习\demo_iterator.py", line 9, in <module>
    print(next(it))
StopIteration
[Finished in 0.1s with exit code 1]

二、生成器

什么是生成器?简单粗暴一点:生成器就是懒人版的迭代器。

在上述的创建迭代器操作中,我们显然是做了一次性生成的操作, list_a = [1, 2, 3, 4] ,这4个元素一次性生成好,以供 next() 调用。

但是生成出的这些元素都是会保存到内存中去,这只是4个元素,如果有上千万、上亿元素呢?

我并不是第一时间要用到所有的元素,我只要在我调用 next() 的时候产生一个返回给我就好,那么这样一次性生成就会白白占用了大量的内存。

生成器应运而生,当调用 next() 的时候,才会生成下一个变量。

生成器的写法很简单,用小括号,比如把一个列表生成式括起来: (i for i in range(10000)) ,这样就初始化了一个生成器。

print([i for i in range(10)])

print(i for i in range(10))

上面的时列表,下面的就是一个生成器了,区别就是 []()

运行结果:

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
<generator object <genexpr> at 0x033383A8>
[Finished in 0.1s]

yield关键字

此外,函数也可以成为生成器,秘密就是 yield 关键字,比如:

def gen():
    a = 0
    while a < 100:
        yield a
        a += 1

test = gen()
print(next(test))
print(next(test))
print(next(test))
print(next(test))

运行结果:

0
1
2
3
[Finished in 0.1s]

yield 关键字,可以这样理解:当函数运行到这一行的时候,程序会从这里暂停, yield 相当于 return 会返回,

当下次迭代时候,则会从 yield 的下一行代码开始执行。

所以,我调用了4次print,可以从0开始依次输出。

从我工作中的使用场景出发的话,我在做一些自动化测试的时候,有些变量参数是不可以重复的,用迭代器来定义变量的生成规则,每次

调用都会产生一个新的,就不会重复了。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK