在计算机科学中,闭包(英语:Closure),又称词法闭包(Lexical Closure)或函数闭包(function closures),是引用了自由变量的函数。这个被引用的自由变量将和这个函数一同存在,即使已经离开了创造它的环境也不例外。 [维基百科::闭包(计算机科学)]
0x02 Python 中的函数式编程 本来也应该包括闭包的概念,但是我觉得闭包更重要的是对**作用域(Scope)**的理解,因此把它单独列出来,同时可以理顺一下 Python 的作用域规则。
闭包的概念最早出现在函数式编程语言中,后来被一些命令式编程语言所借鉴。尤其是在一些函数作为一等公民的语言中,例如JavaScript就经常用到(在JavaScript中函数几乎可以当做“特等公民”看待),我之前也写过一篇关于JavaScript闭包的文章(图解Javascript上下文与作用域),实际上闭包并不是太复杂的概念,但是可以借助闭包更好地理解不同语言的作用域规则。
0x00 The Zen of Python的最后一句重点强调命名空间的概念,我们可以把命名空间看做一个大型的字典类型(Dict),里面包含了所有变量的名字和值的映射关系。在 Python 中,作用域实际上可以看做是“在当前上下文的位置,获取命名空间变量的规则”。在 Python 代码执行的任意位置,都至少存在三层嵌套的作用域:
- 最内层作用域,最早搜索,包含所有局部变量**(Python 默认所有变量声明均为局部变量)**
- 所有包含当前上下文的外层函数的作用域,由内而外依次搜索,这里包含的是非局部也非全局的变量
- 一直向上搜索,直到当前模块的全局变量
- 最外层,最后搜索的,内置(built-in)变量
在任意执行位置,可以将作用域看成是对下面这样一个命名空间的搜索:
scopes = {
"local": {"locals": None,
"non-local": {"locals": None,
"global": {"locals": None,
"built-in": ["built-ins"]}}},
}
除了默认的局部变量声明方式,Python 还有global
和nonlocal
两种类型的声明(nonlocal
是Python 3.x之后才有,2.7没有),其中 global
指定的变量直接指向(3)当前模块的全局变量,而nonlocal
则指向(2)最内层之外,global
以内的变量。这里需要强调指向(references and assignments)的原因是,普通的局部变量对最内层局部作用域之外只有**只读(read-only)**的访问权限,比如下面的例子:
x = 100
def main():
x += 1
print(x)
main()
---------------------------------------------------------------------------
UnboundLocalError Traceback (most recent call last)
<ipython-input-2-9ed43e483a17> in <module>()
3 x += 1
4 print(x)
----> 5 main()
<ipython-input-2-9ed43e483a17> in main()
1 x = 100
2 def main():
----> 3 x += 1
4 print(x)
5 main()
UnboundLocalError: local variable 'x' referenced before assignment
这里抛出UnboundLocalError
,是因为main()
函数内部的作用域对于全局变量x
仅有只读权限,想要在main()
中对x
进行改变,不会影响全局变量,而是会创建一个新的局部变量,显然无法对还未创建的局部变量直接使用x += 1
。如果想要获得全局变量的完全引用,则需要global
声明:
x = 100
def main():
global x
x += 1
print(x)
main()
print(x) # 全局变量已被改变
101
101
到这里基本上已经了解了 Python 作用域的规则,那么我们来仿照 JavaScript 写一个计数器的闭包:
"""
/* JavaScript Closure example */
var inc = function(){
var x = 0;
return function(){
console.log(x++);
};
};
var inc1 = inc()
var inc2 = inc()
"""
# Python 3.5
def inc():
x = 0
def inner():
nonlocal x
x += 1
print(x)
return inner
inc1 = inc()
inc2 = inc()
inc1()
inc1()
inc1()
inc2()
1
2
3
1
对于还没有nonlocal
关键字的 Python 2.7,可以通过一点小技巧来规避局部作用域只读的限制:
# Python 2.7
def inc():
x = [0]
def inner():
x[0] += 1
print(x[0])
return inner
inc1 = inc()
inc2 = inc()
inc1()
inc1()
inc1()
inc2()
1
2
3
1
上面的例子中,inc1()
是在全局环境下执行的,虽然全局环境是不能向下获取到inc()
中的局部变量x
的,但是我们返回了一个inc()
内部的函数inner()
,而inner()
对inc()
中的局部变量是有访问权限的。也就是说inner()
将inc()
内的局部作用域打包送给了inc1
和inc2
,从而使它们各自独立拥有了一块封闭起来的作用域,不受全局变量或者任何其它运行环境的影响,因此称为闭包。
闭包函数都有一个__closure__
属性,其中包含了它所引用的上层作用域中的变量:
print(inc1.__closure__[0].cell_contents)
print(inc2.__closure__[0].cell_contents)
[3]
[1]