Skip to content
SRE运维进阶之路SRE运维进阶之路
github icon
    • 1 Python 简介

      • 1.1 初识Python
        • 1.2 Python 代码规范
          • 1.3 Python 虚拟环境
            • 1.4 使用 vscode 打造 python 开发环境
              • 1.5 pypi 配置国内镜像
              • 2 Python 基础

                • 2.1 Python基础语法
                  • 2.2 程序控制
                    • 2.3 Python数据类型

                      • 2.3.1 数值型
                        • 2.3.2 字符串 str
                          • 2.3.3 字节序列
                            • 2.3.4 列表 list & 元组 tuple
                              • 2.3.5 集合 set & 字典 dict
                            • 3 高级特性

                              • 3.1 线性结构特征 可迭代 & 切片
                                • 3.2 列表、集合、字典解析式
                                  • 3.3 生成器
                                    • 3.4 迭代器
                                    • 4 函数

                                      • 4.1 函数的定义 & 调用 & 返回值
                                        • 4.2 函数参数
                                          • 4.3 作用域
                                            • 4.4 递归函数
                                            • 5 函数式编程

                                              • 5.1 高阶函数
                                                • 内建函数
                                                  • map/reduce
                                                    • 过滤 filter
                                                      • 排序算法 sorted
                                                        • 拉链函数 zip
                                                      • 5.2 返回函数
                                                        • 5.3 匿名函数
                                                          • 5.4 装饰器
                                                            • 5.5 偏函数
                                                            • 6 模块

                                                              • 6.1 Python 模块常用的几种安装方式
                                                                • 6.2 Python 的 setup.py 详解
                                                                • 7 IO编程

                                                                  • 7.1 操作文件和目录
                                                                    • 7.2 序列化和反序列化
                                                                    • 8 异常、调试和测试

                                                                      • 8.1 异常处理
                                                                      • 9 面向对象编程

                                                                        • 9.1 类、实例和封装
                                                                          • 9.2 访问控制和属性装饰器
                                                                            • 9.3 继承、多态和Mixin
                                                                            • 10 进程和线程

                                                                              • 10.1 多进程
                                                                                • 10.2 多线程
                                                                                  • 10.2 线程同步
                                                                                  • 11 网络编程

                                                                                    • 11.1 SocketServer
                                                                                      • 11.2 TCP 编程
                                                                                      • 11 魔术方法
                                                                                        • 17 IO 模型
                                                                                          • python 实际工作中的实例
                                                                                          • 前端学习笔记

                                                                                            5.1 高阶函数

                                                                                            author iconClaycalendar icon2021年6月17日category icon
                                                                                            • Python
                                                                                            timer icon大约 9 分钟

                                                                                            此页内容
                                                                                            • 内建函数
                                                                                              • map/reduce
                                                                                              • 过滤 filter
                                                                                              • 排序算法 sorted
                                                                                              • 拉链函数 zip

                                                                                            # 5.1 高阶函数

                                                                                            一等共民

                                                                                            • 函数在Python是一等公民(First-Class Object)
                                                                                            • 函数也是对象,是可调用对象
                                                                                            • 函数可以作为普通变量,也可以作为函数的参数、返回值

                                                                                            高级函数

                                                                                            高阶函数(High-order Function)

                                                                                            • 数学概念 y = f(g(x))
                                                                                            • 在数学和计算机科学中,高阶函数应当是至少满足下面一个条件的函数
                                                                                              • 接受一个或多个函数作为参数
                                                                                              • 输出一个函数
                                                                                            def counter(base):
                                                                                                def inc(step=1): # 有没有闭包?
                                                                                                    nonlocal base # 形参base也是外部函数counter的local变量
                                                                                                    base += step
                                                                                                    return base
                                                                                                return inc
                                                                                            c1 = counter(5)
                                                                                            print(c1())
                                                                                            print(c1())
                                                                                            print(c1())
                                                                                            c2 = counter(5)
                                                                                            print(c2())
                                                                                            print(c1 == c2) # 相等吗? 不相等,两个不同的实例
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4
                                                                                            5
                                                                                            6
                                                                                            7
                                                                                            8
                                                                                            9
                                                                                            10
                                                                                            11
                                                                                            12
                                                                                            13

                                                                                            # 内建函数

                                                                                            # map/reduce

                                                                                            Python内建了map()和reduce()函数。

                                                                                            如果你读过Google的那篇大名鼎鼎的论文“MapReduce: Simplified Data Processing on Large Clustersopen in new window”,你就能大概明白map/reduce的概念。

                                                                                            我们先看map。map()函数接收两个参数,一个是函数,一个是Iterable,map将传入的函数依次作用到序列的每个元素,并把结果作为新的Iterator返回。

                                                                                            举例说明,比如我们有一个函数f(x)=x2,要把这个函数作用在一个list [1, 2, 3, 4, 5, 6, 7, 8, 9]上,就可以用map()实现如下:

                                                                                                        f(x) = x * x
                                                                                            
                                                                                                              │
                                                                                                              │
                                                                                              ┌───┬───┬───┬───┼───┬───┬───┬───┐
                                                                                              │   │   │   │   │   │   │   │   │
                                                                                              ▼   ▼   ▼   ▼   ▼   ▼   ▼   ▼   ▼
                                                                                            
                                                                                            [ 1   2   3   4   5   6   7   8   9 ]
                                                                                            
                                                                                              │   │   │   │   │   │   │   │   │
                                                                                              │   │   │   │   │   │   │   │   │
                                                                                              ▼   ▼   ▼   ▼   ▼   ▼   ▼   ▼   ▼
                                                                                            
                                                                                            [ 1   4   9  16  25  36  49  64  81 ]
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4
                                                                                            5
                                                                                            6
                                                                                            7
                                                                                            8
                                                                                            9
                                                                                            10
                                                                                            11
                                                                                            12
                                                                                            13
                                                                                            14
                                                                                            15

                                                                                            现在,我们用Python代码实现:

                                                                                            >>> def f(x):
                                                                                            ...     return x * x
                                                                                            ...
                                                                                            >>> r = map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9])
                                                                                            >>> list(r)
                                                                                            [1, 4, 9, 16, 25, 36, 49, 64, 81]
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4
                                                                                            5
                                                                                            6

                                                                                            map()传入的第一个参数是f,即函数对象本身。由于结果r是一个Iterator,Iterator是惰性序列,因此通过list()函数让它把整个序列都计算出来并返回一个list。

                                                                                            你可能会想,不需要map()函数,写一个循环,也可以计算出结果:

                                                                                            L = []
                                                                                            for n in [1, 2, 3, 4, 5, 6, 7, 8, 9]:
                                                                                                L.append(f(n))
                                                                                            print(L)
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4

                                                                                            的确可以,但是,从上面的循环代码,能一眼看明白“把f(x)作用在list的每一个元素并把结果生成一个新的list”吗?

                                                                                            所以,map()作为高阶函数,事实上它把运算规则抽象了,因此,我们不但可以计算简单的f(x)=x2,还可以计算任意复杂的函数,比如,把这个list所有数字转为字符串:

                                                                                            >>> list(map(str, [1, 2, 3, 4, 5, 6, 7, 8, 9]))
                                                                                            ['1', '2', '3', '4', '5', '6', '7', '8', '9']
                                                                                            
                                                                                            1
                                                                                            2

                                                                                            只需要一行代码。

                                                                                            再看reduce的用法。reduce把一个函数作用在一个序列[x1, x2, x3, ...]上,这个函数必须接收两个参数,reduce把结果继续和序列的下一个元素做累积计算,其效果就是:

                                                                                            reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)
                                                                                            
                                                                                            1

                                                                                            比方说对一个序列求和,就可以用reduce实现:

                                                                                            >>> from functools import reduce
                                                                                            >>> def add(x, y):
                                                                                            ...     return x + y
                                                                                            ...
                                                                                            >>> reduce(add, [1, 3, 5, 7, 9])
                                                                                            25
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4
                                                                                            5
                                                                                            6

                                                                                            当然求和运算可以直接用Python内建函数sum(),没必要动用reduce。

                                                                                            但是如果要把序列[1, 3, 5, 7, 9]变换成整数13579,reduce就可以派上用场:

                                                                                            >>> from functools import reduce
                                                                                            >>> def fn(x, y):
                                                                                            ...     return x * 10 + y
                                                                                            ...
                                                                                            >>> reduce(fn, [1, 3, 5, 7, 9])
                                                                                            13579
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4
                                                                                            5
                                                                                            6

                                                                                            这个例子本身没多大用处,但是,如果考虑到字符串str也是一个序列,对上面的例子稍加改动,配合map(),我们就可以写出把str转换为int的函数:

                                                                                            >>> from functools import reduce
                                                                                            >>> def fn(x, y):
                                                                                            ...     return x * 10 + y
                                                                                            ...
                                                                                            >>> def char2num(s):
                                                                                            ...     digits = {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}
                                                                                            ...     return digits[s]
                                                                                            ...
                                                                                            >>> reduce(fn, map(char2num, '13579'))
                                                                                            13579
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4
                                                                                            5
                                                                                            6
                                                                                            7
                                                                                            8
                                                                                            9
                                                                                            10

                                                                                            整理成一个str2int的函数就是:

                                                                                            from functools import reduce
                                                                                            
                                                                                            DIGITS = {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}
                                                                                            
                                                                                            def str2int(s):
                                                                                                def fn(x, y):
                                                                                                    return x * 10 + y
                                                                                                def char2num(s):
                                                                                                    return DIGITS[s]
                                                                                                return reduce(fn, map(char2num, s))
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4
                                                                                            5
                                                                                            6
                                                                                            7
                                                                                            8
                                                                                            9
                                                                                            10

                                                                                            还可以用lambda函数进一步简化成:

                                                                                            from functools import reduce
                                                                                            
                                                                                            DIGITS = {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}
                                                                                            
                                                                                            def char2num(s):
                                                                                                return DIGITS[s]
                                                                                            
                                                                                            def str2int(s):
                                                                                                return reduce(lambda x, y: x * 10 + y, map(char2num, s))
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4
                                                                                            5
                                                                                            6
                                                                                            7
                                                                                            8
                                                                                            9

                                                                                            也就是说,假设Python没有提供int()函数,你完全可以自己写一个把字符串转化为整数的函数,而且只需要几行代码!

                                                                                            lambda函数的用法在后面介绍。

                                                                                            # 过滤 filter

                                                                                            Python内建的filter()函数用于过滤序列。

                                                                                            和map()类似,filter()也接收一个函数和一个序列。和map()不同的是,filter()把传入的函数依次作用于每个元素,然后根据返回值是True还是False决定保留还是丢弃该元素。

                                                                                            例如,在一个list中,删掉偶数,只保留奇数,可以这么写:

                                                                                            def is_odd(n):
                                                                                                return n % 2 == 1
                                                                                            
                                                                                            list(filter(is_odd, [1, 2, 4, 5, 6, 9, 10, 15]))
                                                                                            # 结果: [1, 5, 9, 15]
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4
                                                                                            5

                                                                                            把一个序列中的空字符串删掉,可以这么写:

                                                                                            def not_empty(s):
                                                                                                return s and s.strip()
                                                                                            
                                                                                            list(filter(not_empty, ['A', '', 'B', None, 'C', '  ']))
                                                                                            # 结果: ['A', 'B', 'C']
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4
                                                                                            5

                                                                                            可见用filter()这个高阶函数,关键在于正确实现一个“筛选”函数。

                                                                                            注意到filter()函数返回的是一个Iterator,也就是一个惰性序列,所以要强迫filter()完成计算结果,需要用list()函数获得所有结果并返回list。

                                                                                            用filter求素数

                                                                                            计算素数open in new window的一个方法是埃氏筛法open in new window,它的算法理解起来非常简单:

                                                                                            首先,列出从2开始的所有自然数,构造一个序列:

                                                                                            2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

                                                                                            取序列的第一个数2,它一定是素数,然后用2把序列的2的倍数筛掉:

                                                                                            3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

                                                                                            取新序列的第一个数3,它一定是素数,然后用3把序列的3的倍数筛掉:

                                                                                            5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

                                                                                            取新序列的第一个数5,然后用5把序列的5的倍数筛掉:

                                                                                            7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

                                                                                            不断筛下去,就可以得到所有的素数。

                                                                                            用Python来实现这个算法,可以先构造一个从3开始的奇数序列:

                                                                                            def _odd_iter():
                                                                                                n = 1
                                                                                                while True:
                                                                                                    n = n + 2
                                                                                                    yield n
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4
                                                                                            5

                                                                                            注意这是一个生成器,并且是一个无限序列。

                                                                                            然后定义一个筛选函数:

                                                                                            def _not_divisible(n):
                                                                                                return lambda x: x % n > 0
                                                                                            
                                                                                            1
                                                                                            2

                                                                                            最后,定义一个生成器,不断返回下一个素数:

                                                                                            def primes():
                                                                                                yield 2
                                                                                                it = _odd_iter() # 初始序列
                                                                                                while True:
                                                                                                    n = next(it) # 返回序列的第一个数
                                                                                                    yield n
                                                                                                    it = filter(_not_divisible(n), it) # 构造新序列
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4
                                                                                            5
                                                                                            6
                                                                                            7

                                                                                            这个生成器先返回第一个素数2,然后,利用filter()不断产生筛选后的新的序列。

                                                                                            由于primes()也是一个无限序列,所以调用时需要设置一个退出循环的条件:

                                                                                            # 打印1000以内的素数:
                                                                                            for n in primes():
                                                                                                if n < 1000:
                                                                                                    print(n)
                                                                                                else:
                                                                                                    break
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4
                                                                                            5
                                                                                            6

                                                                                            注意到Iterator是惰性计算的序列,所以我们可以用Python表示“全体自然数”,“全体素数”这样的序列,而代码非常简洁。

                                                                                            function 参数如果是 None,可迭代对象的每一个元素自身等效布尔值

                                                                                            print(list(filter(None, range(-5, 5))))
                                                                                            
                                                                                            1

                                                                                            # 排序算法 sorted

                                                                                            排序也是在程序中经常用到的算法。无论使用冒泡排序还是快速排序,排序的核心是比较两个元素的大小。如果是数字,我们可以直接比较,但如果是字符串或者两个dict呢?直接比较数学上的大小是没有意义的,因此,比较的过程必须通过函数抽象出来。

                                                                                            Python内置的sorted()函数就可以对list进行排序:

                                                                                            >>> sorted([36, 5, -12, 9, -21])
                                                                                            [-21, -12, 5, 9, 36]
                                                                                            
                                                                                            1
                                                                                            2

                                                                                            此外,sorted()函数也是一个高阶函数,它还可以接收一个key函数来实现自定义的排序,例如按绝对值大小排序:

                                                                                            >>> sorted([36, 5, -12, 9, -21], key=abs)
                                                                                            [5, 9, -12, -21, 36]
                                                                                            
                                                                                            1
                                                                                            2

                                                                                            key指定的函数将作用于list的每一个元素上,并根据key函数返回的结果进行排序。对比原始的list和经过key=abs处理过的list:

                                                                                            list = [36, 5, -12, 9, -21]
                                                                                            
                                                                                            keys = [36, 5,  12, 9,  21]
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3

                                                                                            然后sorted()函数按照keys进行排序,并按照对应关系返回list相应的元素:

                                                                                            keys排序结果 => [5, 9,  12,  21, 36]
                                                                                                            |  |    |    |   |
                                                                                            最终结果     => [5, 9, -12, -21, 36]
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3

                                                                                            我们再看一个字符串排序的例子:

                                                                                            >>> sorted(['bob', 'about', 'Zoo', 'Credit'])
                                                                                            ['Credit', 'Zoo', 'about', 'bob']
                                                                                            
                                                                                            1
                                                                                            2

                                                                                            默认情况下,对字符串排序,是按照ASCII的大小比较的,由于'Z' < 'a',结果,大写字母Z会排在小写字母a的前面。

                                                                                            现在,我们提出排序应该忽略大小写,按照字母序排序。要实现这个算法,不必对现有代码大加改动,只要我们能用一个key函数把字符串映射为忽略大小写排序即可。忽略大小写来比较两个字符串,实际上就是先把字符串都变成大写(或者都变成小写),再比较。

                                                                                            这样,我们给sorted传入key函数,即可实现忽略大小写的排序:

                                                                                            >>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower)
                                                                                            ['about', 'bob', 'Credit', 'Zoo']
                                                                                            
                                                                                            1
                                                                                            2

                                                                                            要进行反向排序,不必改动key函数,可以传入第三个参数reverse=True:

                                                                                            >>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower, reverse=True)
                                                                                            ['Zoo', 'Credit', 'bob', 'about']
                                                                                            
                                                                                            1
                                                                                            2

                                                                                            从上述例子可以看出,高阶函数的抽象能力是非常强大的,而且,核心代码可以保持得非常简洁。

                                                                                            小结

                                                                                            sorted()也是一个高阶函数。用sorted()排序的关键在于实现一个映射函数。

                                                                                            # 拉链函数 zip

                                                                                            • zip(*iterables)
                                                                                            • 像拉链一样,把多个可迭代对象合并在一起,返回一个迭代器
                                                                                            • 将每次从不同对象中取到的元素合并成一个元组
                                                                                            print(list(zip(range(10),range(10))))
                                                                                            print(list(zip(range(10),range(10),range(5),range(10))))
                                                                                            print(dict(zip(range(10),range(10))))
                                                                                            
                                                                                            d1 = {str(x):y for x,y in zip(range(10),range(10))} # 字典解析式
                                                                                            print(d1)
                                                                                            
                                                                                            1
                                                                                            2
                                                                                            3
                                                                                            4
                                                                                            5
                                                                                            6
                                                                                            edit icon编辑此页open in new window
                                                                                            上次编辑于: 2021/6/23 03:47:00
                                                                                            贡献者: clay-wangzhi
                                                                                            下一页
                                                                                            5.2 返回函数
                                                                                            备案号:冀ICP备2021007336号
                                                                                            Copyright © 2023 Clay