Python 学习笔记

date
Oct 5, 2018
slug
python
status
Published
tags
学习笔记
summary
人生苦短,那就了解了解 Python。
type
Post

基本注意点

  • #开头,注释
  • 缩进的语句视为代码块
  • 大小写敏感

数据类型和变量

  • True 和 False 首字母大写
  • and、or 和 not
  • 空值:None

字符串格式化%

  • %d 整数
  • %f 浮点数
  • %s 字符串
  • %x 十六进制整数
  • 补位
>>> '%2d-%02d' % (3, 1)' 3-01'>>> '%.2f' % 3.1415926'3.14'

数组:list 和 tuple

  • list 数组
    • len(list) 得到长度
    • list[-2] 获得倒数第二个元素
    • list.append(ele)往 list 中追加元素到末尾
    • list.insert(1, ele) 把元素插入到指定的位置,比如索引号为 1 的位置
    • list.pop() 删除 list 末尾的元素,用 pop()方法
    • list.pop(i) 删除指定位置的元素,用 pop(i)方法,其中 i 是索引位置
    • 元素的数据类型也可以不同,L = [‘Apple’, 123, True]
  • tuple 数组:classmates = (‘Michael’, ‘Bob’, ‘Tracy’)
    • tuple 一旦初始化就不能修改,代码更安全

条件判断和循环

  • if elif else
  • for in
  • while
  • range() 函数
    • >>> range(1,5) #代表从1到5(不包含5)[1, 2, 3, 4]
      >>> range(1,5,2) #代表从1到5,间隔2(不包含5)[1, 3]
      >>> range(5) #代表从0到5(不包含5)[0, 1, 2, 3, 4]
  • raw_inpit(str) 读取的内容永远以字符串的形式返回

dict 和 set

  • dict 就是 map,用 key-value 的形式存储。
d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
  • 根据 key 获得 value
    • []:一旦 key 不存在就会报错
    • get()函数:如果 key 不存在,可以返回 None,或者自己指定的 value(作为第二个参数传入)
    • ‘Thomas’ in d 如果不存在则返回 False
  • set 是一组 key 的集合,但不存储 value,key 不能重复。
    • 需要 list 作为输入
    • add(key) 函数用来往里面添加元素,自动忽略重复
    • remove(key) 函数用来删除元素
    • & 操作用来做交集
    • | 操作用来做并集

函数

  • 类型检查 isinstance
  • 可变参数
  • 关键字参数 ** ,
  • 参数定义的顺序必须

默认参数

def power(x, n = 2):
    s = 1
    while n > 0:
        n = n - 1
        s = s * x
    return s
定义默认参数要牢记一点:默认参数必须指向不变对象!

可变参数

a = [2, 3, 5]
def calc(*numbers):
    sum = 0
    for n in numbers:
        sum = sum + n * n
    return sum
calc(2, 3, 5) # 10
calc(*a) # 10

关键参数

extra = {'city': 'Beijing', 'job': 'Engineer'}

def person(name, age, **kw):
    print('name:', name, 'age:', age, 'other:', kw)
>>> person('Michael', 30)
# name: Michael age: 30 other: {}
>>> person('Adam', 45, gender = 'M', job = 'Engineer')
# name: Adam age: 45 other: {'gender': 'M', 'job': 'Engineer'}
>>> person('Jack', 24, city = extra['city'], job = extra['job'])
# name: Jack age: 24 other: {'city': 'Beijing', 'job': 'Engineer'}
>>> person('Jack', 24, **extra)
# name: Jack age: 24 other: {'city': 'Beijing', 'job': 'Engineer'}
kw 获得的 dict 是 extra 的一份拷贝,对 kw 的改动不会影响到函数外的 extra。

命名关键字参数

  • * 号 后面的参数被视为 命名关键字参数
def person(name, age, *, city = 'shanghai', job):
    # 没有 city 和 job 字段或多了其他字段则会报错
    print(name, age, city, job)

person('Jack', 24, city='Beijing', job='Engineer')
# Jack 24 Beijing Engineer
如果函数定义中已经有了一个可变参数,后面跟着的命名关键字参数就不再需要一个特殊分隔符 * 了:
def person(name, age, *args, city, job):
    print(name, age, args, city, job)

person('张三', 12, 213, city='北京', job='frontEnd')
# 张三 12 (12, 213) 北京 frontEnd
如果没有 可变参数,就必须加一个 * 作为特殊分隔符。如果缺少*,Python 解释器将无法识别 位置参数 和 命名关键字参数

参数组合

在 Python 中定义函数,可以用必选参数、默认参数、可变参数、关键字参数和命名关键字参数,这 5 种参数都可以组合使用。
但是请注意,参数定义的顺序必须是:
  1. 必选参数
  1. 默认参数 x = 5
  1. 可变参数 num
  1. 命名关键字参数 *ak
  1. 关键字参数 (如存在可变参数则不需声明)

定义空函数

def nop():
    pass
pass 可以用来作为占位符

高级特性

切片(Slice )

>>> L = ['Michael', 'Sarah', 'Tracy', 'Bob', 'Jack']
>>> L[0:3]
['Michael', 'Sarah', 'Tracy']
  • L[0:3] 表示,从索引 0 开始取,直到索引 3 为止,但不包括索引 3。即索引 0,1,2,正好是 3 个元素。
  • 如果第一个索引是 0,还可以省略。
  • L[-1] 取倒数第一个元素,也支持倒数切片:L(-2:)
  • 只写[:] 就可以原样复制一个 list
  • L[:10:2] 表示前十个元素,每两个取一个:[0,2,4,6,8]
  • L[:10:2] 前 10 个数,每两个取一个
  • L[::5] 所有数,每 5 个取一个:
  • tuple 也可以用切片,操作结果也是 tuple
  • 字符串也支持切片

迭代(Iteration)

  • 只要是可迭代对象(list,tuple,dict,set,字符串)都可以用 for…in…迭代
  • 默认情况下,dict 迭代的是 key。
    • 如果要迭代 value,可以用 for value in d.itervalues()
    • 如果要同时迭代 key 和 value,可以用 for k, v in d.iteritems()。
  • 判断一个对象是否是可迭代对象:
from collections import Iterable
isinstance('abc', Iterable) # str是否可迭代 True
isinstance([1,2,3], Iterable) # list是否可迭代 True
isinstance(123, Iterable) # 整数是否可迭代 False
拥有下标的循环:
for i, value in enumerate(['A', 'B', 'C']):
  print i, value
for 循环同时引用两个变量:
for x, y in [(1, 1), (2, 4), (3, 9)]:
	print x, y

列表生成式(List Comprehensions)

[x * x for x in range(1, 11)] => [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
# 加上判断
[x * x for x in range(1, 11) if x % 2 == 0] => [4, 16, 36, 64, 100]
# 两层循环(可以用来生成全排列)
[m + n for m inABCfor n inXYZ] => [AX,AY,AZ,BX,BY,BZ,CX,CY,CZ]

生成器(Generator)

在 Python 中,这种一边循环一边计算的机制,称为生成器:generator。
生成器里面装了用来生成一个 list 的算法,这样就不必创建完整的 list,从而大量的节省空间
  • 如何创建 generator
    • 把列表生成的 [] 改成 ()
    • 函数内使用 yield
g = (x * x for x in range(3))
g.next() # 0
g.next() # 1
g.next() # 4
g.next() # StopIteration

for n in g:
  print n
定义 generator 的另一种方法,yield:
def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
        yield b
        a, b = b, a + b
        n = n + 1
    return 'done'
如果一个函数定义中包含 yield 关键字,那么这个函数就不再是一个普通函数,而是一个 generator
可以直接使用 for 循环来迭代, 但是那样获取不到返回值, 必须使用捕获 StopIteration 错误, 返回值包含在 StopIteration 的 value 中:
g = fib(6)
while True:
     try:
         x = next(g)
         print('g:', x)
     except StopIteration as e:
         print('Generator return value:', e.value)
         break
# g: 1
# ...
# Generator return value: done

Generator 的执行顺序

generator 函数在每次调用 next()时时候执行到 yield 语句返回,再次执行时从上次返回的 yield 语句处继续执行。
def odd():
    print('step 1')
    yield 1
    print('step 2')
    yield(3)
    print('step 3')
    yield(5)
o = odd()
>>> next(o)
# step 1
# 返回值 1
>>> next(o)
# step 2
# 返回值 3
>>> next(o)
# step 3
# 返回值 5

迭代器

  • 凡是可作用于 for 循环的对象都是 Iterable 类型;
  • 凡是可作用于 next()函数的对象都是 Iterator 类型,它们表示一个惰性计算的序列;
  • list => []、dict => {}、str = ‘aaa’ 是 Iterable 但不是 Iterator
  • Iterator 可以通过 iter() 函数获得一个该对象。

模块

mycompany
├─ __init__.py
├─ abc.py
└─ xyz.py
引入了包以后,只要顶层的包名不与别人冲突,那所有模块都不会与别人冲突。现在,abc.py 模块的名字就变成了 mycompany.abc,类似的,xyz.py 的模块名变成了 mycompany.xyz。
每一个包目录下面都 必须有一个 __init__.py 的文件,否则,Python 就把这个目录当成普通目录,而不是一个包。__init.py__ 可以是空文件,也可以有 Python 代码,因为__init.py__ 本身就是一个模块,而它的模块名就是 mycompany。
类似的,可以有多级目录,组成多级层次的包结构。比如如下的目录结构:
mycompany
 ├─ web
 │  ├─ __init__.py
 │  ├─ utils.py
 │  └─ www.py
 ├─ __init__.py
 ├─ abc.py
 └─ xyz.py
文件 www.py 的模块名就是 mycompany.web.www,两个文件 utils.py 的模块名分别是 mycompany.utilsmycompany.web.utils
模块是一组 Python 代码的集合,可以使用其他模块,也可以被其他模块使用。
  • 创建自己的模块时,要注意:
    • 模块名要遵循 Python 变量命名规范,不要使用中文、特殊字符;
    • 模块名不要和系统模块名冲突,最好先查看系统是否已存在该模块,检查方法是在 Python 交互环境执行 import abc,若成功则说明系统存在此模块。

模块模板

#!/usr/bin/env python3  # 可以让这个hello.py文件直接在Unix/Linux/Mac上运行
# -*- coding: utf-8 -*- # 文件本身使用标准UTF-8编码;
' a test module ' # 任何模块代码的第一行字符串都被视为模块的文档注释;
__author__ = 'Michael Liao' # 把作者写进去,这样当你公开源代码后别人就可以瞻仰你的大名

# 以上就是Python模块的标准文件模板

import sys

def test():
    args = sys.argv
    if len(args)==1:
        print('Hello, world!')
    elif len(args)==2:
        print('Hello, %s!' % args[1])
    else:
        print('Too many arguments!')
# 当我们在 命令行运行 hello 模块文件时,Python 解释器把一个特殊变量 __name__ 置为 __main__
# 也就是下面的这个 if 只有用命令行运行才会执行
if __name__=='__main__':
    test()
作用域
  • 类似__xxx__这样的变量是特殊变量,可以被直接引用,但是有特殊用途,我们自己的变量一般不要用这种变量名;
  • 类似_xxx__xxx__ 这样的函数或变量就是非公开的(private),不应该被直接引用
private 函数或变量不应该被别人引用,那它们有什么用呢?请看例子:
def _private_1(name):
    return 'Hello, %s' % name

def _private_2(name):
    return 'Hi, %s' % name

def greeting(name):
    if len(name) > 3:
        return _private_1(name)
    else:
        return _private_2(name)
外部不需要引用的函数全部定义成 private,只有外部需要引用的函数才定义为 public

面向对象编程

未完待续…
 

© jianxiaoBai 2021 - 2024