廖雪峰Python的研读笔记(一) Python基础、函数、高级特性

前言

以前知道廖前辈的这个 站,但是今天是第一次拜读,我是通过《Python核心编程(第三版)》这本书入门Python的,感觉廖前辈的教程更加容易,总结的也很到位。下面记录的是此番学习Python时带给我的领悟,以及一些值得关注的东西。我将它们写入博客《廖雪峰Python的研读笔记》系列。

Python基础

字符串和编码

Unicode把所有语言都统一到一套编码里,其标准也在不断发展,但最常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节)。现代操作系统和大多数编程语言都直接支持Unicode。

ASCII编码是1个字节,而Unicode编码通常是2个字节。虽然解决了乱码问题,但是用Unicode编码比ASCII编码需要多一倍的存储空间,在存储和传输上都很不划算。

本着节约的精神,又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间。

此外,UTF-8编码有一个额外的好处,就是ASCII编码实际上可以被看成是UTF-8编码的一部分,所以,大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。

现在计算机系统通用的字符编码工作方式:
在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。比如,记事本程序和web服务器,它们都是这样工作的。

循环

仅在必要的时候使用和,因为它们会造成代码执行逻辑分叉过多,容易出错。大多数情况下,我们都可以通过改写循环条件或者修改循环逻辑,去掉和语句。

使用dict和set

dict

和list比较,dict有以下几个特点:

  1. 查找和插入的速度极快,不会随着key的增加而变慢;
  2. 需要占用大量的内存,内存浪费多。

而list相反:

  1. 查找和插入的时间随着元素的增加而增加;
  2. 占用空间小,浪费内存很少。

所以,dict是用空间来换取时间的一种方法。

dict可以用在需要高速查找的很多地方,在Python代码中几乎无处不在,正确使用dict非常重要,需要牢记的第一条就是dict的key必须是不可变对象。

这是因为dict根据key来计算value的存储位置,如果每次计算相同的key得出的结果不同,那dict内部就完全混乱了。这个通过key计算位置的算法称为哈希算法(Hash)。

set

set和dict类似,也是一组key的集合,但不存储value。由于key不能重复,所以,在set中,没有重复的key。

添加用,删除用,交集用,并集用。

再议不可变对象

对于不变对象来说,调用对象自身的任意方法,也不会改变该对象自身的内容。相反,这些方法会创建新的对象并返回,这样,就保证了不可变对象本身永远是不可变的。

例如。

本章小结

几种类型的增删改查:

type 可变 生成 工厂 连接
tuple () 或 (1,) tuple() t1[index] t1+t2
list [] 或 [1] list() append() pop() l1[index]=value l1[index] l1+l2
dict {} 或 {‘k’:’v’} dict() d1[key]=value pop() d1[key]=value d1[key]
set {1} set() add() remove()

函数

调用函数

可以在交互式命令行通过查看函数的帮助信息。

数据类型转换

函数名其实就是指向一个函数对象的引用,完全可以把函数名赋给一个变量,相当于给这个函数起了一个“别名”:

参数检查

让我们修改一下的定义,对参数类型做检查,只允许整数和浮点数类型的参数。数据类型检查可以用内置函数实现:

练习

请定义一个函数,接收3个参数,返回一元二次方程的两个解。

函数的参数

默认参数

当函数有多个参数时,把变化大的参数放前面,变化小的参数放后面。变化小的参数就可以作为默认参数。

默认参数很有用,但使用不当,也会掉坑里。默认参数有个最大的坑,演示如下:

先定义一个函数,传入一个list,添加一个再返回:

当你正常调用时,结果似乎不错:

当你使用默认参数调用时,一开始结果也是对的:

但是,再次调用时,结果就不对了:

很多初学者很疑惑,默认参数是[],但是函数似乎每次都“记住了”上次添加了’END’后的list。

原因解释如下:

Python函数在定义的时候,默认参数L的值就被计算出来了,即[],因为默认参数L也是一个变量,它指向对象[],每次调用该函数,如果改变了L的内容,则下次调用时,默认参数的内容就变了,不再是函数定义时的[]了。

所以,定义默认参数要牢记一点:默认参数必须指向不变对象!

要修改上面的例子,我们可以用这个不变对象来实现:

现在,无论调用多少次,都不会有问题:

为什么要设计、这样的不变对象呢为不变对象一旦创建,对象内部的数据就不能修改,这样就减少了由于修改数据导致的错误。此外,由于对象不变,多任务环境下同时读取对象不需要加锁,同时读一点问题都没有。我们在编写程序时,如果可以设计一个不变对象,那就尽量设计成不变对象。

可变参数

把任意个参数传入函数中,需要定义一个tuple,例如;
把一个list或tuple中的全部元素一起传入这样的函数,可以用和的形式调用函数。

关键字参数

可变参数允许你传入0个或任意个参数,这些可变参数在函数调用时自动组装为一个tuple。而关键字参数允许你传入0个或任意个含参数名的参数,这些关键字参数在函数内部自动组装为一个dict。请看示例:

把任意个关键字参数传入函数中,需要定义一个dict,例如;
把一个dict中的全部元素(此时key为变量名,它们必须是字符串)一起传入这样的函数,可以用的形式调用函数。(注意:将获得一个dict,它是的拷贝,对的改动不会影响到函数外的)

命名关键字参数(Python3)

对于关键字参数,在函数中我们需要判断它们是否存在,通常使用这样的判断,但是调用者仍然可以传入不受限制的关键字参数;
如果要限制关键字参数的名字,可以用命名关键字参数,例如只接收和作为关键字参数时,可以定义为;
和关键字参数不同,命名关键字参数需要一个特殊分隔符,后面的参数被视为命名关键字参数;
如果函数定义中已经有了一个可变参数,后面跟着的命名关键字参数就不再需要一个特殊分隔符了,例如;
命名关键字参数也可以带有默认值,例如:;
命名关键字参数必须传入参数名,这和位置参数不同。如果没有传入参数名,调用将 错:

参数组合

参数定义的顺序必须是:必选参数、默认参数、可变参数、命名关键字参数和关键字参数。
对于任意函数,都可以通过类似的形式调用它,无论它的参数是如何定义的。

小结

Python的函数具有非常灵活的参数形态,既可以实现简单的调用,又可以传入非常复杂的参数。

默认参数一定要用不可变对象,如果是可变对象,程序运行时会有逻辑错误!

要注意定义可变参数和关键字参数的语法:

是可变参数,args接收的是一个tuple;

是关键字参数,kw接收的是一个dict。

以及调用函数时如何传入可变参数和关键字参数的语法:

可变参数既可以直接传入:,又可以先组装list或tuple,再通过传入:;

关键字参数既可以直接传入:,又可以先组装dict,再通过传入:。

使用和是Python的习惯写法,当然也可以用其他参数名,但最好使用习惯用法。

命名的关键字参数是为了限制调用者可以传入的参数名,同时可以提供默认值。

定义命名的关键字参数在没有可变参数的情况下不要忘了写分隔符,否则定义的将是位置参数。

递归调用

小结

使用递归函数的优点是逻辑简单清晰,缺点是过深的调用会导致栈溢出。

针对尾递归优化的语言可以通过尾递归防止栈溢出。尾递归事实上和循环是等价的,没有循环语句的编程语言只能通过尾递归实现循环。

Python标准的解释器没有针对尾递归做优化,任何递归函数都存在栈溢出的问题。

练习

高级特性

切片

有了切片操作,很多地方循环就不再需要了。Python的切片非常灵活,一行代码就可以实现很多行循环才能完成的操作。

tuple也是一种list,唯一区别是tuple不可变。因此,tuple也可以用切片操作,只是操作的结果仍是tuple。
字符串也可以看成是一种list,每个元素就是一个字符。因此,字符串也可以用切片操作,只是操作结果仍是字符串。在很多编程语言中,针对字符串提供了很多各种截取函数(例如,substring),其实目的就是对字符串切片。Python没有针对字符串的截取函数,只需要切片一个操作就可以完成,非常简单。

迭代

可以看出,Python的循环抽象程度要高于Java的循环,因为Python的循环不仅可以用在list或tuple上,还可以作用在其他可迭代对象上。

因为dict的存储不是按照list的方式顺序排列,所以,迭代出的结果顺序很可能不一样。
默认情况下,dict迭代的是key。如果要迭代value,可以用,如果要同时迭代key和value,可以用,其迭代结果为

判断一个对象是可迭代对象,方法是通过collections模块的Iterable类型判断:

Python内置的enumerate函数可以把一个list变成索引-元素对,这样就可以在for循环中同时迭代索引和元素本身:

注意:函数产生一个enumerate对象,它是一个类似生成器的对象,因此只能被语句迭代一次。若将其保存在变量中再次迭代,将不会有任何输出。

上面的for循环里,同时引用了两个变量,在Python里是很常见的,比如下面的代码:

列表生成器

列表生成式即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式。

用法举例:

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2017年3月10日
下一篇 2017年3月11日

相关推荐