
Scalers 点评:在 2015 年,ScalersTalk 成长会完成 Python 小组完成了 《Python 核心编程》第 1 轮的学习。到 2016 年,我们开始第二轮的学习,并 且将重点放在章节的习题上。Python 小组是成长会内部小组,如果你想和我们 一起学习 Python,你需要是成长会成员,并且完成相关进群任务。
我们的节奏是行动是一周一章学到位,章节习题都会一个一个过。通过到位地 执行,达到实质性的提升。
本周学习情况
本周(20160314-20160320)学习第九章,章节内容为《文件》。本周复盘主 持人为 张丹荔。
本章主要内容
本章介绍了文件对象(内建函数、内建方法、属性), 标准文件, 访问文件系统的方法, 文件执行,初步认识持久存储和标准库中与文件有关的模块.
本章主要知识点
文件对象
-
定义:连续的字节序列,一般使用流的方式传输,流可以是单个字节也可以是大数据块。
-
文件及类文件:普通的磁盘文件, 而且也可以访问任何其它类型抽象层面上的”文件”,例如通过URL访问Web页面,或者网络通讯中的Socket.
文件内建函数
-
open: 用于打开文件的内建函数open(filename, access_mode, buffering)其中
access_mode支持r,w,a,U四种模式,buffering支持-1, 0, 1, 大于1的数字 -
file: 同open函数功能一样,仅当需要通过上下文表明访问的是文件对象时,才需要思考使用,否则一般使用open即可。 -
UNS: 通用换行符,默认Python中打开了对于通用换行符的支持,无论是哪个系统中使用的换行符,皆可以被识别,同时Python中还提供了关闭该功能的方法——即来关闭该功能。
--without-universal-newlines
文件内建方法
-
读:
read, readline, readlines(size=-1, 0, n), next -
写:
write(str), writelines(sequences) -
位移:
seek(offset, whence=0,1,2), tell -
关闭:
close -
其它:
fileno, truncate(size), flush, isatty
文件内建属性
-
closed: 是否关闭状态 -
encoding: 编码方式 -
mode: 打开方式 -
name: 文件名称 -
newlines: 换行符信息,若还没遇到换行符时,为None;若找到一个换行符,返回结果为字符串;若找到多个换行符,为换行符的列表
标准文件
Python中只要程序一执行,就可以访问三个标准文件,分别如下:
-
sys.stdin: 标准输入(一般是键盘) -
sys.stdout: 标准输出(到显示器的缓冲输出) -
sys.stderr: 标准错误(到屏幕的非缓冲输出)我们可以通过
sys库拿到这三个文件的句柄,即可访问以上三个文件。此外,sys.*对应的所有都是文件,都可以通过句柄来访问。
命令行参数
命令行参数即在执行Python程序时,通过命令行输入的参数,类似shell等在终端执行命令时输入的参数。这里采用了类似C语言中的表明方法,即argv.
-
argc: 命令行参数的个数len(sys.argv) -
argv: 命令行参数的列表访问方式:
sys.argv,返回一个存储了所有参数的列表,其中首个元素sys.argv[0]是程序的名称,从sys.argv[1]才开始表明输入的第一个参数,若输入只有一个参数时,推荐直接使用sys.argv[1]来获取第一个参数;若输入参数较多时,推荐使用getopt库获取命令行参数列表。
文件系统
-
访问方式:通过 os 模块来访问
-
os模块对于文件及文件夹的操作: -
操作单个文件:
mkfifo/mknod, remove/unlink, rename/renames, tmpfile, walk -
操作文件夹:
chdir/fchdir, chroot, listdir, mkdir/makedirs, rmdir/removedirs -
调整权限:
access, chmod, chown/lchown, umask -
文件描述符:
open, read/write -
os.path模块对于文件路径的操作: -
分隔:
basename, dirname, join, …… -
信息:
getatime, getctime, getmtime, getsize -
查询:
exists, isabs, isdir, ……
文件持久化存储相关库
-
序列化对象的库:
-
pickle/cPickle序列化的库:pickle.dump(obj, file) 序列化 pickle.load(obj) 反序列化 -
anydbm持久化存储的库:db = anydbm.open(filename, access_mode) //1
db[key_str] = value_str //2
db.close //3
db.items //4通过
key和value方式存储,仅仅支持存储字符串,即key和value都必须是字符串。 -
shelve库:结合了前两者的功能,既可以将任意
Python对象序列化,同时还可以将其存储在文件或者内存中。使用方法类似anydbm。
其它文件相关库
-
编码转换:
base64, binascii, uu -
压缩解压:
gzip/zlib, bz2, tarfile, zipfile -
高级文件访问:
shutil -
其它:
tempfile, cStringIO
ScalersTalkID:scalerstalk
本微信公众号作者Scalers,游走在口译世界的IT从业者。微信公众号ScalersTalk,网站ScalersTalk.com,口译100小时训练计划群C 456036104
成长会是由Scalers发起的面向成长、实践行动,且凝聚了来自全球各地各行各业从业者的社群。有意入会者请和Scalers直接联系,我和其他会员会和你直接交流关于成长行动等各方面的经验教训。2016年成长会持续招募中,参见做能说会写的持续行动者:ScalersTalk成长会2016年会员计划介绍(2016.2更新)
