当前位置: 56net亚洲必嬴 > 编程 > 正文

python之常用模块

时间:2019-10-24 18:29来源:编程
目录: 明天内容: collections模块                                                            在放松权利数据类型(dict、list、set、tuple)的基本功上,collections模块还提供了多少

目录:

明天内容:

                collections模块                                                           

  在放松权利数据类型(dict、list、set、tuple)的基本功上,collections模块还提供了多少个附加的数据类型:Counter、deque、defaultdict、namedtuple和OrderedDict等。

    1.namedtuple: 生成能够动用名字来访谈成分内容的tuple

    2.deque: 双端队列,能够快捷的从其余一侧追加和推出对象

    3.Counter: 计数器,首要用来计数

    4.OrderedDict: 有序字典

    5.defaultdict: 带有暗许值的字典

何以是模块:-----------

 1.time和datetime模块

  1.时间模块 (time)

  namedtuple (名称元祖)

  描述生机勃勃类东西的时候,那类东西都有意气风发致的表征,想直接用特色的名字就叙述那一个值的的时候就足以用命名元祖

  namedtuple是一个函数,它用来成立贰个自定义的tuple目的,何况分明了tuple要素的个数,并能够用属性实际不是索引来援引tuple的某部成分。

那样一来,大家用namedtuple能够很有益于地定义生龙活虎种数据类型,它具有tuple的不改变性,又足以依从属性来引用,使用十二分利于。

namedtuple定义

  #namedtuple('名称', [属性list]):
  Circle = namedtuple('Circle', ['x', 'y', 'r'])

www.56.net 1www.56.net 2

1 from collections import namedtuple
2 point = namedtuple('Point', ['x', 'y'])
3 p = point(3, 4)
4 
5 print(p.x)
6 print(p.y)

View Code

www.56.net,大规模的景观:四个模块正是五个富含了python定义和表明的公文,文件名就是模块名字加上.py的后缀。

 2. random模块

  2.随机数 (random)

deque (双端队列)

   使用list积攒数据时,按索引访问成分相当慢,不过插入和删除成分就异常的慢了,因为list是线性存款和储蓄,数据量大的时候,插入和删除功用异常低。

   deque是为着快速贯彻插入和删除操作的双向列表,切合用来队列和栈

deque除了贯彻list的append()pop()外,还支持appendleft()popleft(),那样就能够十二分高效地往底部增加或删除成分

www.56.net 3www.56.net 4

1 from collections import deque
2 
3 dq = deque(['a', 'b', 'c'])
4 dq.append('x')
5 dq.appendleft('y')
6 
7 dq.pop()
8 dq.popleft()
9 print(dq)

deque

模块分类:1----放置模块

3. OS模块(是与操作系统交互的三个接口)

  3.sys模块

OrderedDict

  使用dict时,Key是九冬的。在对dict做迭代时,我们爱莫能助鲜明Key的依次。

  如果要保证Key的相继,能够用OrderedDict

  注意,OrderedDict的Key会依照插入的顺序排列,不是Key自身排序:

www.56.net 5www.56.net 6

 1 from collections import OrderedDict
 2 
 3 d = dict([('a', 2), ('c', 4), ('b', 6)])
 4 # dict的key是无序的
 5 print(d)
 6 
 7 od = OrderedDict([('a', 1), ('c', 3), ('b', 5)])
 8 # OrderedDict的key是有序的
 9 print(od)
10 
11 od['z'] = 6
12 od['y'] = 7
13 od['x'] = 8
14 print(od.keys())  # 按照插入的Key的顺序返回
15 
16 
17 {'a': 2, 'c': 4, 'b': 6}
18 OrderedDict([('a', 1), ('c', 3), ('b', 5)])
19 odict_keys(['a', 'c', 'b', 'z', 'y', 'x'])

OrderedDict

     2----扩张模块()

4. sys模块(sys模块是与python解释器交互的一个接口)

  4.os模块

defaultdict

  使用dict时,如若引用的Key不设有,就能抛出KeyError。倘使愿意key不真实时,再次回到贰个暗中认可值,就足以用defaultdict

  注意暗中同意值是调用函数再次回到的,而函数在开立defaultdict对象时传出。

    除了在Key空头支票时再次来到暗许值,defaultdict的其他表现跟dict是截然等同的

 

www.56.net 7www.56.net 8

 1 from collections import defaultdict
 2 values = [11, 22, 33, 44, 55, 66, 77, 88, 99]
 3 my_dict = defaultdict(list)
 4 
 5 for value in values:
 6     if value > 66:
 7         my_dict['k1'].append(value)
 8     elif value < 66:
 9         my_dict['k2'].append(value)
10 
11 print(my_dict)
12 
13 
14 defaultdict(<class 'list'>, {'k2': [11, 22, 33, 44, 55], 'k1': [77, 88, 99]})

defaultdict

 

               3----自定义模块     自个儿写的文本

5.系列化模块 

  5.连串化模块

Counter

 

  Counter目标是用来追踪值现身的次数。它是贰个冬辰的容器类型,以字典的键值对格局积存,其霜月素作为key,其计数作为value。计数值能够是即兴的Interger(满含0和负数)。Counter类和其余语言的bags或multisets很相近。

www.56.net 9www.56.net 10

1 from collections import Counter
2 c = Counter('hello')
3 c1 = Counter({'a': 4, 'b': 2})
4 c2 = Counter(a=4, b=6)
5 print(c1)
6 print(c)
7 print(c2)

Counter

  当所拜访的键一纸空文时,再次来到0,并不是KeyError;否则再次回到它的计数。

www.56.net 11www.56.net 12

1 from collections import Counter
2 c = Counter('abcdefgab')
3 print(c['a'])
4 print(c['h'])
5 print(c['d'])
6 
7 2
8 0
9 1

计数值的访问

  能够行使一个iterable对象恐怕另二个Counter对象来更新键值。

  计数器的翻新包含扩展和压缩三种。个中,扩展应用update()方法和裁减则动用subtract()方法

www.56.net 13www.56.net 14

 1 from collections import Counter
 2 c = Counter('which')
 3 c.update('witch')
 4 print(c['h'])
 5 
 6 d = Counter('watch')
 7 c.update(d)
 8 print(c['h'])
 9 
10 c = Counter('which')
11 c.subtract('witch')
12 print(c['h'])
13 
14 d = Counter('watch')
15 c.subtract(d)
16 print(c['a'])
17 
18 
19 3
20 4
21 1
22 -1

View Code

 

为什么要接收模块?

6.hashlib模块

1.时间模块(time)

表示时间的三种格局:

  1.时间戳(timestamp)

  2.格式化的时光字符串(Format String) 

  3.元组(结构化) (struct time)

1.时间戳:

time.sleep()  #使程序滞留一段时间,该时间以 秒 为单位。
time.time()  #时间戳, 即 记录某个时间点

2.格式化时间字符串的各类参数用法:如下

www.56.net 15www.56.net 16

%y 两位数的年份表示(00-99)
%Y 四位数的年份表示(000-9999)
%m 月份(01-12)
%d 月内中的一天(0-31)
%H 24小时制小时数(0-23)
%I 12小时制小时数(01-12)
%M 分钟数(00=59)
%S 秒(00-59)
%a 本地简化星期名称
%A 本地完整星期名称
%b 本地简化的月份名称
%B 本地完整的月份名称
%c 本地相应的日期表示和时间表示
%j 年内的一天(001-366)
%p 本地A.M.或P.M.的等价符
%U 一年中的星期数(00-53)星期天为星期的开始
%w 星期(0-6),星期天为星期的开始
%W 一年中的星期数(00-53)星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%Z 当前时区的名称
%% %号本身


print(time.strftime('%Y.%m.%d %X'))
print(time.strftime('%Y.%m.%d %x'))
print(time.strftime('%y%m%d %H%M%S '))
print(time.strftime('%y%m%d %I%M%S %a'))
print(time.strftime('%y%m%d %I%M%S %A'))
print(time.strftime('%y%m%d %I%M%S %A %b'))
print(time.strftime('%y%m%d %I%M%S %A %B'))
print(time.strftime('%y%m%d %I%M%S %A %B %c'))
print(time.strftime('%y%m%d %I%M%S %A %B %c %j'))
print(time.strftime('%y%m%d %I%M%S %A %B %c %j %p'))
print(time.strftime('%y%m%d %I%M%S %A %B %c %j %p %U'))
print(time.strftime('%y%m%d %I%M%S %A %B %c %j %p %U %w'))
print(time.strftime('%y%m%d %I%M%S %A %B %c %j %p %U %W'))
print(time.strftime('%y%m%d %I%M%S %A %B %c %j %p %U %W %Z'))




结果:
2017.08.08 18:51:58
2017.08.08 08/08/17
170808 185158 
170808 065158 Tue
170808 065158 Tuesday
170808 065158 Tuesday Aug
170808 065158 Tuesday August
170808 065158 Tuesday August Tue Aug  8 18:51:58 2017
170808 065158 Tuesday August Tue Aug  8 18:51:58 2017 220
170808 065158 Tuesday August Tue Aug  8 18:51:58 2017 220 PM
170808 065158 Tuesday August Tue Aug  8 18:51:58 2017 220 PM 32
170808 065158 Tuesday August Tue Aug  8 18:51:58 2017 220 PM 32 2
170808 065158 Tuesday August Tue Aug  8 18:51:58 2017 220 PM 32 32
170808 065158 Tuesday August Tue Aug  8 18:51:58 2017 220 PM 32 32 ?D1¨²¡À¨º¡Á?¨º¡À??

View Code

3.元组(结构化):struct_time元组共有9个要素共八个要素:(年,月,日,时,分,秒,一年中第几周,一年中第几天等)

www.56.net 17

m = time.localtime()   #类似命名元组  用于计算比对。
print(m)
print(m.tm_year)

结果:

time.struct_time(tm_year=2017, tm_mon=8, tm_mday=8, tm_hour=18, tm_min=54, tm_sec=21, tm_wday=1, tm_yday=220, tm_isdst=0)
2017

Process finished with exit code 0

 小结:时间戳是Computer可以识其他时间;时间字符串是人可以看懂的年月;元组则是用来操作时间的

三种格式之间的转移:

  1.时间戳(timestamp)

  2.格式化的日子字符串(Format String) 

  3.元组(结构化) (struct time)

www.56.net 18

www.56.net 19www.56.net 20

#时间戳  转  结构化    和      结构化 转  时间戳
print(time.gmtime())   #伦敦时间
print(time.localtime()) #北京时间
s = time.gmtime(1500000000) #时间戳  转  结构化
d = time.localtime(1500000000) #时间戳  转  结构化
print(s)
print(d)
print(time.mktime(s))   #结构化 转  时间戳
print(time.mktime(d))  #结构化 转  时间戳

结果:
time.struct_time(tm_year=2017, tm_mon=8, tm_mday=8, tm_hour=11, tm_min=26, tm_sec=54, tm_wday=1, tm_yday=220, tm_isdst=0)

time.struct_time(tm_year=2017, tm_mon=8, tm_mday=8, tm_hour=19, tm_min=26, tm_sec=54, tm_wday=1, tm_yday=220, tm_isdst=0)

time.struct_time(tm_year=2017, tm_mon=7, tm_mday=14, tm_hour=2, tm_min=40, tm_sec=0, tm_wday=4, tm_yday=195, tm_isdst=0)

time.struct_time(tm_year=2017, tm_mon=7, tm_mday=14, tm_hour=10, tm_min=40, tm_sec=0, tm_wday=4, tm_yday=195, tm_isdst=0)

1499971200.0
1500000000.0

Process finished with exit code 0

#结构化  转  字符串    和   字符串  转   结构化
print(time.strftime('%Y%m%d %X'))  #结构化转 字符串
print(time.strptime('2017-03-16','%Y-%m-%d'))   #字符串  转   结构化

结果:
20170808 19:29:32
time.struct_time(tm_year=2017, tm_mon=3, tm_mday=16, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=3, tm_yday=75, tm_isdst=-1)

Process finished with exit code 0

View Code

键的更正和删除

当计数值为0时,并不意味着成分被删去,删除元素应当使用del。 

键的删减

>>> c = Counter("abcdcba")
>>> c
Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1})
>>> c["b"] = 0
>>> c
Counter({'a': 2, 'c': 2, 'd': 1, 'b': 0})
>>> del c["a"]
>>> c
Counter({'c': 2, 'b': 2, 'd': 1})

 

   借使您退出python解释器然后重新步入,那么您前边定义的函数只怕变量都将错过,因而大家日常将次第写到文件中以便永远保存下来,需求时就透过python test.py形式去实施,此时test.py被称呼脚本script。

7.configparser

2.随机数(random)模块:

import random
#随机小数
print(random.random()) #大于0且小于1的小数。
print(random.uniform(1,3)) #大于1小于3的小数

#随机整数
print(random.randint(1,5))  #随机1-5的之间的整数。顾头顾尾
print(random.randrange(10))
print(random.randrange(1,10,2))

#随机选择一个返回
print(random.choice([1,2,3,4,[11,111,1111],'zxc']))

#随机选择多个返回,返回的个数为函数的第二个参数
print(random.sample([1,2,3,4,[5,6,7,8]],2))  #任意返回多个值,后面参数2 是用户之间定义的。

#打乱列表顺序
item = [1,3,5,7,9]
print(item)
random.shuffle(item)
print(item)


结果:
0.8872507582462091
1.3964555681725257
1
3
7
4
[[5, 6, 7, 8], 4]
[1, 3, 5, 7, 9]
[7, 1, 3, 9, 5]

Process finished with exit code 0

1.写一个验证码 1.要有数字, 2,要有字母  3,一共四位  4 可以重复
拿字母,用acsii 码, 拿到后,就转换成字符串。 65-90  97-122。

www.56.net 21www.56.net 22

第一种方法:
def v_code ():
    code = '' 
           ''
    for i in range (4):
        num = random.randint(0,9)
        alf = chr(random.randint(65,90))
        alp = chr(random.randint(97,122))
        add = random.choice([num,alf,alp])
        code = ''.join([code,str(add)])
    return code
print(v_code())


第二种方法:
list1 = list (range(10))
new_list = list(map(str,list1))
alf = list(range(65,91))
alp = list(range(95,123))
alf_l=[]
for i in range (65,91):
    alf = chr(i)
    alf_l.append(alf)
alp_l=[]
for i in range (95,123):
    alp = chr(i)
    alp_l.append(alp)
new_list.extend(alf_l)
new_list.extend(alp_l)
ret = []
ret = random.sample(new_list,4)
print(''.join(ret))

View Code

elements()

归来贰个迭代器。成分被重新了多少次,在该迭代器中就隐含多少个该因素。成分排列无规定顺序,个数小于1的因素不被含有。

elements()方法 

>>> c = Counter(a=4, b=2, c=0, d=-2)
>>> list(c.elements())
['a', 'a', 'a', 'a', 'b', 'b']

 

    随着程序的上扬,功效更扩展,为了方便管理,我们常常将顺序分成叁个个的文本,这样做程序的协会更清晰,方便管理。那时大家不但能够把这一个文件作为脚本去实施,还足以把她们作为模块来导入到其余的模块中,达成了效果与利益的再一次利用,

8.logging  (记录日志的模块)

3.OS模块

 

'''
os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
os.chdir("dirname")  改变当前脚本工作目录;相当于shell下cd
os.curdir  返回当前目录: ('.')
os.pardir  获取当前目录的父目录字符串名:('..')
os.makedirs('dirname1/dirname2')    可生成多层递归目录
os.removedirs('dirname1')    若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.mkdir('dirname')    生成单级目录;相当于shell中mkdir dirname
os.rmdir('dirname')    删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.listdir('dirname')    列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.remove()  删除一个文件
os.rename("oldname","newname")  重命名文件/目录
os.stat('path/filename')  获取文件/目录信息
os.sep    输出操作系统特定的路径分隔符,win下为"\",Linux下为"/"
os.linesep    输出当前平台使用的行终止符,win下为"tn",Linux下为"n"
os.pathsep    输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command")  运行shell命令,直接显示
os.popen("bash command)  运行shell命令,获取执行结果
os.environ  获取系统环境变量

os.path
os.path.abspath(path) 返回path规范化的绝对路径 os.path.split(path) 将path分割成目录和文件名二元组返回 os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 os.path.basename(path) 返回path最后的文件名。如何path以/或结尾,那么就会返回空值。
                        即os.path.split(path)的第二个元素
os.path.exists(path)  如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path)  如果path是绝对路径,返回True
os.path.isfile(path)  如果path是一个存在的文件,返回True。否则返回False
os.path.isdir(path)  如果path是一个存在的目录,则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.getatime(path)  返回path所指向的文件或者目录的最后访问时间
os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path) 返回path的大小
'''

most_common([n])

回去三个TopN列表。假设n未有被钦定,则赶回全部因素。当多个元素计数值相像不经常间,排列是无规定顺序的。

most_common()方法

 

>>> c = Counter('abracadabra')
>>> c.most_common()
[('a', 5), ('r', 2), ('b', 2), ('c', 1), ('d', 1)]
>>> c.most_common(3)
[('a', 5), ('r', 2), ('b', 2)] 

 

体系化模块:

9.collections模块(使用counter进行记数总结)

4.sys模块:

sys模块是与python解释器交互的一个接口

sys.argv           命令行参数List,第一个元素是程序本身路径
sys.exit(n)        退出程序,正常退出时exit(0)
sys.version        获取Python解释程序的版本信息
sys.maxint         最大的Int值
sys.path           返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform       返回操作系统平台名称

浅拷贝copy

浅拷贝copy

>>> c = Counter("abcdcba")
>>> c
Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1})
>>> d = c.copy()
>>> d
Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1})

 

怎么样叫体系化??

模块:

  Computer程序的支出进度中,随着程序代码越写更多,在叁个文件里代码就能够进一步长,更加的不轻便有限扶持。为了编写制定可保证的代码,大家把过多函数分组,分别放置不相同的文件里,那样,每一个文件包涵的代码就相对比较少,比相当多编制程序语言都利用这种组织代码的措施。在 Python 中,二个.py 文件就叫做多个模块(Module)。

模块分类:

  内置模块  python安装时自带的

  扩大模块  外人写好的,安装之后方可平素接受

        itchat模块(和微信相关), beautifulsoap(爬虫模块), selenium(网页自动化测验工具)

        django tornado(框架)

  自定义模块 本身写的模块 

5.种类化模块:

何以叫种类化——将原本的字典、列表等内容转变到贰个字符串的历程就称为序列化

种类化的指标

1、以某种存款和储蓄情势使自定义对象悠久化;

2、将对象从二个地点传递到另贰个地点。

3、使程序更具维护性。

www.56.net 23

json:

  Json模块提供了多少个职能:dumps、dump、loads、load

www.56.net 24www.56.net 25

import json
d = {'k':1}
ret1= json.dumps(d)   #字典转字符串
print(ret1,type(ret1))
ret2= json.loads(ret1)   #字符串转字典
print(ret2,type(ret2))

f = open('json_file','w')
dic = {'k1':'v1','k2':'v2','k3':'v3'}
json.dump(dic,f)    #dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件
f.close()
print(dic)

f = open('json_file')
dic2 = json.load(f)   #load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回
f.close()
print(type(dic2),dic2)

结果:
{"k": 1} <class 'str'>
{'k': 1} <class 'dict'>
{'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}

Process finished with exit code 0

View Code

pickle:

用以种类化的多个模块

 

  • json,用于字符串 和 python数据类型间打开转移
  • pickle,用于python特有的类型 和 python的数据类型间展开改变

 

pickle模块提供了八个职能:dumps、dump(类别化,存)、loads(反类别化,读)、load  (不仅可以够连串化字典,列表...能够把python中任性的数据类型类别化

此间大家要验证一下,json是大器晚成种具备的言语都能够辨别的数据结构。
设若大家将一个字典只怕连串化成了三个json存在文件里,那么java代码大概js代码也能够拿来用。
而是黄金年代旦大家用pickle举行种类化,其他语言就不能读懂那是怎么了~
故此,假若您类别化的原委是列表也许字典,我们特别推荐你使用json模块
但假如出于某种原因你不得不种类化其余的数据类型,而今后你还大概会用python对那个数目开展反体系化的话,那么就能够利用pickle

shelve:

shelve也是python提要求我们的类别化学工业具,比pickle用起来更轻易一些。
shelve只提须要大家一个open方法,是用key来访问的,使用起来和字典形似。

www.56.net 26www.56.net 27

import shelve
f = shelve.open('shelve_file')
f['key'] = {'int':10, 'float':9.5, 'string':'Sample data'}  #直接对文件句柄操作,就可以存入数据
f.close()

import shelve
f1 = shelve.open('shelve_file')
existing = f1['key']  #取出数据的时候也只需要直接用key获取即可,但是如果key不存在会报错
f1.close()
print(existing)

View Code

本条模块有个节制,它不扶持八个应用同有的时候候往同二个DB实行写操作。所以当大家驾驭大家的利用假若只举办读操作,我们得以让shelve通过只读方式展开DB

www.56.net 28www.56.net 29

import shelve
f = shelve.open('shelve_file', flag='r')
existing = f['key']
f.close()
print(existing)

View Code

是因为shelve在暗中同意景况下是不会记录待长久化对象的其余改变的,所以大家在shelve.open()时候供给改善暗许参数,不然对象的改换不会保留。

www.56.net 30www.56.net 31

import shelve
f1 = shelve.open('shelve_file')
print(f1['key'])
f1['key']['new_value'] = 'this was not here before'
f1.close()

f2 = shelve.open('shelve_file', writeback=True)
print(f2['key'])
f2['key']['new_value'] = 'this was not here before'
f2.close()

View Code

writeback格局有亮点也许有顽固的病痛。优点是收缩了我们失误的票房价值,并且让对象的持久化对客户越来越晶莹了;但这种措施并不是装有的景况下都急需,首先,使用writeback今后,shelf在open()的时候会大增额外的内部存款和储蓄器消耗,况兼当DB在close()的时候会将缓存中的每一个指标都写入到DB,那也会拉动特别的等待时间。因为shelve未有艺术知道缓存中哪些对象修正了,哪些对象未有校订,由此具有的指标都会被写入。

 

算术和集聚操作

+、-、&、|操作也能够用于Counter。其中&和|操作分别重临五个Counter对象各因素的最小值和最大值。供给注意的是,获得的Counter对象将去除小于1的要素。

Counter对象的算术和聚合操作

>>> c = Counter(a=3, b=1)
>>> d = Counter(a=1, b=2)
>>> c + d  # c[x] + d[x]
Counter({'a': 4, 'b': 3})
>>> c - d  # subtract(只保留正数计数的元素)
Counter({'a': 2})
>>> c & d  # 交集:  min(c[x], d[x])
Counter({'a': 1, 'b': 1})
>>> c | d  # 并集:  max(c[x], d[x])
Counter({'a': 3, 'b': 2})

 

 

选择模块好处:

  升高了代码的可维护性。

  当三个模块编写达成,就足以被另内地点援用。

  使用模块能够幸免函数名和变量名冲突。

别的常用操作

上面是部分Counter类的常用操作,来源于Python官方文书档案

Counter类常用操作

sum(c.values())  # 所有计数的总数
c.clear()  # 重置Counter对象,注意不是删除
list(c)  # 将c中的键转为列表
set(c)  # 将c中的键转为set
dict(c)  # 将c中的键值对转为字典
c.items()  # 转为(elem, cnt)格式的列表
Counter(dict(list_of_pairs))  # 从(elem, cnt)格式的列表转换为Counter类对象
c.most_common()[:-n:-1]  # 取出计数最少的n个元素
c += Counter()  # 移除0和负值

序列化 (塞里alization)将指标的情事音讯调换为能够积攒或传输的款型的进程

 1.time和datetime模块

time模块

python中,日常由以下三种方法来表示时间:

  • 日子戳(timestamp):日常来讲,时间戳表示的是从1966年二月1日00:00:00上马按秒计算的舞狮,运维“type(time.time())”,再次回到的是float类型。
  • 格式化的时辰字符串(Format String):如‘2018-4-24'
  • 结构化的日子(struct_time):元祖方式。struct_time元组共有9个因素共捌个因素:(年,月,日,时,分,秒,一年中第几周,一年中第几天,夏令时)

    import time
    # 时间戳:     
    print(time.time())     # 1520503969.847386
    # 字符串格式化时间(两种结果一样):
    print(time.strftime('%x,%X'))   # 04/24/18,16:09:53
    print(time.strftime('%c'))   # Tue Apr 24 16:11:12 2018
    print(time.strftime('%Y-%M-%d,%H:%M:%S'))   # 2018-14-24,16:14:08
    print(time.strftime('%Y-%m-%d %X'))    # 2018-03-08 18:12:49
    print(time.strftime('%Y-%m-%d %H:%M:%S'))
    # 结构化时间:   
    print(time.localtime())   # 本地时区的struct_time
    print(time.gmtime())     # UTC时区的struct_time
    

     

   当中Computer认知的光阴只可以是'时间戳'格式,而工程师可管理的只怕说人类能看懂的时光有: '格式化的年华字符串','结构化的年华' 

二种时光格式之间的转移:

www.56.net 32  

现实用法:

import time
# 时间戳转化为结构化时间
# time.gmtime(时间戳)     # UTC时间
# time.localtime(时间戳)  # 当地时间
ret = time.localtime(2000000000)
print(ret)
# time.struct_time(tm_year=2033, tm_mon=5, tm_mday=18, tm_hour=11, tm_min=33, tm_sec=20, tm_wday=2, tm_yday=138, tm_isdst=0)

# 结构化时间转化为格式化时间
print(time.strftime('%Y-%m-%d %H:%M:%S', ret))
# 2033-05-18 11:33:20

# 把一个结构化时间转化为格式化时间
print(time.strftime("%Y-%m-%d %X", time.localtime()))
# 把一个格式化时间字符串转化为struct_time
print(time.strptime('2018-04-24 17:37:06', '%Y-%m-%d %X'))

 

 www.56.net 33

# 结构化时间 --> %a %b %d %H:%M:%S %Y串

# ctime,把一个时间戳转化为time.asctime()的形式
# 如果参数未给或者为None的时候,将会默认time.time()为参数
a = time.ctime(2000000000)
print(a)   # Wed May 18 11:33:20 2033
print(time.ctime(time.time()))
# Tue Apr 24 17:41:56 2018

# asctime,把一个表示时间的元组或者struct_time表示为这种形式:'Sun Jun 20 23:21:05 1993'。
# 如果没有参数,则默认将time.localtime()作为参数传入。
print(time.asctime())
# Tue Apr 24 17:41:56 2018

python中时间日期格式化符号:

 1 %y 两位数的年份表示(00-99)
 2 %Y 四位数的年份表示(000-9999)
 3 %m 月份(01-12)
 4 %d 月内中的一天(0-31)
 5 %H 24小时制小时数(0-23)
 6 %I 12小时制小时数(01-12)
 7 %M 分钟数(00=59)
 8 %S 秒(00-59)
 9 %a 本地简化星期名称
10 %A 本地完整星期名称
11 %b 本地简化的月份名称
12 %B 本地完整的月份名称
13 %c 本地相应的日期表示和时间表示
14 %j 年内的一天(001-366)
15 %p 本地A.M.或P.M.的等价符
16 %U 一年中的星期数(00-53)星期天为星期的开始
17 %w 星期(0-6),星期天为星期的开始
18 %W 一年中的星期数(00-53)星期一为星期的开始
19 %x 本地相应的日期表示
20 %X 本地相应的时间表示
21 %Z 当前时区的名称

datetime模块:

import datetime

print(datetime.datetime.now())    # 2018-03-08 21:04:15.544213     

# y-m-d h:M:S       2018-04-24 17:00:00
# 计算从脚下岁月底步 比起y-m-d h:M:S过去了不怎么年 多少月 多少天 多少h,多少m,多少s

www.56.net 34www.56.net 35

import time
def pass_time(times):
    pass_time = time.strptime(times, '%Y-%m-%d %X')  # 结构化时间
    pass_time_stamp = time.mktime(pass_time)   # 时间戳
    time_stamp = time.time()-pass_time_stamp  # 已经过去的时间戳
    pass_times = time.localtime(time_stamp)   # 结构化时间
    now = zip(tuple(pass_times),tuple(time.localtime(0)))
    now1 = [(i[0]-i[1]) for i in now]  # 数字型列表,对应年,月---
    return '从当前时间开始,距离%s过去了%s年%s月%s日%s时%s分%s秒' %(times,now1[0],now1[1],now1[2],now1[3],now1[4],now1[5])

print(pass_time('2018-04-24 17:00:00'))

View Code

                      时间模块                                                                                           

  代表时间的三种方式

    在Python中,平常常有那二种情势来代表时间:时间戳、元组(struct_time)、格式化的命宫字符串:

    (1)时间戳(timestamp) :常常来讲,时间戳表示的是从1967年七月1日00:00:00发端按秒总结的偏移量。大家运行“type(time.time())”,重回的是float类型。

    (2)格式化的流年字符串(Format String): ‘一九九七-12-06’

www.56.net 36

%y 两位数的年份表示(00-99)
%Y 四位数的年份表示(000-9999)
%m 月份(01-12)
%d 月内中的一天(0-31)
%H 24小时制小时数(0-23)
%I 12小时制小时数(01-12)
%M 分钟数(00=59)
%S 秒(00-59)
%a 本地简化星期名称
%A 本地完整星期名称
%b 本地简化的月份名称
%B 本地完整的月份名称
%c 本地相应的日期表示和时间表示
%j 年内的一天(001-366)
%p 本地A.M.或P.M.的等价符
%U 一年中的星期数(00-53)星期天为星期的开始
%w 星期(0-6),星期天为星期的开始
%W 一年中的星期数(00-53)星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%Z 当前时区的名称
%% %号本身

    (3)元组(struct_time) :struct_time元组共有9个要素共几个要素:(年,月,日,时,分,秒,一年中第几周,一年中第几天等)

索引(Index) 属性(Attribute) 值(Values)
0 tm_year(年) 比如2011
1 tm_mon(月) 1 - 12
2 tm_mday(日) 1 - 31
3 tm_hour(时) 0 - 23
4 tm_min(分) 0 - 59
5 tm_sec(秒) 0 - 60
6 tm_wday(weekday) 0 - 6(0表示周一)
7 tm_yday(一年中的第几天) 1 - 366
8 tm_isdst(是否是夏令时) 默认为0

 

www.56.net 37www.56.net 38

 1 import time
 2 # time.sleep(10)
 3 # 时间戳
 4 print(time.time())
 5 
 6 # 时间串
 7 print(time.strftime('%Y-%m-%d %H:%M:%S'))
 8 print(time.strftime('%A'))
 9 print(time.strftime('%a'))
10 print(time.strftime('%x'))
11 print(time.strftime('%c'))
12 
13 # 时间元祖
14 print(time.localtime())
15 
16 
17 1510645831.6729546
18 2017-11-14 15:50:31
19 Tuesday
20 Tue
21 11/14/17
22 Tue Nov 14 15:50:31 2017
23 time.struct_time(tm_year=2017, tm_mon=11, tm_mday=14, tm_hour=15, tm_min=50, tm_sec=31, tm_wday=1, tm_yday=318, tm_isdst=0)

View Code

 

两种格式之间的转移

www.56.net 39

www.56.net 40

www.56.net 41www.56.net 42

 1 # 时间元祖
 2 print(time.localtime(1500000000))  # 时间戳转换时间元祖
 3 print(time.gmtime(1200000000))  # 英国时间
 4 print(time.mktime(time.localtime(1500000000)))  # 时间元祖转换时间戳
 5 
 6 print(time.strftime('%Y-%m-%d', time.localtime(1500000000)))  # 时间元祖转换时间串
 7 print(time.strptime("2017-08-03", '%Y-%m-%d'))  # 时间串转换时间元祖
 8 print(time.strptime('2018/05/12', '%Y/%m/%d'))
 9 
10 print(time.asctime(time.localtime(2000000000)))  # 时间元祖转换时间串
11 print(time.ctime())
12 print(time.ctime(1600000000))  # 时间戳转换时间串

练习

www.56.net 43www.56.net 44

1 import time
2 true_time=time.mktime(time.strptime('2017-09-11 08:30:00','%Y-%m-%d %H:%M:%S'))
3 time_now=time.mktime(time.strptime('2017-09-12 11:00:00','%Y-%m-%d %H:%M:%S'))
4 dif_time=time_now-true_time
5 struct_time=time.gmtime(dif_time)
6 print('过去了%d年%d月%d天%d小时%d分钟%d秒'%(struct_time.tm_year-1970,struct_time.tm_mon-1,
7                                        struct_time.tm_mday-1,struct_time.tm_hour,
8                                        struct_time.tm_min,struct_time.tm_sec))

计量时间差

 

sys模块

  sys模块是与python解释器交互的二个接口

sys.argv           命令行参数List,第一个元素是程序本身路径
sys.exit(n)        退出程序,正常退出时exit(0),错误退出sys.exit(1)
sys.version        获取Python解释程序的版本信息
sys.path           返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform       返回操作系统平台名称

www.56.net 45www.56.net 46

 1 import sys
 2 print(sys.platform)
 3 print(sys.version)
 4 print(sys.path)
 5 print(sys.argv)
 6 print(sys.exit())
 7 
 8 
 9 win32
10 3.6.1 (v3.6.1:69c0db5, Mar 21 2017, 18:41:36) [MSC v.1900 64 bit (AMD64)]
11 ['C:\Users\panhw\Desktop\学习文档\python\day19作业', 'C:\Users\panhw\Desktop\学习文档\python', 'C:\Users\panhw\AppData\Local\Programs\Python\Python36\python36.zip', 'C:\Users\panhw\AppData\Local\Programs\Python\Python36\DLLs', 'C:\Users\panhw\AppData\Local\Programs\Python\Python36\lib', 'C:\Users\panhw\AppData\Local\Programs\Python\Python36', 'C:\Users\panhw\AppData\Local\Programs\Python\Python36\lib\site-packages']
12 ['C:/Users/panhw/Desktop/学习文档/python/day19作业/作业.py']

View Code

random模块

 

www.56.net 47www.56.net 48

 1 import random
 2 
 3 # 随机小数
 4 print(random.random())  # 随机生成0到1之间的小数
 5 print(random.uniform(1, 10))  # 随机获取n到m之间的小数
 6 
 7 # 0.11930423761507436
 8 # 9.136906780912456
 9 
10 # 随机整数
11 print(random.randint(1, 5))  # 随机生成n到m之间的整数
12 print(random.randrange(10))  # 随机获取0到m之间的整数
13 print(random.randrange(2, 10))  # 随机生成n到m之间的整数
14 print(random.randrange(3, 15, 3))  # 随机生成n到m之间的整数 n的倍数
15 
16 # 2
17 # 4
18 # 5
19 # 6
20 
21 # 随机选择序列的一个元素返回
22 print(random.choice(['a', 'b', 3, 4, 5, 8, 'v']))
23 # 随机返回选择序列的多个元素 返回的个数为取决于第二个参数
24 print(random.sample(['a', 'b', 3, 4, 5, 8, 'v'], 3))
25 
26 # a
27 # ['a', 'b', 3]
28 
29 # 打乱原列表的顺序
30 item = [1, 2, 4, 5, 6, 7]
31 print(item)
32 random.shuffle(item)
33 print(item)
34 
35 # [1, 2, 4, 5, 6, 7]
36 # [1, 2, 4, 5, 6, 7]

View Code

www.56.net 49www.56.net 50

 1 import random
 2 
 3 
 4 def verify(n=6):
 5     """
 6     随机验证码
 7     :param n: 验证码个数 (int)
 8     :return: 返回验证码 (str)
 9     """
10     li = []
11     for i in range(n):
12         num = str(random.randint(0, 9))  # 随机整数转字符串
13         alpha = chr(random.randint(65, 90))  # 大写字母 ASCII
14         alpha2 = chr(random.randint(97, 122))  # 小写字母 ASCII
15         ret = random.choice([num, alpha, alpha2])  # 随机选择一个
16         li.append(ret)
17     return ''.join(li)  # 列表转字符串
18 
19 print(verify(8))

随机验证码

os模块

 os模块是与操作系统交互的三个接口

 

www.56.net 51www.56.net 52

 1 import os
 2 # 和系统路径相关
 3 print(os.getcwd())  # 获取当前工作目录,即当前python脚本工作的目录路径os.chdir('C:\Users')  # 改变当前脚本工作目录;相当于shell下cd
 4 print(os.getcwd())
 5 print(os.curdir)  # 返回当前目录: ('.')
 6 print(os.pardir)  # 获取当前目录的父目录字符串名:('..')
 7 
 8 
 9 # 和系统文件或文件夹相关的
10 os.mkdir('name1')  # 生成单级目录;相当于shell中mkdir dirname
11 os.makedirs('name1/name2')  # 可生成多层递归目录
12 os.rmdir('name1/name2')  # 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
13 os.removedirs(r'C:UserspanhwDesktop学习文档pythonday20name1name2')  # 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
14 print(os.listdir(r'C:UserspanhwDesktop学习文档pythonday20name1'))  # 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
15 os.remove(r'C:UserspanhwDesktop学习文档pythonday4.py')  # 删除一个文件
16 os.rename(r'name3/name4', 'name3/name')  # 重命名文件/目录
17 
18 
19 # 和操作系统特征相关
20 print(os.stat(r'C:UserspanhwDesktop学习文档pythonday4.py'))  # 获取文件/目录信息
21 print(os.sep)  # 输出操作系统特定的路径分隔符,win下为"\",Linux下为"/"
22 print(os.linesep)  # 输出当前平台使用的行终止符,win下为"tn",Linux下为"n"
23 print(os.pathsep)  # 输出用于分割文件路径的字符串 win下为;,Linux下为:
24 print(os.name)  # 输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
25 print(os.environ)  # 获取系统环境变量
26 
27 
28 # 和操作系统命令相关
29 print(os.system('dir'))  # 运行shell命令,直接显示
30 ret = os.popen('dir')  # 运行shell命令,获取执行结果
31 print(ret.read())
32 
33 
34 # 和系统路径相关
35 print(os.path)
36 print(os.path.abspath('name3'))  # 返回path规范化的绝对路径 os.path.split(path) 将path分割成目录和文件名二元组返回
37 print(os.path.dirname(r'C:UserspanhwDesktop学习文档pythonday20name3'))  # 返回path的目录。其实就是os.path.split(path)的第一个元素
38 print(os.path.split(r'C:UserspanhwDesktop学习文档pythonday20name3'))  # 返回path最后的文件名。如何path以/或结尾,那么就会返回空值。
39 print(os.path.basename(r'C:UserspanhwDesktop学习文档pythonday20name3'))  # 即os.path.split(path)的第二个元素
40 print(os.path.exists(r'C:UserspanhwDesktop学习文档pythonday9.py'))  #  如果path存在,返回True;如果path不存在,返回False
41 print(os.path.isabs(r'C:UserspanhwDesktop学习文档pythonday9.py'))  # 如果path是绝对路径,返回True
42 print(os.path.isfile(r'C:UserspanhwDesktop学习文档pythonday9.py'))  # 如果path是一个存在的文件,返回True。否则返回False
43 print(os.path.isdir(r'C:UserspanhwDesktop学习文档pythonday9.py'))  # 如果path是一个存在的目录,则返回True。否则返回False
44 print(os.path.join(r'C:UserspanhwDesktop', '学习文档', 'python', 'day9.py'))  # 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
45 print(os.path.getsize(r'C:UserspanhwDesktop学习文档pythonday9.py'))  # 返回path的大小
46 print(os.path.getatime(r'C:UserspanhwDesktop学习文档pythonday9.py'))  # 返回path所指向的文件或者目录的最后访问时间
47 print(os.path.getmtime(r'C:UserspanhwDesktop学习文档pythonday9.py'))  # 返回path所指向的文件或者目录的最后修改时间

View Code

 

 

静心:os.stat('path/filename')  获取文件/目录新闻 的布局表达

  stat 结构:

  st_mode: inode 保护模式
  st_ino: inode 节点号。
  st_dev: inode 驻留的设备。
  st_nlink: inode 的链接数。
  st_uid: 所有者的用户ID。
  st_gid: 所有者的组ID。
  st_size: 普通文件以字节为单位的大小;包含等待某些特殊文件的数据。
  st_atime: 上次访问的时间。
  st_mtime: 最后一次修改的时间。
  st_ctime: 由操作系统报告的"ctime"。
  在某些系统上(如Unix)是最新的元数据更改的时间,在其它系统上(如Windows)是创建时间(详细信息参见平台的文档)。

 

类别化模块

 

 

  什么叫类别化——将本来的字典、列表等剧情转变来一个字符串的长河就称为序列化

 

  系列化的指标

 

    1、以某种存款和储蓄情势使自定义对象漫长化;

 

    2、将目的从贰个地方传递到另叁个地点。

 

    3、使程序更具维护性。

 

www.56.net 53

 

 

浅显点说-------将原本的字典、列表等故事情节调换到贰个字符串的进程就叫做序列化

2. random模块

 1 import random
 2 # ----------------------------
 3 # 1.随机小数,发红包可用
 4 print(random.random()) #0到1之间的随机小数
 5 print(random.uniform(1,3))  #大于1且小于3的随机小数
 6 
 7 # ----------------------------
 8 # 2.随机整数,验证码可用
 9 print(random.randint(1,5)) #大于1且小于等于5之间的整数
10 print(random.randrange(1,10,2))  #大于等于1且小于3之间的整数(且是所有的奇数)
11 
12 # ----------------------------
13 # 3.随机选择一个返回,抽奖
14 print(random.choice([1,'23',[4,5]]))
15 # ----------------------------
16 # 4.随机选择返回多个,一次抽取多个
17 print(random.sample([1,'23',[4,5]],2))  #列表元素任意两个组合输出,后缀为输出个数
18 # ----------------------------
19 
20 
21 # ----------------------------
22 # 5.打乱列表顺序,洗牌
23 item=[1,5,2,3,4]
24 random.shuffle(item)  #打乱次序
25 print(item)

使用放肆数随机生成6位验证码:

www.56.net 54www.56.net 55

import random
def ver_code(num):
    strs = ''
    lis1 = [chr(i) for i in range(65, 91)]
    lis2 = [str(i) for i in range(10)]
    ver1 = random.sample(lis1+lis2,num)
    for i in ver1:
        strs += i
    return strs

print(ver_code(6))

View Code

www.56.net 56www.56.net 57

def id_code(num):  # num 字母在每一位被取到的概率相同
    ret = ''
    for i in range(num):
        number = str(random.randint(0,9))
        alph_num = random.randint(97,122)   # A65 a97 +25
        alph_num2 = random.randint(65,90)   # A65 a97 +25
        alph = chr(alph_num)
        alph2 = chr(alph_num2)
        choice = random.choice([alph,alph2])
        choice = random.choice([number,choice])
        ret += choice
    return ret
print(id_code(6))

View Code

接纳随机数完毕贰个发红包的编制程序

www.56.net 58www.56.net 59

import random
inp_money = float(input('红包金额:'))
inp_count = int(input('红包个数:'))
def red_packet(money, count):
    li = []
    money = int(money*100)
    money_site = random.sample(range(1, money), count-1)
    money_site.extend([0, money])
    money_site = sorted(money_site)
    for i in range(count):
        li.append(round((money_site[i+1]-money_site[i])*0.01, 2))
    return li
    # 上面的定义li列表、for循环以及return 可以简写成下面一行。
    # return [round((sorted(money_site)[i + 1] - sorted(money_site)[i]) * 0.01, 2) for i in range(count)]
ret = red_packet(inp_money, inp_count)
print(ret)

View Code

动用自由数随机生成4位验证码,并带模糊效果

from PIL import Image, ImageDraw, ImageFont, ImageFilter

import random

# 随机字母:
def rndChar():
    return chr(random.randint(48, 57))

# 随机颜色1:
def rndColor():
    return (random.randint(64, 255), random.randint(64, 255), random.randint(64, 255))

# 随机颜色2:
def rndColor2():
    return (random.randint(32, 127), random.randint(32, 127), random.randint(32, 127))

# 240 x 60:
width = 60 * 4
height = 60
image = Image.new('RGB', (width, height), (255, 255, 255))
# 创建Font对象:
font = ImageFont.truetype('ariblk.ttf', 40)
# 创建Draw对象:
draw = ImageDraw.Draw(image)
# 填充每个像素:
for x in range(width):
    for y in range(height):
        draw.point((x, y), fill=rndColor())
# 输出文字:
for t in range(4):
    draw.text((60 * t + 10, 10), rndChar(), font=font, fill=rndColor2())
# 模糊:
image = image.filter(ImageFilter.BLUR)
image.save('code.jpg', 'jpeg')

json

 

  Json模块提供了八个职能:dumps、dump、loads、load

 

www.56.net 60www.56.net 61

 1 import json
 2 dic = {'k1': 'v1', 'k2': 'v2', 'k3': 'v3', 'k4': 'v4'}
 3 str_dic = json.dumps(dic)  # 序列化:将一个字典转换成一个字符串
 4 print(str_dic, type(str_dic))
 5 # 注意,json转换完的字符串类型的字典中的字符串是由""表示的
 6 
 7 dic2 = json.loads(str_dic)  # 反序列化:将一个字符串格式的字典转换成一个字典
 8 print(dic2, type(dic2))
 9 #注意,要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示
10 
11 list_dic = [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}]
12 str_dic = json.dumps(list_dic)  # 也可以处理嵌套的数据类型
13 print(type(str_dic), str_dic)
14 
15 list_dic2 = json.loads(str_dic)
16 print(type(list_dic2), list_dic2)

dumps/loads

 

www.56.net 62www.56.net 63

 1 import json
 2 f = open('json_file', 'w', encoding='utf8')
 3 dic = {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
 4 json.dump(dic, f)  # dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件
 5 f.close()
 6 
 7 f = open('json_file')
 8 dic2 = json.load(f)  # load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回
 9 f.close()
10 print(type(dic2), dic2)

dump/load

www.56.net 64www.56.net 65

 1 import json
 2 f = open('file', 'w', encoding='utf8')
 3 json.dump({'国籍': '中国'}, f)
 4 ret = json.dumps({'国籍': '中国'})
 5 f.write(ret + 'n')
 6 
 7 json.dump({'国籍': '美国'}, f, ensure_ascii=False)
 8 ret = json.dumps({'国籍': '美国'}, ensure_ascii=False)
 9 f.write(ret + 'n')
10 f.close()

View Code

www.56.net 66www.56.net 67

3. OS模块(是与操作系统交互的二个接口)

# 有的文件恐怕转义大概会合世难点,经常要在双引号前加r,撤除转义,可能用双斜杠表示

# 和当前执行的python文件工作目录相关的工作路径
os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
os.chdir("dirname")  改变当前脚本工作目录;相当于shell下cd
os.curdir  返回当前目录: ('.')
os.pardir  获取当前目录的父目录字符串名:('..')

# 和文件夹相关
os.makedirs('dirname1/dirname2')    可生成多层递归目录,即文件夹下创建子文件夹,不会覆盖原文件夹
os.removedirs('dirname1')    若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.mkdir('dirname')    生成单级目录,即文件夹;相当于shell中mkdir dirname
os.rmdir('dirname')    删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.listdir('dirname')    列出指定目录下的所有文件和文件夹,包括隐藏文件,并以列表方式打印

# 和文件相关
os.remove()  删除一个文件
os.rename("oldname","newname")  重命名文件/目录
os.stat('path/filename')  获取文件/目录信息

# 和操作系统差异相关
os.sep    输出操作系统特定的路径分隔符,win下为"\",Linux下为"/"
os.linesep    输出当前平台使用的行终止符,win下为"tn",Linux下为"n"
os.pathsep    输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'

# 和执行系统命令相关
os.system("bash command")   运行shell命令,直接显示,但是显示的看不懂

 os.popen("bash command).read()  运转shell命令,获取实践结果,可看懂,如os.popen('dir').read()

os.environ 获取系统环境变量

# 路径相关系列
os.path.abspath(path)  返回path规范化的绝对路径,即从哪个盘开始全部显示出来
os.path.split(path)  将path分割成目录和文件名二元组返回
os.path.dirname(path)  返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename(path)  返回path最后的文件名。如何path以/或结尾,那么就会返回空值。
               即os.path.split(path)的第二个元素
os.path.exists(path)  如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path)  如果path是绝对路径,返回True
os.path.isfile(path)  如果path是一个存在的文件,返回True。否则返回False
os.path.isdir(path)  如果path是一个存在的目录,则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.getatime(path)  返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path) 返回path的大小,文件夹的大小不准确,只显示最大值4096字节,文件准确

ret = os.path.join('F:每天视频以及笔记','day5视频')
print(ret)
---F:每天视频以及笔记day5视频    # 组合成一个完整路径

杜撰什么总结文件夹中保有文件大小?示例路线:F:每一日摄像以至笔记python11期day01

www.56.net 68www.56.net 69

import os
def ram(file_name):
    sum = 0
    for file in os.listdir(file_name):
        path = os.path.join(file_name, file)  # 组合成一个完整路径
        if os.path.isfile(path):   # 路径下是文件
            sum += os.path.getsize(path)
        else:
            sum += ram(path)
    return sum

print(ram('F:每天视频以及笔记python11期day01'))

选取递归观念

www.56.net 70www.56.net 71

import os
def get_size(path):
    l = [path]
    sum_size = 0
    while l:
        path = l.pop()    # l = ['D:python11day2','D:python11day3'...]
        for item in os.listdir(path):    #path = 'D:python11'
            path2 = os.path.join(path, item)   # path2 = 'D:python11day2'
            if os.path.isfile(path2):
                sum_size += os.path.getsize(path2)   # sum = 文件的大小 + 0
            else:                           
                l.append(path2)
    return sum_size
print(get_size('D:python11'))

栈的研讨

  # 复制文件的函数在os模块中并不设有,因为复制文件并不是由操作系统提供的系统调用。可是大家得以调用shuti模块中的copyfile()完成,该模块也正是os模块的三个互补。

pickle

 

用以系列化的三个模块

 

 

 

  • json,用于字符串 和 python数据类型间打开改变
  • pickle,用于python特有的类型 和 python的数据类型间进行退换

 

 

 

pickle模块提供了多个作用:dumps、dump(种类化,存)、loads(反系列化,读)、load  (不仅可以够连串化字典,列表...可以把python中私下的数据类型体系化

 

www.56.net 72www.56.net 73

 1 import pickle
 2 dic = {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
 3 str_dic = pickle.dumps(dic)
 4 print(str_dic, type(str_dic))  # 一串二进制内容
 5 
 6 dic2 = pickle.loads(str_dic)
 7 print(dic2, type(dic2))  # 字典
 8 
 9 import time
10 struct_time = time.localtime(1000000000)
11 print(struct_time)
12 f = open('pickle_file', 'wb')
13 pickle.dump(struct_time, f)
14 f.close()
15 
16 f = open('pickle_file', 'rb')
17 struct_time2 = pickle.load(f)
18 print(struct_time2.tm_year)
19 f.close()

pickle

 

若是大家将三个字典只怕类别化成了三个json存在文件里,那么java代码或然js代码也得以拿来用。
唯独只要大家用pickle进行种类化,其余语言就不能够读懂这是如何了~
故此,假若您种类化的内容是列表只怕字典,我们丰盛推荐你利用json模块
但只尽管因为某种原因你只好类别化别的的数据类型,而现在您还恐怕会用python对这么些数额实行反类别化的话,那么就足以选用pickle

 

比如,我们在python代码中计算的一个数据需要给另外一段程序使用,那我们怎么给?
现在我们能想到的方法就是存在文件里,然后另一个python程序再从文件里读出来。
但是我们都知道,对于文件来说是没有字典这个概念的,所以我们只能将数据转换成字典放到文件中。
你一定会问,将字典转换成一个字符串很简单,就是str(dic)就可以办到了,为什么我们还要学习序列化模块呢?
没错序列化的过程就是从dic 变成str(dic)的过程。现在你可以通过str(dic),将一个名为dic的字典转换成一个字符串,
但是你要怎么把一个字符串转换成字典呢?
聪明的你肯定想到了eval(),如果我们将一个字符串类型的字典str_dic传给eval,就会得到一个返回的字典类型了。
eval()函数十分强大,但是eval是做什么的?e官方demo解释为:将字符串str当成有效的表达式来求值并返回计算结果。
BUT!强大的函数有代价。安全性是其最大的缺点。
想象一下,如果我们从文件中读出的不是一个数据结构,而是一句"删除文件"类似的破坏性语句,那么后果实在不堪设设想。
而使用eval就要担这个风险。
所以,我们并不推荐用eval方法来进行反序列化操作(将str转换成python中的数据结构)

4. sys模块(sys模块是与python解释器交互的二个接口)

1 sys.argv           命令行参数是一个List,第一个元素是程序本身路径
2 sys.exit(n)        退出程序,正常退出时exit(0)
3 sys.version        获取Python解释程序的版本信息
4 sys.maxint         最大的Int值
5 sys.path           返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
6 sys.platform       返回操作系统平台名称

shelve

 

  shelve也是python提必要我们的系列化学工业具,比pickle用起来更简约一些。
  shelve只提须求我们贰个open方法,是用key来访谈的,使用起来和字典相近。

 

www.56.net 74www.56.net 75

1 import shelve
2 f = shelve.open('shelve_file')
3 f['key'] = {'int': 10, 'float': 9.5, 'string': 'sample data'}  # 直接对文件句柄操作,就可以存入数据
4 f.close()
5 
6 f1 = shelve.open('shelve_file')  # 取出数据的时候也只需要直接用key获取即可,但是如果key不存在会报错
7 existing = f1['key'] 
8 f1.close()
9 print(existing)

shelve

 

  这些模块有个节制,它不扶植五个利用同时往同一个DB实行写操作。所以当大家知道大家的选取借使只进行读操作,大家得以让shelve通过只读方式展开DB

 

www.56.net 76www.56.net 77

1 import shelve
2 f = shelve.open('shelve_file', flag='r')
3 existing = f['key']
4 f.close()
5 print(existing)

shelve只读

 

  由于shelve在暗中认可景况下是不会记录待长久化对象的别的校订的,所以大家在shelve.open()时候供给修改私下认可参数,不然对象的更换不会保留

www.56.net 78www.56.net 79

 1 import shelve
 2 f1 = shelve.open('shelve_file')
 3 print(f1['key'])
 4 f1['key']['new_value'] = 'this was not here before'
 5 f1.close()
 6 
 7 f2 = shelve.open('shelve_file', writeback=True)
 8 print(f2['key'])
 9 f2['key']['new_value'] = 'this was not here after'
10 f2.close()

writeback=True

  writeback格局有帮助和益处也是有劣点。优点是减削了大家失误的概率,何况让对象的悠久化对客户更加的的晶莹了;但这种办法并非颇负的场地下都亟待,首先,使用writeback现在,shelf在open()的时候会扩大额外的内部存款和储蓄器消耗,並且当DB在close()的时候会将缓存中的每四个指标都写入到DB,这也会带动十分的等候时间。因为shelve未有主意知道缓存中怎样对象改良了,哪些对象没有退换,由此有着的靶子都会被写入。

常用模块二 

hashlib模块

缘何要有种类化

5.类别化模块 

序列化

把对象(变量)从内存中变为可存款和储蓄或传输的经过称之为体系化,在Python中叫pickling,在此外语言中也被称之为serialization,marshalling,flattening等等,都是八个意味。

类别化指标

  • 持续化某种意况。在断电只怕关机以前能够将方今内部存款和储蓄器中全数的数额保存下来,后一次程序运维时能够从脚下封存的文本内容继续实践。
  • 跨平台数据交互。

系列化有八个模块json和pickle,shelve

  json   全体编制程序语言都通用的连串化格式,不过它支持的数据类型特别有限(只扶助数字,字符串,体系,字典等,不协理元祖

  pickle  只可以在python语言的顺序之间传递数据使用,它帮忙python中全体数据类型

  shelve  在py3之后才有,python专有的种类化模块,只针对文件。它只提供贰个open方法,而且必须要用字典形式拜见内容

json

 Json模块提供了八个职能:dumps、loads,那五个只在内部存款和储蓄器中操作数据,主要在互连网传输中运用,和八个数据类型与公事打交道

             dump、load ,那多个是平昔将目的种类化之后写入文件,它依据于贰个文书句柄

import json
dic={'k1':'v1','k2':'v2','k3':'v3'}
str_dic = json.dumps(dic) #将字典转换成字符串,转换后的字典中的元素是由双引号表示的
print(str_dic,type(str_dic))#{"k1": "v1", "k2": "v2", "k3": "v3"} <class 'str'>

dic2 = json.loads(str_dic)#将一个字符串转换成字典类型
print(dic2,type(dic2))#{'k1': 'v1', 'k2': 'v2', 'k3': 'v3'} <class 'dict'>

import json
dic={'k1':'v1','k2':'v2','k3':'v3'}
f = open('a.txt','w',encoding='utf-8')
json.dump(dic,f,ensure_ascii=False)  # 先接收要序列化的对象 再接受文件句柄
f.close()

f = open('a.txt','r',encoding='utf-8')
ret = json.load(f)
print(type(ret),ret)

 # json在写入多次dump的时候,不能够对应实行数次load来去除数据,pickle能够

# json假若要写入多个因素,应先将元素dumps连串化,再f.write(种类化+‘n’)写入文件。读的时候先按行读取,再选用loads将读出来的字符串调换到相应数据类型。

pickle(能够把python中的放肆数据类型系列化)

  在硬盘上囤积文件有很八种办法,文本文件只是此中生机勃勃种,若是想囤积列表可能目的之类的内容,能够把对象转换到字符串的款式写入文本文件,不过只要要从文件中平复对象,则这些就复杂化了。而python提供的pickle恰好能达成这或多或少:

# 通过pickle存储python原生对象:
import pickle
D = {'a': 1, 'b': 2}
F = open('datafile.pkl', 'wb')
pickle.dump(D, F)       # pickle.dump()可以把任意对象序列化成一个bytes,然后就可以把bytes写入文件
F.close()

# 取回字典,再用pickle模块中load函数进行一次重建
F = open('datafile.pkl', 'rb')
E = pickle.load(F)
F.close()


import pickle
file = 'wish.data'
lis = ['apple', 'banban']
f = open(file, 'wb')
pickle.dump(lis, f)
f.close()

del lis
f = open(file, 'rb')
storedlis = pickle.load(f)
print(storedlis)    # 又得到了列表

有关体系化自定义类的靶子:

class A:
    def __init__(self,name,age):
        self.name=name
        self.age=age
a = A('luffy',18)
# import json
# json.dumps(a)   # 报错,说明json无法存储实例化对象
import pickle
ret = pickle.dumps(a)
print(ret)   # 打印出来的是一串字节
obj = pickle.loads(ret)
print(obj)    # 打印出对象地址
print(obj.__dict__)   # {'name': 'luffy', 'age': 18}

在load的时候,必得具备被load数据类型对应的类在内存里面

shelve(用法律专科高校讲链接)

  python专有的体系化模块,只针对文件,只提供了一个open方法,且是用key来访谈的,使用起来和字典形似。

import shelve
f = shelve.open('a.txt')
f['key'] = {'int': 10, 'float': 9.5, 'string': 'Sample data'}
f['ds'] = '范围分为we分我发'
f.close()
# 直接对文件句柄进行操作,就可以存储文件,而且程序会给我们自动创建三个后缀为dir,bak,dat的文件,其中以bat结尾的文件存储的就是b字节数据类型的数据

f1 = shelve.open('a.txt')
a = f1['ds']   # 用key直接取出存储的内容,如果key不存在则会报错
f1.close()
print(a)

# 设置只读模式
f2 = shelve.open('a.txt', flag='r')
f2['key']['float'] = 3.14    # 修改结构中得值,不可以
f2['space'] = 'dwd'          # 覆盖原来的结构,可以
f1.close()

f3 = shelve.open('a.txt')
b = f3['key']['float']       # 对结构的值作修改,但是失败了
f3.close()
print(b)    # 9.5

算法介绍

Python的hashlib提供了遍布的摘要算法,如MD5,SHA1等等。

怎样是摘要算法呢?摘要算法又称哈希算法、散列算法。它通过八个函数,把自由长度的数额转变为叁个长度固定的数据串(通常用16进制的字符串表示)。

摘要算法便是经过摘要函数f()对自由长度的数额data总计出一定长度的摘要digest,指标是为了开掘原来数据是或不是被人篡匡正。

摘要算法之所以能建议数据是或不是被窜改正,就是因为摘要函数是贰个单向函数,总括f(data)非常轻易,但因此digest反推data却特别难堪。何况,对本来数据做三个bit的改造,都会促成总计出的摘要完全两样。

作者们以科学普及的摘要算法MD5为例,总括出三个字符串的MD5值:

www.56.net 80www.56.net 81

1 import hashlib
2  
3 md5 = hashlib.md5()
4 md5.update('how to use md5 in python hashlib?')
5 print md5.hexdigest()
6 
7 计算结果如下:
8 d26a53750bc40b38b65a520292f69306

md5

假使数据量十分的大,能够分块多次调用update(),最后总括的结果是大同小异的:

www.56.net 82www.56.net 83

1 import hashlib
2  
3 sha1 = hashlib.sha1()
4 sha1.update('how to use sha1 in ')
5 sha1.update('python hashlib?')
6 print sha1.hexdigest()

分组MD5

SHA1的结果是160 bit字节,平日用叁个44人的16进制字符串代表。比SHA1更安全的算法是SHA256和SHA512,可是越安全的算法越慢,何况摘要长度更加长。

种类化的指标

6.hashlib模块

  摘要算法,也称哈希算法,它能将字符串转成数字,不相同的字符串转成的数字明确不一致,日常用16进制表示。无论在哪台机器上,在怎么样时候总结,对同生龙活虎的字符串结果一连同样的

  任何摘要算法都以把最棒多的数量会集映射到四个个其余聚集中。因而两个分歧的数目经过有些摘要算法也大概获得黄金时代致的摘要,这种景色被称为碰撞

用处:

  密文验证的时候加密

  文件的风流倜傥致性校验

# md5算法:产业界通用算法

# sha算法:安全周密更加高,它有很各类(sha1,sha2,sha3等),前边数字越大,安全全面越高,且得到的数字结果越长,总结时间越长。它的用法和md5雷同,只需把md5换来sha1就能够。

密文验证的时候加密:

# hashhlib基本用法
import hashlib
m = hashlib.md5()                     # 创建了一个md5算法对象
m.update('aptx4869'.encode('utf-8'))  # 必须将字符串转换成utf-8格式
print(m.hexdigest())                  # 固定格式
# 6d1ce7aa0a1d988dc96a2abcd187b45a

import hashlib
m = hashlib.md5()
m.update('apt'.encode('utf-8'))   # 对源码进行拆分加密,得到的结果与整体加密一致
m.update('x4869'.encode('utf-8'))
print(m.hexdigest())
# 6d1ce7aa0a1d988dc96a2abcd187b45a
# 一段字符串直接进行摘要和分成几段摘要的结果是相同的


# 如果数字过于简单,就可以根据密文进行暴力破解获得源码,安全性不是太好,因此可以采用加盐的方式加密
# 加盐:在源码的基础上提前加一层静态码‘aptx4869’进行二次加密
m3 = hashlib.md5('aptx4869'.encode('utf-8'))
m3.update('123456'.encode('utf-8'))
print(m3.hexdigest())
# 21a36cc3275d352d92ee741b5425c330

# 这种方式较第一种比较安全性有所提高

# 动态加盐: 对于用户登录,可以通过相应的用户登录名进行一次加密,用密码二次加密,密码随着用户账户的变化而变化
username = 'Learning'
password = 'aptx4869'
m4 = hashlib.md5(username.encode('utf-8'))
m4.update(password .encode('utf-8'))
print(m4.hexdigest())
# b9112f155c08b48bba0e595236facc40

# 这种方式安全性大大的有所提高,登陆过程建议使用 

文件的意气风发致性校验:(用来证实文件内容是还是不是被歪曲)

# 该函数一次性全部交验,如果文件较大,则耗时较大
import hashlib
def check(filename):
    md5obj = hashlib.md5()
    with open(filename,'rb') as f:
            content = f.read()
            md5obj.update(content)
    return md5obj.hexdigest()

# 该函数对于较大的文件,一次性以一定的字节数读取验证来验证一致性
def check(filename):
    md5obj = hashlib.md5()
    with open(filename,'rb') as f:
        while True:
            content = f.read(1024)  
            if content:
                md5obj.update(content)
            else:    # 如果文件为空
                break
    return md5obj.hexdigest()


ret1 = check('file1.txt')     
ret2 = check('file2.txt')
print(ret1)
print(ret2)   

那么难点来了,怎么着验证三个文本的风姿洒脱致性呢?

www.56.net 84www.56.net 85

import hashlib
def compare(filename1,filename2):
    md5sum = []
    for file in [filename1,filename2]:
        md5 = hashlib.md5()
        with open(file,'rb') as f:
            while True:
                content = f.read(1024)
                if content:
                    md5.update(content)
                else:break
            md5sum.append(md5.hexdigest())
    if md5sum[0] == md5sum[1]:return True
    else :return False

print(compare('f1','f2'))

View Code

www.56.net 86www.56.net 87

import hashlib
def loc(filname1, filname2):
    def check(filename):
        md5obj = hashlib.md5()
        with open(filename,'rb') as f:
            while True:
                content = f.read(5)
                if content:
                    md5obj.update(content)
                else:    # 非空
                    break
        return md5obj.hexdigest()
    if  check(filname1) == check(filname2):
        return True
    else:
        return False

print(loc('a.txt', 'a1.txt'))

View Code

摘要算法应用

别的允许顾客登陆的网站都会存款和储蓄客商登入的客商名和口令。怎么样存款和储蓄客户名和口令呢?方法是存到数据库表中:

name    | password
--------+----------
michael | 123456
bob     | abc999
alice   | alice2008

若是以公开保存客商口令,假设数据库走漏,全体顾客的口令就落入红客的手里。此外,网址运营人士是足以访谈数据库的,也正是能得到到具备顾客的口令。正确的保存口令的艺术是不存款和储蓄顾客的当众口令,而是存款和储蓄顾客口令的摘要,例如MD5:

username | password
---------+---------------------------------
michael  | e10adc3949ba59abbe56e057f20f883e
bob      | 878ef96e86145580c38c87f0410ad153
alice    | 99b1c2188db85afee403b1536010c2c9

虚构这么个状态,超多客户喜好用123456,888888,password这么些简单的口令,于是,红客能够优先计算出这几个常用口令的MD5值,获得贰个反推表:

'e10adc3949ba59abbe56e057f20f883e': '123456'
'21218cca77804d2ba1922c33e0151105': '888888'
'5f4dcc3b5aa765d61d8327deb882cf99': 'password'

如此,没有必要破解,只须求相比数据库的MD5,黑客就收获了动用常用口令的客商账号。

对此顾客来说,当然绝不选择过度容易的口令。可是,大家能否在前后相继设计上对简易口令加强保卫安全吗?

由于常用口令的MD5值十分轻巧被总结出来,所以,要确定保证存款和储蓄的客商口令不是那个早就被计算出来的常用口令的MD5,这一方法通过对原始口令加贰个冗杂字符串来落到实处,俗称“加盐”:

hashlib.md5("salt".encode("utf8"))

经过Salt管理的MD5口令,只要Salt不被黑客知道,即便顾客输入轻松口令,也很难通过MD5反推明文口令。

然则生龙活虎旦有五个顾客都应用了扳平的简练口令举个例子123456,在数据库中,将积攒两条相像的MD5值,那表达那四个顾客的口令是风流浪漫律的。有没有法子让使用同一口令的顾客存储不一样的MD5呢?

假使大器晚成旦客户不能修改登陆名,就足以由此把登陆名作为Salt的生龙活虎部分来总括MD5,从而落成均等口令的顾客也蕴藏分歧的MD5。

摘要算法在超多地点都有大面积的接收。要留意摘要算法不是加密算法,不能用来加密(因为无法透过摘要反推明文),只可以用于防窜改,可是它的单向计算个性决定了足以在不存款和储蓄明文口令的意况下验证客商口令。

 

logging模块

1、以某种存款和储蓄方式使自定义对象持久化;

7.configparser

在配置文件里必需有分组(节),分组的组名能够任由起 ,能够满含二个或八个组,能够叫DEFAULT,它都两全极其的意思(私下认可的是全局变量)

# 创建ini文件
import configparser
config = configparser.ConfigParser()
config["DEFAULT"] = {'luffy':'香蕉人',
                     'zero':'三把刀',
                     'sanzhi':'秋刀鱼'}
config['name'] = {'rojie':'onepiece',
                  'BB':'c',
                  'dd':'N'}
# config['www.onepiece.online'] = {'我就试试集合行不行'}  # 报错,只能是字典形式
config['www.onepiece.online'] = {'我就试试集合行不行':'不行啊'}
with open('one.ini', 'w') as f:
   config.write(f)

 写入后内容情势(这里本人是间接用Computer自带的公文阅读器张开的,默许是gbk格式,用任何阅读器非gbk会发出乱码):

[DEFAULT]
zero = 三把刀
sanzhi = 秋刀鱼
luffy = 香蕉人

[name]
dd = N
bb = c
rojie = onepiece

[www.onepiece.online]
自家就试试集合好糟糕 = 不行呀

增加和删除改操作

# 增删改操作
import configparser
config=configparser.ConfigParser()
config.read('one.ini')
# 删除节'name'
config.remove_section('name')
# 删除节下的某个value值
config.remove_option('www.onepiece.online','我就试试集合行不行')
# 判断是否存在某个标题
print(config.has_section('name'))
# 判断标题section1下是否有user
print(config.has_option('www.onepiece.online','我就试试集合行不行'))
# 添加一个标题
config.add_section('EGG')
#在标题EGG下添加name=egon,age=18的配置
config.set('EGG','name','egon')
config.set('EGG','age','18')

总结:

# section  能够直接操作他的目标来获得具有的节音信

# option  能够由此找到的节来查看全体的项

函数式简单安顿

import logging  
logging.debug('debug message')  
logging.info('info message')  
logging.warning('warning message')  
logging.error('error message')  
logging.critical('critical message') 

暗中同意情形下Python的logging模块将日志打字与印刷到了专门的学业输出中,且只显示了高于等于WA昂科雷NING等第的日记,那表达私下认可的日记品级设置为WA大切诺基NING(日志等第阶段C奥迪Q3ITICAL > E奥迪Q7RO兰德酷路泽 > WAPRADONING > INFO > DEBUG),默许的日志格式为日志等级:Logger名称:客户输出音讯。

利落布署日志品级,日志格式,输出地方:

www.56.net 88www.56.net 89

 1 import logging  
 2 logging.basicConfig(level=logging.DEBUG,  
 3                     format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',  
 4                     datefmt='%a, %d %b %Y %H:%M:%S',  
 5                     filename='/tmp/test.log',  
 6                     filemode='w')  
 7   
 8 logging.debug('debug message')  
 9 logging.info('info message')  
10 logging.warning('warning message')  
11 logging.error('error message')  
12 logging.critical('critical message')

简轻易单的日志

布局参数:

logging.basicConfig()函数中可通过具体参数来更改logging模块默认行为,可用参数有:

filename:用指定的文件名创建FiledHandler,这样日志会被存储在指定的文件中。
filemode:文件打开方式,在指定了filename时使用这个参数,默认值为“a”还可指定为“w”。
format:指定handler使用的日志显示格式。
datefmt:指定日期时间格式。
level:设置rootlogger(后边会讲解具体概念)的日志级别
stream:用指定的stream创建StreamHandler。可以指定输出到sys.stderr,sys.stdout或者文件(f=open(‘test.log’,’w’)),默认为sys.stderr。若同时列出了filename和stream两个参数,则stream参数会被忽略。

format参数中可能用到的格式化串:
%(name)s Logger的名字
%(levelno)s 数字形式的日志级别
%(levelname)s 文本形式的日志级别
%(pathname)s 调用日志输出函数的模块的完整路径名,可能没有
%(filename)s 调用日志输出函数的模块的文件名
%(module)s 调用日志输出函数的模块名
%(funcName)s 调用日志输出函数的函数名
%(lineno)d 调用日志输出函数的语句所在的代码行
%(created)f 当前时间,用UNIX标准的表示时间的浮 点数表示
%(relativeCreated)d 输出日志信息时的,自Logger创建以 来的毫秒数
%(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
%(thread)d 线程ID。可能没有
%(threadName)s 线程名。可能没有
%(process)d 进程ID。可能没有
%(message)s用户输出的消息

2、将对象从三个地方传递到另贰个地点。

8.logging  (记录日志的模块)

  不会帮您活动抬高日志的从头到尾的经过,只好遵照技术员写的代码完毕功效

  能够因此三个参数去决定全局的日志输出情状

  能够协理开拓者同时向文件和显示屏输出内容

  logging模块提供5中国和东瀛记等第,从低到高贰回:debug info warning error critical

  暗中同意是从warning情势带头显得

日志级别
CRITICAL = 50  #FATAL = CRITICAL
ERROR = 40
WARNING = 30  #WARN = WARNING
INFO = 20
DEBUG = 10

私下认可等级为warning,它会暗许打印在极限上

简言之用法:basicconfig

# 默认情况下 只显示警告(warning)及警告级别以上信息
import logging
logging.basicConfig(level=logging.DEBUG,format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',datefmt='%a, %d %b %y %H:%M:%S',filename = 'userinfo.log')

logging.debug('debug message')       # debug 调试模式 级别最低
logging.info('info message')         # info  显示正常信息
logging.warning('warning message')   # warning 显示警告信息
logging.error('error message')       # error 显示错误信息
logging.critical('critical message') # critical 显示严重错误信息

---WARNING:root:warning message
---ERROR:root:error message
---CRITICAL:root:critical message
---WARNING:root:warning message

logging.basicconfig()函数可配参数:

www.56.net 90www.56.net 91

filename:用指定的文件名创建FiledHandler,这样日志会被存储在指定的文件中。
filemode:文件打开方式,在指定了filename时使用这个参数,默认值为“a”还可指定为“w”。
format:指定handler使用的日志显示格式。 
datefmt:指定日期时间格式。 
level:设置rootlogger(后边会讲解具体概念)的日志级别 
stream:用指定的stream创建StreamHandler。可以指定输出到sys.stderr,sys.stdout或者文件,默认为sys.stderr。若同时列出了filename和stream两个参数,则stream参数会被忽略。

#格式
%(name)s:Logger的名字,并非用户名,详细查看

%(levelno)s:数字形式的日志级别

%(levelname)s:文本形式的日志级别

%(pathname)s:调用日志输出函数的模块的完整路径名,可能没有

%(filename)s:调用日志输出函数的模块的文件名

%(module)s:调用日志输出函数的模块名

%(funcName)s:调用日志输出函数的函数名

%(lineno)d:调用日志输出函数的语句所在的代码行

%(created)f:当前时间,用UNIX标准的表示时间的浮 点数表示

%(relativeCreated)d:输出日志信息时的,自Logger创建以 来的毫秒数

%(asctime)s:字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒

%(thread)d:线程ID。可能没有

%(threadName)s:线程名。可能没有

%(process)d:进程ID。可能没有

%(message)s:用户输出的消息

View Code

logging模块组件:

# Logger 产生日志对象
# Handler 接收日志然后控制打印到不同地方:
#     FileHandler用来打印到文件中,
#     StreamHandler用来打印到终端
# Filter 过滤日志对象
# Formatter 指定日志显示格式

logger对象配置:

import logging
logger = logging.getLogger()    # Logger用于产生日志,实例化一个logger对象
# Handler对象:接收logger传来的日志,并控制输出
fh = logging.FileHandler('test.log',encoding='utf-8')
# 实例化一个文件句柄,并打印到文件
ch = logging.StreamHandler()
# 打印到终端,没有这步则只在文件中打印,在终端不显示,终端就是电脑输出界面
fmt = logging.Formatter('%(asctime)s-%(name)s-%(levelname)s-%(message)s')
# 定制化显示格式
fh.setFormatter(fmt)
ch.setFormatter(fmt)
# 为Handler对象绑定格式

logger.addHandler(fh)
logger.addHandler(ch)
# 和logger关联的只有文件句柄
logger.setLevel(logging.WARNING)
# 对象警告级别,从该级别以上开始警报
# 这里我是直接给对象设置的该级别,意味着文件和终端都是同一级别,这里可以
# 对文件和终端分别设置不同的级别

logger.debug('debug message')       # debug 调试模式 级别最低
logger.info('info message')         # info  显示正常信息
logger.warning('warning message')   # warning 显示警告信息
logger.error('error message')       # error 显示错误信息
logger.critical('critical message')

logger对象配置

www.56.net 92www.56.net 93

 1 import logging
 2 
 3 logger = logging.getLogger()
 4 # 创建一个handler,用于写入日志文件
 5 fh = logging.FileHandler('test.log')
 6 
 7 # 再创建一个handler,用于输出到控制台
 8 ch = logging.StreamHandler()
 9 # 格式化输出或写入信息
10 formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
11 # 文件流绑定格式
12 fh.setFormatter(formatter)
13 # 屏幕流绑定格式
14 ch.setFormatter(formatter)
15 
16 logger.addHandler(fh) #logger对象可以添加多个fh和ch对象
17 logger.addHandler(ch)
18 
19 logger.debug('logger debug message')
20 logger.info('logger info message')
21 logger.warning('logger warning message')
22 logger.error('logger error message')
23 logger.critical('logger critical message')

logging对象配置

logging库提供了多少个零件:Logger、Handler、Filter、Formatter。Logger对象提供应用程序可径直选取的接口,Handler发送日志到相当的指标地,Filter提供了过滤日志新闻的点子,Formatter内定日志展现格式。此外,可以因而:logger.setLevel(logging.Debug)设置等级,当然,也能够通过

fh.setLevel(logging.Debug)单对文件流设置某些等级。

 

configparser模块

该模块适用于配置文件的格式与windows ini文件雷同,能够包含八个或多少个节(section),每个节能够有四个参数(键=值)。

3、使程序更具维护性。

9.collections模块

内置数据类型基础上,collections模块还提供了多少个附加数据类型:

  counter:计数器

  deque:双端排列,能够快速从其余大器晚成侧追加对象

  namedtuple:生成尚可名字来做客成分内容的tuple

  orderdict:有序字典

  defaultdict:带有暗中同意值的字典

namedtuple:

from collections import namedtuple
point = namedtuple('point', ['x','y','z'])
p = point(1,4,9)
print(p.x)  # 1
print(p.z)  # 9

# 用来计算长方体体积
square = namedtuple('length',('x','y','z'))
v = square(5,2,8)
volume = v.x *v.y * v.z
print(volume)   # 80

deque:

  它是为了兑现插入和删除操作的双向列表,适用于队列和栈

from collections import deque
lis = deque(['a','c','b'])
lis.append(3)
lis.appendleft(5)
print(lis)    # deque([5, 'a', 'c', 'b', 3])
# 这里直接用list()可以转换成列表形式

Counter:

  它的效应是用来追踪值现身的次数,属于三个严节的容器类型,以字典的键值对情势积攒

主导用法:

from collections import Counter
c = Counter('abcdeabcdabcaba')
print(dict(c))    # {'e': 1, 'b': 4, 'd': 2, 'a': 5, 'c': 3}

print(c['a'])   # 5
print(c['b'])   #4

计数器的创新,包罗扩大(update)和压缩(subtract)二种 

from collections import Counter

# update
c = Counter('smile')
c.update('lie')
print(c['e'])   # 2

d = Counter('beautiful')
f = Counter('bee')
d.update(f)
print(d['e'])  # 3

# subtract
c = Counter('smile')
c.subtract('lie')
print(c['e'])   # 0

d = Counter('beautiful')
f = Counter('bee')
d.subtract(f)
print(d['e'])   # -1

键的修正和删除(del)

from collections import Counter
c = Counter("abcdcba")
c['a'] = 0
print(dict(c))   # {'d': 1, 'a': 0, 'c': 2, 'b': 2}
del c['b']
print(dict(c))   # {'a': 0, 'c': 2, 'd': 1}

算数和集聚操作

  +、-、&、|操作也能够用来Counter。此中&和|操作分别重返八个Counter对象各因素的最小值和最大值。需求介怀的是,获得的Counter对象将去除小于1的要素。

c = Counter(a=8, b=1)
d = Counter(a=5, b=2)
print(dict(c+d))   # {'a': 13, 'b': 3}
print(dict(c-d))   # {'a': 3}          注意,它只保留正数计数的元素
print(dict(c&d))   # {'a': 5, 'b': 1}  求交集,min(c[x], d[x])
print(dict(c|d))   # {'b': 2, 'a': 8}  求并集,max(c[x], d[x])

Counter类常用操作

www.56.net 94www.56.net 95

sum(c.values())  # 所有计数的总数
c.clear()  # 重置Counter对象,注意不是删除,最终返回None
list(c)  # 将c中的键转为列表
set(c)  # 将c中的键转为set
dict(c)  # 将c中的键值对转为字典
c.items()  # 转为(elem, cnt)格式的列表
Counter(dict(list_of_pairs))  # 从(elem, cnt)格式的列表转换为Counter类对象
c.most_common()[:-n:-1]  # 取出计数最少的n个元素
c += Counter()  # 移除0和负值

View Code

# 总结风姿浪漫篇印度语印尼语作品内各个单词现身频率,并回到现身频率最高的前12个单词及其现身次数

#  对['a','2',2,4,5,'2','b',4,7,'a',5,'d','a','z']该列表的数码开展计数总计

# 方法链接:

Orderedict

  保持key的顺序

from collections import OrderedDict
d = dict([('a', 3), ('b', 5), ('c', 3)])
print(d)  # {'b': 5, 'c': 3, 'a': 3}

d = OrderedDict([('a', 3), ('b', 5), ('c', 3)])
print(d)  # OrderedDict([('a', 3), ('b', 5), ('c', 3)])
# 给这个样子感觉作用不大啊,用dict转型过来顺序又变了

defaultdict(暗中同意字典,是给字典中的value值设置暗中同意值)

  它最大的裨益在于永世不会在你使用key获取值的时候报错

  有如下值集合 [``11``,``22``,``33``,``44``,``55``,``66``,``77``,``88``,``99``,``90.``..],将所有大于 ``66 的值保存至字典的第一个key中,将小于 ``66 的值保存至第二个key的值中。

from collections import defaultdict

values = [11, 22, 33,44,55,66,77,88,99,90]

my_dict = defaultdict(list)

for value in  values:
    if value>66:
        my_dict['k1'].append(value)
    else:
        my_dict['k2'].append(value)
print(dict(my_dict))

 

 

 

 

 

  

 

创制文件

来看一个居多软件的遍布文档格式如下:

[DEFAULT]
ServerAliveInterval = 45
Compression = yes
CompressionLevel = 9
ForwardX11 = yes

[bitbucket.org]
User = hg

[topsecret.server.com]
Port = 50022
ForwardX11 = no

借使想用python生成叁个如此的文书档案怎么办啊?

www.56.net 96www.56.net 97

 1 import configparser
 2 
 3 config = configparser.ConfigParser()
 4 
 5 config["DEFAULT"] = {'ServerAliveInterval': '45',
 6                       'Compression': 'yes',
 7                      'CompressionLevel': '9',
 8                      'ForwardX11':'yes'
 9                      }
10 
11 config['bitbucket.org'] = {'User':'hg'}
12 
13 config['topsecret.server.com'] = {'Host Port':'50022','ForwardX11':'no'}
14 
15 with open('example.ini', 'w') as configfile:
16 
17    config.write(configfile)

View Code

www.56.net 98www.56.net 99

 1 import configparser
 2 
 3 config = configparser.ConfigParser()
 4 
 5 #---------------------------查找文件内容,基于字典的形式
 6 
 7 print(config.sections())        #  []
 8 
 9 config.read('example.ini')
10 
11 print(config.sections())        #   ['bitbucket.org', 'topsecret.server.com']
12 
13 print('bytebong.com' in config) # False
14 print('bitbucket.org' in config) # True
15 
16 
17 print(config['bitbucket.org']["user"])  # hg
18 
19 print(config['DEFAULT']['Compression']) #yes
20 
21 print(config['topsecret.server.com']['ForwardX11'])  #no
22 
23 
24 print(config['bitbucket.org'])          #<Section: bitbucket.org>
25 
26 for key in config['bitbucket.org']:     # 注意,有default会默认default的键
27     print(key)
28 
29 print(config.options('bitbucket.org'))  # 同for循环,找到'bitbucket.org'下所有键
30 
31 print(config.items('bitbucket.org'))    #找到'bitbucket.org'下所有键值对
32 
33 print(config.get('bitbucket.org','compression')) # yes       get方法Section下的key对应的value

查找文件

www.56.net 100www.56.net 101

 1 import configparser
 2 
 3 config = configparser.ConfigParser()
 4 
 5 config.read('example.ini')
 6 
 7 config.add_section('yuan')
 8 
 9 
10 
11 config.remove_section('bitbucket.org')
12 config.remove_option('topsecret.server.com',"forwardx11")
13 
14 
15 config.set('topsecret.server.com','k1','11111')
16 config.set('yuan','k2','22222')
17 
18 config.write(open('new2.ini', "w"))

增加和删除改操作

 

www.56.net 102

1---->>>>json

适用于不一致语言之间,援救的数据类型   str  int   list   dict   bool 

 

www.56.net 103www.56.net 104

import json
# dic = {"alex": ('women','women','老女人')}
# dic2 = {"alex1": ('women','women','老女人')}
# dic3 = {"alex2": ('women','women','老女人')}
# with open("json-file",mode="w",encoding="utf-8")as f:
#     s1=json.dumps(dic)
#     s2=json.dumps(dic2)
#     s3=json.dumps(dic3)
#     f.write(s1+"n")
#     f.write(s2+"n")
#     f.write(s3+"n")
# with open("json-file",mode="r",encoding="utf-8")as f1:
#     for line in f1:
#         print(json.loads(line))

json文件多多少操作

写入许多据用dumps 和 loads

dump一遍只能读取和写入二个系列化字符串

www.56.net 105www.56.net 106

Serialize obj to a JSON formatted str.(字符串表示的json对象) 
Skipkeys:默认值是False,如果dict的keys内的数据不是python的基本类型(str,unicode,int,long,float,bool,None),设置为False时,就会报TypeError的错误。此时设置成True,则会跳过这类key 
ensure_ascii:,当它为True的时候,所有非ASCII码字符显示为uXXXX序列,只需在dump时将ensure_ascii设置为False即可,此时存入json的中文即可正常显示。) 
If check_circular is false, then the circular reference check for container types will be skipped and a circular reference will result in an OverflowError (or worse). 
If allow_nan is false, then it will be a ValueError to serialize out of range float values (nan, inf, -inf) in strict compliance of the JSON specification, instead of using the JavaScript equivalents (NaN, Infinity, -Infinity). 
indent:应该是一个非负的整型,如果是0就是顶格分行显示,如果为空就是一行最紧凑显示,否则会换行且按照indent的数值显示前面的空白分行显示,这样打印出来的json数据也叫pretty-printed json 
separators:分隔符,实际上是(item_separator, dict_separator)的一个元组,默认的就是(‘,’,’:’);这表示dictionary内keys之间用“,”隔开,而KEY和value之间用“:”隔开。 
default(obj) is a function that should return a serializable version of obj or raise TypeError. The default simply raises TypeError. 
sort_keys:将数据根据keys的值进行排序。 
To use a custom JSONEncoder subclass (e.g. one that overrides the .default() method to serialize additional types), specify it with the cls kwarg; otherwise JSONEncoder is used.

此外参数表明

www.56.net 107www.56.net 108

import json
data = {'username':['李华','二愣子'],'sex':'male','age':16}
json_dic2 = json.dumps(data,sort_keys=True,indent=2,separators=(',',':'),ensure_ascii=False)
print(json_dic2)

json的格式化输出

 

2------>>>>pickle

 

用以类别化的五个模块

 

  • json,用于字符串 和 python数据类型间张开转移
  • pickle,用于python特有的类型 和 python的数据类型间张开转移

 

pickle模块提供了八个效率:dumps、dump(种类化,存)、loads(反体系化,读)、load  (不仅能够种类化字典,列表...能够把python中随机的数据类型种类化

 

 

www.56.net 109www.56.net 110

# dic = {'alex': ('women','women','老女人')}
# dic2 = {"alex1": ('women','women','老女人')}
# dic3 = {"alex2": ('women','women','老女人')}
# with open("pickle_file",mode="wb")as f:
#     pickle.dump(dic,f)
#     pickle.dump(dic2,f)
#     pickle.dump(dic3,f)
# with open("pickle_file",mode="rb")as f:
#     while 1:
#         try:
#             print(pickle.load(f))
#         except EOFError:
#             break

pickle文件多多少操作

专心:文件读写形式问btyes:

 

3----->>>>shelve

shelve也是python提必要大家的系列化学工业具,比pickle用起来更简明一(Wissu)些。
shelve只提供给大家叁个open方法,是用key来访谈的,使用起来和字典雷同。

 

www.56.net 111www.56.net 112

import shelve
f = shelve.open('shelve_file')
f['key'] = {'int':10, 'float':9.5, 'string':'Sample data'}  #直接对文件句柄操作,就可以存入数据
f.close()

import shelve
f1 = shelve.open('shelve_file')
existing = f1['key']  #取出数据的时候也只需要直接用key获取即可,但是如果key不存在会报错
f1.close()
print(existing)

View Code

 

以此模块有个约束,它不扶助五个应用同时往同二个DB实行写操作。所以当大家通晓大家的运用即便只实行读操作,我们能够让shelve通过只读方式展开DB

 

 

www.56.net 113www.56.net 114

import shelve
f = shelve.open('shelve_file', flag='r')
existing = f['key']
f.close()
print(existing)

View Code

是因为shelve在暗许情形下是不会记录待长久化对象的此外修正的,所以我们在shelve.open()时候须要修正暗中同意参数,不然对象的修改不会保留。

 

www.56.net 115www.56.net 116

import shelve
f1 = shelve.open('shelve_file')
print(f1['key'])
f1['key']['new_value'] = 'this was not here before'
f1.close()

f2 = shelve.open('shelve_file', writeback=True)
print(f2['key'])
f2['key']['new_value'] = 'this was not here before'
f2.close()

编辑:编程 本文来源:python之常用模块

关键词: