Python哈希表和解析式(python中哈希表)

网友投稿 335 2022-06-24


哈喽,大家好!距离上一篇文章近1个半月了,不是我拖呀~,刚好这个月遇到了工作调整,再加上要照顾10个月的孩子,实属不易,所以就这么长时间没来更新了。这不,我每天码一点点,'滴水成河',努力完成了这篇文章。

1. 封装和解构

1.1 封装

说明: 等号(=)右边有多个数值仅通过逗号分割,就会封装到一个元组,称为封装packing。

# 示例:

x = 1,

y = 1,2

print(type(x), x)

print(type(y), y)

# 输出结果如下:

(1,)

(1, 2)

备注: 如果右边只有一个数值且没有用逗号,其实是一个整数类型,请留意。另外等号右边一定先运行,再赋值给左边。

1.2 解构

说明: 等号(=)右边容器类型的元素与左边通过逗号分割的变量要一 一对应,称为解构unpacking。

x,y = (1,2) # [1,2] {1,2} {'a':1,'b':2}

print(x)

print(y)

# 输出结果如下:

1

2

备注:右边的容器可以是元组、列表、字典、集合等,必须是可迭代对象。

错误示范:

x,y = (1,2,3)

print(x)

print(y)

# 输出结果如下:

ValueError: too many values to unpack (expected 2)

说明:左、右两边个数一定要一致,不然会抛出'ValueError'错误。

剩余变量解构

说明:python3引入了剩余变量解构(rest),'尽可能'收集剩下的数据组成一个列表。

x, *rest = [1,2,3,4,5,6]

print(type(x), x)

print(type(rest), rest) # 剩余没有赋值的就是rest的了

# 输出结果如下:

1

[2, 3, 4, 5, 6]

*rest, y = [1,2,3,4,5,6]

print(type(rest), rest)

print(type(y), y)

# 输出结果如下:

[1, 2, 3, 4, 5]

6

错误示例:

不能单独使用

说明:等号左边只有一个标识符,无法解构。

*rest = [1,2,3,4,5,6]

print(rest)

# 输出结果如下:

#语法错误

SyntaxError: starred assignment target must be in a list or tuple

不能多次同时使用

x, *rest1, *rest2, y = [1,2,3,4,5,6]

print(rest1)

print(rest2)

# 输出结果如下:

#语法错误,其中一个rest就把剩余元素拿走了,另外一个rest怎么拿?

SyntaxError: two starred expressions in assignment

另外一种丢弃变量下划线:'_'

说明: '_'是合法的标识符,大多场景表示不关心该值。

x, *_, y = [1,2,3,4,5,6]

print(x)

print(_)

print(y)

# 输出结果如下:

1

[2, 3, 4, 5]

6

_, *rest, _ = [1,2,3,4,5,6]

print(_) # '_'是上一次输出值

print(rest)

# 输出结果如下:

6

[2, 3, 4, 5]

2. 集合Set

说明:集合是'可变的、无序的、不重复'的元素集合。

成为集合元素是有条件的:'元素必须可hash、可迭代'

可哈希对象如下(不可变):

数值型:int(整数)、float(浮点)、complex(复数)

布尔型:True(是)、False(否)

字符串:string(字符串)、bytes(字节)

tuple(元组)

None(空)

可以通过内置hash函数判断是否可hash:

s1 = [1,2,3]

print(hash(s1))

# 输出结果如下:

TypeError: unhashable type: 'list' # 列表是不可hash的

2.1 初始化

说明:

set() -> new empty set object,新的空集合

set(iterable) -> new set object,元素必须可迭代

s = {} # 注意这个是空字典,不是空集合

s1 = set() # 空集合

s2 = set([1,2,3]) # 注意列表里面元素迭代出来的是整数,可hash

s3 = set("abcd")

print(s1)

print(s2)

print(s3)

# 输出结果如下:

set()

{1, 2, 3}

{'c', 'd', 'a', 'b'}

错误示例:

s = set([[1]]) # 列表套列表,迭代出来是列表,不可hash

print(s)

# 输出结果如下:

TypeError: unhashable type: 'list'

2.2 增加

s.add(element)

说明:增加一个元素到集合,如果元素已经存在,则不操作。

s1 = set([1,2,3])

s1.add(4)

print(s1)

# 输出结果如下:

{1, 2, 3, 4}

s.update(*element))

说明:合并一个或多个元素到集合中,元素必须可迭代(把迭代的元素并到集合),和后面讲的并集一样。

s1 = set([1,2,3])

s1.update((4,5,6),[7,8,9])

print(s1)

# 输出结果如下:

{1, 2, 3, 4, 5, 6, 7, 8, 9}

2.3 删除

remove(element)

说明:从集合中移除一个元素,如果元素不存在抛出'KeyError'错误。

s1 = {1,2,3,4,5,6}

s1.remove(6)

print(s1)

# 输出结果如下:

{1, 2, 3, 4, 5}

discard(element)

说明:也是从集合中移除一个元素,如果元素不存在不会报异常,啥都不做。

s1 = {1,2,3,4,5,6}

s1.discard(6)

print(s1)

# 输出结果如下:

{1, 2, 3, 4, 5}

pop()

说明:因为集合是无序的,所以是删除'任意'一个元素,如果是空集则抛出'KeyError'错误。

s1 = {1,2,3,4,5,6}

print(s1.pop()) # 随机的(因为无序)

print(s1)

# 输出结果如下:

1

{2, 3, 4, 5, 6}

clear()

说明:删除所有元素,都不推荐使用的啦。

s1 = {1,2,3,4,5,6}

s1.clear()

print(s1)

# 输出结果如下:

set()

2.4 遍历

说明:集合是个容器,是可以遍历的,但是效率都是O(n)。

s1 = {1,2,3}

for s in s1:

print(s)

# 输出结果如下:

1

2

3

说到这里,你觉得集合set和列表list哪个遍历效率更高呢?

答案是set,因为set的元素是hash值作为key(下面讲的字典也是hash值),查询时间复杂度为O(1),而list是线性数据结构,时间复杂度是O(n)。

大家可以按照如下进行验证下,随着数据规模越来越大,很明显就可以看出哪个效率高。

2.5 并集&交集&差集&对称差集

并集

说明: 将多个集合的所有元素合并在一起组成新的集合。

s1 = {1,2,3}

s2 = {3,4,5}

print(s1.union(s2))

# 输出结果如下:

{1, 2, 3, 4, 5}

备注:还可以使用运算符 '|'、'update(element)'、'|='。

交集

说明: 取多个集合的共同(相交)元素

s1 = {1,2,3}

s2 = {3,4,5}

print(s1.intersection(s2))

# 输出结果如下:

{3}

备注:还可以使用'&'、's.intersection_update(element)'、'&='。

差集

说明:属于一个集合但不属于另一个集合的元素组成的集合。

s1 = {1,2,3}

s2 = {3,4,5}

print(s1.difference(s2))

# 输出结果如下:

{1, 2}

备注:还可以使用'-'、's.difference_update(element)'、'-='.

对称差集

说明:多个集合中,不属于交集元素组成的集合。

s1 = {1,2,3}

s2 = {3,4,5}

print(s1.symmetric_difference(s2))

# 输出结果如下:

{1, 2, 4, 5}

备注:还可以使用''、's1.symmetric_difference_update(s2)'、'='.

3.字典

说明:字典是由任意个item(元素)组成的集合,item是由key:value对组成的二元组。

字典是'可变的':支持增删改查;

字典是'无序的':key存储是无序的,非线性数据结构(请不要让表面蒙蔽了你哈);

字典是'key不重复':key是唯一的,且必须可'hash';

3.1 初始化

# 空字典

d1 = {}

d2 = dict()

# 示例:

d3 = dict(a=1,b=2,c=3)

d4 = dict(d3)

d5 = dict([('a',1),('b',2),('c',3)]) # 元素必须是可迭代的

d6 = {'a':1,'b':2,'c':3}

# 输出结果都是:

{'a': 1, 'b': 2, 'c': 3}

3.2 增删改查

增加&修改元素

1)通过'd[key] = value'方式:

备注:如果key不存在,则新增,key存在则直接覆盖(修改元素)。

# 增加 & 修改

d = {'a':1,'b':2,'c':3}

d['d'] = 4 # 增加

d['a'] = 11 # 修改

print(d)

# 输出结果如下:

{'a': 11, 'b': 2, 'c': 3, 'd': 4}

2)通过d.update([E, ]**F) -> None

# 增加 & 修改

d = {'a':1,'b':2,'c':3}

d.update(d=4)

print(d)

# 输出结果如下:

{'a': 1, 'b': 2, 'c': 3, 'd': 4}

删除元素

1)d.pop()

key存在则移除,并返回对应value值。

key不存在,返回给定的缺省值,否则抛出KeyError。

d = {'a':1,'b':2,'c':3}

print(d.pop('c',None))

print(d)

# 输出结果如下:

3

{'a': 1, 'b': 2}

2)d.popitem()

删除并返回一个任意的item(key:value)。

如果是空字典,抛出KeyError。

d = {'a':1,'b':2,'c':3}

print(d.popitem())

print(d)

# 输出结果如下:

('c', 3)

{'a': 1, 'b': 2}

3)d.clear()

删除所有item,不推荐使用。

d = {'a':1,'b':2,'c':3}

d.clear()

print(d)

查找元素

通过key这个键就可以快速找到value值。

时间复杂度是O(1),不会随着数据规模大而降低效率。

正常访问元素:

d = {'a':1,'b':2,'c':3}

print(d['a'])

print(d.get('b'))

# 输出结果如下:

1

2

key不存在的处理方式:

d = {'a':1,'b':2,'c':3}

print(d.get('d',None)) # 如果key不存在,缺省返回None

print(d.setdefault('d',100)) # 如果key不存在,则新增key:value对

print(d)

# 输出结果如下:

None

100

{'a': 1, 'b': 2, 'c': 3, 'd': 100}

3.3 遍历

遍历键:key

d = {'a':1,'b':2,'c':3}

# 方法1:

for k in d: # 缺省是遍历key

print(k)

# 方法2:

for k in d.keys():

print(k)

# 方法3:

for k, _ in d.items():

print(k)

# 输出结果如下:

a

b

c

遍历值:value

d = {'a':1,'b':2,'c':3}

# 方法1:

for v in d.values():

print(v)

# 方法2:

for k in d:

# print(d[k]) # 也可以用

print(d.get(k))

# 方法3:

for _, v in d.items():

print(v)

# 输出结果如下:

1

2

3

遍历item:key-value

d = {'a':1,'b':2,'c':3}

for item in d.items():

print(item)

# 输出结果如下:

('a', 1)

('b', 2)

('c', 3)

其他问题

这种情况在遍历的时候,不能够删除元素,不能改变字典的size。

d = {'a':1,'b':2,'c':3}

for k in d:

print(d.pop(k))

# 输出结果如下:

RuntimeError: dictionary changed size during iteration

优雅的删除方式:

d = {'a':1,'b':2,'c':3}

key_list = []

for k in d:

key_list.append(k)

for k in key_list:

print('已删除key:', d.pop(k))

然并卵,想要清除,直接用clear()啦。

4.解析式和生成器表达式

4.1 列表解析式

语法

[ 返回值 for 元素 in 可迭代对象 if 条件 ]

列表解析式用中括号'[ ]'表示

返回一个新的列表

优点

提高效率

代码轻量

可读性高

示例需求:请从给定区间中提取能够被2整除的元素。

大众普遍的写法:

list = []

for i in range(10):

if i % 2 == 0:

list.append(i)

print(list)

# 输出结果如下:

[0, 2, 4, 6, 8]

再来感受一下简单而优雅的写法:

print([i for i in range(10) if i % 2 == 0])

# 输出结果如下:

[0, 2, 4, 6, 8]


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:怎么反爬虫爬取网站信息(网站反爬虫的手段有)
下一篇:《自拍教程65》Python Testlink用例导出工具xml2excel(自拍技巧教程)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~