大师网-带你快速走向大师之路 解决你在学习过程中的疑惑,带你快速进入大师之门。节省时间,提升效率

Python基础手册14——集合

一、集合

这表示无序的,有限的,不重复的对象集合。因为是无序的,所以它们不能被任何下标索引。一个集合的行为很像一个无值的字典的键,但是它还支持额外的操作。集合只能包含不可变的对象类型,列表和字典以及可变集合不能嵌入到集合中。

和其他容器类型一样,集合支持用 in 和 not in 操作符检查成员,由 len() 内建函数得到集合的基数(大小),用 for 循环迭代集合的成员。但是因为集合本身是无序的,你不可以为集合创建索引或执行切片(slice)操作,也没有键(keys)可用来获取集合中元素的值。

集合(sets)有两种不同的类型,可变集合(set) 和 不可变集合(frozenset)。如你所想,对可变集合(set),你可以添加和删除元素,对不可变集合(frozenset)则不允许这样做。请注意,可变集合(set)不是可哈希的,因此既不能用做字典的键也不能做其他集合中的元素。不可变集合(frozenset)则正好相反,即,他们有哈希值,能被用做字典的键或是作为集合中的一个成员。

集合的常用用法是快速成员测试,从序列中去除重复,以及计算数学运算,例如:交集、并集、差集。

对于集合元素,相同的不变性规则适用于字典的键。注意,数值类型遵循正常的数值比较规则:如果两个数字相等(例如,1和1.0),其中只有一个可以包含在集合中。


二、集合的基本操作

1、创建集合类型

集合与列表( [ ] )和字典( { } ) 一样,可以使用内置函数创建也可以使用操作符来创建。我们可以使用和字典一样的花括号({})来创建集合(可变),也可以使用向内置函数 set()frozenset() 传递一个序列或其他的可迭代的对象分别来创建可变集合和不可变集合。

不管如何创建集合,Python都是用常量格式 {1, 2, 3}(对于可变集合来说)来显示它,要创建空的集合或从已有的可迭代对象构建集合,还是需要内置的set()函数(直接使用空的花括号默认创建的是空字典)但是使用花括号操作符创建集合便于初始化具有已知结构的集合。


2、访问集合中的值

你可以遍历查看集合成员或检查某项元素是否是一个集合中的成员。


3、更新集合

用集合内建的方法和操作符添加和删除集合的成员。


4、删除集合

如果如何删除集合本身,可以像删除任何 Python 对象一样,令集合超出它的作用范围, 或调用 del() 将他们直接清除出当前的名字空间。 如果它的引用计数为零,也会被标记以便被垃圾回收。



二、集合类型操作符


1、成员关系 (in, not in)

Python 中的 in 和 not in 操作符决定某个元素是否是一个集合中的成员。


2、集合等价/不等价

等价/不等价被用于在相同或不同的集合之间做比较。两个集合相等是指,对每个集合而言,两个集合中的成员完全相同。集合等价/不等价与集合的类型或集合成员的顺序无关,只与集合的元素有关。


3、子集/超集

Sets 用 Python 的比较操作符检查某集合是否是其他集合的超集或子集。“小于”符号( <, <= )用来判断子集,“大于”符号( >, >= )用来判断超集。

“小于” 和 “大于”意味着两个集合在比较时不能相等。等于号允许非严格定义的子集和超集。

Sets 支持严格( < )子集和非严格 ( <= ) 子集,也支持严格( > )超集和非严格 ( >= )超集。只有当第一个集合是第二个集合的严格子集时,我们才称第一个集合“小于”第二个集合,同理,只有当第一个集合是第二个集合的严格超集时,我们才称第一个集合“大于”第二个集合。


4、联合( | )

联合(union)操作和集合的 OR(又称可兼析取(inclusive disjunction))其实是等价的,两个集合的联合是一个新集合,该集合中的每个元素都至少是其中一个集合的成员,即,属于两个集合其中之一的成员。联合符号有一个等价的方法,union()。


5、交集( & )

你可以把交集操作比做集合的 AND(或合取)操作。两个集合的交集是一个新集合,该集合中的每个元素同时是两个集合中的成员,即,属于两个集合的成员。交集符号有一个等价的方法,intersection()。


6、差补/相对补集( – )

两个集合(s 和 t)的差补或相对补集是指一个集合 C,该集合中的元素,只属于集合 s,而不属于集合 t。差符号有一个等价的方法,difference()。


7、对称差分( ^ )

和其他的布尔集合操作相似, 对称差分是集合的 XOR(又称”异或“ (exclusive disjunction))。两个集合(s 和 t)的对称差分是指另外一个集合 C,该集合中的元素,只能是属于集合 s 或者集合 t的成员,不能同时属于两个集合。对称差分有一个等价的方法,symmetric_difference()。


8、联合操作符(仅适用于可变集合)

(Union) Update ( |= )

这个更新方法从已存在的集合中添加(可能多个)成员,此方法和 update()等价。

保留/交集更新( &= )

保留(或交集更新)操作保留与其他集合的共有成员。此方法和 intersection_update()等价。

差更新 ( –= )

对集合 s 和 t 进行差更新操作 s-=t,差更新操作会返回一个集合,该集合中的成员是集合 s 去除掉集合 t 中元素后剩余的元素。此方法和 difference_update()等价。

对称差分更新( ^= )

对集合 s 和 t 进行对称差分更新操作(s^=t),对称差分更新操作会返回一个集合,该集合中的成员仅是原集合 s 或仅是另一集合 t 中的成员。此方法和 symmetric_difference_update()等价。




三、集合可用的内建函数

1、len()

把集合作为参数传递给内建函数 len(),返回集合的基数(或元素的个数)。


2、set() and frozenset()

set() 和 frozenset() 工厂函数分别用来生成可变和不可变的集合。如果不提供任何参数,默认会生成空集合。如果提供一个参数,则该参数必须是可迭代的,即,一个序列,或迭代器,或支持迭代的一个对象,例如:一个文件或一个字典。


《Python基础手册》系列:

Python基础手册 1 —— Python语言介绍
Python基础手册 2 —— Python 环境搭建(Linux)
Python基础手册 3 —— Python解释器
Python基础手册 4 —— 文本结构
Python基础手册 5 —— 标识符和关键字
Python基础手册 6 —— 操作符
Python基础手册 7 —— 内建函数
Python基础手册 8 —— Python对象
Python基础手册 9 —— 数字类型
Python基础手册10 —— 序列(字符串)
Python基础手册11 —— 序列(元组&列表)
Python基础手册12 —— 序列(类型操作)
Python基础手册13 —— 映射(字典)
Python基础手册14 —— 集合
Python基础手册15 —— 解析
Python基础手册16 —— 文件
Python基础手册17 —— 简单语句
Python基础手册18 —— 复合语句(流程控制语句)
Python基础手册19 —— 迭代器
Python基础手册20 —— 生成器
Python基础手册21 —— 函数的定义
Python基础手册22 —— 函数的参数
Python基础手册23 —— 函数的调用
Python基础手册24 —— 函数中变量的作用域
Python基础手册25 —— 装饰器
Python基础手册26 —— 错误 & 异常
Python基础手册27 —— 模块
Python基础手册28 —— 模块的高级概念
Python基础手册29 —— 包