Python爬虫技术--基础篇--面向对象编程(下)(python爬虫百度百科)

网友投稿 315 2022-09-01


Python爬虫技术--基础篇--面向对象编程(下)(python爬虫百度百科)

1.获取对象信息

当我们拿到一个对象的引用时,如何知道这个对象是什么类型、有哪些方法呢?

使用type()

首先,我们来判断对象类型,使用​​type()​​函数:

基本类型都可以用​​type()​​判断:

>>> type(123)>>> type('str')>>> type(None)

如果一个变量指向函数或者类,也可以用​​type()​​判断:

>>> type(abs)>>> type(a)

但是​​type()​​​函数返回的是什么类型呢?它返回对应的Class类型。如果我们要在​​if​​语句中判断,就需要比较两个变量的type类型是否相同:

>>> type(123)==type(456)True>>> type(123)==intTrue>>> type('abc')==type('123')True>>> type('abc')==strTrue>>> type('abc')==type(123)False

判断基本数据类型可以直接写​​int​​​,​​str​​​等,但如果要判断一个对象是否是函数怎么办?可以使用​​types​​模块中定义的常量:

>>> import types>>> def fn():... pass...>>> type(fn)==types.FunctionTypeTrue>>> type(abs)==types.BuiltinFunctionTypeTrue>>> type(lambda x: x)==types.LambdaTypeTrue>>> type((x for x in range(10)))==types.GeneratorTypeTrue

使用isinstance()

对于class的继承关系来说,使用​​type()​​​就很不方便。我们要判断class的类型,可以使用​​isinstance()​​函数。

我们回顾上次的例子,如果继承关系是:

object -> Animal -> Dog -> Husky

那么,​​isinstance()​​就可以告诉我们,一个对象是否是某种类型。先创建3种类型的对象:

>>> a = Animal()>>> d = Dog()>>> h = Husky()

然后,判断:

>>> isinstance(h, Husky)True

没有问题,因为​​h​​变量指向的就是Husky对象。

再判断:

>>> isinstance(h, Dog)True

​​h​​​虽然自身是Husky类型,但由于Husky是从Dog继承下来的,所以,​​h​​​也还是Dog类型。换句话说,​​isinstance()​​判断的是一个对象是否是该类型本身,或者位于该类型的父继承链上。

因此,我们可以确信,​​h​​还是Animal类型:

>>> isinstance(h, Animal)True

同理,实际类型是Dog的​​d​​也是Animal类型:

>>> isinstance(d, Dog) and isinstance(d, Animal)True

但是,​​d​​不是Husky类型:

>>> isinstance(d, Husky)False

能用​​type()​​​判断的基本类型也可以用​​isinstance()​​判断:

>>> isinstance('a', str)True>>> isinstance(123, int)True>>> isinstance(b'a', bytes)True

并且还可以判断一个变量是否是某些类型中的一种,比如下面的代码就可以判断是否是list或者tuple:

>>> isinstance([1, 2, 3], (list, tuple))True>>> isinstance((1, 2, 3), (list, tuple))True

总是优先使用isinstance()判断类型,可以将指定类型及其子类“一网打尽”。

使用dir()

如果要获得一个对象的所有属性和方法,可以使用​​dir()​​函数,它返回一个包含字符串的list,比如,获得一个str对象的所有属性和方法:

>>> dir('ABC')['__add__', '__class__',..., '__subclasshook__', 'capitalize', 'casefold',..., 'zfill']

类似​​__xxx__​​​的属性和方法在Python中都是有特殊用途的,比如​​__len__​​​方法返回长度。在Python中,如果你调用​​len()​​​函数试图获取一个对象的长度,实际上,在​​len()​​​函数内部,它自动去调用该对象的​​__len__()​​方法,所以,下面的代码是等价的:

>>> len('ABC')3>>> 'ABC'.__len__()3

我们自己写的类,如果也想用​​len(myObj)​​​的话,就自己写一个​​__len__()​​方法:

>>> class MyDog(object):... def __len__(self):... return 100...>>> dog = MyDog()>>> len(dog)100

剩下的都是普通属性或方法,比如​​lower()​​返回小写的字符串:

>>> 'ABC'.lower()'abc'

仅仅把属性和方法列出来是不够的,配合​​getattr()​​​、​​setattr()​​​以及​​hasattr()​​,我们可以直接操作一个对象的状态:

>>> class MyObject(object):... def __init__(self):... self.x = 9... def power(self):... return self.x * self.x...>>> obj = MyObject()

紧接着,可以测试该对象的属性:

>>> hasattr(obj, 'x') # 有属性'x'吗?True>>> obj.x9>>> hasattr(obj, 'y') # 有属性'y'吗?False>>> setattr(obj, 'y', 19) # 设置一个属性'y'>>> hasattr(obj, 'y') # 有属性'y'吗?True>>> getattr(obj, 'y') # 获取属性'y'19>>> obj.y # 获取属性'y'19

如果试图获取不存在的属性,会抛出AttributeError的错误:

>>> getattr(obj, 'z') # 获取属性'z'Traceback (most recent call last): File "", line 1, in AttributeError: 'MyObject' object has no attribute 'z'

可以传入一个default参数,如果属性不存在,就返回默认值:

>>> getattr(obj, 'z', 404) # 获取属性'z',如果不存在,返回默认值404404

也可以获得对象的方法:

>>> hasattr(obj, 'power') # 有属性'power'吗?True>>> getattr(obj, 'power') # 获取属性'power'>>>> fn = getattr(obj, 'power') # 获取属性'power'并赋值到变量fn>>> fn # fn指向obj.power>>>> fn() # 调用fn()与调用obj.power()是一样的81

小结

通过内置的一系列函数,我们可以对任意一个Python对象进行剖析,拿到其内部的数据。要注意的是,只有在不知道对象信息的时候,我们才会去获取对象信息。如果可以直接写:

sum = obj.x + obj.y

就不要写:

sum = getattr(obj, 'x') + getattr(obj, 'y')

一个正确的用法的例子如下:

def readImage(fp): if hasattr(fp, 'read'): return readData(fp) return None

假设我们希望从文件流fp中读取图像,我们首先要判断该fp对象是否存在read方法,如果存在,则该对象是一个流,如果不存在,则无法读取。​​hasattr()​​就派上了用场。

请注意,在Python这类动态语言中,根据鸭子类型,有​​read()​​​方法,不代表该fp对象就是一个文件流,它也可能是网络流,也可能是内存中的一个字节流,但只要​​read()​​方法返回的是有效的图像数据,就不影响读取图像的功能。

2.实例属性与类属性

由于Python是动态语言,根据类创建的实例可以任意绑定属性。

给实例绑定属性的方法是通过实例变量,或者通过​​self​​变量:

class Student(object): def __init__(self, name): self.name = names = Student('Bob')s.score = 90

但是,如果​​Student​​​类本身需要绑定一个属性呢?可以直接在class中定义属性,这种属性是类属性,归​​Student​​类所有:

class Student(object): name = 'Student'

当我们定义了一个类属性后,这个属性虽然归类所有,但类的所有实例都可以访问到。来测试一下:

>>> class Student(object):... name = 'Student'...>>> s = Student() # 创建实例s>>> print(s.name) # 打印name属性,因为实例并没有name属性,所以会继续查找class的name属性Student>>> print(Student.name) # 打印类的name属性Student>>> s.name = 'Michael' # 给实例绑定name属性>>> print(s.name) # 由于实例属性优先级比类属性高,因此,它会屏蔽掉类的name属性Michael>>> print(Student.name) # 但是类属性并未消失,用Student.name仍然可以访问Student>>> del s.name # 如果删除实例的name属性>>> print(s.name) # 再次调用s.name,由于实例的name属性没有找到,类的name属性就显示出来了Student

从上面的例子可以看出,在编写程序的时候,千万不要对实例属性和类属性使用相同的名字,因为相同名称的实例属性将屏蔽掉类属性,但是当你删除实例属性后,再使用相同的名称,访问到的将是类属性。

小结

实例属性属于各个实例所有,互不干扰;

类属性属于类所有,所有实例共享一个属性;

不要对实例属性和类属性使用相同的名字,否则将产生难以发现的错误。


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Python爬虫技术--基础篇--面向对象编程(中)(python编写爬虫程序)
下一篇:JAVA面向对象之继承 super入门解析
相关文章

 发表评论

暂时没有评论,来抢沙发吧~