Python爬虫技术--基础篇--函数(上篇)(python爬虫常用算法)

网友投稿 553 2022-09-01


Python爬虫技术--基础篇--函数(上篇)(python爬虫常用算法)

1.调用函数

Python内置了很多有用的函数,我们可以直接调用。

要调用一个函数,需要知道函数的名称和参数,比如求绝对值的函数​​abs​​,只有一个参数。可以直接从Python的官方网站查看文档:

​​abs(100)100>>> abs(-20)20>>> abs(12.34)12.34

调用函数的时候,如果传入的参数数量不对,会报​​TypeError​​​的错误,并且Python会明确地告诉你:​​abs()​​有且仅有1个参数,但给出了两个:

>>> abs(1, 2)Traceback (most recent call last): File "", line 1, in TypeError: abs() takes exactly one argument (2 given)

如果传入的参数数量是对的,但参数类型不能被函数所接受,也会报​​TypeError​​​的错误,并且给出错误信息:​​str​​是错误的参数类型:

>>> abs('a')Traceback (most recent call last): File "", line 1, in TypeError: bad operand type for abs(): 'str'

而​​max​​​函数​​max()​​可以接收任意多个参数,并返回最大的那个:

>>> max(1, 2)2>>> max(2, 3, 1, -5)3

数据类型转换

Python内置的常用函数还包括数据类型转换函数,比如​​int()​​函数可以把其他数据类型转换为整数:

>>> int('123')123>>> int(12.34)12>>> float('12.34')12.34>>> str(1.23)'1.23'>>> str(100)'100'>>> bool(1)True>>> bool('')False

函数名其实就是指向一个函数对象的引用,完全可以把函数名赋给一个变量,相当于给这个函数起了一个“别名”:

>>> a = abs # 变量a指向abs函数>>> a(-1) # 所以也可以通过a调用abs函数1

2.定义函数

在Python中,定义一个函数要使用​​def​​​语句,依次写出函数名、括号、括号中的参数和冒号​​:​​​,然后,在缩进块中编写函数体,函数的返回值用​​return​​语句返回。

我们以自定义一个求绝对值的​​my_abs​​函数为例:

def my_abs(x): if x >= 0: return x else: return -x

View Code

请注意,函数体内部的语句在执行时,一旦执行到​​return​​时,函数就执行完毕,并将结果返回。因此,函数内部通过条件判断和循环可以实现非常复杂的逻辑。

如果没有​​return​​​语句,函数执行完毕后也会返回结果,只是结果为​​None​​​。​​return None​​​可以简写为​​return​​。

在Python交互环境中定义函数时,注意Python会出现​​...​​​的提示。函数定义结束后需要按两次回车重新回到​​>>>​​提示符下:

┌────────────────────────────────────────────────────────┐│Command Prompt - python - □ x │├────────────────────────────────────────────────────────┤│>>> def my_abs(x): ││... if x >= 0: ││... return x ││... else: ││... return -x ││... ││>>> my_abs(-9) ││9 ││>>> _ ││ ││ │└────────────────────────────────────────────────────────┘

如果你已经把​​my_abs()​​​的函数定义保存为​​abstest.py​​​文件了,那么,可以在该文件的当前目录下启动Python解释器,用​​from abstest import my_abs​​​来导入​​my_abs()​​​函数,注意​​abstest​​​是文件名(不含​​.py​​扩展名):

┌────────────────────────────────────────────────────────┐│Command Prompt - python - □ x │├────────────────────────────────────────────────────────┤│>>> from abstest import my_abs ││>>> my_abs(-9) ││9 ││>>> _ ││ ││ ││ ││ ││ ││ ││ │└────────────────────────────────────────────────────────┘

​​import​​​的用法在后续​​模块​​一节中会详细介绍。

空函数

如果想定义一个什么事也不做的空函数,可以用​​pass​​语句:

def nop(): pass

​​pass​​​语句什么都不做,那有什么用?实际上​​pass​​​可以用来作为占位符,比如现在还没想好怎么写函数的代码,就可以先放一个​​pass​​,让代码能运行起来。

​​pass​​还可以用在其他语句里,比如:

if age >= 18: pass

缺少了​​pass​​,代码运行就会有语法错误。

参数检查

调用函数时,如果参数个数不对,Python解释器会自动检查出来,并抛出​​TypeError​​:

>>> my_abs(1, 2)Traceback (most recent call last): File "", line 1, in TypeError: my_abs() takes 1 positional argument but 2 were given

但是如果参数类型不对,Python解释器就无法帮我们检查。试试​​my_abs​​​和内置函数​​abs​​的差别:

>>> my_abs('A')Traceback (most recent call last): File "", line 1, in File "", line 2, in my_absTypeError: unorderable types: str() >= int()>>> abs('A')Traceback (most recent call last): File "", line 1, in TypeError: bad operand type for abs(): 'str'

当传入了不恰当的参数时,内置函数​​abs​​​会检查出参数错误,而我们定义的​​my_abs​​​没有参数检查,会导致​​if​​​语句出错,出错信息和​​abs​​不一样。所以,这个函数定义不够完善。

让我们修改一下​​my_abs​​​的定义,对参数类型做检查,只允许整数和浮点数类型的参数。数据类型检查可以用内置函数​​isinstance()​​实现:

def my_abs(x): if not isinstance(x, (int, float)): raise TypeError('bad operand type') if x >= 0: return x else: return -x

添加了参数检查后,如果传入错误的参数类型,函数就可以抛出一个错误:

>>> my_abs('A')Traceback (most recent call last): File "", line 1, in File "", line 3, in my_absTypeError: bad operand type

错误和异常处理将在后续讲到。

返回多个值

函数可以返回多个值吗?答案是肯定的。

比如在游戏中经常需要从一个点移动到另一个点,给出坐标、位移和角度,就可以计算出新的坐标:

import mathdef move(x, y, step, angle=0): nx = x + step * math.cos(angle) ny = y - step * math.sin(angle) return nx, ny

​​import math​​​语句表示导入​​math​​​包,并允许后续代码引用​​math​​​包里的​​sin​​​、​​cos​​等函数。

然后,我们就可以同时获得返回值:

>>> x, y = move(100, 100, 60, math.pi / 6)>>> print(x, y)151.96152422706632 70.0

但其实这只是一种假象,Python函数返回的仍然是单一值:

>>> r = move(100, 100, 60, math.pi / 6)>>> print(r)(151.96152422706632, 70.0)

原来返回值是一个tuple!但是,在语法上,返回一个tuple可以省略括号,而多个变量可以同时接收一个tuple,按位置赋给对应的值,所以,Python的函数返回多值其实就是返回一个tuple,但写起来更方便。

小结

定义函数时,需要确定函数名和参数个数;

如果有必要,可以先对参数的数据类型做检查;

函数体内部可以用​​return​​随时返回函数结果;

函数执行完毕也没有​​return​​​语句时,自动​​return None​​。

函数可以同时返回多个值,但其实就是一个tuple。


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Python爬虫技术--基础篇--字典和集合(字典树python)
下一篇:Java实现学生信息管理系统(借助Array List)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~