资源整合(资源整合公司怎么注册)

网友投稿 335 2022-08-22


资源整合(资源整合公司怎么注册)

一、5 个值得在 2018 年关注的库

Web 领域:Sanic

这个库和 Flask 类似,但是比它快很多,速度能在测试中达到每秒 36000 次请求。在2017年的 Star 增长数几乎是翻了一倍。Gotta go faster!

环境与包管理:Pipenv

这个库相当于是环境管理和包管理二合一,由 Kenneth Reitz (Requests 的作者 )编写,现在移交给 Python 官方来维护,提供比 pip 体验更好的开发包管理。它的 Slogon 是Python Development Workflow for Humans,用来解决各种环境不一致、安装包的问题。

爬虫:Requestium

现在反爬虫技术越来越厉害,常见的请求 + 解析爬虫随着频率变大和前端开发的复杂化变得并不是那么奏效。Requestium 的好处是,结合了 Chrome 59 以后的 headless 无头特性(代替了 phantomjs)。虽然效率稍微低一点,但是稳,前端渲染的网页也可以爬取解析。是 Requests, Selenium 和 Parsel 的结合体。

深度学习:Caffe2

文本处理:FlashText

这个库的开发者在 medium 上发了一篇文章,标题是:​​Regex was taking 5 days to run. So I built a tool that did it in 15 minutes​​. (正则要花5天时间才能完成,所以我做了个工具在15分钟内搞定)。这个库可以快速进行大规模语料库的文本搜索与替换。当关键词数量>500 的时候,FlashText 的搜索速度开始超过正则。

二、Awesome Python中文版来啦!

引自:​​Python 资源大全​​​ (本文由 ​​伯乐在线​​ - ​​艾凌风​​ 翻译 英文出处:​​vinta/awesome-python​​)

三、python 之网络和邮件

作者:赖明星链接:​​yagmail

果使用 ​​yagmail​​,发送一个带附件的邮件,只需要2行代码:

import yagmail yag = yagmail.SMTP(user='joy_lmx@163.com', password='nicai?', host='smtp.163.com', port='25') yag.send(user, subject = "I now can send an attachment", attachments=['a.txt', 'b.jpg'])

2. requests

>>> r = requests.get('auth=('user', 'pass')) >>> r.status_code 200 >>> r.headers['content-type'] 'application/json; charset=utf8' >>> r.encoding 'utf-8' >>> r.text u'{"type":"User"...' >>> r.json() {u'private_gists': 419, u'total_private_repos': 77, ...}

3. psutil

​​psutil​​​ 是用来获取操作系统监控以及进程管理的,如果你正在写一个监控系统(或脚本),赶紧去试试。这么说吧,我曾经使用psutil把网易内部的一个监控模块,从 \(1000+\) 行重构到了\(100+\) 行。 我这里推荐的几个库,可能 ​​​yagmail​​​对最多人有用。而 ​​psutil​​​,对专业的人士最有用。如果你要写一个监控系统,不使用 ​​psutil​​​的话,只能直接去 ​​/proc​​​ 目录下读取想用的文件进行计算,或者执行 ​​iostat​​​、​​vmstat​​​、​​df​​​ 等 ​​linux​​​ 命令获取命令输出,不管哪一种方法,都要处理很多繁琐的细节。有了 ​​psutil​​ 以后,就轻松多了。贴段代码大家感受一下:

def get_network_info(self): """ psutil.net_io_counters() snetio(bytes_sent=12541464, bytes_recv=21459989, packets_sent=80164, packets_recv=88134, errin=0, errout=0, dropin=0, dropout=0) """ return psutil.net_io_counters()def get_memory_used(self): """ psutil.virtual_memory() svmem(total=4159041536, available=3723980800, percent=10.5, used=1599082496, free=2559959040, active=587403264, inactive=897105920, buffers=95989760, cached=1068032000) """ memory_info = psutil.virtual_memory() memory_used = ( memory_info.total * memory_info.percent / 100 ) / 1024 / 1024 return memory_used

此外,使用越来越广泛的监控工具 glances(如果没用过,要不现在就是试试?),就是用 psutil 收集相关数据的。

4. BeautifulSoup

如果你写爬虫,还在用 ​​XPath​​​ 解析 HTML,那赶紧用用 ​​BeautifulSoup​​​,比 ​​XPath​​​ 好用一百倍;如果你还在用正则表达式从 HTML 中获取内容,​​BeautifulSoup​​​ 能让你好用到哭。(补充:评论里大家都说 ​​XPath​​​ 更好用,难道是我思维方式和大家不一样?)​​​BeautifulSoup​​​ 是用来解析 HTML 的,特点就是好用,有人吐槽 ​​BeautifulSoup​​​ 慢?我不在乎 ​​BeautifulSoup​​​ 比 ​​XPath​​​ 慢多少,我只知道,我的时间比机器的更宝贵。 例如,要找到页面中所有的 links,如下所示:

from bs4 import BeautifulSoupimport requests url = '= requests.get(url, timeout=20)soup = BeautifulSoup(r.content, 'html.parser')print(type(soup))

for link in soup.find_all('a'): print(link.get('href'))

Soup​​

5. utils

除了开源的库以外,还有些开源项目的 ​​DataStruct.py​​​ ​​helper.py​​​ ​​utils.py​​ 文件,也值得看一看。里面很多好东西,都是可以直接拿过来用的。

四、怎么样才算是精通 Python?

五、你写论文时发现了哪些神网站?

六、LaTeX笔记|基本功能(一)

七 完全云端运行:使用谷歌CoLaboratory训练神经网络

八、谷歌发布 TensorFlow 1.5,全面支持动态图机制和 TensorFlow Lite

探寻有趣之事!


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Java基础教程之整数运算
下一篇:NumPy
相关文章

 发表评论

暂时没有评论,来抢沙发吧~