【此文章转自乐字节】
现在Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多。而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云计算,游戏开发都有涉及。
前端时间闲的无聊, 对Python兴趣徒增。学习这事儿吧,光看没用,还是要是实战,顺手搜了一些写的不错的开源库,也看了些博客。总结一些,分享给大家。
学Python,想必大家都是从爬虫开始的吧。毕竟网上类似的资源很丰富,开源项目也非常多。
简单来说这段过程发生了以下四个步骤:
查找域名对应的IP地址。向IP对应的服务器发送请求。服务器响应请求,发回网页内容。浏览器解析网页内容。有兴趣的朋友可以去网上搜索更详细的内容。那么学习爬虫需要掌握哪些库呢?
通用:
urllib -网络库(stdlib)。requests -网络库。grab – 网络库(基于pycurl)。pycurl – 网络库(绑定libcurl)。urllib3 – Python HTTP库,安全连接池、支持文件post、可用性高。httplib2 – 网络库。RoboBrowser – 一个简单的、极具Python风格的Python库,无需独立的浏览器即可浏览网页。MechanicalSoup -一个与网站自动交互Python库。mechanize -有状态、可编程的Web浏览库。socket – 底层网络接口(stdlib)。Unirest for Python – Unirest是一套可用于多种语言的轻量级的HTTP库。hyper – Python的HTTP/2客户端。PySocks – SocksiPy更新并积极维护的版本,包括错误修复和一些其他的特征。作为socket模块的直接替换。文本处理
用于解析和操作简单文本的库。
difflib – (Python标准库)帮助进行差异化比较。Levenshtein – 快速计算Levenshtein距离和字符串相似度。fuzzywuzzy – 模糊字符串匹配。esmre – 正则表达式加速器。ftfy – 自动整理Unicode文本,减少碎片化。自然语言处理
处理人类语言问题的库。
NLTK -编写Python程序来处理人类语言数据的最好平台。Pattern – Python的网络挖掘模块。他有自然语言处理工具,机器学习以及其它。TextBlob – 为深入自然语言处理任务提供了一致的API。是基于NLTK以及Pattern的巨人之肩上发展的。jieba – 中文分词工具。SnowNLP – 中文文本处理库。loso – 另一个中文分词库。异步
异步网络编程库
asyncio – (在Python 3.4 +版本以上的 Python标准库)异步I/O,时间循环,协同程序和任务。Twisted – 基于事件驱动的网络引擎框架。Tornado – 一个网络框架和异步网络库。pulsar – Python事件驱动的并发框架。diesel – Python的基于绿色事件的I/O框架。gevent – 一个使用greenlet 的基于协程的Python网络库。eventlet – 有WSGI支持的异步框架。Tomorrow – 异步代码的奇妙的修饰语法。队列
celery – 基于分布式消息传递的异步任务队列/作业队列。huey – 小型多线程任务队列。mrq – Mr. Queue – 使用redis & Gevent 的Python分布式工作任务队列。RQ – 基于Redis的轻量级任务队列管理器。simpleq – 一个简单的,可无限扩展,基于Amazon SQS的队列。python-gearman – Gearman的Python API。电子邮件
用来发送和解析电子邮件的库。
django-celery-ses:带有 AWS SES 和 Celery 的 Django email 后端。envelopes:供人类使用的电子邮件库。flanker:一个 email 地址和 Mime 解析库。imbox:Python IMAP 库。inbox.py:Python SMTP 服务器。inbox:一个开源电子邮件工具箱。lamson:Python 风格的 SMTP 应用服务器。mailjet:Mailjet API 实现,用来提供批量发送邮件,统计等功能。marrow.mailer:高性能可扩展邮件分发框架。modoboa:一个邮件托管和管理平台,具有现代的、简约的 Web UI。pyzmail:创建,发送和解析电子邮件。Talon:Mailgun 库,用来抽取信息和签名。yagmail:yagmail是一个GMAIL / SMTP客户端,旨在使其尽可能简单地发送电子邮件。URL 处理
解析 URLs 的库
furl:一个让处理 URL 更简单小型 Python 库。purl:一个简单的,不可变的 URL 类,具有简洁的 API 来进行询问和处理。pyshorteners:一个纯 Python URL 缩短库。shorturl:生成短小 URL 和类似 bit.ly 短链的 Python 实现。webargs:一个解析 HTTP 请求参数的库,内置对流行 web 框架的支持,包括 Flask, Django, Bottle, Tornado 和 Pyramid。不看不知道,一看真的是吓一跳,Python的库真的太多太多了,有感兴趣的小伙伴可以去网上搜索更详细的内容。
Python有很多Web开发框架,大而全的开发框架非Django莫属,用得也最广泛.有很多公司有使用Django框架,如某狐,某讯等。以简洁著称的web.py,flask都非常易于上手,以异步高性能著称的tornado,源代码写得美如画,知乎,Quora都在用。
web开发的一些框架
1、Django
2、Flask
3、Web2py
4、Tornado
5、CherryPy
最后
祝大家学的愉快,学的神速。
有帮助的话,各位小伙伴可以点个赞收藏支持下啦!❤️
也欢迎关煮lili,一个在变秃,但能带你变强的程序员~
今天先说这么多,我是乐字节哩哩,一个有趣的灵魂!下期见!
最后给大家推荐三个b站超详细的Java和python自学课:
从java零基础到项目实战哦【b站BV: BV1CB4y1A7sk】
十大企业级项目自学课-B站:BV14K411F7HJ
python小白入门到精通完整版b站:BV1Sp4y1W77E
将bv号,复制去b站即可
还没有评论,来说两句吧...