2、Minos：一个基于 Tornado/MongoDB/Redis 的区系统

3、tushare：TuShare 是一个免费、开源的 Python 财经数据接口包，TuShare 文档

4、beijing_bus：北京实时公交，可以显示查询的公交到达某站还需多久

5、luokr.com：Python Tornado 写的开源站——螺壳，访问，如图：

6、ssbc：Python Django 写的种子搜索站——手撕包菜，如图：

7、listen1：Listen 1 让你用一个页就能听到多个站的在线音乐，支持各种平台。如图：

8、python-gems：有趣的 Pyhton 代码片段集合

9、algorithm：老齐的 Python 算法教程

10、python-goose：Goose 用于文章提取器，提取中文内容的示例代码：

from goose import Goose
from goose.text import StopWordsChinese
url = ‘http://www.bbc.co.uk/zhongwen/simp/chinese_news/2012/12/121210_hongkong_politics.shtml’
g = Goose({‘stopwords_class’: StopWordsChinese})
article = g.extract(url=url)
print article.cleaned_text[:150]
香港行政长官梁振英在各方压力下就其大宅的违章建筑（僭建）问题到立法会接受质询，并向香港民众道歉。

梁振英在星期二（12月10日）的答问大会开始之际在其演说中道歉，但强调他在违章建筑问题上没有隐瞒的意图和动机。

一些亲北京阵营议员欢迎梁振英道歉，且认为应能获得香港民众接受，但这些议员也质问梁振英有
11、mincss：Python 写的用来找到 CSS 中没有用到的代码片段，并删除。适用于：想要做一个页面，但是不会写 CSS 人。示例代码如下：

#coding:utf-8
#!/usr/bin/env python
from future import print_function
import sys, os
sys.path.insert(0, os.path.abspath(’.’))
from mincss.processor import Processor

这里改成想要参考的页面

URL = ‘http://localhost:9000/page.html’

def run():
p = Processor()
p.process(URL)

if name == ‘main’:
run()
12、KindleEar：这是一个运行在 Google App Engine(GAE) 上的 Kindle 个人推送服务应用，生成排版精美的杂志模式mobi/epub格式自动每天推送至您的 Kindle 或其他邮箱。

14、flask-admin：我工作中需要写一个微型的管理系统，用的就是这个框架。简直快餐型，页面都写好了，只要设置好相关配置就可以跑起来了。唯一缺点就是文档中的例子少，开发一些特定的需求需要自己看源码，才能知道如何改。文档，下面是我跑起来之后的样子：

15、python-sdk：七牛云存储 SDK。我自己在用他家的服务，上手简单、有免费额度，可以用来做‘图床’，同时，有了这个 SDK 可以写一些好用的小工具。注意：图床不能随便用，我曾经就用超了，账户的钱能扣成负数！

16、superset：企业级的数据探索、展示平台。功能很强大，可以用来做数据分析、展示。如下图：

17、flaskbb：基于 Flask 框架做的论坛，功能有限，轻量级的论坛应用在线文档，可以在这个项目上进行二次开发，实现更加复杂的功能。在线预览

18、fuck-login：模拟登录一些知名的站，为了方便爬取需要登录的站。注意：控制爬虫的爬取频率！

19、Young：基于 Tornado 框架、MongoDB 数据库，写的功能丰富的区项目。详细的安装步骤，适合学习如何创建区类 Web App。在线预览，项目运行效果图：

20、textfilter：基于某 1w 词敏感词库，用 Python 实现几种不同的过滤方式。用于过滤敏感词的实用模块，示例代码：

from filter import DFAFilter

gfw = DFAFilter()
gfw.parse(“keywords”)
print “待过滤：售假人民币我操操操”
print “过滤后：”, gfw.filter(“售假人民币我操操操”, “*”)

test_first_character()

运行结果

待过滤：售假人民币我操操操

过滤后：售假币

21、qrcode：Python 写的生成动态、彩色、各式各样的二维码，详细的中文文档，通过 qrcode 生成的二维码样式如下：

22、httpie：非常好用的命令行 HTTP 客户端，cURL 的替代者，返回的结果支持高亮，提高了可读性。用于调试接口、查看服务器返回的 HTTP 协议的信息。在线文档，下面的是 cURL 和 httpie 的返回结果对比图：

23、langid：用于识别输入文本数据所属的语种，目前支持 97 种语言识别。示例代码：

print langid.classify(text1)
print langid.classify(text2)

(‘en’, 0.9999957874458753)

(‘zh’, 1.0)

24、fake-useragent：伪装浏览器身份，常用于爬虫。这个项目的代码很少，可以阅读一下，看看 ua.random 是如何返回随机的浏览器身份的，示例代码：

from fake_useragent import UserAgent
ua = UserAgent()

ua.ie

Mozilla/5.0 (Windows; U; MSIE 9.0; Windows NT 9.0; en-US);

ua.msie

Mozilla/5.0 (compatible; MSIE 10.0; Macintosh; Intel Mac OS X 10_7_3; Trident/6.0)’

ua[‘Internet Explorer’]

Mozilla/5.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; GTB7.4; InfoPath.2; SV1; .NET CLR 3.3.69573; WOW64; en-US)

ua.opera

Opera/9.80 (X11; Linux i686; U; ru) Presto/2.8.131 Version/11.11

ua.chrome

Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.2 (KHTML, like Gecko) Chrome/22.0.1216.0 Safari/537.2’

ua.google

Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_4) AppleWebKit/537.13 (KHTML, like Gecko) Chrome/24.0.1290.1 Safari/537.13

ua[‘google chrome’]

Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11

ua.firefox

Mozilla/5.0 (Windows NT 6.2; Win64; x64; rv:16.0.1) Gecko/20121011 Firefox/16.0.1

ua.ff

Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:15.0) Gecko/20100101 Firefox/15.0.1

ua.safari

Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25

and the best one, random via real world browser usage statistic

ua.random
25、reddit：reddit.com 站的源码，通过这个项目，可以学习 Python 在构建大型项目中的使用、项目结构、代码风格、Python 技巧的使用方法等。安装教程

26、httpstat：httpstat 美化了 curl 的结果，使得结果更加可读。同时它无依赖、兼容 Python3、一共才 300 多行。还可以显示 HTTP 请求的每个过程中消耗的时间，如下图：

27、PyMySQL：纯 Pyton 写的 MySQL 库，纯 Python 的好处就是可以运行在任何装有 Python 解释器（CPython、PyPy、IronPython）的平台上。相对于 MySQLdb 性能几乎一样，使用方法也一样，但是 PyMySQL 安装方法极其简单——pip install PyMySQL，PyMySQL 使用示例代码：

下面为例子需要的数据库的建表语句

CREATE TABLE (
int(11) NOT NULL AUTO_INCREMENT,
varchar(255) COLLATE utf8_bin NOT NULL,
varchar(255) COLLATE utf8_bin NOT NULL,
PRIMARY KEY ()
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin
AUTO_INCREMENT=1 ;

–– coding: utf-8 ––

import pymysql.cursors

连接数据库

connection = pymysql.connect(host=‘localhost’,
user=‘user’,
password=‘passwd’,
db=‘db’,
charset=‘utf8mb4’,
cursorclass=pymysql.cursors.DictCursor)

try:
with connection.cursor() as cursor:
# 创建一个新的纪录（record）
sql = “INSERT INTO (, ) VALUES (%s, %s)”
cursor.execute(sql, (‘webmaster@python.org’, ‘very-secret’))

finally:
connection.close() # 操作完数据库一要记得调用 close 方法，关闭连接
28、flask-limiter：一个 Flask 的扩展库，它可以根据访问者的 IP 限制其访问频率、次数等。示例代码如下：

from flask import Flask
from flask_limiter import Limiter
from flask_limiter.util import get_remote_address

app = Flask(name)
limiter = Limiter(
app,
key_func=get_remote_address,
global_limits=[“2 per minute”, “1 per second”],
)

@app.route(“/slow”)
@limiter.limit(“1 per day”)
def slow():
return “24”

@app.route(“/fast”)
def fast():
return “42”

@app.route(“/ping”)
@limiter.exempt
def ping():
return ‘PONG’

app.run()
29、ngrok：一个十分方便、好用的内穿透工具，它可以把本地某个端口的服务，通过一个安全隧道，映射到公的一个地址。同时它提供了一个 Web 页面，展示了每个请求、响应的所有信息，便于调试本地的程序。基本的使用方法如下：

ngrok 协议本地服务监听的端口
ngrok http 8000

创建成功会返回公地址，然后通过该地址就可以访问到本地的服务。
本地访问 http://localhost:4040，就可以查看关于每个请求、响应的相关数据

30、glances：一个可以让你一目了然你的系统情况（类 (h)top）的工具，它界面友好，安装方便：pip install glances

32、locust：模拟用户行为的负载测试工具，包含友好的 Web 页面，如下图：

33、jumpserver：Jumpserver 是一款由 Python 编写开源的跳板机（是一类可作为跳板批量操作远程设备的络设备）系统，实现了跳板机应有的功能。基于 SSH 协议来管理，客户端无需安装 agent。支持常见 Linux 系统，效果如下：

34、sh：sh 是一个成熟，用于替代 subprocess，它允许你调用任何程序，就像它是一个函数，支持 Python2.6 – 3.5

from sh import ifconfig
print ifconfig(“eth0”)
35、fastText.py：fastText 简而言之，就是把文档中所有词通过 lookup table 变成向量，取平均后直接用线性分类器得到分类结果。fastText 的实现

36、mongoaudit：强大的 MongoDB 渗透测试工具，用于发掘 MongoDB 漏洞、并提出改善方法。

安装：pip install mongoaudit
运行：python mongoaudit
37、mycli：mycli 是一个带语法高亮、自动补全的 MySQL 命令行客户端工具。例如，连接数据库方法：mycli -h localhost -u 用户名数据库

38、python-fire：Fire 是 Google 开源的 Python 库，可自动将您的代码转变成 CLI，无需您做任何额外工作。您不必定义参数，设置帮助信息，或者编写定义代码运行方式的 main 函数。相反，您只需从 main 模块调用“Fire”函数，其余工作全部交由 Python Fire 来完成。示例代码如下：

import fire
class Example(object):
def hello(self, name=‘world’):
“”“Says hello to the specified name.”””
return ‘Hello {name}!’.format(name=name)

def main():
fire.Fire(Example)
if name == ‘main’:
main()

在终端中调用效果如下：

$ ./example.py hello
Hello world!
$ ./example.py hello David
Hello David!
$ ./example.py hello –name=Google
Hello Google!
39、ngxtop：解析 nginx 访问日志并格式化输出有用的信息，可以用来实时了解你的服务器正在发生的情况。安装命令 pip install ngxtop，输出示例如下：

$ ngxtop
running for 411 seconds, 64332 records processed: 156.60 req/sec

Summary:
| count | avg_bytes_sent | 2xx | 3xx | 4xx | 5xx |
|———±—————–±——±——±——±——|
| 64332 | 2775.251 | 61262 | 2994 | 71 | 5 |

Detailed:
| request_path | count | avg_bytes_sent | 2xx | 3xx | 4xx | 5xx |
|——————————————±——–±—————–±——±——±——±——|
| /abc/xyz/xxxx | 20946 | 434.693 | 20935 | 0 | 11 | 0 |
| /xxxxx.json | 5633 | 1483.723 | 5633 | 0 | 0 | 0 |
| /xxxxx/xxx/xxxxxxx | 3624 | 7830.236 | 3621 | 0 | 3 | 0 |
| /static/js/minified/utils.min.js | 3031 | 1781.155 | 2104 | 927 | 0 | 0 |
40、algorithms：基本算法、数据结构的 Python 实现

.
├── array
│ ├── circular_counter.py
│ └── …
├── backtrack
│ ├── anagram.py
│ └── …
├── bfs
│ ├── shortest_distance_from_all_buildings.py
│ └── word_ladder.py
├── bit
│ ├── count_ones.py
│ └── …
│ └── traversal.py
└── 等等
41、searx：分分钟打造一个聚合的搜索引擎，使用简单，部署方便。拓展方便，基于插件式的管理。演示地址

42、grequests：Rquests + Gevent 让异步 HTTP 变得简单、人性化。示例代码：

import grequests
def exception_handler(request, exception):
… print “Request failed”

reqs = [
… grequests.get(‘http://httpbin.org/delay/1’, timeout=0.001),
… grequests.get(‘http://fakedomain/’),
… grequests.get(‘http://httpbin.org/status/500’)]

grequests.map(reqs, exception_handler=exception_handler)
Request failed
Request failed
[None, None, <Response [500]>]
43、explainshell：一个可以解析 Linux 命令的站，它可以给出命令的解释和其参数的解释，例如：ps -aux|grep python，在线演示

44、certbot：免费的自动启用和部署 HTTPS 的工具，让你的站开启 HTTPS 变得简单快捷。在部署教程页面选择服务器的操作系统和 Web 服务器，之后根据给出的步骤一步步的执行命令就行了，部署教程

45、musicbox：基于 Python 编写的易云音乐命令行版本，使用起来简单优雅，能够快速安装及使用

46、django-blog-tutorial：基于最新版 Django 1.10 和 Python 3.5，通过 26 篇教程一步步带你使用 Django 从零开发一个个人博客系统，在实践的同时掌握 Django 的开发技巧，完成效果展示

import asyncio
from aredis import StrictRedis

async def example():
client = StrictRedis(host=‘127.0.0.1’, port=6379, db=0)
await client.flushdb()
await client.set(‘foo’, 1)
assert await client.exists(‘foo’) is True
await client.incr(‘foo’, 100)

loop = asyncio.get_event_loop()
loop.run_until_complete(example())
48、freezegun：时间漫步模块，模拟到某一个时间，使用简单方式多样，实现了装饰器、上下文等调用方式。示例代码如下：

from freezegun import freeze_time
import datetime
import unittest

50、getproxy：极简的抓取代理项目，无需配置。不仅提供了获取代理脚本，同时可以通过该页面，直接获取可用代理（15min 更新、类型包含http和https）

51、syncPlaylist：在易云音乐与 QQ 音乐之间同步歌单。易于使用、配置方便、代码简单，用到的技术：requests + beautifulsoup 以及 selenium + phantomjs

52、GetSubtitles：通过拖曳视频文件进终端，一步下载字幕到视频对应文件夹，并重命名字幕名称为视频名称。Ubuntu 16.04、Windows 10上测试通过，同时兼容 Python2、3。Python 的魅力之一就是可以快速实现一个适合自己的小工具 Cool

53、huey：结合 redis 实现的轻量任务队列，但是支持功能还是很多的：

多进程、多线程、协程
任务定时执行
任务执行失败重试
结果存储
54、simiki：一个简单的个人 Wiki 框架，便于快速搭建 Wiki 页。使用 Markdown 书写 Wiki, 生成静态 HTML 页面。Wiki 源文件按目录分类存放, 方便管理维护。中文文档

55、pyecharts：Echarts+Python 实现的一个用于生成 Echarts 图表的类库

56、proxy_pool：基于 Python 的自建代理 IP 池服务，通过络爬虫抓取互联上免费的代理 IP，本地校验、剔除失效的代理IP，从而实现高可用的代理 IP 池。最后使用 Flask 搭建提供代理 IP 服务，包括代理池刷新、无效代理删除、代理获取等。该项目设计文档详细、模块结构简明易懂，同时适合爬虫新手更好的学习爬虫技术

57、WeiboSpider：分布式微博爬虫，支持快速抓取和稳定抓取两种运行模式。项目模块逻辑清晰、注释丰富、便于定制化自己的需求。同时，对于小白用户，可以通过演示视频快速入门，也提供QQ群答疑，已经持续维护一年多。靠谱的项目，小伙伴们要赶快上车～

58、pygorithm：一个帮助学习主要算法的库，可以通过理解这些算法的实现，提高自己的算法水平。冒泡排序示例：

from pygorithm.sorting import bubble_sort
my_list = [12, 4, 3, 5, 13, 1, 17, 19, 15]
sorted_list = bubble_sort.sort(my_list)
print(sorted_list)
[1, 3, 4, 5, 12, 13, 15, 17, 19]
59、newspaper：强大的提取 Web 的内容、文章的库，支持多种语言，安装命令 pip3 install newspaper3k。示例代码：

from newspaper import Article

url = ‘http://fox13now.com/2013/12/30/new-year-new-laws-obamacare-pot-guns-and-drones/’
article = Article(url)

article.download()

article.html
‘<html itemscope itemtype=”http://…’

article.parse()

article.authors
[‘Leigh Ann Caldwell’, ‘John Honway’]

article.publish_date
datetime.datetime(2013, 12, 30, 0, 0)

article.text
‘Washington (CNN) – Not everyone subscribes to a New Year’s resolution…’

article.top_image
‘http://someCDN.com/blah/blah/blah/file.png’

article.movies
[‘http://youtube.com/path/to/link.com’, …]

from newspaper import Article
url = ‘http://www.bbc.co.uk/zhongwen/simp/chinese_news/2012/12/121210_hongkong_politics.shtml’

a = Article(url, language=‘zh’) # Chinese

a.download()
a.parse()

print(a.text[:150])
香港行政长官梁振英在各方压力下就其大宅的违章建
筑（僭建）问题到立法会接受质询，并向香港民众道歉。
梁振英在星期二（12月10日）的答问大会开始之际
在其演说中道歉，但强调他在违章建筑问题上没有隐瞒的
意图和动机。一些亲北京阵营议员欢迎梁振英道歉，
且认为应能获得香港民众接受，但这些议员也质问梁振英有

print(a.title)
港特首梁振英就住宅违建事件道歉
60、faker：用于生成假数据的库，支持多种语言，你值得拥有。示例代码：

fake.address()

‘辽宁省雪市静安廉街b座 998259’

fake.street_address()

‘巢湖街U座’

fake.building_number()

‘x座’

fake.city_suffix()

‘市’

fake.latitude()

Decimal(’-0.295126’)

fake.province()

‘湖北省’

61、binlog2sql：从 MySQL binlog 解析出你要的 SQL。根据不同选项，提供如下功能

63、pysheeet：Python 速查表，在线阅读

64、robobrowser：提供多种模拟操作页的库，比如获得页内容、访问链接、点击按钮、填充并提交表单、上传文件。使用简单、API 友好。适用于想要通过脚本流程化操作，某些未提供这些操作接口的场景，示例代码如下：

上传文件

from robobrowser import RoboBrowser

Browse to a page with an upload form

browser = RoboBrowser()
browser.open(‘http://cgi-lib.berkeley.edu/ex/fup.html’)

Find the form

upload_form = browser.get_form()
upload_form # <RoboForm upfile=, note=>

Choose a file to upload

upload_form[‘upfile’] # <robobrowser.forms.fields.FileInput…>
upload_form[‘upfile’].value = open(‘path/to/file.txt’, ‘r’)

Submit

browser.submit(upload_form)
65、ItChat：开源的微信个人 SDK，提供了丰富的功能。从而使得 Python 调用微信、发送消息、传输文件等操作只需要编写极少的代码，示例代码如下：

import itchat

itchat.auto_login()

itchat.send(‘Hello, filehelper’, toUserName=‘filehelper’)
66、records：Kenneth Reitz 大神的for Humans列，Records 是一个支持大多数主流关系数据库的原生 SQL 查询第三方库。API 友好，使用简单、支持命令行模式、功能多样。与此同时该库只有 500 行代码，可以当作入门阅读源码的项目，同时学习大神的编程技巧与习惯，示例代码如下：

import records

db = records.Database(‘postgres://…’) # 连接数据库
rows = db.query(‘select * from active_users’) # 执行原生 SQL

遍历结果

for r in rows:
print(r.name, r.user_email)

友好的 print 格式

print(rows.dataset)

username|active|name |user_email |timezone

——–|——|———-|—————–|————————–

model-t |True |Henry Ford|model-t@gmail.com|2016-02-06 22:28:23.894202

支持将结果导出成不同格式

print(rows.export(‘json’)) # json
print(rows.export(‘csv’)) # csv
print(rows.export(‘yaml’)) # yaml
rows.export(‘df’) # pandas 的 df 对象
with open(‘report.xls’, ‘wb’) as f:
f.write(rows.export(‘xls’)) # xls
67、zdict：方便的终端字典工具，支持多种字典和参数、翻译结果高亮、以及交互模式查询。安装命令 pip install zdict（仅支持 Python3）。查询效果如下图所示：

68、joblib：使用 Python 方便的进行并行计算，示例代码如下：

from joblib import Parallel, delayed
from math import sqrt
Parallel(n_jobs=1)(delayed(sqrt)(i2) for i in range(10))
69、tldr-python-client：Linux man 解释一般都太长了，很多时候我们就想用一些比较常用的命令，但却记不起来。这个时候如果不 Google，就可以用 tldr（简化 man 的工程）。该项目为 Python 客户端实现

70、thefuck：在 Linux 命令行中，当你输入的命令有错误后，直接输入 fuck 就可以自动执行修复后的命令，效果图如下：

71、youtube-dl：强大的视频下载工具，支持几百个国内外主流视频站。正如名字一样，最初是为了下载 youtube 上的视频而开发的。如果有国外服务器的朋友，可以充分利用这个工具，下载 youtube 上的视频，速度不要太爽。下面介绍安装、下载视频等命令：

1. 安装命令：sudo pip install youtube-dl

Installing collected packages: youtube-dl
Successfully installed youtube-dl-2017.12.14

2. 查看 URL 支持格式：youtube-dl –list-formats URL

format code extension resolution note
134 mp4 450×360 DASH video 449k , avc1.4d4015, 25fps, video only
17 3gp 176×144 small , mp4v.20.3, mp4a.40.2@ 24k
36 3gp 300×240 small , mp4v.20.3, mp4a.40.2
18 mp4 450×360 medium , avc1.42001E, mp4a.40.2@ 96k
43 webm 640×360 medium , vp8.0, vorbis@128k (best)

3. 选择格式下载视频：youtube-dl -f 18 URL （18为mp4 450×360格式）

[youtube:playlist] Downloading playlist PLF90USSyuoYzPhhFG7XFBRn63Zvs–lNP – add –no-playlist to just download video JyLducMVYVg
[youtube:playlist] PLF90USSyuoYzPhhFG7XFBRn63Zvs–lNP: Downloading webpage
[download] Downloading playlist: 情满四合院完整版
[youtube:playlist] playlist 情满四合院完整版: Downloading 42 videos
[download] Downloading video 1 of 42
…

4. 下载完成后，最后使用 https://github.com/houtianze/bypy 库把下载的视频同步到百度盘上

72、jieba：强大的 Python 分词库，拿来直接用就好。示例代码如下：

encoding=utf-8

import jieba

seg_list = jieba.cut(“我来到北京清华大学”, cut_all=True)
print(“Full Mode: ” + “/ “.join(seg_list)) # 全模式

seg_list = jieba.cut(“我来到北京清华大学”, cut_all=False)
print(“Default Mode: ” + “/ “.join(seg_list)) # 精确模式

seg_list = jieba.cut(“他来到了易杭研大厦”) # 默认是精确模式
print(“, “.join(seg_list))

seg_list = jieba.cut_for_search(“小明硕士毕业于中国科学院计算所，后在日本京都大学深造”) # 搜索引擎模式
print(“, “.join(seg_list))

【全模式】: 我/ 来到/ 北京/ 清华/ 清华大学/ 华大/ 大学

【精确模式】: 我/ 来到/ 北京/ 清华大学

【新词识别】：他, 来到, 了, 易, 杭研, 大厦 (此处，“杭研”并没有在词典中，但是也被Viterbi算法识别出来了)

【搜索引擎模式】：小明, 硕士, 毕业, 于, 中国, 科学, 学院, 科学院, 中国科学院, 计算, 计算所, 后, 在, 日本, 京都, 大学, 日本京都大学, 深造
73、pydu：该库将平时常用的数据结构和工具都收录其中，可供日常开发的使用，同时方便学习与借鉴，丰富的文档能帮助新手更好的理解和使用它。这些实用的模块都是来自于开源项目和贡献者们的智慧，快来加入到这个项目中，让它变得更加实用和丰富

74、shell-functools：把函数式的编程带入 shell，从而让很多事情变得简单。通过 Python 的高阶函数和内置模块 os.path 与命令的管道结合，达到了强大、高效的功效。相比于单纯的命令实现更加的直观和容易理解，示例代码如下：

示例 1

ls 查看当前目录下的文件

ls
document.txt
folder
image.jpg

通过 map abspath 展示这些文件的绝对路径

ls | map abspath
/tmp/demo/document.txt
/tmp/demo/folder
/tmp/demo/image.jpg

示例 2

find 命令找到的文件和目录

find
.
./folder
./folder/me.jpg
./folder/subdirectory
./folder/subdirectory/song.mp3
./document.txt
./image.jpg

把找到的结果中的文件，重命名在末尾追加 .bak （备份文件）

find | filter is_file | map basename | map append “.bak”
me.jpg.bak
song.mp3.bak
document.txt.bak
image.jpg.bak
75、tqdm：强大、快速、易扩展的 Python 进度条库。我想通过下面的示例代码和效果展示图，你会跑去给这个项目来个 Star 的

from tqdm import tqdm
for i in tqdm(range(10000)):
pass

输出结果：

76%|████████████████████████████ | 7568/10000 [00:33<00:10, 229.00it/s]

76、HAipproxy：使用 Scrapy＋Redis 实现的高可用分布式 IP 代理池，为大型分布式爬虫提供高可用低延迟的代理 IP 资源。

from client.py_cli import ProxyFetcher
args = dict(host=‘127.0.0.1’, port=6379, password=‘123456’, db=0)
＃这里的意思是，去和相关的代理ip校验队列中获取ip
＃这么做的原因是同一个代理IP对不同站代理效果不同
fetcher = ProxyFetcher(‘zhihu’, strategy=‘greedy’, redis_args=args)

获取一个可用代理

print(fetcher.get_proxy())

获取可用代理列表

print(fetcher.get_proxies()) # or print(fetcher.pool)
以知乎为目标抓取站，该代理IP池的实际性能测试结果如下：

77、MovieHeavens：基于 Pyqt4 的电影天堂电影搜索工具，再也不用忍受各种广告和点击跳转了

import wechatsogou

ws_api = wechatsogou.WechatSogouAPI()
ws_api.get_gzh_info(‘微信名称’)
79、Synonyms：中文近义词工具包。支持自然语言理解的很多任务：文本对齐、推荐算法、相似度计算、语义偏移、关键字提取、概念提取、自动摘要、搜索引擎等。示例代码如下：

import synonyms
synonyms.seg(“能量”)

80、pook：模拟 HTTP 请求结果的库，可用于单元测试等场景。采用装饰器方式调用的示例代码如下：

import pook
import requests

@pook.get(‘http://httpbin.org/status/500’, reply=204)
@pook.get(‘http://httpbin.org/status/400’, reply=200)
def fetch(url):
return requests.get(url)

res = fetch(‘http://httpbin.org/status/400’)
print(’#1 status:’, res.status_code)

res = fetch(‘http://httpbin.org/status/500’)
print(’#2 status:’, res.status_code)
81、incubator-airflow：定时任务管理平台，管理和调度各种离线定时任务，自带 Web 管理界面。当定时任务量达到百级别的时候，就无法再使用 crontab 有效、方便地管理这些任务了。该项目就是为了解决了这个问题而诞生的

82、wtfpython：有趣、令人惊讶（坑爹）、鲜为人知的 Python 代码片段集合。中文

83、redis-faina：Redis 性能分析器。提供两种模式分析模式：命令实时、读取日志。其原理是使用 Redis MONITOR 命令，将该命令的结果通过管道传递给 redis-faina 脚本，脚本将返回的信息解析，并汇成总成统计信息。具体信息如下所示：

注意：分析非常闲的 redis 实例时，分析的结果可能偏差的很多。
时间单位为微秒：ms = 1.0 × 10^-6 seconds

Overall Stats

总命令数

Lines Processed 10

QPS

Commands/Sec 1.03

出现最多的 key 的前缀

Top Prefixes

startchart 9 (90.00%)

请求最多的key

Top Keys

startchart:521xueweihan/hellogithub 9 (90.00%)

请求最多的命令

Top Commands

get 9 (90.00%)

请求响应时间的分布

Command Time (microsecs)

Median 583914.0
75% 637395.0
90% 5703923.0
99% 5703923.0

总耗时最多的命令

Heaviest Commands (microsecs)

get 9746157.0

慢请求列表

Slowest Calls

5703923.0 “get” “startchart:521xueweihan/hellogithub”
637395.0 “get” “startchart:521xueweihan/hellogithub”
633909.0 “get” “startchart:521xueweihan/hellogithub”
583914.0 “get” “startchart:521xueweihan/hellogithub”
569207.0 “get” “startchart:521xueweihan/hellogithub”
5487

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

Github上有趣的100个python项目