Python 第三方库、模块安装和卸载方法以及国内镜像 您所在的位置:网站首页 pypi镜像源 Python 第三方库、模块安装和卸载方法以及国内镜像

Python 第三方库、模块安装和卸载方法以及国内镜像

2023-04-01 19:30| 来源: 网络整理| 查看: 265

写在前面,本来第三方库和模块的安装是后期熟悉了 Python 之后才需要知道的,不过看到有人私信问我一些第三方发行版本的安装问题。我没有用过第三方发行版本,我直接学的 Python 原版的安装和使用,其实跟原版 Python 的区别在于,第三方开发版集成了一些第三方库和工具。

关于 Python 安装和配置,点击:Python 图文安装教程

所以下面我介绍一下第三方库和模块的安装方法,如果你不知道这是什么,可以先收藏本文和关注本公众号 逍遥乱弹,后面学到了再来看也可以的。

我们都知道Python有很多第三方开发的库或者模块,非常好用,这里收集一些可能用到的第三方模块、官方网站和安装命令。注意你不需要安装所有的第三方库,用到哪个安装哪个就可以。

安装和卸载 Python 第三方库的命令

安装和卸载 Python 第三方库非常简单,只需要在命令行里输入下面命令就可以了,下面先看一下相关命令,后面会有演示。

安装第三方库的命令:

pip install 库名

如果是Mac或者Linux操作系统的话,是:

pip3 install 库名

下面都以Windows操作系统为例,其他系统把 pip 替换成 pip3 就可以了。

卸载第三方库:

pip uninstall 库名

查看安装了哪些第三方库:

pip list

如果你在运行这些命令的时候,提示下面橘色警告:

WARNING: You are using pip version 20.1.1; however, version 20.2.2 is available.

意思就是你的 pip 版本比较低,需要升级了。

升级 pip 的命令也非常简单,直接在命令行里输入:

pip install --upgrade pip

Python 国内镜像和源

安装第三方模块或者库的时候,因为Python服务器在国外,所以有时候特别慢导致安装失败,所以可以使用国内的镜像(源)。

下面先列出常用的Python国内镜像,后面说一下使用的方法:

豆瓣

https://pypi.douban.com/simple

阿里云

https://mirrors.aliyun.com/pypi/simple/

如果是教育网可以使用一些知名大学的源:

清华大学的镜像

https://pypi.tuna.tsinghua.edu.cn/simple

中国科技大学的镜像

https://pypi.mirrors.ustc.edu.cn/simple

使用方法直接在pip命令后面空格加 -i https://pypi.douban.com/simple 就可以了,下面默认都加上了豆瓣的镜像,当然你也可以用同样的办法使用其他的镜像也是可以的。

pip install 库名 -i https://pypi.douban.com/simple

办公相关的第三方库

openpyxl 模块

用来处理 Excel 表格(xlsx格式)官方文档:

https://openpyxl.readthedocs.io/en/stable/

pip install openpyxl

如果安装失败,可以使用上面的第三方镜像,命令是这样的:

pip install openpyxl -i https://pypi.douban.com/simple

pypdf2 模块可以读取、写入、分割、合并PDF文件

官方文档:

https://pythonhosted.org/PyPDF2/

pip install pypdf2 -i https://pypi.douban.com/simple

pdfplumber 模块可以更好读取PDF内容可以提取PDF中的表格

官方文档:

https://github.com/jsvine/pdfplumber

pip install pdfplumber -i https://pypi.douban.com/simple

python-docx 模块可以创建和修改docx格式的Word文档在程序中导入本模块跟名称不一样,直接导入docx

import docx

官方文档:

https://python-docx.readthedocs.io/en/latest/

pip install python-docx -i https://pypi.douban.com/simple

python-pptx 模块可以创建和修改pptx格式的PPT文档导入模块

import pptx

官方文档:

https://python-pptx.readthedocs.io/en/latest/

pip install python-pptx -i https://pypi.douban.com/simple

收发邮件相关的第三方库

yagmail 模块全称 Yet Another Gmail/SMTP Client一个非常方便的SMTP包,超简单的Python发邮件模块

官方文档:

https://github.com/kootenpv/yagmail

pip install yagmail -i https://pypi.douban.com/simple

imbox 模块简易的Python IMAP包进行IMAP收发邮件等相关操作

官方文档:

https://github.com/martinrusev/imbox

pip install imbox -i https://pypi.douban.com/simple

keyring 模块从Python访问系统密钥环服务方便、安全的存储你的密码

官方文档:

https://github.com/jaraco/keyring

pip install keyring -i https://pypi.douban.com/simple

schedule 模块定时任务执行器

官方文档:

https://schedule.readthedocs.io/en/latest/

pip install schedule -i https://pypi.douban.com/simple

PS.多个库可以一次性安装,可以用像下面这样写,可以把上面提到的所有模块一次性安装了:

pip install openpyxl pypdf2 pdfplumber python-docx python-pptx yagmail imbox keyring schedule -i https://pypi.douban.com/simple

注意:如果提示 Requirement already satisfied,指的是已经安装过了。

pip 版本升级

如果提示 pip 的版本比较老,比如上图黄色的字就是需要升级,同样可以加上豆瓣的镜像(这个命令跟文章开头的命令是一样的效果):

python -m pip install --upgrade pip -i https://pypi.douban.com/simple

爬虫相关的第三方库

requests 模块

非常简单的爬虫利器

官方文档:

https://2.python-requests.org/en/master/

pip install requests -i https://pypi.douban.com/simple

Beautiful Soup 库

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库。注意最新的版本是 BS4。

导入模块比较特殊:

from bs4 import BeautifulSoup

官方文档:

https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/

pip install beautifulsoup4 -i https://pypi.douban.com/simple

lxml 解析器

一个第三方HTML解析器,BS4 提取了数据之后,除了可以用 Python 标准库里的解析器之外,也可以使用 lxml 解析器,它的优点就是速度快,效率高,推荐使用。

官方文档:

https://lxml.de/

pip install lxml -i https://pypi.douban.com/simple

html5lib 解析器纯Python实现的 html5lib ,以浏览器的方式解析文档,容错最好,但是速度慢。

官方文档:

https://github.com/html5lib/

pip install html5lib -i https://pypi.douban.com/simple

同理,批量安装上面几个关于爬虫的库,可以用下面命令:

pip install requests beautifulsoup4 lxml html5lib -i https://pypi.douban.com/simple

Scrapy 框架

功能很强大的爬虫框架

官方文档:

https://docs.scrapy.org/en/latest/

https://scrapy-chs.readthedocs.io/zh_CN/latest/intro/overview.html

pip install scrapy -i https://pypi.douban.com/simple

不过很有可能会安装 Scrapy 失败。

如果 Scrapy 安装失败的话,一般出现错误的都是 Twised 安装失败,提示:Running setup.py install for Twisted ... error

那么我们可以手动下载 Twisted 再安装。

下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

根据自己 Python 版本下载对应版本安装(如果你的Python是最新的,选择最新版就可以了)

然后命令行进入刚才这个文件的下载目录,然后运行下面命令进行安装。

pip install Twisted-19.10.0-cp38-cp38-win_amd64.whl

其中 Twisted-19.10.0-cp38-cp38-win_amd64.whl 是你下载的文件名。

成功安装Twisted之后,再运行pip命令安装 Scrapy,就可以安装成功了。

Selenium 库

Selenium 是一个用于 Web 应用程序测试的工具。

官方网站:https://selenium.dev/

官方文档:

https://selenium-python.readthedocs.io/index.html

pip install selenium -i https://pypi.douban.com/simple

使用 Selenium 需要下载 ChromeDriver,可以从淘宝提供的镜像里下载:

http://npm.taobao.org/mirrors/chromedriver/

PyQuery 解析器

也是对抓取的信息进行解析的工具

pip install pyquery -i https://pypi.douban.com/simples

数据分析相关第三方库

Numpy 模块

Numpy 是一个比较底层的数据分析模块,具有高性能、开源、数组运算、读取迅速等优势。

pip install numpy -i https://pypi.douban.com/simple

引入,一般我们引入的时候会给这个模块起一个别名 np

import numpy as np

Pandas 模块

Pandas 数据结构非常快速高效、数据处理功能比较智能、文件存储功能非常方便、科研和商业应用很广泛。

pip install pandas -i https://pypi.douban.com/simple

导入 Pandas 模块,同样起一个别名pd,方便后面使用

import pandas as pd

xlrd 模块

Pandas 可以使用 xlrd 模块来读写 Excel 文件(.xlsx)

pip install xlrd -i https://pypi.douban.com/simple

其他第三方库:

pip install IPython -i https://pypi.douban.com/simplepip install urllib3 -i https://pypi.douban.com/simplepip install jupyter -i https://pypi.douban.com/simplepip install matplotlib -i https://pypi.douban.com/simplepip install scipy -i https://pypi.douban.com/simplepip install scikit-learn -i https://pypi.douban.com/simple

关注我的公众号 逍遥乱弹,然后点击菜单 Python 就可以查看我所有的 Python 学习日志了。

后面我会继续分享 Python 基础知识,以及这些第三方库的使用。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有