1.3.2 Anaconda

使用Python完成数据科学任务的主要缺点之一是需要安装的库数量太多。另外,在提供部署模型的实例时,你需要安装运行程序所需的所有库,如果要将程序部署到不同的平台和操作系统,这可能会产生问题。

幸运的是,venv有一些替代品,其中之一就是Anaconda,它是一个用于数据科学和机器学习的免费开源Python发行版,旨在简化软件包的管理和部署。Anaconda的软件包管理器称为conda,它可以安装、运行和更新软件包及其依赖项。

包含主库的一个子集的较小conda版称为miniconda。在仅需要主库时,使用此版本非常方便,因为它比发行版小,安装时间短。

要以自动化方式创建环境,必须像创建venv一样创建依赖关系列表。conda与pip格式兼容,但它也支持更具表现力的YAML格式。让我们通过以下步骤来看看这是如何做到的:

1)例如,我们用以下方式创建一个名为dl.yaml的文件。

2)将dl.yaml放置在你选择的目录中,然后在终端文件的相同位置输入以下命令。

3)现在需要激活。安装后,只要输入activate就可以随时激活。

现在,所有Python调用都将定向到我们创建的conda虚拟环境中的Python。