使用Tensorflow 2.0-AMI设置AWS EC2实例还是自己构建它? - python

我需要使用Tensorflow 2.0设置一个AWS EC2 GPU实例。我看到的所有文档都表明当前的AWS AMI映像仅支持Tensorflow 1.14或1.15,但不支持Tensorflow 2.0。因此,我想知道在AWS实例上获取Tensorflow-gpu 2.0的最佳方法是什么。

我可以创建一个EC2 GPU实例,安装Nvidia驱动程序,然后使用nvidia-dockerTensorflow 2.0.安装docker实例,或者仅使用Tensorflow 1.14安装AWS AMI映像然后升级到Tensorflow 2.0会更容易吗?尚不清楚哪种方法更有意义。

欢迎大家提出意见。

python大神给出的解决方案

所以我经历了两条路线。现在我要说的是,用Tensorflow 2.0设置docker容器比从AMI映像构建要容易。

对于docker路由,您可以使用GPU启动Ubuntu 18.04实例。然后,您必须执行以下步骤。现在,我列出了基本步骤,但没有详细介绍。但是希望这足以帮助某人入门。

启动实例并安装docker-ce软件。确保网络端口8888可用于传入连接。
为特定的GPU实例安装nvidia驱动程序:https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/install-nvidia-driver.html
从Nvidia github存储库安装nvidia-docker软件。这将使Docker映像能够访问EC2实例上的GPU驱动程序。
使用以下命令下载并运行tensorflow 2.0容器:
docker run -it --gpus all --rm -v $(realpath ~/Downloads):/tf/notebooks -p 8888:8888 tensorflow/tensorflow:2.0.0-gpu-py3-jupyter

这应该启动一个笔记本,用户可以从他们的计算机访问它。

如果要通过AMI映像执行此操作,则基本上必须安装Tensorflow 1.14映像,然后对其进行升级。这实际上比看起来难。同样,这是这些步骤的简要概述,但是我尝试尽可能地包括链接或代码。

在服务器(25.2)上设置ubuntu 18.04深度学习AMI。
更新和升级ubuntu:

    sudo apt-get update
    sudo apt-get upgrade

由于当前发行版使用程序包管理器的代理版本,请更新Anaconda发行版。

conda update conda
conda update --all

创建一个tensorflow 2.0 conda环境

conda create -n tf2 python=3.7 tensorflow-gpu==2.0 cudatoolkit cudnn jupyter

在外壳中初始化conda。您必须执行此操作才能使用shell中的conda命令。您可能需要退出该实例,然后再回切到该实例中。

conda init bash
bash

安装environment_kernels软件包

pip install environment_kernels

安装jupyter笔记本扩展

conda install -c conda-forge jupyter_contrib_nbextensions

在实例上安装Jupyter服务器。请按照链接上的说明进行操作:https://docs.aws.amazon.com/dlami/latest/devguide/setup-jupyter-config.html
ssh进入实例并启动Jupyter服务器。

ssh -N -f -L 8888:localhost:8888 ubuntu@aws-public-url

打开计算机上的浏览器,然后浏览到该服务器的公共URL:8888。

因此,在亚马逊发布Tensorflow 2.0 AMI之前,我会说使用第一种方法而不是第二种方法。

用大写字母拆分字符串,但忽略AAA Python Regex - python

我的正则表达式:vendor = "MyNameIsJoe. I'mWorkerInAAAinc." ven = re.split(r'(?<=[a-z])[A-Z]|[A-Z](?=[a-z])', vendor) 以大写字母分割字符串,例如:'我的名字是乔。 I'mWorkerInAAAinc”变成…

子条件的python条件覆盖 - python

我试图找到一个python代码覆盖率工具,该工具可以衡量语句中是否包含子表达式:例如,我想看看下面的示例是否涵盖了condition1 / condition2 / condtion3?if condition1 or condition2 or condition3: x = true_value python大神给出的解决方案 对此的唯一合理答案是:当前…

USB设备发行 - python

我目前正在使用PyUSB。由于我不熟悉USB,所以我不知道如何执行以下操作。我已经从Python PyUSB成功连接到我的USB设备硬件。在代码中,我需要重置USB设备硬件。通过向硬件发送命令来完成。现在,在硬件重置后,我想从Python PyUSB释放当前的USB设备。然后,我想在重置后将其重新连接到USB设备硬件。请让我知道,如何释放USB设备连接和接口…

Python-熊猫描述了抛出错误:无法散列的类型“ dict” - python

更新:我正在使用“ Socrata开源API”中的一些示例代码。我在代码中注意到以下注释:# First 2000 results, returned as JSON from API / converted to Python # list of dictionaries by sodapy. 我不熟悉JSON。我已经下载了一个数据集,并创建了一个包含大量…

keras中的自定义RMSPE损失函数 - python

我正在尝试在keras中定义我自己的损失函数,即均方根百分比误差。 RMSPE定义为:我已经将损失函数定义为:from keras import backend as K def rmspe(y_true, y_pred): sum = K.sqrt(K.mean(K.square( (y_true - y_pred) / K.clip(K.abs(y_tr…