使用tensorflow_datasets.load(TF 2.1)拆分训练数据以进行训练和验证 - python

我正在尝试运行以下Colab项目,但是当我想将训练数据分为验证和训练部分时,出现此错误:

KeyError: "Invalid split train[:70%]. Available splits are: ['train']"

我使用以下代码:

(training_set, validation_set), dataset_info = tfds.load(
'tf_flowers',
split=['train[:70%]', 'train[70%:]'],
with_info=True,
as_supervised=True,
)

如何解决此错误?

参考方案

根据Tensorflow Dataset docs,百分比拆分是可能的,例如e。 G。 first_10_percent = tfds.Split.TRAIN.subsplit(tfds.percent[:10])

如示例所示,更改split列表时,您的代码将起作用:

(training_set, validation_set), dataset_info = tfds.load(
'tf_flowers',
split=[
       tfds.Split.TRAIN.subsplit(tfds.percent[:70]),
       tfds.Split.TRAIN.subsplit(tfds.percent[70:])
],
with_info=True,
as_supervised=True,
)

使用上面的代码,training_set具有2590个条目,而validation_set具有1080个条目。

TensorFlow操作,在官方API中找不到 - python

最近,我尝试重复学习Nvidia在GitHub上发布的代码-progressive_growing_of_gans。但是,我发现以下几种基于官方API找不到的操作参考。feed_dict = {} setter = tf.assign(var, tf.placeholder(var.dtype, var.shape, 'new_value'…

使用TensorFlow Dataset API和flat_map的并行线程 - python

我正在将TensorFlow代码从旧队列界面更改为新的Dataset API。使用旧的接口,我可以为num_threads队列指定tf.train.shuffle_batch参数。但是,控制Dataset API中线程数量的唯一方法似乎是使用map参数在num_parallel_calls函数中。但是,我改用flat_map函数,该函数没有这样的参数。问:是…

使用Tensorflow 2.0-AMI设置AWS EC2实例还是自己构建它? - python

我需要使用Tensorflow 2.0设置一个AWS EC2 GPU实例。我看到的所有文档都表明当前的AWS AMI映像仅支持Tensorflow 1.14或1.15,但不支持Tensorflow 2.0。因此,我想知道在AWS实例上获取Tensorflow-gpu 2.0的最佳方法是什么。我可以创建一个EC2 GPU实例,安装Nvidia驱动程序,然后使用…

Python sqlite3数据库已锁定 - python

我在Windows上使用Python 3和sqlite3。我正在开发一个使用数据库存储联系人的小型应用程序。我注意到,如果应用程序被强制关闭(通过错误或通过任务管理器结束),则会收到sqlite3错误(sqlite3.OperationalError:数据库已锁定)。我想这是因为在应用程序关闭之前,我没有正确关闭数据库连接。我已经试过了: connectio…

python-docx应该在空单元格已满时返回空单元格 - python

我试图遍历文档中的所有表并从中提取文本。作为中间步骤,我只是尝试将文本打印到控制台。我在类似的帖子中已经看过scanny提供的其他代码,但是由于某种原因,它并没有提供我正在解析的文档的预期输出可以在https://www.ontario.ca/laws/regulation/140300中找到该文档from docx import Document from…