PyTorch中基于TPU的FastAI多类图像分类_图像_模子
在本文中,我们将演示最盛行的打算机视觉运用之一-多类图像分类问题,利用fastAI库和TPU作为硬件加速器。TPU,即张量处理单元,可以加速深度学习模型的演习过程。
本文涉及的主题:
多类图像分类常用的图像分类模型利用TPU并在PyTorch中实现多类图像分类我们利用图像分类来识别图像中的工具,并且可以用于检测品牌logo、对工具进行分类等。但是这些办理方案有一个局限性,即只能识别工具,但无法找到工具的位置。但是与目标定位比较,图像分类模型更随意马虎实现。
图像分类的常用模型我们可以利用VGG-16/19,Resnet,Inception v1,v2,v3,Wideresnt,Resnext,DenseNet等,它们是卷积神经网络的高等变体。这些是盛行的图像分类网络,并被用作许多最前辈的目标检测和分割算法的主干。
基于FasAI库和TPU硬件的图像分类我们将在以下方面开展这项事情步骤:
1.选择硬件加速器这里我们利用Google Colab来实现。要在Google Colab中利用TPU,我们须要打开edit选项,然后打开notebook设置,并将硬件加速器变动为TPU。
通过运行下面的代码片段,你可以检讨你的Notebook是否正在利用TPU。
import osassert os.environ['COLAB_TPU_ADDR']Path = 'grpc://'+os.environ['COLAB_TPU_ADDR']print('TPU Address:', Path)
不才面的代码片段中,我们将导入fastAI库。
from fastai.vision import from fastai.metrics import error_rate, accuracy
3.定制数据集
不才面的代码片段中,你还可以考试测验利用自定义数据集。
PATH = '/content/images/dataset'np.random.seed(24)tfms = get_transforms(do_flip=True)data = ImageDataBunch.from_folder(PATH, valid_pct=0.2, ds_tfms=tfms, size=299, bs=16).normalize(imagenet_stats)data.show_batch(rows=4, figsize=(8, 8))
不才面的代码片段中,我们将导入VGG-19 batch_normalisation模型。我们将把它作为fastAI的打算机视觉学习模块的一个实例。
learn = cnn_learner(data, models.vgg19_bn, metrics=accuracy)
不才面的代码片段中,我们考试测验利用一个epoch。
learn.fit_one_cycle(1)
在输出中,我们可以看到我们得到了0.99的准确度,它花了1分2秒。
不才面的代码片段中,我们利用稠浊矩阵显示结果。
con_matrix = ClassificationInterpretation.from_learner(learn)con_matrix.plot_confusion_matrix()
不才面的代码片段中,我们可以通过在test_your_image中给出图像的路径来测试我们自己的图像。
test_your_image='/content/images (3).jpg'test = open_image(test_your_image)test.show()
不才面的代码片段中,我们可以得到输出张量及其所属的类。
learn.predict(test)
正如我们在上面的输出中看到的,模型已经预测了输入图像的类标签,它属于“flower”种别。
结论在上面的演示中,我们利用带TPU的fastAI库和预演习VGG-19模型实现了一个多类的图像分类。在这项任务中,我们在对验证数据集进行分类时得到了0.99的准确率。
本文系作者个人观点,不代表本站立场,转载请注明出处!