轻松学Pytorch-使用ResNet50实现图像分类

Hello大家好，这篇文章给大家详细介绍一下pytorch中最重要的组件torchvision，它包含了常见的数据集、模型架构与预训练模型权重文件、常见图像变换、计算机视觉任务训练。可以是说是pytorch中非常有用的模型迁移学习神器。本文将会介绍如何使用torchvison的预训练模型ResNet50实现图像分类。

模型

Torchvision.models包里面包含了常见的各种基础模型架构，主要包括：

AlexNet VGG ResNet SqueezeNet DenseNet Inception v3 GoogLeNet ShuffleNet v2 MobileNet v2 ResNeXt Wide ResNet MNASNet

这里我选择了ResNet50，基于ImageNet训练的基础网络来实现图像分类，网络模型下载与加载如下：

model = torchvision.models.resnet50(pretrained=True).eval().cuda()

tf = transforms.Compose([

transforms.Resize(256),

transforms.CenterCrop(224),

transforms.ToTensor(),

transforms.Normalize(

mean=[0.485, 0.456, 0.406],

std=[0.229, 0.224, 0.225]

)])

使用模型实现图像分类

这里首先需要加载ImageNet的分类标签，目的是最后显示分类的文本标签时候使用。然后对输入图像完成预处理，使用ResNet50模型实现分类预测，对预测结果解析之后，显示标签文本，完整的代码演示如下：

 1with open('imagenet_classes.txt') as f:
 2    labels = [line.strip() for line in f.readlines()]
 3
 4src = cv.imread("D:/images/space_shuttle.jpg") # aeroplane.jpg
 5image = cv.resize(src, (224, 224))
 6image = np.float32(image) / 255.0
 7image[:,:,] -= (np.float32(0.485), np.float32(0.456), np.float32(0.406))
 8image[:,:,] /= (np.float32(0.229), np.float32(0.224), np.float32(0.225))
 9image = image.transpose((2, 0, 1))
10input_x = torch.from_numpy(image).unsqueeze(0)
11print(input_x.size())
12pred = model(input_x.cuda())
13pred_index = torch.argmax(pred, 1).cpu().detach().numpy()
14print(pred_index)
15print("current predict class name : %s"%labels[pred_index[0]])
16cv.putText(src, labels[pred_index[0]], (50, 50), cv.FONT_HERSHEY_SIMPLEX, 1.0, (0, 0, 255), 2)
17cv.imshow("input", src)
18cv.waitKey(0)
19cv.destroyAllWindows()

运行结果如下：

q2IFFz6.png!web

转ONNX支持

在torchvision中的模型基本上都可以转换为ONNX格式，而且被OpenCV DNN模块所支持，所以，很方便的可以对torchvision自带的模型转为ONNX，实现OpenCV DNN的调用，首先转为ONNX模型，直接使用torch.onnx.export即可转换(还不知道怎么转，快点看前面的例子)。转换之后使用OpenCV DNN调用的代码如下：

 1with open('imagenet_classes.txt') as f:
 2    labels = [line.strip() for line in f.readlines()]
 3net = cv.dnn.readNetFromONNX("resnet.onnx")
 4src = cv.imread("D:/images/messi.jpg")  # aeroplane.jpg
 5image = cv.resize(src, (224, 224))
 6image = np.float32(image) / 255.0
 7image[:, :, ] -= (np.float32(0.485), np.float32(0.456), np.float32(0.406))
 8image[:, :, ] /= (np.float32(0.229), np.float32(0.224), np.float32(0.225))
 9blob = cv.dnn.blobFromImage(image, 1.0, (224, 224), (0, 0, 0), False)
10net.setInput(blob)
11probs = net.forward()
12index = np.argmax(probs)
13cv.putText(src, labels[index], (50, 50), cv.FONT_HERSHEY_SIMPLEX, 1.0, (0, 0, 255), 2)
14cv.imshow("input", src)
15cv.waitKey(0)
16cv.destroyAllWindows()

运行结果见上图，这里就不再贴了。

✄------------------------------------------------

看到这里，说明你喜欢这篇文章，请点击「在看」或顺手「转发」「点赞」。

欢迎微信搜索「 panchuangxx 」，添加小编磐小小仙微信，每日朋友圈更新一篇高质量推文（无广告），为您提供更多精彩内容。

▼ ▼ 扫描二维码添加小编 ▼ ▼

FRb6fmv.jpg!web

模型

转ONNX支持

Recommend

PyTorch实现经典分类网络 | 鸢尾花开

无需额外数据、Tricks、架构调整，CMU开源首个将ResNet50精度提升至80%+新方法

[PyTorch 学习笔记] 8.1 图像分类简述与 ResNet 源码分析

无需额外数据、Tricks、架构调整，CMU 开源首个提升 ResNet50 精度至 80%+ 新方法

一个使用pytorch的图片分类教程——以明信片分类为例

使用EasyCV Mask2Former轻松实现图像分割

图卷积神经网络分类的pytorch实现 - 颀周

MMClassification 图像分类使用

ResNet50的猫狗分类训练及预测 - Wchime

VGG16 、VGG19 、ResNet50 、Inception V3 、Xception介绍

About Joyk