随着深度学习算法的兴起和普及,人工智能领域取得了令人瞩目的进展,尤其是在计算机视觉领域。 21 世纪的第二个十年见证了卷积神经网络的迅速采用、最先进算法的发明、海量训练数据的可用性以及高性能和成本效益计算的发明。 计算机视觉的关键概念之一是图像分类。 这是软件系统正确标记图像中主要对象的能力。 由当前最先进的算法驱动的系统在识别图像中的物体方面已经超越了人类的能力,这项技术正被科技巨头、大型企业和政府广泛用于智能应用、网站、天气、研究、 监视等等。
本文使用识别图片的是imageai,一个开源 python 库,旨在使开发人员能够使用简单的几行代码来构建具有自包含深度学习和计算机视觉功能的应用程序和系统。github地址:https://github.com/OlafenwaMoses/ImageAI
一、安装相关依赖
pip install tensorflow==2.4.0
pip install imageai --upgrade
二、下载模型
https://github.com/OlafenwaMoses/ImageAI/releases/download/essentials-v5/resnet50_imagenet_tf.2.0.h5/
三、运行代码
from imageai.Classification import ImageClassification import os execution_path = os.getcwd() print(execution_path) prediction = ImageClassification() prediction.setModelTypeAsResNet50() prediction.setModelPath( execution_path + "\\resnet50_imagenet_tf.2.0.h5") prediction.loadModel() predictions, percentage_probabilities = prediction.classifyImage("C:\\Users\\Kevin\\Downloads\\sample.jpg", result_count=5) for index in range(len(predictions)): print(predictions[index] , " : " , percentage_probabilities[index])
四、成果展示
五、效果检测
(一)
这个结果为:
china_cabinet : 52.015215158462524
dining_table : 6.917249411344528
sliding_door : 5.515669286251068
shower_curtain : 3.3443160355091095
washbasin : 2.956695295870304
(二)
结果为:
steel_arch_bridge : 85.26373505592346
suspension_bridge : 8.433160185813904
pier : 3.5338036715984344
fountain : 2.5331469252705574
organ : 0.14364809030666947
(三)
结果为:
walking_stick : 12.551949918270111
bow : 9.904763102531433
palace : 6.482072174549103
shield : 5.560542643070221
mantis : 5.26958592236042
这个变成手杖,拐棍,就有点离谱了。
参考:https://guymodscientist.medium.com/image-prediction-with-10-lines-of-code-3266f4039c7a