首先我们要知道,图像在计算机里是以数字的形式存在的,主流的图像处理框架在读取图像之后,都是以矩阵来表达。比如一张300×300像素的RGB图片,在程序中就是一个三维数组,size为300x300x3,前两个是高和宽,最后一个是RGB的三个通道。对于以往的传统机器视觉来说,对图像数组应用各种矩阵操作就可以得到想要的结果。
卷积和池化到底在做什么?
未经允许不得转载:小健博客 » 卷积和池化到底在做什么?
首先我们要知道,图像在计算机里是以数字的形式存在的,主流的图像处理框架在读取图像之后,都是以矩阵来表达。比如一张300×300像素的RGB图片,在程序中就是一个三维数组,size为300x300x3,前两个是高和宽,最后一个是RGB的三个通道。对于以往的传统机器视觉来说,对图像数组应用各种矩阵操作就可以得到想要的结果。