跟支票打交道的CNN——LeNet-5-白红宇的个人博客

跟支票打交道的CNN——LeNet-5

发布日期：2021-05-08 02:51:21 浏览次数：23 分类：精选文章

本文共 697 字，大约阅读时间需要 2 分钟。

LeNet-5是由Yann LeCun在1998年提出的一个经典卷积神经网络（CNN），用于手写数字识别。它是早期卷积神经网络中最具代表性的实验系统之一，曾被美国大多数银行用于识别支票上的手写数字。

LeNet-5包含七层，输入图片为32×32像素（经过padding处理后为28×28），相当于1024个神经元。其结构包括卷积层、池化层、卷积层、池化层、卷积层、全连接层和输出层。

C1层：卷积层，6个5×5卷积核，输出特征图为28×28，共784个神经元。

S2层：最大池化层，输出6张14×14的特征图。

C3层：卷积层，16个5×5卷积核，输出10×10特征图。

S4层：最大池化层，输出16张5×5特征图。

C5层：卷积层/全连接层，输出120个特征图。

F6层：全连接层，84个节点。

输出层：全连接层，使用Softmax函数分类输出数字0-9。

卷积核：CNN中的卷积核是未知的，需要通过训练学习，类似于机器学习中的权值参数。

池化方式：常用最大值池化，通过降低维度减少计算量。

特征图：CNN中的每张图片都称为特征图，用于传递到下一层。

神经网络：由多个神经元组成，通过权值和偏置计算输出值，激活函数（如Sigmoid和tanh）用于非线性变换。

前向传播：预测分类结果。

反向传播：通过计算损失函数的梯度调整权值和偏置，以最小化损失。

损失函数：常用均方误差或交叉熵损失。

梯度下降：通过参数更新规则优化模型。

LeNet-5的设计体现了CNN在图像识别中的核心思想：通过局部感受野和共享权值，有效降低训练参数数量，同时保持高识别性能。

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！