跟支票打交道的CNN——LeNet-5
发布日期:2021-05-08 02:51:21 浏览次数:23 分类:精选文章

本文共 697 字,大约阅读时间需要 2 分钟。

LeNet-5是由Yann LeCun在1998年提出的一个经典卷积神经网络(CNN),用于手写数字识别。它是早期卷积神经网络中最具代表性的实验系统之一,曾被美国大多数银行用于识别支票上的手写数字。

结构简介

LeNet-5包含七层,输入图片为32×32像素(经过padding处理后为28×28),相当于1024个神经元。其结构包括卷积层、池化层、卷积层、池化层、卷积层、全连接层和输出层。

层次结构

  • C1层:卷积层,6个5×5卷积核,输出特征图为28×28,共784个神经元。
  • S2层:最大池化层,输出6张14×14的特征图。
  • C3层:卷积层,16个5×5卷积核,输出10×10特征图。
  • S4层:最大池化层,输出16张5×5特征图。
  • C5层:卷积层/全连接层,输出120个特征图。
  • F6层:全连接层,84个节点。
  • 输出层:全连接层,使用Softmax函数分类输出数字0-9。
  • 概念解释

  • 卷积核:CNN中的卷积核是未知的,需要通过训练学习,类似于机器学习中的权值参数。
  • 池化方式:常用最大值池化,通过降低维度减少计算量。
  • 特征图:CNN中的每张图片都称为特征图,用于传递到下一层。
  • 神经网络:由多个神经元组成,通过权值和偏置计算输出值,激活函数(如Sigmoid和tanh)用于非线性变换。
  • 基本思想

  • 前向传播:预测分类结果。
  • 反向传播:通过计算损失函数的梯度调整权值和偏置,以最小化损失。
  • 损失函数:常用均方误差或交叉熵损失。
  • 梯度下降:通过参数更新规则优化模型。
  • LeNet-5的设计体现了CNN在图像识别中的核心思想:通过局部感受野和共享权值,有效降低训练参数数量,同时保持高识别性能。

    上一篇:Lionheart万汇:如何将SMA、EMA、MACD运用到你的交易策略当中(一)
    下一篇:Lionheart万汇:台积电大幅提升资本开支,2021有望续创辉煌

    发表评论

    最新留言

    表示我来过!
    [***.240.166.169]2025年04月06日 06时20分06秒