
跟支票打交道的CNN——LeNet-5
C1层:卷积层,6个5×5卷积核,输出特征图为28×28,共784个神经元。 S2层:最大池化层,输出6张14×14的特征图。 C3层:卷积层,16个5×5卷积核,输出10×10特征图。 S4层:最大池化层,输出16张5×5特征图。 C5层:卷积层/全连接层,输出120个特征图。 F6层:全连接层,84个节点。 输出层:全连接层,使用Softmax函数分类输出数字0-9。 卷积核:CNN中的卷积核是未知的,需要通过训练学习,类似于机器学习中的权值参数。 池化方式:常用最大值池化,通过降低维度减少计算量。 特征图:CNN中的每张图片都称为特征图,用于传递到下一层。 神经网络:由多个神经元组成,通过权值和偏置计算输出值,激活函数(如Sigmoid和tanh)用于非线性变换。 前向传播:预测分类结果。 反向传播:通过计算损失函数的梯度调整权值和偏置,以最小化损失。 损失函数:常用均方误差或交叉熵损失。 梯度下降:通过参数更新规则优化模型。
发布日期:2021-05-08 02:51:21
浏览次数:23
分类:精选文章
本文共 697 字,大约阅读时间需要 2 分钟。
LeNet-5是由Yann LeCun在1998年提出的一个经典卷积神经网络(CNN),用于手写数字识别。它是早期卷积神经网络中最具代表性的实验系统之一,曾被美国大多数银行用于识别支票上的手写数字。
结构简介
LeNet-5包含七层,输入图片为32×32像素(经过padding处理后为28×28),相当于1024个神经元。其结构包括卷积层、池化层、卷积层、池化层、卷积层、全连接层和输出层。
层次结构
概念解释
基本思想
LeNet-5的设计体现了CNN在图像识别中的核心思想:通过局部感受野和共享权值,有效降低训练参数数量,同时保持高识别性能。
发表评论
最新留言
表示我来过!
[***.240.166.169]2025年04月06日 06时20分06秒
关于作者

喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
Postgresql 日期和时间类型
2019-03-05
xmin、xmax、cmin、cmax
2019-03-05
《卸甲笔记》-PostgreSQL和Oracle的数据类型的对比系列五:其它类型
2019-03-05
查询某表格上次进行vacuum的时间
2019-03-05
Failed to execute vcredist_x64.exe
2019-03-05
invalid byte sequence for encoding
2019-03-05
Centos7.0系统上使用yum安装相关包时出现KeyboardInterrupt错误
2019-03-05
Highgo Database故障收集脚本
2019-03-05
PostgreSQL中的隐式连接和显式连接
2019-03-05
failed to initialize the database
2019-03-05
Failed to execute vcredist_x64.exe
2019-03-05
invalid byte sequence for encoding
2019-03-05
银河麒麟系统配置apt网络源
2019-03-05
unity3d-学习笔记13-卡牌游戏制作(部分功能的优化)
2019-03-05
最小生成树——Kruskal
2019-03-05
Linux内核结构粗解及关于 shell 通俗理解
2019-03-05
第七周 4.12-4.18
2019-03-05
程序设计入门14 结构体
2019-03-05
程序设计基础75 tips 广度搜索细节问题
2019-03-05
笨办法学python之数据类型
2019-03-05