Variable变量-白红宇的个人博客

Variable变量

发布日期：2021-05-20 07:44:02 浏览次数：18 分类：精选文章

本文共 766 字，大约阅读时间需要 2 分钟。

PyTorch中的Variable和Tensor虽然在本质上没有区别，但在使用时有一些关键区别，主要体现在梯度计算方面。Variable是一种更高层次的对象，可以在计算图中进行前向传播和反向传播，自动进行梯度计算。

创建Variable的过程非常简单。例如，可以使用Variable(a, required_grad=True)将一个Tensor转换为Variable。这里的required_grad=True意味着这个Variable在反向传播时需要计算梯度，默认情况下这个参数是False。

在创建了这些Variable后，可以通过y = w * x * b构建计算图。这里，w、x、b都是Variable，通过乘法和加法操作连接起来。例如，y的计算可以表示为y = 2x + 3。

执行反向传播时，使用y.backward()函数。这个函数会自动计算出所有依赖x、w和b的Variable的梯度，并通过x.grad、w.grad和b.grad来获取这些梯度。

需要注意的是，当对多个输入求导时，如传入一个向量 [1, 0.1, 0.01]，需要明确标识每个输入的位置。例如，使用y.backward(torch.FloatTensor([1, 0.1, 0.01]))时，会分别为x的每个元素计算梯度。

通过print(x.grad)可以看到x的梯度，print(w.grad)可以看到w的梯度，最后print(b.grad)可以看到b的梯度。

这种方式不仅适用于标量参数，还能处理向量或矩阵参数。例如，创建一个requires_grad的x，然后计算其乘以2的结果，再对这个结果进行标量或向量求导。

总之，PyTorch的Variable使得梯度计算变得简单自动，无需手动管理导数链式法则，极大提升了计算效率和代码简洁度。

上一篇：C++中的数学函数汇总

下一篇：Python 代码占多行

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！