Pytorch怎么获取无梯度Tensor中的值？

猿友 2021-07-19 15:16:29 浏览数 (1945)

很多小伙伴在使用两个网络并行计算的时候会出现一些小问题，原因是一个网络的输出值要给另一个网络反馈，而反馈的输出值再有网络权重的梯度，这时候我们就需要给tensor去权重了，那么pytorch怎么获取无梯度tensor呢？接下来小编就来介绍一下小编是怎么做的。

遇到的问题：

使用两个网络并行运算，一个网络的输出值要给另一个网络反馈。而反馈的输出值带有网络权重的梯度，即grad_fn=<XXXBackward0>.

这时候如果把反馈值扔到第二网络中更新，会出现第一个计算图丢失无法更新的错误。哎哟喂，我根本不需要第一个网络的梯度好吗？

一开始用了一个笨办法，先转numpy，然后再转回torch.Tensor。因为numpy数据是不带梯度的。

但是我的原始tensor的放在cuda上的，

cuda的张量是不能直接转Tensor，所以

t_error = td_error.cuda().data.cpu().numpy()
t_error = torch.FloatTensor(t_error).to(device)

从cuda转回了cpu，变成numpy，又转成了tensor，又回到了cuda上，坑爹呢这是，可能只有我才能写出如此低效的辣鸡代码了。

后来发现，其实直接在返回的时候添加

with torch.no_grad():
 td_error = reward + GAMMA * v_ - v

即可.

补充：在pytorch中取一个tensor的均值，然后该张量中的所有值与其对比！

Pytorch中的Tensor的shape是(B, C, W, H)，

对该tensor取均值并与所有值做对比代码如下：

C, H, W = tensor.shape[1], tensor.shape[2], tensor.shape[3]
for c in range(C):
 mean = torch.mean(x[0][c])
 for h in range(H):
  for w in range(W):
  if x[0][c][h][w] >= mean:
  x[0][c][h][w] = mean

小结

以上就是pytorch怎么获取无梯度Tensor的全部内容，希望能给大家一个参考，也希望大家多多支持W3Cschool。