在PyTorch中,.contiguous()方法的作用是确保张量在内存中是连续存储的。当你对张量执行某些操作,如transpose()、permute()、narrow()、expand()等之后,得到的张量可能不再在内存中连续排列。这些操作通常返回一个张量的视图,它们改变的是数据访问的方式,而不是实际的数据存储方式。
在内存中连续排列的张量有一个特性:对于张量中任意两个相邻的元素,它们在物理内存中的位置也是相邻的。换句话说,张量在物理存储上的排列顺序与在张量形式上的逻辑排列顺序一致。
当调用.contiguous()时,如果张量已经是连续的,这个函数实际上不会做任何事;但如果不是,PyTorch将会重新分配内存并确保张量的数据连续排列。这涉及到复制数据到新的内存区域,并返回一个新的张量,该张量在内存中实际是连续的。
下面是在Python中对.contiguous()的一个简单示例:
import torch # 创建一个非连续张量 x = torch.arange(12).view(3, 4).transpose(0, 1) # 移动维度 print(x.is_contiguous()) # False # 使用 .contiguous() 来确保张量是连续的 y = x.contiguous() print(y.is_contiguous()) # True
当.contiguous()被调用,PyTorch会检查张量的步长(stride)属性。如果发现数据不是连续存储的,则会进行数据的拷贝操作。
在PyTorch的底层C++库中,.contiguous()方法是通过调用Tensor的成员函数contiguous()来实现的。这个函数检查张量是否是非连续的,如果是,则调用clone()方法来创建当前张量数据的副本,然后返回连续排列的新张量。这个副本操作包含显式的内存复制,从原来的张量到一个新连续排列的内存块。
在实践中,为了避免不必要的性能损失,你应该在实际需要连续张量之前避免调用.contiguous(),比如在准备将张量作为神经网络层的输入之前。这是因为某些PyTorch操作要求输入张量在内存中是连续的,比如卷积操作。如果你的张量不是连续的,这些操作在内部会自动调用.contiguous()来确保能够正确进行计算。