matmul

paddle.sparse. matmul ( x, y, name=None ) [源代码]

注解

该 API 从 CUDA 11.0 开始支持。

对输入 x 与输入 y 求稀疏矩阵乘法,x 为稀疏 Tensor, y 可为稀疏 Tensor 或稠密 Tensor。

输入、输出的格式对应关系如下:

注解

x[SparseCsrTensor] @ y[SparseCsrTensor] -> out[SparseCsrTensor]

x[SparseCsrTensor] @ y[DenseTensor] -> out[DenseTensor]

x[SparseCooTensor] @ y[SparseCooTensor] -> out[SparseCooTensor]

x[SparseCooTensor] @ y[DenseTensor] -> out[DenseTensor]

该 API 支持反向传播,xy 必须 >= 2D,不支持自动广播。 x 的 shape 应该为 [*, M, K]y 的 shape 应该为 [*, K, N] ,其中 * 为 0 或者批维度。

参数

  • x (SparseTensor) - 输入的 Tensor,可以为 Coo 或 Csr 格式。数据类型为 float32、float64。

  • y (SparseTensor|DenseTensor) - 输入 Tensor,可以为 Coo 或 Csr 格式 或 DenseTensor。数据类型为 float32、float64。

  • name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。

返回

SparseTensor|DenseTensor: 其 Tensor 类型由 xy 共同决定,数据类型与输入相同。

代码示例

# required: gpu
import paddle

# csr @ dense -> dense
crows = [0, 1, 2, 3]
cols = [1, 2, 0]
values = [1., 2., 3.]
csr = paddle.sparse.sparse_csr_tensor(crows, cols, values, [3, 3])
# Tensor(shape=[3, 3], dtype=paddle.float32, place=Place(gpu:0), stop_gradient=True,
#        crows=[0, 1, 2, 3],
#        cols=[1, 2, 0],
#        values=[1., 2., 3.])
dense = paddle.ones([3, 2])
out = paddle.sparse.matmul(csr, dense)
# Tensor(shape=[3, 2], dtype=float32, place=Place(gpu:0), stop_gradient=True,
#        [[1., 1.],
#         [2., 2.],
#         [3., 3.]])

# coo @ dense -> dense
indices = [[0, 1, 2], [1, 2, 0]]
values = [1., 2., 3.]
coo = paddle.sparse.sparse_coo_tensor(indices, values, [3, 3])
# Tensor(shape=[3, 3], dtype=paddle.float32, place=Place(gpu:0), stop_gradient=True,
#        indices=[[0, 1, 2],
#                 [1, 2, 0]],
#        values=[1., 2., 3.])
dense = paddle.ones([3, 2])
out = paddle.sparse.matmul(coo, dense)
# Tensor(shape=[3, 2], dtype=float32, place=Place(gpu:0), stop_gradient=True,
#        [[1., 1.],
#         [2., 2.],
#         [3., 3.]])