[mlir][tensor] fix typo in pad tiling comment
[llvm-project.git] / mlir / test / Conversion / VectorToSCF / tensor-transfer-ops.mlir
blob6ec74f6b32db944635217e801257a97282ddfad2
1 // RUN: mlir-opt %s -pass-pipeline="builtin.module(func.func(convert-vector-to-scf{lower-tensors=true lower-scalable=true}))" -split-input-file -allow-unregistered-dialect | FileCheck %s
3 // CHECK-LABEL: func @transfer_read_2d(
4 //       CHECK: %[[ALLOC:.*]] = memref.alloca() : memref<vector<4x9xf32>>
5 //       CHECK: %[[CASTED:.*]] = vector.type_cast %[[ALLOC]] : memref<vector<4x9xf32>> to memref<4xvector<9xf32>>
6 //       CHECK: scf.for {{.*}} {
7 //       CHECK:   %[[READ:.*]] = vector.transfer_read %{{.*}}[{{.*}}], %cst {in_bounds = [true]} : tensor<?x?xf32>, vector<9xf32>
8 //       CHECK:   memref.store %[[READ]], %[[CASTED]][%{{.*}}] : memref<4xvector<9xf32>>
9 //       CHECK: }
10 //       CHECK: %[[LOADED:.*]] = memref.load %[[ALLOC]][] : memref<vector<4x9xf32>>
11 //       CHECK: return %[[LOADED]] : vector<4x9xf32>
12 func.func @transfer_read_2d(%A : tensor<?x?xf32>, %base1 : index, %base2 : index)
13     -> (vector<4x9xf32>){
14   %p = arith.constant -42.0: f32
15   %f = vector.transfer_read %A[%base1, %base2], %p {in_bounds = [true, true]}
16       : tensor<?x?xf32>, vector<4x9xf32>
17   return %f : vector<4x9xf32>
20 // -----
22 // CHECK-LABEL: func @transfer_write_2d(
23 //       CHECK: %[[ALLOC:.*]] = memref.alloca() : memref<vector<2x3xf32>>
24 //       CHECK: memref.store {{.*}}, %[[ALLOC]][] : memref<vector<2x3xf32>>
25 //       CHECK: %[[CASTED:.*]] = vector.type_cast %[[ALLOC]] : memref<vector<2x3xf32>> to memref<2xvector<3xf32>>
26 //       CHECK: %[[RESULT:.*]] = scf.for {{.*}} iter_args(%[[STATE:.*]] = %{{.*}}) -> (tensor<?x?xf32>) {
27 //       CHECK:   %[[LOADED:.*]] = memref.load %[[CASTED]][%{{.*}}] : memref<2xvector<3xf32>>
28 //       CHECK:   %[[WRITE:.*]] = vector.transfer_write %[[LOADED]], %[[STATE]][{{.*}}] {in_bounds = [true]} : vector<3xf32>, tensor<?x?xf32>
29 //       CHECK:   scf.yield %[[WRITE]] : tensor<?x?xf32>
30 //       CHECK: }
31 //       CHECK: return %[[RESULT]] : tensor<?x?xf32>
32 func.func @transfer_write_2d(%A : tensor<?x?xf32>, %vec : vector<2x3xf32>,
33                         %base1 : index, %base2 : index) -> (tensor<?x?xf32>) {
34   %t = vector.transfer_write %vec, %A[%base1, %base2] {in_bounds = [true, true]}
35       : vector<2x3xf32>, tensor<?x?xf32>
36   return %t : tensor<?x?xf32>
39 // -----
41 // CHECK-LABEL: func @scalable_transpose_store
42 //  CHECK-SAME: %[[TENSOR:[a-z0-9]+]]: tensor<?x?xf32>
43 //       CHECK: %[[RESULT:.*]] = scf.for {{.*}} iter_args(%[[ITER_ARG:.*]] = %[[TENSOR]]) -> (tensor<?x?xf32>)
44 //       CHECK:   %[[WRITE_SLICE:.*]] = vector.transfer_write %{{.*}} %[[ITER_ARG]]
45 //       CHECK:   scf.yield %[[WRITE_SLICE]]
46 //       CHECK: return %[[RESULT]]
47 func.func @scalable_transpose_store(%vec: vector<4x[4]xf32>, %A: tensor<?x?xf32>, %base1: index, %base2: index) -> tensor<?x?xf32> {
48   %transpose = vector.transpose %vec, [1, 0] : vector<4x[4]xf32> to vector<[4]x4xf32>
49   %result = vector.transfer_write %transpose, %A[%base1, %base2] {in_bounds = [true, true]} : vector<[4]x4xf32>,  tensor<?x?xf32>
50   return %result : tensor<?x?xf32>