1*438a7d4cSAart Bik// RUN: mlir-opt %s --sparsification-and-bufferization | FileCheck %s --check-prefix=CHECK-NOVEC 2*438a7d4cSAart Bik// RUN: mlir-opt %s --sparsification-and-bufferization="vl=8" | FileCheck %s --check-prefix=CHECK-VEC 3*438a7d4cSAart Bik 4*438a7d4cSAart Bik// Test to ensure we can pass optimization flags into 5*438a7d4cSAart Bik// the mini sparsification and bufferization pipeline. 6*438a7d4cSAart Bik 7*438a7d4cSAart Bik#SV = #sparse_tensor.encoding<{ map = (d0) -> (d0 : compressed) }> 8*438a7d4cSAart Bik 9*438a7d4cSAart Bik#trait_sum_reduction = { 10*438a7d4cSAart Bik indexing_maps = [ 11*438a7d4cSAart Bik affine_map<(i) -> (i)>, // a 12*438a7d4cSAart Bik affine_map<(i) -> ()> // x (scalar out) 13*438a7d4cSAart Bik ], 14*438a7d4cSAart Bik iterator_types = ["reduction"], 15*438a7d4cSAart Bik doc = "x += SUM_i a(i)" 16*438a7d4cSAart Bik} 17*438a7d4cSAart Bik 18*438a7d4cSAart Bik// 19*438a7d4cSAart Bik// CHECK-NOVEC-LABEL: func.func @sum_reduction 20*438a7d4cSAart Bik// CHECK-NOVEC: scf.for 21*438a7d4cSAart Bik// CHECK-NOVEC: arith.addf %{{.*}} %{{.*}} : f32 22*438a7d4cSAart Bik// CHECK-NOVEC: } 23*438a7d4cSAart Bik// 24*438a7d4cSAart Bik// CHECK-VEC-LABEL: func.func @sum_reduction 25*438a7d4cSAart Bik// CHECK-VEC: vector.insertelement 26*438a7d4cSAart Bik// CHECK-VEC: scf.for 27*438a7d4cSAart Bik// CHECK-VEC: vector.create_mask 28*438a7d4cSAart Bik// CHECK-VEC: vector.maskedload 29*438a7d4cSAart Bik// CHECK-VEC: arith.addf %{{.*}} %{{.*}} : vector<8xf32> 30*438a7d4cSAart Bik// CHECK-VEC: } 31*438a7d4cSAart Bik// CHECK-VEC: vector.reduction <add> 32*438a7d4cSAart Bik// 33*438a7d4cSAart Bikfunc.func @sum_reduction(%arga: tensor<?xf32, #SV>, 34*438a7d4cSAart Bik %argx: tensor<f32>) -> tensor<f32> { 35*438a7d4cSAart Bik %0 = linalg.generic #trait_sum_reduction 36*438a7d4cSAart Bik ins(%arga: tensor<?xf32, #SV>) 37*438a7d4cSAart Bik outs(%argx: tensor<f32>) { 38*438a7d4cSAart Bik ^bb(%a: f32, %x: f32): 39*438a7d4cSAart Bik %0 = arith.addf %x, %a : f32 40*438a7d4cSAart Bik linalg.yield %0 : f32 41*438a7d4cSAart Bik } -> tensor<f32> 42*438a7d4cSAart Bik return %0 : tensor<f32> 43*438a7d4cSAart Bik} 44