RISCV/rvv/concat-vector-insert-elt.ll

1aa493f0SPhilip Reames; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
1aa493f0SPhilip Reames; RUN: llc -mtriple=riscv32 -mattr=+v -target-abi=ilp32 \
1aa493f0SPhilip Reames; RUN:     -verify-machineinstrs < %s | FileCheck %s --check-prefixes=CHECK,RV32
1aa493f0SPhilip Reames; RUN: llc -mtriple=riscv64 -mattr=+v -target-abi=lp64 \
1aa493f0SPhilip Reames; RUN:     -verify-machineinstrs < %s | FileCheck %s --check-prefixes=CHECK,RV64
1aa493f0SPhilip Reames
1aa493f0SPhilip Reamesdefine void @v4xi8_concat_vector_insert_idx0(ptr %a, ptr %b, i8 %x) {
1aa493f0SPhilip Reames; CHECK-LABEL: v4xi8_concat_vector_insert_idx0:
1aa493f0SPhilip Reames; CHECK:       # %bb.0:
1aa493f0SPhilip Reames; CHECK-NEXT:    vsetivli zero, 2, e8, mf8, ta, ma
1aa493f0SPhilip Reames; CHECK-NEXT:    vle8.v v8, (a0)
1aa493f0SPhilip Reames; CHECK-NEXT:    vle8.v v9, (a1)
ff5e536bSPhilip Reames; CHECK-NEXT:    vsetvli zero, zero, e8, mf8, tu, ma
ff5e536bSPhilip Reames; CHECK-NEXT:    vmv.s.x v8, a2
1aa493f0SPhilip Reames; CHECK-NEXT:    vsetivli zero, 4, e8, mf4, ta, ma
1aa493f0SPhilip Reames; CHECK-NEXT:    vslideup.vi v8, v9, 2
1aa493f0SPhilip Reames; CHECK-NEXT:    vse8.v v8, (a0)
1aa493f0SPhilip Reames; CHECK-NEXT:    ret
1aa493f0SPhilip Reames  %v1 = load <2 x i8>, ptr %a
1aa493f0SPhilip Reames  %v2 = load <2 x i8>, ptr %b
1aa493f0SPhilip Reames  %concat = shufflevector <2 x i8> %v1, <2 x i8> %v2, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
233971b4SPhilip Reames  %ins = insertelement <4 x i8> %concat, i8 %x, i32 0
1aa493f0SPhilip Reames  store <4 x i8> %ins, ptr %a
1aa493f0SPhilip Reames  ret void
1aa493f0SPhilip Reames}
1aa493f0SPhilip Reames
1aa493f0SPhilip Reamesdefine void @v4xi8_concat_vector_insert_idx1(ptr %a, ptr %b, i8 %x) {
1aa493f0SPhilip Reames; CHECK-LABEL: v4xi8_concat_vector_insert_idx1:
1aa493f0SPhilip Reames; CHECK:       # %bb.0:
1aa493f0SPhilip Reames; CHECK-NEXT:    vsetivli zero, 2, e8, mf8, ta, ma
1aa493f0SPhilip Reames; CHECK-NEXT:    vle8.v v8, (a0)
1aa493f0SPhilip Reames; CHECK-NEXT:    vle8.v v9, (a1)
ff5e536bSPhilip Reames; CHECK-NEXT:    vmv.s.x v10, a2
ff5e536bSPhilip Reames; CHECK-NEXT:    vslideup.vi v8, v10, 1
1aa493f0SPhilip Reames; CHECK-NEXT:    vsetivli zero, 4, e8, mf4, ta, ma
1aa493f0SPhilip Reames; CHECK-NEXT:    vslideup.vi v8, v9, 2
1aa493f0SPhilip Reames; CHECK-NEXT:    vse8.v v8, (a0)
1aa493f0SPhilip Reames; CHECK-NEXT:    ret
1aa493f0SPhilip Reames  %v1 = load <2 x i8>, ptr %a
1aa493f0SPhilip Reames  %v2 = load <2 x i8>, ptr %b
1aa493f0SPhilip Reames  %concat = shufflevector <2 x i8> %v1, <2 x i8> %v2, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
1aa493f0SPhilip Reames  %ins = insertelement <4 x i8> %concat, i8 %x, i32 1
1aa493f0SPhilip Reames  store <4 x i8> %ins, ptr %a
1aa493f0SPhilip Reames  ret void
1aa493f0SPhilip Reames}
1aa493f0SPhilip Reames
1aa493f0SPhilip Reamesdefine void @v4xi8_concat_vector_insert_idx2(ptr %a, ptr %b, i8 %x) {
1aa493f0SPhilip Reames; CHECK-LABEL: v4xi8_concat_vector_insert_idx2:
1aa493f0SPhilip Reames; CHECK:       # %bb.0:
1aa493f0SPhilip Reames; CHECK-NEXT:    vsetivli zero, 2, e8, mf8, ta, ma
ff5e536bSPhilip Reames; CHECK-NEXT:    vle8.v v8, (a1)
ff5e536bSPhilip Reames; CHECK-NEXT:    vle8.v v9, (a0)
ff5e536bSPhilip Reames; CHECK-NEXT:    vsetvli zero, zero, e8, mf8, tu, ma
ff5e536bSPhilip Reames; CHECK-NEXT:    vmv.s.x v8, a2
1aa493f0SPhilip Reames; CHECK-NEXT:    vsetivli zero, 4, e8, mf4, ta, ma
ff5e536bSPhilip Reames; CHECK-NEXT:    vslideup.vi v9, v8, 2
ff5e536bSPhilip Reames; CHECK-NEXT:    vse8.v v9, (a0)
1aa493f0SPhilip Reames; CHECK-NEXT:    ret
1aa493f0SPhilip Reames  %v1 = load <2 x i8>, ptr %a
1aa493f0SPhilip Reames  %v2 = load <2 x i8>, ptr %b
1aa493f0SPhilip Reames  %concat = shufflevector <2 x i8> %v1, <2 x i8> %v2, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
1aa493f0SPhilip Reames  %ins = insertelement <4 x i8> %concat, i8 %x, i32 2
1aa493f0SPhilip Reames  store <4 x i8> %ins, ptr %a
1aa493f0SPhilip Reames  ret void
1aa493f0SPhilip Reames}
1aa493f0SPhilip Reames
1aa493f0SPhilip Reamesdefine void @v4xi8_concat_vector_insert_idx3(ptr %a, ptr %b, i8 %x) {
1aa493f0SPhilip Reames; CHECK-LABEL: v4xi8_concat_vector_insert_idx3:
1aa493f0SPhilip Reames; CHECK:       # %bb.0:
1aa493f0SPhilip Reames; CHECK-NEXT:    vsetivli zero, 2, e8, mf8, ta, ma
ff5e536bSPhilip Reames; CHECK-NEXT:    vle8.v v8, (a1)
ff5e536bSPhilip Reames; CHECK-NEXT:    vle8.v v9, (a0)
ff5e536bSPhilip Reames; CHECK-NEXT:    vmv.s.x v10, a2
ff5e536bSPhilip Reames; CHECK-NEXT:    vslideup.vi v8, v10, 1
1aa493f0SPhilip Reames; CHECK-NEXT:    vsetivli zero, 4, e8, mf4, ta, ma
ff5e536bSPhilip Reames; CHECK-NEXT:    vslideup.vi v9, v8, 2
ff5e536bSPhilip Reames; CHECK-NEXT:    vse8.v v9, (a0)
1aa493f0SPhilip Reames; CHECK-NEXT:    ret
1aa493f0SPhilip Reames  %v1 = load <2 x i8>, ptr %a
1aa493f0SPhilip Reames  %v2 = load <2 x i8>, ptr %b
1aa493f0SPhilip Reames  %concat = shufflevector <2 x i8> %v1, <2 x i8> %v2, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
1aa493f0SPhilip Reames  %ins = insertelement <4 x i8> %concat, i8 %x, i32 3
1aa493f0SPhilip Reames  store <4 x i8> %ins, ptr %a
1aa493f0SPhilip Reames  ret void
1aa493f0SPhilip Reames}
1aa493f0SPhilip Reames
1aa493f0SPhilip Reamesdefine void @v4xi64_concat_vector_insert_idx0(ptr %a, ptr %b, i64 %x) {
1aa493f0SPhilip Reames; RV32-LABEL: v4xi64_concat_vector_insert_idx0:
1aa493f0SPhilip Reames; RV32:       # %bb.0:
1aa493f0SPhilip Reames; RV32-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
1aa493f0SPhilip Reames; RV32-NEXT:    vle64.v v8, (a0)
1aa493f0SPhilip Reames; RV32-NEXT:    vle64.v v10, (a1)
233971b4SPhilip Reames; RV32-NEXT:    vsetivli zero, 2, e32, m1, tu, ma
233971b4SPhilip Reames; RV32-NEXT:    vslide1down.vx v8, v8, a2
233971b4SPhilip Reames; RV32-NEXT:    vslide1down.vx v8, v8, a3
1aa493f0SPhilip Reames; RV32-NEXT:    vsetivli zero, 4, e64, m2, ta, ma
ff5e536bSPhilip Reames; RV32-NEXT:    vslideup.vi v8, v10, 2
1aa493f0SPhilip Reames; RV32-NEXT:    vse64.v v8, (a0)
1aa493f0SPhilip Reames; RV32-NEXT:    ret
1aa493f0SPhilip Reames;
1aa493f0SPhilip Reames; RV64-LABEL: v4xi64_concat_vector_insert_idx0:
1aa493f0SPhilip Reames; RV64:       # %bb.0:
1aa493f0SPhilip Reames; RV64-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
1aa493f0SPhilip Reames; RV64-NEXT:    vle64.v v8, (a0)
1aa493f0SPhilip Reames; RV64-NEXT:    vle64.v v10, (a1)
ff5e536bSPhilip Reames; RV64-NEXT:    vsetvli zero, zero, e64, m1, tu, ma
ff5e536bSPhilip Reames; RV64-NEXT:    vmv.s.x v8, a2
1aa493f0SPhilip Reames; RV64-NEXT:    vsetivli zero, 4, e64, m2, ta, ma
1aa493f0SPhilip Reames; RV64-NEXT:    vslideup.vi v8, v10, 2
1aa493f0SPhilip Reames; RV64-NEXT:    vse64.v v8, (a0)
1aa493f0SPhilip Reames; RV64-NEXT:    ret
1aa493f0SPhilip Reames  %v1 = load <2 x i64>, ptr %a
1aa493f0SPhilip Reames  %v2 = load <2 x i64>, ptr %b
1aa493f0SPhilip Reames  %concat = shufflevector <2 x i64> %v1, <2 x i64> %v2, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
233971b4SPhilip Reames  %ins = insertelement <4 x i64> %concat, i64 %x, i32 0
1aa493f0SPhilip Reames  store <4 x i64> %ins, ptr %a
1aa493f0SPhilip Reames  ret void
1aa493f0SPhilip Reames}
1aa493f0SPhilip Reames
1aa493f0SPhilip Reamesdefine void @v4xi64_concat_vector_insert_idx1(ptr %a, ptr %b, i64 %x) {
1aa493f0SPhilip Reames; RV32-LABEL: v4xi64_concat_vector_insert_idx1:
1aa493f0SPhilip Reames; RV32:       # %bb.0:
1aa493f0SPhilip Reames; RV32-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
1aa493f0SPhilip Reames; RV32-NEXT:    vle64.v v8, (a0)
1aa493f0SPhilip Reames; RV32-NEXT:    vle64.v v10, (a1)
ff5e536bSPhilip Reames; RV32-NEXT:    vsetivli zero, 2, e32, m1, ta, ma
ff5e536bSPhilip Reames; RV32-NEXT:    vslide1down.vx v9, v8, a2
ff5e536bSPhilip Reames; RV32-NEXT:    vslide1down.vx v9, v9, a3
ff5e536bSPhilip Reames; RV32-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
ff5e536bSPhilip Reames; RV32-NEXT:    vslideup.vi v8, v9, 1
1aa493f0SPhilip Reames; RV32-NEXT:    vsetivli zero, 4, e64, m2, ta, ma
1aa493f0SPhilip Reames; RV32-NEXT:    vslideup.vi v8, v10, 2
1aa493f0SPhilip Reames; RV32-NEXT:    vse64.v v8, (a0)
1aa493f0SPhilip Reames; RV32-NEXT:    ret
1aa493f0SPhilip Reames;
1aa493f0SPhilip Reames; RV64-LABEL: v4xi64_concat_vector_insert_idx1:
1aa493f0SPhilip Reames; RV64:       # %bb.0:
1aa493f0SPhilip Reames; RV64-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
1aa493f0SPhilip Reames; RV64-NEXT:    vle64.v v8, (a0)
1aa493f0SPhilip Reames; RV64-NEXT:    vle64.v v10, (a1)
ff5e536bSPhilip Reames; RV64-NEXT:    vmv.s.x v9, a2
ff5e536bSPhilip Reames; RV64-NEXT:    vslideup.vi v8, v9, 1
1aa493f0SPhilip Reames; RV64-NEXT:    vsetivli zero, 4, e64, m2, ta, ma
1aa493f0SPhilip Reames; RV64-NEXT:    vslideup.vi v8, v10, 2
1aa493f0SPhilip Reames; RV64-NEXT:    vse64.v v8, (a0)
1aa493f0SPhilip Reames; RV64-NEXT:    ret
1aa493f0SPhilip Reames  %v1 = load <2 x i64>, ptr %a
1aa493f0SPhilip Reames  %v2 = load <2 x i64>, ptr %b
1aa493f0SPhilip Reames  %concat = shufflevector <2 x i64> %v1, <2 x i64> %v2, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
1aa493f0SPhilip Reames  %ins = insertelement <4 x i64> %concat, i64 %x, i32 1
1aa493f0SPhilip Reames  store <4 x i64> %ins, ptr %a
1aa493f0SPhilip Reames  ret void
1aa493f0SPhilip Reames}
1aa493f0SPhilip Reames
1aa493f0SPhilip Reamesdefine void @v4xi64_concat_vector_insert_idx2(ptr %a, ptr %b, i64 %x) {
1aa493f0SPhilip Reames; RV32-LABEL: v4xi64_concat_vector_insert_idx2:
1aa493f0SPhilip Reames; RV32:       # %bb.0:
1aa493f0SPhilip Reames; RV32-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
ff5e536bSPhilip Reames; RV32-NEXT:    vle64.v v8, (a1)
ff5e536bSPhilip Reames; RV32-NEXT:    vle64.v v10, (a0)
ff5e536bSPhilip Reames; RV32-NEXT:    vsetivli zero, 2, e32, m1, tu, ma
ff5e536bSPhilip Reames; RV32-NEXT:    vslide1down.vx v8, v8, a2
ff5e536bSPhilip Reames; RV32-NEXT:    vslide1down.vx v8, v8, a3
1aa493f0SPhilip Reames; RV32-NEXT:    vsetivli zero, 4, e64, m2, ta, ma
ff5e536bSPhilip Reames; RV32-NEXT:    vslideup.vi v10, v8, 2
ff5e536bSPhilip Reames; RV32-NEXT:    vse64.v v10, (a0)
1aa493f0SPhilip Reames; RV32-NEXT:    ret
1aa493f0SPhilip Reames;
1aa493f0SPhilip Reames; RV64-LABEL: v4xi64_concat_vector_insert_idx2:
1aa493f0SPhilip Reames; RV64:       # %bb.0:
1aa493f0SPhilip Reames; RV64-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
ff5e536bSPhilip Reames; RV64-NEXT:    vle64.v v8, (a1)
ff5e536bSPhilip Reames; RV64-NEXT:    vle64.v v10, (a0)
ff5e536bSPhilip Reames; RV64-NEXT:    vsetvli zero, zero, e64, m1, tu, ma
ff5e536bSPhilip Reames; RV64-NEXT:    vmv.s.x v8, a2
1aa493f0SPhilip Reames; RV64-NEXT:    vsetivli zero, 4, e64, m2, ta, ma
ff5e536bSPhilip Reames; RV64-NEXT:    vslideup.vi v10, v8, 2
ff5e536bSPhilip Reames; RV64-NEXT:    vse64.v v10, (a0)
1aa493f0SPhilip Reames; RV64-NEXT:    ret
1aa493f0SPhilip Reames  %v1 = load <2 x i64>, ptr %a
1aa493f0SPhilip Reames  %v2 = load <2 x i64>, ptr %b
1aa493f0SPhilip Reames  %concat = shufflevector <2 x i64> %v1, <2 x i64> %v2, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
1aa493f0SPhilip Reames  %ins = insertelement <4 x i64> %concat, i64 %x, i32 2
1aa493f0SPhilip Reames  store <4 x i64> %ins, ptr %a
1aa493f0SPhilip Reames  ret void
1aa493f0SPhilip Reames}
1aa493f0SPhilip Reames
1aa493f0SPhilip Reamesdefine void @v4xi64_concat_vector_insert_idx3(ptr %a, ptr %b, i64 %x) {
1aa493f0SPhilip Reames; RV32-LABEL: v4xi64_concat_vector_insert_idx3:
1aa493f0SPhilip Reames; RV32:       # %bb.0:
1aa493f0SPhilip Reames; RV32-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
*675e7bd1SPiyou Chen; RV32-NEXT:    vle64.v v8, (a1)
*675e7bd1SPiyou Chen; RV32-NEXT:    vle64.v v10, (a0)
ff5e536bSPhilip Reames; RV32-NEXT:    vsetivli zero, 2, e32, m1, ta, ma
ff5e536bSPhilip Reames; RV32-NEXT:    vslide1down.vx v9, v8, a2
ff5e536bSPhilip Reames; RV32-NEXT:    vslide1down.vx v9, v9, a3
ff5e536bSPhilip Reames; RV32-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
*675e7bd1SPiyou Chen; RV32-NEXT:    vslideup.vi v8, v9, 1
1aa493f0SPhilip Reames; RV32-NEXT:    vsetivli zero, 4, e64, m2, ta, ma
*675e7bd1SPiyou Chen; RV32-NEXT:    vslideup.vi v10, v8, 2
*675e7bd1SPiyou Chen; RV32-NEXT:    vse64.v v10, (a0)
1aa493f0SPhilip Reames; RV32-NEXT:    ret
1aa493f0SPhilip Reames;
1aa493f0SPhilip Reames; RV64-LABEL: v4xi64_concat_vector_insert_idx3:
1aa493f0SPhilip Reames; RV64:       # %bb.0:
1aa493f0SPhilip Reames; RV64-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
ff5e536bSPhilip Reames; RV64-NEXT:    vle64.v v8, (a1)
ff5e536bSPhilip Reames; RV64-NEXT:    vle64.v v10, (a0)
ff5e536bSPhilip Reames; RV64-NEXT:    vmv.s.x v9, a2
ff5e536bSPhilip Reames; RV64-NEXT:    vslideup.vi v8, v9, 1
1aa493f0SPhilip Reames; RV64-NEXT:    vsetivli zero, 4, e64, m2, ta, ma
ff5e536bSPhilip Reames; RV64-NEXT:    vslideup.vi v10, v8, 2
ff5e536bSPhilip Reames; RV64-NEXT:    vse64.v v10, (a0)
1aa493f0SPhilip Reames; RV64-NEXT:    ret
1aa493f0SPhilip Reames  %v1 = load <2 x i64>, ptr %a
1aa493f0SPhilip Reames  %v2 = load <2 x i64>, ptr %b
1aa493f0SPhilip Reames  %concat = shufflevector <2 x i64> %v1, <2 x i64> %v2, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
1aa493f0SPhilip Reames  %ins = insertelement <4 x i64> %concat, i64 %x, i32 3
1aa493f0SPhilip Reames  store <4 x i64> %ins, ptr %a
1aa493f0SPhilip Reames  ret void
1aa493f0SPhilip Reames}