1*f4a2713aSLionel Sambuc // RUN: %clang_cc1 %s -O3 -triple=x86_64-apple-darwin -target-feature +avx2 -emit-llvm -o - -Werror | FileCheck %s 2*f4a2713aSLionel Sambuc 3*f4a2713aSLionel Sambuc // Don't include mm_malloc.h, it's system specific. 4*f4a2713aSLionel Sambuc #define __MM_MALLOC_H 5*f4a2713aSLionel Sambuc 6*f4a2713aSLionel Sambuc #include <immintrin.h> 7*f4a2713aSLionel Sambuc 8*f4a2713aSLionel Sambuc __m256i test_mm256_mpsadbw_epu8(__m256i x, __m256i y) { 9*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.mpsadbw({{.*}}, {{.*}}, i32 3) 10*f4a2713aSLionel Sambuc return _mm256_mpsadbw_epu8(x, y, 3); 11*f4a2713aSLionel Sambuc } 12*f4a2713aSLionel Sambuc 13*f4a2713aSLionel Sambuc __m256i test_mm256_sad_epu8(__m256i x, __m256i y) { 14*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psad.bw 15*f4a2713aSLionel Sambuc return _mm256_sad_epu8(x, y); 16*f4a2713aSLionel Sambuc } 17*f4a2713aSLionel Sambuc 18*f4a2713aSLionel Sambuc __m256i test_mm256_abs_epi8(__m256i a) { 19*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pabs.b 20*f4a2713aSLionel Sambuc return _mm256_abs_epi8(a); 21*f4a2713aSLionel Sambuc } 22*f4a2713aSLionel Sambuc 23*f4a2713aSLionel Sambuc __m256i test_mm256_abs_epi16(__m256i a) { 24*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pabs.w 25*f4a2713aSLionel Sambuc return _mm256_abs_epi16(a); 26*f4a2713aSLionel Sambuc } 27*f4a2713aSLionel Sambuc 28*f4a2713aSLionel Sambuc __m256i test_mm256_abs_epi32(__m256i a) { 29*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pabs.d 30*f4a2713aSLionel Sambuc return _mm256_abs_epi32(a); 31*f4a2713aSLionel Sambuc } 32*f4a2713aSLionel Sambuc 33*f4a2713aSLionel Sambuc __m256i test_mm256_packs_epi16(__m256i a, __m256i b) { 34*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.packsswb 35*f4a2713aSLionel Sambuc return _mm256_packs_epi16(a, b); 36*f4a2713aSLionel Sambuc } 37*f4a2713aSLionel Sambuc 38*f4a2713aSLionel Sambuc __m256i test_mm256_packs_epi32(__m256i a, __m256i b) { 39*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.packssdw 40*f4a2713aSLionel Sambuc return _mm256_packs_epi32(a, b); 41*f4a2713aSLionel Sambuc } 42*f4a2713aSLionel Sambuc 43*f4a2713aSLionel Sambuc __m256i test_mm256_packs_epu16(__m256i a, __m256i b) { 44*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.packuswb 45*f4a2713aSLionel Sambuc return _mm256_packus_epi16(a, b); 46*f4a2713aSLionel Sambuc } 47*f4a2713aSLionel Sambuc 48*f4a2713aSLionel Sambuc __m256i test_mm256_packs_epu32(__m256i a, __m256i b) { 49*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.packusdw 50*f4a2713aSLionel Sambuc return _mm256_packus_epi32(a, b); 51*f4a2713aSLionel Sambuc } 52*f4a2713aSLionel Sambuc 53*f4a2713aSLionel Sambuc __m256i test_mm256_add_epi8(__m256i a, __m256i b) { 54*f4a2713aSLionel Sambuc // CHECK: add <32 x i8> 55*f4a2713aSLionel Sambuc return _mm256_add_epi8(a, b); 56*f4a2713aSLionel Sambuc } 57*f4a2713aSLionel Sambuc 58*f4a2713aSLionel Sambuc __m256i test_mm256_add_epi16(__m256i a, __m256i b) { 59*f4a2713aSLionel Sambuc // CHECK: add <16 x i16> 60*f4a2713aSLionel Sambuc return _mm256_add_epi16(a, b); 61*f4a2713aSLionel Sambuc } 62*f4a2713aSLionel Sambuc 63*f4a2713aSLionel Sambuc __m256i test_mm256_add_epi32(__m256i a, __m256i b) { 64*f4a2713aSLionel Sambuc // CHECK: add <8 x i32> 65*f4a2713aSLionel Sambuc return _mm256_add_epi32(a, b); 66*f4a2713aSLionel Sambuc } 67*f4a2713aSLionel Sambuc 68*f4a2713aSLionel Sambuc __m256i test_mm256_add_epi64(__m256i a, __m256i b) { 69*f4a2713aSLionel Sambuc // CHECK: add <4 x i64> 70*f4a2713aSLionel Sambuc return _mm256_add_epi64(a, b); 71*f4a2713aSLionel Sambuc } 72*f4a2713aSLionel Sambuc 73*f4a2713aSLionel Sambuc __m256i test_mm256_adds_epi8(__m256i a, __m256i b) { 74*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.padds.b 75*f4a2713aSLionel Sambuc return _mm256_adds_epi8(a, b); 76*f4a2713aSLionel Sambuc } 77*f4a2713aSLionel Sambuc 78*f4a2713aSLionel Sambuc __m256i test_mm256_adds_epi16(__m256i a, __m256i b) { 79*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.padds.w 80*f4a2713aSLionel Sambuc return _mm256_adds_epi16(a, b); 81*f4a2713aSLionel Sambuc } 82*f4a2713aSLionel Sambuc 83*f4a2713aSLionel Sambuc __m256i test_mm256_adds_epu8(__m256i a, __m256i b) { 84*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.paddus.b 85*f4a2713aSLionel Sambuc return _mm256_adds_epu8(a, b); 86*f4a2713aSLionel Sambuc } 87*f4a2713aSLionel Sambuc 88*f4a2713aSLionel Sambuc __m256i test_mm256_adds_epu16(__m256i a, __m256i b) { 89*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.paddus.w 90*f4a2713aSLionel Sambuc return _mm256_adds_epu16(a, b); 91*f4a2713aSLionel Sambuc } 92*f4a2713aSLionel Sambuc 93*f4a2713aSLionel Sambuc __m256i test_mm256_alignr_epi8(__m256i a, __m256i b) { 94*f4a2713aSLionel Sambuc // CHECK: shufflevector <32 x i8> %{{.*}}, <32 x i8> %{{.*}}, <32 x i32> <i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 32, i32 33, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 48, i32 49> 95*f4a2713aSLionel Sambuc return _mm256_alignr_epi8(a, b, 2); 96*f4a2713aSLionel Sambuc } 97*f4a2713aSLionel Sambuc 98*f4a2713aSLionel Sambuc __m256i test2_mm256_alignr_epi8(__m256i a, __m256i b) { 99*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrl.dq({{.*}}, i32 8) 100*f4a2713aSLionel Sambuc return _mm256_alignr_epi8(a, b, 17); 101*f4a2713aSLionel Sambuc } 102*f4a2713aSLionel Sambuc 103*f4a2713aSLionel Sambuc __m256i test_mm256_sub_epi8(__m256i a, __m256i b) { 104*f4a2713aSLionel Sambuc // CHECK: sub <32 x i8> 105*f4a2713aSLionel Sambuc return _mm256_sub_epi8(a, b); 106*f4a2713aSLionel Sambuc } 107*f4a2713aSLionel Sambuc 108*f4a2713aSLionel Sambuc __m256i test_mm256_sub_epi16(__m256i a, __m256i b) { 109*f4a2713aSLionel Sambuc // CHECK: sub <16 x i16> 110*f4a2713aSLionel Sambuc return _mm256_sub_epi16(a, b); 111*f4a2713aSLionel Sambuc } 112*f4a2713aSLionel Sambuc 113*f4a2713aSLionel Sambuc __m256i test_mm256_sub_epi32(__m256i a, __m256i b) { 114*f4a2713aSLionel Sambuc // CHECK: sub <8 x i32> 115*f4a2713aSLionel Sambuc return _mm256_sub_epi32(a, b); 116*f4a2713aSLionel Sambuc } 117*f4a2713aSLionel Sambuc 118*f4a2713aSLionel Sambuc __m256i test_mm256_sub_epi64(__m256i a, __m256i b) { 119*f4a2713aSLionel Sambuc // CHECK: sub <4 x i64> 120*f4a2713aSLionel Sambuc return _mm256_sub_epi64(a, b); 121*f4a2713aSLionel Sambuc } 122*f4a2713aSLionel Sambuc 123*f4a2713aSLionel Sambuc __m256i test_mm256_subs_epi8(__m256i a, __m256i b) { 124*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psubs.b 125*f4a2713aSLionel Sambuc return _mm256_subs_epi8(a, b); 126*f4a2713aSLionel Sambuc } 127*f4a2713aSLionel Sambuc 128*f4a2713aSLionel Sambuc __m256i test_mm256_subs_epi16(__m256i a, __m256i b) { 129*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psubs.w 130*f4a2713aSLionel Sambuc return _mm256_subs_epi16(a, b); 131*f4a2713aSLionel Sambuc } 132*f4a2713aSLionel Sambuc 133*f4a2713aSLionel Sambuc __m256i test_mm256_subs_epu8(__m256i a, __m256i b) { 134*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psubus.b 135*f4a2713aSLionel Sambuc return _mm256_subs_epu8(a, b); 136*f4a2713aSLionel Sambuc } 137*f4a2713aSLionel Sambuc 138*f4a2713aSLionel Sambuc __m256i test_mm256_subs_epu16(__m256i a, __m256i b) { 139*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psubus.w 140*f4a2713aSLionel Sambuc return _mm256_subs_epu16(a, b); 141*f4a2713aSLionel Sambuc } 142*f4a2713aSLionel Sambuc 143*f4a2713aSLionel Sambuc __m256i test_mm256_and_si256(__m256i a, __m256i b) { 144*f4a2713aSLionel Sambuc // CHECK: and <4 x i64> 145*f4a2713aSLionel Sambuc return _mm256_and_si256(a, b); 146*f4a2713aSLionel Sambuc } 147*f4a2713aSLionel Sambuc 148*f4a2713aSLionel Sambuc __m256i test_mm256_andnot_si256(__m256i a, __m256i b) { 149*f4a2713aSLionel Sambuc // CHECK: xor <4 x i64> 150*f4a2713aSLionel Sambuc // CHECK: and <4 x i64> 151*f4a2713aSLionel Sambuc return _mm256_andnot_si256(a, b); 152*f4a2713aSLionel Sambuc } 153*f4a2713aSLionel Sambuc 154*f4a2713aSLionel Sambuc __m256i test_mm256_or_si256(__m256i a, __m256i b) { 155*f4a2713aSLionel Sambuc // CHECK: or <4 x i64> 156*f4a2713aSLionel Sambuc return _mm256_or_si256(a, b); 157*f4a2713aSLionel Sambuc } 158*f4a2713aSLionel Sambuc 159*f4a2713aSLionel Sambuc __m256i test_mm256_xor_si256(__m256i a, __m256i b) { 160*f4a2713aSLionel Sambuc // CHECK: xor <4 x i64> 161*f4a2713aSLionel Sambuc return _mm256_xor_si256(a, b); 162*f4a2713aSLionel Sambuc } 163*f4a2713aSLionel Sambuc 164*f4a2713aSLionel Sambuc __m256i test_mm256_avg_epu8(__m256i a, __m256i b) { 165*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pavg.b 166*f4a2713aSLionel Sambuc return _mm256_avg_epu8(a, b); 167*f4a2713aSLionel Sambuc } 168*f4a2713aSLionel Sambuc 169*f4a2713aSLionel Sambuc __m256i test_mm256_avg_epu16(__m256i a, __m256i b) { 170*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pavg.w 171*f4a2713aSLionel Sambuc return _mm256_avg_epu16(a, b); 172*f4a2713aSLionel Sambuc } 173*f4a2713aSLionel Sambuc 174*f4a2713aSLionel Sambuc __m256i test_mm256_blendv_epi8(__m256i a, __m256i b, __m256i m) { 175*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pblendvb 176*f4a2713aSLionel Sambuc return _mm256_blendv_epi8(a, b, m); 177*f4a2713aSLionel Sambuc } 178*f4a2713aSLionel Sambuc 179*f4a2713aSLionel Sambuc __m256i test_mm256_blend_epi16(__m256i a, __m256i b) { 180*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pblendw(<16 x i16> %{{.*}}, <16 x i16> %{{.*}}, i32 2) 181*f4a2713aSLionel Sambuc return _mm256_blend_epi16(a, b, 2); 182*f4a2713aSLionel Sambuc } 183*f4a2713aSLionel Sambuc 184*f4a2713aSLionel Sambuc __m256i test_mm256_cmpeq_epi8(__m256i a, __m256i b) { 185*f4a2713aSLionel Sambuc // CHECK: icmp eq <32 x i8> 186*f4a2713aSLionel Sambuc return _mm256_cmpeq_epi8(a, b); 187*f4a2713aSLionel Sambuc } 188*f4a2713aSLionel Sambuc 189*f4a2713aSLionel Sambuc __m256i test_mm256_cmpeq_epi16(__m256i a, __m256i b) { 190*f4a2713aSLionel Sambuc // CHECK: icmp eq <16 x i16> 191*f4a2713aSLionel Sambuc return _mm256_cmpeq_epi16(a, b); 192*f4a2713aSLionel Sambuc } 193*f4a2713aSLionel Sambuc 194*f4a2713aSLionel Sambuc __m256i test_mm256_cmpeq_epi32(__m256i a, __m256i b) { 195*f4a2713aSLionel Sambuc // CHECK: icmp eq <8 x i32> 196*f4a2713aSLionel Sambuc return _mm256_cmpeq_epi32(a, b); 197*f4a2713aSLionel Sambuc } 198*f4a2713aSLionel Sambuc 199*f4a2713aSLionel Sambuc __m256i test_mm256_cmpeq_epi64(__m256i a, __m256i b) { 200*f4a2713aSLionel Sambuc // CHECK: icmp eq <4 x i64> 201*f4a2713aSLionel Sambuc return _mm256_cmpeq_epi64(a, b); 202*f4a2713aSLionel Sambuc } 203*f4a2713aSLionel Sambuc 204*f4a2713aSLionel Sambuc __m256i test_mm256_cmpgt_epi8(__m256i a, __m256i b) { 205*f4a2713aSLionel Sambuc // CHECK: icmp sgt <32 x i8> 206*f4a2713aSLionel Sambuc return _mm256_cmpgt_epi8(a, b); 207*f4a2713aSLionel Sambuc } 208*f4a2713aSLionel Sambuc 209*f4a2713aSLionel Sambuc __m256i test_mm256_cmpgt_epi16(__m256i a, __m256i b) { 210*f4a2713aSLionel Sambuc // CHECK: icmp sgt <16 x i16> 211*f4a2713aSLionel Sambuc return _mm256_cmpgt_epi16(a, b); 212*f4a2713aSLionel Sambuc } 213*f4a2713aSLionel Sambuc 214*f4a2713aSLionel Sambuc __m256i test_mm256_cmpgt_epi32(__m256i a, __m256i b) { 215*f4a2713aSLionel Sambuc // CHECK: icmp sgt <8 x i32> 216*f4a2713aSLionel Sambuc return _mm256_cmpgt_epi32(a, b); 217*f4a2713aSLionel Sambuc } 218*f4a2713aSLionel Sambuc 219*f4a2713aSLionel Sambuc __m256i test_mm256_cmpgt_epi64(__m256i a, __m256i b) { 220*f4a2713aSLionel Sambuc // CHECK: icmp sgt <4 x i64> 221*f4a2713aSLionel Sambuc return _mm256_cmpgt_epi64(a, b); 222*f4a2713aSLionel Sambuc } 223*f4a2713aSLionel Sambuc 224*f4a2713aSLionel Sambuc __m256i test_mm256_hadd_epi16(__m256i a, __m256i b) { 225*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.phadd.w 226*f4a2713aSLionel Sambuc return _mm256_hadd_epi16(a, b); 227*f4a2713aSLionel Sambuc } 228*f4a2713aSLionel Sambuc 229*f4a2713aSLionel Sambuc __m256i test_mm256_hadd_epi32(__m256i a, __m256i b) { 230*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.phadd.d 231*f4a2713aSLionel Sambuc return _mm256_hadd_epi32(a, b); 232*f4a2713aSLionel Sambuc } 233*f4a2713aSLionel Sambuc 234*f4a2713aSLionel Sambuc __m256i test_mm256_hadds_epi16(__m256i a, __m256i b) { 235*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.phadd.sw 236*f4a2713aSLionel Sambuc return _mm256_hadds_epi16(a, b); 237*f4a2713aSLionel Sambuc } 238*f4a2713aSLionel Sambuc 239*f4a2713aSLionel Sambuc __m256i test_mm256_hsub_epi16(__m256i a, __m256i b) { 240*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.phsub.w 241*f4a2713aSLionel Sambuc return _mm256_hsub_epi16(a, b); 242*f4a2713aSLionel Sambuc } 243*f4a2713aSLionel Sambuc 244*f4a2713aSLionel Sambuc __m256i test_mm256_hsub_epi32(__m256i a, __m256i b) { 245*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.phsub.d 246*f4a2713aSLionel Sambuc return _mm256_hsub_epi32(a, b); 247*f4a2713aSLionel Sambuc } 248*f4a2713aSLionel Sambuc 249*f4a2713aSLionel Sambuc __m256i test_mm256_hsubs_epi16(__m256i a, __m256i b) { 250*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.phsub.sw 251*f4a2713aSLionel Sambuc return _mm256_hsubs_epi16(a, b); 252*f4a2713aSLionel Sambuc } 253*f4a2713aSLionel Sambuc 254*f4a2713aSLionel Sambuc __m256i test_mm256_maddubs_epi16(__m256i a, __m256i b) { 255*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmadd.ub.sw 256*f4a2713aSLionel Sambuc return _mm256_maddubs_epi16(a, b); 257*f4a2713aSLionel Sambuc } 258*f4a2713aSLionel Sambuc 259*f4a2713aSLionel Sambuc __m256i test_mm256_madd_epi16(__m256i a, __m256i b) { 260*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmadd.wd 261*f4a2713aSLionel Sambuc return _mm256_madd_epi16(a, b); 262*f4a2713aSLionel Sambuc } 263*f4a2713aSLionel Sambuc 264*f4a2713aSLionel Sambuc __m256i test_mm256_max_epi8(__m256i a, __m256i b) { 265*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmaxs.b 266*f4a2713aSLionel Sambuc return _mm256_max_epi8(a, b); 267*f4a2713aSLionel Sambuc } 268*f4a2713aSLionel Sambuc 269*f4a2713aSLionel Sambuc __m256i test_mm256_max_epi16(__m256i a, __m256i b) { 270*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmaxs.w 271*f4a2713aSLionel Sambuc return _mm256_max_epi16(a, b); 272*f4a2713aSLionel Sambuc } 273*f4a2713aSLionel Sambuc 274*f4a2713aSLionel Sambuc __m256i test_mm256_max_epi32(__m256i a, __m256i b) { 275*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmaxs.d 276*f4a2713aSLionel Sambuc return _mm256_max_epi32(a, b); 277*f4a2713aSLionel Sambuc } 278*f4a2713aSLionel Sambuc 279*f4a2713aSLionel Sambuc __m256i test_mm256_max_epu8(__m256i a, __m256i b) { 280*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmaxu.b 281*f4a2713aSLionel Sambuc return _mm256_max_epu8(a, b); 282*f4a2713aSLionel Sambuc } 283*f4a2713aSLionel Sambuc 284*f4a2713aSLionel Sambuc __m256i test_mm256_max_epu16(__m256i a, __m256i b) { 285*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmaxu.w 286*f4a2713aSLionel Sambuc return _mm256_max_epu16(a, b); 287*f4a2713aSLionel Sambuc } 288*f4a2713aSLionel Sambuc 289*f4a2713aSLionel Sambuc __m256i test_mm256_max_epu32(__m256i a, __m256i b) { 290*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmaxu.d 291*f4a2713aSLionel Sambuc return _mm256_max_epu32(a, b); 292*f4a2713aSLionel Sambuc } 293*f4a2713aSLionel Sambuc 294*f4a2713aSLionel Sambuc __m256i test_mm256_min_epi8(__m256i a, __m256i b) { 295*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmins.b 296*f4a2713aSLionel Sambuc return _mm256_min_epi8(a, b); 297*f4a2713aSLionel Sambuc } 298*f4a2713aSLionel Sambuc 299*f4a2713aSLionel Sambuc __m256i test_mm256_min_epi16(__m256i a, __m256i b) { 300*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmins.w 301*f4a2713aSLionel Sambuc return _mm256_min_epi16(a, b); 302*f4a2713aSLionel Sambuc } 303*f4a2713aSLionel Sambuc 304*f4a2713aSLionel Sambuc __m256i test_mm256_min_epi32(__m256i a, __m256i b) { 305*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmins.d 306*f4a2713aSLionel Sambuc return _mm256_min_epi32(a, b); 307*f4a2713aSLionel Sambuc } 308*f4a2713aSLionel Sambuc 309*f4a2713aSLionel Sambuc __m256i test_mm256_min_epu8(__m256i a, __m256i b) { 310*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pminu.b 311*f4a2713aSLionel Sambuc return _mm256_min_epu8(a, b); 312*f4a2713aSLionel Sambuc } 313*f4a2713aSLionel Sambuc 314*f4a2713aSLionel Sambuc __m256i test_mm256_min_epu16(__m256i a, __m256i b) { 315*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pminu.w 316*f4a2713aSLionel Sambuc return _mm256_min_epu16(a, b); 317*f4a2713aSLionel Sambuc } 318*f4a2713aSLionel Sambuc 319*f4a2713aSLionel Sambuc __m256i test_mm256_min_epu32(__m256i a, __m256i b) { 320*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pminu.d 321*f4a2713aSLionel Sambuc return _mm256_min_epu32(a, b); 322*f4a2713aSLionel Sambuc } 323*f4a2713aSLionel Sambuc 324*f4a2713aSLionel Sambuc int test_mm256_movemask_epi8(__m256i a) { 325*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmovmskb 326*f4a2713aSLionel Sambuc return _mm256_movemask_epi8(a); 327*f4a2713aSLionel Sambuc } 328*f4a2713aSLionel Sambuc 329*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepi8_epi16(__m128i a) { 330*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmovsxbw 331*f4a2713aSLionel Sambuc return _mm256_cvtepi8_epi16(a); 332*f4a2713aSLionel Sambuc } 333*f4a2713aSLionel Sambuc 334*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepi8_epi32(__m128i a) { 335*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmovsxbd 336*f4a2713aSLionel Sambuc return _mm256_cvtepi8_epi32(a); 337*f4a2713aSLionel Sambuc } 338*f4a2713aSLionel Sambuc 339*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepi8_epi64(__m128i a) { 340*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmovsxbq 341*f4a2713aSLionel Sambuc return _mm256_cvtepi8_epi64(a); 342*f4a2713aSLionel Sambuc } 343*f4a2713aSLionel Sambuc 344*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepi16_epi32(__m128i a) { 345*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmovsxwd 346*f4a2713aSLionel Sambuc return _mm256_cvtepi16_epi32(a); 347*f4a2713aSLionel Sambuc } 348*f4a2713aSLionel Sambuc 349*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepi16_epi64(__m128i a) { 350*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmovsxwq 351*f4a2713aSLionel Sambuc return _mm256_cvtepi16_epi64(a); 352*f4a2713aSLionel Sambuc } 353*f4a2713aSLionel Sambuc 354*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepi32_epi64(__m128i a) { 355*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmovsxdq 356*f4a2713aSLionel Sambuc return _mm256_cvtepi32_epi64(a); 357*f4a2713aSLionel Sambuc } 358*f4a2713aSLionel Sambuc 359*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepu8_epi16(__m128i a) { 360*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmovzxbw 361*f4a2713aSLionel Sambuc return _mm256_cvtepu8_epi16(a); 362*f4a2713aSLionel Sambuc } 363*f4a2713aSLionel Sambuc 364*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepu8_epi32(__m128i a) { 365*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmovzxbd 366*f4a2713aSLionel Sambuc return _mm256_cvtepu8_epi32(a); 367*f4a2713aSLionel Sambuc } 368*f4a2713aSLionel Sambuc 369*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepu8_epi64(__m128i a) { 370*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmovzxbq 371*f4a2713aSLionel Sambuc return _mm256_cvtepu8_epi64(a); 372*f4a2713aSLionel Sambuc } 373*f4a2713aSLionel Sambuc 374*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepu16_epi32(__m128i a) { 375*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmovzxwd 376*f4a2713aSLionel Sambuc return _mm256_cvtepu16_epi32(a); 377*f4a2713aSLionel Sambuc } 378*f4a2713aSLionel Sambuc 379*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepu16_epi64(__m128i a) { 380*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmovzxwq 381*f4a2713aSLionel Sambuc return _mm256_cvtepu16_epi64(a); 382*f4a2713aSLionel Sambuc } 383*f4a2713aSLionel Sambuc 384*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepu32_epi64(__m128i a) { 385*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmovzxdq 386*f4a2713aSLionel Sambuc return _mm256_cvtepu32_epi64(a); 387*f4a2713aSLionel Sambuc } 388*f4a2713aSLionel Sambuc 389*f4a2713aSLionel Sambuc __m256i test_mm256_mul_epi32(__m256i a, __m256i b) { 390*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmul.dq 391*f4a2713aSLionel Sambuc return _mm256_mul_epi32(a, b); 392*f4a2713aSLionel Sambuc } 393*f4a2713aSLionel Sambuc 394*f4a2713aSLionel Sambuc __m256i test_mm256_mulhrs_epi16(__m256i a, __m256i b) { 395*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmul.hr.sw 396*f4a2713aSLionel Sambuc return _mm256_mulhrs_epi16(a, b); 397*f4a2713aSLionel Sambuc } 398*f4a2713aSLionel Sambuc 399*f4a2713aSLionel Sambuc __m256i test_mm256_mulhi_epu16(__m256i a, __m256i b) { 400*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmulhu.w 401*f4a2713aSLionel Sambuc return _mm256_mulhi_epu16(a, b); 402*f4a2713aSLionel Sambuc } 403*f4a2713aSLionel Sambuc 404*f4a2713aSLionel Sambuc __m256i test_mm256_mulhi_epi16(__m256i a, __m256i b) { 405*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmulh.w 406*f4a2713aSLionel Sambuc return _mm256_mulhi_epi16(a, b); 407*f4a2713aSLionel Sambuc } 408*f4a2713aSLionel Sambuc 409*f4a2713aSLionel Sambuc __m256i test_mm256_mullo_epi16(__m256i a, __m256i b) { 410*f4a2713aSLionel Sambuc // CHECK: mul <16 x i16> 411*f4a2713aSLionel Sambuc return _mm256_mullo_epi16(a, b); 412*f4a2713aSLionel Sambuc } 413*f4a2713aSLionel Sambuc 414*f4a2713aSLionel Sambuc __m256i test_mm256_mullo_epi32(__m256i a, __m256i b) { 415*f4a2713aSLionel Sambuc // CHECK: mul <8 x i32> 416*f4a2713aSLionel Sambuc return _mm256_mullo_epi32(a, b); 417*f4a2713aSLionel Sambuc } 418*f4a2713aSLionel Sambuc 419*f4a2713aSLionel Sambuc __m256i test_mm256_mul_epu32(__m256i a, __m256i b) { 420*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pmulu.dq 421*f4a2713aSLionel Sambuc return _mm256_mul_epu32(a, b); 422*f4a2713aSLionel Sambuc } 423*f4a2713aSLionel Sambuc 424*f4a2713aSLionel Sambuc __m256i test_mm256_shuffle_epi8(__m256i a, __m256i b) { 425*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pshuf.b 426*f4a2713aSLionel Sambuc return _mm256_shuffle_epi8(a, b); 427*f4a2713aSLionel Sambuc } 428*f4a2713aSLionel Sambuc 429*f4a2713aSLionel Sambuc __m256i test_mm256_shuffle_epi32(__m256i a) { 430*f4a2713aSLionel Sambuc // CHECK: shufflevector <8 x i32> %{{.*}}, <8 x i32> undef, <8 x i32> <i32 3, i32 3, i32 0, i32 0, i32 7, i32 7, i32 4, i32 4> 431*f4a2713aSLionel Sambuc return _mm256_shuffle_epi32(a, 15); 432*f4a2713aSLionel Sambuc } 433*f4a2713aSLionel Sambuc 434*f4a2713aSLionel Sambuc __m256i test_mm256_shufflehi_epi16(__m256i a) { 435*f4a2713aSLionel Sambuc // CHECK: shufflevector <16 x i16> %{{.*}}, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 6, i32 6, i32 5, i32 8, i32 9, i32 10, i32 11, i32 15, i32 14, i32 14, i32 13> 436*f4a2713aSLionel Sambuc return _mm256_shufflehi_epi16(a, 107); 437*f4a2713aSLionel Sambuc } 438*f4a2713aSLionel Sambuc 439*f4a2713aSLionel Sambuc __m256i test_mm256_shufflelo_epi16(__m256i a) { 440*f4a2713aSLionel Sambuc // CHECK: shufflevector <16 x i16> %{{.*}}, <16 x i16> undef, <16 x i32> <i32 3, i32 0, i32 1, i32 1, i32 4, i32 5, i32 6, i32 7, i32 11, i32 8, i32 9, i32 9, i32 12, i32 13, i32 14, i32 15> 441*f4a2713aSLionel Sambuc return _mm256_shufflelo_epi16(a, 83); 442*f4a2713aSLionel Sambuc } 443*f4a2713aSLionel Sambuc 444*f4a2713aSLionel Sambuc __m256i test_mm256_sign_epi8(__m256i a, __m256i b) { 445*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psign.b 446*f4a2713aSLionel Sambuc return _mm256_sign_epi8(a, b); 447*f4a2713aSLionel Sambuc } 448*f4a2713aSLionel Sambuc 449*f4a2713aSLionel Sambuc __m256i test_mm256_sign_epi16(__m256i a, __m256i b) { 450*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psign.w 451*f4a2713aSLionel Sambuc return _mm256_sign_epi16(a, b); 452*f4a2713aSLionel Sambuc } 453*f4a2713aSLionel Sambuc 454*f4a2713aSLionel Sambuc __m256i test_mm256_sign_epi32(__m256i a, __m256i b) { 455*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psign.d 456*f4a2713aSLionel Sambuc return _mm256_sign_epi32(a, b); 457*f4a2713aSLionel Sambuc } 458*f4a2713aSLionel Sambuc 459*f4a2713aSLionel Sambuc __m256i test_mm256_slli_si256(__m256i a) { 460*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psll.dq 461*f4a2713aSLionel Sambuc return _mm256_slli_si256(a, 3); 462*f4a2713aSLionel Sambuc } 463*f4a2713aSLionel Sambuc 464*f4a2713aSLionel Sambuc __m256i test_mm256_slli_epi16(__m256i a) { 465*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pslli.w 466*f4a2713aSLionel Sambuc return _mm256_slli_epi16(a, 3); 467*f4a2713aSLionel Sambuc } 468*f4a2713aSLionel Sambuc 469*f4a2713aSLionel Sambuc __m256i test_mm256_sll_epi16(__m256i a, __m128i b) { 470*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psll.w 471*f4a2713aSLionel Sambuc return _mm256_sll_epi16(a, b); 472*f4a2713aSLionel Sambuc } 473*f4a2713aSLionel Sambuc 474*f4a2713aSLionel Sambuc __m256i test_mm256_slli_epi32(__m256i a) { 475*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pslli.d 476*f4a2713aSLionel Sambuc return _mm256_slli_epi32(a, 3); 477*f4a2713aSLionel Sambuc } 478*f4a2713aSLionel Sambuc 479*f4a2713aSLionel Sambuc __m256i test_mm256_sll_epi32(__m256i a, __m128i b) { 480*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psll.d 481*f4a2713aSLionel Sambuc return _mm256_sll_epi32(a, b); 482*f4a2713aSLionel Sambuc } 483*f4a2713aSLionel Sambuc 484*f4a2713aSLionel Sambuc __m256i test_mm256_slli_epi64(__m256i a) { 485*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pslli.q 486*f4a2713aSLionel Sambuc return _mm256_slli_epi64(a, 3); 487*f4a2713aSLionel Sambuc } 488*f4a2713aSLionel Sambuc 489*f4a2713aSLionel Sambuc __m256i test_mm256_sll_epi64(__m256i a, __m128i b) { 490*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psll.q 491*f4a2713aSLionel Sambuc return _mm256_sll_epi64(a, b); 492*f4a2713aSLionel Sambuc } 493*f4a2713aSLionel Sambuc 494*f4a2713aSLionel Sambuc __m256i test_mm256_srai_epi16(__m256i a) { 495*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrai.w 496*f4a2713aSLionel Sambuc return _mm256_srai_epi16(a, 3); 497*f4a2713aSLionel Sambuc } 498*f4a2713aSLionel Sambuc 499*f4a2713aSLionel Sambuc __m256i test_mm256_sra_epi16(__m256i a, __m128i b) { 500*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psra.w 501*f4a2713aSLionel Sambuc return _mm256_sra_epi16(a, b); 502*f4a2713aSLionel Sambuc } 503*f4a2713aSLionel Sambuc 504*f4a2713aSLionel Sambuc __m256i test_mm256_srai_epi32(__m256i a) { 505*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrai.d 506*f4a2713aSLionel Sambuc return _mm256_srai_epi32(a, 3); 507*f4a2713aSLionel Sambuc } 508*f4a2713aSLionel Sambuc 509*f4a2713aSLionel Sambuc __m256i test_mm256_sra_epi32(__m256i a, __m128i b) { 510*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psra.d 511*f4a2713aSLionel Sambuc return _mm256_sra_epi32(a, b); 512*f4a2713aSLionel Sambuc } 513*f4a2713aSLionel Sambuc 514*f4a2713aSLionel Sambuc __m256i test_mm256_srli_si256(__m256i a) { 515*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrl.dq 516*f4a2713aSLionel Sambuc return _mm256_srli_si256(a, 3); 517*f4a2713aSLionel Sambuc } 518*f4a2713aSLionel Sambuc 519*f4a2713aSLionel Sambuc __m256i test_mm256_srli_epi16(__m256i a) { 520*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrli.w 521*f4a2713aSLionel Sambuc return _mm256_srli_epi16(a, 3); 522*f4a2713aSLionel Sambuc } 523*f4a2713aSLionel Sambuc 524*f4a2713aSLionel Sambuc __m256i test_mm256_srl_epi16(__m256i a, __m128i b) { 525*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrl.w 526*f4a2713aSLionel Sambuc return _mm256_srl_epi16(a, b); 527*f4a2713aSLionel Sambuc } 528*f4a2713aSLionel Sambuc 529*f4a2713aSLionel Sambuc __m256i test_mm256_srli_epi32(__m256i a) { 530*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrli.d 531*f4a2713aSLionel Sambuc return _mm256_srli_epi32(a, 3); 532*f4a2713aSLionel Sambuc } 533*f4a2713aSLionel Sambuc 534*f4a2713aSLionel Sambuc __m256i test_mm256_srl_epi32(__m256i a, __m128i b) { 535*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrl.d 536*f4a2713aSLionel Sambuc return _mm256_srl_epi32(a, b); 537*f4a2713aSLionel Sambuc } 538*f4a2713aSLionel Sambuc 539*f4a2713aSLionel Sambuc __m256i test_mm256_srli_epi64(__m256i a) { 540*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrli.q 541*f4a2713aSLionel Sambuc return _mm256_srli_epi64(a, 3); 542*f4a2713aSLionel Sambuc } 543*f4a2713aSLionel Sambuc 544*f4a2713aSLionel Sambuc __m256i test_mm256_srl_epi64(__m256i a, __m128i b) { 545*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrl.q 546*f4a2713aSLionel Sambuc return _mm256_srl_epi64(a, b); 547*f4a2713aSLionel Sambuc } 548*f4a2713aSLionel Sambuc 549*f4a2713aSLionel Sambuc __m256i test_mm256_unpackhi_epi8(__m256i a, __m256i b) { 550*f4a2713aSLionel Sambuc // CHECK: shufflevector <32 x i8> %{{.*}}, <32 x i8> %{{.*}}, <32 x i32> <i32 8, i32 40, i32 9, i32 41, i32 10, i32 42, i32 11, i32 43, i32 12, i32 44, i32 13, i32 45, i32 14, i32 46, i32 15, i32 47, i32 24, i32 56, i32 25, i32 57, i32 26, i32 58, i32 27, i32 59, i32 28, i32 60, i32 29, i32 61, i32 30, i32 62, i32 31, i32 63> 551*f4a2713aSLionel Sambuc return _mm256_unpackhi_epi8(a, b); 552*f4a2713aSLionel Sambuc } 553*f4a2713aSLionel Sambuc 554*f4a2713aSLionel Sambuc __m256i test_mm256_unpackhi_epi16(__m256i a, __m256i b) { 555*f4a2713aSLionel Sambuc // CHECK: shufflevector <16 x i16> %{{.*}}, <16 x i16> %{{.*}}, <16 x i32> <i32 4, i32 20, i32 5, i32 21, i32 6, i32 22, i32 7, i32 23, i32 12, i32 28, i32 13, i32 29, i32 14, i32 30, i32 15, i32 31> 556*f4a2713aSLionel Sambuc return _mm256_unpackhi_epi16(a, b); 557*f4a2713aSLionel Sambuc } 558*f4a2713aSLionel Sambuc 559*f4a2713aSLionel Sambuc __m256i test_mm256_unpackhi_epi32(__m256i a, __m256i b) { 560*f4a2713aSLionel Sambuc // CHECK: shufflevector <8 x i32> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15> 561*f4a2713aSLionel Sambuc return _mm256_unpackhi_epi32(a, b); 562*f4a2713aSLionel Sambuc } 563*f4a2713aSLionel Sambuc 564*f4a2713aSLionel Sambuc __m256i test_mm256_unpackhi_epi64(__m256i a, __m256i b) { 565*f4a2713aSLionel Sambuc // CHECK: shufflevector <4 x i64> %{{.*}}, <4 x i64> %{{.*}}, <4 x i32> <i32 1, i32 5, i32 3, i32 7> 566*f4a2713aSLionel Sambuc return _mm256_unpackhi_epi64(a, b); 567*f4a2713aSLionel Sambuc } 568*f4a2713aSLionel Sambuc 569*f4a2713aSLionel Sambuc __m256i test_mm256_unpacklo_epi8(__m256i a, __m256i b) { 570*f4a2713aSLionel Sambuc // CHECK: shufflevector <32 x i8> %{{.*}}, <32 x i8> %{{.*}}, <32 x i32> <i32 0, i32 32, i32 1, i32 33, i32 2, i32 34, i32 3, i32 35, i32 4, i32 36, i32 5, i32 37, i32 6, i32 38, i32 7, i32 39, i32 16, i32 48, i32 17, i32 49, i32 18, i32 50, i32 19, i32 51, i32 20, i32 52, i32 21, i32 53, i32 22, i32 54, i32 23, i32 55> 571*f4a2713aSLionel Sambuc return _mm256_unpacklo_epi8(a, b); 572*f4a2713aSLionel Sambuc } 573*f4a2713aSLionel Sambuc 574*f4a2713aSLionel Sambuc __m256i test_mm256_unpacklo_epi16(__m256i a, __m256i b) { 575*f4a2713aSLionel Sambuc // CHECK: shufflevector <16 x i16> %{{.*}}, <16 x i16> %{{.*}}, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 2, i32 18, i32 3, i32 19, i32 8, i32 24, i32 9, i32 25, i32 10, i32 26, i32 11, i32 27> 576*f4a2713aSLionel Sambuc return _mm256_unpacklo_epi16(a, b); 577*f4a2713aSLionel Sambuc } 578*f4a2713aSLionel Sambuc 579*f4a2713aSLionel Sambuc __m256i test_mm256_unpacklo_epi32(__m256i a, __m256i b) { 580*f4a2713aSLionel Sambuc // CHECK: shufflevector <8 x i32> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13> 581*f4a2713aSLionel Sambuc return _mm256_unpacklo_epi32(a, b); 582*f4a2713aSLionel Sambuc } 583*f4a2713aSLionel Sambuc 584*f4a2713aSLionel Sambuc __m256i test_mm256_unpacklo_epi64(__m256i a, __m256i b) { 585*f4a2713aSLionel Sambuc // CHECK: shufflevector <4 x i64> %{{.*}}, <4 x i64> %{{.*}}, <4 x i32> <i32 0, i32 4, i32 2, i32 6> 586*f4a2713aSLionel Sambuc return _mm256_unpacklo_epi64(a, b); 587*f4a2713aSLionel Sambuc } 588*f4a2713aSLionel Sambuc 589*f4a2713aSLionel Sambuc __m256i test_mm256_stream_load_si256(__m256i *a) { 590*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.movntdqa 591*f4a2713aSLionel Sambuc return _mm256_stream_load_si256(a); 592*f4a2713aSLionel Sambuc } 593*f4a2713aSLionel Sambuc 594*f4a2713aSLionel Sambuc __m128 test_mm_broadcastss_ps(__m128 a) { 595*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.vbroadcast.ss.ps 596*f4a2713aSLionel Sambuc return _mm_broadcastss_ps(a); 597*f4a2713aSLionel Sambuc } 598*f4a2713aSLionel Sambuc 599*f4a2713aSLionel Sambuc __m256 test_mm256_broadcastss_ps(__m128 a) { 600*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.vbroadcast.ss.ps.256 601*f4a2713aSLionel Sambuc return _mm256_broadcastss_ps(a); 602*f4a2713aSLionel Sambuc } 603*f4a2713aSLionel Sambuc 604*f4a2713aSLionel Sambuc __m256d test_mm256_broadcastsd_pd(__m128d a) { 605*f4a2713aSLionel Sambuc // check: @llvm.x86.avx2.vbroadcast.sd.pd.256 606*f4a2713aSLionel Sambuc return _mm256_broadcastsd_pd(a); 607*f4a2713aSLionel Sambuc } 608*f4a2713aSLionel Sambuc 609*f4a2713aSLionel Sambuc __m256i test_mm256_broadcastsi128_si256(__m128i a) { 610*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.vbroadcasti128 611*f4a2713aSLionel Sambuc return _mm256_broadcastsi128_si256(a); 612*f4a2713aSLionel Sambuc } 613*f4a2713aSLionel Sambuc 614*f4a2713aSLionel Sambuc __m128i test_mm_blend_epi32(__m128i a, __m128i b) { 615*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pblendd.128 616*f4a2713aSLionel Sambuc return _mm_blend_epi32(a, b, 57); 617*f4a2713aSLionel Sambuc } 618*f4a2713aSLionel Sambuc 619*f4a2713aSLionel Sambuc __m256i test_mm256_blend_epi32(__m256i a, __m256i b) { 620*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pblendd.256 621*f4a2713aSLionel Sambuc return _mm256_blend_epi32(a, b, 57); 622*f4a2713aSLionel Sambuc } 623*f4a2713aSLionel Sambuc 624*f4a2713aSLionel Sambuc __m256i test_mm256_broadcastb_epi8(__m128i a) { 625*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pbroadcastb.256 626*f4a2713aSLionel Sambuc return _mm256_broadcastb_epi8(a); 627*f4a2713aSLionel Sambuc } 628*f4a2713aSLionel Sambuc 629*f4a2713aSLionel Sambuc __m256i test_mm256_broadcastw_epi16(__m128i a) { 630*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pbroadcastw.256 631*f4a2713aSLionel Sambuc return _mm256_broadcastw_epi16(a); 632*f4a2713aSLionel Sambuc } 633*f4a2713aSLionel Sambuc 634*f4a2713aSLionel Sambuc __m256i test_mm256_broadcastd_epi32(__m128i a) { 635*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pbroadcastd.256 636*f4a2713aSLionel Sambuc return _mm256_broadcastd_epi32(a); 637*f4a2713aSLionel Sambuc } 638*f4a2713aSLionel Sambuc 639*f4a2713aSLionel Sambuc __m256i test_mm256_broadcastq_epi64(__m128i a) { 640*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pbroadcastq.256 641*f4a2713aSLionel Sambuc return _mm256_broadcastq_epi64(a); 642*f4a2713aSLionel Sambuc } 643*f4a2713aSLionel Sambuc 644*f4a2713aSLionel Sambuc __m128i test_mm_broadcastb_epi8(__m128i a) { 645*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pbroadcastb.128 646*f4a2713aSLionel Sambuc return _mm_broadcastb_epi8(a); 647*f4a2713aSLionel Sambuc } 648*f4a2713aSLionel Sambuc 649*f4a2713aSLionel Sambuc __m128i test_mm_broadcastw_epi16(__m128i a) { 650*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pbroadcastw.128 651*f4a2713aSLionel Sambuc return _mm_broadcastw_epi16(a); 652*f4a2713aSLionel Sambuc } 653*f4a2713aSLionel Sambuc 654*f4a2713aSLionel Sambuc __m128i test_mm_broadcastd_epi32(__m128i a) { 655*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pbroadcastd.128 656*f4a2713aSLionel Sambuc return _mm_broadcastd_epi32(a); 657*f4a2713aSLionel Sambuc } 658*f4a2713aSLionel Sambuc 659*f4a2713aSLionel Sambuc __m128i test_mm_broadcastq_epi64(__m128i a) { 660*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.pbroadcastq.128 661*f4a2713aSLionel Sambuc return _mm_broadcastq_epi64(a); 662*f4a2713aSLionel Sambuc } 663*f4a2713aSLionel Sambuc 664*f4a2713aSLionel Sambuc __m256i test_mm256_permutevar8x32_epi32(__m256i a, __m256i b) { 665*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.permd 666*f4a2713aSLionel Sambuc return _mm256_permutevar8x32_epi32(a, b); 667*f4a2713aSLionel Sambuc } 668*f4a2713aSLionel Sambuc 669*f4a2713aSLionel Sambuc __m256d test_mm256_permute4x64_pd(__m256d a) { 670*f4a2713aSLionel Sambuc // CHECK: shufflevector{{.*}}<i32 1, i32 2, i32 1, i32 0> 671*f4a2713aSLionel Sambuc return _mm256_permute4x64_pd(a, 25); 672*f4a2713aSLionel Sambuc } 673*f4a2713aSLionel Sambuc 674*f4a2713aSLionel Sambuc __m256 test_mm256_permutevar8x32_ps(__m256 a, __m256 b) { 675*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.permps 676*f4a2713aSLionel Sambuc return _mm256_permutevar8x32_ps(a, b); 677*f4a2713aSLionel Sambuc } 678*f4a2713aSLionel Sambuc 679*f4a2713aSLionel Sambuc __m256i test_mm256_permute4x64_epi64(__m256i a) { 680*f4a2713aSLionel Sambuc // CHECK: shufflevector{{.*}}<i32 3, i32 0, i32 2, i32 0> 681*f4a2713aSLionel Sambuc return _mm256_permute4x64_epi64(a, 35); 682*f4a2713aSLionel Sambuc } 683*f4a2713aSLionel Sambuc 684*f4a2713aSLionel Sambuc __m256i test_mm256_permute2x128_si256(__m256i a, __m256i b) { 685*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.vperm2i128 686*f4a2713aSLionel Sambuc return _mm256_permute2x128_si256(a, b, 0x31); 687*f4a2713aSLionel Sambuc } 688*f4a2713aSLionel Sambuc 689*f4a2713aSLionel Sambuc __m128i test_mm256_extracti128_si256(__m256i a) { 690*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.vextracti128 691*f4a2713aSLionel Sambuc return _mm256_extracti128_si256(a, 1); 692*f4a2713aSLionel Sambuc } 693*f4a2713aSLionel Sambuc 694*f4a2713aSLionel Sambuc __m256i test_mm256_inserti128_si256(__m256i a, __m128i b) { 695*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.vinserti128 696*f4a2713aSLionel Sambuc return _mm256_inserti128_si256(a, b, 1); 697*f4a2713aSLionel Sambuc } 698*f4a2713aSLionel Sambuc 699*f4a2713aSLionel Sambuc __m256i test_mm256_maskload_epi32(int const *a, __m256i m) { 700*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.maskload.d.256 701*f4a2713aSLionel Sambuc return _mm256_maskload_epi32(a, m); 702*f4a2713aSLionel Sambuc } 703*f4a2713aSLionel Sambuc 704*f4a2713aSLionel Sambuc __m256i test_mm256_maskload_epi64(long long const *a, __m256i m) { 705*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.maskload.q.256 706*f4a2713aSLionel Sambuc return _mm256_maskload_epi64(a, m); 707*f4a2713aSLionel Sambuc } 708*f4a2713aSLionel Sambuc 709*f4a2713aSLionel Sambuc __m128i test_mm_maskload_epi32(int const *a, __m128i m) { 710*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.maskload.d 711*f4a2713aSLionel Sambuc return _mm_maskload_epi32(a, m); 712*f4a2713aSLionel Sambuc } 713*f4a2713aSLionel Sambuc 714*f4a2713aSLionel Sambuc __m128i test_mm_maskload_epi64(long long const *a, __m128i m) { 715*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.maskload.q 716*f4a2713aSLionel Sambuc return _mm_maskload_epi64(a, m); 717*f4a2713aSLionel Sambuc } 718*f4a2713aSLionel Sambuc 719*f4a2713aSLionel Sambuc void test_mm256_maskstore_epi32(int *a, __m256i m, __m256i b) { 720*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.maskstore.d.256 721*f4a2713aSLionel Sambuc _mm256_maskstore_epi32(a, m, b); 722*f4a2713aSLionel Sambuc } 723*f4a2713aSLionel Sambuc 724*f4a2713aSLionel Sambuc void test_mm256_maskstore_epi64(long long *a, __m256i m, __m256i b) { 725*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.maskstore.q.256 726*f4a2713aSLionel Sambuc _mm256_maskstore_epi64(a, m, b); 727*f4a2713aSLionel Sambuc } 728*f4a2713aSLionel Sambuc 729*f4a2713aSLionel Sambuc void test_mm_maskstore_epi32(int *a, __m128i m, __m128i b) { 730*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.maskstore.d 731*f4a2713aSLionel Sambuc _mm_maskstore_epi32(a, m, b); 732*f4a2713aSLionel Sambuc } 733*f4a2713aSLionel Sambuc 734*f4a2713aSLionel Sambuc void test_mm_maskstore_epi64(long long *a, __m128i m, __m128i b) { 735*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.maskstore.q 736*f4a2713aSLionel Sambuc _mm_maskstore_epi64(a, m, b); 737*f4a2713aSLionel Sambuc } 738*f4a2713aSLionel Sambuc 739*f4a2713aSLionel Sambuc __m256i test_mm256_sllv_epi32(__m256i a, __m256i b) { 740*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psllv.d.256 741*f4a2713aSLionel Sambuc return _mm256_sllv_epi32(a, b); 742*f4a2713aSLionel Sambuc } 743*f4a2713aSLionel Sambuc 744*f4a2713aSLionel Sambuc __m128i test_mm_sllv_epi32(__m128i a, __m128i b) { 745*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psllv.d 746*f4a2713aSLionel Sambuc return _mm_sllv_epi32(a, b); 747*f4a2713aSLionel Sambuc } 748*f4a2713aSLionel Sambuc 749*f4a2713aSLionel Sambuc __m256i test_mm256_sllv_epi64(__m256i a, __m256i b) { 750*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psllv.q.256 751*f4a2713aSLionel Sambuc return _mm256_sllv_epi64(a, b); 752*f4a2713aSLionel Sambuc } 753*f4a2713aSLionel Sambuc 754*f4a2713aSLionel Sambuc __m128i test_mm_sllv_epi64(__m128i a, __m128i b) { 755*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psllv.q 756*f4a2713aSLionel Sambuc return _mm_sllv_epi64(a, b); 757*f4a2713aSLionel Sambuc } 758*f4a2713aSLionel Sambuc 759*f4a2713aSLionel Sambuc __m256i test_mm256_srav_epi32(__m256i a, __m256i b) { 760*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrav.d.256 761*f4a2713aSLionel Sambuc return _mm256_srav_epi32(a, b); 762*f4a2713aSLionel Sambuc } 763*f4a2713aSLionel Sambuc 764*f4a2713aSLionel Sambuc __m128i test_mm_srav_epi32(__m128i a, __m128i b) { 765*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrav.d 766*f4a2713aSLionel Sambuc return _mm_srav_epi32(a, b); 767*f4a2713aSLionel Sambuc } 768*f4a2713aSLionel Sambuc 769*f4a2713aSLionel Sambuc __m256i test_mm256_srlv_epi32(__m256i a, __m256i b) { 770*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrlv.d.256 771*f4a2713aSLionel Sambuc return _mm256_srlv_epi32(a, b); 772*f4a2713aSLionel Sambuc } 773*f4a2713aSLionel Sambuc 774*f4a2713aSLionel Sambuc __m128i test_mm_srlv_epi32(__m128i a, __m128i b) { 775*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrlv.d 776*f4a2713aSLionel Sambuc return _mm_srlv_epi32(a, b); 777*f4a2713aSLionel Sambuc } 778*f4a2713aSLionel Sambuc 779*f4a2713aSLionel Sambuc __m256i test_mm256_srlv_epi64(__m256i a, __m256i b) { 780*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrlv.q.256 781*f4a2713aSLionel Sambuc return _mm256_srlv_epi64(a, b); 782*f4a2713aSLionel Sambuc } 783*f4a2713aSLionel Sambuc 784*f4a2713aSLionel Sambuc __m128i test_mm_srlv_epi64(__m128i a, __m128i b) { 785*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.psrlv.q 786*f4a2713aSLionel Sambuc return _mm_srlv_epi64(a, b); 787*f4a2713aSLionel Sambuc } 788*f4a2713aSLionel Sambuc 789*f4a2713aSLionel Sambuc __m128d test_mm_mask_i32gather_pd(__m128d a, double const *b, __m128i c, 790*f4a2713aSLionel Sambuc __m128d d) { 791*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.pd 792*f4a2713aSLionel Sambuc return _mm_mask_i32gather_pd(a, b, c, d, 2); 793*f4a2713aSLionel Sambuc } 794*f4a2713aSLionel Sambuc 795*f4a2713aSLionel Sambuc __m256d test_mm256_mask_i32gather_pd(__m256d a, double const *b, __m128i c, 796*f4a2713aSLionel Sambuc __m256d d) { 797*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.pd.256 798*f4a2713aSLionel Sambuc return _mm256_mask_i32gather_pd(a, b, c, d, 2); 799*f4a2713aSLionel Sambuc } 800*f4a2713aSLionel Sambuc __m128d test_mm_mask_i64gather_pd(__m128d a, double const *b, __m128i c, 801*f4a2713aSLionel Sambuc __m128d d) { 802*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.pd 803*f4a2713aSLionel Sambuc return _mm_mask_i64gather_pd(a, b, c, d, 2); 804*f4a2713aSLionel Sambuc } 805*f4a2713aSLionel Sambuc __m256d test_mm256_mask_i64gather_pd(__m256d a, double const *b, __m256i c, 806*f4a2713aSLionel Sambuc __m256d d) { 807*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.pd.256 808*f4a2713aSLionel Sambuc return _mm256_mask_i64gather_pd(a, b, c, d, 2); 809*f4a2713aSLionel Sambuc } 810*f4a2713aSLionel Sambuc 811*f4a2713aSLionel Sambuc __m128 test_mm_mask_i32gather_ps(__m128 a, float const *b, __m128i c, 812*f4a2713aSLionel Sambuc __m128 d) { 813*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.ps 814*f4a2713aSLionel Sambuc return _mm_mask_i32gather_ps(a, b, c, d, 2); 815*f4a2713aSLionel Sambuc } 816*f4a2713aSLionel Sambuc __m256 test_mm256_mask_i32gather_ps(__m256 a, float const *b, __m256i c, 817*f4a2713aSLionel Sambuc __m256 d) { 818*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.ps.256 819*f4a2713aSLionel Sambuc return _mm256_mask_i32gather_ps(a, b, c, d, 2); 820*f4a2713aSLionel Sambuc } 821*f4a2713aSLionel Sambuc __m128 test_mm_mask_i64gather_ps(__m128 a, float const *b, __m128i c, 822*f4a2713aSLionel Sambuc __m128 d) { 823*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.ps 824*f4a2713aSLionel Sambuc return _mm_mask_i64gather_ps(a, b, c, d, 2); 825*f4a2713aSLionel Sambuc } 826*f4a2713aSLionel Sambuc __m128 test_mm256_mask_i64gather_ps(__m128 a, float const *b, __m256i c, 827*f4a2713aSLionel Sambuc __m128 d) { 828*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.ps.256 829*f4a2713aSLionel Sambuc return _mm256_mask_i64gather_ps(a, b, c, d, 2); 830*f4a2713aSLionel Sambuc } 831*f4a2713aSLionel Sambuc 832*f4a2713aSLionel Sambuc __m128i test_mm_mask_i32gather_epi32(__m128i a, int const *b, __m128i c, 833*f4a2713aSLionel Sambuc __m128i d) { 834*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.d 835*f4a2713aSLionel Sambuc return _mm_mask_i32gather_epi32(a, b, c, d, 2); 836*f4a2713aSLionel Sambuc } 837*f4a2713aSLionel Sambuc __m256i test_mm256_mask_i32gather_epi32(__m256i a, int const *b, __m256i c, 838*f4a2713aSLionel Sambuc __m256i d) { 839*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.d.256 840*f4a2713aSLionel Sambuc return _mm256_mask_i32gather_epi32(a, b, c, d, 2); 841*f4a2713aSLionel Sambuc } 842*f4a2713aSLionel Sambuc __m128i test_mm_mask_i64gather_epi32(__m128i a, int const *b, __m128i c, 843*f4a2713aSLionel Sambuc __m128i d) { 844*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.d 845*f4a2713aSLionel Sambuc return _mm_mask_i64gather_epi32(a, b, c, d, 2); 846*f4a2713aSLionel Sambuc } 847*f4a2713aSLionel Sambuc __m128i test_mm256_mask_i64gather_epi32(__m128i a, int const *b, __m256i c, 848*f4a2713aSLionel Sambuc __m128i d) { 849*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.d.256 850*f4a2713aSLionel Sambuc return _mm256_mask_i64gather_epi32(a, b, c, d, 2); 851*f4a2713aSLionel Sambuc } 852*f4a2713aSLionel Sambuc 853*f4a2713aSLionel Sambuc __m128i test_mm_mask_i32gather_epi64(__m128i a, long long const *b, __m128i c, 854*f4a2713aSLionel Sambuc __m128i d) { 855*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.q 856*f4a2713aSLionel Sambuc return _mm_mask_i32gather_epi64(a, b, c, d, 2); 857*f4a2713aSLionel Sambuc } 858*f4a2713aSLionel Sambuc __m256i test_mm256_mask_i32gather_epi64(__m256i a, long long const *b, __m128i c, 859*f4a2713aSLionel Sambuc __m256i d) { 860*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.q.256 861*f4a2713aSLionel Sambuc return _mm256_mask_i32gather_epi64(a, b, c, d, 2); 862*f4a2713aSLionel Sambuc } 863*f4a2713aSLionel Sambuc __m128i test_mm_mask_i64gather_epi64(__m128i a, long long const *b, __m128i c, 864*f4a2713aSLionel Sambuc __m128i d) { 865*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.q 866*f4a2713aSLionel Sambuc return _mm_mask_i64gather_epi64(a, b, c, d, 2); 867*f4a2713aSLionel Sambuc } 868*f4a2713aSLionel Sambuc __m256i test_mm256_mask_i64gather_epi64(__m256i a, long long const *b, __m256i c, 869*f4a2713aSLionel Sambuc __m256i d) { 870*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.q.256 871*f4a2713aSLionel Sambuc return _mm256_mask_i64gather_epi64(a, b, c, d, 2); 872*f4a2713aSLionel Sambuc } 873*f4a2713aSLionel Sambuc 874*f4a2713aSLionel Sambuc __m128d test_mm_i32gather_pd(double const *b, __m128i c) { 875*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.pd 876*f4a2713aSLionel Sambuc return _mm_i32gather_pd(b, c, 2); 877*f4a2713aSLionel Sambuc } 878*f4a2713aSLionel Sambuc __m256d test_mm256_i32gather_pd(double const *b, __m128i c) { 879*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.pd.256 880*f4a2713aSLionel Sambuc return _mm256_i32gather_pd(b, c, 2); 881*f4a2713aSLionel Sambuc } 882*f4a2713aSLionel Sambuc __m128d test_mm_i64gather_pd(double const *b, __m128i c) { 883*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.pd 884*f4a2713aSLionel Sambuc return _mm_i64gather_pd(b, c, 2); 885*f4a2713aSLionel Sambuc } 886*f4a2713aSLionel Sambuc __m256d test_mm256_i64gather_pd(double const *b, __m256i c) { 887*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.pd.256 888*f4a2713aSLionel Sambuc return _mm256_i64gather_pd(b, c, 2); 889*f4a2713aSLionel Sambuc } 890*f4a2713aSLionel Sambuc __m128 test_mm_i32gather_ps(float const *b, __m128i c) { 891*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.ps 892*f4a2713aSLionel Sambuc return _mm_i32gather_ps(b, c, 2); 893*f4a2713aSLionel Sambuc } 894*f4a2713aSLionel Sambuc __m256 test_mm256_i32gather_ps(float const *b, __m256i c) { 895*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.ps.256 896*f4a2713aSLionel Sambuc return _mm256_i32gather_ps(b, c, 2); 897*f4a2713aSLionel Sambuc } 898*f4a2713aSLionel Sambuc __m128 test_mm_i64gather_ps(float const *b, __m128i c) { 899*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.ps 900*f4a2713aSLionel Sambuc return _mm_i64gather_ps(b, c, 2); 901*f4a2713aSLionel Sambuc } 902*f4a2713aSLionel Sambuc __m128 test_mm256_i64gather_ps(float const *b, __m256i c) { 903*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.ps.256 904*f4a2713aSLionel Sambuc return _mm256_i64gather_ps(b, c, 2); 905*f4a2713aSLionel Sambuc } 906*f4a2713aSLionel Sambuc 907*f4a2713aSLionel Sambuc __m128i test_mm_i32gather_epi32(int const *b, __m128i c) { 908*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.d 909*f4a2713aSLionel Sambuc return _mm_i32gather_epi32(b, c, 2); 910*f4a2713aSLionel Sambuc } 911*f4a2713aSLionel Sambuc __m256i test_mm256_i32gather_epi32(int const *b, __m256i c) { 912*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.d.256 913*f4a2713aSLionel Sambuc return _mm256_i32gather_epi32(b, c, 2); 914*f4a2713aSLionel Sambuc } 915*f4a2713aSLionel Sambuc __m128i test_mm_i64gather_epi32(int const *b, __m128i c) { 916*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.d 917*f4a2713aSLionel Sambuc return _mm_i64gather_epi32(b, c, 2); 918*f4a2713aSLionel Sambuc } 919*f4a2713aSLionel Sambuc __m128i test_mm256_i64gather_epi32(int const *b, __m256i c) { 920*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.d.256 921*f4a2713aSLionel Sambuc return _mm256_i64gather_epi32(b, c, 2); 922*f4a2713aSLionel Sambuc } 923*f4a2713aSLionel Sambuc __m128i test_mm_i32gather_epi64(long long const *b, __m128i c) { 924*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.q 925*f4a2713aSLionel Sambuc return _mm_i32gather_epi64(b, c, 2); 926*f4a2713aSLionel Sambuc } 927*f4a2713aSLionel Sambuc __m256i test_mm256_i32gather_epi64(long long const *b, __m128i c) { 928*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.d.q.256 929*f4a2713aSLionel Sambuc return _mm256_i32gather_epi64(b, c, 2); 930*f4a2713aSLionel Sambuc } 931*f4a2713aSLionel Sambuc __m128i test_mm_i64gather_epi64(long long const *b, __m128i c) { 932*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.q 933*f4a2713aSLionel Sambuc return _mm_i64gather_epi64(b, c, 2); 934*f4a2713aSLionel Sambuc } 935*f4a2713aSLionel Sambuc __m256i test_mm256_i64gather_epi64(long long const *b, __m256i c) { 936*f4a2713aSLionel Sambuc // CHECK: @llvm.x86.avx2.gather.q.q.256 937*f4a2713aSLionel Sambuc return _mm256_i64gather_epi64(b, c, 2); 938*f4a2713aSLionel Sambuc } 939