xref: /minix3/external/bsd/llvm/dist/clang/test/CodeGen/avx2-builtins.c (revision f4a2713ac843a11c696ec80c0a5e3e5d80b4d338)
1*f4a2713aSLionel Sambuc // RUN: %clang_cc1 %s -O3 -triple=x86_64-apple-darwin -target-feature +avx2 -emit-llvm -o - -Werror | FileCheck %s
2*f4a2713aSLionel Sambuc 
3*f4a2713aSLionel Sambuc // Don't include mm_malloc.h, it's system specific.
4*f4a2713aSLionel Sambuc #define __MM_MALLOC_H
5*f4a2713aSLionel Sambuc 
6*f4a2713aSLionel Sambuc #include <immintrin.h>
7*f4a2713aSLionel Sambuc 
8*f4a2713aSLionel Sambuc __m256i test_mm256_mpsadbw_epu8(__m256i x, __m256i y) {
9*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.mpsadbw({{.*}}, {{.*}}, i32 3)
10*f4a2713aSLionel Sambuc   return _mm256_mpsadbw_epu8(x, y, 3);
11*f4a2713aSLionel Sambuc }
12*f4a2713aSLionel Sambuc 
13*f4a2713aSLionel Sambuc __m256i test_mm256_sad_epu8(__m256i x, __m256i y) {
14*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psad.bw
15*f4a2713aSLionel Sambuc   return _mm256_sad_epu8(x, y);
16*f4a2713aSLionel Sambuc }
17*f4a2713aSLionel Sambuc 
18*f4a2713aSLionel Sambuc __m256i test_mm256_abs_epi8(__m256i a) {
19*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pabs.b
20*f4a2713aSLionel Sambuc   return _mm256_abs_epi8(a);
21*f4a2713aSLionel Sambuc }
22*f4a2713aSLionel Sambuc 
23*f4a2713aSLionel Sambuc __m256i test_mm256_abs_epi16(__m256i a) {
24*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pabs.w
25*f4a2713aSLionel Sambuc   return _mm256_abs_epi16(a);
26*f4a2713aSLionel Sambuc }
27*f4a2713aSLionel Sambuc 
28*f4a2713aSLionel Sambuc __m256i test_mm256_abs_epi32(__m256i a) {
29*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pabs.d
30*f4a2713aSLionel Sambuc   return _mm256_abs_epi32(a);
31*f4a2713aSLionel Sambuc }
32*f4a2713aSLionel Sambuc 
33*f4a2713aSLionel Sambuc __m256i test_mm256_packs_epi16(__m256i a, __m256i b) {
34*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.packsswb
35*f4a2713aSLionel Sambuc   return _mm256_packs_epi16(a, b);
36*f4a2713aSLionel Sambuc }
37*f4a2713aSLionel Sambuc 
38*f4a2713aSLionel Sambuc __m256i test_mm256_packs_epi32(__m256i a, __m256i b) {
39*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.packssdw
40*f4a2713aSLionel Sambuc   return _mm256_packs_epi32(a, b);
41*f4a2713aSLionel Sambuc }
42*f4a2713aSLionel Sambuc 
43*f4a2713aSLionel Sambuc __m256i test_mm256_packs_epu16(__m256i a, __m256i b) {
44*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.packuswb
45*f4a2713aSLionel Sambuc   return _mm256_packus_epi16(a, b);
46*f4a2713aSLionel Sambuc }
47*f4a2713aSLionel Sambuc 
48*f4a2713aSLionel Sambuc __m256i test_mm256_packs_epu32(__m256i a, __m256i b) {
49*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.packusdw
50*f4a2713aSLionel Sambuc   return _mm256_packus_epi32(a, b);
51*f4a2713aSLionel Sambuc }
52*f4a2713aSLionel Sambuc 
53*f4a2713aSLionel Sambuc __m256i test_mm256_add_epi8(__m256i a, __m256i b) {
54*f4a2713aSLionel Sambuc   // CHECK: add <32 x i8>
55*f4a2713aSLionel Sambuc   return _mm256_add_epi8(a, b);
56*f4a2713aSLionel Sambuc }
57*f4a2713aSLionel Sambuc 
58*f4a2713aSLionel Sambuc __m256i test_mm256_add_epi16(__m256i a, __m256i b) {
59*f4a2713aSLionel Sambuc   // CHECK: add <16 x i16>
60*f4a2713aSLionel Sambuc   return _mm256_add_epi16(a, b);
61*f4a2713aSLionel Sambuc }
62*f4a2713aSLionel Sambuc 
63*f4a2713aSLionel Sambuc __m256i test_mm256_add_epi32(__m256i a, __m256i b) {
64*f4a2713aSLionel Sambuc   // CHECK: add <8 x i32>
65*f4a2713aSLionel Sambuc   return _mm256_add_epi32(a, b);
66*f4a2713aSLionel Sambuc }
67*f4a2713aSLionel Sambuc 
68*f4a2713aSLionel Sambuc __m256i test_mm256_add_epi64(__m256i a, __m256i b) {
69*f4a2713aSLionel Sambuc   // CHECK: add <4 x i64>
70*f4a2713aSLionel Sambuc   return _mm256_add_epi64(a, b);
71*f4a2713aSLionel Sambuc }
72*f4a2713aSLionel Sambuc 
73*f4a2713aSLionel Sambuc __m256i test_mm256_adds_epi8(__m256i a, __m256i b) {
74*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.padds.b
75*f4a2713aSLionel Sambuc   return _mm256_adds_epi8(a, b);
76*f4a2713aSLionel Sambuc }
77*f4a2713aSLionel Sambuc 
78*f4a2713aSLionel Sambuc __m256i test_mm256_adds_epi16(__m256i a, __m256i b) {
79*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.padds.w
80*f4a2713aSLionel Sambuc   return _mm256_adds_epi16(a, b);
81*f4a2713aSLionel Sambuc }
82*f4a2713aSLionel Sambuc 
83*f4a2713aSLionel Sambuc __m256i test_mm256_adds_epu8(__m256i a, __m256i b) {
84*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.paddus.b
85*f4a2713aSLionel Sambuc   return _mm256_adds_epu8(a, b);
86*f4a2713aSLionel Sambuc }
87*f4a2713aSLionel Sambuc 
88*f4a2713aSLionel Sambuc __m256i test_mm256_adds_epu16(__m256i a, __m256i b) {
89*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.paddus.w
90*f4a2713aSLionel Sambuc   return _mm256_adds_epu16(a, b);
91*f4a2713aSLionel Sambuc }
92*f4a2713aSLionel Sambuc 
93*f4a2713aSLionel Sambuc __m256i test_mm256_alignr_epi8(__m256i a, __m256i b) {
94*f4a2713aSLionel Sambuc   // CHECK: shufflevector <32 x i8> %{{.*}}, <32 x i8> %{{.*}}, <32 x i32> <i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 32, i32 33, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 48, i32 49>
95*f4a2713aSLionel Sambuc   return _mm256_alignr_epi8(a, b, 2);
96*f4a2713aSLionel Sambuc }
97*f4a2713aSLionel Sambuc 
98*f4a2713aSLionel Sambuc __m256i test2_mm256_alignr_epi8(__m256i a, __m256i b) {
99*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrl.dq({{.*}}, i32 8)
100*f4a2713aSLionel Sambuc   return _mm256_alignr_epi8(a, b, 17);
101*f4a2713aSLionel Sambuc }
102*f4a2713aSLionel Sambuc 
103*f4a2713aSLionel Sambuc __m256i test_mm256_sub_epi8(__m256i a, __m256i b) {
104*f4a2713aSLionel Sambuc   // CHECK: sub <32 x i8>
105*f4a2713aSLionel Sambuc   return _mm256_sub_epi8(a, b);
106*f4a2713aSLionel Sambuc }
107*f4a2713aSLionel Sambuc 
108*f4a2713aSLionel Sambuc __m256i test_mm256_sub_epi16(__m256i a, __m256i b) {
109*f4a2713aSLionel Sambuc   // CHECK: sub <16 x i16>
110*f4a2713aSLionel Sambuc   return _mm256_sub_epi16(a, b);
111*f4a2713aSLionel Sambuc }
112*f4a2713aSLionel Sambuc 
113*f4a2713aSLionel Sambuc __m256i test_mm256_sub_epi32(__m256i a, __m256i b) {
114*f4a2713aSLionel Sambuc   // CHECK: sub <8 x i32>
115*f4a2713aSLionel Sambuc   return _mm256_sub_epi32(a, b);
116*f4a2713aSLionel Sambuc }
117*f4a2713aSLionel Sambuc 
118*f4a2713aSLionel Sambuc __m256i test_mm256_sub_epi64(__m256i a, __m256i b) {
119*f4a2713aSLionel Sambuc   // CHECK: sub <4 x i64>
120*f4a2713aSLionel Sambuc   return _mm256_sub_epi64(a, b);
121*f4a2713aSLionel Sambuc }
122*f4a2713aSLionel Sambuc 
123*f4a2713aSLionel Sambuc __m256i test_mm256_subs_epi8(__m256i a, __m256i b) {
124*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psubs.b
125*f4a2713aSLionel Sambuc   return _mm256_subs_epi8(a, b);
126*f4a2713aSLionel Sambuc }
127*f4a2713aSLionel Sambuc 
128*f4a2713aSLionel Sambuc __m256i test_mm256_subs_epi16(__m256i a, __m256i b) {
129*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psubs.w
130*f4a2713aSLionel Sambuc   return _mm256_subs_epi16(a, b);
131*f4a2713aSLionel Sambuc }
132*f4a2713aSLionel Sambuc 
133*f4a2713aSLionel Sambuc __m256i test_mm256_subs_epu8(__m256i a, __m256i b) {
134*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psubus.b
135*f4a2713aSLionel Sambuc   return _mm256_subs_epu8(a, b);
136*f4a2713aSLionel Sambuc }
137*f4a2713aSLionel Sambuc 
138*f4a2713aSLionel Sambuc __m256i test_mm256_subs_epu16(__m256i a, __m256i b) {
139*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psubus.w
140*f4a2713aSLionel Sambuc   return _mm256_subs_epu16(a, b);
141*f4a2713aSLionel Sambuc }
142*f4a2713aSLionel Sambuc 
143*f4a2713aSLionel Sambuc __m256i test_mm256_and_si256(__m256i a, __m256i b) {
144*f4a2713aSLionel Sambuc   // CHECK: and <4 x i64>
145*f4a2713aSLionel Sambuc   return _mm256_and_si256(a, b);
146*f4a2713aSLionel Sambuc }
147*f4a2713aSLionel Sambuc 
148*f4a2713aSLionel Sambuc __m256i test_mm256_andnot_si256(__m256i a, __m256i b) {
149*f4a2713aSLionel Sambuc   // CHECK: xor <4 x i64>
150*f4a2713aSLionel Sambuc   // CHECK: and <4 x i64>
151*f4a2713aSLionel Sambuc   return _mm256_andnot_si256(a, b);
152*f4a2713aSLionel Sambuc }
153*f4a2713aSLionel Sambuc 
154*f4a2713aSLionel Sambuc __m256i test_mm256_or_si256(__m256i a, __m256i b) {
155*f4a2713aSLionel Sambuc   // CHECK: or <4 x i64>
156*f4a2713aSLionel Sambuc   return _mm256_or_si256(a, b);
157*f4a2713aSLionel Sambuc }
158*f4a2713aSLionel Sambuc 
159*f4a2713aSLionel Sambuc __m256i test_mm256_xor_si256(__m256i a, __m256i b) {
160*f4a2713aSLionel Sambuc   // CHECK: xor <4 x i64>
161*f4a2713aSLionel Sambuc   return _mm256_xor_si256(a, b);
162*f4a2713aSLionel Sambuc }
163*f4a2713aSLionel Sambuc 
164*f4a2713aSLionel Sambuc __m256i test_mm256_avg_epu8(__m256i a, __m256i b) {
165*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pavg.b
166*f4a2713aSLionel Sambuc   return _mm256_avg_epu8(a, b);
167*f4a2713aSLionel Sambuc }
168*f4a2713aSLionel Sambuc 
169*f4a2713aSLionel Sambuc __m256i test_mm256_avg_epu16(__m256i a, __m256i b) {
170*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pavg.w
171*f4a2713aSLionel Sambuc   return _mm256_avg_epu16(a, b);
172*f4a2713aSLionel Sambuc }
173*f4a2713aSLionel Sambuc 
174*f4a2713aSLionel Sambuc __m256i test_mm256_blendv_epi8(__m256i a, __m256i b, __m256i m) {
175*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pblendvb
176*f4a2713aSLionel Sambuc   return _mm256_blendv_epi8(a, b, m);
177*f4a2713aSLionel Sambuc }
178*f4a2713aSLionel Sambuc 
179*f4a2713aSLionel Sambuc __m256i test_mm256_blend_epi16(__m256i a, __m256i b) {
180*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pblendw(<16 x i16> %{{.*}}, <16 x i16> %{{.*}}, i32 2)
181*f4a2713aSLionel Sambuc   return _mm256_blend_epi16(a, b, 2);
182*f4a2713aSLionel Sambuc }
183*f4a2713aSLionel Sambuc 
184*f4a2713aSLionel Sambuc __m256i test_mm256_cmpeq_epi8(__m256i a, __m256i b) {
185*f4a2713aSLionel Sambuc   // CHECK: icmp eq <32 x i8>
186*f4a2713aSLionel Sambuc   return _mm256_cmpeq_epi8(a, b);
187*f4a2713aSLionel Sambuc }
188*f4a2713aSLionel Sambuc 
189*f4a2713aSLionel Sambuc __m256i test_mm256_cmpeq_epi16(__m256i a, __m256i b) {
190*f4a2713aSLionel Sambuc   // CHECK: icmp eq <16 x i16>
191*f4a2713aSLionel Sambuc   return _mm256_cmpeq_epi16(a, b);
192*f4a2713aSLionel Sambuc }
193*f4a2713aSLionel Sambuc 
194*f4a2713aSLionel Sambuc __m256i test_mm256_cmpeq_epi32(__m256i a, __m256i b) {
195*f4a2713aSLionel Sambuc   // CHECK: icmp eq <8 x i32>
196*f4a2713aSLionel Sambuc   return _mm256_cmpeq_epi32(a, b);
197*f4a2713aSLionel Sambuc }
198*f4a2713aSLionel Sambuc 
199*f4a2713aSLionel Sambuc __m256i test_mm256_cmpeq_epi64(__m256i a, __m256i b) {
200*f4a2713aSLionel Sambuc   // CHECK: icmp eq <4 x i64>
201*f4a2713aSLionel Sambuc   return _mm256_cmpeq_epi64(a, b);
202*f4a2713aSLionel Sambuc }
203*f4a2713aSLionel Sambuc 
204*f4a2713aSLionel Sambuc __m256i test_mm256_cmpgt_epi8(__m256i a, __m256i b) {
205*f4a2713aSLionel Sambuc   // CHECK: icmp sgt <32 x i8>
206*f4a2713aSLionel Sambuc   return _mm256_cmpgt_epi8(a, b);
207*f4a2713aSLionel Sambuc }
208*f4a2713aSLionel Sambuc 
209*f4a2713aSLionel Sambuc __m256i test_mm256_cmpgt_epi16(__m256i a, __m256i b) {
210*f4a2713aSLionel Sambuc   // CHECK: icmp sgt <16 x i16>
211*f4a2713aSLionel Sambuc   return _mm256_cmpgt_epi16(a, b);
212*f4a2713aSLionel Sambuc }
213*f4a2713aSLionel Sambuc 
214*f4a2713aSLionel Sambuc __m256i test_mm256_cmpgt_epi32(__m256i a, __m256i b) {
215*f4a2713aSLionel Sambuc   // CHECK: icmp sgt <8 x i32>
216*f4a2713aSLionel Sambuc   return _mm256_cmpgt_epi32(a, b);
217*f4a2713aSLionel Sambuc }
218*f4a2713aSLionel Sambuc 
219*f4a2713aSLionel Sambuc __m256i test_mm256_cmpgt_epi64(__m256i a, __m256i b) {
220*f4a2713aSLionel Sambuc   // CHECK: icmp sgt <4 x i64>
221*f4a2713aSLionel Sambuc   return _mm256_cmpgt_epi64(a, b);
222*f4a2713aSLionel Sambuc }
223*f4a2713aSLionel Sambuc 
224*f4a2713aSLionel Sambuc __m256i test_mm256_hadd_epi16(__m256i a, __m256i b) {
225*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.phadd.w
226*f4a2713aSLionel Sambuc   return _mm256_hadd_epi16(a, b);
227*f4a2713aSLionel Sambuc }
228*f4a2713aSLionel Sambuc 
229*f4a2713aSLionel Sambuc __m256i test_mm256_hadd_epi32(__m256i a, __m256i b) {
230*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.phadd.d
231*f4a2713aSLionel Sambuc   return _mm256_hadd_epi32(a, b);
232*f4a2713aSLionel Sambuc }
233*f4a2713aSLionel Sambuc 
234*f4a2713aSLionel Sambuc __m256i test_mm256_hadds_epi16(__m256i a, __m256i b) {
235*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.phadd.sw
236*f4a2713aSLionel Sambuc   return _mm256_hadds_epi16(a, b);
237*f4a2713aSLionel Sambuc }
238*f4a2713aSLionel Sambuc 
239*f4a2713aSLionel Sambuc __m256i test_mm256_hsub_epi16(__m256i a, __m256i b) {
240*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.phsub.w
241*f4a2713aSLionel Sambuc   return _mm256_hsub_epi16(a, b);
242*f4a2713aSLionel Sambuc }
243*f4a2713aSLionel Sambuc 
244*f4a2713aSLionel Sambuc __m256i test_mm256_hsub_epi32(__m256i a, __m256i b) {
245*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.phsub.d
246*f4a2713aSLionel Sambuc   return _mm256_hsub_epi32(a, b);
247*f4a2713aSLionel Sambuc }
248*f4a2713aSLionel Sambuc 
249*f4a2713aSLionel Sambuc __m256i test_mm256_hsubs_epi16(__m256i a, __m256i b) {
250*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.phsub.sw
251*f4a2713aSLionel Sambuc   return _mm256_hsubs_epi16(a, b);
252*f4a2713aSLionel Sambuc }
253*f4a2713aSLionel Sambuc 
254*f4a2713aSLionel Sambuc __m256i test_mm256_maddubs_epi16(__m256i a, __m256i b) {
255*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmadd.ub.sw
256*f4a2713aSLionel Sambuc   return _mm256_maddubs_epi16(a, b);
257*f4a2713aSLionel Sambuc }
258*f4a2713aSLionel Sambuc 
259*f4a2713aSLionel Sambuc __m256i test_mm256_madd_epi16(__m256i a, __m256i b) {
260*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmadd.wd
261*f4a2713aSLionel Sambuc   return _mm256_madd_epi16(a, b);
262*f4a2713aSLionel Sambuc }
263*f4a2713aSLionel Sambuc 
264*f4a2713aSLionel Sambuc __m256i test_mm256_max_epi8(__m256i a, __m256i b) {
265*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmaxs.b
266*f4a2713aSLionel Sambuc   return _mm256_max_epi8(a, b);
267*f4a2713aSLionel Sambuc }
268*f4a2713aSLionel Sambuc 
269*f4a2713aSLionel Sambuc __m256i test_mm256_max_epi16(__m256i a, __m256i b) {
270*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmaxs.w
271*f4a2713aSLionel Sambuc   return _mm256_max_epi16(a, b);
272*f4a2713aSLionel Sambuc }
273*f4a2713aSLionel Sambuc 
274*f4a2713aSLionel Sambuc __m256i test_mm256_max_epi32(__m256i a, __m256i b) {
275*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmaxs.d
276*f4a2713aSLionel Sambuc   return _mm256_max_epi32(a, b);
277*f4a2713aSLionel Sambuc }
278*f4a2713aSLionel Sambuc 
279*f4a2713aSLionel Sambuc __m256i test_mm256_max_epu8(__m256i a, __m256i b) {
280*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmaxu.b
281*f4a2713aSLionel Sambuc   return _mm256_max_epu8(a, b);
282*f4a2713aSLionel Sambuc }
283*f4a2713aSLionel Sambuc 
284*f4a2713aSLionel Sambuc __m256i test_mm256_max_epu16(__m256i a, __m256i b) {
285*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmaxu.w
286*f4a2713aSLionel Sambuc   return _mm256_max_epu16(a, b);
287*f4a2713aSLionel Sambuc }
288*f4a2713aSLionel Sambuc 
289*f4a2713aSLionel Sambuc __m256i test_mm256_max_epu32(__m256i a, __m256i b) {
290*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmaxu.d
291*f4a2713aSLionel Sambuc   return _mm256_max_epu32(a, b);
292*f4a2713aSLionel Sambuc }
293*f4a2713aSLionel Sambuc 
294*f4a2713aSLionel Sambuc __m256i test_mm256_min_epi8(__m256i a, __m256i b) {
295*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmins.b
296*f4a2713aSLionel Sambuc   return _mm256_min_epi8(a, b);
297*f4a2713aSLionel Sambuc }
298*f4a2713aSLionel Sambuc 
299*f4a2713aSLionel Sambuc __m256i test_mm256_min_epi16(__m256i a, __m256i b) {
300*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmins.w
301*f4a2713aSLionel Sambuc   return _mm256_min_epi16(a, b);
302*f4a2713aSLionel Sambuc }
303*f4a2713aSLionel Sambuc 
304*f4a2713aSLionel Sambuc __m256i test_mm256_min_epi32(__m256i a, __m256i b) {
305*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmins.d
306*f4a2713aSLionel Sambuc   return _mm256_min_epi32(a, b);
307*f4a2713aSLionel Sambuc }
308*f4a2713aSLionel Sambuc 
309*f4a2713aSLionel Sambuc __m256i test_mm256_min_epu8(__m256i a, __m256i b) {
310*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pminu.b
311*f4a2713aSLionel Sambuc   return _mm256_min_epu8(a, b);
312*f4a2713aSLionel Sambuc }
313*f4a2713aSLionel Sambuc 
314*f4a2713aSLionel Sambuc __m256i test_mm256_min_epu16(__m256i a, __m256i b) {
315*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pminu.w
316*f4a2713aSLionel Sambuc   return _mm256_min_epu16(a, b);
317*f4a2713aSLionel Sambuc }
318*f4a2713aSLionel Sambuc 
319*f4a2713aSLionel Sambuc __m256i test_mm256_min_epu32(__m256i a, __m256i b) {
320*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pminu.d
321*f4a2713aSLionel Sambuc   return _mm256_min_epu32(a, b);
322*f4a2713aSLionel Sambuc }
323*f4a2713aSLionel Sambuc 
324*f4a2713aSLionel Sambuc int test_mm256_movemask_epi8(__m256i a) {
325*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmovmskb
326*f4a2713aSLionel Sambuc   return _mm256_movemask_epi8(a);
327*f4a2713aSLionel Sambuc }
328*f4a2713aSLionel Sambuc 
329*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepi8_epi16(__m128i a) {
330*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmovsxbw
331*f4a2713aSLionel Sambuc   return _mm256_cvtepi8_epi16(a);
332*f4a2713aSLionel Sambuc }
333*f4a2713aSLionel Sambuc 
334*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepi8_epi32(__m128i a) {
335*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmovsxbd
336*f4a2713aSLionel Sambuc   return _mm256_cvtepi8_epi32(a);
337*f4a2713aSLionel Sambuc }
338*f4a2713aSLionel Sambuc 
339*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepi8_epi64(__m128i a) {
340*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmovsxbq
341*f4a2713aSLionel Sambuc   return _mm256_cvtepi8_epi64(a);
342*f4a2713aSLionel Sambuc }
343*f4a2713aSLionel Sambuc 
344*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepi16_epi32(__m128i a) {
345*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmovsxwd
346*f4a2713aSLionel Sambuc   return _mm256_cvtepi16_epi32(a);
347*f4a2713aSLionel Sambuc }
348*f4a2713aSLionel Sambuc 
349*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepi16_epi64(__m128i a) {
350*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmovsxwq
351*f4a2713aSLionel Sambuc   return _mm256_cvtepi16_epi64(a);
352*f4a2713aSLionel Sambuc }
353*f4a2713aSLionel Sambuc 
354*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepi32_epi64(__m128i a) {
355*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmovsxdq
356*f4a2713aSLionel Sambuc   return _mm256_cvtepi32_epi64(a);
357*f4a2713aSLionel Sambuc }
358*f4a2713aSLionel Sambuc 
359*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepu8_epi16(__m128i a) {
360*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmovzxbw
361*f4a2713aSLionel Sambuc   return _mm256_cvtepu8_epi16(a);
362*f4a2713aSLionel Sambuc }
363*f4a2713aSLionel Sambuc 
364*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepu8_epi32(__m128i a) {
365*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmovzxbd
366*f4a2713aSLionel Sambuc   return _mm256_cvtepu8_epi32(a);
367*f4a2713aSLionel Sambuc }
368*f4a2713aSLionel Sambuc 
369*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepu8_epi64(__m128i a) {
370*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmovzxbq
371*f4a2713aSLionel Sambuc   return _mm256_cvtepu8_epi64(a);
372*f4a2713aSLionel Sambuc }
373*f4a2713aSLionel Sambuc 
374*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepu16_epi32(__m128i a) {
375*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmovzxwd
376*f4a2713aSLionel Sambuc   return _mm256_cvtepu16_epi32(a);
377*f4a2713aSLionel Sambuc }
378*f4a2713aSLionel Sambuc 
379*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepu16_epi64(__m128i a) {
380*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmovzxwq
381*f4a2713aSLionel Sambuc   return _mm256_cvtepu16_epi64(a);
382*f4a2713aSLionel Sambuc }
383*f4a2713aSLionel Sambuc 
384*f4a2713aSLionel Sambuc __m256i test_mm256_cvtepu32_epi64(__m128i a) {
385*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmovzxdq
386*f4a2713aSLionel Sambuc   return _mm256_cvtepu32_epi64(a);
387*f4a2713aSLionel Sambuc }
388*f4a2713aSLionel Sambuc 
389*f4a2713aSLionel Sambuc __m256i test_mm256_mul_epi32(__m256i a, __m256i b) {
390*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmul.dq
391*f4a2713aSLionel Sambuc   return _mm256_mul_epi32(a, b);
392*f4a2713aSLionel Sambuc }
393*f4a2713aSLionel Sambuc 
394*f4a2713aSLionel Sambuc __m256i test_mm256_mulhrs_epi16(__m256i a, __m256i b) {
395*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmul.hr.sw
396*f4a2713aSLionel Sambuc   return _mm256_mulhrs_epi16(a, b);
397*f4a2713aSLionel Sambuc }
398*f4a2713aSLionel Sambuc 
399*f4a2713aSLionel Sambuc __m256i test_mm256_mulhi_epu16(__m256i a, __m256i b) {
400*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmulhu.w
401*f4a2713aSLionel Sambuc   return _mm256_mulhi_epu16(a, b);
402*f4a2713aSLionel Sambuc }
403*f4a2713aSLionel Sambuc 
404*f4a2713aSLionel Sambuc __m256i test_mm256_mulhi_epi16(__m256i a, __m256i b) {
405*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmulh.w
406*f4a2713aSLionel Sambuc   return _mm256_mulhi_epi16(a, b);
407*f4a2713aSLionel Sambuc }
408*f4a2713aSLionel Sambuc 
409*f4a2713aSLionel Sambuc __m256i test_mm256_mullo_epi16(__m256i a, __m256i b) {
410*f4a2713aSLionel Sambuc   // CHECK: mul <16 x i16>
411*f4a2713aSLionel Sambuc   return _mm256_mullo_epi16(a, b);
412*f4a2713aSLionel Sambuc }
413*f4a2713aSLionel Sambuc 
414*f4a2713aSLionel Sambuc __m256i test_mm256_mullo_epi32(__m256i a, __m256i b) {
415*f4a2713aSLionel Sambuc   // CHECK: mul <8 x i32>
416*f4a2713aSLionel Sambuc   return _mm256_mullo_epi32(a, b);
417*f4a2713aSLionel Sambuc }
418*f4a2713aSLionel Sambuc 
419*f4a2713aSLionel Sambuc __m256i test_mm256_mul_epu32(__m256i a, __m256i b) {
420*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pmulu.dq
421*f4a2713aSLionel Sambuc   return _mm256_mul_epu32(a, b);
422*f4a2713aSLionel Sambuc }
423*f4a2713aSLionel Sambuc 
424*f4a2713aSLionel Sambuc __m256i test_mm256_shuffle_epi8(__m256i a, __m256i b) {
425*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pshuf.b
426*f4a2713aSLionel Sambuc   return _mm256_shuffle_epi8(a, b);
427*f4a2713aSLionel Sambuc }
428*f4a2713aSLionel Sambuc 
429*f4a2713aSLionel Sambuc __m256i test_mm256_shuffle_epi32(__m256i a) {
430*f4a2713aSLionel Sambuc   // CHECK: shufflevector <8 x i32> %{{.*}}, <8 x i32> undef, <8 x i32> <i32 3, i32 3, i32 0, i32 0, i32 7, i32 7, i32 4, i32 4>
431*f4a2713aSLionel Sambuc   return _mm256_shuffle_epi32(a, 15);
432*f4a2713aSLionel Sambuc }
433*f4a2713aSLionel Sambuc 
434*f4a2713aSLionel Sambuc __m256i test_mm256_shufflehi_epi16(__m256i a) {
435*f4a2713aSLionel Sambuc   // CHECK: shufflevector <16 x i16> %{{.*}}, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 6, i32 6, i32 5, i32 8, i32 9, i32 10, i32 11, i32 15, i32 14, i32 14, i32 13>
436*f4a2713aSLionel Sambuc   return _mm256_shufflehi_epi16(a, 107);
437*f4a2713aSLionel Sambuc }
438*f4a2713aSLionel Sambuc 
439*f4a2713aSLionel Sambuc __m256i test_mm256_shufflelo_epi16(__m256i a) {
440*f4a2713aSLionel Sambuc   // CHECK: shufflevector <16 x i16> %{{.*}}, <16 x i16> undef, <16 x i32> <i32 3, i32 0, i32 1, i32 1, i32 4, i32 5, i32 6, i32 7, i32 11, i32 8, i32 9, i32 9, i32 12, i32 13, i32 14, i32 15>
441*f4a2713aSLionel Sambuc   return _mm256_shufflelo_epi16(a, 83);
442*f4a2713aSLionel Sambuc }
443*f4a2713aSLionel Sambuc 
444*f4a2713aSLionel Sambuc __m256i test_mm256_sign_epi8(__m256i a, __m256i b) {
445*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psign.b
446*f4a2713aSLionel Sambuc   return _mm256_sign_epi8(a, b);
447*f4a2713aSLionel Sambuc }
448*f4a2713aSLionel Sambuc 
449*f4a2713aSLionel Sambuc __m256i test_mm256_sign_epi16(__m256i a, __m256i b) {
450*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psign.w
451*f4a2713aSLionel Sambuc   return _mm256_sign_epi16(a, b);
452*f4a2713aSLionel Sambuc }
453*f4a2713aSLionel Sambuc 
454*f4a2713aSLionel Sambuc __m256i test_mm256_sign_epi32(__m256i a, __m256i b) {
455*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psign.d
456*f4a2713aSLionel Sambuc   return _mm256_sign_epi32(a, b);
457*f4a2713aSLionel Sambuc }
458*f4a2713aSLionel Sambuc 
459*f4a2713aSLionel Sambuc __m256i test_mm256_slli_si256(__m256i a) {
460*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psll.dq
461*f4a2713aSLionel Sambuc   return _mm256_slli_si256(a, 3);
462*f4a2713aSLionel Sambuc }
463*f4a2713aSLionel Sambuc 
464*f4a2713aSLionel Sambuc __m256i test_mm256_slli_epi16(__m256i a) {
465*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pslli.w
466*f4a2713aSLionel Sambuc   return _mm256_slli_epi16(a, 3);
467*f4a2713aSLionel Sambuc }
468*f4a2713aSLionel Sambuc 
469*f4a2713aSLionel Sambuc __m256i test_mm256_sll_epi16(__m256i a, __m128i b) {
470*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psll.w
471*f4a2713aSLionel Sambuc   return _mm256_sll_epi16(a, b);
472*f4a2713aSLionel Sambuc }
473*f4a2713aSLionel Sambuc 
474*f4a2713aSLionel Sambuc __m256i test_mm256_slli_epi32(__m256i a) {
475*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pslli.d
476*f4a2713aSLionel Sambuc   return _mm256_slli_epi32(a, 3);
477*f4a2713aSLionel Sambuc }
478*f4a2713aSLionel Sambuc 
479*f4a2713aSLionel Sambuc __m256i test_mm256_sll_epi32(__m256i a, __m128i b) {
480*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psll.d
481*f4a2713aSLionel Sambuc   return _mm256_sll_epi32(a, b);
482*f4a2713aSLionel Sambuc }
483*f4a2713aSLionel Sambuc 
484*f4a2713aSLionel Sambuc __m256i test_mm256_slli_epi64(__m256i a) {
485*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pslli.q
486*f4a2713aSLionel Sambuc   return _mm256_slli_epi64(a, 3);
487*f4a2713aSLionel Sambuc }
488*f4a2713aSLionel Sambuc 
489*f4a2713aSLionel Sambuc __m256i test_mm256_sll_epi64(__m256i a, __m128i b) {
490*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psll.q
491*f4a2713aSLionel Sambuc   return _mm256_sll_epi64(a, b);
492*f4a2713aSLionel Sambuc }
493*f4a2713aSLionel Sambuc 
494*f4a2713aSLionel Sambuc __m256i test_mm256_srai_epi16(__m256i a) {
495*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrai.w
496*f4a2713aSLionel Sambuc   return _mm256_srai_epi16(a, 3);
497*f4a2713aSLionel Sambuc }
498*f4a2713aSLionel Sambuc 
499*f4a2713aSLionel Sambuc __m256i test_mm256_sra_epi16(__m256i a, __m128i b) {
500*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psra.w
501*f4a2713aSLionel Sambuc   return _mm256_sra_epi16(a, b);
502*f4a2713aSLionel Sambuc }
503*f4a2713aSLionel Sambuc 
504*f4a2713aSLionel Sambuc __m256i test_mm256_srai_epi32(__m256i a) {
505*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrai.d
506*f4a2713aSLionel Sambuc   return _mm256_srai_epi32(a, 3);
507*f4a2713aSLionel Sambuc }
508*f4a2713aSLionel Sambuc 
509*f4a2713aSLionel Sambuc __m256i test_mm256_sra_epi32(__m256i a, __m128i b) {
510*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psra.d
511*f4a2713aSLionel Sambuc   return _mm256_sra_epi32(a, b);
512*f4a2713aSLionel Sambuc }
513*f4a2713aSLionel Sambuc 
514*f4a2713aSLionel Sambuc __m256i test_mm256_srli_si256(__m256i a) {
515*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrl.dq
516*f4a2713aSLionel Sambuc   return _mm256_srli_si256(a, 3);
517*f4a2713aSLionel Sambuc }
518*f4a2713aSLionel Sambuc 
519*f4a2713aSLionel Sambuc __m256i test_mm256_srli_epi16(__m256i a) {
520*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrli.w
521*f4a2713aSLionel Sambuc   return _mm256_srli_epi16(a, 3);
522*f4a2713aSLionel Sambuc }
523*f4a2713aSLionel Sambuc 
524*f4a2713aSLionel Sambuc __m256i test_mm256_srl_epi16(__m256i a, __m128i b) {
525*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrl.w
526*f4a2713aSLionel Sambuc   return _mm256_srl_epi16(a, b);
527*f4a2713aSLionel Sambuc }
528*f4a2713aSLionel Sambuc 
529*f4a2713aSLionel Sambuc __m256i test_mm256_srli_epi32(__m256i a) {
530*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrli.d
531*f4a2713aSLionel Sambuc   return _mm256_srli_epi32(a, 3);
532*f4a2713aSLionel Sambuc }
533*f4a2713aSLionel Sambuc 
534*f4a2713aSLionel Sambuc __m256i test_mm256_srl_epi32(__m256i a, __m128i b) {
535*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrl.d
536*f4a2713aSLionel Sambuc   return _mm256_srl_epi32(a, b);
537*f4a2713aSLionel Sambuc }
538*f4a2713aSLionel Sambuc 
539*f4a2713aSLionel Sambuc __m256i test_mm256_srli_epi64(__m256i a) {
540*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrli.q
541*f4a2713aSLionel Sambuc   return _mm256_srli_epi64(a, 3);
542*f4a2713aSLionel Sambuc }
543*f4a2713aSLionel Sambuc 
544*f4a2713aSLionel Sambuc __m256i test_mm256_srl_epi64(__m256i a, __m128i b) {
545*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrl.q
546*f4a2713aSLionel Sambuc   return _mm256_srl_epi64(a, b);
547*f4a2713aSLionel Sambuc }
548*f4a2713aSLionel Sambuc 
549*f4a2713aSLionel Sambuc __m256i test_mm256_unpackhi_epi8(__m256i a, __m256i b) {
550*f4a2713aSLionel Sambuc   // CHECK: shufflevector <32 x i8> %{{.*}}, <32 x i8> %{{.*}}, <32 x i32> <i32 8, i32 40, i32 9, i32 41, i32 10, i32 42, i32 11, i32 43, i32 12, i32 44, i32 13, i32 45, i32 14, i32 46, i32 15, i32 47, i32 24, i32 56, i32 25, i32 57, i32 26, i32 58, i32 27, i32 59, i32 28, i32 60, i32 29, i32 61, i32 30, i32 62, i32 31, i32 63>
551*f4a2713aSLionel Sambuc   return _mm256_unpackhi_epi8(a, b);
552*f4a2713aSLionel Sambuc }
553*f4a2713aSLionel Sambuc 
554*f4a2713aSLionel Sambuc __m256i test_mm256_unpackhi_epi16(__m256i a, __m256i b) {
555*f4a2713aSLionel Sambuc   // CHECK: shufflevector <16 x i16> %{{.*}}, <16 x i16> %{{.*}}, <16 x i32> <i32 4, i32 20, i32 5, i32 21, i32 6, i32 22, i32 7, i32 23, i32 12, i32 28, i32 13, i32 29, i32 14, i32 30, i32 15, i32 31>
556*f4a2713aSLionel Sambuc   return _mm256_unpackhi_epi16(a, b);
557*f4a2713aSLionel Sambuc }
558*f4a2713aSLionel Sambuc 
559*f4a2713aSLionel Sambuc __m256i test_mm256_unpackhi_epi32(__m256i a, __m256i b) {
560*f4a2713aSLionel Sambuc   // CHECK: shufflevector <8 x i32> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>
561*f4a2713aSLionel Sambuc   return _mm256_unpackhi_epi32(a, b);
562*f4a2713aSLionel Sambuc }
563*f4a2713aSLionel Sambuc 
564*f4a2713aSLionel Sambuc __m256i test_mm256_unpackhi_epi64(__m256i a, __m256i b) {
565*f4a2713aSLionel Sambuc   // CHECK: shufflevector <4 x i64> %{{.*}}, <4 x i64> %{{.*}}, <4 x i32> <i32 1, i32 5, i32 3, i32 7>
566*f4a2713aSLionel Sambuc   return _mm256_unpackhi_epi64(a, b);
567*f4a2713aSLionel Sambuc }
568*f4a2713aSLionel Sambuc 
569*f4a2713aSLionel Sambuc __m256i test_mm256_unpacklo_epi8(__m256i a, __m256i b) {
570*f4a2713aSLionel Sambuc   // CHECK: shufflevector <32 x i8> %{{.*}}, <32 x i8> %{{.*}}, <32 x i32> <i32 0, i32 32, i32 1, i32 33, i32 2, i32 34, i32 3, i32 35, i32 4, i32 36, i32 5, i32 37, i32 6, i32 38, i32 7, i32 39, i32 16, i32 48, i32 17, i32 49, i32 18, i32 50, i32 19, i32 51, i32 20, i32 52, i32 21, i32 53, i32 22, i32 54, i32 23, i32 55>
571*f4a2713aSLionel Sambuc   return _mm256_unpacklo_epi8(a, b);
572*f4a2713aSLionel Sambuc }
573*f4a2713aSLionel Sambuc 
574*f4a2713aSLionel Sambuc __m256i test_mm256_unpacklo_epi16(__m256i a, __m256i b) {
575*f4a2713aSLionel Sambuc   // CHECK: shufflevector <16 x i16> %{{.*}}, <16 x i16> %{{.*}}, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 2, i32 18, i32 3, i32 19, i32 8, i32 24, i32 9, i32 25, i32 10, i32 26, i32 11, i32 27>
576*f4a2713aSLionel Sambuc   return _mm256_unpacklo_epi16(a, b);
577*f4a2713aSLionel Sambuc }
578*f4a2713aSLionel Sambuc 
579*f4a2713aSLionel Sambuc __m256i test_mm256_unpacklo_epi32(__m256i a, __m256i b) {
580*f4a2713aSLionel Sambuc   // CHECK: shufflevector <8 x i32> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>
581*f4a2713aSLionel Sambuc   return _mm256_unpacklo_epi32(a, b);
582*f4a2713aSLionel Sambuc }
583*f4a2713aSLionel Sambuc 
584*f4a2713aSLionel Sambuc __m256i test_mm256_unpacklo_epi64(__m256i a, __m256i b) {
585*f4a2713aSLionel Sambuc   // CHECK: shufflevector <4 x i64> %{{.*}}, <4 x i64> %{{.*}}, <4 x i32> <i32 0, i32 4, i32 2, i32 6>
586*f4a2713aSLionel Sambuc   return _mm256_unpacklo_epi64(a, b);
587*f4a2713aSLionel Sambuc }
588*f4a2713aSLionel Sambuc 
589*f4a2713aSLionel Sambuc __m256i test_mm256_stream_load_si256(__m256i *a) {
590*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.movntdqa
591*f4a2713aSLionel Sambuc   return _mm256_stream_load_si256(a);
592*f4a2713aSLionel Sambuc }
593*f4a2713aSLionel Sambuc 
594*f4a2713aSLionel Sambuc __m128 test_mm_broadcastss_ps(__m128 a) {
595*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.vbroadcast.ss.ps
596*f4a2713aSLionel Sambuc   return _mm_broadcastss_ps(a);
597*f4a2713aSLionel Sambuc }
598*f4a2713aSLionel Sambuc 
599*f4a2713aSLionel Sambuc __m256 test_mm256_broadcastss_ps(__m128 a) {
600*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.vbroadcast.ss.ps.256
601*f4a2713aSLionel Sambuc   return _mm256_broadcastss_ps(a);
602*f4a2713aSLionel Sambuc }
603*f4a2713aSLionel Sambuc 
604*f4a2713aSLionel Sambuc __m256d test_mm256_broadcastsd_pd(__m128d a) {
605*f4a2713aSLionel Sambuc   // check: @llvm.x86.avx2.vbroadcast.sd.pd.256
606*f4a2713aSLionel Sambuc   return _mm256_broadcastsd_pd(a);
607*f4a2713aSLionel Sambuc }
608*f4a2713aSLionel Sambuc 
609*f4a2713aSLionel Sambuc __m256i test_mm256_broadcastsi128_si256(__m128i a) {
610*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.vbroadcasti128
611*f4a2713aSLionel Sambuc   return _mm256_broadcastsi128_si256(a);
612*f4a2713aSLionel Sambuc }
613*f4a2713aSLionel Sambuc 
614*f4a2713aSLionel Sambuc __m128i test_mm_blend_epi32(__m128i a, __m128i b) {
615*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pblendd.128
616*f4a2713aSLionel Sambuc   return _mm_blend_epi32(a, b, 57);
617*f4a2713aSLionel Sambuc }
618*f4a2713aSLionel Sambuc 
619*f4a2713aSLionel Sambuc __m256i test_mm256_blend_epi32(__m256i a, __m256i b) {
620*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pblendd.256
621*f4a2713aSLionel Sambuc   return _mm256_blend_epi32(a, b, 57);
622*f4a2713aSLionel Sambuc }
623*f4a2713aSLionel Sambuc 
624*f4a2713aSLionel Sambuc __m256i test_mm256_broadcastb_epi8(__m128i a) {
625*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pbroadcastb.256
626*f4a2713aSLionel Sambuc   return _mm256_broadcastb_epi8(a);
627*f4a2713aSLionel Sambuc }
628*f4a2713aSLionel Sambuc 
629*f4a2713aSLionel Sambuc __m256i test_mm256_broadcastw_epi16(__m128i a) {
630*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pbroadcastw.256
631*f4a2713aSLionel Sambuc   return _mm256_broadcastw_epi16(a);
632*f4a2713aSLionel Sambuc }
633*f4a2713aSLionel Sambuc 
634*f4a2713aSLionel Sambuc __m256i test_mm256_broadcastd_epi32(__m128i a) {
635*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pbroadcastd.256
636*f4a2713aSLionel Sambuc   return _mm256_broadcastd_epi32(a);
637*f4a2713aSLionel Sambuc }
638*f4a2713aSLionel Sambuc 
639*f4a2713aSLionel Sambuc __m256i test_mm256_broadcastq_epi64(__m128i a) {
640*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pbroadcastq.256
641*f4a2713aSLionel Sambuc   return _mm256_broadcastq_epi64(a);
642*f4a2713aSLionel Sambuc }
643*f4a2713aSLionel Sambuc 
644*f4a2713aSLionel Sambuc __m128i test_mm_broadcastb_epi8(__m128i a) {
645*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pbroadcastb.128
646*f4a2713aSLionel Sambuc   return _mm_broadcastb_epi8(a);
647*f4a2713aSLionel Sambuc }
648*f4a2713aSLionel Sambuc 
649*f4a2713aSLionel Sambuc __m128i test_mm_broadcastw_epi16(__m128i a) {
650*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pbroadcastw.128
651*f4a2713aSLionel Sambuc   return _mm_broadcastw_epi16(a);
652*f4a2713aSLionel Sambuc }
653*f4a2713aSLionel Sambuc 
654*f4a2713aSLionel Sambuc __m128i test_mm_broadcastd_epi32(__m128i a) {
655*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pbroadcastd.128
656*f4a2713aSLionel Sambuc   return _mm_broadcastd_epi32(a);
657*f4a2713aSLionel Sambuc }
658*f4a2713aSLionel Sambuc 
659*f4a2713aSLionel Sambuc __m128i test_mm_broadcastq_epi64(__m128i a) {
660*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.pbroadcastq.128
661*f4a2713aSLionel Sambuc   return _mm_broadcastq_epi64(a);
662*f4a2713aSLionel Sambuc }
663*f4a2713aSLionel Sambuc 
664*f4a2713aSLionel Sambuc __m256i test_mm256_permutevar8x32_epi32(__m256i a, __m256i b) {
665*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.permd
666*f4a2713aSLionel Sambuc   return _mm256_permutevar8x32_epi32(a, b);
667*f4a2713aSLionel Sambuc }
668*f4a2713aSLionel Sambuc 
669*f4a2713aSLionel Sambuc __m256d test_mm256_permute4x64_pd(__m256d a) {
670*f4a2713aSLionel Sambuc   // CHECK: shufflevector{{.*}}<i32 1, i32 2, i32 1, i32 0>
671*f4a2713aSLionel Sambuc   return _mm256_permute4x64_pd(a, 25);
672*f4a2713aSLionel Sambuc }
673*f4a2713aSLionel Sambuc 
674*f4a2713aSLionel Sambuc __m256 test_mm256_permutevar8x32_ps(__m256 a, __m256 b) {
675*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.permps
676*f4a2713aSLionel Sambuc   return _mm256_permutevar8x32_ps(a, b);
677*f4a2713aSLionel Sambuc }
678*f4a2713aSLionel Sambuc 
679*f4a2713aSLionel Sambuc __m256i test_mm256_permute4x64_epi64(__m256i a) {
680*f4a2713aSLionel Sambuc   // CHECK: shufflevector{{.*}}<i32 3, i32 0, i32 2, i32 0>
681*f4a2713aSLionel Sambuc   return _mm256_permute4x64_epi64(a, 35);
682*f4a2713aSLionel Sambuc }
683*f4a2713aSLionel Sambuc 
684*f4a2713aSLionel Sambuc __m256i test_mm256_permute2x128_si256(__m256i a, __m256i b) {
685*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.vperm2i128
686*f4a2713aSLionel Sambuc   return _mm256_permute2x128_si256(a, b, 0x31);
687*f4a2713aSLionel Sambuc }
688*f4a2713aSLionel Sambuc 
689*f4a2713aSLionel Sambuc __m128i test_mm256_extracti128_si256(__m256i a) {
690*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.vextracti128
691*f4a2713aSLionel Sambuc   return _mm256_extracti128_si256(a, 1);
692*f4a2713aSLionel Sambuc }
693*f4a2713aSLionel Sambuc 
694*f4a2713aSLionel Sambuc __m256i test_mm256_inserti128_si256(__m256i a, __m128i b) {
695*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.vinserti128
696*f4a2713aSLionel Sambuc   return _mm256_inserti128_si256(a, b, 1);
697*f4a2713aSLionel Sambuc }
698*f4a2713aSLionel Sambuc 
699*f4a2713aSLionel Sambuc __m256i test_mm256_maskload_epi32(int const *a, __m256i m) {
700*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.maskload.d.256
701*f4a2713aSLionel Sambuc   return _mm256_maskload_epi32(a, m);
702*f4a2713aSLionel Sambuc }
703*f4a2713aSLionel Sambuc 
704*f4a2713aSLionel Sambuc __m256i test_mm256_maskload_epi64(long long const *a, __m256i m) {
705*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.maskload.q.256
706*f4a2713aSLionel Sambuc   return _mm256_maskload_epi64(a, m);
707*f4a2713aSLionel Sambuc }
708*f4a2713aSLionel Sambuc 
709*f4a2713aSLionel Sambuc __m128i test_mm_maskload_epi32(int const *a, __m128i m) {
710*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.maskload.d
711*f4a2713aSLionel Sambuc   return _mm_maskload_epi32(a, m);
712*f4a2713aSLionel Sambuc }
713*f4a2713aSLionel Sambuc 
714*f4a2713aSLionel Sambuc __m128i test_mm_maskload_epi64(long long const *a, __m128i m) {
715*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.maskload.q
716*f4a2713aSLionel Sambuc   return _mm_maskload_epi64(a, m);
717*f4a2713aSLionel Sambuc }
718*f4a2713aSLionel Sambuc 
719*f4a2713aSLionel Sambuc void test_mm256_maskstore_epi32(int *a, __m256i m, __m256i b) {
720*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.maskstore.d.256
721*f4a2713aSLionel Sambuc   _mm256_maskstore_epi32(a, m, b);
722*f4a2713aSLionel Sambuc }
723*f4a2713aSLionel Sambuc 
724*f4a2713aSLionel Sambuc void test_mm256_maskstore_epi64(long long *a, __m256i m, __m256i b) {
725*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.maskstore.q.256
726*f4a2713aSLionel Sambuc   _mm256_maskstore_epi64(a, m, b);
727*f4a2713aSLionel Sambuc }
728*f4a2713aSLionel Sambuc 
729*f4a2713aSLionel Sambuc void test_mm_maskstore_epi32(int *a, __m128i m, __m128i b) {
730*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.maskstore.d
731*f4a2713aSLionel Sambuc   _mm_maskstore_epi32(a, m, b);
732*f4a2713aSLionel Sambuc }
733*f4a2713aSLionel Sambuc 
734*f4a2713aSLionel Sambuc void test_mm_maskstore_epi64(long long *a, __m128i m, __m128i b) {
735*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.maskstore.q
736*f4a2713aSLionel Sambuc   _mm_maskstore_epi64(a, m, b);
737*f4a2713aSLionel Sambuc }
738*f4a2713aSLionel Sambuc 
739*f4a2713aSLionel Sambuc __m256i test_mm256_sllv_epi32(__m256i a, __m256i b) {
740*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psllv.d.256
741*f4a2713aSLionel Sambuc   return _mm256_sllv_epi32(a, b);
742*f4a2713aSLionel Sambuc }
743*f4a2713aSLionel Sambuc 
744*f4a2713aSLionel Sambuc __m128i test_mm_sllv_epi32(__m128i a, __m128i b) {
745*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psllv.d
746*f4a2713aSLionel Sambuc   return _mm_sllv_epi32(a, b);
747*f4a2713aSLionel Sambuc }
748*f4a2713aSLionel Sambuc 
749*f4a2713aSLionel Sambuc __m256i test_mm256_sllv_epi64(__m256i a, __m256i b) {
750*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psllv.q.256
751*f4a2713aSLionel Sambuc   return _mm256_sllv_epi64(a, b);
752*f4a2713aSLionel Sambuc }
753*f4a2713aSLionel Sambuc 
754*f4a2713aSLionel Sambuc __m128i test_mm_sllv_epi64(__m128i a, __m128i b) {
755*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psllv.q
756*f4a2713aSLionel Sambuc   return _mm_sllv_epi64(a, b);
757*f4a2713aSLionel Sambuc }
758*f4a2713aSLionel Sambuc 
759*f4a2713aSLionel Sambuc __m256i test_mm256_srav_epi32(__m256i a, __m256i b) {
760*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrav.d.256
761*f4a2713aSLionel Sambuc   return _mm256_srav_epi32(a, b);
762*f4a2713aSLionel Sambuc }
763*f4a2713aSLionel Sambuc 
764*f4a2713aSLionel Sambuc __m128i test_mm_srav_epi32(__m128i a, __m128i b) {
765*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrav.d
766*f4a2713aSLionel Sambuc   return _mm_srav_epi32(a, b);
767*f4a2713aSLionel Sambuc }
768*f4a2713aSLionel Sambuc 
769*f4a2713aSLionel Sambuc __m256i test_mm256_srlv_epi32(__m256i a, __m256i b) {
770*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrlv.d.256
771*f4a2713aSLionel Sambuc   return _mm256_srlv_epi32(a, b);
772*f4a2713aSLionel Sambuc }
773*f4a2713aSLionel Sambuc 
774*f4a2713aSLionel Sambuc __m128i test_mm_srlv_epi32(__m128i a, __m128i b) {
775*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrlv.d
776*f4a2713aSLionel Sambuc   return _mm_srlv_epi32(a, b);
777*f4a2713aSLionel Sambuc }
778*f4a2713aSLionel Sambuc 
779*f4a2713aSLionel Sambuc __m256i test_mm256_srlv_epi64(__m256i a, __m256i b) {
780*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrlv.q.256
781*f4a2713aSLionel Sambuc   return _mm256_srlv_epi64(a, b);
782*f4a2713aSLionel Sambuc }
783*f4a2713aSLionel Sambuc 
784*f4a2713aSLionel Sambuc __m128i test_mm_srlv_epi64(__m128i a, __m128i b) {
785*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.psrlv.q
786*f4a2713aSLionel Sambuc   return _mm_srlv_epi64(a, b);
787*f4a2713aSLionel Sambuc }
788*f4a2713aSLionel Sambuc 
789*f4a2713aSLionel Sambuc __m128d test_mm_mask_i32gather_pd(__m128d a, double const *b, __m128i c,
790*f4a2713aSLionel Sambuc                                   __m128d d) {
791*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.pd
792*f4a2713aSLionel Sambuc   return _mm_mask_i32gather_pd(a, b, c, d, 2);
793*f4a2713aSLionel Sambuc }
794*f4a2713aSLionel Sambuc 
795*f4a2713aSLionel Sambuc __m256d test_mm256_mask_i32gather_pd(__m256d a, double const *b, __m128i c,
796*f4a2713aSLionel Sambuc                                       __m256d d) {
797*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.pd.256
798*f4a2713aSLionel Sambuc   return _mm256_mask_i32gather_pd(a, b, c, d, 2);
799*f4a2713aSLionel Sambuc }
800*f4a2713aSLionel Sambuc __m128d test_mm_mask_i64gather_pd(__m128d a, double const *b, __m128i c,
801*f4a2713aSLionel Sambuc                                   __m128d d) {
802*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.pd
803*f4a2713aSLionel Sambuc   return _mm_mask_i64gather_pd(a, b, c, d, 2);
804*f4a2713aSLionel Sambuc }
805*f4a2713aSLionel Sambuc __m256d test_mm256_mask_i64gather_pd(__m256d a, double const *b, __m256i c,
806*f4a2713aSLionel Sambuc                                       __m256d d) {
807*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.pd.256
808*f4a2713aSLionel Sambuc   return _mm256_mask_i64gather_pd(a, b, c, d, 2);
809*f4a2713aSLionel Sambuc }
810*f4a2713aSLionel Sambuc 
811*f4a2713aSLionel Sambuc __m128 test_mm_mask_i32gather_ps(__m128 a, float const *b, __m128i c,
812*f4a2713aSLionel Sambuc                                  __m128 d) {
813*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.ps
814*f4a2713aSLionel Sambuc   return _mm_mask_i32gather_ps(a, b, c, d, 2);
815*f4a2713aSLionel Sambuc }
816*f4a2713aSLionel Sambuc __m256 test_mm256_mask_i32gather_ps(__m256 a, float const *b, __m256i c,
817*f4a2713aSLionel Sambuc                                      __m256 d) {
818*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.ps.256
819*f4a2713aSLionel Sambuc   return _mm256_mask_i32gather_ps(a, b, c, d, 2);
820*f4a2713aSLionel Sambuc }
821*f4a2713aSLionel Sambuc __m128 test_mm_mask_i64gather_ps(__m128 a, float const *b, __m128i c,
822*f4a2713aSLionel Sambuc                                  __m128 d) {
823*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.ps
824*f4a2713aSLionel Sambuc   return _mm_mask_i64gather_ps(a, b, c, d, 2);
825*f4a2713aSLionel Sambuc }
826*f4a2713aSLionel Sambuc __m128 test_mm256_mask_i64gather_ps(__m128 a, float const *b, __m256i c,
827*f4a2713aSLionel Sambuc                                     __m128 d) {
828*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.ps.256
829*f4a2713aSLionel Sambuc   return _mm256_mask_i64gather_ps(a, b, c, d, 2);
830*f4a2713aSLionel Sambuc }
831*f4a2713aSLionel Sambuc 
832*f4a2713aSLionel Sambuc __m128i test_mm_mask_i32gather_epi32(__m128i a, int const *b, __m128i c,
833*f4a2713aSLionel Sambuc                                      __m128i d) {
834*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.d
835*f4a2713aSLionel Sambuc   return _mm_mask_i32gather_epi32(a, b, c, d, 2);
836*f4a2713aSLionel Sambuc }
837*f4a2713aSLionel Sambuc __m256i test_mm256_mask_i32gather_epi32(__m256i a, int const *b, __m256i c,
838*f4a2713aSLionel Sambuc                                         __m256i d) {
839*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.d.256
840*f4a2713aSLionel Sambuc   return _mm256_mask_i32gather_epi32(a, b, c, d, 2);
841*f4a2713aSLionel Sambuc }
842*f4a2713aSLionel Sambuc __m128i test_mm_mask_i64gather_epi32(__m128i a, int const *b, __m128i c,
843*f4a2713aSLionel Sambuc                                      __m128i d) {
844*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.d
845*f4a2713aSLionel Sambuc   return _mm_mask_i64gather_epi32(a, b, c, d, 2);
846*f4a2713aSLionel Sambuc }
847*f4a2713aSLionel Sambuc __m128i test_mm256_mask_i64gather_epi32(__m128i a, int const *b, __m256i c,
848*f4a2713aSLionel Sambuc                                         __m128i d) {
849*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.d.256
850*f4a2713aSLionel Sambuc   return _mm256_mask_i64gather_epi32(a, b, c, d, 2);
851*f4a2713aSLionel Sambuc }
852*f4a2713aSLionel Sambuc 
853*f4a2713aSLionel Sambuc __m128i test_mm_mask_i32gather_epi64(__m128i a, long long const *b, __m128i c,
854*f4a2713aSLionel Sambuc                                      __m128i d) {
855*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.q
856*f4a2713aSLionel Sambuc   return _mm_mask_i32gather_epi64(a, b, c, d, 2);
857*f4a2713aSLionel Sambuc }
858*f4a2713aSLionel Sambuc __m256i test_mm256_mask_i32gather_epi64(__m256i a, long long const *b, __m128i c,
859*f4a2713aSLionel Sambuc                                         __m256i d) {
860*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.q.256
861*f4a2713aSLionel Sambuc   return _mm256_mask_i32gather_epi64(a, b, c, d, 2);
862*f4a2713aSLionel Sambuc }
863*f4a2713aSLionel Sambuc __m128i test_mm_mask_i64gather_epi64(__m128i a, long long const *b, __m128i c,
864*f4a2713aSLionel Sambuc                                      __m128i d) {
865*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.q
866*f4a2713aSLionel Sambuc   return _mm_mask_i64gather_epi64(a, b, c, d, 2);
867*f4a2713aSLionel Sambuc }
868*f4a2713aSLionel Sambuc __m256i test_mm256_mask_i64gather_epi64(__m256i a, long long const *b, __m256i c,
869*f4a2713aSLionel Sambuc                                         __m256i d) {
870*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.q.256
871*f4a2713aSLionel Sambuc   return _mm256_mask_i64gather_epi64(a, b, c, d, 2);
872*f4a2713aSLionel Sambuc }
873*f4a2713aSLionel Sambuc 
874*f4a2713aSLionel Sambuc __m128d test_mm_i32gather_pd(double const *b, __m128i c) {
875*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.pd
876*f4a2713aSLionel Sambuc   return _mm_i32gather_pd(b, c, 2);
877*f4a2713aSLionel Sambuc }
878*f4a2713aSLionel Sambuc __m256d test_mm256_i32gather_pd(double const *b, __m128i c) {
879*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.pd.256
880*f4a2713aSLionel Sambuc   return _mm256_i32gather_pd(b, c, 2);
881*f4a2713aSLionel Sambuc }
882*f4a2713aSLionel Sambuc __m128d test_mm_i64gather_pd(double const *b, __m128i c) {
883*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.pd
884*f4a2713aSLionel Sambuc   return _mm_i64gather_pd(b, c, 2);
885*f4a2713aSLionel Sambuc }
886*f4a2713aSLionel Sambuc __m256d test_mm256_i64gather_pd(double const *b, __m256i c) {
887*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.pd.256
888*f4a2713aSLionel Sambuc   return _mm256_i64gather_pd(b, c, 2);
889*f4a2713aSLionel Sambuc }
890*f4a2713aSLionel Sambuc __m128 test_mm_i32gather_ps(float const *b, __m128i c) {
891*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.ps
892*f4a2713aSLionel Sambuc   return _mm_i32gather_ps(b, c, 2);
893*f4a2713aSLionel Sambuc }
894*f4a2713aSLionel Sambuc __m256 test_mm256_i32gather_ps(float const *b, __m256i c) {
895*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.ps.256
896*f4a2713aSLionel Sambuc   return _mm256_i32gather_ps(b, c, 2);
897*f4a2713aSLionel Sambuc }
898*f4a2713aSLionel Sambuc __m128 test_mm_i64gather_ps(float const *b, __m128i c) {
899*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.ps
900*f4a2713aSLionel Sambuc   return _mm_i64gather_ps(b, c, 2);
901*f4a2713aSLionel Sambuc }
902*f4a2713aSLionel Sambuc __m128 test_mm256_i64gather_ps(float const *b, __m256i c) {
903*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.ps.256
904*f4a2713aSLionel Sambuc   return _mm256_i64gather_ps(b, c, 2);
905*f4a2713aSLionel Sambuc }
906*f4a2713aSLionel Sambuc 
907*f4a2713aSLionel Sambuc __m128i test_mm_i32gather_epi32(int const *b, __m128i c) {
908*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.d
909*f4a2713aSLionel Sambuc   return _mm_i32gather_epi32(b, c, 2);
910*f4a2713aSLionel Sambuc }
911*f4a2713aSLionel Sambuc __m256i test_mm256_i32gather_epi32(int const *b, __m256i c) {
912*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.d.256
913*f4a2713aSLionel Sambuc   return _mm256_i32gather_epi32(b, c, 2);
914*f4a2713aSLionel Sambuc }
915*f4a2713aSLionel Sambuc __m128i test_mm_i64gather_epi32(int const *b, __m128i c) {
916*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.d
917*f4a2713aSLionel Sambuc   return _mm_i64gather_epi32(b, c, 2);
918*f4a2713aSLionel Sambuc }
919*f4a2713aSLionel Sambuc __m128i test_mm256_i64gather_epi32(int const *b, __m256i c) {
920*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.d.256
921*f4a2713aSLionel Sambuc   return _mm256_i64gather_epi32(b, c, 2);
922*f4a2713aSLionel Sambuc }
923*f4a2713aSLionel Sambuc __m128i test_mm_i32gather_epi64(long long const *b, __m128i c) {
924*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.q
925*f4a2713aSLionel Sambuc   return _mm_i32gather_epi64(b, c, 2);
926*f4a2713aSLionel Sambuc }
927*f4a2713aSLionel Sambuc __m256i test_mm256_i32gather_epi64(long long const *b, __m128i c) {
928*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.d.q.256
929*f4a2713aSLionel Sambuc   return _mm256_i32gather_epi64(b, c, 2);
930*f4a2713aSLionel Sambuc }
931*f4a2713aSLionel Sambuc __m128i test_mm_i64gather_epi64(long long const *b, __m128i c) {
932*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.q
933*f4a2713aSLionel Sambuc   return _mm_i64gather_epi64(b, c, 2);
934*f4a2713aSLionel Sambuc }
935*f4a2713aSLionel Sambuc __m256i test_mm256_i64gather_epi64(long long const *b, __m256i c) {
936*f4a2713aSLionel Sambuc   // CHECK: @llvm.x86.avx2.gather.q.q.256
937*f4a2713aSLionel Sambuc   return _mm256_i64gather_epi64(b, c, 2);
938*f4a2713aSLionel Sambuc }
939