xref: /llvm-project/llvm/test/Transforms/Inline/AMDGPU/amdgpu-inline-stack-struct-argument.ll (revision e3515ba3816b9cabeca6a3b03b90902ebcfd3c65)
1*e3515ba3SJanek van Oirschot; REQUIRES: asserts
2*e3515ba3SJanek van Oirschot; RUN: opt -mtriple=amdgcn-amd-amdhsa -S -passes=inline -inline-cost-full=true -inline-threshold=0 -inline-instr-cost=5 -inline-call-penalty=0 -debug-only=inline < %s 2>&1 | FileCheck %s
3*e3515ba3SJanek van Oirschot
4*e3515ba3SJanek van Oirschot; CHECK:      NOT Inlining (cost={{[0-9]+}}, threshold={{[0-9]+}}), Call:   %noinlinecall1 = call noundef i64 @non_inlining_call
5*e3515ba3SJanek van Oirschot; CHECK:      NOT Inlining (cost={{[0-9]+}}, threshold={{[0-9]+}}), Call:   %noinlinecall2 = call noundef i64 @non_inlining_call
6*e3515ba3SJanek van Oirschot; CHECK-NOT:  NOT Inlining (cost={{[0-9]+}}, threshold={{[0-9]+}}), Call:   %inlinecall1 = call noundef i64 @inlining_call
7*e3515ba3SJanek van Oirschot; CHECK-NOT:  NOT Inlining (cost={{[0-9]+}}, threshold={{[0-9]+}}), Call:   %inlinecall2 = call noundef i64 @inlining_call
8*e3515ba3SJanek van Oirschot
9*e3515ba3SJanek van Oirschot%noinlineT =  type {{ptr, ptr}, ptr, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64}
10*e3515ba3SJanek van Oirschot%inlineT =    type {{ptr, ptr}, ptr, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64}
11*e3515ba3SJanek van Oirschot
12*e3515ba3SJanek van Oirschotdefine noundef i64 @non_inlining_call(%noinlineT noundef %struc) {
13*e3515ba3SJanek van Oirschotentry:
14*e3515ba3SJanek van Oirschot  %ptra0 = extractvalue %noinlineT %struc, 0, 0
15*e3515ba3SJanek van Oirschot  %ptrb0 = extractvalue %noinlineT %struc, 0, 1
16*e3515ba3SJanek van Oirschot  %ptrc0 = extractvalue %noinlineT %struc, 1
17*e3515ba3SJanek van Oirschot  %a0 = load i64, ptr %ptra0, align 8
18*e3515ba3SJanek van Oirschot  %b0 = load i64, ptr %ptrb0, align 8
19*e3515ba3SJanek van Oirschot  %c0 = load i64, ptr %ptrc0, align 8
20*e3515ba3SJanek van Oirschot  %d0 = extractvalue %noinlineT %struc, 2
21*e3515ba3SJanek van Oirschot  %e0 = extractvalue %noinlineT %struc, 3
22*e3515ba3SJanek van Oirschot  %f0 = extractvalue %noinlineT %struc, 4
23*e3515ba3SJanek van Oirschot  %g0 = extractvalue %noinlineT %struc, 5
24*e3515ba3SJanek van Oirschot  %h0 = extractvalue %noinlineT %struc, 6
25*e3515ba3SJanek van Oirschot  %i0 = extractvalue %noinlineT %struc, 7
26*e3515ba3SJanek van Oirschot  %j0 = extractvalue %noinlineT %struc, 8
27*e3515ba3SJanek van Oirschot  %k0 = extractvalue %noinlineT %struc, 9
28*e3515ba3SJanek van Oirschot  %l0 = extractvalue %noinlineT %struc, 10
29*e3515ba3SJanek van Oirschot  %m0 = extractvalue %noinlineT %struc, 11
30*e3515ba3SJanek van Oirschot  %n0 = extractvalue %noinlineT %struc, 12
31*e3515ba3SJanek van Oirschot  %o0 = extractvalue %noinlineT %struc, 13
32*e3515ba3SJanek van Oirschot  %p0 = extractvalue %noinlineT %struc, 14
33*e3515ba3SJanek van Oirschot  %xor = xor i64 %a0, %b0
34*e3515ba3SJanek van Oirschot  %xor1 = xor i64 %xor, %c0
35*e3515ba3SJanek van Oirschot  %xor2 = xor i64 %xor1, %d0
36*e3515ba3SJanek van Oirschot  %xor3 = xor i64 %xor2, %e0
37*e3515ba3SJanek van Oirschot  %xor4 = xor i64 %xor3, %f0
38*e3515ba3SJanek van Oirschot  %xor5 = xor i64 %xor4, %g0
39*e3515ba3SJanek van Oirschot  %xor6 = xor i64 %xor5, %h0
40*e3515ba3SJanek van Oirschot  %xor7 = xor i64 %xor6, %i0
41*e3515ba3SJanek van Oirschot  %xor8 = xor i64 %xor7, %j0
42*e3515ba3SJanek van Oirschot  %xor9 = xor i64 %xor8, %k0
43*e3515ba3SJanek van Oirschot  %xor10 = xor i64 %xor9, %l0
44*e3515ba3SJanek van Oirschot  %xor11 = xor i64 %xor10, %m0
45*e3515ba3SJanek van Oirschot  %xor12 = xor i64 %xor11, %n0
46*e3515ba3SJanek van Oirschot  %xor13 = xor i64 %xor12, %o0
47*e3515ba3SJanek van Oirschot  %xor14 = xor i64 %xor13, %p0
48*e3515ba3SJanek van Oirschot  ret i64 %xor14
49*e3515ba3SJanek van Oirschot}
50*e3515ba3SJanek van Oirschot
51*e3515ba3SJanek van Oirschotdefine noundef i64 @inlining_call(%inlineT noundef %struc) {
52*e3515ba3SJanek van Oirschotentry:
53*e3515ba3SJanek van Oirschot  %ptra0 = extractvalue %inlineT %struc, 0, 0
54*e3515ba3SJanek van Oirschot  %ptrb0 = extractvalue %inlineT %struc, 0, 1
55*e3515ba3SJanek van Oirschot  %ptrc0 = extractvalue %inlineT %struc, 1
56*e3515ba3SJanek van Oirschot  %a0 = load i64, ptr %ptra0, align 8
57*e3515ba3SJanek van Oirschot  %b0 = load i64, ptr %ptrb0, align 8
58*e3515ba3SJanek van Oirschot  %c0 = load i64, ptr %ptrc0, align 8
59*e3515ba3SJanek van Oirschot  %d0 = extractvalue %inlineT %struc, 2
60*e3515ba3SJanek van Oirschot  %e0 = extractvalue %inlineT %struc, 3
61*e3515ba3SJanek van Oirschot  %f0 = extractvalue %inlineT %struc, 4
62*e3515ba3SJanek van Oirschot  %g0 = extractvalue %inlineT %struc, 5
63*e3515ba3SJanek van Oirschot  %h0 = extractvalue %inlineT %struc, 6
64*e3515ba3SJanek van Oirschot  %i0 = extractvalue %inlineT %struc, 7
65*e3515ba3SJanek van Oirschot  %j0 = extractvalue %inlineT %struc, 8
66*e3515ba3SJanek van Oirschot  %k0 = extractvalue %inlineT %struc, 9
67*e3515ba3SJanek van Oirschot  %l0 = extractvalue %inlineT %struc, 10
68*e3515ba3SJanek van Oirschot  %m0 = extractvalue %inlineT %struc, 11
69*e3515ba3SJanek van Oirschot  %n0 = extractvalue %inlineT %struc, 12
70*e3515ba3SJanek van Oirschot  %o0 = extractvalue %inlineT %struc, 13
71*e3515ba3SJanek van Oirschot  %p0 = extractvalue %inlineT %struc, 14
72*e3515ba3SJanek van Oirschot  %q0 = extractvalue %inlineT %struc, 15
73*e3515ba3SJanek van Oirschot  %xor = xor i64 %a0, %b0
74*e3515ba3SJanek van Oirschot  %xor1 = xor i64 %xor, %c0
75*e3515ba3SJanek van Oirschot  %xor2 = xor i64 %xor1, %d0
76*e3515ba3SJanek van Oirschot  %xor3 = xor i64 %xor2, %e0
77*e3515ba3SJanek van Oirschot  %xor4 = xor i64 %xor3, %f0
78*e3515ba3SJanek van Oirschot  %xor5 = xor i64 %xor4, %g0
79*e3515ba3SJanek van Oirschot  %xor6 = xor i64 %xor5, %h0
80*e3515ba3SJanek van Oirschot  %xor7 = xor i64 %xor6, %i0
81*e3515ba3SJanek van Oirschot  %xor8 = xor i64 %xor7, %j0
82*e3515ba3SJanek van Oirschot  %xor9 = xor i64 %xor8, %k0
83*e3515ba3SJanek van Oirschot  %xor10 = xor i64 %xor9, %l0
84*e3515ba3SJanek van Oirschot  %xor11 = xor i64 %xor10, %m0
85*e3515ba3SJanek van Oirschot  %xor12 = xor i64 %xor11, %n0
86*e3515ba3SJanek van Oirschot  %xor13 = xor i64 %xor12, %o0
87*e3515ba3SJanek van Oirschot  %xor14 = xor i64 %xor13, %p0
88*e3515ba3SJanek van Oirschot  %xor15 = xor i64 %xor14, %q0
89*e3515ba3SJanek van Oirschot  ret i64 %xor15
90*e3515ba3SJanek van Oirschot}
91*e3515ba3SJanek van Oirschot
92*e3515ba3SJanek van Oirschot; Calling each (non-)inlining function twice to make sure they won't get the sole call inlining cost bonus.
93*e3515ba3SJanek van Oirschotdefine i64 @Caller(ptr noundef %in) {
94*e3515ba3SJanek van Oirschotentry:
95*e3515ba3SJanek van Oirschot  %ptra0 = getelementptr inbounds i64, ptr %in, i64 0
96*e3515ba3SJanek van Oirschot  %ptrb0 = getelementptr inbounds i64, ptr %in, i64 1
97*e3515ba3SJanek van Oirschot  %ptrc0 = getelementptr inbounds i64, ptr %in, i64 2
98*e3515ba3SJanek van Oirschot  %ptrd0 = getelementptr inbounds i64, ptr %in, i64 3
99*e3515ba3SJanek van Oirschot  %ptre0 = getelementptr inbounds i64, ptr %in, i64 4
100*e3515ba3SJanek van Oirschot  %ptrf0 = getelementptr inbounds i64, ptr %in, i64 5
101*e3515ba3SJanek van Oirschot  %ptrg0 = getelementptr inbounds i64, ptr %in, i64 6
102*e3515ba3SJanek van Oirschot  %ptrh0 = getelementptr inbounds i64, ptr %in, i64 7
103*e3515ba3SJanek van Oirschot  %ptri0 = getelementptr inbounds i64, ptr %in, i64 8
104*e3515ba3SJanek van Oirschot  %ptrj0 = getelementptr inbounds i64, ptr %in, i64 9
105*e3515ba3SJanek van Oirschot  %ptrk0 = getelementptr inbounds i64, ptr %in, i64 10
106*e3515ba3SJanek van Oirschot  %ptrl0 = getelementptr inbounds i64, ptr %in, i64 11
107*e3515ba3SJanek van Oirschot  %ptrm0 = getelementptr inbounds i64, ptr %in, i64 12
108*e3515ba3SJanek van Oirschot  %ptrn0 = getelementptr inbounds i64, ptr %in, i64 13
109*e3515ba3SJanek van Oirschot  %ptro0 = getelementptr inbounds i64, ptr %in, i64 14
110*e3515ba3SJanek van Oirschot  %ptrp0 = getelementptr inbounds i64, ptr %in, i64 15
111*e3515ba3SJanek van Oirschot  %ptrq0 = getelementptr inbounds i64, ptr %in, i64 16
112*e3515ba3SJanek van Oirschot  %a0 = load i64, ptr %ptra0, align 8
113*e3515ba3SJanek van Oirschot  %b0 = load i64, ptr %ptrb0, align 8
114*e3515ba3SJanek van Oirschot  %c0 = load i64, ptr %ptrc0, align 8
115*e3515ba3SJanek van Oirschot  %d0 = load i64, ptr %ptrd0, align 8
116*e3515ba3SJanek van Oirschot  %e0 = load i64, ptr %ptre0, align 8
117*e3515ba3SJanek van Oirschot  %f0 = load i64, ptr %ptrf0, align 8
118*e3515ba3SJanek van Oirschot  %g0 = load i64, ptr %ptrg0, align 8
119*e3515ba3SJanek van Oirschot  %h0 = load i64, ptr %ptrh0, align 8
120*e3515ba3SJanek van Oirschot  %i0 = load i64, ptr %ptri0, align 8
121*e3515ba3SJanek van Oirschot  %j0 = load i64, ptr %ptrj0, align 8
122*e3515ba3SJanek van Oirschot  %k0 = load i64, ptr %ptrk0, align 8
123*e3515ba3SJanek van Oirschot  %l0 = load i64, ptr %ptrl0, align 8
124*e3515ba3SJanek van Oirschot  %m0 = load i64, ptr %ptrm0, align 8
125*e3515ba3SJanek van Oirschot  %n0 = load i64, ptr %ptrn0, align 8
126*e3515ba3SJanek van Oirschot  %o0 = load i64, ptr %ptro0, align 8
127*e3515ba3SJanek van Oirschot  %p0 = load i64, ptr %ptrp0, align 8
128*e3515ba3SJanek van Oirschot  %q0 = load i64, ptr %ptrq0, align 8
129*e3515ba3SJanek van Oirschot  %noinlinestruc1 = insertvalue %noinlineT undef, ptr %ptra0, 0, 0
130*e3515ba3SJanek van Oirschot  %noinlinestruc2 = insertvalue %noinlineT %noinlinestruc1, ptr %ptrb0, 0, 1
131*e3515ba3SJanek van Oirschot  %noinlinestruc3 = insertvalue %noinlineT %noinlinestruc2, ptr %ptrc0, 1
132*e3515ba3SJanek van Oirschot  %noinlinestruc4 = insertvalue %noinlineT %noinlinestruc3, i64 %d0, 2
133*e3515ba3SJanek van Oirschot  %noinlinestruc5 = insertvalue %noinlineT %noinlinestruc4, i64 %e0, 3
134*e3515ba3SJanek van Oirschot  %noinlinestruc6 = insertvalue %noinlineT %noinlinestruc5, i64 %f0, 4
135*e3515ba3SJanek van Oirschot  %noinlinestruc7 = insertvalue %noinlineT %noinlinestruc6, i64 %g0, 5
136*e3515ba3SJanek van Oirschot  %noinlinestruc8 = insertvalue %noinlineT %noinlinestruc7, i64 %h0, 6
137*e3515ba3SJanek van Oirschot  %noinlinestruc9 = insertvalue %noinlineT %noinlinestruc8, i64 %i0, 7
138*e3515ba3SJanek van Oirschot  %noinlinestruc10 = insertvalue %noinlineT %noinlinestruc9, i64 %j0, 8
139*e3515ba3SJanek van Oirschot  %noinlinestruc11 = insertvalue %noinlineT %noinlinestruc10, i64 %k0, 9
140*e3515ba3SJanek van Oirschot  %noinlinestruc12 = insertvalue %noinlineT %noinlinestruc11, i64 %l0, 10
141*e3515ba3SJanek van Oirschot  %noinlinestruc13 = insertvalue %noinlineT %noinlinestruc12, i64 %m0, 11
142*e3515ba3SJanek van Oirschot  %noinlinestruc14 = insertvalue %noinlineT %noinlinestruc13, i64 %n0, 12
143*e3515ba3SJanek van Oirschot  %noinlinestruc15 = insertvalue %noinlineT %noinlinestruc14, i64 %o0, 13
144*e3515ba3SJanek van Oirschot  %noinlinestruc16 = insertvalue %noinlineT %noinlinestruc15, i64 %p0, 14
145*e3515ba3SJanek van Oirschot  %inlinestruc1 = insertvalue %inlineT undef, ptr %ptra0, 0, 0
146*e3515ba3SJanek van Oirschot  %inlinestruc2 = insertvalue %inlineT %inlinestruc1, ptr %ptrb0, 0, 1
147*e3515ba3SJanek van Oirschot  %inlinestruc3 = insertvalue %inlineT %inlinestruc2, ptr %ptrc0, 1
148*e3515ba3SJanek van Oirschot  %inlinestruc4 = insertvalue %inlineT %inlinestruc3, i64 %d0, 2
149*e3515ba3SJanek van Oirschot  %inlinestruc5 = insertvalue %inlineT %inlinestruc4, i64 %e0, 3
150*e3515ba3SJanek van Oirschot  %inlinestruc6 = insertvalue %inlineT %inlinestruc5, i64 %f0, 4
151*e3515ba3SJanek van Oirschot  %inlinestruc7 = insertvalue %inlineT %inlinestruc6, i64 %g0, 5
152*e3515ba3SJanek van Oirschot  %inlinestruc8 = insertvalue %inlineT %inlinestruc7, i64 %h0, 6
153*e3515ba3SJanek van Oirschot  %inlinestruc9 = insertvalue %inlineT %inlinestruc8, i64 %i0, 7
154*e3515ba3SJanek van Oirschot  %inlinestruc10 = insertvalue %inlineT %inlinestruc9, i64 %j0, 8
155*e3515ba3SJanek van Oirschot  %inlinestruc11 = insertvalue %inlineT %inlinestruc10, i64 %k0, 9
156*e3515ba3SJanek van Oirschot  %inlinestruc12 = insertvalue %inlineT %inlinestruc11, i64 %l0, 10
157*e3515ba3SJanek van Oirschot  %inlinestruc13 = insertvalue %inlineT %inlinestruc12, i64 %m0, 11
158*e3515ba3SJanek van Oirschot  %inlinestruc14 = insertvalue %inlineT %inlinestruc13, i64 %n0, 12
159*e3515ba3SJanek van Oirschot  %inlinestruc15 = insertvalue %inlineT %inlinestruc14, i64 %o0, 13
160*e3515ba3SJanek van Oirschot  %inlinestruc16 = insertvalue %inlineT %inlinestruc15, i64 %p0, 14
161*e3515ba3SJanek van Oirschot  %inlinestruc17 = insertvalue %inlineT %inlinestruc16, i64 %q0, 15
162*e3515ba3SJanek van Oirschot  %noinlinecall1 = call noundef i64 @non_inlining_call(%noinlineT noundef %noinlinestruc16)
163*e3515ba3SJanek van Oirschot  %add = add i64 0, %noinlinecall1
164*e3515ba3SJanek van Oirschot  %noinlinecall2 = call noundef i64 @non_inlining_call(%noinlineT noundef %noinlinestruc16)
165*e3515ba3SJanek van Oirschot  %add2 = add i64 %add, %noinlinecall2
166*e3515ba3SJanek van Oirschot  %inlinecall1 = call noundef i64 @inlining_call(%inlineT noundef %inlinestruc17)
167*e3515ba3SJanek van Oirschot  %add3 = add i64 %add2, %inlinecall1
168*e3515ba3SJanek van Oirschot  %inlinecall2 = call noundef i64 @inlining_call(%inlineT noundef %inlinestruc17)
169*e3515ba3SJanek van Oirschot  %add4 = add i64 %add3, %inlinecall2
170*e3515ba3SJanek van Oirschot  ret i64 %add4
171*e3515ba3SJanek van Oirschot}
172