xref: /llvm-project/llvm/test/Transforms/Inline/AMDGPU/amdgpu-inline-stack-struct-argument.ll (revision e3515ba3816b9cabeca6a3b03b90902ebcfd3c65)
1; REQUIRES: asserts
2; RUN: opt -mtriple=amdgcn-amd-amdhsa -S -passes=inline -inline-cost-full=true -inline-threshold=0 -inline-instr-cost=5 -inline-call-penalty=0 -debug-only=inline < %s 2>&1 | FileCheck %s
3
4; CHECK:      NOT Inlining (cost={{[0-9]+}}, threshold={{[0-9]+}}), Call:   %noinlinecall1 = call noundef i64 @non_inlining_call
5; CHECK:      NOT Inlining (cost={{[0-9]+}}, threshold={{[0-9]+}}), Call:   %noinlinecall2 = call noundef i64 @non_inlining_call
6; CHECK-NOT:  NOT Inlining (cost={{[0-9]+}}, threshold={{[0-9]+}}), Call:   %inlinecall1 = call noundef i64 @inlining_call
7; CHECK-NOT:  NOT Inlining (cost={{[0-9]+}}, threshold={{[0-9]+}}), Call:   %inlinecall2 = call noundef i64 @inlining_call
8
9%noinlineT =  type {{ptr, ptr}, ptr, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64}
10%inlineT =    type {{ptr, ptr}, ptr, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64, i64}
11
12define noundef i64 @non_inlining_call(%noinlineT noundef %struc) {
13entry:
14  %ptra0 = extractvalue %noinlineT %struc, 0, 0
15  %ptrb0 = extractvalue %noinlineT %struc, 0, 1
16  %ptrc0 = extractvalue %noinlineT %struc, 1
17  %a0 = load i64, ptr %ptra0, align 8
18  %b0 = load i64, ptr %ptrb0, align 8
19  %c0 = load i64, ptr %ptrc0, align 8
20  %d0 = extractvalue %noinlineT %struc, 2
21  %e0 = extractvalue %noinlineT %struc, 3
22  %f0 = extractvalue %noinlineT %struc, 4
23  %g0 = extractvalue %noinlineT %struc, 5
24  %h0 = extractvalue %noinlineT %struc, 6
25  %i0 = extractvalue %noinlineT %struc, 7
26  %j0 = extractvalue %noinlineT %struc, 8
27  %k0 = extractvalue %noinlineT %struc, 9
28  %l0 = extractvalue %noinlineT %struc, 10
29  %m0 = extractvalue %noinlineT %struc, 11
30  %n0 = extractvalue %noinlineT %struc, 12
31  %o0 = extractvalue %noinlineT %struc, 13
32  %p0 = extractvalue %noinlineT %struc, 14
33  %xor = xor i64 %a0, %b0
34  %xor1 = xor i64 %xor, %c0
35  %xor2 = xor i64 %xor1, %d0
36  %xor3 = xor i64 %xor2, %e0
37  %xor4 = xor i64 %xor3, %f0
38  %xor5 = xor i64 %xor4, %g0
39  %xor6 = xor i64 %xor5, %h0
40  %xor7 = xor i64 %xor6, %i0
41  %xor8 = xor i64 %xor7, %j0
42  %xor9 = xor i64 %xor8, %k0
43  %xor10 = xor i64 %xor9, %l0
44  %xor11 = xor i64 %xor10, %m0
45  %xor12 = xor i64 %xor11, %n0
46  %xor13 = xor i64 %xor12, %o0
47  %xor14 = xor i64 %xor13, %p0
48  ret i64 %xor14
49}
50
51define noundef i64 @inlining_call(%inlineT noundef %struc) {
52entry:
53  %ptra0 = extractvalue %inlineT %struc, 0, 0
54  %ptrb0 = extractvalue %inlineT %struc, 0, 1
55  %ptrc0 = extractvalue %inlineT %struc, 1
56  %a0 = load i64, ptr %ptra0, align 8
57  %b0 = load i64, ptr %ptrb0, align 8
58  %c0 = load i64, ptr %ptrc0, align 8
59  %d0 = extractvalue %inlineT %struc, 2
60  %e0 = extractvalue %inlineT %struc, 3
61  %f0 = extractvalue %inlineT %struc, 4
62  %g0 = extractvalue %inlineT %struc, 5
63  %h0 = extractvalue %inlineT %struc, 6
64  %i0 = extractvalue %inlineT %struc, 7
65  %j0 = extractvalue %inlineT %struc, 8
66  %k0 = extractvalue %inlineT %struc, 9
67  %l0 = extractvalue %inlineT %struc, 10
68  %m0 = extractvalue %inlineT %struc, 11
69  %n0 = extractvalue %inlineT %struc, 12
70  %o0 = extractvalue %inlineT %struc, 13
71  %p0 = extractvalue %inlineT %struc, 14
72  %q0 = extractvalue %inlineT %struc, 15
73  %xor = xor i64 %a0, %b0
74  %xor1 = xor i64 %xor, %c0
75  %xor2 = xor i64 %xor1, %d0
76  %xor3 = xor i64 %xor2, %e0
77  %xor4 = xor i64 %xor3, %f0
78  %xor5 = xor i64 %xor4, %g0
79  %xor6 = xor i64 %xor5, %h0
80  %xor7 = xor i64 %xor6, %i0
81  %xor8 = xor i64 %xor7, %j0
82  %xor9 = xor i64 %xor8, %k0
83  %xor10 = xor i64 %xor9, %l0
84  %xor11 = xor i64 %xor10, %m0
85  %xor12 = xor i64 %xor11, %n0
86  %xor13 = xor i64 %xor12, %o0
87  %xor14 = xor i64 %xor13, %p0
88  %xor15 = xor i64 %xor14, %q0
89  ret i64 %xor15
90}
91
92; Calling each (non-)inlining function twice to make sure they won't get the sole call inlining cost bonus.
93define i64 @Caller(ptr noundef %in) {
94entry:
95  %ptra0 = getelementptr inbounds i64, ptr %in, i64 0
96  %ptrb0 = getelementptr inbounds i64, ptr %in, i64 1
97  %ptrc0 = getelementptr inbounds i64, ptr %in, i64 2
98  %ptrd0 = getelementptr inbounds i64, ptr %in, i64 3
99  %ptre0 = getelementptr inbounds i64, ptr %in, i64 4
100  %ptrf0 = getelementptr inbounds i64, ptr %in, i64 5
101  %ptrg0 = getelementptr inbounds i64, ptr %in, i64 6
102  %ptrh0 = getelementptr inbounds i64, ptr %in, i64 7
103  %ptri0 = getelementptr inbounds i64, ptr %in, i64 8
104  %ptrj0 = getelementptr inbounds i64, ptr %in, i64 9
105  %ptrk0 = getelementptr inbounds i64, ptr %in, i64 10
106  %ptrl0 = getelementptr inbounds i64, ptr %in, i64 11
107  %ptrm0 = getelementptr inbounds i64, ptr %in, i64 12
108  %ptrn0 = getelementptr inbounds i64, ptr %in, i64 13
109  %ptro0 = getelementptr inbounds i64, ptr %in, i64 14
110  %ptrp0 = getelementptr inbounds i64, ptr %in, i64 15
111  %ptrq0 = getelementptr inbounds i64, ptr %in, i64 16
112  %a0 = load i64, ptr %ptra0, align 8
113  %b0 = load i64, ptr %ptrb0, align 8
114  %c0 = load i64, ptr %ptrc0, align 8
115  %d0 = load i64, ptr %ptrd0, align 8
116  %e0 = load i64, ptr %ptre0, align 8
117  %f0 = load i64, ptr %ptrf0, align 8
118  %g0 = load i64, ptr %ptrg0, align 8
119  %h0 = load i64, ptr %ptrh0, align 8
120  %i0 = load i64, ptr %ptri0, align 8
121  %j0 = load i64, ptr %ptrj0, align 8
122  %k0 = load i64, ptr %ptrk0, align 8
123  %l0 = load i64, ptr %ptrl0, align 8
124  %m0 = load i64, ptr %ptrm0, align 8
125  %n0 = load i64, ptr %ptrn0, align 8
126  %o0 = load i64, ptr %ptro0, align 8
127  %p0 = load i64, ptr %ptrp0, align 8
128  %q0 = load i64, ptr %ptrq0, align 8
129  %noinlinestruc1 = insertvalue %noinlineT undef, ptr %ptra0, 0, 0
130  %noinlinestruc2 = insertvalue %noinlineT %noinlinestruc1, ptr %ptrb0, 0, 1
131  %noinlinestruc3 = insertvalue %noinlineT %noinlinestruc2, ptr %ptrc0, 1
132  %noinlinestruc4 = insertvalue %noinlineT %noinlinestruc3, i64 %d0, 2
133  %noinlinestruc5 = insertvalue %noinlineT %noinlinestruc4, i64 %e0, 3
134  %noinlinestruc6 = insertvalue %noinlineT %noinlinestruc5, i64 %f0, 4
135  %noinlinestruc7 = insertvalue %noinlineT %noinlinestruc6, i64 %g0, 5
136  %noinlinestruc8 = insertvalue %noinlineT %noinlinestruc7, i64 %h0, 6
137  %noinlinestruc9 = insertvalue %noinlineT %noinlinestruc8, i64 %i0, 7
138  %noinlinestruc10 = insertvalue %noinlineT %noinlinestruc9, i64 %j0, 8
139  %noinlinestruc11 = insertvalue %noinlineT %noinlinestruc10, i64 %k0, 9
140  %noinlinestruc12 = insertvalue %noinlineT %noinlinestruc11, i64 %l0, 10
141  %noinlinestruc13 = insertvalue %noinlineT %noinlinestruc12, i64 %m0, 11
142  %noinlinestruc14 = insertvalue %noinlineT %noinlinestruc13, i64 %n0, 12
143  %noinlinestruc15 = insertvalue %noinlineT %noinlinestruc14, i64 %o0, 13
144  %noinlinestruc16 = insertvalue %noinlineT %noinlinestruc15, i64 %p0, 14
145  %inlinestruc1 = insertvalue %inlineT undef, ptr %ptra0, 0, 0
146  %inlinestruc2 = insertvalue %inlineT %inlinestruc1, ptr %ptrb0, 0, 1
147  %inlinestruc3 = insertvalue %inlineT %inlinestruc2, ptr %ptrc0, 1
148  %inlinestruc4 = insertvalue %inlineT %inlinestruc3, i64 %d0, 2
149  %inlinestruc5 = insertvalue %inlineT %inlinestruc4, i64 %e0, 3
150  %inlinestruc6 = insertvalue %inlineT %inlinestruc5, i64 %f0, 4
151  %inlinestruc7 = insertvalue %inlineT %inlinestruc6, i64 %g0, 5
152  %inlinestruc8 = insertvalue %inlineT %inlinestruc7, i64 %h0, 6
153  %inlinestruc9 = insertvalue %inlineT %inlinestruc8, i64 %i0, 7
154  %inlinestruc10 = insertvalue %inlineT %inlinestruc9, i64 %j0, 8
155  %inlinestruc11 = insertvalue %inlineT %inlinestruc10, i64 %k0, 9
156  %inlinestruc12 = insertvalue %inlineT %inlinestruc11, i64 %l0, 10
157  %inlinestruc13 = insertvalue %inlineT %inlinestruc12, i64 %m0, 11
158  %inlinestruc14 = insertvalue %inlineT %inlinestruc13, i64 %n0, 12
159  %inlinestruc15 = insertvalue %inlineT %inlinestruc14, i64 %o0, 13
160  %inlinestruc16 = insertvalue %inlineT %inlinestruc15, i64 %p0, 14
161  %inlinestruc17 = insertvalue %inlineT %inlinestruc16, i64 %q0, 15
162  %noinlinecall1 = call noundef i64 @non_inlining_call(%noinlineT noundef %noinlinestruc16)
163  %add = add i64 0, %noinlinecall1
164  %noinlinecall2 = call noundef i64 @non_inlining_call(%noinlineT noundef %noinlinestruc16)
165  %add2 = add i64 %add, %noinlinecall2
166  %inlinecall1 = call noundef i64 @inlining_call(%inlineT noundef %inlinestruc17)
167  %add3 = add i64 %add2, %inlinecall1
168  %inlinecall2 = call noundef i64 @inlining_call(%inlineT noundef %inlinestruc17)
169  %add4 = add i64 %add3, %inlinecall2
170  ret i64 %add4
171}
172