xref: /llvm-project/llvm/test/Transforms/LoopVectorize/AArch64/runtime-check-size-based-threshold.ll (revision 69ee6533131d030bc724193bfc1b91fcc99a81d2)
1; RUN: opt -passes=loop-vectorize -mtriple=arm64-apple-iphoneos -vectorizer-min-trip-count=8 \
2; RUN:   -enable-epilogue-vectorization=false -S %s | FileCheck --check-prefixes=CHECK,DEFAULT %s
3; RUN: opt -passes=loop-vectorize -mtriple=arm64-apple-iphoneos -vectorizer-min-trip-count=8 \
4; RUN:   -enable-epilogue-vectorization=false -vectorize-memory-check-threshold=1 -S %s | FileCheck --check-prefixes=CHECK,THRESHOLD %s
5
6; Tests for loops with large numbers of runtime checks. Check that loops are
7; vectorized, if the loop trip counts are large and the impact of the runtime
8; checks is very small compared to the expected loop runtimes.
9
10
11; The trip count in the loop in this function is too to warrant large runtime checks.
12; CHECK-LABEL: define {{.*}} @test_tc_too_small
13; CHECK-NOT: vector.memcheck
14; CHECK-NOT: vector.body
15define void @test_tc_too_small(ptr %ptr.1, ptr %ptr.2, ptr %ptr.3, ptr %ptr.4, i64 %off.1, i64 %off.2) {
16entry:
17  br label %loop
18
19loop:                                             ; preds = %bb54, %bb37
20  %iv = phi i64 [ 0, %entry ], [ %iv.next, %loop ]
21  %gep.1 = getelementptr inbounds i16, ptr %ptr.1, i64 %iv
22  %lv.1 = load i16, ptr %gep.1, align 2
23  %ext.1 = sext i16 %lv.1 to i32
24  %gep.2 = getelementptr inbounds i16, ptr %ptr.2, i64 %iv
25  %lv.2 = load i16, ptr %gep.2, align 2
26  %ext.2 = sext i16 %lv.2 to i32
27  %gep.off.1 = getelementptr inbounds i16, ptr %gep.2, i64 %off.1
28  %lv.3 = load i16, ptr %gep.off.1, align 2
29  %ext.3 = sext i16 %lv.3 to i32
30  %gep.off.2 = getelementptr inbounds i16, ptr %gep.2, i64 %off.2
31  %lv.4 = load i16, ptr %gep.off.2, align 2
32  %ext.4 = sext i16 %lv.4 to i32
33  %tmp62 = mul nsw i32 %ext.2, 11
34  %tmp66 = mul nsw i32 %ext.3, -4
35  %tmp70 = add nsw i32 %tmp62, 4
36  %tmp71 = add nsw i32 %tmp70, %tmp66
37  %tmp72 = add nsw i32 %tmp71, %ext.4
38  %tmp73 = lshr i32 %tmp72, 3
39  %tmp74 = add nsw i32 %tmp73, %ext.1
40  %tmp75 = lshr i32 %tmp74, 1
41  %tmp76 = mul nsw i32 %ext.2, 5
42  %tmp77 = shl nsw i32 %ext.3, 2
43  %tmp78 = add nsw i32 %tmp76, 4
44  %tmp79 = add nsw i32 %tmp78, %tmp77
45  %tmp80 = sub nsw i32 %tmp79, %ext.4
46  %tmp81 = lshr i32 %tmp80, 3
47  %tmp82 = sub nsw i32 %tmp81, %ext.1
48  %tmp83 = lshr i32 %tmp82, 1
49  %trunc.1 = trunc i32 %tmp75 to i16
50  %gep.3 = getelementptr inbounds i16, ptr %ptr.3, i64 %iv
51  store i16 %trunc.1, ptr %gep.3, align 2
52  %trunc.2 = trunc i32 %tmp83 to i16
53  %gep.4 = getelementptr inbounds i16, ptr %ptr.4, i64 %iv
54  store i16 %trunc.2, ptr %gep.4, align 2
55  %iv.next = add nuw nsw i64 %iv, 1
56  %cmp = icmp ult i64 %iv, 10
57  br i1 %cmp, label %loop, label %exit
58
59exit:
60  ret void
61}
62
63; The trip count in the loop in this function high enough to warrant large runtime checks.
64; CHECK-LABEL: define {{.*}} @test_tc_big_enough
65; DEFAULT: vector.memcheck
66; DEFAULT: vector.body
67; THRESHOLD-NOT: vector.memcheck
68; THRESHOLD-NOT: vector.body
69;
70define void @test_tc_big_enough(ptr %ptr.1, ptr %ptr.2, ptr %ptr.3, ptr %ptr.4, i64 %off.1, i64 %off.2) {
71entry:
72  br label %loop
73
74loop:                                             ; preds = %bb54, %bb37
75  %iv = phi i64 [ 0, %entry ], [ %iv.next, %loop ]
76  %gep.1 = getelementptr inbounds i16, ptr %ptr.1, i64 %iv
77  %lv.1 = load i16, ptr %gep.1, align 2
78  %ext.1 = sext i16 %lv.1 to i32
79  %gep.2 = getelementptr inbounds i16, ptr %ptr.2, i64 %iv
80  %lv.2 = load i16, ptr %gep.2, align 2
81  %ext.2 = sext i16 %lv.2 to i32
82  %gep.off.1 = getelementptr inbounds i16, ptr %gep.2, i64 %off.1
83  %lv.3 = load i16, ptr %gep.off.1, align 2
84  %ext.3 = sext i16 %lv.3 to i32
85  %gep.off.2 = getelementptr inbounds i16, ptr %gep.2, i64 %off.2
86  %lv.4 = load i16, ptr %gep.off.2, align 2
87  %ext.4 = sext i16 %lv.4 to i32
88  %tmp62 = mul nsw i32 %ext.2, 11
89  %tmp66 = mul nsw i32 %ext.3, -4
90  %tmp70 = add nsw i32 %tmp62, 4
91  %tmp71 = add nsw i32 %tmp70, %tmp66
92  %tmp72 = add nsw i32 %tmp71, %ext.4
93  %tmp73 = lshr i32 %tmp72, 3
94  %tmp74 = add nsw i32 %tmp73, %ext.1
95  %tmp75 = lshr i32 %tmp74, 1
96  %tmp76 = mul nsw i32 %ext.2, 5
97  %tmp77 = shl nsw i32 %ext.3, 2
98  %tmp78 = add nsw i32 %tmp76, 4
99  %tmp79 = add nsw i32 %tmp78, %tmp77
100  %tmp80 = sub nsw i32 %tmp79, %ext.4
101  %tmp81 = lshr i32 %tmp80, 3
102  %tmp82 = sub nsw i32 %tmp81, %ext.1
103  %tmp83 = lshr i32 %tmp82, 1
104  %trunc.1 = trunc i32 %tmp75 to i16
105  %gep.3 = getelementptr inbounds i16, ptr %ptr.3, i64 %iv
106  store i16 %trunc.1, ptr %gep.3, align 2
107  %trunc.2 = trunc i32 %tmp83 to i16
108  %gep.4 = getelementptr inbounds i16, ptr %ptr.4, i64 %iv
109  store i16 %trunc.2, ptr %gep.4, align 2
110  %iv.next = add nuw nsw i64 %iv, 1
111  %cmp = icmp ult i64 %iv, 500
112  br i1 %cmp, label %loop, label %exit
113
114exit:
115  ret void
116}
117
118define void @test_tc_unknown(ptr %ptr.1, ptr %ptr.2, ptr %ptr.3, ptr %ptr.4, i64 %off.1, i64 %off.2, i64 %N) {
119; CHECK-LABEL: define void @test_tc_unknown
120; DEFAULT:       [[ADD:%.+]] = add i64 %N, 1
121; DEFAULT-NEXT:  [[C:%.+]] = icmp ult i64 [[ADD]], 16
122; DEFAULT-NEXT:  br i1 [[C]], label %scalar.ph, label %vector.memcheck
123; THRESHOLD-NOT: vector.memcheck
124; THRESHOLD-NOT: vector.body
125;
126entry:
127  br label %loop
128
129loop:                                             ; preds = %bb54, %bb37
130  %iv = phi i64 [ 0, %entry ], [ %iv.next, %loop ]
131  %gep.1 = getelementptr inbounds i16, ptr %ptr.1, i64 %iv
132  %lv.1 = load i16, ptr %gep.1, align 2
133  %ext.1 = sext i16 %lv.1 to i32
134  %gep.2 = getelementptr inbounds i16, ptr %ptr.2, i64 %iv
135  %lv.2 = load i16, ptr %gep.2, align 2
136  %ext.2 = sext i16 %lv.2 to i32
137  %gep.off.1 = getelementptr inbounds i16, ptr %gep.2, i64 %off.1
138  %lv.3 = load i16, ptr %gep.off.1, align 2
139  %ext.3 = sext i16 %lv.3 to i32
140  %gep.off.2 = getelementptr inbounds i16, ptr %gep.2, i64 %off.2
141  %lv.4 = load i16, ptr %gep.off.2, align 2
142  %ext.4 = sext i16 %lv.4 to i32
143  %tmp62 = mul nsw i32 %ext.2, 11
144  %tmp66 = mul nsw i32 %ext.3, -4
145  %tmp70 = add nsw i32 %tmp62, 4
146  %tmp71 = add nsw i32 %tmp70, %tmp66
147  %tmp72 = add nsw i32 %tmp71, %ext.4
148  %tmp73 = lshr i32 %tmp72, 3
149  %tmp74 = add nsw i32 %tmp73, %ext.1
150  %tmp75 = lshr i32 %tmp74, 1
151  %tmp76 = mul nsw i32 %ext.2, 5
152  %tmp77 = shl nsw i32 %ext.3, 2
153  %tmp78 = add nsw i32 %tmp76, 4
154  %tmp79 = add nsw i32 %tmp78, %tmp77
155  %tmp80 = sub nsw i32 %tmp79, %ext.4
156  %tmp81 = lshr i32 %tmp80, 3
157  %tmp82 = sub nsw i32 %tmp81, %ext.1
158  %tmp83 = lshr i32 %tmp82, 1
159  %trunc.1 = trunc i32 %tmp75 to i16
160  %gep.3 = getelementptr inbounds i16, ptr %ptr.3, i64 %iv
161  store i16 %trunc.1, ptr %gep.3, align 2
162  %trunc.2 = trunc i32 %tmp83 to i16
163  %gep.4 = getelementptr inbounds i16, ptr %ptr.4, i64 %iv
164  store i16 %trunc.2, ptr %gep.4, align 2
165  %iv.next = add nuw nsw i64 %iv, 1
166  %cmp = icmp ult i64 %iv, %N
167  br i1 %cmp, label %loop, label %exit
168
169exit:
170  ret void
171}
172