Analysis/ValueTracking/knownbits-trunc-with-min-max-clamp.ll

6d7cf520Sadam-bzowski; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --version 5
6d7cf520Sadam-bzowski; RUN: opt < %s -passes=aggressive-instcombine -S | FileCheck %s
6d7cf520Sadam-bzowski
6d7cf520Sadam-bzowski; The LIT tests rely on i32, i16 and i8 being valid machine types.
*088d6361Sadam-bzowski; The bounds checking tests require also i64 and i128.
*088d6361Sadam-bzowskitarget datalayout = "n8:16:32:64:128"
6d7cf520Sadam-bzowski
6d7cf520Sadam-bzowski; This LIT test checks if TruncInstCombine pass correctly recognizes the
6d7cf520Sadam-bzowski; constraints from a signed min-max clamp. The clamp is a sequence of smin and
6d7cf520Sadam-bzowski; smax instructions limiting a variable into a range, smin <= x <= smax.
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski; Each LIT test (except the last ones) has two versions depending on the order
6d7cf520Sadam-bzowski; of smin and smax:
6d7cf520Sadam-bzowski; a) y = smax(smin(x, upper_limit), lower_limit)
6d7cf520Sadam-bzowski; b) y = smin(smax(x, lower_limit), upper_limit)
*088d6361Sadam-bzowski;
*088d6361Sadam-bzowski; The clamp is used in TruncInstCombine.cpp pass (as part of aggressive-instcombine)
*088d6361Sadam-bzowski; to optimize extensions and truncations of lshr. This is what is tested here.
*088d6361Sadam-bzowski; The pass also optimizes extensions and truncations of other binary operators,
*088d6361Sadam-bzowski; but in such cases the smin-smax clamp may not be used.
6d7cf520Sadam-bzowski
6d7cf520Sadam-bzowskidefine i8 @test_0a(i16 %x) {
6d7cf520Sadam-bzowski; CHECK-LABEL: define i8 @test_0a(
6d7cf520Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smin.i16(i16 [[X]], i16 31)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smax.i16(i16 [[TMP1]], i16 0)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[A:%.*]] = trunc i16 [[TMP2]] to i8
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i8 [[A]], 2
6d7cf520Sadam-bzowski; CHECK-NEXT:    ret i8 [[B]]
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski  %1 = tail call i16 @llvm.smin.i16(i16 %x, i16 31)
6d7cf520Sadam-bzowski  %2 = tail call i16 @llvm.smax.i16(i16 %1, i16 0)
6d7cf520Sadam-bzowski  %a = sext i16 %2 to i32
6d7cf520Sadam-bzowski  %b = lshr i32 %a, 2
6d7cf520Sadam-bzowski  %b.trunc = trunc i32 %b to i8
6d7cf520Sadam-bzowski  ret i8 %b.trunc
6d7cf520Sadam-bzowski}
6d7cf520Sadam-bzowski
6d7cf520Sadam-bzowskidefine i8 @test_0b(i16 %x) {
6d7cf520Sadam-bzowski; CHECK-LABEL: define i8 @test_0b(
6d7cf520Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smax.i16(i16 [[X]], i16 0)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smin.i16(i16 [[TMP1]], i16 31)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[A:%.*]] = trunc i16 [[TMP2]] to i8
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i8 [[A]], 2
6d7cf520Sadam-bzowski; CHECK-NEXT:    ret i8 [[B]]
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski  %1 = tail call i16 @llvm.smax.i16(i16 %x, i16 0)
6d7cf520Sadam-bzowski  %2 = tail call i16 @llvm.smin.i16(i16 %1, i16 31)
6d7cf520Sadam-bzowski  %a = sext i16 %2 to i32
6d7cf520Sadam-bzowski  %b = lshr i32 %a, 2
6d7cf520Sadam-bzowski  %b.trunc = trunc i32 %b to i8
6d7cf520Sadam-bzowski  ret i8 %b.trunc
6d7cf520Sadam-bzowski}
6d7cf520Sadam-bzowski
*088d6361Sadam-bzowski; The following two tests contain add instead of lshr.
*088d6361Sadam-bzowski; The optimization works here as well.
6d7cf520Sadam-bzowskidefine i8 @test_1a(i16 %x) {
6d7cf520Sadam-bzowski; CHECK-LABEL: define i8 @test_1a(
6d7cf520Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smin.i16(i16 [[X]], i16 31)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smax.i16(i16 [[TMP1]], i16 0)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[A:%.*]] = trunc i16 [[TMP2]] to i8
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = add i8 [[A]], 2
6d7cf520Sadam-bzowski; CHECK-NEXT:    ret i8 [[B]]
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski  %1 = tail call i16 @llvm.smin.i16(i16 %x, i16 31)
6d7cf520Sadam-bzowski  %2 = tail call i16 @llvm.smax.i16(i16 %1, i16 0)
6d7cf520Sadam-bzowski  %a = sext i16 %2 to i32
6d7cf520Sadam-bzowski  %b = add i32 %a, 2
6d7cf520Sadam-bzowski  %b.trunc = trunc i32 %b to i8
6d7cf520Sadam-bzowski  ret i8 %b.trunc
6d7cf520Sadam-bzowski}
6d7cf520Sadam-bzowski
6d7cf520Sadam-bzowskidefine i8 @test_1b(i16 %x) {
6d7cf520Sadam-bzowski; CHECK-LABEL: define i8 @test_1b(
6d7cf520Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smax.i16(i16 [[X]], i16 0)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smin.i16(i16 [[TMP1]], i16 31)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[A:%.*]] = trunc i16 [[TMP2]] to i8
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = add i8 [[A]], 2
6d7cf520Sadam-bzowski; CHECK-NEXT:    ret i8 [[B]]
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski  %1 = tail call i16 @llvm.smax.i16(i16 %x, i16 0)
6d7cf520Sadam-bzowski  %2 = tail call i16 @llvm.smin.i16(i16 %1, i16 31)
6d7cf520Sadam-bzowski  %a = sext i16 %2 to i32
6d7cf520Sadam-bzowski  %b = add i32 %a, 2
6d7cf520Sadam-bzowski  %b.trunc = trunc i32 %b to i8
6d7cf520Sadam-bzowski  ret i8 %b.trunc
6d7cf520Sadam-bzowski}
6d7cf520Sadam-bzowski
*088d6361Sadam-bzowski; Tests for clamping with negative min and max.
*088d6361Sadam-bzowski
*088d6361Sadam-bzowski; With sext no optimization occurs.
6d7cf520Sadam-bzowskidefine i8 @test_2a(i16 %x) {
6d7cf520Sadam-bzowski; CHECK-LABEL: define i8 @test_2a(
6d7cf520Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smin.i16(i16 [[X]], i16 -1)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smax.i16(i16 [[TMP1]], i16 -31)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[A:%.*]] = sext i16 [[TMP2]] to i32
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i32 [[A]], 2
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B_TRUNC:%.*]] = trunc i32 [[B]] to i8
*088d6361Sadam-bzowski; CHECK-NEXT:    ret i8 [[B_TRUNC]]
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski  %1 = tail call i16 @llvm.smin.i16(i16 %x, i16 -1)
6d7cf520Sadam-bzowski  %2 = tail call i16 @llvm.smax.i16(i16 %1, i16 -31)
6d7cf520Sadam-bzowski  %a = sext i16 %2 to i32
*088d6361Sadam-bzowski  %b = lshr i32 %a, 2
6d7cf520Sadam-bzowski  %b.trunc = trunc i32 %b to i8
6d7cf520Sadam-bzowski  ret i8 %b.trunc
6d7cf520Sadam-bzowski}
6d7cf520Sadam-bzowski
6d7cf520Sadam-bzowskidefine i8 @test_2b(i16 %x) {
6d7cf520Sadam-bzowski; CHECK-LABEL: define i8 @test_2b(
6d7cf520Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smax.i16(i16 [[X]], i16 -31)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smin.i16(i16 [[TMP1]], i16 -1)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[A:%.*]] = sext i16 [[TMP2]] to i32
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i32 [[A]], 2
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B_TRUNC:%.*]] = trunc i32 [[B]] to i8
*088d6361Sadam-bzowski; CHECK-NEXT:    ret i8 [[B_TRUNC]]
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski  %1 = tail call i16 @llvm.smax.i16(i16 %x, i16 -31)
6d7cf520Sadam-bzowski  %2 = tail call i16 @llvm.smin.i16(i16 %1, i16 -1)
6d7cf520Sadam-bzowski  %a = sext i16 %2 to i32
*088d6361Sadam-bzowski  %b = lshr i32 %a, 2
6d7cf520Sadam-bzowski  %b.trunc = trunc i32 %b to i8
6d7cf520Sadam-bzowski  ret i8 %b.trunc
6d7cf520Sadam-bzowski}
6d7cf520Sadam-bzowski
*088d6361Sadam-bzowski; With zext the optimization occurs.
*088d6361Sadam-bzowskidefine i8 @test_2c(i16 %x) {
*088d6361Sadam-bzowski; CHECK-LABEL: define i8 @test_2c(
*088d6361Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
*088d6361Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smin.i16(i16 [[X]], i16 -1)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smax.i16(i16 [[TMP1]], i16 -31)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i16 [[TMP2]], 2
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B_TRUNC:%.*]] = trunc i16 [[B]] to i8
*088d6361Sadam-bzowski; CHECK-NEXT:    ret i8 [[B_TRUNC]]
*088d6361Sadam-bzowski;
*088d6361Sadam-bzowski  %1 = tail call i16 @llvm.smin.i16(i16 %x, i16 -1)
*088d6361Sadam-bzowski  %2 = tail call i16 @llvm.smax.i16(i16 %1, i16 -31)
*088d6361Sadam-bzowski  %a = zext i16 %2 to i32
*088d6361Sadam-bzowski  %b = lshr i32 %a, 2
*088d6361Sadam-bzowski  %b.trunc = trunc i32 %b to i8
*088d6361Sadam-bzowski  ret i8 %b.trunc
*088d6361Sadam-bzowski}
*088d6361Sadam-bzowski
*088d6361Sadam-bzowskidefine i8 @test_2d(i16 %x) {
*088d6361Sadam-bzowski; CHECK-LABEL: define i8 @test_2d(
*088d6361Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
*088d6361Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smax.i16(i16 [[X]], i16 -31)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smin.i16(i16 [[TMP1]], i16 -1)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i16 [[TMP2]], 2
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B_TRUNC:%.*]] = trunc i16 [[B]] to i8
*088d6361Sadam-bzowski; CHECK-NEXT:    ret i8 [[B_TRUNC]]
*088d6361Sadam-bzowski;
*088d6361Sadam-bzowski  %1 = tail call i16 @llvm.smax.i16(i16 %x, i16 -31)
*088d6361Sadam-bzowski  %2 = tail call i16 @llvm.smin.i16(i16 %1, i16 -1)
*088d6361Sadam-bzowski  %a = zext i16 %2 to i32
*088d6361Sadam-bzowski  %b = lshr i32 %a, 2
*088d6361Sadam-bzowski  %b.trunc = trunc i32 %b to i8
*088d6361Sadam-bzowski  ret i8 %b.trunc
*088d6361Sadam-bzowski}
*088d6361Sadam-bzowski
*088d6361Sadam-bzowski; Tests for clamping with mixed-signed min and max.
*088d6361Sadam-bzowski; With zext the optimization occurs.
6d7cf520Sadam-bzowskidefine i8 @test_3a(i16 %x) {
6d7cf520Sadam-bzowski; CHECK-LABEL: define i8 @test_3a(
6d7cf520Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smin.i16(i16 [[X]], i16 31)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smax.i16(i16 [[TMP1]], i16 -31)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i16 [[TMP2]], 2
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B_TRUNC:%.*]] = trunc i16 [[B]] to i8
*088d6361Sadam-bzowski; CHECK-NEXT:    ret i8 [[B_TRUNC]]
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski  %1 = tail call i16 @llvm.smin.i16(i16 %x, i16 31)
6d7cf520Sadam-bzowski  %2 = tail call i16 @llvm.smax.i16(i16 %1, i16 -31)
*088d6361Sadam-bzowski  %a = zext i16 %2 to i32
*088d6361Sadam-bzowski  %b = lshr i32 %a, 2
6d7cf520Sadam-bzowski  %b.trunc = trunc i32 %b to i8
6d7cf520Sadam-bzowski  ret i8 %b.trunc
6d7cf520Sadam-bzowski}
6d7cf520Sadam-bzowski
6d7cf520Sadam-bzowskidefine i8 @test_3b(i16 %x) {
6d7cf520Sadam-bzowski; CHECK-LABEL: define i8 @test_3b(
6d7cf520Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smax.i16(i16 [[X]], i16 -31)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smin.i16(i16 [[TMP1]], i16 31)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i16 [[TMP2]], 2
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B_TRUNC:%.*]] = trunc i16 [[B]] to i8
*088d6361Sadam-bzowski; CHECK-NEXT:    ret i8 [[B_TRUNC]]
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski  %1 = tail call i16 @llvm.smax.i16(i16 %x, i16 -31)
6d7cf520Sadam-bzowski  %2 = tail call i16 @llvm.smin.i16(i16 %1, i16 31)
*088d6361Sadam-bzowski  %a = zext i16 %2 to i32
*088d6361Sadam-bzowski  %b = lshr i32 %a, 2
6d7cf520Sadam-bzowski  %b.trunc = trunc i32 %b to i8
6d7cf520Sadam-bzowski  ret i8 %b.trunc
6d7cf520Sadam-bzowski}
6d7cf520Sadam-bzowski
*088d6361Sadam-bzowski; Optimizations with vector types.
6d7cf520Sadam-bzowskidefine <16 x i8> @test_vec_1a(<16 x i16> %x) {
6d7cf520Sadam-bzowski; CHECK-LABEL: define <16 x i8> @test_vec_1a(
6d7cf520Sadam-bzowski; CHECK-SAME: <16 x i16> [[X:%.*]]) {
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call <16 x i16> @llvm.smin.v16i16(<16 x i16> [[X]], <16 x i16> splat (i16 127))
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call <16 x i16> @llvm.smax.v16i16(<16 x i16> [[TMP1]], <16 x i16> zeroinitializer)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[A:%.*]] = trunc <16 x i16> [[TMP2]] to <16 x i8>
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr <16 x i8> [[A]], splat (i8 2)
6d7cf520Sadam-bzowski; CHECK-NEXT:    ret <16 x i8> [[B]]
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski  %1 = tail call <16 x i16> @llvm.smin.v16i16(<16 x i16> %x, <16 x i16> splat (i16 127))
6d7cf520Sadam-bzowski  %2 = tail call <16 x i16> @llvm.smax.v16i16(<16 x i16> %1, <16 x i16> zeroinitializer)
6d7cf520Sadam-bzowski  %a = sext <16 x i16> %2 to <16 x i32>
*088d6361Sadam-bzowski  %b = lshr <16 x i32> %a, splat (i32 2)
6d7cf520Sadam-bzowski  %b.trunc = trunc <16 x i32> %b to <16 x i8>
6d7cf520Sadam-bzowski  ret <16 x i8> %b.trunc
6d7cf520Sadam-bzowski}
6d7cf520Sadam-bzowski
6d7cf520Sadam-bzowskidefine <16 x i8> @test_vec_1b(<16 x i16> %x) {
6d7cf520Sadam-bzowski; CHECK-LABEL: define <16 x i8> @test_vec_1b(
6d7cf520Sadam-bzowski; CHECK-SAME: <16 x i16> [[X:%.*]]) {
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call <16 x i16> @llvm.smax.v16i16(<16 x i16> [[X]], <16 x i16> zeroinitializer)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call <16 x i16> @llvm.smin.v16i16(<16 x i16> [[TMP1]], <16 x i16> splat (i16 127))
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[A:%.*]] = trunc <16 x i16> [[TMP2]] to <16 x i8>
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr <16 x i8> [[A]], splat (i8 2)
6d7cf520Sadam-bzowski; CHECK-NEXT:    ret <16 x i8> [[B]]
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski  %1 = tail call <16 x i16> @llvm.smax.v16i16(<16 x i16> %x, <16 x i16> zeroinitializer)
6d7cf520Sadam-bzowski  %2 = tail call <16 x i16> @llvm.smin.v16i16(<16 x i16> %1, <16 x i16> splat (i16 127))
6d7cf520Sadam-bzowski  %a = sext <16 x i16> %2 to <16 x i32>
*088d6361Sadam-bzowski  %b = lshr <16 x i32> %a, splat (i32 2)
6d7cf520Sadam-bzowski  %b.trunc = trunc <16 x i32> %b to <16 x i8>
6d7cf520Sadam-bzowski  ret <16 x i8> %b.trunc
6d7cf520Sadam-bzowski}
6d7cf520Sadam-bzowski
6d7cf520Sadam-bzowski; A longer test that was the original motivation for the smin-smax clamping.
6d7cf520Sadam-bzowskidefine i8 @test_final(i16 %x, i16 %y) {
6d7cf520Sadam-bzowski; CHECK-LABEL: define i8 @test_final(
6d7cf520Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]], i16 [[Y:%.*]]) {
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smin.i16(i16 [[X]], i16 127)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smax.i16(i16 [[TMP1]], i16 0)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP3:%.*]] = tail call i16 @llvm.smax.i16(i16 [[Y]], i16 0)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP4:%.*]] = tail call i16 @llvm.smin.i16(i16 [[TMP3]], i16 127)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[MUL:%.*]] = mul i16 [[TMP2]], [[TMP4]]
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[SHR:%.*]] = lshr i16 [[MUL]], 7
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TRUNC:%.*]] = trunc i16 [[SHR]] to i8
6d7cf520Sadam-bzowski; CHECK-NEXT:    ret i8 [[TRUNC]]
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski  %1 = tail call i16 @llvm.smin.i16(i16 %x, i16 127)
6d7cf520Sadam-bzowski  %2 = tail call i16 @llvm.smax.i16(i16 %1, i16 0)
6d7cf520Sadam-bzowski  %x.clamp = zext nneg i16 %2 to i32
6d7cf520Sadam-bzowski  %3 = tail call i16 @llvm.smax.i16(i16 %y, i16 0)
6d7cf520Sadam-bzowski  %4 = tail call i16 @llvm.smin.i16(i16 %3, i16 127)
6d7cf520Sadam-bzowski  %y.clamp = zext nneg i16 %4 to i32
6d7cf520Sadam-bzowski  %mul = mul nuw nsw i32 %x.clamp, %y.clamp
6d7cf520Sadam-bzowski  %shr = lshr i32 %mul, 7
6d7cf520Sadam-bzowski  %trunc= trunc nuw nsw i32 %shr to i8
6d7cf520Sadam-bzowski  ret i8 %trunc
6d7cf520Sadam-bzowski}
6d7cf520Sadam-bzowski
6d7cf520Sadam-bzowski; Range tests below check if the bounds are dealt with correctly.
6d7cf520Sadam-bzowski
6d7cf520Sadam-bzowski; This gets optimized.
6d7cf520Sadam-bzowskidefine i8 @test_bounds_1(i16 %x) {
6d7cf520Sadam-bzowski; CHECK-LABEL: define i8 @test_bounds_1(
6d7cf520Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smin.i16(i16 [[X]], i16 127)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smax.i16(i16 [[TMP1]], i16 0)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[A:%.*]] = trunc i16 [[TMP2]] to i8
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i8 [[A]], 7
*088d6361Sadam-bzowski; CHECK-NEXT:    ret i8 [[B]]
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski  %1 = tail call i16 @llvm.smin.i16(i16 %x, i16 127)
6d7cf520Sadam-bzowski  %2 = tail call i16 @llvm.smax.i16(i16 %1, i16 0)
6d7cf520Sadam-bzowski  %a = sext i16 %2 to i32
*088d6361Sadam-bzowski  %b = lshr i32 %a, 7
*088d6361Sadam-bzowski  %b.trunc = trunc i32 %b to i8
6d7cf520Sadam-bzowski  ret i8 %b.trunc
6d7cf520Sadam-bzowski}
6d7cf520Sadam-bzowski
6d7cf520Sadam-bzowski; While this does not.
6d7cf520Sadam-bzowskidefine i8 @test_bounds_2(i16 %x) {
6d7cf520Sadam-bzowski; CHECK-LABEL: define i8 @test_bounds_2(
6d7cf520Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smin.i16(i16 [[X]], i16 128)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smax.i16(i16 [[TMP1]], i16 0)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[A:%.*]] = trunc i16 [[TMP2]] to i8
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i8 [[A]], 7
*088d6361Sadam-bzowski; CHECK-NEXT:    ret i8 [[B]]
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski  %1 = tail call i16 @llvm.smin.i16(i16 %x, i16 128)
6d7cf520Sadam-bzowski  %2 = tail call i16 @llvm.smax.i16(i16 %1, i16 0)
6d7cf520Sadam-bzowski  %a = sext i16 %2 to i32
*088d6361Sadam-bzowski  %b = lshr i32 %a, 7
*088d6361Sadam-bzowski  %b.trunc = trunc i32 %b to i8
6d7cf520Sadam-bzowski  ret i8 %b.trunc
6d7cf520Sadam-bzowski}
6d7cf520Sadam-bzowski
6d7cf520Sadam-bzowski; This should get optimized. We test here if the optimization works correctly
6d7cf520Sadam-bzowski; if the upper limit is signed max int.
6d7cf520Sadam-bzowskidefine i8 @test_bounds_3(i16 %x) {
6d7cf520Sadam-bzowski; CHECK-LABEL: define i8 @test_bounds_3(
6d7cf520Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smin.i16(i16 [[X]], i16 32767)
6d7cf520Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smax.i16(i16 [[TMP1]], i16 32752)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i16 [[TMP2]], 2
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B_TRUNC:%.*]] = trunc i16 [[B]] to i8
*088d6361Sadam-bzowski; CHECK-NEXT:    ret i8 [[B_TRUNC]]
6d7cf520Sadam-bzowski;
6d7cf520Sadam-bzowski  %1 = tail call i16 @llvm.smin.i16(i16 %x, i16 32767)
6d7cf520Sadam-bzowski  %2 = tail call i16 @llvm.smax.i16(i16 %1, i16 32752)
6d7cf520Sadam-bzowski  %a = sext i16 %2 to i32
*088d6361Sadam-bzowski  %b = lshr i32 %a, 2
*088d6361Sadam-bzowski  %b.trunc = trunc i32 %b to i8
*088d6361Sadam-bzowski  ret i8 %b.trunc
*088d6361Sadam-bzowski}
*088d6361Sadam-bzowski
*088d6361Sadam-bzowski; Here min = 128 is greater than max = 0.
*088d6361Sadam-bzowskidefine i8 @test_bounds_4(i16 %x) {
*088d6361Sadam-bzowski; CHECK-LABEL: define i8 @test_bounds_4(
*088d6361Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
*088d6361Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smin.i16(i16 [[X]], i16 0)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smax.i16(i16 [[TMP1]], i16 128)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i16 [[TMP2]], 2
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B_TRUNC:%.*]] = trunc i16 [[B]] to i8
*088d6361Sadam-bzowski; CHECK-NEXT:    ret i8 [[B_TRUNC]]
*088d6361Sadam-bzowski;
*088d6361Sadam-bzowski  %1 = tail call i16 @llvm.smin.i16(i16 %x, i16 0)
*088d6361Sadam-bzowski  %2 = tail call i16 @llvm.smax.i16(i16 %1, i16 128)
*088d6361Sadam-bzowski  %a = sext i16 %2 to i32
*088d6361Sadam-bzowski  %b = lshr i32 %a, 2
*088d6361Sadam-bzowski  %b.trunc = trunc i32 %b to i8
*088d6361Sadam-bzowski  ret i8 %b.trunc
*088d6361Sadam-bzowski}
*088d6361Sadam-bzowski
*088d6361Sadam-bzowski; The following 3 tests check the situation where min and max are minimal and
*088d6361Sadam-bzowski; maximal signed values. No transformations should occur here.
*088d6361Sadam-bzowskidefine i8 @test_bounds_5(i16 %x) {
*088d6361Sadam-bzowski; CHECK-LABEL: define i8 @test_bounds_5(
*088d6361Sadam-bzowski; CHECK-SAME: i16 [[X:%.*]]) {
*088d6361Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i16 @llvm.smin.i16(i16 [[X]], i16 32767)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i16 @llvm.smax.i16(i16 [[TMP1]], i16 -32768)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i16 [[TMP2]], 2
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B_TRUNC:%.*]] = trunc i16 [[B]] to i8
*088d6361Sadam-bzowski; CHECK-NEXT:    ret i8 [[B_TRUNC]]
*088d6361Sadam-bzowski;
*088d6361Sadam-bzowski  %1 = tail call i16 @llvm.smin.i16(i16 %x, i16 32767)
*088d6361Sadam-bzowski  %2 = tail call i16 @llvm.smax.i16(i16 %1, i16 -32768)
*088d6361Sadam-bzowski  %a = zext i16 %2 to i32
*088d6361Sadam-bzowski  %b = lshr i32 %a, 2
*088d6361Sadam-bzowski  %b.trunc = trunc i32 %b to i8
*088d6361Sadam-bzowski  ret i8 %b.trunc
*088d6361Sadam-bzowski}
*088d6361Sadam-bzowski
*088d6361Sadam-bzowskidefine i8 @test_bounds_6(i32 %x) {
*088d6361Sadam-bzowski; CHECK-LABEL: define i8 @test_bounds_6(
*088d6361Sadam-bzowski; CHECK-SAME: i32 [[X:%.*]]) {
*088d6361Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i32 @llvm.smin.i32(i32 [[X]], i32 2147483647)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i32 @llvm.smax.i32(i32 [[TMP1]], i32 -2147483648)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i32 [[TMP2]], 2
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B_TRUNC:%.*]] = trunc i32 [[B]] to i8
*088d6361Sadam-bzowski; CHECK-NEXT:    ret i8 [[B_TRUNC]]
*088d6361Sadam-bzowski;
*088d6361Sadam-bzowski  %1 = tail call i32 @llvm.smin.i32(i32 %x, i32 2147483647)
*088d6361Sadam-bzowski  %2 = tail call i32 @llvm.smax.i32(i32 %1, i32 -2147483648)
*088d6361Sadam-bzowski  %a = zext i32 %2 to i64
*088d6361Sadam-bzowski  %b = lshr i64 %a, 2
*088d6361Sadam-bzowski  %b.trunc = trunc i64 %b to i8
*088d6361Sadam-bzowski  ret i8 %b.trunc
*088d6361Sadam-bzowski}
*088d6361Sadam-bzowski
*088d6361Sadam-bzowskidefine i8 @test_bounds_7(i64 %x) {
*088d6361Sadam-bzowski; CHECK-LABEL: define i8 @test_bounds_7(
*088d6361Sadam-bzowski; CHECK-SAME: i64 [[X:%.*]]) {
*088d6361Sadam-bzowski; CHECK-NEXT:    [[TMP1:%.*]] = tail call i64 @llvm.smin.i64(i64 [[X]], i64 9223372036854775807)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[TMP2:%.*]] = tail call i64 @llvm.smax.i64(i64 [[TMP1]], i64 -9223372036854775808)
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B:%.*]] = lshr i64 [[TMP2]], 2
*088d6361Sadam-bzowski; CHECK-NEXT:    [[B_TRUNC:%.*]] = trunc i64 [[B]] to i8
*088d6361Sadam-bzowski; CHECK-NEXT:    ret i8 [[B_TRUNC]]
*088d6361Sadam-bzowski;
*088d6361Sadam-bzowski  %1 = tail call i64 @llvm.smin.i64(i64 %x, i64 9223372036854775807)
*088d6361Sadam-bzowski  %2 = tail call i64 @llvm.smax.i64(i64 %1, i64 -9223372036854775808)
*088d6361Sadam-bzowski  %a = zext i64 %2 to i128
*088d6361Sadam-bzowski  %b = lshr i128 %a, 2
*088d6361Sadam-bzowski  %b.trunc = trunc i128 %b to i8
6d7cf520Sadam-bzowski  ret i8 %b.trunc
6d7cf520Sadam-bzowski}