CodeGen/ARM/2012-03-26-FoldImmBug.ll

a2b48d98SEvan Cheng; RUN: llc < %s -mtriple=thumbv7-apple-ios -mcpu=cortex-a8 | FileCheck %s
a2b48d98SEvan Cheng
a2b48d98SEvan Cheng; ARM has a peephole optimization which looks for a def / use pair. The def
a2b48d98SEvan Cheng; produces a 32-bit immediate which is consumed by the use. It tries to
a2b48d98SEvan Cheng; fold the immediate by breaking it into two parts and fold them into the
a2b48d98SEvan Cheng; immmediate fields of two uses. e.g
a2b48d98SEvan Cheng;        movw    r2, #40885
a2b48d98SEvan Cheng;        movt    r3, #46540
a2b48d98SEvan Cheng;        add     r0, r0, r3
a2b48d98SEvan Cheng; =>
a2b48d98SEvan Cheng;        add.w   r0, r0, #3019898880
a2b48d98SEvan Cheng;        add.w   r0, r0, #30146560
a2b48d98SEvan Cheng;
a2b48d98SEvan Cheng; However, this transformation is incorrect if the user produces a flag. e.g.
a2b48d98SEvan Cheng;        movw    r2, #40885
a2b48d98SEvan Cheng;        movt    r3, #46540
a2b48d98SEvan Cheng;        adds    r0, r0, r3
a2b48d98SEvan Cheng; =>
a2b48d98SEvan Cheng;        add.w   r0, r0, #3019898880
a2b48d98SEvan Cheng;        adds.w  r0, r0, #30146560
a2b48d98SEvan Cheng; Note the adds.w may not set the carry flag even if the original sequence
a2b48d98SEvan Cheng; would.
a2b48d98SEvan Cheng;
a2b48d98SEvan Cheng; rdar://11116189
a2b48d98SEvan Chengdefine i64 @t(i64 %aInput) nounwind {
*d24ab20eSStephen Lin; CHECK-LABEL: t:
a2b48d98SEvan Cheng; CHECK: movs [[REG:(r[0-9]+)]], #0
a2b48d98SEvan Cheng; CHECK: movt [[REG]], #46540
a2b48d98SEvan Cheng; CHECK: adds r{{[0-9]+}}, r{{[0-9]+}}, [[REG]]
a2b48d98SEvan Cheng  %1 = mul i64 %aInput, 1000000
a2b48d98SEvan Cheng  %2 = add i64 %1, -7952618389194932224
a2b48d98SEvan Cheng  ret i64 %2
a2b48d98SEvan Cheng}