[PowerPC] licm-xxsplti.ll - regenerate test checks

This commit is contained in:
Simon Pilgrim 2025-07-07 15:02:35 +01:00
parent 45d679218a
commit d3d8ef7e41

View File

@ -1,3 +1,4 @@
; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 5
;; Test hoisting `xxspltib` out of the loop.
; RUN: llc -verify-machineinstrs -mtriple powerpc64-ibm-aix-xcoff --mcpu=pwr10 \
@ -10,6 +11,145 @@
; RUN: %s -o - 2>&1 | FileCheck --check-prefix=LINUX64LE %s
define void @_Z3fooPfS_Pi(ptr noalias nocapture noundef %_a, ptr noalias nocapture %In_a, ptr noalias nocapture %n) {
; AIX64-LABEL: _Z3fooPfS_Pi:
; AIX64: # %bb.0: # %entry
; AIX64-NEXT: lwz 5, 0(5)
; AIX64-NEXT: cmpwi 5, 1
; AIX64-NEXT: bltlr 0
; AIX64-NEXT: # %bb.1: # %for.body.preheader
; AIX64-NEXT: li 6, 0
; AIX64-NEXT: cmplwi 5, 1
; AIX64-NEXT: beq 0, L..BB0_4
; AIX64-NEXT: # %bb.2: # %for.body.preheader.new
; AIX64-NEXT: rlwinm 6, 5, 0, 1, 30
; AIX64-NEXT: xxspltib 0, 6
; AIX64-NEXT: addi 9, 4, -8
; AIX64-NEXT: addi 7, 3, -8
; AIX64-NEXT: li 8, 8
; AIX64-NEXT: li 10, 12
; AIX64-NEXT: li 11, 4
; AIX64-NEXT: addi 6, 6, -2
; AIX64-NEXT: rldicl 6, 6, 63, 1
; AIX64-NEXT: addi 6, 6, 1
; AIX64-NEXT: mtctr 6
; AIX64-NEXT: li 6, 0
; AIX64-NEXT: .align 4
; AIX64-NEXT: L..BB0_3: # %for.body
; AIX64-NEXT: #
; AIX64-NEXT: lxvwsx 1, 9, 8
; AIX64-NEXT: addi 6, 6, 2
; AIX64-NEXT: xxland 1, 1, 0
; AIX64-NEXT: xscvspdpn 1, 1
; AIX64-NEXT: stfsu 1, 8(7)
; AIX64-NEXT: lxvwsx 1, 9, 10
; AIX64-NEXT: addi 9, 9, 8
; AIX64-NEXT: xxland 1, 1, 0
; AIX64-NEXT: xxsldwi 1, 1, 1, 3
; AIX64-NEXT: stfiwx 1, 7, 11
; AIX64-NEXT: bdnz L..BB0_3
; AIX64-NEXT: L..BB0_4: # %for.cond.cleanup.loopexit.unr-lcssa
; AIX64-NEXT: andi. 5, 5, 1
; AIX64-NEXT: bclr 4, 1, 0
; AIX64-NEXT: # %bb.5: # %for.body.epil
; AIX64-NEXT: sldi 5, 6, 2
; AIX64-NEXT: xxspltib 1, 6
; AIX64-NEXT: lxvwsx 0, 4, 5
; AIX64-NEXT: xxland 0, 0, 1
; AIX64-NEXT: xxsldwi 0, 0, 0, 3
; AIX64-NEXT: stfiwx 0, 3, 5
; AIX64-NEXT: blr
;
; AIX32-LABEL: _Z3fooPfS_Pi:
; AIX32: # %bb.0: # %entry
; AIX32-NEXT: lwz 5, 0(5)
; AIX32-NEXT: cmpwi 5, 1
; AIX32-NEXT: bltlr 0
; AIX32-NEXT: # %bb.1: # %for.body.preheader
; AIX32-NEXT: li 6, 0
; AIX32-NEXT: beq 0, L..BB0_4
; AIX32-NEXT: # %bb.2: # %for.body.preheader.new
; AIX32-NEXT: xxspltib 0, 6
; AIX32-NEXT: addi 12, 4, -8
; AIX32-NEXT: addi 9, 3, -8
; AIX32-NEXT: rlwinm 7, 5, 0, 1, 30
; AIX32-NEXT: li 8, 0
; AIX32-NEXT: li 10, 8
; AIX32-NEXT: li 11, 12
; AIX32-NEXT: .align 4
; AIX32-NEXT: L..BB0_3: # %for.body
; AIX32-NEXT: #
; AIX32-NEXT: lxvwsx 1, 12, 10
; AIX32-NEXT: addic 6, 6, 2
; AIX32-NEXT: addze 8, 8
; AIX32-NEXT: xor 0, 6, 7
; AIX32-NEXT: or. 0, 0, 8
; AIX32-NEXT: xxland 1, 1, 0
; AIX32-NEXT: xscvspdpn 1, 1
; AIX32-NEXT: stfsu 1, 8(9)
; AIX32-NEXT: lxvwsx 1, 12, 11
; AIX32-NEXT: addi 12, 12, 8
; AIX32-NEXT: xxland 1, 1, 0
; AIX32-NEXT: xscvspdpn 1, 1
; AIX32-NEXT: stfs 1, 4(9)
; AIX32-NEXT: bne 0, L..BB0_3
; AIX32-NEXT: L..BB0_4: # %for.cond.cleanup.loopexit.unr-lcssa
; AIX32-NEXT: andi. 5, 5, 1
; AIX32-NEXT: bclr 4, 1, 0
; AIX32-NEXT: # %bb.5: # %for.body.epil
; AIX32-NEXT: slwi 5, 6, 2
; AIX32-NEXT: xxspltib 1, 6
; AIX32-NEXT: lxvwsx 0, 4, 5
; AIX32-NEXT: xxland 0, 0, 1
; AIX32-NEXT: xscvspdpn 0, 0
; AIX32-NEXT: stfsx 0, 3, 5
; AIX32-NEXT: blr
;
; LINUX64LE-LABEL: _Z3fooPfS_Pi:
; LINUX64LE: # %bb.0: # %entry
; LINUX64LE-NEXT: lwz 5, 0(5)
; LINUX64LE-NEXT: cmpwi 5, 1
; LINUX64LE-NEXT: bltlr 0
; LINUX64LE-NEXT: # %bb.1: # %for.body.preheader
; LINUX64LE-NEXT: li 6, 0
; LINUX64LE-NEXT: cmplwi 5, 1
; LINUX64LE-NEXT: beq 0, .LBB0_4
; LINUX64LE-NEXT: # %bb.2: # %for.body.preheader.new
; LINUX64LE-NEXT: rlwinm 6, 5, 0, 1, 30
; LINUX64LE-NEXT: xxspltib 0, 6
; LINUX64LE-NEXT: addi 8, 4, -8
; LINUX64LE-NEXT: addi 7, 3, -8
; LINUX64LE-NEXT: li 9, 8
; LINUX64LE-NEXT: li 10, 12
; LINUX64LE-NEXT: li 11, 4
; LINUX64LE-NEXT: addi 6, 6, -2
; LINUX64LE-NEXT: rldicl 6, 6, 63, 1
; LINUX64LE-NEXT: addi 6, 6, 1
; LINUX64LE-NEXT: mtctr 6
; LINUX64LE-NEXT: li 6, 0
; LINUX64LE-NEXT: .p2align 4
; LINUX64LE-NEXT: .LBB0_3: # %for.body
; LINUX64LE-NEXT: #
; LINUX64LE-NEXT: lxvwsx 1, 8, 9
; LINUX64LE-NEXT: addi 6, 6, 2
; LINUX64LE-NEXT: xxland 1, 1, 0
; LINUX64LE-NEXT: xxsldwi 1, 1, 1, 3
; LINUX64LE-NEXT: xscvspdpn 1, 1
; LINUX64LE-NEXT: stfsu 1, 8(7)
; LINUX64LE-NEXT: lxvwsx 1, 8, 10
; LINUX64LE-NEXT: addi 8, 8, 8
; LINUX64LE-NEXT: xxland 1, 1, 0
; LINUX64LE-NEXT: stxvrwx 1, 7, 11
; LINUX64LE-NEXT: bdnz .LBB0_3
; LINUX64LE-NEXT: .LBB0_4: # %for.cond.cleanup.loopexit.unr-lcssa
; LINUX64LE-NEXT: andi. 5, 5, 1
; LINUX64LE-NEXT: bclr 4, 1, 0
; LINUX64LE-NEXT: # %bb.5: # %for.body.epil
; LINUX64LE-NEXT: sldi 5, 6, 2
; LINUX64LE-NEXT: xxspltib 1, 6
; LINUX64LE-NEXT: lxvwsx 0, 4, 5
; LINUX64LE-NEXT: xxland 0, 0, 1
; LINUX64LE-NEXT: stxvrwx 0, 3, 5
; LINUX64LE-NEXT: blr
entry:
%0 = load i32, ptr %n, align 4
%cmp9 = icmp sgt i32 %0, 0
@ -72,113 +212,3 @@ for.body:
%niter.ncmp.1 = icmp eq i64 %niter.next.1, %unroll_iter
br i1 %niter.ncmp.1, label %for.cond.cleanup.loopexit.unr-lcssa, label %for.body
}
; AIX32: ._Z3fooPfS_Pi:
; AIX32-NEXT: # %bb.0: # %entry
; AIX32-NEXT: lwz 5, 0(5)
; AIX32-NEXT: cmpwi 5, 1
; AIX32-NEXT: bltlr 0
; AIX32-NEXT: # %bb.1: # %for.body.preheader
; AIX32-NEXT: li 6, 0
; AIX32-NEXT: beq 0, L..BB0_4
; AIX32-NEXT: # %bb.2: # %for.body.preheader.new
; AIX32-NEXT: xxspltib 0, 6
; AIX32-NEXT: addi 12, 4, -8
; AIX32-NEXT: addi 9, 3, -8
; AIX32-NEXT: rlwinm 7, 5, 0, 1, 30
; AIX32-NEXT: li 8, 0
; AIX32-NEXT: li 10, 8
; AIX32-NEXT: li 11, 12
; AIX32-NEXT: .align 4
; AIX32-NEXT: L..BB0_3: # %for.body
; AIX32-NEXT: # =>This Inner Loop Header: Depth=1
; AIX32-NEXT: lxvwsx 1, 12, 10
; AIX32-NEXT: addic 6, 6, 2
; AIX32-NEXT: addze 8, 8
; AIX32-NEXT: xor 0, 6, 7
; AIX32-NEXT: or. 0, 0, 8
; AIX32-NEXT: xxland 1, 1, 0
; AIX32-NEXT: xscvspdpn 1, 1
; AIX32-NEXT: stfsu 1, 8(9)
; AIX32-NEXT: lxvwsx 1, 12, 11
; AIX32-NEXT: addi 12, 12, 8
; AIX32-NEXT: xxland 1, 1, 0
; AIX32-NEXT: xscvspdpn 1, 1
; AIX32-NEXT: stfs 1, 4(9)
; AIX32-NEXT: bne 0, L..BB0_3
; AIX64: ._Z3fooPfS_Pi:
; AIX64-NEXT: # %bb.0: # %entry
; AIX64-NEXT: lwz 5, 0(5)
; AIX64-NEXT: cmpwi 5, 1
; AIX64-NEXT: bltlr 0
; AIX64-NEXT: # %bb.1: # %for.body.preheader
; AIX64-NEXT: li 6, 0
; AIX64-NEXT: cmplwi 5, 1
; AIX64-NEXT: beq 0, L..BB0_4
; AIX64-NEXT: # %bb.2: # %for.body.preheader.new
; AIX64-NEXT: rlwinm 6, 5, 0, 1, 30
; AIX64-NEXT: xxspltib 0, 6
; AIX64-NEXT: addi 9, 4, -8
; AIX64-NEXT: addi 7, 3, -8
; AIX64-NEXT: li 8, 8
; AIX64-NEXT: li 10, 12
; AIX64-NEXT: li 11, 4
; AIX64-NEXT: addi 6, 6, -2
; AIX64-NEXT: rldicl 6, 6, 63, 1
; AIX64-NEXT: addi 6, 6, 1
; AIX64-NEXT: mtctr 6
; AIX64-NEXT: li 6, 0
; AIX64-NEXT: .align 4
; AIX64-NEXT: L..BB0_3: # %for.body
; AIX64-NEXT: # =>This Inner Loop Header: Depth=1
; AIX64-NEXT: lxvwsx 1, 9, 8
; AIX64-NEXT: addi 6, 6, 2
; AIX64-NEXT: xxland 1, 1, 0
; AIX64-NEXT: xscvspdpn 1, 1
; AIX64-NEXT: stfsu 1, 8(7)
; AIX64-NEXT: lxvwsx 1, 9, 10
; AIX64-NEXT: addi 9, 9, 8
; AIX64-NEXT: xxland 1, 1, 0
; AIX64-NEXT: xxsldwi 1, 1, 1, 3
; AIX64-NEXT: stfiwx 1, 7, 11
; AIX64-NEXT: bdnz L..BB0_3
; LINUX64LE: _Z3fooPfS_Pi: # @_Z3fooPfS_Pi
; LINUX64LE-NEXT: .Lfunc_begin0:
; LINUX64LE-NEXT: .cfi_startproc
; LINUX64LE-NEXT: # %bb.0: # %entry
; LINUX64LE-NEXT: lwz 5, 0(5)
; LINUX64LE-NEXT: cmpwi 5, 1
; LINUX64LE-NEXT: bltlr 0
; LINUX64LE-NEXT: # %bb.1: # %for.body.preheader
; LINUX64LE-NEXT: li 6, 0
; LINUX64LE-NEXT: cmplwi 5, 1
; LINUX64LE-NEXT: beq 0, .LBB0_4
; LINUX64LE-NEXT: # %bb.2: # %for.body.preheader.new
; LINUX64LE-NEXT: rlwinm 6, 5, 0, 1, 30
; LINUX64LE-NEXT: xxspltib 0, 6
; LINUX64LE-NEXT: addi 8, 4, -8
; LINUX64LE-NEXT: addi 7, 3, -8
; LINUX64LE-NEXT: li 9, 8
; LINUX64LE-NEXT: li 10, 12
; LINUX64LE-NEXT: li 11, 4
; LINUX64LE-NEXT: addi 6, 6, -2
; LINUX64LE-NEXT: rldicl 6, 6, 63, 1
; LINUX64LE-NEXT: addi 6, 6, 1
; LINUX64LE-NEXT: mtctr 6
; LINUX64LE-NEXT: li 6, 0
; LINUX64LE-NEXT: .p2align 4
; LINUX64LE-NEXT: .LBB0_3: # %for.body
; LINUX64LE-NEXT: # =>This Inner Loop Header: Depth=1
; LINUX64LE-NEXT: lxvwsx 1, 8, 9
; LINUX64LE-NEXT: addi 6, 6, 2
; LINUX64LE-NEXT: xxland 1, 1, 0
; LINUX64LE-NEXT: xxsldwi 1, 1, 1, 3
; LINUX64LE-NEXT: xscvspdpn 1, 1
; LINUX64LE-NEXT: stfsu 1, 8(7)
; LINUX64LE-NEXT: lxvwsx 1, 8, 10
; LINUX64LE-NEXT: addi 8, 8, 8
; LINUX64LE-NEXT: xxland 1, 1, 0
; LINUX64LE-NEXT: stxvrwx 1, 7, 11
; LINUX64LE-NEXT: bdnz .LBB0_3