]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - test/CodeGen/X86/pr21792.ll
Vendor import of llvm release_40 branch r292009:
[FreeBSD/FreeBSD.git] / test / CodeGen / X86 / pr21792.ll
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-linux -mcpu=corei7 | FileCheck %s
3
4 ; This fixes a missing cases in the MI scheduler's constrainLocalCopy exposed by
5 ; PR21792
6
7 @stuff = external constant [256 x double], align 16
8
9 define void @func(<4 x float> %vx) {
10 ; CHECK-LABEL: func:
11 ; CHECK:       # BB#0: # %entry
12 ; CHECK-NEXT:    pushq %rax
13 ; CHECK-NEXT:  .Lcfi0:
14 ; CHECK-NEXT:    .cfi_def_cfa_offset 16
15 ; CHECK-NEXT:    pand {{.*}}(%rip), %xmm0
16 ; CHECK-NEXT:    pextrq $1, %xmm0, %rdx
17 ; CHECK-NEXT:    movq %rdx, %rcx
18 ; CHECK-NEXT:    shrq $32, %rcx
19 ; CHECK-NEXT:    movd %xmm0, %rax
20 ; CHECK-NEXT:    movq %rax, %r9
21 ; CHECK-NEXT:    shrq $32, %r9
22 ; CHECK-NEXT:    andl $2032, %eax # imm = 0x7F0
23 ; CHECK-NEXT:    leaq stuff(%rax), %rdi
24 ; CHECK-NEXT:    leaq stuff(%r9), %rsi
25 ; CHECK-NEXT:    andl $2032, %edx # imm = 0x7F0
26 ; CHECK-NEXT:    leaq stuff(%rdx), %rdx
27 ; CHECK-NEXT:    leaq stuff(%rcx), %rcx
28 ; CHECK-NEXT:    leaq stuff+8(%rax), %r8
29 ; CHECK-NEXT:    leaq stuff+8(%r9), %r9
30 ; CHECK-NEXT:    callq toto
31 ; CHECK-NEXT:    popq %rax
32 ; CHECK-NEXT:    retq
33 entry:
34   %tmp2 = bitcast <4 x float> %vx to <2 x i64>
35   %and.i = and <2 x i64> %tmp2, <i64 8727373547504, i64 8727373547504>
36   %tmp3 = bitcast <2 x i64> %and.i to <4 x i32>
37   %index.sroa.0.0.vec.extract = extractelement <4 x i32> %tmp3, i32 0
38   %idx.ext = sext i32 %index.sroa.0.0.vec.extract to i64
39   %add.ptr = getelementptr inbounds i8, i8* bitcast ([256 x double]* @stuff to i8*), i64 %idx.ext
40   %tmp4 = bitcast i8* %add.ptr to double*
41   %index.sroa.0.4.vec.extract = extractelement <4 x i32> %tmp3, i32 1
42   %idx.ext5 = sext i32 %index.sroa.0.4.vec.extract to i64
43   %add.ptr6 = getelementptr inbounds i8, i8* bitcast ([256 x double]* @stuff to i8*), i64 %idx.ext5
44   %tmp5 = bitcast i8* %add.ptr6 to double*
45   %index.sroa.0.8.vec.extract = extractelement <4 x i32> %tmp3, i32 2
46   %idx.ext14 = sext i32 %index.sroa.0.8.vec.extract to i64
47   %add.ptr15 = getelementptr inbounds i8, i8* bitcast ([256 x double]* @stuff to i8*), i64 %idx.ext14
48   %tmp6 = bitcast i8* %add.ptr15 to double*
49   %index.sroa.0.12.vec.extract = extractelement <4 x i32> %tmp3, i32 3
50   %idx.ext19 = sext i32 %index.sroa.0.12.vec.extract to i64
51   %add.ptr20 = getelementptr inbounds i8, i8* bitcast ([256 x double]* @stuff to i8*), i64 %idx.ext19
52   %tmp7 = bitcast i8* %add.ptr20 to double*
53   %add.ptr46 = getelementptr inbounds i8, i8* bitcast (double* getelementptr inbounds ([256 x double], [256 x double]* @stuff, i64 0, i64 1) to i8*), i64 %idx.ext
54   %tmp16 = bitcast i8* %add.ptr46 to double*
55   %add.ptr51 = getelementptr inbounds i8, i8* bitcast (double* getelementptr inbounds ([256 x double], [256 x double]* @stuff, i64 0, i64 1) to i8*), i64 %idx.ext5
56   %tmp17 = bitcast i8* %add.ptr51 to double*
57   call void @toto(double* %tmp4, double* %tmp5, double* %tmp6, double* %tmp7, double* %tmp16, double* %tmp17)
58   ret void
59 }
60
61 declare void @toto(double*, double*, double*, double*, double*, double*)