Tests pass currently.

chriselrod · chriselrod · commit 3b5c7cedc8bd · 2020-01-22T09:27:57.000-05:00
diff --git a/src/add_constants.jl b/src/add_constants.jl
@@ -6,15 +6,17 @@ end
 function add_constant!(ls::LoopSet, var, elementbytes::Int = 8)
     sym = gensym(:temp)
     op = Operation(length(operations(ls)), sym, elementbytes, LOOPCONSTANT, constant, NODEPENDENCY, Symbol[], NOPARENTS)
-    pushpreamble!(ls, Expr(:(=), mangledvar(op), var))
-    pushpreamble!(ls, op, mangledvar(op))
+    temp = gensym(:intermediateconst)
+    pushpreamble!(ls, Expr(:(=), temp, var))
+    pushpreamble!(ls, op, temp)
     pushop!(ls, op, sym)
 end
 function add_constant!(ls::LoopSet, var::Symbol, mpref::ArrayReferenceMetaPosition, elementbytes::Int)
     op = Operation(length(operations(ls)), var, elementbytes, LOOPCONSTANT, constant, NODEPENDENCY, Symbol[], NOPARENTS, mpref.mref)
     add_vptr!(ls, op)
-    pushpreamble!(ls, Expr(:(=), mangledvar(op), Expr(:call, lv(:load), mpref.mref.ptr, mem_offset(op, UnrollArgs(zero(Int32), Symbol(""), Symbol(""), nothing)))))
-    pushpreamble!(ls, op, mangledvar(op))
+    temp = gensym(:intermediateconstref)
+    pushpreamble!(ls, Expr(:(=), temp, Expr(:call, lv(:load), mpref.mref.ptr, mem_offset(op, UnrollArgs(zero(Int32), Symbol(""), Symbol(""), nothing)))))
+    pushpreamble!(ls, op, temp)
     pushop!(ls, op, var)
 end
 # This version has loop dependencies. var gets assigned to sym when lowering.
diff --git a/test/runtests.jl b/test/runtests.jl
@@ -86,7 +86,16 @@ using LinearAlgebra
                 C[m,n] += ΔCₘₙ * factor
                end)
         lsAmuladd = LoopVectorization.LoopSet(Amuladdq);
+        lsAmuladd.operations
         @test LoopVectorization.choose_order(lsAmuladd) == (Symbol[:n,:m,:k], :m, Unum, Tnum)
+
+        # @macroexpand @avx for m ∈ 1:size(A,1), n ∈ 1:size(B,2)
+        #         ΔCₘₙ = zero(eltype(C))
+        #         for k ∈ 1:size(A,2)
+        #             ΔCₘₙ += A[m,k] * B[k,n]
+        #         end
+        #         C[m,n] += ΔCₘₙ * factor
+        #     end
         
         function AmulB_avx1!(C, A, B)
             @_avx for m ∈ 1:size(A,1), n ∈ 1:size(B,2)
@@ -770,6 +779,8 @@ end
                 G[d1,κ] = z
             end
         end
+        # exit()
+        # using LoopVectorization
         function AtmulvB_avx3!(G, B,κ)
             d = size(G,1)
             @_avx for d1=1:d
@@ -779,7 +790,24 @@ end
                 end
             end
         end
+        # N = 97; B = rand(N, N);
+        # G1 = Matrix{Float64}(undef, N, 1);
+        # AtmulvB_avx3!(G1, B, 1)
 
+        @macroexpand @_avx for d1=1:d
+                G[d1,κ] = B[1,d1]*B[1,κ]
+                for d2=2:d
+                    G[d1,κ] += B[d2,d1]*B[d2,κ]
+                end
+            end
+        pq = :(for d1=1:d
+                G[d1,κ] = B[1,d1]*B[1,κ]
+                for d2=2:d
+                    G[d1,κ] += B[d2,d1]*B[d2,κ]
+                end
+               end)
+        lsp = LoopVectorization.LoopSet(pq);
+        lsp.preamble_symsym
 
         M, K, N = 51, 49, 61
         for T ∈ (Float32, Float64, Int32, Int64)