mtl : add reshape and transpose handling

ggerganov · ggerganov · commit 7ca81e9e6594 · 2023-05-31T23:01:37.000+03:00
diff --git a/examples/mtl/mtl.m b/examples/mtl/mtl.m
@@ -258,6 +258,7 @@ int llama_mtl_eval(
 
         switch (gf->nodes[i]->op) {
             case GGML_OP_RESHAPE:
+            case GGML_OP_TRANSPOSE:
                 {
                     // noop
                 } break;
diff --git a/ggml.c b/ggml.c
@@ -15011,15 +15011,19 @@ struct ggml_cgraph ggml_graph_import(const char * fname, struct ggml_context **
 
                 // create the tensor
                 // "view" operations are handled differently
+                // TODO: handle inplac ops - currentl a copy is always made
 
                 struct ggml_tensor * tensor = NULL;
 
                 switch (eop) {
                     // TODO: implement other view ops
                     case GGML_OP_RESHAPE:
                         {
-                            // TODO: implement other dims
-                            tensor = ggml_reshape_3d(*ctx_eval, args[0], ne[0], ne[1], ne[2]);
+                            tensor = ggml_reshape_4d(*ctx_eval, args[0], ne[0], ne[1], ne[2], ne[3]);
+                        } break;
+                    case GGML_OP_TRANSPOSE:
+                        {
+                            tensor = ggml_transpose(*ctx_eval, args[0]);
                         } break;
                     default:
                         {
diff --git a/llama.cpp b/llama.cpp
@@ -1279,15 +1279,14 @@ static bool llama_eval_internal(
             ggml_set_name(Qcur, "Qcur");
             ggml_set_name(Kcur, "Kcur");
 
-            // TODO: TMP !!!!
-            if (il == 0) {
-                ggml_set_name(Qcur, "mtl-check");
-            }
-
             // store key and value to memory
             {
                 // compute the transposed [N, n_embd] V matrix
                 struct ggml_tensor * Vcur = ggml_transpose(ctx0, ggml_reshape_2d(ctx0, ggml_mul_mat(ctx0, model.layers[il].wv, cur), n_embd, N));
+                // TODO: TMP !!!!
+                if (il == 0) {
+                    ggml_set_name(Vcur, "mtl-check");
+                }
 
                 struct ggml_tensor * k = ggml_view_1d(ctx0, kv_self.k, N*n_embd, (ggml_element_size(kv_self.k)*n_embd)*(il*n_ctx + n_past));
                 struct ggml_tensor * v = ggml_view_2d(ctx0, kv_self.v, N, n_embd,

Original file line number	Diff line number	Diff line change
`@@ -258,6 +258,7 @@ int llama_mtl_eval(`
`258`	`258`
`259`	`259`	`switch (gf->nodes[i]->op) {`
`260`	`260`	`case GGML_OP_RESHAPE:`
	`261`	`+ case GGML_OP_TRANSPOSE:`
`261`	`262`	`{`
`262`	`263`	`// noop`
`263`	`264`	`} break;`