llama : print devices used on model load

slaren · slaren · commit 20ca856ab1cc · 2024-10-07T22:45:30.000+02:00
diff --git a/ggml/src/ggml-backend.cpp b/ggml/src/ggml-backend.cpp
@@ -555,7 +555,6 @@ struct ggml_backend_registry {
         register_backend(ggml_backend_cuda_reg());
 #endif
 #ifdef GGML_USE_METAL
-
         register_backend(ggml_backend_metal_reg());
 #endif
 #ifdef GGML_USE_VULKAN
@@ -565,7 +564,7 @@ struct ggml_backend_registry {
         register_backend(ggml_backend_blas_reg());
 #endif
 
-        // TODO: sycl, vulkan, kompute, cann
+        // TODO: sycl, kompute, cann
 
         register_backend(ggml_backend_cpu_reg());
     }
diff --git a/src/llama.cpp b/src/llama.cpp
@@ -19100,8 +19100,13 @@ struct llama_model * llama_load_model_from_file(
 
             case GGML_BACKEND_DEVICE_TYPE_GPU:
             case GGML_BACKEND_DEVICE_TYPE_GPU_FULL:
+            {
+                size_t free, total; // NOLINT
+                ggml_backend_dev_memory(dev, &free, &total);
+                LLAMA_LOG_INFO("%s: using device %s (%s) - %zu MiB free\n", __func__, ggml_backend_dev_name(dev), ggml_backend_dev_description(dev), free/1024/1024);
                 model->devices.push_back(dev);
                 break;
+            }
         }
     }
 

Original file line number	Diff line number	Diff line change
`@@ -19100,8 +19100,13 @@ struct llama_model * llama_load_model_from_file(`
`19100`	`19100`
`19101`	`19101`	`case GGML_BACKEND_DEVICE_TYPE_GPU:`
`19102`	`19102`	`case GGML_BACKEND_DEVICE_TYPE_GPU_FULL:`
	`19103`	`+ {`
	`19104`	`+ size_t free, total; // NOLINT`
	`19105`	`+ ggml_backend_dev_memory(dev, &free, &total);`
	`19106`	`+ LLAMA_LOG_INFO("%s: using device %s (%s) - %zu MiB free\n", __func__, ggml_backend_dev_name(dev), ggml_backend_dev_description(dev), free/1024/1024);`
`19103`	`19107`	`model->devices.push_back(dev);`
`19104`	`19108`	`break;`
	`19109`	`+ }`
`19105`	`19110`	`}`
`19106`	`19111`	`}`
`19107`	`19112`