[CoreML Backend] Update coreml runner to only profile model when profile_model option is set

cymbalrush · cymbalrush · commit 8487a338e1ce · 2024-03-21T22:30:02.000-07:00
diff --git a/backends/apple/coreml/runtime/sdk/ETCoreMLModelAnalyzer.mm b/backends/apple/coreml/runtime/sdk/ETCoreMLModelAnalyzer.mm
@@ -123,11 +123,6 @@ - (nullable instancetype)initWithCompiledModelAsset:(ETCoreMLAsset *)compiledMod
                          modelAsset.contentURL.path);
     }
     
-    ETCoreMLModelProfiler *profiler = [[ETCoreMLModelProfiler alloc] initWithCompiledModelAsset:model.asset
-                                                                                    outputNames:model.orderedOutputNames
-                                                                                  configuration:configuration
-                                                                                          error:error];
-    
     self = [super init];
     if (self) {
         _model = model;
@@ -136,7 +131,6 @@ - (nullable instancetype)initWithCompiledModelAsset:(ETCoreMLAsset *)compiledMod
         _configuration = configuration;
         _pathToSymbolNameMap = pathToSymbolNameMap;
         _executor = [[ETCoreMLDefaultModelExecutor alloc] initWithModel:model];
-        _profiler = profiler;
     }
     
     return self;
@@ -147,12 +141,22 @@ - (nullable instancetype)initWithCompiledModelAsset:(ETCoreMLAsset *)compiledMod
                                                  eventLogger:(const executorchcoreml::ModelEventLogger *)eventLogger
                                                        error:(NSError * __autoreleasing *)error {
     if (self.profiler == nil) {
+        ETCoreMLModelProfiler *profiler = [[ETCoreMLModelProfiler alloc] initWithCompiledModelAsset:self.model.asset
+                                                                                        outputNames:self.model.orderedOutputNames
+                                                                                      configuration:self.configuration
+                                                                                              error:error];
+        self.profiler = profiler;
+    }
+       
+    
+    if (!self.profiler) {
         ETCoreMLLogErrorAndSetNSError(error,
                                       ETCoreMLErrorModelProfilingNotSupported,
                                       "%@: Model profiling is only available for macOS >= 14.4, iOS >= 17.4, tvOS >= 17.4 and watchOS >= 10.4.",
                                       NSStringFromClass(ETCoreMLModelAnalyzer.class));
         return nil;
     }
+    
     NSArray<MLMultiArray *> *modelOutputs = nil;
     NSArray<ETCoreMLModelStructurePath *> *operationPaths = self.profiler.operationPaths;
     ETCoreMLModelProfilingResult *profilingInfos = [self.profiler profilingInfoForOperationsAtPaths:operationPaths
diff --git a/examples/apple/coreml/executor_runner/main.mm b/examples/apple/coreml/executor_runner/main.mm
@@ -6,21 +6,18 @@
 // Please refer to the license found in the LICENSE file in the root directory of the source tree.
 
 #import <Foundation/Foundation.h>
-
 #import <chrono>
-#import <memory>
-#import <numeric>
-#import <string>
-
+#import <coreml_backend/delegate.h>
 #import <executorch/extension/data_loader/file_data_loader.h>
 #import <executorch/runtime/executor/method.h>
 #import <executorch/runtime/executor/program.h>
 #import <executorch/runtime/platform/log.h>
 #import <executorch/runtime/platform/runtime.h>
-#import <executorch/util/util.h>
 #import <executorch/sdk/etdump/etdump_flatcc.h>
-
-#import <coreml_backend/delegate.h>
+#import <executorch/util/util.h>
+#import <memory>
+#import <numeric>
+#import <string>
 
 static inline id check_class(id obj, Class cls) {
     return [obj isKindOfClass:cls] ? obj : nil;
@@ -44,7 +41,8 @@ static inline id check_class(id obj, Class cls) {
     bool purge_models_cache = false;
     bool dump_model_outputs = false;
     bool dump_intermediate_outputs = false;
-
+    bool profile_model = false;
+    
     Args(NSDictionary<NSString *, NSString *> *params) {
         {
             NSString *value = SAFE_CAST(params[@"--model_path"], NSString);
@@ -83,15 +81,18 @@ static inline id check_class(id obj, Class cls) {
             }
         }
         {
-            NSString *value = SAFE_CAST(params[@"--dump_intermediate_outputs"], NSString);
-            if (value.length > 0) {
-                dump_intermediate_outputs = value.boolValue;
+            if (params[@"--profile_model"] != nil) {
+                profile_model = true;
             }
         }
         {
-            NSString *value = SAFE_CAST(params[@"--dump_model_outputs"], NSString);
-            if (value.length > 0) {
-                dump_model_outputs = value.boolValue;
+            if (params[@"--dump_intermediate_outputs"] != nil) {
+                dump_intermediate_outputs = true;
+            }
+        }
+        {
+            if (params[@"--dump_model_outputs"] != nil) {
+                dump_model_outputs = true;
             }
         }
     }
@@ -102,7 +103,17 @@ static inline id check_class(id obj, Class cls) {
 }
 
 NSSet<NSString *> *all_keys() {
-    return [NSSet setWithObjects:@"--model_path", @"--iterations", @"--purge_models_cache", @"--etdump_path", @"--debug_buffer_path", @"--debug_buffer_size", @"--dump_intermediate_outputs", @"--dump_model_outputs", nil];
+    return [NSSet setWithArray:@[
+        @"--model_path",
+        @"--iterations",
+        @"--purge_models_cache",
+        @"--etdump_path",
+        @"--debug_buffer_path",
+        @"--debug_buffer_size",
+        @"--dump_intermediate_outputs",
+        @"--dump_model_outputs",
+        @"--profile_model"
+    ]];
 }
 
 Args parse_command_line_args(NSArray<NSString *> *args) {
@@ -127,11 +138,11 @@ Args parse_command_line_args(NSArray<NSString *> *args) {
         key = value;
         values = [NSMutableString string];
     }
-
+    
     if (key.length > 0) {
         params[key] = values.length > 0 ? clean_string(values.copy) : @"";
     }
-
+    
     return Args(params);
 }
 
@@ -148,29 +159,28 @@ Args parse_command_line_args(NSArray<NSString *> *args) {
     DataLoaderImpl(const std::string& filePath)
     :data_(read_data(filePath))
     {}
-
+    
     Result<FreeableBuffer> Load(size_t offset, size_t size) override {
         NSData *subdata = [data_ subdataWithRange:NSMakeRange(offset, size)];
         return FreeableBuffer(subdata.bytes, size, nullptr);
     }
-
+    
     Result<size_t> size() const override {
         return data_.length;
     }
-
+    
 private:
-   NSData *data_;
+    NSData *data_;
 };
 
 using Buffer = std::vector<uint8_t>;
 
-std::unique_ptr<Program> get_program(NSURL *url) {
-    DataLoaderImpl dataLoader(url.path.UTF8String);
-    auto program = Program::load(&dataLoader);
+std::unique_ptr<Program> make_program(DataLoader *data_loader) {
+    auto program = Program::load(data_loader);
     if (!program.ok()) {
         return nullptr;
     }
-
+    
     return std::make_unique<Program>(std::move(program.get()));
 }
 
@@ -179,7 +189,7 @@ Args parse_command_line_args(NSArray<NSString *> *args) {
     if (!methodName.ok()) {
         return Error::InvalidProgram;
     }
-
+    
     return std::string(methodName.get());
 }
 
@@ -189,15 +199,15 @@ Args parse_command_line_args(NSArray<NSString *> *args) {
     if (!method_meta.ok()) {
         return Error::InvalidProgram;
     }
-
+    
     std::vector<std::vector<uint8_t>> buffers;
     buffers.reserve(method_meta->num_memory_planned_buffers());
     for (size_t bufferID = 0; bufferID < method_meta->num_memory_planned_buffers(); ++bufferID) {
         auto buffer_size = method_meta->memory_planned_buffer_size(bufferID);
         std::vector<uint8_t> data(buffer_size.get(), 0);
         buffers.emplace_back(std::move(data));
     }
-
+    
     return buffers;
 }
 
@@ -207,7 +217,7 @@ Args parse_command_line_args(NSArray<NSString *> *args) {
     for (auto& buffer : buffers) {
         result.emplace_back(buffer.data(), buffer.size());
     }
-
+    
     return result;
 }
 
@@ -221,7 +231,7 @@ Args parse_command_line_args(NSArray<NSString *> *args) {
             ET_LOG(Info, "Skipping non-tensor input %zu", i);
             continue;
         }
-        Buffer buffer(tensor_meta->nbytes(), 1);
+        Buffer buffer(tensor_meta->nbytes(), 0);
         auto sizes = tensor_meta->sizes();
         exec_aten::TensorImpl tensor_impl(tensor_meta->scalar_type(), std::size(sizes), const_cast<int *>(sizes.data()), buffer.data());
         exec_aten::Tensor tensor(&tensor_impl);
@@ -241,7 +251,7 @@ Args parse_command_line_args(NSArray<NSString *> *args) {
     if (durations.size() == 0) {
         return 0.0;
     }
-
+    
     return std::accumulate(durations.begin(), durations.end(), 0.0)/durations.size();
 }
 
@@ -258,96 +268,115 @@ Error execute_method(Method *method, size_t n, std::vector<double>& durations) {
         auto diff = current_time - start_time;
         durations.emplace_back(std::chrono::duration<double, std::milli>(diff).count());
     }
-
+    
     return status;
 }
+
+bool is_model_analysis_enabled(const Args& args) {
+    return args.profile_model || args.dump_model_outputs || args.dump_intermediate_outputs;
+}
+
+std::unique_ptr<ETDumpGen> make_etdump_gen(Buffer& debug_buffer, const Args& args) {
+    if (!is_model_analysis_enabled(args)) {
+        return nullptr;
+    }
+    
+    auto etdump_gen = std::make_unique<ETDumpGen>();
+    debug_buffer.resize(args.debug_buffer_size);
+    if (args.dump_intermediate_outputs || args.dump_model_outputs) {
+        debug_buffer.resize(args.debug_buffer_size);
+        ET_LOG(Info, args.dump_model_outputs ? "Logging model outputs." : "Logging intermediate outputs.");
+        Span<uint8_t> debug_buffer_span(debug_buffer.data(), debug_buffer.size());
+        etdump_gen->set_debug_buffer(debug_buffer_span);
+        etdump_gen->set_event_tracer_debug_level(args.dump_model_outputs ? EventTracerDebugLogLevel::kProgramOutputs : EventTracerDebugLogLevel::kIntermediateOutputs);
+    }
+        
+    return etdump_gen;
+}
+
+void dump_etdump_gen(ETDumpGen *etdump_gen, const Buffer& debug_buffer, const Args& args) {
+    etdump_result result = (etdump_gen != nullptr) ? etdump_gen->get_etdump_data() : etdump_result{.buf = nullptr, .size = 0};
+    if (result.size == 0) {
+        return;
+    }
+    
+    FILE *ptr = fopen(args.etdump_path.c_str(), "wb");
+    fwrite(result.buf, 1, result.size, ptr);
+    fclose(ptr);
+    ET_LOG(Info, "Profiling result saved at path = %s", args.etdump_path.c_str());
+    if (args.dump_intermediate_outputs || args.dump_model_outputs) {
+        ET_LOG(Info, "Debug buffer size = %zu", result.size);
+        FILE *ptr = fopen(args.debug_buffer_path.c_str(), "wb");
+        fwrite(debug_buffer.data(), 1, debug_buffer.size(), ptr);
+        fclose(ptr);
+        ET_LOG(Info, "Debug result saved at path = %s", args.etdump_path.c_str());
+    }
+}
+
 }
 
 int main(int argc, char * argv[]) {
     @autoreleasepool {
         runtime_init();
-
+        
         auto args = parse_command_line_args([[NSProcessInfo processInfo] arguments]);
         if (args.purge_models_cache) {
             ET_LOG(Info, "Purging models cache");
             auto delegate = CoreMLBackendDelegate::get_registered_delegate();
             delegate->purge_models_cache();
         }
-
+        
         if (args.model_path.empty()) {
             ET_LOG(Error, "Model path is empty.");
             return EXIT_FAILURE;
         }
-
+        
         NSURL *model_url = [NSURL fileURLWithPath:@(args.model_path.c_str())];
         ET_CHECK_MSG(model_url != nil, "Model path=%s is invalid", args.model_path.c_str());
-
-        auto program = get_program(model_url);
+        
+        auto data_loader = std::make_unique<DataLoaderImpl>(model_url.path.UTF8String);
+        auto program = ::make_program(data_loader.get());
         ET_CHECK_MSG(program != nil, "Failed to load program from path=%s", args.model_path.c_str());
-
+        
         auto method_name = get_method_name(program.get());
         ET_CHECK_MSG(method_name.ok(), "Failed to get method name from program=%p", program.get());
-
-        auto plannedBuffers = get_planned_buffers(method_name.get(), program.get());
+        
+        auto planned_buffers = get_planned_buffers(method_name.get(), program.get());
         Buffer method_buffer(kRuntimeMemorySize, 0);
         MemoryAllocator method_allocator(static_cast<int32_t>(method_buffer.size()), method_buffer.data());
-        auto spans = to_spans(plannedBuffers.get());
+        auto spans = to_spans(planned_buffers.get());
         HierarchicalAllocator planned_allocator(Span<Span<uint8_t>>(reinterpret_cast<Span<uint8_t> *>(spans.data()), spans.size()));
         MemoryManager memory_manager(&method_allocator, &planned_allocator);
-
-        ETDumpGen *etdump_gen = new ETDumpGen();
-        Buffer debug_buffer(args.debug_buffer_size, 0);
-        if (args.dump_intermediate_outputs) {
-            ET_LOG(Info, "Dumping intermediate outputs");
-            Span<uint8_t> buffer(debug_buffer.data(), debug_buffer.size());
-            etdump_gen->set_debug_buffer(buffer);
-            etdump_gen->set_event_tracer_debug_level(
-                EventTracerDebugLogLevel::kIntermediateOutputs);
-        } else if (args.dump_model_outputs) {
-            ET_LOG(Info, "Dumping model outputs");
-            Span<uint8_t> buffer(debug_buffer.data(), debug_buffer.size());
-            etdump_gen->set_debug_buffer(buffer);
-            etdump_gen->set_event_tracer_debug_level(
-                EventTracerDebugLogLevel::kProgramOutputs);
-        }
-
+        
+        Buffer debug_buffer;
+        auto etdump_gen = ::make_etdump_gen(debug_buffer, args);
+        
         auto load_start_time = std::chrono::steady_clock::now();
-        auto method = program->load_method(method_name.get().c_str(), &memory_manager, (EventTracer *)etdump_gen);
+        auto method = program->load_method(method_name.get().c_str(), &memory_manager, (EventTracer *)etdump_gen.get());
         auto load_duration = std::chrono::steady_clock::now() - load_start_time;
         ET_LOG(Info, "Load duration = %f",std::chrono::duration<double, std::milli>(load_duration).count());
-
+        
         ET_CHECK_MSG(method_name.ok(), "Failed to load method with name=%s from program=%p", method_name.get().c_str(), program.get());
         ET_LOG(Info, "Running method = %s", method_name.get().c_str());
-
+        
         auto inputs = ::prepare_input_tensors(*method);
         ET_LOG(Info, "Inputs prepared.");
-
+        
         // Run the model.
         std::vector<double> durations;
-        Error status = execute_method(&method.get(), args.iterations, durations);
+        Error status = ::execute_method(&method.get(), args.iterations, durations);
         ET_CHECK_MSG(status == Error::Ok, "Execution of method %s failed with status 0x%" PRIx32, method_name.get().c_str(), status);
         ET_LOG(Info, "Model executed successfully.");
-
-        double mean = calculate_mean(durations);
+        
+        double mean = ::calculate_mean(durations);
         ET_LOG(Info, "Inference latency=%.2fms.", mean);
-
+        
         auto outputs = method_allocator.allocateList<EValue>(method->outputs_size());
         status = method->get_outputs(outputs, method->outputs_size());
         ET_CHECK(status == Error::Ok);
-
-        etdump_result result = etdump_gen->get_etdump_data();
-        if (result.size != 0) {
-            ET_LOG(Info, "Size = %zu", result.size);
-            FILE *ptr = fopen(args.etdump_path.c_str(), "wb");
-            fwrite(result.buf, 1, result.size, ptr);
-            fclose(ptr);
-            if (args.dump_intermediate_outputs || args.dump_model_outputs) {
-                FILE *ptr = fopen(args.debug_buffer_path.c_str(), "wb");
-                fwrite(debug_buffer.data(), 1, debug_buffer.size(), ptr);
-                fclose(ptr);
-            }
-        }
-
+       
+        dump_etdump_gen(etdump_gen.get(), debug_buffer, args);
+        
         return EXIT_SUCCESS;
     }
 }