ggml-qnn: upgrade QNN SDK and add comments in build scripts to make ggml-org#12215 more clear

zhouwg · zhouwg · commit a6c8a019f88c · 2025-03-10T15:49:56.000+08:00
diff --git a/cmake/arm64-windows-llvm.cmake b/cmake/arm64-windows-llvm.cmake
@@ -1,7 +1,9 @@
 set( CMAKE_SYSTEM_NAME Windows )
 set( CMAKE_SYSTEM_PROCESSOR arm64 )
 
+#this is original, might-be suitable for MS's llvm toolchain
 #set( target arm64-pc-windows-msvc )
+#this is modification, the following must be set for llvm-mingw otherwise failure
 set( target aarch64-w64-mingw32 )
 
 set( CMAKE_C_COMPILER    clang )
@@ -10,8 +12,8 @@ set( CMAKE_CXX_COMPILER  clang++ )
 set( CMAKE_C_COMPILER_TARGET   ${target} )
 set( CMAKE_CXX_COMPILER_TARGET ${target} )
 
-#set( arch_c_flags "-march=armv8.7-a -fvectorize -ffp-model=fast -fno-finite-math-only" )
-#set( warn_c_flags "-Wno-format -Wno-unused-variable -Wno-unused-function -Wno-gnu-zero-variadic-macro-arguments" )
+set( arch_c_flags "-march=armv8.7-a -fvectorize -ffp-model=fast -fno-finite-math-only" )
+set( warn_c_flags "-Wno-format -Wno-unused-variable -Wno-unused-function -Wno-gnu-zero-variadic-macro-arguments" )
 
 set( CMAKE_C_FLAGS_INIT   "${arch_c_flags} ${warn_c_flags}" )
 set( CMAKE_CXX_FLAGS_INIT "${arch_c_flags} ${warn_c_flags}" )
diff --git a/scripts/build-run-android.sh b/scripts/build-run-android.sh
@@ -15,6 +15,7 @@ GGUF_MODEL_NAME=/sdcard/qwen1_5-1_8b-chat-q4_0.gguf
 #https://developer.qualcomm.com/software/hexagon-dsp-sdk/tools
 QNN_SDK_URL=https://www.qualcomm.com/developer/software/qualcomm-ai-engine-direct-sdk
 QNN_SDK_PATH=/opt/qcom/aistack/qairt/2.31.0.250130/
+QNN_SDK_PATH=/opt/qcom/aistack/qairt/2.32.0.250228/
 
 #default is QNN NPU
 qnnbackend=2
diff --git a/scripts/build-run-windows.sh b/scripts/build-run-windows.sh
@@ -1,14 +1,23 @@
 #!/bin/bash
-# build llama.cpp or llama.cpp + ggml-qnn for Windows with cygwin on Windows
-# build llama.cpp + ggml-qnn for Snapdragon desktop SoC equipped WoA(Windows on ARM) with cygwin on Windows
+# this script can be used with cygwin on x86-64 Windows
+#                           or llvm-mingw on x86-64 Linux
+#
+# case-1: build llama.cpp for x86-64 Windows with cygwin on x86-64 Windows
+# case-2: build llama.cpp + ggml-qnn for x86-64 Windows with cygwin on x86-64 Windows
+# case-3: build llama.cpp + ggml-qnn for Snapdragon desktop SoC equipped WoA(Windows on ARM) with cygwin on Windows
+# case-4: build llama.cpp + ggml-qnn for Snapdragon desktop SoC equipped WoA(Windows on ARM) with mingw on x86-64 Linux
 
 # items marked TODO has not verified yet
 
 set -e
 
 
 PWD=`pwd`
+#for cygwin on x86-64 Windows
 PREFIX_PATH=/cygdrive/c
+#for mingw on x86-64 Linux
+#PREFIX_PATH=/opt/qcom/aistack/
+
 GGUF_MODEL_NAME=${PREFIX_PATH}/qwen1_5-1_8b-chat-q4_0.gguf
 PROJECT_HOME_PATH=`pwd`
 
@@ -17,6 +26,7 @@ PROJECT_HOME_PATH=`pwd`
 #https://developer.qualcomm.com/software/hexagon-dsp-sdk/tools
 QNN_SDK_URL=https://www.qualcomm.com/developer/software/qualcomm-ai-engine-direct-sdk
 QNN_SDK_PATH=${PREFIX_PATH}/qairt/2.31.0.250130/
+QNN_SDK_PATH=${PREFIX_PATH}/qairt/2.32.0.250228/
 
 #default is QNN NPU
 qnnbackend=2
@@ -41,6 +51,7 @@ function check_qnn_sdk()
     fi
 }
 
+#ok with cygwin on x86-64 Windows
 function build_windows_x86
 {
     echo "build_windows_x86-without-qnn"
@@ -52,6 +63,7 @@ function build_windows_x86
     cd -
 }
 
+#ok with cygwin on x86-64 Windows
 function build_windows_x86_qnn
 {
     echo "build_windows_x86-with-qnn"
@@ -66,7 +78,8 @@ function build_windows_x86_qnn
 #TODO
 function build_windows_arm64_qnn
 {
-    echo "build_windows_arm64 not supported now"
+    echo "build llama.cpp for WoA through cgwin on Windows or mingw on Linux not supported now, pls try mingw on Windows and it works"
+    return 0
     echo "cmake source dir:${PROJECT_HOME_PATH}"
     #cmake -H. -B./out/windows_arm64_qnn -DCMAKE_BUILD_TYPE=Release -DGGML_OPENMP=OFF -DGGML_QNN=ON -DCMAKE_TOOLCHAIN_FILE=${PROJECT_HOME_PATH}/cmake/arm64-windows-llvm.cmake -DCMAKE_C_FLAGS=-march=armv8.7-a -DGGML_QNN_SDK_PATH=${QNN_SDK_PATH}
     #cmake -H. -B./out/windows_arm64_qnn -DCMAKE_BUILD_TYPE=Release -DGGML_OPENMP=OFF -DGGML_QNN=ON -DCMAKE_TOOLCHAIN_FILE=${PROJECT_HOME_PATH}/cmake/arm64-windows-cygwin.cmake -DCMAKE_C_FLAGS=-march=armv8.7-a -DGGML_QNN_SDK_PATH=${QNN_SDK_PATH}
diff --git a/scripts/build-woa-on-windows.bat b/scripts/build-woa-on-windows.bat
@@ -0,0 +1,5 @@
+@echo "build llama.cpp through llvm-mingw toolchain on x86-64 Windows"
+
+set PATH=C:\Program Files\llvm-mingw-20250305-ggml-ucrt-x86_64\bin;C:\Program Files\llvm-mingw-20250305-ggml-ucrt-x86_64\Git\cmd;C:\Program Files\llvm-mingw-20250305-ggml-ucrt-x86_64\CMake\bin;%PATH%;
+cmake --preset arm64-windows-llvm-release -D GGML_OPENMP=OFF -DGGML_QNN=ON -DGGML_QNN_SDK_PATH="C:\\qairt\\2.31.0.250130"
+cmake --build build-arm64-windows-llvm-release