Change lowbit example to use 4-bit as default in example (#10865)

metascroy · web-flow · commit 001e5ef4dd6c · 2025-05-13T18:35:00.000-07:00
As titled
diff --git a/examples/models/llama/README.md b/examples/models/llama/README.md
@@ -398,7 +398,7 @@ LLAMA_CHECKPOINT=path/to/checkpoint.pth
 LLAMA_PARAMS=path/to/params.json
 
 # Set low-bit quantization parameters
-QLINEAR_BITWIDTH=3 # Can be 1-8
+QLINEAR_BITWIDTH=4 # Can be 1-8
 QLINEAR_GROUP_SIZE=128 # Must be multiple of 16
 QEMBEDDING_BITWIDTH=4 # Can be 1-8
 QEMBEDDING_GROUP_SIZE=32 # Must be multiple of 16