How to quantize llama with k-quant quantization? #2293

dbanka · 2023-07-20T14:05:05Z

dbanka
Jul 20, 2023

I could not find any documentation on how to do quantisation of llama model with new k-quant methods: q2_K, q3_K_S, q3_K_M, q3_K_L, q4_K_S, q4_K_M, q5_K_S, q6_K.

It will be very helpful if someone could share the steps/code to run that.

dbanka · 2023-07-20T14:17:44Z

dbanka
Jul 20, 2023
Author

Sorry it is already there in quantize help, found it

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

How to quantize llama with k-quant quantization? #2293

Uh oh!

{{title}}

Uh oh!

Replies: 1 comment

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

How to quantize llama with k-quant quantization? #2293

Uh oh!

dbanka Jul 20, 2023

Replies: 1 comment

Uh oh!

dbanka Jul 20, 2023 Author

dbanka
Jul 20, 2023

dbanka
Jul 20, 2023
Author