gguf-py : add IQ1_M to GGML_QUANT_SIZES (#6761)

2024-09-22 21:16:20 +00:00 · 2024-04-21 14:49:30 +02:00 · 2024-04-21 14:49:30 +02:00 · c1386c936e
commit c1386c936e
parent e8d35f47cb
1 changed files with 1 additions and 0 deletions
--- a/gguf-py/gguf/constants.py
+++ b/gguf-py/gguf/constants.py
@ -872,6 +872,7 @@ GGML_QUANT_SIZES = {
    GGMLQuantizationType.I32:     (1, 4),
    GGMLQuantizationType.I64:     (1, 8),
    GGMLQuantizationType.F64:     (1, 8),
+    GGMLQuantizationType.IQ1_M:   (256, QK_K // 8 + QK_K // 16  + QK_K // 32),
 }