convert-falcon-hf-to-gguf.py : add tensor data layout

2025-01-14 04:24:30 +00:00 · 2023-08-19 12:05:11 +02:00 · 2023-08-19 12:05:11 +02:00 · b3a7a2b486
commit b3a7a2b486
parent 2c8055b65b
1 changed files with 2 additions and 1 deletions
--- a/convert-falcon-hf-to-gguf.py
+++ b/convert-falcon-hf-to-gguf.py
@ -95,7 +95,8 @@ print("gguf: get model metadata")
 block_count = hparams["n_layer"]

 gguf_writer.add_name(last_dir)
-gguf_writer.add_context_length(2048)
+gguf_writer.add_context_length(2048) # not in config.json
+gguf_writer.add_tensor_data_layout("jploski") # qkv tensor transform
 gguf_writer.add_embedding_length(hparams["hidden_size"])
 gguf_writer.add_feed_forward_length(4 * hparams["hidden_size"])
 gguf_writer.add_block_count(block_count)