llama : add pooling switch

2024-12-30 21:34:36 +00:00 · 2024-03-04 14:06:33 +02:00 · 2024-03-04 14:06:33 +02:00 · e66da356a4
commit e66da356a4
parent 9bbeb0f110
1 changed files with 25 additions and 18 deletions
--- a/llama.cpp
+++ b/llama.cpp
@ -8379,10 +8379,17 @@ static int llama_decode_internal(
                if (batch.logits[i] == 0) {
                    continue;
                }
-                if (hparams.pooling_type == LLAMA_POOLING_TYPE_CLS) {
+                switch (hparams.pooling_type) {
                    case LLAMA_POOLING_TYPE_CLS:
                        ggml_backend_tensor_get_async(backend_embd, embd, embeddings_out.data() + (n_embd*i), (n_embd*batch.seq_id[i][0])*sizeof(float), n_embd*sizeof(float));
-                } else {
+                        break;
                    case LLAMA_POOLING_TYPE_MEAN:
                    case LLAMA_POOLING_TYPE_NONE:
                        ggml_backend_tensor_get_async(backend_embd, embd, embeddings_out.data() + (n_embd*i), (n_embd*i)*sizeof(float), n_embd*sizeof(float));
                        break;
                    default:
                        GGML_ASSERT(false && "unknown pooling type");
                        break;
                }
            }
        }