llama : the WPM vocabs use the CLS token as BOS

ggml-ci
This commit is contained in:
Georgi Gerganov 2024-12-21 10:22:04 +02:00
parent 5cd85b5e00
commit 9d5c711587
No known key found for this signature in database
GPG Key ID: 449E073F9DC10735

View File

@ -1657,7 +1657,7 @@ bool llama_token_is_control_impl(const struct llama_vocab & vocab, llama_token t
}
llama_token llama_token_bos_impl(const struct llama_vocab & vocab) {
return vocab.special_bos_id;
return vocab.type != LLAMA_VOCAB_TYPE_WPM ? vocab.special_bos_id : vocab.special_cls_id;
}
llama_token llama_token_eos_impl(const struct llama_vocab & vocab) {