llama.cpp

mirror of https://github.com/ggerganov/llama.cpp.git synced 2024-12-27 03:44:35 +00:00

History

Xuan Son Nguyen 6e7d133a5f server : refactor multitask handling (#9274 ) * server : remove multitask from server_task * refactor completions handler * fix embeddings * use res_ok everywhere * small change for handle_slots_action * use unordered_set everywhere * (try) fix test * no more "mutable" lambda * Apply suggestions from code review Co-authored-by: Georgi Gerganov <ggerganov@gmail.com> * use deque --------- Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>	2024-09-02 17:11:51 +02:00
..
steps.py	server : refactor multitask handling (#9274 )	2024-09-02 17:11:51 +02:00

Xuan Son Nguyen 6e7d133a5f

server : refactor multitask handling (#9274 )

* server : remove multitask from server_task

* refactor completions handler

* fix embeddings

* use res_ok everywhere

* small change for handle_slots_action

* use unordered_set everywhere

* (try) fix test

* no more "mutable" lambda

* Apply suggestions from code review

Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>

* use deque

---------

Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>

2024-09-02 17:11:51 +02:00

steps.py

server : refactor multitask handling (#9274 )

2024-09-02 17:11:51 +02:00