Honor -ngl option for Cuda offloading in llava

2024-12-26 11:24:35 +00:00 · 2023-10-14 03:12:10 +03:00 · 2023-10-14 03:12:10 +03:00 · 932589c0ef
commit 932589c0ef
parent 2a4bcbacea
1 changed files with 7 additions and 1 deletions
--- a/examples/llava/llava.cpp
+++ b/examples/llava/llava.cpp
@ -80,6 +80,12 @@ int main(int argc, char ** argv) {
    llama_backend_init(params.numa);
    llama_model_params model_params              = llama_model_default_params();
                       model_params.n_gpu_layers = params.n_gpu_layers;
                       model_params.main_gpu     = params.main_gpu;
                       model_params.tensor_split = params.tensor_split;
                       model_params.use_mmap     = params.use_mmap;
                       model_params.use_mlock    = params.use_mlock;
    llama_model * model = llama_load_model_from_file(params.model.c_str(), model_params);
    if (model == NULL) {
        fprintf(stderr , "%s: error: unable to load model\n" , __func__);