llama.cpp/mul.comp at d50f8897a797a5a03f31228d1b5a7b8130ee1bc2 - llama.cpp - Gitea: Git with a cup of tea

root/llama.cpp

mirror of https://github.com/ggerganov/llama.cpp.git synced 2024-12-26 03:14:35 +00:00

0cc4m 7c7836d9d4

Vulkan Shader Refactor, Memory Debugging Option (#7947 )

* Refactor shaders, extract GLSL code from ggml_vk_generate_shaders.py into vulkan-shaders directory

* Improve debug log code

* Add memory debug output option

* Fix flake8

* Fix unnecessary high llama-3 VRAM use

2024-06-16 07:17:31 +02:00

13 lines

334 B

Plaintext

Raw Blame History

 #version 450
 #include "types.comp"
 #include "generic_binary_head.comp"
 void main() {
     if (gl_GlobalInvocationID.x >= p.ne) {
         return;
     }
     data_d[p.d_offset + dst_idx(gl_GlobalInvocationID.x)] = D_TYPE(FLOAT_TYPE(data_a[src0_idx(gl_GlobalInvocationID.x)]) * FLOAT_TYPE(data_b[src1_idx(gl_GlobalInvocationID.x)]));
 }