llama.cpp

mirror of https://github.com/ggerganov/llama.cpp.git synced 2024-12-30 21:34:36 +00:00

History

Georgi Gerganov 841f27abdb metal : optimize FA kernels (#10171 ) * ggml : add ggml_flash_attn_ext_get_prec * metal : use F16 precision in FA kernels ggml-ci * metal : minor clean-up * metal : compile-guard bf16 FA kernels ggml-ci * build : remove obsolete compile flag [no ci] * metal : prevent int overflows [no ci] * cuda : disable BF16 FA ggml-ci * metal : fix BF16 requirement for FA kernels ggml-ci * make : clean-up [no ci]		2024-11-08 13:47:22 +02:00
..
ggml-alloc.h	ggml : fix typo in example usage ggml_gallocr_new (ggml/984)	2024-10-04 18:50:05 +03:00
ggml-amx.h	add amx kernel for gemm (#8998 )	2024-10-18 13:34:36 +08:00
ggml-backend.h	ggml : move CPU backend to a separate file (#10144 )	2024-11-03 19:34:08 +01:00
ggml-blas.h	ggml : add backend registry / device interfaces to BLAS backend (#9752 )	2024-10-07 21:55:08 +02:00
ggml-cann.h	[CANN] Adapt to dynamically loadable backends mechanism (#9970 )	2024-10-22 16:16:01 +08:00
ggml-cpp.h	llama : use smart pointers for ggml resources (#10117 )	2024-11-01 23:48:26 +01:00
ggml-cpu.h	ggml : move CPU backend to a separate file (#10144 )	2024-11-03 19:34:08 +01:00
ggml-cuda.h	llama : refactor model loader with backend registry (#10026 )	2024-10-30 02:01:23 +01:00
ggml-kompute.h	kompute: add backend registry / device interfaces (#10045 )	2024-10-30 17:01:52 +01:00
ggml-metal.h	ggml : add metal backend registry / device (#9713 )	2024-10-07 18:27:51 +03:00
ggml-rpc.h	rpc : add backend registry / device interfaces (#9812 )	2024-10-10 20:14:55 +02:00
ggml-sycl.h	[SYCL] Add SYCL Backend registry, device and Event Interfaces (#9705 )	2024-10-18 06:46:16 +01:00
ggml-vulkan.h	vulkan : add backend registry / device interfaces (#9721 )	2024-10-17 02:46:58 +02:00
ggml.h	metal : optimize FA kernels (#10171 )	2024-11-08 13:47:22 +02:00