Kvcache Optimization Python Packages

vmlx

vMLX - JANGTQ Uber Compressed MLX Models - L2 Disk Cache (survives restart) + L1 Paged (super fast ttft) + Hybrid SSM Scheduler + Cont Batching + etc!

9K 736 80

kvcached

Virtualized Elastic KV Cache for Dynamic GPU Sharing and Beyond

1K 1K 122