Обложка канала

Futuris

2134 @Futuris

Аналитика и субъективный взгляд на последние новости в сфере технологий и искусственного интеллекта.

Futuris

3 года назад
Открыть в
Llama2.rs Вы хотели запустить LLaMa2 70B на своем стареньком лэптопе? Ну, вот теперь можете. Чел переписал Карпатовскую llama2.c на Rust, оптимизировал загрузку весов в память (memmap), реализовал Grouped Query Attention и добавил квантизацию. 70B LLaMa2, которая в обычной жизни влазит только в A100, теперь бегает на лаптопе! Кхм, ну как, бегает... скорее ходит. 5 токенов в минуту. GitHub @ai_newz
GitHub - srush/llama2.rs

Contribute to srush/llama2.rs development by creating an account on GitHub.

GitHub