ОблоТка канала

Machinelearning

Π’Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ . ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ , Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти . ΠΊΠ°Π½Π°Π» с самой свСТСй ΠΈ Π°ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠ΅ΠΉ ΠΈΠ· ΠΌΠΈΡ€Π° it

Machinelearning

3 Π³ΠΎΠ΄Π° Π½Π°Π·Π°Π΄
ΠžΡ‚ΠΊΡ€Ρ‹Ρ‚ΡŒ Π²
πŸ“Œ LOMO: LOw-Memory Optimization New optimizer, LOw-Memory Optimization enables the full parameter fine-tuning of a 7B model on a single RTX 3090, or a 65B model on a single machine with 8Γ—RTX 3090, each with 24GB memory. Новый ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€, LOw-Memory Optimization (LOMO), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΠ΅Ρ‚ вычислСниС Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π° ΠΈ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π² ΠΎΠ΄ΠΈΠ½ шаг для ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΡ использования памяти. Π˜Π½Ρ‚Π΅Π³Ρ€ΠΈΡ€ΡƒΡ LOMO с ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΌΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ экономии памяти, ΠΌΠΎΠΆΠ½ΠΎ ΡΠΎΠΊΡ€Π°Ρ‚ΠΈΡ‚ΡŒ использованиС памяти Π΄ΠΎ 10,8% ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ со стандартным ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΎΠΌ (Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ DeepSpeed). πŸ–₯ Github: https://github.com/OpenLMLab/LOMO/tree/main πŸ“• Paper: https://arxiv.org/pdf/2306.09782.pdf πŸ”— Dataset: https://paperswithcode.com/dataset/superglue ai_machinelearning_big_data