ОблоТка канала

Machinelearning

Π’Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ . ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ , Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти . ΠΊΠ°Π½Π°Π» с самой свСТСй ΠΈ Π°ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠ΅ΠΉ ΠΈΠ· ΠΌΠΈΡ€Π° it

Machinelearning

3 Π³ΠΎΠ΄Π° Π½Π°Π·Π°Π΄
ΠžΡ‚ΠΊΡ€Ρ‹Ρ‚ΡŒ Π²
πŸ“ An open, billion-scale corpus of images interleaved with text. MultimodalC4 is a multimodal extension of c4 that interleaves millions of images with text. ΠžΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΉ ΠΌΠΈΠ»Π»ΠΈΠ°Ρ€Π΄Π½Ρ‹ΠΉ корпус ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, Ρ‡Π΅Ρ€Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ…ΡΡ с тСкстом. πŸ–₯ Github: https://github.com/allenai/mmc4 ⏩ Paper: https://arxiv.org/abs/2304.06939v1 ⭐️ Dataset: https://paperswithcode.com/dataset/c4 ai_machinelearning_big_data