Канал про интересные мне темы - интернет - статистика - наука о данных Без рекламы и буллшита.
docker history - https://pythonspeed.com/articles/docker-history/
"What if it changes?" - chriskiehl.com/article…-changes
Асинхронный python без головной боли - https://habr.com/ru/post/667630/
Протоколы в Python: утиная типизация по-новому - https://habr.com/ru/post/557898/
#digestwe unify single-encoder, dual-encoder and encoder-decoder paradigms, and train one image-text foundation model that subsumes the capabilities of all three approachesThe idea of using all of the available noisy data and approaches and creatively sharing the compute is a good pattern, unless you read this line:
Pretraining CoCa takes about 5 days on 2,048 CloudTPUv4 chipsResearch and compute siloing, of course, but the pattern itself is nice. #deep_learing
jit / pt packages even if it reduces package size significantly.
But there is a third solution. If there is a single large layer / module (e.g. nn.Embedding - the best candidate) there is a dirty hack:
- Do not quantize the model;
- Quantize the weight matrix manually;
- Save the checkpoint with int8 weights;
- Store scale and zero_point separately;
- On loading, just convert int8 into float32 manually;
(Basically the same approach as dynamic quantization).
Your mileage may vary, but basic conversions is as follows:
qmax = 127 qmin = -128 scale = (weight.max() - weight.min()) / (qmax - qmin) zero_point = qmin - weight.min() / scaleObviously we tried going below
int8, but the dynamic range for nn.Embedding was somewhere around 2**6, so we decided not to.
If this faces some further real world hurdles, I will provide an update.
#deep_learingХабр читают люди из разных уголков мира, у которых разные ассоциации и с Победой, и с СССР, и даже с Юрием Алексеевичем. Поэтому мы рекомендуем отказаться от провокации этих ассоциаций. ... Это не столько позиция, сколько обобщенные результаты наблюдений. Модераторам каждый день приходится устранять десятки нарушений, спровоцированных, казалось бы, безобидными ассоциациями.Стоп ... но с Победой и Юрием другие ассоциации ведь всем понятно у кого? А Хабр работает по российским законам и получает 100% выручки в РФ. Но почему-то модераторы Хабра ... своими действиями поддерживают именно этих людей и намекают, что надо бы ассоциации забыть или перепрошить, или по крайней мере не напоминать. Понятно, что на УК РФ 354.1 это наверное не тянет (для этого нужна более активная "позиция"), но осадочек остается очень и очень неприятный. Причем, посмотрите видео, оно максимально "белое и пушистое", за все светлое и чистое, никого ни к чему не призывает (да, почему-то кому-то можно везде всех призывать, а нам типа всегда нельзя). Короче, товарищи. Если вам даже так, мерзко, вяло и на пол-шишечки, запрещают помнить и гордиться своей историей - задумывайтесь, анализируйте информацию и делайте выводы. И да, максимальный репост. Спасибо!