Spark in me - Internet, data science, math, deep learning, philosophy(@snakers4). Improved Text Recapitalization and Repunctuation Model for 4 Languages

Spark in me - Internet, data science, math, deep learning, philosophy

2440 @snakers4

Открыть

Канал про интересные мне темы - интернет - статистика - наука о данных Без рекламы и буллшита.

Spark in me - Internet, data science, math, deep learning, philosophy

@snakers4 4 года назад

Improved Text Recapitalization and Repunctuation Model for 4 Languages - The model now can work with long inputs, 512 tokens or ca. 150 words; - Inputs longer than 150 words are automatically processed in chunks; - The bugs with newer PyTorch versions have been fixed; - Model was trained longer with larger batches; - Model size slightly reduced to 85 MB; - The rest of model optimizations were deemed too high maintenance; Link

GitHub - snakers4/silero-models: Silero Models: pre-trained speech-to-text, text-to-speech and text-enhancement models made embarrassingly simple

Silero Models: pre-trained speech-to-text, text-to-speech and text-enhancement models made embarrassingly simple - GitHub - snakers4/silero-models: Silero Models: pre-trained speech-to-text, text-t...

GitHub