would_be_interpreter(@wouldbeinterpreter). Возник вопрос про память переводов (ТМ) и виды совпадений в ней. Рассказываю 🙂 (Дисклеймер 1: я раб

Возник вопрос про память переводов (ТМ) и виды совпадений в ней. Рассказываю 🙂 (Дисклеймер 1: я работаю на английском и термины знаю только английские. Если в русскоязычной локализации что-то называется не так, можно в комментах мне об этом рассказать :) Дисклеймер 2: инфа сотка исключительно для моей компании. Предполагаю, что общие принципы работают везде, но если вдруг что-то не так, как вам знакомо – сорри, рассказываю на материале Transperfect) Память перевода заводится отдельно под каждого клиента, и их может быть несколько в зависимости от проекта: например, отдельная ТМ для внутренних текстов и отдельная – для B2C. Кстати, если клиент по какой-то причине уходит, он может забрать свои ТМки с собой 😅 А в памяти переводов есть: 🌐 No match - Нет совпадений Это новые сегменты, которых совсем нет в ТМ. За них лингвисту платят полную ставку, так как их нужно переводить с нуля. (Сегменты – это, например, одно предложение, или один абзац, или один пункт из списка bullet points. Про сегментацию могу рассказать отдельно 🙂) 🌐 Fuzzy match - Неполное/частичное совпадение Это значит, что что-то похожее есть в ТМ, но не совсем. Например, раньше переводили “I was bitten by a frog”, а теперь появилось “I was bitten by MY frog”. Такие совпадения выражаются в процентах (например, Fuzzy match 75-99%). Чем выше процент, тем «похожее» контент. За фаззики обычно лингвисту платят неполную ставку. С какого процента фаззик считается таковым, зависит от договорённости с клиентом. 🌐 Repetitions - Повторы Это сегменты, которые уже встречались конкретно в этом проекте. То есть, как только ты перевёл первый такой сегмент, ты можешь смело (ну или же, наоборот, очень аккуратно)) подставлять этот перевод во все остальные репы (точнее, «кошка» сама подставит). За подстановку и проверку повторов обычно платят, но совсем чуть-чуть (например, 0.02$ за слово). А могут приравнять их к полным совпадениям (см. ниже) и не оплачивать. Уточняйте заранее 🙂 🌐 100% match - Полное совпадение Значит, точно такой же сегмент уже есть в памяти. Смело подтверждаем этот сегмент и идём дальше. За подтверждение полных мэтчей обычно не платят; в редких случаях платят столько же, сколько за повторы. Кстати, изменение форматирования или пунктуации превратит полное совпадение в частичное. 🌐 Content match / Golden match - Идеальное совпадение Значит, что не просто сегмент уже есть в ТМ, но и все сегменты вокруг него (контекст) там точно такие же, как и в этом проекте. То есть тут вообще думать не надо. Обычно считается вместе с полными совпадениями. Всё это, конечно, не всегда работает с креативными текстами, где иногда даже не используют память перевода. Но вот технический, медицинский перевод, перевод тренингов или документации идёт на ура 🙂 Вопросики? 🙂