Вроде я эту историю не рассказывал, по крайней мере не нашёл по ключевым словам в канале, поэтому те кто слышал послушают ещё раз, а участники событий поностальгируют.
Так как у нас мониторились все линки на предмет ошибок в том числе, на одной из магистралей стали мы их замечать. Не много, одну или две в минуту, но странные - из каждых четырёх часов, полчаса есть ошибки оставшееся время нет. К ошибкам мы были нетерпимы и старались добиваться везде их полного отсутствия. Характер их указывал на какой-то периодический процесс и наше подозрение, так как оборудование стояло в хорошо спроектированной серверной, упало на систему охлаждения и вентиляции. Так как проблема нас беспокоила только с эстетической точки зрения, мы конечно поискали с секундомером что такого может включаться, почистили патчи, но с решением конечно затянули дождавшись смены сезонов и переключения режима работы климатической системы. После этого проблема с ошибками ушла, это ещё больше нас убедило в том что дело в вибрации создаваемой кондиционерами или вентиляторами, может в температуре как таковой или потоках воздуха.
За сезон обычно много меняется и шансов увидеть повторение такого поведения было не много, но прошло полгода и проблема вернулась. Тогда мой коллега, который впоследствии ушёл в программисты и продолжает там оставаться, решил докопаться. В ход пошли многие средства контроля, включая видеозапись, чтобы отследить моменты с максимальной точностью. Никакой связи с работой системы охлаждения выявить не удалось, замена патчей и портов на оборудовании тоже не помогла. И тогда от отчаяния, но скорее по приколу мой коллега выпустил пар и просто наорал на трансивер, вот как здесь, наше оборудование тоже было из примерно того времени, хотя события происходили лет на 5 позже. И внезапно ошибок не стало. Не совсем, конечно, как только крик прекратился они вернулись. Не поверив собственным глазам, эксперимент повторился, а потом ещё раз и ещё раз, в присутствии меня, на видеозапись. Каждый раз одно и то же, ошибки есть - кричишь, громко и сильно - ошибок нет. Это не решало нашей проблемы и никак не указывало нам на причину, но сама ситуация была так для нас необычна, что линк в таком виде прожил ещё один сезон. А после чего мы заменили трансивер, который был в достаточной мере уникален чтобы менять его просто так и больше ошибок мы не видели.
Всё чистая правда. Поэтому когда недавно была новость про то что какая-то песня убивала жёсткие диски, я думаю участники этих событий даже бровью не повели, те кто видели видео наверное тоже :) если не забыли про него, что там до какой-то песни, когда я собственным криком мог починить оптический линк от ошибок.