#238991

Преамбула. Серверная комната.
2 стойки с серверами. В последнее время одноюнитовые интела конкретно последней платформы жгут память. Уже 5 комплектов памяти сгорело. Более старые серверы нормально фунциклируют.
4 пожога было при выключении/включении, один вроде как при перезагрузке.

Поставщик уже смотрит волком, говорят, что кроме как у нас больше ни у кого ничего не горит. Типа мы их сами неправильно готовим.

У нас здание -- часть группы зданий машиностроитеьного завода. С соответствующей "чистотой" в электричестве. Ввод в серверную сделан пятипроводным кабелем. Три фазы, рабочий ноль, и некий пятый провод, которы по оговоркам электриков похоже совсем не земля, а защитный ноль. Посаженный в силовом этажном щите на один болт с рабочим нулем.

Далее это все приходит в APC Symmetra -- это такой UPS с двойным преобразованием на 8 киловатт мощности. Трехфазный ввод, он сам выбирает наиболее живую фазу для работы. Все серверы после симметры стоят. Понятно, что защитный ноль через симметру передается на корпуса серверов безо всяких промежуточных преобразований.

Нормальной земли уже совсем нету, хотя помещение и относится к старому советскому ВЦ, где когда-то БЭСМ-6 еще даже бывали

Внимание, вопрос! Может ли и в правду наша беда быть связана с проникновением всякой гадостной помехи через защитный ноль?

чудес не бывает ,логически предположить что либо где то дребезг контактов(в результате искрение и импульсная помеха)или все таки ноль у вас грязный в электрическом смысле,подумайте о помехоподавлени вашей цепи на Lc фильтрах (дросели) это более менее что могу советовать для начала борьбы с вашей проблемой.

Реклама
Автоматы ВА47-29 IEK

Автоматические выключатели IEK
с возможностью быстрой и надежной опломбировки! Подробнее

А в вашей красивой серверной другого заземления нет? Например кабель какой-нибудь сетевой экранированный? Врядли защитный ноль сам по себе навредит. Страшна разность потенциалов...

Память горит на одной материнке или на разных? Ddr2? Что за мать, если не секрет?
Посмотрите разность потенциалов между защитным нулем и рабочим (после упса) тестером, а еще лучше - осциллографом. В случае осциллографа попробуйте повключать/повыключать какой-нибудь потребитель мощностью ватт 500 в серверной (отключив предварительно проблемное железо) и посмотрите переходные процессы.
Если будут обнаружены значительные скачки/разность потенциалов между нулями, значит, возможно, дело в этом. Если нет - неисправно что-то другое.

Охохо... Не зря же в ПУЭ пишут: "Запрещается помещать защитный ноль и рабочий под один контактный зажим". Защитный ноль это и есть земля. Пусть хоть для начала под разные болты вгонят защитный ноль и рабочий.

Добрый час! а на Наге уже спрашивали? ведь вы сами ответили на свой вопрос,только новые корпуса, или матери, всё старое работает, память цела. Даже представить себе сложно, память стоит на матери все проводники соединены, это тут не сетевые карты на которые иногда приходит чёрт знает что.. даже не видюха на которую можно повесить какой хочешь монитор , всё находится внутри и сгорает, или точнее при включении-выключении, или перезагрузке.
Все матери и корпуса однотипны, вариантов немного поменять поставщика, или что проще перекинуть рабочую память на интел, и посмотреть , может у них вся партия такая.. бывает.
Но скорее всего это либо блоки питания, со своими задержками и проверками питаний , или матери в которых тоже стабилизаторов стоит немало и тоже свои прибамбасы с подтверждениями и задержками питания. Скорее какое то питание или сигналы приходят на память раньше чем это нужно..

  1. и самое простое проверить вольтметром напряжения с блоков питания, заодно и посмотреть осциллографом их чистоту.
  2. перекинуть память с рабочих на новые и наоборот, или поменять поставщика.
  3. поменять блоки питания , они небось с горячей заменой? но если можно надо пробовать,
  4. поменять матери.
    Как только соберете статистику всё станет ясно.. метод исключения очень точен.
    на "0" тут грешить не стоит, ваш бесперебойник всё на себя замыкает.. там такие фильтры, и преобразование..так что какой бы грязный "0" не был, ничего не повлияет..
    Удачи Сергей.

Регистрация: 12.03.2006 Казань Сообщений: 2391

Александр Ро написал :
4 пожога было при выключении/включении, один вроде как при перезагрузке.

Если был вылет при перезагрузке то возможно как-то криво реализована инициализация и помогут изменения настроек Bios. Например, отключить тест памяти, жестко выставить тайминги, разумеется разгонов никаких быть не должно.

Александр Ро написал :
одноюнитовые интела конкретно последней платформы жгут память

Модель укажите. Сомневаюсь, что дело в заземлении.

Александр Ро написал :
Ввод в серверную сделан пятипроводным кабелем.

Сечения и материал жил? Изоляция кабеля в порядке? Повторный заземлитель далеко? Можно до него "дотянуться"?

Регистрация: 29.10.2005 Москва Сообщений: 5350

2Александр Ро

Может. Точнее не он сам, а в совокупности с другими факторами, просто являясь катализатором процесса или его недостающей частью.

Если у вас серьезная контора, и поставщик у вас серьезный, тогда не заморачивайтесь особо. Поставщик сервера должен предъявить требования к питанию, а вы или кто-то другой, эти требования выполнить. Если они просто приходят и меняют память, не удостаивая внимания проверке вашей сети питания и параметров локальной сети - это лажовая контора... Лучше поиметь с них денег и отказаться от их услуг. В протиивном случае вы можете попасть на огроные бабки путем потери важной информации.

Так же, как сказали выше - может в самих серверах начинка дряная...

Конец истории. В подвале в другом крыле корпуса прекратился ремонт со сварочными работами, память гореть перестала.
Вот вам и симметра...

P.s. Люди -- симметра -- *****! Не покупайте!
У нашей изначально 1 силовой модуль из трёх был нерабочий. Меняли пол года через официальный сервис. После замены через неделю вышли из строя 2 батарейки из трех. Подмену везут уже несколько месяцев. "Непревзойденная надежность", мать их за ногу....

Добрый час! спасибо за конец истории, а то исчезают люди, а решилась проблема или нет остаётся только догадываться..
Удачи и не переделывать...Спасибо , Сергей.