• NVIDIA Tesla K20X - nie startuje, brak vCore/vMem

Правила форуму:Натисніть тут для перегляду правил форуму

  1. Назва теми має містити: виробника пристрою, повну модель та короткий опис проблеми.
  2. Пост має містити: код маркування друкованої плати (необхідний у разі ремонту обладнання), розширений опис проблеми, речі, які ви перевірили/замінили/виміряли, ваші висновки та запитання. Якщо ви не можете знайти код маркування друкованої плати, прочитайте ЦЮ ТЕМУ. Якщо ви все ще не можете знайти маркування друкованої плати, завантажте фотографії з високою роздільною здатністю обох сторін друкованої плати - необхідно видалити всі плівки, модулі або кронштейни, які можуть покривати ці позначки.
  3. Перш ніж публікувати нову тему, прочитайте всі теми підфоруму НАВЧАННІ і проведіте попередню діагностику на основі змісту цих тренінгів.
  4. Завантаження будь-яких повних схем, бордвю, файлів БІОС / прошивки або будь-якої іншої документації (або посилань на веб-сайти з такими файлами) СТРОГО ЗАБОРОНЕНО. Ви можете опублікувати лише невелику частину документації або посилання на файл БІОС на підфорумі НЕПЕРЕВІРЕНІ ФАЙЛИ БІОС що спростити діагностику або ремонт. Вам не дозволяється публікувати більше однієї повної сторінки інструкції/схеми на одну тему. Файл, який ви публікуєте, не повинен містити водяних знаків, «конфіденційних» тегів, посилань чи адрес електронної пошти та не може бути захищений паролем.
  5. Дозволено описувати лише один несправний пристрій у одній темі - ви завжди повинні відкривати нову тему для кожного наступного пристрою.
  6. Запит повних схем, бордвю, файлів БІОС або будь-якої іншої документації ЗАБОРОНЕНО на цьому підфорумі. Якщо вам потрібно попросити щось із цього, вам слід відкрити нову тему в підфорумі ЗАПИТ НА ДОКУМЕНТАЦІЮ ТА БІОС.
Ця тема позначена як АРХІВНИЙ. Відповідайте лише в тому випадку, якщо ваша відповідь містить рішення проблеми (Правила Форуму, п. 12.1).

#1 NVIDIA Tesla K20X - nie startuje, brak vCore/vMem


rutki3z 6 Січня 2023, 00:14
Witajcie, trafił do mnie taki oto "wynalazek": Tesla K20X, karta ma podobne PCB do GTX Titan/GTX 780 ale z bardziej rozbudowaną sekcją vcore. Karta miała nie dokręconą śrubkę chłodzenia obok NCP4208, nie wiem czy ten układ mógł się przegrzać ale jest martwy, został wymieniony.

Karta nie startowała i nie startuje, zimny rdzeń

Kontroler vCore NCP4208 + 8x FDMF6823B

Зображення
Зображення

    5V ok
    3.3V ok
    VCORE 0,1V
    VMEM 0V

    VMEM - 39,5Ω
    VCORE - 7.1Ω
    Pary sygnałowe PCI-E mają taki sam opór
    PEX 12V - 0,14kΩ
    12V obok 8-pin ~5kΩ
    12v obok 6-pin - ~8kΩ
    5V - 1,75kΩ
    3,3V - 2,45kΩ

Przed zamianą NCP4208:
    Pin 1 (VCC3) - 0,14V + niski opór
    PWRGD - 0V
    ALERT - 0V
    EN - 3,1V

Po zamianie NCP4208 na nowy:
    Pin 1 - 3,3V
    PWRGD - 0V
    ALERT - 0V
    EN - przez ułamek sekundy stan wysoki, po czym niski

    VCore wciąż 0,1V i vMEM 0V

Sprawdzałem DrMOS-y, każdy z nich ma te same opory na Gate High, Gate Low i VSWH . Z ciekawości odpiąłem (przecięcie ścieżki na PCB) sygnał EN, i na wyjściu vcore jest już generowane ~0,6V. Oczywiście karta dalej nie startuje, a sam sygnał chyba jest kontrolowany przez GPU.

Nie wiem co dalej sprawdzić, może to zachowanie wskazuje na uszkodzony rdzeń?. Lub moja ciekawość przez odpięcie EN go zabiła. Co robić, jak żyć?

Re: NVIDIA Tesla K20X - nie startuje, brak vCore/vMem


Google Adsense [BOT] 6 Січня 2023, 00:14

#2 Re: NVIDIA Tesla K20X - nie startuje, brak vCore/vMem


xamledyD 6 Січня 2023, 17:09
Witam.
Układ NCP4208 wyposażony jest w interfejs I2C, który służy do zarządzania tym układem. Nie mam pewności, czy nowy czysty układ zadziała bez problemów w tej karcie. Jeśli masz oscyloskop, to sprawdź czy na liniach SCL i SDA układu coś się dzieje.
Pozdrawiam

#3 Re: NVIDIA Tesla K20X - nie startuje, brak vCore/vMem


Vogelek23 6 Січня 2023, 22:14
xamledyD написав:Układ NCP4208 wyposażony jest w interfejs I2C, który służy do zarządzania tym układem. Nie mam pewności, czy nowy czysty układ zadziała bez problemów w tej karcie.
Musi zadziałać, bo interfejs I2C służy jedynie do wysyłania poleceń DO sterownika NCP4208 (który jest układem Slave, a więc sam poleceń żadnych nie wysyła). Ponadto, NCP4208 nie jest wyposażony ani w CPU, ani w jakąkolwiek pamięć ROM.

rutki3z написав:EN - przez ułamek sekundy stan wysoki, po czym niski
Czy w ciągu tego ułamka sekundy występują jakiekolwiek impulsy na którejkolwiek z cewek tej przetwornicy (od strony sterowników)? Jaka jest rezystancja do masy na którejkolwiek z cewek?

#4 Re: NVIDIA Tesla K20X - nie startuje, brak vCore/vMem


rutki3z 6 Січня 2023, 23:13
Jeśli masz oscyloskop, to sprawdź czy na liniach SCL i SDA układu coś się dzieje.

Niestety nie posiadam oscyloskopu.

Czy w ciągu tego ułamka sekundy występują jakiekolwiek impulsy na którejkolwiek z cewek tej przetwornicy (od strony sterowników)?

Z odczytów na mierniku napięcie jest chwilowo wyższe niż 0,1V po czym spada do 0,1V

Jaka jest rezystancja do masy na którejkolwiek z cewek?

VCORE - 7.1Ω

Poeksperymentowałem trochę z tym NCP4208 i dla testu podłączyłem 3,3V z jego wbudowanego regulatora na nogę EN. Poskutkowało to wygenerowaniem ~0,8V na VCORE, niestety sygnał PWRGD wciąż 0V. Ścieżka z rdzenia do nogi EN była w trakcie tego "eksperymentu" odcięta, bo nie chciałem puścić tych 3,3v z kontrolera na rdzeń.

Jeśli dobrze odczytałem dokumentację tego układu i schematu od Gigabyte GTX 760 (z tym samym NCP4208), to w przypadku błędu sygnał PWRGD jest ściągany do masy przez ten właśnie kontroler. Zastanawiam się czy odpięcie kontrolera od tej linii dało by jakiś efekt, może nawet spóźnione fajerwerki. (Jak dobrze rozumiem, to właśnie 3.3v na PWRGD załącza kolejne układy zasilania)

#5 Re: NVIDIA Tesla K20X - nie startuje, brak vCore/vMem


rutki3z 9 Січня 2023, 17:19
Udało mi się zdobyć taką sprawną kartę i sprawdzić opory na liniach zasilania. Okazało się że karta posiada zaniżony opór od strony 12V z gniazda PCI-Express. Jako że zasilanie na linii 5V I 3.3V występowało, kolejnym podejrzanym był układ generujący zasilanie pamięci (FBVDD). MOSFET-y sprawdziłem, i wyglądają na sprawne, jednak opór na nodze od sterowania bramką umieszczonego niżej MOSFET-u low-side był w omach, kiedy na sprawnej karcie jest w kΩ. Zdemontowałem kontroler APW7088, i wszystkie inne pomiary się unormowały. Opory na dodatkowych liniach generowanych przez FBVDD są OK.

Zastanawia mnie jednak co spowodowało uszkodzenie dwóch głównych kontrolerów, gdy układy DrMOS/MOSFET wyglądają na sprawne, a napięcia zasilające zarówno je jak i kontrolery, były cały czas były OK. Niefortunne wyładowanie ESD? A może jednak częsciowo uszkodzony DrMOS lub MOSFET? Jeśli któryś z forumowiczów jest w stanie zaproponować realistyczny scenariusz dla takiego uszkodzenia, moja ciekawość była by zaspokojona :)

Podam pomiary dla sprawnej karty, gdyby ktoś chciał się zabrać za naprawę lub diagnozę podobnej konstrukcji. Uprzedzam że pomiary w poprzednich postach były wykonane na mierniku z rozładowaną baterią, i nie są dokładne.
  • VCore: 5.5Ω
  • VMem: 38Ω
  • 12V PCI-Express: 2.85kΩ
  • 8-pin PCI-E: 5.15kΩ
  • 6-pin PCI-E: 8.25kΩ
  • 5V: 1.81kΩ
  • 3.3V na nodze kości SPI: 2.45kΩ


Re: NVIDIA Tesla K20X - nie startuje, brak vCore/vMem


Google Adsense [BOT] 9 Січня 2023, 17:19
Ця тема позначена як АРХІВНИЙ. Відповідайте лише в тому випадку, якщо ваша відповідь містить рішення проблеми (Правила Форуму, п. 12.1).

Хто зараз онлайн

Зараз переглядають цей форум: Немає зареєстрованих користувачів і 3 гостей

_______________________________
Всі права захищені. Заборонено копіювати будь-який вміст та елементи веб-сайту без дозволу.
Усі торгові марки, назви брендів, продукти чи послуги, опубліковані на цьому веб-сайті, належать їхнім законним власникам і використовувались лише в інформаційних цілях.