Тест на корректность функционирования CPU
От: CaptainFlint Россия http://flint-inc.ru/
Дата: 16.07.25 10:29
Оценка:
Комп начал барахлить, пытаюсь идентифицировать сбойный компонент. Хочется как-то проверить, корректно ли работает процессор. Для проверки памяти, скажем, есть memtest. А есть ли что-то аналогичное для процессоров? Обычно везде предлагаются всякие стресс-тесты, молотилки чисел типа Prime95 или OCCT, которые гоняют вычисления под нагрузкой. Но что если обычные вычисления работают корректно, а отдельные потенциально сбойные операции или блоки остаются совершенно незадействованными? Типа всяких там SSE, SSSE, FPU... То есть хочется тест, который делает ставку не на жаропрочность проца, а на экстенсивный прогон максимально разнообразных задач. Существуют ли такие в природе?
Почему же, ё-моё, ты нигде не пишешь «ё»?
Re: Тест на корректность функционирования CPU
От: Pzz Россия https://github.com/alexpevzner
Дата: 16.07.25 10:41
Оценка:
Здравствуйте, CaptainFlint, Вы писали:

CF>Комп начал барахлить, пытаюсь идентифицировать сбойный компонент. Хочется как-то проверить, корректно ли работает процессор. Для проверки памяти, скажем, есть memtest. А есть ли что-то аналогичное для процессоров? Обычно везде предлагаются всякие стресс-тесты, молотилки чисел типа Prime95 или OCCT, которые гоняют вычисления под нагрузкой. Но что если обычные вычисления работают корректно, а отдельные потенциально сбойные операции или блоки остаются совершенно незадействованными? Типа всяких там SSE, SSSE, FPU... То есть хочется тест, который делает ставку не на жаропрочность проца, а на экстенсивный прогон максимально разнообразных задач. Существуют ли такие в природе?


Если процессор не разогнанный, очень маловероятно, что он начал сбоить.

Я бы начал с memtest-а, а потом шел бы по цепочке охлаждение процессора (пыль в радиаторе, вентилятор, термопаста)->блок питания->память->материнская плата.

И еще, есть смысл подёргать/пошевелить всё, что воткнуто в сокеты. Там контакты иногда закисают.

У меня есть старый компьютер, работает сервером. Сначала сдох питальник (компьютер стал перегружаться на ровном месте), потом поработал стабильно несколько месяцев и стал зависать. В итоге пришлось методом тыка мать поменять. Причиной, видимо, был заклинивший вентилятор процессора, от постоянного перегрева на матери, похоже, появились микротрещины в районе процессорного сокета.

С замененой матерью работает, как часы. В процессе "вслепую" поменял память, не помогло.
Re[2]: Тест на корректность функционирования CPU
От: CaptainFlint Россия http://flint-inc.ru/
Дата: 16.07.25 12:00
Оценка:
Здравствуйте, Pzz, Вы писали:

Pzz>Я бы начал с memtest-а, а потом шел бы по цепочке охлаждение процессора (пыль в радиаторе, вентилятор, термопаста)->блок питания->память->материнская плата.


Memtest уже гонял. Перегрев я исключил, так как проявление сбоя от нагрузки не зависит. Prime95 гонял, всё чисто. В American Truck Simulator играл, слышно было, как вентиляторы разгоняются от нагрузки — и тоже ничего. Но в совершенно произвольный момент, даже когда ничего не делаю и ничего нагружающего не запущено, может всё взять и зависнуть намертво (вплоть до курсора мыши и NumLock'а). Или уйти в резет. Поэтому и возникло желание проверить, а нет ли в проце какой-то хитрой ситуации. А то Prime95 мне гоняет (утрировано) два сложения и два умножения в цикле, и с ними всё зашибись. А потом ядро Windows дёргает какую-нибудь векторную операцию, и всё дохнет.

Pzz>И еще, есть смысл подёргать/пошевелить всё, что воткнуто в сокеты. Там контакты иногда закисают.


Комп пересобирался год назад, маловероятно, что за такое время успело закиснуть.

Pzz>У меня есть старый компьютер, работает сервером. Сначала сдох питальник (компьютер стал перегружаться на ровном месте), потом поработал стабильно несколько месяцев и стал зависать. В итоге пришлось методом тыка мать поменять. Причиной, видимо, был заклинивший вентилятор процессора, от постоянного перегрева на матери, похоже, появились микротрещины в районе процессорного сокета.


Pzz>С замененой матерью работает, как часы. В процессе "вслепую" поменял память, не помогло.


Вот у меня сейчас два главных кандидата: проц и материнка. Ну или на уровне софта что-то капитально поломалось в самой винде. Ещё, теоретически, системный хард может быть. Когда он сбоит во время глубоко ядерных операций, системе может стать очень плохо. Хочется из этого списка хотя бы проц исключить, так как тоже сомневаюсь, что он виноват. Но не могу найти подходящих тестов. Везде сплошные оверклокинги и перегревы.
Почему же, ё-моё, ты нигде не пишешь «ё»?
Re[3]: Тест на корректность функционирования CPU
От: Pzz Россия https://github.com/alexpevzner
Дата: 16.07.25 12:25
Оценка:
Здравствуйте, CaptainFlint, Вы писали:

Pzz>>Я бы начал с memtest-а, а потом шел бы по цепочке охлаждение процессора (пыль в радиаторе, вентилятор, термопаста)->блок питания->память->материнская плата.


CF>Memtest уже гонял. Перегрев я исключил, так как проявление сбоя от нагрузки не зависит.


А зря. У меня совершенно ненагруженный одноядерный Celeron 450 с теплопакетом 35 ватт разогревался до 100 градусов из-за заклинившего вентилятора и радиатора, забитого пылью. Если бы я вовремя придал этому значение, возможно мать не пришлось бы менять.

У тебя ж есть показометр температуры процессора. Чего он показывает?

Pzz>>И еще, есть смысл подёргать/пошевелить всё, что воткнуто в сокеты. Там контакты иногда закисают.


CF>Комп пересобирался год назад, маловероятно, что за такое время успело закиснуть.


Может, тогда вставил чуть криво, оно и поплыло.

CF>Вот у меня сейчас два главных кандидата: проц и материнка. Ну или на уровне софта что-то капитально поломалось в самой винде. Ещё, теоретически, системный хард может быть. Когда он сбоит во время глубоко ядерных операций, системе может стать очень плохо. Хочется из этого списка хотя бы проц исключить, так как тоже сомневаюсь, что он виноват. Но не могу найти подходящих тестов. Везде сплошные оверклокинги и перегревы.


Очень маловероятно, что проц. Они обычно весьма надёжные.

Диск тоже вряд ли.

Наверное, все-таки или питальник, или мать.
Re[4]: Тест на корректность функционирования CPU
От: CaptainFlint Россия http://flint-inc.ru/
Дата: 16.07.25 13:17
Оценка:
Здравствуйте, Pzz, Вы писали:

CF>>Memtest уже гонял. Перегрев я исключил, так как проявление сбоя от нагрузки не зависит.


Pzz>А зря. У меня совершенно ненагруженный одноядерный Celeron 450 с теплопакетом 35 ватт разогревался до 100 градусов из-за заклинившего вентилятора и радиатора, забитого пылью. Если бы я вовремя придал этому значение, возможно мать не пришлось бы менять.


Pzz>У тебя ж есть показометр температуры процессора. Чего он показывает?


Так если перегрев, то он бы под нагрузочными тестами дох. А он не дохнет.
В покое 45, под умеренной нагрузкой 65, под праймом 85, в пике 90 (Ryzen 7 5800X).
Почему же, ё-моё, ты нигде не пишешь «ё»?
Re[5]: Тест на корректность функционирования CPU
От: Pzz Россия https://github.com/alexpevzner
Дата: 16.07.25 13:23
Оценка:
Здравствуйте, CaptainFlint, Вы писали:

Pzz>>У тебя ж есть показометр температуры процессора. Чего он показывает?


CF>Так если перегрев, то он бы под нагрузочными тестами дох. А он не дохнет.

CF>В покое 45, под умеренной нагрузкой 65, под праймом 85, в пике 90 (Ryzen 7 5800X).

Да, не похоже на перегрев.
Re: Тест на корректность функционирования CPU
От: Michael7 Россия  
Дата: 16.07.25 21:53
Оценка:
Здравствуйте, CaptainFlint, Вы писали:

CF> А есть ли что-то аналогичное для процессоров? Обычно везде предлагаются всякие стресс-тесты, молотилки чисел типа Prime95 или OCCT, которые гоняют вычисления под нагрузкой. Но что если обычные вычисления работают корректно, а отдельные потенциально сбойные операции или блоки остаются совершенно незадействованными? Типа всяких там SSE, SSSE, FPU...


OCCT как раз имеет опции для тестирования вычислительных блоков, SSE, AVX/AVX2 там. Или можно на сайте интела найти Linpack для теста, погонять.
Re[6]: Тест на корректность функционирования CPU
От: CaptainFlint Россия http://flint-inc.ru/
Дата: 17.07.25 15:52
Оценка:
Здравствуйте, Pzz, Вы писали:

Pzz>Да, не похоже на перегрев.


Я, когда написал тут своё сообщение, что под тестами всё хорошо, вдруг задумался: а ведь, действительно, все падения происходили, именно когда комп не был ничем нагружен, а в нагруженных сценариях всё работало стабильно!

Решил проверить гипотезу, запустил на постоянку однопоточный тест WinRAR. Уже сутки прошли, падений не было; а ведь до этого до очередного сбоя проходило несколько часов от силы.

Таким образом, это очень похоже на микротрещину в чипе или в припое, когда от термического расширения контакт становится более надёжным. Правда, по-прежнему неизвестен источник; может быть и проц, и материнка, и память (это объяснило бы, почему memtest ничего не показал). Диск и видеокарту можно исключить, они винраром не греются. Блок питания под вопросом, на низком потреблении у них обычно показатели несколько хуже и, теоретически, это могло тоже объяснить поведение, но всё же вероятность, мне кажется, ниже.
Почему же, ё-моё, ты нигде не пишешь «ё»?
Re[7]: Тест на корректность функционирования CPU
От: Pzz Россия https://github.com/alexpevzner
Дата: 17.07.25 15:59
Оценка: -1
Здравствуйте, CaptainFlint, Вы писали:

CF>Таким образом, это очень похоже на микротрещину в чипе или в припое, когда от термического расширения контакт становится более надёжным. Правда, по-прежнему неизвестен источник; может быть и проц, и материнка, и память (это объяснило бы, почему memtest ничего не показал). Диск и видеокарту можно исключить, они винраром не греются. Блок питания под вопросом, на низком потреблении у них обычно показатели несколько хуже и, теоретически, это могло тоже объяснить поведение, но всё же вероятность, мне кажется, ниже.


Скорее всего, мать. Память особо-то и не греется, процессора очень надёжны.
Re[2]: Тест на корректность функционирования CPU
От: CaptainFlint Россия http://flint-inc.ru/
Дата: 17.07.25 16:17
Оценка:
Здравствуйте, Michael7, Вы писали:

M>OCCT как раз имеет опции для тестирования вычислительных блоков, SSE, AVX/AVX2 там. Или можно на сайте интела найти Linpack для теста, погонять.


Да, про обоих слышал, но как минимум OCCT позиционирует себя как стресс-тест, экстремально прогревающий проц. Чисто интуитивно кажется, что для прогрева требуется активно гонять относительно небольшую цепочку идентичных операций, оказавшихся максимально энергопотребляющими в единицу времени. Тогда как у меня была задача получить что-то аналогичное code coverage'у, когда пофиг на нагрузку и температуру, а надо проверить поведение максимально доступного числа операций в максимально доступном числе ситуаций, чтобы задействовать все блоки проца (включая регистры, кэши, межъядерные шины и так далее, и тому подобное). OCCT и линпак, по их описаниям, не очень похожи на подобные инструменты. Не говорю, что они плохи, просто было интересно, существует ли тест, специально заточенный именно на покрытие всех операций процессора, а не на нагрузку и тест стабильности в условиях перегрева. Тем более, что, как выяснилось, в моём случае прогрев даже, наоборот, стабилизирует ситуацию (см. соседнюю ветку).
Почему же, ё-моё, ты нигде не пишешь «ё»?
Re[8]: Тест на корректность функционирования CPU
От: CaptainFlint Россия http://flint-inc.ru/
Дата: 17.07.25 16:18
Оценка:
Здравствуйте, Pzz, Вы писали:

Pzz>Скорее всего, мать. Память особо-то и не греется, процессора очень надёжны.


Да, согласен. Тоже считаю, что это главный кандидат.
Почему же, ё-моё, ты нигде не пишешь «ё»?
Re[9]: Тест на корректность функционирования CPU
От: Pzz Россия https://github.com/alexpevzner
Дата: 17.07.25 17:01
Оценка:
Здравствуйте, CaptainFlint, Вы писали:

Pzz>>Скорее всего, мать. Память особо-то и не греется, процессора очень надёжны.


CF>Да, согласен. Тоже считаю, что это главный кандидат.


Сколько такая маман стоит-то? Очень будет обидно промахнуться?
Re[10]: Тест на корректность функционирования CPU
От: CaptainFlint Россия http://flint-inc.ru/
Дата: 17.07.25 20:34
Оценка:
Здравствуйте, Pzz, Вы писали:

Pzz>Сколько такая маман стоит-то? Очень будет обидно промахнуться?


Где я живу, такая продаётся за 550 евро. Пока рассматриваю варианты с поиском хорошего сервис-центра или с пересылкой аналогичной материнки из другого города (так вышло, что у меня там есть комп с такой же материнкой, и он фактически не используется).
Почему же, ё-моё, ты нигде не пишешь «ё»?
Re[3]: Тест на корректность функционирования CPU
От: bnk СССР http://unmanagedvisio.com/
Дата: 17.07.25 21:52
Оценка:
Здравствуйте, CaptainFlint, Вы писали:

CF> Но в совершенно произвольный момент, даже когда ничего не делаю и ничего нагружающего не запущено, может всё взять и зависнуть намертво (вплоть до курсора мыши и NumLock'а). Или уйти в резет.


Если уходит в резет, то должна быть запись в логе, почему. Не пробовал смотреть?
Re[4]: Тест на корректность функционирования CPU
От: CaptainFlint Россия http://flint-inc.ru/
Дата: 18.07.25 00:39
Оценка:
Здравствуйте, bnk, Вы писали:

bnk>Если уходит в резет, то должна быть запись в логе, почему. Не пробовал смотреть?


Смотрел, конечно. В момент сбоя абсолютно чисто. Только постфактум рапортует после загрузки, что упс, обнаружилось необъяснимое нештатное завершение.
Из всех сбоев (коих набралось десятка два), лишь единственный был бсодом и поэтому оставил следы. Я пропустил дамп через анализатор, но стек-трейс был совершенно безобидным, обычные типовые функции ядра, даже не из драйверного модуля, а прям само ядро. Что лишний раз указывало в сторону аппаратных проблем, а не программных.
Почему же, ё-моё, ты нигде не пишешь «ё»?
Re[5]: Тест на корректность функционирования CPU
От: Vzhyk2  
Дата: 18.07.25 04:56
Оценка:
Здравствуйте, CaptainFlint, Вы писали:

CF>Смотрел, конечно. В момент сбоя абсолютно чисто. Только постфактум рапортует после загрузки, что упс, обнаружилось необъяснимое нештатное завершение.

CF>Из всех сбоев (коих набралось десятка два), лишь единственный был бсодом и поэтому оставил следы. Я пропустил дамп через анализатор, но стек-трейс был совершенно безобидным, обычные типовые функции ядра, даже не из драйверного модуля, а прям само ядро. Что лишний раз указывало в сторону аппаратных проблем, а не программных.
99.999999% на то, что пыть и грязь внутри компа его отправляют в перезагрузку.
Следующее по вероятности — дохнет БП.
Следующее мамка дохнет.
Следующее винты дохнут.
Re[6]: Тест на корректность функционирования CPU
От: CaptainFlint Россия http://flint-inc.ru/
Дата: 18.07.25 10:21
Оценка:
Здравствуйте, Vzhyk2, Вы писали:

V>99.999999% на то, что пыть и грязь внутри компа его отправляют в перезагрузку.

V>Следующее по вероятности — дохнет БП.
V>Следующее мамка дохнет.
V>Следующее винты дохнут.

Всё, кроме третьего, не согласуется с наблюдением длительной стабильной работы при наличии нагрузки. Теоретически, может быть и БП, под малой нагрузкой выдающий кривое питание, но как-то не верится, что от слабенькой доп. нагрузки всё выправляется в идеальное состояние. Больше всего похоже на микротрещину, и скорее всего, именно в материнке. Во всяком случае, я решил исходить из этой гипотезы. А как починю или заменю — буду дальше смотреть, помогло ли.
Почему же, ё-моё, ты нигде не пишешь «ё»?
Re[7]: Тест на корректность функционирования CPU
От: Vzhyk2  
Дата: 18.07.25 11:08
Оценка:
Здравствуйте, CaptainFlint, Вы писали:

CF>Теоретически, может быть и БП, под малой нагрузкой выдающий кривое питание, но как-то не верится, что от слабенькой доп. нагрузки всё выправляется в идеальное состояние.

Как-то купил крутой и дорогой БП для большой мощи. Новенький с большой гарантией (3 года).
Так вот эта сука при малой нагрузке глючила совсем случайным образом, причем могла и 3 раза в день глюкнуть и 5 дней без глюков проработать.
По гарантии так и не смог сдать. В сервис центре типа тестили и всё у них отлично.
В общем валяется на антресоли он.
Купил самый дешевый, что тянет мое железо и этот уже 7 лет пашет и не жужжит (еще и тихий оказался, вентиляторы видяхи без нагрузки громче).
Re[8]: Тест на корректность функционирования CPU
От: CaptainFlint Россия http://flint-inc.ru/
Дата: 18.07.25 11:37
Оценка:
Здравствуйте, Vzhyk2, Вы писали:

V>Как-то купил крутой и дорогой БП для большой мощи. Новенький с большой гарантией (3 года).

V>Так вот эта сука при малой нагрузке глючила совсем случайным образом, причем могла и 3 раза в день глюкнуть и 5 дней без глюков проработать.

Мой комп проработал почти три года без проблем. Ну как, по современным меркам без проблем. И на малой мощности, и на большой. Был включён в режиме 24/7 за редкими исключениями, и на ночь обычно ничем не нагружался. А тут очень резко вдруг начались зависание за зависанием. Если бы БП был плохим (или просто неподходящим), он бы проявил себя намного раньше. А деградация проявилась бы последовательным нарастанием сбоев, а не резким всплеском.

Я не могу его исключить на сто процентов, разумеется, но картина слишком уж не характерная.
Почему же, ё-моё, ты нигде не пишешь «ё»?
Re: Тест на корректность функционирования CPU
От: TailWind  
Дата: 18.07.25 11:49
Оценка: 9 (1) +1 :)
Попробуйте поменять шлейф SATA
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.