2019-10-27

Проверка стабильности работы компьютера

Периодические перезагрузки операционной системы, мёртвые зависания компьютера с зацикленным звуковым сопровождением, синие экраны, ошибки в работе приложений, очень долгие операции чтения содержимого системного диска... Если данное поведение характерно для вашей системы, то читаем дальше.



Содержание




Нестабильность


Можно ли дать какое-нибудь определение стабильности работы компьютера? Если упрощенно, то стабильной работой компьютера можно считать, его продолжительную работу без программных или аппаратных сбоев. Причем под словом сбой, подразумевается проблема не позволяющая продолжить дальнейшую работу с операционной системой.

Основных системных устройств, в большей степени влияющих на стабильную работу компьютера четыре - процессор, оперативная память, видеокарта, жесткий диск. Каждое из них, отвечает за выполнение определенного спектра задач. Стабильность системы в целом, как раз строится из стабильной работы каждого их этих устройств. И, как не трудно догадаться, некорректная работа одного, может вызывать ошибки в работе другого устройства.

Сами ошибки-сбои можно разделить на два типа, аппаратные и программные. А по типу обнаружения, на явные и не явные.

К явным можно отнести те, выявление которых не требует тестирования и выполнения каких либо манипуляций. Например, артефакты выводимого изображения, или очень медленная загрузка компьютера.

С неявными, сложнее. Они проявляются при определенных условиях, и не обладают конкретными признаками. Как раз в этой ситуации и используют тесты стабильности.

Как происходит проверка стабильности работы системы? Как было сказано ранее, стабильность системы строится из стабильной работы ее устройств. Проверка стабильности, представляет собой поочередную нагрузку каждого устройства системы, с целью выявить сбойное. Нагрузка осуществляется соответствующими программными тестами, о которых будет рассказано в далее.


Тесты Стабильности


Основных, критических в плане стабильности, устройств четыре — Процессор, Оперативная память, Видеокарта, Жесткий диск. Для каждого из перечисленных устройств, существуют свои программные тесты.

Есть и другие устройства, но они не столь критичны к стабильности всей системы в целом. К примеру, проблемы сетевой карты, будут влиять лишь на стабильную работу сети, а не всей операционной системы.

Что касается программных тестов, какие-то из них работают в операционной системе Windows, некоторые запускаются только в операционной системе DOS, а некоторые являются самостоятельными загрузочными системами, т.е. запускаются прямиком из загрузчика, и предполагают использование отдельного загрузочного диска или флешки.

Причем не обязательно для тестирования стабильности использовать специализированное программное обеспечение. Целевую нагрузку на конкретное устройство, или на несколько устройств, можно создать обычными ресурсоемкими приложениями, такими как архиваторы, конвертеры, 3D-игры, графические видео/фото/3D-редакторы (особенно на этапе рендеринга), и т.п. В зависимости от выполняемой работы, подобного рода приложения могут хорошо нагружать одно, или несколько устройств из основной четверки.

Важным пунктом, при проведении тестов стабильности, является мониторинг системы. Он позволит контролировать текущие значения температур устройств, оборотов вентиляторов систем охлаждений, напряжений цепей питания, вычислительной загрузки (процент использования ресурсов конкретного устройства). Эта информация поможет выявить, что может вызывать нестабильную работу устройств.

Из доступных бесплатно, можно отметить программы HWiNFO


Или HWMonitor.


Первая более продвинутая, с графиками, и детальной информацией о системе, и сенсорах. Вторая упрощенная, выводящая только показания сенсоров.

Кроме системных устройств, проблемы стабильности могут возникать и из-за программных компонентов. Это могут быть проблемы операционной системы, драйверов, целевых программ. Обнаружить такие проблемы можно загрузившись с чистой операционной системы, или со специализированных мультизагрузочных LiveCD.

Современные мультизагрузочные сборки, включают в себя, как правило, достаточный набор тестовых программ, для проверки различного вида устройств. Список мультизагрузочных LiveCD можно посмотреть здесь.

Теперь перейдем к обзору программ...

Процессор


Процессор, это наверно одно из самых не проблемных устройств системы. Сбои в его работе крайне редки. Единственное, что может повлиять на стабильную работу процессора, это его температурный режим.

Если он не превышен, система будет работать стабильно, в противном случае, процессор начнет пропускать вычислительные такты, для уменьшения температуры кристала. Для нас, это будет характеризовано лишь уменьшившейся производительностью системы. Возможно и другое поведение. Повышение температуры до максимального порога, и последующее автоматическое выключение системы, или ее перезагрузка.

Максимально допустимая температура у каждой модели процессора своя. Узнать ее можно в характеристиках процессора, которые легко найти в интернете. Поисковый запрос будет приблизительно следующий - "Модель_процессора максимальная температура".

Проверить стабильность процессора, можно лишь нагрузив его различного рода, ресурсоемкими вычислениями. К ресурсоемким вычислениям можно отнести следующие:

1. Архивирование. Современные архиваторы (7-Zip, WinRAR и другие) способны хорошо нагружать систему при создании архивов. Кроме этого в данные программы встроены бенчмарки, которые можно использовать в качестве теста стабильности процессора и оперативной памяти.


2. Конвертирование форматов видео. Процесс преобразование одного формата видео в другое, так же ресурсозатратная операция, схожая с архивированием. Для продолжительной нагрузки потребуется конвертировать видео большого размера/продолжительности. Нагрузка в данном случае ложиться на процессор, оперативную память, в некоторых случаях и на видеокарту.

3. Игры. Нагрузка от игр больше смещена в сторону графической составляющей, и собственно больше касается видеокарты и оперативной памяти. Загрузка процессора при этом, зависит от его производительности. То есть не каждый процессор можно загрузить определенной игрой на 100%.

4. Синтетические тесты (бенчмарки), и стресс тесты. Специализированные программы, задача которых, если речь идет о стресс тестах, максимально нагрузить тестируемое оборудование, а в случае бенчмарков, выполнить вычисления и выдать в качестве результата индекс производительности тестируемого оборудования. Отличие бенчмарков от стресс тестов, в том, что первые создают нагрузку лишь на период тестов, а вторые, постоянно. Хотя на данный момент, в популярных бенчмарках присутствует возможность зацикливать тестирование, превращая тем самым бенчмарк в стресс тест.


Теперь собственно программы стресс тестирования процессора:

1. Prime95 - может сильно нагрузить процессор, выполняя поиск простых чисел Марсена, и соответственно нагреть его. Добиться такой нагрузки при выполнении повседневных задач невозможно. Для теста стабильности, самое то.


2. Linpack Xtreme - бенчмарк Linpack (решение плотной СЛАУ методом LU-декомпозиции) с консольной оболочкой упрощающей запуск данного бенчмарка. Сильно нагружает процессор.


3. IntelBurnTest - бенчмарк Linpack, но уже с графическим интерфейсом.


4. OCCT - Многофункциональный стресс тест. Содержит в себе инструменты тестирования процессора (Linpack так же входит в состав программы), видеокарты, оперативной памяти, и блока питания. Имеет встроенные средства мониторинга системы.


5. CINEBENCH - многопоточный бенчмарк, выполняющий рендеринг графической сцены. Предназначен для определения производительности вашего компьютера в программе Cinema 4D. Хорошо загружает процессор.


Несомненно есть и другие программы, мною были перечисленны самые популярные. Замечу, что программы Prime95 и Linpack кроссплатформенные.

Определившись с программами, перейдем к тестам. Предварительно замечу, что далее описывается алгоритм тестирования процессора в стоковом состоянии, т. е. без разгона.

Для начала необходимо запустить программу мониторинга, и обратить внимание на показания процессора, а именно его температуры и процента использования. Убедиться, что загрузка процессора равна нулю, или почти нулю. Температура не должна быть большой.

К примеру, в моем случае, сейчас летом, температура воздуха в комнате равна 32 ℃, температура процессора при этом равна 43 ℃.


Естественно, зимой показания будут ниже, в районе 35-38 ℃. Это нормальные показатели для моего Intel Core i7 3770s. А вот если бы температура в покое была в диапазоне 50-60 ℃, то это явный сигнал о необходимости проверки системы охлаждения и термоинтерфейса.

При нагрузке Linpack'ом температура процессора существенно возрастает.


Во время теста, следим за температурой. Если она непрерывно повышается, после чего происходит сбой, то это явный признак перегрева процессора, что является следствием проблем с охлаждением.

Если же сбой не связан с повышением температуры, то есть, температура зафиксировалась на определенном значении, и сбои происходят в разное время выполнения теста, при максимальной температуре, причина скорее всего в оперативной памяти.

Во время нагрузки, обязательно необходимо мониторить наличие троттлинга процессора. Троттлинг — это механизм пропуска вычислительных тактов процессора с целью предотвращения дальнейшего роста его температуры. Наличие троттлинга, так же свидетельствует о том, что у процессора присутствуют проблемы с охлаждением.


Оперативная Память


Задача оперативной памяти, хранить данные необходимые процессору для текущих вычислений. То есть это данные, к которым нужен быстрый доступ.

Структура самой памяти, схожа с таблицей (столбцы, строки, ячейки). Каждая ячейка имеет два возможных логических состояния, 1 или 0, для записи информации в них в бинарном виде. Если работа какой-нибудь из ячеек нарушается, то независимо от записанной в нее информации она будет всегда выдавать 0 при чтении. Тем самым, информация записанная в область сбойной ячейки будет искажена (очень грубое обьяснение).

Кроме этого возможны проблемы доступа к отдельным участкам оперативной памяти, что может приводить к бесконечному ожиданию данных, или по простому мертвому зависанию системы.

При чтении данных из сбойной области оперативной памяти, процессор может интерпретировать ожидаемую команду/инструкцию, как совершенно другую, приводя работу операционной системы к сбою.

Сбои оперативной памяти, обычно, не постоянны. Если в ходе работы с компьютером сбойный участок памяти не будет задействован, операционная система будет исправно работать. В противном случае вы можете получить различного рода ошибки. Перечислим некоторые из них:

1. Внезапные перезагрузки, синие экраны смерти. Критические ошибки, приводящие к краху ядра операционной системы.

2. Мертвые зависания. Когда получение данных из оперативной памяти привело процессор к мертвому зацикливанию. Например бесконечное чтение данных, или иными словами невозможность дочитать требуемую информацию.

3. Ошибки в работе программ/игр. При запуске и использовании различных программ можно получить ошибку чтения/доступа к оперативной памяти.

Выявить проблемы с оперативной памятью можно с помощью любой программы задействующей ее по максимуму. К таким программам можно отнести архиваторы, конвертеры, игры, графические фото/видео редакторы.

При этом выявление проблемы может не произойти с первого раза, так как запускаемое приложение попросту может не использовать поврежденный участок оперативной памяти. Увеличить шансы теста всей области оперативной памяти могут лишь большие объемы данных задействованных в обработке указанных выше программ.

К примеру, если вы будете архивировать или конвертировать файл небольшого размера, то вы вряд ли сможете выявить проблемы с оперативной памятью.

Самый точный способ проверить оперативную память, это запустить специализированный тест MemTest86. Запускается он в виде отдельного исполняемого файла вне операционной системы, и производит тестирование всего объема оперативной памяти. Существует в двух исполнениях, для систем с BIOS и с UEFI.

Для использования MemTest86 потребуется использовать загрузочный диск/флешку. В идеале подойдет любая мультизагрузочная сборка, как правило, в 99% случаев MemTest86 присутствует в них. Либо же можно скачать программу создающую соответствующую загрузочную флешку с официального сайта программы. BIOS версии в большинстве случаев достаточно, так как любая современная материнская плата способна грузиться в Legacy-режиме.

Если же по какой-либо причине сделать это невозможно, следует воспользоваться версией MemTest86 от PassMark, предназначенных исключительно для UEFI-систем.


Работа с программой очень проста. Все что следует сделать, это запустить тест, и ожидать появление сообщений об ошибках. Проверять планки оперативной памяти, если их количество больше одной, следует по отдельности, чтобы стопроцентно сразу определить сбойную.


Видеокарта


Видеокарта это сложное устройство, представляющее собой отдельный вычислительный блок со своим процессором (он же графический чип) и оперативной памятью. Занимается видеокарта подготовкой и выводом изображения. Графические вычисления не единственные возможные для видеокарт, существует программное обеспечение задействующее вычислительные мощности видеокарт для своих нужд.

Так как основная задача видеокарты, это вывод изображения, любое нарушение ее стабильной работы будет сразу вывявлено в виде искаженного изображения (еще их называют артефактами) или отсутсвия изображения вовсе.

Какие бывают искажения?  Они могут постоянными, то есть появляться при запуске компьютера и последующей его работе, попутно вызывая сбои в работе операционной системе. Или переменными, иными словами проявляться при определенных условиях.

Постоянные артефакты это явный признак аппаратной неисправности видеокарты. Убедиться в этом достаточно просто. Все современные процессоры содержат встроенное графическое ядро. Достаточно переключиться на него и проверить выводимое изображение.

Теперь о переменных артефактах. Видеокарта состоит из графического процессора и оперативной памяти, и соответственно для этих двух компонентов харрактерны те же проблемы что и для обычных процессора и оперативной памяти. О возможных проблемах этих устройств вы можете прочитать в предыдущих разделах.

Из этого можно сделать вывод, что проблемы могут проявляться либо при перегреве графического чипа, либо при использовании поврежденного участка оперативной памяти видеокарты.

Зайдествовать ресурсы видеокарты с целью проверить ее стабильность достаточно просто. Все что необходимо это запустить ресурсоемкое 3D-приложение и мониторить сосотояние показания температурных датчиков видеокарты, и следить за выводимой картинкой.

Это могут быть как игры так и специализированные программы. При использовании игр, вам потребуется использовать сторонние средства мониторинга состояния видеокарты. Кроме описанных ранее можно воспользоваться программой FPS Monitor. Она позволяет выводить необходимую вам информацию в оверлее (поверх картинки) любого 3D-приложения/игры.


Параметры вывода необходимой информации гибко настраиваются.

Из специализированных тестов можно отметить программу FurMark.


Программа способна очень сильно нагузить графический чип и соответственно разогреть его. FurMark содержит собственные средства мониторигра и логирования полученных результатов.


Едиственный недостаток данной программы, она не позволяет полностью загрузить оперативную память видеокарты.

Для проверки оперативной памяти видеокарты так же существуют различные стресс-тесты. Одним из таковых является программа VMT (Video Memory stress Test).


VMT может запускаться как в ОС Windows так и в ОС DOS. Во втором случае, так же можно обойтись мультизагрузочными сборками, так как данная программа зачастую в них присутсвует.


Или же воспользоваться соответствующим *.iso образом из архива дистрибутива.



Жесткий Диск


Как и любой накопитель информации, основная задача жёсткого диска это хранить и предоставлять информацию. То есть позволять записывать и считывать информацию. Нестабильность работы для любого накопителя характеризуется успешным и своевременным выполнением вышеуказанных операций.

Структура любого накопителя информации это набор последовательно расположенных ячеек. Совокупность этих ячеек, это объем накопителя. Каждая ячейка это отдельный сектор накопителя, или минимальный объем возможной хранимой информации на данном накопителе. Для жестких дисков основанных на магнитных дисках это 512 Б, для твердотельных дисков это 4 КБ.

Разберем основные возможные проблемы:

1. Невозможность прочитать информацию из одного сектора или группы секторов. Возможны сбои в работе операционной системы, отдельных программ. Все зависит от того какая информация была записана в сбойном секторе жесткого диска, системный файлы операционной системы, файл какой-либо программы, или же личный документ, картинка и т.д.

2. Замедление доступ к секторам накопителя. Характерно замедлением работы компьютера в целом, ввиду долгого чтения/записи информации с жесткого диска.

3. Невозможность получить доступ к диску вовсе. Диск определяется, но доступ к содержимому невозможен.

Как таковой стабильности зависящей от каких то факторов для накопителей, в виде температурной зависимости, крайне редок. То есть, если у вас есть проблемы с диском, то скорее всего его придется заменить.

Для проверки дисков существуют множество различных програм Victoria, ViVARD, MHDD и др. Вся их суть заключается в проверке секторов диска на возможность чтения/записи информации, с подробным выводом полученных данных об их состоянии. В некоторых из них реализована возможность выполнить ремаппинг секторов. То есть пометка указанных секторов контроллером жёсткого диска как неиспользуемых.

Данные программы можно так же найти в большинстве мультизагрузочных сборок.

Victoria может работать в операционной системе Windows. Есть так же версия и для операционной системы DOS. Имеет простой и понятный графический интерфейс. Легко определяет имеющиеся диски. Имеет достаточно хороший функционал. Постоянно обновляется.


ViVARD реализован в виде DOS приложения. Прост в использовании. Легко определяет имеющиеся диски.


MHDD работает в операционной системе DOS. Интерфейс программы сложный. Основные действия в программе выполняются с помощью горячих клавиш, и написания команд (для вызова справки используйте команду HELP). Определяет диски работающие только в IDE режиме. По сравнению с предыдущими программами, обладает дополнительным функционалом.


Ввиду простоты, доступности и не капризности программы Victoria, советую использовать именно ее.


Что делать со сбойным устройством?


Процессор. При обнаружении аномальной температуры, почистить систему охлаждения процессора, радиатор кулера желательно полностью очистить от пыли (можно даже помыть). Вентилятор кулера максимально очистить от пыли. Заменить термоинтерфейс (термопасту).

Оперативная память. При наличии ошибок в оперативной памяти, первым делом следует несколько раз вытащить и вставить планку(ки) оперативной памяти, или просто почистить контактные площадки планки памяти, и снова выполнить тест оперативной памяти. Если после данной манипуляции, остались сбойные планки памяти, их остается лишь заменить.

Видеокарта. При наличии перегрева, выполнить чистку системы охлаждения, а так же заменить термоинтерфейс графического чипа, по возможности и оперативной памяти. При некоторых проблемах может помочь процедура вынимания/вставления видеокарты. В остальных случаях, либо замена, либо сервисный центр.

Жесткий диск. Если имеется большое количество bad-секторов, и они сконцентрированы на определенном участке жесткого диска, можно попробовать обойти его, оставив данные сектора как неразмеченную область. Если количество bad-секторов хаотично и диск в целом достаточно сильно ими заполнен, то следует заменить диск. Для единичного количества секторов, пара на несколько гигабайт дискового пространства, не критичная ситуация. Если это не вызывает сбои, можно оставить как есть, в противном случае попробовать ремаппить данные bad-сектора.


Итог


В статье было рассмотрено: Программы проверки стабильности компьютера. Алгоритм проверки стабильности работы компьютера. Как проверить стабильность компьютера? Что делать при со сбойным устройством?

В целом, в статье не было детально рассмотрена работа с каждым приложением. Статья несет более обобщенный характер. Если вы считаете, что необходимо рассмотреть проверку каждого конкретного устройства отдельно, напишите об этом в комментариях.

Комментариев нет :

Отправить комментарий