ћерион Ќетворкс

6 минут чтени€

¬ данной статье рассматриваютс€ вопросы, которые следует задать системным администраторам, и меры предосторожности, которые они должны предприн€ть при устранении неполадок.

bazovye-osnovy-ustraneniya-nepoladok-v-unix

 ак правило, устранение неполадок не рассматриваетс€ на каких-либо официальных зан€ти€х, - это все то, что большинство из нас в конечном итоге усваивает на собственном горьком опыте.  ак действовать, где искать, как определить первопричину возникших проблем - все это навыки, которые мы обычно развиваем с течением времени.

∆изненный цикл сеанса устранени€ неполадок обычно включает:

  • ќбнаружение - обнаружение проблемы
  • »дентификаци€ - понимание того, в чем проблема
  • јнализ - определение причины проблемы
  • »справление - исправление того, что было не так
  • ѕрофилактика - прин€тие мер дл€ предотвращени€ повторени€ проблемы

—истематический подход к устранению неполадок может помочь быстрее вы€вить основную причину проблемы, котора€ нарушает работу сервера или приложени€. ¬от несколько шагов и вопросы, которые нужно задать себе:


1. „то только что изменилось?

Ќаиболее часта€ перва€ реакци€ на что-то, что перестает работать - это спросить: Ђ’орошо, а что изменилось?ї »зучение последних изменений - это тоже действие, которое, скорее всего, окупитс€, если на самом деле какое-то существенное изменение было сделано только что. »щите файлы, особенно файлы конфигурации, которые могли быть изменены, приложени€ или пакеты, которые были только что добавлены, службы, которые только что были запущены, и т. д. Ќе упускайте из виду тот факт, что многие системные проблемы возникают не сразу. ѕримеры того, что идет не так, не св€зано с недавним изменением, включают:

  • ћедленно заканчиваетс€ место на диске
  • ћожете столкнутьс€ с ошибкой конфигурации, котора€ раньше просто не активировалась из-за несоблюдени€ определенных условий

2.  акие ошибки € наблюдаю?

ќбратите особое внимание на любые ошибки, которые отображаютс€ на системной консоли или в файлах журнала. ”казывают ли эти ошибки на какую-то конкретную причину? ¬ы видели раньше подобные ошибки? ¬идите ли вы какие-либо про€вление тех же ошибок в старых файлах журнала или в других системах? „то вам говор€т поисковые запросы в »нтернете? Ќезависимо от того, с какой проблемой вы столкнулись, вы вр€д ли будете первым системным администратором, столкнувшимс€ с ними.


3.  ак себ€ ведет система или сервис?

¬озможно, стоит обратить внимание на симптомы проблемы. —истема или служба работают медленно или полностью непригодны дл€ использовани€? ћожет быть, только некоторые пользователи не могут войти в систему. ћожет быть, не работают только некоторые функции. ¬ыделение того, что работает, а что нет, может помочь вам сосредоточитьс€ на том, что не так.


4. „ем эта система отличаетс€ от той, котора€ €вл€етс€ рабочей?

≈сли вам повезло, что у вас есть дублирующие системы, и у вас есть шанс сравнить ту, котора€ не работает, с другой. ¬озможно, вы сможете определить ключевые различи€, которые могут помочь вы€вить причину.

5.  аковы веро€тные точки останова?

ѕодумайте, как работает приложение или сервис и как/где могут возникнуть проблемы. ѕолагаетс€ ли он на конфигурационный файл? Ќужно ли ему общатьс€ с другими серверами? «адействована ли база данных? «аписываетс€ ли он в определенные лог-файлы? ¬ключает ли это несколько процессов? ћожете ли вы легко определить, все ли необходимые процессы запущены? ≈сли можете, систематически устран€йте потенциальные причины.


6.  акие инструменты дл€ поиска и устранени€ неисправностей могут быть полезны?

ѕодумайте об имеющихс€ у вас инструментах дл€ поиска системных проблем. Ќекоторые из них могут оказатьс€ полезными:

  • top - дл€ оценки производительности, включа€ проблемы с пам€тью, файлом подкачки и загрузкой
  • df - дл€ проверки использовани€ диска
  • find - дл€ поиска файлов, которые были изменены за последний день
  • tail -f - дл€ просмотра последних записей журнала и наблюдени€ за тем, по€вл€ютс€ ли все еще ошибки
  • lsof - чтобы определить, какие файлы были открыты конкретным процессом
  • ping - быстра€ проверка сети
  • ifconfig - проверка сетевых интерфейсов
  • traceroute - проверка подключений к удаленным системам
  • netstat - проверка сетевых подключений
  • nslookup - проверка разрешений хоста
  • route - проверка таблиц маршрутизации
  • arp - проверка IP-адреса на записи MAC-адреса в вашем кеше

7. ѕроисходит что-нибудь непри€тное?

Ќе исключайте возможность того, что кто-то вмешивалс€ в вашу систему, хот€ большинство хакеров предпочли бы делать свою работу так, чтобы вы ничего не заметили.


8. „то мне Ќ≈ делать?

Ќе путайте симптомы и причины.  аждый раз, когда вы определ€ете проблему, спрашивайте себ€, почему она существует. Ѕудьте осторожны, чтобы не уничтожить Ђдоказательстваї, пока вы лихорадочно работаете над тем, чтобы вернуть свою систему в оперативный режим. —копируйте файлы журнала в другую систему, если вам нужно освободить дисковое пространство, чтобы вернуть систему в рабочее состо€ние. «атем вы можете изучить их позже, чтобы вы€снить, что вызвало проблемы, над решением которых вы работаете.

≈сли вам нужно восстановить файл конфигурации, сначала сделайте копию файла (например, cp -p config config.save), чтобы вам было легче узнать, как и когда файл был изменен, и что вам нужно сделать, чтобы все заработало. »мейте ввиду, что дл€ поиска решени€ возникшей проблемы вы, возможно, примените большое количество решений. » в последствии не сможете запомнить, какое из решений устранило проблему.


9. „то мне делать?

«апишите все свои действи€. ≈сли вы используете PuTTY дл€ подключени€ (или какой-либо другой инструмент, позвол€ющий записывать взаимодействи€ с вашей системой), включите ведение журнала. Ёто поможет вам, когда вам нужно будет проанализировать, что произошло и как вы решили проблему. ≈сли у вас достаточно места на диске, вы также можете использовать скрипт дл€ записи сеанса входа в систему (например, сценарий устранени€ неполадок `date% m% d% y`). ≈сли у вас нет возможности сохран€ть логи, записывайте все, что вы делали и что видели. ¬ы можете не вспомнить все это позже, особенно если вы находитесь в состо€нии стресса. ¬ы можете помнить шаги, но не пор€док, в котором вы их выполн€ли.

ѕосле устранени€ проблемы задокументируйте, что произошло. ¬озможно данна€ проблема возникнет снова, и вам, возможно, придетс€ объ€снить своему руководству или клиентам, что произошло, и как вы собираетесь предотвратить это в будущем. ѕо возможности подумайте, как можно избежать данной проблемы в будущем. ћожете ли вы улучшить свои службы мониторинга так, чтобы проблемы с дисковым пространством, пам€тью и сетью, изменени€ конфигурации и т. д. были решены задолго до того, как они повли€ют на работающие службы?


—кидки 50% в Merion Academy

¬ыбрать курс