SCOM 2007 Troubleshooting Guide

Коллеги, доброго времени суток! Хочу представить вашему вниманию набор сценариев устранеия проблем в SCOM 2007. Как обычно. замечания, дополнения, комментарии и разумная критика горячо приветствуются. Приятного и полезного чтения :)

 

 

Агент OpsMgr 2007 при установке выдает ошибку "One or more computers you are trying to manage are already in the process of being managed"

При попытке установить агентов System Center Operations Manager 2007 R2, можно столкнуться со следующей ошибкой:

One or more computers you are trying to manage are already in the process of being managed. Please resolve these issues via the Pending Management view in Administration, prior to attempting to manage them again.

Вызывается эта ошибка наличием записей, оставшихся от предыдущих установок в таблице AgentPendingAction базы данных. Решение проблемы таково:
1. Создайте резервную копию БД!
2. Выполните следующий запрос:
SELECT AgentPendingActionId FROM AgentPendingAction WHERE AgentName like 'Имя_компьютера'
Запрос вернет одиночные записи, указывающие на один и тот же агент..
3. Для удаления агента и списка ожидания, выполните следующую команду:
DECLARE @ActionId uniqueidentifier SET @ActionId = (SELECT AgentPendingActionId FROM AgentPendingAction WHERE AgentName like 'Имя_компьютера') EXEC p_AgentPendingActionDeleteByIdList @AgentPendingActionIdList = @ActionId
По завершении выполнения команды, пробуйте установить агент снова – в этот раз должно получиться ;)

Определение причин неработоспособности мастера компьютеров и устройств в Operations Manager 2007

•    Check if all Operations Manager servers are running in RMS and all Management Servers
•    Проверьте связь между серверами Operations Manager.
•    Проверьте настройки брандмауэра между сервером управления и целевой машиной.
•    Убедитесь, что установлен агент типа "MOM 2005 agent or OpsMgr 2007 agent", проверьте, не заблокирован ли  аккаунт обнаружения  и обладает ли он административными правами на целевом сервере/рабочей станции.
•    Проверьте, не отключен ли SQL Service Broker при помощи следующего SQL-запроса:
SELECT is_broker_enabled FROM sys.databases WHERE name = 'OperationsManager'
Если будет возвращено нулевое значение, включите SQL Service Broker, остановив службы  SDK, Config, и Health на RMS, службы Health на всех вторичных серверах управления и выполнив следующую команду:

ALTER DATABASE OperationsManager SET ENABLE_BROKER

Если все вышеуказанное проделано, но источник проблемы так и не обнаружен, выполните следующее:
•    Запустите обнаружение от имени другой учетной записи
•    Перезапустите службы Operations Manager на всех серверах  управления и RMS
•    Перезапустите сервер RMS и другие сервера управления.
•    Перезапустите сервер баз данных

Шторм оповещений в OpsMgr 2007 – найти и обезвредить

Шторм оповещений – это внезапное значительное увеличение количества оповещений. Такой шторм может быть симптомом серьезных изменений в группе управления, таких как «обвал» сетей. Также шторм может сигнализировать о проблеме в настройках System Center Operations Manager 2007.
Одна из вероятных причин шторма – установка новых пакетов управления, они же MP. Мониторы в них начинают работать сразу же после импортирования MP. Чтобы максимально снизить вероятность возникновения шторма, следуйте существующим рекомендациям по импорту.

Выявление штормов оповещений.

Для слежения за предупреждениями в реальном времени, используйте режим Active Alerts. Убедитесь, что Scope  не содержит активных и скрытых оповещений
Отслеживайте возникновение большого количества ошибок после изменений в конфигурации сети. Также будьте очень внимательны при установке нового MP.
В состав Operations Manager 2007 входят отчеты, которые могут помочь в выявлении штормов Из консоли действий (Operations) с доступом к серверу отчетов выберите Microsoft Generic Report Library. Из этой библиотеки вам будут нужны отчеты Most Common Alerts и Most Common Events.

Переопределение мониторов и правил

Если вас затопило оповещениями, не относящимися к проблемам наблюдаемых систем, придется покопаться в настройках мониторов (или правил), генерирующих эти оповещения.
Просмотрите детали активного оповещения при помощи панели мониторинга. Раздел Alert Details указывает на монитор или правило, сгенерировавшие это оповещение.

Переопределение настроек (Override) монитора
1. Войдите на компьютер под учетной записью с правами Operations Manager Advanced Operator role for the Operations Manager 2007 management group.
2. В консоли Operations нажмите кнопку Authoring.
3. В панели Authoring разверните узел Management Pack Objects и нажмите Monitors.
4. В панели Monitors полностью разверните тип объекта и нажмите на нужный монитор.
5. В консоли действий нажмите Overrides и выберите Override the Monitor. Можно переопределять настройки для выбранных мониторов, либо всех мониторов группы. После выбора группы мониторов для расстрела переопределения настроек, откроется диалоговое окно Override Properties, в котором можно просмотреть настройки по умолчанию для данного монитора. Далее можно выбирать, переопределить все настройки  монитора либо какую-то их часть на свой выбор.
Замечание: если кнопка Overrides недоступна,  убедитесь, что вы выбрали именно монитор, а не контейнер с ним.
6. Напротив каждой настройки, которую нужно перопределить, поставьте галочку в столбце Override.
7. Выберите MP из списка Select destination management pack или создайте новый открытый MP, нажав New.
Замечание: по умолчанию, при создании MP нужно отключить правило или монитор либо создать перопределение. Operations Manager сохранит установки в MP по умолчанию. Для каждого закрытого MP рекомендуется создавать отдельный MP, в котором и будут производиться изменения, а не сохранять измененные установки в MP по умолчанию. Дополнительную информацию на этот счет читаем в статье TechNet Default Management Pack.
8. По завершении внесения изменений, нажмите OK.

  Замечание: Процедура переопределения для правил аналогична используемой для мониторов. После настройки переопределений оцените эффект и при необходимости доработайте напильником продолжайте вносить изменения до достижения желаемого результата.
Дополнительные сведения элегантно выуживаем отсюда: https://technet.microsoft.com/en-us/library/bb309455.aspx

Подавленные оповещения

В настройках правил можно выставить подавление дублирующихся оповещений. Подавленные оповещения не отображаются в консоли действий.
Operations Manager 2007 подавляет только те дублирующиеся оповещения, которые указаны в критериях подавления. Для определения необходимости подавления, SCOM сравнивает поля оповещения с соответствующими полями, заданными в критериях и, если совпадение полное, выполняет подавление. Также необходимо, чтобы подавляемое оповещение было сгенерировано тем же правилом и было не решено.

Политика подавления оповещений

Обычные подтипы правил генерируют оповещение как отклик на совпадение критериев. По умолчанию оповещение создается для каждого такого совпадения. При этом все оповещения отображаются в консоли как новая проблема, что добавляет головной боли IT-отделу.OpsMgr позволяет настроить правила так, что дублирующиеся оповещения будут подавляться либо скрываться, оставляя на поверхности только первое нерешенное оповещение. Как только оно будет решено, этот статус автоматически распространится на все дубликаты.
Подавление оповещений жестко привязано к правилам, оповещения генерирующим. Если два разных правила сгенерируют одно и то же оповещение, то в консоли оператора MOM появятся два уникальных оповещения.

Важное дополнение
Сотрудники, использующие ваш MP, могут захотеть настроить уже созданные правила для подавления дополнительных параметров событий. По умолчанию эти параметры могут вообще не отслеживаться правилом сбора событий, так что подавление просто не будет работать. При создании правил сбора событий постарайтесь предусмотреть, какие еще параметры могут потребоваться, и добавить их в правила. Неплохим примером того, какие события конечные пользователи захотят подавлять, может служить журнал событий безопасности.
Политика подавления оповещений весьма гибка в настройке, но, как правило, настройки по умолчанию (Компьютер и домен) подходят для большинства MP. Произвольная политика  может потребоваться в следующих случаях:
•    Правило выполняет скрипт, запускающий несколько проверок состояния приложения. Как результат, скрипт может генерировать два и более различных оповещений напрямую из кода скрипта. Подавление идет по параметру “Alert Name”.
•    Правило настроено так, чтобы генерировать оповещения на основе события, которое отражает различные изменения состояния и проблемы. В этом случае оповещения могут быть идентифицированы по полю Description, что и служит критерием для подавления.
Замечание: подавление на основании описания может быть проблематично, если описание состоит из нестатичного текста. Например, проблематично будет подавлять оповещения с датой и временем в поле Description.

Невозможно связаться с провайдерами (No Providers Could Be Contacted)

Сообщение "No Providers Could Be Contacted" сигнализирует о невозможности службы коннектора подключиться ни к одному из провайдеров, настроенных в пользовательском интерфейсе Connector Configuration на порту 1720.
Решение : при помощи winrm попробуйте подключиться к провайдерам, чтобы выяснить, доступны ли они. Если известен пароль локального администратора, то для подключения к провайдеру используйте основную проверку подлинности. В противном случае, используйте Kerberos. Для использования Kerberos сервера провайдера и коннектора должны быть в одном домене и пользователь должен входить в группу локальных администраторов сервера провайдера. Запускать winrm можно как с сертификатами, так и без таковых.
Чтобы определить, работают ли сертификаты, запустите winrm с параметрами skipCAcheck –skipCNcheck, чтобы пропустить проверку сертификатов на этапе подключения.  Если в этом случае провайдер будет доступен, значит проблема в сертификатах..
Команды winrm могут выполняться как с сертификатами, так и без таковых. Пропуск сертификатов как правило используется для выявления проблем, с этими сертификатами связанных. Если команда будет выполнена успешно, на экране ничего не отобразится, если же при выполнении произойдет сбой, то появится сообщение об ошибке.

Ниже приведены примеры использования  winrm на серверах Windows и UNIX от имени локального администратора либо администратора домена.

Команды для Windows-провайдера
Winrm e https://schemas.microsoft.com/wbem/wsman/1/wmi/root/scx/\* -r:https://<node name of provider>:1270 –u:administrator –p:******** -auth:basic –encoding:utf-8 –skipCAcheck –skipCNcheck –filter:”select * from SCX_Connector, where ManagementGroupName = ‘test’”
winrm e https://schemas.microsoft.com/wbem/wsman/1/wmi/root/scx/\* -r:https://<node name of provider>:1270 –u:administrator –p:******** -auth:kerberos –encoding:utf-8 –skipCAcheck –skipCNcheck –filter:”select * from SCX_Connector, where ManagementGroupName = ‘test’”

Команды для UNIX-провайдера
winrm e https://schemas.microsoft.com/wbem/wscim/1/cim-schema/2/SCX\_Connector?\_cimnamespace=root/scx -r:https://<node name of provider> -u:root –p:******** -auth:basic –encoding:utf8 –skipCAcheck –skipCNcheck –filter:”select * from SCX_Connector, where ManagementGroupName = ‘test’”
winrm e https://schemas.microsoft.com/wbem/wscim/1/cim-schema/2/SCX\_Connector?\_cimnamespace=root/scx -r:https://<node name of provider> -u:root –p:******** -auth:kerberos –encoding:utf8 –skipCAcheck –skipCNcheck –filter:”select * from SCX_Connector, where ManagementGroupName = ‘test’”

При выборе типа WS-Management для сервера появляется сообщение об ошибке безопасности

В журнале коннектора появляется следующее сообщение об ошибке:
Exception: A security error occurred while determining the WSMan type of server xxxx
Решение: проблема возникает при установке неверного сертификата.
Отличить проблему сертификата от проблемы с неправильными учетными данными можно, запустив в отношении провайдера команду winrm –enumerage с параметром skipCAcheck. Если команда выполнена успешно, проблема в сертификате.

После смены пароля WS-Man выдается сообщение «в доступе отказано» Password Change

После изменения пользователя и пароля WS-Man на странице настроек Config Object, необходимо запустить sci.exe на машине коннектора. Если запустить команду на любом другом компьютере, WinRM выдаст сообщение «В доступе отказано».
При невозможности подключения к OMSDK, используйте команду whoami чтобы убедиться, что вы подключились как Opsmgr\Administrator и попробуйте еще раз.