Продукты
CA-Unicenter: администрирование распределенных систем
Алексей Сапков
Если на вашем предприятии установлена небольшая сеть из нескольких персоналок и сервера, то поддержание этой системы в рабочем состоянии, скорее всего, не доставляет особых хлопот. Другое дело, если речь идет о крупной сети, включающей до нескольких сотен рабочих станций. Для эффективного администрирования распределенных сетей фирма Computer Associates разработала продукт CA-Unicenter, представляющий интегрированную среду управления системами с архитектурой "клиент-сервер".
Даже самый опытный системный администратор не всегда в состоянии справиться с той лавиной проблем, которая обрушивается на него со стороны действительно крупной сети. А ведь нужно еще помнить о "плановых" мероприятиях (резервном копировании и т.д.) и выполнять эту рутинную работу точно по расписанию, потому что ошибка или опоздание могут обернуться для компании убытками.
Для того, чтобы облегчить то нелегкое бремя, которое приходится нести системному администратору, и повысить эффективность и надежность его работы, фирма Computer Associates разработала и активно продвигает сегодня CA-Unicenter – интегрированную среду управления системами с архитектурой "клиент-сервер".
Термин "клиент-сервер", используемый при описании работы распределенных систем, упрощенно означает следующее: машина или рабочая станция пользователя (клиент) посылает на другую рабочую станцию (сервер)запрос на выполнение некоторых действий и ожидает от сервера результатов выполнения. Другой термин, который используется для описания подобного взаимодействия, – "менеджер-агент". По сути это частный случай структуры "клиент-сервер" – сервер запрашивает информацию с множества клиентов или заставляет их выполнить для него какую-то работу.
CA-Unicenter состоит из отдельных подсистем, каждая из которых, работая в тесном взаимодействии с остальными, отвечает за выполнение определенных задач системного администрирования. Это могут быть, например, резервное копирование или меры безопасности.
CA-Unicenter инсталлируется и как сервер, и как клиент. При этом в системе может быть несколько серверов. Инсталляция всех подсистем не обязательна: пользователь может установить только те из них, которые ему необходимы. Таким образом, различные серверы могут выполнять различные задачи.
Важной особенностью Unicenter является то, что система использует реляционные базы данных для хранения необходимой ей информации.
Управление событиями (Event Management)
Системный администратор прежде всего должен знать, что происходит в системе, и вовремя реагировать на события, которые требуют его внимания. Для этого в Unicenter предусмотрен механизм сообщений. Сообщение – это некий текст с дополнительными параметрами (тип, место, время и т.п.), который система получает при возникновении того или иного события. Источниками сообщений могут быть и приложения, работающие в системе, и пользователи.
Модуль управления событиями в CA-Unicenter позволяет делать установки, определяющие важные сообщения, реагировать на сообщения автоматически, а также идентифицировать необычные условия, требующие особого внимания.
Система управления событиями может быть сконфигурирована для обработки сообщений как на индивидуальной машине, так и на центральном сервере. Такой компьютер будет являться одновременно агентом и сервером и сможет принимать и обрабатывать сообщения. Тем самым достигается разгрузка трафика сети – передаются только те сообщения, которые заслуживают особого внимания, а остальные обрабатываются на месте.
Администратор может определить в системе важные сообщения и сопоставить им некоторые действия (запуск программы, пересылка сообщения на другую машину, уведомление пользователя и т.п.), которые будут выполняться автоматически как реакция на это сообщение.
Взаимодействуя с системой управления проблемами, система управления событиями может автоматически определять события, указывающие на возникновение проблемы, и генерировать ответный отчет о проблеме.
Управление распределением работы (Workload Management)
С возрастанием сложности системы становится трудно поддерживать эффективность работы всех частей и процессов. Для разумного решения этих проблем требуется ответить на несколько вопросов:
• В чем состоит работа, которую необходимо выполнить?
• В какие часы система наиболее загружена?
• Сколько времени займет выполнение работы (job)?
• Какие еще процессы обычно выполняются в это время?
• Нет ли в системе узких мест и заторов (bottlenecks)?
• Нет ли возможности выполнить работу эффективнее?
CA-Unicenter автоматически управляет загрузкой работы систем отслеживая расписание работ, следовательность их выполнения и сбои, временные затраты, и запускает работы на той машине, где для ее выполнения есть ресурсы.
Workload management работает с несколькими основными объектами:
– "станция" – сервер или рабочая станция, на которой будет запускаться работа;
– "календарь" – определяет, когда будет выполняться работа или набор работ;
– "работа" – определяет точно, что должно быть выполнено;
– "набор работ" – для упрощения управления логически объединенными в группу работами;
– "предшественник" – позволяет
проконтролировать последовательность выполнения работ. Подобным объектом может быть другая работа или целый набор работ;
– "описание ресурсов" – позволяет определить, какие ресурсы необходимы работе и в каком режиме.
Простейший пример операций с перечисленными объектами – календарное планирование работ. Более сложный – расписание, управляемое событиями, то есть в этом случае работа запускается, если происходит некоторое событие в системе. Такого рода управление происходит при помощи еще двух видов объектов: триггеров и действий. Система выполняет действие, если срабатывает триггер.
В качестве триггеров рассматриваются такие события, как закрытие любого файла, завершение работы, начало работы. Можно определить свои собственные события.
Среди доступных действий – запуск программы, посылка сообщения на консоль системы управления событиями, вызов команды СА-Unicenter и т.п.
Управление файлами (File Management)
В любой серьезной системе время от времени обязательно должно выполняться резервное копирование информации. Несоблюдение этого правила может привести к невосстановимым потерям важных данных в случае какого-либо сбоя в файловой системе рабочей станции.
CA-Unicenter включает в себя систему резервного копирования и архивации. Она записывает все действия по архивации и резервному копированию в единой БД файлов и предоставляет быстрый доступ к информации о том, где и что находится в резервных копиях и архивах.
При помощи системы управления работами CA-Unicenter позволяет автоматизировать эти процессы: вовремя запускается резервное копирование, определяются сбои при копировании, автоматически выполняется восстановление. Задачу уведомления администратора обо всем происходящем решает система управления событиями.
Использование системы для резервного копирования дает администратору следующие преимущества:
– повышенную производительность работы;
– дополнительную безопасность (файлы могут шифроваться в процессе копирования);
– возможность сжатия данных при копировании (в среднем двукратного);
- защиту от случайного стирания нужных данных (посредством меток на лентах).
Система автоматически помечает ленты, на которые производится резервное копирование, чтобы проследить за сохранностью и распределением копируемых файлов. Благодаря этому исключается, например, использование уже заполненных лент. В то же время, если информация на них уже устарела, ленты могут быть повторно использованы.
Срок актуальности информации устанавливает администратор: это либо определенная дата (интервал времени), либо циклическое копирование, то есть файл не удаляется, пока не будет скопирована на резервный носитель его более поздняя версия.
Система способна выполнять три различных типа резервного копирования: копирование по специальному требованию отдельного пользователя; копирование файлов, удовлетворяющих какому-либо критерию, выполняемое регулярно в определенное время; копирование всей системы, выполняемое также автоматически в установленное время.
Система резервного копирования может повысить общую производительность сети, перенося работу по резервному копированию на ту рабочую станцию, для которой эта работа "заказана". Резервное копирование позволяет локально понизить трафик сети, уменьшая количество передаваемых данных, восстанавливать файлы, даже если сеть находится в нерабочем состоянии, и т.д.
Архивирование и резервное копирование – очень близкие по своей сути операции. Архивирование отличается лишь тем, что архивируемые файлы удаляются из активной файловой системы. Это позволяет более эффективно использовать дисковое пространство, не засоряя его данными, которые используются крайне редко.
Операции резервного копирования и архивации выполняются над некоторым набором файлов. Критериями для выбора файлов являются : используемость файла – файлы копируются при модификации и архивируются спустя определенное время после последнего обращения к ним; информация о самом файле – имя, размер, тип и т.п.; календарь – каждый файл копируется или архивируется по определенному расписанию. Кроме того, может быть использована любая комбинация этих признаков.
Управление безопасностью (Security Management)
Всякой многопользовательской системе необходима служба безопасности, способная предотвратить несанкционированный доступ к информации, диверсию или просто ошибочные операции, влекущие к потере данных, а также проследить за использованием данных и ресурсов различными пользователями.
Современные сетевые операционные системы, такие как Unix, предлагают довольно мощные средства безопасности, но их возможности не всегда удовлетворяют нуждам конкретной организации. Так, если в локальной сети очень много пользователей и рабочих станций, то становится трудно уследить за всеми. "Умелец" же, как известно, всегда найдет дырочку в системе безопасности, выстроенной администратором, и будет ею пользоваться, если этого вовремя не заметить.
Unicenter повышает уровень безопасности в системе и, перехватывая доступ к файлам на уровне операционной системы, предоставляет дополнительные средства защиты. Он контролирует доступ к ресурсам со стороны пользователей, обладающих привилегиями администратора, – последним разрешается выполнять некоторые операции на уровне администратора (скажем, настройка системы и т.п.), но полного доступа к файловой системе они не имеют. Кроме того, ограничение доступа к системе и файлам может быть выставлено по дате и времени. При помощи ограничений на названия файлов, которые создаются пользователями, устанавливаются стандарты на имена файлов. Предусмотрена защита и от случайного удаления файлов: строго отслеживая уровни доступа, Unicenter может предотвратить удаление файла, даже если пользователь имеет разрешение на запись.
Всю информацию о безопасности Unicenter хранит в единой реляционной базе данных. Главным достоинством такого подхода является то, что файлы защищены не их физическими атрибутами, а установками, записанными в БД системы управления безопасностью.
Вновь создаваемые файлы защищаются автоматически не произвольно по желанию создающего их пользователя, а в соответствии с теми установками, которые были сделаны системным администратором.
Система использует четыре основных объекта для управления безопасностью: "пользователь" – содержит всю информацию о пользователе в системе; "группа пользователей" – позволяет логически объединять пользователей в группы по уровням их привилегий и правам доступа; "ресурс" – специальное представление того, что необходимо защитить (например, файл или объект Unicenter); "группа ресурсов" – объединяет ресурсы с одинаковыми атрибутами.
Unicenter поддерживает больше режимов доступа, чем операционная система. Помимо традиционных режимов чтения, записи, выполнения, существуют режимы создания, удаления и управления. Последний режим определяет для пользователя возможность управления объектами CA-Uniceter.
В зависимости от прав пользователя, на его попытку получить доступ к ресурсу может последовать три ответа: разрешить, зафиксировать, запретить. Термин "зафиксировать" означает, что доступ разрешается, но все действия пользователя тщательно заносятся в журнал.
В случае, если пользователь нарушает права доступа, возможны три типа реакции: отказ – запретить доступ, выдать сообщение, зафиксировать нарушение; предупреждение – разрешить доступ, выдать сообщение, зафиксировать нарушение; пропуск – подавить проверку прав доступа.
Кроме того, возможны три варианта запрещения доступа: просто запретить; запретить, включая все дальнейшие попытки доступа к ресурсам (фактически, 'вытеснить пользователя из системы); запретить не только все дальнейшие попытки доступа, но и вход пользователя в систему до тех пор, пока администратор лично не восстановит его в правах.
Управление отчетами (Report Management)
Для работы в системе пользователям необходима различного рода информация. Но, к сожалению, та информация, которую они получают, зачастую не удовлетворяет их потребностей. Фактически же вопрос предоставления пользователям необходимой информации является одной из важнейших частей работы в распределенной среде "клиент-сервер".
Подсистема управления отчетами предоставляет мощные средства сбора и доставки необходимой информации. Зачастую, однако, проблема заключается не в недостатке, а в избытке информации – в ней становится трудно разобраться. Unicenter позволяет выделить необходимые страницы из объемного отчета и доставить пользователю только необходимые сведения.
Управление проблемами (Problem Management)
Подсистема управления проблемами позволяет быстро и аккуратно решать ежедневные вопросы и проблемы, возникающие в системе. Точно определяя условия возникновения проблемы и увязывая ее с конкретной аппаратурой, программами и/или процедурными ошибками, можно существенно повысить надежность вычислительной среды.
В управлении проблемами выделяются три основные области: определения компонентов, определения проблем и автоматическое отслеживание проблем (АОП).
Определения компонентов используются для описания конфигурации системы. Это может быть аппаратура, программное обеспечение, а также не связанные с компьютерами условия (состояние окружающей среды), телекоммуникации, системы безопасности и любые другие компоненты, наблюдение за которыми вы хотите вести.
Определения компонентов содержат информацию по обеспечению их работоспособности, устанавливают связи типа "родитель-потомок", позволяют отследить их перемещение. В соединении с определениями проблем они предоставляют информацию, позволяющую найти причины негативного воздействия одного компонента на другой.
Проблема – это любой инцидент, требующий расследования и действий. Она определяется либо вручную, либо через АОП. Когда проблема определена, система фиксирует описание сбоя, записывает важные события в журнал и ведет деятельность, направленную на устранение проблемы, до тех пор, пока она не будет устранена.
Система управления событиями может постоянно просматривать все события в поисках тех, которые были определены как индикаторы потенциальных проблем, и потом передавать их системе АОП для рассмотрения. АОП, используя свои установки, решает, говорит ли присланное сообщение о возникновении проблемы, и в случае положительного заключения определяет проблему так, как если бы это было сделано вручную. Следом к обработке проблемы приступает система управления проблемами.
Проблемы могут разделятся на категории для выделения основных областей или типов проблем. Каждая проблема имеет код состояния, который отражает одно из трех ее состояний: либо проблема находится в работе; либо она была решена, но результат не был проверен тем, кто сообщил о проблеме; либо решение проблемы было подтверждено, и она отмечена как решенная окончательно.
Каждая проблема имеет уровень приоритета, показывающий важность ее решения относительно других проблем в системе. Уровень приоритета может автоматически меняться, базируясь на установках смены приоритетов. Для проблем с низким приоритетом это позволяет предотвратить состояние вечного ожидания.
* * *
Итак, CA-Unicenter предоставляет системному администратору набор мощных средств для автоматизации управления системой. Однако не для всех систем нужны такие мощные инструменты. Наибольшей отдачи от системы следует ожидать в крупных сетях с большим количеством пользователей и рабочих станций.
Не следует думать, что эта система может заменить собой системного администратора – широкий круг задач по-прежнему требует вмешательства специалиста. Тем не менее Unicenter уже можно считать первым шагом на пути создания систем, работающих почти без вмешательства человека, хотя до более или менее приемлемого решения этой проблемы, по-видимому, еще очень далеко.