1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | Оглавление текущего номера /159, 1996 г./ | Бонус | Поиск  

Технологии

Графическая химия, или Молекулы на экране

Виталий Авакян


© 2004, Еженедельник «Компьютерра» | http://www.computerra.ru/offline
Этого материала на сайте "Компьютерры", к сожалению, нет

"Молекулы состоят из атомов".

Школьная шутка

 

Автор этой статьи Виталий Гайкович Авакян – кандидат химических наук, старший научный сотрудник Института химической физики РАН. Хотите рассказать, как компьютеры применяются в деле, которым вы занимаетесь? Позвоните нам по телефону 232.22.63 и поговорите с главным редактором, или оставьте свои координаты.

Сколько в мире наук? Сосчитать невозможно. Часто на наших глазах рождаются совсем новые науки, возникают новые ответвления старых наук. Вот о таком ответвлении старой науки химии и поговорим.

Речь идет о графической химии. Не слыхали о такой? И я не слыхал тоже. До настоящего момента. Пока не сел писать эту статью. У меня возникла необходимость ввести этот термин.

Что понимаю я под графической химией, какое место призвана занимать она в мире химической науки, многотоннажной химии гигантских реакторов, нефтеперегонных и металлургических производств?

Хотя графическая химия в своем современном оформлении и существовании полностью обязана компьютерам, на самом деле существовала она давно. Химики со школьной скамьи привыкли пользоваться графическими представлениями. История их возникновения берет начало в прошлом веке, как и попытки изображения химических превращений на бумаге с помощью формул. В формировании графических представлений в химии основополагающую роль сыграло становление таких понятий, как атомы и молекулы, валентность атомов, образующих молекулы, присущие атомам валентные состояния. Исключительно плодотворной явилась идея Вант Гоффа и Ле Бёлля, которые первыми высказали мысль о том, что состоящая из атомов молекула является

пространственным образованием. А окружающие каждый атом соседние атомы ориентированы вокруг него строго определенным образом в определенном количестве. И столь же важным для формирования графической химии оказалось представление о так называемых вандерваальсовых радиусах атомов, благодаря которым каждый атом химического элемента можно изобразить в виде шарика определенного диаметра.

Впрочем, вспоминать всех, кто сыграл важную роль в формировании графических представлений, можно было бы долго, – это не является целью статьи. Для начала давайте посмотрим, как выглядят молекулы на экране компьютера. На рис. 1. изображена молекула фуллерена – химического соединения, которое состоит из 60 атомов углерода и имеет форму футбольного мяча. Только у мяча внутри воздух, а у фуллерена – пустота (вакуум). Были попытки так и назвать это соединение – футбол-лен. Но почему-то столь близкое всем название не прижилось. Странные все-таки люди эти ученые!

Как видим, изображение выглядит почти так же, как выглядело бы, допустим, на экране гипотетического электронного сверхмикроскопа. С той, правда, разницей, что в микромире – который мы пытаемся смоделировать с помощью компьютера – нет понятия цвета объекта. Но нам удобно придать каждому элементу свой цвет – чтобы проще было различать разные атомы на экране.

 

 

 Имеется и другая возможность изображения молекул. В этом случае используется представление о том, что вся масса атомов сосредоточена в бесконечно малых ядрах, размер которых значительно меньше, чем расстояния между ними. Ядра связаны между собой химическими связями, которые, подобно пружинам, способны растягиваться или сжиматься. Эти связи по своим "механическим" свойствам могут обладать одинарной, двойной или тройной упругостью – что изображается с помощью одинарной, двойной или тройной линии. Существуют также связи с промежуточной (между одинарной и двойной) упругостью. На рис. 2. молекула того же фуллерена изображена с помощью связей такого рода между атомами углерода, -картинка точно соответствует действительности, причем каждый атом связан с тремя соседями. Для сравнения укажем, что в алмазе -веществе, также состоящем только из атомов углерода – каждый его атом связан одинарными связями с четырьмя соседями. Заметим кстати, что реальные молекулы как минимум в сто миллионов раз меньше, чем нарисованные на экране компьютера.

Почему для химика важно уметь правильно изображать молекулы? Прежде всего потому, что структурные формулы представляют собой своего рода международный универсальный химический язык. Специалисты зачастую лучше способны представить структуру соединения по его структурной формуле, чем по его названию. Ведь названия могут оказаться столь сложными (да еще и написанными на непонятном иностранном языке), что займут в длину не одну строку текста, и не всегда они оказываются правильными.

Но это лишь одна сторона дела. В основе применения языка структурных формул лежит важнейший принцип современной химии: структура – свойство. Знание структуры соединения влечет за собой и знание его физических и химических свойств, а также, в конечном счете, и способов его применения. Так вот, изображая структуру соединений с помощью только связей, как на рис. 2., мы наилучшим образом представляем себе, какие химические превращения могут происходить с данным соединением. Изображая молекулы в виде объемных тел, мы можем лучше понять, каким образом молекулы упаковываются в кристаллы, когда выступы одной ее части попадают во впадины другой, а также оценить пространственную доступность частей молекулы, ответственных за химические свойства или биологические действия соединений. Необходимо отметить, что правильные объемные изображения молекул без компьютера нарисовать практически невозможно. К тому же компьютер позволяет произвольно вращать и перемещать молекулу на экране, позволяя тем самым достичь наилучшего ракурса для просмотра и анализа.

В качестве примера рассмотрим молекулу морфина. Из таких молекул состоит соединение, в обиходе называемое морфий, который обладает одним очень хорошим качеством, являясь анальгетиком, т. е. обезболивающим средством, и одним очень плохим, будучи наркотиком. На рис. 3. соединение изображено с помощью связей. Для лучшего понимания этой сложной структуры показаны три изображения. На первом утолщенными линиями выделена одна плоская часть молекулы и показаны атомы, образующие эту плоскость. На втором изображении выделена другая плоскость, на третьем – представлена сама молекула. Сравнивая эти изображения, нужно представить себе, что одна плоская часть молекулы ориентирована под углом примерно в 90 градусов по отношению к другой части.

 

 Действующей частью молекулы как анальгетика является положительно заряженный атом азота. На рис. 4. показано объемное изображение молекулы морфина со стороны плоскости, несущей атом азота. Голубым цветом нарисованы атомы углерода, красным цветом – кислород, синим – азот, белым цветом показаны атомы водорода. Размеры плоского участка, где находится атом азота, соответствуют площади отрицательно заряженной впадины на поверхности рецептора нервной клетки. Попадая в эту впадину, молекула морфина блокирует своим положительным зарядом передачу нервных импульсов, которые после их попадания в мозг ощущаются как боль. Свойства остальной части молекулы способствуют правильной ориентации и закреплению заряженной части морфина на поверхности рецептора.

Перейдем теперь к описанию программных средств, с помощью которых можно решать графические задачи в химии, т. е. оперировать со структурными формулами. Для начала нужно четко определить, о каких задачах идет речь. Их можно разделить на три типа: задачи дизайнерские (полиграфические), информационные и исследовательские. Первый тип задач связан с необходимостью изображения химических формул в печатных изданиях. Второй – с сохранением и поиском структурной химической информации в базах данных. Третий – с теоретическими расчетами свойств молекул, из которых в дальнейшем образуются вещества с нужными нам качествами.

Конечно, самое простое – это изображение формул. Для этого существуют совместимые с MS Draw программы объектной графики типа ChemWindow (SoftChell International Ltd.), с помощью которых можно нарисовать структуру любого химического соединения, снабдить формулы необходимыми надписями и вставить полученные рисунки в текстовый файл, используя механизм внедрения объектов OLE.

Второй тип задач несравненно сложнее. Дело в том, что химическая формула – это не простой графический объект. Для химика важна не только полная структура, т. е. общий вид соединения. Необычайно значимы и фрагменты, из которых молекула состоит, и способ соединения фрагментов друг с другом. Поэтому информация о структуре соединения хранится не в виде целого графического файла в форматах, скажем, BMP или PCX, а в виде так называемой таблицы связей, которая представляет собой текстовый файл специального формата, где перечислены все атомы молекулы, закодировано полное число соседей у каждого атома и типы связей между ними. Графический модуль, предназначенный для изображения структурных формул, способен воспроизводить их, читая файлы таблиц связей. Такой модуль встраивается в СУБД, обеспечивающую возможность записывать, хранить и искать информацию о структуре химических соединений вместе с их свойствами, константами и способами применения.

Кодировка химических структур в виде таблиц связей обеспечивает поиск химической информации как по полной структуре соединения, так и по отдельным фрагментам, позволяя тем самым найти в базе не только само соединение, но и все его аналоги, включая исходные вещества, а также связать элементы структуры с конкретными свойствами соединений. Это дает возможность в конечном счете "построить" как из кубиков сначала на компьютере, а затем синтезировать в лаборатории новое соединение с нужным набором свойств. Задачи такого типа, вообще говоря, невероятно сложные, требующие длительной поисковой, синтетической и испытательской работы, относятся к так называемому молекулярному дизайну. Сама идеология задач такого рода возникла лишь с появлением баз данных химических соединений, созданных сначала для больших машин, а затем и для персональных компьютеров.

Информация о химических соединениях хранится в структурных базах данных. Помимо достаточно большого количества небольших локальных баз, в которых осуществляется хранение и поиск структурной химической информации, в мире существует по крайней мере четыре действительно большие структурные базы данных. Это БД Chemical Abstracts в США, доступная и в России по сети STN International, Кембриджский банк структурных данных в Великобритании, ежегодно обновляемая копия которого имеется в Российской Академии наук, база данных института Beilstein в ФРГ и база структурных данных в российском ВИНИТИ. В них хранятся миллионы химических структур, каждая из которых имеет уникальный регистрационный номер.

Указанные базы данных функционируют в собственных оригинальных СУБД, которые способны решать весь спектр задач, связанных с накоплением, хранением и поиском больших (и очень больших) объемов химической информации. В качестве примера на рис. 5. показано одно из окон базы структурных данных ВИНИТИ: здесь изображена структура молекулы, приведены ее название и брутто-формула (т. е. суммарное количество всех атомов молекулы). В поле "Данные о соединении" указано, какие сведения о веществе имеются в базе. Остальные поля носят служебный характер.

Как правило, поисковые системы в таких структурно-химических базах представляют собой know-how владельца, и их устройство не раскрывается. Вместе с тем уже сейчас имеются достаточно компактные и весьма насыщенные сервисными возможностями графические модули, которые вполне могут быть встроены в стандартные СУБД. На этой основе возможно создание программных оболочек для химических баз данных, предназначенных для хранения и поиска информации практически по любому направлению современной химии.

Третий тип задач, связанный с расчетом строения и свойств молекул, казалось бы, должен интересовать в первую очередь теоретиков. Однако дружественность интерфейса и удобство имеющихся программ, а также возможности современных персональных компьютеров вполне достаточны для того, чтобы задачи такого рода могли решать не только крутые теоретики, но и просто грамотные химики. В настоящее время имеется несколько программ, функционирующих в различных операционных средах. Среди них комплекс HyperChem (Hy-percubelnc., Канада), работающий под Windows, выделяется как большими расчетными возможностями, так и тщательно продуманным удобным интерфейсом.

С помошыю "этой программы можно построить на экране очень большие молекулярные структуры – включая, например, белковые молекулы, состоящие из сотен атомов, – а также рассчитать структурные параметры (длины связей и углы между связями), спектральные и электрические свойства молекул, взаимную ориентацию малых фрагментов в большой молекуле. Кроме того, возможно решение задач о поведении молекул, изображенных на экране компьютера, в условиях, моделирующих изменение температуры и химического окружения. При этом пользователь может следить за всеми изменениями, происходящими с молекулой, и управлять процессом расчета.

Как осуществляется сам расчет? Он проходит в три стадии, первая из которых заключается в простом рисовании структуры на экране с обозначением нужных атомов при помощи мыши. Рисуем почти что как Бог на душу положит, лишь бы не забыть изобразить все существующие связи между атомами. На рис. 6. показаны две стадии рисования молекулы морфина. Слева изображена одна плоская часть молекулы, справа, перпендикулярно первой плоскости, нарисована вторая, при этом первое изображение несколько развернуто, чтобы можно было лучше представить взаимную ориентацию частей молекулы. Получилось плоское изображение молекулы с произвольными межатомными расстояниями, как в книгах и учебниках.

 

 На второй стадии плоское изображение превращается в объемное. Для этого программа использует хранящиеся в ее библиотеке данные о средних длинах связей между каждой парой атомов, углах между связями, объемных свойствах каждого атома, а также о том, сколько соседей может быть у каждого атома. Помимо построения изображения, таким образом осуществляется контроль за правильностью структуры. Поэтому ничего "лишнего" вам изобразить не удастся. На рис. 7. показана структура морфина, полученная на этой стадии. Утолщенными линиями показаны атомы, добавленные на правом изображении рис. 6. Картинка, может быть, и не столь красива, как предыдущая, зато на ней более или менее верно переданы объемные соотношения частей молекулы , чего нет на плоском изображении на рис. 6. Однако структурные параметры (длины связей, углы между связями и плоскостями) здесь еще далеки от реально существующих. Уточнение структурных параметров – вот основная задача расчета, который происходит на третьей стадии. В основе теоретических расчетов молекул лежит одна универсальная характеристика, с которой можно связать все изменения в структуре и окружении молекулы. Такой характеристикой является потенциальная энергия молекулы. В свою очередь, каждая связь или угол в молекуле характеризуются определенной упругостью, сумма которых, грубо говоря, и дает величину энергии. Цель расчета состоит в том, чтобы достичь своеобразного компромисса между стремлением каждого из атомов сохранить присущие ему значения длин связей и углов, и мерой этого компромисса является потенциальная энергия молекулы.

  

 Расчетная процедура состоит в том, что программа варьирует значения длин связей и углов, вычисляет энергию молекулы и сравнивает полученную величину с энергией, рассчитанной на предыдущем шаге. Процесс заканчивается, когда изменение энергии оказывается меньше некоторого наперед заданного числа. "Наилучшей" структуре соответствует минимально достижимая для данной молекулы величина энергии. В результате расчета получаются так называемые оптимальные структуры. Именно такая оптимальная структура морфина изображена на рис. 3 и 4. От структуры на рис. 7. она отличаются тем, что в ней длины связей и углов имеют значения близкие к реальным, а форма молекулы полностью повторяет природную.

После того как получена оптимальная структура, можно рассчитывать другие необходимые свойства. Только в этом случае можно будет говорить, что вычисленные свойства соответствуют реальным свойствам молекулы. Сравнение строения и свойств разных молекул имеет смысл только для оптимальных структур.

Так как количество параметров (длин связей и углов) чрезвычайно велико, особенно для больших молекул, задачи на минимизацию потенциальной энергии, в процессе которых получаются оптимальные структуры молекул, чрезвычайно сложны, и для расчета структуры больших молекул требуется значительное количество машинного времени. Вместе с тем вычислительная мощность современных персональных компьютеров, особенно с процессорами Pentium, уже достаточно высока, чтобы проводить такие расчеты для крупных молекул в обычных химических лабораториях и даже дома.

Таким образом, благодаря методам графической химии, программно реализованным на современных компьютерах, у химиков имеется возможность изображать и наблюдать на экране столь любимые ими молекулы, управлять их жизнью, моделируя их поведение в природе и иных условиях, а также сохранять и находить в базах данных информацию о структуре и свойствах химических соединений.


1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | Оглавление текущего номера /159, 1996 г./ | Бонус | Поиск  

© 2004, Издательский дом «Компьютерра» | http://www.computerra.ru
Телефон редакции: (095) 232-22-61
E-mail редакции: inform@computerra.ru