Чем отличаются белки по составу элементов
Лекция № 3. Строение и функции белков. Ферменты
Строение белков
Белки — высокомолекулярные органические соединения, состоящие из остатков α-аминокислот.
В состав белков входят углерод, водород, азот, кислород, сера. Часть белков образует комплексы с другими молекулами, содержащими фосфор, железо, цинк и медь.
Белки обладают большой молекулярной массой: яичный альбумин — 36 000, гемоглобин — 152 000, миозин — 500 000. Для сравнения: молекулярная масса спирта — 46, уксусной кислоты — 60, бензола — 78.
Аминокислотный состав белков
Белки — непериодические полимеры, мономерами которых являются α-аминокислоты. Обычно в качестве мономеров белков называют 20 видов α-аминокислот, хотя в клетках и тканях их обнаружено свыше 170.
В зависимости от того, могут ли аминокислоты синтезироваться в организме человека и других животных, различают: заменимые аминокислоты — могут синтезироваться; незаменимые аминокислоты — не могут синтезироваться. Незаменимые аминокислоты должны поступать в организм вместе с пищей. Растения синтезируют все виды аминокислот.
В зависимости от аминокислотного состава, белки бывают: полноценными — содержат весь набор аминокислот; неполноценными — какие-то аминокислоты в их составе отсутствуют. Если белки состоят только из аминокислот, их называют простыми. Если белки содержат помимо аминокислот еще и неаминокислотный компонент (простетическую группу), их называют сложными. Простетическая группа может быть представлена металлами (металлопротеины), углеводами (гликопротеины), липидами (липопротеины), нуклеиновыми кислотами (нуклеопротеины).
Все аминокислоты содержат: 1) карбоксильную группу (–СООН), 2) аминогруппу (–NH2), 3) радикал или R-группу (остальная часть молекулы). Строение радикала у разных видов аминокислот — различное. В зависимости от количества аминогрупп и карбоксильных групп, входящих в состав аминокислот, различают: нейтральные аминокислоты, имеющие одну карбоксильную группу и одну аминогруппу; основные аминокислоты, имеющие более одной аминогруппы; кислые аминокислоты, имеющие более одной карбоксильной группы.
Аминокислоты являются амфотерными соединениями, так как в растворе они могут выступать как в роли кислот, так и оснований. В водных растворах аминокислоты существуют в разных ионных формах.
Пептидная связь
Пептиды — органические вещества, состоящие из остатков аминокислот, соединенных пептидной связью.
Образование пептидов происходит в результате реакции конденсации аминокислот. При взаимодействии аминогруппы одной аминокислоты с карбоксильной группой другой между ними возникает ковалентная азот-углеродная связь, которую и называют пептидной. В зависимости от количества аминокислотных остатков, входящих в состав пептида, различают дипептиды, трипептиды, тетрапептиды и т.д. Образование пептидной связи может повторяться многократно. Это приводит к образованию полипептидов. На одном конце пептида находится свободная аминогруппа (его называют N-концом), а на другом — свободная карбоксильная группа (его называют С-концом).
Пространственная организация белковых молекул
Выполнение белками определенных специфических функций зависит от пространственной конфигурации их молекул, кроме того, клетке энергетически невыгодно держать белки в развернутой форме, в виде цепочки, поэтому полипептидные цепи подвергаются укладке, приобретая определенную трехмерную структуру, или конформацию. Выделяют 4 уровня пространственной организации белков.
Первичная структура белка — последовательность расположения аминокислотных остатков в полипептидной цепи, составляющей молекулу белка. Связь между аминокислотами — пептидная.
Именно первичная структура белковой молекулы определяет свойства молекул белка и ее пространственную конфигурацию. Замена всего лишь одной аминокислоты на другую в полипептидной цепочке приводит к изменению свойств и функций белка. Например, замена в β-субъединице гемоглобина шестой глутаминовой аминокислоты на валин приводит к тому, что молекула гемоглобина в целом не может выполнять свою основную функцию — транспорт кислорода; в таких случаях у человека развивается заболевание — серповидноклеточная анемия.
Вторичная структура — упорядоченное свертывание полипептидной цепи в спираль (имеет вид растянутой пружины). Витки спирали укрепляются водородными связями, возникающими между карбоксильными группами и аминогруппами. Практически все СО- и NН-группы принимают участие в образовании водородных связей. Они слабее пептидных, но, повторяясь многократно, придают данной конфигурации устойчивость и жесткость. На уровне вторичной структуры существуют белки: фиброин (шелк, паутина), кератин (волосы, ногти), коллаген (сухожилия).
Третичная структура — укладка полипептидных цепей в глобулы, возникающая в результате возникновения химических связей (водородных, ионных, дисульфидных) и установления гидрофобных взаимодействий между радикалами аминокислотных остатков. Основную роль в образовании третичной структуры играют гидрофильно-гидрофобные взаимодействия. В водных растворах гидрофобные радикалы стремятся спрятаться от воды, группируясь внутри глобулы, в то время как гидрофильные радикалы в результате гидратации (взаимодействия с диполями воды) стремятся оказаться на поверхности молекулы. У некоторых белков третичная структура стабилизируется дисульфидными ковалентными связями, возникающими между атомами серы двух остатков цистеина. На уровне третичной структуры существуют ферменты, антитела, некоторые гормоны.
Четвертичная структура характерна для сложных белков, молекулы которых образованы двумя и более глобулами. Субъединицы удерживаются в молекуле благодаря ионным, гидрофобным и электростатическим взаимодействиям. Иногда при образовании четвертичной структуры между субъединицами возникают дисульфидные связи. Наиболее изученным белком, имеющим четвертичную структуру, является гемоглобин. Он образован двумя α-субъединицами (141 аминокислотный остаток) и двумя β-субъединицами (146 аминокислотных остатков). С каждой субъединицей связана молекула гема, содержащая железо.
Если по каким-либо причинам пространственная конформация белков отклоняется от нормальной, белок не может выполнять свои функции. Например, причиной «коровьего бешенства» (губкообразной энцефалопатии) является аномальная конформация прионов — поверхностных белков нервных клеток.
Свойства белков
Купить проверочные работы
по биологии
Аминокислотный состав, структура белковой молекулы определяют его свойства. Белки сочетают в себе основные и кислотные свойства, определяемые радикалами аминокислот: чем больше кислых аминокислот в белке, тем ярче выражены его кислотные свойства. Способность отдавать и присоединять Н + определяют буферные свойства белков; один из самых мощных буферов — гемоглобин в эритроцитах, поддерживающий рН крови на постоянном уровне. Есть белки растворимые (фибриноген), есть нерастворимые, выполняющие механические функции (фиброин, кератин, коллаген). Есть белки активные в химическом отношении (ферменты), есть химически неактивные, устойчивые к воздействию различных условий внешней среды и крайне неустойчивые.
Внешние факторы (нагревание, ультрафиолетовое излучение, тяжелые металлы и их соли, изменения рН, радиация, обезвоживание)
могут вызывать нарушение структурной организации молекулы белка. Процесс утраты трехмерной конформации, присущей данной молекуле белка, называют денатурацией. Причиной денатурации является разрыв связей, стабилизирующих определенную структуру белка. Первоначально рвутся наиболее слабые связи, а при ужесточении условий и более сильные. Поэтому сначала утрачивается четвертичная, затем третичная и вторичная структуры. Изменение пространственной конфигурации приводит к изменению свойств белка и, как следствие, делает невозможным выполнение белком свойственных ему биологических функций. Если денатурация не сопровождается разрушением первичной структуры, то она может быть обратимой, в этом случае происходит самовосстановление свойственной белку конформации. Такой денатурации подвергаются, например, рецепторные белки мембраны. Процесс восстановления структуры белка после денатурации называется ренатурацией. Если восстановление пространственной конфигурации белка невозможно, то денатурация называется необратимой.
Функции белков
Функция | Примеры и пояснения |
---|---|
Строительная | Белки участвуют в образовании клеточных и внеклеточных структур: входят в состав клеточных мембран (липопротеины, гликопротеины), волос (кератин), сухожилий (коллаген) и т.д. |
Транспортная | Белок крови гемоглобин присоединяет кислород и транспортирует его от легких ко всем тканям и органам, а от них в легкие переносит углекислый газ; в состав клеточных мембран входят особые белки, которые обеспечивают активный и строго избирательный перенос некоторых веществ и ионов из клетки во внешнюю среду и обратно. |
Регуляторная | Гормоны белковой природы принимают участие в регуляции процессов обмена веществ. Например, гормон инсулин регулирует уровень глюкозы в крови, способствует синтезу гликогена, увеличивает образование жиров из углеводов. |
Защитная | В ответ на проникновение в организм чужеродных белков или микроорганизмов (антигенов) образуются особые белки — антитела, способные связывать и обезвреживать их. Фибрин, образующийся из фибриногена, способствует остановке кровотечений. |
Двигательная | Сократительные белки актин и миозин обеспечивают сокращение мышц у многоклеточных животных. |
Сигнальная | В поверхностную мембрану клетки встроены молекулы белков, способных изменять свою третичную структуру в ответ на действие факторов внешней среды, таким образом осуществляя прием сигналов из внешней среды и передачу команд в клетку. |
Запасающая | В организме животных белки, как правило, не запасаются, исключение: альбумин яиц, казеин молока. Но благодаря белкам в организме могут откладываться про запас некоторые вещества, например, при распаде гемоглобина железо не выводится из организма, а сохраняется, образуя комплекс с белком ферритином. |
Энергетическая | При распаде 1 г белка до конечных продуктов выделяется 17,6 кДж. Сначала белки распадаются до аминокислот, а затем до конечных продуктов — воды, углекислого газа и аммиака. Однако в качестве источника энергии белки используются только тогда, когда другие источники (углеводы и жиры) израсходованы. |
Каталитическая | Одна из важнейших функций белков. Обеспечивается белками — ферментами, которые ускоряют биохимические реакции, происходящие в клетках. Например, рибулезобифосфаткарбоксилаза катализирует фиксацию СО2 при фотосинтезе. |
Ферменты
Ферменты, или энзимы, — особый класс белков, являющихся биологическими катализаторами. Благодаря ферментам биохимические реакции протекают с огромной скоростью. Скорость ферментативных реакций в десятки тысяч раз (а иногда и в миллионы) выше скорости реакций, идущих с участием неорганических катализаторов. Вещество, на которое оказывает свое действие фермент, называют субстратом.
Ферменты — глобулярные белки, по особенностям строения ферменты можно разделить на две группы: простые и сложные. Простые ферменты являются простыми белками, т.е. состоят только из аминокислот. Сложные ферменты являются сложными белками, т.е. в их состав помимо белковой части входит группа небелковой природы — кофактор. У некоторых ферментов в качестве кофакторов выступают витамины. В молекуле фермента выделяют особую часть, называемую активным центром. Активный центр — небольшой участок фермента (от трех до двенадцати аминокислотных остатков), где и происходит связывание субстрата или субстратов с образованием фермент-субстратного комплекса. По завершении реакции фермент-субстратный комплекс распадается на фермент и продукт (продукты) реакции. Некоторые ферменты имеют (кроме активного) аллостерические центры — участки, к которым присоединяются регуляторы скорости работы фермента (аллостерические ферменты).
Для реакций ферментативного катализа характерны: 1) высокая эффективность, 2) строгая избирательность и направленность действия, 3) субстратная специфичность, 4) тонкая и точная регуляция. Субстратную и реакционную специфичность реакций ферментативного катализа объясняют гипотезы Э. Фишера (1890 г.) и Д. Кошланда (1959 г.).
Э. Фишер (гипотеза «ключ-замок») предположил, что пространственные конфигурации активного центра фермента и субстрата должны точно соответствовать друг другу. Субстрат сравнивается с «ключом», фермент — с «замком».
Д. Кошланд (гипотеза «рука-перчатка») предположил, что пространственное соответствие структуры субстрата и активного центра фермента создается лишь в момент их взаимодействия друг с другом. Эту гипотезу еще называют гипотезой индуцированного соответствия.
Скорость ферментативных реакций зависит от: 1) температуры, 2) концентрации фермента, 3) концентрации субстрата, 4) рН. Следует подчеркнуть, что поскольку ферменты являются белками, то их активность наиболее высока при физиологически нормальных условиях.
Большинство ферментов может работать только при температуре от 0 до 40 °С. В этих пределах скорость реакции повышается примерно в 2 раза при повышении температуры на каждые 10 °С. При температуре выше 40 °С белок подвергается денатурации и активность фермента падает. При температуре, близкой к точке замерзания, ферменты инактивируются.
При увеличении количества субстрата скорость ферментативной реакции растет до тех пор, пока количество молекул субстрата не станет равным количеству молекул фермента. При дальнейшем увеличении количества субстрата скорость увеличиваться не будет, так как происходит насыщение активных центров фермента. Увеличение концентрации фермента приводит к усилению каталитической активности, так как в единицу времени преобразованиям подвергается большее количество молекул субстрата.
Для каждого фермента существует оптимальное значение рН, при котором он проявляет максимальную активность (пепсин — 2,0, амилаза слюны — 6,8, липаза поджелудочной железы — 9,0). При более высоких или низких значениях рН активность фермента снижается. При резких сдвигах рН фермент денатурирует.
Скорость работы аллостерических ферментов регулируется веществами, присоединяющимися к аллостерическим центрам. Если эти вещества ускоряют реакцию, они называются активаторами, если тормозят — ингибиторами.
Классификация ферментов
По типу катализируемых химических превращений ферменты разделены на 6 классов:
Классы в свою очередь подразделены на подклассы и подподклассы. В действующей международной классификации каждый фермент имеет определенный шифр, состоящий из четырех чисел, разделенных точками. Первое число — класс, второе — подкласс, третье — подподкласс, четвертое — порядковый номер фермента в данном подподклассе, например, шифр аргиназы — 3.5.3.1.
Перейти к лекции №2 «Строение и функции углеводов и липидов»
Перейти к лекции №4 «Строение и функции нуклеиновых кислот АТФ»
Смотреть оглавление (лекции №1-25)
Белки
Белки – это важные компоненты, которые имеют большое значение для нормальной работы организма. Источниками этих веществ являются животные и растительные продукты. Чтобы белковые элементы полноценно усваивались организмом, необходимо правильно употреблять их.
Что такое белок
Виды белков
Виды белков бывают следующие:
Синтез белка
Синтез белка осуществляется в особых частицах – рибосомах.
Этот процесс происходит в несколько стадий:
Состав белков
Состав белков представляет собой линейные полимеры, которые включают остатки α-L-аминокислот. Также в белковых молекулах могут присутствовать модифицированные аминокислотные остатки и составляющие неаминокислотной природы.
Аминокислоты обозначают сокращениями, включающими 1 или 3 буквы. Белки, которые имеют длину от 2 до нескольких десятков аминокислотных остатков, называют пептидами. Если наблюдается высокая степень полимеризации, их именуют белками. Однако такое деление считается достаточно условным.
Свойства белков
Для белков характерны следующие свойства:
Функции белков
Рассмотрим детальнее ряд важных функций белков:
Строение белков
Среди органических веществ белки, которые называются биополимерами, считаются самыми многочисленными. Они отличаются разнообразием. На долю этих веществ приходится 50-80 % сухой массы клетки.
Белковые молекулы отличаются большими размерами. Потому их нередко именуют макромолекулами. В строение белков входят углерод, водород, азот, кислород. Помимо этого, в них могут присутствовать сера, железо, фосфор.
Белки отличаются числом – от 100 до нескольких тысяч, составом, последовательностью мономеров. В качестве мономеров выступают аминокислоты.
Переваривание белков
Белки усваиваются в желудке и тонком кишечнике. Процесс переваривания представляет собой гидролитическое расщепление белков до аминокислот.
Он имеет определенные особенности:
Основным ферментом желудка, который расщепляет белки, считается пепси. Он синтезируется в неактивном состоянии и представляет собой профермент пепсиноген. Под воздействием соляной кислоты наблюдается частичный протеолиз пепсиногена. В результате появляется активная форма – пепсин.
Обмен белков в организме
Обмен белков в организме значительно сложнее, чем метаболизм липидов или углеводов. Жирные кислоты попадают в клетки почти в исходном виде, а углеводы – служат источником энергии. При этом основной строитель мышц претерпевает немало изменений в организме. На отдельных этапах белок преобразуется в углеводы. Как следствие, вырабатывается энергия.
Существует несколько этапов белкового обмена, для каждого из которых характерны определенные особенности:
Продукты богатые белком
Существует довольно много источников таких элементов. Животные продукты богатые белком, бывают следующие:
К растительным источникам белков стоит отнести следующее:
Норма белка в день для организма
Норма белка в день для организма взрослого человека составляет минимум 50 г в чистом виде, что соответствует 150 г белого мяса или рыбы. Люди, которые активно занимаются спортом и нацелены на развитие мышечных тканей, должны употреблять большее количество белков.
Для профилактики распада мышечной ткани женщины должны употреблять минимум 1 г белка на 1 кг веса. Однако оптимальным количеством считается 2 г. Для мужчин этот параметр увеличивается до 3 г. Это означает, что представитель сильного пола весом 90 кг должен съедать в день 270 г чистого белка.
Усваиваемость белка
При употреблении таких веществ, стоит помнить о чувстве меры. Избыточное количество белков представляет определенную опасность. Они с трудом перевариваются и могут вызвать нарушения пищеварительных функций.
Проблемы с усвоением белков могут возникать в следующих ситуациях:
Вред белков
Нарушения белкового обмена представляют большой вред для организма. Эти вещества принимают участие почти во всех физиологических процессах. При нарушении обмена белков есть риск развития опасных нарушений.
При этом для здоровых людей белки представляют опасность лишь при избыточном потреблении в течение долгого периода времени. При соблюдении белковых диет, которые базируются на употреблении большого количества протеинов, нужно помнить о чувстве меры. Такие системы питания должны быть кратковременными и плавными.
Избыточное количество белков в рационе провоцирует поражение почек и печени. Это связано со сложным процессом выведения веществ. В этом случае вырабатываются кетоновые тела, которые провоцируют отравление организма.
При некоторых патологиях есть противопоказания к употреблению белков. К ним относят подагру, недостаточность почек и печени, хроническую форму панкреатита.
Белки представляют собой ценные вещества, которые принимают участие во всех физиологических процессах. Потому каждый человек должен употреблять достаточное количество протеинов. При этом необходимо помнить о чувстве меры и соблюдать рекомендации врачей.
Структура белка: введение для айтишников
1. Почему белки важны?
Как сказал Фридрих Энгельс, “Жизнь есть способ существования белковых тел”. В 19 веке еще не знали о роли ДНК в наследовании генетической информации, но утверждение дяди Фридриха в значительной мере справедливо до сих пор – основную работу в наших клетках совершают именно белки. Это и поддержание структуры (формы клеток), и химический катализ, и моторная функция (сокращение мышц, например), и транспорт (скажем, белок гемоглобин переносит кислород из легких в ткани и углекислый газ в обратном направлении) и сложные регуляторные функции по поддержанию постоянства внутренней среды (скажем, белковые гормоны и всякие внутриклеточные регуляторные системы) и многие другие. Словом, если в нашем организме что-то происходит, в это обязательно вовлечены белки (хотя и не только они).
2. Что такое белок?
С химической точки зрения белок – это линейный (неветвящийся) полимер, состоящий из монотонно повторяющихся одинаковых блоков «основной цепи», к которым приделаны различные «боковые группы». Так как блоки основной цепи несимметричны, вся полипептидная цепь белка имеет направление, различают N- и C-конец полипептидной цепи.
Длина цепи – от 70 до более чем 1000 мономеров (аминокислотных остатков), средняя длина для высших организмов – примерно 500-600 аминокислотных остатков, для бактерий эта величина будет меньше, скорее 300-400 остатков. Всего в природе существует 20 стандартных аминокислот, одинаковых и для бактерии и для человека, то есть из основной цепи могут торчать 20 разных боковых групп.
(Тут возможна поправка – некоторые химические группы могут быть модифицированны после синтеза белка, например, фосфорилированы. Однако это не рассматривается как другая аминокислота, а рассматривается как продукт модификации исходной. Так же у высших организмов возможно встраивание двух неканонических аминокислот, но это редкое событие. То есть, строго говоря, разных аминокислот 22, из них 20 основных и 2 редкие, плюс некоторые боковые группы могут быть изредка химически модифицированы).
Из поколения в поколение генетическая информация передается в виде ДНК, в ней есть так называемые «белок-кодирующие области». В этих местах ДНК однозначным образом (для ботанов – с точностью до альтернативного сплайсинга и редактирования РНК) закодирована информация о линейной последовательности аминокислот для синтеза данного белка, плюс в клетке есть соответствующие машины, способные синтезировать белок по информации, изначально закодированной в ДНК.
Так как белок – линейный полимер, собранный из 20 стандартных мономеров, его так называемую «первичную структуру» легко представить в виде строки, например так:
Это аминокислотная последовательность маленького человеческого белка в формате FASTA, первая строчка, начинающаяся с «>», описывает его название, после чего следует последовательность аминокислот в соответствии со стандартной кодировкой (например, М –метиони, S – серин и тд, всего 20 букв стандартного однобуквенного кода), слева – N-конец белка, справа – его С-конец. Для разных белков длина строки будет очевидно разной, так как белки имеют разную длину. Последовательности всех известных белков можно найти в открытом доступе здесь: www.ncbi.nlm.nih.gov
3. Структура белка
Хорошо, с первичной структурой разобрались, но разве белок работает в развернутом линейном виде? Конечно нет. Тут надо заметить, что со структурной точки зрения есть разные классы белков: глобулярные, мембранные и фибриллярные. Мембранные белки, как следует из названия, живут только в клеточных мембранах, для стабилизации их структуры нужно особое окружение мембраны, мы не будем их рассматривать в этом обзоре. Фибриллярные белки имеют простое регулярное строение, похожи на вытянутые волокна, они не растворимы в воде и выполняют структурные функции (например, из кератина состоят волосы, к фибриллярным белкам относится белок из натурального шёлка). Недавно стали выделять класс разупорядоченных белков – белков, не обладающих постоянной трехмерной структурой, либо приобретающих ее только на короткое время при взаимодействии с другими белками. Наиболее интересный с практической точки зрения класс белков, который мы и будем рассматривать – глобулярные водорастворимые белки, к этому классу относится большинство белков.
Линейная полипептидная цепь в воде способна самопроизвольно сворачиваться в сложную трехмерную структуру (глобулу) и только в таком свернутом виде белки могут выполнять химический катализ и прочую интересную работу. Поэтому нам принципиально важно знать именно трехмерную укладку белка, так как только на этом уровне становится понятно, как белок работает.
Вопрос: сколько трехмерных структур соответствует конкретному белку?
Ответ: Одна, с точностью до небольшой подвижности маленьких «разупорядоченных» петель. Известно ровно одно исключение, когда одной последовательности соответствуют 2 достаточно разные структуры, это прионы.
Вопрос: Почему у белка только одна трехмерная структура?
Ответ: для химического катализа нам нужно расположить соответствующие химические группы строго определенным образом в пространстве. Для этого нужна жесткая структура. То есть весь белок должен быть жестким, чтобы поддерживать химические группы аминокислот активного центра в нужных местах (в реальности многие белки состоят из двух и более жестких частей, которые могут двигаться друг относительно друга, это нужно для регуляции активности белка (аллостерическая регуляция), чтобы некий сигнал мог включать и выключать химическую активность белка-фермента). Чтобы структура была жесткой и стабильной, природа позаботилась о том, чтобы структура каждого белка соответствовала энергетическому минимуму данной системы атомов и этот минимум был настолько глубоким, чтобы белок из него не «выпрыгнул». Все другие, паразитные структуры, обладают большей энергией и белок все равно сваливается в энергетический минимум, соответствующий нативной структуре.
Вопрос: на чем держится трехмерная структура белка?
Ответ: если коротко, то в основном на большом количестве нековалентных взаимодействий. В принципе, химические группы белка могут образовывать: (1) водородную связь, эти группы есть и в основной цепи и у некоторых боковых групп, (2) ионную связь – электростатическое взаимодействие между разноименно заряженными боковыми группами, (3) Ван-дер-Ваальсово взаимодействие и (4) гидрофобный эффект, на котором держится общая структура белка. Суть в том, что в белке всегда есть гидрофобные ароматические остатки, им энергетически невыгодно контактировать с полярными молекулами воды, а выгодно «слипнуться» друг с другом. Таким образом, при сворачивании белка гидрофобные группы выталкиваются из водного окружения, «слипаясь» друг с другом и формируя «гидрофобное ядро», а полярные и заряженные группы, наоборот, стремятся в водное окружение, формируя поверхность белковой глобулы. Так же (5) боковые группы двух остатков цистеина могут образовать между собой дисульфидный мостик – полноценную ковалентную связь, жестко фиксирующую белок.
Соответственно, все аминокислоты делятся на гидрофобные, полярные (гидрофильные), положительно и отрицательно заряженные. Плюс цистеины, способные образовывать ковалентную связь между собой. Особыми свойствами обладают глицин – у него отсутствует боковая группа, сильно ограничивающая конформационную подвижность других остатков, поэтому он может очень сильно «гнуться» и находится в местах, где белковую цепь надо развернуть. У пролина же, наоборот, боковая группа образует кольцо, ковалентно связанное с основной цепью, жестко фиксируя ее конформацию. Пролины встречаются там, где надо сделать белковую цепь жесткой и негнущейся. Многие заболевания связаны с мутацией пролина на глицин, из-за чего структура белка слегка «плывет».
Вопрос: откуда вообще мы знаем о трехмерных структурах белка?
Ответ: из эксперимента, это абсолютно надежные данные.
Сейчас есть 3 метода для экспериментального определения структуры белка: ядерно-магнитный резонанс (ЯМР), cryo-EM (электронная микроскопия) и рентгеноструктурный анализ кристаллов белка.
ЯМР позволяет определить структуру белка в растворе, но он работает только для очень маленьких белков (для больших невозможно сделать деконволюцию).
Этот метод был важен для общего доказательства того, что у белка только одна трехмерная структура и что структура белка в кристалле идентична структуре в растворе. Это очень дорогой метод, так как требуется получить белок с изотопными метками.
Cryo-EM заключается в простой заморозке раствора белка и микроскопии. Минус метода – низкое разрешение (видна лишь общая форма молекулы, но не видно, как она устроена внутри), плюс плотность белка близка к плотности воды/растворителя, поэтому сигнал тонет в высоком уровне шума. В этом методе активно применяются компьютерные технологии работы с картинками и статистика для вытягивания сигнала из шума.
Отбираются миллионы картинок молекул белка, проводится разделение на классы в зависимости от ориентации молекулы относительно подложки, усреднение по классам, генерация eigenimages, новый раунд усреднения и так пока не сойдется. Потом из информации из разных классов можно восстановить трехмерный вид молекулы с низким разрешением. Если же есть внутренняя симметрия частиц (например, при cryo-EM анализе вирусов), то можно еще каждую частицу поусреднять в соответствии с операторами симметрии – тогда разрешение будет еще лучше, но хуже, чем в случае рентгеноструктурного анализа.
Рентгеноструктурный анализ – основной способ определения структур белка. Главный плюс – потенциально можно получить кристаллы даже очень больших комплексов из многих десятков белков (например, именно так была определена структура рибосомы – Нобелевская премия 2009 года). Минус метода – вначале нужно получить кристалл белка, но далеко не каждый белок хочет кристаллизоваться.
Зато после того, как кристалл получен, по дифракции рентгеновского излучения можно однозначно определить положения всех (упорядоченных) атомов в молекуле белка, этот метод дает самое высокое разрешение и позволяет в лучших случаях видеть позиции отдельных атомов. Было доказано, что структура белка в кристалле однозначно соответствует структуре в растворе.
Сейчас действует конвенция – если ты определил структуру белка любым из экспериментальных физических методов, структура должна быть помещена в открытый доступ в банк данных белковых структур (Protein Data Bank – PDB, www.pdb.org ), в настоящее время там находится более 90 000 структур (впрочем, многие из них повторяющиеся, например, комплексы одного и того же белка с разными малыми молекулами, такими, как лекарственные средства). В PDB все структуры лежат в стандартном формате, называющемся, внезапно, pdb. Это текстовый формат, в котором каждому атому структуры соответствует одна строчка, в которой указан номер атома в структуре, название атома (углерод, азот и тд), название аминокислоты, в которую входит атом, название цепи белка (A, B, C и тд, если это кристалл комплекса из нескольких белков), номер аминокислоты в цепи и трехмерные координаты атома в ангстремах относительно ориджина, плюс так называемые температурный фактор и заселённость (это сугубо кристаллографические параметры).
Далее есть специальные программы, которые по данным из этого текстового файла могут графически отображать красивую трехмерную структуру молекулы белка, которую можно покрутить на экране монитора и, как говорил Гай Додсон, «дотронуться мышкой до молекулы» (например, PyMol, CCP4mg, старый RasMol). То есть смотреть на структуры белка просто – ставишь программу, загружаешь нужную структуру из PDB и наслаждаешься красотой природы.
4. Анализируем структуру
Итак, мы поняли основную идею: белок — линейный полимер, сворачивающийся в водном растворе под действием множества слабых взаимодействий в стабильную и единственную для данного белка трехмерную структуру, и способный в таком виде выполнять свою функцию. Различают несколько уровней организации белковых структур. Выше мы уже познакомились с первичной структурой – линейной последовательностью аминокислот, которую можно выписать в строчку.
Вторичная структура белка определяется взаимодействием атомов основной цепи белка. Как уже было сказано выше, в состав основной цепи белка входят доноры и акцепторы водородной связи, таким образом, основная цепь может приобретать некоторую структуру. Точнее, несколько разных структур (детали все-таки зависят от различающихся боковых групп), так как возможно образование разных альтернативных водородных связей между группами основной цепи. Структуры бывают такие: альфа-спираль, бета-листы (состоящие из нескольких бета-тяжей), которые бывают параллельными и анти-параллельными, бета-поворот. Плюс часть цепи может и не иметь выраженной структуры, например в районе поворота петли белка. Эти типы структур имеют свои устоявшиеся схематичные обозначения – альфа-спираль в виде спирали или цилиндра, бета-тяжи в виде широких стрелок. Вторичную структуру удается достаточно достоверно предсказывать по первичной (стандартом является JPred), альфа-спирали предсказываются наиболее точно, с бета-тяжами бывают накладки.
Третичная структура белка определяется взаимодействием боковых групп аминокислотных остатков, это и есть трехмерная структура белка. Можно представить себе, что вторичная структура сформирована и теперь эти спирали и бета-тяжи хотят уложиться все вместе в компактную трехмерную структуру, чтобы все гидрофобные боковые группы спокойно «слиплись» вместе в глубине белковой глобулы, сформировав гидрофобное ядро, а полярные и заряженные остатки торчали наружу в воду, формируя поверхность белка и стабилизируя контакты между элементами вторичной структуры. Третичную структуру изображают схематически несколькими способами. Если просто отрисовать все атомы, то получится каша (хотя когда мы анализируем активный центр белка, то мы хотим смотреть как раз на все атомы активных остатков).
Если мы хотим посмотреть, как устроен весь белок в общем, можно отобразить только некоторые атомы основной цепи, чтобы увидеть ее ход. Как вариант, можно нарисовать красивую схему, где поверх реального расположения атомов схематично нарисованы элементы вторичной структуры – так с первого взгляда видна укладка белка. После изучения всей структуры в общем, схематичном виде, можно отобразить химические группы активного центра и уже сосредоточиться на них. Задача предсказания третичной структуры белка – нетривиальная и в общем случае не решается, хотя может быть решена в частных случаях. Подробнее – ниже.
Четвертичная структура белка – да, есть и такая, правда не у всех белков. Многие белки работают сами по себе (мономеры, в данном случае под мономером имеется в виду одиночная свернутая полипептидная цепь, то есть белок целиком), тогда их четвертичная структура равна третичной. Однако достаточно много белков работает только в комплексе, состоящем из нескольких полипептидных цепей (субъединиц или мономеров — димеры, тримеры, тетрамеры, мультимеры), тогда вот такая сборка из нескольких отдельных цепей и называется четвертичной структурой. Самый банальный пример – состоящий из 4 субъединиц гемоглобин, самый красивый на мой взгляд пример – состоящий из 11 одинаковых субъединиц бактериальный белок TRAP.
5. Вычислительные задачи
Белок – сложная система из тысяч атомов, поэтому без использования компьютеров в структуре белка не разобраться. Задач, как решенных на приемлемом уровне, так и совсем не решенных, множество. Перечислю наиболее актуальные:
На уровне первичной структуры – поиск белков с похожей аминокислотной последовательностью, построение по ним эволюционных деревьев и тд – классические задачи биоинформатики. Главным хабом является NCBI — The National Center for Biotechnology Information, www.ncbi.nlm.nih.gov. Для поиска белков со сходной последовательностью стандартно используется BLAST: blast.ncbi.nlm.nih.gov/Blast.cgi
Предсказание растворимости белка. Речь идет о том, что если мы прочитаем геном какого-нибудь животного, определим по нему последовательности белков, переклонируем эти гены в кишечную палочку или baculovirus expression system, то окажется, что при экспрессии в этих системах примерно треть белков не будет сворачиваться в правильную структуру, и, как следствие, будет нерастворима. Тут выясняется, что большие белки на самом деле состоят из отдельных «доменов», каждый из которых представляет автономную, функциональную часть белка (несущую одну из его функций) и часто «вырезав» из гена отдельный домен, можно получить растворимый белок, определить его структуру и провести с ним опыты. Люди пытаются использовать машинное обучение (нейронные сети, SVM и прочие классификаторы), чтобы предсказывать растворимость белка, однако работает оно достаточно плохо (Гугл много чего покажет по запросу “protein solubility prediction” – есть много серверов, но по моему опыту все они работают отвратительно на моих белках). В идеале я хотел бы видеть сервис, который надежно сказал бы, где в белке находятся те самые растворимые домены, чтобы их можно было вырезать и работать с ними – такого сервиса нет.
На уровне вторичной структуры – предсказание той самой вторичной структуры по первичной (JPred)
На уровне третичной структуры – поиск белков со сходными трехмерными структурами (DALI, en.wikipedia.org/wiki/Structural_alignment ),
Поиск структур по заданной суб-структуре. Например, у меня есть расположение трех аминокислот активного центра в пространстве. Хочу найти структуры, которые содержать такие же три аминокислоты в таком же относительном расположении, либо найти структуры белков, мутирование которых даст возможность расположить нужные аминокислоты нужным образом. (гуглить «protein substructure search»)
Предсказание потенциальной подвижности трехмерной структуры, возможных конформационных изменений – normal mode analysis, ElNemo.
На уровне четвертичной структуры – предположим, известны структуры двух белков. Известно, что они образуют комплекс. Предсказать структуру комплекса (определить, как эти два белка будут взаимодействовать посредством shape matching, например). Гуглить «protein-protein docking»
6. Предсказание структуры белка
Выделил эту вычислительную задачу в отдельный раздел, ибо велика она, фундаментальна и не решается в общем случае.
Экспериментально мы знаем, что если взять белок, полностью развернуть его и бросить в воду, то он свернется обратно в исходное состояние за время от миллисекунд до секунд (это утверждение справедливо по крайней мере для небольших глобулярных белков без всяких патологий). Это значит, что вся информация, необходимая для определения трехмерной структуры белка, в неявном виде содержится в его первичной последовательности, поэтому так хочется научиться предсказывать трехмерную структуру белка по последовательности аминокислот in silico! Однако эта задача в общем случае не решена до сих пор. В чем же дело? Дело в том, что в первичной последовательности отсутствует в явном виде информация, необходимая для построения структуры. Во-первых, нет информации о конформации основной цепи – а она обладает значительной подвижностью, хотя и несколько ограниченной по стерическим причинам. Плюс каждая боковая цепь каждой аминокислоты может находиться в разных конформациях, для длинных боковых групп типа аргинина, это может быть больше десятка конформаций.
Что же делать? Есть достаточно известный хабравчанам самый общий подход, называемый «молекулярная динамика» и подходящий для любых молекул и систем. Берем развернутый белок, приписываем всем атомам случайные значения скоростей, считаем взаимодействия между атомами, повторяем до тех пор, пока система не придет в стабильное состояние, соответствующее свернутому белку. Почему это не работает? Потому что современные вычислительные мощности позволяют за месяцы работы кластера считать десятки наносекунд для системы из тысяч атомов, какой является белок, помещенный в воду. Время же сворачивания белка – миллисекунды и больше, то есть вычислительных мощностей не хватает, разрыв – в несколько порядков. Впрочем, пару лет назад американцы совершили некоторый прорыв. Они использовали специальное железо, оптимизированное для векторных вычислений и после оптимизации на аппаратном уровне у них за месяцы работы машины получилось посчитать молдинамику до миллисекунд для очень маленького белка и белок свернулся, структура соответствовала экспериментально определенной ( http://en.wikipedia.org/wiki/Anton_(computer) )! Однако праздновать победу еще рано. Они взяли очень маленький (его размер раз в 5-10 меньше среднего белка) и один из самых быстросворачивающихся белков, классический модельный белок, на котором изучалось сворачивание. Для больших белков время расчетов увеличивается нелинейно и потребуются уже годы, то есть еще есть над чем работать.
Другой подход реализован в Rosetta. Они разбивают последовательность белка на очень короткие (3-9 остатков) фрагменты и смотрят, какие конформации для этих фрагментов присутствуют в PDB, после чего запускают Монте-Карло по всем вариантам и смотрят, что получится. Иногда получается что-то годное, но в моих случаях через несколько дней работы кластера получаешь такой бублик, что возникает немой вопрос: «Кто писал их оценочную функцию, ставящую какую-то хорошую оценку вот этой загогулине?».
Есть инструменты и для моделирования вручную – можно предсказать вторичную структуру и попробовать вручную крутить ее, находя лучшую укладку. Некие гениальные люди даже выпустили игрушку FoldIt, представляющую белок схематично и позволяющую укладывать его, как-бы собирая головоломку (для интересующихся структурой – рекомендую!). Есть абсолютно официальное соревнование для предсказателей белковых структур, называемое CASP. Суть в том, что когда экспериментаторы определяют новую структуру белка, не имеющую аналогов в PDB, они могут не выкладывать ее сразу в PDB, а выставить последовательность этого белка на конкурс предсказаний CASP. Через некоторое время, когда все закончат свои предсказательные модели, экспериментаторы выкладывают свою экспериментально определенную структуру белка и смотрят, насколько хорошо сработали предсказатели. Самое интересное, что игроки FoldIt, не будучи учеными, как-то выиграли CASP у профессионалов моделирования белковых структур и предсказали структуру белка точнее. Однако даже эти успехи не позволяют утверждать, что проблема предсказания структуры белка решается – очень часто модель очень далека от реальной структуры.
Все это относилось к моделированию белков ab initio, когда нет никакой априорной информации о структуре. Однако очень часто бывают ситуации, когда для некоторого белка в PDB присутствует его отдаленный родственник с уже известной структурой. Под родственником подразумевается белок с похожей первичной последовательностью. Считается, что для белков со сходством по первичной последовательности больше 30% одинаковая укладка основной цепи (хотя одинаковая укладка наблюдалась и для белков, не проявляющих никакого статистически достоверного сходства по первичной последовательности). В случае наличия гомолога (похожего белка) с известной структурой, можно сделать «гомологичное моделирование», то есть попросту «натянуть» последовательность твоего белка на известную структуру гомолога, а потом погонять минимизацию энергии, чтобы как-то все это дело утрясти. Такое моделирование показывает хорошие результаты при наличие очень близких гомологов, чем дальше гомолог – тем больше ошибка. Инструменты для гомологичного моделирования – Modeller, SwissModel.
Можно решать и другие задачи, например, пытаться моделировать, что произойдет, если внести в белок ту или иную мутацию. Например, если заменить гидрофильную аминокислоту на поверхности белка на другую гидрофильную, то скорее всего структура белка не изменится вообще. Если заменить аминокислоту из гидрофобного ядра на другую гидрофобную, но другого размера, то скорее всего укладка белка останется той же, но слегка «съедет» на доли ангстрема. Если же заменить аминокислоту из гидрофобного ядра на заряженную, то скорее всего белок просто «взорвется» и не сможет свернуться.
Может показаться, что все не так уж и плохо и мы достаточно хорошо пониманием сворачивание белка. Да, мы понимаем кое-что, например до некоторой степени мы понимаем общие физические принципы, лежащие в основе сворачивания полипептидной цепи – они рассматриваются в замечательном учебнике Птицына и Финкельштейна «Физика белка». Однако это общее понимание не позволяет нам ответить на вопросы «Свернется ли данный белок или не свернется?», «Какая структура будет у этого белка?», «Как сделать белок с желаемой структурой?».
Вот одна из иллюстраций: мы хотим локализовать один из доменов большого белка, это стандартная задача. У нас есть фрагмент, который сворачивается и растворим, то есть это живой и здоровый белок. Мы же хотим найти его минимальную часть и начинаем методами генетической инженерии с обоих концов удалять по 2-3 аминокислоты, экспрессировать такой обрезанный белок в бактерии и смотреть его сворачиваемость экспериментально. Мы делаем десятки конструкций с такими маленькими делециями и видим такую картину – полностью растворимый и живой белок отличается от полностью мертвого и несворачивающегося на 3 аминокислоты. Повторюсь, это объективный экспериментальный результат. Проблема в том, что сейчас не существует вычислительного метода, который предсказал бы сворачиваемость белка хотя бы на уровне «да/нет» и сказал мне, где проходит граница между сворачивающимся и несворачивающимся белком, потому мы вынуждены клонировать и экспериментально проверять десятки вариантов. Это лишь одна из иллюстраций того, что наше понимание структуры белка весьма далеко от совершенства. Как говорил Ричард Фейнман, «Чего не могу воссоздать, того не понимаю».
Так что, господа программисты, физики и математики, нам еще есть над чем работать.
На этой оптимистичной ноте разрешите откланяться, благодарю всех, кто осилил сей опус.