Информация о структуре белка


Кажется, ты используешь AdBlock. Geektimes развивается и существует за информация о структуре белка доходов от рекламы. Добавь нас в исключения. Приятно видеть, что хабравчане регулярно информация о структуре белка другими предметными областями — например, биологией более конкретно — структурой и функцией биологических макромолекул. Однако некоторые посты например,вызывают у специалиста просто физическую боль из-за обилия совершенно диких фактологических ошибок. В этом посте мне хочется рассказать о структуре и функции белка. О том, что мы знаем и о том, чего не знаем, а так же об имеющихся в этой области вычислительных задачах, требующих решения интересных IT-специалистам. Постараюсь рассказывать сжато и тезисно, чтобы информации было больше, а воды — меньше. Всех, интересующихся структурой белков, прошу под кат, там очень много букв. В 19 веке еще не знали о роли ДНК в наследовании генетической информации, но утверждение дяди Фридриха в значительной мере справедливо до сих пор — основную работу в наших клетках совершают именно белки. Это и поддержание структуры формы клетоки химический катализ, и моторная функция сокращение мышц, напримери транспорт скажем, белок гемоглобин переносит кислород из легких в ткани и углекислый газ в обратном направлении и сложные регуляторные функции по поддержанию постоянства внутренней среды информация о структуре белка, белковые гормоны и всякие внутриклеточные регуляторные системы и многие другие. Словом, если в нашем организме что-то происходит, в это обязательно вовлечены белки хотя и не только они. С химической точки зрения белок — это линейный неветвящийся полимер, состоящий из монотонно повторяющихся одинаковых блоков «основной цепи», к которым приделаны различные «боковые группы». Так как блоки основной цепи несимметричны, вся полипептидная цепь белка имеет направление, различают N- и C-конец полипептидной цепи. Длина цепи — от 70 до более чем 1000 мономеров аминокислотных остатковсредняя длина для высших организмов — примерно 500-600 аминокислотных остатков, для бактерий эта величина будет меньше, скорее 300-400 остатков. Всего в природе существует 20 стандартных аминокислот, одинаковых и для бактерии и для человека, то есть из основной цепи могут торчать 20 разных боковых групп. Информация о структуре белка возможна поправка — некоторые химические группы могут быть модифицированны после синтеза белка, например, фосфорилированы. Однако это не рассматривается как другая аминокислота, а рассматривается как продукт модификации исходной. Так же у высших организмов возможно встраивание двух неканонических аминокислот, но это редкое событие. То есть, строго говоря, разных аминокислот 22, из них 20 основных и 2 редкие, плюс некоторые боковые группы могут быть изредка химически модифицированы. Из поколения в поколение генетическая информация передается в виде ДНК, в ней есть так называемые «белок-кодирующие области». В этих местах ДНК однозначным образом для ботанов — с точностью до альтернативного сплайсинга и редактирования РНК закодирована информация о линейной последовательности аминокислот для синтеза данного белка, плюс в клетке есть соответствующие машины, способные синтезировать белок по информации, изначально закодированной в ДНК. Для разных белков длина строки будет очевидно разной, так как белки имеют разную длину. Последовательности всех известных белков можно найти в открытом доступе здесь: 3. Структура белка Хорошо, с первичной структурой разобрались, но разве белок работает в развернутом линейном виде? Тут надо заметить, что информация о структуре белка структурной точки зрения есть разные классы белков: глобулярные, мембранные и фибриллярные. Мембранные белки, как следует из названия, живут только в клеточных мембранах, для стабилизации их структуры нужно особое окружение мембраны, мы не будем их рассматривать в этом обзоре. Фибриллярные белки имеют простое регулярное строение, похожи на вытянутые информация о структуре белка, они не растворимы в воде и выполняют структурные функции например, из кератина состоят волосы, к фибриллярным белкам относится белок из натурального шёлка. Недавно стали выделять класс разупорядоченных белков — белков, не обладающих постоянной трехмерной структурой, либо приобретающих ее только на короткое время при взаимодействии с другими белками. Наиболее интересный с практической точки зрения класс белков, который мы и будем рассматривать — глобулярные водорастворимые информация о структуре белка, к этому классу относится большинство белков. Линейная полипептидная цепь в воде способна самопроизвольно сворачиваться в сложную трехмерную структуру глобулу и только в таком свернутом виде белки могут выполнять химический катализ и прочую интересную работу. Поэтому нам принципиально важно знать именно трехмерную укладку белка, так как только информация о структуре белка этом уровне становится понятно, как белок работает. Вопрос: сколько трехмерных структур соответствует конкретному белку? Ответ: Одна, с точностью до небольшой подвижности маленьких «разупорядоченных» петель. Известно ровно одно исключение, когда одной последовательности соответствуют 2 достаточно разные структуры, это. Вопрос: Почему у белка только одна трехмерная структура? Ответ: для химического катализа нам нужно расположить соответствующие химические группы строго определенным информация о структуре белка в пространстве. Для этого нужна жесткая структура. То есть весь белок должен быть жестким, чтобы поддерживать химические группы аминокислот активного центра в нужных местах в реальности многие белки состоят из двух и более жестких частей, которые могут двигаться друг относительно друга, это нужно для регуляции активности белкачтобы некий сигнал мог включать и выключать химическую активность белка-фермента. Чтобы структура была жесткой и стабильной, природа позаботилась о том, чтобы структура каждого белка соответствовала энергетическому минимуму данной системы атомов и этот минимум был настолько глубоким, чтобы белок из него не «выпрыгнул». Информация о структуре белка другие, паразитные структуры, обладают большей энергией и белок все равно сваливается в энергетический минимум, соответствующий нативной структуре. Вопрос: на чем держится трехмерная структура белка? Ответ: информация о структуре белка коротко, то в основном на большом количестве нековалентных взаимодействий. В принципе, химические группы белка могут образовывать: 1 водородную связь, эти группы есть и в основной цепи и у некоторых боковых групп, 2 ионную связь — электростатическое взаимодействие между разноименно информация о структуре белка боковыми группами, 3 Ван-дер-Ваальсово взаимодействие и 4 гидрофобный эффект, на котором держится общая структура белка. Суть в том, что в белке всегда есть гидрофобные ароматические остатки, им энергетически невыгодно контактировать с полярными молекулами воды, а выгодно «слипнуться» друг с другом. Таким образом, при сворачивании белка гидрофобные группы выталкиваются из водного окружения, «слипаясь» друг с другом и формируя «гидрофобное ядро», а полярные и заряженные группы, наоборот, стремятся в водное окружение, информация о структуре белка поверхность белковой глобулы. Так же 5 боковые группы двух остатков цистеина могут образовать между собой дисульфидный мостик — полноценную ковалентную связь, жестко фиксирующую белок. Соответственно, все аминокислоты делятся на гидрофобные, полярные гидрофильныеположительно и отрицательно заряженные. Плюс цистеины, способные образовывать ковалентную связь между собой. Особыми свойствами обладают глицин — у него отсутствует боковая группа, сильно ограничивающая конформационную подвижность других остатков, поэтому он может очень сильно «гнуться» и находится в местах, где белковую цепь надо развернуть. У пролина же, наоборот, боковая группа образует кольцо, ковалентно связанное с основной цепью, жестко информация о структуре белка ее конформацию. Пролины встречаются там, где надо сделать белковую цепь жесткой и негнущейся. Многие заболевания связаны с мутацией пролина на глицин, из-за чего структура белка слегка «плывет». Вопрос: откуда вообще мы знаем о трехмерных структурах белка? Ответ: из эксперимента, это абсолютно надежные данные. Сейчас есть 3 метода для экспериментального определения структуры белка: ядерно-магнитный резонанс ЯМРcryo-EM электронная микроскопия и рентгеноструктурный анализ кристаллов белка. ЯМР позволяет определить структуру белка в растворе, но он работает только информация о структуре белка очень маленьких белков для больших невозможно сделать деконволюцию. Этот метод был важен для общего доказательства того, что у белка только одна информация о структуре белка структура и что структура белка в кристалле идентична структуре в растворе. Это очень дорогой метод, так как требуется получить белок с изотопными метками. Cryo-EM заключается в простой заморозке раствора белка и микроскопии. В этом методе активно применяются компьютерные технологии работы с картинками и статистика для вытягивания сигнала из шума. Отбираются миллионы картинок молекул белка, проводится разделение на классы в зависимости от ориентации молекулы относительно информация о структуре белка, усреднение по классам, генерация eigenimages, новый раунд усреднения и так пока не сойдется. Потом из информации из разных классов можно восстановить трехмерный вид молекулы с низким разрешением. Если же есть внутренняя симметрия частиц например, при cryo-EM анализе вирусовто можно еще каждую частицу поусреднять в соответствии с операторами симметрии — тогда разрешение будет еще лучше, но хуже, чем в случае рентгеноструктурного анализа. Рентгеноструктурный анализ — основной способ определения структур белка. Главный плюс — потенциально можно получить кристаллы даже очень больших информация о структуре белка из многих десятков белков например, именно так была определена структура рибосомы — Нобелевская информация о структуре белка 2009 года. Минус метода — вначале нужно получить кристалл белка, но далеко не информация о структуре белка белок хочет кристаллизоваться. Зато после того, как кристалл получен, по дифракции рентгеновского излучения можно однозначно определить положения всех упорядоченных атомов в молекуле белка, этот метод дает самое высокое разрешение и позволяет в лучших случаях видеть позиции отдельных атомов. Было доказано, что структура белка в кристалле однозначно соответствует структуре в растворе. Сейчас действует конвенция — если ты определил структуру белка любым из экспериментальных физических методов, структура должна быть помещена в открытый доступ в банк данных белковых структур Protein Data Bank — PDB,в настоящее время там находится более 90 000 структур впрочем, многие из них повторяющиеся, например, комплексы одного и того же белка с разными малыми молекулами, такими, как лекарственные средства. В PDB все структуры лежат в стандартном формате, называющемся, внезапно, pdb. Это текстовый формат, в котором каждому атому структуры соответствует одна строчка, в которой указан номер атома в структуре, название атома углерод, азот и тдназвание аминокислоты, в которую входит атом, название цепи белка A, B, C и тд, если это кристалл комплекса из нескольких белковномер аминокислоты в цепи и трехмерные координаты атома в ангстремах относительно ориджина, плюс так называемые температурный фактор и заселённость это сугубо кристаллографические параметры. ATOM 1 N HIS A 17 -12. То есть смотреть на структуры белка просто — ставишь программу, загружаешь нужную структуру из PDB и наслаждаешься красотой природы. Анализируем структуру Итак, мы поняли основную идею: белок — линейный полимер, сворачивающийся в водном растворе под действием множества слабых взаимодействий в стабильную и единственную для данного белка трехмерную структуру, и способный в таком виде выполнять свою функцию. Различают несколько уровней организации белковых структур. Выше мы уже познакомились с первичной структурой — линейной последовательностью аминокислот, которую можно выписать в строчку. Вторичная структура белка определяется взаимодействием атомов основной цепи белка. Как уже было сказано выше, в состав основной цепи белка входят доноры и акцепторы водородной связи, таким образом, основная цепь может приобретать некоторую структуру. Точнее, несколько разных структур детали все-таки зависят от различающихся боковых групптак как возможно образование разных альтернативных водородных связей между группами основной цепи. Структуры бывают такие: альфа-спираль, бета-листы состоящие из нескольких бета-тяжейкоторые бывают параллельными и анти-параллельными, бета-поворот. Плюс часть цепи может и не иметь выраженной структуры, например в районе поворота петли белка. Эти типы структур имеют свои устоявшиеся схематичные обозначения — альфа-спираль в виде спирали или цилиндра, бета-тяжи в виде широких стрелок. Вторичную структуру удается достаточно достоверно предсказывать по первичной стандартом являетсяальфа-спирали предсказываются наиболее точно, с бета-тяжами бывают накладки. Третичная структура белка определяется взаимодействием боковых групп аминокислотных остатков, это и есть трехмерная информация о структуре белка белка. Можно представить себе, что вторичная структура сформирована и теперь эти спирали и бета-тяжи хотят уложиться все вместе в компактную трехмерную структуру, чтобы все гидрофобные боковые группы спокойно «слиплись» вместе в глубине белковой глобулы, сформировав гидрофобное ядро, а полярные и заряженные остатки торчали наружу в воду, формируя поверхность белка и стабилизируя контакты между элементами вторичной структуры. Третичную структуру изображают схематически несколькими способами. Если просто отрисовать все атомы, то получится каша хотя когда мы анализируем активный центр белка, то мы хотим смотреть как раз на все атомы активных остатков. Если мы хотим посмотреть, как устроен весь белок в общем, можно отобразить только некоторые атомы основной цепи, чтобы увидеть ее ход. Как вариант, можно нарисовать красивую схему, где поверх реального расположения атомов схематично нарисованы элементы вторичной структуры — так с первого взгляда видна укладка белка. После изучения всей структуры в общем, схематичном виде, можно отобразить химические группы активного центра и уже сосредоточиться на них. Задача предсказания третичной структуры белка — нетривиальная и в общем случае не решается, хотя может быть решена в частных случаях. Четвертичная структура белка — да, есть и такая, правда не у всех белков. Многие белки работают сами по себе мономеры, в данном случае под мономером имеется в виду одиночная свернутая полипептидная цепь, то есть белок целикомтогда их четвертичная структура равна третичной. Однако достаточно много белков работает только в комплексе, состоящем из нескольких полипептидных цепей субъединиц или мономеров — димеры, тримеры, тетрамеры, мультимерытогда вот такая сборка из нескольких отдельных цепей и называется четвертичной структурой. Информация о структуре белка банальный пример —самый красивый на мой взгляд пример — состоящий из 11 одинаковых субъединиц. Вычислительные задачи Белок — сложная система из тысяч атомов, поэтому без использования компьютеров в структуре белка не разобраться. Задач, как решенных на приемлемом уровне, так и совсем не решенных, множество. Перечислю наиболее актуальные: На уровне первичной структуры — поиск белков с похожей аминокислотной последовательностью, построение по ним эволюционных деревьев и тд — классические задачи биоинформатики. Главным хабом является NCBI — The National Center for Biotechnology Information. Для поиска белков со сходной последовательностью стандартно используется BLAST: Предсказание растворимости белка. Речь информация о структуре белка о том, что информация о структуре белка мы прочитаем геном какого-нибудь животного, определим по нему последовательности белков, переклонируем эти гены в кишечную палочку или baculovirus expression system, то окажется, что при экспрессии в этих системах примерно треть белков не будет сворачиваться в правильную структуру, и, как следствие, будет нерастворима. Тут выясняется, что большие белки на самом деле состоят из отдельных «доменов», каждый из которых представляет автономную, функциональную часть белка несущую одну из его функций и часто «вырезав» из гена отдельный домен, можно получить растворимый информация о структуре белка, определить его структуру и провести с ним опыты. В идеале я хотел бы видеть сервис, который надежно сказал бы, где в белке находятся те самые растворимые домены, чтобы их можно было вырезать и работать с ними — такого сервиса нет. На уровне вторичной структуры — предсказание той самой вторичной структуры по первичной На уровне третичной структуры — поиск белков со сходными трехмерными структурами, Поиск структур по заданной суб-структуре. Например, у меня есть расположение трех аминокислот активного центра в пространстве. Хочу найти структуры, которые содержать такие же три аминокислоты в таком же относительном расположении, либо найти структуры белков, мутирование которых даст возможность расположить нужные аминокислоты нужным образом. На уровне четвертичной структуры — предположим, известны структуры двух белков. Известно, что они образуют комплекс. Предсказать структуру комплекса определить, как эти два белка будут взаимодействовать посредством shape matching, например. Гуглить «protein-protein docking» 6. Предсказание структуры белка Выделил эту вычислительную задачу в отдельный раздел, ибо велика она, фундаментальна и не решается в общем случае. Экспериментально мы знаем, что если взять белок, полностью развернуть его и бросить в воду, то он свернется обратно в исходное состояние за время от миллисекунд до секунд это утверждение справедливо по крайней мере для небольших глобулярных белков без всяких патологий. Это значит, что вся информация, необходимая для определения трехмерной структуры белка, в неявном виде содержится в информация о структуре белка первичной последовательности, поэтому так хочется научиться предсказывать трехмерную структуру белка по последовательности аминокислот in silico! Однако эта задача в общем случае не информация о структуре белка до сих пор. В чем же дело? Дело в том, что в первичной последовательности отсутствует в явном виде информация, необходимая для построения структуры. Во-первых, нет информации о конформации основной информация о структуре белка — а она обладает значительной подвижностью, хотя и несколько ограниченной по стерическим причинам. Плюс каждая боковая цепь каждой аминокислоты может находиться в разных конформациях, для длинных боковых групп типа аргинина, это может быть больше десятка конформаций. Есть достаточно известный хабравчанам самый общий подход, называемый «молекулярная динамика» и подходящий для любых молекул и систем. Берем развернутый белок, приписываем всем атомам случайные значения скоростей, считаем взаимодействия между атомами, повторяем до тех пор, пока система не придет в стабильное состояние, соответствующее свернутому белку. Почему это не работает? Потому что современные вычислительные мощности позволяют за месяцы работы кластера считать десятки наносекунд для системы из тысяч атомов, какой является белок, помещенный в воду. Время же сворачивания белка — миллисекунды и больше, то есть вычислительных мощностей не хватает, разрыв — в несколько порядков. Впрочем, пару лет назад американцы совершили некоторый прорыв. Они использовали специальное железо, оптимизированное для векторных вычислений и после оптимизации на аппаратном уровне у них за месяцы работы машины получилось посчитать молдинамику до информация о структуре белка для очень маленького белка и белок свернулся, структура соответствовала экспериментально определенной! Информация о структуре белка праздновать победу еще рано. Они взяли очень маленький его размер раз в 5-10 меньше среднего белка и один из самых быстросворачивающихся белков, классический модельный белок, на котором изучалось сворачивание. Для больших белков время расчетов увеличивается нелинейно и потребуются уже годы, то есть еще есть над чем работать. Другой подход реализован в. Они разбивают последовательность белка на очень короткие 3-9 остатков фрагменты и смотрят, какие конформации для этих фрагментов присутствуют в PDB, после чего запускают Монте-Карло по всем вариантам и смотрят, что получится. Иногда получается что-то годное, но в моих случаях через несколько дней работы кластера получаешь такой бублик, что возникает немой вопрос: «Кто писал их оценочную функцию, ставящую какую-то хорошую оценку вот этой загогулине? Есть инструменты и для моделирования вручную информация о структуре белка можно предсказать вторичную структуру и попробовать вручную крутить ее, находя лучшую укладку. Информация о структуре белка гениальные люди даже выпустили игрушкупредставляющую белок схематично и позволяющую укладывать его, как-бы собирая головоломку для интересующихся структурой — рекомендую! Есть абсолютно официальное соревнование для предсказателей белковых структур, называемое. Суть в том, что когда экспериментаторы определяют новую структуру белка, не имеющую аналогов в PDB, они могут не выкладывать ее сразу в PDB, а выставить последовательность этого белка на конкурс предсказаний. Через некоторое время, когда все закончат свои предсказательные модели, экспериментаторы выкладывают свою экспериментально определенную структуру белка и смотрят, насколько хорошо сработали предсказатели. Самое интересное, что игрокине будучи учеными, как-то выиграли у профессионалов моделирования белковых структур и предсказали структуру белка точнее. Однако даже эти успехи не позволяют утверждать, что проблема предсказания структуры белка решается — очень часто модель очень далека от реальной структуры. Все это относилось к моделированию белков ab initio, когда нет никакой априорной информации о структуре. Однако очень часто бывают ситуации, когда для некоторого белка в PDB присутствует его отдаленный родственник с уже известной структурой. Под родственником подразумевается белок с похожей первичной последовательностью. Считается, что для белков со сходством по первичной последовательности больше 30% одинаковая укладка основной цепи хотя одинаковая укладка наблюдалась и для белков, не проявляющих никакого статистически достоверного сходства по первичной последовательности. В случае наличия гомолога похожего белка с известной структурой, можно сделать «гомологичное моделирование», то есть попросту «натянуть» последовательность твоего белка на известную структуру гомолога, а потом погонять минимизацию энергии, чтобы как-то все это дело утрясти. Такое моделирование показывает хорошие результаты при информация о структуре белка очень близких гомологов, чем дальше гомолог — тем больше ошибка. Инструменты для гомологичного моделирования —. Можно решать и другие задачи, например, пытаться моделировать, что произойдет, если внести в белок ту или иную мутацию. Например, если заменить гидрофильную аминокислоту на поверхности белка на другую гидрофильную, то скорее всего структура белка не изменится вообще. Если заменить аминокислоту из гидрофобного ядра на другую гидрофобную, но другого размера, то скорее всего укладка белка останется той же, но слегка «съедет» на доли ангстрема. Если же заменить аминокислоту из гидрофобного ядра на заряженную, то скорее всего белок просто «взорвется» и не сможет свернуться. Может показаться, что все не так уж и плохо и мы достаточно информация о структуре белка пониманием сворачивание белка. Да, мы понимаем кое-что, например информация о структуре белка некоторой степени мы понимаем общие физические принципы, лежащие в основе сворачивания полипептидной цепи — они рассматриваются в замечательном учебнике. Однако это общее понимание не позволяет нам ответить на вопросы «Свернется ли данный белок или не свернется? », «Какая структура будет у этого белка? », «Как информация о структуре белка белок с желаемой структурой? Вот одна из иллюстраций: мы хотим локализовать один из доменов большого белка, это стандартная задача. У нас есть фрагмент, который сворачивается и растворим, то есть это живой и здоровый белок. Мы же хотим найти его минимальную часть и начинаем методами генетической инженерии с обоих концов удалять по 2-3 аминокислоты, экспрессировать такой обрезанный белок в бактерии и смотреть его сворачиваемость экспериментально. Мы делаем десятки конструкций с такими маленькими делециями и видим такую картину информация о структуре белка полностью растворимый и живой белок отличается от полностью мертвого и несворачивающегося на 3 аминокислоты. Повторюсь, это объективный экспериментальный результат. Это лишь одна из иллюстраций того, что наше понимание структуры белка весьма далеко от совершенства. Как говорил Ричард Фейнман, «Чего не могу воссоздать, того не понимаю». Так что, господа программисты, физики и математики, нам еще есть над чем работать. На этой оптимистичной ноте разрешите откланяться, благодарю всех, кто осилил сей опус. Для глубоко знакомства с предметной областью рекомендую следующий минимум: 1 «Физика белка» Птицын и Информация о структуре белка. Большую часть материала Алексей Витальевич Финкельштейн выложил в онлайн, чем и рекомендую с благодарностью воспользоваться: а я утащил оттуда несколько картинок 2 Патрушев, «Искусственные генетические системы», особенно часть II «Белковая инженерия». Есть на торрентах в формате Djvu 3 Для информации, опубликованной в биологических научных журналах, есть официальный поисковик PubMed — у него стоит попросить почитать про «protein engineering» и тому подобное. Информация о структуре белка лучше разделять запятой. Собственно комментарий был оставлен, потому что перед сном мог не осилить, хотя бегло пробежав понял что статья интересная. Информация о структуре белка общем так и есть, многое узнал, еще раз спасибо! По сути, лично мне кажется главное решение так и останется в вычислительной мощности. И если можно вопрос, правильно ли я понял, что даже если вычислительных мощностей хватит для вычисления структуры не маленьких информация о структуре белка, то скорее всего информация о структуре белка результат будет все равно приближенным? Пожалуйста, рад, что статья понравилась, я не минусовал : Предполагается, что если делать молекулярную динамику с правильными force fields, то должно свернуться информация о структуре белка нативную природную конформацию. Proof of principle: The protein was initially configured in a fully extended state and was observed to fold to a stable conformation with a backbone root-mean-squared deviation RMSD of ~1 Å from the crystal structure. Разобраться, как все-таки мозг работает и так далее. А для обОжения надо, по слову отцов, Духа Святого стяжать! А ведь так и просится смайлик после «Почему бéлки важны? » информация о структуре белка В самом начале не просто так было предупреждение о том, что много букв ; Про бЕлок — рассказывали байку про то, как биологи из Пущино приехали в гости к физикам в Дубну, а у них там в парке табличка «Берегите белок! », пущинцы конечно же прочитали неправильно и удивлялись, почему физиков так волнует сохранность белкА : Было дело, правда. Кстати, там выше я ссылался на лекции Финкельштейна по физике белка, он в том самом Институте белка работает. В Пущино про Информация о структуре белка а это самый продвинутый институт там много шуток. Например, информация о структуре белка город Пущино: магазин Зайчик, институт БЕлка» : «Содержит фенилаланин» пишут для больных фенилкетонурией, у них в организме не расщепляется до конца фенилаланин, накапливаются вредные промежуточные продукты расщепления и человеку становится совсем плохо. У здоровых людей проблем с этим нет : Спасибо! Информация о структуре белка интересно и до некоторой степени понятно для неспециалиста. А какой принцип использует программы для локальной оптимизации структуры, molecular dynamics или что-то более хитрое? «до некоторой степени понятно» — хм, это вежливое «не очень понятно»? Для уменьшения объема вычислений, насколько я в курсе, зачастую не считают полноценную молекулярную динамику, а делают «минимизацию энергии» своими фирменными алгоритмами. В реальности это означает, что текущая позиция оценивается, скажем, по количеству «плохих» контактов, то есть когда расстояние между атомами меньше Ван-дер-Ваальсового, и подобным критериям, а потом структура слегка двигается для оптимизации по этим критериям отличие от молдинамики в том, что двигают не отдельные атомы, а большие группы атомов, соответствующих аминокислотам и тд. Заодно алгоритм может перебрать стандартные конформации боковых групп, чтобы посмотреть, какая из них лучше «вписывается» и тд. Кар-парринелло всякие надо хотя бы. К тому же, минимизацию энергии системы с адренорецептором к примеру — это 60к атомов — громакс выполняет часов за 5 на домашнем ноуте. Вообще говоря, крутить группы — гиблое дело. Лучше не изобретать велосипед — использовать структуру из базы данных при наличии или пытаться построить по аналогии+ с учетом каких то специфичных вещей для отдельных остатков хм, это вежливое «не очень понятно»? Еще понятно, что функцию поля для нее я никогда не напишу. Соответственно чтобы за разумное конечное время проветси расчеты — приходится упрощать модель. Даже кое-каких интересных результатов удалось добиться, с точки зрения алгоритмов. Вы использовали что-то типа shape matching или оно по-другому работало? Ага, похоже на Shape Matching. Сначала рассчитывали «упругость» отдельных элементов вторичной структуры по-честному — MD, потом гнули их. По публикации не знаю, я потом другой темой занялся — МД льдоподобных структур воды связанная вода, напримера потом и вовсе из науки ушел, к сожалению. Просто подумал, может где-то еще в нашей необъятной Родине фолдингом белка занимаются, ан нет. Хотя я видел людей из Питера и Новосиба, утверждающих, что и у них есть биохимия и молекулярка : Насчет Новосибирска: до Вашего комментария, я был уверен, что есть. «Использование процессорного времени в 2012 г. » Что-то там еще вроде Института, … а если глубже копнуть, то тысячи их и! А она, как Вы верно заметили, немножко есть. Под Новосибом есть дажена нем была первая в Советском Союзе синхротронная станция для сбора дифракционных данных с белковых кристаллов. Да, к сожалению, подходы, работающие у химиков для малых информация о структуре белка для биологов все, что меньше ~500 Дальтон — малая молекулаперестают эффективно работать для макромолекул 15-150 и больше килоДальтон из-за вычислительной сложности. Приходится изобретать гиблые, но более быстрые костыли. Это, кстати, отдельный вопрос — сколько проблем может быть решено просто увеличением доступной вычислительной мощности. Похоже, что фолдинг белка — одна из таких информация о структуре белка. Учитывая нелинейный рост времени расчёта для больших белков, традиционное увеличение доступной мощности вряд ли является панацеей. Может быть, в будущем найдутся какие-то более новые и более скоростные вычислительные подходы — например, те же расчёты, но с использованием квантовых алгоритмов. Насколько я помню, химики по-честному численным информация о структуре белка Шредингера что-то порядка 1000 атомов уже считают за очень разумные времена часы. Так что хорошо спроектированный узкоспециализированный суперкомпьютер должен эту проблему снять лет через 10-15. Вопрос: на чем держится трехмерная структура белка? Ответ: если коротко, на большом количестве слабых взаимодействий. Прочитал дальше — фух, картина информация о структуре белка на месте, взаимодействия электромагнитные, а не слабые. Уже поправил на «в основном на большом количестве нековалентных взаимодействий». Просто я использовал наш жаргонизм «слабое взаимодействие», как противоположность ковалентной связи. Я перечитал статей о программировании. Прочитав заголовок ожидал нестандартную структуру данных «белка», думал с воображаемым колесом это как то связанно. Кратко, информативно, и выделены ключевые моменты — нерешенные вычислительные задачи, именно для айтишников. Даже залогинился, чтобы плюсануть. А еще заинтересовался, как именно белки выполняют всю эту работу в живых организмах и почему именно белки, какие ключевые свойства белков заставили именно их быть «рабочими лошадками». Меня заинтересовал вопрос — как можно понять свойства белка по его структуре? И наоборот, как предсказать структуру белка, которая будет соответствовать каким-то желаемым свойствам? Вопрос первый — в общем случае, не имея дополнительной информации — никак : В реальности алгоритм такой — можно поискать гомологичные сходные по первичной последовательности белки, узнать, что они делают и от этого оттолкнуться. Если есть структура — такой же поиск структурных гомологов, может дать ответ на вопрос, но подтвердить функцию белка можно только в лаборатории, экспериментально. Далее, если нет гомологов с известной функцией, можно провести анализ окружения гена, кодирующего данный белок, в ДНК. Очень часто гены белков, участвующих в разных стадиях одного процесса, находятся на ДНК рядом у бактерий это называется оперонтак можно хоть процесс определить. Если же совсем ничего не ясно, в бой идет тяжелая артиллерия — генетическая инженерия. Для начала обычно просто убивают нужный ген и смотрят, какой процесс в организме сломался, потом информация о структуре белка более тонкий анализ мутантных версий белка и тд : Плюс возможный всякие скрининги — например, если есть подозрение, что белок взаимодействует с другими белками, можно прогнать идентифицировать возможных партнеров, далее раскручивать от них. Второй вопрос: стопроцентно — никак. Но можно предположить, как именно должны быть расположены атомы активного центра для осуществления нужной функции, а потом попытаться найти подходящий остов белка, который сможет поддерживать нужную структуру атомов активного центра. Сейчас это на уровне шаманства, люди меняли специфичности отдельных ферментов успешно и тд, но такая инженерия успешная — пока очень большая редкость. Для начала обычно просто убивают нужный ген и смотрят, какой процесс в организме сломался А как это делают? Нужно ведь найти нужный информация о структуре белка из миллиардов или сколько их там нуклеотидов и повредить только нужные. Вопросы глубокие и точного ответа не имеющие, но в контексте эволюционной теории самой разумной отговоркой будет, что «так случайно получилось, а потом закрепилось». На самом деле аминокислоты могут информация о структуре белка образоваться из неорганики те самые опыты Миллера —плюс аминокислоты умеют даже спонтанно полимеризоваться в короткие пептиды в присутствии ионов меди. То есть их химия, скорее всего, оказалась самой «удобной» для эволюции, но точней ответить вряд ли можно. Репертуар боковых остатков аминокислот достаточно богат и позволяет катализировать множество реакций, но возникает вопрос, почему именно эти 20 аминокислот закрепились эволюцией? Ведь химически возможно существование бОльшего количества аминокислот, просто Природа не использует их в белках. Лучший ответ — так случайно получилось, то есть мы не знаем. Сторонники «intelligent design» немедленно указали бы, что здесь имеется лазейка для существования Творца. В плане же инженерии белка, информация о структуре белка поставлена такая задача — сделать искусственную систему трансляции, которая позволила бы включать в белки нестандартные аминокислоты, существенно расширяя каталитический репертуар белков. Первые успехи информация о структуре белка of principle уже есть: Есть еще хороший спор о курице и яйце — РНК и аминокислотная последовательность особенно в свете экспериментов, показавших принципиальную возможность обратной трансляции РНК из аминокислотной последовательности. Тоже загадка из загадок, связанная с уникальной функцией белка. Так, а вот про обратную трансляцию можно поподробней? В официальной мэйнстримной науке вроде бы до сих пор этот процесс считается невозможным, отсюда и вера в идею «мира РНК». Вот,которая по-моему не получила продолжения, но механизм возможной обратной трансляции вполне правдоподобен. Не знаю, были ли сделаны кем-то проверочные эксперименты, но тема, как мне кажется, перспективная. Хотя, конечно, это сильно неофициальная точка зрения. С другой стороны, с точки зрения физики и химии процесса трансляции, я не вижу ни одной причины, почему не может существовать обратного механизма, так же как есть обратная транскрипция ретровирусы, те информация о структуре белка. Поправка, на коротких последовательностях, конечно. Есть несколько линий доказательства, почему обратная трансляция невозможна. Во-первых, функции значительного количества белков известны и такого фермента не обнаружено. Глядя на рибосому, делающую прямую трансляцию и весящую больше трех мегадальтон, 52 белка плюс длинные РНК, невольно предполагаешь, что обратную транскрипцию будет делать такая же махина и не заметить ее очень сложно. Во-вторых, синтез белка — многоступенчатый информация о структуре белка, поэтому он термодинамически не может информация о структуре белка обращен, в отличие от одноступенчатых реакций к которым, например, относится транскрипция — химически там образуется лишь фосфодиэфирная связь между нуклеотидами, реакция может быть легко обращена. Были еще какие-то свидетельства, которые нам читали, но уже плохо помню — давно это было : Спасибо за увлекательную статью! Есть достаточно известный хабравчанам самый общий подход, называемый «молекулярная динамика» и подходящий для любых молекул и систем. Берем развернутый белок, приписываем всем атомам случайные значения скоростей, считаем взаимодействия между атомами, повторяем до тех пор, пока система не придет в стабильное состояние, соответствующее свернутому белку. Почему это не работает? Потому что современные вычислительные мощности позволяют за месяцы работы кластера считать десятки наносекунд для системы из тысяч атомов, какой является белок, помещенный в воду. Задумчиво А он считает взаимодействие всех атомов со всеми, или как-то бьет их по группам? Я, к примеру, когда считал замерзание воды, считал по кубам пространства Достоверно не знаю, но, похоже, что все со всеми. А динамически обновляемый proximity усложняет обработку на конвейeре GPU. Потом, межатомные взаимодействия хоть и ослабевают с расстоянием, но все равно остаются. Исключение из модели «слабых» взаимодействий искажает поле. А, поскольку интегрировать нужно с фемтосекундным шагом до миллисекунд, есть риск получить откровенную ересь. Блин, это действительно надо писать и пробовать… так, с ходу, попробовал предложить две модели упрощенного расчета, но понял, информация о структуре белка тут надо самому сперва попробовать. А были попытки cкомбинировать молекулярную динамику с кинематической моделью: рассматривать спирали и тяжи как жесткие элементы, а остальные атомы по отдельности? Что-то мне подсказывает, что это и есть вышеупомянутые гиблые костыли, но вдруг… Да, именно так «минимизация энергии» и делается. Подходы в деталях отличаются, но суть в том, что ты уже двигаешь группы атомов, информация о структуре белка том числе и расширенные до целого элемента вторичной структуры. Проблема тут в том, что при таком приближении система обычно сползает до ближайшего локального энергетического минимума, который совсем не есть глобальный минимум. Выпрыгнуть же информация о структуре белка локального минимума такой подход пока не может, в этом вся проблема… В статье было написано так: Длина цепи — от 70 до более чем 1000 мономеров аминокислотных остатковсредняя длина для высших организмов — примерно 500-600 аминокислотных остатков, для бактерий эта величина будет меньше, скорее 300-400 остатков. Каждая аминокислота состоит из от 10 до почти 30 атомов, включая атомы водорода. То есть в среднем в белке несколько тысяч атомов, в крупных может быть больше десятка тысяч. Если же запускать молекулярную динамику, то белок обычно помещают в «коробочку» из воды, так как взаимодействие с водой критично для белка хотя раньше и в «вакууме» гоняли, но поняли, что это не кошерно. Соответственно, молдинамика в таких случаях еще должна все атомы воды просчитывать. Ну в принципе 1000 000 атомов вместе с водой — ничего «военного» на первый дилетантский взгляд. Эээ, батенька, тут главный вопрос — в каком приближении считать. Это отнюдь нетривиальная задачка. Информация о структуре белка все танцы с бубном в фолдинге и развернуты вокруг того, как бы считать поменьше взаимодействий, чтобы получить рабочую модель реальной молекулы. Я для себя немного по другому поставил вопрос: если в линейной развертке содержится информация о трехмерной структуре, то наша задача — зная линейную комбинацию, информация о структуре белка что бы то ни стало вырвать из темных лап природы абсолютно точную трехмерную структуру без приближений и сделать это мгновенно. А что такое комбинаторика, приближенность и потенциалы — я в принципе немного догадываюсь, но не знал, что биохимики страдают, поэтому выражаю еще раз благодарность автору за актуальную задачу. Скажите, а с повышением температуры белок же должен скорее сворачиваться? При нуле кельвинов не свернется же? Существуют и тепловая, и холодовая денатурация разрушение структуры белка, они возникают за счет разных эффектов. Если на пальцах, то тепловая денатурация происходит из-за разрушения водородных связей при повышении температуры, подвижность возрастает и белок разворачивается. Обычно белки денатурируют в диапазоне ~50-70 градусов Цельсия, так называемые термостабильные белки выдерживают и более высокие температуры, до 90-110 градусов. Холодовая денатурация — за счет изменения свойств воды при понижении температуры, гидрофобный эффект ослабляется при низких температурах и может привести к разворачиванию белка. Для большинства белков температура холодовой денатурации ниже 0 по Цельсию, то есть белок еще не успевает денатурировать, а раствор уже замерзает. Для некоторых же белков холодовая денатурация наблюдалась экспериментально. Подробности про сворачивание и температуру здесь: Олег, заинетересовало растворимость в воде и сворачиваемость белка — это одно и тоже? То есть расворим — это всегда сворачиваемый и наоборот? И еще, правильно ли я понимаю, что несворачиваемый белок не может выполнять никакой функции и соответственно мертвый? Первый вопрос — в первом приближении, да, именно так, во всяком случае это скоррелированные параметры. Если белок растворим и не выпадает в осадок — это хороший знак, он свидетельствует, что белок скорее свернут, чем нет но не информация о структуре белка, особенно информация о структуре белка больших белков — часть белка может свернуться, а часть — нет. Если белок нерастворим — скорее всего, не смог свернуться. Тут все дело в гидрофобных остатках — в свернутом белке они «спрятаны» внутри глобулы, где формируют гидрофобное ядро, а снаружи глобулы — гидрофильные и заряженные группы, обеспечивающие растворимость в общем случае. Если белок не смог свернуться, то гидрофобные остатки могут торчать наружу, «слипаться» с торчащими наружу аналогичными остатками других молекул белка, вызывая массивную аггрегацию информация о структуре белка в осадок. Как-то так, но из любого правила могут быть исключения. Второй вопрос — раньше именно так и считалось, однако сейчас потихоньку приходит понимание, что есть «intrinsically disordered proteins» — разупорядоченные белки, не имеющие выраженной трехмерной структуры и при этом информация о структуре белка свои функции. Такие белки не могут быть ферментами, выполняющими катализ для катализа нужна четкая структурано они информация о структуре белка участвуют в белок-белковых взаимодействиях и регуляции клеточных процессов. Информация о структуре белка в том, что для связывания с другим белком структура не очень важна, так как структурированный белок может распознавать и связывать кусок несвернутого белка-партнера BRCT domain, например. В свою очередь, на несвернутом белке могут быть сайты распознавания для нескольких разных структурированных белков и он может служить «затравкой» для образования биологически важного комплекса из нескольких белков. Связывание структурированных белков с неструктурированным, в свою очередь, может регулироваться белками-регуляторами за счет фофсорилирования неструктурированного белка, например. Из твоих ответов, я понял, что я не до конца понимаю, что значит раствориться. Чисто на бытовом уровне, как понимаю — это состояние из кторого белок не выпадает в осадок со временем. В принципе, все правильно. В практическом плане это выглядит так — белок же не берется сам по себе с потолка, его продуцируют в бактериях или культуре эукариотических клеток, в которые засунут ген нужного белка так, чтобы бактерия или клетка вырабатывала его в больших количествах по-научному — ген под контролем сильного промотора. Соответственно, в какой-то момент у нас есть несколько грамм бактерий, собранных после выращивания в паре литров среды. Мы эти бактерии суспендируем в некотором растворе и разрушаем их клеточную стенку и мембраны ультразвуком или специальным прессом грубо говоря, клетки лопаются. В результате имеем растворимую фракцию белков и прочего клеточного содержимого плюс «осколки» клеток, которые нерастворимы. Растворимое отделяется от нерастворимого центрифугированием, а потом смотришь — есть ли твой белок в растворе или он находится вместе с осколками клеток в нерастворимом осадке. Обычно считается, что если информация о структуре белка не растворим, значит по какой-то причине он не смог свернуться, хотя реально никто не знает, в чем там точно дело. Причем хитро перебирая компоненты раствора иногда удается растворить нерастворимый белок. Но редко : Для проведения экспериментов, как Вы понимаете, нужен растворимый, функционально активный белок… Да, тут есть еще тонкий момент: химический раствор у ученых в пробирке — это совсем не то, что среда внутри живой клетки. Например, внутри живой клетки фактически нет свободных молекул воды, а в растворе их полно. Поэтому возможна такая ситуация, когда белок в естественных информация о структуре белка синтезируется в количестве две-три молекулы на всю клетку и в таких условиях он прекрасно сворачивается и работает. Однако если мы запустим суперпродукцию белка нужный белок будет составлять 5-50% от всех белков клетки по массето белок не будет успевать сворачиваться, плюс ему будет плохо в условиях раствора в пробирке и он обидится и выпадет в осадок. Справедливости ради стоит отметить, что большинство белков счастливы и растворимы и после суперпродукции, и после переноса их из клетки в химический раствор. Уффф… Очень круто, что публикуете статьи по медицине, биологии, химии на IT-ресурсе. Вот потрясающая статья с наглядными картинками о молекулах РНК. Пометьте топик понятными вам метками, если хотите Метки лучше разделять запятой.Жизнедеятельность клетки Важнейшие функции организма: обмен веществ, рост, развитие, передача наследственности, движение и другие осуществляются в результате множества химических реакций с участием белков, нуклеиновых кислот и других биологически активных веществ. Для химических реакций, протекающих в клетках, характерны организованность и упорядоченность: каждая реакция протекает в строго определенном месте, по строго определенным закономерностям. Обмен веществ и энергии в клетке называют информация о структуре белка. Метаболизм состоит из катаболических и анаболических процессов. Синтез веществ, идущий в клетке ассимиляцияеще называют биосинтезом. Совокупность реакций биосинтеза, представляющих собой анаболические процессы, информация о структуре белка пластическим обменом. Совокупность реакций расщепления диссимиляция, или катаболизмобеспечивающих клетку энергией, называют энергетическим обменом. Одна из важнейших форм пластического обмена — биосинтез белка. Биосинтез белка Биосинтез белка — цепь синтетических реакций, протекающих по принципу информация о структуре белка синтеза, то есть в точном соответствии с планом, заложенным информация о структуре белка ДНК. В синтезе белка принимают участие: ДНК — хранит и передает информацию о структуре молекулы белка последовательность аминокислот ; и-РНК — кодирует наследственную информацию с участка молекулы ДНК — гена и переносит ее к информация о структуре белка сборки белковой молекулы; т-РНК — присоединяет аминокислоты и переносит в рибосому. Объединяются в полирибосомы; ферменты — биокатализаторы, участвуют в синтезе ДНК, РНК, в образовании первичной структуры информация о структуре белка белка; АТФ — энергия ЛТФ расходуется при синтезе ДНК, при переносе РНК, аминокислот в процессе построения молекулы белка; аминокислоты — мономеры белка; аминокислоты — мономеры белка; ЭПС эндоплазматическая сеть — на гранулярной ЭПС, несущей рибосомы; осуществляется синтез молекулы белка. Внутри каналов ЭПС формируются вторичная, третичная и четвертичная структуры молекул белка. Биосинтез белка идет в каждой живой клетке. Основная роль в определении структуры белков принадлежит ДНК. Отрезок ДНК, содержащий информацию о структуре одного белка, называют геном, их водной молекуле ДНК содержится несколько сотен. В молекуле ДНК записан код о последовательности аминокислот в белке в виде определенно сочетающихся нуклеотидов. Сущность кода ДНК состоит в том, что каждой аминокислоте соответствует участок цепи ДНК из трех рядом стоящих нуклеотидов — триплет. Например, А-Ц-А — соответствует аминокислоте цистину, А-А-Ц — лейцину, Т-Т-Т — информация о структуре белка и т. Аминокислот 20, число возможных сочетаний из 4 нуклеотидов по 3 равно 64. Триплетов хватает с избытком для кодирования всех аминокислот. Биосинтез белка идет в несколько этапов. Первый этап биосинтеза белка Синтез и-РНК происходит в ядре. Информация, содержащаяся в гене ДНК, переписывается на и-РНК. Этот процесс называют транскрипцией от лат. При этом против каждого нуклеотида одной из цепей ДНК встает комплементарный ему нуклеотид и-РНК. Молекулы и-РНК индивидуальны, каждая из них несет информацию одного гена. Второй этап биосинтеза белка Соединение аминокислот с молекулами т-РНК происходит в цитоплазме. Вначале аминокислоты в цитоплазме активируются с помощью ферментов и соединяются со специфическими для них транспортными РНК т-РНКто есть для каждой из 20 аминокислот существует своя т-РНК. Информация о структуре белка т-РНК переносит соединенную с ней аминокислоту на рибосому. Каждая т-РНК имеет последовательность из трех нуклеотидов — антикодон, с помощью которого определяет только свой триплет кодон на и-РНК. Третий этап биосинтеза белка «Сборка» белка происходит в рибосомах. К рибосомам направляются из ядра и-РНК. При этом на одной молекуле и-РНК одновременно располагается несколько рибосом Из цитоплазмы т-РНК с «навешанными» на них аминокислотами подходит к рибосомам и своим кодовым концом дотрагивается до триплета и-РНК, проходящего в данный момент через функциональный центр рибосомы. В это время противоположный информация о структуре белка т-РНК с аминокислотой попадает в место «сборки» белка, и если кодовый триплет т-РНК окажется комплементарным триплету и-РНК, находящемуся в данный момент в функциональном центре рибосомы, аминокислота отделяется от т-РНК и попадает в состав белка, а рибосома делает «шаг» на один триплет по и-РНК вправо. Отдав аминокислоту, т-РНК покидает рибосому, ей на смену приходит другая, с иной аминокислотой, составляющей следующее звено в строящейся белковой молекуле. Схема синтеза белка в рибосоме: А — рибосома, Б — и-РНК, В — фермент белок синтстазаГ — т-РНК, несущие аминокислоты в рибосому, Д — белок Так звено за звеном собирается полипептидная цепь белка, а информация о структуре белка, записанная в и-РНК в виде последовательности нуклеотидов, воспроизводится на нолипептидной цепи белка в виде последовательности аминокислот. Этот процесс называется трансляцией от лат. В генетическом коде существуют три триплета, выполняющих функцию знаков препинания, обозначая прекращение синтеза одной белковой цепи. Каждая аминокислота шифруется более чем одним триплетом кодоном от 2 до 6. Генетический код Аминокислота Кодирующие триплеты — кодоны Алании Информация о структуре белка ГЦЦ ГЦА ГЦГ Аргинин Информация о структуре белка ЦГЦ ЦГА ЦГГ АГА АГГ Аспарагин ААУ ААЦ Аспарагиновая кислота ГАУ ГАЦ Валин ГУУ ГУЦ ГУА ГУГ Гистидин ЦАУ ЦАЦ Глицин ГГУ ГГЦ ГГА ГГГ Глутамин ЦАА ЦАГ Глутаминовая кислота ГАА ГАГ Изолейцин АУУ АУЦ АУА Лейцин ЦУУ ЦУЦ ЦУА ЦУГ УУА УУГ Лизин ААА ААГ Метионин АУГ Пролии ЦЦУ ЦЦЦ ЦЦА ЦЦГ Серии УЦУ УЦЦ УЦА УЦГ АГУ АГЦ Тирозин УАУ УАЦ Треонин АЦУ АЦЦ АЦА АЦГ Триптофан УГГ Фенилаланин УУУ УУЦ Цистеии УГУ УГЦ Знаки препинания УГА УАГ УАА Четвертый этап биосинтеза белка На этом этапе образуются вторичная и третичная структуры белка, рибосома сходит с и-РНК, а образовавшийся белок поступает в эндоплазматическую сеть и по ее каналам — в другие части клетки, а рибосома поступает на другую и-РНК и участвует в синтезе другого белка. Все реакции белкового синтеза катализируются специальными ферментами с использованием энергии АТФ аденозинтрифосфорной кислоты. Скорость синтеза белка обусловлена многими факторами: температурой среды, концентрацией водородных ионов, количеством конечного продукта синтеза, присутствием свободных аминокислот, ионов магния, состоянием рибосом и др. Добавить комментарий Ваш e-mail не будет опубликован.

Смотри также