пока Гугл только Замена моделейМатериал из Википедии, свободной энциклопедииВ биологии, замещение модель описывает процесс, в котором последовательность символов изменения в другой набор качеств. Например, в Cladistics, каждая позиция в той последовательности, может соответствовать собственности виды, которые могут быть либо присутствует или отсутствует. Алфавит могла бы состоять из "0" за отсутствие и "1" для присутствия. Тогда последовательность 00110 может означать, например, что виды не перьев или откладывать яйца, не имеют меха, это теплокровные, и не могут дышать под водой. Другая последовательность 11010 будет означать, что вид имеет перья, откладывает яйца, не имеют меха, это теплокровные, и не могут дышать под водой. В Филогенетика, последовательности часто приобретается путем получения первого нуклеотида или выравнивания последовательностей белков, а затем с базами илиаминокислот в соответствующей позиции в соотношении как символы. Последовательности достигнуто это может выглядеть AGCGGAGCTTA и GCCGTAGACGC. Замена модели используются для целого ряда вещей:
[Править]нейтрального, независимого, конечных моделей сайтыБольшинство замещение моделей, используемых на сегодняшний день нейтральный, независимый, конечных моделей объектов.
[Править]молекулярные часы и единиц времениРазличные замещение моделям сделку со временем по-разному.
[Править]Время-обратимые моделямиБольшинство полезных моделей замещения времени обратимы. Что касается замены моделей, это просто означает, что с течением времени, относительные частоты каждого символа не меняются. За время обратимо модели, не существует предположение, что преимущественное замен изменений в определенных направлениях с течением времени. Например -> C -> G так же, как G -> C -> А. Причина этого в том, что при выполнении анализа реальных биологических данных, существует, как правило, не имеют доступа к последовательности предков виде, только на вид и сегодня. Однако, когда модели обратимого времени, какие виды были исконные виды не имеет значения. Вместо этого филогенетического дерева может иметь корни вдоль ветви, ведущие к произвольной современных видов, вновь укоренившиеся позднее на основе новых знаний, или влево некорневых. Время обратимо модель удовлетворяет следующему свойству π 1 Q 12 = 2 π Q 21 (см. ниже определения этой записи) [Править]Математика замещения моделямиНейтрального, независимого, конечных моделей сайтах (при условии постоянной скорости эволюции) есть два параметра, Π, вектор базы (или персонаж) частоты в начальный момент (на время обратимо модель, этот вектор обычно называют базу равновесие частотах, и распространяется на все времена), и скоростью матрицы, Q,которая описывает скорость, с которой базе одного типа изменений в базы другого типа, Q I J для Функции матрицы перехода является функцией от длин филиала (в некоторых единицах времени, возможно, в замен), в матрицу условных вероятностей. Она обозначается P (T). Запись в I-м столбце и J-й строки (Р И Й (T))есть вероятность, за время т, что существует база J на данной позиции, условно от наличия базы и в этом положении на время 0. Если модель время обратимо, это может быть выполнена между любыми двумя последовательностями, даже если он не является предком другой стороны, если вы знаете, общая длина филиала между ними. Асимптотических свойств P я J (T) таковы, что Матрица перехода может быть вычислена по скорости матрицы и равновесия база частот P (T) = E Q T. Так какQ является матрица, это матрица экспоненциальной и аппроксимируется рядом Тейлора расширение Если Q является диагонализуемы, экспоненциальный можно вычислить прямо: пусть где (λ I) собственные значения Q, каждый повторяются в соответствии с его кратность. Тогда где Время обратимость (или стационарности) ограничение Π Q = 0, потому что строки были определены в сумме до нуля, а общая база частоты не должны систематически переход от Π. Это равносильно тому, Π P (T) = Π для всех T. [Править]GTR: Общая время обратимоГТП является наиболее общим нейтральным, независимым, конечное-сайтов, время обратимо-модели возможно.Она была впервые описана в общем виде Симона Tavare в 1986 году. [7] GTR параметры состоят из вектором частот щелочное равновесие, Π = (π 1, π 2, π 3, π 4), что дает частоту, на которой каждая базовая происходит на каждом участке, и скорость матрица Таким образом, ОТО (для четырех символов государства, как это часто бывает в Филогенетика, а именно при работе с ДНК или РНК данные) требует 6 замещение параметрами скорости, а также 4 равновесных параметров базовой частоты. С 4 частотных параметров должны сумма к 1, на самом деле только 3 свободных параметров частоты. Это обычно дополнительно сокращено до 8 плюс параметры μ, общее число замен в единицу времени.При измерении времени в замен (μ = 1), только 8 свободных параметров остается. В общем, для вычисления количества параметров, вы подсчитать количество записей выше диагонали в матрице, т.е. для N значений за чертой сайта Например, для последовательности аминокислот (есть 20 "стандарт" аминокислоты, составляющие белки), вы обнаружите, есть 208 параметрам. Однако при изучении кодирующих областей генома, это более общие для работы с моделью замещение кодона (кодон три базы и кодов для одной аминокислоты в белке). Есть 4 3 = 64кодона, в результате чего в 2078 свободных параметров, но когда ставки для переходов между кодонов, которые отличаются более чем на одну базовую считаются равными нулю, то есть только [Править]Механистическое против эмпирических моделейОсновное отличие моделей эволюционного сколько параметров оценивается каждый раз для набора данных на стадии рассмотрения и сколько из них оценивается один раз на большом наборе данных. Механистическое модели описывают все замещения в зависимости от ряда параметров, которые оцениваются для каждого набора данных проанализированы, желательно с использованием максимального правдоподобия. Это имеет то преимущество, что эта модель может быть приспособлен к особенностям конкретного набора данных (например, различные предубеждения в состав ДНК). Проблемы могут возникнуть, когда используется слишком много параметров, особенно если они могут компенсировать друг друга. Тогда это часто бывает, что набор данных слишком мало для получения достаточной информации, чтобы оценить все параметры точно. Эмпирических моделей, созданных с помощью оценки многим параметрам (как правило, все записи скорости матрицы и характер частоты, см. выше модель ОТО) с большим набором данных. Эти параметры затем фиксируется и будет использоваться для каждого набора данных. Это имеет то преимущество, что эти параметры могут быть оценены более точно. Как правило, это не представляется возможным оценить все элементы матрицы от замещения текущего набора данных только. С другой стороны, предполагаемые параметры могут быть слишком общими и не соответствуют конкретному набору данных достаточно хорошо. При больших масштабах секвенирование генома все еще производят очень больших количеств ДНК и белковых последовательностей, есть достаточно данных для создания эмпирических моделей с любым числом параметров. Из-за проблем, упомянутых выше, эти два подхода, часто сочетаются, по оценке большинства параметров сразу на больших масштабах данные, а некоторые оставшиеся параметры затем корректируются с данными, на стадии рассмотрения. В следующих разделах дается обзор различных подходов, принятых для ДНК, белка или кодон основе моделей. [Править]моделей ДНК замещенияОсновная статья: Модель ДНК, эволюция для более формальных описаний ДНК моделей. Модели развития ДНК была впервые предложена в 1969 году Джукс и Кантора [8], при равном ставкам перехода, а также равные частоты равновесия во всех базах. В 1980 году Кимура [9] представила модель с двумя параметрами: один для переходного периода и одного для скорости перевала и в 1981 году, Felsenstein [10]сделал модель, в которой соответствует ставка замещения к равновесной частоты целевой нуклеотид. Хасэгава, Kishino и Яно (HKY) [11] объединил два последних моделей шести параметров модели. В 1990-х годов, модели похожи на HKY были разработаны и уточнены некоторые исследователи (например, [12] и [13]). Для моделей ДНК замещения, в основном механистической модели (как описано выше) заняты. Небольшое количество параметров для оценки делает это возможным, но и ДНК часто оптимизированы для конкретных целей (например, быстро выражения или стабильности) в зависимости от организма и тип гена, что делает необходимым, чтобы настроить модель на эти обстоятельства. [Править]Модели аминокислотных заменДля многих анализов, особенно для большой эволюционный расстояния, эволюция смоделированный на амино уровня кислоты. Поскольку не все ДНК замещения также изменить закодированы аминокислоты, информация не будет потеряна при взгляде на аминокислоты вместо нуклеотидных оснований. Однако ряд преимуществ, говорят в пользу использования информации амино кислоты: ДНК является гораздо более склонны показыватькомпозиционную предвзятость, чем аминокислоты, не все позиции в ДНК развиваться с той же скоростью (Non-синонимами мутации чаще стали зафиксированные в населения, чем те синонимы), но, вероятно, самое главное, из-за этих быстро меняющихся позиций и ограниченный размер алфавита (возможно только четыре государства), ДНК гораздо больше страдает от задней замен, что затрудняет точную оценку большие расстояния. В отличие от ДНК моделями, амино-кислот моделях традиционно эмпирических моделей. Они были первыми в 1970-х Dayhoff с сотрудниками [14], по оценке коэффициент замещения от белка группировок, по крайней мере 85% идентичность. Это минимуму вероятность наблюдения несколько замен на сайте. С оценками матрицу курс, были получены серия замена матрицы вероятностей, известный под такими именами, как PAM 250. Dayhoff модель была использована для оценки значимости результатов поиска гомологии, но и для филогенетического анализа. Dayhoff PAM матрицы были основаны на относительно небольшое число группировок (так как больше не было на тот момент), но в 1990, Нью-матрицы были рассчитаны с использованием почти такой же методологии, но основанные на больших базах данных белков доступно, то ([15] [ 16], причем последняя известная как "JTT" матрицы "). [Править]Ссылки
|
Систематика > Деревья >