egovoru: (Default)
[personal profile] egovoru

Много лет я пользуюсь сервером Датского технического университета, позволяющего предсказывать трансмембранные альфа-спирали в аминокислотных последовательностях белков, используя скрытые марковские модели. Мне и близко не хватает образования, чтобы понять, как это работает, но азы излагает Джордан Элленберг в своей книжке, посвященной прикладной математике (уважаемый [livejournal.com profile] mynine подсказал, что есть и русский перевод). Сам Андрей Андреевич Марков парадоксальным образом презирал прикладные исследования и считал, что, например, Карл Пирсон, основатель математической статистики, не сделал ничего, заслуживающего упоминания :)


«Неистовый Андрей», как окрестили его российские газеты, опубликовал в них более 20 писем по волновавшим его общественным вопросам. Самый громкий скандал разразился в 1912 году, когда Марков обратился в Священный Синод с просьбой... отлучить его от Церкви, в знак протеста против отлучения Льва Толстого несколькими годами раньше. Протестовал он и против исключения Горького из Академии наук, а также против присвоения звания почетного академика членам царской фамилии, никак иначе себя не проявившим.

Судя по всему, знаменитые марковские цепи тоже родились из публичного спора, который их автор затеял с другим академиком, ультра-консервативным Павлом Алексеевичем Некрасовым. Тот попытался прилечь «закон больших чисел» для доказательства постулируемой христианством свободы воли. По этому закону, большая совокупность независимых индивидуальных событий (бросаний монетки) дает предсказуемый средний результат. А раз так, провозгласил Некрасов, то из предсказуемого поведения толпы следует, что составляющие ее люди действуют независимо друг от друга, совершая свой собственный выбор.

Логическая ошибка этого утверждения видна невооруженным глазом: eсли всякий раз после поедания гуляша у меня начинается изжога, то это еще не значит, что любая моя изжога – результат поедания гуляша. Марков нашел контрпример, опровергающий рассуждения Некрасова – последовательность зависимых друг от друга переменных, тем не менее дающую предсказуемый результат. А цепью ее называют потому, что каждая переменная зависит только от предыдущей в последовательности, а не от всей своей предыстории.


«Неистовый» Андрей Марков с женой Марией
за своим рабочим столом в начале 20-го века
(фото из биографической статьи Гелия Башарина с соавт.,
из которой, кажется, и Элленберг почерпнул свои сведения :)

Несмотря на презрение к прикладной математике, Марков опробовал свои цепи, анализируя русскую классику. Простой вопрос: какова вероятность того, что за гласной буквой в тексте будет следовать тоже гласная? Оказывается, это сильно зависит от конкретного произведения: для «Евгения Онегина» эта вероятность – только 12.8%, а вот для «Детских годов Багрова-внука» – аж целых 55.2%! (Похоже, Аксаков злоупотреблял прилагательными вроде «длинношеее» :)


Иллюстрация из книжки Джордана Элленберга, схематически представляющая марковские цепи для двух произведений классической русской литературы: наверху – Пушкин, внизу – Аксаков

Не кто иной, как Клод Шеннон первым догадался, что марковские цепи можно использовать не только для анализа, но и для создания текстов. И все заверте... приведя, в конечном счете, к появлению ChatGPT :)

Спасибо уважаемой [livejournal.com profile] zlata_gl за информацию о книжке Элленберга – там есть еще много интересного!

If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

Profile

egovoru: (Default)
egovoru

January 2026

S M T W T F S
    123
456 78910
111213 14151617
18192021222324
25262728293031

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 15th, 2026 07:51 am
Powered by Dreamwidth Studios