egovoru: (Default)
[personal profile] egovoru

Сколько информации содержит молекула ДНК, состоящая из 10 нуклеотидов? Большинство из вас, вероятно, ответит, воспользовавшись формулой Шеннона h(E) = -log2P{E}: 20 бит. Но я думаю, этот ответ неверен, и вот почему.


Двадцать бит содержит не сама молекула ДНК, а последовательность из 10 символов четырехбуквенного алфавита, которой мы подменяем молекулу ДНК, производя эти вычисления. Но ведь ту же молекулу ДНК можно представить и по-другому: например, как последовательность чисел – пространственных координат всех составляющих ее атомов, плюс буквенные обозначения химических элементов. Если мы подсчитаем, сколько информации содержит такая запись (а именно так и строят структурные модели молекул), то получим число, существенно большее, чем 20 бит. Теоретически можно представить себе и квантово-механическое описание всех составляющих молекулу частиц, хотя пока мы и не умеем этого делать для молекул такого размера – и эта запись будет содержать еще больше информации.

Не означает ли это, что понятие «количество информации» вообще не имеет смысла для физических объектов, а применимо только к их символьным обозначениям? Ведь прежде чем измерять информацию как вероятность выбора одного варианта из многих, необходимо разметить пространство возможностей.

На ту же мысль наводит и отсутствие прибора, которым можно было бы измерить информационное содержание физического объекта – в отличие от, например, температуры. В противном же случае приходится выдумывать такие несуразности, как отдельная «органическая информация» :)


Leo Bear-McGuinness рассказывает о планах использования ДНК
для хранения произведенных человечеством текстов

Спасибо уважаемому [livejournal.com profile] mns2012 за ссылку на статью Барбиери.

Page 1 of 6 << [1] [2] [3] [4] [5] [6] >>

Date: 2018-07-11 04:34 pm (UTC)
From: [identity profile] affidavid.livejournal.com
Нет, вычисления вполне годятся, если мы используем ДНК для кодировки каких-то сообщений (про это довольно много статей). Разумеется, это не имеет никакого отношения к биологической роли ДНК, там все совершенно по-другому.

Date: 2018-07-11 05:07 pm (UTC)
From: [identity profile] evgeniirudnyi.livejournal.com
Физики нашли по этому поводу крайне простое решение. У них в настоящее время информация вселенной сохраняется.

Date: 2018-07-11 05:35 pm (UTC)
From: [identity profile] marigranula.livejournal.com
Информацонное содержание чего либо само по себе вряд ли имеет какой-либо смысл. Как в случае и с близким к информации понятию энтропии. Какой-либо смысл имеет говорить не об абсолютном значении энтропии, а об разнице между энтропиями двух состояний. В случае с информацией, обьем информации зависит и от носителя информации и от взаимодействующей с ней системой (например, прибором). Если у нас например есть синтезатор ДНК, то на вопрос "Сколько бит нужно, чтобы синтезировать ДНК из 10 оснований," ответ - 20 бит. А вот если у нас есть прибор синтезирующий ДНК или из С14 или из С13, то нам потребуется уже 30 бит. Но при этом стандартный анализатор ДНК все равно будет выдавать по 2 бита на основание для нашей последовательности. А вот если мы приделаем к анализатору масс-спектрометр, то он уже будет выдаст 30 бит. А если мы добудем atomic force микроскоп, то будем определять положение нуклеотидов, и информации будет ещё больше. Я к тому, что тут прям по анекдоту:
-А правда, что в Одессе всегда отвечают вопросом на вопрос?
-А почему вы спрашиваете?
Так и тут, на вопрос "сколько информации содержится в ДНК" единственный коректный ответ "а почему вы спрашиваете?" . Что вы собираетесь с этой ДНК делать? С помощью каких приборов? От этого все зависит.

Date: 2018-07-11 05:56 pm (UTC)
From: [identity profile] a-gorb.livejournal.com
”Большинство из вас, вероятно, ответит, воспользовавшись формулой Шеннона”
Как во всякой формуле, сначала надо более-менее понять, к чему она относится. (Например, формула 2+2=4 не всегда является верной, как показал в своей диссертации Менделеев, 2 литра воды + 2 литра спирта = 3,86 литров напитка.) Так и здесь. Говоря о информации, Шеннон начинает со следующего:
Система связи по существу состоит из пяти частей:
Источник информации – создает сообщение
Передатчик – перерабатывает в некий сигнал
Канал передачи
Приемник – восстанавливает сообщение по сигналу
Адресат.

Date: 2018-07-11 10:55 pm (UTC)
From: [identity profile] egovoru.livejournal.com
Конечно, если мы хотим использовать ДНК для записи некоего сообщения, как показано в этом видео, то вопрос, сколько ДНК нужно, чтобы закодировать его, вполне осмысленный. В этом случае мы заранее договариваемся, что будем использовать разные нуклеотиды для передачи четырех разных символов (а можно задействовать и только два нуклеотида для более привычного бинарного кода или изобрести какой-то более сложный код для передачи, скажем, всех букв алфавита). Эта ситуация ничем не отличается от той, когда мы используем лампы или транзисторы для той же цели.

Меня смущает не это, а разговоры о том, что, дескать, такой-то физический объект "содержит столько-то бит информации". Мне кажется, подобные утверждения начисто лишены смысла. А Вы что думаете?

Date: 2018-07-11 10:57 pm (UTC)
From: [identity profile] egovoru.livejournal.com
В том-то и беда, что мне совершенно непонятно, как можно говорить об "информации вселенной" или даже атома - и вообще любого физического объекта. А Вы понимаете, что именно при этом имеется в виду? Как именно предполагается подсчитывать количество информации, содержащееся в том или ином физическом объекте?

Date: 2018-07-11 11:22 pm (UTC)
From: [identity profile] egovoru.livejournal.com
"Информацонное содержание чего либо само по себе вряд ли имеет какой-либо смысл"

Если мы имеем дело с последовательностью символов, то говорить о ее информационном содержании очень даже можно - см. формулу Шеннона. Иными словами, количество информации - это отрицательный логарифм вероятности выпадения именно этой последовательности символов среди всех, которые можно составить из данного алфавита (проще говоря, величина, обратная числу всех возможных последовательностей). Но как определить количество информации, содержащееся в физическом объекте?

"Сколько бит нужно, чтобы синтезировать ДНК из 10 оснований," ответ - 20 бит"

Верно, но, заметьте, это ведь ответ на вопрос, обратный тому, какой я задала в посте :) Действительно, синезируя ДНК, мы заранее договариваемся, что букве А в заданной нам последовательности символов будет соответствовать аденин в создаваемой молекуле, букве Т - тимин и т.д.

"на вопрос "сколько информации содержится в ДНК" единственный коректный ответ "а почему вы спрашиваете?"

Да, именно об этом я и говорю. А между тем, постоянно попадаются суждения типа "такой-то физический объект содержит столько-то информации" - или даже попытки подсчитать информационное содержание Вселенной (https://www.researchgate.net/profile/Aleksandr_Bukalov/publication/289779624_Antropo-cosmic_resonance_coincidence_of_dynamic_values_and_constants_in_the_present_epoch_and_generalization_of_the_Antropic_Principle/links/5692908108aec14fa55d7f19/Antropo-cosmic-resonance-coincidence-of-dynamic-values-and-constants-in-the-present-epoch-and-generalization-of-the-Antropic-Principle.pdf)! Мне кажется, все это начисто лишено смысла, или нет?

Date: 2018-07-11 11:28 pm (UTC)
From: [identity profile] egovoru.livejournal.com
К Шеннону-то нет никаких претензий: его формула совершенно четко определяет способ подсчета количества информации, содержащейся в данном сообщении (оцифрованном сигнале) - иными словами, в данной последовательности символов. Но как приложить эту формулу к физическим телам, которые ведь вовсе не представляют собой последовательность символов? А между тем, таки сплошь и рядом прилагают и даже говорят об "информационном содержании Вселенной" :)

Date: 2018-07-12 01:09 am (UTC)
From: [identity profile] affidavid.livejournal.com
Ну биты это это всегда абстракция - когда-то полезная, когда-то нет. В биологии очень не полезная, потому как в любом организме на много порядков больше информации, чем в его ДНК.

Date: 2018-07-12 03:18 am (UTC)
From: [identity profile] riftsh.livejournal.com
> Если мы подсчитаем, сколько информации содержит такая запись (а именно так и строят структурные модели молекул), то получим число, существенно большее, чем 20 бит.

Это не обязательно так. Для иллюстрации правильнее рассматривать белки, потому что у ДНК структура вообще простая. "Последовательное" информационное содержание белка из 100 аминокислот - 600 бит. Теоретически возможное число конформаций такого белка в приближении Левинталя (3 стабильные конформации на торсионный угол) - 3^198 (мы знаем, что это число на десятки порядков больше реального пространства конформационного поиска, см. парадокс Левинталя). И вот это вот сильно завышенное "структурное" информационное содержание - log2(3^198)=314 бит - прекрасно вписывается в наши 600 бит из последовательности.

Важно иметь ввиду, что такие расчеты предполагают доступность полного структурного "алфавита". Построить белок ab initio обойдется немножко дороже, чем 314 бит ;)

Date: 2018-07-12 05:02 am (UTC)
From: [identity profile] marigranula.livejournal.com
"Если мы имеем дело с последовательностью символов, то говорить о ее информационном содержании очень даже можно"
Последовательность символов - это все таки не физический обьект. Это абстрактное понятие.

"Верно, но, заметьте, это ведь ответ на вопрос, обратный тому, какой я задала в посте"
Я демонстрирую в примере то что на вопрос "сколько информации содержит молекула ДНК, состоящая из 10 нуклеотидов" нужно отвечать, зная еще и аппарат. Можно спросить "сколько информации сможет записать синтезатор в ДНК из 10 нуклеотидов"

" Мне кажется, все это начисто лишено смысла, или нет?"
Э... это зависит более конкретно от того, что автор имеет ввиду. Например, если мы примем модель вселенной как клеточного автомата, то можно. Можно посчитать общее количество клеток во вселенной и умножить на количество возможных состояний каждой клетки.... Принципиально уточнять, что имеется ввиду. Но вообщем, согласен что заявление "такой-то физический объект содержит столько-то информации" бессмысленно.

Date: 2018-07-12 07:37 am (UTC)
From: [identity profile] le-ra.livejournal.com
Погодь, 10 пар нуклеотидов - это максимум три разных аминокислоты в протеинивом эквиваленте (или я уже все забыл?)

Date: 2018-07-12 08:34 am (UTC)
From: [identity profile] 109.livejournal.com

А что смущает-то? Если кодировать аминокислотами, то одно количество бит, а если атомами – то другое. Вот если я спрошу, сколько бит можно закодировать числом от 0 до 255, вы же правильно ответите? А если добавить, что записывать число можно разноцветными фломастерами? А если после каждой цифры можно точку ставить или не ставить?

Date: 2018-07-12 09:53 am (UTC)
mns2012: (Default)
From: [personal profile] mns2012
Посмотрите хорошую статью немецкого специалиста Хуберта Йоки.

Теория Шеннона не отражает смысловой аспект сообщений.

Функциональная информация - это минус лог. отношения числа функциональных строк (доставляющих заданный уровень конкретной биофункции f) к числу всех возможных строк длины не более заданной. Это объективная величина (понятно, с учетом стандартных допущений теории информации).

По поводу Вашего недоумения думаю, что никаких нестыковок быть не должно: нужно смотреть в каждом методе, какие допущения используются. Если все допущения привести "к общему знаменателю", то разными способами должна получаться примерно одна и та же цифра.

Date: 2018-07-12 10:00 am (UTC)
mns2012: (Default)
From: [personal profile] mns2012
В теории Колмогорова это прилагается через язык описания, обладающий определенными свойствами. Если имеется такой язык, то можно сравнивать программы, производящие строки описания чего-либо (назовем это Х) на данном языке. Длина самой короткой программы, выводящей такую строку, есть по определению колмогоровская сложность Х. Хорошо, что к.с. отображает сложность объекта Х, поскольку доказано, что к.с. практически не зависит от языка описания (константа). Плохо то, что к.с. вычислить невозможно.

Date: 2018-07-12 11:29 am (UTC)
From: [identity profile] egovoru.livejournal.com
"биты это это всегда абстракция"

Амперы или там джоули - это все тоже абстракции; тем не менее, силу тока и энергию всегда можно однозначно измерить и/или рассчитать. А информацию?

Date: 2018-07-12 11:35 am (UTC)
From: [identity profile] egovoru.livejournal.com
"такие расчеты предполагают доступность полного структурного "алфавита"

Вот именно. То есть, эти 314 бит нужны будут нужны в дополнение к 600 (да и то, 600 - это какой-то уж очень коротенький белок). Не говоря уже о том, что тут мы решаем обратную задачу - подсчитываем, сколько информации нам будет нужно, чтобы построить заданный белок. А эта задача предполагает предварительную договоренность о том, как именно мы будем расшифровывать заданную нам информацию, что, очевидно, тоже имеет свое информационное содержание. Вопрос же об информационном содержании физического тела остается неопределенным.

Date: 2018-07-12 11:38 am (UTC)
From: [identity profile] egovoru.livejournal.com
"Последовательность символов - это все таки не физический обьект. Это абстрактное понятие"

Да, я именно это и хочу сказать: похоже, говорить о том, что нечто "содержит столько-то информации" можно только в случае последовательности символов, а не физических тел.

"заявление "такой-то физический объект содержит столько-то информации" бессмысленно"

А между тем, мне все чаще попадаются рассуждения о том, что, дескать, "все состоит из информации" - то есть, если мы будем копать все глубже и глубже, дробить все мельче и мельче, в конечном счете упремся в "голую информацию". Этот взгляд не укладывается у меня в голове.
Edited Date: 2018-07-12 11:40 am (UTC)

Date: 2018-07-12 11:44 am (UTC)
From: [identity profile] egovoru.livejournal.com
Не обязательно - они ведь могут быть и стоп-кодонами, например. Но дело не в том, как последовательность нуклеотидом определяет последовательность аминокислот, а в том, что я не понимаю, в каком смысле говорят об "информационном содержании" физических тел. На мой взгляд, информационное содержание может быть только у нашего описания такого тела, а последнее зависит от контекста.

Date: 2018-07-12 11:46 am (UTC)
From: [identity profile] egovoru.livejournal.com
Вопрос о том, сколько информации можно закодировать таким-то способом, вполне правомочный. Меня смущает правомочность обратного вопроса, сколько информации содержит физический объект. Он кажется мне бессмысленным, потому что ответ на него зависит от контекста.
Edited Date: 2018-07-15 10:17 pm (UTC)

Date: 2018-07-12 11:50 am (UTC)
From: [identity profile] egovoru.livejournal.com
"строки описания чего-либо (назовем это Х) на данном языке"

В этом случае никаких вопросов не возникает, поскольку мы опять же говорим не о физических объектах, а о последовательностях символов. Мне кажется, можно говорить "информационном содержании" только описаний, но не самих физических объектов. А?

Date: 2018-07-12 11:55 am (UTC)
From: [identity profile] egovoru.livejournal.com
"Теория Шеннона не отражает смысловой аспект сообщений"

Верно, но подсчитывать смысл, если я правильно понимаю, никто пока не научился.

Но в данном случае меня занимает не смысл, а невозможность однозначно рассчитать количество даже шенноновской информации для физического объекта. Это количество зависит от контекста, то есть, от того, какой именно последовательностью символов мы представляем данный объект.

Спасибо за отклик и ссылку на статью, но, судя по Вашему о ней посту, автор пишет все же несколько о другом.

Date: 2018-07-12 11:56 am (UTC)
From: [identity profile] marigranula.livejournal.com
"то есть, если мы будем копать все глубже и глубже, дробить все мельче и мельче, в конечном счете упремся в "голую информацию"."
Опять таки, если мы примем, что вселенная - это cellular automata, то так сказать наверное можно.... Не ясно зачем, но можно...

Date: 2018-07-12 11:58 am (UTC)
From: [identity profile] egovoru.livejournal.com
А какие у нас есть основания считать вселенную клеточным автоматом?

Date: 2018-07-12 12:08 pm (UTC)
From: [identity profile] marigranula.livejournal.com
никаких :)
Я просто говорю о том, что человек, поддерживающий модель клеточного автомата, может сказать, что в литре содержится скажем 10^103 бит. Я не говорю сейчас о том, есть ли у него эмпирические доказательств для утверждения что вселенная - клеточный автомат. Но в рамках этой гипотезы - само утверждение о данном количестве информации в данном объеме корректно.
Page 1 of 6 << [1] [2] [3] [4] [5] [6] >>

Profile

egovoru: (Default)
egovoru

April 2026

S M T W T F S
    1234
567 891011
121314 15161718
192021 22232425
2627282930  

Style Credit

Expand Cut Tags

No cut tags
Page generated Apr. 26th, 2026 05:45 am
Powered by Dreamwidth Studios