Entry tags:
Миллионы обезьян снова в деле
Шерлок Холмс и доктор Ватсон летели на воздушном шаре. Заблудились в тумане, шар отсырел, снизился. Вдруг видят человека.
— Скажите, любезнейший, а где мы находимся? — кричит Ватсон.
Подумав, тот отвечает:
— В гондоле воздушного шара.
Порыв ветра подхватывает шар и путешественники улетают.
— Ох, уж эти математики! — восклицает Холмс.
— Постойте, Холмс, но как вы догадались?
— Это элементарно, Ватсон! Он ответил подумав и дал совершенно верный, но совершенно бесполезный ответ.
https://habr.com/ru/articles/421763/
- статья про сложность по Колмогорову и вообще ... Например парадокс интересных чисел.
Ну это кому как, многим числа вообще неинтересны.
Вот
сложность строки определяется длиной наикратчайшей компьютерной программы, способной её выдать
Например цепочка из 10000 единиц имеет сложность всего на 3..4 больше чем цепочка из 1000 единиц - доп.цифра в счетчике цикла. А вот случайные последовательности имеют сложность больше своей длины:
print "x,;qwfup497rj;qlwkjeDfHhy8[eflk" ;
Реально случайные, т.к. существуют весьма компактные генераторы псевдослучайных последовательностей.
И далее весьма сомнительное на первый взгляд утверждение
компьютер, способный просто вычислить Колмогоровскую сложность любой строки... создать невозможно! Пусть современные компьютеры и весьма мощны, эта задача невыполнима. Таково содержание одной из глубочайших теорем математической логики. Теорема, по сути, говорит, что Колмогоровскую сложность строки невозможно вычислить.
Да ну ! Я уже показывал, что обезъян, сочиняющих романы нужно не так уж и много. Здесь не то же ли самое ?
Программы, сиречь алгоритмы - это все же последовательность битов. Конечно, не каждая цепочка из 1 и 0 будет работать корректно. Простым, хотя и долгим, перебором можно найти все последовательности 0 и 1, печатающее данное число, и выбрать среди них самую короткую.
Но в разговоре с математиками держите ухо востро, см. эпиграф - подобрать можно, вычислить нельзя. Т.е. пресловутый миллион обезьян может не только романы Толстого, но алгоритмы набивать - грязная работа. Под вычислениями академик чистой математики понимал существенно, специальным образом зауженный набор действий.
Update
2.2. Понятие уникальности контента будет пересмотрено. Контенту будет присваиваться хэш смыслов и хэш форматирования. То есть, если текст на пять экранов может быть (без потери смысла) сведён к двум фразам — он и будет рассматриваться как эти две фразы, не более