vlkamov: Рембрандт. Автопортрет с широко открытыми глазами. (Default)
vlkamov ([personal profile] vlkamov) wrote2023-10-22 08:39 pm

Опровергаем Котельникова

Идет звукозапись. Пианист сороковой раз ошибается. Звукорежиссер говорит ему: "Вы сыграйте пожалуйста гамму, остальное я сам нарежу"

Ныне много народу ушибленных на голову попперной фальсификацией и т.п. Они до сих пор уверены, что великий еврейский ученый Эйнштейн "опроверг" хоть и великого же, но Ньютона ...

Конечно теорему Котельникова, который в англоязычной прессе публиковался под псевдонимом "Найквист-Шеннон" :-)
Теорема Котельникова гласит о том, что непрерывный сигнал с ограниченным спектром можно точно восстановить по его дискретным отсчётам, если они были взяты с частотой дискретизации, превышающего максимальную частоту сигнала минимум в два раза.

я тут не опровергаю, это у меня шутки такие. Это - теорема, она ДОКАЗАНА. А если вышеупомянутые ниспровергатели имеют свое "мнение", так пусть засунут его себе в ... ухо (пост про звук же :-). Но уточнить, о чем собственно речь, границы применимости нужно и полезно.

Возьмем не утративший популярности формат компакт-диска

( http://danalex.ru/sample_rate_bit_depth )

Ходит слух, что вице-президент Sony Н.Ога выбрал длительность звучания по 9-й симфонии Бетховена – 74 минуты. Частота дискретизации была взята 44100 Гц для сигнала как бы по Котельникову до 22.05 кГц - выше чем верхний предел у лучших слухачей. Бетховен с его тугоухостью тут ни при чем. Каждые 1/44100 сек в ЦАП уходит пара (стерео же) 16-битных отсчетов, итого по 700 кбит/с на канал

16-битное целое со знаком лежит в пределах от -32768 до +32768. Это самый пик, выше технически быть не может, но не будем бросаться в крайности. Пусть наш сигнал состоит из 1000 всего лишь синусоид (самый информационно бедный звук) амплитудами от 2000 до 12000 и звучит в течение той же секунды (нота 1/4). Частоты через 5 Гц от 5 до 10 кГц (это ниже 22.05, не так ли ?). Как ни крути, а 1000*(12000-2000)/2 = 5 млн раскладов в секунду.

Но позвольте ! А теорема !? А вот...

Дело в том, что дискретные отсчеты в теореме дискретны лишь во времени, а величина их предполагается, что передается с абсолютной точностью, т.е. бесконечно длинные числа. Только в таком виде можно можно точно восстановить любой сигнал потому что в бесконечно длинные числа можно натолкать любое количество информации. В теореме неявно использован канал с бесконечной полосой пропускания ;-)

44100х16 с его 700 кбит/с был хорош, если испытывать его по аналоговым тестам. А именно: 1 кГц синусоида самой большой амплитуды, но это так себе музыка. Если же симфонический оркестр играет ту 9ю симфонию всем составом - tutti - сотня инструментов. Даже одинаковые инструменты звучат несинхронно и чуть-чуть разным тоном со своим набором гармоник - вот вам и 1000 синусоид с разными частотами, амплитудами и фазами. И у каждой своя динамика - тоже информация. Причем тарелочки, барабаны и т.п. имеют чуть ли не сплошной спектр, да и тональные тоже пошумливают, постукивают, позвякивают ("ударили в смычки").

А хор ! Я не встречал хоровой записи, в которой не слышал бы артефакты. На Ютубе выкладывают подборки как бы качественных записей для тестирования аудиофильской акустики. В общем да, приятные, и что характерно - либо немногочисленный инструментал, либо соло вокал с лапидарным акомпанементом.

В общем, не помогает Котельников, потери неизбежны. Для получения реально хорошего метода цифровой звукозаписи, надо плясать не от этой теоремы, а от восприятия звука слушателем, что можно отбросить, а что нельзя. А пока тупо наращивают частоту дискретизации - 48, 96, 192 кГц и разрядность - 24, 32. Где-то в ход пошли числа с плавающей запятой ...

Post a comment in response:

This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

If you are unable to use this captcha for any reason, please contact us by email at support@dreamwidth.org