Наглядно про качество звука.

На днях решил выяснить сильно ли влияет частота дискретизации на качество. И можно ли увидеть это визуально? Как известно в основе преобразования Фурье (ПФ) лежит чрезвычайно простая, но исключительно удачная идея – почти любую периодическую функцию можно представить суммой отдельных гармонических составляющих (синусоид и косинусоид с различными амплитудами A, периодами Т и, следовательно, частотами ?).

Но при вычислении Дискретного преобразования Фурье (ДПФ) с помощью компьютера всегда имеют дело с массивом дискретных отсчётов (конечная выборка). При этом вынужденно предполагают, что этот массив содержит один или несколько периодов обрабатываемого сигнала g(t) . Влияние параметров записи вроде разрядности и частоты дискретизации конечно есть, но вот насколько сильное. Для того чтобы это узнать остается только поставить эксперимент.Сначала я сгенерировал простейшую волну - синусоиду. Взглянуть в на то, с чего начинается вся современная электронная музыка можно используя функцию аудиоредактора Adobe Audition - Generate->Tones. Параметры выбрал такие : амплитуда -6дБ и частота 440Гц без каких либо дополнительных гармоник, и самое главное параметры аудио - 44100Гц/16бит. И вот что получилось.

Sin Wave.

Sin Wave

Выглядит нормально, больше сказать нечего. Но это базовая функция. Попробуем пилу.

Saw Wave

Saw Wave

Теперь отлично видно, что график функции пилы как-будто приближается синусами. Если посмотреть, что по этому поводу говорит гугл можно наткнутся на такую статью с кучей формул и умных фраз. В этой статье есть полезный для нас отрывок : “… означает, что каждый резкий пик на какой-либо частоте f в Фурье-спектре функции g(t) “размывается” в функцию sin(pi*T*v)/(pi*T*v) в спектре g(t).” Эта могучая фраза сопровождается рисунком. Пилообразная волноформа естественно имеет резкие пики, на которых возникают искажения и функция “размывается”. Попробуем другую волну и сравним изображения при разных параметрах аудио.

Square Wave (44100/16)

Pure Square low

Тут все искажения становятся заметно сильнее, причем неравномерно, что наверное скорее плюс чем минус, можно сказать что каждый пилообразный сигнал неповторим в в своей дискретности.

Square Wave (192000/32)

Pure Square hi

Вот теперь все ровно, даже зацепится не за что.

Все эти эффекты происходят из-за того, что цифровой сигнал дискретен и по времени и по амплитуде – параметры 44100Hz/16bit/Stereo ( стандарт Audio CD), обозначают, что амплитуда звука записывалась не непрерывно, а “всего” 44100 раза в секунду для каждого канала (L-R), затем эта амплитуда представляется с помощью 16 бит. Почему 44100, а не 3600 и не 60000? Ответ на этот вопрос дает – Теорема Котельникова, буржуи так же называют ее Теорема Найквиста. В трансляции на этот случай звучит она так – максимальная частота дискретного сигнала равна половине частоты дискретизации. Т.е. 44100Гц/2 = 22050Гц , а это с запасом покрывает частотный диапазон человеческого слуха, редко кто слышит звуки даже выше 18000 Гц. Представление амплитуды с помощью 16 бит обеспечивает теоретический динамический диапазон -96 дБ при незначительных шумах, которые носят название - шумы квантования. Этим руководствовались при разработке стандарта CD44100Hz/16bit/Stereo, который на то время был на пределе технологических возможностей и обеспечивал отличное качество записи. Но применения цифровых эффектов при таких параметрах приводит к накоплению ошибок округления, и замутнению звука, поэтому при записи и обработке фонограмм в крутых студиях используют большую точность представления, а затем приводят сигнал к нужным 16bit, подготовка фонограммы для записи на какой-либо носитель и носит название Мастеринг. Необходимость более высокой частоты дискредитации возникает, еще и из-за слишком совершенного слуха человека, который анализирует изменения колебательных процессов на пороге слуха, под воздействием более высоких частот, которые присутствуют всегда у живых инструментов и в природе.

Tags: , ,


Related Content :
  • Плагин Waves S1 MS-Matrix. Стереоэквализация.
  • FL Studio видео уроки. #002 - Layering снэров.
  • FL Studio видео уроки. #001

  • This entry was posted on Saturday, January 26th, 2008 at 8:36 pm and is filed under Статьи. You can follow any responses to this entry through the RSS 2.0 feed. You can leave a response, or trackback from your own site.

    5 Responses to “Наглядно про качество звука.”

    1. Rackz Says:

      Сделал все (вроде бы) точно так же, в аудишене (2.0, 5306.2) - во втором случае сначала показалось все ровненьким, приблизил - все оказалось таким же.
      я создавал новые файлы, первый - 44.1, 16 бит, второй - 192, 32 бит (флоат)(карточка выше 24х не тянет, есесн), и в них уже генерил волны - т.к. в окне самой генерации дискретизации нет.
      на всякий проверял во frequency view - в обоих случаях спектр жирный и полный (что странно, учитывая что идет все от 440 гц , а доходит до 96 кгц)
      что я делаю не так?

    2. Rackz Says:

      ааа, вроде дошло. при большей дискретизации у нас больше точек-фреймов описания волны. Волна идет синусом по такому же количеству точек, что от общего числа составляет меньшую часть - я просто приближаал до этих точек, и на том уровне все казалось одинаковым.

    3. exr Says:

      Точно =) Ну и еще хотелось бы добавить, что не стоит думать, что это большая разница в качестве, это небольшой процент, остальное - это техника сведения. Ну естественно, если появится возможность будем переходить на большую частоту, пока 48кГц/32bit.

    4. Маги Says:

      А ухом, вот интересно, в миксе вы реально слышите разницу при сведении 44100 16 и 48кГц 32 ?
      я не пробовал, но результат интересен

    5. exr Says:

      нет =) 44100 перекрывает весь частотный диапазон слуха человека. Но на границах частотных диапазонов FFT преобразования происходят с небольшими неточностями. Поэтому диапазон расширяют а потом конвертируют в 44100.

    Leave a Reply