Кодирование звуковой информации

Автор работы: Пользователь скрыл имя, 22 Апреля 2012 в 14:47, реферат

Краткое описание

Мир наполнен самыми разнообразными звуками: тиканье часов и гул моторов, завывание ветра и шелест листьев, пение птиц и голоса людей. О том, как рождаются звуки и что они собой представляют люди начали догадываться очень давно. Еще древнегреческий философ и ученый - энциклопедист Аристотель, исходя из наблюдений, объяснял природу звука, полагая, что звучащее тело создает попеременное сжатие и разрежение воздуха. Так, колеблющаяся струна то разряжает, то уплотняет воздух, а из-за упругости воздуха эти чередующиеся воздействия передаются дальше в пространство - от слоя к слою, возникают упругие волны. Достигая нашего уха, они воздействуют на барабанные перепонки и вызывают ощущение звука.

Содержание

Введение 3
Кодирование звуковой информации 4
Компьютерное представление звуковой информации4
Аналого-цифровой преобразователь4
одмешивание псевдослучайного сигнала6
2.3. Кодирование оцифрованного звука перед его записью на носитель7
2.4. Цифро-аналоговый преобразователь9
2.5. Теорема Котельникова10
3. Помехоустойчивое и канальное кодирование11
4. Основные звуковые форматы12
5. Цифровые синтезаторы музыкальных звуков14
6. Анализ музыкальных инструментов14
7. Синтез музыкальных звуков17
8. Обработка звука17
Заключение19
Список литературы20

Вложенные файлы: 1 файл

тертычный реферат.docx

— 252.58 Кб (Скачать файл)

     
     
     

     
    1. Цифро-аналоговый преобразователь

     При воспроизведении записанного в  компьютерный файл звука производится преобразование в противоположном  направлении -- из дискретной цифровой формы представления сигнала в непрерывную аналоговую. Для этого существует соответствующий узел компьютерного устройства, который называется ЦАП – цифро-аналоговый преобразователь.

     Процесс реконструкции первоначального  аналогового сигнала по имеющимся  дискретным данным нетривиален, поскольку  никакой информации о форме сигнала  между соседними отсчетами не сохранилось. В разных звуковых картах для восстановления звукового сигнала  могут использоваться различные  способы. Наиболее наглядный и понятный из них является, тот, что по имеющимся соседним точкам рассчитывает некоторую гладкую функцию, проходящую через заданные точки, которая и принимается в качестве формы аналогового сигнала.

     Характеристики  ЦАП:

  • Разрядность – количество различных уровней выходного сигнала, которые ЦАП может воспроизвести. Обычно задается в битах; количество бит есть логарифм по основанию 2 от количества уровней. Например, однобитный ЦАП способен воспроизвести два ( ) уровня, а восьмибитный — 256 ( ) уровней. Разрядность тесно связана с эффективной, которая показывает реальное разрешение, достижимое на данном ЦАП.
  • Максимальная частота дискретизации – максимальная частота, на которой ЦАП может работать, выдавая на выходе корректный результат. В соответствии с теоремой Шенона-Найквиста (известной также как теорема Котельникова), для корректного воспроизведения аналогового сигнала из цифровой формы необходимо, чтобы частота дискретизации была не менее, чем удвоенная максимальная частота в спектре сигнала. Например, для воспроизведения всего слышимого человеком звукового диапазона частот, спектр которого простирается до 20 кГц, необходимо, чтобы звуковой сигнал был дискретизован с частотой не менее 40 кГц. Стандарт Audio CD устанавливает частоту дискретизации звукового сигнала 44,1 кГц; для воспроизведения данного сигнала понадобится ЦАП, способный работать на этой частоте. В дешевых компьютерных звуковых картах частота дискретизации составляет 48 кГц. Сигналы, дискретизованные на других частотах, подвергаются передискретизации до 48 кГц, что частично ухудшает качество сигнала.
  • Монотонность – свойство ЦАП увеличивать аналоговый выходной сигнал при увеличении входного кода.
  • THD+N (суммарные гармонические искажения шум– мера искажений и шума вносимых в сигнал ЦАПом. Выражается в процентах мощности гармоник и шума в выходном сигнале. Важный параметр при малосигнальных применениях ЦАП.
  • Динамический диапазон – соотношение наибольшего и наименьшего сигналов, которые может воспроизвести ЦАП, выражается в децибелах. Данный параметр связан с разрядностью и шумовым порогом.
  • Статические характеристики:
    • DNL (дифференциальная нелинейность) характеризует, насколько приращение аналогового сигнала, полученное при увеличении кода на 1 младший значащий разряд (МЗР), отличается от правильного значения;
    • INL (интегральная нелинейность) характеризует, насколько передаточная характеристика ЦАП отличается от идеальной. Идеальная характеристика строго линейна; INL показывает, насколько напряжение на выходе ЦАП при заданном коде отстоит от линейной характеристики; выражается в МЗР;
    • усиление;
    • смещение.
  • Частотные характеристики:
    • SNDR (отношение сигнал/шум+искажения) характеризует в децибелах отношение мощности выходного сигнала к суммарной мощности шума и гармонических искажений;
    • HDi (коэффициент i-й гармоники) характеризует отношение i-й гармоники к основной гармонике;
    • THD (коэффициент гармонических искажений) – отношение суммарной мощности всех гармоник (кроме первой) к мощности первой гармоники.
 

     Технические возможности современных микросхем  позволяют для реконструкции  формы сигнала производить весьма сложные вычисления. Выпускаются  даже специализированные микропроцессоры, для которых в технической  литературе принято название DSP (Digital Signal Processor) – процессоры цифровой обработки сигналов. 

    1. Теорема Котельникова

     Поскольку дискретные сигналы широко используют в настоящее время при передаче сообщений, а многие реальные сигналы (электрические сигналы при передаче речи, музыки, многих изображений) являются непрерывными, то важно знать: можно  ли непрерывные сигналы представлять с помощью дискретных; можно ли указать условия, при которых такое представление оказывается точным. Ответы на эти вопросы дает доказанная в 1933 г. советским ученым Владимиром Александровичем Котельниковым и названная его именем теорема Котельникова. Эта теорема формируется следующим образом:

     если  непрерывный сигнал имеет спектр, ограниченный частотой Fмакс, то он может быть полностью и однозначно восстановлен по его дискретным отсчетам, взятым через интервалы времени  , т.е. с частотой  , где

Fд – частота дискретизации; Fмакс - максимальная частота спектра сигнала.

     Теорема Котельникова указывает условия, при  которых непрерывный сигнал может  быть точно восстановлен по соответствующему ему сигналу с дискретным временем.

     Реальные  непрерывные сигналы, подлежащие передаче, как правило, имеют спектры, хотя и довольно быстро стремящиеся к  нулю с ростом частоты, но все же неограниченные. Такие сигналы могут быть восстановлены по своим дискретным отсчетам лишь приближенно. Но, если выбрать шаг дискретизации достаточно малым, то можно обеспечить пренебрежимо малое значение ошибки восстановления непрерывного сигнала по его переданным отсчетам в дискретные моменты времени.

     К примеру, Fмакс для телефонного канала составляет 3,4 кГц. Следовательно, сигнал можно передать отдельными значениями, следующими с частотой 6,8 кГц, т.е. в одну секунду должно передаваться 6,8 тысяч отсчетов. Качество передачи речи при этом оказывается удовлетворительным. Увеличение частоты дискретизации сверх указанного значения допустимо и приводит к незначительному повышению точности восстановления телефонного сигнала.

  1. Помехоустойчивое  и канальное кодирование

     Помехоустойчивое кодирование позволяет при воспроизведении сигнала выявить и устранить (или снизить частоту их появления) ошибки чтения с носителя. Для этого при записи к сигналу полученному на выходе АЦП добавляется искусственная избыточность (контрольный бит), которая впоследствии помогает восстановить поврежденный отсчет. В устройствах записи звука обычно используется комбинация из двух или трех помехоустойчивых кодов. Для лучшей защиты от пакетных ошибок также применяется перемежниеКанальное кодированиеслужит для согласования цифровых сигналов с параметрами канала передачи (записи/воспроизведения). К полезному сигналу добавляются вспомогательные данные, которые облегчают последующее декодирование. Это могут быть сигналывременного кода, служебные сигналы, сигналы синхронизации. В устройствах воспроизведения цифровых сигналов канальный декодер выделяет из общего потока данных тактовые сигналы и преобразует поступивший канальный сигнал в цифровой поток данных. После коррекции ошибок сигнал поступает в ЦАП. 

       

  1. Основные  звуковые форматы

     Результаты  дискретизации звуковой информации, как и все остальные компьютерные данные, сохраняются на внешних носителях  в виде файлов. Звуковые файлы могут  иметь различные форматы. Рассмотрим наиболее распространенные из них.

     Формат AU. Этот простой и распространенный формат на системах Sun и NeXT (в последнем случае, правда, файл будет иметь расширение SND). Файл состоит из короткого служебного заголовка (минимум 28 байт), за которым непосредственно следуют звуковые данные. Широко используется в Unix-подобных системах и служит базовым для Java-машины.

     Формат WAVE (WAV). Стандартный формат файлов для хранения звука в системе Windows. Является специальным типом другого, более общего формата RIFF (Resource Interchange File Format); другой разновидностью RIFF служат видеофайлы AVI. Файл RIFF составлен из блоков, некоторые из которых могут, в свою очередь, содержать другие вложенные блоки; перед каждым блоком данных помещается четырех символьный идентификатор и длина. Звуковые файлы WAV, как правило, более просты и имеют только один блок формата и один блок данных. В первом содержится общая информация об оцифрованном звуке (число каналов, частота дискретизации, характер зависимости громкости и т.д.), а во втором – сами числовые данные. Каждый отсчет занимает целое количество байт (например, 2 байта в случае 12-битовых чисел, старшие разряды содержат нули). При стерео записи (запись при которой происходит раскладка звука через два (и более) независимых аудиоканала) числа группируются парами для левого и правого канала соответственно, причем каждая пара образует законченный. Такая, казалось бы, излишняя структурированность позволяет программному обеспечению оптимизировать процесс передачи данных при воспроизведении, но, как в подобных случаях всегда бывает, выигрыш во времени приводит к существенному увеличению размера файла.

     Формат MP3 (MPEG Layer3). Это один из форматов хранения аудио сигнала, позднее утвержденный как часть стандартов сжатого видео. Поскольку произвольные звуковые данные обратимыми методами сжимаются недостаточно хорошо, приходится переходить к методам необратимым: иными словами, базируясь на знаниях о свойствах человеческого слуха, звуковая информация “подправляется” так, чтобы возникшие искажения на слух были незаметны, но полученные данные лучше сжимались традиционными способами. Такое кодирование называется адаптированным и позволяет экономить на наименее значимых с точки зрения восприятия человека деталях звучания. Приемы, применяемые в MP3, сложны и опираются на достаточно сложную математику, но зато обеспечивают очень значительный эффект сжатия звуковой информации. Технология MP3 является, пожалуй, самой во многих бытовых звуковых устройствах, например, плеерах и сотовых телефонах.

     Формат MIDIНазвание MIDесть сокращение от Musical Instrument Digital Interface, т.е. цифровой интерфейс для музыкальных инструментов. Это довольно старый (1983 г.) стандарт, объединяющий разнообразное музыкальное оборудование (синтезаторы, ударные и т.д.). MIDI базируется на пакетах данных, каждый из которых соответствует некоторому событию, в частности, нажатию клавиши или установке режима звучания. Любое событие может одновременно управлять несколькими каналами, каждый из которых относится к определенному оборудованию. Несмотря на свое изначальное предназначение, формат файла стал стандартным для музыкальных данных, которые при желании можно проигрывать с помощью звуковой карты компьютера безо всякого внешнего MIDI-оборудования. Главным преимуществом файлов MIDI является их очень небольшой размер, поскольку это не детальная запись звука, а фактически некоторый расширенный электронный эквивалент традиционной нотной записи. Но это же свойство одновременно является и недостатком: поскольку звук не детализирован, то разное оборудование будет воспроизводить его по-разному, что в принципе может даже заметно исказить изначальный музыкальный замысел.

     Формат MOD. Представляет собой дальнейшее развитие идеологии MIDI-файлов. Известные как “модули программ воспроизведения”, они хранят в себе не только “электронные ноты”, но и образцы оцифрованного звука, которые используются как шаблоны индивидуальных нот. Таким способом достигается однозначность воспроизведения звука. К недостаткам формата следует отнести большие затраты времени при наложении друг на друга шаблонов одновременно звучащих нот. 

  1. Цифровые  синтезаторы музыкальных  звуков

     Информация, которую несет музыкальный звук, рассказывает о высоте (то есть о том, какая нота звучит) и тембре или типе музыкального инструмента, с помощью которого производится звукоизвлечение (генерация звука). Так же, в структуру музыкального звука исполнитель закладывает свою "импрессию", варьируя силу и резкость начала (атаки) и окончания (затухания), громкость, применяя амплитудное и частотное вибрато.

     Как правило, звук начинается с так называемой атаки, быстрого нарастания амплитуды  сигнала. Длительность атаки для  разных музыкальных инструментов варьируется  от единиц до нескольких десятков или  даже сотен миллисекунд. После атаки  начинается поддержка, в течение  которой уровень сигнала примерно постоянен или плавно меняется в  случае применения амплитудного вибрато. Во время поддержки формируется  ощущение высоты звука. Далее идет участок  затухания, уменьшения величины сигнала. Атака, поддержка и затухание  образуют так называемую амплитудную огибающую.

     Спектр  музыкального сигнала состоит из последовательности (по оси частот) узких "колоколов". Причем частоты, соответствующие максимумам (вершинам) "колоколов", примерно кратны основному  тону или "фундаментальной" частоте  музыкального звукового сигнала, под  которой понимается частота, соответствующая  человеческому ощущению высоты звука. 

  1. Анализ  музыкальных инструментов

     Целью анализа музыкальных звуков является изучение их структуры, определение  существенных для восприятия человеческим слухом характеристик и использование  полученных знаний для синтеза правдоподобно  звучащих виртуальных цифровых музыкальных  инструментов.

     Традиционно для анализа сигналов в частотной  области применяется быстрое  преобразование Фурье. Данное преобразование позволяет представить любой  дискретизированный сигнал, состоящий из N отсчетов в виде суммы N гармонических колебаний вида:

     Yk(t)=Ak*sin(2П*Fk*t+Фk),

     где k - номер гармоники, целое число от 0 до N-1; Ak - амплитуда k-й гармоники (расположенные на графике в виде вертикальных линий, как на рис. 3, в порядке возрастания k, они и образуют амплитудный спектр сигнала); Fk - частота k-й гармоники; Фk - фаза k-й гармоники; t - время, равное в моменты дискретизации (взятия отсчетов) сигнала

Информация о работе Кодирование звуковой информации