Два основных подхода к хранению звуковых файлов можно сопоставить с
векторным и растровым способами хранения изображений: это MIDI и подобные
ему форматы, и оцифрованный звук.
В формате MIDI звук генерируется синтезатором, который умеет порождать
звуки различного тембра, высоты, длительности и громкости. Тембры этих
звуков обычно более или менее соответствуют звукам распространенных музыкальных
инструментов. Вместо собственно звука хранится последовательность команд
этого синтезатора. Используя в качестве звуковых примитивов фонемы человеческого
языка, этот подход можно применить и для синтеза речи.
MIDI-файлы имеют малый объем и, при наличии аппаратного синтезатора, не
требуют ресурсов центрального процессора для воспроизведения, поэтому
их часто используют в качестве фонового озвучивания игровых программ и
Web-страниц. К недостаткам этого формата следует отнести тот факт, что
качество его воспроизведения определяется качеством синтезатора, которое
у дешевых звуковых карт оставляет желать лучшего, и то, что далеко не
всякий звук можно воспроизвести таким способом.
Задача преобразования реального звука в MIDI сродни задаче векторизации
растрового изображения и другим задачам распознавания образов, и в общем
виде не разрешима.
Оцифрованный звук, напротив, является результатом простого осуществления
аналого-цифрового преобразования реального звука. Характеристиками такого
звука являются частота дискретизации, разрешение АЦП и количество каналов