Курсовая работа Мультимедиа. Форматы звуковых файлов. Типы и виды графических, текстовых, аудио и видео форматов

Многие необычные форматы попадают в приводимый изготовителем перечень просто потому, что они популярны в стране производителя проигрывателя или даже чипа процессора. В качестве примера можно привести SVCD (Super Video CD), который отличается от своего предшественника VideoCD увеличенным потоком данных и возможностью записи до четырех каналов звукового сопровождения. Видеодиски этого формата практически отсутствуют на российском рынке, но очень широко распространены в Китае.
Положение с музыкальными записями на DVD-Audio и SACD, число релизов на которых весьма ограничено, пока неоднозначно. Для воспроизведения SACD обязательно требуется специальный процессор. Если на DVD-Audio присутствует запись с разрешением 24 бита/96 кГц, то DVD-проигрыватель воспроизведет эту запись, если его преобразователь не хуже. Однако запись с частотой дискретизации 192 кГц такой проигрыватель не поймет: тут тоже потребуется специальный процессор.
Записи HDCD (High Definition Compatible Digital) как высококачественная альтернатива компакт-диску появились раньше DVD-Audio и SACD - еще в 1992 году. Разработчиком была фирма Pacific Microsonics. Идея заключалась в том, что можно использовать пустые места в цифровых словах записи на компакт-диске для размещения дополнительных данных о четырех младших разрядах. Таким образом к стандартным 16 разрядам добавляется еще четыре, что позволяет увеличить динамический диапазон.


У других есть ограничения по числу знаков


Но даже в случае вывода полной информации моделей, которые бы поддерживали кирилличный текст, пока крайне мало


Выбор JPEG-файла из меню сопровождается предварительным показом картинки


По-настоящему мультимедийные проигрыватели сами предлагают выбрать тип файлов

В настоящее время торговый знак HDCD принадлежит Microsoft (в рамках технологии Windows Media), а за декодирование HDCD-записей наряду с другими в проигрывателях отвечают универсальные процессоры. Проигрыватели, способные воспроизводить HDCD-диски, по заверениям производителей, лучше воспроизводят и обычные CD. Это связано с использованием при декодировании HDCD более точных цифровых фильтров, без которых декодирование просто невозможно. Но они работают и при воспроизведении обычных дисков.
Широкое распространение компьютерных технологий и, в первую очередь, интернета привело к появлению в 1992 году формата МР3. Благодаря высокому коэффициенту сжатия и приемлемому качеству звучания он фактически стал стандартом для хранения музыкальных файлов. Конечно, появлялись и другие музыкальные форматы, разработчики которых заявляли, что их формат точно «похоронит» МР3. Такие заявления аргументировались более высоким качеством, меньшим размером файлов, высокой скоростью кодирования и т.д. Однако МР3 уже был. И самое главное - он поддерживался массой программ, аппаратных проигрывателей и кодировщиков, которые в подавляющем большинстве были бесплатными. Сегодня основной конкурент на место лидера в области сжатого звука - это формат WMA (Windows Media Audio) компании Microsoft, который является модифицированной версией приобретенного по лицензии речевого кодека Voxware Audio Codec 4. Для предпоследней версии WMA 8 рекламируется двукратный выигрыш по скорости потока данных. Она, например, позволяет записать музыку на битрейте 64 кбит/с, сравнимую по качеству с файлами МР3 с битрейтом 128 кбит/с. То есть при сопоставимом качестве звучания WMA-файл получается вдвое меньше МР3-файла. Однако утверждать, что при одинаковом объеме WMA-файл будет звучать вдвое лучше, все же нельзя. До последнего времени бытовые проигрыватели позволяли воспроизводить только записи MP3, но в последних моделях все чаще появляется и WMA.
Поскольку оба формата пришли из компьютерной области, не составляет труда сделать на компьютере свою компиляцию и записать сжатую музыку на CD-R/RW или даже записываемый DVD, чтобы затем воспроизвести их на DVD-проигрывателе. Компьютерные корни форматов и интернет-происхождение музыкальных файлов часто не стыкуются с более простыми возможностями DVD-проигрывателей. На CD в среднем умещается до 200 произведений в МР3, а на DVD - более 1000. Здесь необходимо сделать несколько замечаний по поводу возможности воспроизведения музыкальных файлов и удобства навигации по экранному меню DVD-проигрывателей. И если с точки зрения постоянных битрейтов записи практически нет ограничений (обычно поддерживаются значения от 20 до 320 кбит/с), то записи с переменным битрейтом поддерживают далеко не все модели. Простой поиск по дереву каталога в компьютере или по плей-листу виртуального медиаплейера редко полностью реализуется в бытовых проигрывателях. Можно сказать, что наиболее удобным является двухуровневая организация католога: один уровень вложения содержит папки по жанрам или исполнителям, второй - собственно музыкальные файлы. Однако еще встречаются модели, которые не понимают разбиения на папки и вываливают все файлы в порядке их номеров на диске. В этом случае, чтобы добраться до файла в конце второй сотни, придется последовательно перебирать все предыдущие.
Аналогично обстоит дело и с воспроизведением фотографий (файлы JPEG или KodakPhoto CD). Обычно можно выбрать изображение из меню с предварительным просмотром или запустить слайд-шоу, которое может охватывать изображения в пределах диска или только указанной папки. Большинство дисков с МР3, произведенных заводским способом, содержит, кроме музыкальных файлов, еще и изображения (обложки дисков, фото выступлений исполнителей и т.д.), а иногда еще и видео. Компьютер позволяет показывать изображения, когда воспроизводится музыка. Для DVD-проигрывателей это пока недоступно. В некоторых моделях тип воспроизводимых файлов нужно выбирать через меню начальных установок. Последние модели, более дружественные к мультимедийным дискам, сами предлагают после прочтения служебной информации выбрать тип файлов. В качестве примера (фото 5) показано такое меню, которое было одинаково для всех тестировавшихся в редакции последних моделей DVD-проигрывателей с воспроизведением видео в формате MPEG-4 или DviX.
И в заключение - несколько слов о перспективах. Наиболее интересным, что может произойти в ближайшем будущем, - это появление моделей массовых DVD-проигрывателей с возможностью воспроизведения видеозаписей в формате WMV (Windows Media Video), который широко используется для интернет-видео. По крайней мере, сообщения о первых моделях, поддерживающих DviX и WMV9, уже появились: американская V Inc. показала проигрыватель Bravo D3, а датская KiSS Technology анонсировала даже два - DP-600 и DP-608. Подождем серийных образцов.

Мультимедиа технологии. Графические форматы

Мультимедиа (лат. Multum + Medium ) - одновременное использование различных форм представления информации и ее обработки в едином объекте-контейнере.

Например, в одном объекте-контейнере (англ. container ) может содержаться текстовая, аудиальная, графическая и видео информация, а также, возможно, способ интерактивного взаимодействия с ней.

Термин мультимедиа также, зачастую, используется для обозначения носителей информации, позволяющих хранить значительные объемы данных и обеспечивать достаточно быстрый доступ к ним (первыми носителями такого типа были CD - compact disk.

Классификация:

Мультимедиа может быть грубо классифицировано как линейное и нелинейное .

Аналогом линейного способа представления может являться кино. Человек, просматривающий данный документ никаким образом не может повлиять на его вывод.

Нелинейный способ представления информации позволяет человеку участвовать в выводе информации, взаимодействуя каким-либо образом со средством отображения мультимедийных данных. Участие человека в данном процессе также называется «интерактивностью». Такой способ взаимодействия человека и компьютера наиболее полным образом представлен в категориях компьютерных игр. Нелинейный способ представления мультимедийных данных иногда называется «гипермедиа».

В качестве примера линейного и нелинейного способа представления информации, можно рассматривать такую ситуацию, как проведение презентации. Если презентация была записана на пленку и показывается аудитории, то при этом способе донесения информации просматривающие данную презентацию не имеют возможности влиять на докладчика. В случае же живой презентации, аудитория имеет возможность задавать докладчику вопросы и взаимодействовать с ним прочим образом, что позволяет докладчику отходить от темы презентации, например поясняя некоторые термины или более подробно освещая спорные части доклада. Таким образом, живая презентация может быть представлена, как нелинейный(интерактивный) способ подачи информации…

Графические форматы

Графи́ческий форма́т - это способ записи графической информации. Графические форматы файлов предназначены для хранения изображений, таких как фотографии и рисунки.

Графические форматы различаются по виду хранимых данных (растровая, векторная и смешанная формы), по допустимому объему данных, параметрам изображения, хранению палитры, методике сжатия данных (для EGA без сжатия требуется 256К) - DCLZ (Data Compression Lempel-Ziv), LZW (Lempel-Ziv & Welch), по способам организации файла (текстовый, двоичный), структуре файла (с последовательной или ссылочной (индексно-последовательной) структурой) и т.д.

Растровый файл состоит из точек, число которых определяется разрешением, измеряемым обычно в точках на дюйм (dpi) или на сантиметр (dpc). Очень важным фактором, влияющим, с одной стороны, на качество вывода изображения, а с другой - на размер файла, является глубина цвета, т.е. число разрядов, отводимых для хранения информации о трех составляющих (если это цветная картинка) или одной составляющей (для полутонового не цветного изображения). Например, при использовании модели RGB глубина 24 разряда на точку означает, что на каждый цвет (красный, синий, зеленый) отводится по 8 разрядов и поэтому в таком файле может храниться информация о 2^24 = 16,777,216 цветах (Обычно в этом случае говорят о 16 млн. цветов). Очевидно, что даже файлы с низким разрешением содержат в себе тысячи или десятки тысяч точек. Так, растровая картинка размером 1024х768 точек и с 256 цветами занимает 768 Кбайт. Для уменьшения объемов файлов разработаны специальные алгоритмы сжатия графической информации. Именно они и являются основной причиной существования графических форматов.

Векторный способ записи графических данных применяется в системах автоматического проектирования (CAD) и в графических пакетах. В этом случае изображение состоит из простейших элементов (линия, ломаная, кривая Безье, эллипс, прямоугольник и т.д.), для каждого из которых определен ряд атрибутов (например, для замкнутого многоугольника - координаты угловых точек, толщина и цвет контурной линии, тип и цвета заливки и т.д.). Записывается также место объектов на странице и расположение их друг относительно друга (какой из них "лежит" выше, а какой ниже). Векторный формат является доказательством идеи древнегреческих математиков о том, что любую существующую в природе форму можно описать, используя геометрические примитивы и компас.

У каждого метода есть свои преимущества. Растровый позволяет передавать тонкие, едва уловимые детали образов, векторный же лучше всего применять, если оригинал имеет отчетливые геометрические очертания. Векторные файла меньше по объему, зато растровые быстрее вырисовываются на экране дисплея, так как для вывода векторного изображения процессору необходимо произвести множество математических операций. С другой стороны, векторные файлы гораздо проще редактировать.

Существует множество программ-трансляторов, переводящих данные из векторного формата в растровый. Как правило, такая задача решается довольно просто, чего нельзя сказать об обратной операции - преобразовании растрового файла в векторный и даже о переводе одного векторного файла в другой. Векторные алгоритмы записи используют уникальные для каждой фирмы-поставщика математические модели, описывающие элементы изображения.

Ниже описан ряд наиболее распространенных графических форматов.

1. PCX - Простейший растровый формат. Первоначально этот формат использовался в программе PaintBrush фирмы Zsoft, однако в последствии получил широкое распространение среди пакетов редактирования растровых изображений, хотя до сих пор не признан в качестве официального стандарта. К сожалению, в процессе своей эволюции PCX претерпел настолько значительные изменения, что современная версия формата, поддерживающая 24-разрядный цветовой режим, не может использоваться старыми программами. С самого "рождения" формат PCX был ориентирован на существующие видеоадаптеры (сначала EGA, потом VGA) и поэтому является аппаратно-зависимым. В PCX используется схема сжатия данных RLE, позволяющая уменьшать размер файла, например, на 40- 70%, если используется 16 и менее цветов, и на 10- 30% для 256-цветных изображений.

2. BMP - (Windows Bitmap) разрабатывался фирмой Microsoft как совместимый со всеми приложениями Windows. Для приложений в операционной системе OS/2 имеется собственная версия BMP. В формате BMP можно сохранять черно-белые, серые полутоновые, индексные цветные и цветные изображения системы RGB (но не двухцветные или цветные изображения системы CMYK). Недостаток этих графических форматов: большой объем. Следствие - малая пригодность для Internet-публикаций.

3. GIF - поддерживает до 256 цветов, позволяет задавать один из цветов как прозрачный, дает возможность сохранения с чередованием строк (при просмотре сначала выводится каждая 8-я, затем каждая 4-я и т.д. Это позволяет судить об изображении до его полной загрузки). Способен содержать несколько кадров в одном файле с последующей последовательной демонстрацией (т.н. "анимированный GIF"). Уменьшение размера файла достигается удалением из описания палитры неиспользуемых цветов и построчного сжатия данных (записывается количество точек повторяющегося по горизонтали цвета, а не каждая точка с указанием ее цвета). Такой алгоритм дает лучшие результаты для изображений с протяженными по горизонтали однотонными объектами. Для сжатия файла используется высокоэффективный алгоритм Лемпела - Зива - Велча (LZW)

4. TIFF (target image file format) - был разработан специально для использования в приложениях, связанных с компоновкой страницы и направлен на преодоление трудностей, которые возникают при переносе графических файлов с IBM-совместимых компьютеров на Macintosh и обратно. Он поддерживается всеми основными графическими пакетами и пакетами редактирования изображений и читается на многих платформах. Использует сжатие изображения (LZW). Формат TIFF очень удобен, но за это приходится расплачиваться огромными размерами получаемых файлов (например, файл формата А4 в цветовой модели CMYK с разрешением 300 dpi, обычно применяемым для высококачественной печати, имеет размер около 40 Мбайт). Кроме того, существует несколько "диалектов" формата, которые не каждая программа, поддерживающая TIFF, легко "понимает".

5. JPEG - миллионы цветов и оттенков, палитра не настраиваемая, предназначен для представления сложных фотоизображений. Разновидность progressive JPEG позволяет сохранять изображения с выводом за указанное количество шагов (от 3 до 5 в Photoshop"e) - сначала с маленьким разрешением (плохим качеством), на следующих этапах первичное изображение перерисовывается все более качественной картинкой. Анимация или прозрачный цвет форматом не поддерживаются. Уменьшение размера файла достигается сложным математическим алгоритмом удаления информации - чем заказываемое качество ниже, тем коэффициент сжатия больше, файл меньше. Главное, подобрать максимальное сжатие при минимальной потере качества. Последний идентифицирует и отбрасывает данные, которые человеческий глаз не в состоянии увидеть (незначительные изменения в цвете не различаются человеком, тогда как улавливается даже малейшая разница в интенсивности, поэтому JPEG меньше подходит для обработки черно-белых полутоновых изображений), что приводит к существенному уменьшению размера файла. Таким образом, в отличие от метода сжатия LZW или RLE в результате применения технологии JPEG данные теряются навсегда. Так, файл, однажды записанный в формате JPEG, а затем переведенный, скажем, в TIFF, уже не будет тем же, что и оригинал. Наиболее подходящий формат для размещения в Интернете полноцветных изображений. Вероятно, до появления мощных алгоритмов сжатия изображения без потери качества останется ведущим форматом для представления фотографий в Web.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

Multimedia - это подхваченный всеми термин, обозначающий интерактивный инструмент для работы с графикой, анимацией, звуком и видео. Мультимедиа привносит блеск в презентации, живопись и игры, и, кроме того, доставляет удовольствие при обучении. Она превращает компьютер из настольной системы с клавиатурой и монитором в некий «космический аппарат», укомплектованный динамиками, микрофоном, наушниками, джойстиками и компакт-дисками.

1. Что же такое мультимедиа?

программный мультимедиа графика звук

Мультимедиа позволяет работать на компьютере со всеми видами информации, а не только с текстом или обычными рисунками. Мультимедиа - это цифровая информация, имеющая более широкие возможности, чем другие ее виды.

ь Поскольку звуковая и графическая информация записывается в цифровой форме, она может копироваться без потери качества.

ь Цифровая информация может сжиматься до минимума для хранения.

ь Можно записать огромное количество информации на CD-ROM, а сам CD-ROM занимает очень мало места.

ь Интерактивные компьютерные программы, использующие цифровые медиасистемы, являются отличными средствами обучения.

Если вы покупаете компьютер со встроенными средствами мультимедиа или устанавливаете на свой компьютер, то вам необходимо разобраться в многообразии средств мультимедиа, а также познакомиться с существующими способами записи и воспроизведения. Существуют два основных вида систем мультимедиа:

o Системы воспроизведения . Эти системы, как правило включают многоскоростной дисковод CD-ROM, звуковую карту, динамики и видеосистему с относительно высоким разрешением. Не помешает также наличие карты декомпрессии, работающей с цифровой информацией.

o Авторские системы . (системы, используемые для создания файлов систем мультимедиа). Авторские системы, как правило, включают такие компоненты, как микрофоны и видеокамеры для записи звука и съемки видеоизображений. Они также высокоскоростные, емкие жесткие диски, способные хранить и обслуживать большие объемы информации, требующиеся для цифрового видео.

В 80-х годах персональный компьютер состоял из микропроцессора (CPU), клавиатуры, монитора, дисковода и принтера. Все, что вы могли сделать на компьютере, - это работать с текстом. Люди тратили очень много времени, оформляя письма, производя финансовые расчеты и просматривая базы данных.

Но теперь, когда появились такие графические пользовательские интерфейсы, как Windows95/98 (SE)/МЕ/NT/2 k., и значительно более мощные персональные компьютеры, начали появляться приложения, предоставляющие возможность использовать анимационные эффекты, звук и видео. В конце 1980 г. люди начали сочинять музыку на компьютере, комбинируя анимацию и звук, создавая захватывающие мультимедиа-презентации со звуком и движущимися картинками. Оборудование, однако, было дорогим, а результаты часто не оправдывали ожиданий. Windows3.1 и DOS не имели достаточно ресурсов для поддержки систем мультимедиа, поэтому картинки на экране двигались очень медленно.

2. Мультимедиа и Windows 95/9 8 (SE)/МЕ/NT/2k /XP

Благодаря Windows все преобразовалось. Она поддерживает средства значительно улучшающие работу с мультимедиа.

ь Windows95/98 (SE)/МЕ/NT/2k. является 32-разрядной, многозадачной, многопоточной операционной системой. Это означает, что Windows поддерживает выполнение нескольких задач одновременно, проигрывание мультимедиа-презентаций и работу пользователей в диалоговом режиме.

ь При установке Windows автоматически определяет конфигурацию мультимедиа устройств.

ь Приложения Windows поддерживают мультимедиа. Вы можете создавать составные документы, т.е. документы, включающие звук , видео, графику, диаграммы, картинки и другие элементы различных приложений.

ь Windows поддерживает форматы компакт-дисков Sony/Philips CD+ и Kodak PhotoCD, а также позволяет легко запускать программы и проигрывать диски с устройства CD-ROM.

ь Видеостандарт Windows широко поддерживается в компьютерной индустрии. Разработчики мультимедиа-продуктов могут спокойно распространять свою продукцию, зная, что она будет работать под Windows.

ь Мультимедиа-продукты, разработанные для Windows, как правило, являются продуктами высокого качества, так как Windows поддерживает большие видеоокна и 32-разрядная архитектура Windows улучшает прохождение данных.

ь Windows поддерживает интерфейс Sony VISCA. Это означает, что в приложениях вы можете использовать так называемые VCR-кнопки (VCR - английская аббревиатура от Video Cassette Recorder - видеомагнитофон, т.е. кнопки, функционально аналогичные кнопкам перемотки, воспроизведения и другим на аудио- и видеовоспроизводящих устройствах) при проигрывании лазерных дисков.

ь Качество игр в Windows значительно улучшено за счет нового программного графического интерфейса.

ь Windows поддерживает множество различных стандартных промышленных звуковых и видеоустройств компрессии информации при ее записи в файл, а также декомпрессии при воспроизведении (так называемых кодек-устройств). Кодек сокращает объем мультимедиа-файлов и позволяет распространять их в различных форматах.

Наиболее важным средством мультимедиа в последние несколько лет стало видео. Видео вмещает невероятное количество информации, которая может быть сжата перед перенесением ее с одного устройства на другое, например, из видеокамеры на жесткий диск через шину компьютера. Применение технологии сжатия аудио- и видеоинформации позволяет расширить рынок средств мультимедиа.

3. Системы мультимедиа

Дополнительными периферийными устройствами к компьютеру в середине 80-х годов были дисководы, сканеры, принтеры и коммуникационные средства типа модем. В 90-х годах появляется звуковые карты , видео-карты, дисководы CD-ROM и высокоскоростные коммуникационные средства, благодаря которым теперь вы можете связаться с информационной службой, передающей вам мультимедиа по проводам.

Ниже перечислены минимальные требования для запуска мультимедиа под Windows.

ь Процессор Intel 80486 (Для цифровых видеоприложений рекомендуется Pentium).

ь Шина PCI для передачи данных для контроллера диска и видеокарты.

ь Жесткий диск большого объем (от 300 Мбайт). Для высококачественных цифровых видеосистем требуется гигабайты памяти.

ь CD-ROM со скоростью не ниже 4-х с регулировкой звука на передней панели.

ь Звуковая карта , обеспечивающая частоты квантования 11,025; 22,05 и 44,1-кГц для стерео звучания. Также требуется многоголосные и многотембровые устройства, способные воспринимать на входе несколько источников, а на выходе представить стереозвучание.

ь Видеоаппаратуру, поддерживающую высокие разрешения монитора. Microsoft рекомендует для лучшего качества представления видео использовать VESA или PCI видеокарты. В последнее время стали популярны AGP адаптеры.

ь IBM-совместимый аналоговый порт джойстика.

ь MIDI-порт, поддерживающий установленные стандарты для ввода, вывода и передачи данных. Некоторые звуковые карты содержат MIDI-синтезаторы, но в общем случае вы подсоединяетесь к внешнему MIDI-синтезатору, по внешнему виду напоминающему клавиатуру.

MIDI (Musical Instrument Digital Interface - интерфейс цифровых музыкальных инструментов) является стандартом для записи нот и сопутствующей информации, связанной с проигрыванием музыки на электронном музыкальном устройстве. Реальный звук при этом не записывается.

Вышеперечисленные компоненты необходимы для воспроизведения и записи средствами мультимедиа. Однако, если вы хотите сами создавать мультимедиа-клипы, то вам могут потребоваться дополнительная аппаратура.

4. Типы и стандарты мультимедиа

Мультимедиа-информация храниться в виде файлов специального формата, содержащих звук, видеоизображения, или в файлах формата MIDI.

Аудиомедиа (звуковая медиа) хранится, в основном, в двух форматах, WAV и MIDI. Большинство WAV-файлов требует много дискового пространства, но они могут воспроизводиться с помощью любой звуковой карты. MIDI-файлы занимают значительно меньше места на диске, но могут проигрываться только на MIDI-совместимых устройствах. В настоящее время почти все карты способны воспроизводить MIDI-файлы.

Визуальное медиа - это анимационные файлы и видеофайлы.

Анимация. В Windows, если у вас есть соответствующее приложение, вы можете создавать изображения, перемещающиеся по экрану. Не существует стандартного формата анимационного файла, однако многие разработчики одновременно развивают производство как анимационных средств, так и воспроизводящей аппаратуры. Анимация может сопровождаться звуковыми файлами разных форматов.

Видео. Video for Windows - это видеостандарт для Windows. Вы можете записать фильм с видеокамеры или лазерного диска на жесткий диск компьютера и сохранить его как файл в формате AVI либо MPG. Сжатие требуется лишь для высококачественного видео и его эффективного хранения.

5. О звуковой мультимедиа

Приложения для записи и воспроизведения звука были одними из первых известных приложений мультимедиа для персонального компьютера. Добавив звуковую карту, вы сможете записывать сообщение, переданное голосом, сохранять его как файл на диске, переносить его на другой компьютер, где оно также может быть воспроизведено. Вы также можете записывать музыку и звук для компьютерных презентаций.

Существует два способа звукозаписи:

· Цифровая запись , когда реальные звуковые волны записываются и конвертируются в цифровые данные.

· MIDI апись , вообще говоря, является не реальным звуком, а записью нажатий на клавиши или другой операций, выполняемых на синтезаторах или MIDI-совместимых электромузыкальных устройствах. MIDI-файл является электронным эквивалентом игры на фортепиано.

6. Цифровая запись

Звуковая плата преобразует звук на выходе в цифровую информацию путем измерения звука тысячи раз в секунду. Цифровой звук хранится в файлах с расширением WAV. При записи звука аналого-цифровой преобразователь конвертирует звук в цифровые данные. При воспроизведении звука цифроаналоговый преобразователь конвертирует цифровые данные в аналог звуковой волны.

Звук представляет собой вибрации, которые формируют волну с соответствующими амплитудой и периодом, как это показано на рис. 1. Амплитуда выражает высоту волны, или громкость звука. Период - это расстояние между двумя звуковыми волнами. Наконец, частота показывает количество периодов в секунду и измеряется в герцах. Например, сто периодов в секунду - это 100 Гц. Человек может воспринимать звук с частотой от 20 до 20000 Гц, и вся выпускаемая звуковоспроизводящая и звукозаписывающая аппаратура рассчитана на этот диапазон частот.

Измерение звуковой волны

Для того чтобы записать звук и хранить его на цифровом устройстве типа вашего компьютера, производится квантование звука, т.е. разбиение звуковой волны на определенные интервалы по времени. Звуковая волна, показанная на рис. 2, была разбита на 16 интервалов. Если предположить, что продолжительность звуковой волны равна одной секунде, то ее частота квантования - 16 Гц.

Квантование волны при частоте квантования 16 Гц

Как правило, такая низкая частота квантования не используется. Даже цифровой звук с частотой квантования 100 или 1000 Гц не будет распознаваться при воспроизведении. Это происходит потому, что цифровое представление волны в данном случае не сглажено. Фильтрующая аппаратура сглаживает волну, однако наилучшим способом получения качественной цифровой записи является повышение частоты квантования. Следует учесть, что при этом увеличивается объем хранящихся данных, что потребует больше памяти на диске.

Стандартам мультимедиа соответствуют три типа частоты квантования: 11,025; 22,05; 44,1 кГц. Частота квантования зависит от записываемого звука: 11,025 кГц подходит для записи голоса, но для получения высококачественной записи требуется частота квантования 44,1 или 48 кГц. Однако повышение частоты квантования приводит к увеличению размера файла и требуемого пространства на диске для его хранения. Формула для расчета дискового пространства будет приведена ниже, но прежде необходимо разобраться с одной переменной - числом разрядов (бит), используемым для хранения информации о квантовании.

Каждый интервал содержит информацию о малом временном сегменте звука. Количество разрядов для записи каждого интервала определяет точность аппроксимации звуковой волны, однако увеличивает размер файла, в котором хранится цифровой звук. 4-разрядное разбиение на интервалы обеспечивает деление амплитуды звуковой волны по вертикали на 16 уровней, а 8-разрядное разбиение - на 256 уровней. Для высококачественной записи требуется 16-разрядное разбиение на интервалы по амплитуде, которое определяет 65536 уровней амплитуды.

Предшествующее обсуждение касалось сглаженной звуковой волны, но реальная волна не сглажена - она состоит из многих различных частот, которые вместе создают тембр звука. Тембр - это уникальный звук, присущий инструменту. Например, колебания струны и резонатор определяют звучание скрипки (уникальное звучание скрипки Страдивари является результатом добавления ценных веществ в ее полировку). Скрипка производит целый комплекс звуковых волн, как это показано на рис. 3.

Теперь вы видите важность повышения частоты квантования и разрядности звуковой платы при записи звука. Вам необходимо знать не только амплитуду каждого выбранного интервала, но и все, что происходит с волной за единицу времени. Повышение частоты квантования и разрядности звуковой платы обеспечивает качественную запись звука, однако, следует помнить, что это приводит к значительному увеличению дискового пространства, необходимого для хранения записываемого звука. К счастью, если вы записываете голос, то нет необходимости использовать большую частоту квантования и разрядность звуковой платы.

Реальные звуковые волны имеют весьма сложную форму и для получения их высококачественного цифрового представления требуется высокая частота квантования

Ниже приводится формула расчета требуемого дискового пространства для хранения цифрового звука:

на секунду

В табл. 1. приведено требуемое пространство на диске для хранения записи звука продолжительностью одна минута для каждой частоты квантования при разрядности 8 бит. Первая строка в таблице соответствует низкокачественной записи голоса, а последняя строка - стандартам, установленным для цифровых аудиокомпакт-дисков.

Требования по хранению звуковых файлов

Разрядность

Частота квантования

Байт для хранения

0,66 Мбайт/мин

1,32 Мбайт/мин

2,646 Мбайт/мин

5,292 Мбайт/мин

Заметим, что высокая частота квантования и разрядность не требуются, если звук был записан и проигрывается на оборудовании более низкого качества. Например, карманный микрофон записывает звук гораздо более низкого качества, чем запись при частоте квантования 44 кГц. Если у вас высококачественная запись, то для ее воспроизведения соответственно требуется аппаратура высокого качетва.

7. Звук и типы звуковых файлов

Звук - это физическое природное явление, распространяющееся посредством колебаний воздуха и, следовательно, можно сказать, что мы имеем дело только с волновыми характеристиками. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком.
Такая запись именуется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.

Любой звуковой файл можно представить, чтобы Вам было наиболее понятно, как базу данных. Она имеет свою структуру, о параметрах которой указывается обычно вначале файла. Потом идет структурированный список значений по определенным полям. Иногда вместо значений стоят формулы, позволяющие уменьшать размер файла. Данные файлы могут читать только специализированные программы, в которые заложен блок чтения.

РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко (я встречал только в программе 3D Audio). Но РСМ является основополагающей для всех звуковых файлов. Я бы не сказал, что это очень экономный метод для хранения данных на диске, но думаю, что от этого уже никогда точно не уйдешь, причем объемы современных винчестеров уже позволяют не обращать внимания на пару десятков мегабайт.

Изыскания по поводу экономного хранения звуковых данных на диске. Если Вы встречаете данную аббревиатуру, то знайте, что имеете дело с разностным РСМ. В основе данного метода лежит та вполне оправданная идея, что вычисления гораздо более громоздки по сравнению с тем, что можно просто указать значения разности.

Адаптивный DPCM. Согласитесь, что при указании просто значений разности может возникнуть проблема с тем, что есть очень маленькие и очень большие значения. В результате, какие бы супер-точные измерения не были все равно имеет место искажение действительности. Поэтому в адаптивном методе добавлен коэффициэнт масштабируемости.

Самое простое хранилище дискретных даннных. Я бы сказал прямое. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали - это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.

Resource Interchange File Format. Уникальная система хранения любых структурированных данных.

Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga - одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.

Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента. Проще говоря, прошитый в синтезатор сэмпл.

AIF или AIFF

Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.

AIFC или AIFF

Тот же AIFF, только с заданными параметрами сжатия (компрессии).

Опять же та же гонка за экономией места. Структура файла намного проще, чем в wav, но там указан метод кодирования данных. Файлы очень мало «весят», за счет чего получили довольно широкое распространение в Интернете. Чаще всего Вы можете встретить параметры?-Law 8 кГц - моно. Но есть и 16-битные стерео-файлы с частотами 22050 и 44100 Гц. Это звуковой формат предназначен для работы со звуком в рабочих системах SUN, Linux и FreeBCD.

Файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве.

Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Если говорят, что там есть качество, то могу сказать, что там его немного. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для «обычных немузыкальных» людей потери не ощутимы явно.

Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF - процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.

Восьмибитный моно-формат от семейства SoundBlaster. Можно встретить в большом количестве старых программ, использующих звук (не музыкальных).

НСОМ

То же самое, что и VOC (восемь бит, моно), но только для Apple Macintosh.

Стандартный формат U-Law. 8 кГц, 8 бит, моно.

Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.

Бывает двух видов. Один - это тот же AU для SUN и NeXT. Другой - это 8-мибитный моно-файл для РС и Маков с различной частотой дискретизации.

Существуют и другие типы звуковых файлов, но это, скорее всего, файлы различных программ для создания и обработки музыки. В основном, такие файлы читаются только той программой, в которой они были созданы.

8. Компрессия аудиоданных

Мультимедиа-информация состоит из огромного количества цифровых данных, которые необходимо хранить в сжатом виде. Windows включает в себя средства управления компрессией аудио- и видеоизображений, которые работают с одним или более модулями декомпрессии и называются кодеками (от Компрессия и ДЕКомпрессия). Большое количество программных кодеков поставляются с Windows. Когда вы записываете или воспроизводите звук или видеофайл, Windows автоматически использует кодек.

Многие звуковые и видеокарты имеют встроенные аппаратные кодеки. Windows сначала использует аппаратный кодек, поскольку он быстрее и не очень нагружает процессор. Если аппаратный кодек отсутствует, то Windows применяет программные кодеки. Если она не смогла найти кодек, на экране появится сообщение об ошибке, поскольку сжатый файл невозможно распаковать.

Программа управления компрессией аудиоданных (Audio Compression Manager, ACM) в Windows использует следующие кодеки для компрессии / декомпрессии аудиоданных.

· TrueSpeech Сodec . Кодек, ориентированный на голос, разработанный компанией DSP Group. Используйте этот кодек только при сжатии и передачи по сетям или телефонным линиям файлов, содержащих запись голоса. TrueSpeech производит компрессию данных не в реальном времени, в свою очередь, декомпрессия производится в реальном масштабе времени.

· Microsoft GSM Audio Codec . Кодек, производящий компрессию данных монохромных звуковых записей низкого качества в реальном масштабе времени. Используйте этот кодек при записи голосовых сообщений, вставленных в сообщения электронной почты (e-mail). Для записи голосовых сообщений вы можете использовать приложение Фонограф.

· Microsoft CCITT G.711 A-Law and U-Law Codec . Этот кодек обеспечивает совместимость телефонных стандартов в Европе и северной Америке. Он обеспечивает коэффициент сжатия данных 2:1.

· Microsoft ADPCM Codec . Этот кодек обеспечивает компрессию как в реальном, так и не в реальном масштабе времени, последняя используется пользователями авторских систем мультимедиа. Аудиофайлы лучше генерируются кодеком не в реальном времени масштабе времени.

· IMA ADPCM Codec . Этот кодек был рекомендован Interactive Multimedia Association для использования на различных платформах мультимедиа. Он осуществляет компрессию в реальном масштабе времени и подобен кодеку Microsoft ADPCM.

· Microsoft PCM converter . Этот конвертер позволяет проигрывать 16-разрядный звук на 8-разрядной звуковой карте. Вы также можете использовать этот кодек в случае, когда необходимо поддерживать частоту квантования 1 МГц для карты, поддерживающую другую частоту квантования.

9. Программное обеспечение по преобразованию цифровой записи

Существует множество программ-кодеков, разработанных специально для преобразований файлов с цифровой записью. Цель каждой такой программы одна - сжатие звукового файла с наименьшей потерей качества и наибольшей степенью сжатия. У каждой из них свои плюсы и минусы: у одних качество сжатия высоко, однако скорость этого сжатия желает лучшего, другие моментально кодируют но с потерей качества, кто же захочет слушать файл с любимой музыкальной композицией, которая кряхтит, свистит и шуршит как старая дедова пластинка.

Наиболее популярные программы-кодеки приведены ниже.

Voice

Программное обеспечение состоит из четырёх модулей, которые могут работать как на одном компьютере, так и на разных.
Первый модуль, работающий в среде Windows, отвечает за работу с внешней аппаратурой, производит непосредственно запись с телефонной (радио) линии и воспроизведение в телефонную (радио) линию звуковых файлов.

Диалоговое окно программы Voice

Второй программный модуль, отвечающий за сжатие звуковых файлов, использует в свой работе стандартные алгоритмы сжатия Wav-файлов. Используемые алгоритмы сжатия позволяют упаковывать поступающие сообщения до уровня 4Кбайт - 600 байт за секунду. Алгоритмы сжатия можно оперативно изменять в зависимости от требуемой степени сжатия и качества звучания.

Третий программный модуль отвечает за ведение базы данных (добавление разговоров в базу данных и автоматическое удаление из неё по мере их старения). В базе данных информация хранится в течение заданного отрезка времени, после чего она либо архивируется, либо автоматически удаляется.

Последний, четвёртый программный модуль предназначен для работы с базой данных: поиск разговоров, их прослушивание, перезапись и ручное удаление.

Все модули работают в 32х разрядных средах Windows. Всё программное обеспечение одновременно может работать как друг с другом, так и с другими Windows-приложениями.

Mpeg Encoder

Диалоговое окно программы mpeg Encoder

Один недостаток mpeg Encoder - уходит много времени на сжатие файла с цифровой записью. На обработку звукового файла продолжительностью около 3-5 минут уходит порядка 25-40 минут. Но ожидания стоят того - качество не отличается от оригинала.

Программа состоит только из одного диалогового окна, что упрощает работу. Не требуется каких-либо дополнительных знаний в области преобразований цифровой информации и т.п., вы указываете путь к исходящему файлу в поле SOURCE и в поле TARGET конечную папку, в которой будет находиться сжатый файл в формате mp3 (по умолчанию). Задаете частоту квантования, параметры качества - стерео или моно и… вперед! Смело жмем кнопку Encode.

LameBatch

LameBatch - это незатейливая оболочка, написанная с целью упрощения работы с командными строками mp3-кодеров, называющегося LAME от Mark Taylor и компании. Оболочки основана на простом ядре.

Диалоговое окно с параметрами программы LameBatch

Содержит всего две вкладки «Files» и «Settings», в последней вы указываете все нужные вам параметры сжатия.

Основные фишки:

ь Только одно окошко (без всплывающих окон непосредственно кодера).

ь Индивидуальные настройки кодирования каждого файла.

ь Возможность их изменения для других файлов во время кодирования одного.

ь Всяческая информация о ходе процесса.

ь Проверка файлов на допустимость формата.

ь Различные варианты сортировки очереди.

ь Незатейливое прописывание тэгов.

ь Возможность отложить работу на неопределенный срок.

ь Различная настройка папки для результатов.

ь Проверка перезаписи и доступного места.

ь Поддержка Drag and drop.

ь Встраивается в контекстное меню Explorer.

ь Выключение машины по окончании процедуры.

Последняя версия на сегодня это LameBatch 0.99c и выпущена 25 октября. При тестировании использовались LAME 3.35. LameBatch распространяется как халява, поэтому - никаких гарантий.

Список программ и их достоинства, и недостатки можно перечислять очень долго. Программ-кодеков в последнее время разработано много, стоит подключиться к сети Internet, набрать в строке поискового портала «programs&encode&multimedia» как сразу получишь список программ для обработки звуковых и не только файлов.

Заключение

Порассуждаем немного о сжатии звуковых файлов. Для чего это нужно, особо говорить не стоит, упомяну лишь то, что широко распространенные способы сжатия цифровых музыкальных данных в 11-14 раз позволили неимоверно толкнуть вперед программную и «железную» музыкальную индустрию, не говоря уже о том, что с качественной музыкой теперь в Internet проблем, в общем-то, нет. Найти можно практически любую композицию. (На самом деле, конечно же, далеко не любую. Попробуйте поискать что-нибудь нетривиальное - Билли Маккензи, например, или Берни Марсдена, вряд ли у вас что-нибудь получится. Найти можно преимущественно популярную музыку или классику жанра, да и то далеко не всю.

С момента начала своего бурного развития (около двух лет назад) открытая технология сжатия музыкальной (звуковой) информации качественных изменений технологии сжатия не претерпела. Другими словами, многочисленным поклонникам музыки приходится мириться с достаточно емкими файлами, т.к. никаких сдвигов на этом фронте не намечается. Сегодняшние пределы для сжатия без значительной потери качества составляют около 11-12 раз от оригинального размера музыкального файла. Как известно, на компакт-диске со стандартной частотой оцифровки 44 100 Гц (стерео, два байта на одно амплитудное значение) может уместиться до 74 минут звука - примерно по 10 Мбайт на минуту.

При средней длительности музыкальной композиции 4 минуты имеем чистого (несжатого) звука 40 Мбайт. Много. Очень много для Internet. Имея модем со скоростью 33,6 Кбайт/с и полный канал для скачивания (т.е. в идеале - 3,5 Кбайт/с) 40 Мбайт мы получим только через 4-5 часов (обычно эта цифра в 1,5-2 раза больше).

Применяя сжатие музыкального файла без потери его основных характеристик (стерео, частота дискретизации при оцифровке 44 100 Гц, 2 байта на выборку амплитуды), можно добиться уменьшения размера в 11-12 раз. Так что вместо 40 Мбайт получится всего 3,8-3,9 Мбайт. Это уже вполне приемлемо. Можно сжимать еще больше, но тогда ощутимо проигрываем в качестве: отличия от оригинала становятся слышимыми даже не меломану. Называемые здесь пределы - 11 или 12 раз - это уже подобранные и проверенные критерии качество / размер за всю недолгую историю использования программ-сжимателей звуковых файлов.

Литература

1. Том Шелдон. «Windows 95 проще простого» Диалектика. Киев. 1996 г.

2. А. Чижов. «Napster - панацея для MP3-меломана» Фантазия. 1999-2000 г.

Размещено на Allbest.ru

...

Подобные документы

    Понятие мультимедиа как интерактивных систем, обеспечивающих работу с неподвижными изображениями и движущимся видео, анимированной компьютерной графикой, текстом, речью и качественным звуком. Области применения сканера, веб-камеры, лазерной клавиатуры.

    контрольная работа , добавлен 12.01.2012

    Форматы и характеристики цифрового видео: частота кадра, экранное разрешение, глубина цвета, качество изображения. Типовый технологический процесс производства видеокомпонентов для мультимедиа продуктов с использованием программы miroVIDEO Capture.

    лекция , добавлен 30.04.2009

    Описания интерактивных систем, обеспечивающих работу с изображениями, движущимся видео и анимированной компьютерной графикой. Определение основных мультимедийных ресурсов сети Интернет. Преимущества и недостатки применения мультимедиа в образовании.

    курсовая работа , добавлен 17.01.2015

    Области применения мультимедиа. Основные носители и категории мультимедиа-продуктов. Звуковые карты, CD-ROM, видеокарты. Программные средства мультимедиа. Порядок разработки, функционирования и применения средств обработки информации разных типов.

    контрольная работа , добавлен 14.01.2015

    Разработка мультимедиа-программы для прослушивания аудио-файлов и просмотров видео. Описание меню для пользователей и для администраторов проекта. Создание форм для указанного приложения при помощи Visual Foxpro 9. Листинг программы и ее результаты.

    курсовая работа , добавлен 27.07.2013

    Общее представление о мультимедиа-технологиях. Цели применения продуктов, созданных в мультимедиа-технологиях. Мультимедийные ресурсы и средства разработки мультимедиа. Аппаратные средства, видео и анимация. Процесс создания мультимедийного проекта.

    курсовая работа , добавлен 25.06.2014

    Создание информационной мультимедиа системы (медиа-плеера) для презентации аудио-видео информации о факультете КТАС, представленной в специально отснятых и смонтированных avi-файлах. Разработка модуля пользовательского интерфейса, выходные данные.

    курсовая работа , добавлен 21.11.2014

    Потоковое мультимедиа - мультимедиа, которое непрерывно получается пользователем от провайдера потокового вещания. Попытки отображения мультимедиа информации на компьютерах. Разработка сетевых протоколов потокового вещания и развитие интернет технологий.

    курсовая работа , добавлен 21.12.2010

    Проблемы информационной безопасности в современных условиях. Особенности развития средств мультимедиа. Применение информационных технологий в процессах коммуникации. Разработка защитного технического, программного обеспечения от компьютерных преступлений.

    курсовая работа , добавлен 27.03.2015

    Потенциальные возможности компьютера. Широкое применение мультимедиа технологии. Понятие и виды мультимедиа. Интересные мультимедиа устройства. 3D очки, web-камеры, сканер, динамический диапазон, мультимедийная и виртуальная лазерная клавиатура.

Мультимедиа технологии. Графические форматы

Мультимедиа (лат. Multum + Medium ) - одновременное использование различных форм представления информации и ее обработки в едином объекте-контейнере.

Например, в одном объекте-контейнере (англ. container ) может содержаться текстовая, аудиальная, графическая и видео информация, а также, возможно, способ интерактивного взаимодействия с ней.

Термин мультимедиа также, зачастую, используется для обозначения носителей информации, позволяющих хранить значительные объемы данных и обеспечивать достаточно быстрый доступ к ним (первыми носителями такого типа были CD - compact disk.

Классификация:

Мультимедиа может быть грубо классифицировано как линейное и нелинейное .

Аналогом линейного способа представления может являться кино. Человек, просматривающий данный документ никаким образом не может повлиять на его вывод.

Нелинейный способ представления информации позволяет человеку участвовать в выводе информации, взаимодействуя каким-либо образом со средством отображения мультимедийных данных. Участие человека в данном процессе также называется «интерактивностью». Такой способ взаимодействия человека и компьютера наиболее полным образом представлен в категориях компьютерных игр. Нелинейный способ представления мультимедийных данных иногда называется «гипермедиа».

В качестве примера линейного и нелинейного способа представления информации, можно рассматривать такую ситуацию, как проведение презентации. Если презентация была записана на пленку и показывается аудитории, то при этом способе донесения информации просматривающие данную презентацию не имеют возможности влиять на докладчика. В случае же живой презентации, аудитория имеет возможность задавать докладчику вопросы и взаимодействовать с ним прочим образом, что позволяет докладчику отходить от темы презентации, например поясняя некоторые термины или более подробно освещая спорные части доклада. Таким образом, живая презентация может быть представлена, как нелинейный(интерактивный) способ подачи информации…

Графические форматы

Графи́ческий форма́т - это способ записи графической информации. Графические форматы файлов предназначены для хранения изображений, таких как фотографии и рисунки.

Графические форматы различаются по виду хранимых данных (растровая, векторная и смешанная формы), по допустимому объему данных, параметрам изображения, хранению палитры, методике сжатия данных (для EGA без сжатия требуется 256К) - DCLZ (Data Compression Lempel-Ziv), LZW (Lempel-Ziv & Welch), по способам организации файла (текстовый, двоичный), структуре файла (с последовательной или ссылочной (индексно-последовательной) структурой) и т.д.

Растровый файл состоит из точек, число которых определяется разрешением, измеряемым обычно в точках на дюйм (dpi) или на сантиметр (dpc). Очень важным фактором, влияющим, с одной стороны, на качество вывода изображения, а с другой - на размер файла, является глубина цвета, т.е. число разрядов, отводимых для хранения информации о трех составляющих (если это цветная картинка) или одной составляющей (для полутонового не цветного изображения). Например, при использовании модели RGB глубина 24 разряда на точку означает, что на каждый цвет (красный, синий, зеленый) отводится по 8 разрядов и поэтому в таком файле может храниться информация о 2^24 = 16,777,216 цветах (Обычно в этом случае говорят о 16 млн. цветов). Очевидно, что даже файлы с низким разрешением содержат в себе тысячи или десятки тысяч точек. Так, растровая картинка размером 1024х768 точек и с 256 цветами занимает 768 Кбайт. Для уменьшения объемов файлов разработаны специальные алгоритмы сжатия графической информации. Именно они и являются основной причиной существования графических форматов.

Векторный способ записи графических данных применяется в системах автоматического проектирования (CAD) и в графических пакетах. В этом случае изображение состоит из простейших элементов (линия, ломаная, кривая Безье, эллипс, прямоугольник и т.д.), для каждого из которых определен ряд атрибутов (например, для замкнутого многоугольника - координаты угловых точек, толщина и цвет контурной линии, тип и цвета заливки и т.д.). Записывается также место объектов на странице и расположение их друг относительно друга (какой из них "лежит" выше, а какой ниже). Векторный формат является доказательством идеи древнегреческих математиков о том, что любую существующую в природе форму можно описать, используя геометрические примитивы и компас.

У каждого метода есть свои преимущества. Растровый позволяет передавать тонкие, едва уловимые детали образов, векторный же лучше всего применять, если оригинал имеет отчетливые геометрические очертания. Векторные файла меньше по объему, зато растровые быстрее вырисовываются на экране дисплея, так как для вывода векторного изображения процессору необходимо произвести множество математических операций. С другой стороны, векторные файлы гораздо проще редактировать.

Существует множество программ-трансляторов, переводящих данные из векторного формата в растровый. Как правило, такая задача решается довольно просто, чего нельзя сказать об обратной операции - преобразовании растрового файла в векторный и даже о переводе одного векторного файла в другой. Векторные алгоритмы записи используют уникальные для каждой фирмы-поставщика математические модели, описывающие элементы изображения.

Ниже описан ряд наиболее распространенных графических форматов.

1. PCX - Простейший растровый формат. Первоначально этот формат использовался в программе PaintBrush фирмы Zsoft, однако в последствии получил широкое распространение среди пакетов редактирования растровых изображений, хотя до сих пор не признан в качестве официального стандарта. К сожалению, в процессе своей эволюции PCX претерпел настолько значительные изменения, что современная версия формата, поддерживающая 24-разрядный цветовой режим, не может использоваться старыми программами. С самого "рождения" формат PCX был ориентирован на существующие видеоадаптеры (сначала EGA, потом VGA) и поэтому является аппаратно-зависимым. В PCX используется схема сжатия данных RLE, позволяющая уменьшать размер файла, например, на 40- 70%, если используется 16 и менее цветов, и на 10- 30% для 256-цветных изображений.

2. BMP - (Windows Bitmap) разрабатывался фирмой Microsoft как совместимый со всеми приложениями Windows. Для приложений в операционной системе OS/2 имеется собственная версия BMP. В формате BMP можно сохранять черно-белые, серые полутоновые, индексные цветные и цветные изображения системы RGB (но не двухцветные или цветные изображения системы CMYK). Недостаток этих графических форматов: большой объем. Следствие - малая пригодность для Internet-публикаций.

3. GIF - поддерживает до 256 цветов, позволяет задавать один из цветов как прозрачный, дает возможность сохранения с чередованием строк (при просмотре сначала выводится каждая 8-я, затем каждая 4-я и т.д. Это позволяет судить об изображении до его полной загрузки). Способен содержать несколько кадров в одном файле с последующей последовательной демонстрацией (т.н. "анимированный GIF"). Уменьшение размера файла достигается удалением из описания палитры неиспользуемых цветов и построчного сжатия данных (записывается количество точек повторяющегося по горизонтали цвета, а не каждая точка с указанием ее цвета). Такой алгоритм дает лучшие результаты для изображений с протяженными по горизонтали однотонными объектами. Для сжатия файла используется высокоэффективный алгоритм Лемпела - Зива - Велча (LZW)

4. TIFF (target image file format) - был разработан специально для использования в приложениях, связанных с компоновкой страницы и направлен на преодоление трудностей, которые возникают при переносе графических файлов с IBM-совместимых компьютеров на Macintosh и обратно. Он поддерживается всеми основными графическими пакетами и пакетами редактирования изображений и читается на многих платформах. Использует сжатие изображения (LZW). Формат TIFF очень удобен, но за это приходится расплачиваться огромными размерами получаемых файлов (например, файл формата А4 в цветовой модели CMYK с разрешением 300 dpi, обычно применяемым для высококачественной печати, имеет размер около 40 Мбайт). Кроме того, существует несколько "диалектов" формата, которые не каждая программа, поддерживающая TIFF, легко "понимает".

5. JPEG - миллионы цветов и оттенков, палитра не настраиваемая, предназначен для представления сложных фотоизображений. Разновидность progressive JPEG позволяет сохранять изображения с выводом за указанное количество шагов (от 3 до 5 в Photoshop"e) - сначала с маленьким разрешением (плохим качеством), на следующих этапах первичное изображение перерисовывается все более качественной картинкой. Анимация или прозрачный цвет форматом не поддерживаются. Уменьшение размера файла достигается сложным математическим алгоритмом удаления информации - чем заказываемое качество ниже, тем коэффициент сжатия больше, файл меньше. Главное, подобрать максимальное сжатие при минимальной потере качества. Последний идентифицирует и отбрасывает данные, которые человеческий глаз не в состоянии увидеть (незначительные изменения в цвете не различаются человеком, тогда как улавливается даже малейшая разница в интенсивности, поэтому JPEG меньше подходит для обработки черно-белых полутоновых изображений), что приводит к существенному уменьшению размера файла. Таким образом, в отличие от метода сжатия LZW или RLE в результате применения технологии JPEG данные теряются навсегда. Так, файл, однажды записанный в формате JPEG, а затем переведенный, скажем, в TIFF, уже не будет тем же, что и оригинал. Наиболее подходящий формат для размещения в Интернете полноцветных изображений. Вероятно, до появления мощных алгоритмов сжатия изображения без потери качества останется ведущим форматом для представления фотографий в Web.

6. PNG - пока малораспространен из-за слабой рекламы, создавался специально для Интернета как замена первых двух форматов и благодаря патентной политике Compuserve постепенно вытесняет GIF (см. выше). Позволяет выбирать палитру сохранения - серые полутона, 256 цветов, true color ("истинные цвета"). В зависимости от свойств изображения действительно иногда предпочтительнее GIF"a или JPG"a. Позволяет использовать "прозрачный" цвет, но, в отличие от GIF"a таких цветов может быть до 256. В отличие от GIF сжатие без потери качества производится и по горизонтали и по вертикали (алгоритм собственный, параметры тоже не настраиваемые). Не умеет создавать анимированные ролики (разрабатывается формат MNG).

7. PDF (Portable Document Format) - это пример смешанного формата, предназначенного для хранения текста и графики одновременно. В формате PDF сохраняются данные текстовым редактором Adobe Acrobat. Для сжатия графики применяется метод LZW.

8. PSD - формат графического редактора Adobe Photoshop. Обладает очень большими возможностями. Хранит данные о различных палитрах цветов, о прозрачности, имеет возможность хранения послойных изображений. При этом отличается большим размером.

Векторная графика

CDR (CorelDRAW)
Формат популярного CorelDRAW, являющимся неоспоримым лидером в классе векторных графических редакторов на платформе РС. Имея сравнительно невысокую устойчивость и проблемы с совместимостью файлов разных версий формата.

AI (Adobe Illustrator)
Являясь частью семейства Adobe, поддерживают практически все программы, так или иначе связанные с векторной графикой. Лучший посредник при передаче изображений из одной программы в другую, с РС на Macintosh и наоборот. Отличается наибольшей стабильностью и совместимостью с языком PostScript, на который ориентируются практически все издательско-полиграфические приложения.

WMF (Windows Metafile)
Еще один родной формат Windows, на сей раз векторный. Понимается практически всеми программами Windows, так или иначе связанными с векторной графикой.

EMF (Enhaced Metafile)
Подобный WMF.

ДРУГИЕ ФОРМАТЫ

SWF (ShokWaveFlash)
Формат Flash, продукт компании «Macromedia», позволяющий разрабатывать интерактивные мультимедийные приложения. Сфера использования Flash различна, это могут быть игры, веб-сайты, CD презентации, баннеры и просто мультфильмы. При создании продукта можно использовать медиа, звуковые и графические файлы, можно создавать интерактивные интерфейсы и полноценные веб-приложения с использованием PHP и XML.

SVG (Scalable Vector Graphics)
Стандарт, рекомендованый World Wide Web Consortium для описания с помощью XML markup двумерной векторной и комбинированной векторно-растровой графики.
В браузере SVG-графика отрисовывается с помощью растровых механизмов. Поддержка полупрозрачностей в каждом слое, градиенты линейные, градиенты радиальные, визуальные эффекты (тени, отмывки, блестящие поверхности, текстуры (фактуры), паттерны любой конструкции, символы любой сложности).
SVG - это формат для двухмерной векторной графики - так определено в спецификации, но с помощью добавления скрипта (а именно JavaScript) внутрь SVG файла можно создавать трехмерные анимированные изображения.
В SVG может быть встроено растровое изображение, к которому как и к любому другому объекту в SVG может быть применена трансформация, прозрачность и т.д.

ICO (Icon)
Иконка, в Интернете используется как символ сайта, логотип. Например, сейчас вы видите красный квадратик в адресной строке. Если вы добавите страничк нашго сайта в избранное (favorit), радом со ссылкой появится наша иконка, которая поможет быстро визуально находит ссылку на сайт. Собственно, это и есть главное предназначение иконки в Интернете.

Интерфейс прикладного программирования (иногда интерфейс программирования приложений ) (англ. application programming interface, API [эй-пи-ай]) - набор готовых классов, функций, структур и констант, предоставляемых приложением (библиотекой, сервисом) для использования во внешних программных продуктах. Используется программистами для написания всевозможных приложений.

Любой пользователь компьютерных систем, мобильных устройств или интернета практически каждый день сталкивается с файлами мультимедиа. Что такое медиафайл? Далее предлагается рассмотреть этот вопрос подробнее. Впрочем, ничего особо сложного в понимании всей концепции мультимедиа нет.

Что такое медиафайл в общем понимании?

Начнем, пожалуй, с самого элементарного. Как правило, к мультимедиа относят все то, что связано с файлами video, audio и графики или их сочетанием, причем даже с содержанием текстов. По большому счету, даже презентации, созданные в Power Point, которые содержат один или несколько из вышеперечисленных объектов, тоже можно отнести к некой разновидности мультимедиа, хотя считается, что это именно презентация, а не мультимедиа только по той простой причине, что такие файлы программными или «железными» проигрывателями не воспроизводятся.

Именно эти три большие группы и представляют основные направления всей категории мультимедиа. Однако для всех трех классов можно привести еще и дополнительную классификацию, разделяя их по форматам или содержанию. Так, например, в категории видео в плане содержания могут присутствовать фильмы, мультфильмы, клипы, видеооткрытки, рекламные материалы и т.д.

А если в каждом классе копнуть еще и в разновидности форматов, времени не хватит, чтобы описать их все, поскольку сегодня в компьютерном мире их можно насчитать даже не десятки - сотни. Но говоря о том, что такое медиафайл, отдельно стоит рассмотреть каждую категорию.

Аудио

Аудио или звуковые файлы являются одной из самых больших категорий, которая объединяет огромное количество всевозможных форматов.

На заре их появления и создания изначально использовался формат PCM WAVE, который был разработан корпорацией Microsoft. Но файлы этого типа были очень большими по размеру и хранить их на жестких дисках малого объема или съемных носителях в виде тех же дискет было достаточно проблематично.

Все изменилось, когда был разработан специальный кодек Fraunhofer MP3 Encoder, позволявший производить сжатие аудиоинформации с уменьшением размера исходного WAV-файла. Правда, с небольшой потерей качества на уровне понижения звуковых характеристик (частоты дискретизации, глубины звука и т.д.). Однако сегодня формат MP3 усовершенствован настолько, что не только разница в звучании незаметна, но иногда файлы этого стандарта, к примеру, с битрейтом на уровне 320 кбит/с звучат намного лучше, нежели любой другой формат.

Говоря о том, что такое медиафайл категории аудио, можно отметить, что в последнее время достаточно распространенными и популярными форматами являются такие как:

  • AIFF;
  • FLAC;
  • CDDA;
  • DVD Audio и многие другие.

Некоторые их этих форматов являются самостоятельными и могут воспроизводиться любыми проигрывателями. Другие представляют собой аудиодорожки, которые встраиваются в видео. Если же взять еще и узкоспециализированные форматы музыкальных программ (например, формат FLP для секвенсора FL Studio), количество форматов возрастает просто неимоверно.

Видео

Еще одним большим классом считается видео. При этом ролики могут содержать audio, video, графику, текст (например, субтитры) и т.д. В этой категории форматов тоже можно насчитать очень много.

Самыми распространенными считаются следующие:

  • DivX;
  • Xvid;
  • MPEG;
  • RealVideo;
  • 3GP и т.д.

Всего, что сегодня есть в этой категории, просто не перечислишь. Однако тут есть один нюанс. Бывает так, что проигрыватель не воспроизводит медиафайлы этого типа. Почему? Да только потому, что каждого стандарта необходимо использовать специальные программы, называемые кодеками и декодерами (об этом будет сказано отдельно).

Графика

Наконец, еще один большой класс мультимедиа - графика. Здесь, пожалуй, всевозможных форматов можно насчитать больше всего. Кроме того, можно разделить стационарные изображения и анимацию, которая, хотя и относится к графике по формату, но по содержанию ближе к видео, или растровые и векторные изображения. Самый простой пример - файл GIF. Их, кстати, в равной степени можно отнести и так называемым смешанным файлам.

Что же касается самих графических файлов, тут дело не ограничивается только стандартными форматами картинок. Если взять в расчет инженерные, проектировочные или чертежные программные пакеты вроде AutoCAD, их «родные» форматы тоже смело можно относить к разновидности графических объектов.

Смешанные медиафайлы

Что такое медиафайл смешанного типа? Проще всего пояснить это на примере документов PDF, которые могут содержать и графику, и текст.

Несмотря на то, что для их просмотра или редактирования предусмотрены специальные программы вроде Adobe Reader, а не стандартные средства, применяемые для графических изображений, они тоже в некотором смысле представляют собой одну из разновидностей мультимедиа.

Создание медиафайлов

Что же касается создания или редактирования мультимедиа, для каждой категории предусмотрены специальные средства в виде узконаправленных редакторов или программ, объединяющих несколько возможностей.

Звуковые файлы создать (записать) или отредактировать можно не только в специализированных приложениях вроде Adobe Audition, Sound Forge или ACID, но и с применением программ для видео, в которых, помимо обработки видео, имеются инструменты и для редактирования аудио. Одной из самых мощных считается программа Sony Vegas Pro. Но на самом деле сегодня таких приложений разного уровня можно найти достаточно много. Естественно, все они отличаются своими возможностями и профессионализмом получаемого результата.

Ну а если посмотреть на утилиты для создания и обработки графики, здесь столько всего, что неискушенный пользователь просто потеряется в этом огромном списке при выборе необходимой утилиты.

Кодеки и декодеры

Отдельно стоит остановиться на кодеках и декодерах, которые необходимы не только для корректного воспроизведения мультимедиа некоторых типов, но и для преобразования форматов. При этом тот же кодек видео может использоваться в каком-нибудь конвертере для преобразования видео в аудио и наоборот.

Самыми популярными и наиболее распространенными пакетами с полным набором необходимых инструментов считаются K-Lite, которые, в зависимости от модификации, могут содержать разное количество кодеков и декодеров. Самым полным считается пакет K-Lie Mega Codec Pack, в котором присутствуют абсолютно все известные на сегодня декодеры и кодеки. После установки любой кодек видео или декодер аудио встраивается в операционную систему, программы для воспроизведения или обработки мультимедиа автоматически, поэтому проблем с их использованием быть не должно. Только на стадии инсталляции необходимо отметить все то, что нужно установить.