Відмінності між версіями «ОЗМ 2-3 Міхав»

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук
м (JPEG)
(JPEG)
Рядок 262: Рядок 262:
  
 
== JPEG ==
 
== JPEG ==
 +
'''Алгоритм стиснення у форматі'''
 +
#Зазвичай зображення перетворюється з кольоровго простору RGB в [https://ru.wikipedia.org/wiki/YCbCr YCbCr].
 +
#Часто канали Cb и Cr проріджують, тобто блоку пикселів надається усереднене значення.
 +
#Значення каналів розбиваються на блоки 8x8 (всі бачили квадратики на занадто стисненому зображенні).
 +
#Кожний блок піддається дискретно-косинусному перетворенню, що є різновидом дискретного перетворення Фур'є. Отримаємо матрицю коефіцієнтів 8x8. При чому лівий верхній коефіцієнт називається DC-коефіцієнтом (він найважливіший і є усередненим значенням всіх значень), а інші 63 — AC-коефіцієнтами.
 +
#Отримані коефіцієнти квантуються, тобто кожен домножується на коефіцієнт матриці квантування (кожен кодувальник зазвичай використовує свою матрицю).
 +
#Потім вони кодуються кодами Хаффмана.
 +
 +
 
'''Структура jpeg файлу'''
 
'''Структура jpeg файлу'''
  
Рядок 342: Рядок 351:
  
 
'''Вдосконалення стандарту JPEG'''
 
'''Вдосконалення стандарту JPEG'''
*JPEG 2000 - рафический формат, который вместо дискретного косинусного преобразования, применяемого в формате JPEG, использует технологию вейвлет-преобразования, основывающуюся на представлении сигнала в виде суперпозиции базовых функций волновых пакетов. Крім цього, відновлене зображення не містить решітки артефактів.
+
*JPEG 2000 - графичний формат, який замість дискретного косинусного перетворення, що використовується у форматі JPEG, використовує технологію вейвлет-перетворення, що грунтується на представленні сигнала у вигляді суперпозиції базових функцій хвильових пакетів. Крім того, що отримане зображення має менший розмір, відновлене зображення не містить решітки артефактів.
 
*JPEG-LS - група експертів в областв фотографвї (Joint Photographic Experts Group) запропонувала стандарт на стиснення без втрат (в якому, правда, передбачений також режим стиснення з обмеженими втратами).
 
*JPEG-LS - група експертів в областв фотографвї (Joint Photographic Experts Group) запропонувала стандарт на стиснення без втрат (в якому, правда, передбачений також режим стиснення з обмеженими втратами).
 
*JPEG XR -  формат кодування і файловий формат для фотографій, розроблений і запатентований корпорацією Microsoft. У порівнянні з JPEG 2000 85 % за меншого розміру файла JPEG XR дає менше артефактів. Але поширюється під закритою ліцензією, через що може використовуватись лише на ОС сімейства Windows.
 
*JPEG XR -  формат кодування і файловий формат для фотографій, розроблений і запатентований корпорацією Microsoft. У порівнянні з JPEG 2000 85 % за меншого розміру файла JPEG XR дає менше артефактів. Але поширюється під закритою ліцензією, через що може використовуватись лише на ОС сімейства Windows.

Версія за 23:42, 17 лютого 2016

BMP

BMP-файл має структуру, представлену в таблиці. Розширений Windows95 BMP Header можна проігнорувати, оскільки майже всі програми генерують звичайний Windows 3.11 BMP Header. Рядки зображення у файлі мають бути кратними 4-ом. Наприклад якщо ширина картинки = 121 Pixel, то під час запису в файл кожному рядку необхідно добавити ще 3 нульових байта.

Для імені файлу, представленого в BMP-форматі, частіше за все використовується розширенняBMP, хоча деякі файли мають розширення RLE, що означає run length encoding (кодування довжини серій). Розширення RLE імені файла зазвичай вказує на те, що було здійснене стиснення за допомогою алгоритму RLE.

Значення пікселів зберігаються у порядку їх розташування зліва направо, починаючи (як правило) з нижнього рядка зображення. Таким чином, у BMP-файлі перший байт даних растрового масива - це індекс для кольору пікселя, що знаходиться в нижньому лівому кутку зображення.

BMP з глибиною 16 і 24 біт/піксель не мають таблиць кольорів; в цих файлах значення пікселів растрового масива безпосередньо характеризують значення кольорів RGB. Також можуть відрізнятись внутрішні формати збереження окремих розділів файла. Наприклад, інформація растрового масива в деяких 16 и 256-кольорових BMP-файлах може стискатись за допомогою алгоритму RLE, який заміняє послідовності ідентичних пікселів зображення на лексеми, що визначають число пікселів у послідовності та їх колір.

Offset Bytes Name Опис
00h 2 bfType BMP сигнатура ("BM")
02h 4 bfSize Розмір файла в Байтах
06h 2 Зарезервовано, має бути 0
08h 2 Зарезервовано, має бути 0
0Ah 4 bfOffs Зміщення області даних
Розширений Header Windows 3.x
0Eh 4 biSize Довжина
12h 4 biWidth Ширина Bitmap-а в пікселях
16h 4 biHeight Висота Bitmap-а в пікселях
1Ah 2 BiPlanes Кольорові площини (має бути 1)
1Ch 2 BiBit Кількість біт на піксель
1Eh 4 biCompr Тип стиснення (0 - не стиснено )
22h 4 biSizeIm Розмір зображення в байтах
26h 4 BiXPels/m Горизонтальне розрішення в DPI
2Ah 4 BiYPels/m Вертикальне розрішення в DPI
2Eh 4 biClrUsed Кількість використаних кольорів
32h 4 BiClrImp. Кількість важливих кольорів RGB_QUAD
36h N*4 Визначення для n кольорів з :
RgbBlue 1 Byte частка блакитного
RgbGreen 1 Byte частка зеленого
RgbRed 1 Byte частка червоного
RgbRes 1 Byte зарезервовано
Розширений Header Windows 95
0Eh 4 Довжина заголовка в байтах
12h 4 Ширина Bitmap-а в пікселях
16h 4 Висота Bitmap-а в пікселях
1Ah 2 Кольорові площини (має бути 1 )
1Ch 2 Кількість бітів на піксель
1Eh 4 Тип стиснення (0 - не стиснено )
22h 4 Розмір зображення в байтах
26h 4 Горизонтальне розрішення в DPI
2Ah 4 Вертикальне розрішення в DPI
2Eh 4 Кількість використаних кольорів
32h 4 Кількість важливих кольорів
додаткові 4-поля BMP
36h 4 Маска червоних частин кольору
3Ah 4 Маска зелених частин кольору
3Eh 4 Маска блакитних частин кольору
42h 4 Маска альфа каналу
46h 4 Color Space Type
4Ah 4 X-координата червоного CIE-кінця
4Eh 4 Y-координата червоного CIE-кінця
52h 4 Z-координата червоного CIE-кінця
56h 4 X-координата зеленого CIE-кінця
5Ah 4 Y-координата зеленого CIE-кінця
5Eh 4 Z-координата зеленого CIE-кінця
62h 4 X-координата блакитного CIE-кінця
66h 4 Y-координата блакитного CIE-кінця
5Eh 4 Z-координата блакитного CIE-кінця
62h 4 Гамма червоної координати
66h 4 Гамма зеленої координати
6Ah 4 Гамма блакитної координати
Власне дані растрового масива

JPEG

Алгоритм стиснення у форматі

  1. Зазвичай зображення перетворюється з кольоровго простору RGB в YCbCr.
  2. Часто канали Cb и Cr проріджують, тобто блоку пикселів надається усереднене значення.
  3. Значення каналів розбиваються на блоки 8x8 (всі бачили квадратики на занадто стисненому зображенні).
  4. Кожний блок піддається дискретно-косинусному перетворенню, що є різновидом дискретного перетворення Фур'є. Отримаємо матрицю коефіцієнтів 8x8. При чому лівий верхній коефіцієнт називається DC-коефіцієнтом (він найважливіший і є усередненим значенням всіх значень), а інші 63 — AC-коефіцієнтами.
  5. Отримані коефіцієнти квантуються, тобто кожен домножується на коефіцієнт матриці квантування (кожен кодувальник зазвичай використовує свою матрицю).
  6. Потім вони кодуються кодами Хаффмана.


Структура jpeg файлу

[FF D8] — маркер початку. Він завжди знаходиться на початку всіх jpg-файлов.

Далі йдут байти [FF FE]. Це маркер, що означає початок секції з коментарем. Наступні 2 байта — довжина секції (включно з цими 2 байтами). Отже в наступних n-2 — сам коментар.

Після того, як ми вилучили коментар, буде легко зрозуміти, що:

  • Файл поділений на сектори, на початку яких знаходяться маркери.
  • Маркери мають довжину 2 байта, при чому перший байт [FF].
  • Майже всі сектори зберігають свою довжину в наступних 2 байтах після маркера.


Маркер [FF DB]: DQT — таблица квантування.

Заголовок секції завжди займає 3 байта, наприклад [00 43 00]. Заголовок складається з:

  • [00 43] Довжина: 0x43 = 67 байт
  • [0_] Довжина значень в таблиці: 0 (0 — 1 байт, 1 — 2 байта)
  • [_0] Ідентифікатор таблиці: 0

За допомогою інших 64-х байт потрібно заповнити таблицю 8x8. Значення заповнюються в zigzag order.


Маркер [FF C0]: SOF0 — Baseline DCT

Цей маркер называється SOF0, і означає, що зображення закодовано базовим методом. Він дуже поширений.

FF C0 00 11 08 00 10 00 10 03 01 22 00 02 11 01 03 11 01

  • [00 11] Довжина: 17 байт.
  • [08] Precision: 8 біт. У базовому методі завжди 8.
  • [00 10] Висота зображення: 0x10 = 16
  • [00 10] Ширина зображення: 0x10 = 16
  • [03] Кількість компонентів: 3. Найчастіше це Y, Cb, Cr.

Компонент:

  • [01] Ідентифікатор: 1
  • [2_] Горизонтальне прорідження (H1): 2
  • [_2] Вертикальне прорідження (V1): 2
  • [00] Ідентифікатор таблиці квантувания: 0


Маркер [FF C4]: DHT (таблица Хаффмана)

Ця секція зберігає коди і значення, отримані кодуванням Хаффмана.

FF C4 00 15 00 01 01 00 00 00 00 00 00 00 00 00 00 00 00 00 00 03 02

  • [00 15] довжина: 21 байт.
  • [0_] клас: 0 (0 — таблиця DC коефіцієнтів, 1 — таблиця AC коефіцієнтів).
  • [_0] ідентифікатор таблиці: 0

Довжина кода Хаффмана: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Кількість кодів: [01 01 00 00 00 00 00 00 00 00 00 00 00 00 00 00]

Кількість кодів означає кількість кодів такої довжини. Секция зберігає тільки довжини кодів, а не самі коди. У прикладі є один код довжини 1 і один — довжини 2.


Маркер [FF DA]: SOS (Start of Scan)

Байт [DA] в маркере означає — «ТАК! Нарешті ми перейшли безпосередньо до розбору секції закодованого зображення!». Але секції символічно називається SOS.

FF DA 00 0C 03 01 00 02 11 03 11 00 3F 00

  • [00 0C] Довжина заголовковох частини (а не всієї секції): 12 байт.
  • [03] Кількість компонентів сканування. У прикладі 3, по одному на Y, Cb, Cr.

Компонент:

  • [01] Номер компонента зображення: 1 (Y)
  • [0_] Ідентифікатор таблиці Хаффмана для DC коефіцієнтів: 0
  • [_0] Ідентифікатор таблиці Хаффмана для AC коефіцієнтів: 0


Недоліки формату

Стиснення формату jpeg є як головною перевагою, так і його недоліком. Формат JPEG в режиме стиснення з втратами малопридатний для стиснення креслень, текстової та знакової графіки, де різкий контраст між сусідніми пікселями призводить до появи помітних артефактів. JPEG (як і інші формати стиснення з втратами) не підходить для стиснення зображень при багатоетапній обробці, так як дефекти у зображення будут вноситися щоразу при збереженні проміжних результатів обробки.

На відновлених зображеннях при високих степенях стиснення з'являються характерні артефакти: зображення розсипається на блоки розміром 8x8 пікселів. У стандарті передбачені фільтри для корекції цих артефактів, але на практиці подібні фільтри, не дивлячись на їх высоку ефективність, майже не використовуються.


Вдосконалення стандарту JPEG

  • JPEG 2000 - графичний формат, який замість дискретного косинусного перетворення, що використовується у форматі JPEG, використовує технологію вейвлет-перетворення, що грунтується на представленні сигнала у вигляді суперпозиції базових функцій — хвильових пакетів. Крім того, що отримане зображення має менший розмір, відновлене зображення не містить решітки артефактів.
  • JPEG-LS - група експертів в областв фотографвї (Joint Photographic Experts Group) запропонувала стандарт на стиснення без втрат (в якому, правда, передбачений також режим стиснення з обмеженими втратами).
  • JPEG XR - формат кодування і файловий формат для фотографій, розроблений і запатентований корпорацією Microsoft. У порівнянні з JPEG 2000 85 % за меншого розміру файла JPEG XR дає менше артефактів. Але поширюється під закритою ліцензією, через що може використовуватись лише на ОС сімейства Windows.


jpeg.org

Декодирование JPEG для чайников

GIF

PNG

SVG

SVG - Scalable Vector Graphic (масштабована векторна графіка) широко застосовується в поліграфії. Для веб-сайтів існує SVG, яка згідно з офіційною специфікацією на w3.org - мова для опису двовимірної графіки в XML. SVG включає в себе три типа об'єктів: фігури, зображення і текст. SVG існує з 1999 года, а з 16 серпня 2011 включена в рекомендації W3C.

SVG підтримується майже усіма сучасними браузерами, за виключенням Internet Explorer 8 і нижче.

За допомогою тега svg можна малювати прості об'єкти у SVG: прямокутник, коло, лінію, еліпс, ламану лінію або багатокутник.

Переваги SVG

  • Масштабування: на відміну від растрової графіки, SVG не втрачає якість при масштабуванні, тому її зручно використовувати для розробки під retina (загальна маркетингова назва РК-дисплеїв, що використовуються у пристроях Apple і мають настольки высоку щільність пікселів, що людське око не може помітити, що зображення складаєтьяс з них).
  • Зменшення HTTP-запитів: за застосування SVG скорочується кількість звернень до серверу, відповідно збільшується швидкість завантаження сайту.
  • Стилізація: за допомогою CSS можна змінювати параметри графіки на сайті, наприклад фон, прозорість або межі.
  • Анімація і редагування: SVG можна анимувати за допомогою SMIL (Synchronized Multimedia Integration Language) або javascript, а також редагувати в текстовому або графічному редакторі (InkScape чи Adobe Illustrator).
  • Малий розмір: об'єкти SVG займають значно менше місця, ніж растрові зображення.
  • Компресія: оскільки код SVG займає досить багато місця, була створена «обгортка» SVGZ, коли файл SVG упаковують в gzip, а отриманому архіву зазвичай надають розширення «SVGZ». SVG добре стискається, оскільки це текстовий XML-документ, що має регулярну структуру.
  • Відкритість: SVG — відкритий стандарт. На відміну від деяких інших форматів, SVG не є чиєюсь власністю.
  • Індексація: текст в графіці SVG є текстом, а не зображенням, тому його можна виділяти і копіювати, він індексуються пошуковими машинами, не потрібно створювати додаткові метафайли для пошукових серверів.

Недоліки SVG

  • Складність використання у великих картографічних додатках через те, що для правильного відображення маленької частини зображення документ потрібно прочитати повністю.
  • Чи більше в зображенні дрібних деталей, тем швидше зростає розмір SVG-данных. Крайній випадок — коли зображення - це білий шум. На практиці, SVG стає невигідним уже задовго до того, як зображення дійде до стадії білого шуму.


Приклад SVG з використанням анімації

Офіційна специфікація

Порівняння форматів

Формат Макс. число біт/піксель Макс. число кольорів Макс. розмір зображення, піксель Методи стиснення Кодуванння кількох зображень
BMP 24 16 777 216 65 535 x 65 535 RLE* -
JPEG 24 16 777 216 65 535 x 65 535 JPEG -
GIF 8 256 65 535 x 65 535 LZW +
PNG 48 281 474 976 710 656 2 147 483 647 x 2 147 483 647 Deflation (варіант LZ77) -

Примітка: потенційно у будь-якому растровому форматі зображення можна зберігати кілька зображень в одному файлі, використавши, наприклад, RAR-архів. Оскільки початок архіву знаходиться за сигнатурою, його можна дописати після першого зображення. Таким чином отримаємо "фотоальбом" з обкладинкою, який можна розпакувати.

Формат Біт на точку / якість Розмір, KiB
BMP 8 257
24 768
GIF 8 31
JPEG 20 11
40 14,8
70 19
90 29
PNG 8 22
24 43
32 46
SVG - 19