Многие современные информационно-измерительные системы базируются на технологиях компьютерного зрения. В таких системах необходимо обеспечить обработку больших объемов статических и/или динамических изображений.
Процедуры обработки изображений условно делятся на три класса по виду входных и выходных данных [1]. Эту классификацию предложил Д. Марр и она отражает процессы восприятии видеоинформации зрением человека и высокоорганизованных животных. Согласно концепции Д. Марра все процедуры обработки делятся на процедуры низкого, среднего и высокого уровня. Процедуры низкого уровня предназначены для получения и первичной обработки изображений. Процедуры среднего уровня обеспечивают формирование векторов признаков для описания изображений. Процедуры высокого уровня решают задачи анализа изображений с целью их распознавания.
Среди других процедур среднего уровня важное значение имеет сжатие изображений, в результате которого обеспечивается сокращение их избыточности. Сжатие изображений позволяет снизить требования к устройствам хранения и передачи информации. При этом в зависимости от конкретных условий использования оптимально применение конкретных методов сжатия изображений. Различают методы адаптивного и неадаптивного, симметричного и асимметричного, искажающего и неискажающего сжатия [2].
Для сжатия изображений наиболее эффективно применение методов адаптивного симметричного искажающего сжатия. Такие методы в общем случае работают по следующей схеме: (1) снижение межэлементной избыточности; (2) выделение наиболее существенной информации; (3) кодирование данных. Снижение межэлементной избыточности обеспечивает уменьшение взаимозависимости между элементами изображения, что позволяет уменьшить избыточность информации, содержащейся в изображении. Выделение наиболее существенной информации позволяет отбросить незначащие детали, не влияющие на восприятие изображения. Кодирование данных позволяет представить элементы изображения в наиболее компактной форме.
В настоящее время широко применяются методы на основе различных вейвлет-преобразований. В общем случае здесь выделяют два подхода – внутриподдиапазонный и межподдиаппазонный. Внутриподдиапазонные методы основаны на устранении корреляции между соседними вейвлет-коэффициентами в каждом из поддиапазонов по отдельности. Межподдиапазонные методы основаны на устранении корреляции между вейвлет-коэффициентами, принадлежащими к разным поддиапазонам. Основной задачей при создании методов на основе вейвлет-преобразования является анализ значимости коэффициентов.
В данной работе предлагается подход на основе весовой модели. Данная модель позволяет оценить значимость векторов детализирующих коэффициентов с помощью значений их энергии. Это связано с тем, что наиболее значимыми являются вектора детализирующих коэффициентов с большими по абсолютной величине значениями. Поэтому можно вычислить евклидову норму вектора детализирующих коэффициентов, которая и представляет собой значение энергии.
Процедура сжатия заключается в выполнении вейвлет-преобразования, определении значимых детализирующих коэффициентов и их кодировании с помощью метода Хаффмена. Реализация этой процедуры на языке C++ в системе программирования Microsoft Visual Studio позволило для стандартных полутоновых изображений из коллекции USC-SIPI [3] получить средний коэффициент сжатия, равный четырем.
1. Гонсалес, Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. – М.: Техносфера, 2012. – 1104 с.
2. Сэломон, Д. Сжатие данных, изображений и звука / Д. Сэломон. – М.: Техносфера, 2004. – 368 с.
3. The USC-SIPI Image Database [Электронный ресурс]. – Режим доступа: http://sipi.usc.edu/database/database.php (дата обращения: 04.10.2020).
Текст статьи, опубликованный в сборнике (скачать).