WikiDer > Спам в изображениях

Image spam

Рис. 1. Пример чистого спам-изображения

Рис. 2. Примеры замаскированных изображений спама для обхода обнаружения на основе оптического распознавания текста и сигнатур.

Рис. 3. Средний размер спама в зависимости от процента графического спама.^[1]

Рис. 4. Средний размер спама в зависимости от процентной доли графического и ZIP / RAR-спама (2011-2012 гг., В неделю)^[2]

Спам на основе изображений,^[3]^[4] или же графический спам, это своего рода электронный спам где текстовое спам-сообщение встраивается в изображения, которые затем прикрепляются к спам-сообщениям. Поскольку большинство почтовых клиентов отображают файл изображения непосредственно пользователю, спам-сообщение передается, как только электронное письмо открывается (нет необходимости дополнительно открывать прикрепленный файл изображения).

Цель графического спама - обойти анализ текстового содержания электронного письма, выполняемый большинством спам-фильтры (например, SpamAssassin, Радикальный спам, Bogofilter, SpamBayes). Соответственно, по той же причине вместе с прикрепленным изображением часто спамеры добавить в электронное письмо некоторый «поддельный» текст, а именно несколько слов, которые с наибольшей вероятностью появятся в законных электронных письмах, а не в спаме. Предыдущие электронные письма со спамом с изображениями содержали изображения спама, текст в которых был чистым и легко читаемым, как показано на рис.1.

Как следствие, оптическое распознавание символов инструменты использовались для извлечения текста, встроенного в изображения для спама, который затем можно было обрабатывать вместе с текстом в теле письма с помощью спам-фильтра или, в более общем плане, с помощью более сложных методов категоризации текста.^[3]^[5]Кроме того, подписи (например, хеширование MD5) также были сгенерированы для легкого обнаружения и блокировки уже известных изображений спама. Спамеры, в свою очередь, отреагировали, применив некоторые обфускация методы спама изображений, аналогичные CAPTCHA, как для предотвращения чтения встроенного текста средствами OCR, так и для введения в заблуждение обнаружения на основе сигнатур. Некоторые примеры показаны на рис.2.

В связи с этим возник вопрос об улучшении обнаружения спама в изображениях с помощью компьютерного зрения и методов распознавания образов.^[3]^[4]^[6]^[7]

В частности, несколько авторов исследовали возможность распознавания спама в изображениях с обфусцированными изображениями с помощью общих низкоуровневых функций изображения (таких как количество цветов, преобладающий цветовой охват, соотношение сторон изображения, область текста), метаданные изображения и т. Д.^[6]^[7]^[8]^[9] (видеть^[4] Примечательно, что некоторые авторы также пытались определить наличие текста в прикрепленных изображениях с артефактами, обозначающими злонамеренную попытку его скрыть.^[10]^[11]^[12]^[13]

Спам в виде изображений начался в 2004 году и достиг своего пика в конце 2006 года, когда более 50% спама составляли изображения. В середине 2007 года он начал сокращаться, а в 2008 году практически исчез.^[1] Причину этого явления понять непросто. Уменьшение количества спама в изображениях, вероятно, можно объяснить как улучшением предлагаемых мер противодействия (например, быстрые детекторы спама в изображениях, основанные на визуальных характеристиках), так и более высокими требованиями к полосе пропускания спама в виде изображений, которые заставляют спамеров отправлять меньшие объемы спама за заданный промежуток времени. Оба фактора могли сделать графический спам менее удобным для спамеров, чем другие виды спама. Тем не менее, в конце 2011 года было обнаружено возрождение графического спама, и графический спам достиг 8% всего спам-трафика, хотя и на короткий период.^[2]

Смотрите также

Рекомендации

^ ^а ^б IBM X-Force® 2010, Отчет о тенденциях и рисках за год (август 2010 г.).
^ ^а ^б IBM X-Force® 2012, Отчет о тенденциях и рисках за год (сентябрь 2012 г.).
^ ^а ^б ^c Джорджио Фумера, Игнацио Пиллаи, Фабио Роли,«Фильтрация спама на основе анализа текстовой информации, встроенной в изображения». Journal of Machine Learning Research (специальный выпуск по машинному обучению в компьютерной безопасности), vol. 7. С. 2699-2720, 12/2006.
^ ^а ^б ^c Баттиста Биджо, Джорджио Фумера, Игнацио Пиллаи, Фабио Роли,Бигджо, Баттиста; Фумера, Джорджио; Пиллаи, Игнацио; Роли, Фабио (2011). «Обзор и экспериментальная оценка методов фильтрации спама в изображениях, письма с распознаванием образов». Письма с распознаванием образов. 32 (10): 1436–1446. Дои:10.1016 / j.patrec.2011.03.022. Том 32, выпуск 10, 15 июля 2011 г., страницы 1436-1446, ISSN 0167-8655.
^ "Плагин Bayes OCR Spam Assassin's".
^ ^а ^б Арадхай, Х., Майерс, Г., Херсон, Дж. А., 2005. Анализ изображений для эффективной категоризации спам-сообщений электронной почты на основе изображений. В: Proc. Int. Конф. по анализу и распознаванию документов, стр. 914–918.
^ ^а ^б Дредзе, М., Геварьяху, Р., Элиас-Бахрах, А., 2007. Изучение быстрых классификаторов для графического спама. В: Proc. 4-я конф. по электронной почте и защите от спама (CEAS)
^ Wu, C.-T., Cheng, K.-T., Zhu, Q., Wu, Y.-L., 2005. Использование визуальных функций для фильтрации спама. В: Proc. IEEE Int. Конф. по обработке изображений, Vol. III.стр. 501–504.
^ Лю, К., Цинь, З., Ченг, Х., Ван, М., 2010. Эффективное моделирование изображений спама. В: Int. Symp. по интеллектуальным информационным технологиям и информатике безопасности. Компьютерное общество IEEE, стр. 663–666.
^ "Fuzzy - плагин OCR Spam Assassin's".
^ Баттиста Биджо, Джорджио Фумера, Игнацио Пиллаи, Фабио Роли "Фильтрация спама в изображениях с использованием визуальной информации", 14-я Международная конференция по анализу и обработке изображений (ICIAP 2007), Модена, Италия, IEEE Computer Society, стр. 105–110, 10.09.2007.
^ Фабио Роли, Баттиста Бигджо, Джорджио Фумера, Игнацио Пиллаи, Риккардо Сатта, «Фильтрация спама в изображениях путем обнаружения состязательного запутанного текста», Семинар по системам обработки нейронной информации (NIPS), Уистлер, Британская Колумбия, Канада, 08/12/2007.
^ Баттиста Биггио, Джорджио Фумера, Игнацио Пиллаи, Фабио Роли, «Улучшение фильтрации спама в изображениях с помощью функций текста изображений», Пятая конференция по электронной почте и защите от спама (CEAS 2008), Маунтин-Вью, Калифорния, США, 21 августа 2008 г.

[Report_1-1] а ^б IBM X-Force® 2010, Отчет о тенденциях и рисках за год (август 2010 г.).

[Report_2-2] а ^б IBM X-Force® 2012, Отчет о тенденциях и рисках за год (сентябрь 2012 г.).

[Image_Based_spam-3] а ^б ^c Джорджио Фумера, Игнацио Пиллаи, Фабио Роли,«Фильтрация спама на основе анализа текстовой информации, встроенной в изображения». Journal of Machine Learning Research (специальный выпуск по машинному обучению в компьютерной безопасности), vol. 7. С. 2699-2720, 12/2006.

[Image_Based_spam_name_2-4] а ^б ^c Баттиста Биджо, Джорджио Фумера, Игнацио Пиллаи, Фабио Роли,Бигджо, Баттиста; Фумера, Джорджио; Пиллаи, Игнацио; Роли, Фабио (2011). «Обзор и экспериментальная оценка методов фильтрации спама в изображениях, письма с распознаванием образов». Письма с распознаванием образов. 32 (10): 1436–1446. Дои:10.1016 / j.patrec.2011.03.022. Том 32, выпуск 10, 15 июля 2011 г., страницы 1436-1446, ISSN 0167-8655.

[Bayes_OCR_Spam_Assassin's_Plugin-5] "Плагин Bayes OCR Spam Assassin's".

[Aradhye-6] а ^б Арадхай, Х., Майерс, Г., Херсон, Дж. А., 2005. Анализ изображений для эффективной категоризации спам-сообщений электронной почты на основе изображений. В: Proc. Int. Конф. по анализу и распознаванию документов, стр. 914–918.

[Dredze-7] а ^б Дредзе, М., Геварьяху, Р., Элиас-Бахрах, А., 2007. Изучение быстрых классификаторов для графического спама. В: Proc. 4-я конф. по электронной почте и защите от спама (CEAS)

[Cheng-8] Wu, C.-T., Cheng, K.-T., Zhu, Q., Wu, Y.-L., 2005. Использование визуальных функций для фильтрации спама. В: Proc. IEEE Int. Конф. по обработке изображений, Vol. III.стр. 501–504.

[Liu-9] Лю, К., Цинь, З., Ченг, Х., Ван, М., 2010. Эффективное моделирование изображений спама. В: Int. Symp. по интеллектуальным информационным технологиям и информатике безопасности. Компьютерное общество IEEE, стр. 663–666.

[Fuzzy-10] "Fuzzy - плагин OCR Spam Assassin's".

[Visual_Information-11] Баттиста Биджо, Джорджио Фумера, Игнацио Пиллаи, Фабио Роли "Фильтрация спама в изображениях с использованием визуальной информации", 14-я Международная конференция по анализу и обработке изображений (ICIAP 2007), Модена, Италия, IEEE Computer Society, стр. 105–110, 10.09.2007.

[Obfuscated_text-12] Фабио Роли, Баттиста Бигджо, Джорджио Фумера, Игнацио Пиллаи, Риккардо Сатта, «Фильтрация спама в изображениях путем обнаружения состязательного запутанного текста», Семинар по системам обработки нейронной информации (NIPS), Уистлер, Британская Колумбия, Канада, 08/12/2007.

[Image_text_Features-13] Баттиста Биггио, Джорджио Фумера, Игнацио Пиллаи, Фабио Роли, «Улучшение фильтрации спама в изображениях с помощью функций текста изображений», Пятая конференция по электронной почте и защите от спама (CEAS 2008), Маунтин-Вью, Калифорния, США, 21 августа 2008 г.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

Navigation

Navigation

Themenportale

WikiDer > Спам в изображениях

Смотрите также

Рекомендации