WikiDer > Спамовая масса
Спамовая масса определяется как «мера воздействия ссылочный спам в рейтинге страницы ». Концепция была разработана Золтаном Дьёнджи и Эктор Гарсиа-Молина из Стэндфордский Университет совместно с Павлом Берхиным и Яном Педерсеном из Yahoo!. Эта статья расширяет предлагаемые ими TrustRank методология.
Исследователи разработали хорошее ядро и плохое ядро избранных Интернет документы, из которых они измерили массу спама в коллекции документов. Два типа измерений, абсолютная масса и относительная масса, используются для сравнения групп документов. Чем выше массовые измерения, тем больше вероятность, что документы приравнены к спаму.
Пороги
Пороговое значение используется для идентификации групп документов как спама. Если их относительная масса превышает пороговое значение, документы считаются спамом. Второй порог для PageRank значения выбранных документов. Только документы с высоким PageRank помечаются как спам.
Цель методологии - выявить спам-документы с искусственно завышенными значениями PageRank.