Здравствуйте, SkyDance, Вы писали:
SD>"FreshMeat" <19221@users.rsdn.ru> wrote in message news:1524022@news.rsdn.ru...
>> Метода (с) biomaster стабильно работает уже год
SD>Не верю.
SD>Байесовскому фильтру для тренировки нужны письма не только плохие, но и хорошие, причем желательно, чтоб их было пополам.
а я делаю по-другому. все почта с моего домена автоматом редиректится на гугловский аккаунт. а там все скопом (или часть фильтрами) редиректится обратно. тут самое важное что гугл, если определил письмо как спам, НЕ редиректит его даже если в подходящем правиле написано про пересылку копии письма по адресу. раз в неделю заглядываю в этот гугловский ящик, проверить спам — и где-то лишь раз в недели две туда попадает что-то важное. и ничего (ни одно письмо) не пропадает, а копии на всякий случай хранятся еще и у гугула (честно говоря ему я доверяю больше чем собственному хостеру, который честно признается в личной переписке что "у нас почта плохо работает так как через нас спам пытаются слать", в результате чего уже несколько мне хостер грохал ящик с почтой. ненавижу mastak). в общем, как вариант, мне такое помогло.
мне кажется что у "mail-центров" (gmail в данном случае) есть больше шансов качественно отсеить спам, так как у них из-за количества ящиков есть взгляд с птичьего полета на ситуацию
Здравствуйте, FreshMeat, Вы писали:
FM>Раньше такого способа не встречал, если кому пригодится — хорошо
FM>E-mail друга, для отправления благодарностей публиковать не буду
Quid pro quo. Продам свою разработку.
Тоже ящик, тоже исключительно для спама. Скрипт разбирает заголовки и выбирает оттуда ip-адреса. Формирует базу и подсовывает proxy-checker'у. Имеем автообновления базы прокси-серверов абсолютно бесплатно.
Правда, из-за ботнетов количество опознанных прокси в последнее время уменьшилось.
... << RSDN@Home 1.1.4 beta 3 rev. 193>>
Здравствуйте, IPv6, Вы писали:
IP>а я делаю по-другому. все почта с моего домена автоматом редиректится на гугловский аккаунт. а там все скопом (или часть фильтрами) редиректится обратно. тут самое важное что гугл, если определил письмо как спам, НЕ редиректит его даже если в подходящем правиле написано про пересылку копии письма по адресу. раз в неделю заглядываю в этот гугловский ящик, проверить спам — и где-то лишь раз в недели две туда попадает что-то важное. и ничего (ни одно письмо) не пропадает, а копии на всякий случай хранятся еще и у гугула (честно говоря ему я доверяю больше чем собственному хостеру, который честно признается в личной переписке что "у нас почта плохо работает так как через нас спам пытаются слать", в результате чего уже несколько мне хостер грохал ящик с почтой. ненавижу mastak). в общем, как вариант, мне такое помогло.
Схема неплохая, только с нюансами. Скажем когда почта пересылается с гмейла обратно она не должна редиректиться как новая, настройки должны у сервера присутствовать соответствующие. Белых списков отправителей у гугла автоматом не ведется, да и вручную их вести геморойненько. Без них в спам может попасть письмо от известного адресата, с которым вы постоянно переписываетесь.
IP>мне кажется что у "mail-центров" (gmail в данном случае) есть больше шансов качественно отсеить спам, так как у них из-за количества ящиков есть взгляд с птичьего полета на ситуацию
Ну как бы да, у чуваков есть доступ к огромному количеству сообщений. Но пользы от этого не так много как можно было бы предположить. Письма которые у них в наличии сортированы на спам и не спам лишь частично, потому что людям свойственно ошибаться. Чтобы достичь качества фильтрации клиентских фильтров на сервере нужно иметь отсортированные письма с вероятностью ошибки близкой к 0, а этого естественно нет. Поэтому гмейл, яндекс спамооборона, касперский — все имеют офигительную базу писем, но при этом количество false negatives/false positives в районе 80-85%/1-2%.
В общем трафик конечно экономится таким макаром, только не стоит естественно ожидать каких то расчудесных чудес от такого подхода. Над более удобной системой, с принципом работы слегка напоминающим то что вы описали но более серьезным качеством фильтрации, работа уже ведется
P.S.: SkyDancer (привет Макс
практически нигде не соврал
Только вот это —
зря. Во-первых такая реклама не очень эффективная штука, а во-вторых авторство этого движка себе присваивать некрасиво, ты знаешь почему