Автор Тема: squid - отслеживать не слова, но фразы.  (Прочитано 753 раз)

Оффлайн XBM

  • Давно тут
  • **
  • Сообщений: 478
  • Бэкап - акт проявления трусости.
    • Email
Работает squid, фильтрует слова (всякие "суицид", "наркотики" и пр.).
acl blockreg url_regex -i "/etc/squid/blockreg.acl"
Прошедшая проверка показала, что надо фильтровать еще и фразы. Например "Система Ислама" ( это такая запрещенная книга).
Подскажите, как это можно сделать?

Оффлайн yaleks

  • Мастер
  • ***
  • Сообщений: 6 233
Подскажите, как это можно сделать?
⃰⃰ ⃰ ⃰ ⃰ ⃰ Написать ИИ (AI), который на основе бреда из перечня запрещенных материалов будет определять - относится данная страница к этому или нет.
Причем лучше чтобы он определял и классифицировал на основании некого внутреннего представления о прекрасном и оно должно будет совпасть с таковым у "проверяющего".

Оффлайн XBM

  • Давно тут
  • **
  • Сообщений: 478
  • Бэкап - акт проявления трусости.
    • Email
Мне тоже нравится такой способ решения проблемы. :)
Но начинать придётся с простенького "linux way" - ковыряния в squid.conf :(

(данные с minjust.ru скачены и даже как-то распарсены)

Оффлайн yaleks

  • Мастер
  • ***
  • Сообщений: 6 233
ну на самом деле можете помучить dansguardian, но все равно количество вариаций этой запрещенной информации дофига. Вот будут у вас слово "крокодил" искать и привет  ;-)

Воспользуйтесь рекомендацией нового министра образования - отключить интернет нахрен.

Оффлайн batva

  • Завсегдатай
  • *
  • Сообщений: 75
    • Email
Я решил эту проблему дансгуардианом давно. Белый список иначе хрен пройдешь проверку. прокурор тут докапывался почему в яндексе находятся сайты по запросу фашизм. Но ни один сайт соответственно не открыл. Теперь янедекс даже не в сером списке. Сейчас все поисковики просто в черном списке. На уроке истории, учителям, рекомендовал это слово заменить писком как при мате по тв.