Вроде ясна причина тормозов
От: VladD2 Российская Империя www.nemerle.org
Дата: 22.03.26 20:09
Оценка: 40 (6) +1
Похоже у нас очень плохо написан запрос пэдженеции для форумов. Когда страница очень глубокая это приводит к диким тормозам. Новый индекс это несколько улучшил. Но основная проблема осталась.

Надо править код. Там кто-то лютых вложенных запросов нахерачил. Запрос с:
WHERE
    t1.rn BETWEEN 40226 AND 40245

выполняется по 20 секунд и жрет процессор как не в себя.
Запрос редкостной глупости. Вместо того, чтобы сначала выбрать сроки и потом для них считать что-то, происходит скан всех записей до 40226 с массой вложенных запросов к другим таблицам.

Ну роботы поисковиков и т.п. убивают сайт долбя в этот запрос.
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Отредактировано 22.03.2026 20:10 VladD2 . Предыдущая версия .
Re: Вроде ясна причина тормозов
От: Marty Пират https://www.youtube.com/channel/UChp5PpQ6T4-93HbNF-8vSYg
Дата: 23.03.26 21:54
Оценка: +6
Здравствуйте, VladD2, Вы писали:

Спасибо, что нашел время разобраться с проблемой
Маньяк Робокряк колесит по городу
Re[3]: Вроде ясна причина тормозов
От: Pavel Dvorkin Россия  
Дата: 23.03.26 15:18
Оценка: +1 :))) :)
Здравствуйте, bnk, Вы писали:

bnk>А у вас с ним какие теперь отношения после двух политик — вы вообще больше не разговариваете что ли?


Что-то вспомнилось...

Позвольте! Неужели же Аристарх Платонович не может ничего ему сказать?

— Аристарх Платонович не может ему ничего сказать, так как Аристарх Платонович не разговаривает с Иваном Васильевичем с тысяча восемьсот восемьдесят пятого года.

— Как это может быть?

— Они поссорились в тысяча восемьсот восемьдесят пятом году и с тех пор не встречаются, не говорят друг с другом даже по телефону.


(С) Булгаков, Театральный роман.
With best regards
Pavel Dvorkin
Re[6]: Вроде ясна причина тормозов
От: bnk СССР http://unmanagedvisio.com/
Дата: 23.03.26 15:44
Оценка: 5 (1)
Здравствуйте, Pzz, Вы писали:

Pzz>Здравствуйте, VladD2, Вы писали:


Pzz>>>Ну вроде приличные из них понимают robots.txt. Может хоть их как-то ограничить?


VD>>Если бы я понимал, что с ними делать...


Pzz>Положи в корень robots.txt вот с таким содержимым:


Pzz>
Pzz>User-agent: *
Pzz>Disallow: /
Pzz>


Тогда же вообще ничего индексироваться не будет. Я бы только AI-ботов забанил, от них больше всего вреда IMHO.
Re[7]: Вроде ясна причина тормозов
От: bnk СССР http://unmanagedvisio.com/
Дата: 23.03.26 16:07
Оценка: 5 (1)
Здравствуйте, VladD2, Вы писали:

VD>И что? Лишаемся любой индикации поисковиками?


Запрети AI-ботов как компромисс (выше).
Мой сайт особенно доставали китайские (baidu, alibaba), когда запретил, стало лучше.
Re: Вроде ясна причина тормозов
От: Pzz Россия https://github.com/alexpevzner
Дата: 22.03.26 21:57
Оценка: +1
Здравствуйте, VladD2, Вы писали:

VD>Ну роботы поисковиков и т.п. убивают сайт долбя в этот запрос.


А нельзя хоть на время этих роботов задвинуть куда подальше?
Re[5]: Вроде ясна причина тормозов
От: Pzz Россия https://github.com/alexpevzner
Дата: 23.03.26 15:41
Оценка: +1
Здравствуйте, VladD2, Вы писали:

Pzz>>Ну вроде приличные из них понимают robots.txt. Может хоть их как-то ограничить?


VD>Если бы я понимал, что с ними делать...


Положи в корень robots.txt вот с таким содержимым:

User-agent: *
Disallow: /
Re[7]: Вроде ясна причина тормозов
От: Pzz Россия https://github.com/alexpevzner
Дата: 23.03.26 16:31
Оценка: +1
Здравствуйте, VladD2, Вы писали:

Pzz>>
Pzz>>User-agent: *
Pzz>>Disallow: /
Pzz>>


VD>И что? Лишаемся любой индикации поисковиками?


Ну хоть попробуем, поможет ли это в принципе...
Re[2]: Вроде ясна причина тормозов
От: VladD2 Российская Империя www.nemerle.org
Дата: 22.03.26 23:06
Оценка:
Здравствуйте, Pzz, Вы писали:

Pzz>А нельзя хоть на время этих роботов задвинуть куда подальше?


Если бы я знал как. Я далек от девопса. По уму их конечно пускать надо только по ночам и давать готовые зипы с архивами, а не позволять сканировать весь сайт. Но они ведь могут и под обычных юзеров мимикрировать. Плюс это могу быть сканеры кого угодно. Те кто нас ддосил тоже делали похожие вещи долбя в тяжелые страницы.
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re: Вроде ясна причина тормозов
От: VladD2 Российская Империя www.nemerle.org
Дата: 22.03.26 23:07
Оценка:
Здравствуйте, VladD2, Вы писали:

VD>Запрос редкостной глупости. Вместо того, чтобы сначала выбрать сроки и потом для них считать что-то, происходит скан всех записей до 40226 с массой вложенных запросов к другим таблицам.


Функцию генерировавшую этот запрос поправил. Но паблишить не умею. Трясите АВК, чтобы он опубликовал изменения.

Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re[2]: Вроде ясна причина тормозов
От: bnk СССР http://unmanagedvisio.com/
Дата: 23.03.26 04:38
Оценка:
Здравствуйте, VladD2, Вы писали:

VD>Здравствуйте, VladD2, Вы писали:


VD>>Запрос редкостной глупости. Вместо того, чтобы сначала выбрать сроки и потом для них считать что-то, происходит скан всех записей до 40226 с массой вложенных запросов к другим таблицам.


VD>Функцию генерировавшую этот запрос поправил. Но паблишить не умею. Трясите АВК, чтобы он опубликовал изменения.


VD>Image: gSpIpH6.png


А у вас с ним какие теперь отношения после двух политик — вы вообще больше не разговариваете что ли?
Re[3]: Вроде ясна причина тормозов
От: Pzz Россия https://github.com/alexpevzner
Дата: 23.03.26 15:19
Оценка:
Здравствуйте, VladD2, Вы писали:

Pzz>>А нельзя хоть на время этих роботов задвинуть куда подальше?


VD>Если бы я знал как. Я далек от девопса. По уму их конечно пускать надо только по ночам и давать готовые зипы с архивами, а не позволять сканировать весь сайт. Но они ведь могут и под обычных юзеров мимикрировать. Плюс это могу быть сканеры кого угодно. Те кто нас ддосил тоже делали похожие вещи долбя в тяжелые страницы.


Ну вроде приличные из них понимают robots.txt. Может хоть их как-то ограничить?
Re[4]: Вроде ясна причина тормозов
От: wl. Россия  
Дата: 23.03.26 15:21
Оценка:
Здравствуйте, Pzz, Вы писали:

Pzz>Здравствуйте, VladD2, Вы писали:


Pzz>>>А нельзя хоть на время этих роботов задвинуть куда подальше?


VD>>Если бы я знал как. Я далек от девопса. По уму их конечно пускать надо только по ночам и давать готовые зипы с архивами, а не позволять сканировать весь сайт. Но они ведь могут и под обычных юзеров мимикрировать. Плюс это могу быть сканеры кого угодно. Те кто нас ддосил тоже делали похожие вещи долбя в тяжелые страницы.


Pzz>Ну вроде приличные из них понимают robots.txt. Может хоть их как-то ограничить?


а подобие iptables в винде есть? может забанить по ip самых жирных, да и хватит
Re[3]: Вроде ясна причина тормозов
От: VladD2 Российская Империя www.nemerle.org
Дата: 23.03.26 15:26
Оценка:
Здравствуйте, bnk, Вы писали:

bnk>А у вас с ним какие теперь отношения после двух политик — вы вообще больше не разговариваете что ли?


Ну почему, разговариваем по мессенджерам иногда.
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re[4]: Вроде ясна причина тормозов
От: VladD2 Российская Империя www.nemerle.org
Дата: 23.03.26 15:26
Оценка:
Здравствуйте, Pzz, Вы писали:

Pzz>Ну вроде приличные из них понимают robots.txt. Может хоть их как-то ограничить?


Если бы я понимал, что с ними делать...
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re[5]: Вроде ясна причина тормозов
От: bnk СССР http://unmanagedvisio.com/
Дата: 23.03.26 15:30
Оценка:
Здравствуйте, wl., Вы писали:

wl.>а подобие iptables в винде есть? может забанить по ip самых жирных, да и хватит


Там не один IP, у алибабы например там несколько датацентров с AI-ботами

Вот например robots.txt против AI-ботов
https://github.com/ai-robots-txt/ai.robots.txt

мой robots.txt против них же
  robots.txt
User-agent: PerplexityBot
Disallow: /

User-agent: CCBot
Disallow: /

User-agent: ChatGPT-User
Disallow: /

User-agent: GPTBot
Disallow: /

User-agent: Applebot-Extended 
Disallow: /

User-agent: anthropic-ai
Disallow: /

User-agent: ClaudeBot 
Disallow: /

User-agent: Omgilibot
Disallow: /

User-agent: Omgili
Disallow: /

User-agent: FacebookBot
Disallow: /

User-agent: Diffbot
Disallow: /

User-agent: DuckAssistBot
Disallow: /

User-agent: AI2Bot
Disallow: /

User-agent: Bytespider
Disallow: /

User-agent: Kangaroo Bot
Disallow: /

User-agent: PanguBot
Disallow: /

User-agent: ImagesiftBot 
Disallow: /

User-agent: PerplexityBot
Disallow: /

User-agent: cohere-ai
Disallow: /

User-agent: cohere-training-data-crawler
Disallow: /

User-agent: Meta-ExternalAgent
Disallow: /

User-agent: Meta-ExternalFetcher
Disallow: /

User-agent: Timpibot
Disallow: /

User-agent: Webzio-Extended
Disallow: /

User-agent: YouBot
Disallow: /

User-agent: MJ12bot
Disallow: /
Re[5]: Вроде ясна причина тормозов
От: Pzz Россия https://github.com/alexpevzner
Дата: 23.03.26 15:38
Оценка:
Здравствуйте, wl., Вы писали:

Pzz>>Ну вроде приличные из них понимают robots.txt. Может хоть их как-то ограничить?


wl.>а подобие iptables в винде есть? может забанить по ip самых жирных, да и хватит


В венде есть firewall.

У самых жирных много адресов.
Re[6]: Вроде ясна причина тормозов
От: VladD2 Российская Империя www.nemerle.org
Дата: 23.03.26 16:00
Оценка:
Здравствуйте, Pzz, Вы писали:

Pzz>Положи в корень robots.txt вот с таким содержимым:


Он наверняка есть.

Pzz>
Pzz>User-agent: *
Pzz>Disallow: /
Pzz>


И что? Лишаемся любой индикации поисковиками?
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re[7]: Вроде ясна причина тормозов
От: Pzz Россия https://github.com/alexpevzner
Дата: 23.03.26 16:31
Оценка:
Здравствуйте, bnk, Вы писали:

bnk>Тогда же вообще ничего индексироваться не будет. Я бы только AI-ботов забанил, от них больше всего вреда IMHO.


Ну да. Но ИМХО лучше чтобы не индексировалось, чем чтобы ничего не работало.

Я бы начал с такого варианта. Может он вообще не поможет, тогда в эту сторону можно дальше и не копать. А если поможет, можно уже поиграть с настройками в сторону ослабления ограничений.
Re[6]: Вроде ясна причина тормозов
От: Stanislaw K СССР  
Дата: 23.03.26 17:17
Оценка:
Здравствуйте, Pzz, Вы писали:

Pzz>В венде есть firewall.


Pzz>У самых жирных много адресов.


Можно подсетями AS банить.
Все проблемы от жадности и глупости
Re: Звдеплоили?
От: Wolverrum Ниоткуда  
Дата: 23.03.26 19:34
Оценка:
Здравствуйте, VladD2,

ща натурально летает
Re[5]: Вроде ясна причина тормозов
От: VladD2 Российская Империя www.nemerle.org
Дата: 23.03.26 22:40
Оценка:
Здравствуйте, wl., Вы писали:

wl.>а подобие iptables в винде есть? может забанить по ip самых жирных, да и хватит


Еще надо понять кого банить. Плюс еще Яндекс с Гуглем не забанить. Вообще у нас тут Гникс. Начерно через него можно полмира забанить.
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re: Вроде ясна причина тормозов
От: σ  
Дата: 24.03.26 00:25
Оценка:
VD>Похоже у нас очень плохо написан запрос пэдженеции для форумов. Когда страница очень глубокая это приводит к диким тормозам. Новый индекс это несколько улучшил. Но основная проблема осталась.

VD>Надо править код. Там кто-то лютых вложенных запросов нахерачил. Запрос с:

VD>
WHERE
    t1.rn BETWEEN 40226 AND 40245

VD>выполняется по 20 секунд и жрет процессор как не в себя.
VD>Запрос редкостной глупости. Вместо того, чтобы сначала выбрать сроки и потом для них считать что-то, происходит скан всех записей до 40226 с массой вложенных запросов к другим таблицам.

Вайбкодинг. Итоги.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.