PD>Но не 140 тысяч же!
Ах да, в дополнение к ответу. На вот этом видео можно посмотреть как Stable Diffusion учится с 6 фотографий не просто запоминать, а ещё и рисовать конкретного человека. Причём на вполне потребительской видеокарте и за считанные минуты. Кластер на мегават не нужен. Так что не вижу повода для меланхолии.
https://www.youtube.com/watch?v=jepK6ufemMw&t=1855s