Просто обучение с нуля мало интересно, т.к. никаких практических задач под это не видно. Вернее это уже пробовал и понял что чуда не получается, нет ресурсов для чуда — одному человеку в принципе ничего интересного нельзя сделать.
Вот есть готовые модельки, на которые уже потрачены миллионы долларов. Вот та же LLaMA и Stable Diffusion. Хотелось бы их поковырять, попробовать как-то дообучить и посмотреть что получится.