Здравствуйте, Kocur, Вы писали:
K>Посоветуйте, пожалуйста, бесплатную и удобную нейронку, которая делает хорошие обложки для книг.
Кажется, что для нейронок это очень сложная штука — генерировать корректный текст. Не так давно начали хвастаться лидеры, что они этого добились. А тут не просто текст, но ещё и книжную обложку. Удачи в поисках!
Здравствуйте, Nuzhny, Вы писали:
N>Кажется, что для нейронок это очень сложная штука — генерировать корректный текст. Не так давно начали хвастаться лидеры, что они этого добились. А тут не просто текст, но ещё и книжную обложку. Удачи в поисках!
а если просто без текста? текст я могу сам присобачить в Гимпе
Здравствуйте, Kocur, Вы писали:
K>Здравствуйте, Nuzhny, Вы писали:
N>>Кажется, что для нейронок это очень сложная штука — генерировать корректный текст. Не так давно начали хвастаться лидеры, что они этого добились. А тут не просто текст, но ещё и книжную обложку. Удачи в поисках!
K>а если просто без текста? текст я могу сам присобачить в Гимпе
Попробуй Fooocus. Он локально ставится прямо скриптом с гитхаба. Возможно подойдёт то, что приходит по умолчанию, но можно играться с моделями и надмоделями (не помню как называется)
D>Попробуй Fooocus. Он локально ставится прямо скриптом с гитхаба. Возможно подойдёт то, что приходит по умолчанию, но можно играться с моделями и надмоделями
H>>Qwen Image K>а что это, если подробнее? Веб-сервис, программа, дискорд-канал?
На картинке у Hоmunculus — ComfyUI — это такой комбайн-всемогутор, универсальная IDE для пользователя современных нейросетей. Я его тоже максимально рекомендую из-за тотальной универсальности. Это локальное веб-приложение на python, которое позволяет запускать любые конвейеры обработки данных. Не только изображений, но и видео, и звука, да и свои тоже. Навайбкодить свою ноду для comfy вопрос 10 минут с почти любой LLM в обнимку.
Такие конвейеры в comfy называются workflow. Workflow — это последовательности нод, обрабатывающих данные, и связей между ними, определяющих из какой ноды в какую что будет передаваться.
Приятной фишкой comfyui является то, что любая сгенерированная картинка прямо в себе, в метаданных, хранит весь workflow и параметры генерации. Просто перетягиваешь понравившуюся на интерфейс, и она открывается. Таким образом можно быстро учиться на прикольных образцах, находить интересные решения, и т.д.
Qwen Image — это одна из множества моделей, из числа новых и хорошо умеющих в текст. Её можно бесплатно скачать и запустить локально. Нужно только иметь приличную видеокарту (16 Gb VRAM наверное минимум), ну или запастить терпением, потому что на процессоре генерация очень медленная.
Здравствуйте, Kocur, Вы писали:
K>у гопоты неплохо получился алфавит. А какой промпт использовал?
Это с r/chatgpt
Там эту задачку периодически задают новым моделям. Сливается где-то на пятой-десятой букве.
nanobanana генерирует поштучно для каждой буквы по дефолту чтобы не позориться