Re: Посоветуйте нейронку - Искусственный интеллект

Здравствуйте, Kocur, Вы писали:

K>Посоветуйте, пожалуйста, бесплатную и удобную нейронку, которая делает хорошие обложки для книг.

Кажется, что для нейронок это очень сложная штука — генерировать корректный текст. Не так давно начали хвастаться лидеры, что они этого добились. А тут не просто текст, но ещё и книжную обложку. Удачи в поисках!

Здравствуйте, Nuzhny, Вы писали:

N>Кажется, что для нейронок это очень сложная штука — генерировать корректный текст. Не так давно начали хвастаться лидеры, что они этого добились. А тут не просто текст, но ещё и книжную обложку. Удачи в поисках!

а если просто без текста? текст я могу сам присобачить в Гимпе

Здравствуйте, Kocur, Вы писали:

K>Здравствуйте, Nuzhny, Вы писали:

N>>Кажется, что для нейронок это очень сложная штука — генерировать корректный текст. Не так давно начали хвастаться лидеры, что они этого добились. А тут не просто текст, но ещё и книжную обложку. Удачи в поисках!

K>а если просто без текста? текст я могу сам присобачить в Гимпе

Попробуй Fooocus. Он локально ставится прямо скриптом с гитхаба. Возможно подойдёт то, что приходит по умолчанию, но можно играться с моделями и надмоделями (не помню как называется)

https://github.com/lllyasviel/Fooocus

Здравствуйте, Doom100500, Вы писали:

D>Попробуй Fooocus. Он локально ставится прямо скриптом с гитхаба. Возможно подойдёт то, что приходит по умолчанию, но можно играться с моделями и надмоделями

спасибо, попробую

Здравствуйте, Kocur, Вы писали:

K>Посоветуйте, пожалуйста, бесплатную и удобную нейронку, которая делает хорошие обложки для книг.

Qwen Image

Здравствуйте, Hоmunculus, Вы писали:

H>Qwen Image

а что это, если подробнее? Веб-сервис, программа, дискорд-канал?

H>>Qwen Image
K>а что это, если подробнее? Веб-сервис, программа, дискорд-канал?

На картинке у Hоmunculus — ComfyUI — это такой комбайн-всемогутор, универсальная IDE для пользователя современных нейросетей. Я его тоже максимально рекомендую из-за тотальной универсальности. Это локальное веб-приложение на python, которое позволяет запускать любые конвейеры обработки данных. Не только изображений, но и видео, и звука, да и свои тоже. Навайбкодить свою ноду для comfy вопрос 10 минут с почти любой LLM в обнимку.

Такие конвейеры в comfy называются workflow. Workflow — это последовательности нод, обрабатывающих данные, и связей между ними, определяющих из какой ноды в какую что будет передаваться.

Приятной фишкой comfyui является то, что любая сгенерированная картинка прямо в себе, в метаданных, хранит весь workflow и параметры генерации. Просто перетягиваешь понравившуюся на интерфейс, и она открывается. Таким образом можно быстро учиться на прикольных образцах, находить интересные решения, и т.д.

Qwen Image — это одна из множества моделей, из числа новых и хорошо умеющих в текст. Её можно бесплатно скачать и запустить локально. Нужно только иметь приличную видеокарту (16 Gb VRAM наверное минимум), ну или запастить терпением, потому что на процессоре генерация очень медленная.

Вот описание этой модели на сайте ComfyUI:

https://docs.comfy.org/tutorials/image/qwen/qwen-image

Здравствуйте, Kocur, Вы писали:

K>Посоветуйте, пожалуйста, бесплатную и удобную нейронку, которая делает хорошие обложки для книг.

nano banana (последнее изобретение от Google) хвалят. Может инкрементно редактировать изображения, добавляя или убирая элементы.

https://aistudio.google.com/prompts/new_chat?model=gemini-2.5-flash-image-preview

Хотя попробовал — "тест азбуки" (сгенерируй детскую азбуку) по-прежнему генерирует бред, даже хуже GPT.

GPT

Здравствуйте, bnk, Вы писали:]

bnk>GPT

у гопоты неплохо получился алфавит. А какой промпт использовал?

Здравствуйте, Kocur, Вы писали:

K>у гопоты неплохо получился алфавит. А какой промпт использовал?

Это с r/chatgpt
Там эту задачку периодически задают новым моделям. Сливается где-то на пятой-десятой букве.
nanobanana генерирует поштучно для каждой буквы по дефолту чтобы не позориться

https://www.reddit.com/r/ChatGPT/comments/1likt7a/i_asked_chatgpt_to_make_an_alphabet_chart_for/

	От:	Kocur
	Дата:	26.08.25 14:18
	Оценка:	+1

От:	Nuzhny	https://github.com/Nuzhny007
Дата:	26.08.25 19:04
Оценка:

	От:	Kocur
	Дата:	27.08.25 06:13
	Оценка:

	От:	Doom100500
	Дата:	27.08.25 07:50
	Оценка:

	От:	Kocur
	Дата:	27.08.25 10:43
	Оценка:

	От:	hi_octane
	Дата:	03.09.25 20:47
	Оценка:	8 (1) +1

От:	bnk	http://unmanagedvisio.com/
Дата:	03.09.25 21:28
Оценка: