Сообщение Re[2]: LLM без цензуры - возможно ли? от 24.04.2026 15:37
Изменено 24.04.2026 15:41 GlebЗ
Re[2]: LLM без цензуры - возможно ли?
Здравствуйте, VladD2, Вы писали:
VD>Ну, и можно всегда попытаться обойти цензуру тупо обманывая модель. Вся защита строится на системных промтах.
Не так. Это часть обучения. Сначала идет обучение без учителя, внедряют весь интернет, почти нечищенный(почистить это невозможно). В этот момент сеть экстремист, расист, матершинник и женоненавистник. Затем идет обучение с учителем. Там его доучивают человечности.
Unsensored модели — это дополнительное обучение, но так как в весах оно уже есть, это работает эффективно.
При этом в больших моделях на входе и на выходе ставят специальные модели guardrails. Эти сволочи отсеивают и охраняют, особенно от prompt injection
VD>Ну, и можно всегда попытаться обойти цензуру тупо обманывая модель. Вся защита строится на системных промтах.
Не так. Это часть обучения. Сначала идет обучение без учителя, внедряют весь интернет, почти нечищенный(почистить это невозможно). В этот момент сеть экстремист, расист, матершинник и женоненавистник. Затем идет обучение с учителем. Там его доучивают человечности.
Unsensored модели — это дополнительное обучение, но так как в весах оно уже есть, это работает эффективно.
При этом в больших моделях на входе и на выходе ставят специальные модели guardrails. Эти сволочи отсеивают и охраняют, особенно от prompt injection
Re[2]: LLM без цензуры - возможно ли?
Здравствуйте, VladD2, Вы писали:
VD>Ну, и можно всегда попытаться обойти цензуру тупо обманывая модель. Вся защита строится на системных промтах.
Не так. Это часть обучения. Сначала идет обучение без учителя, внедряют весь интернет, почти нечищенный(почистить это невозможно). В этот момент сеть экстремист, расист, матершинник и женоненавистник. Затем идет обучение с учителем. Там его доучивают человечности.
Unsensored модели — это дополнительное обучение, но так как в весах оно уже есть, дообучение/finetuning работает эффективно.
При этом в больших моделях на входе и на выходе ставят специальные модели guardrails. Эти сволочи отсеивают и охраняют, особенно от prompt injection
VD>Ну, и можно всегда попытаться обойти цензуру тупо обманывая модель. Вся защита строится на системных промтах.
Не так. Это часть обучения. Сначала идет обучение без учителя, внедряют весь интернет, почти нечищенный(почистить это невозможно). В этот момент сеть экстремист, расист, матершинник и женоненавистник. Затем идет обучение с учителем. Там его доучивают человечности.
Unsensored модели — это дополнительное обучение, но так как в весах оно уже есть, дообучение/finetuning работает эффективно.
При этом в больших моделях на входе и на выходе ставят специальные модели guardrails. Эти сволочи отсеивают и охраняют, особенно от prompt injection