Индекс форумов |
Исходное сообщение |
---|
"ArtPrompt - атака на AI-системы, позволяющая обойти фильтры ..." Отправлено Аноним, 03-Мрт-24 12:52 |
Цензурастов в очередной раз повертели. Делюсь своим способом обхода навесного фильтра в OpenAI (moderation API, которое юзают другие нейросети для цензуры). Так как LLM являются фактически AGI, и для цензуры обычно используется та же модель, что и для ответов, просто со специфическим входным промптом вроде 'если вопрос касается таких-то вещей, то выведи "отказать", иначе — выведи "пропустить"', то мы можем ... уговорить цензора пропустить наш вопрос. |
При общении не допускается: неуважительное отношение к собеседнику, хамство, унизительное обращение, ненормативная лексика, переход на личности, агрессивное поведение, обесценивание собеседника, провоцирование флейма голословными и заведомо ложными заявлениями. Не отвечайте на сообщения, явно нарушающие правила - удаляются не только сами нарушения, но и все ответы на них. Лог модерирования. |
Закладки на сайте Проследить за страницей |
Created 1996-2024 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |