Гардрейл для текста

Классифицирует ввод как safe или unsafe и подсвечивает спаны, которые модель бы заредактировала. Joint sequence + token-level голова, обученная на курированном safety-корпусе.

Запрос

Отправьте текст, чтобы увидеть вердикт модели.