LLM 탈옥에 필요한 두개의 방어선을 뚫다. Super Suffix

게시판 즐겨찾기

편집

드래그 앤 드롭으로
즐겨찾기 아이콘 위치 수정이 가능합니다.

게시물ID : it_7453짧은주소 복사하기
작성자 : 하늘가는겨?★
추천 : 0
조회수 : 420회
댓글수 : 0개
등록시간 : 2025/12/19 06:59:54

LLM 안전 정렬 (HLRF등을 이용한 ~하지 마라잉.) 과 외부 감시 모델(프롬프트 불손하면 잡음)을 동시에 뚫는 '슈퍼 접미사' 가능성 보여줌

두 방어선을 모두 속이는 이 기법에 맞서려면, 모델 내부 상태의 흔적을 감시하는 새로운 심층 방어 체계 구축이 필요.

OSS LLM 서비스 개발자 분들에게는 필요한 내용입니다.

전체 추천리스트 보기

새로운 댓글이 없습니다.

새로운 댓글 확인하기

데이터절약모드

◀뒤로가기

PC버전

맨위로▲