게시판 즐겨찾기
편집
드래그 앤 드롭으로
즐겨찾기 아이콘 위치 수정이 가능합니다.
LLM 탈옥에 필요한 두개의 방어선을 뚫다. Super Suffix
게시물ID : it_7453짧은주소 복사하기
작성자 : 하늘가는겨?
추천 : 0
조회수 : 420회
댓글수 : 0개
등록시간 : 2025/12/19 06:59:54

LLM 안전 정렬 (HLRF등을 이용한 ~하지 마라잉.) 과 외부 감시 모델(프롬프트 불손하면 잡음)을 동시에 뚫는 '슈퍼 접미사' 가능성 보여줌


두 방어선을 모두 속이는 이 기법에 맞서려면, 모델 내부 상태의 흔적을 감시하는 새로운 심층 방어 체계 구축이 필요.

 

OSS LLM 서비스 개발자 분들에게는 필요한 내용입니다. 

 

 

 


참고

전체 추천리스트 보기
새로운 댓글이 없습니다.
새로운 댓글 확인하기
글쓰기
◀뒤로가기
PC버전
맨위로▲
공지 운영 자료창고 청소년보호