LLM에 개인정보를
보내지 마세요.

코드 한 줄 변경으로, LLM이 개인정보를 절대 보지 못하게.
자동 탐지, 토큰화, 복원까지 한 번에.

위험
// 원본 텍스트
김철수님의 주민번호 850101-1234567
전화번호는 010-1234-5678이고
이메일은 kim@company.kr
안전
// LLM에 전송
[[PERSON_a3f1]]님의 주민번호 [[RRN_b7c2]]
전화번호는 [[PHONE_d4e5]]이고
이메일은 [[EMAIL_f6a8]]

도입은 이게 전부입니다

# 한 줄만 변경
base_url = "https://api.openai.com/v1"
base_url = "https://pii-gateway.zent.kr/v1"
All-in-One

LLM Gateway

URL만 바꾸면 개인정보 보호가 자동 적용되는 프록시.

POST /v1/chat/completions

PII Encoding

개인정보 토큰 치환과 원본 복원 독립 API.

POST /v1/encode · /v1/decode

PII Detecting

탐지만 수행. 감사 로그, 컴플라이언스 체크.

POST /v1/detect
99.5%
탐지율 (Recall)
0.00%
오탐율 (FP Rate)
21종
PII 유형 탐지
56ms
평균 지연

4단계 하이브리드 PII 탐지 파이프라인

정규식만으로는 잡을 수 없는 한국어 개인정보를, AI와 문맥 분석을 결합해 정밀하게 탐지하고, BERT 검증기가 오탐을 걸러냅니다.

1

패턴 정규식 탐지

주민등록번호, 전화번호, 사업자번호 등 정형화된 개인정보를 고정밀 정규식으로 즉시 탐지합니다.

Luhn 검증 50+ 패턴 체크섬 검증
2

문맥 규칙 엔진

주변 텍스트의 의미론적 단서를 분석하여 단순 패턴으로 잡기 어려운 개인정보를 식별합니다.

시맨틱 렉시콘 N-gram 분석 네거티브 룰
3

한국어 NER 모델

한국어 특화 개체명인식 모델이 인명, 주소 등 비정형 개인정보를 딥러닝으로 탐지합니다.

Transformer NER 인명 3,500+ 한국어 특화
4

AI PII 검증기

NER이 탐지한 후보를 AI 분류기로 2차 검증하여 오탐을 제거합니다. 공유 encoder로 추가 지연 최소화.

공유 Encoder 경량 Head FP 0.00%

양방향 토큰화 & 복원

개인정보를 토큰으로 치환 후, LLM 응답에서 원본으로 자동 복원합니다.

  • AES-256 암호화 토큰 Vault
  • 요청별 격리된 토큰 맵
  • SSE 스트리밍 실시간 복원

파생 컨텍스트

원본 없이도 LLM이 추론할 수 있도록 안전한 메타 속성만 전달합니다.

  • 전화번호 → 유형, 지역 힌트
  • 주민번호 → 연령대, 성별
  • 이메일 → 제공자 유형

OpenAI 호환 프록시

베이스 URL만 변경하면 즉시 적용. 별도 SDK 불필요.

  • /v1/chat/completions 완전 호환
  • GPT, Claude, Gemini 등 모든 LLM 지원
  • 스트리밍 / 비스트리밍 모두 지원

온프레미스 배포

Docker로 자체 인프라에 설치. 외부로 데이터가 나가지 않습니다.

  • Docker Compose 원클릭 배포
  • 커스텀 PII 패턴 추가 가능
  • NER 모델 로컬 실행

성능 수치가 궁금하신가요?

벤치마크 결과 보기 →

직접 체험해보세요

텍스트를 입력하거나 예시를 선택하면, ZENT PII Gateway이 개인정보를 실시간으로 탐지합니다.

0자

투명한 성능, 검증된 수치

자체 테스트 데이터셋 기반 벤치마크입니다. 데이터셋 구성, 메트릭 정의, 한계를 모두 공개합니다.

99.5%
Macro Recall
200건 양성 기준
0.00%
FP Rate (오탐율)
380건 negative 기준
98.6%
Pass Rate
full 5,578건 기준
56ms
평균 Latency
CPU 추론 기준

PII 유형별 탐지율

주민등록번호
99.96%
계좌번호
100%
전화번호
99.56%
인명
99.50%
주소
99.29%
이메일
98.59%
사업자등록번호
100%
카드번호
99.87%
여권번호
99.80%
운전면허번호
100%

full 데이터셋 5,578건 기준. support 5건 미만 유형은 통계적 의미 제한으로 제외.

경쟁 솔루션 비교

솔루션 Pass Rate Recall FP Rate Latency
ZENT PII Gateway ours 98.5% 0.9949 0.00% 63ms
PIILOT Original 72.0% 0.6086 5.79% 38ms
Microsoft Presidio 4.0% 0.2108 32.11% 4ms
spaCy ko NER 4.0% 0.0000 0.00% 4ms

동일 데이터셋(positive 200건 + negative 380건) 기준. Presidio/spaCy는 한국어 최적화 미적용 상태.

벤치마크 투명성 안내

본 수치는 자체 생성 테스트 데이터(양성 200건 + 음성 380건) 기반이며, 외부 독립 평가는 아닙니다. Precision, Recall, F1 모두 측정하고 있으며, 양성 케이스의 라벨은 전수 검증을 통해 보강되었습니다. 데이터셋 구성, 메트릭 정의, 재현 방법은 벤치마크 리포트에서 확인하실 수 있습니다.

도입 방법을 알아보세요

Cloud API, 온프레미스, 커스텀 구축 등
기업 환경에 맞는 최적의 방안을 제안드립니다.

이메일 문의하기

contact@zent.kr