LLM 개인정보 보호 게이트웨이

LLM에 개인정보를
보내지 마세요.

코드 한 줄 변경으로, LLM이 개인정보를 절대 보지 못하게.
자동 탐지, 토큰화, 복원까지 한 번에.

데모 체험하기 기술 소개

위험

// 원본 텍스트

김철수님의 주민번호 850101-1234567로
전화번호는 010-1234-5678이고
이메일은 kim@company.kr

안전

// LLM에 전송

[[PERSON_a3f1]]님의 주민번호 [[RRN_b7c2]]로
전화번호는 [[PHONE_d4e5]]이고
이메일은 [[EMAIL_f6a8]]

도입은 이게 전부입니다

# 한 줄만 변경

base_url = "https://api.openai.com/v1"

base_url = "https://pii-gateway.zent.kr/v1"

제공 유형

All-in-One

LLM Gateway

URL만 바꾸면 개인정보 보호가 자동 적용되는 프록시.

POST /v1/chat/completions

PII Encoding

개인정보 토큰 치환과 원본 복원 독립 API.

POST /v1/encode · /v1/decode

PII Detecting

탐지만 수행. 감사 로그, 컴플라이언스 체크.

POST /v1/detect

99.5%

탐지율 (Recall)

0.00%

오탐율 (FP Rate)

21종

PII 유형 탐지

56ms

평균 지연

핵심 기술

4단계 하이브리드 PII 탐지 파이프라인

정규식만으로는 잡을 수 없는 한국어 개인정보를, AI와 문맥 분석을 결합해 정밀하게 탐지하고, BERT 검증기가 오탐을 걸러냅니다.

패턴 정규식 탐지

주민등록번호, 전화번호, 사업자번호 등 정형화된 개인정보를 고정밀 정규식으로 즉시 탐지합니다.

Luhn 검증 50+ 패턴 체크섬 검증

문맥 규칙 엔진

주변 텍스트의 의미론적 단서를 분석하여 단순 패턴으로 잡기 어려운 개인정보를 식별합니다.

시맨틱 렉시콘 N-gram 분석 네거티브 룰

한국어 NER 모델

한국어 특화 개체명인식 모델이 인명, 주소 등 비정형 개인정보를 딥러닝으로 탐지합니다.

Transformer NER 인명 3,500+ 한국어 특화

AI PII 검증기

NER이 탐지한 후보를 AI 분류기로 2차 검증하여 오탐을 제거합니다. 공유 encoder로 추가 지연 최소화.

공유 Encoder 경량 Head FP 0.00%

아키텍처

양방향 토큰화 & 복원

개인정보를 토큰으로 치환 후, LLM 응답에서 원본으로 자동 복원합니다.

AES-256 암호화 토큰 Vault
요청별 격리된 토큰 맵
SSE 스트리밍 실시간 복원

파생 컨텍스트

원본 없이도 LLM이 추론할 수 있도록 안전한 메타 속성만 전달합니다.

전화번호 → 유형, 지역 힌트
주민번호 → 연령대, 성별
이메일 → 제공자 유형

OpenAI 호환 프록시

베이스 URL만 변경하면 즉시 적용. 별도 SDK 불필요.

/v1/chat/completions 완전 호환
GPT, Claude, Gemini 등 모든 LLM 지원
스트리밍 / 비스트리밍 모두 지원

온프레미스 배포

Docker로 자체 인프라에 설치. 외부로 데이터가 나가지 않습니다.

Docker Compose 원클릭 배포
커스텀 PII 패턴 추가 가능
NER 모델 로컬 실행

성능 수치가 궁금하신가요?

벤치마크 결과 보기 →

인터랙티브 데모

직접 체험해보세요

텍스트를 입력하거나 예시를 선택하면, ZENT PII Gateway이 개인정보를 실시간으로 탐지합니다.

0자

벤치마크

투명한 성능, 검증된 수치

자체 테스트 데이터셋 기반 벤치마크입니다. 데이터셋 구성, 메트릭 정의, 한계를 모두 공개합니다.

99.5%

Macro Recall

200건 양성 기준

0.00%

FP Rate (오탐율)

380건 negative 기준

98.6%

Pass Rate

full 5,578건 기준

56ms

평균 Latency

CPU 추론 기준

PII 유형별 탐지율

주민등록번호

99.96%

계좌번호

100%

전화번호

99.56%

인명

99.50%

주소

99.29%

이메일

98.59%

사업자등록번호

100%

카드번호

99.87%

여권번호

99.80%

운전면허번호

100%

full 데이터셋 5,578건 기준. support 5건 미만 유형은 통계적 의미 제한으로 제외.

경쟁 솔루션 비교

솔루션	Pass Rate	Recall	FP Rate	Latency
ZENT PII Gateway ours	98.5%	0.9949	0.00%	63ms
PIILOT Original	72.0%	0.6086	5.79%	38ms
Microsoft Presidio	4.0%	0.2108	32.11%	4ms
spaCy ko NER	4.0%	0.0000	0.00%	4ms

동일 데이터셋(positive 200건 + negative 380건) 기준. Presidio/spaCy는 한국어 최적화 미적용 상태.

벤치마크 투명성 안내

본 수치는 자체 생성 테스트 데이터(양성 200건 + 음성 380건) 기반이며, 외부 독립 평가는 아닙니다. Precision, Recall, F1 모두 측정하고 있으며, 양성 케이스의 라벨은 전수 검증을 통해 보강되었습니다. 데이터셋 구성, 메트릭 정의, 재현 방법은 벤치마크 리포트에서 확인하실 수 있습니다.

LLM에 개인정보를
보내지 마세요.

LLM Gateway

PII Encoding

PII Detecting

4단계 하이브리드 PII 탐지 파이프라인

패턴 정규식 탐지

문맥 규칙 엔진

한국어 NER 모델

AI PII 검증기

양방향 토큰화 & 복원

파생 컨텍스트

OpenAI 호환 프록시

온프레미스 배포

직접 체험해보세요

원본 텍스트

토큰화된 텍스트

탐지 결과

파생 컨텍스트

투명한 성능, 검증된 수치

PII 유형별 탐지율

경쟁 솔루션 비교

도입 방법을 알아보세요

LLM에 개인정보를보내지 마세요.

LLM Gateway

PII Encoding

PII Detecting

4단계 하이브리드 PII 탐지 파이프라인

패턴 정규식 탐지

문맥 규칙 엔진

한국어 NER 모델

AI PII 검증기

양방향 토큰화 & 복원

파생 컨텍스트

OpenAI 호환 프록시

온프레미스 배포

직접 체험해보세요

원본 텍스트

토큰화된 텍스트

탐지 결과

파생 컨텍스트

투명한 성능, 검증된 수치

PII 유형별 탐지율

경쟁 솔루션 비교

도입 방법을 알아보세요

LLM에 개인정보를
보내지 마세요.