본문으로 건너뛰기
피드

AWS 덕후가 스팸 메일 처리용 AI를 만들었는데, 성격이 험악함

backend 약 6분
vote
0
댓글
북마크

Last Week in AWS의 Corey Quinn이 Claude + Lambda + SES로 성격 나쁜 AI 이메일 어시스턴트를 만든 이야기. 이메일을 6단계로 분류하고 Shadow mode로 사람이 승인한 후에만 발송하는 구조.

  • 1

    Cloudflare Email → Lambda(분류) → DynamoDB → Next.js 대시보드 → SES(발송) 아키텍처

  • 2

    Claude로 이메일 6단계 분류 + 초안 생성 + 성격 부여

  • 3

    Shadow mode로 모든 초안을 사람이 승인한 후 발송

  • 4

    Cloudflare Email Workers는 인증된 주소로만 발신 가능해서 SES로 전환

  • 5

    AI 슬롭의 베이지화에 대한 저항으로 의도적으로 개성 있는 톤을 설계

AWS 덕후가 스팸 메일 처리용 AI를 만들었는데, 성격이 좀 험악함

  • Last Week in AWS의 Corey Quinn이 스팸·영업 메일 처리를 위해 "Billie the Platypus"라는 AI 이메일 어시스턴트를 만든 이야기. 시스템 프롬프트 핵심 지시문이 압권: "네 에너지는 '이 이메일이 내가 직접 찾아가기 전에 너한테 도착했으면 좋겠다'야"

  • 만든 이유: EA(비서)는 너무 착해서 스팸에도 20분씩 정성 답장을 씀. 본인은 "브랜드 이미지"와 "평판" 때문에 직접 까칠한 답장을 못 씀. 그래서 Lambda 함수에 성격장애(?)를 심어놓은 거임

💡

> Claude Code 같은 도구 덕에 "팀 설득 → ROI 정당화 → 3개월 로드맵" 없이 주말에 혼자 뚝딱 만들 수 있는 시대. "이거 재밌겠다"에서 "어 프로덕션에 올라갔네"까지의 거리가 역대 최단이라는 거임

아키텍처 (당연히 AWS)

sequenceDiagram
    participant 발신자
    participant Cloudflare as Cloudflare Email
    participant Lambda as Lambda 분류기
    participant DynamoDB
    participant 대시보드 as Next.js 대시보드
    participant Claude
    participant SES as AWS SES
    participant Corey

    발신자->>Cloudflare: 이메일 발송
    Cloudflare->>Lambda: 이메일 전달
    Lambda->>Claude: 분류 요청
    Claude-->>Lambda: 티어 판정
    Lambda->>DynamoDB: 분류 결과 + 초안 저장
    대시보드->>DynamoDB: 대기 중인 초안 조회
    대시보드->>Claude: 초안 생성/재생성
    대시보드->>SES: 승인된 메일 발송
    SES->>발신자: 답장
    SES->>Corey: BCC (신뢰 부족)
  • 인바운드: Cloudflare Email Routing → Lambda → DynamoDB
  • 대시보드: Gmail API → Next.js (자기 방에 있는 k8s) → Claude → DynamoDB
  • 아웃바운드: 대시보드 → SES → 수신자 (+ BCC로 본인에게도. 본인 말로는 "신뢰 문제")

이메일 분류 체계

  • Tier 0 (트랜잭션): 비밀번호 재설정, 영수증 → Corey에게 전달

  • Tier 1 (스팸): 바로 블랙홀행

  • Tier 2 (저노력 영업): "프로필을 보고 연락드립니다…" → 기술적으로는 예의 바른 거절

  • Tier 3 (팟캐스트 요청): 대부분 거절이지만 팟캐스터는 진짜 사람이니 존중하며

  • Tier 4 (진짜 사람): 실제로 글을 읽고 연락한 사람 → 정성스럽게 답장

  • Tier 5 (아는 사람): 즉시 Corey에게 전달

  • Tier 99 (내부): 내부 메일 → Corey에게 전달

  • 분류도 Claude, 초안 생성도 Claude, 성격도 Claude. Anthropic한테 "협박성 이메일 대필비"를 내고 있는 셈

기술적 디테일

  • Cloudflare Email Workers는 "인증된 주소"로만 발신 가능해서 SES로 전환. 이메일 서비스인데 낯선 사람에게 답장을 못 보내는 건 좀…
  • SES는 SendRawEmail을 써야 커스텀 헤더(In-Reply-To, References) 설정 가능. 기본 SendEmail API로는 안 됨. "SES는 이메일 시스템이 아니라 이메일 시스템 조립 키트. SMTP용 이케아 같은 거"라는 표현이 찰떡
  • SES 프로덕션 승인은 1분 걸렸는데, SendGrid에서 사람 붙잡는 데는 47주 걸린다고 비꼼
  • Reply-To 헤더 파싱: 문의 폼은 보통 From: noreply@ / Reply-To: [email protected]인데, Reply-To를 제대로 추출해야 진짜 사람에게 답장이 감
  • 타임스탬프 주입: 시스템 프롬프트에 현재 시간을 넣어줘야 화요일에 "월요일 아침 커피" 운운하는 실수를 방지

왜 AI 성격을 일부러 험악하게 만들었나

  • AI 슬롭(slop)이 싫은 이유: 모든 ChatGPT 이메일이 똑같이 "전문적으로 밋밋하고, 누구도 불쾌하지 않게 최적화된" 엘리베이터 음악 같기 때문
  • AI가 꼭 베이지색일 필요는 없음. 쓸 거면 두 가지 선택지가 있는데: 보이지 않게 하거나(지루함), 적절히 미친 척하거나(다시 재밌어짐)
  • "AI 콘텐츠를 남의 메일함에 쏟아부을 거면, 최소한 기억에 남을 정도로 이상하게 만드는 게 예의". 인터넷의 베이지화에 대한 소소한 저항이라는 거임

Shadow Mode의 중요성

  • 모든 초안은 사람이 승인해야 발송됨. 프롬프트 인젝션 걱정? Shadow mode가 있으니 최악의 경우 30초 낭비로 끝남
  • 오퍼레이터 컨텍스트 패널: "이번 분기 스폰서십 안 받음" 같은 메모를 넣으면 코드 수정 없이 Billie의 상황 인식이 업데이트됨

기술 블로그를 빙자한 코미디이지만, Claude Code로 주말에 프로덕션 서비스를 뚝딱 만드는 시대의 단면을 잘 보여줌.

댓글

댓글

댓글을 불러오는 중...

backend

Go에서 Rust로 옮길 때 진짜로 바뀌는 것들

이 글은 Go 백엔드 서비스를 Rust로 옮길 때 속도보다 컴파일 타임 보장, 런타임 트레이드오프, 개발자 경험이 더 중요하다고 설명한다. nil 패닉, 데이터 레이스, 에러 처리, 제네릭, 비동기 모델, 마이그레이션 전략까지 실무 관점에서 Go와 Rust를 길게 비교한다.

backend

Python 3.15에서 헤드라인은 못 탔지만 꽤 쓸만한 기능들

Python 3.15에는 lazy imports나 Tachyon profiler 같은 큰 기능 말고도 실무에서 바로 체감될 만한 작은 개선들이 들어가. TaskGroup 취소, 컨텍스트 매니저 데코레이터 개선, 스레드 안전 이터레이터처럼 평소 애매하게 불편했던 지점들이 꽤 깔끔해졌어.

backend

심평원, DUR부터 의료영상 심사까지 클라우드로 갈아엎는다

심평원이 정보시스템 클라우드 전환과 함께 병·의원 업무에 직접 닿는 DUR, 의료영상 AI 심사, 요양급여내역 조회 시스템을 고도화한다. 핵심은 설치형 프로그램 중심이던 연계를 웹과 API 기반으로 넓히고, 진료·청구 과정에서 실시간 확인과 자동 판독을 강화하는 쪽이다.

backend

윈도우 에러 코드 7번 ‘ERROR_ARENA_TRASHED’는 어디서 왔을까

ERROR_ARENA_TRASHED는 Win32에서 실제로 쓰이는 현대적 에러라기보다 MS-DOS 시절 메모리 관리 구조에서 넘어온 잔재야. MS-DOS가 메모리 블록 앞의 arena 시그니처를 훑다가 예상한 값이 아니면 ‘arena가 망가졌다’고 보고 이 에러를 냈다는 이야기야.

backend

C/C++ 컴파일러의 느슨한 메모리 동시성 버그를 자동으로 잡는 박사논문

C와 C++ 컴파일러에서 relaxed memory 동시성 버그를 찾는 자동 테스트 프레임워크를 다룬 박사논문이 공개됐어. Téléchat, Atomic-mixer 같은 도구로 소스 수준 동작과 컴파일된 프로그램 동작을 비교하고, LLVM과 GCC 툴체인에서 실제 버그를 찾아낸 내용이 핵심이야.