Docs | Src |   A-  |  A+   | -/-

Metadata
sourcehttps://www.martinfowler.com/bliki/Datensparsamkeit.html
created2026-05-04
byopenai:gpt-5.4

bliki: 데이터 절제

데이터 절제(Datensparsamkeit)

데이터 절제(Datensparsamkeit)는 영어로는 제대로 옮기기 어려운 독일어 단어다. 데이터를 수집하고 저장하는 방식에 대한 태도를 가리키며, 정말로 필요한 데이터만 다뤄야 한다는 뜻이다.

요즘은 빅데이터(Big Data)라는 개념이 크게 주목받고 있다. 그와 함께 손에 넣을 수 있는 데이터는 무엇이든 모조리 수집하고 저장해야 한다는 생각도 퍼져 있다. 당장 사용자가 주소록에 저장한 연락처를 쓸 일이 없더라도, 나중에 쓸모가 있을지 모르니 일단 요청한다. 웹사이트에서 발생하는 모든 클릭을 기록해 두고, 나중에 뒤져 볼 일이 생길 때를 대비해 쌓아 둔다. 스마트폰 앱에서는 위치 정보를 요청해 둔다. 혹시 나중에 그 데이터를 활용할 방법이 떠오를지 모르기 때문이다. 어차피 저장 공간은 싸니, 안 할 이유가 없다고 여긴다.

문제는 이런 “모조리 수집하라(capture-it-all)” 방식이 심각한 프라이버시 문제를 낳는다는 점이다. 우리가 수집한 데이터를 스스로 악용하지 않는다고 믿더라도, 데이터 저장소 하나하나는 범죄자나 정부 감시 기관의 표적이 된다. 이 문제는 특히 독일에서 더 민감하다. 독일은 시민을 통제하려고 정부가 광범위한 감시를 벌였던 정권을 여러 차례 겪었기 때문이다. 그래서 독일에는 강력한 개인정보 보호법이 있다.

데이터 절제(Datensparsamkeit) 1은 이런 개인정보 보호법에서 나온 개념으로, “모든 것을 수집하라(capture-all-the-things)”와는 정반대의 철학이다. 번역은 쉽지 않아서(그래서 독일어 원어를 그대로 쓴다) 느슨하게는 “데이터 긴축”, “데이터 최소화”, “데이터 절약”, “데이터 검소함” 정도로 옮길 수 있다 2. 핵심은 데이터를 왜 수집하고 저장하는지 늘 자문하고, 목적을 이루는 데 필요한 최소한의 데이터만 다루라는 뜻이다.

1: 발음은 여기를 참고하라.

2: 이 글을 처음 쓴 뒤 이 원칙은 훨씬 더 큰 주목을 받게 됐다. 특히 유럽연합의 GDPR 규정이 도입되면서 더욱 그랬다. 이 맥락에서는 이 개념을 데이터 최소화(Data Minimization)라고 부르는 경우를 점점 더 자주 듣는다. 다만 이 페이지는 당분간 원래 제목을 유지하겠다.

예를 들어 웹사이트에서 사용자를 추적해 순 방문자 수를 계산한다고 하자. 같은 사람이 몇 시간 안에 여러 페이지에 들어오더라도 방문 한 번으로 세고 싶다. 한 달 동안 여러 번 방문하더라도 여전히 한 명의 방문자로만 집계하고 싶다. 이를 처리하는 한 가지 방법은 IP 주소를 기록하고, 각 IP 주소를 한 사람으로 간주하는 것이다 3. 하지만 IP 주소는 많은 정보를 드러내며, 방문자 수 집계 외의 훨씬 많은 용도로 쓰일 수 있다. 데이터 절제(Datensparsamkeit)의 관점에서는 IP 주소 자체를 그대로 저장하지 말아야 한다. 대신 해시(hash) 처리한 뒤 해시값만 저장하는 편이 낫다.

3: 네트워크 주소 변환(Network Address Translation) 때문에 실제로는 이보다 훨씬 복잡하다는 점은 알고 있다. 다만 여기서는 단순한 예가 필요했다.

IP 주소와 관련된 비슷한 사례로, IP를 이용해 지역이나 국가 같은 인구통계 정보를 추정하는 경우가 있다. 이런 경우 IP 주소의 앞 세 옥텟(octet)만 기록해도 대부분의 정보를 얻을 수 있으며, 동시에 데이터 절제(Datensparsamkeit) 원칙도 지킬 수 있다.

데이터 절제(Datensparsamkeit)는 단지 나쁜 사람들이 데이터를 훔쳐 가는 문제만을 뜻하지 않는다. 데이터를 수집하는 기업과 사용자 사이의 관계와도 관련이 있다. 지금의 기본 태도는, 사용자가 만들어 낸 데이터는 수집한 쪽이 자유롭게 이용할 수 있을 뿐 아니라 그들의 가치 있는 상업적 자산이 되기까지 한다는 것이다. 나를 포함한 프라이버시 옹호자들은 이런 전제가 바뀌어야 한다고 본다. 기업은 필요한 것만 수집해야 하며, 왜 그것이 필요한지 입증할 책임도 기업에 있어야 한다. 물론 그에 더해 무엇을 수집하는지, 무엇을 저장하는지, 누구와 데이터를 공유하는지도 완전히 투명하게 밝혀야 한다. 데이터 보안 침해가 발생하면 즉시 공개해야 하며, 지금처럼 기본적으로 은폐해서는 안 된다.

설령 데이터에 대한 개인의 통제권에 관한 내 견해에 동의하지 않더라도, 보안 침해의 위험만 보아도 데이터 절제(Datensparsamkeit)는 현명한 선택이다. 필요하지도 않은 데이터를 보유하고 있다가 누군가 그것을 훔쳐 피해를 일으켰다면, 그 피해에 책임을 져야 하지 않을까? 법적 책임이 없더라도, 그 사실이 알려지면 심각한 후폭풍이 따른다. 따라서 데이터 절제(Datensparsamkeit)를 실천하지 않는 누구에게나 분명한 위험이 있다.

감사의 말

에리크 되르넨부르크(Erik Dörnenburg)가 내게 데이터 절제(Datensparsamkeit)라는 개념을 소개해 주었다. 밈 “… all the things”는 아주 오래전부터 있었던 것처럼 느껴지지만(적어도 10년은 된 듯하다), 그 시작이 2010년이었다는 사실을 코니 시에츠마(Korny Sietsma) 덕분에 알게 되어 반갑다.

1: 발음은 여기를 참고하라.

2: 이 글을 처음 쓴 뒤 이 원칙은 훨씬 더 큰 주목을 받게 됐다. 특히 유럽연합의 GDPR 규정이 도입되면서 더욱 그랬다. 이 맥락에서는 이 개념을 데이터 최소화(Data Minimization)라고 부르는 경우를 점점 더 자주 듣는다. 다만 이 페이지는 당분간 원래 제목을 유지하겠다.

3: 네트워크 주소 변환(Network Address Translation) 때문에 실제로는 이보다 훨씬 복잡하다는 점은 알고 있다. 다만 여기서는 단순한 예가 필요했다.