'아카이브'는 전통적 정의에서 자유로워졌다. 더 이상 아카이브는 집단기억의 저장소가 아니다. 디지털 기술은 아카이브를 집단의 기억에서 ‘우리의 기억’으로 바꾸어놓았다. 국가가 곧 아카이비스트였던 디지털 시대 이전과 달리 개인이 그리고 기업이 기억의 기록자가 되는 시대를 우리는 살아가고 있다.

디지털 기술은 아카이브의 전통적 속성도 뒤바꾸어 놓았다. 먼저 기록의 목적이 달라졌다. 디지털 이전 시대 아카이브는 엘리트 집단 혹은 국가기구의 특정한 목적과 의도를 달성하기 위해 물리적 유산을 수집, 보관, 선택해 전시했다. <조선왕조실록>은 조선 왕실 통치행위의 기록과 전달을, 국립중앙박물관은 한민족의 역사 보전을 아카이브 구성의 목적으로 삼았다. 구성의 주체는 소수의 엘리트 집단으로 제한됐다. 시민의 기억을 담는 아카이브는 상상조차 되지 못했다.

▲  조선왕조실록이 아카이빙 돼 있던 오대산 사고.(사진 출처 : 문화재청)
▲ 조선왕조실록이 아카이빙 돼 있던 오대산 사고.(사진 출처 : 문화재청)

아카이브의 구성 목적은 그 자체가 이데올로기다. 사고에 저장된 <조선왕조실록>이라는 아카이브는 조선의 통치 철학을 대변했고, 당대의 사관을 분류와 기록 등을 통해 맥락적으로 드러낸다. 국립중앙박물관은 서울 용산 이전 이후 일본 전시관을 분리시켰는데 이는 국가주의 이데올로기를 전파하기 위함이었다(선승혜, 2007). 그래서, 목적은 수집의 범위를 규정한다. 동시에 전시를 통해 그것의 이데올로기를 공표하게 되는 것이다. 디지털 이전의 모든 아카이브는 목적이 곧 아카이브의 존재 증명이며 결과이기도 하다.

디지털 기술은 결과로서 전통적 아카이브를 거부하고 해체한다. 오히려 아카이브 구성의 무한한 가능성에 문호를 열어둔다. 목적을 전제로 한 수집 행위가 희석되는 대신, 수집된 정보의 구성 혹은 재구성에 더 방점을 둔다. 전통적 아카이브가 목적 이외의 형태로 전환되기 어려운 결과형 아카이브라면, 디지털 아카이브는 기획과 상상력에 따라 얼마든지 재구성, 재배열될 수 있는 과정형 아카이브가 된다. 아카이브가 구축되는 순간 끝이 아니라 오히려 새로운 시작인 셈이다.

검색은 디지털 아카이브의 출입구

▲  캐싱된 구글 검색. 검색의 결과도 저장을 전제로 하는 하나의 아카이브라고 할 수 있다.
▲ 캐싱된 구글 검색. 검색의 결과도 저장을 전제로 하는 하나의 아카이브라고 할 수 있다.

디지털 기술은 무엇보다 개인이 일상의 아카이브를 구축하도록 돕는다. 아카이브 구성 주체의 혁명적 변화가 일어난 것이다. 여기엔 검색이라는 기술적 장치가 개입한다. 일반적으로 검색은 그 자체가 아카이브의 출입구이자 아카이브다. 검색은 그 하부에 방대한 데이터의 총체를 누적하고 있으며 사용자의 기획과 판단에 따라 수시로 아카이브를 일시에 구축했다 해체한다. 예를 들어 ‘아카이브’라는 쿼리를 입력하면 구글은 아카이브를 품고 있는 수많은 검색의 링크를 노출한다. 단순히 링크에만 그치지 않는다. 캐시된 형태로 임시 저장된 내역도 함께 보여준다. 저장과 전시라는 아카이브의 필수 요소를 구글 검색은 갖고 있는 것이다.

검색은 통상 2~3단계의 중요한 데이터 처리 절차를 거친다. 웹이라는 공간에 등록된 수억개 사이트에서 자료를 인덱싱한다. 그리고 사용자의 검색 쿼리 따라 수억개의 디지털 아카이브를 생성하고 배열한다.

인덱싱은 데이터의 수집(크롤링)과 조직화, 서열화(랭킹)로 구분할 수 있다. 디지털 이전 시대 수집과 저장, 분류를 단일 국가 기관이 통합적, 권위적으로 도맡았다면, 검색은 각 단계를 기업이 설계한 알고리즘이 수행한다.

[plus]또한 디지털 기술은 아카이브의 이 같은 구축 절차를 하나하나 분절시키고 사용자가 관여를 일정 부분 허용한다. 그 덕에 수집 의도의 주체가 다원화되고, 수집 과정이 자동화되며, 보관의 무제한성이 확보되는 것이다. 뿐만 아니라 필터링으로 상징되는 선택의 범위를 다양화함으로써 유동적인 아카이브의 구성이 가능해진다. 그리고 이데올로기가 투영된 아카이브의 전시는 랭킹 알고리즘이 대신한다.

이 과정에 새로운 아카이빙의 주체가 개입한다. 검색 사업자다. 엄격하게는 기업이 설계한 알고리즘이 아카이비스트로 관여하게 된다. 웹에 게시된 모든 자료를 수집하고 조직적으로 저장하며, 전시하기 위해 의미를 부여하고 배열의 순서를 정리하는 건 국가기구나 사람이 아니라 검색 기업이 디자인한 알고리즘이다.

검색 플랫폼은 가상의 물리적 공간에 비트로 분화된 데이터들이 체계적으로 쌓여갈 수 있도록 지원한다. 대신 이들은 개인 아카이브에 누적된 비트를 자유롭게 접근할 수 있으며 그들의 자본 축적 구조에 맞게 사용권을 갖게 된다. 가상의 공간과 사용권이 교환되는 구조인 셈이다. 다시 말하지만 이들 검색 플랫폼은 사용자들의 데이터에 자유롭게 접근할 권리를 취득하게 되며 향후 새로운 가상세계의 통제권을 획득하게 된다. 비약으로 보이는가.

주목해야 할 속성 : 공동 관리자로서 검색 알고리즘

검색과 아카이브 인터넷 서비스의 결합은 그것의 힘의 관계를 잘 드러내준다. 구글 포토와 검색 그리고 인공지능의 관계를 사례로 들여다보자. 구글 포토는 스마트폰에 저장된 모든 사용자의 사진 데이터를 생성과 동시에 자동 동기화한다. 구글 포토를 설치한 사용자는 자신도 모르게 구글의 클라우드에 사진 아카이브가 자동 생성된다는 사실을 발견하게 된다.

여기엔 ‘디폴트의 정치’가 개입한다. 구글 포토는 ‘동의’라는 디폴트의 이름으로 사용자의 아카이브를 자동으로 백업하는 데이터 전유를 시도한다.[ref]이는 구글에만 해당하지 않는다. 대부분의 무료 포토 서비사들이 디폴트 상태로 동기화와 백업을 자동으로 진행한다.[/ref] 구글 포토에 저장된 복제된 이미지 기록물은 공개 이전에는 인공지능의 원료로 동원되고, 공개 이후 상태는 검색의 이미지 아카이브(클라우드)로 자동 편입된다.

googlephoto
▲ googlephoto

이렇게 수집된 전세계 수많은 사용자들의 사진 아카이브는 궁극적으로 구글의 지능을 증강시키는 데 동원된다. 구글의 이미지 인식 지능은 어마어마한 규모의 사진 데이터를 수집함으로써 증대된다. 이른바 딥러닝의 학습 원료로서 개인들의 디지털 아카이브가 활용되는 결과를 낳는 것이다. 이를 통해 구글의 인공지능은 한층 정교해지고 상업적 가치를 더하게 된다. 구글 검색의 증대된 지능은 사용자들이 보고, 발견할 수 있는 모든 선택권들을 미래에 통제할 수 있게 된다. 그것이 맞춤형, 개인화라는 레토릭과 결합돼 있다는 사실을 우리는 깨달을 필요가 있다.

[rel]검색이 흡수한 일상 아카이브의 규모는 지능의 진화 속도에 차별을 발생시킨다. 얼마나 더 많은 데이터와 아카이브를 누적하고 흡수하느냐에 따라서 인공지능 정밀도는 변화하게 되는 것이다. 전지구적 단위에서 수억명의 일상 아카이브를 흡수할 수 있는 구글과 국내 수천만명의 아카이브 접근이 가능한 네이버는 그래서 상업적 주도권에서 격차가 발생할 수밖에 없다. 시장에서의 경쟁력은 흡수한 아카이브의 양에 비례할 수도 있기 때문이다.

머신러닝이 만드는 '무인 자율관료제'

우리는 이제 디지털 아카이브를 정치적으로 접근할 수 있는 관점을 가지게 됐다. 파스퀴넬리(Pasquinelli, 2016)가 설명하듯, 데이터베이스는 권력의 형태를 수학적으로 묘사한 것이다. 인공지능과 같은 튜링 기계는 아카이브라는 데이터베이스에 축적된 정보를 통해 사회 패턴을 미분한 뒤 기록하고 지능화한다. 물론 아카이빙과 기계지능의 진화는 동시에 발생한다. 그것이 디지털 아카이브의 권력을 생산해내는 작동 방식이다.

일상의 기록 즉 우리의 디지털화한 기억은 통제와 감시의 원료가 될 수 있다. 인공지능을 비롯한 머신러닝 알고리즘이 더 완벽한 통제를 위해 개선되고 향상되는 데 기여한다. 심지어 머신러닝 알고리즘은 일상 아카이브의 학습 자료를 통해 ‘자율관료제'(Autonomous Bureaucracy)를 운영하기 시작했다(Pasquinelli, 2016). 부정하고 싶지만 검색과 일상 아카이브의 결합이 만들어낼 현재 그리고 내일의 풍경인 셈이다.

참고 문헌


  • 백욱인. (2015). 디지털 환경에서의 아카이브 동향과 전망.

  • 선승혜. (2007). 동아시아에서 전시와 이데올로기의 관계에 대하여. 현대미술학 논문집, (11), 137-165.

  • Pasquinelli, M.(2016). The Spike: On the Growth and Form of Pattern Police. Nervous Systems

저작권자 © 블로터 무단전재 및 재배포 금지