'서치GPT'는 생성형 AI(인공지능)를 기반으로 하는 네이버의 차세대 검색 프로젝트다. 단어가 아닌 문장으로 검색해도 적합한 정보를 찾아주는 기능이 핵심이다. 글로벌 AI 연구소 오픈AI가 개발한 대화형 챗봇 '챗GPT'가 전세계적인 관심을 끌고 있는 상황에서 올 상반기에는 한국어에 최적화된 AI 검색 서비스를 내놓겠다는 것이 네이버의 계획이다.

문제는 AI 검색 서비스 운영 비용이 너무 크다는 데 있다. 샘 알트만 오픈AI 대표는 챗GPT가 답변 하나를 내놓는 데 '한 자릿수 센트(Single-digit cent)'의 운영 비용이 들어간다고 말했다. 1센트는 0.01달러, 한화로 약 13원이다. 챗GPT의 일간이용자가 지난 1월 이미 1000만명을 기록했던 것을 감안하면 오픈AI는 챗GPT의 하루 운영 비용으로 최소 수억원을 쓰고 있는 셈이다.

네이버도 이런 문제로부터 자유롭지 않다. 검색은 네이버의 근간을 이루는 서비스이기 때문이다. 서치GPT뿐만 아니라 최근 확장하고 있는 '검색량 변화 알림'과 같은 다양한 검색을 제공하려면 품질 개선과 운영 비용 절감이라는 두 가지 목표를 모두 달성할 필요가 있다. 네이버 서치CIC(사내독립기업)가 지속적으로 검색 환경에 대한 개선 작업을 진행하는 이유다.

(좌측부터) 김선호 네이버 서치CIC 테크 리드, 김재헌 네이버 서치CIC 책임리더, 정지훈 네이버 서치CIC 엔지니어가 최근 경기도 성남시 네이버 사옥에서 진행된 블로터와의 인터뷰에서 질문에 답하고 있다.(사진=네이버)
(좌측부터) 김선호 네이버 서치CIC 테크 리드, 김재헌 네이버 서치CIC 책임리더, 정지훈 네이버 서치CIC 엔지니어가 최근 경기도 성남시 네이버 사옥에서 진행된 블로터와의 인터뷰에서 질문에 답하고 있다.(사진=네이버)

네이버는 지난해 11월 검색 사용자 일부를 대상으로 도입한 HTTP/3를 최근 검색 사용자 전체로 확대 적용했다. HTTP는 웹상에서 데이터를 주고받기 위한 프로토콜(통신 규칙)로 국제인터넷기술위원회(IETF)가 제정한다. 예를 들어 크롬이나 익스플로러 같은 웹브라우저에서 네이버 검색 서비스를 이용할 경우 네이버의 웹서버로부터 정보나 이미지, 동영상 등을 전송 받아야 한다. 이때 전송 방법이나 순서 등을 정해 놓은 약속이 HTTP다.

HTTP/3은 모바일 환경을 고려해 만들어졌다. 1996년 HTTP/1이 처음 발표된 이후 인터넷의 발전과 고성능 장비의 출시로 2015년 새로운 버전인 HTTP/2가 나왔다. 이때도 네이버는 선제적으로 HTTP/2를 도입했다. 그런데 그 사이 모바일 분야가 급성장하며 그에 맞는 새로운 버전이 다시 필요해졌다. 2022년 6월 HTTP/3가 수립된 이유다. 1년이 채 안 된 만큼 지금도 국내에서 HTTP/3를 도입한 플랫폼은 소수다. 네이버는 김선호 서치CIC 테크 리드와 정지훈 서치CIC 엔지니어가 HTTP/3 표준이 세워지기 전부터 리서치를 시작해 국내 플랫폼 중에서는 최초로 도입할 수 있었다.

네이버 검색에 HTTP/3를 도입하며 가장 크게 달라지는 것은 속도와 안정성이다. 먼저 웹브라우저와 웹서버가 최초로 연결되는 시간이 HTTP/2에 비해 크게 줄었다. 상대적으로 속도가 느린 3G 네트워크 환경에서 테스트를 진행한 결과 웹페이지에 검색 결과 화면이 처음 나타나는 시간이 3.4초에서 2.4초로 약 29% 단축됐다.

이는 전송을 처리하는 프로토콜이 바뀐 결과다. 기존의 HTTP/2는 TCP(Transmission Control Protocol)를 사용하는 것과 달리 HTTP/3는 QUIC(Quick UDP Internet Connections)라는 UDP(User Datagram Protocol)를 사용한다. TCP는 안정적으로 데이터를 전송하는 데 특화돼 있지만 UDP에 비해 느린 속도가 단점이었다. 하지만 기업 입장에서는 느리더라도 데이터가 안정적으로 전송되는 것이 가장 중요하면서도 기본적인 조건이기 때문에 데이터 전송에 대한 안정성이 부족한 UDP를 쓸 수는 없었다. HTTP가 30년 넘게 TCP를 기반으로 했던 이유다. 이제는 기술이 발전해 UDP를 사용하면서도 TCP의 안정성이라는 장점을 흡수할 수 있게 된 것이다.

3G 네트워크에서 HTTP/3와 HTTP/2의 네이버 모바일 앱 검색 결과 구현 속도 비교 테스트 결과 화면. HTTP/3에서는 2.4초에 검색 결과가 최초로 출력되지만 HTTP/2에서는 3.4초에 최초로 출력되는 것을 볼 수 있다.(사진=네이버)
3G 네트워크에서 HTTP/3와 HTTP/2의 네이버 모바일 앱 검색 결과 구현 속도 비교 테스트 결과 화면. HTTP/3에서는 2.4초에 검색 결과가 최초로 출력되지만 HTTP/2에서는 3.4초에 최초로 출력되는 것을 볼 수 있다.(사진=네이버)

택배 상자 10개를 보내는 상황으로 예를 들면 TCP의 경우 10개 상자가 모두 순서에 맞게 도착하는 것이 보장되지만 속도가 느리다. 반면 UDP는 속도는 빠르지만 10개 중 몇 개가 누락될 수도 있다. 그동안은 안정성 측면에서 신뢰할 수 없기 때문에 UDP를 사용하지 않았지만 QUIC가 만들어지면서 그런 단점이 보완된 것이다. 김재헌 네이버 서치CIC 책임리더는 이달 2일 경기도 성남시 분당구에 위치한 네이버 사옥에서 진행된 <블로터>와의 인터뷰에서 "네이버 검색 트래픽이 워낙 많기 때문에 성능 개선을 진행하면서 이상 현상이 발생하면 바로 조치를 취한다"며 "검색에 적용되는 기술은 안정성에 문제가 없다는 확신이 들어야만 비로소 도입된다"고 말했다.

즉 이미 안정성은 확보됐다고 보기 때문에 HTTP/3를 적용하겠다고 나선 시점에는 속도를 높이는 것이 주요 과제였다. 공장에서 물건을 찍어낼 때 부품의 생산속도가 빨라지면 자연스럽게 완제품의 생산속도도 빨라지듯 검색이 이뤄지는 과정의 각 단위에서 정보가 전송되는 속도를 높여 전체적인 검색 속도를 높이는 결과를 끌어냈다. 특히 3G를 쓰거나 해외에 있을 경우 또는 엘리베이터, 터널 등 네트워크가 원활하지 않은 곳에서 서비스를 이용할 경우에 속도 향상을 더욱 크게 체감할 수 있다.

이처럼 전과 같은 운영 비용을 쓰면서도 안정성 확보와 검색 속도 향상이라는 결과를 낸다면 비용 절감 효과를 보는 것이나 다름없다. 서치GPT 같은 AI 검색 서비스뿐만 아니라 단순 문자 정보에 그치지 않고 이미지나 동영상 등이 포함된 정보를 보여줘야 하는 최근 검색 트렌드를 고려하더라도 일정 수준 이상의 성능은 필수적인 요소이기 때문이다.

김 책임리더는 "네이버 서치CIC가 하는 일은 검색 서비스의 속도는 높이고 운영 비용은 줄이는 작업이라는 점에서 항상 똑같다"면서 "그것은 점진적으로 이뤄진다기보다는 계단식으로 이뤄지며 이번 HTTP/3 도입도 그러한 계단식 발전의 계기 중 하나"라고 말했다. 그러면서 "HTTP/3 도입은 엄밀히 말하면 서치 GPT만을 위한 것은 아니다"라며 "서치 GPT를 포함한 다양한 검색 서비스들을 조금 더 빠르게 낮은 운영비용으로 제공하는 게 우리가 하는 일의 목표"라고 강조했다.

저작권자 © 블로터 무단전재 및 재배포 금지