‘윈도우10’의 얼굴인식 기술이 인터넷을 뜨겁게 달궜다. ‘윈도우 헬로’라고 부르는 이 기술은 PC의 잠금 해제를 암호나 지문, 패턴 터치 등이 아니라 카메라에 얼굴을 비추는 것으로 대신한다.

그러니까, 컴퓨터를 켜고 암호 입력 화면이 떠도 그냥 PC 앞에 앉아 있기만 하면 곧장 잠금이 풀리고 바로 PC를 쓸 수 있다. 윈도우10을 만든 마이크로소프트의 기술이기도 하지만, 그 뒤에는 인텔의 인지컴퓨팅 기술이 깔려 있다. 윈도우 헬로는 이른바 ‘윈텔’의 합작품인 셈이다.

▲  리얼센스는 카메라로 사물이 의도하는 것을 읽는 기술이다.
▲ 리얼센스는 카메라로 사물이 의도하는 것을 읽는 기술이다.

반도체 회사 인텔의 또 다른 접근법

인텔이라고 하면 가장 먼저 떠오르는 건 ‘반도체’, ‘프로세서’, ‘펜티엄’ 같은 단어다. 인텔은 세계 최대의 반도체 회사다. 인텔이 만들어내는 프로세서 하나하나가 PC 시장, 더 나아가 서버와 클라우드 등 컴퓨팅 시장에 영향을 끼친다.

그런 인텔의 요즘 행보는 낯선 면이 있다. 사물인터넷을 강조하고 증강현실, 웨어러블 같은 산업에 이름을 올리기 시작했다. 이유는 단순하다. 컴퓨팅 산업이 단순한 컴퓨터를 떠나 복합적으로 우리 생활 모든 영역에 파고 들어오기 때문이다.

인텔은 모바일 시장을 잡지 못했고, 그에 대한 대안으로 다양한 컴퓨팅 분야에 적극적으로 들어가야 한다는 교훈을 얻었다. 그 방향 중 하나가 ‘리얼센스’다. 리얼센스는 카메라를 통해 사물을 읽는 기술이다. 물론, 이를 위해선 리얼센스 기술이 적용된 전용 카메라를 반드시 갖춰야 한다.

▲  리얼센스의 기능 중 하나는 관절을 읽어들여 명령을 받는 것이다. 손가락 끝이 콘트롤러가 된다.
▲ 리얼센스의 기능 중 하나는 관절을 읽어들여 명령을 받는 것이다. 손가락 끝이 콘트롤러가 된다.

리얼센스의 출발은 ‘인지컴퓨팅’, ‘지각컴퓨팅’ 등으로 부르는 ‘퍼셉추얼 컴퓨팅(perceptual computing)’ 기술에서 시작된다. 말이 조금 어렵긴 하지만 결국 컴퓨터가 데이터가 아닌 사물을 직접 읽고 판단할 수 있는 능력이라는 이야기다. 인텔의 인지컴퓨팅 출발점은 카메라였다. 그 카메라 관련 기술은 리얼센스, 카메라 자체는 ‘리얼센스 3D 카메라’와 ‘리얼센스 스냅샷’ 등으로 부른다.

두 방식 모두 카메라를 이용해 사물을 입체로 읽어들이는 기술이다. 다만 사물을 읽는 방법에 차이가 있고, 그에 따라 서비스가 조금씩 달라진다. 리얼센스 카메라 기술의 핵심은 사람이 사물을 직접 만지지 않고도 눈만으로 상당히 많은 정보를 얻을 수 있다는 점이다.

3D 카메라의 발전형 ‘리얼센스 스냅샷’

둘 중에서 상대적으로 간단한 기술부터 보자. 리얼센스 스냅샷은 ‘스테레오스코픽’이라고 부르는 3D 카메라 방식을 이용하는 기술이다. 실제 카메라는 3개가 쓰인다. 우리 눈은 2개의 카메라로 사물을 동시에 촬영해 사물의 입체 형상을 읽어들인다. 덕분에 거리와 실제 크기를 파악할 수 있다. 카메라도 눈을 2개 달면 복합적인 정보를 인지할 수 있다. 리얼센스 스냅샷은 그 원리를 이용하는 것이다.

대표적인 제품은 지난 2014년 인텔 개발자포럼(IDF)에서 공개됐던 델의 태블릿PC ‘베뉴8 7000’이다. 이 제품은 아톰 프로세서를 내장하고 있고 뒷면에 3개의 카메라를 달고 있다. 1개는 800만 화소의 촬영용 카메라이고, 나머지 2개는 사물을 입체적으로 파악할 수 있도록 하는 보조 카메라다. 보조카메라 해상도는 720p 수준으로, 고성능 카메라는 아니다.

▲  델 ‘베뉴8 7000’은 리얼센스 카메라를 지닌 대표적인 제품이다. 카메라를 3개 넣어 리얼센스 스냅샷을 적용할 수 있다.
▲ 델 ‘베뉴8 7000’은 리얼센스 카메라를 지닌 대표적인 제품이다. 카메라를 3개 넣어 리얼센스 스냅샷을 적용할 수 있다.

이 태블릿PC는 2개의 보조 카메라로 사물의 깊이를 파악할 수 있다. 스테레오스코픽과 카메라의 초점 거리를 더해 실제 제품의 위치를 파악하는 것이다. 인텔이 리얼센스 스냅샷의 기술로 언급하는 것 중 하나가 ‘실측’이다. 사물을 리얼센스 스냅샷 카메라로 비추고, 원하는 두 점을 찍으면 실제 두 점 사이의 거리를 측정해준다. 2개의 카메라가 각 점의 입체 좌표를 읽고 있기 때문에 둘 사이의 거리를 파악하는 것은 아주 쉬운 일이다.

카메라 2개를 이용해 동시에 초점이 다른 여러 장의 사진을 찍은 뒤 어떤 피사체에 초점을 맞출지 선택할 수도 있다. 이는 이미 여러 카메라 기술로 고안된 것인데, 보통 하나의 카메라로 짧은 시간 동안 여러 초점을 찍은 뒤 초점거리를 조정한다. 리얼센스 스냅샷은 보조 렌즈 2개를 이용해 더 정확하게 위치를 담아낸다. 최대 30m 안에 있는 피사체의 초점을 골라낼 수 있다.

▲  사진을 찍은 뒤 초점을 골라내는 것도 빠르고 정확하게 해낼 수 있다. 거리를 읽는 카메라가 있기 때문이다.
▲ 사진을 찍은 뒤 초점을 골라내는 것도 빠르고 정확하게 해낼 수 있다. 거리를 읽는 카메라가 있기 때문이다.

적외선으로 사물 형태 읽는 ‘리얼센스 3D 카메라’

흔히 리얼센스라고 하면 바로 이 리얼센스 3D 카메라를 이야기한다. 윈도우 헬로도 이 기술을 이용한다. 리얼센스 3D 카메라의 방식은 리얼센스 스냅샷과 조금 다르지만, 사물을 입체로 읽어들인다는 기본 원칙은 비슷하다. 다만 거리를 검출해내는 방식이 일반 카메라가 아니라 적외선을 이용한다는 게 차이점이다.

리얼센스 3D 카메라 역시 3개의 카메라 모듈을 이용한다. 1개는 이미지를 촬영하는 메인 카메라이며, 나머지 2개는 적외선 레이저 프로젝터와 적외선 카메라로 이뤄져 있다. 우리 눈에 보이지 않는 적외선 레이저를 쏴 사물의 거리와 입체 굴곡을 읽어들이는 것이다. 그 뒤에 일반 카메라 영상을 합치면 평면 이미지가 3D 데이터를 갖게 된다. 우리의 눈과는 다르지만 현재 컴퓨터 기기가 할 수 있는 정확한 사물 인식 기술이다.

▲  크리에이티브의 리얼센스 3D카메라. 이미지 카메라, 적외선 프로젝터, 적외선 카메라와 마이크를 품고 있다. 값은 99달러다.
▲ 크리에이티브의 리얼센스 3D카메라. 이미지 카메라, 적외선 프로젝터, 적외선 카메라와 마이크를 품고 있다. 값은 99달러다.

제품마다 다를 수 있지만 대체로 작동 거리는 길지 않다. 0.2~1.2m의 거리를 읽어들일 수 있다. 적외선 프로젝터의 도달 범위가 촬영 거리를 결정하기 때문이다. 현재 리얼센스 3D 카메라는 크리에이티브의 외장형 카메라, 레노버 ‘요가3’가 대표 사례다. HP, 델, 에이수스, 에이서, 후지쯔 등도 리얼센스를 품은 PC를 내놓고 있다.

얼굴인식 기술의 고도화

컴퓨터가 사물을 3D로 읽어야 할 이유는 뭘까? 꼭 그래야 한다는 이유는 없지만 사례들은 흥미롭고, 고개를 끄덕이게 한다. 그 대표적인 사례가 바로 얼굴인식 보안 장치인 윈도우 헬로다.

얼굴인식이 보안 장치로 쓰인 사례는 적지 않다. 생체 보안은 이미 그 유일성과 편리함, 그리고 분실되지 않는다는 장점을 두루 갖고 있다는 점에서 일반화됐다. 복제에 대한 우려가 늘 입에 오르내리긴 하지만, 아직까지는 생체 정보를 복제하는 것보다 비밀번호를 훔치는 게 훨씬 쉽고 빠르다.

▲  리얼센스는 얼굴을 적외선으로 입체화해서 읽어들인다.
▲ 리얼센스는 얼굴을 적외선으로 입체화해서 읽어들인다.

하지만 얼굴은 좀 다르다. 이전에도 일부 안드로이드 기기에 얼굴인식을 넣었다가 사진을 보여주는 것으로 암호가 손쉽게 풀렸던 예가 있다. 과연 얼굴이 확실한 보안 도구가 될 수 있을지에 대한 고민이 시작된 것이다.

[rel]리얼센스가 얼굴을 읽는 방법은 그 우려를 거의 덜어낼 수 있다. 모든 기술이 공개된 것은 아니지만 몇 가지만 보면, 일단 3D로 사물을 읽어들이기 때문에 평면인 사진은 통하지 않는다. 또한 리얼센스는 적외선 카메라을 함께 이용하기 때문에 체온을 통한 열감지도 함께 이뤄지는 것으로 알려졌다. 센서를 더한 것으로 확실한 보완책이 만들어진 것이다.

대개 얼굴인식은 눈, 코, 입 등 얼굴 윤곽을 잡고, 그 크기와 상대적인 거리를 읽어 사람을 파악하는 기술을 쓴다. 입체적으로 사물을 인지하는 기술이 더해지면 더 정확하게 얼굴을 읽을 수 있다. 리얼센스와 윈도우 헬로는 안경을 쓰거나, 화장을 하고, 머리 모양을 다르게 해도 헷갈리지 않는다.

호주의 한 미디어는 아예 얼굴을 가장 확실하게 복제하는 사례인 쌍둥이들을 대상으로 윈도우 헬로를 테스트했다. 리얼센스 카메라는 쌍둥이를 모두 골라냈다. 닮아 보여도 카메라가 읽는 얼굴은 다르다는 얘기다.

사물과 그 속 뜻 읽는 ‘인지 기술’

리얼센스는 얼굴만 읽는 건 아니다. 몸의 관절을 구분할 수 있어서 컴퓨터가 동작을 받아들일 수 있도록 했다. 손가락 움직임을 관절로 구분해서 파악할 수 있고, 얼굴 표정도 구분한다. 직접 키보드나 마우스, 터치스크린에 손대지 않고도 멀리서 손가락 움직임만으로 기기를 제어할 수 있다. 인텔은 게임으로 이를 시연하기도 했는데, 꼭 게임만이 아니라 기기에 직접 손대지 않고 원격으로 제어할 수 있는 ‘터치프리 컴퓨팅’의 가능성을 제시한 셈이다.

이번 인텔 IDF 2015에서는 더 많은 사례들이 제시됐다. 인텔은 드론에 리얼센스 카메라를 달아 항공 사진의 정밀도를 높이고, 자판기에 적용해 물리적 버튼 없이 상품을 고를 수 있도록 했다. 리얼센스가 로봇의 눈 역할을 해서 이동하며 장애물을 쉽게 피하고 호텔의 방 열쇠를 얼굴로 대신하는 등 다양한 사례가 등장했다.

당연히 3D 스캐너에 대한 기술도 소개됐다. 이미 리얼센스 3D카메라 자체가 평면의 이미지 속에 3D 좌표를 품는 기술이기 때문에, 이를 데이터 파일로 뽑아낼 수 있으면 그 자체로 간이 3D 스캐너가 된다. 수 억원씩 나가던 3D 스캐너가 고작 99달러짜리 기기로 대체되는 것이다.

▲  로봇과 드론이 리얼센스 덕분에 눈을 얻었다.
▲ 로봇과 드론이 리얼센스 덕분에 눈을 얻었다.

얼굴인식 뿐 아니라 리얼센스 스냅샷의 거리 측정 기능을 구체화하는 방법도 소개됐다. 구글은 ‘프로젝트 탱고’라는 이름으로 증강현실 기술을 고도화하고 있다. 프로젝트 탱고는 카메라 2개를 이용해 주변 환경을 3차원 이미지로 만들어주는 것이 핵심인데, 리얼센스를 이용하면 더 정확한 결과물을 얻을 수 있다. 마이크로소프트나 구글 등 소프트웨어를 만드는 기업들이 더 좋은 결과물을 얻을 수 있도록 하는 하드웨어 기반 기술을 만들어주는 게 인텔의 역할이라면, 리얼센스는 기존 운영체제에 CPU를 공급하던 것에서 맥락상 크게 벗어나지 않는다.

물론 비슷한 기술들이 없었던 것은 아니다. 마이크로소프트 ‘키넥트’는 2개의 카메라로 사람을 인지하고, 관절의 움직임을 읽어들인다. 키넥트는 게임과 가상현실 등에 적용돼 있다. 손가락만 놓고 보면 ‘리프모션’ 같은 기술도 눈에 띈다. 리얼센스가 최초이자 유일한 기술은 아니지만, 리얼센스로 인해 카메라 기반 인지컴퓨팅 기술이 더 구체화되고, 시장도 확대되고 있다. 키넥트와 리프모션이 더 구체화되고 적용될 수 있는 시장이 열리고 있는 것이다.

▲  리얼센스는 손 대지 않아도 더 많은 정보를 얻을 수 있는 컴퓨팅 기술로 발전하고 있다.
▲ 리얼센스는 손 대지 않아도 더 많은 정보를 얻을 수 있는 컴퓨팅 기술로 발전하고 있다.

이 글은 ‘네이버캐스트→테크놀로지월드→용어로 보는 IT’에도 게재됐습니다. ☞‘네이버캐스트’ 보기

저작권자 © 블로터 무단전재 및 재배포 금지