아이폴리, 시각장애인 위한 이미지 인식 앱 개발

가 +
가 -

“거기에 파란색 셔츠가 있어요.”

시각장애인은 눈 앞에 무엇이 있는지 알아보기 위해 물체를 직접 만져보거나 점자를 확인하거나 주변사람들에게 도움을 청한다. 만약 스마트폰이 눈 앞에 있는 모습을 직접 설명해준다면 어떨까? 복잡한 과정 없이 사진만 찍으면 스마트폰이 알아서 정보를 읽어주면서 말이다. 아이폴리가 실제로 이 기술을 구현해 시각장애인을 위한 이미지 인식 앱을 공개했다.

아이폴리는 싱귤래리티대학 소속 연구원들이 개발한 기술이다. 기술 원리는 간단하다. 사용자는 스마트폰으로 사진을 찍으면, 사진은 자동으로 아이폴리 서버에 올라간다. 서버는 곧바로 사진을 분석하고 사진에 대한 묘사를 문자로 입력한다. 이미지 분석은 컨볼루셔널 뉴럴 네트워크(Convolutional Neural Network) 방식을 활용했다. 아이폴리는 문자를 음성으로 바꾸는 기술을 이용해 찍은 사진이 어떤 상태인지 음성으로 내보낸다. 형태뿐만 아니라 색깔도 읽어준다. 유튜브 시연 영상을 보면 “애플 이어폰을 보고 있습니다”, “구름이 있는 파란색 하늘을 보고 있습니다”라는 결과가 나온다.

아이폴리는 8월15일 보도자료를 통해 “사진만 찍어도 눈앞에 있는 물체, 표지판, 상품 가격, 옷 등을 시각장애인들이 볼 수 있을 것”이라고 설명했다.

Aipoly_02

▲아이폴리 실행 예(사진:아이폴리)

Aipoly_03

▲아이폴리 실행 예. “당신은 접시에 놓인 치즈버거를 보고 있습니다(You are looking at a cheese burger on plate”라는 문자와 음성이 나온다. (사진:아이폴리)

더 읽어보세요!

아이폴리는 이번 앱에서 활용한 컴퓨터 비전(머신 비전)기술이 점점 좋아질 것이라고 예상하고 있다. 동시에 아이폴리의 활용성도 더 높아질 것으로 기대하고 있다. 아이폴리는 “2012과 2013년 사이에 컴퓨터 비전 기술의 정확성은 2배 이상 높아졌다”라며 “앞으로 5년 안에 전세계 2억8500만명의 시각장애인이 존재할 것이고, 그 중 3분의 2가 스마트폰을 사용할 것”이라고 설명했다.

아이폴리는 현재 베타버전으로 앱을 공개했다. 전세계에서 베타 테스터를 모집해 기술의 정확도를 더 높일 예정이다.

한편 싱귤래리티대학은 미래학자 레이 커즈와일이 설립된 대학이다. 구글과 나사가 자본금을 지원하기 했다. 알베르토 리즈졸리 아이폴리 설립자는 “싱귤래리티대학은 OCR 기술, 문자를 음성으로 변환해주는 기술 등에 투자하며 시각장애인을 위한 기술에 앞장서고 있다”라고 보도자료를 통해 밝혔다.

아이폴리 소개 동영상 바로보기

네티즌의견(총 1개)