그들이 사회에 기여하는 법, ‘인프라’와 ‘데이터’

가 +
가 -

대기업은 어떻게 사회공헌을 할까. 대개는 직원 수백명이 봉사활동을 나서거나 기업 대표가 거액을 기부하는 모습이 떠오른다. 요즘엔 바뀌었다. 기술로 사회에 공헌하는 사례가 부쩍 늘었다. 인프라나 고급 기술을 학계나 비영리단체에게 기부하는 식이다. 특히 빅데이터, 클라우드, 슈퍼컴퓨팅 기술이 자주 쓰이고 있다. 이러한 기술은 제대로 활용하려면 수백만원에서 수억원에 이르는 적잖은 비용을 치러야 하는데 이를 무상으로 제공하면서 기존에 막혀 있던 사회 문제를 해결하려는 모습이다.

8th_anni_infra_csr_thum

아마존웹서비스(AWS) “데이터 연구 돕자”

아마존웹서비스(AWS)는 서버나 스토리지 같은 인프라를 서비스 형태로 제공하는 업체다. 글로벌 리서치 회사 가트너에 따르면 AWS는 클라우드 IaaS(Infrastructure as a Service) 분야에서 3년 연속 리더자리를 지켰다. 그만큼 AWS는 클라우드 시장에서 독보적인 위치에 올라 있다.

8th_anni_infra_csr_02_Gartner_RE

▲가트너가 2014년 5월 발표한 IaaS 시장 분석그래프(출처:가트너)

AWS는 최근 몇 년간 외부 연구 활동을 적극적으로 돕고 있다. 데이터 분석가를 위한 장학제도 ‘AWS 에듀케이션’을 보자. AWS는 장학금, 즉 돈을 직접 지원하지 않는다. 그대신 인프라 서비스를 무료로 제공한다. 보통 1년씩 계약하거나 연장하고 있다.

AWS 에듀케이션은 클라우드 기술을 보유하고 있기에 가능한 제도다. 예전 같았으면 사람들이 직접 인프라 장비를 싣고 가 사무실에 설치해야 했다. 하지만 AWS는 온라인으로 이러한 인프라를 제공한다. 세계 각국에서 기계학습이나 빅데이터 분석을 하는 연구자는 온라인으로 양질의 연구 환경을 제공받을 수 있다. AWS의 기술은 기계학습과 빅데이터 연구를 통해 탄생했기 때문에, 해당 기술이 발전할수록 AWS 기술도 함께 성장한다. AWS 에듀케이션 제도는 적절한 기술을 필요한 곳에 기부하는 동시에 업계 기술 수준도 높이는 효과를 낸다.

AWS는 공공을 위한 프로그램을 함께 진행하고 있다. 예를 들어, AWS는 2013년부터 미국 항공우주국(NASA)과 협업해 ‘나사 NEX’라는 프로젝트를 운용 중이다. 이 프로그램은 기후변화 연구를 위해 지구 표면의 위성 이미지 등을 수집한다. 프로젝트엔 ‘AWS EC2’나 ‘아마존 EMR’ 같은 자원이 쓰인다. 아마존은 이렇게 수집한 자료를 공공데이터로 개방하고 있다.

8th_anni_infra_csr_01

2014년 8월엔 일반인에게도 환경오염이나 기후 변화를 연구하도록 돕고자 AWS 인프라를 제공하고 있다. 이 프로젝트에 선출된 학계나 관련 연구자들은 탄소배출을 줄이기 위한 방법이나 지구온난화를 억제하는 방법을 연구한다. AWS는 가상머신인 ‘AWS EC2 인스턴스’에 5천만시간 접속할 수 있는 권한을 제공한다. 날씨를 예측하는 것은 방대한 데이터를 모으고 빨리 처리하는 작업을 동반하기에, AWS 같은 인프라를 제공하면 연구에 도움이 된다.

AWS는 ‘공개 데이터세트’도 제공하고 있다. AWS 고객 중 데이터를 공개하고 싶은 사람끼리 연결해 데이터를 공유할 수 있기 지원하는 장이다. 여기엔 구글이 제공하는 인간 유전자 변이 지도나 미국 인구 통계 등이 포함된다.

IBM, “슈퍼컴퓨터로 도시 문제를 해결하자”

IBM은 슈퍼컴퓨팅 기술에 적극적으로 투자하는 기업 중 하나다. 특히 ‘왓슨’이라는 브랜드를 내세워 왓슨을 내세워 인공지능, 인지 컴퓨팅, 기계학습 알고리즘 등을 개발하고 있다. 2014년 1월부터는 왓슨그룹을 따로 만들어 투자비용을 늘리고 인력을 추가 지원했다. 왓슨그룹에서 연구하는 인원은 2천여명이 넘으며 연구비용도 약 10억달러가 투입됐다. 이러한 슈퍼컴퓨팅 기술은 대규모 데이터를 분석하고 다양한 상황을 예측하는데 효과적이다.

중국IBM 2014년 7월8일 중국 베이징의 대기오염을 개선하기 위해 왓슨 슈퍼컴퓨터를 이용하기로 했다. ‘그린 호라이즌’라고 명명한 이 프로젝트는 대기 오염을 분석하거나 재생에너지 사업을 관리할 수 있도록 돕는 연구다. 이미 중국 정부나 IBM은 슈퍼컴퓨터 기술로 대기 오염 정도를 실시간으로 분석하고 있지만, 좀 더 최신의 기술력으로 정보를 분석하는 데서 끝내지 않고 미래에 올 상황을 예상하고 대비할 수 있게 도울 계획이다.

IBM은 7월8일 공식 홈페이지를 통해 “인공위성, 지리정보, 광학센서를 통해 얻은 수많은 데이터를 처리하면 3일 후 대기 오염 상태를 미리 예측할 수 있다”라며 “과학적인 데이터를 제공해 정부 관계자들이 쉽게 정책을 결정할 수 있도록 도울 것”이라고 설명했다.

8th_anni_infra_csr_03_IBM_GREEN

▲IBM이 개발한 ‘하이브리드 재생에너지 예측’ 솔루션(출처 : IBM)

IBM은 ‘하이브리드 재생에너지 예측(Hybrid Renewable Energy Forecasting)’ 솔루션을 제공해 친환경 에너지를 효율적으로 관리하도록 도울 예정이다. 예를 들어, 구름 움직임이나 대기 온도와 바람정보 등을 센서로 받아 재생에너지 생산량을 예측할 수 있다. 브래드 갬몬스 IBM 글로벌 에너지 전기 사업부 국장은 “분석기술을 이용하면 불규칙한 자연 환경에 효과적으로 대응해 에너지 생산량을 높일 수 있다”라고 설명했다.

중국 정부는 태양광 에너지나 풍력 에너지와 같은 친환경 에너지를 위해 투자를 늘리고 있다. 최근 중국 베이징의 스모그는 심각한 수준의 사회문제로 떠오르고 있으며, 2014년 2월 세계보건기구(WHO)는 중국 내 스모그를 ‘위기 상황’으로 규정하기도 했다. 중국은 1600억달러를 투자해 중국 내 대기오염 개선 사업을 진행하고 있다.

한국에서도 왓슨을 활용한 사회공헌활동이 이뤄지고 있다. 2014년 8월20일 한국IBM은 경기도 31개 시,군과 협업하여 ‘경기도 민원 콘텐츠 분석 프로젝트’를 진행하고 있다. 이는 전자민원 게시판과 도와 시군 웹사이트에 등록된 460,769건의 종합민원 분석하는 프로젝트다. 한국IBM는 자체 연구소에서 한글 분석 기능을 개발하고 이를 비정형 데이터 분석 플랫폼 IBM WCA(Watson Content Analytics)에 추가했다.

8th_anni_infra_csr_04_IBM_KOR

▲한국 IBM이 개발한 ‘경기도 민원 콘텐츠 분석 프로젝트’. 각 지역별로 몇개의 민원이 있는지 그림으로 보여주고 있다. (출처 : 한국IBM)

한국IBM은 “‘WCA 분석 플랫폼을 활용하면 시,군별 민원 접수 현황을 실시간 분석을 통해 알 수 있다”라며 “지도 모양의 대시보드에 거주 지역에서 제기되고 있는 민원 내용이 그래프로 표기됨으로써 분석 결과를 한눈에 볼 수 있다”라고 설명했다.

예를 들어, 여름에는 아파트, 입주, 공사, 음식물 관련 민원이 많다는 결과를 도출하거나, 상위 민원 발생 지역은 수원, 용인, 고양, 성남, 파주 순이라는 걸 밝혀냈다. 가장 많이 접수된 민원은 ‘교통’으로 전체의 43%를 차지하며, 생활환경(35%), 주민생활(19%), 건강(3%) 등이 뒤를 이었다. 특히, 교통 관련 민원은 버스의 경우 무정차, 기사 불친절 등의 민원이 많았으며, 특히 광주시에 집중된 것으로 나타났다. 택시의 경우, 승차거부, 미터요금 이상, 불친절, 타도 영업 등의 집중 민원이 접수되는 것으로 분석됐다.

IBM은 “WCA를 활용하면 효율적인 민원 처리가 가능해진다”라며 “빅데이터 분석에 기반하여, 민원 처리 프로세스를 점검하고 개선 방법을 찾을 수 있다”라고 설명한다. 예를 들면, 빅데이터 분석하면, 특정 민원이 중복되거나, 집단의 이해관계가 어떻게 반영된 건지 알 수 있다. 이런 경우, 별도의 처리 프로세스를 마련하여, 다른 민원업무를 보다 더 효율적으로 처리할 수 있게 된다.

인텔 “파킨슨 병 위해 웨어러블•빅데이터 이용”

인텔은 전통적인 칩 생산업체이다. 최근엔 웨어러블 기기를 위한 기술에 박차를 가하고 있다. 인텔은 이러한 기술을 파킨슨 병 연구 및 치료 향상을 위해 쓸 예정이다. 2014년 8월14일 ‘마이클 J. 폭스 파킨슨병 연구재단(Michael J. Fox Foundation for Parkinson’s Research, MJFF)’과 함께 파킨슨병의 연구 및 치료 향상을 위한 협력을 발표했다. 파킨슨병은 뇌 질환 중 알츠하이머병 다음으로 높은 많이 발생되는 질병이다.

인텔의 웨어러블 기기가 환자 1명으로부터 얻는 정보는 매일 1GB 수준이다. 초당 300개 항목 이상의 관찰 하고, 데이터를 1년 365일, 하루 24시간 동안 실시간으로 수집 및 전송할 수 있다. 환자 집단과 시간이 지남에 따라 막대한 양의 정보가 쌓이게 된다. 인텔은 이 정보를 클라우데라로 구축한 빅데이터 분석 플랫폼으로 다룰 예정이다.

☞인텔-MJFF 협업 소개 동영상 바로보기

인텔은 해당 웨어러블 기기로 원격에서 환자를 모니터링을 할 수 있을거라 보고 있다. 또 증상을 진단하고 치료에 필요한 정보를 확보할 수 있을 거라고 판단한다. 파킨슨병은 환자가 작성하는 일지가 연구에 중요한 영향을 끼치는데, 인텔은 웨어러블 기기가 자동으로 환자의 떨림이나 느린 동작, 수면의 질 등을 측정해 수집하도록 할 예정이다. 환자가 스스로 작성하는 일지를 웨어러블 기기가 대신하는 셈이다.

파킨슨병 연구원은 이 같은 기술의 도움을 받아 수천명의 환자 정보를 빠르게 분석할 수 있다. 그동안 환자의 수기에서 정보를 얻던 것과 비교해 연구 품질이 개선될 것으로 보인다. 질병의 새로운 패턴과 치료 방법을 고안하는 데도 효과적이라는 게 인텔의 설명이다. 마이클 J. 폭스 재단도 이번 협력에 기대를 걸고 있다.

인텔은 조만간 이 플랫폼으로 환자, 게놈, 임상시험 등 다른 유형의 데이터도 저장할 지원한다. 또한 기계 학습과 그래프 분석 같은 다른 첨단 기술도 지원해 연구자들이 질병 증세 변화 감지에 사용할 수 있는 보다 정확한 예상 모델을 구현한다.

마이클 J. 폭스 재단 대표이사인 토드 쉬어러(Todd Sherer) 박사는 “1817년 제임스 파킨슨 박사가 파킨슨병을 처음 정의한지 약 200년이 지났지만 우리는 여전히 그때와 다름없는 주관적인 방법으로 파킨슨병을 진단하고 있다”며 “데이터 과학, 웨어러블 컴퓨팅, 기타 소스에서 수집되는 데이터 등에는 환자의 실제 질병 경험을 포착하고 객관적으로 측정하는 우리의 능력을 변화시킬 수 있는 잠재력이 있다. 이는 파킨슨병 치료제 개발, 진단 및 치료에 영향을 미칠 것이다”라고 밝혔다.

SAP “고령화 사회를 위한 치료부담, 데이터 분석으로 해결하자”

SAP은 ERP 소프트웨어와 빅데이터 분석 관리 서비스를 내세우는 업체이다. ERP란 인사, 재무,생산 등을 총괄하는 통합정보시스템을 말한다. SAP의 인메모리 데이터베이스 플랫폼 중 ‘HANA’가 주목받고 있다.

SAP은 최근 데이터를 관리하던 기술력을 의료분야로 확장하고 있다. 특히 고령화 현상이 심해지는 아시아 지역과 협업을 모색하고 있다. 의료부분은 개인이나 한 기업이 하기보다 정부가 부담을 지는 경우가 많다. SAP은 이를 기술로 해결할 수 있다고 보고 있다.

예를 들어, 부모님이 알츠하이머를 진단받았다고 치자. 전문 의료진 이외에 1차적으로 가족은 부모님을 돌봐야 한다. 이 과정에서 사람들은 인터넷 검색이나 책을 통해서 필요한 정보를 얻는다. 하지만 막상 너무 많은 정보가 있는 탓에 무엇이 내 상황에 맞는 정보인지 찾기 힘들다. 이 과정에서 의사, 가족, 해당 질병에 관한 전문단체가 서로 연결할 수 있는 플랫폼을 만들고, 수많은 데이터 중 환자에게 필요한 정보가 무엇인지 분석해 보여주겠다는 생각이다.

8th_anni_infra_csr_06_SAP

▲SAP이 지원하는 ‘케어서클’. 이 플랫폼으로 환자, 가족, 의료단체, 의사와 연결할 수 있다. (출처:케어서클)

폭스마틴 회장은 “자폐증, 당뇨, 알츠하이머 같은 장기적인 치료하는 질병을 어떻게 치료하고 관리해야 하는지 알려줄 것”이라며 “사용자는 모바일 기반에서 원하는 정보를 분석 시스템을 기반으로 받을 수 있다”라고 말했다. 이 프로그램은 북미지역엔 이미 출시했으며, 아시아 지역에서도 곧 나올 예정이다.

세계은행 “실시간 데이터로 금융정책을 제대로 만들자”

세계은행은 국제연합 UN 산하 국제 금융기관이다. 이들은 개발도상국에 대한 개발자금 지원하고, 개발정책 수립 및 집행에 대한 기술지원을 한다. 최근 이러한 기술에 빅데이터를 적극적으로 활용하고 있다 .

예를 들어, 2009년 케냐에는 심각한 식량위기가 찾아왔다. 약 100만명 이상이 기아에 허덕였으며, 설상가상으로 물가상승률이 높아져 상황은 악화됐다.

당시 케냐 정부는 물가상승률은 25%로 정하고 있었는데, 이 수치가 잘못 계산됐다는 이야기가  돌고 있었다. 잘못 측정된 물가 상승률은 금융정책에 악영향을 주고 있었다. 뿐만 아니라 음식값과 물가상승률은 서로 매우 밀접한 영향을 주기 때문에, 이러한 상황은 더욱 시급히 해결돼야 했다.

2013년 세계은행은 이를 위해 각국에 있는 데이터과학자를 모아 함께 데이터를 수집했다. 물가상승률을 제대로 계산하려면, 먼저 데이터 분석이 먼저되야 하기 때문이다. 데이터 과학자들이 이를 위해 웹 사이트에 있는 수많은 데이터를 긁어오는 작업을 수행했다. 이를 위해 세계 물가 비교 사이트인 ‘험치닷컴(humuch.com)’을 이용했고, 남아프리카 식료품 체인점인 ‘픽엔페이(Pick n’ Pay)’에 나와있는 음식가격 데이터를 가져왔다. 또 케냐 주식인 ‘메이쓰’를 가격을 알려주는 엠팜(mFarm)에서 정보를 가져왔다.

☞세계 빈곤 및 부패를 없애기 위해 모인 데이터과학자들 영상 바로보기

150명의 데이터 과학자들은 이 데이터를 기반으로 실시간 음식가격에 대한 자료를 알 수 있었다. 그리고 실시간으로 음식 수요 및 가격 데이터를 알아와 물가상승률을 알맞게 계산 할 수 있었다. 이 프로젝트는 세계은행과 데이터과학자들의 봉사단체인 ‘데이터카인드‘가 주도적으로 이끌었다. 데이터카인드는 사회단체 및 비영리 단체와 데이터과학자를 연결해주는 단체이다. 이들은 개발 도상국 및 인권단체와 함께 일하면서 필요한 데이터를 분석하고 수집하도록 돕고 있다.

MS “클라우드로국제 식량 문제 해결해요”

8th_anni_infra_csr_05_MS

▲출처:MS 블로그

마이크로소프트(MS)는 2014년 7월, 미국 농무부(USDA)와 협업하여 식량 공급에 대한 연구를 지원하기로 했다. 특히 지구온난화가 식량에 미치는 영향을 집중 연구하려 한다. 지구 온난화에 대한 연구는 수많은 데이터를 가지고 빠른 속도로 처리해야 할 수 있다. 이를 위해 MS는 가지고 있는 기술력을 적극 기부한다. 예를 들어, 클라우드 장터인 ‘MS 애저 마켓플레이스’에서 필요한 데이터를 무료로 제공하고 있다. 여기에는 농작물 정보 및 기반 시설 및 비즈니스 현황 등이 포함한다. MS는 이 자료를 누구나 다운 받을 수 있게 제공하고 있다.

이 뿐만 아니라 특정 절차를 거친 학계나 비영리 단체 연구원에게는 1년동안 무료로 클라우드 컴퓨팅을 이용할 수 있게 지원한다. 이때, 18만시간의 컴퓨팅 사용량과 20테라바이트 저장 공간을 제공한다. 또한 데이터를 쉽게 처리할 수 있게 각종 소프트웨어 및 API를 제공하며, 이를 사용할 수 있도록 일대일 교육이라든지 온라인 교육프로그램도 내놓고 있다.