구글 데이터셋 서치, 베타 딱지 떼고 정식 공개

가 +
가 -

 


구글이 공개돼 있는 다양한 데이터셋(Data set)을 쉽게 검색할 수 있게 해주는 데이터셋 서치를 발표했다.
데이터셋 서치는 2018년 9월 처음 공개됐고 이번에 베타 딱지를 떼어내게 됐다.

1월24일(현지시간) <테크크런치>에 따르면 연구자들은 구글 데이터셋 서치를 사용해 2010년부터 2018년까지 네덜란드에서 얼마나 많은 고양이들이 있었는지부터 주석이 붙은 대규모 오디오 및 이미지에 이르는 데이터셋을 가설을 확인하고 머신러닝 모델을 훈련 및 테스트하는 용도로 사용할 수 있다.

구글은 현재까지 데이터셋 서치를 위해 현재까지 600만개 가량의 표를 인덱스화했다.앞으로도 새로운 기능들을 데이터셋 서치에 추가해 나갈 예정이다. 첫번째로 추가될 기능은 필터로 사용자가 표, 이미지, 텍스트 등 어떤 데이터셋 유형을 보고 싶은지 선택할 수 있게 해준다. 이를 통해 찾고 있는 정확한 데이터를 보다 쉽게 찾을 수 있다. 구글은 데이터셋 서치에서 퍼블리셔에 대한 보다 많은 정보도 추가했다고 덧붙였다.

데이터셋 서치에서 찾을 수 있는 많은 데이터들은 정부 기관들이 제공한 것이다.

현재 데이터셋 서치에는 200만개 가량의 미국 정부 데이터셋이 올라와 있다. 정부 데이터셋들 외에도 사용자들은 구글 캐글 서비스 또는 다른 민간 또는 공공 기관들이 공개한 데이터셋들도 찾을 수 있다고 구글은 설명했다.

네티즌의견(총 0개)