클래스: 데이터 과학 학습: 기본 이해

무료이용으로 수강해 보세요.

업계 전문가가 강의하는 클래스 23,100개를 수강하세요.

지식에 초점 두기

지식에 초점 두기

데이터 과학의 주요 과제 중 하나는 제가 꿈의 클러스터라고 부르는 것입니다. 케빈 코스트너 주연의 꿈의 구장이라는 영화를 기반으로 합니다. 옥수수 밭에 야구 다이아몬드를 만드는 데 저축한 돈을 모두쓴 남자에 관한 이야기였습니다. 그는 오래된 플레이어의 유령이 방문했습니다. 그들은 그에게 야구 다이아몬드를 완성하라고 말했습니다. 그들은 당신이 그것을 세우면 그들이 올 것이라고 말했습니다. 많은 조직들이 동일한 함정에 빠집니다. 그들은 하드웨어를 구축하고 방대한 양의 데이터를 수집하는 데 에너지를 집중합니다. 대규모 데이터 클러스터에서 실행할 소프트웨어에 상당한 투자를 합니다. 그들의 꿈은 하드웨어와 소프트웨어가 충분하다면 귀중한 통찰력을 얻을 수 있는 것입니다. 그들이 그것을 만들면 될 것입니다. 그것에 대해 생각할 때 많은 의미가 있습니다. 성공적인 하드웨어 프로젝트를 제공한 경험이 많은 조직이 많습니다. 그들이 할 줄 아는 일입니다. 대부분의 대규모 조직은 그것에 능숙하며, 수십 년 동안 해왔습니다. 데이터 과학은 새로운 것입니다. 많은 조직에서는 탐색하고 질문하는 데 돈을 쓰는 것이 쉽지 않습니다. 여러분은 운영 능력을 구축하고 있지 않습니다. 대신 새로운 마음가짐을 시작하는 데 집중해야 합니다. 하드웨어는 진짜입니다. 가시적입니다. 사고 있는 것을 볼 수 있습니다. 탐색은 정량화하기가 더 어렵습니다. 프로젝트 파이프라인에 깔끔하게 맞는 ROI가 없습니다. 휘발성 일 수 있습니다. 이미 해 본 후에야 그만한 가치가 있는지 알 수 있습니다. 미국 의회도서관은 1,700억 트윗을 수집하는 프로젝트를 시작한 것으로 유명합니다. 그들은 데이터 과학으로 작업할 수 있음을 보여주고 싶었습니다. 그들은 트윗을 보관하기 위해 서버와 하드웨어를 구입했는데 데이터로 무엇을 할 것인지에 대한 계획이 없었습니다. 또한 데이터에 대한 아무 액세스 권한을 부여할 수 없었습니다. 그것을 만들면 될 것이라고 생각했습니다. 불행히도 데이터 수집의 기념비인 수백 대의 서버에서…

목차