“데이터가 당신에게 싫어하는 것을 알려주면 어떨까요?” 세 가지 큰 데이터 함정

큰 데이터는 곧 큰 비즈니스가 될 것입니다. 거대한 양의 구조화 된 데이터와 비 구조화 된 데이터를 통찰력있게 분리 할 수 ​​있으므로 고객 서비스를 개선하고 프로세스를보다 효율적으로 만들고 비용을 절감 할 수 있습니다.

1. 움직이기 전에 정치가 큰 데이터 프로젝트를 탈선 시키도록하십시오.

유럽 ​​우주국 (European Space Agency)은 거대한 위험 데이터를 처리하기 위해 클라우드 리서치 플랫폼을 가동합니다. 빅 데이터 분석 : 왜 영국군은 총알을 물어야합니까?

분석가 Gartner에 따르면 큰 데이터의 채택은 여전히 ​​초기 단계에 있습니다. 기업의 8 %만이 실행 및 실행 중이며, 20 %는 조종 및 실험 중이며, 18 %는 ‘전략 개발’, 19 %는 ‘지식 수집 나머지는 계획이 없거나 모릅니다. 그러나 분석가 회사는 2 년 이내에 440 만 명의 사람들이 그러한 프로젝트에 참여할 것으로 예측하고 있으며 Harvey Nash의 최근 조사에 따르면 10 명의 CIO 중 4 명이 내년에 투자를 늘릴 계획이라고합니다.

그러나 대용량 데이터는 테스트되지 않은 기술과 대부분의 조직 내부에서 부족한 기술을 사용하기 때문에이를 악용하려는 조직에 많은 어려움이 있습니다

가트너는 빅 데이터가 3 년 내에 440 만개의 새로운 IT 일자리를 창출 할 것이라고 예측했다. 곧 부족할 직책을 찾아보십시오.

기술 팀과 나머지 비즈니스 팀은 목표가 무엇인지에 대한 아이디어가 다를 수 있기 때문에 큰 데이터 계획을 수립하고 실행하는 것이 프로젝트의 가장 어려운 부분 중 하나 일 수 있습니다. 웹 사이트에서 컨설팅 한 기술 책임자에게 큰 데이터 IT 부서에서만 실행되는 프로젝트는 비즈니스 요구 사항과 관련이 없기 때문에 실패 할 수 있습니다. 예를 들어 마케팅 부서의 잘못된 요청으로 인해 IT 부서는 무엇을 제공할지 혼란스러워 할 수 있습니다.

Masan Group의 CTO 인 Rohit Killam은 Clarion Solicitors의 인프라 관리자 인 Duncan James는 “진정한 병목 현상은 올바른 이해 관계자와 함께 가치 중심의 대용량 데이터 프로그램을 개념화하는 것입니다. 가장 어려운 부분, 특히 비즈니스가 처음부터 원하는 것을 분명하게 표현할 수없는 경우.

가트너 (Gartner)의 프랭크 Buytendijk (Frank Buytendijk) 연구 부회장은 많은 조직에서 프로젝트 수행을 원할 때마다 예산이 책정되기 전에 비즈니스 사례가 있어야한다고 말합니다.

조직이 어떻게 작동하고 생각하는지, 어떤 것이 든 훌륭한 것은 있지만, 기술로 놀기의 모든 요점이 당신을 위해 무엇을하는지 알아 내려고 노력하고 있기 때문에 혁신적인 것은 정말 어렵습니다. 이것은 큰 데이터에는 고유하지 않지만 큰 데이터에도 큰 영향을 미칩니다.

Buytendijk에 따르면 큰 데이터 프로젝트는 오픈 소스 도구의 가용성 덕분에 많은 비용을 들이지 않아도됩니다. 결과적으로이 프로젝트는 조직의 큰 데이터 전략을 탐색하는 위험이 적은 방법으로 사용될 수 있습니다. 그는 “비즈니스 사례가 출발점이되어서는 안되며, 비즈니스 사례가 결과물이어야하며, 기업 내에서 올바른 대화를 창출하는 것이 실현되고있다”고 말했다.

올해 초 실시한 Harvey Nash CIO Survey에 따르면 4 명의 CIO 중 1 명은 대형 데이터 프로젝트의 직원을 찾는 데 어려움이 있다고보고했습니다. 이는 웹 사이트에서 조사한 IT 책임자에 따르면 사내 기술 팀이 제공하는 표준 스킬 셋 외부에서 수행되는 이러한 프로젝트에 필요한 복잡한 일련의 기술로 인해 복잡해졌습니다.

클라리온의 던컨 제임스 (Duncan James)는 “대용량 데이터 기술 부족으로 큰 데이터 프로젝트가 지연되는 것은 아니지만 성공 요인 및 프로젝트 실행에 영향을 미칩니다. Penn Medicine의 건강 기술 부사장 겸 학술 컴퓨팅 부사장 인 Brian Wells는 결과 해석과 분석적 가설 개발과 관련된 분야에서이 문제가 있다고 덧붙입니다.

Gartner의 Buytendijk은 “기술은 처음부터 문제였으며 가까운 장래에 문제가 될 것입니다.”라고 말했습니다. “계량 경제학, 통계학 및 수학에 대한 배경 지식이 있고 현대적인 프로그램 방법을 아는 사람들을 어떻게 찾을 수 있습니까? 환경과 비즈니스 감각을 가지고 있습니다. 왜냐하면 빅 데이터 분석은 상황을 해석하고, 특정 상황에서 어떤 일이 일어나고있는 이유입니다. 이 스킬 셋은 실제로 찾기가 정말로 어렵습니다.

한 가지 문제는 큰 데이터는 연역적 사고보다는 귀납적 사고가 필요한 반면, 대부분의 IT 조직은 연역적 사고가 우수하다는 점입니다. 귀납적 사고 (데이터를 사용하여 연결 가능성을 창출하는 방식)가 일상적인 업무 방식을 벗어납니다.

또 다른 문제는 큰 데이터 기술은 매우 프로그래밍 집약적인데, 프로젝트에서 소프트웨어와 구현 간의 전형적인 비율은 1에서 5 사이입니다.이 도구는 사용자 친화적이지 않고, 다른 도구와 통합 할 수 없으며 몇 년 동안은 그렇지 않습니다.

Big Data Analytics, 빅 데이터 애널리틱스, DataRobot은 데이터 과학의 저조한 성과를 자동화하는 것을 목표로하고 있으며 Big Data Analytics, MapR 창업자 인 John Schroeder는 사임하고, 대체 할 COO

SafeAmerica Credit Union의 IT 담당 부사장 인 John Gracyalny는 “많은 데이터의 복잡성이 과대 평가된다고 생각합니다.”라고 모든 기술 담당자가 동의합니다. “우리는 내부적으로 데이터웨어 하우스 / 분석 도구를 구축하기위한 프로젝트를 시작했습니다. 우리는 4 인 IT 부서 만 보유하고 있으며, 비전 작업과 데이터베이스 디자인을 제공하고 있으며, 가장 최근의 사람은 외부 처리를위한 코드를 작성하고 있습니다. 데이터 추출 및 가져 오기가 가능하며 내 오른손에는 기성 보고서 도구가 통합됩니다.

조직이 디지털 쓰레기를 통해 준설 작업을 시작하면, 묻혀 있던 정보를 발견 할 위험이 있습니다. 따라서 고객 트랜잭션 및 저장된 다른 데이터를 탐색하기 전에 거버넌스를 마련해야합니다.

예를 들어 작년에 뉴욕 타임즈의 한 기사는 소매업자가 쇼핑 패턴을 사용하여 고객이 임신했을 때를 파악하고 돈을 지불하는 바우처를 제공 할 수있는 방법과 시청자가 느끼지 못하게하는 방법을 공개했습니다. 따라서 조직은 자체 데이터 및 기타 타사 데이터를 사용하여 고객이 알지 못하도록하는 고객 정보를 발견 할 수 있도록주의해야합니다.

Gartner의 Buytendijk이 다음과 같이 말합니다. “유도 적으로 작업하기 시작하면 데이터가 말하게됩니다. 데이터가 사용자에게 마음에 들지 않는 것을 알려주면 어떻게됩니까?”

“빅 데이터는 질문조차되지 않은 질문에 답하기 때문에 매우 곤란할 수 있습니다. 그렇다면 조직에 알리고 싶지 않은 일이있는 커다란 벽이있는 샌드 박스를 통해 거버넌스 상황을 어떻게 만듭니 까?”

Buytendijk에 따르면 조직은 큰 데이터의 성과를 과도하게 (과도하게) 사용하지 못하게하는 일종의 통치가 필요합니다. “많은 국가에서 큰 데이터가 자신의 이익을 위해 너무 영리하다는 평판 문제가있었습니다. 권력은 커다란 책임을지고있다 “고 그는 경고했다.

추가 읽기

LinkedIn, 새로운 블로깅 ​​플랫폼 발표

Big OLAP 시대인가?

DataRobot은 데이터 과학의 낮은 매달린 열매를 자동화하는 것을 목표로합니다.

MapR 창업자 존 슈뢰더 (John Schroeder)가 물러났다.

너는 데이터 야?! ‘ 빅 데이터 세상에서 승리 할 5 가지 직업

2. 빅 데이터 기술 위기

3. 거친 지배 구조의 두통