Pinterest는 매일 20 테라 바이트의 새로운 데이터를 기록합니다.

Pinterest는 커버 (또는 인터페이스로 구성된 소셜 네트워크)를 통해 책을 판단 할 때 주름 장식의 흰색 볼 가운과 끝이없는 채식 요리법의 이미지를 저장하는 간단한 저장소처럼 보일 수 있습니다.

그러나 싹 트고있는 소셜 미디어 회사는 그 밑에있는 모두가 거대한 데이터 회사라는 것을 분명히하고 싶어합니다.

그리고 많은 기업 기술자, 충실한 인물처럼 Pinterest는 공개 된 특히 Hadoop에 대한 관심을 보여주었습니다.

Pinterest 데이터 엔지니어 인 Mohammad Shahangian은 목요일 아침 블로그 포스트에 디지털 스크랩북의 데이터 인프라 스트럭처에 대해 설명하고 Hadoop 백본이 관련 콘텐츠를 처리하고 고정 관념을 어떻게 유지하는지 강조했습니다.

Hadoop을 사용하면 Pins, Guided Search 및 이미지 처리와 같은 기능을 통해 가장 관련성이 높고 최근의 콘텐츠를 사용자 앞에 표시 할 수 있습니다. 또한 수천 개의 일일 측정 기준을 강화하고 엄격한 실험 및 분석을 통해 사용자가 취하는 모든 변화를 반영 할 수 있습니다.

대규모 데이터 애플리케이션을 신속하게 구축하기 위해 단일 클러스터 Hadoop 인프라를 유비쿼터스 셀프 서비스 플랫폼으로 발전 시켰습니다.

Shahangian은 Hadoop이 “플러그 앤 플레이 기술”이 아니므로 Pinterest 엔지니어가 맞춤형 검색 엔진을 구축 할 때 “각자의 요구 사항을 충족시키기 위해 광범위한 양조 방식의 오픈 소스 및 독점 솔루션”을 어떻게 활용했는지 자세히 설명했습니다.

다음은 Pinterest를 구동하는 엔진을 통해 얼마나 많은 데이터가 생성되는지 보여주는 스냅 샷입니다.

샌프란시스코에 본사를두고있는 기업이 공식적인 사용자 수를 공개하지는 않았지만이 플랫폼은 매월 4 천만에서 6 천만 명에 달하는 월간 활성 사용자 수와 계산에 사용된다고합니다.

그러나 Shahangian은 지금까지 사이트에 300 억 개 이상의 핀이 있다고 강매했다.

이미지를 통해 Pinterest

LinkedIn, 새로운 블로깅 ​​플랫폼 발표

Pinterest의 엔지니어링 책임자는 플랫폼에 대한 미래에 대한 힌트와 API에 대한 힌트를 제시하며, Facebook은 Vice를 Instagram으로 오는 비디오와 함께 십자 표시로두고, Instagram은 Twitter와 더 많은 관계를 끊었으며 공식적으로 : Twitter는 IPO를 제출했으며, Pinterest에 더 많은 마케팅을 집중해야합니까?

Big OLAP 시대인가?

DataRobot은 데이터 과학의 낮은 매달린 열매를 자동화하는 것을 목표로합니다.

MapR 창업자 존 슈뢰더 (John Schroeder)가 물러났다.

Amazon의 Simple Storage Service (S3)에 약 10 페타 바이트의 데이터를 저장하며, Pinterest는 3,000 개 이상의 노드로 구성된 6 개의 Hadoop 클러스터를 보유하고 있으며 개발자는 200 억 개가 넘는 로그 메시지를 생성하고 거의 모든 데이터를 처리합니다. 현재 Hadoop 설정을 사용하여 (관리되는 Hadoop 클러스터로 도박하는 동안),이 플랫폼은 Qubole의 웹 인터페이스를 통해 매일 2,000 명 이상의 작업을 매일 수행하는 일반 MapReduce 사용자 100 명 이상을 필요로하며, 임시 작업 및 예정된 워크 플로

Big Data Analytics, 빅 데이터 애널리틱스, DataRobot은 데이터 과학의 저조한 성과를 자동화하는 것을 목표로하고 있으며 Big Data Analytics, MapR 창업자 인 John Schroeder는 사임하고, 대체 할 COO