Snowflake, 다중 클러스터 데이터웨어 하우스 소개

여러면에서 클라우드 데이터웨어 하우스 (DW) 장면에는 두 개의 돌출부가 있습니다. 하나는 AWS (Amazon Web Services)와 Microsoft의 Azure (Azure) 사이의 전투를 포함합니다. 다른 하나는 IBM의 dashDB와 두 개의 클라우드 데이터웨어 하우스 순수 재생 인 Cazena 및 Snowflake로 구성됩니다.

소규모 기업에서 큰 혁신이 이루어지며, 클라우드 DW 공간에 대한 분석을 MS-AWS 로브에만 제한하면 시장에서 몇 가지 중요한 돌파구를 놓치게됩니다. 예를 들어, Microsoft는 자사의 Azure SQL 데이터웨어 하우스와 AWS의 Redshift 서비스를 구분하여 서로 독립적으로 컴퓨팅 및 스토리지를 확장하고 요구가없는 시간에 DW를 일시 중지하는 기능을 구분합니다. 그러나 Snowflake의 Elastic Data Warehouse (EDW)는 실제로이 아키텍처를 시장에 선 보이게했습니다.

Microsoft가 DW 플랫폼을 일반용 (GA), Snowflake (Bob Muglia의 CEO 인 Bob Muglia가 Microsoft에서 전체 Server and Tools Business를 운영하는 데 사용함)에 배치 한 지 불과 8 일 만에 오늘 EDW에 대한 아키텍처 혁신이 추가되었습니다.

모든 친구들을위한 클러스터 온 – 프레미스와 클라우드 모두에서 대부분의 DW 플랫폼은 물리적으로 서버 클러스터의 리소스 풀링에 기반을두고 있지만 Snowflake는 DW를 여러 클러스터에서 실행할 수있는 기능을 도입하고 있습니다. Snowflake는이 아키텍처가 더 많은 동시성, 즉 더 많은 동시 사용자를 처리 할 수있는 능력을 제공 할 것이라고 말합니다.

사실, 추가 클러스터의 할당 (및 할당 해제)은 자동화 된 관리자가 아니기 때문에 수행 할 수 있으므로 Snowflake는 실제로 멀티 클러스터 아키텍처가 무제한의 동시 사용자 수를 수용 할 것이라고 말합니다.

Encore : 향상된 동시성 외에도 Snowflake는 대시 보드 및보고 성능을 최적화하는 새로운 쿼리 캐싱 기술을 발표했습니다. 또한 손실이나 부패가 발생할 경우 데이터를 쉽게 복구 할 수 있도록 “데이터 획기적”을 추가하고 있습니다.

그런 다음 Snowflake가 말한 것처럼 새로운 자동화 된 데이터 배포 및 메타 데이터 관리가 있으며 성능 확장 및 쿼리 최적화를 위해 필요한 수동 튜닝을 제거합니다.

Dayenu; 그것은 우리에게는 충분 하겠지만 더 많은 사용자를 수용하는 동일한 멀티 클러스터 아키텍처는 재해 복구 및 고 가용성을 향상시킬 수 있습니다. 이는 각 클러스터가 물리적으로 분리 된 가용성 영역에 위치 할 수 있기 때문에 거의 “자유로운”아키텍처 결과로 간주됩니다. 새로운 EDW 기능 목록에 HA / DR을 추가하십시오.

Snowflake는 200 명이 넘는 고객이 있다고합니다. 1 년 전만해도 그 자체로 GA 제품을 얻으려면 그 정도면 충분합니다. 물론 IBM과 Cazena는주의를 기울여야합니다. 그러나 아마존과 마이크로 소프트도 그렇게해야한다. 당신의 월계관에서 쉬는 것이 너무 예리하다.

 이야기

LinkedIn, 새로운 블로깅 ​​플랫폼 발표

Big OLAP 시대인가?

DataRobot은 데이터 과학의 낮은 매달린 열매를 자동화하는 것을 목표로합니다.

MapR 창업자 존 슈뢰더 (John Schroeder)가 물러났다.

Amazon은 Jaspersoft 지원으로 “Redshift”클라우드 데이터웨어 하우스를 발표하고 Cloud 데이터웨어 하우스 경쟁은 가열되고 Microsoft는 파트너에게 : 우리는 데이터 중심적입니다

Big Data Analytics, 빅 데이터 애널리틱스, DataRobot은 데이터 과학의 저조한 성과를 자동화하는 것을 목표로하고 있으며 Big Data Analytics, MapR 창업자 인 John Schroeder는 사임하고, 대체 할 COO