Hive
O que é Hive?
O Apache Hive é um sistema de armazenamento de dados distribuído e tolerante a falhas que permite análises em grande escala. Um data warehouse fornece um armazenamento central de informações que podem ser facilmente analisadas para tomar decisões informadas e baseadas em dados. O Hive permite que os usuários leiam, gravem e gerenciem petabytes de dados usando SQL.
O Hive é construído sobre o Apache Hadoop, que é uma estrutura de código aberto usada para armazenar e processar com eficiência grandes conjuntos de dados. Como resultado, o Hive está intimamente integrado ao Hadoop e foi projetado para funcionar rapidamente em petabytes de dados. O que torna o Hive único é a capacidade de consultar grandes conjuntos de dados, aproveitando Apache Tez ou MapReduce, com uma interface semelhante a SQL.