Skip to content

Introdução a Engenharia de Dados no Google Cloud

Visão Geral

Tasks Description Solutions
Replicate and Migrate Transfer raw data into Google Cloud Google Cloud and others
Ingest Raw data is available in a data source Cloud Storage, Pub/Sub, Spanner and others.
Transform Process data using EL, ELT, or ETL tools Dataproc, Dataflow, Dataform and others.
Store Processed data is available in a data sink BigQuery, Dataplex, Bigtable and Analytics Hub

Ingestão

Formatos de Dados

Formats Types
Unstructured Documents, images, audio files
Structured Tables (Rows and Columns)

Storage

Cloud Storage

O Cloud Storage oferece quatro classes de armazenamento principais, cada uma projetada para diferentes necessidades de acesso e custos. Aqui está um resumo de cada uma:

- Standard Storage: É a opção recomendada para dados que são acessados frequentemente, seja diariamente ou semanalmente.

- Nearline Storage: É mais adequada para dados que são acessados com menos frequência, por exemplo, uma vez por mês.

- Coldline Storage: É recomendada para dados que são acessados raramente, como uma vez por trimestre.

- Archive Storage: É a melhor opção para dados que são acessados muito raramente, como uma vez por ano ou menos.

Em resumo, a escolha da classe de armazenamento depende da frequência com que os dados precisam ser acessados, com o Standard Storage sendo para acesso frequente e o Archive Storage sendo para dados que raramente precisam ser acessados.