Siglas e Terminologias
Aqui temos um pequeno glossário de termos e siglas presentes no dia a dia de um profissional de dados.
ACID
ACID é uma sigla para as quatro principais características que definem uma transação: Atomicidade, Consistência, Isolamento e Durabilidade. Quando uma operação de banco de dados possui essas propriedades ACID, ela pode ser chamada de transação ACID.
AKA
AKA, Also known as (também conhecido por) esse termo é usado para se referir a alguém ou alguma coisa por outro nome.
ACL
Access Control List - Uma lista de controle de acesso (ACL) é uma lista de entradas de controle de acesso (ACE). Cada ACE em uma ACL identifica um objeto de confiança e especifica os direitos de acesso permitidos, negados ou auditados para esse objeto de confiança. Essa sigla e sua aplicação é muito presente nos produtos da Microsoft quando tratamos de seguraça de acesso relacionado a usuários e suas permissões.
AWS
AWS - Amazon Web Services é uma plataforma de serviços de computação em nuvem, que formam uma plataforma de computação na nuvem oferecida pela Amazon. Os serviços são oferecidos em várias áreas geográficas distribuídas pelo mundo.
CDC
CDC - Change Data Capture, ou no português captura de dados alterados. É um processo que captura alterações feitas em um banco de dados e garante que essas alterações sejam replicadas para um destino, como um data warehouse.
CDN
CDN - Content Delivery Network, ou no português rede de entrega de conteúdo. É um grupo de servidores geograficamente distribuídos que aceleram a entrega do conteúdo estáticos e dinâmicos na Web, aproximando o conteúdo de onde os usuários acessam, assim encurtando o caminho.
CHURN
Churn, ou taxa de rotatividade, é uma métrica que mede o número de clientes que deixam uma empresa em um determinado período de tempo. É calculado dividindo o número de clientes perdidos pelo número de clientes ativos no início do período.
O churn serve como um indicador de negócios que avalia a rotatividade de clientes, pois mede a proporção de clientes que deixam a base em um determinado período.
CRISP-DM
CRISP-DM (Cross Industry Standard Process for Data Mining) consiste em um conjunto de boas práticas (aka metodologia) para se executar um projeto em Ciência de Dados, ou nos dias de hoje, popularmente chamado de Data Science.
CTE
CTE, ou Common Table Expression, é uma expressão SQL que permite definir uma tabela temporária para ser usada em uma consulta SQL. CTEs são semelhantes a subconsultas, mas têm algumas vantagens importantes.
As principais vantagens das CTEs são:
- Reutilização: CTEs podem ser reutilizadas em várias consultas, o que pode reduzir a quantidade de código necessário.
- Organização: CTEs podem ajudar a organizar consultas complexas, tornando-as mais fáceis de entender e manter.
- Eficiência: CTEs podem melhorar o desempenho de consultas complexas, pois os dados são avaliados apenas uma vez.
DataOps
DataOps é uma metodologia automatizada e orientada a processos, usada por equipes analíticas e de dados, para melhorar a qualidade e reduzir o tempo de ciclo de análise de dados. Embora DataOps tenha começado como um conjunto de práticas recomendadas, agora amadureceu e se tornou uma abordagem nova e independente para análise de dados. DataOps se aplica a todo o ciclo de vida dos dados, desde a preparação até a geração de relatórios, e reconhece a natureza interconectada da equipe de análise de dados e das operações de tecnologia da informação.
DAG
DAG - Directed Acyclic Graph, ou no português gráfico cíclico direcionado. É um tipo de representação de fluxo utilizando gráfico cujos nós são direcionalmente relacionados entre si e não formam um loop direcional fechado. Na prática da engenharia analítica, os DAGs são frequentemente usados para representar visualmente os relacionamentos entre seus modelos de dados.
Embora o conceito de DAG tenha tem como origem a matemática ele acabou ganhando popularidade e aplicabilidade no trabalho computacional, os DAGs encontraram um lar no mundo moderno dos dados. Eles oferecem uma ótima maneira de visualizar pipelines de dados facilitando muito o entendimento do fluxo de processsamento de dados.
DAMA
DAMA – a Data Management Association, fundada em 1980 em Los Angeles antes conhecida como Data Administration Management Association. A DAMA International dedica-se a promover os conceitos e práticas de gestão de informações e dados e a apoiar os membros da DAMA e suas organizações para atender às suas necessidades de gestão de informações e dados.
DATA MINING
Data Mining, ou Mineração de Dados, na tradução livre pt-br, consiste em explorar um conjunto de dados, de forma analítica (com técnicas estatísticas, modelos matemáticos, etc) a fim de encontrar um padrão.
DATA VAULT
O Data Vault é um padrão de design de modelagem de dados usado para construir data warehouse para análise em escala empresarial. Ele é projetado para fornecer armazenamento histórico de longo prazo capturando os dados dos vários sistemas da empresa para um repositório central.
DATAVIZ
DataViz (ou data visualization) é a representação gráfica de um conjunto de dados (como barras, mapas ou esquemas), para que eles possam ser interpretados mais rapidamente, a partir da identificação de conceitos e padrões para a tomada de decisão.
DAX
DAX - Data Analysis eXpression, é uma coleção de funções, operadores e constantes que podem ser usados em uma fórmula ou expressão, para calcular e retornar um ou mais valores. Para falar de forma mais simples, o DAX ajuda a criar novas informações de dados que já estão em seu modelo.
DCL
DCL - Data Control Language: no português, instruções para controlar as permissões de acesso e uso aos objetos do banco de dados.
DDL
DDL - Data Definition Language: no português, conjunto de instruções e comandos para definição de dados.
DMBOk
DMBOK - Data Management Body of Knowledge que contém sugestões sobre melhores práticas e sugestões de um vernáculo comum para gerenciamento de dados corporativos. A primeira edição (DAMA-DMBOK) foi publicada em 1º de novembro de 2009, e a segunda edição (DAMA-DMBOK2) foi publicada em 1º de julho de 2017.
DML
DML - Data Manipulation Language: no português, serve para representar o conjunto de instruções da linguagem SQL para manipular os dados.
DQL
DQL - Data Query Definition: representando a principal instrução SQL, o SELECT, comando que realiza consultas de dados.
ETL
Sigla que corresponde a três etapas: extrair, transformar e carregar (ETL) é o processo que as organizações orientadas a dados usam para coletar dados de várias fontes e reuni-los para dar suporte à descoberta, à geração de relatórios, à análise e à tomada de decisões.
GCP
GCP - Google Cloud Platform é uma suíte de computação em nuvem com ferramentas de gerenciamento modulares criada pelo Google em 2008, que usa a mesma infraestrutura que a empresa usa para seus produtos dirigidos aos usuários, como o Buscador Google e o Youtube.
IaaS
A IaaS (infraestrutura como serviço) é um modelo de serviço em nuvem que oferece recursos de infraestrutura sob demanda, como computação, armazenamento, rede e virtualização, a empresas e indivíduos pela nuvem.
IaC
Infraestrutura como código (IaC) refere-se ao gerenciamento e provisionamento da infraestrutura por meio de códigos, em vez de processos manuais. A sigla vem do termo em inglês, "Infrastructure as Code"
Basicamente IaC, consiste na utilização de uma linguagem de codificação descritiva de alto nível (em geral arquivos de configuração padronizados, com o json e yaml) que tem como objetivo automatizar o provisionamento da infraestrutura de TI.
LLM
LLM refere-se ao termo em inglês Large Language Models. Considerada uma tecnologia de Machine Learning, a linguagem funciona por meio do aprendizado de máquina (ou seja, tem sua capacidade aumentada quanto mais é testada e usada).
OBT
OBT - One Big Table é uma modelagem que surgiu como resposta ao crescimento exponencial dos dados gerados pelas organizações. Os modelos dimensionais tradicionais, que eram o padrão para a modelagem de dados em data warehouses, começaram a se mostrar inadequados para lidar com esses volumes de dados.
Os modelos dimensionais tradicionais são baseados na ideia de que os dados podem ser divididos em dimensões e fatos. As dimensões representam os atributos dos dados, como cliente, produto e data. Os fatos representam os valores dos dados, como vendas, lucros e custos.
Esse modelo funciona bem para aplicações que exigem consultas simples e rápidas. No entanto, ele se torna ineficiente para aplicações que exigem consultas complexas ou que precisam lidar com dados de natureza multidimensional e heterogênea.
A modelagem OBT One Big Table, por outro lado, armazena todos os dados em uma única tabela. Isso simplifica a execução de consultas complexas, pois não é necessário realizar junções entre tabelas.
A modelagem OBT One Big Table foi proposta pela primeira vez por Dave Fowler em uma palestra em 2020. Fowler argumentou que o modelo OBT One Big Table é uma boa opção para aplicações que exigem flexibilidade, desempenho e simplicidade.
A modelagem OBT One Big Table ainda é uma abordagem relativamente nova, mas está ganhando popularidade à medida que as organizações enfrentam o desafio de lidar com grandes volumes de dados.
OLAP
OLAP - Online Analytical Processing é uma tecnologia usada para organizar bancos de dados de grandes empresas e dar suporte a business intelligence Conhecido como um tipo modelo de dados, onde a informação é conceitualmente organizada em cubos que armazenam valores quantitativos ou medidas.
Os sistemas de Análise de Processamento Online (tradução livre de OLAP) possuem a função de analisar (e não processar) informações de diversas perspectivas dentro de um Data Warehouse, fornecendo assim, suporte para as funções de análise do negócio e tomada de decisões.
OLAP: é utilizado pelo nível estratégico do negócio, serve para gerar relatórios e ajudar a gestão da empresa nas tomadas de decisões sobre a empresa.
OLTP
OLTP - Online Transaction Processing é um tipo de processamento de dados que consiste na execução de várias transações que ocorrem simultaneamente (transações bancárias online, compras, entrada de pedidos ou envio de mensagens de texto, por exemplo). Essas transações são tradicionalmente chamadas de transações econômicas ou financeiras, registradas e protegidas para que uma empresa possa acessar as informações a qualquer momento para fins contábeis ou de relatórios.
Os sistemas de Processamento de Transações Online (tradução livre de OLTP) são sistemas transacionais responsáveis pelas operações cotidianas da empresa, isto é, são sistemas que processam os dados gerados diariamente para realizar as funções de execução do negócio.
OLTP: é aplicado no nível operacional da empresa e serve para processar dados no dia a dia e dar suporte às atividades de rotina do negócio;
OOP
OOP (Object-Oriented Programming) é uma abordagem da programação na qual os dados são encapsulados em objetos e o próprio objeto é operado, em vez de suas partes componentes.
PaaS
PaaS — Platform as a Service (plataforma como serviço) é um ambiente de desenvolvimento e implantação completo na nuvem, com recursos que permitem a você fornecer tudo, desde aplicativos simples baseados em nuvem até sofisticados aplicativos empresariais habilitados para a nuvem. Você adquire os recursos necessários por meio de um provedor de serviços de nuvem com pagamento conforme o uso e os acessa por uma conexão com a Internet segura.
PoC
PoC, ou Proof of Concept, é um termo em inglês que significa "prova de conceito". Em português, é uma demonstração prática de que uma ideia ou conceito é viável. Uma POC é geralmente usada para validar um novo produto, serviço ou tecnologia antes de investir recursos significativos em seu desenvolvimento.
PR
PR - Pull Request em inglês. Em português, significa “solicitação de puxar”. O Pull Request é um recurso do Git e do GitHub que permite que os desenvolvedores contribuam com o código de um projeto sem afetar a branch principal. Quando um desenvolvedor cria um Pull Request, ele está solicitando que o proprietário do repositório faça o merge do código em sua branch principal. O Pull Request é uma forma de iniciar uma discussão sobre as alterações propostas e permitir que outros desenvolvedores revisem e comentem o código antes que ele seja mesclado na branch principal1
SOW
Share of Wallet (SOW), o termo representa o quanto de dinheiro, proporcionalmente, sua empresa recebe da carteira do cliente. A maioria das empresas tem um orçamento anual, dividido mensalmente para fazer jus a todas os seus gastos. Uma parte dele é usada para adquirir ou assinar produtos e serviços.
Um dos seus clientes gasta R$ 200,00 por mês comprando itens em sua padaria – mas gasta R$ 250,00 por mês na lanchonete do concorrente. Isso quer dizer que parte da carteira desse cliente está dividida entre os dois estabelecimentos – isso é Share of Wallet.
SWOT
SWOT, ou melhor, análise SWOT é uma ferramenta de gestão que se baseia no estudo das forças, fraquezas, oportunidades e ameaças a uma situação ou empresa, produto, indústria ou até uma pessoa. Inclusive, o acrônimo SWOT é uma sigla para Forças (Strengths), Fraquezas (Weaknesses), Oportunidades (Opportunities) e Ameaças (Threats).
UAT
UAT - User Acceptance Testing, é a validação do deploy em um ambiente onde testes de aceitação do usuário serão realizados. Isso permite que o sistema seja validado e homologado mediante a avaliação dos usuários que usam o sistema, diferente dos processos automatizados anteriores. Toda vez que ouvir alguém falar ambiente de UAT entenda que significa o mesmo que ambiente de homologação.
Wrapper
Em linguagens de programação como Python, um wrapper é uma função destinada a chamar uma ou mais outras funções, às vezes apenas por conveniência e, às vezes, modificando algum ponto para realizar uma tarefa ligeiramente diferente no processo.