O que é BigData

Criado por Anchieta Acacio

2023-11-24 11:37:48

Big Data refere-se a conjuntos de dados extremamente grandes e complexos que não podem ser facilmente gerenciados, processados ou analisados ​​com ferramentas tradicionais de processamento de dados. Esses conjuntos de dados são caracterizados por volume, variedade, velocidade e veracidade.


O volume se refere à quantidade massiva de dados gerados diariamente por várias fontes, como redes sociais, dispositivos móveis, sensores, transações financeiras, entre outros. A variedade refere-se à diversidade dos tipos de dados, que podem ser estruturados (dados em tabelas), semiestruturados (dados em formatos como XML e JSON) ou não estruturados (texto, áudio, vídeo). A velocidade refere-se à velocidade em que os dados são gerados e precisam ser processados em tempo real ou próximo disso. A veracidade se refere à confiabilidade e qualidade dos dados.


As tecnologias usadas em Big Data permitem o armazenamento, processamento e análise eficientes desses conjuntos de dados. O Hadoop é um framework que permite o processamento distribuído de grandes volumes de dados em clusters de computadores. O Spark é um framework rápido e poderoso para processamento de dados em tempo real. NoSQL é uma abordagem para bancos de dados não relacionais que oferece escalabilidade horizontal e flexibilidade para lidar com grandes volumes de dados. O Apache Kafka é uma plataforma de streaming distribuída para ingestão e processamento em tempo real de fluxos de dados em larga escala. O Hive é uma infraestrutura para consulta e análise de grandes conjuntos de dados armazenados no Hadoop usando uma linguagem semelhante ao SQL.


O uso de Big Data tem se mostrado importante em diversas áreas, como análise de dados, inteligência artificial, aprendizado de máquina, personalização de serviços, tomada de decisões baseada em dados, segurança cibernética, saúde, entre outros. A análise desses grandes conjuntos de dados pode revelar insights valiosos e informar estratégias e decisões empresariais.


Bibliografias:

1. "Big Data: A Revolution That Will Transform How We Live, Work, and Think" - Viktor Mayer-Schönberger and Kenneth Cukier

2. "The Big Data-Driven Business: How to Use Big Data to Win Customers, Beat Competitors, and Boost Profits" - Russell Glass and Sean Callahan

3. "Big Data at Work: Dispelling the Myths, Uncovering the Opportunities" - Thomas H. Davenport

4. "Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking" - Foster Provost and Tom Fawcett

5. "Hadoop: The Definitive Guide" - Tom White

6. "Spark: The Definitive Guide" - Bill Chambers and Matei Zaharia

Rede Sociais