top of page
linear-illustration-slide-presentation-l
building-a-performing-machine-learning-m
623379_orig
Foto do escritorDiogo Vidal

Dados Estruturados x Dados Semi Estruturados x Dados Não Estruturados



Dados Estruturados

Dados organizados em blocos semânticos (relações)

Dados de um mesmo grupo possuem as mesmas descrições (atributos)

Descrições para todas as classes de um grupo possuem o mesmo formato (esquema)

Dados mantidos em um SGBD sao chamados de Dados Estruturados por manterem a mesma estrutura de representação (rígida), previamente projetada (esquema)


Dados Semi Estruturados

Atualmente, muitos dados não são mantidos no SGBD

Dados Web, por exemplo, apresentam uma organização bastante heterogênea.

A alta heterogeneidade dificulta as consultas a estes dados

Assim, estes dados sao classificados como semi-estruturados

Não são estritamente tipados Não são complementamente não-estruturados

Os dados semi-estruturados são dados onde o esquema de representação está presente (de forma explícita ou implícita)

  • Auto-descritivo

Uma análise do dado deve ser feita para que a sua estrutura possa ser identificada e extraída

Características principais

  • Definição à posteriori

Esquemas são definidos após a existência dos dados

Investigação de suas estruturas particulares

  • Estrutura irregular

Não existe um esquema padrão para os dados

Coleções de dados são definidos de maneiras diferentes, contendo informações incompletas

  • Estrutura implícita

Muitas vezes existe uma estrutura implícita

  • Estrutura parcial

Apenas parte dos dados disponíveis podem ter uma estrutura


Comparativo

Exemplos


XML – eXtensible Markup Language

RDF – Resource Description Framework

OWL – Web Ontology Language


Dados Não Estruturados

Sao os dados que não possuem uma estrutura definida.

Normalmente caracterizados por documentos textos, imagens, videos, etc

Nem as estruturas sao descritas implicitamente

Grande maioria dos dados atuais na Web e nas empresas seguem este formato.

Crescimento diferenciado dos tipos de dados


Atualmente, devido a variedade de dispositivos, os dados também são variados

Diversos dispositivos Explosão de sensores, dispositivos inteligentes, tecnologias de colaboração, redes sociais

Dados não são mais relacionais, mas diversificados de paginas web, emails, documentos, dados de sensores, etc

Sistemas tradicionais estão em colapso para processar estes dados


Volume de Dados No ano 2000, eram armazenados no mundo

◦ 800.000 Petabytes (PB) IDC: Expectativa para 2020

◦ 35 zetabytes (ZB)


Twitter sozinho gera mais de 7 terabytes de dados TODOS OS DIAS enquanto o Facebook 10TB.



A origem ao BIG DATA (V3 - Volume, Velocidade e Variedade)












◦ Analisar dados semi-estruturados e não-estruturados de uma variedade de fontes

◦ Quando todos os dados ou quase todos devem ser analisados

◦ Para analises interativas e exploratórias

Big Data releva as formalidades e restrições do Data Warehouse Preserva a fidelidade dos dados


 

Se você gostou, inscreva se, mande sua opinião!

Meu e-mail: diogo.vidal@outlook.com | Diogo Vidal


349 visualizações0 comentário

Posts recentes

Ver tudo

Comments


bottom of page