Dados Estruturados
Dados organizados em blocos semânticos (relações)
Dados de um mesmo grupo possuem as mesmas descrições (atributos)
Descrições para todas as classes de um grupo possuem o mesmo formato (esquema)
Dados mantidos em um SGBD sao chamados de Dados Estruturados por manterem a mesma estrutura de representação (rígida), previamente projetada (esquema)
Dados Semi Estruturados
Atualmente, muitos dados não são mantidos no SGBD
Dados Web, por exemplo, apresentam uma organização bastante heterogênea.
A alta heterogeneidade dificulta as consultas a estes dados
Assim, estes dados sao classificados como semi-estruturados
Não são estritamente tipados Não são complementamente não-estruturados
Os dados semi-estruturados são dados onde o esquema de representação está presente (de forma explícita ou implícita)
Auto-descritivo
Uma análise do dado deve ser feita para que a sua estrutura possa ser identificada e extraída
Características principais
Definição à posteriori
Esquemas são definidos após a existência dos dados
Investigação de suas estruturas particulares
Estrutura irregular
Não existe um esquema padrão para os dados
Coleções de dados são definidos de maneiras diferentes, contendo informações incompletas
Estrutura implícita
Muitas vezes existe uma estrutura implícita
Estrutura parcial
Apenas parte dos dados disponíveis podem ter uma estrutura
Comparativo
Exemplos
XML – eXtensible Markup Language
RDF – Resource Description Framework
OWL – Web Ontology Language
Dados Não Estruturados
Sao os dados que não possuem uma estrutura definida.
Normalmente caracterizados por documentos textos, imagens, videos, etc
Nem as estruturas sao descritas implicitamente
Grande maioria dos dados atuais na Web e nas empresas seguem este formato.
Crescimento diferenciado dos tipos de dados
Atualmente, devido a variedade de dispositivos, os dados também são variados
Diversos dispositivos Explosão de sensores, dispositivos inteligentes, tecnologias de colaboração, redes sociais
Dados não são mais relacionais, mas diversificados de paginas web, emails, documentos, dados de sensores, etc
Sistemas tradicionais estão em colapso para processar estes dados
Volume de Dados No ano 2000, eram armazenados no mundo
◦ 800.000 Petabytes (PB) IDC: Expectativa para 2020
◦ 35 zetabytes (ZB)
Twitter sozinho gera mais de 7 terabytes de dados TODOS OS DIAS enquanto o Facebook 10TB.
A origem ao BIG DATA (V3 - Volume, Velocidade e Variedade)
◦ Analisar dados semi-estruturados e não-estruturados de uma variedade de fontes
◦ Quando todos os dados ou quase todos devem ser analisados
◦ Para analises interativas e exploratórias
Big Data releva as formalidades e restrições do Data Warehouse Preserva a fidelidade dos dados
Se você gostou, inscreva se, mande sua opinião!
Meu e-mail: diogo.vidal@outlook.com | Diogo Vidal
Comments