Inteligência Artificial (AI é a sigla em inglês) é a disciplina que estuda e desenvolve modelos de computação que reproduzem habilidades do cérebro humano. Big Data é um conjunto de tecnologias abertas (open source) que armazenam e processam grandes volumes de dados de forma distribuída/paralela e com grande tolerância a falhas.AI tem um grande foco em processamento de imagens, reconhecimento de linguagem (falada e escrita), aprendizagem, identificação de padrões, capacidade de locomoção autônoma (robôs, carros), habilidade de tomar decisões de acordo com o ambiente e o contexto, coisas que nós humanos — no geral (risos) — fazemos com maestria. Existem muitos exemplos e aplicações, mas talvez um dos mais comuns hoje em dia pode ser visto na hora de tirar fotos no celular, os aparelhos mais novos conseguem identificar rostos e geralmente colocam um quadrado em torno deles, o software do aparelho foi “ensinado” a reconhecer rostos humanos. Aprendizado (algoritmo) de máquina é uma das ferramentas usadas nesse processo.Big Data, por sua vez, é um modelo de infrastrutura de processamento e armzenamento. Pense numa analogia simples. Você tem o seu computador com um HD de 1 terabyte. Pra evitar perdas, você faz um backup num HD externo via USB. Se seu computador pifar, você tem que restaurar o backup porque o seu HD externo armazena dados mas não tem como processá-los. Em Big Data, tudo fica junto, todo dispositivo armazena/processa e os backups são automáticos.Na prática, isso significa que você teria, por exemplo, três computadores em casa com os dados triplicados. Qual a vantagem? Digamos que levaria 15 minutos pra escanear 1 TB contra vírus. Como seus dados são triplicados, que tal dividir a carga e processar 1/3 dos dados em cada computador? Isso significa terminar a tarefa em 5 minutos, já que os 3 computadores estariam rodando em paralelo. Big Data leva isso ao extremo com centenas de máquinas e produz resultados com muito mais rapidez por causa desse paralelismo. Outra vantagem é que se um dos computadores falhar, os outros continuam operando sem perda de dados.A interseção entre os dois tópicos é que algoritmos de inteligência artificial muitas vezes rodam em ambientes de Big Data por causa do volume enorme de dados, mas BD e AI são ferramentas distintas.
ETL PowerCenter - by Diogo Vidal
Comments