31/7/15

¿Qué es el Big Data?

El tratamiento y análisis de enormes almacenes de datos, que provienen de múltiples fuentes como vídeos, imágenes, redes sociales, comunicaciones 3G, 4G y GPS, dispositivos móviles, apps, etc.
Estos datos son en sí mismo big data, generan tal cantidad de información que se deben encontrar nuevas formas de gestión.
Cada día en el mundo se generan más de 2.5 exabytes de datos. El crecimiento es tan grande, que el 90% de los datos guardados en la actualidad, han sido creados en los dos últimos años. Estos datos separados tienen poco sentido, analizados, agrupados y procesados pueden generar un gran valor añadido, su explotación se convierte en una destacada oportunidad para empresas y administraciones públicas y para desarrollo en la Sociedad de la Información.
Esa minería recibe el nombre de Big Data e incluye tecnologías, sistemas y metodologías que permiten el tratamiento y análisis de grandes conjuntos de datos, que no pueden ser gestionados con los sistemas y herramientas tradicionales en una destacada oportunidad para empresas y administraciones públicas y para desarrollo en la Sociedad de la Información.

Para qué puede sirven? Entre sus mayores beneficios  esta hacer más útil y aprovechable el conocimiento, permiten mejorar resultados de actividades, procesos, personas o máquinas y además permitir cosas que antes o no existían o se consideraban prácticamente imposibles para empresas y administraciones públicas y para desarrollo en la Sociedad de la Información.
La información obtenida por las empresas es analizada con el objetivo de aumentar su rentabilidad, por ejemplo empresas como Google o Amazon presentan anuncios personalizados en función de los gustos y necesidades de los usuarios tras realizar análisis de las búsquedas o compras que estos realizan, esta información permite a las empresas predecir futuras prestaciones o artículos que ofrecer a sus usuarios.
Los organismos gubernamentales usan esta tecnología para mejorar los servicios que prestan a los ciudadanos, por ejemplo la ciudad francesa de Lyon, gracias a esta tecnología junto con la captura de datos mediante sensores repartidos por toda la ciudad ha podido analizar las congestiones de tráfico con el objetivo de predecir en cualquier momento cuando  se va a producir un atasco de tal manera que cambian automáticamente las señales de tráfico con el objetivo de mejorar el flujo circulatorio.
Las soluciones Big Data en el ámbito académico se pueden centrar en el aspecto institucional y en el  aprendizaje, desarrollando modelos que permitirán analizar los comportamientos de los estudiantes y sus intereses en comunidades virtuales de aprendizaje, así como realizar un seguimiento más exhaustivo  de los alumnos. Estudio de modelos específicos que permiten por ejemplo identificar estudiantes en riesgo para tomar decisiones tendentes a intervenir, con el fin de reducir la deserción y aumentar las tasas de finalización.
Existen una gran cantidad de bases de datos donde los datos son recogidos, limpiados y colocados en almacenes de datos, DataWareHouse. Los datos una vez consolidados se depositan en bases de datos adicionales sobre los que se realizan informes, estadísticas y análisis más o menos complejos.
Las tecnologías de almacenamiento tradicionales, para procesar y visualizar datos tienen limitaciones para algunos de los tipos de aplicaciones característicos del BigData, especialmente en los casos con cantidades de datos muy grandes. Han aparecido nuevas herramientas orientadas específicamente a estos problemas, como por ejemplo:
  • Sistemas basados en el paradigma “map-reduce”. Hadoop es la implementación más popular de este paradigma, que permite la ejecución masivamente paralela de procesos de análisis sobre grandes cantidades de datos, usando para ello PCs convencionales aralela de procesos de análisis sobre grandes cantidades de datos, usando para ello PCs convencionales.
  • Bases de Datos NoSQL. Tipos de sistemas diferentes como las bases de datos orientadas a documento, las bases de datos tipo BigTable, las bases de datos que funcionan sobre Hadoop, o las bases de datos con modelo de datos en grafico. Cada uno de estos tipos de bases de datos está optimizado para tipos de aplicaciones diferentes.
Dejamos un enlace con algunas de las herramientas de Big Data más utilizadas:
Y otro sobre Administraciones Públicas y Big Data:

0 comments:

Publicar un comentario