Big Data. ¿Qué es?
A todos nos resulta familiar el concepto de Big Data, lo hemos oído más de una y dos veces, pero ¿entendemos realmente qué es?
Big Data es un concepto que hace años que está de moda en el mundo informático. Este concepto llegó con el objetivo de cubrir unas necesidades que hasta el momento las tecnologías que teníamos no podían satisfacer. El Big Data empezó a existir en el momento en que nuestra sociedad se convirtió en la sociedad de la información. El progreso constante que experimentamos con las nuevas tecnologías, el desarrollo frenético de las redes de comunicación y Internet, está dejando un rastro digital lleno de información.
Día a día estamos acumulando datos, generamos y compartimos constantemente información, sobre todo en las redes sociales y a través de Internet. Toda esta información convertida en datos se combina con algoritmos. El Big Data existe en cualquier campo imaginable, desde la investigación, la sanidad, el periodismo, la educación, la política…
Es por eso que cuando hablamos de Big Data hacemos referencia al conjunto de datos que creamos día a día a través de las nuevas tecnologías, redes sociales e Internet y al análisis masivo que esto conlleva. El mismo termino se refiere a las nuevas tecnologías que a día de hoy permiten el almacenamiento y procesamiento de toda esta información.
En español, el Big Data se traduce como grandes datos (macrodatos) o datos masivos.
Según elEconomista, se denomina Big Data a la gestión y análisis de enormes volúmenes de datos que no pueden ser tratados de manera convencional, ya que superan los límites y capacidades de las herramientas de software habitualmente utilizadas para la captura, gestión y procesamiento de datos. Es un termino que engloba infraestructuras, tecnologías y servicios que han sido creados para dar solución al procesamiento de enormes conjuntos de datos estructurados, no estructurados o semi-estructurados (mensajes en redes sociales, señales de móvil, archivos de audio, sensores, imágenes digitales, datos de formularios, emails, datos de encuestas, logs etc,) que pueden provenir de diferentes fuentes.
¿De dónde vienen los datos?
La información creada a nivel mundial no para de crecer. En estos últimos tiempos, gracias a Internet y a las nuevas tecnologías, la información y los datos que podemos llegar a crear son inimaginables.
Hay diferentes fuentes a través de las cuales se crea toda esta información. Por ejemplo, toda la información que producimos las personas, quizás muchas veces sin darnos ni cuenta. Estos datos se construyen a través de los mails que podemos mandar, cuando colgamos nuestro currículo en Linkedin, cuando utilizamos Twitter, los comentarios que posteamos en Facebook, las fotos que subimos en Instagram, las conversaciones de WhatsApp, hacer click en un enlace de internet… y miles de acciones que, sin darnos cuenta, realizamos en nuestro día a día y que forman parte de esta construcción masiva de datos a nivel mundial.
También hay otros tipos de fuentes, como la información que se crea entre màquinas. Las máquinas se intercanvian información a la vez que la crean. Por ejemplo, los GPS, los teléfonos móviles, los termómetros, los parquímetros, las máquinas expendedoras, los contadores de electricidad… estas máquinas se comunican a través de dispositivos con otros aparatos que van recogiendo información. Las redes que permiten este intercanvio de información pueden ser el Wifi, el ADSL, el Bluetooth, la fibra óptica….
También existen fuentes biométricas con las caules se generan cantidades de datos e información. Podríamos hablar de los sensores de huellas dactilares, los lectores de ADN, los sensores de reconocimiento de voz….
Las transacciones financieras, como lo puede ser un traspaso monetario de una cuenta a otra, comprar un billete de avión, comprar ropa online… también es una gran fuente de información.
Las 7 V (o características) del Big Data
- Volumen: la cantidad de datos generados no para de aumentar. A medida que los datos crecen, también es necesario que lo hagan las aplicaciones y las infraestructuras construidas para soportar la recogida y el almacenamiento de este volumen de datos. Además, cada vez son más variados.
- Velocidad: el concepto de inmediatez está ya impregnado en nuestro ADN. Se busca la información para que llegue al instante. Es por eso que se requiere una velocidad de procesamiento y de análisis que este a la altura de la velocidad actual de los datos. Por lo tanto, velocidad es la rapidez en que los datos se crean, se almacenan y se procesan a tiempo real.
- Variedad: existen muchas formas diferentes en las que se registran los datos. Como ya hemos dicho, podemos hablar de fotografías, comentarios, correos, audios…
- Veracidad: es necesario conocer la fiabilidad de la información que se almacena, ya que esto configurará la calidad de estos datos.
- Visualización: capacidad de convertir diferentes informaciones y cantidades en informaciones que concluían y que sean predictivas. Sintetizar los datos.
- Valor: que haya mucha información no implica que la información tenga valor. Es por eso que es importante que los datos se transformen en información con valor y validez. Que podamos extraer conocimiento de la información y actuar o tomar decisiones a partir de ella.
- Variabilidad: los datos varían en cada segundo, minuto y hora. Es por eso que no son fijos en el tiempo y que requieren de un control constante.
Ahora que conocemos mejor este concepto, en una de las próximas publicaciones explicaremos como el Big Data se puede convertir en una posibilidad de negocio, sus ventajas y sus riesgos.
!Hasta la próxima!