En estos días, ya sea en nuestro trabajo, en nuestro emprendimiento o en las redes, solemos escuchar bastante el término Big Data, de hecho, muchas empresas están gastando recursos financieros y talento en desarrollar soluciones de este tipo, pero, ¿Qué es en realidad Big Data?
Vamos a explicar de manera muy sencilla qué es Big Data y también qué no es Big Data. Primero tenemos que entender que no es una palabra sofisticada, Big Data es simplemente un término que describe grandes volúmenes de datos, ya sea estructurados o no, que son difíciles o imposibles de administrar usando herramientas tradicionales para la administración de bases de datos.
Pero lo importante no es solo el tipo o la cantidad de datos, sino lo que las organizaciones hacen con los datos. El Big Data se puede analizar para obtener información que facilite la toma de decisiones y brinde confianza para realizar movimientos comerciales estratégicos.
La información puede venir de muchas fuentes en dependencia del giro de tu negocio o de la empresa para la que trabajas, ya sea pública o privada; una página de internet, un POS, un sistema de geolocalización o hasta las redes sociales pueden ser una fuente de información. Entendamos un concepto básico, Big data está caracterizada por 3 componentes principales: volumen, variedad y velocidad.
Sí en tu empresa se tienen grandes cantidades de información, y nadie la usa porque está totalmente desorganizada, entonces, tú empresa seguramente no necesita Big Data, si no una solución que en conjunto con un Data Warehouse y un sistema de visualización de datos, como puede ser un sistema de Business Intelligence (BI), le ayude a organizar la información y sacar provecho de ella, analizando periodos diarios, semanales, mensuales, etc.
La Tecnología
Desde el punto de vista de tecnología, un procesamiento de tipo Big data necesitaría una cantidad de información gigantesca distribuida de manera paralela en varios servidores, discos o computadoras. Con lo cual, si tu estas usando Excel, Power Pivot, o un sistema de BI, en realidad no estás haciendo Big data. Para trabajar con Big Data se necesitan herramientas especializadas como lo son Hadoop, Spark, MongoDB, Cassandra, entre otras.
¿Qué Nos Dice Doug Laney?
Cómo mencionamos anteriormente, Big Data tiene 3 principales componentes, su volumen que nos dice que hablamos de cantidades gigantescas de información en el orden de los terabytes, petabytes o exabytes. Su variedad que nos habla de diferentes tipos y fuentes de datos, y su velocidad que es como la palabra lo dice que tanta información es generada y cada cuando debe ser recolectada y procesada (pensemos en las transacciones de un banco).
¿Por Qué Es Importante?
Normalmente las empresas que hacen uso de Big Data tienen la capacidad de mejorar sus operaciones casi en tiempo real si cuentan con sistemas autónomos, pueden crear campañas de marketing hipersegmentadas y que se pueden personalizar con base a la interacción del usuario. En los casos que no se trata de actividades lucrativas, como lo son los gobiernos, pueden hacer uso del Big Data para dar un mejor servicio a sus ciudadanos como, por ejemplo, estrategias de movilidad para cada tipo de usuario, para cada ciudad y para cada circunstancia. Así podríamos mencionar aplicaciones en los sectores financieros, energéticos, salud y cadena de suministro, pero eso lo hablaremos a detalle después.
Fuente: Oracle, Silcon Expertise