15 años de liderazgo en MBA y Maestrías Online.
Contamos con más de 200.000 alumnos de 45 países.
Ofrecemos Becas del 65% de descuento.

InicioBig DataLas cinco V que caracterizan al Big Data

Las cinco V que caracterizan al Big Data

Las cinco V que caracterizan al Big Data

¿Qué es el Big Data? Es un gran volumen de información cuya característica principal es que proviene de diversas fuentes; estos datos llegan a gran velocidad, lo cual hace que sea prácticamente imposible procesarlos con los sistemas de cómputo tradicionales.

La manera como se utilizan los datos en la actualidad, define el éxito de la gestión de muchas empresas que se apoyan en estos para obtener mayor rendimiento, ya que permite una mejor toma de decisiones, clasificación de los clientes de acuerdo a diversos parámetros y mejoras sustanciales en la fluidez y accesibilidad de la información.

De la misma manera como en la rutina periodística se aplica la guía de las cinco «W» (what, where, who, when, why), el Big Data aplica como mandamiento tener en cuenta las cinco V, pues definen el camino a seguir para la conversión eficiente de los datos obtenidos en conocimiento.

Si te interesa convertirte en un experto del Bigdata, te presentamos el Máster en Big Data Analytics, este Máster Online es de referencia internacional y es uno de los más completos en su categoría, con un 100% de empleabilidad. Además, pertenece a las principales economías que mueven el mundo y en la actualidad faltan especialistas en esta área.

Velocidad de datos:

Al generarse datos en enormes cantidades y con gran rapidez, ocurre que se acorta mucho su ciclo de vida y muy pronto se vuelven obsoletos, por lo que la pronta respuesta de procesamiento es clave para su mejor utilización.

Volumen de datos:

Constituye uno de los mayores desafíos para el analista de datos, pues la avalancha que se genera desde todas las plataformas existentes nos haría pensar que su recolección es imposible; de hecho, la gran cantidad de datos que se genera hace que su vigencia sea de muy corto plazo.

Variabilidad:

Es el parámetro por excelencia que caracteriza al big data, el cual solo se puede definir como tal si los datos provienen de diversas fuentes; no vale una sola por muy grande que sea el volumen que ofrezca. La gama de datos que recibimos a diario incluye imágenes, videos, textos, audio; todo lo que guardamos a través de las redes sociales y también todas las reacciones y respuestas que generamos.

Esto hace que su captura y procesamiento sea muy complicado a menos que se cuente con métodos y sistemas adecuados para aprovechar la infinidad de posibilidades que nos ofrece su procesamiento.

Veracidad:

Esta es una condición que afecta la calidad y por ende, el aprovechamiento de los datos. Pongamos como ejemplo en las redes sociales aquellas cuentas cuyos seguidores son «comprados» o captados con tácticas de manipulación y en la realidad no siguen a esa cuenta.

La búsqueda en ese perfil arroja un número de seguidores, pero la interacción es mucho menor a ese volumen.

De allí la importancia de depurar los datos para conservar solo aquellos que aportan valor tangible; de esta manera, la toma de decisión en base a estos será mucho más cercana a la realidad.

Valor:

Así como la variabilidad define al big data, el valor es su parámetro de mayor importancia, el que integra a todos los demás pues indica que si los procedimientos en la captura, depuración y procesamiento de datos se realizan de manera óptima, en esa misma proporción se extrae mayor valor y rentabilidad de los datos almacenados al aprovechar toda la inteligencia que traen consigo.

Diferencias entre el analista y el científico de datos

El análisis de datos, a primera vista, es similar a la ciencia de datos; en ambas disciplinas se procesan grandes cantidades de datos para convertirlas en información de valor, en principio, numérico. La diferencia fundamental radica en la naturaleza de las responsabilidades de cada uno de ellos.

El analista de datos realiza estadísticas descriptivas básicas y visualización de datos para sacar conclusiones con un propósito específico en la mano; este es, por ejemplo, una interrogante que le plantee la empresa para la cual presta sus servicios.

El analista de datos examina los hechos para dar respuestas específicas a un problema por medio de la exploración enfocada a la solución del mismo.

El científico de datos, luego de aplicar procesos tecnológicos y estadísticos, formula las preguntas por sus propios medios y luego de graficar los resultados de sus procedimientos, propondrá soluciones a los problemas detectados a través de las investigaciones realizadas.

ETL Tools, aliadas en el manejo de Big Data

Ante la realidad de las múltiples fuentes de las cuales provienen los datos, existe una interrogante muy importante de resolver: ¿cómo es posible analizar los datos como si vinieran de una sola fuente? la respuesta está en el acrónimo ETL:

Extracción:

Comprende el proceso de iniciar, construir datos de referencia, capturar los datos provenientes de todas las fuentes, validarlos y centralizarlos,

Transformación:

Consiste en estandarizar los datos mediante el procedimiento de data cleaning. Para cumplir con este proceso, es necesaria la creación de un algoritmo o aplicar machine learning; de esta manera, nuestros equipos se encargarán de la tarea.

Load:

Es el proceso de colocarlos en un warehouse para su posterior análisis.

Estos procesos se pueden realizar con una supervisión indirecta, con la desventaja del gran consumo de tiempo. Las herramientas ETL realizan la automatización de los datos, extrayéndolos de sus fuentes de origen para luego ser transformados y puestos a punto para ser analizados y guardados.

El ciclo de vida de los datos.

Como ya se ha mencionado, los datos son el nuevo petróleo; como tal, para que puedan tener una utilidad real deben ser sometidos a los procedimientos ya descritos, pero, ¿de qué manera los datos se convierten en dinero?

Luego de realizar la captura de los datos con la ayuda de las herramientas ETL, se efectúa el procesamiento y análisis de los datos limpios y estructurados a fin de obtener respuestas a los problemas que se busca resolver.

Lo que sigue a continuación es la búsqueda de patrones en relación a nuestros intereses puntuales; para definir qué estamos buscando, se puede realizar la creación de un algoritmo específico para esa búsqueda o buscar apoyo en el machine learning; la ventaja de su uso es que se pueden encontrar patrones que, aunque no estaban en nuestro plan original de búsqueda, son de utilidad para la solución del problema.

Luego de estos procedimientos, corresponde hacer la exploración y visualización, esto es, plasmar los resultados de la investigación en forma gráfica y comprensible para a que las personas encargadas de la toma de decisiones en las empresas u organismos públicos se les facilite la visualización de la información.

La manera de obtener dinero mediante el análisis de datos es observando el comportamiento de los usuarios de determinados productos o servicios, o las tendencias que pueden predecir el futuro de consumo de un artículo.

Evidentemente, las tendencias no son un parámetro determinante en la proyección de un fenómeno adquisitivo, pero sí nos permiten saber hacia dónde enfocar los esfuerzos de marketing para marcarla, de acuerdo a la temporada y sector geográfico donde se ha hecho la exploración.

Una profesión con gran futuro.

De acuerdo a todo lo expuesto anteriormente, podemos concluir que, en proporción a la velocidad como se van generando los datos día a día, así mismo se crea la necesidad de contar con analistas capaces de apoyar el desarrollo empresarial.

Los beneficios económicos del analista de datos van en constante aumento, siendo sus salarios los de mayor ascenso en el mundo de las especialidades tecnológicas.

Hoy es un excelente momento para tomar la decisión de convertirse en analista de datos.

¡Comparte este artículo!

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

diecinueve + trece =

Este sitio está protegido por reCAPTCHA y se aplican la política de privacidad y los términos de servicio de Google.