Big Data es un término que simplemente hace referencia a la existencia de un gran volumen de datos que inundan nuestras vidas, tanto en el ámbito profesional como en lo personal.
Los datos por sí solos no suponen ningún avance. Lo verdaderamente importante es capturarlos determinando cuales son los relevantes para tomar decisiones, transportarlos hasta donde sean necesarios, gestionarlos de una forma rápida, ágil e inteligente para convertirlos en información.
Para todo ello tenemos un conjunto de tecnologías que ordenamos en este artículo según su función principal con respecto a los datos
Generación de Datos
Las personas estamos ya conectadas a través de smartphones, ordenadores y asistentes personales, pero el avance más significativo se está dando con la conectividad de cualquier tipo de gadget u objeto a través de lo que llamamos IOT (Internet of Things). Desde lámparas hasta semáforos, pasando por automóviles, electrodomésticos y carreteras. Cualquier objeto puede “conectarse” y con ello empezar a generar datos relevantes.
Captura de Datos
Muchos de los datos existentes se pueden adquirir a través de fuentes externas que los ponen a disposición del mundo empresarial. Es lo que se conoce como “datos de terceros” (3rd Party data), pero la experiencia está demostrando que con los datos que dispone y genera cada empresa por ´si misma, se llega a disponer de información clave suficiente para tomar decisiones basadas en ellos (1st party data).
Las empresas necesitan poder capturar los datos relevantes para su negocio que pueden estar estructurados en una base de datos o totalmente desestructurados.
Para poder recopilar, seleccionar, almacenar proteger todos estos datos procedentes de una amplia gama de fuentes, han aparecido las plataformas de gestión de datos (Data Management Platform)
Transporte de Datos
El nuevo estándar de banda ancha inalámbrica que supera al 4G en velocidad, cobertura y prestaciones y que se conoce como Tecnología 5G. Promete ser entre 10 y 20 veces más rápido que las conexiones 4G actuales, con una disminución de la latencia (el tiempo total que tarda un paquete de datos en viajar de un nodo origen a otro nodo destino), que puede llegar a ser de 1 milisegundo.
En el ámbito personal, esto significa por ejemplo poder descargar una película en pocos segundos, pero su potencia es tal que permite transportar datos entre personas, pero también objetos, dispositivos, aplicaciones, sistemas de transportes y ciudades. Como ejemplo de sus posibilidades, la operación quirúrgica que un cirujano realizó en remoto durante el último Mobile World Congress en Barcelona
Transformación en Información y Utilización
Una vez se han generado los datos, se han capturado, filtrado y transportado a donde se requieren, se necesita poder hacer uso de ellos, transformarlos en información para que sea aprovechable tanto en el ámbito personal como profesional. Las tecnologías que procesan y gestionan los datos para convertirlos en información las englobamos dentro de un término amplio que se conoce como Inteligencia Artificial (IA).
La IA es, según la RAE, la disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana, como el aprendizaje o el razonamiento lógico.
La Inteligencia Artificial se ha convertido en un término un tanto generalizado que, ambiciona a largo plazo la posibilidad de construir máquinas que emulen y quizás excedan el pensamiento humano.
La IA ya está presente en nuestras vidas cotidianas como por ejemplo en los chatbots de atención al cliente, en los asistentes personales del móvil que saben qué recorrido vas a realizar antes de empezar, en las aplicaciones de reconocimiento facial y gestión de textos, control por voz de dispositivos en los hogares: televisión, bombillas, enchufes, Ayudas en la conducción para evitar que nos salgamos del carril o nos acerquemos demasiado al vehículo que nos precede ..…. está consiguiendo optimizar muchos procesos de negocio empresariales en las áreas de comercial/marketing, fabricación, mantenimiento y servicio a clientes, y está siendo aplicada también en el deporte: Tenis, Fútbol, ... o en otros sectores con casos de uso sorprendentes como por ejemplo el vino, las Universidades, o la conducción de coches autónomos
El Machine Learning (ML), es un subconjunto de la IA que utiliza técnicas estadísticas para dar a las máquinas la capacidad de "aprender" de los datos sin que se les den explícitamente las instrucciones sobre cómo hacerlo. Este proceso se conoce como "entrenamiento" de un "modelo" mediante un "algoritmo" de aprendizaje que mejora progresivamente el rendimiento y precisión que se utiliza luego para hacer predicciones.
La capacidad de aprender es algo que consideramos un aspecto fundamental de la "inteligencia". Hay otros aspectos de la inteligencia como la inteligencia creativa y la inteligencia emocional, pero el ML se ocupa específicamente de crear algoritmos que puedan mejorar el desempeño de una tarea a medida que se alimentan de cantidades cada vez mayores de información.
Un concepto importante es la diferencia entre aprendizaje supervisado y no supervisado. El aprendizaje supervisado implica el entrenamiento de algoritmos con datos etiquetados, para qué puedan "saber" inmediatamente si llevaron a cabo una operación en particular correctamente. Es el tipo de algoritmo de ML más común en la actualidad.
El aprendizaje no supervisado involucra datos que no están etiquetados y por lo tanto, el algoritmo nunca aprende específicamente si sus operaciones se resuelven correcta o incorrectamente, sino que las decisiones se toman en función de lo que el algoritmo puede determinar a partir de los datos en sí y su relación con posibles agrupaciones latentes de datos que intervienen en el algoritmo. Los resultados de un modelo de este tipo, a menudo se convierte en entradas para un algoritmo de aprendizaje supervisado en un momento posterior.
El Deep Learning (DL) es un área de Machine Learning que intenta imitar la actividad en la red neuronal del cerebro humano, para aprender a reconocer patrones complejos en los datos. Lo "profundo" (Deep) se refiere a la gran cantidad de “niveles neuronales” de los modelos de ML que ayudan a aprender representaciones ricas de datos para mejorar la precisión y rendimiento
Otras dos disciplinas en auge dentro de la IA son el Natural language processing (NLP), o procesamiento del lenguaje natural que permite que las máquinas analicen, comprendan y manipulen el lenguaje humano, y la visión por Ordenador (Computer Vision) que permite que las máquinas analicen, comprendan y manipulen imágenes y videos.
Certificación de los Datos
La cadena de bloques, más conocida por el término en inglés blockchain, es un registro único, consensuado y distribuido en varios nodos de una red. Su funcionamiento técnico puede resultar complejo de entender, pero la idea básica es sencilla. El blockchain permite almacenar información que jamás se podrá perder, modificar o eliminar. Esta tecnología se ha popularizado mucho con las criptomonedas, donde podemos imaginárnoslo como el típico libro contable donde se registran cada una de las transacciones, pero tiene múltiples usos, como por ejemplo asegurar trazabilidad, certificaciones de formación o las famosas NFT’s (Non Fungibles Tokens) que son activos digitales indivisibles y únicos que representan elementos tangibles e intangibles como coleccionables digitales, música, obras de arte y tokens para juegos. Pueden utilizarse para demostrar la propiedad de artículos digitales, como personajes de juegos, o inclusive la propiedad de activos físicos.
Comments