En ocasiones, las definiciones técnicas pueden confundirnos más de lo que nos ayudan. Por eso, al hablar de Big Data, los ejemplos son potentes herramientas para entender el concepto sin partir de una definición. Este artículo analiza 3 escenarios diferentes donde se manejan y administran macrodatos, con el objetivo de construir un concepto que podamos extrapolar a todo tipo de industrias, concluyendo con las recomendaciones estratégicas que nos permitirán hacer un manejo diligente de estos datos si lo llegamos a necesitar.
Big Data: ejemplos
- Censos Poblacionales
Los censos poblacionales son un claro ejemplo del big data en acción. Se trata de ejercicios que involucran varios datos de millones de personas, los cuales deben recolectarse, almacenarse, administrarse y protegerse de forma estratégica; si no se desea estar en un apuro monumental.
En un periodo relativamente reducido de tiempo, las autoridades hacen un levantamiento masivo de datos que, por su volumen, complejidad y velocidad de crecimiento, son extremadamente difíciles de administrar.
Evidentemente, los censos se realizan con un fin de representación política (¿a cuántas personas representa cada gobernante?), pero sus fines van más allá de esta dimensión. La información que deriva de un censo se utiliza también para la toma de decisiones en materia de fiscalización o asignación presupuestal, elaboración de proyecciones estadísticas y hasta para medir la felicidad. Por estos motivos, hacer las preguntas adecuadas -en un lugar y un momento adecuados- se vuelve trascendental; ya que toda respuesta que no sea útil terminará:
- Ocupando un valioso espacio de almacenamiento,
- Desperdiciando presupuesto gubernamental,
- Gastando poder de procesamiento,
- Implicando un riesgo de ciberseguridad, y
- Contaminando el poder de decisión.
- Mejora de experiencias
Las empresas más digitales del mundo dependen de grandes cantidades de datos para ofrecer un producto o servicio competitivo. Todos agradecemos (y tememos, al mismo tiempo) abrir una aplicación y encontrar ese álbum que nuestro artista favorito acaba de lanzar.
Bueno, pues ofrecer ese tipo de productos o servicios personalizados requiere conocer mucha información sobre nosotros. Sobre nosotros, y sobre muchas, muchas personas más. ¿Cuántas canciones escuchamos de un artista? ¿Cuántas veces escuchamos a los artistas de un género similar? ¿Cuánto tiempo miramos un producto antes de descartarlo? ¿Este producto entró al carrito de compras o no? ¿Qué relación existe entre ese pantalón atlético que nos interesó y esa cama de mascotas que compramos hace un mes?
Como podemos imaginar, las respuestas a estas preguntas involucran datos. Cada segundo que miramos la pantalla es un dato, el cual debe multiplicarse por los millones de personas que también son usuarios de una determinada aplicación. Cada segundo y cada click que hacemos como usuarios deben almacenarse, administrarse y protegerse de tal forma que permitan decirnos algo sobre una persona en particular, al mismo tiempo en que sepamos algo sobre los millones de usuarios en general.
- Analítica judicial
Se sabe que el sector legal ha sido un sector tradicionalmente resistente al uso de herramientas tecnológicas, incluidas las herramientas de analítica. Pues bien; a pesar de esa resistencia, algunos emprendimientos y empresas legaltech comenzaron a levantar datos donde por mucho tiempo nadie los pudo ver. La consulta de expedientes en línea se volvió de pronto una necesidad. Las decisiones judiciales se convirtieron en tendencias, estadísticas y predicciones. Los jueces y los abogados se convirtieron en una fuente de datos que muchos intentan comercializar.
El reto, sin embargo, es desarrollar las herramientas para extraer información que va más allá de lo evidente. Lo importante ya no es una sentencia, sino todas las sentencias en general. Lo importante no es una sentencia en particular, sino cada una de las oraciones que la integran.
En el contexto de los macrodatos judiciales, cada oración de un juez o un abogado se vuelve un input. Entonces, se vuelve indispensable preguntarnos: ¿ese input influyó en el resultado? ¿ese input nos llevó a una apelación? ¿Cuál es la tasa de éxito de un determinado abogado? ¿Cuál es la tasa de encarcelamiento de un juez?
Bueno, y entonces: ¿qué es el Big Data?
En la sección anterior “Big Data: ejemplos”, hicimos referencia a tres escenarios donde se capturan, administran y utilizan cantidades masivas de datos. Estos escenarios se verifican en contextos diferentes, pero tienen un común denominador, el cual se refiere a las metodologías, las herramientas y las tecnologías utilizadas para capturar, procesar, almacenar y manejar de forma eficiente cantidades masivas de datos, con el objeto de que pueda extraerse de esos datos información útil o valiosa para la toma de decisiones, tanto en el presente como en anticipación hacia el futuro.
Recomendaciones estratégicas
- ¿Qué hacer como titular de datos?
En la primera sección de este documento “Big Data: ejemplos”, abordamos 3 escenarios donde se captura masivamente nuestra información. En los censos, nuestra información individual debería ser irrelevante: lo que importa es la información de la comunidad. Esto cambia en otros modelos big data, donde la información de la comunidad no tiene tanto valor como la información individual.
Este contexto nos permite entender que nuestra información siempre tiene valor y por ello debemos vigilar que esa información se trate con diligencia y exigir a quien la solicita que la trate con responsabilidad.
- ¿Qué hacer como responsable del manejo de macrodatos?
Administrar macrodatos no es una actividad que deba tratarse a la ligera, pues se trata -en toda la extensión de la palabra- de una responsabilidad. El responsable de una base de datos de gran escala debe cumplir, dependiendo de su contexto particular, con las leyes en materia de protección de datos personales (locales o internacionales, como GDPR o CCPA), pero también debe cumplir con muchas obligaciones en materia de ciberseguridad y confidencialidad.
Hemos visto que los modelos big data se diferencian de los modelos tradicionales en las complejidades inherentes a capturar, manejar y proteger cantidades masivas de datos. Esos datos tienen valor, en la medida que se utilicen metodologías, tecnologías y personas que permitan manejarlos de forma eficiente. Esta eficiencia siempre debe venir acompañada de una responsabilidad: la responsabilidad de obtener y proteger la información obtenida de acuerdo con el marco legal aplicable.
No hay comentarios
Todavía no hay ningún comentario en esta entrada.
Deja un comentario