logo

Infraestructura para análisis de Big Data

Por Lidia Vázquez

Aguascalientes, Aguascalientes. 18 de noviembre de 2015 (Agencia Informativa Conacyt).-  El investigador Juan Carlos García, director de la carrera de Ingeniería en Inteligencia Artificial de la Universidad Panamericana (UP), campus Bonaterra, en Aguascalientes, desarrolla un proyecto que permitirá la gestión y almacenamiento de grandes cantidades de información digital (Big Data), con el objetivo de generar nuevas conclusiones a partir de su análisis.

Big Data 11 8 3 5

El proyecto consiste en validar distintos escenarios de implementación como infraestructura y arquitectura de cómputo distribuido y supercómputo en la nube de Internet, implementando motores y bases de datos. “Localizar la infraestructura necesaria para un proyecto de datos masivos, trabajar el modelo matemático para la predicción, uso y dar sentido a los datos para posteriormente aplicar el modelo matemático, es lo que nosotros estamos desarrollando”, explicó el investigador en entrevista para la Agencia Informativa Conacyt.

big data 11 34Expuso que trabaja con cuatro tecnologías que permiten montar distintos motores de almacenamiento de datos no relacionales, mencionó que utiliza las plataformas de Microsoft, IBM, Amazon y recursos propios de computación de alto rendimiento (HPC por las siglas en inglés de High Performance Computing), herramienta muy importante en el desarrollo de simulaciones computacionales a problemas complejos, acotó que en estos recursos evalúan las bases de datos de Spark, Hadopp y Oracle NoSQL.

En relación con una investigación que se ha insertado en este sistema, indicó, se tiene 65 por ciento de avance de integración de información filtrada a dos bases de datos, Oracle NoSQL y Apache de IBM, en el tema para detectar cuáles son los índices de deserción universitaria a partir de distintas situaciones, acotó que se tienen más de mil 500 variables contempladas como factores que pueden afectar.

Mencionó que el reto más grande es adentrarse en las investigaciones ya que no existen referencias sobre el tema, así como también comenzar a integrar estos datos al lenguaje de programación, dijo, es necesario trabajar en llevar el modelo matemático al modelo práctico.

Finalmente resaltó que poder desarrollar estos sistemas de almacenamiento de datos en grandes cantidades, así como la utilización de bases de datos para filtrar información, puede arrojar conclusiones importantes para la toma de decisiones. “Por ejemplo, podrías analizar diferentes factores, clima, alimentación, condiciones geográficas, cualquier cosa que pueda determinar la afectación de un alumno en su periodo universitario”.

Aseguró que el alcance es para todos, “poder dar la certeza y decir cuida estas variables que son las más importantes para que un muchacho que empieza la universidad la termine (...) es lo que se busca implementar con infraestructura de gran capacidad para almacenamiento y procesamiento de información que permita tener la certeza en la toma de decisiones”.

 

 

 

Licencia de Creative Commons
Esta obra cuyo autor es Agencia Informativa Conacyt está bajo una licencia de Reconocimiento 4.0 Internacional de Creative Commons.

 



Agencia Informativa Conacyt

 

Algunos derechos reservados 2015 ®
Ciencia MX
Conoce nuestras políticas de privacidad
logotipo

México, CDMX


 

Search Mobile