La Ciencia de Datos (Minería de Datos, "Big Data", Inteligencia de Negocios) analiza grandes conjuntos de datos para extraer conclusiones útiles. Hallar tendencias, desviaciones, anomalías, situaciones interesantes, comportamientos típicos, en un mar de datos. ¿Qué nos dicen los datos? "Torturar los datos hasta que confiesen". Entender qué está pasando y hacer predicciones basadas en conocimiento previo. Por ejemplo, noticias en la prensa; mensajes de twitter; opiniones sobre políticos, productos, películas, melodías; ¿qué tan probable es que termines tus estudios?; detección de conducta mental anómala de una persona, a partir de señales de su teléfono móvil; resultados de exámenes de conocimientos versus condición socio-económica y familiar del estudiante; delitos cometidos en una zona durante varios años; compras en establecimientos comerciales; epidemias, con sus muertos, enfermos, vacunados y restablecidos; trabajos típicos de los migrantes que se reincorporan al país; preferencias de películas, de bebidas, de comida chatarra; anuncios en canales de TV e internet versus compras por los televidentes usuarios... Evidentemente, es una disciplina muy útil.
La Inteligencia Artificial es una rama de la Computación que crea programas y mecanismos que muestran comportamientos considerados inteligentes.
La Ciencia de Datos explota extensamente las herramientas de la Inteligencia Artificial (aprendizaje mecánico; clasificadores; análisis de tendencias; redes neuronales), pero requiere conocimientos sólidos de bases de datos y de confección de aplicaciones informáticas. Usa también la probabilidad y la estadística. En la plática daré varios ejemplos de proyectos desarrollados en el CIC.
Como la Ciencia de Datos tiene un crecimiento continuo, que durará por varias décadas, las personas que terminan una licenciatura o ingeniería en computación o informática y estudian esta disciplina emergente, tendrán un futuro prometedor conforme crezca el número y diversidad de aplicaciones y fenómenos.