Existen numerosas técnicas de análisis de datos, de las que daremos buena cuenta a continuación. Sin embargo, los investigadores continúan desarrollando nuevas técnicas de análisis de datos, principalmente para responder a las necesidades de análisis de nuevas combinaciones.
Algunas de las técnicas de análisis que veremos en este artículo pueden aplicarse a pequeñas cantidades de datos, pero todas ellas son útiles en análisis mayores (Big Data); proporcionando insights de gran ayuda.
Test A/B
Se denomina así a los experimentos aleatorios con dos variables para medir cuál funciona mejor.
Más información sobre test A/B.
Aprendizaje de reglas de asociación
Son el conjunto de técnicas de análisis para descubrir relaciones interesantes. Se trata de una serie de algoritmos que generan y pruebas posibles reglas.
Más información sobre aprendizaje de reglas de asociación.
Clasificación
Consiste en identificar categorías a las que pertenecen los datos.
Más información sobre clasificación.
Análisis clúster
El análisis de conglomerados es un método estadístico para clasificar objetos que divide un grupo diverso en grupos más pequeños con objetos similares, cuyas similitudes se conocen de antemano.
Más información sobre análisis clúster.
Crowdsourcing
Es una técnica de recogida de datos proporcionados por grupo de gente o comunidad grande.
Más información sobre crowdsourcing.
Fusión e integración de datos
Se refiere al conjunto de técnicas que integran y analizan datos de múltiples fuentes, de modo que se puedan extraer ideas de una forma más eficiente y potencialmente más precisa.
Más información sobre fusión e integración de datos.
Minería de datos
El Data Mining son técnicas que extraen patrones de bases de datos amplias, combinando métodos como la estadística o el Machine Learning.
Más información sobre minería de datos.
Aprendizaje conjunto
Es el uso de varios modelos predictivos para obtener un desempeño predictivo mejor.
Más información sobre aprendizaje conjunto.
Algoritmos genéticos
Una técnica usada para optimizar, que se inspira en la evolución natural. Las soluciones posibles se pueden combinar y mutar, probando su capacidad para “sobrevivir” en distintos modelados.
Más información sobre algoritmos genéticos.
Aprendizaje automático
El Machine Learning es una especialidad de la ciencia computacional, que combina el diseño y desarrollo de algoritmos que permiten a las máquinas evolucionar comportamientos basándose en datos empíricos.
Más información sobre aprendizaje automático.
Procesado de lenguaje natural
Una combinación de inteligencia artificial y lingüística que usa los algoritmos para analizar el lenguaje natural humano.
Más información sobre procesado de lenguaje natural.
Redes neuronales
Modelos computacionales, inspirados en las redes neuronales, que encuentran patrones en los datos.
Más información sobre redes neuronales.
Análisis de redes
Técnicas usadas para caracterizar relaciones entre nodos de un gráfico o red.
Más información sobre análisis de redes.
Optimización
Es un portafolio de técnicas numéricas usadas para rediseñar sistemas y procesos complejos, de modo que mejoren su funcionamiento de acuerdo con uno o varios objetivos de medida.
Más información sobre optimización.
Reconocimiento de patrones
Conjunto de técnicas de Machine Learning que asignan valores o etiquetas a una instancia o valor, de acuerdo con un algoritmo específico.
Más información sobre reconocimiento de patrones.
Modelado predictivo
Son las técnicas en las que se crea o elige un modelo matemático para predecir la probabilidad de un resultado.
Más información sobre modelado predictivo.
Regresión
Técnicas estadísticas para determinar cómo cambia el valor de una variable dependiente cuando se cambia una o varias variables independientes.
Más información sobre regresión.
Análisis de sentimiento
Deriva de la aplicación del procesado de lenguaje natural y otras técnicas analíticas para identificar y extraer información subjetiva.
Más información sobre análisis de sentimiento.
Procesado de señales
Combinación de técnicas de la ingeniería eléctrica y la matemática aplicada para analizar señales discretas y continuas.
Más información sobre procesado de señales.
Análisis espacial
Análisis de datos topológicos, geométricos o propiedades geográficas encriptados.
Más información sobre análisis espacial.
Estadísticas
Es la ciencia utilizada para recoger, organizar e interpretar datos, incluyendo el diseño de encuestas y experimentos.
Más información sobre estadística.
Aprendizaje supervisado
Técnicas de aprendizaje automático que infieren una función o relación de un conjunto de datos.
Más información sobre aprendizaje supervisado.
Simulación
Modelado del comportamiento de sistemas complejos, que se usa habitualmente para prever, pronosticar y planificar escenarios.
Más información sobre simulación.
Análisis de series temporales
Análisis de secuencias de datos mediante la representación de valores de forma sucesiva para extraer características importantes de los datos.
Más información sobre análisis de series temporales.
Aprendizaje sin supervisión
Son técnicas de aprendizaje automático que encuentran estructuras ocultas en datos sin clasificar.
Más información sobre aprendizaje sin supervisión.
Visualización
Usada para crear imágenes, diagramas o animaciones para comunicar, comprender y mejorar los resultados de análisis de datos.
Más información sobre visualización de datos.