17
Ed. 29. Vol.8 Nº 1. Marzo-Junio 2019
DOI: http://dx.doi.org/10.17993/3ctecno/2019.v8n1e29/10-29
Con respecto, a la metodología KDD (Knowledge Discovery in Databases) está compuesto por los
siguientes pasos: selección de datos, el preprocesamiento de los datos data mining y evaluación del
modelo (Gervilla, et al., 2009). De igual manera, la metodología SEMMA (Sample, Explore, Modify,
Model, Assess), contiene de cinco fases: muestra, explora, modicar, modelo, y evaluar (Kyunf, et al.,
2015). Sin embargo, dichas metodologías están más enfocada explícitamente al área informática.
Por lo tanto, pueden ser confuso para un profesional no informático que se encuentre al frente de
la empresa.
Adicionalmente, a la metodología CRISP-DM (CROSS Industry Standasrd for Data Mining), se compone
por seis fases: comprensión del negocio, comprensión de datos, preparación de datos, modelado,
evaluación e implementación (Castorena, et al., 2018). De la misma manera, la metodología de
almacenamiento rápido (Rapid Warehousing Methodology) fue propuesta por SAS Institute, se desarrolla
en cinco fases: denición de los objetivos, denición de los requerimientos de la información, diseño
y modelización, implementación y revisión (Leonard y Castro, 2013). En pocas palabras, dichas
metodologías se enfocan desde un contexto empresarial.
En la misma línea, la metodología HEFESTO, contiene de seis fases: Inicio, análisis de requerimientos,
análisis de las fuentes de datos, modelado del DWH, integración de datos, y representación de
información (Vanegas, 2013). De igual forma, metodología de Kimball, consiste de planicación,
análisis de requerimientos, modelado dimensional, diseño físico, diseño e implementación del
subsistema de ETL e implementación (Rivadera, 2010). Por ende, las metodologías contemplan el
ciclo muy detallado, es decir, presenta demasiadas etapas, lo cual, la aplicación aumenta tiempo y
costos para la organización.
Con los antecedentes expuestos y dadas las características del presente trabajo, se aplica un
procedimiento metodológico adaptada de la metodología CRISP-DM con las siguientes fases:
comprensión del negocio, comprensión de datos, diseño del preprocesamiento, preparación de
datos, representación de información y evaluación.