tesis de maestría.page.titleprefix Ambiente de integración de herramientas para exploración de datos centrados en la web
Loading...
Date
2005-11
Authors
Merlino, Hernán
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
"La existencia de sistemas informáticos de uso libre orientados a la exploración de uso, la exploración de contenido y la exploración de estructura en Web y la identificación de procesos de exploración en Web que requieren la integración articulada de dichos artefactos son la motivación de esta tesis. En este contexto, en este trabajo se propone una herramienta para exploración de datos Web que permite estructurar todo el proceso de exploración. La mayor ventaja de esta herramienta es poder utilizar
diversas técnicas de exploración, además de permitir la reutilización de procesos ya ejecutados con anterioridad y la combinación de los mismos para su posterior comparación; todo esto llevado a cabo sin un alto grado de complejidad. La herramienta desarrollada satisface los siguientes requerimientos: los procesos que ejecuta son modulares y flexibles, la información que entrega es verificable y verificable, el sistema tiene la capacidad para agendar tareas, el sistema puede ser ejecutado en entornos Windows, Unix y Linux, el sistema puede admite varias fuentes de dato de entradas y el sistema puede admite formato flexible de archivos de salida."
"The motivation if this thesis is; the existence of open source software for Web use mining, Web content mining and Web structure mining and the identification of process of Web mining that required the articulation of these artifacts. This framework permits the generation of a structured process of Web mining. The more important advantage of this framework is the ability of using a lot of Web mining techniques; and it’s possible to reuse the process; and these process can be mixed and compared; the framework can do all the tasks described above without effort. The framework has the following requirements: the process has to be modular and flexible; the information generated has to be verifiable; schedule task is once of the abilities of the framework; the framework has to run on Windows, Unix and Linux; the framework has to accept a lot of formats of inputs and has to generate a lot of formats of outputs."
"The motivation if this thesis is; the existence of open source software for Web use mining, Web content mining and Web structure mining and the identification of process of Web mining that required the articulation of these artifacts. This framework permits the generation of a structured process of Web mining. The more important advantage of this framework is the ability of using a lot of Web mining techniques; and it’s possible to reuse the process; and these process can be mixed and compared; the framework can do all the tasks described above without effort. The framework has the following requirements: the process has to be modular and flexible; the information generated has to be verifiable; schedule task is once of the abilities of the framework; the framework has to run on Windows, Unix and Linux; the framework has to accept a lot of formats of inputs and has to generate a lot of formats of outputs."
Description
Keywords
SISTEMAS DE INFORMACION, MINERIA DE DATOS, INGENIERIA DE SOFTWARE