tesis de maestría.page.titleprefix
Ambiente de integración de herramientas para exploración de datos centrados en la web

Loading...
Thumbnail Image

Date

2005-11

Authors

Merlino, Hernán

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

"La existencia de sistemas informáticos de uso libre orientados a la exploración de uso, la exploración de contenido y la exploración de estructura en Web y la identificación de procesos de exploración en Web que requieren la integración articulada de dichos artefactos son la motivación de esta tesis. En este contexto, en este trabajo se propone una herramienta para exploración de datos Web que permite estructurar todo el proceso de exploración. La mayor ventaja de esta herramienta es poder utilizar diversas técnicas de exploración, además de permitir la reutilización de procesos ya ejecutados con anterioridad y la combinación de los mismos para su posterior comparación; todo esto llevado a cabo sin un alto grado de complejidad. La herramienta desarrollada satisface los siguientes requerimientos: los procesos que ejecuta son modulares y flexibles, la información que entrega es verificable y verificable, el sistema tiene la capacidad para agendar tareas, el sistema puede ser ejecutado en entornos Windows, Unix y Linux, el sistema puede admite varias fuentes de dato de entradas y el sistema puede admite formato flexible de archivos de salida."
"The motivation if this thesis is; the existence of open source software for Web use mining, Web content mining and Web structure mining and the identification of process of Web mining that required the articulation of these artifacts. This framework permits the generation of a structured process of Web mining. The more important advantage of this framework is the ability of using a lot of Web mining techniques; and it’s possible to reuse the process; and these process can be mixed and compared; the framework can do all the tasks described above without effort. The framework has the following requirements: the process has to be modular and flexible; the information generated has to be verifiable; schedule task is once of the abilities of the framework; the framework has to run on Windows, Unix and Linux; the framework has to accept a lot of formats of inputs and has to generate a lot of formats of outputs."

Description

Keywords

SISTEMAS DE INFORMACION, MINERIA DE DATOS, INGENIERIA DE SOFTWARE

Citation