Control de Acceso y Estadísticas a las Páginas de un Servicio Web en el Ámbito Docente...

Post on 25-Jan-2016

213 views 0 download

transcript

Control de Acceso y Estadísticas a las Páginas de un

Servicio Web en el Ámbito Docente Universitario

Departamento de InformáticaUniversidad de Extremadura

Jesús M. Álvarez Llorente

Se presenta...

un sencillo método de controlque nos permite conocer la

actividad de nuestro sitio web (sin obras)

¿Por qué?

Tenemos un sitio web con todos los servicios

(la página de nuestra asignatura)

¿Se utiliza?¿Se utiliza?¿Cómo?¿Cómo?

¿Quién?¿Quién?

¿Cuándo?¿Cuándo?

¿Dónde?¿Dónde?

Primera idea

Existen servicios gratuitos de contadores y estadísticas:

NetStat CiberStats

No proporcionan toda la informaciónNo proporcionan toda la información

Son más lentosSon más lentos

Mejor idea

Controlar las visitas nosotros mismos.

¿Cómo?

Registrando el instante y procedencia de cada visita a cada página.

Se ha aplicado a un conjunto de páginas relacionadas con la docencia universitaria en la carrera de Informática

Objetivos

1. Conocer quién visita y cuándo.

2. Espiar la actividad de los visitantes.

3. Analizar la repercusión de eventos en la web.

El método

Guardar para cada páginauna tabla con las visitas:

Dirección IPDirección IP Fecha/HoraFecha/Hora150.214.166.95150.214.166.95 10/05/2001 13:35:2310/05/2001 13:35:23

149.50.136.10149.50.136.10 12/05/2001 17:30:0112/05/2001 17:30:01

23.100.99.20123.100.99.201 01/06/2001 02:02:1901/06/2001 02:02:19

<img src="http://www.uhu.es/cgi-bin/cgi00.dat?command=log&page=buscar&code=gif&file=j16.gif">

<img src="http://www.uhu.es/cgi-bin/cgi00.dat?command=log&page=buscar&code=gif&file=j16.gif">

El método

En el contenido html se incluye una referencia (p.e. como imagen), similar a

las utilizadas en NetStat, CiberStats.(Visible o Invisible)

El código de la páginaEl código de la página

La imagenLa imagen

<img src="http://www.uhu.es/cgi-bin/cgi00.dat?command=log&page=buscar&code=gif&file=j16.gif">

El método (resumiendo)

Por cada página una referencia:

Y se va generando una tabla de datos de visitas:

<img src="hhtp:// ... "> <img src="hhtp:// ... "> <img src="hhtp:// ... ">

IPIP HoraHora

150.214.166.95150.214.166.95

10/01/2001 13:55:4110/01/2001 13:55:41

IPIP HoraHora

150.214.166.95150.214.166.95

10/01/2001 13:55:5910/01/2001 13:55:59

100.26.82.122100.26.82.122

10/02/2001 01:15:1410/02/2001 01:15:14

IPIP HoraHora

150.214.166.95150.214.166.95

10/01/2001 14:10:0110/01/2001 14:10:01

100.26.82.122100.26.82.122

10/02/2001 01:18:4310/02/2001 01:18:43

100.26.82.122100.26.82.122

16/03/2001 11:55:4416/03/2001 11:55:44

149.58.22.33149.58.22.33

07/07/2001 12:00:0507/07/2001 12:00:05

155.66.46.222155.66.46.222

14/07/2001 15:33:1014/07/2001 15:33:10

149.58.22.33149.58.22.33

06/08/2001 19:07:4006/08/2001 19:07:40

Los resultados

1. Contadores de acceso.

Pero, además, podemos dividir los accesos por franjas temporales

(hoy, 24H, últimos 10 días, etc.).

Basta con contar el número de registros de cada tablaen distintos rangos de fechas.

Los resultados

2. Control de visitas a una página.

Podemos saber cuándo y desde dónde se han conectado las visitas a una página.

Basta con listar el contenido de la tabla correspondiente a una página.

Los resultados

3. Control de procedencias.

Mantenemos una lista del conjunto de direcciones de procedencia.

Proporciona información interesante sobre la procedenciacon un rendimiento aceptable.

Los resultados

4. Control de accesos de visitantes.

Podemos resumir el conjunto de visitasrealizadas desde una misma dirección

(qué visitó, cuántas veces, en cuántos días, etc.).

Buscamos en las distintas tablas de accesos las entradascorrespondientes a la misma dirección.

Los resultados

5. Rastreo de actividad de visitantes.

Podemos seguir el rastro de los pasosque siguió el visitante durante un acceso.

Buscamos en las distintas tablas de accesos las entradascorrespondientes a la misma dirección durante el mismo día

y lo mostramos como un grafo.

Los resultados

6. Evolución de visitas.

Podemos estudiar la velocidad a la quese incrementa el número de visitas

a lo largo del tiempo en distintas páginas.

Examinamos algunas tablas de accesos, contando el total de visitas día a día en un rango de fechas.

27/0

9/00

27/1

0/00

27/1

1/00

27/1

2/00

27/0

1/01

so.b

usca

r

so.e

nlac

es

so.e

valu

acio

n

so.n

oved

ades

so.p

rogr

ama

so.ta

blon

so.tu

toria

so.n

otas

so.a

punt

es.s

hell1

so.h

ome

so.d

esca

rga

0

100

200

300

400

27/0

9/00

11/1

0/00

25/1

0/00

08/1

1/00

22/1

1/00

06/1

2/00

20/1

2/00

03/0

1/01

17/0

1/01

31/0

1/01

14/0

2/01

so.notas

so.apuntes.shell1

so.homeso.descarga

0

50

100

150

200

250

300

350

400

Conclusiones

1. El sistema es simple y eficaz.

2. El sistema es fácilmente ampliable: Nuevas páginas. Nuevos informes.

Con sólo registrar 2 datos de cada visita podemos obtener mucha información.

3. Se cumplen los objetivos:

Conclusiones

Conocer quién visita y cuándo. Espiar la actividad de los visitantes. Analizar la repercusión de eventos.

1. Perfeccionamiento del sistema:

Trabajo actual y futuro

Construcción de nuevos informes. Obtención automática de gráficos. Función de derivación en avance. Optimización de algoritmos y

estructuras.

2. Portabilidad del sistema:

Trabajo actual y futuro

Ámbito y uso personal. Requiere conocimientos técnicos

avanzados (C, UNIX).

Obstáculo insalvable

Infinita reticencia de los administradores web para permitir a los usuarios instalar cgis.

Trabajo actual y futuro

[Bri91] Brian W. Kernighan, Dennis M. Ritchie. El Lenguaje de Programación C.Prentice-Hall Hispanoamericana, 1991.

[Byr99] Byron S. Gottfried. Programación en C (2ª edición). McGraw-Hill, 1999.[Phi96] Daniel Philippe Chalat. HTML y la Programación de Servidores Web.

Gestión 2000, 1996.[Ste98] E. Stephen Mack, Janan Platt. HTML 4.0. Anaya Multimedia, 1998.[Tit96] Ed. Tittel (et al.). Fundamentos de Programación con HTML & CGI.

Anaya Multimedia, 1996.[Gal00] Germán Galeano, Pablo Díaz, José Carlos Sánchez. Manual

Imprescindible de HTML 4. Anaya Multimedia, 2000.[Coh96] Isaac Cohen. CGI/Pearl y JavaScript: Creación de Páginas HTML

interactivas. Gestión 2000, 1996.[Bra00] Jerry Bradenbaugh. Aplicaciones JavaScript. Anaya Multimedia, 2000.[Chr90] Kaare Christian. Diccionario de C y UNIX. Anaya Multimedia, 1990.[Rob96] William Robert Stanek. HTML, CGI, SGML, VRML, JAVA: Web

Publishing: Unleashed. Sams.Net, 1996.

Referencias

SUGERENCIAS Y PREGUNTAS