Psicofonías

(algo así como el blog de Psicobyte)

Malas noticias

Man in the Lighthouse (el farero, para los amigos) deja su blog.

Lo cuenta él mismo en ese recientemente huérfano blog.

También he tenido el honor (que no el placer, dadas las circusntancias) de enterarme por un correo que me ha enviado personalmente. En él habla de motivos personales que me parecen completamente válidos, comprensibles, y respetables. Lo cual no quita que me siga pareciendo una triste noticia.

Yo era hasta ahora uno de los muchos navegantes que arribaba a su roca sediento de leer sus evocadoras imágenes y disfrutar las cálidas alegorías con que adornaba su faro.

Pero ahora ha apagado la linterna.

Como aún no debemos perder la esperanza de que regrese, y por si consigo que otra vez le pique el gusanillo blogueril, he colocado ahí arriba, sobre el horizonte de la imagen de cabecera de este blog, una réplica de su faro. Por si el farero, donde quiera que vaya, sea cual sea el viento que hincha sus velas, vé la luz sobre las rocas.

Y quizás encuentre el camino de vuelta.

Un poco de accesibilidad

Con la excusa del curso aquel de Arquitectura de la Información le he estado dando un repaso a este blog, para que quede decente y bonito.

Para empezar, y por la cosa de la decencia, he corregido el código que genera el motor, porque cuando pasé de HTML a XHTML me dejé algún pequeño error, y esto no validaba como debe ser.

La cosa de la accesibilidad ha sido bastante más coñazo: He tenido que reescribir toda la hoja de estilo y pasarla a unidades realtivas para que sea más manejable en explorer (firefox no tenía problemas) como, por ejemplo, a la hora de cambiar el tamaño de fuentes en el texto. Lo más difícil ha sido hacerlo de modo que no cambiase la estética actual: Cambiarlo todo sin que cambie nada.

Para rematar con esto del estilo, he agregado otra hoja CSS específica para impresión. Si imprimes una pantalla del blog, la página resultante aparece con un tipo de letra y formato distintos, sin las imágenes de fondo y sin la barra de navegación (Que no tiene mucho sentido en la versión impresa).

También he añadido unas teclas de acceso rápido a las secciones del blog, y un estilo para indicarlas. Ahora, por ejemplo, si pulsas Alt + E (o CTRL + E en Mac) accederás directamente a la sección Estupideces.

También le he estado haciendo unos test de accesibilidad y he quedado bastante contento con el resultado (Aunque quedan cosas por hacer, ahora mismo esto pasa los test de la Sección 508 y cumple el nivel A de las WCAG.

No es todo lo que se puede hacer, pero es algo. Espero haber facilitado la tarea a a algún visitante...

Lista de spamers

Un blog es lugar muy interesante para un enlace desde el punto de vista de Google.

Los blogs enlazan mucho entre ellos, y tienen un contenido muy dinámico, cambiante y variado, lo que hace que sus elaces suelan ser muy "valiosos" en cuanto al pagerank que pueden aportar.

Por lo tanto, si tienes un sitio web y quieres que tenga un pagerank alto (para aparecer primero en las búsquedas en Google), te conviene tener enlaces en el mayor número posible de blogs.

Esto significa que los blogs suelen verse asediados por multitud de spamers que intentan desesperadamente colocar un link en ellos.

Ya te comenté que estaba trasteando con mis logs para ver de donde venían y cómo actuaban los spamers y, a resultas de ello, como soy un tipo generoso y con gran espíritu solidario, me he currado una lista de spamers que visitan este blog, por si a alguien le es de alguna utilidad.

Se trata de un archivo de texto plano, aunque está comprimido con RAR. Si no quieres o no puedes descomprimirla, avisame y te mando una sin comprimir por correo electrónico.

La lista (constituida por 234 dominios) está dividida en dos columnas: En la primera aparece el número de "visitas" que ha llegado aquí de cada dominio spamer, y en la segunda se muestra el dominio en sí mismo (están ordenados de más a menos "activos"). Ambos datos están separados por una tabulación, para que puedas cortarlo facilmente.

Solo aparecen dominios. A veces el spam vendrá de "dominio.com/pagina" y a veces de "dominio.com/otra_pagina_distinta".

La lista es de dominios de segundo nivel, lo que quiere decir que si aparece, por ejemplo, "dominio.com", el spamer puede proceder de "www.dominio.com" o "lo_que_sea.dominio.com". Los dominios genéricos desde los que vienen tanto spamers como no spamers (como, por ejemplo, "blogs.com") no salen en la lista. Solo aparecen (salvo error) dominios que son integramente spamers. Tampoco aparecen las redirecciones del estilo "go.to", aunque hay algunos (pocos) que vienen con direcciones del tipo "go.to/spamer".

En fín: Aquí te dejo la lista de spamers, para que la uses a tu gusto, si quieres.

Y si quieres una versión más detallada (Con las URIs exactas de los spamers o lo que sea), o tienes alguna duda o consejo, no tienes más que decirlo.

Sostiene Camacho

En la novela de Tabucci "Sostiene Pereira" (y creo recordar que en la subsiguente película homónima también), el antiheróico, gordo y anciano protagonista (el Pereira en cuestión) se dedica a escribir las notas necrológicas de escritores célebres aún vivos, con la idea de tenerlas preparadas para cuando les llegue el fatal (e inevitable) momento.

No deja de tener su lógica: Después de todo, acabarán muriendo necesariamente y, para cuando llegue el caso, mejor es tenerlo ya todo listo que tener que montarlo precipitadamente y que salga mal.

Pereira, que no era tonto, además escogía aquellos que ya tubiesen una edad arriesgadamente avanzada o un precario estado de salud.

Pues la cosa es que la realidad, como siempre, supera a la fantasía: Acabo de leer una nota en Yonkis que dice que en Esmas.com hay alguien con la misma previsión que el mencionado Pereira, y que ya tienen preparado el obituario de Juan Pablo II.

Presta atención a los huecos marcados con puntos suspensivos, listos para rellenar los datos que aún son inseguros:

El guía de la iglesia murió a causa de un... a los ... de edad

El artículo lo firma un tal Miguel Camacho, y es de suponer que es a él a quién debemos tamaña muestra de previsión. No puedo evitar la tentación de hacer los ovbios chistes fáciles, y decir que sin duda es un hombre con visión de futuro. Todo un adelantado a su tiempo.

No dudo que esto es algo que harán en muchas redacciones, aunque, la verdad, quizás hubiese sido mejor guardar la necrológica en un archivo privado, en lugar de ponerla en la Web...

Vivir para ver.

Estadísticas y spam

Estoy trabajando en un modulillo para extraer estadísticas de accesos a este blog, y ya está dando algunos resultados curiosos.

Primero, unas aclaraciones:

El log muestra solo las visitas a páginas del blog. No contabiliza descargas de imágenes, hojas de estilo, archivos ni nada similar. Tampoco cuenta acesos al RSS (esos van en un log aparte).

En esta tabla, "Visitas" se refeire, realmente, a "Visualizaciones". Por ejemplo, si alguien entra en la página principal, luego pasa a ver los comentarios de un post y escribe un comentario, eso cuenta como tres visitas (una de la página principal, otra de los comentarios, y otra despues de enviar el suyo). O sea, que las estadísticas están "hinchadas".

Spam se refiere a accesos que se hacen con cabeceras HTTP_REFERER falsificadas. Es decir, gente que dice venir a través de un enlace en una página que, en realidad, no tiene ese enlace.

Visitas Legitimas son las que no son spam según la definición de arriba, evidentemente.

El protocolo HTTP, que es el que sostiene la Web, tiene una serie de campos que envía en la cabecera de las páginas (justo antes de enviar la página en sí) con información variada. Uno de estos campos es HTTP_REFERER, que indica de qué página viene un visitante cuando llega a la tuya.

El trucar la cabecera HTTP_REFERER es un método de los spamers para hacer creer a tu página que tienen enlaces apuntándote. Muchos blog tienen un listado de accesos desde otras páginas (Como, por ejemplo, el de Malglam), y así el spamer consigue un enlace en tu página apuntándole a él, con lo que eso puede significar de vistas, pagerank, etc. (Son unos cabrones retorcidos, como puedes ver).

Yo no muestro en este blog las HTTP_REFERER pero, además de que consumen ancho de banda, si son muchas respecto a las visitas legítimas, pueden falsearme la estadística (cosa que me irrita sobremanera).

Y el hecho es que me la falsean.

Porque, efectivamente, recibo un montón de spam de esta clase. Básicamente casinos, sexo y medicamentos.

He escrito un pequeño filtro (benditas sean las regexps) que me separa el spam del resto de visitas, y esta es la tabla resultante para lo que llevamos de mes (hasta ayer):

FechaVisitas LegítimasSpam
01-02-200584414
02-02-200584262
03-02-20059289
04-02-200573643
05-02-200578647
06-02-200590120
07-02-200568939
08-02-200591437
09-02-200570329
10-02-200572163
11-02-2005815189
12-02-200558540
13-02-2005839822
14-02-20058361324
15-02-2005869111
16-02-2005114012

En general, tengo por aquí una cantidad bastante apreciable de spam. Lo cual, unido a que no hay demasiados visitantes, hace que la la proporción sea notable.

Y luego, los casos extremos. El domingo 13 llegó aquí casi tanto spam como visitas legítimas. Pero al día siguiente, lunes 14, la cosa se disparó brutalmente: ¡Llegó mucho más spam que visitas reales!

Definitivamente, tengo que hacer algo. Me estoy planteando hacer un filtro similar al que he usado parqa las estadísticas, pero para los accesos al blog. De modo que si alguien viene aquí desde, pongamos por caso, "culitos-calientes-pervertidos.com" (es un ejemplo inventado, me niego a poner las URLs auténticas de estos tipos), el blog le envíe una respuesta 404 "Page not found".

Lo que pasa es que no me acaba de gustar eso de filtrar accesos. No sé, me da un cierto mal rollo.

¿Tú que opinas?

PPCMS 2022