Semalt revela una guía para eliminar el tráfico falso de su sitio

El spam de referencia es el producto de los robots de spam que envían tráfico falso a Google Analytics directamente, apareciendo así en los informes de tráfico generados. Tome medidas para eliminar el spam de referencia si los encuentra en los informes de GA para lograr estadísticas precisas para el sitio.

Artem Abgarian, Gerente Senior de Éxito del Cliente de Semalt Digital Services, comparte aquí algunos problemas prácticos a este respecto.

¿Qué es un bot?

Los bots son programas desarrollados para ejecutar tareas de forma repetitiva, rápida y precisa. Los bots fueron inicialmente diseñados para indexar páginas en Internet por los motores de búsqueda . Las personas con intenciones maliciosas adoptaron el uso de bots a lo largo de los años para ayudarles a crear fraudes mediante clics, transferir el contenido de un sitio, distribuir malware, acumular direcciones de correo electrónico y exagerar el tráfico del sitio.

Bots seguros y maliciosos

Un ejemplo de un buen bot es el robot de Google que rastrea e indexa páginas para los usuarios. Los robots de búsqueda no ejecutan JavaScript (la mayoría de ellos). Sin embargo, aquellos que lo usan se encuentran apareciendo en los informes de GA que podrían dañar la representación métrica. Si no ejecutan JavaScript, entonces no hay impacto en los informes, pero a pesar de que aparecen en los registros del servidor. Sin embargo, pueden afectar la velocidad de carga ya que usan los recursos del servidor. Los bots seguros se adhieren a las directivas contenidas en el robots.txt. Los robots maliciosos, por otro lado, implementan varias estrategias para anular estas pautas.

Spam Bots

Su objetivo principal es visitar tantos sitios web como sea posible y enviar spam con encabezados de referencia facial para evitar la detección. El encabezado de referencia falso incorpora un enlace de redireccionamiento al sitio que desean promocionar. Las solicitudes HTTP de dicho bot aparecen en los registros del servidor e indexadas por Google. Actúa como un vínculo de retroceso al sitio cuando aparece en el registro del servidor. Google ha realizado cambios en sus algoritmos para no indexar datos de los registros del servidor, frustrando así los esfuerzos de los desarrolladores de spambot. Los robots de spam ejecutados con JavaScript pueden pasar los filtros GA, por lo que se reflejan en los informes.

Botnet

Las botnets comprenden varias computadoras infectadas para formar una red controlada por el spammer. Utiliza diferentes IP para atacar un solo sitio web. Cuanto más grande sea la botnet, mayor será la tasa de éxito de la infiltración. El tráfico de una botnet aparece como tráfico directo ya que proviene de otra computadora, por lo que es más difícil de detectar. Bloquear uno no tendría mucho impacto cuando otro toma su lugar.

Bots de spam altamente maliciosos

Su objetivo principal es reclutar una computadora para que forme parte de una botnet al infectarla con malware. La computadora se usa para distribuir el mismo malware a otras computadoras. El bloqueo de una botnet puede inhibir el tráfico entrante de los visitantes reales. Los redireccionamientos sospechosos del informe de tráfico de referencia conducen principalmente a estos sitios web que infectan malware. Evite hacer clic en dichos enlaces a menos que haya instalado un software antimalware efectivo o una computadora separada.

Smart Spam Bots

Estos sitios web envían tráfico a Google Analytics utilizando su código de seguimiento junto con el ID del sitio. También incluyen algunas referencias falsas en el informe de tráfico, que pueden pasar desapercibidas. Sus actividades nunca aparecen en los registros del servidor, y no hay forma de bloquearlas, ya que envían datos directamente a la herramienta de análisis. Las personas que no usan Google Tag Managers tienen el código de seguimiento de GA en su sitio, que actúa como un identificador de propiedad web. Google Tag Manager es una herramienta eficiente para eliminar el spam de referencia en este caso. Los robots de spam en su mayoría atacan sitios plagados de vulnerabilidades en el código fuente o aquellos con medidas de seguridad limitadas.

Detectar fuentes de spam

Navegue a los informes de tráfico de Google y use las tasas de rebote como elemento de clasificación, en orden descendente. Aquellos con tasas de rebote del 100% o 0% deben ser sospechosos de enviar spam. Alternativamente, hay una lista exhaustiva de spammers ya establecidos con los que puede comparar, sin tener que hacer ningún análisis manual. El siguiente paso es bloquearlos.

Asegúrese de crear una anotación en el gráfico del informe que explique dónde hubo una explosión de tráfico en ese momento.

1. Use el motor de reescritura para el archivo .htaccess y use las capacidades de Spambot para eliminar el spam de referencia haciendo cambios en él. Si está seguro de la dirección IP que usa el spambot, inclúyala en el código y denegue el acceso. La capacidad se puede utilizar para bloquear rangos de direcciones IP. Solo haga esto si está seguro de que el spam utiliza varias direcciones IP para realizar una sola acción. Además, evite que los usuarios sepan que usan spambots.

2. Función de filtrado de bots: marque la casilla que solicita excluir los bots y las arañas conocidos.

3. Monitorear los registros del servidor: ahuyenta a los bots visitando el sitio regularmente. Use un firewall para proteger la computadora del espacio virtual filtrando las fuentes web de los robots de spam.

4. El administrador del sistema debe estar en condiciones de ofrecer asistencia profesional.

5. El código ItSAlive ayuda a mantener las métricas de Google y Yandex de la interferencia de los robots de spam.

6. Google Chrome es capaz de detectar malware y es adecuado para navegar si no hay un firewall instalado.

7. Las alertas de usuario son notificaciones personalizadas de Google que notifican cuando hay un aumento inesperado del tráfico.

8. Filtros de Google Analytics. Cree nuevos filtros en la sección de vista de la pestaña Administrador en GA.