Captura cola.png

Uso de Python para recuperar el tráfico del sitio SEO (Parte dos)

Search Engine WatchFriday, 15 March 2019

La automatización del proceso de reducir los problemas de tráfico del sitio con Python le brinda la oportunidad de ayudar a sus clientes a recuperarse rápidamente.

Esta es la segunda parte de una serie de tres partes. En la primera parte, presenté nuestro enfoque para concretar las páginas que perdían tráfico. Lo llamamos el análisis “ganadores vs perdedores”. Si tiene un sitio grande, Pagar páginas individuales que pierden tráfico como lo hicimos en la primera parte podría no darle una idea de cuál es el problema. Entonces, en la segunda parte, crearemos grupos de páginas manuales usando expresiones regulares. Si te quedas para leer la tercera parte, te mostraré cómo agrupar las páginas automáticamente utilizando el aprendizaje automático.

Puede encontrar el código utilizado en la parte uno, dos y tres en este cuaderno de Google Colab. Caminemos por la segunda parte y aprendamos algo de Python.

Incorporando redirecciones

A medida que el sitio de nuestro análisis se trasladó de una plataforma a otra, las URL cambiaron y se colocó un número decente de redirecciones. Con el fin de realizar un seguimiento de los ganadores y los perdedores con mayor precisión, queremos seguir los redireccionamientos desde el primer conjunto de páginas. No estábamos comparando manzanas con manzanas en la primera parte. Si queremos obtener una visión más precisa de los ganadores y los perdedores, tendremos que intentar descubrir a dónde se están redirigiendo las páginas de origen y luego repetir la comparación.

1. Peticiones de Python

Usaremos la biblioteca de solicitudes que simplifica el rastreo web, para enviar una solicitud HTTP HEAD a cada URL en nuestro conjunto de datos de Google Analytics, y si devuelve un redireccionamiento 3xx, registraremos el destino final y volveremos a ejecutar nuestros ganadores y Análisis de perdedores con las URL correctas, finales. Las solicitudes HTTP HEAD aceleran el proceso y ahorran ancho de banda ya que el servidor web solo devuelve encabezados, no respuestas HTML completas.

A continuación hay dos funciones que usaremos para hacer esto. La primera función toma una sola URL y devuelve el código de estado y cualquier ubicación de redirección resultante (o Ninguna si no hay una redirección).

La segunda función toma una lista de URL y ejecuta la primera función en cada una de ellas, guardando todos los resultados en una lista.

…Para leer más, siga el link del idioma que prefiera

Tags: plataforma, seo, google, analytics

Clickee para leer el artículo en InglésClickee para leer el artículo en Español