La importancia del error 404
Un Error 404 es la respuesta de un servidor web a un pedido de un archivo que no existe en el servidor. Hasta aquí todo muy lindo y claro, pero ¿qué tiene realmente de importante una respuesta de error 404?
En primera instancia, lo importante en sí es asegurarse de que el servidor envíe el encabezado HTTP diciendo que el archivo no existe. Es cierto que muchas veces es mejor intentar ayudar al visitante, ofreciendo alguna caja de búsqueda, enlaces a paginas similares o quizá algún mensaje chistoso (como ocurre en muchos sitios web), con lo que estoy en total acuerdo, lo mejor es siempre intentar ayudar al lector o posible cliente de nuestra empresa a encontrar lo que busca. Pero todo dentro de ciertos límites. Existen webmasters que suelen utilizar un código de respuesta HTTP 200 (el servidor le dice al navegador que la pagina solicitada esta correcta) aunque el archivo no exista, para lograr que los buscadores indexen la pagina y de esa forma atraer a otros posibles clientes que realicen la misma búsqueda o similar.
Basta con analizar algún registro de accesos al servidor para darse cuenta de la cantidad de pedidos a paginas hechos por robots para hacer SPAM, como por ejemplo warning_this_is_english_domain_to_solve_this_problem_submit_site_in_atoall.com.html” con el cual me encontré la semana pasada, son muchos y de grandes variedades.
Este caso en particular (atoall . com), su site arma una serie de URL para que GoogleBot las indexe y de esa forma intentar conseguir enlaces. Con una simple búsqueda de la url anterior, podemos notar como por lo menos 100.000 sitios tiene esta página dentro de Google, lo que puede provocar una penalización dentro de tu sitio por enlazar con Spammers. Una simple mal configuración del servidor puede provocar una penalización en Google.
A prestar atención!!
Popularity: 2% [?]