Comprendiendo Google Search Console usando un poco de sentido común
Muchas veces cuando leemos sobre SEO, se tiende a realizar una cantidad de suposiciones o incluso a aceptar como "hechos factuales" aquello que por desconocimiento se asume, este es el caso de lo que muchas veces sucede con Search Console de cara al SEO, el conjunto de herramienta e información que Google proporciona a los usuarios y que erróneamente en muchos casos se tiende a creer que lo allí reflejado es el "estado en tiempo real" del sitio en Google o incluso, que esta determina el posicionamiento de alguna forma.
Un rápido contexto
Anteriormente Google Search Console (GSC) se llamaba Webmaster Tools (WMT por su acrónimo en inglés) y esta es una gran herramienta para obtener información directamente de la fuente del propio buscador sobre como nuestros sitios van impactando en las búsquedas en las que puede competir entre muchos otros aspectos.
Lo primero que se debe tener en cuenta como base fundamental es que Google Search Console no determina ni debe determinar el "SEO" que se realice en el sitio, así como no lo hace ni lo debe hacer ninguna herramienta de un tercero.
Veamos algunos aspectos de lo que nos ofrece esta herramienta:
La utilidad de la información de la consola de búsqueda de Google
El centro de ayuda como gran recurso
Principios fundamentales para comprender GSC
Primer principio fundamental: Es opcional
Segundo principio fundamental: Es complementaria
Tercer principio fundamental: Es general más no implicativa
Cuarto principio fundamental: No es en tiempo real
Quinto principio fundamental: No determina el "estado SEO" de tu sitio en Google
Ejemplo 1: Interpretando los datos de Google en la indexación de un sitio web
Ejemplo 2: Entendiendo lo que Google ofrece en la sección de [Enlaces a tu sitio]
El mensaje de bienvenida de Search Console
1 - Añadir todas las versiones del sitio web
2 - Selecciona tu versión preferida
3 - Selecciona tu país de destino
4 - Comparte el acceso a compañeros de trabajo
5 - Envía un sitemap
La nueva versión de la Consola de Búsqueda de Google
Páginas AMP
Cobertura del índice (Index coverage)
[Errores]
[Validas con advertencias]
[Validas]
[Excluidas]
Motivo 1: Página alternativa con etiqueta canónica adecuada
Motivo 2: Página con redirección
Motivo 3: Anomalía en el rastreo
Motivo 4: La URL enviada no ha sido seleccionada como canónica
Motivo 5: Errores 404 - No se ha encontrado (404)
Motivo 6: Google eligió una página canónica diferente a la del usuario
Motivo 7: Rastreada: Actualmente sin indexar
Motivo 8: Página duplicada sin etiqueta canónica
Motivo 9: Errores 404 suaves - Soft 404
Motivo 10: Página duplicada que no es HTML
Motivo 11: Se ha retirado la página por una reclamación legal
Motivo 12: Descubierta: actualmente sin indexar
Motivo 13: Rastreada: actualmente sin indexar
¡16 meses de datos acumulados!
Enviar feedback a Google sobre la versión Beta de GSC
La utilidad de la información de la consola de búsqueda de Google (GSC)
GSC es de gran utilidad en muchos aspectos, uno de ellos y sobre el cual Google ha mejorado mucho entendiendo la necesidad de brindar información más clara sobre el proceso que realiza es la información del proceso de rastreado y de indexación (Estado de indexación) del sitio web, esta información en conjunto con lo ofrecido en la sección de Rendimiento y la sección de Seguridad (problemas de seguridad como hackeos), son fundamentales.Por supuesto encontraremos otras secciones como la de acciones manuales y eliminación de páginas entre otras sobre las que podríamos ampliarnos extensamente.
Antes de avanzar sobre aspectos de la herramienta, tengamos en cuenta un gran recurso para comprender el funcionamiento y la información ofrecida en GSC, la información contenida dentro del centro de ayuda
El centro de ayuda de Google
Si necesitas conocer u entender la información que Google está arrojando en GSC en sus diferentes secciones, es una muy buena idea acudir a la información provista por GoogleEn muchos casos y en gran medida, esta información se desconoce y constantemente se refiere como una fuente informativa para comprender aspectos del funcionamiento del buscador y de la herramienta en el foro para Webmaster de Google, incluso en el foro de Blogger y por supuesto, para las empresas en las diferentes tipos de asesorías cuando se requiere señalar uno que otro aspecto y con ello, aumentar la capacidad de comprensión sobre el proceso e incluso, desmitificando cantidad errores u concepciones equivocadas y hasta horrores que han sido "absorbidos" como un "hecho factual" aún cuando incluso, tal cosa puede ser algo que está desactualizado o bien, inducida erróneamente por un tercero.
Principios fundamentales para comprender GSC
Siempre recomiendo al momento de usar esta herramienta, tener en cuenta cuenta varios principios fundamentales para comprender lo que en esta se ofrece y el cómo Google procede de su lado.En muchas ocasiones, lo que la herramienta refleja sirve para "fundamentar" la visión de un "buscador de Google castigador" (penalizaciones y sanciones) y no es algo exagerado, así como la visión de un Dios castigador para diferentes religiones puede vender muy bien, en lo que respecta al SEO, la visión de un "buscador castigador" que penaliza por esto y por aquello sirve para facturar muy bien induciendo al cliente sobre el "castigo de Google por esto u aquello" aprovechandose del desconocimiento o la ignorancia y el decir incluso que "Google miente" en conjunto con "mi experiencia en" como lo he visto en muchos casos es argumentado.
Ahora veamos 5 principios básicos para tener en cuenta y que podrás ver desarrollados en otros temas en lo que respecta al SEO en Google y como este procede de su lado.
Primer principio fundamental: No es un factor de la clasificación de Google y es de uso totalmente opcional
Usar la consola de búsqueda verificando un sitio web, no es de carácter obligatorio y el usarla o no, no tiene incidencia alguna en el posicionamiento en los resultados orgánicos, esto es, no es un factor de clasificación.Nota agregada:
Así como GSC no es un factor de clasificación tampoco lo es ninguna otra herramienta o producto de Google, llamase AdSense, Google Analytics, etc., sin importar si se llegase a ver algún supuesto "estudio de factores SEO" donde impliquen o afirmen ello, ya sea que lo impliquen o no como una correlación, relación, o como lo quieran sustentar.
Segundo principio fundamental: Es complementaria
Esta ha sido una herramienta de ayuda para suplir en muchos casos lo que los webmasters o a través de las plataformas de sitios no podían realizar a modo de optimizaciones SEO para el sitio desde su propio lado por diferentes aspectos en la capacidad o limitaciones en la gestión directa y detallada del sitio.Hay funcionalidades que se ofrecen en GSC que son del tipo complementario, es decir, en general son aspectos que se podrán gestionar del lado del servidor o bien, del CMS si esto lo permitiese y lo hiciera correctamente, como por ejemplo, establecer el dominio preferido del sitio, ya sea con www o sin www y en el protocolo respectivo (http o https).
Siguiendo el ejemplo del dominio preferido, en muchos casos era normal que a través del CMS el webmaster no pudiera establecerlo y el sitio se indexaba tanto con www como sin www en Google, luego, usando la herramienta de GSC se le podía indicar cual versión (registrandola como una propiedad) se quería se considerara por parte de Google como la versión preferida.
¿Qué sucede cuando un sitio tiene https y no hay forma de establecer las redirecciones entre versiones y protocolos http y https a nivel del sitio?
En este caso es cuando GSC y el cómo Google trabaja de su lado se vuelven muy útiles, primero porque es solo verificar las versiones en https y señalar cual se desea como preferida y segundo, porque Google de su lado hace el trabajo en la transición de http a https gracias a que, cuando encuentra que un sitio tiene https le dará prioridad a este y comenzará a hacer la transición
- Indexanción de páginas HTTPS por defecto - (Indexing HTTPS pages by default)
¿Qué sucede con aquellos sitios web que no usan GSC y no han controlado las versiones preferidas?, ¿se tratarán como contenido duplicado que afecta el posicionamiento?
No, no son tratados como contenido duplicado que es sancionado por Google y lo que Google hace en la actualidad, es que establecerá entre aquellas versiones que encuentre para ser indexadas, cual es la que considerará como la versión canónica, por supuesto esto puede tomar un tiempo y es allí cuando dicho proceso puede verse afectado por diferentes señales que Google usará para establecer ello, lo cual puede generar algo de "ruido" y demorar el proceso, lo que muchos aducen erróneamente como que Google lo penalizará
- El contenido duplicado en Google entre los mitos, falacias y herramientas SEO
Tercer principio fundamental: Es general más no implicativa
Lo que allí se encuentra es para cualquier tipo de sitio según su condición, no establece que todos deban tener en el sitio web lo que allí se refiere, el mejor ejemplo de esto se puede ver con los informes de la sección de Segmentación Internacional y por la cual, muchas personas cuando exploran la herramienta y encuentran allí un aviso que dice:Tu sitio no tiene ninguna etiqueta hreflang.
Google utiliza etiquetas hreflang para hacer coincidir la preferencia de idioma del usuario con la variante correcta de tus páginas.creen que deben colocarla, pero no es así y constantemente he visto esto reflejado en los foros de Google, por ejemplo, para casos dónde se cree equivocadamente que con esta se establece el idioma del sitio, o que deben tenerlas porque GSC muestra el aviso entre otros.
Sucede lo mismo con la sección de sitemaps sobre la cual, se puede ver se tiende a creer erróneamente es "la única vía" para la indexación y si no se envía un sitemap en GSC, el sitio no será indexado
- El sitemap es una gran herramienta de ayuda para muchos casos, pero no es la vía exclusiva de indexación de Google
Cuarto principio fundamental: Los datos no están en tiempo real
Google provee información a través de la consola pero esta tiene un retraso de tiempo en los datos e información, sucede en unas secciones mucho más que en otras y lo que allí veas, no determina que es lo que a ese momento sea todo lo que realmente Google posee o ha procesado de su lado para el sitio web, puede ser mucho, mucho más.El mejor ejemplo para señalar que los datos no se ofrecen en tiempo real es el de la sección Analítica de Búsqueda (actualmente conocida como Rendimiento) la cual muestra los datos con un retraso de entre 2 y 3 días en promedio aunque actualmente, ya ofrece datos con un día de diferencia, no obstante que Google hace la aclaración que estos datos podrán variar con el paso de los días y solo se deben considerar como consolidados aquellos que no están señalados como "Preliminares".
Como dato agregado, en ciertos casos dónde Google está realizando procesos de su lado, se puede llegar a tener hasta 7 u 8 días de retraso en la información (procesos de actualización entre otros), lo que no es muy habitual pero sucede y cuando ocurre, dispara las alarmas de los webmasters pensando que se trata de un error un problema de su lado o que deben solventar y no es así.
La otra sección que ejemplificaba muy bien (lo digo en pasado porque ya fue removida definitivamente) el hecho de que algunas secciones tardan mucho en actualizarse, era la sección de Mejoras HTML, la cual podía llegar a tardar meses (mucho, pero muchos meses) en que se actualizara la información allí referida.
Solo por agregar algo más de lo que debes tener en cuenta para el correcto contexto, sucede que incluso en casos de acciones manuales que excluyen un sitio web de los resultados de búsqueda (desindexado) son detectadas por los webmasters antes de que la notificación se refleje en GSC.
Quinto principio fundamental: No determina el "estado SEO" de tu sitio en Google
De ninguna forma la información que se ofrece en la consola de búsqueda determina el estado de tu sitio en Google salvo claro está, en algunos casos de acciones manuales, por ejemplo las que tienen una incidencia directa con la indexación o con aspectos de clasificación.- Entre acciones manuales y la desinformación
Ahora, el que creo es el mejor ejemplo que se puede colocar en este caso sucedía con una sección que, y una vez más ¡gracias a Dios! y después de mucho tiempo (el inicio de una "limpieza" y actualización), Google removió de las entonces conocidas Webmaters Tools, me refiero a la sección que se llamaba "Palabras Claves de Contenido"
Constantemente esta sección era "vista" erróneamente como la forma en la cual Google "dimensionaba" la densidad de palabras claves, o clasificaba las palabras claves en importancia, aún cuando esta sección para lo que realmente era útil en su momento, era para identificar, por ejemplo, una vulneración a causa de un hackeo.
Ahora con lo anterior, veamos lo que sería un par de ejemplos sencillos respecto de la indexación:
Ejemplo 1: Interpretando los datos de Google en la indexación de un sitio web
Muchas veces se puede ver cantidad de preguntas sobre posicionamiento en dónde una de las principales preocupaciones es si Google está indexando bien el sitio y claro, no faltan las falacias y los que escriben sobre "como lograr la indexación de tu sitio en pocos minutos en Google" pero en ello muchas veces se acude a GSC pero dado que no se tienen lo anterior, se llegan a cantidad de conclusiones o suposiciones erróneas respecto de si el motor de búsqueda lo está indexando bien.Rápidamente y teniendo en cuenta lo anteriormente expuesto se puede llegar a ver un escenario como este:
Un sitio tiene unas 2000 publicaciones y otras 400 URLs de diferentes tipos y lo que concierne respecto de la forma de identificar la indexación en Google en sus diferentes formas, esto es en la sección de sitemap, lo que denota Google en su operador y en el estado de indexación
Sitemap
No se ha enviado ninguno por lo tanto, lo que aparece es cero.
Operador site:URL
Al usar el operador Google mostrará que tiene unas 2100 URLs aproximadamente pero al tratar de avanzar hasta el final solo llegaremos a la página 20 de resultados, unas 200 URLs aproxidamente, lo que es normal porque en este solo se ofrece una muestra, no todo lo que Google tiene indexado de su lado.
Estado de Indexación
En el estado de indexación al mirar los datos que ofrece GSC nos encontramos con que muestra como ultimo dato que tiene 2200 y una tendencia descendente, luego, ¿porqué los datos no encajan?.
Ver este escenario es más que normal, luego de que comprendemos que la consola de búsqueda no está en tiempo real, extraer la conclusión de lo anterior es simple, Google ha estado actualizando su índice removiendo URLs gradualmente que fueron indexadas pero que puede considerar duplicados o irrelevantes entre otros aspectos, por ejemplo, cuando en un blog se indexan paginaciones o URLs tipo histórico, por ejemplo en Blogger con las que tienen el "Archive" en la URL.
En general y si se ve una tendencia de esta forma en [Estado de indexación], solo es revisar otros detalles para identificar fácilmente que no hay un problema, por ejemplo, al revisar lo que Google muestra en [Analítica de búsqueda].
Al respecto de esto, podemos ver lo que John nos ofrece recientemente en este video de Google Webmasters en ¿por qué varía el conteo de páginas indexadas? (Why does the indexed pages count vary)
Respecto de la variación de los datos diferentes formas de obtener y verificar información de lo que se encuentra indexado por Google.
Ejemplo 2: Entendiendo lo que Google ofrece en la sección de [Enlaces a tu sitio]
Esta es una sección en la consola de búsqueda que se convirtió en el referente fundamental del SEO por la propia orientación de Google durante mucho tiempo y actualmente se puede ver que cuando los enlaces, por alguna razón allí desaparecen (procesos de actualización entre otros) muchas personas, empresas y SEOs entran casi que en pánico bajo el pensamiento que Google ya no muestra los enlaces existentes y piensan que ello afectará el posicionamiento del sitio o bien, que el que estos no se reflejen allí significa que no han sido identificados y "no suman" como se puede ver constantemente:- ¿Porqué mis backlinks decresen? - (Why are my back links decreasing?)
- ¿A dónde se han ido mis enlaces de Pinterest? - (Where have my Pinterest links gone?)
En realidad se desconoce mucho cómo interpretar los datos allí reflejados, pero para simplificar un poco su comprensión, se puede resumir de esta forma:
- En GSC Google solo ofrece una muestra
- Esta muestra puede cambiar con el tiempo
- No se reflejan todos los backlinks que tiene identificados
- Lo que allí se refleje no quiere decir que son los enlaces que cuentan para el ranking, puede incluir enlaces nofollow, irrelevantes, spam, desautorizados y enlaces que Google de su lado ha devaluado entre otros.
Básicamente, incluso Google podría no mostrar nada allí o remover dicha sección y nada cambiaría y no me extrañaría que en algún momento en el futuro esto sucediera.
Algo que emerge de esto es que, para aquellos que se dedican a crear enlaces y siguen las teorías del "SEO negativo" entre otros, acuden a usar (y por supuesto recomiendan) herramientas de terceros para tener todo el perfil de enlaces, y como tal ello no es malo y hay herramientas de terceros que son totalmente gratuitas en razón de proporcionar información sobre el sitio propio y en ello, ciertamente la parte de poder ver la totalidad de los backlinks que puede tener el sitio es por lo que muchos acuden a estas pero naturalmente cuando siguen dichas líneas del linkbuilding, lo que buscan es "encontrar" sitios para crear enlaces.
Ahora que tenemos lo anterior, podremos comprender fácilmente el mensaje automatizado y genérico, que recibimos al verificar un sitio web y como contextualizar rápidamente lo que allí se nos comenta
El mensaje de bienvenida de Search Console
Veamos algunos puntos a tener en cuenta sobre cada una de las recomendaciones que llegan dentro del mensaje, pero recuerda tener muy en cuenta la parte resaltada en amarillo ("Tenemos algunos consejos"), son recomendaciones, no son ni condicionantes ni de carácter obligatorio.
Ahora exploremos los 5 puntos del mensaje
1 - Añadir todas las versiones del sitio web
Si bien es cierto que solo necesitas seguir la que será la versión preferida y no necesitas tener las otras verificadas, ya sea que esté establecida por defecto en el CMS o a nivel del servidor, esto puede ser de ayuda para detectar posibles intrusiones2 - Selecciona tu versión preferida
Ya lo hemos tratado anteriormente en el segundo princpio, luego, si desde el servidor ya está establecido que la versión preferida es, por ejemplo, la versión http con www, entonces en GSC no habrá diferencia si seleccionas o no la versión preferida, Google por defecto lo detectará sin necesidad de que hagas nada3 - Selecciona tu país de destino
La geolocalización es algo que puedes realizar por ejemplo, cuando tu blog tiene como orientación un país determinado, pero no quiere decir que debas hacerlo, aquí es cuando consideras algo mencionado anteriormente y es cuando te preguntas: ¿cómo sabría Google a qué país o países se dirige mi sitio si yo no uso GSC?.La respuesta es sencilla, lo hará en base a gran cantidad de señales en tu propio sitio web, su contenido y los datos que expongas serán utilizados para esto, luego aún si no lo haces y tienes un sitio dirigido a España, a Panamá o hacia México, Google sabrá reconocer esto sin problemas.
De hecho, si tienes un sitio web dirigido a varios países también lo sabrá identificar sin problemas y aún cuando tengas el sitio hacia un país en particular (incluyendo un dominio de nivel superior geográfico), si este es relevante en una búsqueda de Google en otro país, el sitio será ofrecido en los resultados sin ningún problema acorde a su relevancia entre muchos otros factores.
Establecer el país es como tal, una de las señales que Google puede tener en cuenta al momento de geolocalizar un sitio web, pero es una de muchas y no establece de hecho que el sitio vaya a posicionar mejor en dicho país, tampoco que no vaya a ser relevante en otros así como tampoco sucede con la IP detectada por Google del servidor del sitio, esto es, porque es muy normal que un sitio web dirigido a Colombia, pueda tener su servidor en los Canadá y Google sabe ello, por lo mismo, lo que John comenta en este hilo del foro de Webmaster Central
4 - Comparte el acceso a compañeros de trabajo
Esto es una sugerencia, no quiere decir que lo tengas que hacer, la consola de búsqueda te permite compartir en varios niveles información para que esto pueda ser visto por otras personasPor colocar un ejemplo, en mi caso personal cuando voy a trabajar con una empresa, lo primero que le solicito es que se me conceda acceso a la versión preferida del sitio en GSC con el permiso "Usuario con acceso restringido", más allá de lo que pueda llegar a complementar luego con Google Analytics (GA) ya que en muchos casos no están vinculadas.
Esto lo hago de esa forma por dos razones, primero porque con la información ofrecida por la consola de búsqueda podré en gran medida y luego de analizar el nicho de competencia del sitio, obtener el panorama de la actualidad del sitio y su impacto en los resultados de Google
5 - Envía un sitemap
Como bien dice el texto, ayuda, pero ni es indispensable, ni obligatorio, si no se envía y con tan solo que Google identifique el sitio a través de algún enlace, rastreando un servidor o tan solo con verificar el sitio web, mientras este posea una estructura adecuada, Google rastreará y seguirá los enlaces y procederá a indexar el sitio.- El sitemap es una opción y ayuda, no establece la indexación y permanencia de una URL en el índice de Google
Como detalle agregado, mencionar además que al utilizar la consola de búsqueda podrás tener hasta mil propiedades verificadas con una cuenta de Google, así que no habrá mucho problema por falta de espacio. ;-)
La nueva versión Beta de la consola de búsqueda
Las herramientas para webmasters de Google han evolucionado a través del tiempo y han sido de gran ayuda para que los webmasters le saquen provecho a la información ofrecida por Google a través de la misma, sobre cómo Google está procesando el sitio y de cuando en cuando van evolucionando.En enero de 2018 se ha lanzado la nueva versión de GSC, es conocida como la versión Beta, la cual está corriendo (funcionando) en paralelo con la versión habitual de la consola de Google por lo que podremos disfrutar de ambas al tiempo así como las mejoras y cambios que traer y algunos de las cuales realmente muy esperados por muchos de nosotros
Esta nueva versión beta de GSC además de ser responsiva (Adaptable) y permitir su gestión vía dispositivo móvil sin ningún problema, ofrece por el momento tres aspectos importantes:
Páginas AMP
Ayudando a la identificación y corrección de errores en páginas AMP en el sitio y proporcionando una herramienta de validación para aquellas páginas que han sido identificadas con algún problema, luego, si se corrige algún error detectado y se supera la validación para una página en particular, Google procederá a evaluar de nuevo aquellas páginas AMP que fueron identificadas con el mismo y así validarlas.También entre otra de las nuevas funcionalidades que se ofrecen está la cobertura de páginas AMP en el índice, lo que proporciona mayor información.
Cobertura del índice (Index coverage)
Lo que se puede denominar como una evolución muy esperada de lo que actualmente es el [Estado de indexación], este informe del estado de cobertuda del índice ofrece una mayor información sobre como Google ha procesado las páginas o URLs del sitio en su índice en cuatro secciones Errores, Validas con advertencias, Validas y Excluidas.[Errores]
Este nuevo informe es muy bueno y mucho más completo, además de que te permite ver las páginas que son identificadas como errores como ya no es habitual ver, por ejemplo, para los errores 404.
[Validas con advertencias]
También te muestra páginas que han sido indexadas aún cuando un archivo robots.txt las está bloqueando como una "Advertencia", lo que es algo habitual que suceda por muchas razones, por ejemplo, ser rastreada a través de otra URL.
Es de mencionar que cuando en la consola aparece esto como una "Advertencia", la misma no está orientada a que sea un peligro o un problema o que ello vaya a afectar el posicionamiento del sitio, es más en razón de señalar que esta página que no se quiere indexar lo está y para este tipo de casos lo mejor sería establecer un bloqueo directo vía servidor en la respuesta de la cabecera o bien, el atributo noindex dentro de una meta etiqueta robots.
[Validas]
Otro de los puntos a destacar es que ofrece una sección de URLs que han sido enviadas o rastreadas de alguna forma e indexadas y nos ofrece ejemplos de este tipo de URLs, hasta 1000 de ellas, ciertamente en algunos casos podrá ofrecer la totalidad si dicha cantidad no ha sido superada, pero en otros casos solo será una muestra pero ello brinda mucha más información para tener en cuenta.
[Excluidas]
Pero el punto más destacado es este apartado que ofrece información que no teníamos de Google y que es de una enorme ayuda ya que se nos ofrece información de URLs y la razón por la cual han sido excluidas en el índice por diferentes razones o motivos más comunes, como por ejemplo:
Motivo 1: Página alternativa con etiqueta canónica adecuada
Páginas que, por ejemplo, son producto de una búsqueda las cuales generan la misma URL en dónde se realiza esta pero se genera una nueva con los parámetros utilizados en la búsqueda y lo cual genera una URL que sería en si mismo un subproducto o un duplicado, lo que correctamente debería tener el canonical hacia la URL principal o canónica.
Motivo 2: Página con redirección
Como se entiende naturalmente, para aquellas páginas que están redireccionadas hacia otra URL.
Motivo 3: Anomalía en el rastreo
Cuando por alguna razón, Google encuentra una URL y recibe un código de respuesta que impide su, rastreo, por ejemplo, un código de estado 403, ya sea que esto haya sido establecido por nosotros o bien, se deba a un error de configuración o de respuesta en el servidor o CMS.
Motivo 4: La URL enviada no ha sido seleccionada como canónica
Lo que es muy común de ver en casos dónde se tienen, por ejemplo, páginas segmentadas que realmente tratan de los mismo una de otra, es decir, cuando te encuentras algo como esto:
dominio.ext/computador-x
dominio.ext/computador-x/procesador
dominio.ext/computador-x/tarjeta-de-video
dominio.ext/computador-x/memoria-ram
dominio.ext/computador-x/tarjeta-de-red
Dónde lo único que se hace es duplicar contenido de la URL principal pero ofreciendo fragmentos de apartados en las otras y cada una con su respectivo rel="canonical" hacia si misma; esto es, páginas que en realidad debería estar dentro de la misma URL y no aportan un valor agregado pero lo que si hacen es duplicar.
Motivo 5: Errores 404 - No se ha encontrado (404)
Además de aquellas páginas que deban responder con este código de estado, esta información será de gran utilidad para detectar errores de configuración en la respuesta de la cabecera de una URL de páginas que esperamos estén indexándose y se están desindexando del motor de búsqueda por una configuración errónea y por ello, estén respondiendo con un 404
Motivo 6: Google eligió una página canónica diferente a la del usuario
Si crees que el canonical es como tal una directiva mandatoria para Google, es decir, que si lo estableces entonces el buscador deberá "seguirla", aquí es cuando te puedes dar cuenta que no es así, es como tal una etiqueta que Google evaluará en su coherencia y consistencia y Google bien puede determinar aún cuando establezcas que quieres que una página del sitio sea la que Google tenga en cuenta, este puede optar por otra página que considere como la que debería ser la página canónica del sitio.
Esto está relacionado con el ejemplo anterior presentado en el caso de la URL enviada no fue seleccionada como canónica.
Otro caso dónde esto puede suceder es cuando Google encuentra URLs de este tipo:
dominio.ext/computador-x//////
Lo que pueden surgir como un error de configuración o de programación y naturalmente, aún cuando tenga el canonical así misma, Google la ignorará y tendrá en su índice la que verdaderamente debe tener, es decir, una URL como esta:
dominio.ext/computador-x/
Motivo 7: Rastreada: Actualmente sin indexar
En muchos casos Google puede optar por no indexar una URL, entre ellos, páginas irrelevantes o que realmente no tienen trascendencia para aportar valor agregado, para colocar un simple ejemplo, una página tipo formulario de contacto pero también podrían haber otros casos en los que las practicas spam buscando la reiteración, es más que común.
Motivo 8: Página duplicada sin etiqueta canónica
Para aquellas páginas del sitio web que son consideradas por Google como duplicados pero las cuales no cuentan con una etiqueta canónica, por ejemplo, lo que se llega a ver sucede muchas veces en URLs tipo paginaciones o agrupadoras como lo son las categorías, tags, etiquetas, etc, mismas que son utilizadas para crear listados en razón de palabras claves.
Motivo 9: Errores 404 suaves - Soft 404
Esto es para aquellos casos dónde la URL no existe, está vacía, la página que el usuario puede ver se identifica como un error 404 pero en realidad esta responde con un código de estado 200,
Motivo 10: Página duplicada que no es HTML
Por ejemplo, para aquellos que gustan tener páginas que han sido convertidas en archivos PDF y estos no han sido bloqueados en su indexación, es allí cuando estos archivos PDF son identificados como duplicados en el sitio.
Motivo 11: Se ha retirado la página por una reclamación legal
Algo que será más que habitual de ver en muchos sitios de descargas de software ilegal y también de sitios de reproducción y descargas de películas de cine.
Motivo 12: Descubierta: actualmente sin indexar
Para aquellas páginas que Google ha identificado por alguna vía, por ejemplo, un enlace de una red social, pero dicha URL no ha sido rastreada, esto refleja claramente uno de los procesos naturales que Google realiza y por lo cual se les explica a los usuarios en los foros que las herramientas que Google proporciona son solo un apoyo u alternativa más, no son lo que se debe hacer para "mejorar el SEO" del sitio.
Motivo 13: Rastreada: actualmente sin indexar
Al igual que el motivo anterior, el 12, se puede ver como Google refleja la otra parte del proceso natural que sucede de su lado y en este caso luego de ser descubierta procederá a rastrearla pero ello no establece que inmediatamente se indexará o que tendrá que serlo, ello dependerá de muchos factores y por ende, una URL podrá ser rastreada pero no ser indexada o tomar más tiempo para que esto suceda mientras Google evalua ello de su lado, sin importar si esta URL es enviada a través de la opción de [Explorar como Google] o se incluye en una página del sitio o en un sitemap.
¡16 meses de datos acumulados!
Así como se puede ver, pasaremos de ver tan solo 3 meses de datos acumulados como máximo en la actual versión de GSC a 16 meses de datos en la versión Beta que podremos ver seleccionando la opción de [Periodo Completo] y esto es una muy, pero muy buena noticia y muy esperado por muchos de nosotros.Voy a mencionar algunos aspectos de mi experiencia personal por lo cual esto es muy relevante.
Primero, porque muchas veces y por experiencia propia, me encuentro con sitios web que no han vinculado GSC con Google Analytics (GA), luego no hay forma de ver los datos históricos del sitio de la consola de búsqueda.
Ciertamente es conocido que si no se modifica el script de GA, lo que se registrará como visitas no será lo misma información que se ofrecerá en la consola de búsqueda de Google, por lo cual los datos podrán tener o una gran variación o bien, una enorme diferencia según el contexto de cada sitio en particular.
Segundo, porque los datos que se ofrecen en la consola de Google a nivel de Analítica de búsqueda en dicho periodo acumulado permitirán poder realizar diferentes análisis de comportamiento del sitio en el pasado respecto de su impacto en las búsquedas de Google y obtener conclusiones cruzando información entre la información que puedo ver allí sumada a la información que obtengo de cada cliente.
Ahora no solo podré conocer viendo los últimos tres meses de datos acumulados el estado del sitio en Google y como este lo ve en base a lo que en el mismo me encuentro, sus practicas y otros factores que se deben tener en cuenta, también podré realizar un análisis y un estimativo más certero de las razones por las cuales el sitio se ha visto afectado y el tráfico de un sitio ha decrecido sumado al conocimiento acumulado sobre el motor de búsqueda y como este ha venido evolucionando
Ciertamente es relevante para los casos dónde tengo que entrar a analizar el pasado del sitio en su impacto de las búsquedas y no para los casos de los sitios que llevo gestionando desde hace muchos años y en los cuales es como tal algo conocido.
Por supuesto actualmente estoy revisando información de aquellos casos recientes en el tiempo que no pude obtener esa información directamente y por lo cual me tocó extrapolarla entre lo que el propietario del sitio me comenta era el impacto del sitio en las SERPs de Google a lo que actualmente es, y por supuesto se me convierte en una muy buena fuente de información y de referencia poder capturar esa información puntual a la cual antes no tenia acceso pero que ahora puedo utilizar para tener en cuenta más adelante dentro de la estrategia SEO que he establecido para cada uno de los sitios en la recuperación y mejoramiento de estos.
Enviar feedback a Google sobre la versión Beta de GSC
Al momento (principios de febrero de 2018), Google tiene disponible la opción de enviar comentarios acerca de esta con un formulario en su centro de ayuda siguiendo este enlace:Por le momento no contamos con dicha opción en Español, pero si se puede hacer a través del enlace anterior que está en inglés.
Espero que lo anterior te sea de ayuda para conocer mejor las herramientas de Google y lo útiles que son y así mismo obtener algo de información sobre como usar e interpretar la información de GSC, ya que en muchos casos ante las personas que desconocen lo fácil que hace Google esto de su lado, se ven confundidos por cantidad de información que en muchos casos se convierte en desinformación y genera pánico y un temor sinsentido infundado sobre el motor de búsqueda o por el desconocimiento de quien lo hace y que solo sigue aquello que otros dicen o escriben, o bien porque en el sentido comercial les es muy beneficioso
Comentarios
Publicar un comentario