- Home
- Categorie
- Digital Marketing
- Posizionamento Nei Motori di Ricerca
- URL con lettere maiuscole "inventate" dal bot?
-
URL con lettere maiuscole "inventate" dal bot?
Ciao a tutti! Chiedo perché mi sto scontrando con un problema curioso, che non sto riuscendo a capire da cosa sia causato.
In GSC mi sono spuntate una serie di URL del tipo esempio.com/Prova1.html che vengono incasellate sotto la voce "Alternate page with proper canonical tag". Queste URL rispondono sempre 200.
Le URL, infatti, mostrano correttamente il canonical verso la loro versione con la minuscola (esempio.com/prova1.html).
La referring page di queste URL, stando a GSC, è la stessa pagina con URL maiuscola.Il dominio in questione è stato pubblicato il 4 di ottobre, quindi escluderei che queste URL fossero presenti da qualche parte nel sito in una data precedente, ma una scansione con la rana non mi costa nulla.
Ho comunque fatto già una scansione della sezione nuova e confermo non ci siano URL con uppercase. Stesso discorso per un'analisi manuale del DOM e del sorgente di alcune pagine prese a campione.
Non ci sono, tantomeno, link verso pagine con la maiuscola, indagati da Ahrefs.Qualcuno ha qualche idea per un'ulteriore indagine possibile? Grazie mille!!
G 2 Risposte -
@alessandro_dandrea Io sapevo che quando arriva ad una pagina chiaramente numerica, tipo prova=1 allora poi iniziava a fare prova=2, prova=3
Ma questa che mi dici tu non l'avevo mai vista?
@kal?
1 Risposta -
@giorgiotave Eh infatti è un caso che mi pare veramente strano. Quello dei numeri lo sapevo per le paginate.
L'unica roba che mi sta venendo in mente (e non vi dico gli "incoraggiamenti" se così fosse) potrebbe essere un parametro dentro al datalayer di GTM che, de facto, non esiste come URL ma dovrebbe essere interpretato dal solo sistema di analytics.
Non vorrei che, nella sua voracità, gbot avesse fatto il rendering del tutto e si fosse trovato la URL relativa, che ha pensato potesse essere da scansionare.
1 Risposta -
@alessandro_dandrea ha detto in URL con lettere maiuscole "inventate" dal bot?:
L'unica roba che mi sta venendo in mente (e non vi dico gli "incoraggiamenti" se così fosse) potrebbe essere un parametro dentro al datalayer di GTM che, de facto, non esiste come URL ma dovrebbe essere interpretato dal solo sistema di analytics.
Sembra quasi una confessione
Riusciamo a riprodurlo da qualche parte?
1 Risposta -
Domanda: è una pagina molto visitata?
Altra domanda: che dicono le analytics o meglio i log (le analytics spesso sanitizzano e mettono tutto lowercase per ridurre la cardinalità)? Uppercase o lowercase? O entrambe?
Teoria da verificare:
- è una pagina molto visitata
- un certo numero di persone ce l'ha nei preferiti o riceve l'URL con una newsletter etc. e la pagina per qualche motivo è uppercase
- Google la trova e la indicizza tramite la telemetria del browser Chrome (cosa questa pluriconfermata anche se non ufficialmente)
1 Risposta -
@alessandro_dandrea Anche a me è capitato in passato. Per togliermele di mezzo ho fatto dei redirect 301. Non c'erano delle url in rete ma dei testi in pagine spam, probabilmente generati in automatico. Il bot le ha trovate e ha provato a scansirmele.
1 Risposta -
@giorgiotave ha detto in URL con lettere maiuscole "inventate" dal bot?:
Sembra quasi una confessione
LOL =D Lo chiamo ascolto attivo =D
-
@kal Ciao Martino, grazie! No, partiamo da zero zerissimo. Le pagine in questione sono andate live 4 giorni prima rispetto alla comparsa in GSC.
Log volevo guardare ma in realtà ancora non ci ho messo il naso. Analytics uguale anche se so per certo che non applicano un lower per pulire ed unificare il dato alla foce.Google la trova e la indicizza tramite la telemetria del browser Chrome
Comunque ero certo di veder scalare il problema sull'intera architettura in questione, invece da GSC pare essersi fermata a pochissime pagine.Ora, che questo significhi che effettivamente sono solo queste poche non è detto, però è un segnale.
1 Risposta -
@grifter72 ha detto in URL con lettere maiuscole "inventate" dal bot?:
@alessandro_dandrea Anche a me è capitato in passato. Per togliermele di mezzo ho fatto dei redirect 301. Non c'erano delle url in rete ma dei testi in pagine spam, probabilmente generati in automatico. Il bot le ha trovate e ha provato a scansirmele.
Ciao, non sono preoccupatissimo eh, numericamente sono molto poche e comunque c'è un canonical correttamente letto ed ascoltato (una di quelle volte in cui lo fa =D )
Non mi convince molto in realtà il redirect di una URL generata da una pagina spam, però capisco il senso.
Grazie!
-
@alessandro_dandrea ha detto in URL con lettere maiuscole "inventate" dal bot?:
Comunque ero certo di veder scalare il problema sull'intera architettura in questione, invece da GSC pare essersi fermata a pochissime pagine.
Indizio importante che fa pensare a degli errori umani e non ad una bizza del Googlebot.
Ad esempio: le tastiere su mobile spesso capitalizzano automaticamente la prima lettera. Se uno ha scritto quell'URL a manina (ad es. per inserirlo in una newsletter) potrebbe capitare.
La prova del nove ce l'hai analizzando le analytics/log.
EDIT: che per qualche motivo non sia finita a quel modo nei link interni l'hai già escluso, giusto?
1 Risposta -
@kal ha detto in URL con lettere maiuscole "inventate" dal bot?:
Ad esempio: le tastiere su mobile spesso capitalizzano automaticamente la prima lettera. Se uno ha scritto quell'URL a manina (ad es. per inserirlo in una newsletter) potrebbe capitare.
Urka. Vero