<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[Pagine Duplicate Involontarie: errore di Google]]></title><description><![CDATA[<p dir="auto">Non si sa come, ma il googlebot è riuscito tramite l'ip ad indicizzare gran parte di un sito con il suo indirizzo diretto...</p>
<p dir="auto">Faccio un esempio: il sito si chiama <a href="http://www.pincopalla.com" rel="nofollow ugc">www.pincopalla.com</a>, bene è correttamente indicizzato con molte pagine ecc ecc...</p>
<p dir="auto">Ma allo stesso tempo non si sa come, googlebot è riuscito ad entrare direttamente nell'ip di questo sito con esempio:<br />
**<br />
<a href="http://124.456.45.71/~pincopalla_account/**" rel="nofollow ugc">http://124.456.45.71/~pincopalla_account/**</a></p>
<p dir="auto">ed ha indicizzato centinaia di pagine che sono le stesse del dominio <strong><a href="http://www.pincopalla.com" rel="nofollow ugc">www.pincopalla.com</a></strong>, praticamente ho una lunga serie di pagine duplicate ed ho l'impressione che molte del dominio principale siano in <strong>risultati supplementari per questo motivo</strong>...</p>
<p dir="auto">Ora, nel robots.txt ho inserito il comando <strong>Disallow: /~pincopalla_account/</strong><br />
Logicamente dovrebbe cancellare tutte le pagine nella cartella pincopalla_account eliminando tutti i duplicati...<br />
oppure ho fatto una caxxata?</p>
<p dir="auto">A rigor di logica il dominio principale dovrebbe rimanere intatto, oppure per qualche logica particolare di googlebot mi rimuoverà dall'indice tutto il sito?</p>
<p dir="auto">Non dovrebbe, credo...</p>
<p dir="auto">a voi il giudizio, è la prima volta che mi capita una cosa simile...</p>
]]></description><link>https://connect.gt/topic/32017/pagine-duplicate-involontarie-errore-di-google</link><generator>RSS for Node</generator><lastBuildDate>Sat, 04 Apr 2026 20:31:57 GMT</lastBuildDate><atom:link href="https://connect.gt/topic/32017.rss" rel="self" type="application/rss+xml"/><pubDate>Tue, 03 Apr 2007 11:16:23 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Sat, 07 Apr 2007 08:22:15 GMT]]></title><description><![CDATA[<p dir="auto"><img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f609.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--wink" title=";)" alt="😉" /></p>
]]></description><link>https://connect.gt/post/488520</link><guid isPermaLink="true">https://connect.gt/post/488520</guid><dc:creator><![CDATA[dsom]]></dc:creator><pubDate>Sat, 07 Apr 2007 08:22:15 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Sat, 07 Apr 2007 08:22:05 GMT]]></title><description><![CDATA[<p dir="auto">Grazie <strong>444523</strong> per la tua testimonianza,</p>
<p dir="auto">ho unito il nuovo thread a quello originale per non tenere aperti più topic che parlano della stessa problematica.</p>
<p dir="auto">Ti ho inviato un pm per informarti dello spostamento.</p>
<p dir="auto">.Stuart</p>
]]></description><link>https://connect.gt/post/488510</link><guid isPermaLink="true">https://connect.gt/post/488510</guid><dc:creator><![CDATA[stuart]]></dc:creator><pubDate>Sat, 07 Apr 2007 08:22:05 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Sat, 07 Apr 2007 00:00:42 GMT]]></title><description><![CDATA[<p dir="auto">Riprendendo questa discussione<br />
<a href="http://www.giorgiotave.it/forum/posizionamento-nei-motori-di-ricerca/35235-pagine-duplicate-involontarie-errore-di-google.html" rel="nofollow ugc">http://www.giorgiotave.it/forum/posizionamento-nei-motori-di-ricerca/35235-pagine-duplicate-involontarie-errore-di-google.html</a></p>
<p dir="auto">mi sono fatto coraggio ed ho usato la sezione rimozione url/sito di Google.<br />
Ho creato l'account ri-sottomesso il robots.txt del sito duplicato ip/cartella chiedendo a Google di rimuovere tutta la cartella fantasma dell'ip dove è collegato il dominio...</p>
<p dir="auto">Una cosa impressionante: le pagine duplicate/fantasma erano circa 1500... ed erano lì da quasi 2 mesi... sono sparite in 2 ore! Ho fatto diversi controlli, non ci sono più... in 2 ore tutto cancellato da Google.</p>
<p dir="auto">In 2 ore... e chi si apsettava una velocità stratosferica simile...</p>
<p dir="auto">sono rimasto davvero colpito!<br />
<img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/2b55.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--o" title=":o:" alt="⭕" />o:o</p>
]]></description><link>https://connect.gt/post/488528</link><guid isPermaLink="true">https://connect.gt/post/488528</guid><dc:creator><![CDATA[444523]]></dc:creator><pubDate>Sat, 07 Apr 2007 00:00:42 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Wed, 04 Apr 2007 15:32:43 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/6516">@olanic</a> said:</p>
<blockquote>
<p dir="auto">Scusate se mi intrometto ma se hai questo dubbio (se cancelli il sito dovrai aspettare un bel po prima di rivederlo ho letto da qualche parte almeno 6 mesi) perchè non fai una prova su una dir o su una singola pagina eliminadola, sempre tramite robot ma attraverso <a href="http://services.google.com/urlconsole/controller?cmd=reload&amp;lastcmd=login" rel="nofollow ugc">http://services.google.com/urlconsole/controller?cmd=reload&amp;lastcmd=login</a><br />
il servizio di G stesso?<br />
Questo servizio ti consentirà di vedere (mi pare nelle 24h) il risultato.</p>
</blockquote>
<p dir="auto">ciao,<br />
nicola</p>
<p dir="auto">Grazie Olanic per il tuo intervento...<br />
tieni presente che anche fosse sbagliata la mia idea, Google non ti cancella tutto il sito di colpo...</p>
<p dir="auto">Gli strumenti webmaster nel tuo account di Google ti permettono di vedere già dalle prime scansioni se gli url "regolari" vengono bloccati... e sembrerebbe di no perchè puoi fare anche dei test in anticipo...</p>
<p dir="auto">sicuramente (avendo la stessa paura tua) non farò la rimozione url... per quello eventualmente aspetto che le cose siano chiare al 100%...</p>
]]></description><link>https://connect.gt/post/488527</link><guid isPermaLink="true">https://connect.gt/post/488527</guid><dc:creator><![CDATA[444523]]></dc:creator><pubDate>Wed, 04 Apr 2007 15:32:43 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Wed, 04 Apr 2007 15:28:26 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/4102">@dsom</a> said:</p>
<blockquote>
<p dir="auto">ecco, io ci avevo pensato in realtà, ma mi son detto "se funziona, mi sbaglierò :D"<br />
rimangono i suggerimenti di prima fondamentalmente <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" title=":)" alt="🙂" /></p>
</blockquote>
<p dir="auto">Sì adesso è inserito bene... ce  l'ho fatta!<br />
Il bello è che un utente abituale di linux ci avrebbe messo 30 secondi mentre si mangiava un pezzo di pizza al pomodoro, beveva un po' di cocacola e si guardava un film porno in contemporanea...</p>
<p dir="auto">io ci ho messo 1 ora a capire che il file robots.txt và inserito tramite ssh in var/www/html</p>
<p dir="auto">ora funziona tutto, e anche i vari test tramite l'account di Google mi confermano che il dominio principale e relativi indirizzi sono liberi d'essere scansionati...<br />
mentre ip/cartella_account ora è completamente bloccato impedendo la duplicazione del sito...</p>
<p dir="auto">Vabbe' ho imparato qualcosa... se non ci saranno sorprese nelle prossime scansioni... vedremo. Cmq sembra tutto ok...</p>
]]></description><link>https://connect.gt/post/488526</link><guid isPermaLink="true">https://connect.gt/post/488526</guid><dc:creator><![CDATA[444523]]></dc:creator><pubDate>Wed, 04 Apr 2007 15:28:26 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Wed, 04 Apr 2007 15:05:04 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/6933">@444523</a> said:</p>
<blockquote></blockquote>
<p dir="auto">A rigor di logica il dominio principale dovrebbe rimanere intatto, oppure per qualche logica particolare di googlebot mi rimuoverà dall'indice tutto il sito?</p>
<p dir="auto">Scusate se mi intrometto ma se hai questo dubbio (se cancelli il sito dovrai aspettare un bel po prima di rivederlo ho letto da qualche parte almeno 6 mesi) perchè non fai una prova su una dir o su una singola pagina eliminadola, sempre tramite robot ma attraverso <a href="http://services.google.com/urlconsole/controller?cmd=reload&amp;lastcmd=login" rel="nofollow ugc">http://services.google.com/urlconsole/controller?cmd=reload&amp;lastcmd=login</a><br />
il servizio di G stesso?<br />
Questo servizio ti consentirà di vedere (mi pare nelle 24h) il risultato.</p>
<p dir="auto">ciao,<br />
nicola</p>
]]></description><link>https://connect.gt/post/488525</link><guid isPermaLink="true">https://connect.gt/post/488525</guid><dc:creator><![CDATA[olanic]]></dc:creator><pubDate>Wed, 04 Apr 2007 15:05:04 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Wed, 04 Apr 2007 15:04:41 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/6933">@444523</a> said:</p>
<blockquote>
<p dir="auto">Eh, dovrebbe funzionare, ma ho trovato un problema...<br />
per funzionare sull'ip il robots.txt deve'essere a questo livello<br />
ip/robots.txt<br />
e non ip/nome_account/robots.txt</p>
</blockquote>
<p dir="auto">ecco, io ci avevo pensato in realtà, ma mi son detto "se funziona, mi sbaglierò :D"<br />
rimangono i suggerimenti di prima fondamentalmente <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" title=":)" alt="🙂" /></p>
]]></description><link>https://connect.gt/post/488519</link><guid isPermaLink="true">https://connect.gt/post/488519</guid><dc:creator><![CDATA[dsom]]></dc:creator><pubDate>Wed, 04 Apr 2007 15:04:41 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Wed, 04 Apr 2007 14:29:49 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/4102">@dsom</a> said:</p>
<blockquote>
<p dir="auto">ho capito,<br />
quindi tu non hai messo in pincopalla un "Disallow : *" ma un "disallow /nomecartella/"</p>
</blockquote>
<p dir="auto">quindi se ci entra dal dominio, non può trovare la cartella (che è il dominio stesso), se ci entra dall'ip viene invece trovata e viene bloccata.</p>
<p dir="auto">ok cosi funge <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" title=":)" alt="🙂" /></p>
<p dir="auto">EDIT:</p>
<p dir="auto">curiosità : hai capito come ha preso l'ip ha controllato eventuali interfacce webmail o admin linkate via ip?</p>
<p dir="auto">Eh, dovrebbe funzionare, ma ho trovato un problema...<br />
per funzionare sull'ip il robots.txt deve'essere a questo livello<br />
ip/robots.txt<br />
e non ip/nome_account/robots.txt</p>
<p dir="auto">Ho cercato in Internet e alcuni server hanno proprio ip/robots.txt che è perfettamente visibile dall'esterno... io non riesco a renderlo visibile all'esterno, forse sbaglio posto...</p>
<p dir="auto">azz... vediamo se qualcuno mi aiuta sul loro forum... a meno che qualche anima buona non sia già esperta qui...<br />
:D:D:D</p>
<p dir="auto">Per l'ip trovato da Google dev'essere un'immagine che era collegata all'ip e non al dominio, quando ho fatto il trasferimento del sito l'ho ri-costruito tramite ip e poi aluni link ho dimenticato di modificarli... non capisco però come dall'immagine linkata all'ip abbia poi preso qualche migliaia di pagine...</p>
]]></description><link>https://connect.gt/post/488517</link><guid isPermaLink="true">https://connect.gt/post/488517</guid><dc:creator><![CDATA[444523]]></dc:creator><pubDate>Wed, 04 Apr 2007 14:29:49 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Wed, 04 Apr 2007 13:07:57 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/6933">@444523</a> said:</p>
<blockquote>
<p dir="auto">Sì, esatto, più o meno così...<br />
nel robots.txt, oltre ad altri comandi di non seguire file .php (il sito è interamente in html con rebuild giornalieri) ho immesso il comando di non indicizzare esattamente la cartella <a href="http://124.456.45.71/%7Epincopalla_account/robots.txt" rel="nofollow ugc">~pincopalla_account</a></p>
</blockquote>
<p dir="auto">Facendo una verifica sulle cartelle, direttamente dal domino, es: <a href="http://www.miodomino.com/cibi_avariati" rel="nofollow ugc">www.miodomino.com/cibi_avariati</a> è perfettamente raggiungibile. così come tutte le cartelle seguendo l'url che incomincio con il dominio...</p>
<p dir="auto">la cartella <a href="http://124.456.45.71/%7Epincopalla_account/robots.txt" rel="nofollow ugc">~pincopalla_account</a> che sotto di sè duplica tutte le pagine è invece bloccata sempre dal test che si può fare nel mio account di Google...</p>
<p dir="auto">Oh, possiamo sempre scommetterci un caffè... tanto non baro, se mi blocca il sito si sentiranno le imprecazioni fin sul forum... ma non credo che accadrà...<br />
:D:D:D</p>
<p dir="auto">D'altronde posso verificare subito se il sito è bloccato, sempre nell'account webmaster c'è la sezione delle pagine scansionate mensilmente, se vedo che si blocca cancello subito tutto...</p>
<p dir="auto">**edit---------------------<br />
che poi sono proprio un morto di sonno, nell'account webmaster c'è proprio una sezione che ti segnala eventuali pagine bloccate dal robots.txt, basta dare un'occhiata lì e si capisce subito dalle prime scansioni cosa succede...</p>
<p dir="auto">un giorno o l'altro con questa mia distrazione finirò sotto una macchina...<br />
**</p>
<p dir="auto">ho capito,<br />
quindi tu non hai messo in pincopalla un "Disallow : *" ma un "disallow /nomecartella/"</p>
<p dir="auto">quindi se ci entra dal dominio, non può trovare la cartella (che è il dominio stesso), se ci entra dall'ip viene invece trovata e viene bloccata.</p>
<p dir="auto">ok cosi funge <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" title=":)" alt="🙂" /></p>
<p dir="auto">EDIT:</p>
<p dir="auto">curiosità : hai capito come ha preso l'ip ha controllato eventuali interfacce webmail o admin linkate via ip?</p>
]]></description><link>https://connect.gt/post/488518</link><guid isPermaLink="true">https://connect.gt/post/488518</guid><dc:creator><![CDATA[dsom]]></dc:creator><pubDate>Wed, 04 Apr 2007 13:07:57 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Wed, 04 Apr 2007 10:57:56 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/4102">@dsom</a> said:</p>
<blockquote>
<p dir="auto">allora, vediamo se capisco : tu hai messo un robots.txt (con scritto cosa?) in</p>
</blockquote>
<p dir="auto">/user/pincopalla_account/public_html/ o roba simile immagino</p>
<p dir="auto">qusto è quindi raggiungibile da</p>
<p dir="auto"><a href="http://124.456.45.71/%7Epincopalla_account/robots.txt" rel="nofollow ugc">http://124.456.45.71/~pincopalla_account/robots.txt</a><br />
<a href="http://pincopalla.com/robots.txt" rel="nofollow ugc">http://pincopalla.com/robots.txt</a></p>
<p dir="auto">ora, non so cosa ci hai scritto dentro, ma per me se è cosi' si dovrebbe bloccare tutto <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" title=":)" alt="🙂" /></p>
<p dir="auto">Sì, esatto, più o meno così...<br />
nel robots.txt, oltre ad altri comandi di non seguire file .php (il sito è interamente in html con rebuild giornalieri) ho immesso il comando di non indicizzare esattamente la cartella <a href="http://124.456.45.71/%7Epincopalla_account/robots.txt" rel="nofollow ugc">~pincopalla_account</a></p>
<p dir="auto">Facendo una verifica sulle cartelle, direttamente dal domino, es: <a href="http://www.miodomino.com/cibi_avariati" rel="nofollow ugc">www.miodomino.com/cibi_avariati</a> è perfettamente raggiungibile. così come tutte le cartelle seguendo l'url che incomincio con il dominio...</p>
<p dir="auto">la cartella <a href="http://124.456.45.71/%7Epincopalla_account/robots.txt" rel="nofollow ugc">~pincopalla_account</a> che sotto di sè duplica tutte le pagine è invece bloccata sempre dal test che si può fare nel mio account di Google...</p>
<p dir="auto">Oh, possiamo sempre scommetterci un caffè... tanto non baro, se mi blocca il sito si sentiranno le imprecazioni fin sul forum... ma non credo che accadrà...<br />
:D:D:D</p>
<p dir="auto">D'altronde posso verificare subito se il sito è bloccato, sempre nell'account webmaster c'è la sezione delle pagine scansionate mensilmente, se vedo che si blocca cancello subito tutto...</p>
<p dir="auto">**edit---------------------<br />
che poi sono proprio un morto di sonno, nell'account webmaster c'è proprio una sezione che ti segnala eventuali pagine bloccate dal robots.txt, basta dare un'occhiata lì e si capisce subito dalle prime scansioni cosa succede...</p>
<p dir="auto">un giorno o l'altro con questa mia distrazione finirò sotto una macchina...<br />
**</p>
]]></description><link>https://connect.gt/post/488524</link><guid isPermaLink="true">https://connect.gt/post/488524</guid><dc:creator><![CDATA[444523]]></dc:creator><pubDate>Wed, 04 Apr 2007 10:57:56 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Wed, 04 Apr 2007 09:13:54 GMT]]></title><description><![CDATA[<p dir="auto">allora, vediamo se capisco : tu hai messo un robots.txt (con scritto cosa?) in</p>
<p dir="auto">/user/pincopalla_account/public_html/ o roba simile immagino</p>
<p dir="auto">qusto è quindi raggiungibile da</p>
<p dir="auto"><a href="http://124.456.45.71/~pincopalla_account/robots.txt" rel="nofollow ugc">http://124.456.45.71/~pincopalla_account/robots.txt</a><br />
<a href="http://pincopalla.com/robots.txt" rel="nofollow ugc">http://pincopalla.com/robots.txt</a></p>
<p dir="auto">ora, non so cosa ci hai scritto dentro, ma per me se è cosi' si dovrebbe bloccare tutto <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" title=":)" alt="🙂" /></p>
<p dir="auto">per questo ti dicevo di fare rewrite.</p>
<p dir="auto">PS : non farei la rimozione dell'url, ti davo solo la tempistica per quella operazione.</p>
]]></description><link>https://connect.gt/post/488513</link><guid isPermaLink="true">https://connect.gt/post/488513</guid><dc:creator><![CDATA[dsom]]></dc:creator><pubDate>Wed, 04 Apr 2007 09:13:54 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Wed, 04 Apr 2007 08:50:13 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/4102">@dsom</a> said:</p>
<blockquote>
<p dir="auto">scusa ma se è raggiungibile da li non lo becca pure google...?</p>
</blockquote>
<p dir="auto">Scusa... sono un po' tardo nel capire, non ho compreso la domanda.</p>
<p dir="auto">Prima il robots.txt non c'era, ora, inserito nella root del sito è raggiungibile sia dal dominio/robots.txt che ovviamente Ip/nome_account/robots.txt...</p>
<p dir="auto">Sì certo che lo raggiunge, basta inserirlo nella root...</p>
<p dir="auto">Nonostante il test mi dia raggiunginile il sito con l'indirizzo ufficiale e relative cartelle ho un po' paura di usare il metodo della "rimozione url"... preferisco attendere e vedere che succede...</p>
]]></description><link>https://connect.gt/post/488523</link><guid isPermaLink="true">https://connect.gt/post/488523</guid><dc:creator><![CDATA[444523]]></dc:creator><pubDate>Wed, 04 Apr 2007 08:50:13 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Tue, 03 Apr 2007 23:36:19 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/6933">@444523</a> said:</p>
<blockquote></blockquote>
<p dir="auto">dunque il robots.txt è stato ovviamente inserito nella root del sito ed è <strong>raggiungibile sia da <a href="http://domino.com/robots.txt" rel="nofollow ugc">domino.com/robots.txt</a></strong> che a quel punto anche da<br />
che da ip/ <a href="http://124.456.45.71/%7Epincopalla_account/" rel="nofollow ugc">~pincopalla_account/</a>ù</p>
<p dir="auto">scusa ma se è raggiungibile da li non lo becca pure google...?</p>
<p dir="auto">cmq la tempistica varia, per la rimozione di un dominio intero può impiegare anche mesi, questo tramite segnalazione di rimozione dall'indice a google.</p>
<p dir="auto">con il robots però credo sia molto più breve, tipo recentemente a far spiderizzare una pagina precedentemente bloccata con un nofollow noindex ci ha messo 2 settimane, non so quante a bloccare un intero sito.</p>
]]></description><link>https://connect.gt/post/488512</link><guid isPermaLink="true">https://connect.gt/post/488512</guid><dc:creator><![CDATA[dsom]]></dc:creator><pubDate>Tue, 03 Apr 2007 23:36:19 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Tue, 03 Apr 2007 22:54:06 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/4102">@dsom</a> said:</p>
<blockquote>
<p dir="auto">se fai così te li blocca entrambi.</p>
</blockquote>
<p dir="auto">per prima cosa devi trovare i link che ha fatto andare google su quell'ip direttamente.<br />
io scommetterei su un menu di admin o una webmail poi i link relativi hanno fatto il resto...</p>
<p dir="auto">per il resto riscriverei con dei 301 tutte le richieste a ip/pagina -&gt; dominio/pagina.</p>
<p dir="auto">dovresti poter essere capace di farlo... credo <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" title=":)" alt="🙂" /></p>
<p dir="auto">Avevo questo dubbio... ma ho verificato con il test inserito negli strumenti di google webmaster e in effetti mi blocca solo quella cartella che in realtà non esiste come percorso ufficiale nel dominio...<br />
tutte le altre cartelle, che sono i veri link inseriti in Google, quelli ufficiali, insomma, il test me li dà come liberi d'essere scansionati...</p>
<p dir="auto">Almeno il loro test robots.txt mi dà questo risultato...</p>
<p dir="auto">Quanto tempo occorre prima che si verifichino i primi cambiamenti nelle serp? Immagino almeno qualche mese... qualcuno ha esperienza?</p>
]]></description><link>https://connect.gt/post/488522</link><guid isPermaLink="true">https://connect.gt/post/488522</guid><dc:creator><![CDATA[444523]]></dc:creator><pubDate>Tue, 03 Apr 2007 22:54:06 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Tue, 03 Apr 2007 22:03:53 GMT]]></title><description><![CDATA[<p dir="auto">se fai così te li blocca entrambi.</p>
<p dir="auto">per prima cosa devi trovare i link che ha fatto andare google su quell'ip direttamente.<br />
io scommetterei su un menu di admin o una webmail poi i link relativi hanno fatto il resto...</p>
<p dir="auto">per il resto riscriverei con dei 301 tutte le richieste a ip/pagina -&gt; dominio/pagina.</p>
<p dir="auto">dovresti poter essere capace di farlo... credo <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" title=":)" alt="🙂" /></p>
]]></description><link>https://connect.gt/post/488511</link><guid isPermaLink="true">https://connect.gt/post/488511</guid><dc:creator><![CDATA[dsom]]></dc:creator><pubDate>Tue, 03 Apr 2007 22:03:53 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Tue, 03 Apr 2007 17:27:37 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/56">@Giorgiotave</a> said:</p>
<blockquote>
<p dir="auto">Ciao 444523,</p>
</blockquote>
<p dir="auto">ma il robots.txt dove lo hai inserito?</p>
<p dir="auto">Mi aspettavo questa domanda... infatti il dubbio per qualche secondo era venuto anche a me...</p>
<p dir="auto">dunque il robots.txt è stato ovviamente inserito nella root del sito ed è raggiungibile sia da <a href="http://domino.com/robots.txt" rel="nofollow ugc">domino.com/robots.txt</a> che a quel punto anche da<br />
che da ip/ <a href="http://124.456.45.71/%7Epincopalla_account/" rel="nofollow ugc">~pincopalla_account/</a></p>
<p dir="auto">In pratica sarebbe anche nella root dell'account con ip, appena googlebot lo legge dovrebbe non indicizzare più la cartella <a href="http://124.456.45.71/%7Epincopalla_account/" rel="nofollow ugc">~pincopalla_account/</a></p>
<p dir="auto">Hai qualche dubbio in merito? Vi farò da cavia, probabilmente è qualcosa che capita davvero di rado... visto che nessuno tranne Giorgio ha risposto...</p>
]]></description><link>https://connect.gt/post/488521</link><guid isPermaLink="true">https://connect.gt/post/488521</guid><dc:creator><![CDATA[444523]]></dc:creator><pubDate>Tue, 03 Apr 2007 17:27:37 GMT</pubDate></item><item><title><![CDATA[Reply to Pagine Duplicate Involontarie: errore di Google on Tue, 03 Apr 2007 15:24:42 GMT]]></title><description><![CDATA[<p dir="auto">Ciao 444523,</p>
<p dir="auto">ma il robots.txt dove lo hai inserito?</p>
]]></description><link>https://connect.gt/post/488509</link><guid isPermaLink="true">https://connect.gt/post/488509</guid><dc:creator><![CDATA[giorgiotave]]></dc:creator><pubDate>Tue, 03 Apr 2007 15:24:42 GMT</pubDate></item></channel></rss>