<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[Deindicizzare pagine]]></title><description><![CDATA[<p dir="auto">buongiorno, ho un problema con un sito dove è stato installato un plugin per la generazione di pagine automatiche e, non avendolo settato correttamente il plugin ha generato 2 sitemap con all'interno una sacco di url (5000 circa) che Google ha scansionato. Ora ho eliminato il plugin e ripulito il DB togliendo tutto quello che riconduceva a quel plugin. Rimane solo un problema, come faccio a deindicizzare tutte queste pagine che danno 404?</p>
]]></description><link>https://connect.gt/topic/250945/deindicizzare-pagine</link><generator>RSS for Node</generator><lastBuildDate>Sun, 12 Apr 2026 05:19:28 GMT</lastBuildDate><atom:link href="https://connect.gt/topic/250945.rss" rel="self" type="application/rss+xml"/><pubDate>Mon, 27 Nov 2023 11:55:29 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to Deindicizzare pagine on Tue, 28 Nov 2023 10:34:03 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/147291">@thelast</a> ha detto in <a href="/post/1311276">Deindicizzare pagine</a>:</p>
<blockquote>
<p dir="auto">come ripuliamo la search console?</p>
</blockquote>
<p dir="auto">Si ripulisce da sola. Quale sezione vedi sporca?<br />
Potresti usare il Response Code 410 ma lo farei solo in caso di problemi evidenti e non sei in questo caso.</p>
<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/147291">@thelast</a> se ho ben capito, la situazione sembra essere il prosieguo della tua discussione Sito da ripulire meglio 301 o 410?</p>
</blockquote>
<p dir="auto">E' lo stesso problema o sono due situazioni diverse?</p>
<p dir="auto">Grazie</p>
]]></description><link>https://connect.gt/post/1311295</link><guid isPermaLink="true">https://connect.gt/post/1311295</guid><dc:creator><![CDATA[sermatica]]></dc:creator><pubDate>Tue, 28 Nov 2023 10:34:03 GMT</pubDate></item><item><title><![CDATA[Reply to Deindicizzare pagine on Mon, 27 Nov 2023 13:21:55 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/147291">@thelast</a> se ho ben capito, la situazione sembra essere il prosieguo della tua discussione <a href="https://connect.gt/topic/250877/sito-da-ripulire-meglio-301-o-410/">Sito da ripulire meglio 301 o 410?</a><br />
Comunque sia, questa generazione automatica di pagine mi sembra (stesso caso oppure simile) a <em>WordPress + WooCommerce</em>, plugin <em>YITH WooCommerce Ajax Product Filter</em>. Vai a creare tag e attributi, utili per la navigazione (filtri di ricerca dei prodotti), il problema è che se ti dimentichi di mettere un bel noindex a priori su ogni attributo, puoi trovare indicizzata questa "porcheria". Dico porcheria perché è un mare di contenuto duplicato, che confonde il crawler anche per l'indicizzazione, quando invece vorresti poco contenuto e di qualità ovvero vedere indicizzata e posizionata la categoria di prodotto, i vari prodotti, ecc. Non ha senso un'insieme di pagine che in pratica contengono l'insieme delle combinazioni dei filtri (pagina dei risultati selezionando attributo1+attributo2, ecc).</p>
<p dir="auto">Dato che saranno un'infinità di pagine (date dalle varie combinazioni possibili), quello che puoi fare ora è aggiungere un'istruzione al robots.txt, del tipo <code>Disallow: /negozio?filter*</code> (vedi tu la sintassi, secondo l'architettura del tuo sito, come vengono generate queste pagine ovvero da dove si generano i prametri URL dati dai filtri di ricerca, quindi ciò che segue il punto di domanda nell'URL).</p>
<p dir="auto">Tra l'altro in questo preciso momento (che volevo verificare una cosa) Google Search Console sembra avere un errore 500, andiamo bene!</p>
<p dir="auto">Comunque ti consiglio di seguire questa strada.</p>
]]></description><link>https://connect.gt/post/1311278</link><guid isPermaLink="true">https://connect.gt/post/1311278</guid><dc:creator><![CDATA[giulio.marchesi]]></dc:creator><pubDate>Mon, 27 Nov 2023 13:21:55 GMT</pubDate></item><item><title><![CDATA[Reply to Deindicizzare pagine on Mon, 27 Nov 2023 13:13:53 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/110870">@sermatica</a> erano della pagine bianche che dopo aver ripulito il DB sono andate in 404. Le abbiamo eliminate perché non potevamo comunque accederci e mettere mano a quelle pagine. Adesso che abbiamo eliminato tutto, come ripuliamo la search console?</p>
]]></description><link>https://connect.gt/post/1311276</link><guid isPermaLink="true">https://connect.gt/post/1311276</guid><dc:creator><![CDATA[thelast]]></dc:creator><pubDate>Mon, 27 Nov 2023 13:13:53 GMT</pubDate></item><item><title><![CDATA[Reply to Deindicizzare pagine on Mon, 27 Nov 2023 12:18:34 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/147291">@thelast</a></p>
<p dir="auto">Ciao,<br />
le 5000 url circa erano o sono reali? Perchè se erano in 404 come ha fatto Google a indicizzarle?</p>
]]></description><link>https://connect.gt/post/1311273</link><guid isPermaLink="true">https://connect.gt/post/1311273</guid><dc:creator><![CDATA[sermatica]]></dc:creator><pubDate>Mon, 27 Nov 2023 12:18:34 GMT</pubDate></item></channel></rss>