<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[[ Duplicate Content Checker] Seo software per ricerca duplicati INTERNI]]></title><description><![CDATA[<p dir="auto">Ciao a tutti!</p>
<p dir="auto">ero alle prese con un problema di contenuti doppi o MOLTO SIMILI all'interno di un sito abbastanza grande (5.000 pagine)</p>
<p dir="auto">Si tratta di un catalogo dove tanti prodotti sono stati messi in più sezioni e categorie, tutti con la stessa descrizione MA con urls, titles, meta e menu della pagina diversi...</p>
<p dir="auto">Quindi non si tratta di duplicati perfetti (più facili da beccare con qualche spider) MA di PAGINE SIMILI.</p>
<p dir="auto">Mi piacerebbe un soft che confrontasse tutte le pag interne di un sito e mi dicesse quante sono simili tra loro, indicando anche la % di somiglianza (e che analizzi solo il testo visibile, chiaramente, non i tags html).</p>
<p dir="auto">Solo così potrei velocemente identificare i duplicati parziali e sistemarli, se no è un lavoro parecchio impegnativo da fare a mano...</p>
<p dir="auto">Esiste un software o tool seo che faccia questo lavoro per me?<br />
Oppure è una specie di "sogno proibito" ? <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" title=":)" alt="🙂" /></p>
<p dir="auto">Vi prego, aiutatemi, ieri ho perso 3 ore a cercare qualcosa ed ho trovato solo 1 soft che "dice" di fare questo, ma niente demo... e non voglio buttare via $400 solo per provare...</p>
<p dir="auto">Se conoscete qualcosa di utile ditemelo, grazie!!&lt;br /&gt;&lt;b&gt;Tipo&lt;/b&gt;: &lt;br /&gt; Duplicate Content Checker&lt;br /&gt;</p>
]]></description><link>https://connect.gt/topic/165191/duplicate-content-checker-seo-software-per-ricerca-duplicati-interni</link><generator>RSS for Node</generator><lastBuildDate>Fri, 13 Mar 2026 20:20:52 GMT</lastBuildDate><atom:link href="https://connect.gt/topic/165191.rss" rel="self" type="application/rss+xml"/><pubDate>Fri, 27 Jan 2012 11:43:31 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to [ Duplicate Content Checker] Seo software per ricerca duplicati INTERNI on Thu, 13 Dec 2012 13:35:53 GMT]]></title><description><![CDATA[<p dir="auto">Ciao ACweb <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/customizations/54a3bffb-5e4a-4eb8-81dc-99b2072e5d05-175.gif?v=5l94qfpgdvn" class="not-responsive emoji emoji-customizations emoji--ciauz" title=":ciauz:" alt=":ciauz:" /> riprendo in mano questo thread : io ho un problema analogo al tuo, devo controllare migliaia di pagine web dello stesso dominio che sono duplicate o molto simili , per caso hai trovato la soluzione ? hai creato lo script e funziona?</p>
<p dir="auto">Grazie a chi altri avessero la soluzione..penso sia interessante la questgione anche a molte persone: i cms , blog ecc genearno molti contenuti duplicati...</p>
<p dir="auto"><img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/customizations/54a3bffb-5e4a-4eb8-81dc-99b2072e5d05-175.gif?v=5l94qfpgdvn" class="not-responsive emoji emoji-customizations emoji--ciauz" title=":ciauz:" alt=":ciauz:" /></p>
]]></description><link>https://connect.gt/post/1050711</link><guid isPermaLink="true">https://connect.gt/post/1050711</guid><dc:creator><![CDATA[marconovita]]></dc:creator><pubDate>Thu, 13 Dec 2012 13:35:53 GMT</pubDate></item><item><title><![CDATA[Reply to [ Duplicate Content Checker] Seo software per ricerca duplicati INTERNI on Wed, 01 Feb 2012 11:22:42 GMT]]></title><description><![CDATA[<p dir="auto">aaaaa, allora seomoz lo fa? o lo faceva?<br />
ma anche con grandi numeri?<br />
ho trovato un servizio online dove puoi incollare un tot di urls per la comparazione... ma ha dei limiti, ovviamente.<br />
Poi non so che procedura applichino per fare la comparazione, per esempio noi abbiamo sviluppato un piccolo algoritmo che estrae solo il testo visibile, senza prendere in considerazione la struttura html.</p>
<p dir="auto">Inoltre io voglio vedere nel report solo gli urls duplicati o simili, quelli "univoci" non mi interessano, stanno bene così.</p>
<p dir="auto">Hai qualche idea per migliorare o aggiungere qualcosa?<br />
accetto ispirazione <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" title=":)" alt="🙂" /></p>
<p dir="auto">se la cosa funziona, volevo farne una v2 che si interfacci a gtranslate per "sgamare" le traduzioni automatiche buttate là solo per fare pagine in più. Ma questo richiederebbe ancora più tempo quindi un codice ancora più veloce e scattante... step by step, vediamo.</p>
<p dir="auto">Se vuoi ti posto uno screen del report finale (in html)</p>
]]></description><link>https://connect.gt/post/1050710</link><guid isPermaLink="true">https://connect.gt/post/1050710</guid><dc:creator><![CDATA[acweb]]></dc:creator><pubDate>Wed, 01 Feb 2012 11:22:42 GMT</pubDate></item><item><title><![CDATA[Reply to [ Duplicate Content Checker] Seo software per ricerca duplicati INTERNI on Wed, 01 Feb 2012 09:57:48 GMT]]></title><description><![CDATA[<p dir="auto">No non sono riuscito ha trovare nulla, prima utilizzato un servizio di SeoMoz che è ottimo fà esattamente quello che dici tu <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f609.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--wink" title=";)" alt="😉" /></p>
]]></description><link>https://connect.gt/post/1050703</link><guid isPermaLink="true">https://connect.gt/post/1050703</guid><dc:creator><![CDATA[ale90]]></dc:creator><pubDate>Wed, 01 Feb 2012 09:57:48 GMT</pubDate></item><item><title><![CDATA[Reply to [ Duplicate Content Checker] Seo software per ricerca duplicati INTERNI on Wed, 01 Feb 2012 07:03:36 GMT]]></title><description><![CDATA[<p dir="auto">Ciao Ale, e non hai mai trovato qualcosa di simile?</p>
<p dir="auto">Io sto scrivendo anche in seo forum internazionali (digitalpoint e altri) ma nessuna risposta fin'ora....</p>
<p dir="auto">Quindi ieri il nostro programmatore in house ha completato la prima beta del software, funziona, usa uno dei più famosi algoritmi di comparazione testi (levehnstain o tanimoto, non ricordo alla fine quale dei due ha usato) e raggruppa le pagine simili, con tanto di % di similitudine (in base al primo url simile rilevato).</p>
<p dir="auto">SOLO che ha grosso problema.... E' LENTOOOOOO...<br />
finchè l'ho provato su 10 url, perfetto:  in pochi minuti li ha scaricati e comparati.</p>
<p dir="auto">Anche con 100 urls non male, 7-8 minuti di attesa.</p>
<p dir="auto">Ma, quando gli ho incollato 1.000 urls..... mi è andato in timeout e poi in crash grazie al timeout... sigh  <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f61e.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--disappointed" title=":(" alt="😞" /></p>
<p dir="auto">Oggi il nostro programmatore spingerà di più sul multi thread, vediamo se riesce ad accelelare le cose!<br />
Io ci spero tanto... devo analizzare un sito con 5.000 urls, non è uno scherzetto...</p>
]]></description><link>https://connect.gt/post/1050709</link><guid isPermaLink="true">https://connect.gt/post/1050709</guid><dc:creator><![CDATA[acweb]]></dc:creator><pubDate>Wed, 01 Feb 2012 07:03:36 GMT</pubDate></item><item><title><![CDATA[Reply to [ Duplicate Content Checker] Seo software per ricerca duplicati INTERNI on Tue, 31 Jan 2012 23:47:33 GMT]]></title><description><![CDATA[<p dir="auto">Ricerco anche io qualcosa del genere <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" title=":)" alt="🙂" /></p>
]]></description><link>https://connect.gt/post/1050702</link><guid isPermaLink="true">https://connect.gt/post/1050702</guid><dc:creator><![CDATA[ale90]]></dc:creator><pubDate>Tue, 31 Jan 2012 23:47:33 GMT</pubDate></item><item><title><![CDATA[Reply to [ Duplicate Content Checker] Seo software per ricerca duplicati INTERNI on Tue, 31 Jan 2012 08:27:26 GMT]]></title><description><![CDATA[<p dir="auto">Nessuno ha una risposta???</p>
<p dir="auto">Aiaiaiaiaia... sto cercando e chiedendo in giro in forums seo internazionali ma niente, per il momento...</p>
<p dir="auto">Quindi ho deciso di sviluppare un piccolo tool per conto mio! <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=5l94qfpgdvn" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" title=":)" alt="🙂" /></p>
]]></description><link>https://connect.gt/post/1050708</link><guid isPermaLink="true">https://connect.gt/post/1050708</guid><dc:creator><![CDATA[acweb]]></dc:creator><pubDate>Tue, 31 Jan 2012 08:27:26 GMT</pubDate></item></channel></rss>