Navigazione

    Privacy - Termini e condizioni
    © 2020 Search On Media Group S.r.l.
    • Registrati
    • Accedi
    • CATEGORIES
    • Discussioni
    • Non letti
    • Recenti
    • Hashtags
    • Popolare
    • Utenti
    • Stream
    • Interest
    • Categories
    1. Home
    2. Categorie
    3. La Community Connect.gt
    4. News Ufficiali da Connect.gt
    5. È possibile tramite robots.txt cancellare una pagina dall'indice?
    Questa discussione è stata cancellata. Solo gli utenti con diritti di gestione possono vederla.
    • S
      shark User • 16 feb 2009, 13:29 ultima modifica di

      È possibile tramite robots.txt cancellare una pagina dall'indice?

      Ciao a tutti,
      È possibile farlo? so che esiste un tool di google per segnalare la singola pagina da cancellare...ma ne ho molte da cancellare....ed oltretutto questo lavoro lo devo fare su più siti...
      Posso mettere tanti Disallow nel robots.txt in modo da indicare le varie pagine(esempio: nomesito.it/pagina.php?id=1) da cancellare?

      Grazie a tutti

      0 Miglior Risposta Ringrazia Cita Rispondi

        1 Risposta Ultima Risposta
        Caricamento altri post
        Rispondi
        • Topic risposta
        Effettua l'accesso per rispondere
        • Da Vecchi a Nuovi
        • Da Nuovi a Vecchi
        • Più Voti
         

      • pacoweb
        pacoweb Moderatore • 16 feb 2009, 17:08 ultima modifica di

        Ciao Shark,

        un metodo veloce per eliminare la pagine dall'indice di Google è quello di registrare un account in Webmaster Tools di Google.

        Dopo di che una volta verificato il sito (con un semplice meta tag da inserire nella home page), tra gli strumenti a disposizione vi è anche quello che permette la rimozione delle pagine dagli indici.

        Per esperienza, in tre, quattro giorni (a seconda del numero delle pagine) ti eliminano il tutto.

        Ovviamente devi anche fare oltre a questa operazione, un lavoro sul file robots.txt oppure inserire un meta tag no index nelle pagine.

        Forse ci metti un pò a segnalare tutte le url con lo strumento di rimozione di google, ma il risultato è pressochè assicurato in poco tempo.

        :ciauz:

        0 Miglior Risposta Ringrazia Cita Rispondi

          1 Risposta Ultima Risposta
        • E
          emmezeta User • 16 feb 2009, 17:26 ultima modifica di

          Se non sbaglio a Google si può richiedere di rimuovere pagine (attraverso il tool) solo se non esistono più (404), se la pagina c'è e non la vuoi più nell'indice forse robots è l'unica soluzione.

          0 Miglior Risposta Ringrazia Cita Rispondi

            1 Risposta Ultima Risposta
          • pacoweb
            pacoweb Moderatore • 16 feb 2009, 17:52 ultima modifica di

            Ciao emmezeta,

            le pagine non devono sempre essere necessariamente rimosse (e restituire quindi il codice di stato http 404) .

            L'importante è che venga impedito ai crawler di accedere ai contenuti e ciò si può fare agendo sul file robots.txt o con il meta no index.

            Ovviamente puoi anche lavorare solo sul file robots.txt e basta.

            La differenza sta nel fatto che se segnali le url in Strumenti per Webmaster di Google, la rimozione sarà immediata (max 5 giorni), mentre non segnalandola, devi aspettare la prossima scansione di Google per la rimozione.

            0 Miglior Risposta Ringrazia Cita Rispondi

              1 Risposta Ultima Risposta
            • S
              shark User • 16 feb 2009, 22:09 ultima modifica di

              Grazie per le informazioni, si come accennato conosco il tool di google per la segnalazione degli url da cancellare...

              Comunque mi confermate che se una pagina è nel robots.txt (Disallow) google è "obbligato" a toglierla?

              0 Miglior Risposta Ringrazia Cita Rispondi

                1 Risposta Ultima Risposta
              • S
                seo.italy User Attivo • 17 feb 2009, 08:01 ultima modifica di

                No, non "disallow" ma "noindex"

                Per confermare inoltre quello che dice pacoweb (soprattutto l'ultimo paragrafo):
                w w w .google.com/support/webmasters/bin/answer.py?answer=93710

                Ovviamente non so le tue esigenze specifiche, ma per non perdere l'eventuale link juice che la pagina che vuoi rimuovere ha acquisito potresti fare un redirect 301 ad un altra pagina...

                0 Miglior Risposta Ringrazia Cita Rispondi

                  1 Risposta Ultima Risposta
                • S
                  shark User • 17 feb 2009, 08:49 ultima modifica di

                  Eh hai ragione ma ho circa 150 siti su cui rimuovere circa 50-60 pagine (con parametri) mi viene da piangere solo al pensiero di segnalare ogni singolo URL da rimuovere.... non c'è modo più veloce o meno "indolore" ?

                  Grazie mille!!

                  0 Miglior Risposta Ringrazia Cita Rispondi

                    1 Risposta Ultima Risposta
                  • S
                    seo.italy User Attivo • 17 feb 2009, 08:53 ultima modifica di
                    • file robots.txt usando "noindex"
                    • mod_rewrite 301 dalle pagine che vuoi cancellare alle pagine "nuove" (eventualmente l'homepage)

                    Ciao!

                    0 Miglior Risposta Ringrazia Cita Rispondi

                      1 Risposta Ultima Risposta
                    • S
                      shark User • 17 feb 2009, 08:59 ultima modifica di

                      Attualmente c'è già il 301 nelle pagine che voglio rimuovere ma google ci stà mettendo un casino di tempo per toglierle...quindi devo abbinare il 301 a questa modifica nel robots.txt

                      noindex: pagina.php?id=1
                      noindex: pagina.php?id=2
                      noindex: pagina.php?id=3

                      ??
                      È corretta la sintassi?

                      Grazie mille!!!

                      0 Miglior Risposta Ringrazia Cita Rispondi

                        1 Risposta Ultima Risposta
                      • S
                        shark User • 17 feb 2009, 09:00 ultima modifica di

                        Ho letto il protocollo e noto che c'è solo Disallow: non esiste Noindex: nel protocollo del file....sbaglio?

                        0 Miglior Risposta Ringrazia Cita Rispondi

                          1 Risposta Ultima Risposta
                        • S
                          seo.italy User Attivo • 17 feb 2009, 09:16 ultima modifica di

                          Effettivamente a quanto pare "noindex" e "nofollow" sono standard che si riferiscono al META tag "robots" - ma a quanto pare Google stesso lo usa anche nel file robots.txt:
                          sebastians-pamphlets . com/about-noindex-crawler-directives-in-robots-txt/

                          Quindi penso che lo possa usare anche tu con la sintassi che hai detto.

                          In ultima istanza, comunque, non è facile togliere delle pagine dall'indice di Google (sebbene mi sembra strano che con un 301 non vengano immediatamente sostituite con quelle nuove...)

                          0 Miglior Risposta Ringrazia Cita Rispondi

                            1 Risposta Ultima Risposta
                          • S
                            shark User • 17 feb 2009, 09:47 ultima modifica di

                            No allora vengono levate le pagine....solo che per certe pagine google non ci accede da novembre °_° appunto per questo non ha ancora trovato il 301.

                            Per un sito ho provato il tool di rimozione...vediamo se funziona 😄

                            0 Miglior Risposta Ringrazia Cita Rispondi

                              1 Risposta Ultima Risposta
                            • E
                              emmezeta User • 17 feb 2009, 14:53 ultima modifica di

                              Scusa paco, sono un neonato in confronto a voi in questo campo, ma siccome avevo rimosso alcune pagine giorni fa e il tool recitava così:

                              "Per farlo, accertati che ogni pagina restituisca un codice di stato HTTP 404 o 410 oppure utilizza un file robots.txt o un metatag noindex per impedire ai crawler di accedere ai contenuti"

                              ...ho cercato di dare il mio contributo al forum ma come giustamente dici tu non è necessario il 404, sorry!

                              0 Miglior Risposta Ringrazia Cita Rispondi

                                1 Risposta Ultima Risposta
                              • pacoweb
                                pacoweb Moderatore • 17 feb 2009, 15:06 ultima modifica di

                                Ciao emmezeta :),

                                non ti devo assolutamente scusare... ;).

                                Anzi, continua a dare sempre il tuo contributo sul forum! Qui siamo tutti per imparare e migliorarci, dandoci suggerimenti e consigli a vicenda.

                                :ciauz:

                                0 Miglior Risposta Ringrazia Cita Rispondi

                                  1 Risposta Ultima Risposta
                                Caricamento altri post
                                Rispondi
                                • Topic risposta
                                Effettua l'accesso per rispondere
                                • Da Vecchi a Nuovi
                                • Da Nuovi a Vecchi
                                • Più Voti