• Super User

    prima di farlo però mi è venuto un dubbio:

    il tuo sito è statico o dinamico?perchè se è dinamico il problema è diverso.

    prima di buttare giù il codice passami l'url del tuo sito must

    forse la soluzione migliore è creare uno spider...è da un pò che volevo creare uno spider in php..penso sia abbastanza impossibile, ma la sfida mi alletta 😄

    lo spider dovrebbe solo leggere la pagina cercare i links a pagine interne e se non sono già presenti nell'array link[] allora li aggiunge all'array.
    dopo aver letto l'index inizia a visualizzare e leggere i links presenti in link[] e ad aggiungere altri link all'array..in questo modo vede tutte le pagine che vedrebbe google.

    in VB6 sarebbe facile da fare, ma mi sono sempre chiesto se potessi fare la stessa cosa in php

    Se invece il tuo sito è statico allora l'idea iniziale della ricerca ricorsiva all'interno delle tue cartelle può andare bene

    ok mi metto a lavoro..tu fammi sapere


  • Super User

    il sito e' il famoso laboratorio personale: www.prodottitipicitaliani.com


  • Super User

    ho fatto uno script adatto solo al sito di must..

    il mio finto spider sta vedendo tutte le tue pagine 😄

    ho fatto in modo che ne visualizzi una ogni 3 secondi...

    il suo nome è SpazioGratis.iT 😄 se hai phpstats dimmi se vedi che sta passando 😄

    poi dimmi la reazione di google adsense


  • Super User

    @kerouac3001 said:

    ho fatto uno script adatto solo al sito di must..

    il mio finto spider sta vedendo tutte le tue pagine 😄

    ho fatto in modo che ne visualizzi una ogni 3 secondi...

    il suo nome è SpazioGratis.iT 😄 se hai phpstats dimmi se vedi che sta passando 😄

    poi dimmi la reazione di google adsense

    il ragno lo vedo, googlebot no :sad:


  • Super User

    bene ho bloccato il ragno..lo faccio ripartire dall'ultima pagina vista solo se mi dirai che google è passato sulle pagine viste

    mi segno qui i dati dell'ultima pagina vista così non li dimentico

    cat=0&id=1210


  • Super User

    @kerouac3001 said:

    bene ho bloccato il ragno..lo faccio ripartire dall'ultima pagina vista solo se mi dirai che google è passato sulle pagine viste

    mi segno qui i dati dell'ultima pagina vista così non li dimentico

    cat=0&id=1210

    non passa, non passa 😢 :arrabbiato:


  • Super User

    la domanda è: perchè a volte adsense legge le pagine viste dagli utenti mentre altre volte le ignora?

    le legge solo la prima volta?
    le legge solo se conosce il browser?
    le legge solo se l'utente resta per un pò di tempo?

    cmq ho bloccato il ragno
    la soluzione è: aspettare :bho:


  • Super User

    @kerouac3001 said:

    la domanda è: perchè a volte adsense legge le pagine viste dagli utenti mentre altre volte le ignora?

    le legge solo la prima volta?

    sicuramente no. anche perche' con il ragno non e' passato neanche la prima volta.

    le legge solo se conosce il browser?

    sicuramente no. con il wget di cui ti parlavo ho provato a spiderizzare anche settando uno user agent (di firefox). cambiato nulla.

    le legge solo se l'utente resta per un pò di tempo?

    no, googlebot/mediapartners arriva SUBITO, praticamente mentre l'utente sta ancora caricando la pagina.

    cmq ho bloccato il ragno
    la soluzione è: aspettare :bho:

    eheh. no, aspettando la soluzione non piove dal cielo (oddio, magari da questo o altri forum si :lol: ).
    secondo me lo spider deve essere in grado di eseguire il codice javascript. niente piu' niente meno.


  • Super User

    no sbagli 🙂

    lo spider esegue il javascript..l'ho visto con i miei occhi..quindi il problema è un altro 🙂

    ti darei l'url per avviare lo spider, ma se lo posto la gente poi si diverte ad usarlo e ti fotte banda quindi evitiamo 🙂

    al massimo te lo do in pvt se lo vuoi vedere...basta aprire l'url e lasciare la pagina aperta...lui fa il resto


  • Super User

    @kerouac3001 said:

    no sbagli 🙂

    lo spider esegue il javascript..l'ho visto con i miei occhi..quindi il problema è un altro 🙂

    ti darei l'url per avviare lo spider, ma se lo posto la gente poi si diverte ad usarlo e ti fotte banda quindi evitiamo 🙂

    al massimo te lo do in pvt se lo vuoi vedere...basta aprire l'url e lasciare la pagina aperta...lui fa il resto

    oh beh, se e' l'url che vedo nei log, ce l'ho.

    resta il problema, e non so veramente che pensare...


  • Super User

    AAAAAAAAAAAAAAHHHHHHHHHHHHHHHHH

    fermo!
    FUNZIONA!!!

    solo che dopo un po' si e' fermato. alzerei il delay tra una pagina e l'altra a 30/60 secondi pero'.

    infatti il bot arrivava all'inizio, poi s'e' fermato. forse ha sentito puzza di spider (o piu' semplicemente c'e' un filtro che evita troppe visite in tot tempo).

    rifallo partire e vediamo al volo se riprende.


  • Super User

    azz..30 secondi è troppo..ti do l'url il privato e fai tu..anzi aggiungo una variabile per settare il delay..un minuto e ti passo l'url in pvt


  • Super User

    vi comunichiamo che il progetto è falllito miseramente quando must mi ha fatto notare che probabilmente google stava vedendo le mie pagine e non le sue ahahahahhah

    aveva ragione 🙂


  • Super User

    @kerouac3001 said:

    vi comunichiamo che il progetto è falllito miseramente quando must mi ha fatto notare che probabilmente google stava vedendo le mie pagine e non le sue ahahahahhah

    aveva ragione 🙂

    :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: