Navigazione

    Privacy - Termini e condizioni
    © 2020 Search On Media Group S.r.l.
    • Registrati
    • Accedi
    • CATEGORIES
    • Discussioni
    • Non letti
    • Recenti
    • Hashtags
    • Popolare
    • Utenti
    • Stream
    • Interest
    • Categories
    1. Home
    2. poetaestinto80
    3. Post
    P

    poetaestinto80

    @poetaestinto80

    • Profilo
    • Chi segue 0
    • Da chi è seguito 0
    • Discussioni 1
    • Post 4
    • Migliore 0
    • Gruppi 0
    Iscrizione Ultimo Accesso
    0
    Reputazione
    4
    Post
    0
    Visite al profilo
    0
    Da chi è seguito
    0
    Chi segue
    User Newbie

    Post creati da poetaestinto80

    • RE: Nutch

      quindi non c'è nessuno che puo darmi una mano con il problema che ho?
      devo indicizzare una directory in locale usando linux.
      Ho provato a modificare il file crawl-urlfilter.txt , ma penso di fare alcuni errori di sintassi. io l'ho modifico in questo modo:

      Creative Commnons crawl filter

      Each non-comment, non-blank line contains a regular expression

      prefixed by '+' or '-'. The first matching pattern in the file

      determines whether a URL is included or ignored. If no pattern

      matches, the URL is ignored.

      skip file:, ftp:, & mailto: urls

      -^(http|ftp|mailto):

      skip image and other suffixes we can't yet parse

      -.(gif|GIF|jpg|JPG|ico|ICO|css|sit|eps|wmf|rtf|zip|ppt|mpg|xls|gz|rpm|tgz|mov|MOV|exe)$

      skip URLs containing certain characters as probable queries, etc.

      #-[!@]
      #+[?&=%]
      -[?
      !@=]

      #URLs VALIDE

      +^file:///usr/Proventi2/([a-z0-9]*.)/

      accept anything else

      +.*

      Sapete dirmi se ho fatto bene?

      postato in News Ufficiali da Connect.gt
      P
      poetaestinto80
    • RE: Nutch

      grazie per l'indicazione, ma mi servirebbero informazioni piu precise su l'indicizzazione di directory

      postato in News Ufficiali da Connect.gt
      P
      poetaestinto80
    • RE: Creare un motore di ricerca

      salve a tutti a me servirebbero maggiorni nformazioni su nutch, e in modo particolare che cosa si deve modificare per fare indicizzare e far fare il crawl di una singola directory modificando(almeno io penso che si debba modificare qualcosa nel file urlcrawlfilter) in che modo?
      che sintassi si deve usare?
      aiuto!!!!!
      per me e' estremamente importante

      ciao

                  poetaestinto80
      postato in News Ufficiali da Connect.gt
      P
      poetaestinto80
    • Nutch

      salve a tutti, a me servirebbero il maggiorn numero di informazioni su Nutch, apparte quelle che sono sul sito mi interessava sapere la sintassi che si deve usare per far indicizzare e far fare il crawl a nutch di una directory.
      Qualcuno sa come si fa?
      che file va modificato e in che modo?
      grazie anticipato a tutti per la vostra disponibilita

              poetaestinto80
      postato in News Ufficiali da Connect.gt
      P
      poetaestinto80