il blog di malaerba

BeeSeek

Pubblicato su software libero by malaerba su Dicembre 9th, 2007

 

Girando per la rete ho letto di un progetto molto interessante che punta alla creazione di un motore di ricerca open-source basato sul peer to peer: BeeSeek. Oltre a mettere insieme tecnologie e modelli di sviluppo che si basano sulla condivisione e trasparenza delle informazioni, ha subito attirato la mia attenzione perché da grande vuole fare l’alternativa a Google :) . Google è un prodotto che funziona incredibilmente bene, ma che ha la pecca di essere chiuso e privato. È chiuso quindi non possiamo sapere come funziona, né in base a quali parametri ordina o seleziona i risultati di una ricerca (potendoci propinare ciò che preferisce filtrando i risultati delle nostre ricerche come fa in Cina), inoltre sa cosa cerchiamo, quello che ci interessa, con chi scambiamo email (Gmail), con chi chattiamo (Gtalk), quali feed leggiamo (Google reader), o chi legge quelli del nostro blog (feedburner), i video che guardiamo (youtube e googlevideo) e di riceve da noi in dono una messe grandissima di informazioni private. Che potrebbe usare come meglio crede. Questa cosa non mi piace, mi ricorda tanto il grande fratello, quello di Orwell. D’altro canto è un privato e punta, legittimamente, al profitto, ma non è sempre detto che il suo profitto coincida con ciò che è bene per noi. Vi propongo una serie di domande e risposte che spiegano meglio cos’è BeeSeek

  • Che cosa è BeeSeek?
    BeeSeek nasce dalla fervida mente di Simone Brunozzi aka ubuntista. L’idea è quella di creare un motore di ricerca open-source e quindi basato su questa filosofia.
  • Cosa significa in questo caso open source?
    Significa trasparenza totale. I motori di ricerca nell’attuale periodo storico sono alla base del sistema di comunicazione veicolando la maggior parte della navigazione nella rete. Diventa quindi necessario uno strumento che garantisca trasparenza. Ma questa da sola non basta, infatti è necessario che l’indicizzazione avvenga non a parte di uno spider ( come fa google) ma sia il più possibile “umanizzata”.
  • Quindi la componente umana sarà centrale in BeeSeek…
    Certamente! In pratica verrano considerate alcune variabili come per esempio il fatto che se dopo una ricerca con il motore di ricerca il primo risultato verrà cliccato ma se si ritornerà alla pagina della ricerca dopo pochissimo tempo in favore magari del secondo risultato della ricerca. Se su questo sito si rimarrà di più probabilmente significherà che è in relazione maggiore con la parola cercata. Ovviamente bisognerà prevenire i falsi positivi, un esempio banale è quello di accedere ad un sito poi rispondere magari al telefono e lasciare il browser su una determinata pagina 30 minuti senza usare il pc. In questi casi entrano in gioco fattori come per esempio il movimento del mouse.
  • Essere un motore di ricerca open source potrebbe portare a degli svantaggi? Ad esempio un ipotetico webmaster , conoscendo gli algoritmi di ricerca, non potrebbe ottimizzare il proprio sito ad HOC per il motore di ricerca, SENZA che ci sia una pertinenza con l’argomento della ricerca?
    Se l’indicizzazione è “umanizzata” come dicevo prima, come potresti migliorare il tuo sito a livello tecnico? Il concetto di base è l’autoregolamentazione. Sui grandi numeri, come quelli che attraversano un motore di ricerca, per far salire un sito devi fare in modo che la gente ci si fermi o trovi notizie interessanti. Poiché è su quei parametri che BeeSeek agisce.
  • Però a livello pratico magari bisogna vedere quanto possa essere efficiente l’ “umanizzazione”, questa funziona bene solo se l’utente medio è competente…Perché l’idea di basare un motore di ricerca, più sulle preferenze delle persone, che sui dati oggettivi, ho paura che possa essere fuorviante…
    Ecco un esempio, se io e te cercando un argomento X ci aspettiamo cose diverse, BeeSeek darà come prima risposta quello che la maggior parte della gente vuole, quindi probabilmente accontenterà con la prima risposta una grossa fetta di utenza! Non sono convinto, personalmente, che uno spider (considerato oggettivo) possa darmi un risultato che invece vada bene a tutti e due!
  • Dove metterete i dati dell’indicizzazione di tutta internet?
    Google ha risolto il problema comprandosi circa 450.000 computer ma a noi hanno rubato il portafoglio mentre li stavamo andando a comprare e quindi ci siamo dovuti inventare un altro metodo :-P ! BeeSeek vuole essere basato su di una rete p2p, ovvero una decentralizzazione anche del database con una frammentazione dello stesso tra i vari utenti che decideranno di ospitarne un pezzettino sul proprio hard disk. Questo permetterà da un lato di non avere un database centralizzato e dall’altro di di garantire in ogni caso la costante accessibilità ad esso. Inoltre non essendo criptato il database occupa relativamente poco spazio! La possibilità di fare da “server” è naturalmente limitata ai soli volontari in modo di consentire ai meno esperti di non doversi occupare di ospitare il database sul proprio pc, configurado le porte del router per esempio.
  • Ma un database non criptato nei client non potrebbe essere manomesso?
    No, per il semplice fatto che la stessa parte di database è contemporaneamente distribuito su più PC garantendo il fatto che sia altamente improbabile che diversi utenti ospitanti il database abbiano la stessa manomissione. Questa ridondanza serve anche perchè nel momento in cui uno spegne il proprio computer non ci può essere un buco nella ricerca.

da un articolo di lele85, sotto questa licenza.
Google non mi sta simpatico, e proprio per questo se Simone Brunozzi, il sabdfl di BeeSeek, andasse a lavorare per google ci rimarrei un po’ male. Sembrerebbe che sia così in gamba e il progetto tanto buono che la concorrenza lo vuole a lavorare per se :) .

9 Responses to 'BeeSeek'

Subscribe to comments with RSS or TrackBack to 'BeeSeek'.

  1. ubuntista said, on Dicembre 9th, 2007 at 4:33 pm

    :-)

  2. malaerba said, on Dicembre 9th, 2007 at 4:47 pm

    Sono contento che ti sia piaciuto l’articolo, i complimenti te li meriti :).

  3. lele85 said, on Dicembre 10th, 2007 at 3:07 pm

    Io sono contento che qualcuno abbia letto la nostra intervista! ;-)
    Diffondete diffondete!

  4. gasnobile said, on Dicembre 10th, 2007 at 5:32 pm

    questa mi pare un’ottima notizia e un’ottima idea. Anche a me non piace Google. Complimenti a Simone Brunozzi!

  5. gasnobile said, on Dicembre 18th, 2007 at 4:56 pm

    ho cominciato ad usare BeeSeek ultimamente, e ho una domanda (forse stupida, ma non sono un addetto ai lavori): perché la ricerca avviene comunque con google?

  6. malaerba said, on Dicembre 18th, 2007 at 5:09 pm

    Essenzialmente perché non hanno ancora codice stabile, vedi le FAQ:
    http://wiki.beeseek.org/FAQ#head-d8c858e046dd2de95e68a1ca155c7805da114b59

  7. Jak - BeeSeek Blogs admin said, on Dicembre 19th, 2007 at 12:48 am

    Ciao malaerba, ti ringrazio molto per il tuo articolo!

    Ti aspettiamo sui canali irc per farci una chiaccherata di persona…che ne dici?

  8. malaerba said, on Dicembre 19th, 2007 at 12:06 pm

    Ok, ci leggiamo una di queste sere. :)

  9. gasnobile said, on Dicembre 21st, 2007 at 12:22 am

    aaaaaaaaaah…capito! avevo cercato nelle FAQ ma non l’avevo trovato. thanks :-)

Leave a Reply