Una breve storia di Seznam

Seznam è una piattaforma per motori di ricerca che è il primo portale web nella Repubblica Ceca. È uno dei secondi motori di ricerca più grandi della Repubblica Ceca. Ivo Lukacovic l'ha fondata nel 1996 a Praga. La sede di Seznam è a Praga, Repubblica Ceca. Attualmente, i CE0 / Consiglio di amministrazione dell'azienda sono Pavel Zima, Tomas Kapalin e Ondrej Prochazka.

Diamo un breve sguardo alla storia della ricerca web di Seznam.cz:

  • Seznam.cz è un'azienda ceca fondata nel 1996. A quei tempi il nostro prodotto chiave era un catalogo web, che all'epoca poteva essere considerato uno standard del settore. A parte questo, abbiamo offerto notizie e liste dei migliori siti.
  • Nel 1997 abbiamo avviato il nostro motore di ricerca full-text, Kompas ("Compass"), cercando in 1,2 milioni di pagine. Kompas ha consentito agli utenti di inserire per la prima volta query includendo gli accenti.
  • Negli anni successivi abbiamo lavorato continuamente per migliorare i nostri servizi. Abbiamo provato a utilizzare la Ricerca Google per breve tempo nel 2002, ma abbiamo deciso di non intraprendere questa strada.
  • Google non era l'unica opzione: abbiamo provato anche Empyreum e Jyxo, ma alla fine abbiamo deciso di sviluppare il nostro motore di ricerca nel 2005. Il nostro database era grande come 30 milioni di documenti cechi e il servizio, creato da sole 4 persone, funzionava 14 server.
  • Per rendere l'indicizzazione web più veloce e migliore, nel 2007 abbiamo aggiornato il nostro crawler a una nuova versione, denominata SeznamBot/2.0. L'architettura è diventata scalabile e si basava su più database MySQL.
  • Nel 2008 abbiamo introdotto la pagina dei risultati del motore di ricerca blind friendly (SERP) e abbiamo iniziato a indicizzare documenti non HTML come file PDF o DOC.
  • Nel 2009 abbiamo iniziato a utilizzare Microsoft Bing per la ricerca di pagine straniere. Abbiamo anche migliorato molto il riconoscimento delle intenzioni degli utenti, il che ha portato a un enorme balzo in avanti nella pertinenza dei risultati di ricerca. Grazie a tutto ciò, abbiamo ricevuto il premio Křišťálová Lupa nella categoria Motori di ricerca e database. Abbiamo anche aggiornato il nostro generatore di screenshot, che fornisce i nostri risultati di ricerca con miniature.
  • Con l'aumento del numero di documenti e funzionalità, il processo di ricerca è diventato sempre più impegnativo. Nel 2010 la ricerca ha girato su più di 100 server in cui una parte significativa di questo conteggio è occupata dal crawler.
  • Un'altra versione aggiornata del nostro crawler introdotta nel 2011 – SeznamBot/3.0 – ha portato un grande cambiamento nella scelta della tecnologia poiché utilizza Hadoop invece di MySQL. Abbiamo iniziato a valutare i documenti nel nostro indice: solo i documenti che consideriamo i migliori possono essere visualizzati nei risultati di ricerca. Abbiamo anche sperimentato le tecnologie Yandex, sviluppato la versione beta della ricerca video e iniziato a cercare attività per il tempo libero.
  • A partire dal 2012 abbiamo iniziato a indicizzare massicciamente le pagine straniere, quindi il numero di documenti che stiamo esaminando è passato da 400 milioni a circa 700 milioni (il numero di documenti che il nostro crawler conosce è in realtà molto più alto, ma come abbiamo già detto, solo i migliori di loro arrivano ai risultati di ricerca).
  • Tablet e smartphone stanno diventando sempre più popolari. Di conseguenza, nel 2013 abbiamo cambiato la nostra ricerca web in un layout reattivo, che si adatta alle capacità del dispositivo. Nello stesso anno abbiamo iniziato a pubblicare le query di ricerca di tendenza sul nostro canale Twitter.
  • Nel 2014 abbiamo ingrandito le miniature dei risultati visualizzati nella pagina dei risultati dei motori di ricerca (SERP) e abbiamo aggiunto i sitelink ad alcuni risultati organici, principalmente per le query di navigazione. Abbiamo iniziato a rilevare la posizione degli utenti e a visualizzare suggerimenti personalizzati e suggerimenti di query in caso di successo. Abbiamo anche sperimentato un layout a matrice della SERP anziché quello tradizionale a colonna singola. Tuttavia, dopo una serie di sessioni di test degli utenti, abbiamo deciso di scartare l'idea e concentrarci sul layout tradizionale.
  • L'anno 2015 ha portato molti cambiamenti per noi. Abbiamo spostato una parte del nostro web crawler in un nuovo data center chiamato Kokura, abbiamo migliorato l'indicizzazione dei siti Web HTTPS, abbiamo aggiornato il rilevamento della lingua, abbiamo lanciato un nuovissimo Freshbot per eseguire la scansione di siti Web e canali RSS più velocemente, abbiamo aggiornato il nostro cluster Hadoop a un importante nuova versione e abbiamo introdotto la nostra soluzione di ricerca di immagini e video per sostituire la tecnologia con licenza insoddisfacente basata su PicSearch. Siamo anche entrati nell'ambiente di smartphone e tablet utilizzando la nostra app browser web. Infine, abbiamo rafforzato i nostri sforzi nella lotta allo spam web, che ha portato a un grande aggiornamento della nostra soluzione anti-spam chiamata Jalapeño.
  • Nel 2016 abbiamo continuato a combattere i siti di spam nei risultati di ricerca implementando Jalapeño 2.0 e successivamente Jalapeño 3.0. Abbiamo iniziato a concentrarci maggiormente sulla qualità dei siti web nei nostri risultati di ricerca, il che ha portato al rilascio di un altro importante aggiornamento chiamato Page Quality. Inoltre, abbiamo introdotto un nuovo operatore di ricerca “info:“, che consente ai proprietari delle pagine di verificare che i loro siti siano indicizzati correttamente. Abbiamo accelerato il download e l'indicizzazione dei video e abbiamo distribuito una versione migliorata e anche molto più veloce di Freshbot chiamata Mach II, che può gestire il doppio delle risorse rispetto al Freshbot originale. Abbiamo anche aumentato la dimensione del database del web crawler che ci ha permesso di affinare la pianificazione della scansione dei siti web. Di pari passo con l'ampliamento del database del crawler web, abbiamo anche aumentato il numero di documenti che effettivamente indicizziamo ed eseguiamo ricerche.

Stiamo costantemente sviluppando e migliorando il nostro motore di ricerca in uno sforzo infinito per fornire agli utenti ciò che stanno cercando.

Fonti:

© 2021 motori-di-ricerca.org