Apache Solr

Beste selvstyrte søkemotorer

Beste selvstyrte søkemotorer
Vet sjefen din at du leter etter en annen jobb? Har du fortalt din betydningsfulle annen om manglende evne til å bestemme om du vil ha barn eller ikke? Kjenner dere foreldre om deres seksuelle legning? Vel, Google og andre store søkemotorer gjør det.

"De fleste brukere søker på Google mens de er pålogget, så all informasjon om deres online liv er tilgjengelig: YouTube-søk, e-post og tidligere søkelogger," sier Adam Tauber, den ledende utvikleren av personvern-respekterende metasøkemotor Searx.

Selvfølgelig kan du bruke Tor for anonymitet og alltid slette alle spor av aktiviteten din etter hvert søk, men å gjøre det etter hvert søk vil mest sannsynlig bli gammel ganske raskt. I stedet bør du vurdere å installere en søkemotor som er vertskap som kan hente informasjon for deg uten å avsløre noe følsomt om deg.

Vi har valgt to slike søkemotorer, og vi introduserer også tre ekstra søkemotorer for å vise deg at gode alternativer til proprietære søkemotorer som Google eller Bing allerede eksisterer og er enklere å installere og bruke enn du kanskje tror.

1. YaCy

YaCy er en gratis distribuert peer-to-peer-søkemotor hvis kjernekomponent er skrevet på Java. Fordi alle YaCy-brukere er like, og fordi søkemotoren ikke lagrer brukeresøksforespørsler, er sensur ganske enkelt ikke mulig.

Foreløpig indekserer YaCy omtrent 1.4 milliarder dokumenter i indeksen takket være aktiviteten til mer enn 600 jevnaldrende operatører som bidrar til den hver måned. Til sammenligning inneholder Google Search-indeksen hundrevis av milliarder nettsider og er godt over 100.000.000 gigabyte i størrelse.

Mens YaCy fortsatt har en lang vei å gå før den kan konkurrere med de største sentraliserte søkemotorene i verden, er den allerede brukbar som en søkeportal for private intranett og prosjektspesifikke applikasjoner, fordi YaCy kan fungere som et enkelt søkeenhet uten nettverk med andre kolleger.

YaCy kan enkelt integreres på en hvilken som helst nettside takket være enkle kodebiter som enkelt kan kopieres og limes inn uten noen endring.

2. Searx

Searx er beskrevet som en personvern-respekterende, hackbar metasøkemotor. Den er tilgjengelig under GNU Affero General Public License versjon 3, og hovedmålet er å beskytte personvernet til brukerne ved aldri å dele brukernes IP-adresser eller søkeloggen med søkemotorer som den samler resultater fra.

"Når du bruker Searx, blir IP-adressen til Searx, en tilfeldig User-Agent og et søk sendt til Google som standard," forklarer Adam Tauber, aka asciimoo, hvordan metasøkemotoren hans fungerer. “Selvfølgelig kan du tilpasse Searx til å videresende andre ekstra parametere som søkespråk eller sidenummeret til den forespurte resultatsiden.”

Searx blokkerer automatisk alle sporingscookies som serveres av søkemotorene for å forhindre brukerprofileringsbasert resultatendring, noe som kan være et resultat av at en søkemotor prøver å implementere søk som er individualisert basert på hva motoren vet om brukeren. Searx er 100 prosent gratis, og alle kan endre det etter behov. Du kan til og med ta Searx-koden og kjøre metasøkemotoren på din egen server, som definitivt bør løse eventuelle bekymringer du måtte ha angående logger.

3. ElasticSearch

ElasticSearch er en søkemotor basert på Lucene, et gratis programvare bibliotek med åpen kildekodeinnhenting som støttes av Apache Software Foundation og er utgitt under Apache Software License.

ElasticSearch tilbyr en fulltekst-søkemotor med et HTTP-nettgrensesnitt. Søkemotoren kan brukes til å søke i alle slags dokumenter, og den kan enkelt distribueres over flere noder.

Det er mulig å bygge en selv-vert søkemotor ved hjelp av ElasticSearch og Docker, og du kan finne en veiledning som beskriver prosessen her.

4. Ambar

Ambar er en åpen kildekodesøkemotor med mange nyttige funksjoner. Den støtter automatisk gjennomsøking, merking og øyeblikkelig fulltekstsøk, bare for å gi noen få eksempler. En av de mest spennende funksjonene i Ambar er dens evne til å utføre OCR på bilder og PDF-filer. De støttede språkene inkluderer engelsk, tysk, russisk, italiensk, fransk, spansk, polsk og nederlandsk.

Ambar kan enkelt distribueres med en enkelt docker-compose-fil, og du kan lære hvordan du gjør det her.

5. Apache Solr

Apache Solr er skrevet i Java og er en bedriftssøkeplattform som inkluderer fulltekstsøk, treffheving, fasettert søk, sanntidsindeksering, dynamisk klynging og mange andre viktige funksjoner. Den ble opprettet i 2004 for et internt prosjekt hos CNET Networks. CNET Networks donerte det til Apache Software Foundation i 2006, hvor det ble uteksaminert fra inkubasjonsstatus til et frittstående toppnivåprosjekt i 2007.

I dag er Solr en meget pålitelig, skalerbar og feiltolerant bedriftssøkeplattform som driver søke- og navigasjonsfunksjonene til mange av verdens største nettsteder, inkludert DuckDuckGo, eHarmony og BestBuy. Du kan

Hvordan installere og konfigurere YaCy

Installasjonen av YaCy er veldig enkel, og det tar bare et par minutter fordi du ikke trenger å installere en ekstern database eller webserver - YaCy kommer med alt du trenger.

  1. Gå til den offisielle nettsiden til YaCy og last ned den nyeste pakken for Linux.
  2. Installer OpenJDK 8 kjøretidsmiljø.
    • Hvis du bruker en Debian-basert distribusjon, bruker du følgende kommando: $ sudo apt-get install openjdk-8-jre
    • Hvis ikke, følg instruksjonene som er spesifikke for distribusjonen din.
  3. Pakk ut den nedlastede pakken til ønsket sted.
  4. Gå til den nye mappen og start “startYACY.sh ”-skript i Terminal.
  5. Du bør se en bekreftelsesmelding som informerer deg om at YaCy startet som en demon

Konklusjon

Søkemotorer vet mer om oss enn folk flest vil innrømme. Hvis du vil slutte å mate store selskaper med saftige data, kan du ta ting i dine egne hender og sette opp en selv-vert søkemotor for å beskytte personvernet ditt. Selv om søkemotorer som er vertskap for fremdeles har en lang vei å gå for å bli fullt brukbare, er potensialet for dem å utkonkurrere slike som Google, og å fange det er bare et spørsmål om å tiltrekke seg flere brukere.

Installer det siste OpenRA-strategispillet på Ubuntu Linux
OpenRA er en Libre / Free Real Time Strategy-spillmotor som gjenskaper de tidlige Westwood-spillene som den klassiske Command & Conquer: Red Alert. Di...
Installer nyeste Dolphin Emulator for Gamecube & Wii på Linux
Dolphin Emulator lar deg spille de valgte Gamecube- og Wii-spillene dine på Linux Personal Computers (PC). Som en fritt tilgjengelig og åpen kildekod...
Hvordan bruke GameConqueror Cheat Engine i Linux
Artikkelen dekker en guide om bruk av GameConqueror-juksemotoren i Linux. Mange brukere som spiller spill på Windows bruker ofte "Cheat Engine" -appli...