Apache Solr

Los mejores motores de búsqueda autohospedados

Los mejores motores de búsqueda autohospedados
¿Sabe tu jefe que estás buscando otro trabajo?? ¿Le ha dicho a su pareja acerca de la incapacidad de decidir si quiere tener hijos o no?? ¿Saben sus padres acerca de su orientación sexual?? Bueno, Google y otros motores de búsqueda importantes lo hacen.

"La mayoría de los usuarios buscan en Google mientras están conectados, por lo que toda la información sobre su vida en línea está disponible: búsquedas de YouTube, correos electrónicos e historial de búsqueda anterior", dice Adam Tauber, el desarrollador principal del motor de metabúsqueda Searx que respeta la privacidad.

Por supuesto, puede usar Tor para mantener el anonimato y siempre eliminar todos los rastros de su actividad después de cada búsqueda, pero hacerlo después de todas y cada una de las búsquedas probablemente envejecerá con bastante rapidez. En su lugar, debería considerar instalar un motor de búsqueda autohospedado capaz de recuperar información por usted sin revelar nada sensible sobre usted.

Hemos seleccionado dos de estos motores de búsqueda y también presentamos tres motores de búsqueda adicionales para mostrarle que ya existen excelentes alternativas a los motores de búsqueda propietarios como Google o Bing y que son más fáciles de instalar y usar de lo que piensa.

1. YaCy

YaCy es un motor de búsqueda de igual a igual distribuido de forma gratuita cuyo componente principal está escrito en Java. Como todos los usuarios de YaCy son iguales y el motor de búsqueda no almacena las solicitudes de búsqueda de los usuarios, la censura simplemente no es posible.

Actualmente, YaCy indexa alrededor de 1.4 mil millones de documentos en su índice gracias a la actividad de más de 600 operadores pares que aportan cada mes. A modo de comparación, el índice de búsqueda de Google contiene cientos de miles de millones de páginas web y tiene un tamaño de más de 100,000,000 gigabytes.

Si bien YaCy todavía tiene un largo camino por recorrer antes de que pueda competir con los motores de búsqueda centralizados más grandes del mundo, ya se puede usar como portal de búsqueda para intranets privadas y aplicaciones específicas de proyectos porque YaCy puede operar como un único dispositivo de búsqueda sin conectarse en red con otros. compañeros.

YaCy se puede integrar fácilmente en cualquier página web gracias a sus simples fragmentos de código que se pueden copiar y pegar sin esfuerzo sin ninguna modificación.

2. Searx

Searx se describe como un metabuscador pirateable que respeta la privacidad. Está disponible bajo la GNU Affero General Public License versión 3, y su objetivo principal es proteger la privacidad de sus usuarios al no compartir nunca las direcciones IP o el historial de búsqueda de los usuarios con los motores de búsqueda de los que recopila los resultados.

"Cuando se utiliza Searx, la dirección IP de Searx, un User-Agent aleatorio y una consulta de búsqueda se envían a Google de forma predeterminada", Adam Tauber, también conocido como asciimoo, explica cómo funciona su motor de metabúsqueda. "Por supuesto, puede personalizar Searx para reenviar otros parámetros adicionales como el idioma de búsqueda o el número de página de la página de resultados solicitada."

Searx bloquea automáticamente todas las cookies de seguimiento servidas por los motores de búsqueda para evitar la modificación de los resultados basados ​​en el perfil del usuario, que puede resultar de un motor de búsqueda que intenta implementar una búsqueda que se individualiza en función de lo que el motor sabe sobre el usuario. Searx es 100% gratuito y cualquiera puede modificarlo según sea necesario. Incluso puede tomar el código de Searx y ejecutar el motor de metabúsqueda en su propio servidor, lo que definitivamente debería abordar cualquier inquietud que pueda tener con respecto a los registros.

3. ElasticSearch

ElasticSearch es un motor de búsqueda basado en Lucene, una biblioteca de software de recuperación de información de código abierto y gratuita respaldada por Apache Software Foundation y se publica bajo la licencia de software Apache.

ElasticSearch proporciona un motor de búsqueda de texto completo con una interfaz web HTTP. El motor de búsqueda se puede utilizar para buscar todo tipo de documentos y se puede distribuir fácilmente en varios nodos.

Es posible crear un motor de búsqueda autohospedado usando ElasticSearch y Docker, y puede encontrar un tutorial que describe el proceso aquí.

4. Ambar

Ambar es un motor de búsqueda de documentos de código abierto con muchas funciones útiles. Admite rastreo automatizado, etiquetado y búsqueda instantánea de texto completo, solo para dar algunos ejemplos. Una de las características más interesantes de Ambar es su capacidad para realizar OCR en imágenes y archivos PDF. Los idiomas admitidos incluyen inglés, alemán, ruso, italiano, francés, español, polaco y holandés.

Ambar se puede implementar fácilmente con un solo archivo docker-compose, y puede aprender cómo hacerlo aquí.

5. Apache Solr

Escrito en Java, Apache Solr es una plataforma de búsqueda empresarial que incluye búsqueda de texto completo, resaltado de aciertos, búsqueda por facetas, indexación en tiempo real, agrupamiento dinámico y muchas otras características importantes. Fue creado en 2004 para un proyecto interno en CNET Networks. CNET Networks amablemente lo donó a la Apache Software Foundation en 2006, donde pasó del estado de incubación a un proyecto independiente de alto nivel en 2007.

Hoy en día, Solr es una plataforma de búsqueda empresarial altamente confiable, escalable y tolerante a fallas que impulsa las funciones de búsqueda y navegación de muchos de los sitios de Internet más grandes del mundo, incluidos DuckDuckGo, eHarmony y BestBuy. Usted puede

Cómo instalar y configurar YaCy

La instalación de YaCy es muy simple y solo toma un par de minutos porque no necesita instalar una base de datos externa o un servidor web, YaCy viene con todo lo necesario.

  1. Vaya al sitio web oficial de YaCy y descargue el paquete más reciente para Linux.
  2. Instale el entorno de ejecución de OpenJDK 8.
    • Si está usando una distribución basada en Debian, use el siguiente comando: $ sudo apt-get install openjdk-8-jre
    • Si no es así, siga las instrucciones específicas para su distribución.
  3. Extraiga el paquete descargado a su ubicación preferida.
  4. Vaya a la nueva carpeta e inicie "startYACY.sh ”en la Terminal.
  5. Debería ver un mensaje de confirmación informándole que YaCy comenzó como un demonio

Conclusión

Los motores de búsqueda saben más sobre nosotros de lo que a la mayoría de la gente le gustaría admitir. Si desea dejar de alimentar a las grandes corporaciones con datos jugosos, puede tomar las cosas en sus propias manos y configurar un motor de búsqueda autohospedado para proteger su privacidad. Aunque los motores de búsqueda autohospedados todavía tienen un largo camino por recorrer para volverse completamente utilizables, el potencial para que superen a los de Google está ahí y capturarlo es solo una cuestión de atraer a más usuarios.

Cómo descargar y jugar Sid Meier's Civilization VI en Linux
Introducción al juego Civilization 6 es una versión moderna del concepto clásico introducido en la serie de juegos Age of Empires. La idea era bastant...
Cómo instalar y jugar a Doom en Linux
Introducción a Doom La serie Doom se originó en los años 90 después del lanzamiento del Doom original. Fue un éxito instantáneo y, desde ese momento e...
Vulkan para usuarios de Linux
Con cada nueva generación de tarjetas gráficas, vemos que los desarrolladores de juegos superan los límites de la fidelidad gráfica y se acercan un pa...