"La mayoría de los usuarios buscan en Google mientras están conectados, por lo que toda la información sobre su vida en línea está disponible: búsquedas de YouTube, correos electrónicos e historial de búsqueda anterior", dice Adam Tauber, el desarrollador principal del motor de metabúsqueda Searx que respeta la privacidad.
Por supuesto, puede usar Tor para mantener el anonimato y siempre eliminar todos los rastros de su actividad después de cada búsqueda, pero hacerlo después de todas y cada una de las búsquedas probablemente envejecerá con bastante rapidez. En su lugar, debería considerar instalar un motor de búsqueda autohospedado capaz de recuperar información por usted sin revelar nada sensible sobre usted.
Hemos seleccionado dos de estos motores de búsqueda y también presentamos tres motores de búsqueda adicionales para mostrarle que ya existen excelentes alternativas a los motores de búsqueda propietarios como Google o Bing y que son más fáciles de instalar y usar de lo que piensa.
1. YaCy
YaCy es un motor de búsqueda de igual a igual distribuido de forma gratuita cuyo componente principal está escrito en Java. Como todos los usuarios de YaCy son iguales y el motor de búsqueda no almacena las solicitudes de búsqueda de los usuarios, la censura simplemente no es posible.
Actualmente, YaCy indexa alrededor de 1.4 mil millones de documentos en su índice gracias a la actividad de más de 600 operadores pares que aportan cada mes. A modo de comparación, el índice de búsqueda de Google contiene cientos de miles de millones de páginas web y tiene un tamaño de más de 100,000,000 gigabytes.
Si bien YaCy todavía tiene un largo camino por recorrer antes de que pueda competir con los motores de búsqueda centralizados más grandes del mundo, ya se puede usar como portal de búsqueda para intranets privadas y aplicaciones específicas de proyectos porque YaCy puede operar como un único dispositivo de búsqueda sin conectarse en red con otros. compañeros.
YaCy se puede integrar fácilmente en cualquier página web gracias a sus simples fragmentos de código que se pueden copiar y pegar sin esfuerzo sin ninguna modificación.
2. Searx
Searx se describe como un metabuscador pirateable que respeta la privacidad. Está disponible bajo la GNU Affero General Public License versión 3, y su objetivo principal es proteger la privacidad de sus usuarios al no compartir nunca las direcciones IP o el historial de búsqueda de los usuarios con los motores de búsqueda de los que recopila los resultados.
"Cuando se utiliza Searx, la dirección IP de Searx, un User-Agent aleatorio y una consulta de búsqueda se envían a Google de forma predeterminada", Adam Tauber, también conocido como asciimoo, explica cómo funciona su motor de metabúsqueda. "Por supuesto, puede personalizar Searx para reenviar otros parámetros adicionales como el idioma de búsqueda o el número de página de la página de resultados solicitada."
Searx bloquea automáticamente todas las cookies de seguimiento servidas por los motores de búsqueda para evitar la modificación de los resultados basados en el perfil del usuario, que puede resultar de un motor de búsqueda que intenta implementar una búsqueda que se individualiza en función de lo que el motor sabe sobre el usuario. Searx es 100% gratuito y cualquiera puede modificarlo según sea necesario. Incluso puede tomar el código de Searx y ejecutar el motor de metabúsqueda en su propio servidor, lo que definitivamente debería abordar cualquier inquietud que pueda tener con respecto a los registros.
3. ElasticSearch
ElasticSearch es un motor de búsqueda basado en Lucene, una biblioteca de software de recuperación de información de código abierto y gratuita respaldada por Apache Software Foundation y se publica bajo la licencia de software Apache.
ElasticSearch proporciona un motor de búsqueda de texto completo con una interfaz web HTTP. El motor de búsqueda se puede utilizar para buscar todo tipo de documentos y se puede distribuir fácilmente en varios nodos.
Es posible crear un motor de búsqueda autohospedado usando ElasticSearch y Docker, y puede encontrar un tutorial que describe el proceso aquí.
4. Ambar
Ambar es un motor de búsqueda de documentos de código abierto con muchas funciones útiles. Admite rastreo automatizado, etiquetado y búsqueda instantánea de texto completo, solo para dar algunos ejemplos. Una de las características más interesantes de Ambar es su capacidad para realizar OCR en imágenes y archivos PDF. Los idiomas admitidos incluyen inglés, alemán, ruso, italiano, francés, español, polaco y holandés.
Ambar se puede implementar fácilmente con un solo archivo docker-compose, y puede aprender cómo hacerlo aquí.
5. Apache Solr
Escrito en Java, Apache Solr es una plataforma de búsqueda empresarial que incluye búsqueda de texto completo, resaltado de aciertos, búsqueda por facetas, indexación en tiempo real, agrupamiento dinámico y muchas otras características importantes. Fue creado en 2004 para un proyecto interno en CNET Networks. CNET Networks amablemente lo donó a la Apache Software Foundation en 2006, donde pasó del estado de incubación a un proyecto independiente de alto nivel en 2007.
Hoy en día, Solr es una plataforma de búsqueda empresarial altamente confiable, escalable y tolerante a fallas que impulsa las funciones de búsqueda y navegación de muchos de los sitios de Internet más grandes del mundo, incluidos DuckDuckGo, eHarmony y BestBuy. Usted puede
Cómo instalar y configurar YaCy
La instalación de YaCy es muy simple y solo toma un par de minutos porque no necesita instalar una base de datos externa o un servidor web, YaCy viene con todo lo necesario.
- Vaya al sitio web oficial de YaCy y descargue el paquete más reciente para Linux.
- Instale el entorno de ejecución de OpenJDK 8.
- Si está usando una distribución basada en Debian, use el siguiente comando: $ sudo apt-get install openjdk-8-jre
- Si no es así, siga las instrucciones específicas para su distribución.
- Extraiga el paquete descargado a su ubicación preferida.
- Vaya a la nueva carpeta e inicie "startYACY.sh ”en la Terminal.
- Debería ver un mensaje de confirmación informándole que YaCy comenzó como un demonio
Conclusión
Los motores de búsqueda saben más sobre nosotros de lo que a la mayoría de la gente le gustaría admitir. Si desea dejar de alimentar a las grandes corporaciones con datos jugosos, puede tomar las cosas en sus propias manos y configurar un motor de búsqueda autohospedado para proteger su privacidad. Aunque los motores de búsqueda autohospedados todavía tienen un largo camino por recorrer para volverse completamente utilizables, el potencial para que superen a los de Google está ahí y capturarlo es solo una cuestión de atraer a más usuarios.