Bloquear 16308 hosts basura en Internet

Todos estamos hartos de esos dominios en Internet que dan asco. Sobrecargan las webs con basura y publicidad muy molesta, y algunas de ellas incluso intentan engañar al usuario con falsos bordes de ventana, o con ciertas frases como las siguientes :

  • Es usted el visitante número 999999
  • Tiene un (1) mensaje de Facebook.

En algunas ocasiones, se ven algunas más descaradas que sugieren que alguna puta señorita le está invitando a su cama a «dormir». Por supuesto, todas estas publicidades son una estafa. Nadie se lleva un televisor de plasma ultraplano por ser el visitante número 999999. Tampoco nadie es redigirido a la verdadera web de Facebook con un mensaje en una web que poco o nada tiene que ver con Facebook. Y de la misma forma, el hacer click sobre uno de los mensajes descarados que se han mencionado antes sólo sirven para llevarte una bofetada de alguna mujer próxima, ya sea tu madre al ver lo salido que está su hijo, o la novia por los celos, etc.

Por todo ello, estamos de acuerdo en que la Web cada día se pone peor, y hay que tomar medidas. Hay algunos plugins que bloquean publicidad molesta como el Adblock, pero esta medida ya es muy conocida. También hay métodos más rudimentarios como una lista de hosts bloqueados pero que igualmente son muy útiles. Por eso vengo a compartir un fichero que os bloqueará mucha mierda que circula por Internet, y que no requiere instalar ningún plugin.

El proceso es bien sencillo. Primero, nos bajamos éste fichero, y después ejecutamos como root lo siguiente en la línea de comandos :

cat fichero >> /etc/hosts

La doble redirección sirve para agregar el contenido del fichero descargado a /etc/hosts y así no invalidar el contenido anterior del fichero. Una vez hecho esto, notaremos que la publicidad desaparece y que algunas webs quedan con un aspecto bastante limpio.

Sin embargo, el mejor arma contra este tipo de webs es el sentido común ( que es el menos común de los sentidos ). Hay que evitar hacer click en enlaces de esos que tienen una ristra brutal de carácteres sin sentido y demasiados números, cosas del estilo http://www2.adspep1to.com/f.!fwe51fkae1fw54g5mrs7gwgZ7gw7e8gw?ad=fw5eg1w5g1w65eg1w5A

También es importante darse cuenta de que mucha gente no sabe esto, así que es habitual encontrar en vuestro entorno a personas usando el ordenador y haciendo el gilipollas de tal forma que empiezan buscando cómo alargarse la salchicha el regalo de san valentín para su novia y acaban en una web de apuestas deportivas con un tufo a estafa a kilómetros. Por eso es importante enseñar a estas personas algunos patrones básicos para reconocer este tipo de webs ( distinguir los enlaces malos, entre una imágen y una animación flash, etc ), para evitar ser estafados.

ACTUALIZACIÓN : Gracias al enlace que han dejado en los comentarios a una web que contenía una gran lista en mega, y a unos cuantos links que he encontrado por internet, he podido recopilar más ficheros de hosts bloqueados. He eliminado comentarios, lineas vacías, espacios o tabuladores sobrantes a final de línea, he juntado todos los ficheros, los he ordenado con sort, he eliminado las líneas repetidas con uniq y lo he dejado en un formato mas «fumable». Es de agradecer que unix posea unas herramientas de manipulación de texto tan útiles. El nuevo fichero contiene 25220 hosts bloqueados ( antes de eliminar las repeticiones tenía el doble de tamaño ), y se puede descargar de aquí

Saludos !!

Compartir

18 Comentarios

  1. Menudo troll que está hecho dalmegnu. Vamos a ver, yo no conozco todos los hosts basura que hay en internet, ademas ese archivo tiene un huevo ( 16308 ), como comprenderás, semejante recopilación no le he hecho yo. Lo saqué de una rom de android especifica que habia para mi móvil, la cual traia bloqueos para la publicidad.

    Saludos !!

    1. Buen post también el tuyo. He estado siguiendo unos cuantos enlaces y he dado con unas buenas recopilaciones. Se me ocurre una idea bastante buena : ¿ Que tal si pillamos todas estas recopilaciones, las juntamos y eliminamos los hosts duplicados ?. Voy a ponerme a ello …

      Saludos !!

  2. ATENCIÓN : Acabo de actualizar el post con un fichero más gordo que si que me he currado yo a base de recopilar de varias páginas, eliminar espacios y tabuladores sobrantes con cut, tr, grep, etc, ordenar y eliminar duplicados con sort y uniq y este tipo de cosas. Abajo del post hay una sección «ACTUALIZACIÓN:» ahi está

  3. me abia resistido a probar estas cosas, que poco sabes juan emacs, que poco sabes… gracias por insistir

      1. las unicas faltas de hortógráfiah que me valen son las del compilador, lo demas son mariconadas.
        bahhh el lenguaje esta vivo y se transforma segun quien lo use, asi que me considero un catalizador de posibilades para la evolucion( o no ) de la hortografia

        1. xD. Tienes razón al decir que el lenguaje no lo inventa la RAE sino que lo inventan las personas que lo hablan, pero aun así ahorrarse ciertos dolores de hojos no está de más. Por otra parte, te copio tu frase «las únicas faltas de ortografía que me valen son las del compilador» …

          Saludos !!

  4. Hola a tod@s! Esto se puede/debe tomar como reemplazo a adblock o ublock (el que uso ahora)? O pueden/deben convivir con los citados?
    Por otra parte, me parece que este artículo, como algún otro, sobreestima a l@s lectoras! Es decir, dan por sentado que todas o la mayoría sabemos totalmente de qué va el artículo/tema que tratan o vamos a poder realizar los tutoriales que brindan sin más. En mi caso estoy entre l@s que no están en chance de hacerlo sin más detalles, por lo que va mi pregunta de novaton (je!). Cuando ponen

    cat fichero >> /etc/hosts

    Debemos reemplazar «fichero» por el nombre del archivo que descargamos o efectivamente poner fichero?

    1. efectivamente debemos reemplazar «fichero» por el nombre del archivo descargado,
      lo de >> es que se agregara al final del fichero /etc/hosts

    1. Bueno DTULF, intentaré hacerlo lo más comprensible posible para los no iniciados, pero aun así yo creo que está bastante claro que fichero es el nombre y no es una expresión literal. Un sistema gnu/linux nada más instalarlo tiene todos los nombres de sus binarios, funciones y demás en inglés, así que es de suponer que ningún fichero o comando del sistema se va a llamar «fichero» y que por lo tanto hay que sustituirlo …

      Por otra parte, claro que puede convivir con adblock, ublock o lo que quieras. Esto lo unico que va a provocar es que tu ordenador no pueda conectar con esos dominios basura, quitandote problemas. Y si consigue conectar con alguno basura que no esté registrado en este blacklist, seguramente ublock te lo pille, así que es muy buena combinación.

      Saludos !!

  5. Hola
    ningun@ nos conocemos 25000 sitios basura en internet, … pero, ¿cómo evitamos que nos cuelen en esa lista sitios que no son basura?

    He encontrado que piwik.org está dentro de la lista, por si queréis corregirlo. espero que no haya muchos más gazapos y, sobre todo, espero que realmente sean gazapos.

Deja una respuesta

Your email address will not be published. Required fields are marked *

To create code blocks or other preformatted text, indent by four spaces:

    This will be displayed in a monospaced font. The first four 
    spaces will be stripped off, but all other whitespace
    will be preserved.
    
    Markdown is turned off in code blocks:
     [This is not a link](http://example.com)

To create not a block, but an inline code span, use backticks:

Here is some inline `code`.

For more help see http://daringfireball.net/projects/markdown/syntax