Solución definitiva para evitar el tráfico spam en Analytics
En este post te cuento como evitar de forma definitiva todo el tráfico spam proveniente de sitios como social-buttons.com, googlsucks.com, theguardlan.com, www.Get-Free-Traffic-Now.com o buy-cheap-online.info, entre otros.
Si estás cansado de que en Google Analytics no paren de entrar visitas spam desde Rusia o desde sitios como social-buttons.com o similares. Si ya tienes filtros en Google Analytics, pero continuamente los tienes que actualizar para que excluyan a los nuevos sitios spam que continúan apareciendo, en este post te detallo una solución sencilla y definitiva que hará que no tengas que volver a preocuparte nunca más del tráfico spam.
¿No te lo crees? Te invito a que sigas leyendo.
¿Por qué una nueva solución para evitar el tráfico spam en Google Analytics?
Este es el tercer post que escribo sobre este tema. A finales de diciembre te contaba cómo eliminar el referrer spam y a finales de enero publicaba una guía más detallada en la que respondía a algunas de las dudas que me habían planteado en el post inicial y actualizaba la solución incluyendo un filtro para evitar el tráfico spam que se camuflaba en forma de falsas búsquedas orgánicas.
Estas soluciones están bien, pero requieren estar al tanto de si hay nuevas visitas spam desde Rusia debidas a la aparición de nuevos sitios spam.
Cuando detectamos un nuevo sitio spam tenemos que incluirlo en el patrón del filtro de Google Analytics que estemos utilizando para excluir el tráfico spam. Además tenemos que actualizar el segmento que estemos utilizando para visualizar los datos de Google Analytics sin la distorsión que producen las visitas spam, para que no tenga en cuenta las visitas del nuevo sitio spam.
Desde finales de enero han aparecido al menos los siguientes sitios o dominios spam, todos ellos propiedad de nuestro ya conocido Vitaly Popov. Un tío plasta donde los haya.
- googlsucks.com
- humanorightswatch.org
- theguardlan.com
- 4webmasters.org
- o-o-6-o-o.com
- s.click.aliexpress.com
- bestwebsitesawards.com
- addons.mozilla.org
Todo el tráfico falso que se registra en Google Analytics como proveniente de estos dominios se podría evitar con un filtro que excluya todo el tráfico proveniente desde Rusia, pero el problema es que en marzo han aparecido nuevos dominios spam, y en este caso no son propiedad de Vitaly Popov.
Los nuevos dominios spam son social-buttons.com (y todas sus variantes), www.Get-Free-Traffic-Now.com y buy-cheap-online.info, entre otros. Las visitas spam de estos dominios se registran como provenientes de países como Estados Unidos, Reino Unido, Francia, Japón, Australia, China, Croacia, Polonia, Rusia, Brasil, Suiza, España, India, Méjico, etc., y además en muchos casos el campo País muestra el valor “(not set)”. Esto hace que un filtro que excluya todo el tráfico proveniente de Rusia ya no funcione.
¿Se pueden añadir todos estos nuevos dominios spam en el patrón del filtro que utilizamos para evitar el tráfico spam? Por supuesto que sí, y sigue siendo una solución que aún funciona. Lo malo de esta solución es que continuamente vas a tener que estar actualizando el filtro para incluir en el patrón los nuevos dominios spam que vayan apareciendo. Y tendrás que hacer lo propio en el segmento que utilizas para ver las estadísticas sin las visitas spam. Vamos, un coñazo.
¿Cómo evitar todo el tráfico spam en Google Analytics de una vez por todas?
En el post Guía para evitar el referrer spam de blackhatworth.com, darodar.com y ilovevitaly.com ya te adelanté que una forma de evitar todo el tráfico spam, tanto el referrer spam como el camuflado en falsas búsquedas orgánicas, era excluir todo el tráfico que en el campo Nombre de host tuviera un valor distinto de la URL de nuestro sitio, en mi caso www.jarfer.com, o de algunas excepciones como jarfer.us9.list-manage.com (lista de correo de MailChimp), translate.googleusercontent.com (traductor de Google) o webcache.googleusercontent.com (caché de Google).
Puedes comprobar tú mismo que todo el tráfico spam registrado en Google Analytics tiene en el campo Nombre de host valores distintos de la URL de tu sitio y de cualquiera de las excepciones indicadas en el párrafo anterior.
Para hacer esta comprobación vete a Informes y en el menú de la izquierda pincha en Audiencia. Dentro de Audiencia pincha en Tecnología y dentro de Tecnología en Red. Por defecto se mostrarán las visitas agrupadas por Proveedor de servicios. En Dimensión primaria selecciona Nombre de host.
La solución sencilla y definitiva que he aplicado desde el 1 de abril para evitar todo el tráfico spam en Google Analytics se basa en un filtro que únicamente incluye el tráfico que en el campo Nombre del host cumpla con la siguiente expresión regular:
jarfer\.com|translate\.googleusercontent\.com|webcache\.googleusercontent\.com|jarfer\.us9\.list\-manage\.com
Si quieres aplicar esta solución tendrás que cambiar “jarfer\.com” por la expresión regular correspondiente a la URL de tu sitio y revisar el resto de excepciones.
En la siguiente imagen puedes ver los detalles del filtro. Fíjate que se trata de un filtro de inclusión de tráfico y no de exclusión.
Para evitar problemas te recomiendo que este filtro lo pongas el primero dentro del orden de ejecución de los filtros.
¿Por qué es una solución definitiva?
Porque con un único filtro, que no hay que actualizar para añadir una nueva condición cada vez que aparece un nuevo sitio spam, se evita todo el tráfico spam basado en visitas fantasma, es decir, aquellas que no acceden a nuestro sitio sino que se insertan directamente en Google Analytics.
En el caso de las visitas spam que no hayamos evitado y que se sigan mostrando en Google Analytics porque sean anteriores al filtro, podemos utilizar un segmento que incluya sólo el tráfico que en el campo Nombre de host cumpla con la expresión regular indicada más arriba.
En la siguiente imagen puedes ver los detalles del segmento.
Un último consejo
Cuando trabajes con filtros te aconsejo que tengas en Google Analytics una vista adicional o de respaldo que no tenga ningún filtro. De esa forma si alguno de los filtros que utilizas en tu vista principal no está configurado correctamente y excluyes de la vista tráfico que no deberías excluir, siempre podrás ir a la vista de respaldo para comparar, ver si tus filtros funcionan correctamente y tener información de absolutamente todo el tráfico que se registra en Google Analytics para tu sitio.
###
Si no estás de acuerdo con algo de lo que te he contado o crees que puedes aportar algo al post, no te cortes y deja un comentario. Si necesitas ayuda con este tema, deja un comentario con la descripción de tu problema y contestaré con la mejor solución que pueda aportar en cuanto tenga un hueco.
Échame un cable y comparte este post en las redes sociales porque creo que puede ayudar a que mucha gente solucione este problema del tráfico spam. Muchas gracias.
Hola
Me he topado con tu articulo cuando buscaba una solución al trafico Spam que recientemente he comenzado a recibir en mi blog. Desde hace un tiempo incluí un código html que incluía las ip de webs spam que llegaban a mi blog, pero actualmente a regresado. El trafico es todo desde Rusia, pero no quiero colocar un filtro geográfico por que si que tengo trafico real desde Rusia ya que publico para artículos para constructores de motos rusos.
He pensado en usar la solución que comentas de en lugar de excluir,,,incluir solo el trafico concuerde con un host predeterminado. Mi duda viene ahora. Mi dominio no esta personalizado, por que no se si en la expresión que comentas tengo que incluir el blogspoto o no?
lsrbikes.blogspot.com|translate.googleusercontent.com|webcache.googleusercontent.com|lsrbikes.blogspot.us9.list-manage.com
Esto estaría bien?
Mi blog es http://lsrbikes.blogspot.com.es/
Espero tu respuesta y muchas gracias de ante mano.
Un cordial saludo
Jose Luis
Hola Jose Luis, lo mejor es que compruebes en Google Analytics cuáles son los nombres de host válidos de las visitas a tu blog que no sean spam. Tal y como indico en el post debes hacerlo en Audiencia, luego en Tecnología, y finalmente en Red. Dentro de Red selecciona Nombre de host como dimensión primaria. Pincha en la segunda imagen del post para ver en detalle cómo hacerlo. Te recomiendo que obtengas los nombres de host para todas las visitas de un rango de fechas más o menos amplio, por ejemplo un año, de forma que no dejes sin incluir en el patrón del filtro ningún nombre de host válido.
Cuando se trata de blog en Blogger, como es tu caso, la expresión regular a incluir en el patrón del filtro es de la forma «\.blogspot» sin el «\.com», ya que en Blogger el nombre de host varía dependiendo del país de origen de la visita y en algunos casos se incluye el «.com» y en otros, como por ejemplo para las visitas que vienen de Méjico, no.
En el caso de tu blog el nombre de host si te visitan desde España es lsrbikes.blogspot.com.es. Sin embargo, si te visitan desde Méjico es lsrbikes.blogspot.mx. Observa que en este segundo caso no lleva «.com».
Por lo tanto, para tu blog la expresión regular debería ser al menos la siguiente:
lsrbikes\.blogspot|translate\.googleusercontent\.com|webcache\.googleusercontent\.com
He visto que no usas MailChimp en tu blog, por lo que no es correcto incluir «|lsrbikes.blogspot\.us9\.list\-manage\.com», aunque si lo incluyes tampoco pasaría nada, pero mejor no poner expresiones regulares innecesarias y que lo único que hacen es añadir complejidad al filtro. En mi caso lo incluyo porque yo sí utilizo MailChimp en mi blog y ese es el nombre de host de las visitas que llegan desde la lista de correo.
Por último, deberías revisar en Google Analytics todos los posibles nombres de host válidos, tal y como te he indicado, por si en tu caso hay algún nombre de host válido adicional que deberías incluir en la expresión regular. Seguramente no, pero mejor si lo compruebas.
Finalmente te dejo tres consejos que seguramente te puedan ayudar:
1) Recuerda que se trata de un filtro que incluye tráfico, por lo que cuando lo configures deberías seleccionar la opción «Incluir» en Tipo de filtro.
2) Pon este filtro el primero en la lista de filtros, ya que el orden en el que se ejecutan los filtros es importante.
3) Tal y como indico al final del post ten una vista adicional de respaldo sin ningún filtro para que puedas comparar ambas vistas (con y sin filtros) y ver si este filtro te funciona correctamente o está dejando de incluir tráfico válido proveniente de alguna fuente que no hayas tenido en cuenta en el filtro.
Espero que haya resuelto todas tus dudas. Si no es así ponte en contacto conmigo a través del correo blog@jarfer.com y trataré de ayudarte lo mejor que pueda.
Recibe un cordial saludo y muchas gracias por comentar. Espero verte pronto por aquí.
Consulta: y si trabajo con mailchimp y cdn u otros generadores de tráfico como los incluyo?
Hola Héctor, comprueba en Analytics cuáles son los nombres de host que se corresponden con visitas que no sean spam. Tal y como indico en el post debes hacerlo pinchando en Audiencia, luego en Tecnología, y finalmente en Red. Dentro de Red selecciona Nombre de host como dimensión primaria. De esta forma podrás identificar cuáles son todos los nombres de host válidos que debes incluir en el patrón del filtro. Esto incluirá el nombre de host correspondiente a MailChimp.
Muchas gracias por tu comentario.
Hola.
Gracias por tu post.
Lo cierto es que no acabo de pillarlo. En la línea de inclusión que has puesto te refieres únicamente a google translate. ¿Por lo tanto solo aceptas vistas que te lleguen de Google Translate?
¿por que tu ejemplo hace mención a solo ese host?. ¿No incluyes uno para tu URL?
Aclaramelo por favor porque no acabo de pillarlo.
Muchas gracias
Hola David, la expresión regular del filtro es la siguiente:
jarfer\.com|translate\.googleusercontent\.com|webcache\.googleusercontent\.com|jarfer\.us9\.list\-manage\.com
Como puedes ver, la primera condición de la expresión regular es «jarfer.com», por lo que sí incluyo el nombre de host de mi blog.
Espero haberte aclarado tu duda y muchas gracias por comentar.
Saludos.
Hola Jarfer,
Gran aporte. Este tema me traía de cabeza y he aplicado tu solución a todos los sitios que gestiono con analytics. De aquí he podido descubrir algo raro que me pasa con dos dominios:
En uno de ellos todas las fuentes de spam tienen como host el mismo dominio de la web con las tres w (www.midominio.com).
En el otro todas las fuentes de spam tienen el host el dominio de la web sin las tres w (midominio.com) mientras que las fuentes licitas tienen como host el dominio con las tres w (www.midominio.com).
Las fuentes spam son:
Sitio 1: best-seo-offer.com, buttons-for-website.com, buttons-for-your-website.com y best-seo-solution.com
Sitio 2: best-seo-offer.com, buttons-for-your-website.com, (direct), buttons-for-website.com, best-seo-solution.com, gettinmobile.net, semalt.semalt.com
Aparte, he podido ver que en algunos casos las fuentes spam tienen como host (not set).
¿Sabes a qué puede ser debido que el host de los spammers sea el mismo que el dominio del sitio?
Un saludo
Hola Kim, muchas gracias por tu comentario.
No se me ocurre por qué en ese par de casos que me comentas el nombre del host del tráfico spam coincide con el del sitio. Quizás porque se trata de un ataque spam más elaborado y, o bien sí acceden a tu sitio, o bien previamente han accedido para obtener el código de Google Analytics y lo han ligado al nombre de host correcto en el momento de hacer el ataque.
Lo primero que te recomiendo que hagas es que revises los logs del servidor de tu alojamiento para comprobar si esas visitas spam acceden a tu sitio.
Saludos.
Hola Jarfer,
Gracias a tu post ya quité el referral spam, pero este fin de semana, una web que no he promocionado (la misma que tenia el spam) ha pasado de 0 visitas directas a 149. ¡Imposible!
¿Nos hayamos ante un caso de direct spam? La mayoría son con «/» de página de destino (130) y las otras 13 son hacia /youporn-forum.uni .me que por supuesto no existe esa url en mi web
¿Qué puedo hacer si es tráfico directo?¿A alguien más le ha pasado?
Hola Bernardo, ¿has comprobado en los logs del servidor de tu alojamiento si ese tráfico spam accede realmente a tu web? Si es así puedes denegar el acceso a tu web para la dirección IP origen de los ataques configurando adecuadamente el archivo .htaccess. Hay un montón de ejemplos en Internet de cómo hacerlo, pero si necesitas ayuda no dudes en ponerte en contacto conmigo. Puedes enviarme un correo a blog@jarfer.com.
Saludos.
Comprobado, sí que parecen acceder a la web. He comprobado la procedencia de las ips y eran casi todas de EEUU y sin web de referencia, es decir no han llegado ni por google ni por links, son directas. Como no tengo familia allí ni fans que me quieran tanto tendré que aceptar que es spam xD Gracias Jarfer, me controlo bien con el .htaccess, un detalle 🙂
Gracias a ti Bernardo.
Pues si. Esto es direct spam. Una vez resuelto el del referral ahora cada vez detecto a mes gente le está pasando esto. Incluso a mi. Estoy teniendo muchas visitas direct. Lo único que puedo saber de ellas es que vienen de EEUU, pero no de qué zona de EEUU, que van al «/» y que no están ni un segundo. Así que no se cómo bloquearlas. Pero tampoco entiendo el sentido de este spam: ¿a quién me lleva?¿alguien gana algo con esto? Entonces no es spam, sería casi la definición de virus.
Jarfer, yo he de investigar esto, ya lo hice con el referral y fue muy bueno, al poner el post en mi blog lo peté de entradas, lo que pasa es que esta no es la motivación de mi web. Pero he de solucionarlo, pierdo el control de las visitas.
A mi también me está pasando mucho, no le veo ningún tipo de sentido, un huevo de visitas directas de EEUU de pronto ya que está solucionado el tema del referal spam, si tenéis alguna noticia con respecto a este tipo de spam, por favor, compartidla, yo también lo haré si encuentro algo. Por si queréis, no tengo problema tampoco en que me contacteis en antonio@alesiadev.com. La verdad es que me está volviendo loco a mi y a bastantes de mis clientes.
Por cierto, jarfer, gracias por la aportación, un post genial.
Gracias a ti por tu comentario Antonio.
Hola José Manuel, a mí afortunadamente no me está pasando ese problema del direct spam.
He estado dándole vueltas al tema sin llegar a ninguna conclusión definitiva. Podría tratarse de crawlers de buscadores, pero es muy raro que sólo accedan al home.
Saludos.
Hola hola.. muchas gracias por la información entregada.
he aplicado los procedimientos de los filtros… como excluir los referrer Spam, e Incluir mi hostname, claramente de forma separada… en ambos casos deja de contar las visitas y 0 en visitas de tiempo real… he realizado diferentes pruebas…
me di cuenta que los referrer spam proviene de dos IP, lo cual me hace pensar que seria mejor filtrarlo por IP, mi pregunta es: ¿ de que forma seria mejor: por filtro o por .htaccess??? ademas ¿ se puede eliminar del informe ? Gracias !
Hola Daniel, si las visitas no acceden a tu sitio tratar de denegarlas en el .htaccess no servirá de nada. Si por el contrario acceden, evitarlas en .htaccess es la mejor opción porque evitas también que se registren en Analytics.
Respecto a la pregunta sobre si se pueden eliminar las visitas spam del informe, la única manera de que no desvirtúen las estadísticas es creando un segmento que no las tenga en cuenta.
Saludos.
Hola! Muchas gracias por tu post! Desde mi Google Analytics gestiono varias cuentas para diferentes dominios. He creado el filtro para una de ellas, pero cuando he querido configurar el filtro para otra de las cuentas, directamente me aparece el mismo filtro. ¿Existe alguna solución? Gracias!
Hola Hola… eso esta bien, ya que el mismo filtro aplica para los diferentes dominios registrados en tu analitycs bajo una misma cuenta. Revisa que el id de la cuenta no sea la misma en los diferentes dominios.
Si creaste una cuenta para cada dominio y aplicas los filtros de forma independiente, no deberías tener inconvenientes.
Exito !!!
Muchas gracias por tu aportación Daniel.
Hola,
yo estoy tratando de poner filtros y me dice esto: Este filtro no habría cambiado tus datos. Puede que la configuración del filtro no sea correcta o que el conjunto de datos sea demasiado pequeño.
Y es que en el informe tengo spam por todo lado tanto como youporn-forum.uni y muchas más de japon, rusia , brasil, eeuu. Bueno no entiendo muy bien lo de la expresión regular del filtro, como seria para mi página?
gracias
Karina
Hola Karina, para tu página el filtro sería azucenaartefloral\.com|translate\.googleusercontent\.com|webcache\.googleusercontent\.com
Es importante que tengas en cuenta que se trata de un filtro de inclusión de tráfico y no de exclusión. Puedes probar primero con una vista de respaldo, tal y como explico al final del post.
Saludos.
Perdona que sea tan plasta por preguntar tanto, vi que comentaron algo sobre la pagina youporn-forum.uni como me quito este?
muchas gracias
De plasta nada Karina, todo lo contrario. En teoría si se trata de tráfico spam que inyecta visitas falsas en Google Analytics, con el filtro que te he indicado debería quedar resuelto.
Pruébalo y me dices.
Saludos.
Por ahora el tema del spam, lo puedo solucionar de forma artesanal. Cuando empiece a tener fama, le volveré a echar un vistazo a este artículo.
Gracias por tu comentario Jerby.
Saludos.
Hola,
He encontrado otra solución que pasa por hacerlo desde el htacces, aplicándose desde el momento que se modifique obviamente.
Para la consulta de Analytics habría que seguir aplicando los filtros comentados.
¿Es una buena solución hacerlo desde htaccess o al incluir muchos dominios para bloquearlos desde allí puede ralentizar la web?
¿Alguien ha probado este sistema http://bloquearenlaces.blogspot.com.es/?
Saludos.
Hola Jose, para las visitas spam provenientes de sitios como social-buttons.com, www .Get-Free-Traffic-Now .com, buy-cheap-online .info o www .event-tracking .com o las provenientes desde Rusia de los sitios de Vitaly Popov establecer filtros de denegación en el fichero .htaccess no sirve de nada, ya que todas estas visitas realmente no acceden al sitio atacado sino que se registran en Google Analytics como si realmente fueran accesos al sitio atacado, pero se trata en todo caso de visitas falsas.
Por lo tanto, lo único que puedes hacer es establecer filtros y segmentos en Google Analytics para que no se tengan en cuenta estas falsas visitas spam.
Saludos.
Hola Jarfer,
Me parece una muy buena práctica para evitar el spam utilizar el filtro incluir sólo el hostname.
Mi pregunta es ¿no te ahorrarías la expresión regular si utilizas el filtro predefinido: incluir solo/ tráfico al nombre del host/ que contienen «Nombre del host»: «jarfer»
A mi me está funcionando, pero igual se me escapa algo.
Gracias y un saludo
Ya veo que hay 2 hosts que no incluyen jarfer, entonces no hay más remedio que utilizar expresión regular, ¿verdad?:
jarfer|translate\.googleusercontent|webcache\.googleusercontent
Saludos!
Hola, es necesario establecer la expresión regular, sobre todo si no quieres que se deje de registrar tráfico que accede a tu sitio desde el traductor de Google; a mí me llega tráfico desde Brasil y Portugal, poco pero algo llega.
Efectivamente la parte del dominio, en mi caso jarfer, se puede simplificar aún más quitando el «.\com».
Saludos y muchas gracias por tu comentario.
Hola Jarfer
Fantástico artículo, muchas gracias por compartir tu experiencia.
En mi caso, sin embargo, no puedo utilizarlo porque estoy analizando una aplicación móvil, en vez de un blog, por lo cual no tengo urls.
¿Cómo puedo hacerlo?
Muchas gracias. Un saludo
Jorge
Hola Jorge, no tengo los detalles de tu caso, por lo que no creo que te pueda ayudar.
¿Tu aplicación móvil accede a algún sitio web? Si no tienes urls, ¿cómo es que se registra tráfico spam en tu Analytics?
Saludos.
Hola de nuevo Jarfer! Tras leer el otro artículo sobre todo esto, he terminado también aquí. He configurado todo lo que has dicho (segmentos, filtros tanto de exlusión como inclusión para ir probando todo) y en principio todo bien.
Pero… yo tb he notado un aumento de tráfico directo desde eeuu que no tiene sentido.
¿Alguien ha encontrado solución? Gracias!
Hola Natalia, me alegro de que mis posts te hayan sido de utilidad.
Respecto al aumento de tráfico directo que indicas podría deberse a tráfico de bots de los buscadores. Existe una opción a nivel de vista que excluye todas las visitas de robots y de arañas conocidos. Yo la tengo activada.
Saludos.
sí sí, eso ya está activado!
Pero esto no evita el tráfico spam, esto lo que hace es ocultarlo para no verlo en las estadísticas. Pero llegar, llega
Hola María, el tráfico spam de los sitios rusos de Vitaly Popov o el de sitios como social-buttons.com, www .Get-Free-Traffic-Now .com, buy-cheap-online .info o www .event-tracking .com no accede al sitio atacado. Se trata de visitas falsas que únicamente se registran en Google Analytics.
Para el tráfico spam que sí accede al sitio atacado, la solución consiste en denegar el acceso mediante configuración en el fichero .htaccess.
Saludos.
[…] aparecen nuevas direcciones que lanzan visitas fantasma, de modo que hay que actualizar la lista de exclusión […]
Hola Jarfer
Soy nuevo en esto del diseño web y estoy con el mismo tema que todos aqui, desde hace un tiempo que veo que temos muchas visitas desde EEUU y Rusia. Tambien de todos los url que mencionas en tu blog. Mi pregunta es que tan danino para la web puede ser que entre este tipo de spam? Puede crear algun problema con el domino? joder el servidor? te pregunto que no tengo mucha idea.
Si es recomendable eliminar eso, por favor avisame que me pongo en contaña para sacarlo.
Otra pregunta, este pito de ingreso a la web, no genera un mejor posicionamiento en google? Disculpe mi ignorancia.
Saludos
Gabriel
Hola Gabriel, no hay nada que disculpar, todo lo contrario.
Respondiendo a tu pregunta, indicarte que este tipo de tráfico spam, al no acceder a tu sitio, no tiene ningún efecto ni en tu servidor ni en tu dominio. Tampoco afecta al posicionamiento ni de forma positiva ni negativa. El único efecto negativo de este tipo de tráfico spam es que desvirtúa los datos de Google Analytics al registrarse como si fuera tráfico real.
En el post anterior sobre este tema respondí con mayor detalle a estas cuestiones que planteas. Puedes encontrarlo en http://www.jarfer.com/guia-para-evitar-el-referrer-spam/
Saludos y muchas gracias por tu comentario.
Hola Jarfer.
Genial tu artículo. Creo haber entendido todo lo que explicas. Hemos aplicado el filtro a nuestra web, hace una semana aproximadamente, pero seguimos registrando visitas que no provienen de nuestro host. Entiendo que entonces la opción es modificar el archivo .htaccess y denegarles el acceso.
El problema y mi pregunta es: ¿cómo hacemos para bloquear los accesos que Google analytics marca como ‘not set’? ¿Son visitas de proxies? Me dicen que no se puede hacer nada contra eso, contra las visitas a través de proxy. ¿Es verdad?
¿Y qué hacemos con web.archive.com? No lo has mencionado en ningún momento. Entiendo que de momento no son sospechosos de nada que nos deba preocupar, ¿no?
Muchas gracias por esta interesantísima retahíla de comentarios y respuestas. He aprendido mucho.
Hola Oriol, tal y como indicas, la mejor solución para evitar el tráfico spam que sí accede a tu sitio web, y que por lo tanto no son visitas fantasma sino visitas reales, es denegar el acceso a ese tráfico mediante configuración en el archivo .htaccess.
Yo no me preocuparía por las visitas marcadas como ‘not set’, ya que suelen ser visitas reales y si han pasado el filtro de inclusión por Nombre de host que indico en ese post seguramente sean visitas totalmente válidas.
Lo mismo en cuanto a las visitas provenientes de web.archive.com, es decir, si el Nombre de host de esas visitas en Google Analytics es el de tu sitio, seguramente sea tráfico real y no spam.
Me alegro de haberte podido ayudar, y muchas gracias por tu comentario.
Saludos.
Hola, que tal, ¿con este filtro no estarías quitando las referencias obtenidas de otros sitios webs, facebook, twitter y otras redes sociales, además de otros motores de búsqueda como bing?
¿No estaríamos dejando de lado ese tráfico válido?
Saludos !!
Hola Menorah, con este filtro sólo se excluye tráfico spam. Puedes comprobarlo creándote una vista de backup sin ningún filtro y cotejando el tráfico que se excluye mediante el filtro. Verás que el tráfico que no es incluido por el filtro, y que por lo tanto queda excluido de la vista con el filtro, es únicamente tráfico spam proveniente de dominios spam ya comentados en éste y otros posts anteriores que he publicado sobre este tema.
Saludos.
Muchísimas gracias Jafer, esto ha limpiado bastante mi analytics!!!!!
Aun veo algunas que no quiero ni mencionar por no hacer propaganda (que pesados…) Entiendo que las webs que no se han limpiado sí acceden realmente , es así? Que harías para acabar de limpiar, filtros de exclusión individuales ¿?
Gracias de nuevo de verdad.
Oriol
La verdad es una faena el tráfico spam, tengo un sitio totalmente nuevo (www.tecnologiaenlared.com) y me muestra de estas famosas fuente share-buttons etc.. mas de 70 visitas diarias, cuando aun en el blog hay 3 post, ya esta creado hace una semana aproximadamente, acabo de aplicar este método que me indicas y espero que elimine todo ese tráfico fantasma, un gran post
Hola Daniel, cómo estás? Te comento que estas soluciones ya no funcionan porque el SPAM ha mutado en su manera de actuar. Te dejo la única solución definitiva que encontré para liberarme de los bots:
http://digodat.com/es/2015/07/21/solucion-definitiva-a-las-visitas-fantasma-falsas-spam-de-analytics/
Saludos!
Buenos dias,
me gustaría que me ayudaras con la expresión que debería aplicar en mi caso.
Recibo muchas visitas de buttons-for-website.com, o variantes.
Muchas gracias.
Hola a tod@s
Se que la pregunta puede ser un poco chorra, pero como creo una vista de respaldo para comparar?
Muchas gracias!
Hola Jarfer.
Como esta noticia ya es un poco antigua no sé si haces seguimiento de los comentarios.
Hace un mes apliqué los filtros que indicabas en tu artículo para eliminar este spam de las estadísticas, y la verdad que todo perfecto. La pega es que este Spam evoluciona y cada vez hay más fuentes y más elaboradas, y algunas parecen incluir también el dominio, por lo que pueden burlar el filtro. Además este filtro puede eliminar algunas fuentes que pueden ser válidas como archive.org.
Así que hace unos días he leído en la Comunidad de Google Adwords una nueva solución. Consiste en crear un «parámetro personalizado» en Analytics, de modo que sabemos las visitas reales porque incluirán ese parámetro. El resto que sean inyectadas artificialmente no lo contendrán. De esta manera añadimos luego un filtro de incluir sólo las que contienen ese parámetro y listo.
Lo mismo puedes crear otro nuevo artículo con esta nueva solución.
Saludos.
Perdón por incidir en algo que ya se ha comentado, pero a pesar de haber puesto en práctica lo de este post (inclusión) y lo de post anteriores (exclusión), sieeeeempre que verifico el filtro recibo el mensaje de que no hubiera habido cambios aplicándolo.
No entiéndo que puedo estar haciendo mal.
Gracias.
Hola Jarfer,
te felicito por el articulo, esta muy bien explicado y es muy interesante.
Siento reconocer que para los que tenemos el nivel «soy nuevo y no me entero de nada», es aun así complicado.
Tengo trafico de: floating-share-buttons.com / referral – http://www.Get-Free-Traffic-Now.com / referral – http://www.event-tracking.com / referral – free-social-buttons.com / referral – e-buyeasy.com / referral – erot.co / referral – forum.topic63374041.darodar.com / referral – chinese-amezon.com / referral.
Soy un Español que a emigrado a Holanda por motivos que todos conocemos, y acabo de crear mi empresa aquí, y claro para mi es muy importante ahora conocer los datos de analytics, y que sean fiables.
Te importaria salvarme la vida y explicarme «para tontos» como seria mi formula y como hacerlo?
Y lo de la opción de las arañas y robots por favor, no lo encuentro !!
Muchísimas gracias de antemano por tu tiempo.
Saludos.
Hola, mil gracias por este magnífico post (twitteado queda).
Me queda una duda, mi filtro sería igual que el tuyo pero donde pone jarfer, poner el nombre d emi blog, correcto?
jarfer.com|translate.googleusercontent.com|webcache.googleusercontent.com|jarfer.us9.list-manage.com
>> El mío sería: mllespinosa.com|translate.googleusercontent.com|webcache.googleusercontent.com|mllespinosa.us9.list-manage.com
Simplemente confirmar contigo que sólo tendría que hacer dos sustituciones. Mil gracias otra vez!
[…] – Soluciones para eliminar el tráfico Referral Spam de Google Analytics – Solución definitiva para evitar el tráfico spam en Analytics […]
[…] Kanela y Limón. Solución definitiva para evitar el tráfico spam en Analytics – Jarfer. […]
[…] Keywords / http://www.infojus.gov.ar / Web CEO Online. Tutorial Screaming Frog SEO Spider en español – Rocío Miró. 5 herramientas SEO para optimizar tus contenidos. Novedades sobre SEO y Marketing Online. Agencia de Posicionamiento Web en Lima. Solución definitiva para evitar el tráfico spam en Analytics – Jarfer. […]
[…] Solución definitiva para evitar el tráfico spam en Analytics […]
Solo quería darte las gracias, me has quitado dolores de cabeza :). Muchas gracias!
Buenos dias Jarfer,
he leido un post tuyo sobre como excluir listas de spam en Google Analytics, que he encontrado muy interesante, pero tengo algunas dudas:
1.- Mi sitio web se llama http://www.euro-microscopes.com/
2.- He ido al apartado Audiencia/Tecnologia/Red/Nombre del host y allí no me sale direcciones spam, simplemente las siguientes:
http://www.euro-microscopes.com
(Not set)
translate.googleusercontent.com
googleusercontent.com
r.com
R.com y Not Set si podrian constituir Spam, pero nada más
3.- Voy a Adquisición/Todo el tráfico/Fuente-Medio y me aparece todo el spam: floating-share-buttons, get-free-social-traffic,etc
4.- Aplico el filtro siguiente inclusivo (dime si es ok, por favor): euro-microscopes\.com|translate\.googleusercontent\.com|webcache\.googleusercontent\.com|euro-microscopes\.us9\.list\-manage\.com
5.- Voy a los apartados anteriores y todo sigue igual
Preguntas:
1.- Es normal que en el apartado tecnologia/red no me aparezca spam antes del filtro?
2.- Es correcto el filtro que he añadido?
3.- Como es que no ha cambiado nada una vez añadido el filtro?
Muchísimas gracias por tu ayuda,
Oriol Sellés
Hola Oriol, desde hace unos meses algunos spammers envían sus visitas spam con nombre de host translate.googleusercontent.com y combinaciones similares porque saben que de esa forma las visitas spam pueden pasar desapercibidas y conseguir que no sean excluidas por los filtros.
Por otra parte, he visto en tu sitio que no utilizas MailChimp. Si esto es así, no necesitas incluir en el filtro la cadena “euro-microscopes\.us9\.list\-manage\.com”.
Te recomiendo que utilices el siguiente filtro: euro\-microscopes\.com
Fíjate que además de ser un filtro mucho más simple que el que tú utilizas, he incluido el carácter “\” en el menos (“-“) del nombre de tu sitio.
Por último, ten en cuenta que el filtro comienza a excluir el tráfico spam desde el momento en el que lo creas, pero no elimina de tu Google Analytics el tráfico spam que se haya registrado antes de la creación del filtro. Para que el tráfico spam anterior a la creación del filtro no aparezca en las estadísticas de Analytics necesitas crear un segmento que sólo incluya las visitas cuyo nombre de host coincida con la expresión regular “euro\-microscopes\.com”.
Espero que esta respuesta te pueda ayudar a resolver tus problemas con el tráfico spam. Si sigues teniendo problemas no dudes en ponerte en contacto conmigo. Trataré de ayudarte tan pronto como me sea posible.
Saludos y muchas gracias por tu comentario.
Buenas noches Jarfer, ¡HELP!
Encuentro: theguardian.com translate.googleusercontent.com googleusercontent.com editors.choice22905550.hulfingtonpost.com
Y muuuuchos más…. uff
No estoy segura que hacer, ¿podría enviarte una pantalla impresa?
(Sniff- confundida)
Mil gracias por tu generosidad.
Edna
Esto realmente afecta al porcentaje de rebote y por lo tanto al posicionamiento supongo, ya que desvirtúa este dato y hoy día a Google le gusta que tengamos un porcentaje de rebote bajo. ¿O me equivoco?
Buenas noches Jarfer y compañía,
Mi blog es http://www.vuelvealasraices.esy.es
Como debería configurar en este caso la inclusión del filtro? Omito el .es?
Por otro lado, en nombre de host me aparece «not set». A que es debido?
Gracias,
[…] Habrá que ver si es verdad lo que dice este señor y es la solución definitiva. Ya comentaré. Origen: Solución definitiva para evitar el tráfico spam en Analytics – Jarfer […]
Hola, gracias por tremenda ayuda. Una consulta, se podría filtrar con la expresión » /?» sin comillas, y colocarle Excluir en el filtro?
Y lo otro, al aplicar esta solución de filtro en una vista nueva, empieza desde cero no con el historial cierto?
Muchas gracias
Hola Pablo, gracias por tu comentario.
Respecto al filtro que indicas, si no lo he entendido mal, creo que no va a funcionar. Lo mejor es que incluyas un filtro de inclusión como el que indico en el post.
Respecto a lo que preguntas de la vista nueva, efectivamente empieza a registrar datos desde que la creas. Los datos de fechas anteriores a la creación de la vista estarán a cero.
Saludos.
Genial el artículo. Han sido menos de 5 minutos y me has resuelto un problema importante. Me manejo bien con analytics para interpretar los datos; pero este avance en la lucha contra el tráfico spam ha sido el mejor de todos. Estaba harto de añadir sitios nuevos a la lista continuamente.
Lo del segmento sin sesiones spam una genial idea para filtrar datos antiguos.
En resumen. Me ha encantado tu artículo y tenía que dejarte este comentario. Es mi forma de agradecerte tu trabajo, eso y añadirte a la barra de marcadores… un aumento en tu tráfico directo 🙂
Saludos
Buenas,
Muy interesante tu entrada.
Tengo una duda, en la expresión >> jarfer\.com|translate\.googleusercontent\.com|webcache\.googleusercontent\.com|jarfer\.us9\.list\-manage\.com <> .com|webcache <<
Gracias
Hola, Jarfer, gracias por el post. El truco tiene muy buena pinta y lo voy a probar: acabo de instalar hoy el filtro. Ojalá funcione, si es así compartiré el post hasta que me mandes parar! 😉
Saludos
Hola de nuevo, Jarfer 🙂 Me contesto a mí misma, ya que creo que algo no va bien con este filtro. Ayer recibí una nueva suscripción en mi blog. Sin embargo, según la vista filtrada, tuve 0 visitas a mi web. Y me consta que la suscriptora no es spammer. ¿A qué podría deberse? No entiendo1
Saludos
[…] Inicialmente pensé fue filtrar excluyendo parámetros de la visita: que si el nombre del host, el sufijo de la URL de procedencia, incluso la ciudad que me enviaba las visitas (Samara). Pero una y otra vez de seguían colando los jaffer… Hasta que descubrí este enlace de Jarfer. […]
Hola!
Gracias por el post, la verdad es que ayuda mucho. Sin embargo, a mi me pasa una cosa bastante curiosa. Creo que tengo spam, pero no estoy seguro ya que al mirar el hostname todo parece estar en orden, pero al mirar la segunda dimensión «fuente/medio» me encuentro con lo siguiente: «eastads.simpli.fi / referral» y «adspreview.simpli.fi / referral». Hay algún modo de evitar este spam (en el caso de que lo sea)?
Gracias!!
He detectado hoy visitas raras y creo que es spam. Están demasiado tiempo en una web muy pequeña y proceden de EEUU.
En le lugar que indicáis (Audiencia > Tecnología > Red.) he detectado que todas las visita son de psinet inc.(proveedor de servicios), pero si en dimensión primaria pongo «Nombre de host» el que me indica es «depokemon.com» igual que la web.
¿Es spam con una artimaña para enseñarme mi nombre de dominio y que no lo bloqueé? Las visitas tengo claro que son spam
Buenísimo! Claro, conciso y para todos los lectores 🙂 Estaba en la búsqueda del mejor artículo de ayuda para evitar tráfico spam y di con el definitivo: el tuyo.
Sigue con el buen trabajo y gracias por el aporte.
Miguel
Muchas gracias por el post. Me chocaba tanto que tuviera interesados en mi calzado infantil desde Rusia que me he puesto a investigar un poco. De momento he incluido todas esas urls en el patrón del filtro de Google Analytics, con la forma definitiva me temo que aún no me atrevo. Además de los que mencionas, a mí me entraban por eva.ru a la que también “he capado”. Menudo mundo éste de la venta online, siempre pasándonos cosas.
En mi blog están apareciendo visitas desde Francia que al parecer son spam. NO SE COMO ARREGLAR ESTA SITUACIÓN.
[…] metidos en este berenjenal podéis ver cómo proceder en varios lugares de la red como seocom o Jarfer, y sinceramente espero que tengáis más suerte que yo; pero me da que llegaréis a la conclusión […]
Hola Jarfer. Los spam me tienen mi estadísticas dañadas.
Tu artículo es muy bueno. Pero no entiendo eso de la expresión regular.
Podrías ayudarme con la de mi sitio? Cuál sería?
https://sites.google.com/site/pemerac/home
Buenas
Muchas gracias por el artículo.
Recientemente he tenido muchos problemas con esto y además con SEO negativo, con lo que estoy peleando por otro lado.
En cuanto a esto, aplico el filtro de segmento e incluir pero lo que no me sale es crear la copia de vista con todos los filtros.
Es decir, cuando intento hacer una copia, la misma me sale con todos los datos de visitas vacios por lo que he hecho el filtro directamente en la unica version, la original, donde funciona.
¿Alguien ha tenido el mismo problema o tiene alguna idea de por qué puede pasar esto?