Las 5 mejores listas de proxy gratuitas para web scraping (2024)

Introducción

En este artículo, veremos lalos cinco principales sitios web de listas de proxyy realizar unpunto de referencia.

Si tiene prisa y desea ir directamente a los resultados,haga clic aquí.

La idea no es solo hablar sobre las diferentes características que ofrecen, sino también probar la confiabilidad con una prueba del mundo real. Miraremos ycomparar los tiempos de respuesta, los errores y las tasas de éxitoen sitios web populares comoGoogle y Amazon.

Hay untipo de proxypara satisfacer cualquier necesidad específica que pueda tener, y siempre puede comenzar con un servidor proxy gratuito. Esto es especialmente cierto si desea usarlo como un raspador de proxy.

Un servidor proxy gratuito es un proxy al que puede conectarse sin necesidad de credenciales especiales y hay mucho para elegir en línea. Lo más importante que debe tener en cuenta es lafuente del proxy. Dado que los proxies toman su información y la redirigen a través de una dirección IP diferente, aún tienen acceso a cualquier solicitud de Internet que realice.

Si bien hay muchos proxies gratuitos de buena reputación disponibles para el web scraping, hay tantos proxies alojados porpiratas informáticos o agencias gubernamentales. Está enviando sus solicitudes a un tercero y este tiene la oportunidad de ver todos los datos no cifrados que provienen de su computadora o teléfono.

Ya sea que desee recopilar información a través del web scraping sin que los sitios web rastreen sus bots o si necesitalímites de tasa de derivación, hay una forma de obtener privacidad.

Los proxies ayudan a mantener segura su actividad en línea al enrutar todas sus solicitudes a través de una dirección IP diferente. Los sitios web no pueden rastrearlo cuando no tienen la dirección IP original de la que provino su solicitud.

Incluso cuando encuentra un proxy gratuito confiable, todavía hayalgunos problemas con su uso. Podrían devolver respuestas increíblemente lentas si hay muchos usuarios en el proxy al mismo tiempo. Algunos de ellos no son confiables y pueden desaparecer sin previo aviso y nunca volver. Los proxies también pueden inyectar anuncios en los datos devueltos a su computadora.

En elcontexto de web scraping, la mayoría de los usuarios comienzan con un proxy gratuito. Por lo general, no envía información confidencial con sus solicitudes, por lo que muchas personas se sienten cómodas usándolas para este propósito. Sin embargo, es posible que no desee que un sitio web sepa que lo está extrayendo de sus datos.

podrías estar haciendoinvestigación de mercadopara aprender más sobre tu competencia a través del web scraping. También puede raspar a la web paraconstruyendo una lista de prospectos.

Muchos usuarios no quieren que un sitio web sepa de ese tipo de actividades. Una de las principales razones por las que los usuarios recurren a proxies gratuitos para el web scraping es que no planean hacerlo con frecuencia. Supongamos que vende un software a propietarios de restaurantes. Es posible que desee raspar una lista de restaurantes para obtener su número de teléfono. Esta es una tarea de una sola vez, por lo que es posible que desee utilizar proxies gratuitos para eso.

Puede obtener la información que necesita de un sitio y luego desconectarse del proxy sin ningún problema.

Si bien los proxies gratuitos songenial para web scraping, todavía no son seguros. Un proxy malicioso podría alterar el HTML de la página que solicitaste y darte información falsa. También corre el riesgo de que el proxy que está utilizando actualmente pueda desconectarse en cualquier momento sin previo aviso. Además, la dirección IP del proxy que está utilizando podría ser bloqueada por sitios web si hay muchas personas usándola por motivos maliciosos.

Los proxies gratuitos tienen sus usos y hay miles de listas disponibles con direcciones IP de proxy gratuitas y sus estados.Algunas listas tienen proxies de mayor calidad que otrasy también tiene la opción de usar servicios de proxy específicos. Aprenderá sobre varias de estas listas y servicios para ayudarlo a comenzar a buscar la mejor opción para su proxy scraper.

Las 5 mejores listas de proxy gratuitas para web scraping (1)


Lo sé, lo sé... Suena un poco agresivo hablar inmediatamente sobre nuestro servicio, pero este artículo no es un anuncio. Dedicamos mucho tiempo y esfuerzo a la evaluación comparativa de estos servicios, y creo que es justo comparar estas listas de proxy gratuitas con la API de ScrapingBee.

Si va a utilizar un proxy para raspado web, considere ScrapingBee. Si bien algunas de las mejores características están en la versión paga, puede obtener1,000 créditos gratis cuando te registras. Este servicio se destaca porque incluso los usuarios gratuitos tienen acceso al soporte y las direcciones IP a las que tiene acceso son más seguras y confiables.

Las funciones que ScrapingBee incluye en los créditos gratuitos no tienen comparación con ningún otro proxy gratuito que encontrará en las listas a continuación. Tendrás acceso a herramientas comoRepresentación de JavaScript ycromo sin cabezapara facilitar el uso de su proxy scraper.

Una de las mejores características es que tienenproxies rotativospara que pueda evitar los sitios web que limitan la velocidad. Esto lo ayuda a ocultar sus bots de proxy scraper y reduce la posibilidad de que un sitio web lo bloquee.

También puede encontrar fragmentos de código en Python, NodeJS, PHP, Go y varios para web scrapers. ScrapingBee incluso tiene su propia API, lo que facilita aún más el web scraping. No tiene que preocuparse por las fugas de seguridad o el funcionamiento lento del proxy porque el acceso a los servidores proxy es limitado.

Puedepersonalizar cosas como su geolocalización, los encabezados que se reenvían y las cookiesque se envían en las solicitudes, y ScrapingBee bloquea automáticamente los anuncios y las imágenes para acelerar sus solicitudes.

Otra cosa interesante es que si sus solicitudes devuelven un código de estado que no sea 200, no se le cobrará ese crédito. Solo tiene que pagar por las solicitudes exitosas.

Aunque el plan gratuito de ScrapingBee es excelente, si planea usar mucho los sitios web de raspado, deberá actualizar a un plan pago. Luego, por supuesto, si tiene algún problema, puede ponerse en contacto con el equipo para averiguar qué sucedió.

Con los proxies gratuitos en las listas a continuación, no tendrá ningún soporte. Usted será responsable de asegurarse de que su información esté segura y tendrá que lidiar con el bloqueo de las direcciones IP y las solicitudes que regresan dolorosamente lentas a medida que más usuarios se conectan al mismo proxy.

Resultados ()

Sitio weberroresObstruidoÉxitoTiempo promedio
Instagram4509553.3
Google8009208.30
Amazonas2209783.34
Las 300 mejores Alexa509953.34

2. Revisión de ProxyScrape

Las 5 mejores listas de proxy gratuitas para web scraping (2)


Si está buscando una lista de proxies completamente gratuitos,Proxyscrape es una de las principales listas de proxy gratuitas disponibles. Una característica realmente interesante es que puede descargar la lista de proxies a un.TXTarchivo. Esto puede ser útil si desea ejecutar muchos rastreadores de proxy al mismo tiempo en diferentes direcciones IP.

Tu puedes inclusofiltrar las listas de proxy librespor país, nivel de anonimato y si utilizan una conexión SSL. Esto le permite encontrar el tipo de proxy que desea usar más rápidamente que con muchas otras listas en las que tiene que desplazarse hacia abajo en una página, mirando las columnas de la tabla.

ProxyScrape incluso tienediferentes tipos de proxies disponibles. Todavía tiene acceso a los proxies HTTP y puede encontrar listas de proxies Socks4 y Socks5. No hay tantos filtros disponibles para las listas de calcetines 4 y calcetines 5, pero puede seleccionar el país que desea usar.

La API de ProxyScrape actualmente funciona con Python y solo hay cuatro tipos de solicitudes de API que puede realizar. Una cosa importante a recordar es queninguno de los proxies en ninguna de las listas que obtiene de este sitio web están garantizados para ser seguros. Los servidores proxy gratuitos pueden ser alojados por cualquier persona o entidad, por lo que utilizará estos servidores proxy bajo su propio riesgo.

Tienen un servicio premium disponible donde alojanproxies del centro de datos. Estos suelen ser más seguros que los gratuitos. Supervisan más estos proxies para asegurarse de que tenga un tiempo de actividad constante y que las direcciones IP no se agreguen a las listas de bloqueo.

Otra buena herramienta que tienen es uncomprobador de proxy en línea. Esto le permite ingresar las direcciones IP de algunos de los proxies gratuitos que ha encontrado y probarlos para ver si todavía funcionan. Cuando intentas hacer web scraping, quieres asegurarte de que tu proxy no se desconecte en medio del proceso y esta es una forma de vigilar la conexión.

Resultados ()

Sitio weberroresObstruidoÉxitoTiempo promedio
Instagram392592dieciséis25.55
Google9584474216.12
Amazonas445dieciséis53920.37
Las 300 mejores Alexa551144813.60

3. revisión de free-proxy.cz

Las 5 mejores listas de proxy gratuitas para web scraping (3)


Free-proxy.cz es uno delos sitios originales de listas de proxy gratuitos. No ha habido mucho mantenimiento en el sitio web, por lo que todavía tiene la interfaz de usuario de un sitio web de principios de 2000, pero si solo está buscando proxies gratuitos, tiene una gran lista. Una cosa que encontrará aquí que es diferente de otros sitios de listas de proxy es una lista de proxies web gratuitos.

Los proxies web generalmente se ejecutan enscripts del lado del servidor como PHProxy, Glype o CGIProxy. La lista también está prefiltrada para duplicados, por lo que no hay direcciones IP repetidas. Además, la lista de otros servidores proxy en su base de datos es única.

En la página de inicio hay una tabla con todos los proxies gratuitos que han encontrado. Puede filtrar los proxies por país, protocolo y nivel de anonimato. Puede ordenar la tabla filtrada por la velocidad del proxy, el tiempo de actividad, el tiempo de respuesta y la última vez que se verificó el estado. La tabla muestra los resultados paginados, por lo que aprovechar la función de clasificación le ahorrará algo de tiempo.

También hay una herramienta de "proxies por categoría" debajo de la tabla que le permite ver los proxies gratuitos por país y región. Esto hace que sea más fácil revisar la tabla de resultados y encontrar exactamente lo que necesita. Esta es la mejor manera de navegar por esta lista de proxies gratuitos porque hay miles disponibles.

Otra herramienta útil en este sitio es el"Información de su dirección IP"botón en la parte superior de la página. Le informará todo sobre la dirección IP que está utilizando para conectarse al sitio web. Le mostrará la ubicación, las variables de proxy y otra información útil sobre su conexión actual. Incluso llega a mostrar tu ubicación en Google Maps. Esta es una buena manera de probar un servidor proxy.

Este sitio no ofrece ningún servicio premium o pago, no hay garantía de que los proxies gratuitos que encuentre aquí estén siempre en línea o tengan medidas de seguridad para proteger sus actividades de extracción de proxy.

Resultados ()

Sitio weberroresObstruidoÉxitoTiempo promedio
Instagram654332143.74
Google96990313.74
Amazonas675332216.40
Las 300 mejores Alexa742025812.73

4. Revisión de GatherProxy

Las 5 mejores listas de proxy gratuitas para web scraping (4)


GatherProxy (proxygather.com) es otra excelente opción para encontrar listas de proxy gratuitas.Está un poco más organizado que muchas de las listas que encontrará en línea.. Puede encontrar proxies según el país o el número de puerto. También hay servidores proxy anónimos y servidores proxy web. Además, tienen una sección separada para listas de calcetines.

El sitio también ofrece varias herramientas gratuitas, como un raspador de proxy gratuito. Puede descargar la herramienta, pero no se ha actualizado en algunos años. Es un buen punto de partida si está tratando de construir un proxy scraper o hacer web scraping en general. También hay unComplemento integrado para GatherProxy que le permite agregar una lista de proxy gratuita a su propio sitio websi te seria de utilidad.

Si desea verificar su dirección IP o la información del navegador, también tienen una herramienta para mostrarle esa información. No es tan detallada como la información de la dirección IP que ves en free-proxy.cz, pero aun así te brinda suficiente información para encontrar lo que necesitas.

Otra herramienta que puedes encontrar en este sitio es el comprobador de proxy. Le permite encontrar, filtrar y verificar el estado de millones de proxies. Puede exportar todos los proxies que encuentre usando esta herramienta a varios formatos diferentes, como CSV. Hay algunos videos geniales en GatherProxy que le muestran cómo usar estas herramientas.

ElLa principal diferencia entre este sitio y muchos otros es que debe ingresar una dirección de correo electrónico antes de poder navegar a través de sus listas de proxies gratuitos.. Todavía es un servicio completamente gratuito, pero debe registrarse y obtener credenciales de inicio de sesión. Una vez que haga eso, podrá ver las tablas de proxies gratuitos y ordenarlos por una serie de parámetros.

También tienes la opción dedescargar las listas de proxy gratisdespués de ordenarlos y filtrarlos según sus criterios de búsqueda. Una buena característica es que actualizan automáticamente las listas de proxy constantemente para que no tenga que preocuparse por obtener una lista de direcciones IP obsoletas.

Resultados ()

(En el momento de escribir este artículo, este servicio no funcionaba)

5. revisión de freeproxylists.net

Las 5 mejores listas de proxy gratuitas para web scraping (5)


Freeproxylists esfácil de usar. La página de inicio muestra una tabla de todos los proxies gratuitos que se han encontrado. Como muchos de los otros sitios en esta publicación, puede ordenar la tabla por país, número de puerto, tiempo de actividad y otros parámetros. Los resultados están paginados, por lo que tendrá que hacer clic en varias páginas para ver todo lo disponible.

Tiene unfiltrado directoen la parte superior de la página para que pueda limitar el número de resultados que se muestran en la tabla. Si le preocupa usar un proxy de un país específico, puede ir a "Por país". Le mostrará una lista de todos los países que representan los proxies gratuitos y la cantidad de proxies disponibles para ese país.

Una desventaja es que ustedno podrá descargar la lista de proxy de este sitio web. Esta es probablemente una de las listas de proxy gratuitas más básicas que encontrará en línea para sus web scrapers. Sin embargo, este servicio tiene una buena reputación en comparación con las miles de otras listas disponibles, y los proxies que encuentras aquí al menos funcionan.

(Incluso para los sitios de listas de proxy gratuitos con una reputación decente como sitio de listas de proxy gratuitos, recuerde siempre que existe un riesgo relacionado con el uso de proxies alojados por entidades que no conoce).

Esta lista parece actualizarse con frecuencia, pero no comparten con qué frecuencia se actualiza. Encontrará proxies gratuitos aquí, pero sería mejor usar una herramienta diferente para verificar si el proxy que desea usar todavía está disponible.

Hay una dirección de correo electrónico disponible en el sitio si tiene preguntas., aunque no debe esperar un tiempo de respuesta rápido. A diferencia de algunos de los otros sitios de proxy gratuitos, no hay versiones pagas o premium de las listas de proxy ni herramientas adicionales, como raspadores de proxy.

Resultados ()

Sitio weberroresObstruidoÉxitoTiempo promedio
Instagram386585290.70
Google984640dieciséis8.90
Amazonas3761361121.02
Las 300 mejores Alexa483051710.90

Punto de referencia

Ahora que hemos analizado los diferentes proxies gratuitos disponibles en el mercado, es hora deprobarlos contra diferentes sitios web. El punto de referencia es simple.

Hicimos un guión querecopila proxies gratuitos de cada(tiene que ser dinámico y obtener el último proxy, ya que las listas cambian cada pocas horas en estos sitios web). Luego, tenemos un conjunto de URL para algunos sitios web populares comoInstagram, Google y Amazon y 300 URL de las 1000 mejores clasificadas por Alexa. Luego vamos a cada URL usando la lista de proxy yregistrar el tiempo de respuesta/código HTTPy eventual comportamiento de bloqueo en el sitio web.

Por ejemplo, Google enviará un código HTTP 429 si bloquea una IP, Amazon devolverá un código HTTP 200 con un Captcha en el cuerpo e Instagram lo redirigirá a la página de inicio de sesión.

Puedes encontrar el guión aquí:https://github.com/ScrapingBee/freeproxylist-blogpost

Ejecutamos el script usando cada lista de proxy con los diferentes sitios web, 1000 solicitudes cada vez y encontramos los siguientes resultados:

Instagram

Lista de proxyerroresObstruidoÉxitoTiempo promedio
Raspado proxy392592dieciséis24.55
libreproxycz654332143.74
Lista de proxy libre386585290.70
Abeja Raspadora4509553.3

Google

Lista de proxyerroresObstruidoÉxitoTiempo promedio
Raspado proxy9584474216.12
libreproxycz96990313.74
Lista de proxy libre984640dieciséis8.90
Abeja Raspadora*8009208.30

*UsandoScrapingBee GoogleAPI

Amazonas

Lista de proxyerroresObstruidoÉxitoTiempo promedio
Raspado proxy445dieciséis53920.37
libreproxycz675332216.40
Lista de proxy libre3761361121.02
Abeja Raspadora2209783.34

Ranking de los 300 mejores de Alexa

Lista de proxyerroresObstruidoÉxitoTiempo promedio
Raspado proxy551144813.60
libreproxycz742025812.73
Lista de proxy libre483051710.90
Abeja Raspadora509953.34

Análisis

El mayor problema con todos estos proxies era elTasa de erroren el proxy: tiempos de espera, error de red, HTTPS... lo que sea.

Entonces, especialmente para Google e Instagram,la mayoría de las solicitudes fueron bloqueadascon los proxies "en funcionamiento" (es decir, proxies que no producen tiempos de espera o errores de red). Esto puede explicarse por el hecho de que Google está muy afectado por herramientas como la araña Scrapebox/Screaming Frog.

Estas son herramientas de SEO que se utilizan para obtener sugerencias de palabras clave, rastrear Google y generar informes de SEO. Tienen un mecanismo incorporado para recopilar estas listas de proxy gratuitas, y muchas personas de SEO las usan. Por lo tanto, estos proxies se usan en exceso en Google y, a menudo, se bloquean.

En general, ademásAbeja Raspadorapor supuesto,Freeproxylists.net parece tener los mejores servidores proxy, pero como puedes ver tampoco es tan bueno.

Conclusión

Cuando intente usar web scraping para obtener información sobre competidores, encontrar direcciones de correo electrónico u obtener otros datos de un sitio web, usar un proxy lo ayudará a proteger su identidad y evitar agregar su verdadera dirección IP a cualquier lista de bloqueo.Los raspadores de proxy lo ayudan a mantener sus bots seguros y rastrear páginas durante el tiempo que necesite.

Si bien existen numerosas listas de proxies gratuitos en línea, no todos contienen la misma calidad de proxies. Ser consciente delos riesgos que conlleva el uso de proxies gratuitos. Existe la posibilidad de que pueda conectarse a uno alojado por un pirata informático o una agencia gubernamental o simplemente alguien que intenta insertar sus anuncios en cada respuesta que se devuelve desde cualquier sitio web. por eso eses bueno usar servicios proxy gratuitos de sitios web en los que confía.

Tener una lista de proxies gratuitos te dala ventaja de no lidiar con listas negrasporque si una dirección IP se bloquea, puede pasar a otro proxy sin muchos problemas. Si necesita usar la misma dirección IP varias veces para su web scraping, valdrá la pena la inversión para pagar un servicio que tenga soporte y administre sus propios proxies para que no tenga que preocuparse de que se caigan en el peor de los casos. tiempo.

Las 5 mejores listas de proxy gratuitas para web scraping (2024)

References

Top Articles
Latest Posts
Article information

Author: Horacio Brakus JD

Last Updated:

Views: 6178

Rating: 4 / 5 (51 voted)

Reviews: 82% of readers found this page helpful

Author information

Name: Horacio Brakus JD

Birthday: 1999-08-21

Address: Apt. 524 43384 Minnie Prairie, South Edda, MA 62804

Phone: +5931039998219

Job: Sales Strategist

Hobby: Sculling, Kitesurfing, Orienteering, Painting, Computer programming, Creative writing, Scuba diving

Introduction: My name is Horacio Brakus JD, I am a lively, splendid, jolly, vivacious, vast, cheerful, agreeable person who loves writing and wants to share my knowledge and understanding with you.