image

Accede a bootcamps ilimitados y a más de 650 cursos para siempre

70
%OFF
Article image
Tailison Ruas
Tailison Ruas22/03/2026 16:40
Compartir
Luizalabs - Back-end com Python - 2º EdiçãoRecomendado para tiLuizalabs - Back-end com Python - 2º Edição

/crawl e tá pronto

    Se você já tentou fazer scraping de um site, então você sabe: isso aqui NUNCA é simples.

    A gente sempre começa esperançoso…

    (“kkkk, rapidinho eu resolvo isso”)

    “Ah, é só pegar umas páginas”...

    Aí vem:

    → Puppeteer ou Playwright

    → página que não carrega direito

    → conteúdo dinâmico quebrando tudo

    → fila, retry, rate limit

    → bloqueio do nada

    E quando finalmente funciona… algo muda na página e quebra de novo.

    Agora imagina isso:

    Uma chamada de API e o site inteiro vem estruturado pra você.

    Simples assim.

    Foi exatamente isso que a Cloudflare lançou com o /crawl.

    Mas o ponto não é só facilidade… é velocidade de execução.

    Porque além de crawlear, ele renderiza páginas como um browser real (inclusive SPA), descobre links automaticamente e já retorna em HTML, Markdown ou JSON.

    Ou seja… praticamente pronto pra usar com IA.

    E sim, simples assim de usar:

    
    # 1. Inicia o crawl
    curl -X POST "https://api.cloudflare.com/client/v4/accounts/{account_id}/browser-rendering/crawl" \
    -H "Authorization: Bearer {TOKEN}" \
    -H "Content-Type: application/json" \
    -d '{
      "url": "https://example.com",
      "limit": 50,
      "formats": ["markdown", "html"]
    }'
    
    # resposta:
    # { "success": true, "result": "job-id-123" }
    
    # 2. Busca o resultado
    curl -X GET "https://api.cloudflare.com/client/v4/accounts/{account_id}/browser-rendering/crawl/job-id-123"
    
    

    Ou seja: ele roda como um job assíncrono. Você inicia e depois consulta o resultado.

    Agora pensa no impacto disso:

    → transformar qualquer site em base pra IA

    → montar buscador em cima de conteúdo externo

    → criar agregadores em horas, não semanas

    Sem infra. Sem dor de cabeça.

    E o mais irônico? A empresa que sempre foi conhecida por lutar contra bots… agora também tá facilitando (e muito) o trabalho deles.

    Claro, não é bagunça não meu camarada, o /crawl:

    >> não ignora proteção

    >>pode ser bloqueado normalmente

    Mas mesmo assim…isso aqui trás uma facilidade imensa para criação rápida de dados. Te deixando com a única precoupação de:

    o que vou construir com isso?

    Tenho a sensação de que isso aqui vai virar base de MUITO projeto por aí...👀

    Compartir
    Recomendado para ti
    Lupo - Primeiros Passos com Inteligência Artificial
    Almaviva - Back-end com Java & QA
    Luizalabs - Back-end com Python - 2º Edição
    Comentarios (0)
    Recomendado para tiLuizalabs - Back-end com Python - 2º Edição