/crawl e tá pronto

Se você já tentou fazer scraping de um site, então você sabe: isso aqui NUNCA é simples.

A gente sempre começa esperançoso…

(“kkkk, rapidinho eu resolvo isso”)

“Ah, é só pegar umas páginas”...

Aí vem:

→ Puppeteer ou Playwright

→ página que não carrega direito

→ conteúdo dinâmico quebrando tudo

→ fila, retry, rate limit

→ bloqueio do nada

E quando finalmente funciona… algo muda na página e quebra de novo.

Agora imagina isso:

Uma chamada de API e o site inteiro vem estruturado pra você.

Simples assim.

Foi exatamente isso que a Cloudflare lançou com o /crawl.

Mas o ponto não é só facilidade… é velocidade de execução.

Porque além de crawlear, ele renderiza páginas como um browser real (inclusive SPA), descobre links automaticamente e já retorna em HTML, Markdown ou JSON.

Ou seja… praticamente pronto pra usar com IA.

E sim, simples assim de usar:


# 1. Inicia o crawl
curl -X POST "https://api.cloudflare.com/client/v4/accounts/{account_id}/browser-rendering/crawl" \
-H "Authorization: Bearer {TOKEN}" \
-H "Content-Type: application/json" \
-d '{
  "url": "https://example.com",
  "limit": 50,
  "formats": ["markdown", "html"]
}'

# resposta:
# { "success": true, "result": "job-id-123" }

# 2. Busca o resultado
curl -X GET "https://api.cloudflare.com/client/v4/accounts/{account_id}/browser-rendering/crawl/job-id-123"

Ou seja: ele roda como um job assíncrono. Você inicia e depois consulta o resultado.

Agora pensa no impacto disso:

→ transformar qualquer site em base pra IA

→ montar buscador em cima de conteúdo externo

→ criar agregadores em horas, não semanas

Sem infra. Sem dor de cabeça.

E o mais irônico? A empresa que sempre foi conhecida por lutar contra bots… agora também tá facilitando (e muito) o trabalho deles.

Claro, não é bagunça não meu camarada, o /crawl:

>> não ignora proteção

>>pode ser bloqueado normalmente

Mas mesmo assim…isso aqui trás uma facilidade imensa para criação rápida de dados. Te deixando com a única precoupação de:

o que vou construir com isso?

Tenho a sensação de que isso aqui vai virar base de MUITO projeto por aí...👀