Visão geral
O Import por URL permite criar produtos colando a URL de uma página de produto. A Alana usa a infraestrutura de scraping do Bright Data para extrair dados estruturados da página, mapeá-los para o schema da Alana e executar automaticamente o pipeline Bronze → Silver.Como funciona
- Você submete a URL de uma página de produto
- O Bright Data busca a página (lidando com renderização JavaScript, CAPTCHAs e restrições geográficas)
- O scraper extrai: título, descrição, imagens, preço, marca, especificações
- Os dados extraídos são mapeados para o schema de produto da Alana (Bronze)
- O Silver normaliza o resultado automaticamente
- O produto aparece no seu catálogo
Métodos de scraping
| Método | Descrição | Melhor para |
|---|---|---|
web_scraper | Renderização completa de JavaScript, extração de dados estruturados | Páginas de produto com conteúdo dinâmico |
web_unlocker | Contorna proteções anti-bot | Varejistas com detecção agressiva de bots |
crawl | Segue links para extrair múltiplos produtos de uma página de categoria | Páginas de categoria ou coleção |
Importar uma única URL
Via UI
- Abra seu catálogo
- Clique em Adicionar Produtos → Importar por URL
- Cole a URL da página de produto
- Selecione o método de scraping (padrão:
web_scraper) - Clique em Importar
- Um job é criado — o produto aparece no catálogo em 30–90 segundos
Via API
Resposta
Importar múltiplas URLs (em lote)
Rastrear uma página de categoria
Use o métodocrawl para importar todos os produtos de uma página de categoria ou coleção:
Verificar status do job
Valores de status do job
| Status | Descrição |
|---|---|
processing | O Bright Data está buscando e analisando a página |
success | Produto criado no catálogo |
partial | Produto criado com alguns campos ausentes |
failed | A página não pôde ser raspada (veja o campo error) |
Limites de uso e custos
| Métrica | Limite |
|---|---|
| Imports de URL única | 100/hora por workspace |
| Imports em lote | 500 URLs/requisição |
| Máximo de produtos por crawl | 500/crawl |
| Jobs simultâneos | 10 por workspace |
| Método | Custo aproximado |
|---|---|
web_scraper | 0,001 créditos/página |
web_unlocker | 0,005 créditos/página |
crawl | 0,001 créditos/produto encontrado |
Boas práticas
Teste com uma única URL antes do import em lote
Teste com uma única URL antes do import em lote
Sempre teste uma URL primeiro para confirmar que o scraper extrai corretamente os campos que você precisa. Varejistas diferentes têm estruturas de página diferentes.
Use web_unlocker para grandes varejistas
Use web_unlocker para grandes varejistas
Sites como Amazon, Mercado Livre e grandes varejistas de moda têm detecção de bot. Use
web_unlocker para evitar imports com falha.Use crawl para imports no nível de categoria
Use crawl para imports no nível de categoria
Quando quiser todos os produtos de uma categoria,
crawl é mais eficiente do que colar a URL de cada produto individualmente.Verifique resultados parciais
Verifique resultados parciais
Um status
partial significa que o produto foi criado mas alguns campos não puderam ser extraídos. Revise esses produtos no Canvas e preencha os campos ausentes manualmente.