Pular para o conteúdo principal

Visão geral

O Import por URL permite criar produtos colando a URL de uma página de produto. A Alana usa a infraestrutura de scraping do Bright Data para extrair dados estruturados da página, mapeá-los para o schema da Alana e executar automaticamente o pipeline Bronze → Silver.

Como funciona

  1. Você submete a URL de uma página de produto
  2. O Bright Data busca a página (lidando com renderização JavaScript, CAPTCHAs e restrições geográficas)
  3. O scraper extrai: título, descrição, imagens, preço, marca, especificações
  4. Os dados extraídos são mapeados para o schema de produto da Alana (Bronze)
  5. O Silver normaliza o resultado automaticamente
  6. O produto aparece no seu catálogo

Métodos de scraping

MétodoDescriçãoMelhor para
web_scraperRenderização completa de JavaScript, extração de dados estruturadosPáginas de produto com conteúdo dinâmico
web_unlockerContorna proteções anti-botVarejistas com detecção agressiva de bots
crawlSegue links para extrair múltiplos produtos de uma página de categoriaPáginas de categoria ou coleção

Importar uma única URL

Via UI

  1. Abra seu catálogo
  2. Clique em Adicionar ProdutosImportar por URL
  3. Cole a URL da página de produto
  4. Selecione o método de scraping (padrão: web_scraper)
  5. Clique em Importar
  6. Um job é criado — o produto aparece no catálogo em 30–90 segundos

Via API

curl -X POST "https://app.alana.shopping/api/workspace/WORKSPACE_ID/url-import" \
  -H "Authorization: Bearer SUA_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "url": "https://www.exemplo.com/produtos/tenis-running-pro",
    "catalogId": "CATALOG_ID",
    "method": "web_scraper"
  }'

Resposta

{
  "jobId": "job_9x8k2m",
  "status": "processing",
  "url": "https://www.exemplo.com/produtos/tenis-running-pro",
  "estimatedSeconds": 45
}

Importar múltiplas URLs (em lote)

curl -X POST "https://app.alana.shopping/api/workspace/WORKSPACE_ID/url-import/bulk" \
  -H "Authorization: Bearer SUA_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "urls": [
      "https://www.exemplo.com/produtos/item-1",
      "https://www.exemplo.com/produtos/item-2",
      "https://www.exemplo.com/produtos/item-3"
    ],
    "catalogId": "CATALOG_ID",
    "method": "web_scraper"
  }'

Rastrear uma página de categoria

Use o método crawl para importar todos os produtos de uma página de categoria ou coleção:
curl -X POST "https://app.alana.shopping/api/workspace/WORKSPACE_ID/url-import" \
  -H "Authorization: Bearer SUA_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "url": "https://www.exemplo.com/categoria/tenis-running",
    "catalogId": "CATALOG_ID",
    "method": "crawl",
    "crawlOptions": {
      "maxProducts": 100,
      "followPagination": true
    }
  }'

Verificar status do job

curl "https://app.alana.shopping/api/workspace/WORKSPACE_ID/url-import/JOB_ID" \
  -H "Authorization: Bearer SUA_API_KEY"

Valores de status do job

StatusDescrição
processingO Bright Data está buscando e analisando a página
successProduto criado no catálogo
partialProduto criado com alguns campos ausentes
failedA página não pôde ser raspada (veja o campo error)

Limites de uso e custos

MétricaLimite
Imports de URL única100/hora por workspace
Imports em lote500 URLs/requisição
Máximo de produtos por crawl500/crawl
Jobs simultâneos10 por workspace
O custo por import é debitado do seu saldo de créditos Bright Data. Os custos variam por método:
MétodoCusto aproximado
web_scraper0,001 créditos/página
web_unlocker0,005 créditos/página
crawl0,001 créditos/produto encontrado
Veja seu uso de créditos Bright Data em ConfiguraçõesIntegraçõesBright Data.

Boas práticas

Sempre teste uma URL primeiro para confirmar que o scraper extrai corretamente os campos que você precisa. Varejistas diferentes têm estruturas de página diferentes.
Sites como Amazon, Mercado Livre e grandes varejistas de moda têm detecção de bot. Use web_unlocker para evitar imports com falha.
Quando quiser todos os produtos de uma categoria, crawl é mais eficiente do que colar a URL de cada produto individualmente.
Um status partial significa que o produto foi criado mas alguns campos não puderam ser extraídos. Revise esses produtos no Canvas e preencha os campos ausentes manualmente.
Last modified on March 18, 2026