Enviado em 06/01/2025 - 20:16h
Senhores, estou fazendo algumas raspagens na web com Python + Selenium. Em um dos sites acabei esbarrando em bloqueios de execução de scripts (Shadow DOM) me impedindo de usar seletores comuns de css ou qualquer outra alternativa para interagir com o HTML da página. Dessa forma, a solução que cheguei foi: Com o selenium renderizar a página na sua extensão completa e tirar uma screenshot, a partir dessa screenshot estou usando pytesseract (library python) para converter a imagem em string. Essa string é enviada a uma API do gpt para me retornar em json as informações da página.Aprenda a Gerenciar Permissões de Arquivos no Linux
Como transformar um áudio em vídeo com efeito de forma de onda (wave form)
Como aprovar Pull Requests em seu repositório Github via linha de comando
Quebra de linha na data e hora no Linux Mint
Organizando seus PDF com o Zotero
tentando instalar em um notebook antigo o Linux LegacyOS_2023... [RESO... (9)
Problema com Conexão Outlook via Firewall (OpenSUSE) com Internet Fibr... (5)