
Enviado em 06/01/2025 - 20:16h
Senhores, estou fazendo algumas raspagens na web com Python + Selenium. Em um dos sites acabei esbarrando em bloqueios de execução de scripts (Shadow DOM) me impedindo de usar seletores comuns de css ou qualquer outra alternativa para interagir com o HTML da página. Dessa forma, a solução que cheguei foi: Com o selenium renderizar a página na sua extensão completa e tirar uma screenshot, a partir dessa screenshot estou usando pytesseract (library python) para converter a imagem em string. Essa string é enviada a uma API do gpt para me retornar em json as informações da página.File Browser: Crie sua Nuvem Pessoal Privada
A produção de áudio e vídeo no Linux e as distribuições dedicadas a esse fim
Criptografando sua Home com Gocryptfs para tristeza do meliante
A Involução do Linux e as Lambanças Desnecessárias desde o seu Lançamento
O Journal no Linux para a guarda e consulta de logs do sistema
Acelerando a compilação de pacotes no Arch Linux (AUR) usando todos os núcleos do processador
Ocultando asteriscos ao digitar senha no Ubuntu
Continuando meus tópicos anteriores (13)
As Assinaturas Perderam o Negrito e o Itálico? [RESOLVIDO] (1)









