Separar conteudo de arquivo HTM com Pascal

1. Separar conteudo de arquivo HTM com Pascal

Roberto Duha
robertoduha

(usa Outra)

Enviado em 08/08/2018 - 16:36h

Olá! Meu conhecimento em Pascal pode ser considerado básico. E não consigo escrever uma solução para o problema abaixo:

No site da Caixa, disponibilizam os resultados (todos eles) de todas as loterias. Ele vem em formato HTM. Para a Megasena, é uma tabela mostrando nas linhas todos os resultados com informações diversas distribuidas pelas colunas. Cada linha um resultado e nas 21 colunas (Megasena) , informações pertinentes ao próprio.

Preciso colocar num arquivo texto sequencial a informação de cada uma dessas 21 colunas de todos os sorteios já realizados.

O arquivo baixado da Caixa, possui um trecho inutil no começo e outro no final. A parte central tem o que nos interessa, com HTM uniforme que se repete em todas as linhas dos sorteios. Problema que ele não tem marcação de final de linha..... quando mando ler uma linha, ele tenta ler o arquivo todo (1.2Mb) e dá erro de execução. Foi o que conclui.

Trecho que interessa:

<tr>
<td rowspan="1">1</td>
<td rowspan="1">11/03/1996</td>
<td rowspan="1">41</td>
<td rowspan="1">05</td>
<td rowspan="1">04</td>
<td rowspan="1">52</td>
<td rowspan="1">30</td>
<td rowspan="1">33</td>
<td rowspan="1">0,00</td>
<td rowspan="1">0</td>
<td rowspan="1">&nbsp</td><td rowspan="1">&nbsp</td>
<td rowspan="1">0,00</td>
<td rowspan="1">17</td>
<td rowspan="1">39.158,92</td>
<td rowspan="1">2016</td>
<td rowspan="1">330,21</td>
<td rowspan="1">SIM</td>
<td rowspan="1">1.714.650,23</td>
<td rowspan="1">0,00</td>
<td rowspan="1">0,00</td></tr>

São (hoje) 2065 resultados da Megasena e logo, 2065 trechos desses.

Podem me dar alguma dica do caminho a seguir? Tem que ser em Pascal. Uso o Lazarus.

Vou publicando aqui o desenrolar. 

Abraço à todos e grato pela atenção.



  






Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner
Linux banner
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts