Unescape de caracteres especiais ISO-8859-1
Publicado por Mayron Cachina 11/01/2008
[ Hits: 6.713 ]
Homepage: http://mayroncachina.net
Conversão de caracteres ISO-8859-1 em UTF-8.
#! /usr/bin/env python # -*- coding: iso-8859-15 -*- ''' Script para unescape de caracteres especiais ISO-8859-1 Autor: Mayron Cachina Contato: mayroncachina@gmail.com Site: http://cachina.wordpress.com ''' import htmlentitydefs import re import cgi #Informações origem = raw_input("Local do arquivo do arquivo original: ") fim = raw_input("Local do arquivo final: ") pattern = re.compile("&(\w+?);") def descape_entity(m, defs=htmlentitydefs.entitydefs): # callback: translate one entity to its ISO Latin value try: return defs[m.group(1)] except KeyError: return m.group(0) # use as is def descape(string): return pattern.sub(descape_entity, string) #Abre os arquivos para manipulação de dados f = open(origem) w = open(fim,'w') #Operações try: novo = descape(f.read()) w.write(novo) finally: f.close() w.close() print "Finalizado!!!"
Gerador de referência cruzada de texto
Sugestão aleatória de filmes e séries para assistir por streaming
Nenhum coment�rio foi encontrado.
Aprenda a Gerenciar Permissões de Arquivos no Linux
Como transformar um áudio em vídeo com efeito de forma de onda (wave form)
Como aprovar Pull Requests em seu repositório Github via linha de comando
Aplicativo simples para gravar tela
Quebra de linha na data e hora no Linux Mint
tentando instalar em um notebook antigo o Linux LegacyOS_2023... [RESO... (8)
Problema com Conexão Outlook via Firewall (OpenSUSE) com Internet Fibr... (5)