Unescape de caracteres especiais ISO-8859-1
Publicado por Mayron Cachina 26/11/2008
[ Hits: 5.504 ]
Homepage: http://mayroncachina.net
Script para conversões de caracteres especiais ISO-8859-1 para UTF-8
#! /usr/bin/env python # -*- coding: iso-8859-15 -*- ''' Script para unescape de caracteres especiais ISO-8859-1 Autor: Mayron Cachina Contato: mayroncachina@gmail.com Site: http://cachina.wordpress.com ''' import htmlentitydefs import re import cgi #Informações origem = raw_input("Local do arquivo do arquivo original: ") fim = raw_input("Local do arquivo final: ") pattern = re.compile("&(\w+?);") def descape_entity(m, defs=htmlentitydefs.entitydefs): # callback: translate one entity to its ISO Latin value try: return defs[m.group(1)] except KeyError: return m.group(0) # use as is def descape(string): return pattern.sub(descape_entity, string) #Abre os arquivos para manipulação de dados f = open(origem) w = open(fim,'w') #Operações try: novo = descape(f.read()) w.write(novo) finally: f.close() w.close() print "Finalizado!!!"
Crivo de Eratóstenes Simples em Python
Nenhum comentário foi encontrado.
Melhorando o tempo de boot do Fedora e outras distribuições
Como instalar as extensões Dash To Dock e Hide Top Bar no Gnome 45/46
E a guerra contra bots continua
Tradução do artigo do filósofo Gottfried Wilhelm Leibniz sobre o sistema binário
Conheça o firewall OpenGFW, uma implementação do (Great Firewall of China).
Instalando o FreeOffice no LMDE 6
Anki: Remover Tags de Estilo HTML de Todas as Cartas
Colocando uma opção de redimensionamento de imagem no menu de contexto do KDE
Não consigo acessar os modos de desempenho (2)
Ubuntu — tentando iniciar o windows? (0)
[Shell Script] Script para desinstalar pacotes desnecessários no OpenSuse
[Shell Script] Script para criar certificados de forma automatizada no OpenVpn
[Shell Script] Conversor de vídeo com opção de legenda
[C/C++] BRT - Bulk Renaming Tool
[Shell Script] Criação de Usuarios , Grupo e instalação do servidor de arquivos samba