Quebrando a criptografia RSA

Este artigo visa descrever as etapas e os códigos fontes que permitiram vencer o desafio RSA, promovido aqui no VOL, como parte do artigo "Criptografia Assimétrica com o RSA", de Elgio Schlemer.

[ Hits: 97.070 ]

Por: André Vitor Matos em 25/08/2009 | Blog: http://www.google.com/profiles/andre.vmatos


A parte difícil



Como dito, não existe grande dificuldade em se escrever um programa para fatorar N. Mesmos os menos otimizados encontrariam o resultado mais cedo ou mais tarde. Talvez a maior dificuldade neste sentido seria o de ter uma linguagem que conseguisse trabalhar com números inteiros de qualquer tamanho, sendo que o python já tem isto. Os maiores desafios foram o cálculo do D e a decifragem da mensagem. Outros desafiados chegaram mais rápido do que eu nos valores de P e Q, mas não conseguiram, a tempo, algoritmos para o D e a mensagem.

Descobrindo a chave privada D

Essa parte não foi difícil, visto que eu estava programando em Python. Na parte anterior, obteve-se o P e o Q, fatores primos da chave pública. Para se descobrir a chave privada, usa-se um pequeno algorítimo, baseado no algorítimo de Euclides. Este programa é uma completa reimplementação do programa fornecido pelo Prof. Elgio em Algoritmo de euclides estendido.

Porém, propositadamente, o programa do prof. foi escrito em C, que, sabe-se, é bastante limitado no tratamento de números grandes, comportando números de, no máximo 32 bits (ou 64, dependendo da sua arquitetura), o que não ajuda muito com a ordem de tamanho de números que estamos trabalhando. Já Python não possui limitação alguma quanto ao tamanho dos números, dando suporte nativo a números de qualquer tamanho (posteriormente foi publicado um artigo ensinando como lidar com números de qualquer tamanho em C. O mesmo pode ser conferido em Programação com números inteiros gigantes). Esse realmente foi um diferencial que me ajudou muito. Segue o código do algorítimo de Euclides estendido em python.

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# André Vitor de Lima Matos
# andre.vmatos@gmail.com


from sys import argv

def euclides_ext(a, b, c):
   r = b % a
   if r == 0:
     return ( (c / a) % ( b / a) )

   return ( ( euclides_ext(r, a, -c) * b + c) / (a % b) )

if len(argv) != 4:
   raise SyntaxError, "São requeridos 3 valores como argumentos"

p, q, e = argv[1:]
p=int(p)
q=int(q)
e=int(e)

n = p * q

qq = (p - 1) * (q - 1)

d = euclides_ext(e, qq, 1)
print "N =", n
print "QQ =", qq
print "D =", d

Este programa foi o que, inicialmente, me deu uma grande vantagem em relação aos outros participantes, por ser razoavelmente complexa sua implementação em C. Aqui não houve criatividade alguma, sendo esse programa uma cópia quase exata do fornecido pelo professor Elgio, porém, em python, o que o expande a números gigantes.

Decifrando as mensagens

Eis aqui o problema que, creio eu, mais deu dor de cabeça aos outros participantes. Bem, pelo menos deu a mim, até que conseguisse resolvê-lo. Para fazer a descriptografia das mensagens é necessário elevar um número enorme a outro maior ainda, e depois tirar o módulo por um número grande também.

Mesmo para computadores potentes, essas operações se tornam inviáveis, pois elas fazem a potência do número, e depois tiram o módulo. Mas não nos importa saber a potência, apenas o módulo. E essa operação é bem mais fácil de ser realizada, com a técnica correta. O algorítimo que eu implementei é, na realidade, uma técnica bem parecida com a que professor Elgio descreveu, após o término do desafio, em Cálculo da potência modular de forma eficiente:

def potencia(c, d, n):
   r = c % n
   l = []

   while d > 1:
     l.append(d & 1)
     d = d >> 1
   while l:
     v = l.pop()
     r = ((a ** v) * r ** 2) % n
return r

Então, vamos lá. Note que o operador d >> 1 divide d por 2 (por isso da potência dois lá em baixo no (r**2)) e arredonda o valor para baixo, porque vai decrescendo o d até 1 (e até 0, se continuar, por isso d > 1). O operador d & 1 é um simples operador lógico, que, neste caso, retorna 1 se o número for ímpar, e 0 se o número for par.

Isso, como você pode imaginar, faz com que a lista l tenha, arredondado pra baixo, log2(d) elementos, sendo 0 os que foram tirados quando d era par e 1 quando d era impar. Esses serão os restos da divisão que serão apropriadamente compensados na próxima função.

Após isto, a função l.pop() vai retirando o próximo valor (FILO, first in, last out) da lista l, retornando-o a v e deletando-o da lista. Esse valor, que, lembro, é 0 ou 1, eleva a, e o multiplica ao quadrado de r, calculado previamente, antes das alterações das variáveis. Se 0, o valor é multiplicado por 1, resultando nele mesmo, e tirado o modulo por n, se 1, o a multiplica a potência, fazendo o papel do resto das divisões anteriores por 2, e então, novamente, tirado o módulo por n.

Quando l se esgotar, o laço termina, e a função retorna o valor final de r, que, por sempre estar sendo tirado o módulo por n, retornará o mesmo valor da potência final.

Matematicamente, os restos parciais da divisão do número d, elevado quantas vezes necessário aos fatores 2 de n, e tirado o resto novamente, retorna o próprio número. Na prática, é algo como: o resto de uma potência por um número n é igual ao resto por n do resto desse número também por n elevado ao expoente que se queira.

Página anterior     Próxima página

Páginas do artigo
   1. Apresentação
   2. O RSA e o desafio proposto
   3. Quebrando o RSA
   4. A parte difícil
   5. Conclusão
Outros artigos deste autor

MOC - O player de áudio para consoles

Instalando o KDE 4.1 no Slackware 12.1

Leitura recomendada

Testando configurações e segurança do Apache com Nikto

Melhorando a segurança do seus servidores em FreeBSD

Instalando e configurando o SpamAssassin

Elastic SIEM - Instalação e Configuração do LAB (Parte I)

EcryptFS - Usando, Desvendando suas Chaves e Recuperando seus Arquivos

  
Comentários
[1] Comentário enviado por elgio em 25/08/2009 - 10:52h

O André está de parabéns. Não apenas venceu o desafio, como também topou um outro desafio, este sem ganhar nada, de escrever este artigo. Pretendo, em breve, atualizar o artigo sobre RSA contando o meu lado da estória e citando os outros participantes que se esforçaram muito também.

[2] Comentário enviado por mago_dos_chats em 25/08/2009 - 17:15h

Parabéns Andre, pelo primeiro lugar no desafio e pelo artigo, que ficou bem escrito, descrevendo seu esforço passo a passo pra resolver o problema.
Abraço

[3] Comentário enviado por cesperanc@ em 25/08/2009 - 20:21h

Parabéns André e obrigado por partilhares a tua experiência.

Um abraço

[4] Comentário enviado por clovesjr em 25/08/2009 - 22:06h

Quero deixar meus parabéns ao André por ter vencido o desafio de forma magistral...

Muito legal contar sua experiência porque como também participei, encontrei desafios semelhantes aos que você encontrou mas você conseguiu superá-los antes de todos os outros participantes.

Assim que conseguir, também vou escrever uma dica ou um artigo sobre esta experiência porque usei o C como linguagem e inicialmente esbarrei naquele problema do tamanho do número e pretendo mostrar como consegui superar este problema usando o próprio C (sem usar a dica do Prof. Elgio).

Parabéns novamente...

Abraços...

Cloves Jr

[5] Comentário enviado por thiagods.ti em 29/09/2009 - 14:03h

Cara, mandasse muito bem.

Só aconselho a quando escrever um programa utilizar variáveis mais legiveis.
E não apenas "d" "r" "c". Fica pior a leitura do código.


Abraços!

[6] Comentário enviado por andre.vmatos em 29/09/2009 - 15:02h

Olá, Thiago. Tem razão. Normalmente, preservo essas técnicas de boa programação nos programas que faço, entretanto, estes usavam realmente estes nomes para as variáveis. Por exemplo, no RSA, a mensagem criptografada é realmente chamada de "c", por isso usei letras como variáveis nos meus programas, também, as mesmas utilizadas pelo Prof. Elgio nos programas dele. Mas obrigado mesmo assim. Qualquer coisa, estamos ai pra tirar qqr dúvida. Abçss

[7] Comentário enviado por thiagods.ti em 29/09/2009 - 15:08h

Sim sim, eu li que os nomes eram esses mesmo, e como era um programa pequeno não tem muito problema. ;D




[8] Comentário enviado por elgio em 03/10/2009 - 12:28h

Oi Thiago.

Só para lhe dar uma resposta, escolher nomes de variáveis PEQUENOS, como i, j, k, vai de acordo com a sugestão "Coding Style" de K&R (capítulo 4, nomes de variáveis).

Ela é uma crítica a outros padrões e sugere que se coloque nomes curtos, preferencialmente UMA ÚNICA LETRA, para variáveis locais, que não devem ser muitas (se forem, então tu não dividiu corretamente teu código em funções).

Sugere que variáveis Globais (Argh) tenham sua primeira letra maiúscula e que estas sim tenham um nome que digam o que ela é. E sugere que constantes sejam todas maiúsculas.

Assim, neste formato de codificação, este seria um PÉSSIMO exemplo:

int f;

int soma (int variavelIntSoma1, int VariavelIntSoma2)
{
int resultadoSoma;
..
}

Mas esta seria ideal:

int Configuracao;
int soma (int x, int y)
{
int s;

...

Uma versão completa deste padrão pode ser encontrada em http://lxr.linux.no/#linux+v2.6.31/Documentation/CodingStyle

Ele é o padrão sugerido para programar em Linux (e, até onde sei, exigido para quem quiser contribuir com o kernel)

[]s

[9] Comentário enviado por andre.vmatos em 16/12/2009 - 19:45h

Se alguém se interessar em aprofundar-se um pouco mais na teoria dos números na qual me baseei pra gerar o algorítimo de divisão de números grandes (congruência), pode estar dando uma lida nesse material:
http://www.rumoaoita.com/site/index.php?option=com_content&view=article&id=65:apostila-de-congruenci...
É bastante teórico, mas pra quem gosta, pode ser interessante. Na época do desafio, não usei esse material, pq não o conhecia ainda, então, usei explicações bem mais simples, mas que foram suficientes. Então, essa semana, estudando pro vestibular do ITA, que está ocorrendo agora, entre os dais 15 e 18 de dezembro, do qual estou participando, encontrei essa apostila, no site Rumo ao ITA. Pode ser útil a alguém. T+

[10] Comentário enviado por s0l1d_k3rn3l em 08/01/2010 - 04:49h

aew

muito bom artigo...

flw

[11] Comentário enviado por maurisilvestre em 28/05/2010 - 10:45h

Ótimo artigo André, parabéns em dobro, primeiro por vencer o desafio e segundo por compartilhar conosco, assim todos podem ter um material de apoio para aprendizado.
t+ Fica com Deus e boa sorte nos próximos desafios =)

[12] Comentário enviado por andre.vmatos em 28/05/2010 - 11:55h

Olá, maurisilvestre. Obrigado pelas congratulações. Espero mesmo ter sido útil. T+

[13] Comentário enviado por removido em 26/09/2011 - 11:36h

Olá. (celestina23love@yahoo.com)
Fiquei muito impressionado ao seu perfil em (vivaolinux.com.br) e eu sinto como ter uma boa amizade com você, meu nome é Celestina, eu gosto de você para me escrever de volta com o meu e-mail(celestina23love@yahoo.com) para que eu possa enviar-lhe uma foto e dizer mais sobre mim, obrigado por acolher o meu pedido de amizade, eu estarei esperando por sua resposta ao meu endereço de email.
Celestina.




Hello. ( celestina23love@yahoo.com )
I was very impressed to your profile at ( vivaolinux.com.br ) and i feel like to have a good friendship with you, My Name is Celestina, i will like you to write me back with my email
( celestina23love@yahoo.com ) so that i can send you a picture and tell you more about me, thanks for welcome my friendship request, i will be waiting for your respond at my mail address.
Celestina .

[14] Comentário enviado por Zaraki em 11/11/2011 - 19:12h

muito bom o artigo, vou testar agora e compartilhar com meus colegas de faculdade!
Obrigado e PArabéns!

[15] Comentário enviado por andre.vmatos em 12/11/2011 - 00:32h

Obrigado, Kyouraku.
Qualquer coisa, estamos ai pra tirar qualquer dúvida.
Abçs

[16] Comentário enviado por nandobravo06 em 19/11/2011 - 01:11h

Um meio interessante de conseguir um desempenho extra no algoritmo de força bruta, é ao invés de tentar todos os ímpares (3, 5, 7, 9, 11, 13...), é só observar que tirando o 2 e o 3, todos os demais números primos é fruto da multiplicação de (x por 6) + ou - 1...

x=1:
5 = (1 * 6) - 1
7 = (1 * 6) + 1

x=2:
11 = (2 * 6) - 1
13 = (2 * 6) + 1

Isso não significa que x * 6 + ou - 1 sempre vá gerar números primos, mas significa uma redução de UM TERÇO do processamento em relação ao algoritmo que testa todos os ímpares.

Uma outra observação é que, sendo N um número gigante, se ((N+1)%6 !=0)&&((N-1)%6 !=0), Se essa condição for verdadeira, SEGURAMENTE O NÚMERO É COMPOSTO!

[17] Comentário enviado por elgio em 19/11/2011 - 13:55h

Que dica maravilhosa Fernando.

Se tiver mais dicas sobre números primos, manda.

Eu, particularmente, levei um pau no passado para descobrir e implementar o euclides extendido para calcular o D do RSA. Não é algo que se encontra de forma clara por ai.

[]'s

[18] Comentário enviado por danilosampaio em 20/04/2012 - 12:40h

Excelente artigo! Parabéns!

[19] Comentário enviado por joaocpimenta em 04/12/2012 - 20:13h

Cara, muito massa mesmo! Parabéns por todo o raciocínio e pelo post!


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts