Guia Rápido do Miniconda para Aplicações Científicas - Instalação e Configuração

Para quem desenvolve ou trabalha com computação científica utilizando o Python ou R, um gerenciador de módulos como o PIP ou o RStudio são essenciais, mas cada um tem suas limitações. O Anaconda é uma alternativa, mas oferece seus próprios desafios. Aqui, procuro apresentar brevemente o Miniconda, que é uma alternativa ao Anaconda, e o Conda que é menor e tão funcional quanto. Adicionalmente, passo algumas orientações sobre como configurar e otimizar sua funcionalidade para usuários do R, especificamente.

[ Hits: 10.254 ]

Por: Bruno Rafael Santos em 08/04/2020 | Blog: https://cutt.ly/4H7vrPh


Tutorial



Eu sempre me perguntei porque a instalação do Miniconda é tão obscura. Você o encontra nos docs do Conda, no link abaixo. O Conda e o Miniconda é a mesma coisa, só que o Conda e o Anaconda vem com uns 1500 pacotes, já o que o torna muito pesado. Se você sabe o que precisa, baixe só o necessário. Atente para a versão, você precisará de instalações distintas para o Python 3.7 e 2.7 e também para o sistema de 32 ou 64 bits.

Link: Miniconda - Conda documentation

Você precisa rodar o script do terminal. Abra um terminal no diretório do download e adicione permissão de execução ao arquivo. O comando abaixo faz exatamente isso, basta ajustá-lo ao nome do arquivo, que geralmente não muda com a versão:

chmod u+x Miniconda3-latest-Linux-x86_64.sh

Para executar o instalador, basta chamá-lo pelo nome agora. Atente que ele dispensa privilégios de administrador, pois ele assume que a instalação é no diretório do usuário ($), se por algum motivo bizarro você precisar instalar em qualquer outro lugar, eleve seus privilégios antes com 'sudo' ou 'su':

./Miniconda3-latest-Linux-x86_64.sh

Ele é um instalador linear, como os dos Windows, então é bem fácil de seguir:
  • Ler a licença: aperte ENTER.
  • Aceitar a licença: aperte ENTER para paginar, q para ir direto para o final, escreva yes para aceitar.
  • Escolha o local da instalação: ele oferece ~/miniconda3. Se for o caso, pressione ENTER, se não, escreva o novo caminho completo. Ele aceita caminhos relativos e atalhos (~ em vez de /home/fulano).
  • Inicializar o Conda: ele recomenda não e você pode fazer isso depois.
  • Acabou.

No fim da instalação, ele dá algumas orientações de como fazer a inicialização. É bem pouco informativo, mas sem problemas, a inicialização é a parte que estamos tentando evitar. Vá até a instalação do Miniconda, é o diretório /bin dentro do local escolhido (no meu caso é ~/test/bin).

cd ~/test/bin

Lá dentro está o script de controle do Conda, que se chama "conda". Ele sozinho não faz nada, dá um lista de opções, a que precisamos é "activate". Note que o "conda" tem uma sintaxe como a do 'find', sem -- antes dos parâmetros.

conda activate

Pronto! O (base) antes indicador do terminal é o sinal de que estamos dentro do ambiente base do Miniconda. Você já pode utilizar o Conda. ;)

Configuração

Temos dois caminhos para configurar o Conda. Um deles é sobre os repositórios e o outro é acerca do acesso a ele. Comecemos pelo acesso, que é bem pouco prático.

Tudo que você precisa para utilizar o Miniconda, é chamar o script "conda" na instalação como vimos acima. O problema é que dependendo do local de instalação, ele pode estar nas profundezas de uma árvore de diretórios. Uma solução simples, é colocar um link simbólico em um local indexado pelo PATH. O ~/bin é um excelente candidato.

Basta um comando:

ln -s $PWD/conda ~/bin

O $PWD torna o caminho absoluto, é um truque para tornar o link mais resiliente a mudanças de localização dele próprio. Atente que o comando acima parte de que estamos no diretório de instalação do Miniconda. Colocar no /bin do sistema o tornaria acessível a todos os usuários, mas teria que colocar a instalação em um lugar acessível para todos. Isso pode ser complicado, mas algo a se pensar.

Agora, basta um 'conda activate' em qualquer terminal do usuário, dono da instalação, para ter acesso ao Conda. Os comandos do Conda são fácies de utilizar:
  • conda activate [env] → inicia o ambiente, se nenhum for especificado, ele inicia o base.
  • conda update pacote → atualiza um pacote específico, note que cada ambiente tem um controle de versão próprio.
  • conda update conda → atualiza todo o conda, todos os pacotes e o gerenciador.
  • conda install pacote → instala o pacote, do ambiente atual.
  • conda remove pacote → remove o pacote, do ambiente atual.

Você pode utilizar o Conda sem utilizar os ambientes, basta ficar no base e tudo funcionará. Existem comandos específicos para pegar o pacote com uma versão específica, ou um repositório específico, e assim por diante. Tem bastante coisa para aprender.

Agora vamos correr atrás dos repositórios. Se você está satisfeito com os repositórios padrão, pode pular esta parte, se você trabalha com R ou Machine Learning, o processo abaixo é recomendado.

Acesse o Bioconda: Getting Started - Bioconda documentation

O link que dei acima já cai direto no tutorial para instalar os repositórios (no conda eles são chamados de canais). Basta executar os comandos na ordem dada, pois o último tem mais prioridade que o primeiro, isso garante que o Bioconda seja a fonte da maior parte dos seus pacotes. Lembre-se de estar no ambiente do Conda para fazer isso, fora do ambiente estes comandos não servem para nada.

conda config --add channels defaults
conda config --add channels bioconda
conda config --add channels conda-forge

Pronto! Daqui para frente todos os seus pacotes serão baixados do conda-forge e do Bioconda e, em raros casos, dos canais padrão.

Bônus

Agora darei algumas orientações sobre como instalar o R no Conda. Embora o R do sistema seja muito bom, com o conda eu posso instalar ferramentas específicas como o RStudio diretamente dele e centralizar as instalações de pacotes do R.

Basta um comando para instalar a maior parte do R:

conda install r-essentials

O "r-essentials" é um meta pacote que organiza toda a instalação do R, ele inclui o "r-base" e uma montanha de dependências que garante a maior parte das funcionalidades do R. Aliás, pacotes do R geralmente tem o nome "r-*", então são fácies de identificar. E eles são atualizados junto como os demais quando se dá um conda update conda.

Referências


Página anterior    

Páginas do artigo
   1. Introdução
   2. Tutorial
Outros artigos deste autor

Assinatura de documentos PDF em lote via Bash

Cronogramas e gestão do tempo com o LibreOffice Calc

GNU Parallel: criando atividades em paralelo com shell script

Devo atender? Um ótimo aplicativo para bloquear Telemarketing

Python para pesquisadores: material didático

Leitura recomendada

Experimentos com remasterização de Sabayon

Aplicativos Linux para o dia-a-dia

Torne-se um DJ usando Linux

Como instalar o CONKY-colors no Ubuntu 12.10

Elaborando vídeo-aula no Linux com Gtk-recordMydesktop

  
Comentários

Nenhum comentário foi encontrado.


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts