Utilizando o Azure Databricks¶
Este guia descreve os passos necessários para acessar o workspace do Azure Databricks criado via Terraform, importar notebooks, configurar um cluster de computação e gerar um token de acesso.
1. Acessando o Workspace e Importando Notebooks¶
Após a execução do Terraform, o recurso Azure Databricks estará provisionado. Caso você não tenha feito o provisionamento dos resursos, acesse a documentação do Terraform do projeto. Para acessar o workspace:
- Acesse o portal do Azure.
- Pesquise por "Azure Databricks" e clique no recurso criado.
- Clique em "Launch Workspace" para abrir a interface do Databricks.
- No menu lateral esquerdo, vá até a seção "Workspace".
- Clique com o botão direito em seu usuário ou pasta principal e selecione "Create > Folder".
-
Nomeie a pasta como
notebooks
. -
Dentro da pasta
notebooks
, clique em "Import". - Selecione os arquivos localizados na pasta do projeto:
src/notebooks/
- Importe todos os arquivos
.ipynb
necessários para o seu trabalho.
2. Criando um Cluster de Computação¶
Para executar os notebooks, será necessário configurar um cluster Databricks.
- No menu esquerdo, clique em "Compute".
- Clique no botão "Create Cluster".
-
Preencha as informações conforme abaixo:
-
Cluster name: Nome de sua escolha (ex:
cluster-projeto
) - Databricks Runtime Version:
10.4 LTS (Scala 2.12, Spark 3.2.1)
- Node type:
Standard_D4s_v3
-
Autopilot Options: Pode deixar as opções padrão ou configurar conforme necessidade.
-
Clique em "Create Cluster".
3. Gerando um Token de Acesso (para o Azure Data Factory)¶
Para integração com outros serviços, como o Azure Data Factory, é necessário um token de acesso do Databricks.
- No canto superior direito da interface do Databricks, clique no ícone de usuário e depois em "User Settings".
- Vá até a aba "Developer" ou "Access Tokens".
- Clique em "Generate New Token".
- Defina o tempo de expiração desejado.
- Clique em "Generate" e copie o token gerado.
⚠️ Atenção: o token não poderá ser recuperado novamente, portanto salve-o com segurança. Você irá utilizá-lo posteriormente na configuração do Azure Data Factory.
Recursos Relacionados¶
- Pasta com notebooks:
src/notebooks/
- Imagem de referência do cluster:
assets/foto-compute.png
Requisitos¶
- O Azure Databricks deve estar provisionado via Terraform.
- Você precisa de permissões para acessar o recurso e criar notebooks/cluster.