1. Introdução

Agora que você já dominou algumas das funções básicas do Python, vamos consolidar esses conhecimentos produzindo um extrator simplificado de dados.

O objetivo desse exercício é permitir que você compreenda bem e comece a dominar as estratégias de extração iterada, para criar bancos de dados com informações coletadas da internet.

2. Estudo

1: Costa, Alexandre. Introdução à Extração de dados. Code.arcos, 2021.

3. Estudo complementar

1: Castro, Pedro Luz de. Dicionários. Youtube, 2020.

Na primeira edição do curso, utilizamos um sistema de extração de dados que usava dicionários. Estratégias de extração que combinam dicionários e Xpath são poderosas formas de construir programas capazes de, ao mesmo tempo, extrair e organizar os dados, oferecendo como resultado bancos de dados já estruturados.

Porém, nossa escolha no curso DSD foi a de dividir esse trabalho em dois programas diferentes: extratores e geradores de tabela. Com isso, os dicionários deixaram de ser uma parte central do curso básico de programação, mas eles são uma ferramenta muito interessante para algumas estratégias avançadas de data science e direito.

2: Castro, Pedro Luz de. Construção de um extrator utilizando dicionários. Youtube, 2020.

Continuando o estudo da utilização dos dicionários como instrumento de extração de dados, esse video do Pedro mostra como essa construção pode ser realizada.

4. Atividades

4.1 Atividade complementar: FizzBuzz

FizBuzz é um desafio clássico de computação:

Escreva uma função que, para todo número entre 1 e 100, printe:
a) "Fizz" se o número for divisível por 3;
b) "Buzz" se o número for divisível por 5;
c) "FizzBuzz" se o número for divisível por 3 e por 5;
d) O próprio número, em todos os outros casos.

A resolução do problema pode ser encontrada na seguinte videoaula.

4.2 Atividade avançada: Lista de Exercícios 2

Tabela Titanic. Arquivo .csv com dados do titanic, para fazer atividades que demandem dados.

A atividade é a resolução da Lista 2 de exercícios, que envolve alguns conhecimentos mais avançados e cuja resolução, feita pelo Stefan, está no video abaixo.

Rotenberg, Stefan . Videoaula: Resolução da Lista 2.

Esta é uma longa resolução da lista 2 porque, de fato, ela vai muito além de uma resposta aos problemas, visto que o Stefan usa as questões como base para explorar vários conhecimentos sobre programação em Python.