1. Informações gerais
Este curso tem sido ministrado na Universidade de Brasília, desde 2019, encontrando-se agora em sua sexta edição. Desta vez, ele é oferecido em duas turmas:
- No PMPD, ele será lançado como Ciência de dados aplicada ao direito regulatório e políticas públicas.
- Na graduação, ela será lançada como Atualização e Prática do Direito 2 (Turma C), e será oferecida em dupla entrada, juntamente com a disciplina do PPGD.
O material do curso é livremente disponibilizado na internet, mas a participação nos encontros síncronos é destinada aos estudantes matriculados nestes cursos, seja como alunos efetivos ou alunos especiais.
2. Objetivos
Abordar o direito a partir da data science envolve enfrentar o desafio de como as práticas jurídicas podem ser explicadas a partir de interpretações realizadas a partir de bases de dados. Essas interpretações consistem na busca de padrões, de algum tipo de regularidade que nos permita utilizar um conjunto informações particulares (sobre processos, sobre decisões, sobre ministros), para fazer afirmações gerais sobre o conjunto de dados.
Para enfrentar esse desafio, o primeiro passo é aprender como é possível fazer pesquisa a partir de bases de dados já existentes, desenhando pesquisas capazes de construir novos conhecimentos, a partir de informações previamente organizadas.
Porém, nem sempre as bases disponíveis são suficientes para enfrentar os nossos problemas de pesquisa, o que pode exigir a construção de novas bases ou, no mínimo, a complementação de bases existentes. Essa complementação normalmente se dá por meio da criação e implementação de novas classificações, que permitam segmentar os dados segundo parâmetros diversos dos que vinham sendo utilizados.
O desafio geral é encontrar padrões, mas os padrões somente são formados quando classificamos os dados de uma maneira determinada. A classificação é o grande desafio teórico e filosófico envolvido na pesquisa, pois ela envolve o desenvolvimento de modelos conceituais capazes de captar as complexidades dos objetos que pretendemos descrever. Sem uma teoria adequada, é impossível fazer pesquisa empírica com resultados sólidos e é muito fácil chegar a conclusões equivocadas, ainda mais quando se utiliza modelos de machine learning.
Os modelos de machine learning são algoritmos desenvolvidos para buscar padrões e eles encontram padrões em quase qualquer conjunto de informações. Ferramentas de clusterização, por exemplo, vão subdividir um conjunto em subconjuntos, a partir de critérios de semelhança. Ocorre que esses modelos encontram padrões nas informações, não encontram padrões nos fatos. Para que eles possam ser úteis, é preciso converter os fenômenos observados empiricamente em informações com sentido, o que exige conhecimento material profundo dos objetos analisados. Sem um modelo descritivo adequado, não é possível aplicar as ferramentas computacionais disponíveis.
Portanto, a observação de padrões significativos em um conjunto de dados exige a combinação de conhecimento material (que garanta classificações adequadas) com habilidades computacionais (que viabilize o desenvolvimento de algoritmos adequados de análise).
Para completar o tripé da data science, precisamos de um terceiro conjunto de habilidades, que capacite o pesquisador a fazer inferências sólidas a partir do conjunto de dados. O estudo de como é possível fazer afirmações confiáveis sobre os padrões existentes em um conjunto de dados recebe tipicamente o nome de metodologia. Que estratégias metodológicas são viáveis para que seja possível compreender o modo como alguns fenômenos observáveis se relacionam?
O curso de Data Science e Direito tem por objetivo servir como uma introdução para juristas, com relação às potencialidades da ciência de dados para a compreensão de fenômenos jurídicos. Essa finalidade faz com que o curso seja modelado para pessoas que tenham um conhecimento material relativamente amplo sobre o direito, mas que precisam desenvolver habilidades metodológicas (relativas ao desenho da pesquisa) e computacionais (que viabilizem a sua execução).
3. Estrutura do curso
3.1 Módulos semanais
A disciplina é dividida em 15 módulos compostos de 4h de atividades semanais e 4h de estudos.
Em vez de contar os módulos a partir da sexta-feira, vamos contá-los a partir das quartas-feiras, para incorporar no próprio módulo o tempo de leitura. Assim, cada módulo (exceto o primeiro, evidentemente) terá início em uma quarta e se encerrará na terça-feira seguinte.
As 4 horas de atividades semanais são compostas por:
- Encontro síncrono geral (2h)
- Atividades práticas semanais (2h)
As quatro horas de estudo são compostas por:
- Leituras obrigatórias + leituras sugeridas: (cerca de 2h semanais)
- Estudo e atividades complementares (até 2 horas)
Essa combinação vai variar conforme o conteúdo dos módulos, que podem agregar outras atividades, incluindo outras atividades síncronas, que serão devidamente marcadas no Calendário.
Neste momento em que as atividades da UnB são remotas, o nosso foco será em atividades assíncronas, que possibilitem que cada estudante acople essa atividade a sua agenda.
3.2 Encontros semanais
Os encontros semanais são de dois tipos:
- Encontros síncronos gerais, realizados nas sextas-feiras (9h00 a 11h30 no período da manhã e 19:00 a 21:00 no período noturno), com o objetivo principal de servir como lugar de diálogo acerca dos textos de leitura obrigatória e complementar.
- Encontros síncronos em grupo. Não teremos uma divisão obrigatória em grupos, mas indicamos fortemente que os estudantes formem grupos, a partir de suas afinidades. Por esse motivo, os estudantes que montarem um grupo que se reunir ao menos 6 vezes ao longo do semestre podem apresentar um relatório da atividade do grupo como uma atividade complementar que aumenta a menção final em um grau: de MI para MM, de MM para MS, de MS para SS.
As atividades práticas funcionam melhor se as pessoas tiverem uma forma de dialogar sobre elas, de buscar caminhos, e um grupo de trabalho, que se reúna semanalmente para conversar sobre os temas da disciplina, é de grande auxílio.
Estes encontros em grupo são voltados a permitir o diálogo entre os estudantes, que é um dos pontos mais prejudicados pelo sistema de ensino remoto, tratando-se de elemento fundamental para o rendimento pedagógico adequado dos estudantes. Este tipo de diálogo é ainda mais importante na segunda parte do curso, quando haverá muitas atividades práticas, cuja realização em grupo é mais produtiva.
3.3 Leituras
Um dos pontos fundamentais do curso são as leituras previstas em cada módulo, que serão de 3 tipos:
- Leitura obrigatória: é o mínimo para o acompanhamento das aulas.
- Leitura sugerida: leitura indicada para chegar a um resultado superior de aprendizagem. Para obter um MS, é preciso que o estudante leia parte substancial da literatura sugerida.
- Leitura complementar: leitura de tópicos específicos. Para pretender um SS, os estudantes devem ultrapassar as leituras mínima e sugerida e explorar (parcialmente, claro) a literatura complementar e as atividades complementares (observando que o trabalho final é considerado uma atividade complementar).
3.4 Atividades envolvidas na disciplina
3.4.1 Atividades práticas semanais
- Atividades em classe, a serem realizadas durante os encontros síncronos gerais.
- Atividades assíncronas obrigatórias.
- Atividades assíncronas complementares, de realização facultativa, previstas apenas em alguns módulos.
3.4.3 Relatório final
Ao final da disciplina, cada estudante deverá entregar um relatório final, descrevendo a sua participação, avaliando o seu rendimento e apresentando uma autoavaliação que atribua ao seu desempenho a menção que for adequada, nos termos da descrição de cada menção (no ponto 5, abaixo).
3.4.4 Trabalho final técnico ou acadêmico
Como atividade complementar, cada estudante deverá apresentar um trabalho final, que pode ser feito individualmente ou em grupo. O tipo do trabalho final e os grupos que o realizarão devem ser definidos até o final do Módulo 12 (embora seja desejável que essa definição ocorra em meados do curso)
Este trabalho pode ser:
- Um projeto de pesquisa de dados em direito. Também é possível fazer um artigo, mas dificilmente haverá tempo hábil para planejar e executar uma pesquisa.
- Um programa capaz de extrair dados e gerar um banco, acerca de dados que não foram ainda colhidos e organizados.
- Um banco de dados desenvolvido, construído ao longo da disciplina, que possa ser disponibilizado de forma pública.
- Participação na rede de pesquisa CoronaNet, em função que lida com coleta e análise de dados.
- Outro trabalho técnico ou acadêmico, desde que seja aprovado pelo(s) docente(s). Nesse caso, o estudante ou grupo deve apresentar uma proposta de trabalho alternativo até o final do prazo de definição do trabalho final.
4. Sistema de Menções
As menções do curso terão o seguinte significado:
- SR - Abandono do curso.
- II ou MI - Resultado insuficiente. Leituras incompletas dos textos obrigatórios, muitas faltas nos encontros síncronos e pouca realização das atividades.
- MM - Resultado mínimo: esse é o resultado esperado dos estudantes que focarem no comparecimento das aulas e na realização das atividades obrigatórias. Esse rendimento correspondente à realização da maior parte das leituras obrigatórias e atividades semanais, mas sem uma realização constante das leituras sugeridas e sem uma participação ativa nos encontros síncronos. Em termos de tempo, o MM corresponde a uma média de 4 horas de dedicação semanal (o que permite dedicar-se aos encontros gerais, às atividades obrigatórias e a parte substancial da leitura obrigatória).
- MS - Resultado bom: esse é o resultado esperado para os estudantes que têm uma presença constante nos encontros síncronos (gerais e em grupo), realizam quase todas as leituras obrigatórias, parte substancial da leitura sugerida e participam das atividades individuais e em grupo. Esse é o resultado esperado para quem dedicar uma média de 5 horas semanais (o que permite fazer todas as leituras obrigatórias e incorporar também parte das leituras sugeridas)
- SS - Resultado excelente: esse resultado envolve, além das leituras e atividades obrigatórias, a realização de boa parte das leituras sugeridas, a exploração de parte da literatura complementar e a realização do trabalho final. Além disso, essa nota reflete uma participação constante e ativa nos encontros síncronos. Trata-se de um resultado que exige mais 6 horas de dedicação semanal (o que permite incorporar as atividades complementares, especialmente a realização do trabalho final).