Objeto de pesquisa e unidade de análise

1. Introdução

Um dos pontos fundamentais da pesquisa é identificar com precisão qual é o objeto da investigação. Esse objeto deve estar referido diretamente pelo problema de pesquisa, já que este é uma pergunta acerca de algo: esse algo é justamente o objeto da pesquisa.

Ocorre que, para compreender o objeto da pesquisa, é preciso fazer um processo de coleta de dados, em busca de informações que nos digam algo com relação ao nosso objeto. Se queremos saber sobre os padrões de julgamentos de ADIs, sobre o modo como o STJ lida com precedentes ou sobre a potencial eficácia de certas estratégias de formulação de políticas públicas judiciárias, precisamos definir com clareza quais serão as informações que julgamos ser possíveis produzir e cuja análise pode responder ao nosso problema de pesquisa.

Nesse processo de definição dos dados a serem buscados, algumas abordagens diferentes são possíveis, que vão conduzir a desenhos de pesquisa bastante diversos. Como a área jurídica é pouco propensa a experimentos, trataremos aqui apenas de estratégias observacionais.

2. Abordagens sincrônicas e diacrônicas

Em primeiro lugar, podemos nos limitar a colher dados referentes a um momento determinado (o que nos levará a analisar a relação desses dados apenas nesse momento) ou colher dados referentes a momentos temporais diversos (o que nos possibilita identificar padrões de modificação dos fenômenos no tempo).

Nesse caso, podem ser analisados dados referentes a um momento determinado, que funcionam como uma espécie de "fotografia". Isso ocorre, por exemplo, quando se analisa o conjunto de casos que estão na pauta de julgamento de um tribunal, para compreender a sua composição. Sampieri e outros chamam esse desenho de transversal, mas preferimos chamar de sincrônico, para acentuar que se trata de um levantamento de dados sobre uma situação fixada no tempo.

Esse tipo de abordagem se diferencia das diacrônicas (chamadas por Sampieri de longitudinais), que levantam dados referentes a momentos diversos, o que permite fazer análises das transformações dos dados ao longo do tempo. Isso ocorreria, por exemplo, se levantássemos os dados da composição da pauta do Conselho Especial do STJ na primeira semana de março dos últimos 20 anos, com o objetivo de mapear o modo como a composição da pauta se modificou durante esse período.

Os estudos diacrônicos são adequados para avaliar o modo como certos elementos variam, dentro de períodos de tempo predeterminados. No judiciário, eles são úteis para investigar objetos como a composição da pauta, os tipos de decisão dos mandados de segurança, o número de processos ajuizados, os argumentos utilizados para extinguir.

Muitas vezes, as abordagens sincrônicas só fazem sentido como parte de uma série de investigações, como ocorre nas pesquisas de intenção de voto. Cada uma delas é relevante pelo fato de medir as intenções em um momento determinado, mas a devida compreensão do fenômeno mapeado exige uma multiplicidade de pesquisas, que possibilitem compreender a evolução dessas intenções no tempo.

Você pode fazer uma pesquisa sincrônica (por exemplo, sobre a composição dos estoques de processos nos gabinetes de um determinado órgão julgador, em um tempo determinado), que estará acoplada a outras pesquisas sincrônicas (que farão esse mapeamento relativamente a outros momentos). Ou você pode fazer uma pesquisa sincrônica quando levanta dados nos quais o tempo não é uma variável relevante: por exemplo, mapeando os tipos de julgamentos que foram realizados nos últimos dois anos por um gabinete, mas tratando esse conjunto como um grupo único, que não será segmentado por datas de julgamento.

O tipo de abordagem dependerá dos seu problema de pesquisa, e dos objetivos que você definiu para especificá-lo. Se algum dos seus objetivos envolve comparar situações em tempos diversos, você precisará inserir esse elemento diacrônico em sua abordagem. Porém, se os seus objetivos não implicarem esse tipo de comparação, a sua abordagem será sincrônica.

Em campos que tratam de características mais estáveis (como, por exemplo, a existência de vieses cognitivos ou o impacto de certos medicamentos em uma doença), abordagens sincrônicas normalmente são adequadas. No campo do direito, porém, é muito comum que o seu objeto de estudo varie bastante ao longo do tempo, o que aponta para a necessidade de realizar abordagens diacrônicas, para que sejam possíveis conclusões mais sólidas.

Inobstante, pode ser que a riqueza do seu trabalho esteja na comparação sincrônica de padrões de comportamento de diferentes órgãos, de diferentes tribunais ou em diferentes regiões. Em casos como esses, é mais comum uma abordagem sincrônica porque a cumulação de dois níveis de comparação (diacrônico e sincrônico) eleva muito a complexidade do trabalho.

Além disso o enfoque sincrônico pode ser justificado em pesquisas exploratórias pelo fato de que não se trata de buscar conclusões explicativas, mas apenas a de identificar as categorias mais adequadas e os tipos de relação entre fenômenos que poderão ser utilizados para formular pesquisas capazes de gerar resultados descritivos  mais sólidos, ou até mesmo ou explicativos.

3. A unidade de análise

As teorias científicas normalmente fazem afirmações acerca de uma classe de objetos: mamíferos, sistemas de governo, infecções virais, decisões de procedência. Cada classe nomeia um conjunto finito de objetos (todos os seres humanos, todos os processos do STJ, etc.) e um dos maiores desafios da ciência é conseguir fazer afirmações seguras sobre todos os membros de uma classe, a partir de pesquisas que somente avaliam um número relativamente restrito de situações concretas.

Uma vez escolhido o objeto de pesquisa, é preciso definir uma forma de descrevê-lo, o que nos coloca frente ao problema do "marco teórico". Um dos pontos fundamentais desse marco é a descrição que fazemos do nosso objeto em termos de identificar os elementos que o compõem.

A pergunta sobre os "componentes" é necessária porque todo objeto de pesquisa é complexo, e pode ser subdividido nas unidades que o compõem. Uma classe processual é composta por uma série de processos individuais. Um processo é composto por peças, como a decisão. Uma decisão é composta por partes, como o relatório e o dispositivo. O dispositivo é composto por termos que, combinados, lhe dão um significado.

Por um lado, temos a intuição de que existe uma organização contínua que une todos esses elementos dentro de um sistema. Talvez exista uma ordem global que conecta os significados de cada uma das palavras de todos dispositivos de todos acórdãos do STJ que julgam Mandados de Segurança. Porém, essa é uma ordem de tal complexidade que não é possível reconstruí-la por meio de uma pesquisa. Unir todos esses esses elementos dentro da mesma estratégia de abordagem provavelmente nos conduzirá a não perceber padrões nos dados que levantamos.

Por isso, precisamos escolher um nível de análise específico, que vai definir o tipo de dados que vamos coletar e interpretar. Se eu defino o meu objeto de pesquisa como os "julgamentos de Mandados de Segurança feitos pelo STJ", tudo indica que eu tomo o meu objeto como um "conjunto de decisões", o que tipicamente me coloca o desafio de fazer uma coleta de dados que identifica uma série de decisões individuais. Essa forma de definir o objeto de pesquisa (um conjunto de decisões a ser mapeado) tipicamente estabelece o desafio de levantar dados acerca de todas as decisões que compõem esse conjunto (numa abordagem censitária) ou de um conjunto determinado de decisões (numa abordagem amostral), para que eu possa realizar uma operação indutiva: fazer uma descrição do conjunto a partir de informações levantadas acerca de seus componentes.

Nesse tipo de escolha, a unidade de análise da pesquisa é a decisão. Os dados serão coletados com referência a decisões particulares e a pesquisa aposta que esse tipo de informação poderá me dizer algo sobre o meu objeto.

Mas quais são os dados que eu vou coletar sobre essas variadas decisões? Isso vai depender do problema de pesquisa. Podemos coletar dados sobre as partes, sobre o valor da causa, sobre os impactos políticos do processo, sobre as características dos julgadores, sobre o número de palavras da decisão, sobre a existência ou não de referências a outros processos.

A única coisa que é certa é que você não vai coletar todos os dados possíveis, pois isso não seria factível. De fato, a pesquisa empírica exige de você que colete o mínimo de dados possível, pois cada um deles exige trabalho. Se você tiver uma abordagem que pode dizer coisas importantes levantando apenas alguns dados simples (como nomes das partes ou tipo de provimento), sua pesquisa será muito eficiente: dirá coisas importantes com um esforço pequeno.

Os dados referentes a cada unidade de análise são o que chamamos de variáveis, visto que as características específicas de cada uma das unidades (no caso, de cada decisão) são definidas pelos valores de cada uma das variáveis que definimos: data da sessão de julgamento, órgão julgador, número de ministros presentes, existência de votos divergentes, etc.

Para sermos mais precisos, as variáveis não são propriamente os dados, mas são categorias de dados. Os dados coletados são os valores que essas variáveis têm para cada uma das unidades de análise. Assim, a nossa unidade de análise são as decisões e podemos definir uma série de variáveis, que indicam quais são as informações a serem buscadas com relação a cada uma das decisões. E os valores são os dados específicos que as variáveis assumem com relação a cada unidade particular.

Mas há alternativas: em vez de coletar dados relativos a cada decisão, podemos  coletar dados relativos a cada processo, o que vai gerar uma abordagem diferente, pois o mesmo processo pode ter várias decisões e uma mesma decisão pode impactar processos diferentes (no caso de apensamento, conexão ou julgamento conjunto). Se eu escolher como unidade de análise o processo, pode ser que eu entenda que existe uma continuidade entre a decisão liminar e a decisão final (pois ambas se referem ao mesmo caso). Se eu escolher como unidade de análise a decisão, posso tratar a decisão liminar e a final como elementos diferentes, que terão atores e conteúdos próprios.

Um resultado bem diferente ocorreria se utilizássemos como unidade de análise os votos. Poderíamos entender que cada julgamento é um conjunto de votos e coletar dados no nível dos votos e não no nível dos processos ou das decisões. Cada uma dessas escolhas nos dará uma base de dados diferente: se construirmos uma tabela com esses dados, as unidades de análise tipicamente nos oferecem as nossas linhas, as variáveis são as nossas colunas e os valores são os dados contidos em cada célula.

A definição da unidade de análise gera variáveis muito diferentes, pois os atributos de decisões, de processos ou de votos são bastante diversos. Podemos classificar decisões em liminares ou definitivas, mas não podemos classificar processos usando essa categoria. Podemos classificar votos como divergentes ou convergentes, mas não podemos usar essa categoria para descrever os processos.

A escolha da unidade de análise é um dos elementos fundamentais do desenho da pesquisa porque os dados serão levantados tendo como referência essa unidade. No caso da pesquisa em direito, por exemplo, teremos resultados bem diferentes se usarmos como unidade de análise os processos ou se usarmos como unidade de análise os pedidos, visto que um mesmo processo pode julgar vários pedidos diferentes. Usando uma metáfora biológica, chamamos o conjunto de todos os objetos de uma mesma classe de população: quando escolhemos como unidade de análise os processos, nós coletamos dados que nos permitem falar de uma população de processos.

A maioria das nossas conclusões não terá validade para um objeto particular. Uma pesquisa exaustiva sobre padrões de julgamento pode permitir que se descubra que certos fatores tornam mais provável uma decisão de procedência, mas não permitem prever os resultados de um caso concreto. Não podemos prever com certeza qual será o impacto do uso de corticoides no tratamento de um paciente com Covid-19, embora haja estudos que indiquem que a maioria dos pacientes graves tende a ter resultados positivos com esse tratamento.

Quando falamos de tempo de tratamento ou de óbito, usamos categorias que somente se aplicam a pacientes concretos. Uma população não é tratada nem morre. Somente indivíduos são tratados por um certo tempo e podem morrer ou sobreviver. É a análise de uma série de situações particulares que nos permite fazer afirmações sobre a população, usando categorias que se aplicam no nível populacional: tempo médio de tratamento, mortalidade, índice de recuperação.

Chamamos de modelo de dados essa definição de qual é a unidade de análise e quais são as variáveis que definem as informações que colheremos com relação a cada um dos elementos que compõem o nosso universo empírico.