O Banco de Textos de Aquisição da Linguagem Escrita (BATALE) foi criado em 2001 e marca o início das atividades do Grupo de Estudos sobre Aquisição da Linguagem Escrita (GEALE). O BATALE atualmente abriga 7423 textos espontâneos, os quais estão distribuídos em 9 estratos, conforme especificado a seguir:

Estrato Ano Material Coletado Tipo de Coleta Série/Ano Local de Coleta Escola Nº de Textos
Estrato 1 2001-2004 Textos Espontâneos Transversal e longitudinal 1ª a 4ª série Ensino Fundalmental Pelotas/RS/Brasil Público e Particular 2024
Estrato 2 2008 Textos Espontâneos Transversal 1ª a 4ª Ensino Básico Lisboa/Portugual Público 96
Estrato 3 2009 Textos Espontâneos Transversal 1ª a 4ª Ensino Fundamental Pelotas/RS/Brasil Público 507
Estrato 4 2009 Textos Espontâneos Transversal 1ª a 3º Ensino Básico Porto/Portugual Público 783
Estrato 5 2009 Textos Espontâneos ditados de imagens Transversal 1ª a 4º Ensino Fundamental Pelotas/RS/Brasil Público 155
Estrato 6 2009 Textos Espontâneos Transversal e Longitudinal EJA Pelotas/RS/Brasil Público 98
Estrato 7 2013-2015 Textos Espontâneos ditados balanceiados Transversal e Longitudinal 1ª a 5º Ensino Fundamental Pelotas/RS/Brasil Público 1765
Estrato 8 2014-2015 Textos Espontâneos ditados balanceiados Transversal e Longitudinal 1ª a 3º Ensino Fundamental Porto Alegre/RS/Brasil Público 1724
Total 7152

Todas as coletas de texto assim como a aplicação de ditados foram realizadas por integrantes do GEALE e seguiram a mesma metodologia. As oficinas de produção textual que visavam a produção de textos espontâneos, cumpriram a seguinte rotina: aquecimento (atividade de estimulação por meio de imagens ou diálogos), produção (atividade de escrita individual) e socialização (atividade de leitura das produções realizadas).

Um exemplo: a oficina Chico Bento

Motivação: os alunos foram estimulados a falar sobre personagens de HQs muito conhecidos no Brasil (Cascão, Mônica, Magali, Cebolinha e Chico Bento, personagens de Mauricio de Souza). Depois da atividade oral, foi apresentada uma reprodução grande e colorida da capa de uma revista em quadrinhos (40cm X 60cm, aproximadamente) e foi realizada uma atividade de leitura de imagem.

Figura 1: Material para a oficina de produção textual. Fonte: Gibi do Chico Bento, criação de Maurício de Souza, Editora Abril.

Produção: cada aluno recebeu um envelope contendo uma história em quadrinhos sem diálogos e fora de ordem. A tarefa solicitada foi o ordenamento e a colagem dos quadrinhos em uma folha, definindo uma sequência narrativa. Em seguida, pedimos às crianças que produzissem seus textos escritos (sem interferência do adulto, deveriam escrever como achassem que deveria ser).

Fechamento: socialização por meio da leitura das histórias produzidas.

Em momento posterior ao da coleta, os textos e/ou ditados são armazenados em pastas catalográficas, próprias para a conservação adequada do material. Para sua melhor organização e catalogação, são criados códigos para cada texto, dispostos em planilhas de Excel, os quais contêm 11 campos:

1. número do aluno; 2. idade do aluno (ano, mês, dia); 3. sexo do aluno; 4. número do estrato do banco a que pertence o texto do aluno 5. número da coleta a que pertence o texto do aluno; 6. número do texto (pois as crianças podem escrever mais de um texto por coleta); 7. ano em que foi feita a coleta do texto; 8. tipo de texto produzido (argumentativo, descritivo, narrativo); 9. sigla da escola à qual pertence o aluno; 10.série/ano escolar do aluno; 11.turma do aluno. 12.O resultado da composição do código de cada texto está exemplificado a seguir:

00004_080624_M_07_01_01_2013_TA_FO_4A_A

Depois de preparados os códigos, os textos são digitados em formato Word, respeitando-se a grafia utilizada pelas crianças e a troca de linhas, sem qualquer tipo de correção. Os textos são, também, digitalizados e salvos em formato JPEG ou PDF.

Antes da elaboração do Sistema Vestígios, todas as grafias, em que havia algum tipo de erro ortográfico, eram manualmente extraídas dos textos por meio de seu registro em fichas impressas específicas para a classificação dos erros, uma para cada aluno.

Figura 2 – Exemplo de parte da ficha para levantamento dos erros. Fonte: GEALE.

Após, os dados eram inseridos em um programa computacional, criado especificamente para a pesquisa por Amaral (2004), a partir da plataforma Microsoft Access, o qual permitia a estocagem, a tabulação e a computação dos erros.

Figura 3 – Tela inicial do programa Errortog, criado a partir da plataforma Microsoft Access, para a computação dos erros ortográficos. Fonte: GEALE.

Agora, com o novo sistema em funcionamento, os textos seguem sendo a matéria-prima de pesquisa no GEALE, porém o grande diferencial é a interface entre o banco de textos e o banco de erros, o que permite a classificação instantânea dos erros diretamente do manuseio com os textos, eliminando parte da extração manual e otimizando o tempo de trabalho.

É importante destacar que qualquer forma de identificação das crianças participantes das coletas é suprimida no processo de tratamento dos textos e/ou ditados, de forma a preservar sua identidade bem como impedir qualquer forma de exposição, respeitando-se, assim, as normas éticas constitutivas da pesquisa científica. Ressalta-se, também, que as produções são coletadas mediante assinatura do Termo de Consentimento Livre e Esclarecido, pelos pais ou responsáveis (no caso das crianças), pela direção da escola-parceira.

MIRANDA, A. R. M. BATALE: Banco de Textos de Aquisição da Linguagem Escrita. Faculdade de Educação. Universidade Federal de Pelotas. 2001. Disponível em: sistemavestigios.org