Member for

5 years 7 months

Projeto: A fala da criança no século XXI - construindo um banco de dados do português brasileiro

 

Pesquisadora responsável: Profa. Dra. Raquel Santana Santos

 

De 2004 a 2006, a FAPESP financiou, juntamente com um projeto de pesquisa, a constituição de um banco de dados de aquisição (processo 03/13565-4), que foi depois complementado com um auxílio CNPq (401024/2006-7), por mais dois anos. Trata-se de um banco de dados de coleta longitudinal, naturalística, com corpora de 11 crianças. Ao todo, foram gravadas em vídeo e áudio mais de 886 sessões de aproximadamente 30 minutos cada, iniciando tão cedo quanto 10 meses e algumas indo até os 5 anos de idade. Em média, cada criança foi acompanhada semanalmente por 3 anos.

Iniciado em 2004, este trabalho dividiu-se em diversas etapas, das quais estão concluídas a coleta dos dados, digitalização, transcrição ortográfica e codificação morfológica. Integrantes do LEAL trabalham no momento na codificação dos dados em formato CHILDES e na transcrição fonética da fala das crianças. O próximo passo é a anonimização dos áudios (já feita para a transcrição).

Este projeto contou, em suas diversas etapas, além do trabalho dos integrantes do LEAL, com alunos especialistas em fonética da USP, com alunos da UNISANTOS, e do LABLinc (UNIFESP), que se responsabilizaram pela codificação morfológica de uma amostra dos dados.

O objetivo é que, uma vez codificados e anonimizados, tanto as transcrições quanto os áudios anonimizados passem a fazer parte da plataforma CHILDES.