Fala Infantil e Dirigida à Criança

 

O Corpus FDC e o Corpus FI são compostos por uma lista de frequências que quantifica as palavras da fala infantil (FI) e da fala dirigida à criança (FDC). Estas palavras advêm das gravações naturalístico-longitudinais do banco de dados coordenado pela Profª Drª Raquel Santana Santos, tendo sido tratadas com auxílio dos scripts em Python de Benevides & Guide (2016). Por ora, foram compilados dados quinzenais de três crianças paulistas (Am: 1;10-4;0 anos; Ar: 2;0-4;11 anos; Lz: 1;7-5;6 anos) e de suas mães e demais cuidadores, totalizando 273 transcrições ortográficas (cerca de 136 horas de fala). 

Os dados dos corpora apresentam as seguintes anotações:

Corpus FI

​​​​​​​​​​​​​​

  • Palavra ortográfica;
  • Lema;
  • Categoria morfológica;
  • Transcrição fonêmica;
  • Transcrição fonológica (tonicidade demarcada);
  • Estruturação silábica;
  • Classificação acentual;
  • Frequência em tokens.

Para acessar os corpora: preencha o seguinte formulário com suas informações de contato. O link de acesso aos dados será disponibilizado em seguida.

Formulário de acesso

​​​​​​​Como citar:

CORPUS FI: banco de dados preparado por SANTOS, R.S. e TONI, A. (2020). Disponível em: http://leal.fflch.usp.br/Corpora-FI-FDC. Acesso em XXX.

CORPUS FDC: banco de dados preparado por SANTOS, R.S. e TONI, A. (2020). Disponível em: http://leal.fflch.usp.br/Corpora-FI-FDC. Acesso em XXX.