Construção de corpus diacrônico de jornais paulistas

Projeto de solicitação de auxiliar-técnico para o Projeto Caipira


Project Report, 2008
7 Pages

Free online reading

Título: Construção de corpus diacrônico de jornais paulistas

Alessandra Castilho da Costa

1. Resumo

O Projeto de História do Português Paulista (PHPP) é um conjunto articulado de projetos da área da Lingüística Histórica do Português que tem por objetivo investigar a formação da sociedade paulista e as variedades lingüísticas do Português Brasileiro, tais como testemunhadas no Estado de São Paulo e em sua capital. O termo “caipira” de seu subtítulo toma por antonomásia a sociedade paulista em seu todo.

A unidade temática do PHPP localiza-se na percepção compartilhada por seus pesquisadores, segundo os quais a língua é um multissistema cujas categorias são nucleadas à volta do Discurso, da Gramática, da Semântica e do Léxico. Conseqüentemente, o estudo diacrônico das variedades do português paulista deverá cobrir seus aspectos discursivo, gramatical, semântico e lexical, na modalidade “Projeto Temático de Equipe” (FAPESP Processo: 06/55944-0).

Esse projeto é fruto de um largo amadurecimento da Lingüística paulista, em sua busca de temas fundamentais para o conhecimento científico do Português do Estado de São Paulo e do País.

O estudo diacrônico da variedade paulista do português brasileiro requer a construção de um Corpus Diacrônico do Português Paulista que será objeto de análises empíricas. O presente projeto pretende contribuir para a construção do corpus diacrônico com a compilação de jornais paulistas dos séculos XIX a XXI.

2. Descrição dos objetivos:

Como previsto pelo Projeto de História do Português Paulista (PHPP) (cf. Castilho 2007), a construção de um corpus diacrônico de jornais paulistas persegue os seguintes objetivos:

- desenvolver um corpus representativo da linguagem jornalística dos séculos XIX a XXI, com o fim de descrever traços de permanência e mudança do português paulista em vários níveis de linguagem (classes de palavras e construções sintáticas, entre outros aspectos);
- transcrever, construir e disponibilizar um corpus diacrônico e representativo de gêneros jornalísticos, que permita a investigação das inter-relações entre gêneros, isto é, a ligação funcional entre gêneros, e sua formação numa perspectiva diacrônica;
- transcrever, construir e disponibilizar um corpus diacrônico e representativo de gêneros jornalísticos, que permita a investigação da diacronia dos processos constitutivos do texto;
- contribuir para a organização de um Corpus Diacrônico do Português Paulista, que estimulará outros estudos sobre essa variedade do PB.

3. Plano de trabalho

3.1 Metodologia: extensão do corpus , organização por épocas históricas e normas de transcrição

A fim de permitir a observação de regularidades em uma perspectiva diacrônica, é necessário que o corpus apresente textos assemelhados (em termos de função ou estrutura) de épocas diferentes para que sejam comparados. Para tornar o corpus de dados equilibrado, serão levantados textos jornalísticos qualitativa e quantitavamente aproximados, i.e., de um lado, os textos serão levantados de acordo com o jornal ( O Correio Paulistano , A Província de S. Paulo , por exemplo), a seção do jornal (Política, Cotidiano, Ilustrada, por exemplo) e o gênero discursivo ( notícia , artigo , entrevista , carta do leitor , etc.) a que pertencem e deverão ser uniformemente distribuídos entre os grupos de dados. Os dados serão levantados em jornais que permitam observar uma evolução histórica. Os dois jornais mais antigos de São Paulo e com continuidade de publicação desde o século XIX são A Província de S. Paulo / O Estado de S. Paulo (de 1875 até hoje) e O Correio Paulistano (1854-1966, tendo ressuscitado em julho de 2006).

Dado que a probabilidade de freqüência de determinados gêneros textuais no jornal é bastante alta (a exemplo, das “notícias da província” e dos “anúncios” no século XIX, que são bastante recorrentes), podemos concluir que um baixo número de edições de jornal pode representar as redes de gêneros textuais, isto é, com poucas edições de jornais, as inter-relações entre os gêneros textuais podem ser investigadas. A extensão do presente corpus deve contemplar o limite de 60 edições no total, a fim de tornar possível a análise de aspectos sintáticos nesses dados.

Visto que no século XIX, as edições do Correio Paulistano e d´ A Província de S. Paulo possuem cerca de 10 páginas digitadas (ou 5000 palavras), devem ser coletadas cerca de 10 (dez) edições de jornal (cerca de 50.000 palavras) por época para garantir a representatividade da amostra.

Como critérios de seleção dos dados, serão seguidos aqueles acordados durante a reunião da Comissão de Corpus em 10 de setembro deste ano (cf. Simões 2007):

1. O corpus deve demonstrar uma constância na diacronia, por exemplo, procurar reunir exemplares do mesmo gênero para todos os séculos.
2. O corpus deve ter um controle do número de palavras ou número de textos (dos gêneros discursivos) para manter um equilíbrio entre os textos.
3. O corpus deve ser organizado segundo os seguintes eixos organizadores: a) gênero discursivo e b) século.

Os dados levantados obedecerão a um intervalo de 30 anos, que representa uma geração de vida, tempo estimado para que ocorram mudanças na língua.

6 of 7 pages

Details

Title
Construção de corpus diacrônico de jornais paulistas
Subtitle
Projeto de solicitação de auxiliar-técnico para o Projeto Caipira
College
University of Sao Paulo; Department of philosophy  (Fundação de Amparo à Pesquisa do Estado de São Paulo - FFLCH)
Course
Pós-Doutorado na área de Filologia e Língua Portuguesa
Author
Year
2008
Pages
7
Catalog Number
V170557
File size
467 KB
Language
Portugues
Tags
construção, projeto, caipira
Quote paper
Dr. Alessandra Castilho da Costa (Author), 2008, Construção de corpus diacrônico de jornais paulistas, Munich, GRIN Verlag, https://www.grin.com/document/170557

Comments

  • No comments yet.
Read the ebook
Title: Construção de corpus diacrônico de jornais paulistas


Upload papers

Your term paper / thesis:

- Publication as eBook and book
- High royalties for the sales
- Completely free - with ISBN
- It only takes five minutes
- Every paper finds readers

Publish now - it's free