Diapositivas para la clase (06/09/2010)

Saludos:

Aquí están las láminas de nuestra décima clase, dedicadas a dar una breve introducción sobre lo que son los corpus lingüísticos:
clase10.pdf
File Size: 5048 kb
File Type: pdf
Download File

Junto con estas láminas, hay dos lecturas relacionadas:

1. La primera es una discusión que sostuvieron Stefan Th. Gries (University of California, Santa Barbara), y Frederick Newmeyer  (University of Washington). En la discusión, Gries ofrece una serie de definiciones sobre lo que es un corpus lingüístico, para qué sirve, por qué son importantes, etc., a un lingüista formal como Newmeyer.

Gries, Stefan Th. (2009): "What is corpus linguistics?", Language and Linguistics Compass, No. 3: 1-17.

gries05.pdf
File Size: 277 kb
File Type: pdf
Download File

En un tono introductorio similar al de Gries, Joan Torruella y Joaquim Llisterri (Universidad Autónoma de Barcelona) elaboraron un artículo  en donde primero definen qué es un corpus lingüístico, y después plantean una tipología posible de corpus, considerando su extensión, sus fines, el tipo de dato lingüístico que contienen, etc.

Torruela, Joan y Llisterri, Joaquim (1999): “Diseño de corpus textuales y orales”, en Blecua J., Clavería G., Sánchez C. y Torruela J. (eds.), Filología e informática, Barcelona, UAB/Editorial Milenio: 45-77.
torruella_llisterri_01.pdf
File Size: 204 kb
File Type: pdf
Download File

Y ahora, unas preguntas para comentar la siguiente clase:

1. En la discusión que tienen Gries  Newmeyer, ¿cuáles son los aspectos que no le quedan claros al segundo respecto a lo que es un CL?

2. De acuerdo con Gries, ¿un CL es un método de análisis, o es una teoría lingüística?

3. ¿A qué se refiere Gries cuando dice que los CLs muestras las "regularidades" de una lengua natural?

4. Para Torruela y Listerri, ¿cuáles son las ventajas de que un CL tenga una gran dimensión, esto es, que contenga millones de palabras?

5. ¿Qué rasgos consideran estos dos autores para clasificar corpus?

6. Basados en las dos lecturas: ¿por qué se pondera en los corpus su cualidad de ser electrónicos? En otras palabras: ¿qué ventajas tienen los corpus electrónicos en contraste con colecciones de datos lingüísticos?