AntConc
AntConc http://www.laurenceanthony.net/software/antconc/ es un programa libre que también permite el análisis lingüístico de los textos. Utiliza solo el formato .txt.
AntConc tiene 7 pestañas diferentes:
- Concordance: genera concordancias de un término en concreto, el término es conocido como KWIC (Keyword in Context)
- Concordance Plot: visualiza el resultado del KWIC en un gráfico, donde cada línea negra representa una ocurrencia del término en cada uno de los archivos del corpus.
- File View: visualiza el archivo completo.
- Clusters/N-Gram: esta función sirve para obtener las palabras que acompañana a un término en concreto, pudiendo elegir el número de palabras que queremos a la izquierda o a la derecha.
- Collocate: indica las palabras que estadísticamente tienen poca probabilidad de aparecer juntas.
- Word List: esta es la función más utilizada y consiste en una simple lista de palabras de todo el corpus, organizadas por orden alfabético, por frecuencia, o por final de palabra.
- Keyword List: ofrece comparaciones entre dos corpus.
Ejercicio 1
- Descargad el archivo zip que contiene los textos de García Lorca “CorpusLorca.zip” y guardadlo en un lugar donde os acordéis.
- Id a “File” y “Open dir”, y se os abrirán todos los 23 documentos que contiene el zip.
- Situaros en la pestaña “Word List”, y cread una lista alfabética de todas las palabras. ¿Qué utilidades podría tener esta función?
- ¿Cuál es el número total de palabras de este corpus (Word Tokens)? ¿Y cuántas palabras únicas hay (Word Types?
- Ahora cread una lista de las palabras (“Word List”) según su frecuencia. ¿Cuáles son las palabras más frecuentes? ¿Qué son las palabras funcionales (function words, stopwords)? ¿Crees que son relevantes en un texto o para estudiar el estilo de un autor?
- Busca ahora algunas de las palabras que puedan ser semánticamente relevantes para el estudio de la obra de García Lorca.
- Sitúate en la pestaña de “Concordance”, busca la palabra “sangre”, clica en “Start” y crea una concordancia. ¿En qué obras aparece?
- ¿Qué sucede si clicamos “Sort”?
- ¿Para qué sirve el “FileView”?
- ¿Qué utilidad tiene el “Cluster Plot”? ¿Cómo obtendrías un “Cluster Plor” de la palabra “sangre”?
- ¿Cómo harías para encontrar todas las ocurrencias de una palabra tanto en singular como en plural? Por ejemplo, niño, niña, niños, niñas.
- Salva todas las ocurrencias que has obtenido de niño, niña, niños, niñas en un fichero de texto. (File > Save output)
- Desde la pestaña “Colocates” busca las palabras que aparecen más frecuentemente con “luna”.