Español Hablado en Bogotá

El corpus del Español Hablado en Bogotá (EHB) cuenta con 241 encuestas semilibres de entre 45 y 60 minutos. Estas grabaciones fueron recopiladas entre 1990 y 1992 en un proyecto dirigido por el Departamento de Dialectología del ICC para realizar un trabajo enfocado en "dialectología urbana con métodos sociolingüísticos" (Montes, 1998, p. 18). El corpus cuenta con 477 informantes, homb

Ver más

Metadatos

Los metadatos corresponden a tres grandes bloques:

I. Documentos: Información técnica de cada grabación.

II. Sesiones: Recoge la información descriptiva de cada archivo. Identificación del hablante, descripción de la muestra, tipo de encuesta, encuestador, fecha de la muestra, temas, entre otros.

III. Informantes: Información y datos sociolingüísticos de los informantes: edad, género, lugar de nacimiento, estrato, nivel educativo, profesión, oficio, viajes, procedencia de los padres y del cónyuge, etc.

Transcripción

Las grabaciones de EHB fueron transcritas y analizadas con un programa de computador desarrollado como tesis de grado por dos estudiantes de sistemas, Hugo Suárez y Jorge Molina. La aplicación se llamaba SATES y comenzó a funcionar en 1994. Como resultado de los procesos de transcripción y análisis, se publicaron dos trabajos: el primero es una muestra impresa con la transcripción de 30 grabaciones: El español hablado en Bogotá. Relatos semilibres de informantes pertenecientes a tres estratos sociales (Montes, 1997) y un análisis de los resultados realizado a partir del software SATES: El español hablado en Bogotá. Análisis previo de su estratificación social (Montes, 1998). Estas transcripciones tienen algunas marcas de fenómenos lingüísticos específicos como la aspiración de la s (loj mijmoj, curaj, ej), la elisión de consonantes (universidá, onde, salú) o el yeísmo (yego). Las convenciones usadas para la transcripción se observan en la tabla 1.

Tabla 1

Convenciones de transcripción del corpus EHB

Convención

Descripción

ENC.?

Encuestador

INF. ?

Informante

...

Vacilación o suspensión

..

Después de palabra incompleta o trunca

?

Separa repeticiones

? ?

Citas textuales

J

Aspiración de s

[--]

Lo que no se entendió. Lo que parece que es o que resulta ininteligible

iii

Repetición de fonemas finales

( )

Cuando el informante tose o le da risa

(?)

Se cree que el informante dijo algo pero no se está seguro

Mj., o Mm.

Sonido que se produce frecuentemente en los relatos

Nota. Tomado de Montes (1997). El español hablado en Bogotá. Relatos semilibres de informantes pertenecientes a tres estratos sociales. Bogotá: Instituto Caro y Cuervo.



Del Español Hablado en Bogotá

Coordinación de la investigación: Departamento de Dialectología del Instituto Caro y Cuervo
Director de la investigación: José Joaquín Montes Giraldo
Coordinadora de la investigación: Jennie Figueroa Lorza
Investigadores: Jennie Figueroa Lorza
Siervo Mora Monroy
Mariano Lozano Ramírez
Ricardo A. Ramírez Caro
María Bernarda Espejo Olaya
Gloria E. Duarte Huertas
Transcripción: Gloria E. Duarte Huertas
Siervo Mora Monroy
María Bernarda Espejo Olaya
Mariano Lozano Ramírez
Ricardo A. Ramírez Caro
Auxiliares de recolección de materiales: Marilyn Ortiz Sánchez
María Clara Henríquez Guarín
Darcio Córdoba Cuesta
Gina Quintero Aldana
Jeanette Sánchez Naranjo
Clara Inés Lozano Espejo

Del corpus del Español Hablado en Bogotá (EHB)

Año Fases Participantes
2013 Digitalización de las grabaciones Fundación Patrimonio Fílmico Colombiano
2015 a 2016 Sistematización y almacenamiento de las grabaciones Carlos Alberto Rodríguez Díaz
Ruth Yanira Rubio López
2019 Revisión de OCR de las transcripciones de muestra Ruth Yanira Rubio López


APA

Instituto Caro y Cuervo. Español Hablado en Bogotá (EHB). Instituto Caro y Cuervo (2017-). Corpus del Español Hablado en Bogotá (EHB) [en línea]. En Corpus Lingüísticos del Instituto Caro y Cuervo (CLICC). Recuperado de: http://clicc.caroycuervo.gov.co/corpus/EHB