El corpus del Español Hablado en Bogotá (EHB) cuenta con 522 grabaciones de las cuales 241 contienen relatos semilibres de entre 45 y 60 minutos y 281 son cuestionarios fonéticos de entre 10 y 30 minutos. Estas grabaciones fueron recopiladas entre 1990 y 1992,  en un proyecto dirigido por el Departamento de Dialectología del ICC para realizar un trabajo enfocado en "dialectología urbana con métodos sociolingüísticos" (Montes, 1998 p18). El corpus cuenta con 477 informantes, hombres y mujeres entre los 15 y los 60 años de edad, nacidos en Bogotá o con más de 15 años viviendo en ella.

Metadatos

Los metadatos corresponden a tres grandes bloques:

I. Documentos: información técnica de cada grabación.

II. Sesiones: recoge la información descriptiva de cada archivo. Identificación del hablante, descripción de la muestra, tipo de encuesta encuestador, fecha de la muestra, temas, entre otros.

III. Informantes: información y datos sociolingüísticos de los informantes: edad, género, lugar de nacimiento, estrato, nivel educativo, profesión, oficio, viajes, procedencia de los padres y del conyugue, etc.

Transcripción

Las grabaciones de EHB fueron transcritas y analizadas con un programa de computador desarrollado como tesis de grado por dos estudiantes de sistemas, Hugo Suárez y Jorge Molina. La aplicación se llamaba SATES y comenzó a funcionar en 1994. Como resultado de los procesos de transcripción y análisis se publicaron dos trabajos, el primero de ellos una muestra impresa con la trascripción de 30 grabaciones: El español hablado en Bogotá. Relatos semilibres de informantes pertenecientes a tres estratos sociales (Montes, 1997) y un análisis de los resultados realizado a partir del software SATES: El español hablado en Bogotá. Análisis previo de su estratificación social (Montes, 1998). Estas transcripciones tienen algunas marcas de fenómenos lingüísticos específicos como la aspiración de la s (loj mijmoj, curaj, ej), la elisión de consonantes (universidá, onde, salú) o el yeismo (yego).  Las convenciones usadas para la transcripción se observan en la tabla 1.

Tabla 1

Convenciones de transcripción del corpus EHB

Convención

Descripción

ENC.?

Encuestador

INF.  ?

Informante

...

Vacilación o suspensión

..

Después de palabra incompleta o trunca

?

Separa repeticiones

? ?

Citas textuales

J

Aspiración de s

[--]

Lo que no se entendió. Lo que parece que es o que resulta ininteligible

iii

Repetición de fonemas finales

( )

Cuando el informante tose o le da risa

(?)

Se cree que el informante dijo algo pero no se está seguro

Mj., o Mm.

Sonido que se produce frecuentemente en los relatos


Nota. Tomado de Montes (1997). El español hablado en Bogotá. Relatos semilibres de informantes  pertenecientes a tres estratos sociales. Bogotá: Instituto Caro y Cuervo. 


Coordinación de la investigación: Departamento de Dialectología del Instituto Caro y Cuervo

Director de la investigación: 

José Joaquín Montes Giraldo

Coordinadora de la investigación: Jennie Figueroa Lorza
Investigadores: Jennie Figueroa Lorza
Siervo Mora Monroy
Mariano Lozano Ramírez
Ricardo A. Ramírez Caro
María Bernarda Espejo Olaya
Gloria E. Duarte Huertas

Transcripción

Gloria E. Duarte Huertas
Siervo Mora Monroy
María Bernarda Espejo Olaya
Mariano Lozano Ramírez
Ricardo A. Ramírez Caro

Auxiliares de recolección de materiales: Marilyn Ortiz Sánchez
María Clara Henríquez Guarín
Darcio Córdoba Cuesta
Gina Quintero Aldana
Jeanette Sánchez Naranjo
Clara Inés Lozano Espejo

Sistematización y almacenamiento: 

Carlos Alberto Rodríguez Díaz
Ruth Yanira Rubio López 
ruth.rubio@caroycuervo.gov.co

Digitación/revisión de OCR de las 
transcripciones

Ruth Yanira Rubio López
ruth.rubio@caroycuervo.gov.co 


APA

Instituto Caro y Cuervo (2017-  ). Corpus del Español Hablado en Bogotá [en línea]. En Corpus Lingüísticos del Instituto Caro y Cuervo (CLICC). Recuperado de: http://clicc.caroycuervo.gov.co/corpus/HCB [Fecha de la consulta]

                                        


Búsqueda Rápida


Búsqueda Avanzada