Español Hablado en Bogotá

El corpus del Español Hablado en Bogotá (EHB) cuenta con  241 encuestas semilibres de entre 45 y 60 minutos. Estas grabaciones fueron recopiladas entre 1990 y 1992,  en un proyecto dirigido por el Departamento de Di

Ver más

Metadatos

Los metadatos corresponden a tres grandes bloques:

I. Documentos: Información técnica de cada grabación.

II. Sesiones: Recoge la información descriptiva de cada archivo. Identificación del hablante, descripción de la muestra, tipo de encuesta encuestador, fecha de la muestra, temas, entre otros.

III. Informantes: Información y datos sociolingüísticos de los informantes: edad, género, lugar de nacimiento, estrato, nivel educativo, profesión, oficio, viajes, procedencia de los padres y del conyugue, etc.

Transcripción

Las grabaciones de EHB fueron transcritas y analizadas con un programa de computador desarrollado como tesis de grado por dos estudiantes de sistemas, Hugo Suárez y Jorge Molina. La aplicación se llamaba SATES y comenzó a funcionar en 1994. Como resultado de los procesos de transcripción y análisis se publicaron dos trabajos, el primero de ellos es una muestra impresa con la trascripción de 30 grabaciones: El español hablado en Bogotá. Relatos semilibres de informantes pertenecientes a tres estratos sociales (Montes, 1997) y un análisis de los resultados realizado a partir del software SATES: El español hablado en Bogotá. Análisis previo de su estratificación social (Montes, 1998). Estas transcripciones tienen algunas marcas de fenómenos lingüísticos específicos como la aspiración de la s (loj mijmoj, curaj, ej), la elisión de consonantes (universidá, onde, salú) o el yeismo (yego).  Las convenciones usadas para la transcripción se observan en la tabla 1.

Tabla 1

Convenciones de transcripción del corpus EHB

Convención

Descripción

ENC.?

Encuestador

INF.  ?

Informante

...

Vacilación o suspensión

..

Después de palabra incompleta o trunca

?

Separa repeticiones

? ?

Citas textuales

J

Aspiración de s

[--]

Lo que no se entendió. Lo que parece que es o que resulta ininteligible

iii

Repetición de fonemas finales

( )

Cuando el informante tose o le da risa

(?)

Se cree que el informante dijo algo pero no se está seguro

Mj., o Mm.

Sonido que se produce frecuentemente en los relatos


Nota. Tomado de Montes (1997). El español hablado en Bogotá. Relatos semilibres de informantes  pertenecientes a tres estratos sociales. Bogotá: Instituto Caro y Cuervo. 


Del Español Hablado en Bogotá

Coordinación de la investigación: Departamento de Dialectología del Instituto Caro y Cuervo

Director de la investigación: 

José Joaquín Montes Giraldo

Coordinadora de la investigación: Jennie Figueroa Lorza
Investigadores: Jennie Figueroa Lorza
Siervo Mora Monroy
Mariano Lozano Ramírez
Ricardo A. Ramírez Caro
María Bernarda Espejo Olaya
Gloria E. Duarte Huertas

Transcripción

Gloria E. Duarte Huertas
Siervo Mora Monroy
María Bernarda Espejo Olaya
Mariano Lozano Ramírez
Ricardo A. Ramírez Caro

Auxiliares de recolección de materiales: Marilyn Ortiz Sánchez
María Clara Henríquez Guarín
Darcio Córdoba Cuesta
Gina Quintero Aldana
Jeanette Sánchez Naranjo
Clara Inés Lozano Espejo

Del corpus del Español Hablado en Bogotá (EHB)

Año

Fases

Participantes

2013

Digitalización de las grabaciones? ? ? ? ? ??

Fundación Patrimonio Fílmico Colombiano

2015 a 2016

Sistematización y almacenamiento de 

las grabaciones?

Carlos Alberto Rodríguez Díaz

Ruth Yanira Rubio López

2019

Revisión de OCR de las transcripciones 

de muestra

Ruth Yanira Rubio López


APA

Instituto Caro y Cuervo. Español Hablado en Bogotá (EHB). Instituto Caro y Cuervo (2017-). Corpus del Español Hablado en Bogotá (EHB) [en línea]. En Corpus Lingüísticos del Instituto Caro y Cuervo (CLICC). Recuperado de: http://clicc.caroycuervo.gov.co/corpus/EHB