Metadatos
Los metadatos corresponden a tres grandes bloques:
I. Documentos: Información técnica de cada grabación.
II. Sesiones: Recoge la información descriptiva de cada archivo. Identificación del hablante, descripción de la muestra, tipo de encuesta, encuestador, fecha de la muestra, temas, entre otros.
III. Informantes: Información y datos sociolingüísticos de los informantes: edad, género, lugar de nacimiento, estrato, nivel educativo, profesión, oficio, viajes, procedencia de los padres y del cónyuge, etc.
Transcripción
Las grabaciones de EHB fueron transcritas y analizadas con un programa de computador desarrollado como tesis de grado por dos estudiantes de sistemas, Hugo Suárez y Jorge Molina. La aplicación se llamaba SATES y comenzó a funcionar en 1994. Como resultado de los procesos de transcripción y análisis, se publicaron dos trabajos: el primero es una muestra impresa con la transcripción de 30 grabaciones: El español hablado en Bogotá. Relatos semilibres de informantes pertenecientes a tres estratos sociales (Montes, 1997) y un análisis de los resultados realizado a partir del software SATES: El español hablado en Bogotá. Análisis previo de su estratificación social (Montes, 1998). Estas transcripciones tienen algunas marcas de fenómenos lingüísticos específicos como la aspiración de la s (loj mijmoj, curaj, ej), la elisión de consonantes (universidá, onde, salú) o el yeísmo (yego). Las convenciones usadas para la transcripción se observan en la tabla 1.
Tabla 1
Convenciones de transcripción del corpus EHB
Convención
|
Descripción
|
ENC.?
|
Encuestador
|
INF. ?
|
Informante
|
...
|
Vacilación o suspensión
|
..
|
Después de palabra incompleta o trunca
|
?
|
Separa repeticiones
|
? ?
|
Citas textuales
|
J
|
Aspiración de s
|
[--]
|
Lo que no se entendió. Lo que parece que es o que resulta ininteligible
|
iii
|
Repetición de fonemas finales
|
( )
|
Cuando el informante tose o le da risa
|
(?)
|
Se cree que el informante dijo algo pero no se está seguro
|
Mj., o Mm.
|
Sonido que se produce frecuentemente en los relatos
|
Nota. Tomado de Montes (1997). El español hablado en Bogotá. Relatos semilibres de informantes pertenecientes a tres estratos sociales. Bogotá: Instituto Caro y Cuervo.