Metadatos
Los
metadatos corresponden a tres grandes bloques:
I.
Documentos: Información técnica de cada grabación.
II.
Sesiones: Recoge la información descriptiva de cada archivo. Identificación del
hablante, descripción de la muestra, tipo de encuesta encuestador, fecha de la
muestra, temas, entre otros.
III.
Informantes: Información y datos sociolingüÃsticos de los informantes: edad,
género, lugar de nacimiento, estrato, nivel educativo, profesión, oficio,
viajes, procedencia de los padres y del conyugue, etc.
Transcripción
Las grabaciones de EHB fueron transcritas y analizadas con
un programa de computador desarrollado como tesis de grado por dos estudiantes
de sistemas, Hugo Suárez y Jorge Molina. La aplicación se llamaba SATES y
comenzó a funcionar en 1994. Como resultado de los procesos de transcripción y
análisis se publicaron dos trabajos, el primero de ellos es una muestra impresa
con la trascripción de 30 grabaciones: El español hablado en Bogotá. Relatos
semilibres de informantes pertenecientes a tres estratos sociales (Montes,
1997) y un análisis de los resultados realizado a partir del software SATES: El
español hablado en Bogotá. Análisis previo de su estratificación social (Montes,
1998). Estas transcripciones tienen algunas marcas de fenómenos lingüÃsticos
especÃficos como la aspiración de la s (loj mijmoj, curaj, ej), la elisión de
consonantes (universidá, onde, salú) o el yeismo (yego). Las convenciones usadas para la transcripción
se observan en la tabla 1.
Tabla 1
Convenciones de transcripción del corpus EHB
Convención
|
Descripción
|
ENC.?
|
Encuestador
|
INF. ?
|
Informante
|
...
|
Vacilación
o suspensión
|
..
|
Después de
palabra incompleta o trunca
|
?
|
Separa
repeticiones
|
? ?
|
Citas
textuales
|
J
|
Aspiración
de s
|
[--]
|
Lo que no
se entendió. Lo que parece que es o que resulta ininteligible
|
iii
|
Repetición
de fonemas finales
|
( )
|
Cuando el
informante tose o le da risa
|
(?)
|
Se cree
que el informante dijo algo pero no se está seguro
|
Mj., o Mm.
|
Sonido que
se produce frecuentemente en los relatos
|
Nota.
Tomado de Montes (1997). El español hablado en Bogotá. Relatos semilibres de
informantes  pertenecientes a tres
estratos sociales. Bogotá: Instituto Caro y Cuervo.Â