Metadatos
Los metadatos corresponden a tres grandes bloques:
I. Documentos: información técnica de cada grabación.
II. Sesiones: recoge la información descriptiva de cada archivo. Identificación del hablante, descripción de la muestra, tipo de encuesta, encuestador, fecha de la muestra, temas, entre otros.
III. Informantes: información y datos sociolingüísticos de los informantes: edad, género, lugar de nacimiento, estrato, nivel educativo, profesión, oficio, viajes, procedencia de los padres y del cónyuge, etc.
Transcripción
La transcripción ortográfica de las encuestas del HCB se realizó durante la investigación en formato papel y con máquinas de escribir. Actualmente se están realizando procesos de digitalización por OCR, digitación y conversión a los distintos formatos para consulta y análisis. De acuerdo con Otálora y Fernández (1986) y después de una revisión general de las transcripciones, los criterios y convenciones usados para su realización se presentan en la siguiente tabla:
Tabla 1
Convenciones de transcripción del corpus HCB
Convención |
Descripción |
Enc. — |
Encuestador |
Inf. — |
Informante |
Inf. A — Inf. B — |
Si hay dos o más hablantes. |
X |
Para reemplazar los nombres de informantes y de otras personas en la grabación. |
[...] |
Omisión de pasajes del texto por dificultades de audición. |
[sic] |
Indica que una parte de la transcripción no es error de imprenta sino una realización apartada del uso general. |
Ortografía |
Se siguieron las normas de ortografía convencionales de la época. Solamente se registraron las diversas variantes de la palabra “entonces” (ento’es, ´tonces, ´to’es, ‘to’ces, ent’os, ‘to’s) como ejemplo ilustrativo de la adopción de distintas formas lingüísticas para una misma unidad, incluso en el mismo informante. |
Se procuró mantener la prosodia de los hablantes, sin embargo, en varias ocasiones, fue necesario adoptar criterios de puntuación para facilitar la comprensión del texto. |
Las transcripciones se revisaron varias veces para asegurar la fidelidad del texto con la grabación. |
Convención |
Elementos extralingüísticos |
... |
Señalar los fenómenos de sintaxis propios del habla como vacilación, pausas prolongadas, interferencias entre los hablantes, repeticiones, frases incompletas, entre otros. |
[Risas] |
Risas |
Nota: Elaboración propia con base en Otálora y Fernández (1986). El habla de la ciudad de Bogotá: Relatos para su estudio. Bogotá: Instituto Caro y Cuervo.