Aproximació a la transcripció de corpus orals: els símbols de transcripció en corpus judicials

AutorSusana Ridao Rodrigo
CargoUniversidad de Almería
Páginas93-110
REVISTA DE LLENGUA I DRET #77
JOURNAL OF LANGUAGE AND LAW
APROXIMACIÓN A LA TRANSCRIPCIÓN DE CORPUS ORALES: LOS SÍMBOLOS
DE TRANSCRIPCIÓN EN CORPUS JUDICIALES*
Susana Ridao Rodrigo**
Resumen
El objetivo de este trabajo es reexionar sobre los problemas existentes a la hora de transcribir corpus de carácter oral;
en concreto, corpus grabados en ámbitos judiciales. Tras abordar cuestiones generales sobre las transcripciones, se
someten a estudio las dicultades propias de la transcripción de un corpus judicial. Se describen sistemas de transcripción
habituales, tanto en general en el ámbito de la lingüística, como en particular en lingüística forense. En la descripción,
se contextualizan y destacan los puntos fuertes y débiles de las propuestas. Finalmente, se argumentan los benecios de
un sistema de transcripción simplicado basado en los utilizados por lingüistas para su uso por profesionales del ámbito
legal. En ese sistema se proponen símbolos intuitivos y sencillos de cifrar y descifrar para la transcripción del lenguaje
empleado en los corpus orales.
Palabras clave: transcripción; símbolos; corpus; juicios.
APPROACH TO TRANSCRIPTION OF ORAL CORPUS: THE TRANSCRIPTION
SYMBOLS IN JUDICIAL CORPUS
Abstract
This paper reects on the existing problems when transcribing spoken corpora; specically, corpus recorded in judicial
settings. After reviewing general issues referring to transcriptions, issues in the transcription of a judicial corpus
are identied and considered. Transcription systems widely used both in general in the eld of linguistics and in
particular in forensic linguistics are described. In this description, the strengths and weaknesses of the proposals are
contextualised and highlighted. Finally, the benets of a simplied transcription system based on those used by linguists
are explored, considering its use by legal professionals. This system proposes intuitive and simple symbols to encrypt
and decrypt for the transcription of the language used in spoken legal corpora.
Keywords: transcription; symbols; corpus; trials.
* Este artículo nace al amparo del grupo de investigación HUM783, el cual está vinculado al centro de investigación CEMyRI de la
UAL.
Agradecemos las sugerencias de cambios efectuadas por los evaluadores de este artículo, pues han permitido mejorar abismalmente
este trabajo con respecto a la propuesta inicial presentada.
** Susana Ridao Rodrigo, Universidad de Almería. sridao@ual.es
Artículo recibido el 13.09.2020. Evaluaciones ciegas: 12.01.2021 y 23.02.2021. Aceptación de la versión nal: 06.04.2021
Citación recomendada: Ridao Rodrigo, Susana. (2022). Aproximación a la transcripción de corpus orales: los símbolos de
transcripción en corpus judiciales. Revista de Llengua i Dret, Journal of Language and Law, 77, 93-110. https://doi.org/10.2436/rld.
i77.2022.3517
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 94
Sumario
1 Introducción
2 Corpus orales frente a corpus escritos en el ámbito judicial
3 La transcripción
3.1 Sistemas de transcripción
3.1.1 Puntos fuertes y puntos débiles
4 Propuesta de criterios de transcripción
5 Para concluir
Referencias bibliográcas
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 95
En otros terrenos, se puede avanzar hasta donde han llegado
otros antes, y no pasar de ahí; pero en la investigación cientíca
siempre hay materia por descubrir y de la cual asombrarse.
Mary W. Shelley, Frankenstein o el moderno Prometeo
1 Introducción
La repercusión de la que ha gozado tradicionalmente el discurso forense y que sigue gozando en la actualidad
ha despertado un gran interés social (Cervera y Torres, 2018, p. 90). En palabras de Godoy Tena (2017, p. 20),
“El ámbito jurídico constituye una piedra angular en la sociedad actual de cada país, puesto que por medio de
sus diversos ordenamientos jurídicos se articulan las bases sobre las que se asientan los fundamentos jurídicos
que rigen una determinada nación”.
Sin duda, los entornos judiciales desde tiempos helénicos han constituido contextos en los que se demuestra
la relevancia de la capacidad oratoria. Ello ha motivado que estos escenarios hayan sido objeto de análisis
y estudio por bastantes investigadores con miras a describir cuáles son los recursos que caracterizan la
comunicación eciente y, sobre todo, que generen conanza en el orador, de manera que el receptor cree la
veracidad de sus palabras. Ya en el siglo xix –y en etapas posteriores, como es lógico– se publican reconocidos
manuales sobre oratoria forense, muestra del necesario casamiento entre el mundo de la comunicación y el
del derecho; por citar tan solo algunos ejemplos pioneros, se pueden consultar las obras de Sainz de Andino
(1828), Pérez de Anaya (1848-1849), Miguel y Romero (1901) o Elguero (1917).
Una cuestión que se ha de tener en cuenta en los estudios multidisciplinares es que de forma colateral pueden
beneciar a las distintas parcelas del saber que les atañe. Sin ir más lejos, la confección de un corpus jurídico
no solo resulta lucrativa a expertos en el campo de la lología, sino que también es provechosa para juristas
o para futuros juristas, aspectos que se han de valorar desde el inicio de la recopilación del corpus (Taranilla,
2011, p. 498). En la misma línea se sitúa Ridao Rodrigo (2010, p. 12), puesto que las vistas orales que ofrece
transcritas pueden resultar útiles a profesionales del campo legal, si bien el sistema de transcripción empleado
está enfocado desde la perspectiva de la lología. En suma, la consecución de estos corpus lingüísticos ha
de permitir que “[…] its subsequent analysis could be worthy, reliable and useful […]” (Marín y Rea, 2012,
p. 143); aunque estas autoras aluden a un corpus de naturaleza escrita de sentencias judiciales, dicha tesis es
extrapolable a los corpus orales.
No obstante, en este horizonte de enriquecedora investigación tanto para el campo de la lingüística como
del derecho, se hallan desafíos a los que enfrentarse. Por su parte, Martín del Burgo y Marchán (2000, p. 6)
observan que los juristas se interesan especialmente por las cuestiones legales, mientras que los lólogos
se centran en asuntos propios de la lología dejando a un lado los aspectos legales, hecho que conforma un
panorama en el que realmente no hay intersección de ambos campos –la lología y el derecho–, como sería
el estudio del lenguaje del derecho.
Los objetivos jados en este artículo parten de la indagación en las causas por las que apenas existen estudios
en contextos judiciales basados en corpus orales. A raíz de ese marco de investigación, se pretende ahondar
en las dicultades existentes a la hora de transcribir vistas orales. Además, se examinan tanto sistemas
de transcripción utilizados en publicaciones lingüísticas en general sobre corpus orales como otros corpus
especícos de transcripción en lingüística forense. Finalmente, tras analizar tales sistemas de transcripción, se
discuten distintas propuestas cuya aplicación resulta sencilla e intuitiva, y se explica y ejemplica un sistema
de transcripción formado por trece criterios.
2 Corpus orales frente a corpus escritos en el ámbito judicial
Desde una perspectiva lingüística, para estudiar detalladamente los intercambios comunicativos que se
producen en los ámbitos judiciales es necesario confeccionar un corpus de carácter oral. Con estas palabras
Orozco-Jutorán (2017, p. 36) reexiona sobre la ventaja de transcribir un corpus de esta naturaleza:
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 96
[…] dado que es más sencillo y sistemático analizar datos escritos que orales, ya que en el texto escrito se
puede marcar una sola palabra o un fragmento más largo, se puede etiquetar sabiendo con total certeza a qué
fragmento se reere la etiqueta, en caso de estar marcando, por ejemplo, una sola palabra de una frase, y
además se pueden utilizar otras herramientas informáticas para hacer vaciado de términos, obtener frecuencias
de aparición de términos y expresiones, etc.
En español existe una arraigada tradición por indagar en el lenguaje legal y administrativo desde el punto de
vista lológico; sin embargo, la inmensa mayoría de estas investigaciones se ha llevado a cabo sobre corpus
escritos y buena parte de ellas se interesa por documentos legales fechados con anterioridad al siglo xix. En
cambio, en esta cuestión los estudios anglosajones poseen un panorama bastante más alentador (Cervera y
Torres, 2016, p. 66; Ridao Rodrigo, 2017, p. 95). Esta situación de escasez de publicaciones sobre el contexto
legal con corpus orales se puede deber a la enraizada tendencia de basar los estudios sobre corpus escritos.
Por supuesto, otra razón importante se centra en la dicultad con la que se enfrenta el investigador a la hora
de conseguir tales grabaciones (Ridao Rodrigo, 2010, p. 17; Villalba, 2015, p. 8).
En la actualidad, también se publican trabajos sobre contextos legales que se sustentan sobre corpus escritos
de documentos contemporáneos, como es el caso de Marín y Rea (2012) sobre un corpus inglés, Pontrandolfo
(2019) sobre un corpus en español, o bien estudios de carácter contrastivo como Godoy (2017) sobre un corpus
de textos en inglés y en español, o Pontrandolfo (2011) que analiza sentencias penales escritas en tres idiomas:
español, inglés e italiano. Otras investigaciones como Orozco-Jutorán (2017) y Arumí Ribas y Vargas-Urpi
(2018) se encuadran dentro del proyecto Traducción e Interpretación en los Procesos penales (TIPp).
La comunicación de carácter oral en los contextos jurídicos en los últimos años está asumiendo más
protagonismo, frente a la hegemonía que ha imperado por abordar el ámbito escrito, incluso en las actuaciones
adoptadas para simplicar el discurso jurídico (Hidalgo Navarro y Villalba Ibáñez, 2016, p. 210). A pesar de
que en los juicios la comunicación se emite por vía oral, esta mantiene un vínculo muy estrecho con el medio
escrito, lo cual diculta la comprensión de los mensajes intercambiados especialmente entre los distintos
actores pertenecientes a los órganos legales (Hidalgo Navarro y Villalba Ibáñez, 2016, p. 212). El hecho de
que tanto la sociedad en general como los profesionales del campo legal sean conscientes de la relevancia
que posee la oratoria en el ámbito jurídico implica que se despierte el interés investigador por este tema, lo
cual supone un cambio con respecto a años atrás (Torres Álvarez, 2017, p. 33).
Algunos autores como Heffer (2005, p. xvii) apuntan a la dicultad a la que se enfrentan los investigadores
cuando pretenden grabar los juicios orales, habida cuenta de la privacidad que caracteriza este género
discursivo. Esta misma cuestión es planteada en Taranilla (2011, pp. 498-499 y 2013, pp. 323-324), quien
reexiona sobre la privacidad existente en los casos penales. Ello permite cavilar sobre su naturaleza de
actos públicos, dado que puede asistir cualquier individuo a pesar de no estar vinculado a dicho caso, pero
para poder grabar tales actos se debe obtener el consentimiento de todos los participantes. Esta situación se
vuelve aún más contradictoria si se tiene en cuenta que en España es obligatorio grabar los juicios de índole
penal, laboral y administrativa; frente a dicha normativa los profesionales de tales ámbitos con asiduidad se
muestran reacios a proporcionar grabaciones a pesar de tener nes investigadores (Cervera y Torres 2015,
p. 10; Taranilla, 2011, pp. 498-499). En palabras de Montolío y López Samaniego (2008, p. 59), se trata
de un “[…] escenario profesional reticente a los cambios” , hecho que se ve reejado incluso en la poca
predisposición para crear un clima propicio a la investigación.
Los desafíos para la confección del corpus no solo se limitan a superar los obstáculos para conseguir las
grabaciones. Con bastante frecuencia se observa que hay un grave inconveniente en el volumen con que los
diferentes participantes han cifrado su discurso, hasta el punto de resultar imposible transcribir bastantes
fragmentos por ser pronunciados en un volumen excesivamente bajo; otra cuestión que diculta el análisis de
estas interacciones comunicativas se centra en la comunicación no verbal, dado que se producen ocasiones en
las que las contestaciones de los interrogados se limitan a armaciones o negaciones transmitidas mediante
movimientos de la cabeza (Quesada, 1991, pp. 87-88). Aunque son muchos y muy diversos los desafíos que
suponen confeccionar un corpus judicial de naturaleza oral, esta modesta investigación se va a centrar en los
problemas derivados de la transcripción y, más especícamente, en los símbolos utilizados.
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 97
3 La transcripción
Resulta conveniente abrir este epígrafe aclarando lo que se entiende por transcripción. Así, Du Bois et al.
(1993, p. 45) aportan esta denición: “Discourse transcription1 can be dened as the process of creating
a written representation of a speech event so as to make it accesible to discourse research”. En la misma
línea se sitúa la denición aportada por Bassi, si bien en este último caso no hace alusión a su nalidad: “La
transcripción es el proceso mediante el que se traspasa lenguaje oral a texto escrito” (2015, p. 39). Como es
lógico, la naturaleza del análisis que se quiere llevar a cabo va a resultar determinante a la hora de seleccionar
el sistema de transcripción que se va a seguir.
El estudio es el n al que se enfrenta el investigador, de tal manera que la transcripción se convierte en el
medio por el que se preparan los materiales (Jefferson, 2004, p. 13). Es indiscutible el papel que asume
la transcripción en estas investigaciones, en tanto que condiciona el análisis que se efectuará sobre dicho
corpus, de ahí que se deba meditar en profundidad sobre los criterios teóricos y metodológicos del sistema de
transcripción que se utilice (Tusón, 1997, p. 99). Se ha de tener en cuenta que “[…] a corpus can be used in
different ways in order to validate, exemplify or build up a language theory” (Tognini-Bonelli, 2001, p. 65).
El temprano estudio de Ochs (1979, p. 44) arroja luz sobre la transcripción fundamentalmente en tres
cuestiones: (1) la transcripción se convierte en los datos del investigador en los estudios sustentados en
los actos orales; (2) la transcripción se concibe como un proceso selectivo en el cual quedan reejados los
objetivos y las deniciones; y (3) el trabajo de transcripción no ha ocupado un lugar relevante en los estudios
empíricos sobre comportamiento verbal, con la excepción de Sacks et al. (1974).
Sin duda, el capítulo de Ochs (1979) ha supuesto un punto de inexión en las investigaciones sobre corpus,
dado que a raíz de esta publicación dejó de considerarse que la transcripción era una mera práctica subordinada
consistente en preparar datos para su posterior análisis, sino que se entiende como un proceso que se ve inuido
por las presuposiciones teóricas del transcriptor, de manera que este actor asume relevantes decisiones sobre
interpretación que condicionan el análisis y los resultados que se extraigan a partir de dicho análisis (Mondada,
2008, p. 78). En palabras de Edwards (1993, p. 3):
The transcript plays a central role in research on spoken discourse, distilling and freezing in time the complex
events and aspects of interaction in categories of interest to the researcher. When well-suited to the theoretical
orientation and research question, the transcript enables the researcher to focus efciently on the eeting events
of an interaction with a minimum of irrelevant and distracting detail. However, choices made concerning what
types of information to preserve (or to neglect), what categories to use, and how to organize and display the
information in a written and spatial medium can all affect the impressions the researcher derives from the data.
Walsh abre el debate de que resulta muy complicado hacer una transcripción correcta y se percata de que
suelen atribuirse los fallos al transcriptor; es más, añade: “[…] in my experience every effort is made to
be as accurate as possible but they happen to operate under quite difcult circumstances” (Walsh, 1999, p.
185). Al inferir que una transcripción es selectiva se ha de asumir que dicha selección se halla en su propia
naturaleza, como consecuencia de que la información que se incluye en la transcripción está determinada por
los conocimientos que poseen los analistas, así como por la perspectiva teórica de la que parten.
Una transcripción se considera amplia cuando no se detallan aspectos paraverbales o no verbales como la
prosodia, las pausas y los gestos, mientras que se denomina na aquella en la que no solo tienen cabida los
mismos elementos que en la transcripción amplia, sino que también alberga cuestiones paraverbales y no
verbales, como es el caso de la entonación, el énfasis, el ritmo, los gestos o las miradas (Moore y Llompart,
2017, pp. 426-427). Sobre esta cuestión, autores como Gumperz y Berenz (1993, p. 119) deenden que en la
transcripción solo se ha de anotar el funcionamiento de las señales comunicativas que utilizan los participantes
en las intervenciones, lo que implica excluir elementos como la duración o el tono.
Por su parte, Arumí Ribas y Vargas-Urpi (2018, p. 429) –trabajo abordado desde la perspectiva de los estudios
de traducción– aseveran que en sus transcripciones no son necesarios símbolos especiales, puesto que la
1 En cursiva en el original.
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 98
herramienta utilizada por las autoras, denominada ExMARalDA2, posibilita que las intervenciones de cada
hablante sean apuntadas en un nivel diferente como ocurre con las anotaciones musicales, de tal manera que
se ven con claridad los solapamientos y las interrupciones, y que otros aspectos como los alargamientos, las
dudas o los retardatarios, por citar algunos elementos propios del lenguaje oral, no resultan relevantes para el
análisis que pretenden efectuar. En cambio, Orozco-Jutorán (2017, p. 37) sostiene que la transcripción de los
juicios orales debe reejar tanto el habla dubitativa como los errores gramaticales u ortofónicos; en denitiva,
se trata de representar lo más elmente posible qué se ha dicho con exactitud en el juicio, si bien sostiene que
resulta necesario utilizar corchetes cuando el transcriptor no logra entender las palabras emitidas o bien tiene
duda; a su vez, aboga por no incluir aspectos sobre comunicación no verbal, con la excepción de información
muy relevante, como es el caso de armar o negar moviendo la cabeza.
Con un marcado carácter crítico de rigor cientíco, en general, y metodológico, en particular, atestiguan
Hidalgo Navarro y Sanmartín Sáez (2005, p. 32) que el proceso de plasmar en papel elementos cuya fuente es
oral supone necesariamente una distorsión con respecto al producto original, lo que signica que la existencia
de delidad en el paso de la oralidad a la escritura resulte ilusoria. En esta misma línea se sitúa Cicres (2011,
p. 27-28), quien enjuicia que toda transcripción representa de manera imperfecta la interacción oral porque
existe mucha información relevante que no se reeja en tal transcripción, como es el caso de cuestiones
paraverbales como el timbre, el tono, la entonación, la intensidad, el tempo, la cualidad de voz o las cuñas
dubitativas, entre otros; e incluso a veces la transcripción no recoge ni el contenido exacto de las palabras
que se pronuncian. Además, hay que tener en cuenta que “[…] a transcript may serve – when given with a
playing of the audio or video record – to instruct an audience as to what is there to be heard on the tape […]
The relationship between this after-the-fact constitution of the sense of an event, and the lived order of that
event, is a problematic one. There are no nal solutions to sense-making” (Ten Have, 2002, pp. 14-15). De
todo esto se deduce que siempre va a haber un grado de subjetividad en la interpretación de una transcripción
incluso cuando se visiona el vídeo original o se escucha el audio original.
Desde la perspectiva de la lingüística forense, Eades advierte de la necesidad de las transcripciones en los
contextos legales, puesto que se acepta de manera generalizada la tesis de que es imposible realizar una
transcripción neutral en el sentido de que pueda reejar dedignamente lo que ocurre en la interacción oral,
aunque aclara la existencia de divergencias entre los intereses de una transcripción en contextos legales frente
al sistema de transcripción con el que trabajan los lingüistas centrados en el análisis de la conversación que
no la llamarían transcripción en sentido estricto, porque “Linguists are concerned with ‘what happens’3 in any
given interaction, rather than simply the information which is provided” (1996, pp. 251-252).
Con otro enfoque, se ha de tener en cuenta que transcribir es un proceso bastante complejo en el que el
transcriptor ha de mantener un alto grado de atención durante todo el tiempo, dado que este trabajo requiere
mucho esfuerzo (Garayzábal Heinze, Queralt, Reigosa y Ridao, 2019, p. 46). Para hacer una aproximación
cuantitativa al tiempo que conlleva transcribir un corpus de esta naturaleza, Orozco-Jutorán (2017, p. 37)
estima que un técnico formado necesita cuarenta minutos y una revisión de tres fases para transcribir tan solo
un minuto, si bien en este caso se trata de un corpus en el que en los juicios no solo se habla en español, sino
que entra en juego un intérprete.
Tras llevar a cabo una revisión de los sistemas más conocidos sobre transcripción, etiquetado y codicación
de corpus orales, Llisterri llega a la conclusión de que en realidad, lejos de conseguir una estandarización, se
está produciendo una diversicación en tanto que son bastantes y muy variadas las propuestas existentes para
efectuar tal labor (1999, p. 74). Sin ir más lejos, el Proyecto para el Estudio Sociolingüístico del Español de
España y de América –coordinado por el profesor Moreno Fernández– puso de maniesto la existencia de
disparidad insalvable en la elaboración y representación escrita de corpus orales, de tal forma que en el citado
proyecto se unicaron criterios para elaborar transcripciones (Villena et al. 2010, pp. 262-263).
Centrado en la lingüística forense, el trabajo de Fraser (2003, p. 223) incluye cinco recomendaciones para la
elaboración y el empleo de las transcripciones en casos judiciales: 1) se ha de garantizar que el transcriptor no
tenga ningún interés en el proceso, por lo que las transcripciones deberían ser revisadas por personal externo
2 No se trata de un sistema de transcripción, sino de un conjunto de herramientas que puede consultarse en la web del proyecto.
3 Entre comillas en el original.
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 99
para asegurar esta objetividad; 2) los profesionales en el campo de la fonética y la lingüística tendrían que
encargarse de transcribir si la grabación es muy precaria, por lo que podría ser impugnada; 3) es necesario
confeccionar un estudio de datos contextuales para transcribir correctamente algunas palabras o enunciados; 4)
el transcriptor ha de proporcionar las distintas interpretaciones en los casos en que el material sea controvertido;
5) cuando la grabación posea una calidad muy baja o sea excesivamente prolija, se tiene que declarar que
el material es intranscribible; y 6) se deben aportar otras pruebas si los materiales transcritos a partir de
grabaciones de calidad deciente no permiten defender un caso con solidez.
3.1 Sistemas de transcripción
Desde que Sacks et al. (1974) publicaran una propuesta para transcribir los corpus orales conforme a los
intereses del análisis conversacional, son muchos los investigadores que se han hecho eco de tal sistema de
transcripción, aunque lo han adaptado a sus necesidades particulares. Tal es el caso de Bassi Follari (2015),
quien al tratar los símbolos de transcripción para las ciencias sociales se basa en el sistema de Jefferson
– ideado a partir de Sacks et al. (1974)–, y propone introducir cambios que se resumen en estos cuatro puntos:
(1) mantener los símbolos que puedan resultar más importantes tras valorar los múltiples contextos e intereses
propios de las indagaciones en ciencias sociales; (2) apoyar la legibilidad de las transcripciones, de manera que
los signos de puntuación sean empleados en sus usos convencionales y evitar poner símbolos intercalados en
las palabras; (3) mostrar preferencias por símbolos cuya colocación sea sencilla en un teclado convencional;
y (4) en cierto modo como consecuencia de los tres puntos anteriores, suprimir los símbolos que no aportan
excesiva información para el análisis o bien que tales símbolos sean sustituidos por otros que estén con rápido
acceso en el teclado (Bassi Follari, 2015, p. 49).
A su vez, conviene tener en cuenta los criterios de transcripción utilizados para la creación del subcorpus oral
del banco de datos CREA-CORDE, dado que pueden resultar muy útiles para aplicarlos a las transcripciones
tratadas en este artículo. He aquí sus características: a) La representación ortográca debe hacerse de acuerdo
con las convenciones ortográcas normativas del español; b) Las formas reducidas de una palabra, asociadas
a registros coloquiales, pueden transcribirse sin modicación, siempre que impliquen eliminación de sílabas
(por ejemplo: boli o tele); c) Los límites de enunciado “ortográco” pueden marcarse con un punto, una
interrogación, una exclamación o dos puntos; d) No se usa el punto y coma; e) La coma se utiliza siguiendo
la organización lógica del discurso del hablante, en lugar de las pausas físicas de la enunciación; f) Los dos
puntos se emplean para marcar el comienzo del discurso directo, citas y enumeraciones, cuando estos van
precedidos por pausa y descenso en la entonación; g) El guion medio (“-”) se utiliza únicamente en los incisos
que realiza el hablante durante la lectura de un texto escrito; h) Las abreviaturas y siglas se transcriben tal
como las enuncie el hablante, ya sea como una palabra completa, ya como una secuencia deletreada; i) Las
demás palabras deletreadas por el hablante deben reejarse también en la transcripción y las transcripciones
de las letras de una misma palabra se separan entre sí por medio de guiones, dejando un espacio entre
palabras; j) Las secuencias numéricas deben transcribirse también en forma de palabras; k) Las interjecciones
se representan de acuerdo con la ortografía estándar del Diccionario de la Real Academia Española; l) Los
gestos o movimientos con sonido realizados por el hablante que tiene el turno de palabra se describen con un
breve comentario; m) Otros fenómenos, no vocales y no comunicativos, ajenos al hablante que tiene el turno
de habla en el momento en que ocurren, se transcriben también como comentarios; n) Los errores léxicos
o gramaticales producidos por el hablante se transcriben tal como se enuncian; o) Las recticaciones del
discurso y las pausas que suponen interrupciones de la secuencia lógica del discurso se marcan por medio
de códigos, sin dejar ninguna huella en la transcripción; p) Los titubeos que dan lugar a palabras repetidas
deben transcribirse y es conveniente dejar espacios en blanco entre las formas repetidas o recticadas; q) Los
titubeos que dan lugar a palabras enunciadas de manera fragmentaria se transcriben; r) Los fragmentos que
presentan dicultades de comprensión se transcriben, si es posible, de forma aproximada, mientras que los
fragmentos ininteligibles no se transcriben, pero se deja una huella de su existencia por medio de un código
(Sánchez Sánchez y Pino Moreno, 1999, pp. 85-89).
Por otro lado, partiendo de autores clásicos como Sacks, Schegloff y Jefferson, Du Bois o Gumperz y Berenz,
entre otros, Tusón Valls (1997, pp. 100-101) propone este sistema para la transcripción, el cual –según la
autora– puede adaptarse con facilidad a los intereses de transcripción más frecuentes en el ámbito de los
estudios de lingüística interesados en el discurso oral:
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 100
1. Numerar las líneas a la izquierda.
2. Usar las grafías normales, salvo cuando se quiere señalar algún aspecto fonético de interés para el análisis;
entonces usar los símbolos del alfabeto fonético.
3. Símbolos prosódicos:
¿? entonación interrogativa
¡! entonación exclamativa
/ tono ascendente
\ tono descendente
…- corte abrupto en medio de una palabra
| pausa breve
|| pausa mediana
<…> pausa larga, también <pausa> o <9>, indicando segundos
┌ tono agudo
└ tono grave
ac ritmo acelerado
le ritmo lento
subr énfasis
MAYÚS mayor énfasis
:: alargamiento de un sonido
p piano (dicho en voz baja)
pp pianissimo (dicho en voz muy baja)
f forte (dicho en voz más alta)
ff fortísimo (dicho en voz muy alta)
4. Símbolos relativos a los turnos de palabra
= = al principio de un turno para indicar que no ha habido pausa después del turno anterior
=…..=
=…..= solapamiento de dos turnos
Para señalar que B interviene aprovechando un pequeño silencio en la intervención de A:
A –¡Ojalá venga pronto! ¡Tengo ganas de verla!
B –¡Ay, sí!
5. Otros símbolos:
[ ] fenómenos no léxicos, tanto vocales como no vocales, p. e. [risas], [mirando a B]
( ) palabra ininteligible o dudosa
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 101
→ a la izquierda de la línea para señalar algo de interés especial para el análisis
Enseguida se describen varios sistemas de transcripción aplicados en concreto a corpus judiciales. Así, en
el corpus publicado en Ridao Rodrigo (2010) se facilita la transcripción de quince juicios celebrados en el
Juzgado de lo Penal de Almería capital entre los años 2000 y 2002 cuya temática se ciñe a robo, robo con
intimidación, delito de lesiones y amenazas, denuncia falsa, delito contra el deber de cumplir la prestación
social sustitutoria, agresión, apropiación indebida y malos tratos, que cuenta con una duración total de tres
horas, diecisiete minutos y nueve segundos. Este sistema de transcripción se rige principalmente por los
símbolos establecidos por el grupo Val.Es.Co.4 (Briz, 1998), aunque ha incorporado, eliminado o cambiado
cuestiones para ajustarse tanto a las características propias del corpus transcrito como a las necesidades de
análisis. Aquí se listan los símbolos utilizados en Ridao Rodrigo (2010):
: Cambio de hablante.
? Interlocutor no reconocido.
§ Sucesión inmediata, sin pausa apreciable, entre dos emisiones de distintos hablantes.
[ Lugar donde se inicia un solapamiento o superposición.
] Final del habla simultánea.
= Mantenimiento del turno de un participante en un solapamiento.
/ Pausa corta, inferior al medio segundo.
// Pausa entre medio segundo y un segundo.
/// Pausa de un segundo o más.
(5”) Silencio (lapso o intervalo) de cinco segundos; se indica el número de segundos en las pausas de más
de un segundo.
EN COCHE Pronunciación marcada o enfática.
(( )) Fragmento indescifrable.
((siempre)) Transcripción dudosa.
((...)) Interrupciones de la grabación o de la transcripción.
(en)tonces Reconstrucción de una unidad léxica que se ha pronunciado incompleta.
º( )º Fragmento pronunciado en un tono de voz más bajo, próximo al susurro.
(risas) Sonidos signicativos e información no verbal.
aaa Alargamientos vocálicos.
nnn Alargamientos consonánticos.
¿¡ !? Preguntas o exclamaciones retóricas (por ejemplo, las interrogaciones exclamativas: preguntas que no
preguntan).
¿ ? Interrogaciones. También para los apéndices del tipo «¿no?», «¿eh?», «¿sabes?».
¡ ! Exclamaciones. Expresiones irónicas.
Letra cursiva Reproducción e imitación de emisiones. Estilo directo, característico de los denominados relatos
conversacionales.
4 El propio grupo Val.Es.Co. posee otro corpus judicial en español transcrito por él mismo, pero no es accesible dado que no ha sido
publicado (Villalba y Kotwica, 2020, p. 139).
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 102
+( )+ Fragmentos del discurso en los que se emplea un ritmo de habla muy acelerado.
-( )- Fragmentos del discurso en los que se emplea un ritmo de habla muy pausado.
{ } Información condencial. Por ejemplo, nombres y apellidos, o nombres de calles, pueblos o ciudades,
números identicativos como el Documento Nacional de Identidad, entre otros.
A continuación, se detalla el sistema utilizado por Taranilla (2012) para transcribir un corpus que consta de
diez juicios celebrados entre febrero de 2009 y julio de 2010 en los juzgados de lo penal de Barcelona capital
(motivados por delitos de robo con violencia más lesiones, quebrantamiento de condena, lesiones, simulación
de delito, robo con fuerza, amenazas e injurias, delito contra la seguridad vial, tenencia ilícita de armas, delito
contra la propiedad intelectual y robo con violencia) cuya duración total es cinco horas, cincuenta y nueve
minutos y diecinueve segundos:
ASPECTOS PROSÓDICOS
.. Pausa (< 1 segundo)
Pausa larga (> 1 segundo)
/ Fin del grupo tonal
- Grupo tonal truncado
¿ ? Interrogativa convencional
?Inicio declarativo, nal interrogativo
palabra Pronunciación enfática
palabra Pronunciación débil
aa
pp
Alargamiento vocálico
Alargamiento consonántico
< >
< >
Solapamiento
®Interrupción
“” cita de palabras ajenas
ASPECTOS VOCALES: SONIDOS
PARALINGÜÍSTICOS
mhm, ha ha Asentimiento
m:: , e:: , a:: Vacilación antes de o durante un
enunciado
uf:: Duda
ntx Desacuerdo (clic alveolar)
ASPECTOS GESTUALES
(armación) Gesto de armación con la cabeza
(negación) Gesto de negación con la cabeza
OTRAS
xxx Fragmento ininteligible
[(?) palabra] Fragmento incierto
palabra Discurso en otro idioma
{comentario} Comentario de la transcriptora
ELEMENTOS DE LA SITUACIÓN COMUNICATIVA
(J) Juez
(MF) Ministerio scal
(D) Defensor
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 103
(A), (O) Acusado
(M), (M1), (R) Testigo
Para cerrar este apartado, se incluye la propuesta de simplicación efectuada por Garayzábal Heinze et al.
(2019, pp. 56-57), en la cual, tras describir en profundidad todo el proceso de transcripción, se establecen tan
solo quince criterios que conguran un sistema de transcripción muy sencillo para que sea aplicado en los
ámbitos policial y judicial españoles:
1. A: Turno de palabra/locutor interviniente
2. PALABRA: Énfasis/elevación de tono
3. aa/ss: Alargamiento vocálico/consonántico
4. ¿?: Frases interrogativas
5. ¡!: Frases exclamativas
6. pal-: Autointerrupciones/autocorrecciones
7. []: Solapamiento
8. (( )): Ininteligible
9. ((duda)): Emisión dudosa
10. pa’: Uso de grafía fonética para acortamiento de palabra o supresión de fonema
11. //: Pausas de habla no normativa (> 30”)
12. cursiva: Locución en otra lengua (code-switching)
13. *voz susurrada*: Locución susurrada
14. { } Explicación breve, onomatopeya
15. Nota al pie: Comentario del transcriptor
3.1.1 Puntos fuertes y puntos débiles
Como es lógico, la transcripción de corpus judiciales debe ubicarse en un término medio que, por un lado,
permita representar el acto comunicativo oral y, por el otro, no sea especialmente compleja ni su codicación ni
su descodicación. Así, en consonancia con Bassi Follari (2015, p. 49), se aboga por añadir aquellos símbolos
cuya aportación resulte relevante y sustituir aquellos que implican menos información, a la vez que se debe
valorar que sea sencillo incorporar tales símbolos, tanto por la legibilidad de la transcripción, como por la
colocación de los símbolos de manera sencilla a la hora de utilizar un teclado.
Con respecto a los criterios seguidos en el subcorpus oral del banco de datos CREA-CORDE (Sánchez y
Pino 1999, pp. 85-89), destaca la utilización de signos de puntuación que signican pausas (tal es el caso
del punto o la coma) y el aprovechamiento de las convenciones de escritura que representan rasgos de la
oralidad como puede ser la interrogación o la exclamación para denotar la modalidad enunciativa. Además, las
indicaciones del CREA-CORDE deenden reejar los titubeos ya sea de palabras repetidas o de palabras con
pronunciación fragmentada, aparte de mostrar los fragmentos cuya transcripción es dudosa o dejar constancia
de la existencia de partes ininteligibles.
Los criterios de transcripción expuestos en Tusón Valls (1997, pp. 100-101) están diseñados para ser utilizados
por investigadores en el ámbito de la lingüística, de ahí que empleen símbolos muy precisos para información
que posiblemente no resulte de gran utilidad en los ámbitos judiciales, como es el caso de distintos tipos de
pausas, los tonos ascendentes o descendientes, los tonos graves o agudos o la distinción entre tantos tipos de
énfasis. Del mismo modo, parece bastante complejo el sistema empleado para marcar los turnos de habla.
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 104
A su vez, se ha de tener en cuenta que los símbolos de solapamiento utilizados pueden resultar mucho más
complicados que los corchetes usados en Ridao Rodrigo (2010) o Garayzábal Heinze et al. (2019, pp. 56-57).
Los símbolos de transcripción de Ridao Rodrigo (2010) y Taranilla (2012) son propios de investigaciones
afrontadas desde la perspectiva lingüística, si bien resultan bastante sencillos e incluso intuitivos. De Ridao
Rodrigo (2010) se ha de subrayar la simplicidad del símbolo utilizado para expresar un tono de voz bajo
que se aproxima al susurro, al igual que aporte símbolos para especicar si el ritmo de habla es más rápido
o bien más lento, la omisión de la información personal dejando constancia de que se ha citado, e incluso la
incorporación tanto de sonidos signicativos como de información no verbal; en oposición, se podría suprimir
la sucesión inmediata de hablante, los tipos de pausas o cuestiones que se cifran ya de esta manera en la
escritura convencional, como es el caso de las preguntas o exclamaciones retóricas, las interrogaciones, las
exclamaciones o el empleo de la cursiva.
En cambio, en Taranilla (2012) se observa un marcado interés por anotar el n del grupo tonal o el grupo
tonal truncado, igual que los tipos de pausa, y tal vez se pueda entender que resulta complicado codicar la
pronunciación enfática o la débil; muy destacable es que incida en que puede haber enunciados que comiencen
con un inicio cuya entonación es declarativa y culminen con una entonación interrogativa, lo cual queda
manifestado en dicha transcripción. Al mismo tiempo, no se estima necesario incluir la interrogación o la
cita de palabras ajenas con comillas y los términos provenientes de otros idiomas en cursiva porque así está
determinado en la escritura habitual. Otra cuestión que podría omitirse está relacionada con los aspectos
vocales de sonidos paralingüísticos, puesto que en esencia responden a onomatopeyas.
Especialmente destacables para esta investigación son los quince criterios establecidos en Garayzábal Heinze
et al. (2019, pp. 56-57), pues no solo responden a la simplicación, sino que resultan bastante intuitivos. Los
criterios cuatro, cinco y doce son utilizados en la escritura convencional, por lo que podrían suprimirse de esa
lista. Con respecto a la forma de cifrar los fragmentos que se pronuncian en un tono muy bajo, quizá resulte
más sencillo usar el símbolo propuesto por Tusón Valls (1997) o el empleado en Ridao Rodrigo (2010), y
convendría señalar los enunciados emitidos con mayor o menor velocidad.
4 Propuesta de criterios de transcripción
Se insiste en el razonamiento de que un sistema de transcripción viable para el ámbito legal ha de ubicarse
en un punto intermedio en el que se incorporen solo los símbolos que aporten información relevante para
entender los intercambios comunicativos, pero no debería conformar un sistema sumamente complejo ni
minucioso (como es el caso de las transcripciones diseñadas por lólogos para ser aplicadas a investigaciones
de índole lingüística), en tanto que un exceso de símbolos de transcripción puede implicar que los lectores o
bien se despisten al intentar entender la información cifrada por tales símbolos o bien por el contrario omitan
de manera automática cualquier dato derivado de los símbolos.
Dicho sistema de transcripción tiene que identicar a los actores con el rol que asumen en el acto comunicativo.
A su vez, se ha de tomar en consideración que puede cifrarse información vital para interpretar la comunicación
intercambiada no solo mediante la vía verbal, sino a través del medio paraverbal (como es el caso de la risa
que puede implicar ironía) y no verbal (como armar o negar mediante movimientos de la cabeza). Del
mismo modo, se debe plasmar en la transcripción tanto los fragmentos ininteligibles como los fragmentos
cuya transcripción resulte dudosa. Por la condencialidad de datos personales, conviene indicar que han
sido pronunciados aunque no se deben incluir tales datos. Tanto las pausas (indicando su duración) como los
solapamientos tienen que quedar reejados en la transcripción. En la misma línea se sitúan las cuestiones
paraverbales como los alargamientos –ya sean vocálicos o consonánticos– y la supresión de fonemas, así como
las palabras emitidas con un volumen bajo o elevado o cuando el ritmo de habla se incrementa o desciende.
Por ende, un sistema de transcripción factible para los contextos legales sería el siguiente que tan solo recoge
trece criterios muy intuitivos, los cuales son acompañados con ejemplos extraídos del corpus de Ridao Rodrigo
(2010)5:
5 Con miras a conseguir una mayor claridad pedagógica, en algunos casos se han modicado estas transcripciones para que tan solo
aparezca el símbolo explicado. Además, hay símbolos que se han cambiado con respecto al sistema de transcripción empleado en
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 105
1. A: Turno de palabra de cada participante. Resulta muy importante determinar el rol de cada hablante en
este acto comunicativo, cuestión que debe quedar identicada en la transcripción.
Ejemplo:
Juez: conteste a las preguntas del señor scal
Fiscal: sí con la venia ¿usted sabe los hechos por los que estamos aquí?
Testigo: sí [Juicio 9, intervenciones 5, 6 y 7]
2. (risas) Sonidos signicativos e información no verbal, cuando estos datos sean relevantes para entender
los intercambios comunicativos, han de ser incorporados en la transcripción. De hecho, hay intervenciones
en las que el hablante en realidad no emite ninguna palabra, sino que transmite el mensaje mediante un gesto.
Ejemplo:
Acusado: (niega con la cabeza) [Juicio 5, intervención 87]
3. (( )): Fragmento ininteligible. Para conseguir rigor en la investigación, el transcriptor tiene que dejar
constancia de que –si las hubiera– existen partes de la transcripción que no se han podido escribir por
problemas con el audio.
Ejemplo:
Letrado: entonces eh usted lo que nos dijo nos dijo también como tenía una amnesia la (( )) realmente no sé
no recuerdo lo que pasó (( )) [Juicio 4, intervención 62]
4. ((duda)): Transcripción dudosa. En la misma línea que el criterio anterior, si el transcriptor no está seguro
de qué ha pronunciado exactamente un participante, ha de indicarlo mediante este símbolo, de tal manera que
los profesionales que estudien tal transcripción conozcan que es posible que dicho fragmento en realidad no
esté transcrito de manera correcta.
Ejemplo:
Fiscal: sí nosotros interesamos la suspensión a n de que sea citado para ((comparecer)) en el juicio ((con los
procedimientos legales)) [Juicio 1, intervención 154]
5. { } Información condencial, como nombres y apellidos. En todo momento se ha de velar por la privacidad
de los individuos implicados, si bien para que la transcripción resulte ser un el reejo del acto es necesario
documentar que se han citado tales datos en el acto judicial.
Ejemplo:
Juez: {nombre y apellidos del acusado} ¿no? [Juicio 12, intervención 1]
6. //: Pausas de habla no normativa (3”). Las pausas no normativas pueden resultar muy signicativas a la
hora de interpretar la intención del hablante, en tanto que demuestra falta de seguridad en la transmisión del
discurso.
Ejemplo:
Acusado: pero como de noche él no quiere que vayamos // (1,5’’) [Juicio 6, intervención 29]
7. []: Solapamiento. Con más asiduidad de lo que se puede pensar a priori, se producen solapamientos en
estos actos; o sea, momentos en que hablan varios actores de forma simultánea. En muchos casos quienes
provocan el solapamiento no son los actores profesionales del ámbito legal con respecto a los interrogados,
sino que con frecuencia los testigos se atreven a producir un solapamiento con los actores profesionales, lo
que implica ignorar las relaciones de poder propias de estos contextos comunicativos.
Ejemplo:
Ridao Rodrigo (2010).
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 106
Fiscal: eh ¿por qué [le agredió?
Testigo: la cartera] no [Juicio 8, intervenciones 18 y 19]
8. aa/ss: Alargamiento vocálico/consonántico. Es aconsejable que las transcripciones en ámbitos legales
reejen esta información paralingüística que a menudo transmite vacilación en el discurso.
Ejemplo:
Fiscal: sí bueno y entonces a partir de ahí ¿qué pasa? empiezaa digamos económicamente ustedes ya no están
bien y entonces pasan ahí [Juicio 11, intervención 13]
9. pa’: Uso de grafía fonética para acortamiento de palabra o supresión de fonema. Se trata de una muestra
propia de un registro informal, aunque en ciertas ocasiones se puede justicar por la carencia de habilidad
por parte del hablante para adaptarse a las normas de formalidad que implica este contexto, sobre todo en
individuos con bajo nivel educativo.
Ejemplo:
Acusado: si iba ahí vamos iba ahí to’ empastilla’o iba to’ lleno de alcohol iba pincha’o sabe usted yo me
pincho [Juicio 2, intervención 4]
10. PALABRA: Énfasis/elevación de tono. Es información perteneciente a la comunicación paralingüística
que resulta sumamente relevante conocer en estos intercambios comunicativos, dado que se emplea esta
estrategia para indicar que se quieren enfatizar las palabras emitidas de esta manera.
Ejemplo:
Fiscal: o sea que en ninguna ocasión NI LE HA AMENAZADO NI SE HA APROXIMADO A ÉL [Juicio 3,
intervención 53]
11. ( )º: Fragmento pronunciado en un tono de voz más bajo próximo al susurro. Se justica la presencia de
este criterio por transmitir inseguridad.
Ejemplo:
Acusado: (no lo sé)º [Juicio 2, intervención 18]
12. +( )+ Fragmento del discurso en que se usa un ritmo de habla muy acelerado. Esta información
paralingüística puede entenderse como una muestra de nerviosismo, o, por el contrario, señal de seguridad,
por lo que debe ser analizada conjuntamente con los otros criterios.
Ejemplo:
Fiscal: se metieron en el despacho y discutieron y ya está +(pero no puede usted precisar qué día fue el que)+
[Juicio 10, intervención 429]
13. -( )- Fragmento del discurso en que se emplea un ritmo de habla muy pausado. Como en el criterio anterior,
ha de ser examinado de manera global, puesto que hablar despacio puede transmitir seguridad o bien cuidar
en gran medida lo que se está comunicando.
Ejemplo:
Testigo 2: -(sí sí me dijo que había hablado con ella y bueno pues)- [Juicio 10, intervención 342]
5 Para concluir
Los estudios interdisciplinares, grosso modo, presentan grandes luces y grandes sombras; en el caso de la
lingüística forense, se pone de maniesto la necesaria correspondencia entre comunicación y derecho, pero
también en este campo de estudio no faltan los obstáculos, de los cuales se subrayan dos: por un lado, en
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 107
realidad no suele haber intersección en la investigación en sí, sino que los estudios enfocados desde el derecho
cubren los intereses propios del campo del derecho dejando a un lado los de la lingüística y justo lo contrario
(Martín del Burgo y Marchán, 2000, p. 6), y, por otro lado, la dicultad para obtener un corpus de vistas orales
representa un gran óbice (Heffer, 2005, p. xvii; Cervera y Torres, 2015, p. 10; Taranilla, 2011, pp.498-499 y
2013, pp. 323-324; Villalba Ibáñez, 2015, p. 8).
Se debe asumir que el proceso de transcripción es más complicado de lo que se puede pensar a priori, puesto
que de él dependen directamente los resultados a los que llegue dicho estudio, de manera que requiere una
reexión profunda sobre la metodología que se va a aplicar. La publicación de Ochs (1979) ya advertía
la relevancia de meditar sobre el sistema de transcripción; aparte, el investigador ha de asumir que una
transcripción no constituye exactamente un el reejo de la interacción oral, sobre todo en la información que
se desprende de la comunicación paraverbal y la comunicación no verbal (Hidalgo Navarro y Sanmartín Sáez,
2005, p. 32; Cicres, 2011, pp. 27-28). Se ha revisado el sistema de transcripción propuesto por Tusón Valls
(1997, pp. 100-101) para estudios lingüísticos, también se incluyen los sistemas de transcripción utilizados en
corpus judiciales de Ridao Rodrigo (2010) y Taranilla (2012), y la propuesta simplicada de quince criterios
de transcripción para contextos legales y policiales de Garayzábal Heinze et al. (2019).
Tras haber analizado los sistemas de transcripción citados, con la nalidad de que resulte útil tanto para su
estudio lingüístico como para su utilización en contextos legales, se efectúan tres consideraciones que se
han de tener en cuenta a la hora de confeccionar una transcripción judicial con la nalidad de que resulte
sencillo: primera, que el sistema empleado debe contener pocos símbolos, de forma que se suprimen aquellos
que aportan información menos relevante; segunda, que dichos símbolos tienen que cifrarse fácilmente en
un teclado normal; y tercera, que tales símbolos han de resultar intuitivos, en la medida de lo posible, para
facilitar su desciframiento.
Tomando como base todas estas consideraciones, se aporta un sistema de transcripción que tan solo cuenta
con trece criterios y, para una mayor claricación del mismo, se acompaña con ejemplos. En este sistema se
incluye la siguiente información: (1) la identicación del turno de palabra de cada participante indicando su
rol; (2) los sonidos signicativos o la información no verbal que sean relevantes en la comunicación; (3) los
fragmentos ininteligibles; (4) las transcripciones dudosas; (5) la información condencial; (6) las pausas no
normativas; (7) el solapamiento; (8) los alargamientos tanto vocálicos como consonánticos; (9) el acortamiento
o la omisión de fonemas; (10) el volumen elevado o la pronunciación enfática; (11) el volumen bajo; (12) el
ritmo de habla acelerado; y (13) el ritmo de habla pausado.
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 108
Referencias bibliográcas
Arumí Ribas, Marta, y Vargas-Urpi, Mireia. (2018). Annotation of interpreters’ conversation management
problems and strategies in a corpus of criminal trials in Spain: the case of non-renditions. Translation
and Interpreting Studies, 13(3), 421-441.
Bassi Follari, Javier Ernesto. (2015). El código de transcripción de Gail Jefferson: adaptación para las ciencias
sociales. Quaderns de Psicologia, 17(1), 39-62.
Briz, Antonio. (1998). El español coloquial en la conversación. Esbozo de pragmagramática. Ariel.
Cervera Rodríguez, Ángel, y Torres Álvarez, José. (2015). Análisis conversacional del Discurso Procesal
Penal. Pragmalingüística, 23, 8-21.
Cervera Rodríguez, Ángel, y Torres Álvarez, José. (2016). Estrategias lingüísticas en el interrogatorio judicial
español: una aproximación pragmalingüística. Estudios de Lingüística (ELUA), 30, 61-78.
Cervera Rodríguez, Ángel, y Torres Álvarez, José. (2018). Estrategias pragmático-discursivas en escritos
de calicación provisional y defensa en juicio oral. Cuadernos de Lingüística Hispánica, 32, 87-105.
Cicres, Jordi. (2011). Transcripció i autenticació de gravacions en contextos judicials. Llengua, Societat i
Comunicació, 9, 26-32.
Du Bois, John, Schuetze-Coburn, Stephan, Cumming, Susanna, y Paolino, Danae. (1993). Outline of discourse
transcription. En Jane A. Edwards, y Martin D. Lampert (eds.), Talking data. Transcription and coding
in discourse research (p. 45-89). Lawrence Erlbaum Associates.
Eades, Diana. (1996). Verbatim courtroom transcripts and discourse analysis. En Hannes Kniffka (ed.), Recent
developments in Forensic Linguistics (p. 241-254). Peter Lang.
Edwards, Jane A. (1993). Principles and contrasting systems of discourse transcription. En Jane A. Edwards,
y Martin D. Lampert (eds.), Talking data. Transcription and coding in discourse research (pp. 3-31).
Lawrence Erlbaum Associates.
Elguero, Francisco. (1917). Lecciones de elocuencia forense. Manuel León Sánchez.
Fraser, Helen. (2003). Issues in transcription: factors affecting the reliability of transcripts as evidence in legal
cases. The International Journal of Speech, Language and the Law, 10(2), 203-226.
Garayzábal Heinze, Elena, Queralt, Sheila, Reigosa, Mercedes, y Ridao, Susana. (2019). La transcripción de
registros de audio en el ámbito policial y judicial español: una propuesta de criterios. Logos: Revista
de Lingüística, Filosofía y Literatura, 29(1), 45-59.
Godoy Tena, Francisco. (2017). Análisis macroestructural comparado de un corpus digital bilingüe (inglés-
español) de 100 sentencias judiciales británicas y españolas de primera instancia y de instancia
apelativa [Tesis doctoral]. Universidad Autónoma de Madrid [Departamento de Filología Inglesa].
Gumperz, John J., y Berenz, Norine. (1993). Transcribing conversational exchanges. En Jane A. Edwards, y
Martin D. Lampert (eds.), Talking data. Transcription and coding in discourse research (p. 91-121).
Lawrence Erlbaum Associates.
Heffer, Chris. (2005). The language of jury trials: a corpus-aided analysis of legal-lay discourse. Palgrave.
Hidalgo Navarro, Antonio, y Sanmartín Sáez, Julia. (2005). Los sistemas de transcripción de la lengua hablada.
Oralia, 8, 13-36.
Hidalgo Navarro, Antonio, y Villalba Ibáñez, Cristina. (2016). Problemas de uso del lenguaje oral en sede
judicial. Algunas propuestas de mejora. Revista de Llengua i Dret, Journal of Language and Law, 66,
208-225.
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 109
Jefferson, Gail. (2004). Glossary of transcript symbols with an introduction. En Gene H. Lerner (ed.),
Conversation analysis: studies from the rst generation (p. 13-31). John Benjamins.
Llisterri, Joaquim. (1999). Transcripción, etiquetado y codicación de corpus orales. Revista Española de
Lingüística Aplicada, Extra 1, 53-92.
Marín Pérez, María José, y Rea Rizzo, Camino. (2012). Structure and design of the British Law Report Corpus
(BLRC): a legal corpus of judicial decisions from the UK. Journal of English Studies, 10, 131-145.
Martín del Burgo y Marchán, Ángel. (2000). El lenguaje del derecho. Bosch.
Miguel y Romero, Mauro. (1901). Lecciones y modelos de práctica forense. Andrés Martín.
Mondada, Lorenza. (2008). La transcription dans la perspective de la linguistique interactionnelle. Cahiers
de l’Université de Perpingan, 37, 78-110.
Montolío, Estrella, y López Samaniego, Anna. (2008). La escritura en el quehacer judicial. Estado de la
cuestión y presentación de la propuesta aplicada en la Escuela Judicial de España. Signos, 41(66), 33-64.
Moore, Emilee, y Llompart, Júlia. (2017). Recoger, transcribir, analizar y presentar datos interaccionales
plurilingües. En Emilee Moore, y Melinda Dooly (eds.), Enfoques cualitativos para la investigación
en educación plurilingüe (p. 418-433). Research-publishing.net.
Ochs, Elinor. (1979). Transcription as theory. En Elinor Ochs, y Bambi Schieffelin (eds.). Developmental
pragmatics (p. 43-72). Nueva York Academic Press.
Orozco-Jutorán, Mariana. (2017). Anotación textual de un corpus multilingüe de interpretación judicial a
partir de grabaciones de procesos penales reales. Revista de Llengua i Dret, Journal of Language and
Law 68, 33-56.
Pérez de Anaya, Francisco. (1848-1849). Lecciones y modelos de elocuencia forense. Imprenta de Don Baltasar
González.
Pontrandolfo, Gianluca. (2011). Phraseology in criminal judgments: a corpus study of original vs. translated
Italian. Sendebar, 22, 209-234.
Pontrandolfo, Gianluca. (2019). Gerundios ‘revelando’ normalización en el lenguaje judicial español:
consideraciones a partir del corpus JustClar. Orillas, 8, 725-749.
Quesada Pacheco, Jorge Arturo. (1991). Análisis de las pruebas testimoniales en juicios penales. Revista de
Ciencias Jurídicas, 68, 83-95.
Ridao Rodrigo, Susana. (2010). El género judicial. Materiales para su estudio lingüístico. Junta de
Extremadura.
Ridao Rodrigo, Susana. (2017). Aproximación cuantitativa a las preguntas abiertas utilizadas en interrogatorios
judiciales españoles. Revista Española de Lingüística, 47(1), 91-108.
Sacks, Harvey, Schegloff, Emanuel A., y Jefferson, Gail. (1974). A simplest systematics for the organization
of turn-taking for conversation. Language, 50(4), 696-735.
Sainz de Andino, Pedro. (1828). Elementos de elocuencia forense. Julián Viana Razola.
Sánchez Sánchez, Mercedes, y Pino Moreno, Marta. (1999). El subcorpus oral del banco de datos CREA-
CORDE (Real Academia Española): procedimientos de transcripción y codicación. Oralia, 2, 83-138.
Taranilla, Raquel. (2011). La conguración narrativa en el proceso legal. Un análisis discursivo basado en
corpus [Tesis doctoral]. Universidad de Barcelona [Departamento de Filología Hispánica].
Susana Ridao Rodrigo
Aproximación a la transcripción de corpus orales: los símbolos de transcripción en corpus judiciales
Revista de Llengua i Dret, Journal of Language and Law, núm. 77, 2022 110
Taranilla, Raquel. (2012). La justicia narrante: un estudio sobre el discurso de los hechos en el proceso
penal. Aranzadi.
Taranilla, Raquel. (2013). Aspectos metodológicos en la confección de un corpus jurídico. Consideraciones
a propósito del Corpus de Procesos Penales. Revista de Investigación Lingüística, 16, 311-341. Ten
Have, Paul. (2002). Reections on transcription. Cahiers de Praxématique, 39, 21-43.
Tognini-Bonelli, Elena. (2001). Corpus linguistics at work. John Benjamins.
Torres Álvarez, José. (2017). Lingüística procesal: estrategias discursivas en los juicios españoles. Bosch
Editor.
Tusón Valls, Amparo. (1997). Análisis de la conversación. Ariel.
Villalba Ibáñez, Cristina. (2015). La cha ES.VAR.ATENUACIÓN. ¿Un recurso adaptable a todos los
géneros? Textos en Proceso, 1(2), 1-24.
Villalba Ibáñez, Cristina, y Kotwic, Dorota. (2020). ‘Tell us only what you know’: evidentiality in the discourse
of participants in Spanish trials. Corpus Pragmatics, 4, 133-153.
Villena, Juan Andrés, Ávila, Antonio Manuel, Sánchez Sáez, José María, y Lasarte, María de la Cruz. (2010).
Problemas de anotación e intercambio en los corpus orales. Estrategias para la transformación de textos
etiquetados en documentos XML. El caso de los corpus PRESEEA. Oralia, 13, 261-323.
Walsh, Michael. (1999). Interpreting for the transcript: problems in recording Aboriginal land claim proceedings
in Northern Australia. The International Journal of Speech, Language and the Law, 6(1), 161-195.

VLEX utiliza cookies de inicio de sesión para aportarte una mejor experiencia de navegación. Si haces click en 'Aceptar' o continúas navegando por esta web consideramos que aceptas nuestra política de cookies. ACEPTAR