Publication:
Attribution of authorship of "The merchant of Venice" and "Henry VI" through linguistic parameters: a contrastive study between William Shakespeare and Christopher Marlowe

Loading...
Thumbnail Image
Official URL
Full text at PDC
Publication Date
2017-06
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
This dissertation intends to attribute to The Merchant of Venice and Henry VI their likeliest authorship through a linguistic study, based on the belief that Shakespeare may not have written all the plays whose authorship has traditionally been attributed to him. There is historical evidence supporting the hypothesis that Christopher Marlowe did not die at the age of 29 as has been traditionally believed, given that he had a secret life as a spy and, for his own security, faked his own death to run away from England and settle in Italy, where he kept working on his literary production and sent his plays back to England, which were ultimately signed by Shakespeare. Consequently, this dissertation aims to test the truthfulness of this theory through a quantitative study belonging to the field of forensic linguistics, a relatively new branch of applied linguistics. For such end, a stylometric analysis was conducted with Hamlet and Dr. Faustus to delineate Shakespeare’s and Marlowe’s idiolect, respectively, since the authorship of these two plays is beyond doubt. The abovementioned stylometric analysis included a lexical study which was carried out with a computer program specifically designed by the engineer David García López for this project, called PSH; as well as a syntactic study which was manually conducted by the researcher. Hence, the same analysis with which Hamlet and Dr. Faustus were objectively defined was applied to The Merchant of Venice and Henry VI to compare their results with those obtained by the aforementioned models for each authors’ idiolect, to conclude that The Merchant of Venice was written by Shakespeare, whereas Henry VI was produced in collaboration between Shakespeare and Marlowe.
Este Trabajo de Fin de Máster pretende investigar, bajo el marco disciplinario de la lingüística forense, la autoría de las obras teatrales de El mercader de Venecia y Enrique VI a través de patrones lingüísticos, considerando como hipótesis inicial que Christopher Marlowe pudo haber escrito varias de las obras cuya autoría está atribuida a William Shakespeare a día de hoy. A continuación, indicaremos de forma sintética los distintos apartados que conformarían nuestra disertación. Primeramente, se aportará material biográfico de ambos autores y se establecerán una serie de analogías que permitan desmentir (o al menos cuestionar) la famosa teoría del fallecimiento de Marlowe en una taberna cuando contaba con veintinueve años de edad. De esta manera, se aceptará su supuesta huida de Inglaterra e hipotética estancia en Italia, lugar desde el que enviaría sus nuevas creaciones a su país natal y donde se darían a conocer como fruto de William Shakespeare. Un hecho comúnmente aceptado por los historiadores de la literatura es que Marlowe gozó durante su vida de mayor reputación que Shakespeare. Algunos, como Astrana (1964), llegan a referirse a él como el ídolo literario en la Inglaterra de aquella época. Esta consideración no resulta sorprendente, dado que a diferencia de Shakespeare, Marlowe sí recibió una refinada educación a nivel universitario, además de mantener una estrecha relación con intelectuales de la época como Robert Greene y Philip Sidney, lo que le habría permitido desarrollar sus habilidades como dramaturgo (Tallent, 2007). Siglos después de la publicación de Henry Watterson en The Gazette Times (23 de abril de 1851), en el que se ofrecían por primera vez pruebas fidedignas que respaldaban la teoría de que Marlowe no falleció con veintinueve años, prestigiosas fuentes literarias e históricas, tales como la Norton Anthology of English Literature, continúan aventurándose a lanzar la hipótesis de que ‘la posibilidad más factible es que él (Marlowe) trabajase como espía en contra de los católicos ingleses que conspiraban para derrocar el régimen protestante (2012:1106). Más allá de la suposición de que el autor de obras como El judío de Malta trabajase como espía, también se postuló que su temprana muerte fue una pantomima, dado que su presunto asesino, así como los testigos en el lugar de los hechos, estaban también conectados con el mundo del espionaje. En suma, el primer bloque de la disertación estaría dedicado al estudio histórico de ambos autores para ofrecer evidencias y testimonios de que Marlowe no murió en 1593 con veintinueve años, sino que huyó a Italia para escribir algunas de las obras cuya autoría está atribuida a Shakespeare a día de hoy, lo cual no sería una idea descabellada, dada la elevada formación académica de Marlowe (en contraste con el nivel básico de estudios que recibió el Bardo) y su éxito como dramaturgo durante la época, para muchos superior al de Shakespeare en aquel momento. Tras la introducción histórica, se llevaría a cabo la creación de un vínculo entre la producción literaria y la lingüística, que conformaría el auténtico foco de nuestra investigación. Este enlace consistiría en la explicación de la lingüística forense, una rama relativamente moderna de la lingüística aplicada que comenzó a desarrollarse con propósitos legales, siendo bautizada con este nombre por el profesor Svartvik en 1968 con su publicación de The Evans Statement, a Case for Forensic Linguistics. A pesar de que en un principio la disciplina estuvo orientada únicamente al análisis lingüístico para la resolución de temas de índole judicial, en las décadas siguientes fue ampliando su foco, abarcando así temas de atribución de autoría de obras literarias. Esta es definida por Coulthard (2010) como el área de la lingüística construida sobre la creencia de que tanto el lenguaje oral como escrito de un individuo son capaces de revelar información acerca de su edad, género, ocupación, educación, religión y otras creencias a través de las elecciones lingüísticas que realiza este a lo largo de su discurso. En otras palabras, la atribución de autoría consiste en la tarea de identificar al autor de un determinado documento a través de un estudio lingüístico, y eso es lo que este proyecto pretende hacer con las obras tradicionalmente consideradas shakespeareanas, con el propósito de confirmar o rechazar los testimonios y evidencias históricas previamente mencionadas. En cuanto a la metodología con la que se llevará a cabo el proyecto, se seguirán los siguientes pasos: En primer lugar, y tras mostrar al lector una revisión de trabajos anteriores en la materia, procederemos a definir de un modo cuantitativo el estilo de cada dramaturgo para una futura comparación con obras de dudosa autoría. Para ello, se utilizarán una obra cuya autoría ha sido inequívocamente atribuida a Shakespeare, Hamlet; así como una obra de Marlowe, Dr. Fausto, para obtener un modelo en términos numéricos del estilo de cada autor. Coulthard (2010) se refería a esto como el idiolecto, y lo definía como aquellos aspectos morfosintácticos, discursivos, pragmáticos y estilísticos que reflejan de un modo distintivo el estilo y el autor de un texto. Así pues, los objetivos del análisis serán discernir el número medio de palabras por frase de cada obra y la frecuencia de ciertas palabras clave seleccionadas por el investigador, así como el ratio de creación léxica, la aparición o ausencia de determinadas construcciones sintácticas, y otros criterios de menor relevancia que serán presentados posteriormente en la propia disertación. Para ello, hemos contactado con un ingeniero matemático, David García López, para la creación de un programa informático capaz de llevar a cabo algunas de las ya mencionadas tareas. Así pues, David García diseñó un software llamado PSH, capaz de contar el número medio de palabras por frase de cualquier texto en formato txt. Además, con el propósito de averiguar la frecuencia de ciertas palabras clave que definan el estilo de ambos autores, el programa es capaz de contar el número de veces que aparece cualquier palabra en el texto, dividirlo entre el número total de palabras y multiplicarlo por cien para obtener así su porcentaje de aparición. En cuanto al ratio de creación léxica, se hizo necesaria la elaboración de un segundo software, bautizado como PSH2, capaz de contar las palabras de un texto cuando estas realizan su primera aparición e ignorar las posteriores, con el propósito de dividir ese número resultante de palabras ‘originales’ entre el auténtico total de palabras del texto y multiplicarlo por cien, obteniendo así un porcentaje con la riqueza léxica de la obra. Dado que no se ha encontrado ningún programa gratuito capaz de analizar sintácticamente oraciones, además de la complejidad del inglés isabelino que manejaban ambos dramaturgos, el propio investigador, bajo la supervisión de su tutor, analizará sintácticamente un corpus de mil palabras en cada una de las dos obras y hará un recuento del número de construcciones en las que las posiciones de sujeto y verbo están invertidas, así como de la frecuencia de verbos en modo imperativo, tanto en solitario como acompañados por un vocativo. Una vez hayan sido contados, se dividirán entre el número total de oraciones analizadas y se multiplicará por cien para establecer, de nuevo, su porcentaje de aparición. El proceso previamente descrito se aplicará a las dos obras ya mencionadas, Hamlet y Dr. Fausto, y el resultado ofrecerá una definición cuantitativa del estilo de Shakespeare y Marlowe. Utilizando esos resultados como modelos estilísticos de ambos dramaturgos, se procederá al siguiente paso de la investigación, que consistirá en analizar El Mercader de Venecia y Enrique VI por el mismo proceso y comparar las cifras resultantes con aquellas que presentaron los propios modelos establecidos para el estilo de cada autor. Es evidente que la atribución de autoría no es una ciencia exacta, y por tanto no podemos aseverar de manera concluyente que una obra sea o no de un determinado autor. No obstante, sí que podemos aventurarnos a clasificar en términos probabilísticos la autoría de cada obra dudosa en función del nivel de similitud idiolectal que presente con aquellas obras cuya autoría está fuera de duda alguna. Antes de mencionar los resultados obtenidos, consideramos oportuno dar una serie de razones por las que nuestro proyecto puede ser útil dentro del panorama lingüístico actual. En primer lugar, cabe destacar la poca proliferación de estudios relativos a la disciplina de la lingüística forense en España, en contraste con otros países europeos como Alemania, Polonia y Reino Unido, donde el número de publicaciones y avances en esta área crece de forma exponencial. En segundo lugar, es importante mencionar que se trata de un tema candente en el panorama lingüístico internacional, dado que a finales del año pasado, un grupo de investigadores de diversos orígenes reunidos por la Universidad de Oxford consiguió demostrar que Enrique VI fue escrito en colaboración entre los dos sujetos de estudio del proyecto, Shakespeare y Marlowe. La noticia atravesó fronteras y los medios de comunicación más importantes de España y del resto del mundo se hicieron eco de la noticia2, en las que se especula con la idea de que Shakespeare pudo haber colaborado con otros autores en al menos diecisiete de sus obras. Así pues, el estudio fue llevado a cabo siguiendo la metodología previamente descrita, y los resultados revelaron que es altamente probable que El Mercader de Venecia fuese escrito en solitario por William Shakespeare, mientras que Enrique VI fue escrito, con un elevado nivel de certeza, por ambos dramaturgos en colaboración. Con estos resultados quedaría alcanzado no solo el objetivo primario del proyecto, consistente en la atribución de autoría de ambas obras, sino también el objetivo último, mediante el cual se pretendían obtener unas conclusiones similares a las alcanzadas por los expertos en la materia previamente mencionados, probando de esta manera la validez del método y los programas informáticos presentados en esta disertación, con el propósito de mejorarlos y aplicarlos en estudios futuros orientados al análisis de otras obras shakespeareanas, así como de otros autores de distinta índole. En resumen, se trata de un proyecto ambicioso pero a la vez apasionante, en el que gracias a las nuevas tecnologías y a un exhaustivo trabajo del grupo investigador se podría contribuir a cambiar la percepción histórica del que para muchos es el autor más grande de todos los tiempos.
Description
Texto completo retirado a petición del autor con fecha 5-03-2019
Keywords
Citation
Astrana Marín, L. (1964): Vida inmortal de William Shakespeare. Editorial Atlántico, Barcelona. Baayen, H.; Halteren, H.; Tweedie, F. (1996): ‘Outside the Cave of Shadows: Using Syntactic Annotation to Enhance Authorship Attribution’. Literary and Linguistic Computing, vol. 11, nº3, pp. 121-132. Baker, J.C. (1988): ‘Pace: A Test of Authorship Based on the Rate at which New Words Enter an Author’s Text’. Literary and Linguistic Computing, Vol. 3, No. 1. Oxford University Press. Bozkurt, I.; Baglioglu, O.; Uyar, E. (2007): Authorship Attribution: Performance of Various Features and Classification Methods. IEEE Xplore, Digital Library (last visit on May, 21, 2017). Bryson, B. (2007): Shakespeare. Editorial RBA, Barcelona. Butters, R. (2012): ‘Retiring President’s Closing Address: Ethics, Best Practices and Standards’. Proceedings of the International Association of Forensic Linguists’ Tenth Bienniel Conference, pp. 351-361. Coulthard, M. (2004): ‘Author Identification, Idiolect, and Linguistic Uniqueness’. Applied Linguistics. Vol. 24, pp. 431–447. Coulthard, M. (2010): ‘Forensic Linguistics: the application of language description in legal contexts’. Langage et société, Vol. 2, No. 132, pp. 15-33. Craig, H.; Kinney, A. (2009): Shakespeare, Computers and the Mystery of Authorship. Cambridge University Press, Cambridge. El País, October 16, 2016. El otro genio detrás de las obras de Shakespeare. Available on http://cultura.elpais.com/cultura/2016/10/24/actualidad/1477311194_853346.html (last visit on May, 20, 2017) Garayzábal, E.; Jiménez, M.; Reigosa, M. (2014): Lingüística Forense: La Lingüística en el Ámbito Legal y Policial. Euphonia Ediciones. España, Madrid. Greenblatt, S. (2012): The Norton Anthology of English Literature. Vol.1. Ninth Edition, New York. Halliday, F.E. (1964): Shakespeare: Biografía ilustrada. Ediciones Destino, Barcelona. Jiménez Aragón, G. (2016): An analysis of authorship attribution: Identifying linguistic variables in oral and written discourse. Master’s dissertation, UCM. Hoover, D. (2003): ‘Another Perspective on Vocabulary Richness’. Computers and the Humanities, vol. 37, pp.151-178. Juola, P. (2008): Authorship Attribution. Now Publishers, Foundation and Trends in Information Retrieval. Hanover, USA. Kocher, P. H. (1948): ‘Christopher Marlowe, Individualist’. University of Toronto Quarterly, Vol. 17, No.2, pp. 111-120. University of Toronto Press. Love, H. (2002): Attributing Authorship: An Introduction. Cambridge University Press, Cambridge. Levi, J. (1994): ‘Language as Evidence: the Linguist as Expert Witness in North America Courts’. International Journal of Speech, Language and the Law, vol. 1, pp.1-26. Matthews, R.; Merriam, T. (1994): ‘Neural Computation in Stylometry: An Application to the Works of Shakespeare and Marlowe’. Literary and Linguistic Computing, Vol. 9, No. 1. Oxford University Press. Merriam, T. (1998): ‘Heterogeneous Authorship in Early Shakespeare and the Problem of Henry V’. Literary and Linguistic Computing, Vol. 13, No. 1. Oxford University Press. Momeni, N. (2011): ‘Forensic Linguistics: A Conceptual Frame of Brivery with Linguistic and Legal Features (a case study in Iran)’. International Journal of Criminology and Social Theory, Vol. 4, No. 2, pp. 733-744. Morton, A.Q. (1978): Literary Detection: How to Prove Authorship and Fraud in Literature and Documents. Scribner, New York. Newman, P. (2010): ‘Review on The Routledge Handbook of Forensic Linguistics’. The International Journal of Speech, Language and the Law. Vol.18, pp. 61-67. Olsson, J. (2014): What is Forensic Linguistics? Forensic Linguistics Institute. Riggs, D. (2004): The World of Christopher Marlowe. Faber and Faber. England, Kent. Rudman, J. (1998): ‘The State of Authorship Attribution Studies: Some Problems and Solutions’. Computers and the Humanities, vol. 31, pp. 351-365. Kluwer Academic Publishers. Schoenbaum, S. (1985): William Shakespeare: Una biografía documentada. Editorial Argos Vergara, Barcelona. Seroussi, Y.; Zukerman, I.; Bohnert, F. (2014): ‘Authorship Attribution with Topic Models’. Association for Computational Linguistics, vol.40, nº 2, pp. 269-310. Shuy, R. (1993): Language crimes: The use and abuse of language evidence in the courtroom. Blackwell Publishers. Shuy, R. (2010): The Language of Defamation Cases. Oxford University Press. Stamatatos, E.; Fakotakis, N.; Kokkinakis, G. (2001): ‘Computer-Based Authorship Attribution Without Lexical Measures’. Computers and the Humanities, vol. 35, pp. 193- 214. Stamatatos, E. (2009): ‘A Survey of Modern Authorship Attribution Methods’. Journal of the American Society for Information Science and Technology, vol. 60, issue 3, pp. 538-556. Starvik, J. (1968): The Evans statements. University of Goteburg. Tallent, L. (2007). ‘Looking for Marlowe’. College Literature. Vol. 34, pp. 213-222. Taylor, G.; Jowett, J.; Bourus, T.; Egan, G. (2016): William Shakespeare: The Complete Works. Modern and Critical Edition. Oxford University Press, Oxford. Turell, M.T. (2005): ‘El plagio en la traducción literaria’. Lingüística Forense, lengua y derecho: conceptos, métodos y aplicaciones. Institut Universitari de Lingüística Aplicada. Universitat Pompeu Fabra. Barcelona, pp. 275-298. The Gazette Times, April 23, 1916. Alternative life of Christopher Marlowe, by Henry Watterson. Available on: https://news.google.com/newspapers?id=Y4NRAAAAIBAJ&sjid=FWgDAAAAIBAJ&pg =4670,4410303&dq=marlowe+basconi&hl=en (last visit on January 29, 2017). The Guardian. October 23, 2016. Christopher Marlowe Credited as one of Shakespeare’s Co-writers. Avaiable on https://www.theguardian.com/culture/2016/oct/23/christopher- marlowe-credited-as-one-of-shakespeares-co-writers (last visit on February 5, 2017). Udina, N. (2017): ‘Forensic linguistics implications for legal education: creating the e- textbook on language and law’. Procedia: Social and Behavioral Sciences. No. 237, pp. 1337-1340. Editions of the Literary Works Hamlet: http://www.folgerdigitaltexts.org/download/txt/Ham.txt (last visit on June 10, 2017) Dr. Faustus: http://www.gutenberg.org/cache/epub/779/pg779.txt (last visit on June 10, 2017). The Merchant of Venice: http://www.folgerdigitaltexts.org/download/txt/MV.txt (last visit on June 10, 2017). Henry VI: http://www.folgerdigitaltexts.org/download/txt/1H6.txt (last visit on June 10, 2017).