Aplicación de recursos de xeración automática da lingua para estudos comparativos
- María José Domínguez Vázquez 1
- María Caíña Hurtado 1
-
1
Universidade de Santiago de Compostela
info
ISSN: 1889-2566
Ano de publicación: 2021
Número: 13
Páxinas: 139-172
Tipo: Artigo
Outras publicacións en: Estudos de lingüística galega
Resumo
O principal obxectivo deste traballo é presentar unha das posibles aplicacións dos xeradores automáticos da lingua Xera e XeraWord: o seu emprego para a análise multicontrastiva. Estes prototipos plurilingües presentan a argumentación valencial de substantivos en español, francés e alemán —Xera— e en galego e portugués —XeraWord. Dado que son concibidos como novos recursos valenciais lexicográficos, cómpre realizarmos unha breve descrición da metodoloxía e da teoría na que se sustentan, así como unha incursión no emprego dos recursos valenciais. A presentación de XeraWord, o máis recente dos prototipos, conxuga tanto a aproximación no manexo do recurso como os diferentes niveis de análise sintáctico-semántica que o conforman, os cales beben do simulador Xera. Co fin de exemplificar a aplicación comparativa botando man dos datos dos simuladores centrámonos na expresión da dirección no substantivo fuxida e os seus equivalentes en alemán, español e portugués.
Referencias bibliográficas
- Albi Aparicio, Miguel Á. 2010. La valencia lógico-semántica de los verbos de movimiento y posición en alemán y español. Frankfurt a.M.: Lang.
- Álvarez Blanco, Rosario & Xosé Xove. 2002. Gramática da lingua galega. Vigo: Galaxia.
- Berthele, Raphael. 2006. Ort und Weg. Die sprachliche Raumreferenz in Varietäten des Deutschen, Rätoromanischen und Französischen. Berlin & New York: de Gruyter. https://doi. org/10.1515/9783110890464
- Busse, Winfried. 1994. Diccionario sintáctico de verbos portugueses. Coimbra: Almedina.
- Busse, Dietrich. 2012. Frame Semantik. Einführung, Diskussion, Weiterentwicklung. Berlin & Boston: De Gruyter.
- Cidrás Escáneo, Francisco Antonio. 2017. Determinación nominal con posesivo en español y gallego. En María José Domínguez Vázquez & Silvia Kutscher (eds.), Interacción entre gramática, didáctica y lexicografía. 239-250. Berlin & Boston: De Gruyter. https://doi.org/10.1515/9783110420784- 018
- Combinatoria = Domínguez Vázquez, María José (dir.), Carlos Valcárcel Riveiro, Daniel Bardanca Outeiriño, Natalia Catalá Torres, Nerea López Iglesias, Rosa Martín Gascueña, Mónica Mirazo Balsa, María Teresa Sanmarco Bande & Laura Pino Serrano. 2020. Combinatoria. Prototipo online para la generación biargumental de la frase nominal en alemán, español y francés. Universidade de Santiago de Compostela. http://portlex.usc.gal/combinatoria/usuario [11/01/2021].
- CORGA = Centro Ramón Piñeiro para a investigación en humanidades: Corpus de Referencia do Galego Actual (CORGA) [3.2 ] http://corpus.cirp.gal/corga/ [09/01/2021].
- DAELE = Diccionario de Aprendizaje de Español como Lengua Extranjera: http://www.iula.upf.edu/rec/ daele/ [15/01/2021].
- DEPE = Maldonado, Concepción. (dir.). (2002). Diccionario de español para extranjeros. Madrid: SM. DICE = Alonso Ramos, Margarita. 2004. Diccionario de colocaciones del español
- (DICE). http://www. dicesp.com/paginas [02/01/2021].
- Domínguez Noya, Eva María, M.ª Sol López Martínez & Francisco Mario Barcala Rodríguez. 2019. Corpus de Referencia do Galego Actual (CORGA): composición, codificación, etiquetaxe e explotación. En Marta Blanco, Hella Olbertz & Victoria Vázquez Rozas (coords.), Corpus y construcciones: perspectivas hispánicas. 179-218. Santiago de Compostela: Universidade de Santiago de Compostela. https://dx.doi.org/10.15304/9788417595876
- Domínguez Vázquez, María José. 2015. Wie wird Veränderung im Deutschen und im Spanischen ausgedrückt? Ein szenen- und valenzfundiertes konzeptuelles wortklassenübergreifendes Beschreibungsmodell. En Meike Meliss & Bernhard Pöll (eds.), Aktuelle Perspektiven der kontrastiven Sprachwissenschaft: Deutsch-Spanisch-Portugiesisch. Zwischen Tradition und Innovation. 97-125. Tübingen: G. Narr.
- Domínguez Vázquez, María José. 2020. Aplicación de WordNet e de word embeddings no desenvolvemento de prototipos para a xeración automática da lingua. Linguamática 2, 71-80. https://doi. org/10.21814/lm.12.2.337
- Domínguez Vázquez, María José, Daniel Bardanca & Alberto Simões. 2021. Automatic Lexicographic Content Creation for Lexicographers. En: Elex 2021: Post-editing Lexicography. Proceedings of the eLex 2021 conference. 5-7 July 2021. Brno: Lexical Computing CZ s.r.o. [No prelo].
- Domínguez Vázquez, María José & Carlos Valcárcel Riveiro. 2020. PORTLEX as a multilingual and cross-lingual online dictionary. En María José Domínguez Vázquez, Mónica Mirazo Balsa & Carlos Valcárcel Riveiro (eds.), Studies on multilingual lexicography. 135-158. Berlin: De Gruyter. https://doi.org/10.1515/9783110607659-008
- Domínguez Vázquez, María José, Miguel Anxo Solla Portela & Carlos Valcárcel Riveiro. 2019. Resources interoperability: exploiting lexicographic data to automatically generate dictionary examples. En Iztok Kosem & Tanara Zingano Kuhn (eds.), Proceedings of the VI. eLex conference Electronic lexicography in the 21st century: Smart Lexicography. 51-71. Brno: Lexical Computing CZ s.r.o.
- Domínguez Vázquez, María José, Alberto Simões, Daniel Bardanca Outeiriño, María Caíña Hurtado & José Luis Iglesias Anllones. Automatic Generation of Nominal Phrases for Portuguese and Galician Combining Multilingual Resources into XeraWord. [No prelo]
- DRAG = Real Academia Galega. 2021. Dicionario da Real Academia Galega. https://academia.gal/ dicionario. [01/04/2021].
- Engel, Ulrich. 1996. Semantische Relatoren. Ein Entwurf für künftige Valenzwörterbücher. En Nico Weber (ed.), Semantik, Lexikographie und Computeranwendung. 223-236. Tübingen: Niemeyer. https://doi.org/10.1515/9783111555522.223
- Engel, Ulrich. 2004. Deutsche Grammatik – Neubearbeitung. München: Iudicium.
- Freixeiro Mato, Xosé Ramón. 2006. Gramática da lingua galega. Vigo: A Nosa Terra.
- Gao, Jun & Haitao Liu. 2020. Valency Dictionaries and Chinese Vocabulary Acquisition for Foreign Learners. Lexikos 30, 111-142. https://doi.org/10.5788/30-1-1548
- Fillmore, Charles John. 1977. Scenes-and-Frames Semantics. En Antonio Zampolli (ed.), Linguistic Structures Processing. 55-81. Amsterdam, New York & Oxford: North-Holland.
- Fuertes-Olivera, Pedro, Marta Niño Amo & Ángeles Sastre Ruano. 2019. Tecnología con fines lexicográficos. RILE. Revista Internacional de Lenguas Extranjeras, 10, 75–100. https://doi. org/10.17345/rile10.75-100
- Gómez Guinovart, Xavier. 2011. Galnet: WordNet 3.0 do galego. Linguamática 3/1, 61-67. https:// doi.org/10.17979/rgf.2015.16.0.1383
- Gross, Gaston. 2008. Les classes d’objets. Paris: Presses de l’Ecole normale supérieure.
- Hanks, Patrick (2004). Corpus Pattern Analysis. En Geoffrey Williams & Sandra Vessier (eds.), Proceedings of the XI EURALEX International Congress. 87-97. Lorient: Université de Bretagne-Sud.
- Hanks, Patrick & James Pustejovsky. (2005). A Pattern Dictionary for Natural Language Processing. Revue Francaise de Linguistique Appliquée 10(2), 63-82. https://doi.org/10.3917/rfla.102.82
- Herbst, Thomas, David Heath, Ian. F. Roe & Dieter Götz. 2004. A Valency Dictionary of English: a corpus based analysis of the complementation patterns of English verbs, nouns and adjectives. Berlin: de Gruyter. https://doi.org/10.1515/9783110892581
- Heringer, Hans Jürgen. 1984. Neues von der Verbszene. En Gerhard Stickel (ed.), Pragmatik in der Grammatik: Jahrbuch 1983 des Instituts für deutsche Sprache. 34-64. Düsseldorf: Schwann.
- Hermanns, Fritz & Werner Holly. 2007. Linguistische Hermeneutik. Theorie und Praxis des Verstehens und Interpretierens. Berlin: de Gruyter
- Kilgarriff, Adam, Vít Baisa, Jan Bušta, Miloš Jakubíček, Vojtěch Kovář, Jan Michelfeit, Pavel Rychlý & Vít Suchomel. 2014. The Sketch Engine: ten years on. Lexicography ASIALEX 1, 7–36. https:// doi.org/10.1007/s40607-014-0009-9
- Kipper, Karin, Hoa Trang Dang & Martha Palmer. 2000. Class-based construction of a verb lexicon. En Robert Engelmore & Haym Hirsh (eds.), Proceedings of the Seventeenth National Conference on Artificial Intelligence and Twelfth Conference on Innovative Applications of Artificial Intelligence. 691–696. Austin: AAAI Press.
- Laufer, Batia & Paul Nation. 2012. Vocabulary. En Susan M. Gass & Alison Mackey (eds.), The Routledge Handbook of Second Language Acquisition. 163–176. London/New York: Routledge.
- Meyers, Adam, Ruth Reeves, Catherine Macleod, Rachel Szekely, Veronika Zielinska, Brian Young, & Ralph Grishman. 2004. Annotating noun argument structure for NomBank. En Maria Teresa Lino, Maria Francisca Xavier, Fátima Ferreira, Rute Costa, Raquel Silva, Carla Pereira, Filipa Carvalho, Milene Lopes, Mónica Catarino & Sérgio Barro (eds.), Proceedings of the 4th International Conference on Language Resources and Evaluation (LREC). París: European Language Resources Association (ELRA).
- Morimoto, Yuko (2001): Los verbos de movimiento. Madrid: Visor.
- Müller-Spitzer, Carolin, María José Domínguez Vázquez, Martina Nied Curcio, Idalete Maria Silva Dias & Sascha Wolfer. 2018. Correct Hypotheses and Careful Reading Are Essential: Results of an Observational Study on Learners Using Online Language Resources. Lexikos 28, 287-315. https://doi.org/10.5788/28-1-1466
- Müller-Spitzer, Carolin, Martina Nied Curcio, María José Domínguez Vázquez, Idalete Maria Silva Dias & Sascha Wolfer. 2019. Recherchepraxis bei der Verbesserung von Interferenzfehlern aus dem Italienischen, Portugiesischen und Spanischen: Eine explorative Beobachtungsstudie mit DaF-Lernenden. Lexicographica 34, 157-182. https://doi.org/10.1515/lex-2018-0008
- Nazar, Rogelio, Antonio Balvet, Gabriela Ferraro, Rafael Marin & Irene Renau. 2020. Pruning and repopulating a lexical taxonomy: experiments in Spanish, English and French. Journal of Intelligent Systems 30 (1), 376-394. https://doi.org/10.1515/jisys-2020-0044
- Nied Curcio, Martina. 2014. Die Benutzung von Smartphones im Fremdsprachenerwerb und -unterricht. En Andrea Abel, Chiara Vettori & Natascia Ralli (eds.), Proceedings of the XVI EURALEX International Congress: The User in Focus. 263-280. Bolzano & Bozen: Institute for Specialised Communication and Multilingualism.
- Pérez Serrano, Mercedes. 2014. ¿Son indispensables los diccionarios combinatorios? Revista de lexicografía 20, 121-145. https://doi.org/10.17979/rlex. 2014.20.0.3877
- Portlex = Domínguez Vázquez (dir.), Carlos Valcárcel Riveiro, Mónica Mirazo Balsa, María Teresa Sanmarco Bande, Alberto Simões & Mário João Vale. 2018. Portlex. Dicccionario multilingüe de la valencia del nombre. Universidade de Santiago de Compostela. http://portlex.usc.gal/portlex/ [01/01/2021].
- Raposo, Eduardo, Maria Fernanda Bacelar do Nascimento, Maria Antónia Coelho da Mota, Luísa Segura & Amália Mendes (coord.) 2013. Gramática do português. Lisboa: Fundação Calouste Gulbenkian. REDES = Bosque, Ignacio (dir.) 2004.
- REDES. Diccionario combinatorio del español contemporáneo. Madrid: SM. https://doi.org/10.17979/rlex.2007.13.0.4792
- Ruppenhofer, Josef, Michael Ellsworth, Myriam Schwarzer-Petruck, Christopher R. Johnson, & Jan Scheffczyk. 2006. FrameNet II: Extended theory and practice. Berkeley: International Computer Science Institute.
- Sánchez Rufat, Anna & Francisco Jiménez Calderón. 2013. Combinatoria léxica y corpus como input. Language Design 14, 61-81.
- Serra Sepúlveda, Susana. 2009. Las restricciones de selección en los diccionarios generales de lengua española. Boletín de Filología 44 (2), 187-213. https://doi.org/10.4067/s0718-93032009000100007
- Schumacher, Helmut. 2006. Deutschsprachige Valenzwörterbücher. En Vilmos Ágel, Ludwig M. Eichinger, Hans-Werner Eroms, Peter Hellwig, Hans Jürgen Heringer & Henning Lobin (eds.), Dependenz und Valenz. Ein internationales Handbuch der zeitgenössischen Forschung, vol. II. 1396– 1424. Berlin & New York: De Gruyter. https://doi.org/10.1515/9783110171525.2.11.1396
- Simões, Alberto & Xavier Gómez Guinovart. 2014. Bootstrapping a portuguese wordnet from galician, spanish and english wordnets. En Juan Luis Navarro Mesa, Alfonso Ortega, António Teixeira, Eduardo Hernández Pérez, Pedro Quintana Morales, Antonio Ravelo García, Iván Guerra Moreno & Doroteo T. Toledano (eds.), Advances in Speech and Language Technologies for Iberian Languages. 239-248. Berlin: Springer International Publishing. https://doi.org/10.1007/978-3- 319-13623-3
- Slobin, Dan I. 2006. What makes manner of motion salient? En Maya Hickmann, & Stéphane Robert, S. (eds.): Space in languages: Linguistic systems and cognitive categories. 59-82. Amsterdam & Philadelphia: Benjamins. https://doi.org/10.1075/tsl.66.05slo
- Smith, Carlota. 1991. The Parameter of Aspect. Dordrect: Kluwer Academic Publishers.
- Sommerfeldt, Karl-Ernst & Herbert Schreiber. 1983. Wörterbuch zur Valenz und Distribution der Substantive. Leipzig & Tübingen: De Gruyter. https://doi.org/10.1515/9783111549491
- Talmy, Leonard. 2000. Towards a Cognitive Semantics, Volume II: Typologie and Process in Concept Structuring. Cambridge: MIT Press.
- VALBU = Schumacher, Helmut, Jacqueline Kubczak, Renate Schmidt & Vera de Ruiter. 2004. VALBU -Valenzwörterbuch deutscher Verben, Tübingen: Narr. http://hypermedia.ids-mannheim.de/ evalbu/index.html [02/02/2021].
- Valcárcel Riveiro, Carlos. 2017. Las construcciones N1N2 como realizaciones actanciales del sustantivo en francés y su tratamiento en el diccionario multilingüe PORTLEX. En María José Domínguez Vázquez & Silvia Kutscher (eds.), Interacción entre gramática, didáctica y lexicografía. 193-207. Berlin & Boston: De Gruyter. https://doi.org/10.1515/9783110420784-015
- Wälchli, Bernhard. 2001. A typology of displacement (with special reference of Latvian). Sprachtypologie und Universalforschung 53/3, 298-323. https://doi.org/10.1524/stuf.2001.54.3.298 VLdr = Engel, Ulrich & Emilia Savin,. 1983. Valenzlexikon deutsch-rumänisch. Dictionar de valenta german-român. Heidelberg: Groos. VLdsp = Domínguez Vázquez, María José, Ulrich Engel & Gemma Paredes Suárez. 2017. Neue Wege zur Verbvalenz. Band II: Deutsch-spanisches Valenzlexikon. Frankfurt: Peter Lang.
- Xera = Domínguez Vázquez, María José (dir.), Carlos Valcárcel Riveiro, Daniel Bardanca Outeiriño, José Antonio Calañas, Natalia Catalá Torres, Rosa Martín Gascueña, Mónica Mirazo Balsa, María Teresa Sanmarco Bande & Laura Pino Serrano. 2020. Xera. Prototipo online para la generación automática monoargumental de la frase nominal en alemán, español y francés. Universidade de Santiago de Compostela. http://portlex.usc.gal/combinatoria/usuario [11/01/2021].
- XeraWord = Domínguez Vázquez, María José (dir.), Daniel Bardanca Outeiriño, María Caíña Hurtado, Xavier Gómez Guinovart, José Luis Iglesias Allones, Alberto Simões, Carlos Valcárcel Riveiro, María Álvarez de la Granja & Francisco A. Cidrás Escaneo. 2020. XeraWord. Prototipo de xeración automática da argumentación da frase nominal en galego e portugués. Santiago de Compostela: Instituto da Lingua Galega. http://ilg.usc.gal/xeraword/ [02/01/2021]
- Ziem, Alexander. 2008. Frames und sprachliches Wissen. Kognitive Aspekte der semantischen Kompetenz. Berlin & New York: De Gruyter. https://doi.org/10.1515/9783110209419