Diana Sousa Marques Santos

Professor - Ibero-romansk
Norwegian version of this page
Phone +47-22857657
Room NT 1026
Username
Visiting address Niels Treschows building 10th floor Niels Henrik Abels vei 36 0851 OSLO
Postal address Postboks 1003 Blindern 0315 OSLO

Academic interests

Computational processing of Portuguese, natural language processing, semantics, translation, information retrieval, evaluation, corpus processing, contrastive studies, statistics, language and culture.

Teaching

Regular

  • Portuguese grammar, BA level (POR1101, POR1102, POR1104, POR2101, POR2102)
  • Portuguese grammar, contrastive linguistics and translation, MA level (POR4120, POR4104)
  • Introduction to statistical methods in linguistics and literature, Master level (SPR4104)
  • Introduction to MA thesis writing, Master level, on publication and quantitative methods (IBER4100)
  • MA supervision

Once

  • PhD course on Emotions in Language (June 2015)
  • Courses on lusophone history and culture (part of IBER1501) (autumn 2016)

Higher education and employment history

I hold a (5 years) electronics and computers engineering degree, a MSc (3 years) with a thesis on machine translation, and a PhD on contrastive corpus-based semantics, all from Instituto Superior Técnico, Technical University of Lisbon (Portugal).

I taught at the Technical University of Lisbon from 1983-1990, 1994.

I have been a researcher at INESC (1991-1996), IBM Portugal (1989-1990) and SINTEF ICT (1998-2010), and employee at the Research Computing Services at the University of Oslo (2010).

My current position in Portuguese linguistics at the University of Oslo started 15 January 2011.

Cooperation

Through leading Linguateca, an international project for deploying and fostering the development and availability of resources for the computational processing of Portuguese, I have a long-standing cooperation with the major universities in Portugal and Brazil, as well as with the Southern Denmark University.

See also

My page at Linguateca for a longer and wider perspective, and my personal page at the University of Oslo for more details on my presence here.

Tags: natural language processing, Portuguese, semantics, Translation, Corpus linguistics, Contrastive linguistics, Cultural Studies, Statistics

Publications

Books and journal volumes

Freitas, Cláudia & Diana Santos (eds.) Tradução em revista 22 (1), special volume on "Translation and technology", 2017.

Simões, Alberto, Anabela Barreiro, Diana Santos, Rui Sousa-Silva & Stella E.O. Tagnin (eds.). Linguística, Informática e Tradução: Mundos que se Cruzam. Homenagem a Belinda Maia, Oslo Studies in Language 7 (1), 2015.

Ebeling, Signe, Atle Grønn, Kjetil Rå Hauge & Diana Santos (eds.). Corpus-based Studies in Contrastive Linguistics, Oslo Studies in Language 6 (1), 2014.

Santos, Diana, Krister Lindén & Wanjiku Ng'ang'a (eds.), Shall We Play the Festschrift Game? Essays on the Occasion of Lauri Carlson's 60th Birthday. Springer, 2012. 241 pages.

Santos, Diana, Cristina Mota, Cláudia Freitas & Luís Costa (eds.). Linguamática 4 (1), edição especial sobre o Págico, 2012.

Peters, Carol, Valentin Jijkoun, Thomas Mandl, Henning Müller, Doug Oard, Anselmo Peñas, Vivien Petras & Diana Santos (Eds.). Advances in Multilingual and Multimodal Information Retrieval: 8th Workshop of the Cross-Language Evaluation Forum, CLEF 2007, Budapest, Hungary, Revised Selected Papers. Lecture Notes in Computer Science 5152, Berlin et al.: Springer, 2008, 922 pages.

Mota, Cristina & Diana Santos (eds.). Desafios na avaliação conjunta do reconhecimento de entidades mencionadas: O Segundo HAREM. Linguateca, 2008, 436 pages.

Costa, Luís, Diana Santos & Nuno Cardoso (eds.), Perspectivas sobre a Linguateca: Actas do encontro Linguateca: 10 anos. Linguateca, 2008, 138 pages.

Santos, Diana (ed.). Avaliação conjunta: um novo paradigma no processamento computacional da língua portuguesa, IST Press, 2007.

Santos, Diana & Nuno Cardoso (eds.). Reconhecimento de entidades mencionadas em português: Documentação e actas do HAREM, a primeira avaliação conjunta na área. 2007.

Santos, Diana. Translation-based corpus studies: Contrasting Portuguese and English tense and aspect systems. Amsterdam/New York, NY: Rodopi, 2004.

Articles (selection)

Santos, Diana. "Corpora at Linguateca: Vision and roads taken", in Tony Berber Sardinha & Telma de Lurdes São Bento Ferreira (eds.), Working with Portuguese Corpora, Bloomsbury, 2014, pp. 219-236.

Santos, Diana. "Translation", in Robert Binnick (ed.), The Oxford Handbook of Tense and Aspect, Oxford University Press, 2012, pp. 335-369.

Santos, Diana. "Caminhos percorridos no mapa da portuguesificação: A Linguateca em perspectiva". Linguamática 1, 1, Maio de 2009, pp. 25-58.

Santos, Diana & Ana Frankenberg-Garcia. "The corpus, its users and their needs: a user-oriented evaluation of COMPARA", International Journal of Corpus Linguistics 12.3 (2007), pp. 335-374.

Santos, Diana & Luís Costa. "QolA: fostering collaboration within QA". In Carol Peters, Paul Clough, Fredric C. Gey, Jussi Karlgren, Bernardo Magnini, Douglas W. Oard, Maarten de Rijke & Maximilian Stempfhuber (eds.), Evaluation of Multilingual and Multi-modal Information Retrieval · 7th Workshop of the Cross-Language Evaluation Forum, CLEF 2006, Alicante, Spain, September 20-22, 2006, Revised Selected Papers . Berlin / Heidelberg: Springer, Lecture Notes in Computer Science Vol. 4730, 2007, pp. 569-578.

Santos, Diana. "DISPARA, a system for distributing parallel corpora on the Web". In Elisabete Ranchhod & Nuno J. Mamede (eds.), Advances in Natural Language Processing (Third International Conference, PorTAL 2002, Faro, Portugal, June 2002, Proceedings) , LNAI 2389, Springer, 2002, pp.209-218.

Santos, Diana. "The translation network: A model for the fine-grained description of translations". In Jean Véronis (ed.), Parallel Text Processing, Dordrecht: Kluwer Academic Publishers, 2000, pp. 169-186.

Santos, Diana. "Broad-coverage machine translation", in K. Jensen, G. Heidorn & S. Richardson, Natural Language Processing: The PLNLP Approach, Kluwer Academic Press, 1993, pp. 101-18.

Textbooks

Londrim, Graciete, Diana Santos, Fabiana Michalsen & Heidi Jansen. Viva!, Fagbokforlaget, 2017.

Full publication list (note that the publications listed in the other "slots" only concern the period after my joining the university)

  • Santos, Diana & Freitas, Cláudia (2017). Áreas emergentes e ferramentas especializadas: tradução e tecnologia em revista. Tradução em Revista.  ISSN 1808-6195.  2(1), s 1- 9
  • Freitas, Cláudia; Freitas, Bianca & Santos, Diana (2016). QUEMDISSE?: Reported speech in Portuguese, In  Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016).  European Language Resources Association.  ISBN 978-2-9517408-9-1.  paper.  s 4410 - 4416
  • Santos, Diana (2016). Comparando corpos orais (transcritos) e escritos na Gramateca, I: Camilla Bardel & Anna De Meo (red.),  Parler les langues romanes/Parlare le lingue romanze/Hablar las lenguas romances/Falando línguas românicas. Atti del Convegno Internazionale GSCP 2014.  Università di Napoli L'Orientale, Il Torcoliere.  ISBN 978-88-204-5703-7.  13.  s 127 - 142
  • Santos, Diana (2016). Português internacional: alguns argumentos, I: José Teixeira (red.),  O Português como Língua num Mundo Global: problemas e potencialidades.  Centro de Estudos Lusíadas da Universidade do Minho.  ISBN 978-989-755-209-0.  Cap. 4.  s 49 - 66
  • Taveira, Paula & Santos, Diana (2016). Ensaio sobre a revisão da oralidade. Revista da Associação Portuguesa de Linguística.  ISSN 2183-9077.  2, s 403- 424 . doi: https://doi.org/10.21747/2183-9077/rapl2a18
  • Freitas, Cláudia & Santos, Diana (2015). Blogs, Amazônia e a Floresta Sintá(c)tica: um corpus de um novo gênero?, I: Ana Maria T. Ibaños; Lívia Pretto Mottin; Simone Sarmento & Tony Berber Sardinha (red.),  Pesquisas e Perspectivas em Linguística de Corpus.  Mercado de Letras.  ISBN 978-85-7591-341-3.  Kap. 4.  s 123 - 150
  • Freitas, Cláudia; Santos, Diana; Carriço, Bruno; Mota, Cristina & Jansen, Heidi (2015). O léxico do corpo e anotação de sentidos em grandes corpora: o projeto Esqueleto. Revista de Estudos da Linguagem.  ISSN 0104-0588.  23(3), s 641- 680
  • Freitas, Cláudia; Santos, Diana; Gonçalo Oliveira, Hugo & Quental, Violeta (2015). VARRA: Validação, Avaliação e Revisão de Relações semânticas no AC/DC, I: Ana Maria T. Ibaños; Lívia Pretto Mottin; Simone Sarmento & Tony Berber Sardinha (red.),  Pesquisas e Perspectivas em Linguística de Corpus.  Mercado de Letras.  ISBN 978-85-7591-341-3.  cap 6.  s 199 - 232
  • Santos, Diana (2015). Os possessivos estão-me a complicar o ensino ;-) Um estudo do dativo possessivo baseado em corpos. Linguística : Revista de Estudos Linguísticos da Universidade do Porto.  ISSN 1646-6195.  10(1), s 107- 130
  • Santos, Diana (2015). Portuguese language identity in the world: adventures and misadventures of an international language, In Elizaveta Khachaturyan (ed.),  Language-Nation-Identity: the "Questione della Lingua" in an Italian and Non-Italian Context.  Cambridge Scholars Publishing.  ISBN 978-1-4438-7206-5.  chapter 3.  s 31 - 54
  • Santos, Diana; Marques, Rui; Freitas, Cláudia; Simões, Alberto & Mota, Cristina (2015). Comparando anotações linguísticas na Gramateca: filosofia, ferramentas e exemplos. Domínios de Lingu@gem.  ISSN 1980-5799.  9(2), s 11- 26
  • Santos, Diana & Mota, Cristina (2015). A admiração à luz dos corpos. Oslo Studies in Language (OSLa).  ISSN 1890-9639.  7(1), s 57- 77
  • Santos, Diana & Simões, Alberto (2015). Ensinador paralelo: Alicerces para uma pedagogia nova. Oslo Studies in Language (OSLa).  ISSN 1890-9639.  7(1), s 235- 252
  • Simões, Alberto; Barreiro, Anabela; Santos, Diana; Sousa-Silva, Rui & Tagnin, Stella E. O. (2015). Mundos que se Cruzam. Oslo Studies in Language (OSLa).  ISSN 1890-9639.  7(1), s 1- 8
  • Ebeling, Signe Oksefjell; Grønn, Atle; Hauge, Kjetil Rå & Santos, Diana (2014). Corpus-based studies in contrastive linguistics at the University of Oslo. Oslo Studies in Language (OSLa).  ISSN 1890-9639.  6(1)
  • Santos, Diana (2014). Corpora at Linguateca: Vision and Roads Taken, In Tony Berber Sardinha & Telma de Lurdes São Bento Ferreira (ed.),  Working with Portuguese Corpora.  Bloomsbury Academic.  ISBN 978-1-4411-9050-5.  Chapter 11.  s 219 - 236
  • Santos, Diana (2014). Gramateca: corpus-based grammar of Portuguese, I: Jorge Baptista; Nuno Mamede; Sara Candeias; Ivandré Paraboni; Thiago A. S. Pardo & M. das Graças Volpe Nunes (red.),  Computational processing of Portuguese language, PROPOR2014.  Springer.  ISBN 978-3-319-09760-2.  24.  s 214 - 219
  • Santos, Diana (2014). PoNTE: apontando para corpos de aprendizes de tradução avançados. Linguamática.  ISSN 1647-0818.  6(1), s 69- 86
  • Santos, Diana (2014). Podemos contar com as contas?, I: Sandra Maria Aluísio & Stella E. O. Tagnin (red.),  New Language Technologies and Linguistic Research: A Two-Way Road.  Cambridge Scholars Publishing.  ISBN 1-4438-5377-1.  Chapter Eleven.  s 194 - 213
  • Santos, Diana (2014). Ser, estar, ficar, haver e ter contra ha, bli e være: quem disse que era fácil traduzir sentimentos e sensações?. Oslo Studies in Language (OSLa).  ISSN 1890-9639.  6(1), s 271- 288
  • Costa, Luís; Mota, Cristina & Santos, Diana (2012). SIGA, a System to Manage Information Retrieval Evaluations, In Helena Caseli; Aline Villavicêncio; António Teixeira & Fernando Perdigão (ed.),  Computational Processing of the Portuguese Language, PROPOR'2012.  Springer.  ISBN 978-3-642-28884-5.  chapter.  s 284 - 290
  • Freitas, Cláudia; Rocha, Paulo; Mota, Cristina; Costa, Luís & Santos, Diana (2012). O que é uma resposta? Notas de uns avaliadores estafados. Linguamática.  ISSN 1647-0818.  4(1), s 67- 75
  • Freitas, Cláudia; Santos, Diana & Silva, Rosário (2012). Corpos e cores: colorindo a descrição da língua portuguesa, I: Deise Dutra & Heliana Mello (red.),  Anais do X Encontro de Linguí­stica de Corpus: Aspetos metodológicos dos estudos de corpora.  Faculdade de Letras da UFMG.  ISBN 978-85-7758-153-5.  II - 3.  s 76 - 99
  • Gonçalo Oliveira, Hugo; Costa, Hernani & Santos, Diana (2012). Folheador: browsing through Portuguese semantic relations. Association for Computational Linguistics. European Chapter. Proceedings of the Conference..  ISSN 1525-2450.  s 35- 40
  • Maia, Belinda & Santos, Diana (2012). Who is afraid of... what? - In English and in Portuguese. Studies in Variation, Contacts and Change in English.  ISSN 1797-4453.  12
  • Mota, Cristina; Simões, Alberto; Freitas, Cláudia; Costa, Luís & Santos, Diana (2012). Págico: Evaluating Wikipedia-based information retrieval in Portuguese, In Nicoletta Calzolari; Khalid Choukri; Thierry Declerck; Mehmet Ugur Dogan; Bente Maegaard; Joseph Mariani & Jan Odijk (ed.),  Proceedings of the Eighth International Conference on Language Resources and Evaluation.  European Language Resources Association.  ISBN 978-2-9517408-7-7.  article.
  • Santos, Diana (2012). Porquê o Págico? Razões para uma avaliação conjunta. Linguamática.  ISSN 1647-0818.  4(1), s 1- 8
  • Santos, Diana (2012). The Next Step for the Translation Network, In Diana Santos; Krister Lindén & Wanjiku Ng'ang'a (ed.),  Shall We Play the Festschrift Game? Essays on the Occasion of Lauri Carlson's 60th Birthday.  Springer.  ISBN 978-3-642-30772-0.  Chapter 5.  s 35 - 52
  • Santos, Diana (2012). Translation, In Robert Binnick (ed.),  The Oxford Handbook of Tense and Aspect.  Oxford University Press.  ISBN 978-0-19-538197-9.  chaper 11.  s 335 - 369
  • Santos, Diana; Mota, Cristina; Simões, Alberto; Costa, Luís & Freitas, Cláudia (2012). Balanço do Págico e perspetivas para o futuro. Linguamática.  ISSN 1647-0818.  4(1), s 93- 99
  • Santos, Diana; Tagnin, Stella E. O. & Teixeira, Elisa Duarte (2012). CorTrad and Portuguese-English translation studies: investigating colours. Studies in Variation, Contacts and Change in English.  ISSN 1797-4453.  12
  • Teixeira, Elisa Duarte; Santos, Diana & Tagnin, Stella E. O. (2012). CorTrad: um novo corpus paralelo multiversão para o par de línguas português-inglês, I: Tania Shepherd; Tony Berber Sardinha & Marcia Veirano Pinto (red.),  Caminhos na Linguística de Corpus.  Mercado de Letras.  ISBN 978-85-7591-158-7.  cap. 7.  s 151 - 176
  • Santos, Diana Sousa Marques (2011). Linguateca's infrastructure for Portuguese and how it allows the detailed study of language varieties. Oslo Studies in Language (OSLa).  ISSN 1890-9639.  3(2), s 113- 128
  • Santos, Diana & Ribeiro, Fernando (2011). Uma incursão pelo universo das publicações em Portugal. Linguamática.  ISSN 1647-0818.  3(2), s 85- 98
  • Santos, Diana; Silva, Rosário & Freitas, Cláudia (2011). Pluralidades na cor: contrastando a língua do Brasil e de Portugal, I: Augusto Soares da Silva; Amadeu Torres & Miguel Gonçalves (red.),  Línguas Pluricêntricas: Variação Linguística e Dimensões Sociocognitivas / Pluricentric Languages: Linguistic Variation and Sociocognitive Dimensions.  Aletheia, Publicações da Faculdade de Filosofia da Universi dade Católica Portuguesa.  ISBN 978-972-697-201-3.  20.  s 555 - 572
  • Simões, Alberto & Santos, Diana (2011). Ensinador: corpus-based Portuguese grammar exercises. Revista de Procesamiento de Lenguaje Natural (SEPLN).  ISSN 1135-5948.  47, s 301- 309
  • Santos, Diana & Cabral, Luis Miguel (2010). GikiCLEF: Expectations and Lessons Learned. Lecture Notes in Computer Science.  ISSN 0302-9743.  6241, s 212- 222

View all works in Cristin

  • Santos, Diana; Michalsen, Fabiana; Jansen, Heidi & Sousa Cruz Londrim, Graciete (2017). Viva!. Fagbokforlaget.  ISBN 978-82-11-02236-3.  241 s.
  • Santos, Diana (2015). Portugisisk i verden. Fremmedspråksenteret.  ISBN 978-82-8195-068-9.  30 s.
  • Santos, Diana; Lindén, Krister & Ng'ang'a, Wanjiku (ed.) (2012). Shall We Play the Festschrift Game? Essays on the Occasion of Lauri Carlson's 60th Birthday. Springer.  ISBN 978-3-642-30772-0.  241 s.

View all works in Cristin

  • Ferreira, Ana Rita & Santos, Diana (2017). Norway seen from a Portuguese vantage point -- there and here.
  • Santos, Diana (2017). Dette må du vite om portugisisk historie!.
  • Santos, Diana (2017). PANTERA: a parallel corpus to study translation between Portuguese and Norwegian.
  • Santos, Diana (2017). Tanta Gente, Mariana!: Maria Judite de Carvalho para principiantes.
  • Santos, Diana (2016). Føler man annerledes når man har et annet morsmål? Følelser og språk.
  • Santos, Diana (2016). Research on emotions in translation: an appetizer.
  • Santos, Diana (2016). What is (an) emotion? My answer at the third meeting of Travelling Emotions.
  • Santos, Diana & Maia, Belinda (2016). Emotions in language: Linguistic and computational approaches.
  • Santos, Diana (2015). Ensinar português com a internete como amiga: desafios e experiências com o Ensinador, o PoNTE e o PANTERA.
  • Santos, Diana (2015). Språkdidaktikk i skole, med vekt på portugisisk.
  • Santos, Diana (2015). Um novo corpo e seus desafios.
  • Taveira, Paula & Santos, Diana (2015). Ensaio sobre a revisão da oralidade.
  • Santos, Diana (2014). Como estudar variantes do português e, ao mesmo tempo, construir um português internacional?.
  • Santos, Diana (2014). Comparing oral (transcribed) and written corpora in Portuguese.
  • Santos, Diana (2014). Det spennende med portugisisk: Kultur, historie, litteratur og språk i portugisisktalende verden.
  • Santos, Diana (2014). First steps of Gramateca: a corpus-based grammar initiative for Portuguese, driven by Linguateca.
  • Santos, Diana (2014). Kulturforskjeller og hvordan de vises i språk: noen åpenbare og ikke så åpenbare konsekvenser av å snakke et annet språk.
  • Santos, Diana & Jansen, Heidi (2014). Esqueleto, PoNTE, PANTERA & Gramateca.
  • Santos, Diana (2013). Para que serve um corpo: O que é, o que significa a sua anotação, exemplos de uso.
  • Santos, Diana (2013). Ser, estar, ficar, haver and ter against ha, bli and være: who said it was easy to describe feelings and sensations?.
  • Santos, Diana (2013). Some methods that can be used with corpora.
  • Gonçalo Oliveira, Hugo; Costa, Hernani & Santos, Diana (2012). Browsing Portuguese with Folheador.
  • Santos, Diana (2012). Introdução ao R e algumas aplicações para linguística com corpos.
  • Santos, Diana (2012). Os possessivos estão-me a complicar o ensino :-).
  • Santos, Diana (2012). Temos de contar com as contas? Argumentos a favor e contra o uso de métodos quantitativos na linguística.
  • Santos, Diana; Lindén, Krister & Ng'ang'a, Wanjiku (2012). Playing the Festschrift Game, In Diana Santos; Krister Lindén & Wanjiku Ng'ang'a (ed.),  Shall We Play the Festschrift Game? Essays on the Occasion of Lauri Carlson's 60th Birthday.  Springer.  ISBN 978-3-642-30772-0.  Introduction.  s v - viii
  • Freitas, Cláudia; Santos, Diana & Silva, Rosário (2011). Corpos e cores: colorindo a descrição da língua portuguesa.
  • Maia, Belinda & Santos, Diana (2011). Who is afraid of... what?: Fear in English and Portuguese.
  • Santos, Diana (2011). Translation and categorization.
  • Santos, Diana Sousa Marques & Ribeiro, Fernando (2011). Estudando os nomes dos autores no RCAAP: relatório do primeiro ano.
  • Santos, Diana; Tagnin, Stella E. O. & Teixeira, Elisa Duarte (2011). CorTrad search features and translation studies: a pilot study on colours, clothing and food domains.

View all works in Cristin

Published Jan. 26, 2011 10:16 AM - Last modified Aug. 21, 2017 10:56 AM