Digitala Vetenskapliga Arkivet

Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Alignment-based profiling of Europarl data in an English-Swedish parallel corpus
Linköpings universitet, Institutionen för datavetenskap, NLPLAB - Laboratoriet för databehandling av naturligt språk. Linköpings universitet, Tekniska högskolan. (HCS)
2010 (Engelska)Ingår i: Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10) / [ed] Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis and Mike Rosner and Daniel Tapias, Paris, France: European Language Resources Association (ELRA) , 2010, s. 3398-3404Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

This paper profiles the Europarl part of an English-Swedish parallel corpus and compares it with three other subcorpora of the sameparallel corpus. We first describe our method for comparison which is based on alignments, both at the token level and the structurallevel. Although two of the other subcorpora contains fiction, it is found that the Europarl part is the one having the highest proportion ofmany types of restructurings, including additions, deletions and long distance reorderings. We explain this by the fact that the majorityof Europarl segments are parallel translations.

Ort, förlag, år, upplaga, sidor
Paris, France: European Language Resources Association (ELRA) , 2010. s. 3398-3404
Nyckelord [en]
parallel corpora, profiling, translation, English, Swedish
Nationell ämneskategori
Språkteknologi (språkvetenskaplig databehandling)
Identifikatorer
URN: urn:nbn:se:liu:diva-60039ISI: 000356879508030ISBN: 2-9517408-6-7 (tryckt)OAI: oai:DiVA.org:liu-60039DiVA, id: diva2:354794
Konferens
7th International Conference on Language Resources and Evaluation (LREC)
Tillgänglig från: 2010-10-05 Skapad: 2010-10-04 Senast uppdaterad: 2018-01-12Bibliografiskt granskad

Open Access i DiVA

fulltext(418 kB)462 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 418 kBChecksumma SHA-512
7c9d6708234586911bebce1d9a45ab34cb16998499791977f1ab10957488d3bcf4141054db87e45e00844232ad3e22eed5496fd7e359e726d3fe48c5ef0100b5
Typ fulltextMimetyp application/pdf

Övriga länkar

Link to conference

Sök vidare i DiVA

Av författaren/redaktören
Ahrenberg, Lars
Av organisationen
NLPLAB - Laboratoriet för databehandling av naturligt språkTekniska högskolan
Språkteknologi (språkvetenskaplig databehandling)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 463 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

isbn
urn-nbn

Altmetricpoäng

isbn
urn-nbn
Totalt: 652 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf