Elektronický paralelní česko-německý korpus

Kód projektu
ROZV/58/2003
Období řešení
1/2003 - 12/2003
Investor / Programový rámec / typ projektu
Ministerstvo školství, mládeže a tělovýchovy ČR
Fakulta / Pracoviště MU
Pedagogická fakulta
Další fakulta/pracoviště MU
Fakulta informatiky

Č. projektu z r. 2001: I/43/2001
Č. projektu z r. 2002: 31/2002
Cílem projektu v roce 2003 je rozšířit korpus na min. 3 miliony slov v české části; zpřesnt zarovnání celého korpusu na co nejmenší jednotku (ideálně na větu); zpřesnit tagování české části automatickou desambiguací, případně vyvinout dokonalejší anotační software; vyvažovat proporce korpusu zařazováním většího množství odborných a publicistických textů; vyvážit poměr českých a německých originálních textů na 1:1; informovat odbornou veřejnost o vzniku korpusu; zajistit další zdroje paralelních textů; zaškolit další studenty pro práci s texty.

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.