<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">Hi,<div class=""><br class=""></div><div class="">Almost no treebanks are fully manually annotated, but a lot of treebanks are semi-manually annotated. Machine parses are often corrected as needed by annotators. In other cases machine parses are manually disambiguated. I am going to assume that those semi-manually constructed treebanks, which are indeed mentioned as training corpora, are also of interest for the current survey.</div><div class=""><br class=""></div><div class="">Best,</div><div class="">Koenraad<br class=""><div><br class=""><blockquote type="cite" class=""><div class="">On 4 Dec 2018, at 10:59, Pavel Stranak <<a href="mailto:stranak@ufal.mff.cuni.cz" class="">stranak@ufal.mff.cuni.cz</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><meta http-equiv="Content-Type" content="text/html; charset=utf-8" class=""><div style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">Hi Jakob,<div class=""><br class=""></div><div class="">I am not sure I understand "training corpus" concept, but if you mean any manually annotated resource (which by definition can be used for supervised training), than the list is missing at the very least all the treebanks.</div><div class=""><br class=""></div><div class="">-Pavel</div><div class=""><br class=""></div><div class=""><br class=""><div class=""><br class=""><blockquote type="cite" class=""><div class="">On 3 Dec 2018, at 19:06, Lenardič, Jakob <<a href="mailto:Jakob.Lenardic@ff.uni-lj.si" class="">Jakob.Lenardic@ff.uni-lj.si</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><div id="divtagdefaultwrapper" dir="ltr" style="caret-color: rgb(0, 0, 0); font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; font-size: 12pt; font-family: Calibri, Helvetica, sans-serif;" class=""><p style="margin-top: 0px; margin-bottom: 0px;" class=""></p><div style="margin-top: 0px; margin-bottom: 0.0001pt; line-height: normal;" class=""><span style="font-size: 9.5pt; font-family: Arial, sans-serif; color: rgb(34, 34, 34); background-color: white; background-position: initial initial; background-repeat: initial initial;" class="">Dear all,</span><span style="font-size: 12pt; font-family: Arial, sans-serif; color: rgb(34, 34, 34);" class=""><br class=""></span><span style="font-size: 9.5pt; font-family: Arial, sans-serif; color: rgb(34, 34, 34); background-color: white; background-position: initial initial; background-repeat: initial initial;" class=""><br class=""></span><span style="font-size: 12pt; font-family: "Times New Roman", serif;" class=""><o:p class=""></o:p></span></div><div style="margin-top: 0px; margin-bottom: 0.0001pt; line-height: normal; background-color: white;" class=""><span style="font-size: 9.5pt; font-family: Arial, sans-serif; color: rgb(34, 34, 34);" class="">as part of the CLARIN Resource Families initiative, we are conducting a survey of<span class="Apple-converted-space"> </span><b class="">manually-annotated training</b><span class="Apple-converted-space"> </span>corpora. We have prepared the preliminary results based on the VLO and the national CLARIN repositories:</span><span style="font-size: 12pt; font-family: Arial, sans-serif; color: rgb(34, 34, 34);" class=""><br class=""></span><span style="font-size: 9.5pt; font-family: Arial, sans-serif; color: rgb(34, 34, 34);" class=""><br class=""></span><u class=""><span style="font-size: 9.5pt; font-family: Arial, sans-serif; color: rgb(0, 105, 217);" class=""><a href="https://docs.google.com/spreadsheets/d/1A12KnLUboHu-SPRY5HfvpkuV6clhN_HFmp7IU_jqC9I/edit?usp=sharing" class="">https://docs.google.com/spreadsheets/d/1A12KnLUboHu-SPRY5HfvpkuV6clhN_HFmp7IU_jqC9I/edit?usp=sharing</a></span></u><span style="font-size: 12pt; font-family: Arial, sans-serif; color: rgb(34, 34, 34);" class=""><o:p class=""></o:p></span></div><div style="margin-top: 0px; margin-bottom: 0.0001pt; line-height: normal; background-color: white;" class=""><span style="font-size: 12pt; font-family: Arial, sans-serif; color: rgb(34, 34, 34);" class=""><o:p class=""> </o:p></span></div><div style="margin-top: 0px; margin-bottom: 0.0001pt; line-height: normal; background-color: white;" class=""><span style="font-size: 9.5pt; font-family: Arial, sans-serif; color: rgb(34, 34, 34); background-color: white; background-position: initial initial; background-repeat: initial initial;" class="">We would appreciate it if you could add any resources and info that we have missed and correct any mistakes we have made. Note that we are looking for corpora that have been designed specifically for training language tools, such as PoS-taggers, Named-Entity recognizers, dependency parsers, etc. Comments and suggestions by email are welcome too. We are collecting feedback by December 20 after which we will prepare the report.</span><span style="font-size: 12pt; font-family: Arial, sans-serif; color: rgb(34, 34, 34);" class=""><o:p class=""></o:p></span></div><div style="margin-top: 0px; margin-bottom: 0px;" class=""><o:p class=""> </o:p></div><div style="margin-top: 0px; margin-bottom: 0px;" class="">Best,<br class="">Jakob<o:p class=""></o:p></div><br class=""><p style="margin-top: 0px; margin-bottom: 0px;" class=""></p><div style="margin-top: 0px; margin-bottom: 0px;" class=""><br class=""></div><div id="Signature" class=""><div name="divtagdefaultwrapper" style="font-family: Calibri, Arial, Helvetica, sans-serif; margin: 0px;" class=""><table cellspacing="2" cellpadding="2" border="0" style="font-family: "Times New Roman"; font-size: 11pt;" class=""><tbody class=""><tr class=""><td valign="top" height="20" align="center" style="font-family: Garamond, Garamond, "Adobe Garamond Pro", Garamond, "Times New Roman", Times, serif; font-size: 16px; padding-right: 15px;" class="">Univerza<i class=""> v Ljubljani</i><br class="">Filozofska<i class=""> fakulteta</i></td><td valign="top" rowspan="2" style="border-left-width: 1px; border-left-style: solid; border-left-color: rgb(223, 224, 224); padding-left: 15px; font-family: "Adobe Garamond Pro", Garamond, "Times New Roman", Times, serif;" class=""><span style="font-size: 16px;" class="">asist. <span style="color: rgb(223, 49, 39);" class="">Jakob Lenardič</span> </span><br class=""><i class=""></i><br class=""><br class=""><i class="">Oddelek za prevajalstvo</i><span class="sep"> / </span><span style="color: rgb(109, 110, 113);" class=""><i class="">Department of translation</i></span><br class=""><br class="">Filozofska<i class=""> fakulteta</i> / <span style="color: rgb(109, 110, 113);" class="">Faculty <i class="">of arts</i></span><br class=""><br class="">Aškerčeva cesta 2, SI-1000 Ljubljana, Slovenija / <span style="color: rgb(109, 110, 113);" class="">Slovenia</span><br class="">T.: <a href="tel:241-1143" class="">241-1143</a><br class=""><a href="mailto:Jakob.Lenardic@ff.uni-lj.si" id="LPNoLP" style="color: rgb(223, 49, 39);" class="">Jakob.Lenardic@ff.uni-lj.si</a><span class="sep">, </span><a href="http://www.ff.uni-lj.si/" id="LPNoLP" style="color: rgb(223, 49, 39);" class="">www.ff.uni-lj.si</a></td></tr><tr class=""><td valign="top" align="center" style="padding-right: 20px; padding-top: 20px;" class=""><a href="http://www.uni-lj.si/" id="LPNoLP" class=""><img width="43" height="85" border="0" title="Univerza v Ljubljani" alt="Univerza v Ljubljani" src="https://www.uni-lj.si/images/logo_UL.gif" class=""></a></td></tr></tbody></table></div></div></div><span style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">_______________________________________________</span><br style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class=""><span style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">Userinvolvement mailing list</span><br style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class=""><a href="mailto:Userinvolvement@lists.clarin.eu" style="font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" class="">Userinvolvement@lists.clarin.eu</a><br style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class=""><a href="https://lists.clarin.eu/cgi-bin/mailman/listinfo/userinvolvement" style="font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" class="">https://lists.clarin.eu/cgi-bin/mailman/listinfo/userinvolvement</a></div></blockquote></div><br class=""></div></div>_______________________________________________<br class="">Userinvolvement mailing list<br class=""><a href="mailto:Userinvolvement@lists.clarin.eu" class="">Userinvolvement@lists.clarin.eu</a><br class="">https://lists.clarin.eu/cgi-bin/mailman/listinfo/userinvolvement<br class=""></div></blockquote></div><br class=""></div></body></html>