<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=windows-1250">
<style type="text/css" style="display:none;"><!-- P {margin-top:0;margin-bottom:0;} --></style>
</head>
<body dir="ltr">
<div id="divtagdefaultwrapper" style="font-size: 12pt; color: rgb(0, 0, 0); font-family: Calibri, Helvetica, sans-serif, EmojiFont, "Apple Color Emoji", "Segoe UI Emoji", NotoColorEmoji, "Segoe UI Symbol", "Android Emoji", EmojiSymbols;" dir="ltr">
<p>Dear Pavel,</p>
<p><br>
</p>
<p>sorry for the late reply. </p>
<p><br>
</p>
<p>Darja and I suggest that the lines aren't duplicated, but that a note is added to the funcitonalities category specifying which entities are recognized by each model.</p>
<p><br>
</p>
<p>You say that there are no training data for English, but could you nevertheless tell me which categories are recognized in English? I've added a note to the relevant cell in the spreadsheet if you want to input this directly.</p>
<p><br>
</p>
<p>Best,<br>
Jakob</p>
<p><br>
</p>
<div id="Signature">
<div name="divtagdefaultwrapper" style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:; margin:0">
<table cellspacing="2" cellpadding="2" border="0" style="font-family:"Times New Roman"; font-size:11pt; color:black">
<tbody>
<tr>
<td valign="top" height="20" align="center" style="font-family:Garamond,Garamond,"Adobe Garamond Pro",Garamond,"Times New Roman",Times,serif; font-size:16px; padding-right:15px">
Univerza<i> v Ljubljani</i><br class="">
Filozofska<i> fakulteta</i></td>
<td valign="top" rowspan="2" style="border-left:1px solid rgb(223,224,224); padding-left:15px; font-family:"Adobe Garamond Pro",Garamond,"Times New Roman",Times,serif">
<span style="font-size:16px">asist. <span style="color:rgb(223,49,39)">Jakob Lenardič</span> </span><br class="">
<i></i><br class="">
<br class="">
<i>Oddelek za prevajalstvo</i><span class="sep"> / </span><span style="color:rgb(109,110,113)"><i>Department of translation</i></span><br class="">
<br class="">
Filozofska<i> fakulteta</i> / <span style="color:rgb(109,110,113)">Faculty <i>of arts</i></span><br class="">
<br class="">
Aškerčeva cesta 2, SI-1000 Ljubljana, Slovenija / <span style="color:rgb(109,110,113)">Slovenia</span><br class="">
T.: 241-1143<br class="">
<a href="mailto:Jakob.Lenardic@ff.uni-lj.si" style="color:rgb(223,49,39)" id="LPNoLP">Jakob.Lenardic@ff.uni-lj.si</a><span class="sep">, </span><a href="http://www.ff.uni-lj.si/" style="color:rgb(223,49,39)" id="LPNoLP">www.ff.uni-lj.si</a></td>
</tr>
<tr>
<td valign="top" align="center" style="padding-right:20px; padding-top:20px"><a href="http://www.uni-lj.si/" id="LPNoLP"><img width="43" height="85" border="0" title="Univerza v Ljubljani" alt="Univerza v Ljubljani" style="user-select: none;" src="https://www.uni-lj.si/images/logo_UL.gif"></a></td>
</tr>
</tbody>
</table>
</div>
</div>
<br>
<br>
<div style="color: rgb(0, 0, 0);">
<hr tabindex="-1" style="display:inline-block; width:98%">
<div id="divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" color="#000000" style="font-size:11pt"><b>From:</b> Pavel Stranak <stranak@ufal.mff.cuni.cz><br>
<b>Sent:</b> Friday, November 8, 2019 1:18 PM<br>
<b>To:</b> Fišer, Darja<br>
<b>Cc:</b> userinvolvement@lists.clarin.eu; Lenardič, Jakob<br>
<b>Subject:</b> Re: [Userinvolvement] CLARIN Tool Families: Overview of Named Entity Recognizers in the CLARIN infrastructure</font>
<div> </div>
</div>
<div>Hi Darja and all,
<div class=""><br class="">
</div>
<div class="">I have made a quick check of our NameTag information and I see 2 issues:</div>
<div class="">- We provide models for Czech and English, both are available online. So I added English into your list.</div>
<div class="">- the "NER categories" column. The issue is that at least for our system the recognised entities (types and sub-types) are a feature of the model (and in the end the training corpus), not the tool. It is specified in detail in the NameTag documentation
 that you link to, but shortly, for instance this is the schema of entities recognised by models '<span class="" style="color:rgb(199,37,78); font-family:Menlo,Monaco,Consolas,"Courier New",monospace; font-size:12.600000381469727px; font-weight:bold; background-color:rgb(249,242,244)">czech-cnec2.0-<version></span>':
<a href="http://ufal.mff.cuni.cz/~strakova/cnec2.0/ne-type-hierarchy.pdf" class="">
http://ufal.mff.cuni.cz/~strakova/cnec2.0/ne-type-hierarchy.pdf</a>. For the English models the schema is very different, because there is no training dataset with this detailed classification of entities.</div>
<div class=""><br class="">
</div>
<div class="">So whould we duplicate lines for the tool for each model? I don't see another way to fill it in. The categories must be per model, at least for NameTag. </div>
<div class=""><br class="">
</div>
<div class="">Best,</div>
<div class="">Pavel</div>
<div class=""><br class="">
</div>
<div class=""><br class="">
</div>
<div class=""><br class="">
</div>
<div class="">
<div><br class="">
<blockquote type="cite" class="">
<div class="">On 7 Nov 2019, at 17:31, Fišer, Darja <<a href="mailto:Darja.Fiser@ff.uni-lj.si" class="">Darja.Fiser@ff.uni-lj.si</a>> wrote:</div>
<br class="Apple-interchange-newline">
<div class="">
<div class="" style="word-wrap:break-word; line-break:after-white-space">
<div dir="ltr" class="" style="font-size:12pt">
<div class="" style="margin-top:0px; margin-bottom:0px"><span class="" style="font-size:12pt">Dear all,</span></div>
</div>
<div dir="ltr" class="" style="font-size:12pt">
<div class="" style="margin-top:0px; margin-bottom:0px"><span lang="EN-GB" class=""><br class="">
</span></div>
<div class="" style="margin-top:0px; margin-bottom:0px"><span lang="EN-GB" class="">Jakob and I have started the second tool survey with which we will expand the CLARIN Resource Families initiative. It is for tools for Named Entity Recognition that are provided
 by national CLARIN consortia. Please find the spreadsheet where we’re collecting the data below:</span></div>
<div class="" style="margin-top:0px; margin-bottom:0px"><span lang="EN-GB" class=""><br class="">
</span></div>
</div>
<div dir="ltr" class="" style="font-size:12pt">
<div class="" style="margin-top:0px; margin-bottom:0px"><span lang="EN-GB" class=""><a href="https://docs.google.com/spreadsheets/d/1W7Yv-HMUt0LGsK19btJ_wMK-fmtXWTt0jmSq7OKnrcc/edit?usp=sharing" id="LPlnk579662" class="" previewremoved="true">https://docs.google.com/spreadsheets/d/1W7Yv-HMUt0LGsK19btJ_wMK-fmtXWTt0jmSq7OKnrcc/edit?usp=sharing</a></span></div>
<div class="" style="margin-top:0px; margin-bottom:0px"><br class="">
</div>
</div>
<div dir="ltr" class="" style="font-size:12pt">
<div class="" style="margin-top:0px; margin-bottom:0px"><span lang="EN-GB" class="">We have already provided input for three tools (<i class="">NameTag</i> by LINDAT, <i class="">janes-ner </i>by CLARIN.SI, and <i class="">PolDeepNer </i>by CLARIN-PL) to show
 what kind of information we are looking for with this survey, so please use these entries as a template </span><span class="" style="font-size:12pt">for providing information on NER tools for your consortium</span><span class="" style="font-size:12pt">. In
 contrast to previous surveys of resources, we did not search the tools for all CLARIN countries by ourselves since tools are at the moment generally less likely discoverable through CLARIN repositories. We are kindly requesting your input by</span><span class="" style="font-size:12pt"> </span><b class="" style="font-size:12pt">28
 November</b><span class="" style="font-size:12pt">.</span></div>
<div class="" style="margin-top:0px; margin-bottom:0px"><span lang="EN-GB" class=""><br class="">
</span></div>
</div>
<div dir="ltr" class="" style="font-size:12pt">
<div class="" style="margin-top:0px; margin-bottom:0px"><span lang="EN-GB" class="">Best,</span></div>
</div>
<div dir="ltr" class="" style="font-size:12pt">
<div class="" style="margin-top:0px; margin-bottom:0px"><span lang="EN-GB" class="">Darja and Jakob</span></div>
<div class="" style="margin-top:0px; margin-bottom:0px"><span lang="EN-GB" class=""><br class="">
</span></div>
</div>
<div class="">
<div class="" style="font-family:Helvetica; font-size:12px; font-style:normal; font-weight:normal; letter-spacing:normal; text-align:start; text-indent:0px; text-transform:none; white-space:normal; word-spacing:0px; text-decoration:none">
</div>
<table cellspacing="2" cellpadding="2" border="0" class="" style="letter-spacing:normal; text-indent:0px; text-transform:none; word-spacing:0px; text-decoration:none; font-size:11pt">
<tbody class="">
<tr class="" style="font-size:14.666666984558105px; font-style:normal; font-weight:normal; letter-spacing:normal; text-align:start; text-indent:0px; text-transform:none; white-space:normal; word-spacing:0px; text-decoration:none">
<td valign="top" height="20" align="center" class="" style="font-family:Garamond,Garamond,"Adobe Garamond Pro",Garamond,"Times New Roman",Times,serif; font-size:16px; padding-right:15px">
Univerza<i class=""> v Ljubljani</i><br class="">
Filozofska<i class=""> fakulteta</i></td>
<td valign="top" rowspan="2" class="" style="border-left-color:rgb(223,224,224); border-left-style:solid; border-left-width:1px; padding-left:15px; font-family:"Adobe Garamond Pro",Garamond,"Times New Roman",Times,serif">
<span class="" style="font-size:16px">Assoc. Prof. dr. <span class="" style="color:rgb(223,49,39)">Darja Fišer</span> </span><br class="">
<i class=""></i><br class="">
<br class="">
<i class="">Oddelek za prevajalstvo</i><span class="sep"> / </span><span class="" style="color:rgb(109,110,113)"><i class="">Department of translation</i></span><br class="">
<br class="">
Filozofska<i class=""> fakulteta</i> / <span class="" style="color:rgb(109,110,113)">Faculty <i class="">of arts</i></span><br class="">
<br class="">
Aškerčeva cesta 2, SI-1000 Ljubljana, Slovenija / <span class="" style="color:rgb(109,110,113)">Slovenia</span><br class="">
<br class="">
<a href="mailto:darja.fiser@ff.uni-lj.si" class="" style="color:rgb(223,49,39)">darja.fiser@ff.uni-lj.si</a><span class="sep">, </span><a href="http://www.ff.uni-lj.si/" class="" style="color:rgb(223,49,39)">www.ff.uni-lj.si</a></td>
</tr>
<tr class="" style="font-size:14.666666984558105px; font-style:normal; font-weight:normal; letter-spacing:normal; text-align:start; text-indent:0px; text-transform:none; white-space:normal; word-spacing:0px; text-decoration:none">
<td valign="top" align="center" class="" style="padding-right:20px; padding-top:20px">
<a href="http://www.uni-lj.si/" class=""><br class="Apple-interchange-newline">
<span class=""></span></a></td>
</tr>
</tbody>
</table>
<span class=""><span id="cid:3E2D45B8-8A16-4FEF-88B1-495AB2C90733@ff.uni-lj.si"><logo_100.png></span></span>
<div class="" style="font-style:normal; font-weight:normal; letter-spacing:normal; text-indent:0px; text-transform:none; white-space:normal; word-spacing:0px; text-decoration:none; font-family:Helvetica; font-size:12px; text-align:start">
<br class="Apple-interchange-newline">
<br class="">
</div>
<br class="Apple-interchange-newline" style="color:rgb(65,156,255); font-size:14.666666984558105px; font-style:normal; font-weight:normal; letter-spacing:normal; orphans:auto; text-indent:0px; text-transform:none; white-space:normal; widows:auto; word-spacing:0px; text-decoration:underline">
</div>
<br class="">
</div>
_______________________________________________<br class="">
Userinvolvement mailing list<br class="">
<a href="mailto:Userinvolvement@lists.clarin.eu" class="">Userinvolvement@lists.clarin.eu</a><br class="">
https://lists.clarin.eu/cgi-bin/mailman/listinfo/userinvolvement<br class="">
</div>
</blockquote>
</div>
<br class="">
</div>
</div>
</div>
</div>
</body>
</html>