<html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"></head><body><div>And if you are following BCP 47, you need to use the IANA Language Subtag Registry as the source of language subtags, and not worry about ISO 639-1 and 639-3 and the rest.</div><div><br></div><div id="composer_signature"><meta http-equiv="Content-Type" content="text/html; charset=UTF-8">--<div>Doug Ewell | Thornton, CO, US | ewellic.org</div></div><div><br></div><div style="font-size:100%;color:#000000"><!-- originalMessage --><div>-------- Original message --------</div><div>From: Misha.Wolf@thomsonreuters.com </div><div>Date: 12/20/16  10:34  (GMT-07:00) </div><div>To: chiarcos@informatik.uni-frankfurt.de, mvalle@cscs.ch </div><div>Cc: ietf-languages@iana.org, semantic-web@w3.org, christian.chiarcos@web.de </div><div>Subject: RE: Clarification about language tag </div><div><br></div></div>+ ietf-languages@iana.org<br><br>Whether you work with modern-day languages or any other languages, you <br>must follow BCP47.<br><br>And, in following BCP-47, you must be prepared to use whatever language <br>tag length is required, not assume that all language tags will have the <br>same length.<br><br>Consider, for example, these longer language tags:<br>-  sr-Cyrl = Serbian (Cyrillic)<br>-  sr-Latn = Serbian (Latin)<br>-  uz-Cyrl = Uzbek (Cyrillic)<br>-  uz-Latn = Uzbek (Latin)<br><br>Regards,<br>Misha<br><br><br>-----Original Message-----<br>From: Christian Chiarcos [mailto:chiarcos@informatik.uni-frankfurt.de] <br>Sent: 20 December 2016 17:19<br>To: semantic-web@w3.org Web; Mario Valle<br>Cc: christian.chiarcos@web.de<br>Subject: Re: Clarification about language tag<br><br>Dear Mario,<br><br>> In Turtle syntax the @lang tag syntax refers to BCP47 that states:<br>><br>> language      = 2*3ALPHA            ; shortest ISO 639 code<br>><br>> That is, the language code (I ignore all the variants here) should be 2  <br>> or 3 characters.<br><br>This means you should use the two-letter code for a language that has one  <br>(@en) even if it does have a three-letter code (@eng). Not every language  <br>does have a two-letter code.<br><br>> Indeed ISO 639 (https://urldefense.proofpoint.com/v2/url?u=http-3A__www.loc.gov_standards_iso639-2D2_php_code-5Flist.php&d=CwIFbA&c=4ZIZThykDLcoWk-GVjSLm9hvvvzvGv0FLoWSRuCSs5Q&r=VsO6ShdzLK20Tv5zCK2CUVP_oB340q3grZz3gJtouLE&m=SnuMGpH9aJBpJG4G8i3x6v1GSkDNibOUkGqj0zyTv_o&s=TEzQYtkmHF-FAqtk-AbmPZIVKuLy0UGpXXfHOfCIwQ0&e= )  <br>> lists both 2 and 3 chars codes (e.g., English: 'en' and 'eng').<br>><br>> But in all Turtle examples I have found the language code has 2 chars.  <br>> Is it a requirement or is simply a tradition? This means, could I write  <br>> "Pancake"@eng?<br>><br>> The question arises because WordNet contains 3 chars codes, so to  <br>> transform into triples, should/shouldn't I convert it to 2 characters?<br><br>The reason is that the 2-character codes are insufficient from the  <br>perspective of multilingual NLP or linguistics where ISO 639-3 is much  <br>more established (and somewhat better defined) than ISO 639-1 2-letter  <br>codes. Therefore, people developing language resources (like WordNet)  <br>sometimes tend to neglect ISO 639-1 codes altogether. I also went that way  <br>at times. In terms of BCP47, however, this is a mistake and should be  <br>fixed. As long as you work with modern-day major languages only and you  <br>don't see issues with the 2-letter codes for your task/resource, you  <br>should definitely follow BCP47 and use 2-letter codes wherever possible.<br><br>Best,<br>Christian<br><br>><br>> Thanks for your patience<br>><br>>                           mario<br>><br><br><br>-- <br>Prof. Dr. Christian Chiarcos<br>Applied Computational Linguistics<br>Johann Wolfgang Goethe Universität Frankfurt a. M.<br>60054 Frankfurt am Main, Germany<br><br>office: Robert-Mayer-Str. 10, #401b<br>mail: chiarcos@informatik.uni-frankfurt.de<br>web: https://urldefense.proofpoint.com/v2/url?u=http-3A__acoli.cs.uni-2Dfrankfurt.de&d=CwIFbA&c=4ZIZThykDLcoWk-GVjSLm9hvvvzvGv0FLoWSRuCSs5Q&r=VsO6ShdzLK20Tv5zCK2CUVP_oB340q3grZz3gJtouLE&m=SnuMGpH9aJBpJG4G8i3x6v1GSkDNibOUkGqj0zyTv_o&s=SYYlim1HJWSJMzRcHsHxPJTJurnKt2vFAm48s952MLA&e= <br>tel: +49-(0)69-798-22463<br>fax: +49-(0)69-798-28931<br><br>_______________________________________________<br>Ietf-languages mailing list<br>Ietf-languages@alvestrand.no<br>http://www.alvestrand.no/mailman/listinfo/ietf-languages<br></body></html>