<font face="times new roman,serif">That is not the interpretation used by CLDR; it is not just a 'best effort'.</font><div><font face="times new roman,serif"><br></font></div><div><font face="times new roman,serif">This goes back to the origin of the macrolanguage model, which tries to deal with language "splitting", where it has become clear that two or more different languages are being represented in practice by the same code. There are basically two different models for handling this:</font></div>
<div><ul><li><font face="times new roman, serif"><b>The German model. </b>Up until 2006, Swiss German was tagged with "de" (German). After 'gsw' was encoded specifically for it, content for Swiss German would be tagged with 'gsw'. After that point, content tagged with 'de' would be presumed not to include Swiss German. </font></li>
<li><font face="times new roman, serif"><b>The Chinese model. </b>Up until 2009, Cantonese was tagged with "zh" (Chinese)*. After 'yue' was encoded specifically for it, content for Cantonese would be tagged with 'yue'. After that point, content tagged with 'zh' might or might not include Cantonese.</font></li>
</ul></div><div><font face="times new roman, serif">The German model suffers from having to migrate any important minority content that was tagged with the code. So for specialized usage (eg bibliographic) it might not be as good. But for IT usage it is much better: it maintains backward compatibility for the vast majority use of the language codes ('de', 'zh', 'ar',...).</font></div>
<div><font face="times new roman,serif"><br></font></div><div><font face="times new roman, serif">Thus CLDR uses the German model for all languages. For example, content tagged with 'zh' is presumed not to include Cantonese; in other words, 'zh' equals 'cmn' when using CLDR. To do that, it replaces each principal encompassed language ('cmn') by its corresponding macrolanguage ('zh'). One could, of course, reverse this by processing all CLDR data in a given implementation's use of it, and map 'zh' to 'cmn'.</font></div>
<div><font face="times new roman, serif"><br></font></div><div><font face="times new roman, serif">Now, that being said, if this group wants to have <span style="background-color:rgb(255,255,255);font-size:13px">Nepali and Oriya be macro languages, it is not really a problem for CLDR; simply more entries in the tables. It will cause migration hassles for other implementations that use BCP47, but that is not an issue with CLDR. The more common the language, the worse the hassles. For example, consider what would happen were ISO to decide that 'en' really was a macrolanguage with 'ens' being Standard English, and 'enz' being New Zealand English—how much software would hiccough when it hit 'enz-GB'...</span></font></div>
<div><font face="'times new roman', serif"><div style="background-color:transparent;margin-top:0px;margin-left:0px;margin-bottom:0px;margin-right:0px"><div></div></div><div style="background-color:transparent;margin-top:0px;margin-left:0px;margin-bottom:0px;margin-right:0px">
<br></div><div style="background-color:transparent;margin-top:0px;margin-left:0px;margin-bottom:0px;margin-right:0px"><a href="https://plus.google.com/114199149796022210033" target="_blank">Mark</a></div><div style="background-color:transparent;margin-top:0px;margin-left:0px;margin-bottom:0px;margin-right:0px">
<br></div><div style="background-color:transparent;margin-top:0px;margin-left:0px;margin-bottom:0px;margin-right:0px">* or the (non-canonical) language tag <span style="white-space:pre-wrap">zh-cmn introduced in 2005</span></div>
</font><font face="'times new roman', serif"><div style="background-color:transparent;margin-top:0px;margin-left:0px;margin-bottom:0px;margin-right:0px"><i><br></i></div><div style="background-color:transparent;margin-top:0px;margin-left:0px;margin-bottom:0px;margin-right:0px">
<i>— Il meglio è l’inimico del bene —</i></div></font><div><div><font face="'times new roman', serif"><i><span style="font-style:normal"><i></i></span><i></i></i></font></div></div><br>
<br><br><div class="gmail_quote">On Sun, Aug 5, 2012 at 1:15 AM, Doug Ewell <span dir="ltr"><<a href="mailto:doug@ewellic.org" target="_blank">doug@ewellic.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div id=":45">This works well or not so well, depending on the meaning of "usually" and on whether one happens to be dealing with the "usually" case. Locations and circumstances exist in which "Chinese" definitely does not mean "Mandarin."<br>
</div></blockquote></div><br></div>