<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:x="urn:schemas-microsoft-com:office:excel" xmlns:p="urn:schemas-microsoft-com:office:powerpoint" xmlns:a="urn:schemas-microsoft-com:office:access" xmlns:dt="uuid:C2F41010-65B3-11d1-A29F-00AA00C14882" xmlns:s="uuid:BDC6E3F0-6DA3-11d1-A2A3-00AA00C14882" xmlns:rs="urn:schemas-microsoft-com:rowset" xmlns:z="#RowsetSchema" xmlns:b="urn:schemas-microsoft-com:office:publisher" xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet" xmlns:oa="urn:schemas-microsoft-com:office:activation" xmlns:html="http://www.w3.org/TR/REC-html40" xmlns:q="http://schemas.xmlsoap.org/soap/envelope/" xmlns:D="DAV:" xmlns:x2="http://schemas.microsoft.com/office/excel/2003/xml" xmlns:ois="http://schemas.microsoft.com/sharepoint/soap/ois/" xmlns:dir="http://schemas.microsoft.com/sharepoint/soap/directory/" xmlns:ds="http://www.w3.org/2000/09/xmldsig#" xmlns:udc="http://schemas.microsoft.com/data/udc" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:sps="http://schemas.microsoft.com/sharepoint/soap/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:udcxf="http://schemas.microsoft.com/data/udc/xmlfile" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=utf-8">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:PMingLiU;
        panose-1:2 2 5 0 0 0 0 0 0 0;}
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:"\@PMingLiU";
        panose-1:2 2 5 0 0 0 0 0 0 0;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.gmailquote
        {mso-style-name:gmail_quote;}
span.EmailStyle18
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page Section1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=EN-US link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>As I said earlier, this very much depends on one’s notion of
what a locale is. You say, <o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>“… </span>it depends highly on what one means by locale. Let me
recast it. For a given type of content (eg country names) and a given language
subtag, there may be differences among regions… or it may be that all regions
share the same values.<span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>”<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>You are picking out one particular data category, country names.
That is not a locale, by any usage I’ve ever seen before now! I don’t in the
slightest question that, for a single data category for which the values are
linguistic expressions, region is not necessarily relevant. But again, that is
not a locale.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>You are casting “locale” as a data collection that is completely
variable wrt the data categories it contains, with no minimal set of required
data categories (there’s only the proviso that there be at least one kind of
content). I can easily imagine that’s a useful approach to managing data in a
repository like CLDR, where the only functional requirement is data management.
But a data collection in that context is just that, a collection of data, not a
locale. A locale is a locale by virtue of its role within a software
implementation. <o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>So, while I have no problem saying that a set of country names
in English is locale data, I would not say that makes it a locale. But, of
course, the way I am casting it leaves open the question of just what the “role
within a software implementation” needs to look like. <o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>And, of course, I’m assuming a model that’s been around for a
while in which a software implementation has various functions to produce
various kinds of culture-dependent results -- provide a country name, format a
numeric value as a currency string, sort a set of data, etc. – where all of
those functions have in common a particular parameter that uses one set of
system-recognized symbols to determine the culture to be assumed in producing
any of those results. In that model, I contend that region is always a key
factor in the cultural distinctions because there is always one or more
functions that produce results that are regionally determined or even specific
to a particular region: date format, default currency symbol, etc. <o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>And, of course, it’s possible to imagine an implementation that
doesn’t use that culture-atom model – i.e. an implementation in which different
sets of symbols are used for parameterizing different clusters of functions.
The whole set of functions still have in common that they produce some kind of culture-dependent
result, but different ones use different parameters to determine different
cultural attributes as are relevant for the given function. So, for instance, a
function that formats a numeric date value as a day name in a given language
might use as a parameter just a language ID with no region element, while
another function that formats a numeric value as a currency string might use as
a parameter just a region ID with no language element. Perhaps software implementations
in the future will all work this way such that there are no longer any
functions that rely on parameters that correspond to “locale IDs” / LCIDs as
those are understood in that model described in the preceding paragraph. In
that case, you might well have a situation in which IDs with region elements
are needed only exceptionally – as you are suggestion. But in that case, I’d
say that those identifiers that are used are IDs for some other notions, not
locale IDs.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Again, this is probably straying off topic for this list, so I
should let this one go.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'> <o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Peter<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in'>

<p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>From:</span></b><span
style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>
mark.edward.davis@gmail.com [mailto:mark.edward.davis@gmail.com] <b>On Behalf
Of </b>Mark Davis<br>
<b>Sent:</b> Wednesday, September 27, 2006 6:16 PM<br>
<b>To:</b> Peter Constable<br>
<b>Cc:</b> ietf-languages@iana.org<br>
<b>Subject:</b> Re: langauge vs. locale (was: RE: Suppress-Script candidates
(was: Re:frr, fy, ngo, tt))<o:p></o:p></span></p>

</div>

<p class=MsoNormal><o:p>&nbsp;</o:p></p>

<p class=MsoNormal style='margin-bottom:12.0pt'>Now, the difference between
&quot;language&quot; identifiers and &quot;locale&quot; identifiers is
notoriously slippery, so I'll provide some background on how CLDR is actually
structured, so you don't have to guess.<br>
<br>
The CLDR data is separated into language-specific data, and non-language
specific data. The language-specific data does *not* include items like the
currencies for a country, or the weekend days, etc.; that is all in the
non-language specific data. Here are some examples: <br>
<a href="http://unicode.org/cldr/data/common/collation/">http://unicode.org/cldr/data/common/collation/</a><br>
<a href="http://unicode.org/cldr/data/common/main/">http://unicode.org/cldr/data/common/main/</a><br>
<br>
The non-language-specific data includes which currencies were valid in a particular
country during which years, or which languages are customarily written in which
scripts. Some examples are:<br>
<a href="http://unicode.org/cldr/data/common/supplemental/">http://unicode.org/cldr/data/common/supplemental/</a><br>
<a href="http://unicode.org/cldr/data/common/transforms/">http://unicode.org/cldr/data/common/transforms/</a><br>
<br>
The so-called locale inheritance is used for the language-specific data, not
the non-language-specific data, so it would be more accurate to call it
language inheritance. The vast majority of the language-specific data does not
differ by country. While, for example, the content of en.xml is chosen to be
appropriate for the the most populous country speaking en (the US), that
doesn't mean that content is *always* inappropriate for many of the other
regions that could use English (eg AG AI AS AU AW BB BM BS BW BZ CA CC CK CM CX
DM ER FJ FK FM GB GD GH GI GM GY HK IE IN IO JM KE KI KN KY LC LR LS MH MP MS
MT MW NA NF NG NR NU NZ PG PH PK PN PW RW SB SG SH SL SZ TC TK TO TT TZ UG UM
US VC VG VI ZA ZM ZW). <br>
<br>
In cases where content does differ according to the region, such as the UK,
then one includes overrides of what is in en.XML. (Where the language-specific
data for two locale/language tags are the same and different than the base, one
can be aliased (either in full or in part) to the other. Thus if en_ZW, for
example, followed UK spelling conventions, then it could be aliased to en_UK.
While the files use &quot;_&quot;, CLDR recognizes &quot;-&quot; and
&quot;_&quot; as equivalent in identifiers.) <br>
<br>
You say:<br>
&gt;But clearly there is no such thing as a region-neutral English locale<br>
<br>
This sentence is a bit slippery; it depends highly on what one means by locale.
Let me recast it. For a given type of content (eg country names) and a given
language subtag, there may be differences among regions (as defined by BCP47)
or it may be that all regions share the same values. (For that matter, there
may be differences *within* regions, as well -- either according to sub-region
that BCP 47 isn't fine-grained enough for (eg for some speech applications the
differences Bostonian English may be important). <br>
<br>
Where there are differences in regions, the region is important. Where there
are not differences between regions, the region is not important. Thus in many
cases, the CLDR data does not differ by country at all, so requiring a country
subtag is pointless. In that sense, I'd say your sentence <br>
<br>
&gt; that region is a key attribute of a locale,<br>
<br>
is false. Region may or may not be significant, depending on the content, and
depending on the language.<br>
<br>
If you meant to say that the *ability* to have a region as a component of
locale/language is key, then I'd agree with you -- otherwise one couldn't
distinguish between en-US and en-UK content. <br>
<br>
I do, however, agree with you on the major point: this is all about *defaults*;
identifiers have an inherent limitation -- they represent some class of users,
within which there will always be variations.<br>
<br>
Mark <br>
<br>
<o:p></o:p></p>

<div>

<p class=MsoNormal><span class=gmailquote>On 9/27/06, <b>Peter Constable</b>
&lt;<a href="mailto:petercon@microsoft.com">petercon@microsoft.com</a>&gt;
wrote:</span><o:p></o:p></p>

<p class=MsoNormal>[This is running a risk of straying off topic for this list,
but I'll post this here since it still pertains to Don's questions regarding
whether particular reg entries should have certain info added to them.]<br>
<br>
<br>
&gt; From: <a href="mailto:ietf-languages-bounces@alvestrand.no">ietf-languages-bounces@alvestrand.no</a>
[mailto:<a href="mailto:ietf-languages-">ietf-languages-</a><br>
&gt; <a href="mailto:bounces@alvestrand.no">bounces@alvestrand.no </a>] On
Behalf Of Kent Karlsson<br>
<br>
<br>
&gt; &gt; that region is a key attribute of a locale,<br>
&gt;<br>
&gt; ...no.<br>
<br>
Please explain. I guess this might depend on one's view of what the minimal set
of information categories that are required for a locale consists of. <br>
<br>
<br>
&gt; &gt; locale ID must always include a region component as well as a<br>
&gt; &gt; language component.<br>
&gt;<br>
&gt; CLDR locales don't. Just about all locale data can, and often should,<br>
&gt; be in the &quot;language only&quot; named locales. Very rarely is there a
difference <br>
&gt; from those locales that belong in the &quot;language_territory&quot; sublocales.<br>
<br>
Not being a participant in the CLDR project, I'm not in a good position to
evaluate the intent of the data I see there. I do note that, e.g. there is a
file &quot;en.xml&quot;. But clearly there is no such thing as a region-neutral
English locale: every English speaker lives in a region where one of
&quot;M/d/yy&quot; or &quot;d/M/yy&quot; is the preferred short date format
(and probably the majority live in regions that prefer the latter), but this
data file is not neutral wrt short date format: in spite of the name, the data
it contains really is applicable to the US. Now, perhaps the intent here is
that this is data that can be used as a default if region-specific data is not
available, but it seems to me that's just a round about way of saying that
en-US is used as the default locale for English. <br>
<br>
<br>
&gt; Yes, but choosing (a single) currency or a choosing a measurement<br>
&gt; system does not belong in a locale. Doing that is a mistake, similar to<br>
&gt; that of selecting character encoding via locale (as, unfortunately done <br>
&gt; in Unix/POSIX locales).<br>
<br>
These are only ever defaults. It's not appropriate to assume that every English
speaker in the US wants a short date format of &quot;M/d/yy&quot;, but it is an
appropriate default in that scenario. In the same way, it's not appropriate to
assume that a user in the US will always use imperial units of measure, but it
is reasonable to treat imperial units as a default. Same for currency. <br>
<br>
<br>
Peter Constable<br>
_______________________________________________<br>
Ietf-languages mailing list<br>
<a href="mailto:Ietf-languages@alvestrand.no">Ietf-languages@alvestrand.no</a><br>
<a href="http://www.alvestrand.no/mailman/listinfo/ietf-languages">http://www.alvestrand.no/mailman/listinfo/ietf-languages</a><o:p></o:p></p>

</div>

<p class=MsoNormal><o:p>&nbsp;</o:p></p>

</div>

</body>

</html>