<html>
<head>
<style><!--
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 10pt;
font-family:Tahoma
}
--></style>
</head>
<body class='hmmessage'>
<PRE>Hi. <BR> <BR>Doug Ewell doug at ewellic.org<BR>Fri Apr 8 23:57:36 CEST 2011<BR> <BR>> Casey Brown wrote:<BR>>> I'm not exactly sure why this request turned into an attack on<BR>>> Wikipedia. The mention of Wikipedia was just an example case to<BR>>> illustrate the possible issues.[0]<BR>> I'm not attacking anyone or anything. It's a known fact that several<BR>> Wikipedias are referenced through non-standard language codes. Try<BR>> <A href="http://simple.wikipedia.org/wiki/Main_Page" target=_blank>http://simple.wikipedia.org/wiki/Main_Page</A> for one example; there is no<BR>> BCP 47 language subtag called 'simple'.<BR> <BR>Then "wawa.wikipedia.org/wiki/Main_Page" should be a possibility (but "simple" does look to me more like a language variety than a language; so it's not quite the same as wawa).<BR> <BR>> Melinda didn't say so, but I got the impression that the request to<BR>> change code element 'www' originated with someone from Wikipedia.<BR>>> If you want to keep it around just for the sake of keeping it around,<BR>>> that seems pretty stupid. ISO is supposed to make things easier<BR>>> through standardization, but there's definitely some degree of common<BR>>> sense involved. As someone else mentioned here, when someone sees<BR>>> "www", are they going to think Wawa or are they going to think<BR>>> "worldwide web"?<BR>Probably the latter I would think (but this may just be my personal view).<BR>>> A Wawa speaker probably wouldn't even assume the<BR>>> code were "www".<BR>>  Deprecated subtags (in ISO 639, code elements) are "kept around" not<BR>>  because it's fun to amass useless clutter, but because it's a bad idea<BR>>  to invalidate existing tagged data. Someone, somewhere, might have used<BR>> ISO 639 or BCP 47 'www' to identify some Wawa data, or to offer users an</PRE><PRE>> option to select Wawa data. Pulling the rug out from under these users<BR>> by invalidating their legitimate use of the standard would not only be<BR>> evil for the Wawa users, but would discourage everyone else from being<BR>> able to trust the stability of the standard.<BR>> The problem is not in someone seeing 'www' in a vacuum and thinking<BR>> "Wawa" versus "World Wide Web." The problem, as Kent said, is in<BR>> creating a Web architecture where one of the subdomains *might* be a<BR>> language code, as in "en.wikipedia.org", or it *might* be something else<BR>> entirely, as in "www.wikipedia.org". That is symbol overloading, and it<BR>> is not good engineering practice; it forces the architect to assume<BR>> there will never, ever be a language code of 'www', not a very safe<BR>> assumption with over 7,800 language codes.<BR>It would be nice though if www could be permanently reserved if it is not needed. Perhaps John is right to request ftp too. </PRE><PRE>However, I agree these codespaces are generally needed (until the advent of iso 639-6). </PRE><PRE>I just can't see howver: <A href="http://www.docname.html.www">www.docname.html.www</A>  That looks strange to me but I guess it's probably rare to find such url's for wawa.<BR> <BR>> Wawa speakers, like speakers of any other language, shouldn't be<BR>> expected to know the magic two- or three-level code for their language.<BR>> This is a matter for engineers. They are the ones who dropped the ball<BR>> here.<BR>>> We shouldn't be attacking websites for still supporting the use of<BR>>> "www" as equal to the "naked" URL, which has been around for the whole<BR>>> life of the internet. I don't mind "blacklisting" ftp too, but it's<BR>>> not as necessary as "www". www is really the only thing that would be<BR>>> a conflict with every single website that uses lang.foo.tld.<BR>> I don't care if they want to make "www.wikipedia.org" equivalent to<BR>>"wikipedia.org". Many, probably most, Web sites are like that. But<BR>> then they should not have created "fr.wikipedia.org" and<BR>"de.wikipedia.org" and such, with "fr" and "de" taking, as it were, the<BR>> place of "www". They could have used "www.fr.wikipedia.org" or<BR>>"wikipedia.org/fr/" and avoided the possible ambiguity which they are<BR>> now facing.<BR>Thanks for the info., Doug.<BR>> Or, since they already make up codes when it suits them, they could use<BR>> "wawa.wikipedia.org" for the Wawa version and be done with it.<BR>I agree that no one is going to automatically think that either "www" or "wwx" stands for "wawa".<BR> <BR> <BR>Best,<BR> <BR>--C. E. Whitehead<BR>cewcathar@hotmail.com <BR>>> [0] ...and not that it matters, but the language codes don't always<BR>>> match for historical reasons, from before we used ISO or from before<BR>>> ISO might have had codes for those languages. We're actually planning<BR>>> on moving most of the wikis soon to match ISO, but it's a pretty<BR>>> labor-intensive process so it's not something that's done every day.<BR>> "We" implies that you are from Wikipedia, which I don't think was stated<BR>> before.<BR>> BTW, wikis that were created before ISO 639-3 existed could still have<BR>> followed the BCP 47 architecture and syntax. It wasn't necessary to<BR>> invent "simple" and "roa-tara" and "zh-classical" when conformant<BR>> private-use tags could have been used instead.<BR>> --<BR>> Doug Ewell | Thornton, Colorado, USA | RFC 5645, 4645, UTN #14<BR>> www.ewellic.org | www.facebook.com/doug.ewell | @DougEwell ­<BR></PRE>                                       </body>
</html>