<div dir="ltr"><br><div class="gmail_extra"><br><br><div class="gmail_quote">On Thu, Aug 22, 2013 at 4:11 AM, Anne van Kesteren <span dir="ltr"><<a href="mailto:annevk@annevk.nl" target="_blank">annevk@annevk.nl</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im">On Thu, Aug 22, 2013 at 12:02 PM, Gervase Markham <<a href="mailto:gerv@mozilla.org">gerv@mozilla.org</a>> wrote:<br>

> It's not been possible to register names like ☺☺☺.com for some time now;<br>
> that's a big clue.<br>
<br>
</div>I don't think it is. There's sites out that rely on underscore working<br>
in subdomains. You cannot register a domain name with an underscore.<br>
<div class="im"><br>
<br>
> (Are your friends really using <a href="http://xn--74h.example.com/" target="_blank">http://xn--74h.example.com/</a> ?)<br>
<br>
</div>Yeah (with "example" replaced). Renders fine in Safari, too.<br>
<div class="im"><br>
<br>
> IIRC, we must have broken a load of URLs when we decided that %-encoding<br>
> in URLs should always be interpreted as UTF-8 (in RFC 3986), whereas<br>
> beforehand it depended on the charset of the page or form producing the<br>
> link. Why did we do that? Because the new way was better for the future,<br>
> and some breakage was acceptable to attain that goal.<br>
<br>
</div>Actually, I don't think we did. And the reason for that is that the<br>
non-ASCII usage was primarily in the query string. </blockquote><div><br></div><div>Well,  there are tons of urls whose path part have non-ASCII characters. They're very common in Korea, for instance. </div><div> </div>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">And as it happens,<br>
we still use the character encoding to go from code points to<br>
percent-escaped byte code points there. The IETF STD doesn't admit to<br>
this, which is part of the reason why we have<br>
<a href="http://url.spec.whatwg.org/" target="_blank">http://url.spec.whatwg.org/</a> now.<br>
<span class="HOEnZb"><font color="#888888"><br>
<br>
--<br>
<a href="http://annevankesteren.nl/" target="_blank">http://annevankesteren.nl/</a><br>
<br>
</font></span></blockquote></div><br></div></div>