<font face="times new roman,serif">FYI, a simple binary data structure that contains all the script info is 2,156 bytes. The extended script info would add 385 bytes to that.<br clear="all"></font><font face="'times new roman', serif"><div style="background-color:transparent;margin-top:0px;margin-left:0px;margin-bottom:0px;margin-right:0px;font-family:Times;font-size:medium">
<span style="font-family:'times new roman',serif;font-size:small"><br></span></div><div style="background-color:transparent;margin-top:0px;margin-left:0px;margin-bottom:0px;margin-right:0px;font-family:Times;font-size:medium">
<span style="font-family:'times new roman',serif;font-size:small">Mark</span></div></font><font face="'times new roman', serif"><i>— Il meglio è l’inimico del bene —</i></font><div><font face="'times new roman', serif"><i><br>
</i></font><div><font face="'times new roman', serif"><i><span style="font-style:normal"><div style="background-color:transparent;margin-top:0px;margin-left:0px;margin-bottom:0px;margin-right:0px">[<a href="https://plus.google.com/114199149796022210033" target="_blank">https://plus.google.com/114199149796022210033</a>]</div>
<i></i></span><i></i></i></font></div></div><br>
<br><br><div class="gmail_quote">On Mon, Dec 12, 2011 at 20:52, "Martin J. Dürst" <span dir="ltr"><<a href="mailto:duerst@it.aoyama.ac.jp">duerst@it.aoyama.ac.jp</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="im">On 2011/12/13 8:50, Andrew Sullivan wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
On Mon, Dec 12, 2011 at 04:54:27PM +0000, Gervase Markham wrote:<br>
</blockquote>
<br>
</div><div class="im"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

     It is the sole survivor of a large number of alternative proposals<br>
that were considered and rejected. Unlike most of the other rejected<br>
proposals, it does not need any modifications to the DNS protocol, or<br>
distribution of "language" codes for labels, nor does it require<br>
multiple DNS lookups, large character tables in the browser, or<br>
real-time access to WHOIS information.<br>
</blockquote>
<br>
The only reason the latter two of these are true is because the root<br>
zone is small.  If it grows to several thousands of labels a<br>
significant number of which are IDNs, the last two advantages turn out<br>
to be fatal flaws, because there's no practical way to make the<br>
decision that you need to make on heuristic grounds.  I'm not trying<br>
to dismiss those factors; I think those are indeed advantages to the<br>
existing solution.  But as you see in this thread, there are<br>
disadvantages that also pile up; and I think that pile gets bigger as<br>
the root zone expands.<br>
</blockquote>
<br></div>
Even without significant growth in the root zone, "large character tables in the browser" is actually very relative. <a href="http://www.unicode.org/Public/UNIDATA/Scripts.txt" target="_blank">http://www.unicode.org/Public/<u></u>UNIDATA/Scripts.txt</a> is about 120kB, but most of it is spaces and comments, and it separates out characters by character class. Removing character class and taking into account gaps and stuff that's not allowed in IDNs anyway, the table can be *significantly* compacted.<br>

<br>
Regards,    Martin.<div class="HOEnZb"><div class="h5"><br>
______________________________<u></u>_________________<br>
Idna-update mailing list<br>
<a href="mailto:Idna-update@alvestrand.no" target="_blank">Idna-update@alvestrand.no</a><br>
<a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/<u></u>mailman/listinfo/idna-update</a><br>
</div></div></blockquote></div><br>