I think one of the background assumptions for this effort is to focus on identifying the allowed "output" characters, not the "input" characters. That is, full width A-Z are already disallowed in the *output* of IDNA, so this would have no change from that.
<br><br>In retrospect, we really shouldn't have had the transformation embodied in IDNA, just what can actually occur &quot;on the wire&quot;.<br><br>Mark<br><br><div><span class="gmail_quote">On 11/29/06, <b class="gmail_sendername">
Erik van der Poel</b> &lt;<a href="mailto:erikv@google.com">erikv@google.com</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hello everyone,<br><br>It's great to see so much energy in the idna200x efforts!<br><br>One of my concerns is that it may be too late to try to prohibit some<br>of the characters that were previously permitted by rfcs 349[0-2],
<br>whether mapped or unmapped in the normalization and case-folding<br>processes. One example that comes to mind is the full-width latin<br>range U+FF01..5E and another is the cjk iteration mark U+3005.<br><br><a href="http://www.ietf.org/internet-drafts/draft-faltstrom-idnabis-tables-01.txt">
http://www.ietf.org/internet-drafts/draft-faltstrom-idnabis-tables-01.txt</a><br><br>Some may decide, after a close reading, that the old rfcs do not allow<br>non-punycode domain names in html, but the fact of the matter is that
<br>these do occur. Now that even the market-leading web browser (msie)<br>has a version out that supports these (v7), it may become increasingly<br>difficult to convince some implementors to prohibit characters that<br>actually occur in the wild.
<br><br><a href="http://www.majuro.jp/kaisya.html">http://www.majuro.jp/kaisya.html</a> (3rd w in <a href="http://www.fwt.co.jp">www.fwt.co.jp</a> is full-width)<br><br>If it would help, I can take a look at Google's copies of web
<br>documents to see which characters are actually used there and how many<br>occurrences there are of each. Of course, such a sample would omit<br>domain names used in email, but the web is quite an important part of<br>
the Internet too.<br><br>Erik van der Poel<br>Google<br>_______________________________________________<br>Idna-update mailing list<br><a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br><a href="http://www.alvestrand.no/mailman/listinfo/idna-update">
http://www.alvestrand.no/mailman/listinfo/idna-update</a><br></blockquote></div><br>