<span class="gmail_quote"></span>I think one of the background assumptions for this effort is to focus on identifying the allowed &quot;output&quot; characters, not the &quot;input&quot; characters. That is, full width A-Z are already disallowed in the *output* of 
<span id="st" name="st" class="st">IDNA</span>, so this would have no change from that.
<br><br>In retrospect, we really shouldn't have had the transformation embodied in <span id="st" name="st" class="st">IDNA</span>, just what can actually occur &quot;on the wire&quot;.<br><span class="sg"><br>Mark</span>
<div><span class="e" id="q_10f34e2804f3e06f_2"><br><br><div><span class="gmail_quote">On 11/29/06, <b class="gmail_sendername">
Erik van der Poel</b> &lt;<a href="mailto:erikv@google.com" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">erikv@google.com</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">

Hello everyone,<br><br>It's great to see so much energy in the idna200x efforts!<br><br>One of my concerns is that it may be too late to try to prohibit some<br>of the characters that were previously permitted by rfcs 349[0-2],
<br>whether mapped or unmapped in the normalization and case-folding<br>processes. One example that comes to mind is the full-width latin<br>range U+FF01..5E and another is the cjk iteration mark U+3005.<br><br><a href="http://www.ietf.org/internet-drafts/draft-faltstrom-idnabis-tables-01.txt" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">

http://www.ietf.org/internet-drafts/draft-faltstrom-idnabis-tables-01.txt</a><br><br>Some may decide, after a close reading, that the old rfcs do not allow<br>non-punycode domain names in html, but the fact of the matter is that
<br>these do occur. Now that even the market-leading web browser (msie)<br>has a version out that supports these (v7), it may become increasingly<br>difficult to convince some implementors to prohibit characters that<br>
actually occur in the wild.
<br><br><a href="http://www.majuro.jp/kaisya.html" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://www.majuro.jp/kaisya.html</a> (3rd w in <a href="http://ww%EF%BD%97.fwt.co.jp" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">
www.fwt.co.jp</a> is full-width)<br><br>If it would help, I can take a look at Google's copies of web
<br>documents to see which characters are actually used there and how many<br>occurrences there are of each. Of course, such a sample would omit<br>domain names used in email, but the web is quite an important part of<br>

the Internet too.<br><br>Erik van der Poel<br>Google<br>_______________________________________________<br>Idna-update mailing list<br><a href="mailto:Idna-update@alvestrand.no" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">
Idna-update@alvestrand.no</a><br><a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">
http://www.alvestrand.no/mailman/listinfo/idna-update</a><br></blockquote></div><br>
</span></div>