<br clear="all">Mark<br>
<br><br><div class="gmail_quote">On Fri, Jul 17, 2009 at 11:15, Gervase Markham <span dir="ltr">&lt;<a href="mailto:gerv@mozilla.org">gerv@mozilla.org</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="im">On 17/07/09 07:37, Gervase Markham wrote:<br>
&gt; A good question, and one which I unfortunately do not have time<br>
&gt; currently to answer. The list is here:<br>
&gt; <a href="http://mxr.mozilla.org/mozilla-central/source/modules/libpref/src/init/all.js#762" target="_blank">http://mxr.mozilla.org/mozilla-central/source/modules/libpref/src/init/all.js#762</a><br>
&gt; if anyone else wants to decode it and discover.<br>
<br>
</div>OK, using<br>
<a href="http://macchiato.com/idna/idna-info.html" target="_blank">http://macchiato.com/idna/idna-info.html</a><br>
I get the below results. Headlines: five are PVALID<br>
(\u01C3\u02D0\u0337\u0338\u3033) and one is CONTEXT0 (\u05F4).<br>
<br>
PVALID:<br>
\u01C3 LATIN LETTER RETROFLEX CLICK (exclamation mark)<br>
\u02D0 MODIFIER LETTER TRIANGULAR COLON (colon)<br>
\u0337 COMBINING SHORT SOLIDUS OVERLAY (slash)<br>
\u0338 COMBINING LONG SOLIDUS OVERLAY (slash)<br>
\u3033 VERTICAL KANA REPEAT MARK UPPER HALF (slash)</blockquote><div><br><br>Here is the set: <a href="http://unicode.org/cldr/utility/list-unicodeset.jsp?a=%5B%5Cu01C3%5Cu02D0%5Cu0337%5Cu0338%5Cu3033%5D" rel="nofollow">http://unicode.org/cldr/utility/list-unicodeset.jsp?a=[\u01C3\u02D0\u0337\u0338\u3033]</a><br>
<br>My take is that all of these are legitimate characters, and should just be PVALID.<br>
<br>
<table style="border-color: rgb(136, 136, 136); border-width: 1px; border-collapse: collapse;" border="1" cellspacing="0">
<tbody>
<tr>
<td style="text-align: center; width: 43px; height: 16px;"><b> Item</b></td>
<td style="width: 124px; height: 16px; text-align: center;"><b> Example</b></td>
<td style="width: 330px; height: 16px;"><b> Comments</b></td>
</tr><tr><td style="text-align: center; width: 43px; height: 22px;">\u01C3</td><td style="width: 124px; height: 22px; text-align: center;"><font style="font-family: times new roman,serif;" size="4">aǃb vs a!b</font></td>
<td style="width: 330px; height: 22px;">typically identical, but ! isn&#39;t allowed in domain names anyway.<br></td></tr><tr><td style="text-align: center; width: 43px; height: 23px;">\u02D0</td><td style="width: 124px; height: 23px; text-align: center;">
<font style="font-family: times new roman,serif;" size="4">aːb vs a:b</font></td><td style="width: 330px; height: 23px;">similar, but not the same appearance. Could be confused with : used in URL password or port, so UIs should probably warn.<br>
</td></tr><tr><td style="text-align: center; width: 43px; height: 33px;">\u0337</td><td style="width: 124px; height: 33px; text-align: center;"><font style="font-family: times new roman,serif;" size="4">a̸b vs a/b</font></td>
<td style="width: 330px; height: 33px;">not really confusable because of positioning</td></tr><tr><td style="text-align: center; width: 43px; height: 16px;">\u0338</td><td style="width: 124px; height: 16px; text-align: center;">
<font style="font-family: times new roman,serif;" size="4">a̷b vs a/b</font></td><td style="width: 330px; height: 16px;">not really confusable because of positioning</td></tr><tr><td style="text-align: center; width: 43px; height: 16px;">
\u3033</td><td style="width: 124px; height: 16px; text-align: center;"><font style="font-family: times new roman,serif;" size="4">a〳b vs a/b</font></td><td style="width: 330px; height: 16px;">not really confusable because of positioning</td>
</tr><tr><td style="text-align: center; width: 43px; height: 16px;">\u05F4</td><td style="width: 124px; height: 16px; text-align: center;"><font size="4">a״b vs a&quot;b</font></td><td style="width: 330px; height: 16px;">
similar, but not the same, and &quot;  isn&#39;t allowed in domain names anyway.<br></td></tr>
</tbody>
</table>
<br>(also found on <a href="http://www.macchiato.com/unicode/idna/idna-info-key">http://www.macchiato.com/unicode/idna/idna-info-key</a>)<br><br></div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<br>
<br>
CONTEXT0:<br>
\u05F4 HEBREW PUNCTUATION GERSHAYIM (double quotes)<br>
<br>
Disclaimer: I haven&#39;t been exercising oversight over the extension of<br>
this list, and am somewhat surprised to see characters in it which do<br>
not resemble period, colon, slash or hyphen-minus.<br>
<br>
Gerv<br>
<br>
Full Results For Mozilla Character Blocklist Under IDNA2008 Rules<br>
-----------------------------------------------------------------<br>
<div class="im"><br>
<a href="http://mxr.mozilla.org/mozilla-central/source/modules/libpref/src/init/all.js#762" target="_blank">http://mxr.mozilla.org/mozilla-central/source/modules/libpref/src/init/all.js#762</a><br>
<br>
</div>\u0020\u00A0\u00BC\u00BD\u00BE<br>
<br>
DISALLOWED<br>
<br>
\u01C3\u02D0\u0337\u0338<br>
<br>
PVALID<br>
<br>
\u0589\u05C3<br>
<br>
DISALLOWED<br>
<br>
\u05F4<br>
<br>
CONTEXT0<br>
<br>
\u0609\u060A\u066A\u06D4\u0701\u0702\u0703\u0704\u115F\u1160\u1735\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200A\u200B\u2024\u2027\u2028\u2029\u202F\u2039\u203A\u2041\u2044\u2052\u205F\u2153\u2154\u2155\u2156\u2157\u2158\u2159\u215A\u215B\u215C\u215D\u215E\u215F<br>

\u2215\u2236\u23AE\u2571\u29F6\u29F8\u2AFB\u2AFD\u2FF0\u2FF1\u2FF2\u2FF3\u2FF4\u2FF5\u2FF6\u2FF7\u2FF8\u2FF9\u2FFA\u2FFB\u3000\u3002\u3014\u3015<br>
<br>
DISALLOWED<br>
<br>
\u3033<br>
<br>
PVALID<br>
<br>
\u3164\u321D\u321E\u33AE\u33AF\u33C6\u33DF\uA789\uFE14\uFE15\uFE3F\uFE5D\uFE5E\uFEFF\uFF0E\uFF0F\uFF61\uFFA0\uFFF9\uFFFA\uFFFB\uFFFC\uFFFD<br>
<br>
DISALLOWED<br>
<div><div></div><div class="h5"><br>
Gerv<br>
_______________________________________________<br>
Idna-update mailing list<br>
<a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
<a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
</div></div></blockquote></div><br>