The TATWEEL was missing from the list below. I put a full list, plus a sample of each character, plus links to property information, at<br><br><div style="margin-left: 40px;"><a href="http://www.macchiato.com/unicode/idna/exceptions">http://www.macchiato.com/unicode/idna/exceptions</a><br>
</div><br>I also tried to put my guess as to the motivation for all the CONTEXTO characters. Any information on that would be appreciated, since the rationales are not clear from email.<br><br>[I have some personal comments also, clearly marked as such. My conclusion is that we need none of the CONTEXTO characters currently in Exceptions; that all of them can just be PVALID.<br>
<br>The only characters that really need special handling are  HYPHEN (which is already called out specially in Protocol, and can be dealt with there) and the ARABIC-INDIC digits, which can be dealt with in Bidi). And of course, we do need CONTEXTJ and the Exceptions for  PVALID and DISALLOWED.]<br>
<br clear="all">Mark<br>
<br><br><div class="gmail_quote">On Sat, Jul 18, 2009 at 12:02, Vint Cerf <span dir="ltr">&lt;<a href="mailto:vint@google.com">vint@google.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<p style="">PVALID: // would otherwise have been DISALLOWED</p><p style=""> </p><p style=""> 00DF; PVALID     # LATIN SMALL
LETTER SHARP S</p><p style=""> 03C2; PVALID     # GREEK SMALL
LETTER FINAL SIGMA</p><p style=""> 06FD; PVALID     # ARABIC SIGN
SINDHI AMPERSAND</p><p style=""> 06FE; PVALID     # ARABIC SIGN
SINDHI POSTPOSITION MEN</p><p style=""> 0F0B; PVALID     # TIBETAN MARK
INTERSYLLABIC TSHEG</p><p style=""> 3007; PVALID     # IDEOGRAPHIC
NUMBER ZERO</p><p style=""> </p><p style="">CONTEXTO: // would otherwise have been DISALLOWED</p><p style=""> </p><p style=""> 00B7; CONTEXTO   # MIDDLE DOT</p><p style=""> 0375; CONTEXTO   # GREEK LOWER NUMERAL
SIGN (KERAIA)</p><p style=""> 05F3; CONTEXTO   # HEBREW PUNCTUATION
GERESH</p><p style=""> 05F4; CONTEXTO   # HEBREW PUNCTUATION
GERSHAYIM</p><p style=""> 30FB; CONTEXTO   # KATAKANA MIDDLE DOT</p><p style=""> </p><p style="">CONTEXTO: // would otherwise have been PVALID</p><p style=""> </p><p style=""> U+002D; CONTEXTO   # HYPHEN-MINUS</p><p style="">
<span> </span>U+02B9;
CONTEXTO   # MODIFIER LETTER PRIME</p><p style=""> U+0660; CONTEXTO   # ARABIC-INDIC DIGIT
ZERO</p><p style=""> U+0661; CONTEXTO   # ARABIC-INDIC DIGIT
ONE</p><p style=""> U+0662; CONTEXTO   # ARABIC-INDIC DIGIT
TWO</p><p style=""> U+0663; CONTEXTO   # ARABIC-INDIC DIGIT
THREE</p><p style=""> U+0664; CONTEXTO   # ARABIC-INDIC DIGIT
FOUR</p><p style=""> U+0665; CONTEXTO   # ARABIC-INDIC DIGIT
FIVE</p><p style=""> U+0666; CONTEXTO   # ARABIC-INDIC DIGIT
SIX</p><p style=""> U+0667; CONTEXTO   # ARABIC-INDIC DIGIT
SEVEN</p><p style=""><span> </span>U+0668;
CONTEXTO   # ARABIC-INDIC DIGIT EIGHT</p><p style=""> U+0669; CONTEXTO   # ARABIC-INDIC DIGIT
NINE</p><p style=""> U+06F0; CONTEXTO   # EXTENDED ARABIC-INDIC
DIGIT ZERO</p><p style=""> U+06F1; CONTEXTO   # EXTENDED ARABIC-INDIC
DIGIT ONE</p><p style=""> U+06F2; CONTEXTO   # EXTENDED ARABIC-INDIC
DIGIT TWO</p><p style=""> U+06F3; CONTEXTO   # EXTENDED ARABIC-INDIC
DIGIT THREE</p><p style=""> U+06F4; CONTEXTO   # EXTENDED ARABIC-INDIC
DIGIT FOUR</p><p style=""> U+06F5; CONTEXTO   # EXTENDED ARABIC-INDIC
DIGIT FIVE</p><p style=""> U+06F6; CONTEXTO   # EXTENDED ARABIC-INDIC
DIGIT SIX</p><p style=""> U+06F7; CONTEXTO   # EXTENDED ARABIC-INDIC
DIGIT SEVEN</p><p style=""> U+06F8; CONTEXTO   # EXTENDED ARABIC-INDIC
DIGIT EIGHT</p><p style=""> U+06F9; CONTEXTO   # EXTENDED ARABIC-INDIC
DIGIT NINE</p><p style=""> U+0483; CONTEXTO   # COMBINING CYRILLIC
TITLO</p><p style=""> U+3005; CONTEXTO   # IDEOGRAPHIC ITERATION
MARK</p><p style=""> </p><p style="">DISALLOWED: // would otherwise have been PVALID</p><p style=""> </p><p style=""> U+302E; DISALLOWED # HANGUL SINGLE DOT TONE MARK</p><p style=""> U+302F; DISALLOWED # HANGUL DOUBLE DOT TONE MARK</p>
<p style=""> </p><p style="">In addition it has been proposed to DISALLOW the following
vertical formatting characters:</p><p style=""> </p><p style=""><span style="font-size: 12pt; font-family: Helvetica;">U+3031:
Lm: VERTICAL KANA REPEAT MARK</span></p><p style=""><span style="font-size: 12pt; font-family: Helvetica;">U+3032:
Lm: VERTICAL KANA REPEAT WITH VOICED SOUND MARK</span></p><p style=""><span style="font-size: 12pt; font-family: Helvetica;">U+3033:
Lm: VERTICAL KANA REPEAT MARK UPPER HALF</span></p><p style=""><span style="font-size: 12pt; font-family: Helvetica;">U+3034:
Lm: VERTICAL KANA REPEAT WITH VOICED SOUND MARK UPPER HALF</span></p><p style=""><span style="font-size: 12pt; font-family: Helvetica;">U+3035:
Lm: VERTICAL KANA REPEAT MARK LOWER HALF</span></p><p style=""><span style="font-size: 12pt; font-family: Helvetica;">U+303B:
Lm: VERTICAL IDEOGRAPHIC ITERATION MARK</span></p><p style=""><span style="font-size: 12pt; font-family: Helvetica;">U+07FA:
Lm:<span>  </span>NKO LAJANYALAN</span></p></blockquote></div><br>