The formal name is Noncharacter_Code_Point.<br><br>Note that there was a one-time cleanup of the Default Ignorable Code Point values in
Unicode 5.1.0, specifically to get it into good shape for IDNA
(<a href="http://www.unicode.org/versions/Unicode5.1.0/">http://www.unicode.org/versions/Unicode5.1.0/</a> - see &quot;Rendering Default
Ignorable Code Points&quot; and the section following). This changed the composition, so if
noncharacters are to be DISALLOWED, then they need to be specifically
mentioned. Functionally, it doesn&#39;t make a lot of difference, since the Noncharacter_Code_Point values are immutable, and will always be unassigned (gc=Cn), so they will never be part of valid labels. But they can be specifically excluded by making Noncharacter_Code_Point be specifically DISALLOWED, and for consistency I&#39;d recommend doing that in the tables document. BTW, here are the code points: <a href="http://unicode.org/cldr/utility/list-unicodeset.jsp?a=[:Noncharacter_Code_Point=True">http://unicode.org/cldr/utility/list-unicodeset.jsp?a=[:Noncharacter_Code_Point=True</a>:]<br>
<br>That immutability is part of the Unicode stability policies: see <a href="http://www.unicode.org/policies/stability_policy.html#Property_Value">http://www.unicode.org/policies/stability_policy.html#Property_Value</a>. Note that there were some additional constraints on property value stability added in conjunction with Unicode 5.1, largely for IDNA. Note however, that the property value table is organized not by when the policy became effective, but by the earliest version that the policy was true of. That is, if policy was imposed in the Unicode 5.0 timeframe, but actually was true for any version at or after Unicode 3.0, then it is listed under 3.0+.<br>
<br>Note there were also additional code points made Deprecated: see
<a href="http://unicode.org/cldr/utility/list-unicodeset.jsp?a=[:Deprecated=True">http://unicode.org/cldr/utility/list-unicodeset.jsp?a=[:Deprecated=True</a>:]
(Deprecated does not mean removed -- characters are never removed or
moved -- but means that they are strongly discouraged.) None of the
additions affect the tables document.<br><br>Mark<br><br><div class="gmail_quote">On Wed, Apr 30, 2008 at 8:45 AM, Erik van der Poel &lt;<a href="mailto:erikv@google.com">erikv@google.com</a>&gt; wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
The trouble with that 2nd definition is that UnicodeData.txt does not<br>
contain &quot;noncharacters&quot; such as U+FFFF. I would prefer IDNA&#39;s<br>
&quot;UNASSIGNED&quot; to exclude Unicode &quot;noncharacters&quot;, since they will never<br>
be reassigned to a different meaning.<br>
<br>
I suspect Ken would know how to state this properly. (Thanks in<br>
advance for any input you may provide.)<br>
<font color="#888888"><br>
Erik<br>
</font><div><div></div><div class="Wj3C7c"><br>
On Wed, Apr 30, 2008 at 7:50 AM, Paul Hoffman &lt;<a href="mailto:phoffman@imc.org">phoffman@imc.org</a>&gt; wrote:<br>
&gt; At 12:08 PM +0200 4/30/08, Patrik Fältström wrote:<br>
&gt;<br>
&gt; &gt; On 28 apr 2008, at 16.21, Paul Hoffman wrote:<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; &gt; I&#39;m not suggesting changing the defined marks; just making 2064..2069<br>
&gt; UNASSIGNED.<br>
&gt; &gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; One view could be that as the block 2065..2069 is defined as<br>
&gt; Other_Default_Ignorable_Code_Point, why would it not be DISALLOWED? Because<br>
&gt; when the codepoint is assigned, this might change?<br>
&gt; &gt;<br>
&gt; &gt; Another view that all unassigned codepoints (as defined by not being<br>
&gt; defined in UnicodeData.txt) are UNASSIGNED.<br>
&gt; &gt;<br>
&gt; &gt; What do you all on this list want? Today we are implementing the first.<br>
&gt; &gt;<br>
&gt;<br>
&gt; &nbsp;The danger with implementing the first is that the Unicode Consortium folks<br>
&gt; can easily change the boundaries of Other_Default_Ignorable_Code_Point if<br>
&gt; they really want a non-ignorable code point to be at a certain position for<br>
&gt; some bureaucratic or aesthetic reason. We in the IETF do that in some of our<br>
&gt; IANA registries.<br>
&gt;<br>
&gt; &nbsp;I think the second may be safer.<br>
&gt;<br>
&gt;<br>
&gt; &nbsp;_______________________________________________<br>
&gt; &nbsp;Idna-update mailing list<br>
&gt; &nbsp;<a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
&gt; &nbsp;<a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
&gt;<br>
_______________________________________________<br>
Idna-update mailing list<br>
<a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
<a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>Mark