Patrik,<br><br>Here are the references you can use. Some of the web pages
won&#39;t be live yet; they will by the end of March. They are permanent
links, once they go live.<br>
<ul><li>toNFC and toNKDC (and isNFC, isNFKC) are defined in <i>Section 2 Notation</i> of <i>Unicode Standard Annex #15: Unicode Normalization Forms</i> by 
              Mark Davis and Martin Dürst, an integral part of The Unicode Standard, 
                Version 5.1.0. (<a href="http://www.unicode.org/reports/tr15/tr15-29.html" target="_blank">http://www.unicode.org/reports/tr15/tr15-29.html</a>)</li><li>toCaseFold is defined in <i>Section 3.13 Default Case Algorithms</i> of The Unicode Standard, 
                Version 5.1.0.</li></ul>The reference for Unicode 5.1.0 is:<br><ul><li>The Unicode Consortium. The Unicode Standard, 
                Version 5.1.0, defined by: <i>The Unicode Standard, Version 5.0 </i>(Boston, MA, Addison-Wesley, 2007. ISBN 
                                0-321-48091-0) (<a href="http://www.unicode.org/versions/Unicode5.0.0/" target="_blank">http://www.unicode.org/versions/Unicode5.0.0/</a>), as 
                amended by <i>Unicode 5.1.0</i> (<a href="http://www.unicode.org/versions/Unicode5.1.0/" target="_blank">http://www.unicode.org/versions/Unicode5.1.0/</a>).</li></ul>Note:
We&#39;ve been planning for 5.1 anyway (release in March), and for references it is important, since it has clarifying text for toCaseFold,
and a number of other areas that should be referenced.<br>
<br>Mark<br><br><div class="gmail_quote">On Sat, Feb 9, 2008 at 3:49 AM, Patrik Fältström &lt;<a href="mailto:patrik@frobbit.se">patrik@frobbit.se</a>&gt; wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
All good comments Erik. Mark, I need to hear from you on the Unicode<br>
view on this. I have no problems changing according to what Erik<br>
suggests, as long as I get the &quot;correct&quot; names from you.<br>
<br>
 &nbsp; &nbsp;Patrik<br>
<div><div></div><div class="Wj3C7c"><br>
On 9 feb 2008, at 03.32, Erik van der Poel wrote:<br>
<br>
&gt; Patrik and Mark,<br>
&gt;<br>
&gt; I&#39;m reading tables-04 now. I noticed a few things that could be<br>
&gt; improved, in terms of standard, stable and unambiguous references to<br>
&gt; Unicode. This is important since IDNA200X is supposed to evolve with<br>
&gt; Unicode. We need to be able to generate the pvalid/disallowed/etc<br>
&gt; table every time Unicode releases a new version. So here are a few<br>
&gt; suggestions and questions:<br>
&gt;<br>
&gt; Standard. IDNA200X should use the standard names of Unicode properties<br>
&gt; and processes, and Unicode should try not to change those names. For<br>
&gt; example, tables-04 refers to NFKC(...) while Unicode calls that<br>
&gt; toNFKC(...):<br>
&gt;<br>
&gt; <a href="http://www.unicode.org/reports/tr15/#Notation" target="_blank">http://www.unicode.org/reports/tr15/#Notation</a><br>
&gt;<br>
&gt; There is another function called isNFKC(...), so it would be nice to<br>
&gt; get the right one (toNFKC).<br>
&gt;<br>
&gt; Stable. IDNA200X should use stable references to Unicode documents,<br>
&gt; and Unicode should make sure those references keep working. For<br>
&gt; example, the normalization spec mentioned above could be referenced<br>
&gt; using the stable URI:<br>
&gt;<br>
&gt; <a href="http://www.unicode.org/reports/tr15/" target="_blank">http://www.unicode.org/reports/tr15/</a><br>
&gt;<br>
&gt; Unambiguous. IDNA200X should use unambiguous names, and Unicode should<br>
&gt; offer them. For example, tables-04 refers to casefold(...). Unicode<br>
&gt; has something called Case_Folding(c) that only applies to single<br>
&gt; characters:<br>
&gt;<br>
&gt; <a href="http://www.unicode.org/versions/Unicode5.0.0/ch03.pdf" target="_blank">http://www.unicode.org/versions/Unicode5.0.0/ch03.pdf</a><br>
&gt;<br>
&gt; Unicode also has something called toCasefolding(x) for strings of<br>
&gt; characters on page 125 of the above chapter, labelled R4. However, the<br>
&gt; paragraph above that says that there is a simple and a full variant of<br>
&gt; that. IDNA200X needs the string function (not the single character<br>
&gt; function) in the &quot;NFKC(casefold(NFKC(cp)) != cp&quot; construct. I believe<br>
&gt; IDNA200X also needs the full variant, not the simple variant. But<br>
&gt; Unicode does not appear to have an unambiguous name for the full<br>
&gt; variant of the function that works on strings. (Or, if R4 *is* the<br>
&gt; full variant, the paragraph above it needs tweaking.) In the meantime,<br>
&gt; IDNA200X can disambiguate it by explicitly saying that<br>
&gt; toCasefolding(...) refers to the full variant.<br>
&gt;<br>
&gt; Yes, this is just nit-picking, but at least we have gotten to the<br>
&gt; point where we&#39;re just tweaking the IDNA200X drafts! We&#39;re nearly<br>
&gt; done. :-)<br>
&gt;<br>
&gt; Erik<br>
</div></div>&gt; _______________________________________________<br>
&gt; Idna-update mailing list<br>
&gt; <a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
&gt; <a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
<br>
<br>_______________________________________________<br>
Idna-update mailing list<br>
<a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
<a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
<br></blockquote></div><br><br clear="all"><br>-- <br>Mark