<font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1"><br clear="all">Mark<br><br><i>— Il meglio è l’inimico del bene —</i><br>
<br><br></font><div class="gmail_quote"><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1">On Thu, Jan 27, 2011 at 03:19, Simon Josefsson <span dir="ltr"><<a href="mailto:simon@josefsson.org">simon@josefsson.org</a>></span> wrote:<br>
</font><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;"><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1">Mark Davis ☕ <<a href="mailto:mark@macchiato.com">mark@macchiato.com</a>> writes:<br>

<br>
>> Thank you, I'm now going through these against my implementation.<br>
>> However, shouldn't I also ignore the toUnicode column for all B tests?<br>
>><br>
><br>
> The B lines are valid for both T and N, so you should include them.<br>
<br>
Then I'm stuck, and I would appreciate clarification from everyone about<br>
what IDNA2008 is saying.  Your second test case is:<br>
<br>
B;      <a href="http://FASS.DE" target="_blank">FASS.DE</a>;        <a href="http://fass.de" target="_blank">fass.de</a>;        ;<br>
<br>
The only place (that I can find) where IDNA2008 converts to lower case<br>
is in the following paragraph:<br></font></blockquote><div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1"><br></font></div><div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1">Sorry I wasn't not clear; The second column is the "Source", which you need to ignore since you are not mapping.</font></div>
<div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1"><br></font></div><div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1">Let's take a couple of lines:</font></div>
<div><meta http-equiv="content-type" content="text/html; charset=utf-8"><pre style="word-wrap: break-word; white-space: pre-wrap; "><font class="Apple-style-span" size="1" face="'courier new', monospace">N;      Faß.de;        <a href="http://fass.de">faß.de</a>;     <a href="http://xn--fa-hia.de">xn--fa-hia.de</a>; 
</font></pre><div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1">You would only look at the 3rd and 4th columns for testing, so <span class="Apple-style-span" style="white-space: pre-wrap; "><a href="http://fass.de">faß.de</a> </span>and<span class="Apple-style-span" style="white-space: pre-wrap;"> <a href="http://xn--fa-hia.de">xn--fa-hia.de</a>.</span></font></div>
<div><meta http-equiv="content-type" content="text/html; charset=utf-8"><pre style="word-wrap: break-word; white-space: pre-wrap; "><meta http-equiv="content-type" content="text/html; charset=utf-8"><font class="Apple-style-span" size="1" face="'courier new', monospace">B; à.\u05D0\u0308;        ;       xn--0ca.xn--ssa73l
</font></pre></div><div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1">Logically, you only look at the 3rd and 4th columns here as well. However, blank columns just mean that the contents are the same (suppressed for space and readability), so the fully-fleshed out lines would be:</font></div>
<div><meta http-equiv="content-type" content="text/html; charset=utf-8"><div><pre style="word-wrap: break-word; white-space: pre-wrap; "><font class="Apple-style-span" size="1" face="'courier new', monospace">B;   à.\u05D0\u0308;        à.\u05D0\u0308;        xn--0ca.xn--ssa73l</font></pre>
</div></div></div><div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1">If you think this convention is more trouble than it is worth, let us know. For the line that you list</font></div><div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1"><br>
</font></div><div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1"><meta http-equiv="content-type" content="text/html; charset=utf-8">B;      <a href="http://fass.de/" target="_blank">FASS.DE</a>;        <a href="http://fass.de/" target="_blank">fass.de</a>;        ;</font></div>
<div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1"><br></font></div><div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1">it would go to </font></div><div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1"><br>
</font></div><div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1"><meta http-equiv="content-type" content="text/html; charset=utf-8">B;      <a href="http://fass.de/" target="_blank">FASS.DE</a>;        <a href="http://fass.de/" target="_blank">fass.de</a>;        </font><span class="Apple-style-span" style="font-family: arial, helvetica, sans-serif; font-size: x-small; "><a href="http://fass.de/" target="_blank">FASS.DE</a></span><span class="Apple-style-span" style="font-family: arial, helvetica, sans-serif; font-size: x-small; ">;</span></div>
<meta http-equiv="content-type" content="text/html; charset=utf-8"><div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1"><br></font></div><div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1">I'll have to look at that particular instance to see why the casing looks odd in column 4.</font></div>
<div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1"><br></font></div><div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1">The other take-away I have from this is that we need to have clearer instructions for those who want to use the file, and that do not support mapping. I'll add that to a list of feedback for the committee. </font></div>
<div><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1"><br></font></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
<font class="Apple-style-span" face="arial, helvetica, sans-serif" size="1"><br>
   5.3.  A-label Input<br>
<br>
   If the input to this procedure appears to be an A-label (i.e., it<br>
   starts in "xn--", interpreted case-insensitively), the lookup<br>
   application MAY attempt to convert it to a U-label, first ensuring<br>
   that the A-label is entirely in lowercase (converting it to lowercase<br>
   if necessary), and apply the tests of Section 5.4 and the conversion<br>
   of Section 5.5 to that form.  If the label is converted to Unicode<br>
   (i.e., to U-label form) using the Punycode decoding algorithm, then<br>
   the processing specified in those two sections MUST be performed, and<br>
   the label MUST be rejected if the resulting label is not identical to<br>
   the original.  See Section 8.1 of the Rationale document [RFC5894]<br>
   for additional discussion on this topic.<br>
<br>
However "<a href="http://FASS.DE" target="_blank">FASS.DE</a>" is not an A-label.<br>
<br>
Is there anything else in IDNA2008 that lower case labels?<br>
<br>
Further, I don't interpret the above to cause case conversion of the<br>
string looked up in DNS.  I only interprete it as converting it to lower<br>
case for the purpose of comparing with the output from the Punycode<br>
output.  It would be nice if someone could confirm or reject this<br>
interpretation as well.<br>
<br>
Since your test vectors aren't written in the form of test vectors for<br>
IDNA2008, it is difficult for me to understand whether this is caused by<br>
something in TR46 (which I don't implement) or just an misunderstanding<br>
on my or your side.<br>
<font color="#888888"><br>
/Simon<br>
</font></font></blockquote></div><br>