<font face="georgia,serif"><br clear="all"></font><font face="georgia, serif">Mark<br><br><i>— Il meglio è l’inimico del bene —</i></font><br>
<br><br><div class="gmail_quote">On Tue, Jan 25, 2011 at 14:37, Simon Josefsson <span dir="ltr"><<a href="mailto:simon@josefsson.org">simon@josefsson.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
<div class="im">Mark Davis ☕ <<a href="mailto:mark@macchiato.com">mark@macchiato.com</a>> writes:<br>
<br>
> For the next version of UTS46, the UTC is introducing additional fields in<br>
> its test files that indicate whether the strings are valid in IDNA2008, so<br>
> you could take a look at those (currently in draft state).<br>
><br>
> <a href="http://www.unicode.org/review/#pri177" target="_blank">http://www.unicode.org/review/#pri177</a><br>
><br>
> The draft test file is at<br>
> <a href="http://www.unicode.org/Public/idna/6.0.1/IdnaTest.txt" target="_blank">http://www.unicode.org/Public/idna/6.0.1/IdnaTest.txt</a><br>
><br>
> You would skip the lines starting with T, since those are only relevant for<br>
> transitional implementations. If you use the files and find any issues, let<br>
> me know and I can funnel the feedback back to the UTC.<br>
<br>
</div>Thank you, I'm now going through these against my implementation.<br>
However, shouldn't I also ignore the toUnicode column for all B tests?<br></blockquote><div><br></div><div>The B lines are valid for both T and N, so you should include them.</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

<br>
That is, for a IDNA2008 implementation with no mapping support, the<br>
useful test vectors are the toASCII columns of all lines, and all<br></blockquote><div><br></div><div>You would ignore any line with an error in the toUnicode column, or that has T in the Type column.</div><div><br></div>
<div>With no mapping, you wouldn't test the Source column value. What you'd do is see that the toAscii and to toUnicode values mapped back and forth. (However, you would _use_ the value in the Source column if either were empty.)</div>
<div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
columns of the N lines.<br>
<div><div></div><div class="h5"><br>
/Simon<br>
_______________________________________________<br>
Idna-update mailing list<br>
<a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
<a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
</div></div></blockquote></div><br>