I&#39;m on vacation this week, but will respond when I get back to work.<br><br>I do know that in the test we are handling both the unescaped representation (å) and the escaped representation (%C3%A5), so we&#39;ll have to break the figures apart.
<br><br>Mark<br><br><div><span class="gmail_quote">On 4/4/07, <b class="gmail_sendername">Harald Alvestrand</b> &lt;<a href="mailto:harald@alvestrand.no">harald@alvestrand.no</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Mark Davis wrote:<br>&gt;<br>&gt;<br>&gt; On 3/15/07, *John C Klensin* &lt;<a href="mailto:klensin@jck.com">klensin@jck.com</a><br>&gt; &lt;mailto:<a href="mailto:klensin@jck.com">klensin@jck.com</a>&gt;&gt; wrote:<br>&gt;
<br>&gt; [snip]<br>&gt;<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; I&#39;m trying to understand this experiment.&nbsp;&nbsp;Normally, an href<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; that &quot;uses IDNA&quot; would have Punycode labels (A-labels) in its<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; domain names.<br>&gt;<br>
&gt;<br>&gt; I don&#39;t know the basis for saying that this would be the &quot;normal&quot;<br>&gt; usage. There isn&#39;t anything in IDNA2003, unless I&#39;m missing something,<br>&gt; that requires or even suggests that it is not perfectly fine to have:
<br>&gt;<br>&gt; &lt;a href=&quot;<a href="http://ÖBB.at">http://ÖBB.at</a> &lt;http://%C3%96BB.at&gt;&quot;&gt;Österreichishe Bundesbahn&lt;/a&gt;<br>That text is in the HTML spec.<br><br>All versions of HTML that claim that the stuff inside a &quot;href=&quot; is an
<br>URI (rather than an IRI) implicitly claim that the domain name is in<br>A-label form.<br>I&#39;m not up to date on HTML updates, but RFC 3987 was published in<br>January 2005, so all versions older than that (including HTML 
4.01)<br>referenced URIs.<br><br>After a little searching, I found that details on the recommended way of<br>handling those errors are in<br>&lt;<a href="http://www.w3.org/TR/html401/appendix/notes.html#non-ascii-chars">http://www.w3.org/TR/html401/appendix/notes.html#non-ascii-chars
</a>&gt; - but<br>they&#39;re still errors.<br><br>Do you have stats on how many of the 831.000 cases you identified were<br>in A-label form rather than &quot;possibly conformant U-label&quot; form? That<br>would tell us something about how much standards are adhered to....
<br><br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Harald<br><br><br></blockquote></div><br><br clear="all"><br>-- <br>Mark