I think the issue is around what is meant by &quot;storage&quot;. Look at a snippet of text:<br><br>href=&quot;<a href="http://xn--mxabir3a6f.el/" target="_blank">http://εύβοια.el</a>&quot;<br><br>I just stored both of those URLs. Where? Well, in my GMail storage, in the idna message archive, on my machine (in Gears), on any recipient&#39;s machine (until deleted), eventually in the search engine caches, and the wayback machine. Should I have not sent it because it is a U-Label, and thus be stored in thousands of locations? Well, if I thought enough of the storage locations would be used by IDNA-unaware implementations, and I wanted to ensure that they worked, then maybe yes. But if not, it is readable, and thus far more usable to more people to use the regular Unicode characters.<br>

<br>In the example I cited, the database stores URLs, but it is, itself, not IDNA aware. It just knows that they are strings. It *never* does DNS lookup itself. The documentation of the database can say that those are URLs that use IDNA (RFC...). It is then up to programs accessing that database to do something sensible with them. We see this all over the place. What&#39;s better to store, the BCP47 region code &quot;419&quot; or the string &quot;Latin America&quot;. The former is precise, can be directly translated and compared by any program that deals with BCP47 codes. And no matter what the language, the region code 419 means the same tying (assuming you know the standard it adheres to.) But the latter makes more sense in lots of situations.<br>
<br clear="all">
Mark<br>
<br><br><div class="gmail_quote">On Thu, Apr 2, 2009 at 08:56, Vint Cerf <span dir="ltr">&lt;<a href="mailto:vint@google.com" target="_blank">vint@google.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">


<p><font color="navy" face="Arial" size="2">
Mark, I think I see where we may disconnect. <br><br>First for the idna2008 definition that the U-label and A-label forms are equivalent AND the application (database, other) is IDN-aware, I agree that either form works and that U-label has some benefit. For any application that is not IDN-aware, I would have to assume that a U-label form would not be recognized as a valid label. So my concern is for assuring we don&#39;t break IDN-unaware applications. <br>


<br>V</font></p>
<p></p><hr align="center" size="2" width="100%">
<font face="Tahoma" size="2">
<b>From</b>: <a href="mailto:mark.edward.davis@gmail.com" target="_blank">mark.edward.davis@gmail.com</a> 
<br><b>To</b>: Vint Cerf
<br><b>Cc</b>: <a href="mailto:ajs@shinkuro.com" target="_blank">ajs@shinkuro.com</a> ; <a href="mailto:harald@alvestrand.no" target="_blank">harald@alvestrand.no</a> ; <a href="mailto:duerst@it.aoyama.ac.jp" target="_blank">duerst@it.aoyama.ac.jp</a> ; <a href="mailto:idna-update@alvestrand.no" target="_blank">idna-update@alvestrand.no</a> 
<br><b>Sent</b>: Thu Apr 02 08:36:51 2009<div><br><b>Subject</b>: Re: Touchstones for &quot;Mapping&quot;
<br></div></font>
<br>Mark<br><div><br>On Thu, Apr 2, 2009 at 07:45, Vint Cerf &lt;<a href="mailto:vint@google.com" target="_blank">vint@google.com</a>&gt; wrote:<br>&gt; mark, my point was that under the rules of IDN, you can convert from A-Label<br>


&gt; to U-label with assurance of precision. So you can cater to human<br>
&gt; readability. Storing in U-label for doesn&#39;t work for non-IDN aware<br>&gt; applications and might even confuse them. This is a presentation issue<br>&gt; surely?<br><br>\x{49}\x{20}\x{63}\x{6F}\x{75}\x{6C}\x{64}\x{20}\x{77}\x{72}\x{69}\x{74}\x{65}\x{20}\x{74}\x{68}\x{69}\x{73}\x{20}\x{69}\x{6E}\x{20}\x{68}\x{65}\x{78}\x{20}\x{63}\x{6F}\x{64}\x{65}\x{73}\x{2E} (I could write this in hex codes.) Using those hex codes is just a presentation issue as well; but what is best for storage depends on the context.<br>



<br>We all agree that A-Labels and U-Labels are equivalent. And clearly you have to convert to A-Labels before doing a DNS lookup. But up until that point, it is an open issue as to what makes more sense for particular implemenations. For data that might be fed directly to an IDNA unaware application, A-Label is clearly the best. For the database example, on the other hand, it makes no sense to store an A-Label -- it just makes every level of interaction more complicated than it need be; a U-Label is best for storage. It just needs to be converted to an A-Label at some time before a DNS lookup.<br>



<br>So I think the most we can say in the document is something like: <br><br></div><div><div style="margin-left: 40px;">Implementations SHOULD store A-Labels or U-Labels, and SHOULD NOT store M-Labels. Where the stored labels are to be channeled unaltered to IDNA-unaware implementations, the storage SHOULD be A-Labels.<br>



</div><br>While that needs some wordsmithing, does the direction work for you?<br><br>&gt;<br></div><div>&gt; v<br>&gt;<br>&gt;<br>&gt; Vint Cerf<br>&gt; Google<br>&gt; 1818 Library Street, Suite 400<br>&gt; Reston, VA 20190<br>


&gt; 202-370-5637<br>
&gt; <a href="mailto:vint@google.com" target="_blank">vint@google.com</a><br>&gt;<br>&gt;<br>&gt;<br>&gt;<br>&gt; On Apr 2, 2009, at 10:33 AM, Mark Davis wrote:<br>&gt;<br></div><div><div></div><div>&gt;&gt; I think the main storage benefits are human readability. It is much<br>



&gt;&gt; easier to read:<br>&gt;&gt;<br>&gt;&gt; href=&quot;<a href="http://xn--mxabir3a6f.el" target="_blank">http://εύβοια.el</a>&quot;<br>&gt;&gt; rather than<br>&gt;&gt; href=&quot;<a href="http://xn--mxabir3a6f.el" target="_blank">http://xn--mxabir3a6f.el</a>&quot;<br>



&gt;&gt;<br>&gt;&gt; or in some XML:<br>&gt;&gt;<br>&gt;&gt; &lt;url&gt;<a href="http://xn--mxabir3a6f.el" target="_blank">http://εύβοια.el</a>&lt;/url&gt;<br>&gt;&gt; rather than<br>&gt;&gt; &lt;url&gt;<a href="http://xn--mxabir3a6f.el" target="_blank">http://xn--mxabir3a6f.el</a>&lt;/url&gt;<br>



&gt;&gt;<br>&gt;&gt; But there are other issues: URL&#39;s are stored all over the place. If I<br>&gt;&gt; have one in an SQL database, I want to be able to do a SELECT Data<br>&gt;&gt; WHERE Url LIKE &#39;<a href="http://xn--mxabir3a6f" target="_blank">http://εύβοια</a>%&#39; and not &#39;<a href="http://xn--mxabir3a6f" target="_blank">http://xn--mxabir3a6f</a>%&#39;.<br>



&gt;&gt;<br>&gt;&gt; And there are formal problems, because substrings in Unicode space<br>&gt;&gt; don&#39;t match substrings in PunyCode space. that if my URL were<br>&gt;&gt; &quot;<a href="http://xn----vlbedmcdb5a7bjigbc9jyd.el" target="_blank">http://εύβοια-ξενοδοχείο.el</a>&quot; (a made up example), then its A-Label<br>



&gt;&gt; form is &quot;<a href="http://xn----vlbedmcdb5a7bjigbc9jyd.el" target="_blank">http://xn----vlbedmcdb5a7bjigbc9jyd.el</a>&quot;. The SELECT of<br>&gt;&gt; &#39;<a href="http://xn--mxabir3a6f" target="_blank">http://xn--mxabir3a6f</a>%&#39; would fail. Moreover, Url LIKE<br>



&gt;&gt; &#39;xn--mxabir3a6f%&#39; can even return false results, strings whose U-Label<br>&gt;&gt; doesn&#39;t start with &#39;<a href="http://xn--mxabir3a6f" target="_blank">http://εύβοια</a>%&#39;<br>&gt;&gt;<br>&gt;&gt; Mark<br>


&gt;&gt;<br>
&gt;&gt; On Thu, Apr 2, 2009 at 05:50, Vint Cerf &lt;<a href="mailto:vint@google.com" target="_blank">vint@google.com</a>&gt; wrote:<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; Martin,<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; I continue to be somewhat confused by logic that suggests that storage<br>



&gt;&gt;&gt; benefits from being in the U-label form.   A-labels are almost de facto<br>&gt;&gt;&gt; normative since they work withIDN-aware and IDN-unaware appllications.<br>&gt;&gt;&gt; IDN-aware applications should be able to generate the corresponding U-label<br>



&gt;&gt;&gt; for presentation. IdN-unaware applications. Won&#39;t even recognize a U-label<br>&gt;&gt;&gt; domain name as valid IWoild think. Consequently, storage in A-label form<br>&gt;&gt;&gt; seems the rational choice. If you disagree, it must be because you see a<br>



&gt;&gt;&gt; flaw in the reasoning above. Can you clarify? V<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; ----- Original Message -----<br>&gt;&gt;&gt; From: <a href="mailto:idna-update-bounces@alvestrand.no" target="_blank">idna-update-bounces@alvestrand.no</a><br>



&gt;&gt;&gt; &lt;<a href="mailto:idna-update-bounces@alvestrand.no" target="_blank">idna-update-bounces@alvestrand.no</a>&gt;<br>&gt;&gt;&gt; To: Harald Alvestrand &lt;<a href="mailto:harald@alvestrand.no" target="_blank">harald@alvestrand.no</a>&gt;<br>



&gt;&gt;&gt; Cc: Andrew Sullivan &lt;<a href="mailto:ajs@shinkuro.com" target="_blank">ajs@shinkuro.com</a>&gt;; <a href="mailto:idna-update@alvestrand.no" target="_blank">idna-update@alvestrand.no</a><br>&gt;&gt;&gt; &lt;<a href="mailto:idna-update@alvestrand.no" target="_blank">idna-update@alvestrand.no</a>&gt;<br>



&gt;&gt;&gt; Sent: Thu Apr 02 03:37:30 2009<br>&gt;&gt;&gt; Subject: Re: Touchstones for &quot;Mapping&quot;<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; There are two sides here, the protocol correctness and<br>&gt;&gt;&gt; the content correctness. By content correctness, I mean<br>



&gt;&gt;&gt; whether the link e.g. goes to the intended page.<br>&gt;&gt;&gt; Completely impossible to check with punycode, of course.<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; Regards,   Martin.<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; On 2009/04/02 16:56, Harald Alvestrand wrote:<br>



&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; Martin J. Dürst wrote:<br>&gt;&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt;&gt; I very much agree with Harald. We are working on IDNs because we want<br>&gt;&gt;&gt;&gt;&gt; humans to be able to easily read domain names in their script. Storing<br>



&gt;&gt;&gt;&gt;&gt; them as A-Labels when there is a reasonable chance that humans will<br>&gt;&gt;&gt;&gt;&gt; have a look at them (e.g. in HTML or XML source, email source,...)<br>&gt;&gt;&gt;&gt;&gt; is against the very intent of IDNs. Authors are humans, too, even<br>



&gt;&gt;&gt;&gt;&gt; if they work on plain text :-!<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; I can argue the other side of the argument for HTML and XML, though.....<br>&gt;&gt;&gt;&gt; the main thing being that humans who *enter* IDNs in Unicode form<br>



&gt;&gt;&gt;&gt; without the benefit of conformance-enforcing software interfaces will<br>&gt;&gt;&gt;&gt; just about always get them wrong (due to bizarrities of case,<br>&gt;&gt;&gt;&gt; compatibility characters and other weirdnesses).<br>



&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; If they enter A-labels by hand, it&#39;s pretty certain they&#39;ve<br>&gt;&gt;&gt;&gt; cut-and-pasted them.<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt;              Harald<br>&gt;&gt;&gt;&gt;<br>



&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; _______________________________________________<br></div></div><div>&gt;&gt;&gt;&gt; Idna-update mailing list<br>&gt;&gt;&gt;&gt; <a href="mailto:Idna-update@alvestrand.no" target="_blank">Idna-update@alvestrand.no</a><br>



&gt;&gt;&gt;&gt; <a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;<br></div><div>&gt;&gt;&gt; --<br>


&gt;&gt;&gt; #-# Martin J.Dürst, Professor, Aoyama Gakuin University<br>
&gt;&gt;&gt; #-# <a href="http://www.sw.it.aoyama.ac.jp" target="_blank">http://www.sw.it.aoyama.ac.jp</a>   mailto:<a href="mailto:duerst@it.aoyama.ac.jp" target="_blank">duerst@it.aoyama.ac.jp</a><br>&gt;&gt;&gt; _______________________________________________<br>


</div><div><div></div><div>
&gt;&gt;&gt; Idna-update mailing list<br>&gt;&gt;&gt; <a href="mailto:Idna-update@alvestrand.no" target="_blank">Idna-update@alvestrand.no</a><br>&gt;&gt;&gt; <a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>



&gt;&gt;&gt; _______________________________________________<br>&gt;&gt;&gt; Idna-update mailing list<br>&gt;&gt;&gt; <a href="mailto:Idna-update@alvestrand.no" target="_blank">Idna-update@alvestrand.no</a><br>&gt;&gt;&gt; <a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>



&gt;&gt;&gt;<br>&gt;&gt; _______________________________________________<br>&gt;&gt; Idna-update mailing list<br>&gt;&gt; <a href="mailto:Idna-update@alvestrand.no" target="_blank">Idna-update@alvestrand.no</a><br>&gt;&gt; <a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>



&gt;<br>&gt;<br><br>
</div></div><br>_______________________________________________<br>
Idna-update mailing list<br>
<a href="mailto:Idna-update@alvestrand.no" target="_blank">Idna-update@alvestrand.no</a><br>
<a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
<br></blockquote></div><br>