<br>Mark<br><br>On Thu, Apr 2, 2009 at 07:45, Vint Cerf &lt;<a href="mailto:vint@google.com">vint@google.com</a>&gt; wrote:<br>&gt; mark, my point was that under the rules of IDN, you can convert from A-Label<br>&gt; to U-label with assurance of precision. So you can cater to human<br>
&gt; readability. Storing in U-label for doesn&#39;t work for non-IDN aware<br>&gt; applications and might even confuse them. This is a presentation issue<br>&gt; surely?<br><br>\x{49}\x{20}\x{63}\x{6F}\x{75}\x{6C}\x{64}\x{20}\x{77}\x{72}\x{69}\x{74}\x{65}\x{20}\x{74}\x{68}\x{69}\x{73}\x{20}\x{69}\x{6E}\x{20}\x{68}\x{65}\x{78}\x{20}\x{63}\x{6F}\x{64}\x{65}\x{73}\x{2E} (I could write this in hex codes.) Using those hex codes is just a presentation issue as well; but what is best for storage depends on the context.<br>
<br>We all agree that A-Labels and U-Labels are equivalent. And clearly you have to convert to A-Labels before doing a DNS lookup. But up until that point, it is an open issue as to what makes more sense for particular implemenations. For data that might be fed directly to an IDNA unaware application, A-Label is clearly the best. For the database example, on the other hand, it makes no sense to store an A-Label -- it just makes every level of interaction more complicated than it need be; a U-Label is best for storage. It just needs to be converted to an A-Label at some time before a DNS lookup.<br>
<br>So I think the most we can say in the document is something like: <br><br><div style="margin-left: 40px;">Implementations SHOULD store A-Labels or U-Labels, and SHOULD NOT store M-Labels. Where the stored labels are to be channeled unaltered to IDNA-unaware implementations, the storage SHOULD be A-Labels.<br>
</div><br>While that needs some wordsmithing, does the direction work for you?<br><br>&gt;<br>&gt; v<br>&gt;<br>&gt;<br>&gt; Vint Cerf<br>&gt; Google<br>&gt; 1818 Library Street, Suite 400<br>&gt; Reston, VA 20190<br>&gt; 202-370-5637<br>
&gt; <a href="mailto:vint@google.com">vint@google.com</a><br>&gt;<br>&gt;<br>&gt;<br>&gt;<br>&gt; On Apr 2, 2009, at 10:33 AM, Mark Davis wrote:<br>&gt;<br>&gt;&gt; I think the main storage benefits are human readability. It is much<br>
&gt;&gt; easier to read:<br>&gt;&gt;<br>&gt;&gt; href=&quot;<a href="http://xn--mxabir3a6f.el">http://εύβοια.el</a>&quot;<br>&gt;&gt; rather than<br>&gt;&gt; href=&quot;<a href="http://xn--mxabir3a6f.el">http://xn--mxabir3a6f.el</a>&quot;<br>
&gt;&gt;<br>&gt;&gt; or in some XML:<br>&gt;&gt;<br>&gt;&gt; &lt;url&gt;<a href="http://xn--mxabir3a6f.el">http://εύβοια.el</a>&lt;/url&gt;<br>&gt;&gt; rather than<br>&gt;&gt; &lt;url&gt;<a href="http://xn--mxabir3a6f.el">http://xn--mxabir3a6f.el</a>&lt;/url&gt;<br>
&gt;&gt;<br>&gt;&gt; But there are other issues: URL&#39;s are stored all over the place. If I<br>&gt;&gt; have one in an SQL database, I want to be able to do a SELECT Data<br>&gt;&gt; WHERE Url LIKE &#39;<a href="http://xn--mxabir3a6f">http://εύβοια</a>%&#39; and not &#39;<a href="http://xn--mxabir3a6f">http://xn--mxabir3a6f</a>%&#39;.<br>
&gt;&gt;<br>&gt;&gt; And there are formal problems, because substrings in Unicode space<br>&gt;&gt; don&#39;t match substrings in PunyCode space. that if my URL were<br>&gt;&gt; &quot;<a href="http://xn----vlbedmcdb5a7bjigbc9jyd.el">http://εύβοια-ξενοδοχείο.el</a>&quot; (a made up example), then its A-Label<br>
&gt;&gt; form is &quot;<a href="http://xn----vlbedmcdb5a7bjigbc9jyd.el">http://xn----vlbedmcdb5a7bjigbc9jyd.el</a>&quot;. The SELECT of<br>&gt;&gt; &#39;<a href="http://xn--mxabir3a6f">http://xn--mxabir3a6f</a>%&#39; would fail. Moreover, Url LIKE<br>
&gt;&gt; &#39;xn--mxabir3a6f%&#39; can even return false results, strings whose U-Label<br>&gt;&gt; doesn&#39;t start with &#39;<a href="http://xn--mxabir3a6f">http://εύβοια</a>%&#39;<br>&gt;&gt;<br>&gt;&gt; Mark<br>&gt;&gt;<br>
&gt;&gt; On Thu, Apr 2, 2009 at 05:50, Vint Cerf &lt;<a href="mailto:vint@google.com">vint@google.com</a>&gt; wrote:<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; Martin,<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; I continue to be somewhat confused by logic that suggests that storage<br>
&gt;&gt;&gt; benefits from being in the U-label form.   A-labels are almost de facto<br>&gt;&gt;&gt; normative since they work withIDN-aware and IDN-unaware appllications.<br>&gt;&gt;&gt; IDN-aware applications should be able to generate the corresponding U-label<br>
&gt;&gt;&gt; for presentation. IdN-unaware applications. Won&#39;t even recognize a U-label<br>&gt;&gt;&gt; domain name as valid IWoild think. Consequently, storage in A-label form<br>&gt;&gt;&gt; seems the rational choice. If you disagree, it must be because you see a<br>
&gt;&gt;&gt; flaw in the reasoning above. Can you clarify? V<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; ----- Original Message -----<br>&gt;&gt;&gt; From: <a href="mailto:idna-update-bounces@alvestrand.no">idna-update-bounces@alvestrand.no</a><br>
&gt;&gt;&gt; &lt;<a href="mailto:idna-update-bounces@alvestrand.no">idna-update-bounces@alvestrand.no</a>&gt;<br>&gt;&gt;&gt; To: Harald Alvestrand &lt;<a href="mailto:harald@alvestrand.no">harald@alvestrand.no</a>&gt;<br>
&gt;&gt;&gt; Cc: Andrew Sullivan &lt;<a href="mailto:ajs@shinkuro.com">ajs@shinkuro.com</a>&gt;; <a href="mailto:idna-update@alvestrand.no">idna-update@alvestrand.no</a><br>&gt;&gt;&gt; &lt;<a href="mailto:idna-update@alvestrand.no">idna-update@alvestrand.no</a>&gt;<br>
&gt;&gt;&gt; Sent: Thu Apr 02 03:37:30 2009<br>&gt;&gt;&gt; Subject: Re: Touchstones for &quot;Mapping&quot;<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; There are two sides here, the protocol correctness and<br>&gt;&gt;&gt; the content correctness. By content correctness, I mean<br>
&gt;&gt;&gt; whether the link e.g. goes to the intended page.<br>&gt;&gt;&gt; Completely impossible to check with punycode, of course.<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; Regards,   Martin.<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; On 2009/04/02 16:56, Harald Alvestrand wrote:<br>
&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; Martin J. Dürst wrote:<br>&gt;&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt;&gt; I very much agree with Harald. We are working on IDNs because we want<br>&gt;&gt;&gt;&gt;&gt; humans to be able to easily read domain names in their script. Storing<br>
&gt;&gt;&gt;&gt;&gt; them as A-Labels when there is a reasonable chance that humans will<br>&gt;&gt;&gt;&gt;&gt; have a look at them (e.g. in HTML or XML source, email source,...)<br>&gt;&gt;&gt;&gt;&gt; is against the very intent of IDNs. Authors are humans, too, even<br>
&gt;&gt;&gt;&gt;&gt; if they work on plain text :-!<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; I can argue the other side of the argument for HTML and XML, though.....<br>&gt;&gt;&gt;&gt; the main thing being that humans who *enter* IDNs in Unicode form<br>
&gt;&gt;&gt;&gt; without the benefit of conformance-enforcing software interfaces will<br>&gt;&gt;&gt;&gt; just about always get them wrong (due to bizarrities of case,<br>&gt;&gt;&gt;&gt; compatibility characters and other weirdnesses).<br>
&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; If they enter A-labels by hand, it&#39;s pretty certain they&#39;ve<br>&gt;&gt;&gt;&gt; cut-and-pasted them.<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt;              Harald<br>&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; _______________________________________________<br>&gt;&gt;&gt;&gt; Idna-update mailing list<br>&gt;&gt;&gt;&gt; <a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
&gt;&gt;&gt;&gt; <a href="http://www.alvestrand.no/mailman/listinfo/idna-update">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; --<br>&gt;&gt;&gt; #-# Martin J.Dürst, Professor, Aoyama Gakuin University<br>
&gt;&gt;&gt; #-# <a href="http://www.sw.it.aoyama.ac.jp">http://www.sw.it.aoyama.ac.jp</a>   mailto:<a href="mailto:duerst@it.aoyama.ac.jp">duerst@it.aoyama.ac.jp</a><br>&gt;&gt;&gt; _______________________________________________<br>
&gt;&gt;&gt; Idna-update mailing list<br>&gt;&gt;&gt; <a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>&gt;&gt;&gt; <a href="http://www.alvestrand.no/mailman/listinfo/idna-update">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
&gt;&gt;&gt; _______________________________________________<br>&gt;&gt;&gt; Idna-update mailing list<br>&gt;&gt;&gt; <a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>&gt;&gt;&gt; <a href="http://www.alvestrand.no/mailman/listinfo/idna-update">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
&gt;&gt;&gt;<br>&gt;&gt; _______________________________________________<br>&gt;&gt; Idna-update mailing list<br>&gt;&gt; <a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>&gt;&gt; <a href="http://www.alvestrand.no/mailman/listinfo/idna-update">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
&gt;<br>&gt;<br><br>