<div dir="ltr">i had something different in mind. What was key to IDNA2008 was the uniqueness of the UNICODE/PUNYCODE representations. Essentially, after normalization, one expects that the two strings are unambiguously equivalent. mapping from normalized unicode to punycode and back should produce the same (character for character) string. The problem that the Hamza discussion illustrates, as I understand it, is that there is no normalization that produces this result if one string uses the combined character and another uses the composed character sequence - no normalization produces an unambiguous result. <div><br></div><div>v</div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jan 28, 2015 at 3:43 AM, Mark Davis ☕️ <span dir="ltr"><<a href="mailto:mark@macchiato.com" target="_blank">mark@macchiato.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div class="gmail_extra"><span class=""><br><div class="gmail_quote">On Wed, Jan 28, 2015 at 9:20 AM, Vint Cerf <span dir="ltr"><<a href="mailto:vint@google.com" target="_blank">vint@google.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div>I am reading your message as saying "ambiguity is ok if there are few instances of it" while some of us would like the handling of identifiers encoded with Unicode to be unambiguous. </div><div><div></div></div></blockquote></div><br></span><div class="gmail_default"><font face="times new roman, serif">The sense of "unambiguous" that matters to users is that when they read a sequence of glyphs, their interpretation of the underlying character sequence is correct (in normal environments, with common fonts).</font></div><div class="gmail_default"><font face="times new roman, serif"><br></font></div><div class="gmail_default"><font face="times new roman, serif">That level of "unambiguous" was impossible, even before Unicode.</font></div><div class="gmail_default"><font face="times new roman, serif"><br></font></div><div class="gmail_default"><font face="times new roman, serif">Take 8859-5, with both o and Russian o, or ASCII with "google.corn" vs "<a href="http://goog1e.com" target="_blank">goog1e.com</a>". [Both the 1 and lowercase L are an issue, but also in many fonts—in common use—users will read the (r + n) in the former as an m.]</font></div><div class="gmail_default"><font face="times new roman, serif"><br></font></div><div class="gmail_default"><font face="times new roman, serif">To extend Andrew's death analogy, there is no way that we can all live forever. However, there are clearly medical processes and social policies that can improve and extend the years that we all have. But to be productive, the focus needs to be on the big ticket items, and thus needs to be prioritized by real data.</font></div><span class=""><div><div><div dir="ltr"><font face="'times new roman', serif"><div style="margin:0px;background-color:transparent"><div></div></div><div style="margin:0px;background-color:transparent"><br></div><div style="margin:0px;background-color:transparent"><a href="https://google.com/+MarkDavis" target="_blank">Mark</a></div><div style="margin:0px;background-color:transparent"><i><br></i></div><div style="margin:0px;background-color:transparent"><i>— Il meglio è l’inimico del bene —</i></div></font><div><div><font face="'times new roman', serif"><i><span style="font-style:normal"><i></i></span><i></i></i></font></div></div></div></div></div>
</span></div></div>
</blockquote></div><br></div>