<div dir="ltr">Ken, <div><br></div><div>your argument seems to be based on linguistic grounds and this I can accept but I continue to be concerned about the consequences of the use of these two character-forming mechanisms in the domain name system. As i think we all know, domain names are NOT language. At best, they are collections of characters drawn from ASCII or from Unicode. The consequence of this observation is that we have an obligation to think about the ways in which such characters may be used <i>in domain names</i> and the hazards that might be encountered or avoided, depending on the rules we pick to deal with this case (among others). </div>
<div><br></div><div>Matching rules, phishing opportunities and other phenomena lie at the center of the application of the richness of Unicode to the identifier space of domain names. Surely we want to observe the Principle of Least Astonishment in these situations?</div>
<div><br></div><div>v</div><div><br></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Thu, Aug 7, 2014 at 5:47 PM, Whistler, Ken <span dir="ltr"><<a href="mailto:ken.whistler@sap.com" target="_blank">ken.whistler@sap.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Paul Hoffmann asserted:<br>
<div class=""><br>
> Right. To me, the current processing under NFC is the wrong result. Andrew<br>
> was a bit polite at the end of his message, but it sounds to me that he thinks<br>
> the NFC processing for the new character leads to the wrong result when<br>
> compared to earlier NFC processing.<br>
<br>
</div>The issue for the table update comes down to that.<br>
<br>
I think it is quite clear, however, that it is not the case that "the current processing<br>
<div class="">under NFC is the wrong result".<br>
<br>
</div>The premises of this argument all come down to implicit (or<br>
occasionally explicit) assertions that the beh-with-hamza encoded<br>
for the Fula implosive b is the *same* character as an existing<br>
Arabic beh character followed by the combining Hamza mark.<br>
<br>
They are *NOT* the same. And *if* they are not the same, all the<br>
arguments about NFC being wrong, etc., are pointless.<br>
<br>
These implicit assertions that the beh-with Hamza and the sequence<br>
*ARE* the same are as beside the point as heading down the road<br>
of citing any number of other possible once similarities in appearance:<br>
for example, claiming that U+063A ARABIC LETTER GHAIN is the *SAME*<br>
character as U+0639 ARABIC LETTER AIN + U+0307 COMBINING DOT<br>
ABOVE sequence, because the atomic character and that sequence<br>
might look the same.<br>
<span class="HOEnZb"><font color="#888888"><br>
--Ken<br>
</font></span><div class="HOEnZb"><div class="h5"><br>
<br>
<br>
_______________________________________________<br>
Idna-update mailing list<br>
<a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
<a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
</div></div></blockquote></div><br></div>