<div dir="ltr">Sorry, email was "sent" while still drafting. Will send complete email in a few minutes.</div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jan 28, 2015 at 12:30 PM, Roozbeh Pournader <span dir="ltr"><<a href="mailto:roozbeh@google.com" target="_blank">roozbeh@google.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Wed, Jan 28, 2015 at 6:52 AM, Andrew Sullivan <span dir="ltr"><<a href="mailto:ajs@anvilwalrusden.com" target="_blank">ajs@anvilwalrusden.com</a>></span> wrote:<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span>
On Tue, Jan 27, 2015 at 09:51:34AM -0800, Roozbeh Pournader wrote:<br>
> It's very unfortunate, and I'd say ill-informed. The conclusions are not<br>
> supported by the claims<br>
<br>
</span>It would be very helpful to me if you could point out which statements<br>
are ill-informed or which conclusions are not supported by the<br>
premises in that statement.<br></blockquote><div><br></div><div>Sure. I thought I and other have done that. But let me try:</div><div><br></div><div>There are three major things wrong wrong with the final recommendations. As you were involved in the process, you can try to trace which is failed by which phase:</div><div><ul><li>Arabic letters which have absolutely no problem with normalization in Unicode, such as U+0624 ARABIC LETTER ALEF WITH HAMZA ABOVE are discouraged, with absolutely no difference in how Unicode treats them and how it treats U+00E4 LATIN SMALL LETTER A WITH DIAERESIS. Both characters are canonically decomposed to two proper pieces. The reasoning for discouraging U+0624 appears to be that it has hamza in it.</li><li>Other Arabic letters that have the exact confusability issues that U+08A1 ARABIC LETTER BEH WITH HAMZA ABOVE</li></ul></div><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Note also that the IAB can produce advice to others, but it doesn't<br>
have a police force.  I would not be the least surprised if, on<br>
reflection, someone creating an identifier using Arabic script decided<br>
to ignore the general advice in one particular case.  Your network,<br>
your rules, after all.<br></blockquote><div><br></div><div>Yes, but IAB is supposed to have done its homework. Others with not enough knowledge in the matter may defer to IAB's conclusions, as the document "appears" to be well-researched. So in practice, people may just block Yeh Hamza because they don't know better, and the poor Arabic users spread around the world would have a hard time finding.</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<span><br>
> Then, other characters in the Arabic script that have identical<br>
> confusability issues (I'll leave finding them as an exercise to the reader,<br>
> to minimize the damage to the script) are not listed.<br>
<br>
</span>I think this is extremely unfortunate, and I urge you to reconsider.<br>
The issue for the protocols is not going to go away on its own.  What<br>
you appear to be saying is that you know a whole bunch more<br>
Arabic-character cases like this, but you're not going to tell us what<br>
they are.  That sounds like a reason to avoid Arabic-script<br>
identifiers at all until a fuller evaluation is done, and I doubt very<br>
much that either of us wants that sort of suggestion floating around.<br>
And given that some people will be creating identifiers no matter<br>
what, isn't it better that they be doing so with a full appreciation<br>
of what risks might be involved?<br>
<span><br>
> On top of that, only Arabic script is excluded while such characters exist<br>
> in several other scripts, specially Latin.<br>
<br>
</span>Late in the process of drafting that statement, the<br>
Internationalization program became aware of some cases in Latin that,<br>
we _think_, may expose the same issues.  We have not done complete<br>
analysis, and in the interests of providing timely advice we decided<br>
to start with the cases we know.  But the statement does note that<br>
there are probably other cases.  If the various internationalization<br>
communities working in the IETF (on this mailing list, and in the<br>
nearly-complete PRECIS WG) turn to this issue urgently, then I imagine<br>
the IAB will think the IETF has it under control and will remain<br>
silent.  On the other hand, if the IAB (and the Internationalization<br>
program) completely grasps this issue for other characters and thinks<br>
there is significant risk that the issue can't or won't be addressed<br>
by the IETF community, then I'd hope the IAB would issue another<br>
statement listing those other characters also.<br>
<br>
I should note that when we first started exploring the issue, the<br>
informal response we got was, "_Hamza_ is special, read the Unicode<br>
Standard more closely."  And indeed, the Standard does seem initially<br>
to suggest that _Hamza_ is quite unlike other combining characters.<br>
That's the reason for the focus on _Hamza_.  It's quite an accident<br>
that it's only Arabic script; the issue is actually that Arabic is<br>
where _Hamza_ is, and nothing to do with Arabic as such.<br>
<span><br>
> I'll refrain from commenting further on the threads:<br>
<br>
</span>I urge you to reconsider.  We need greater participation and<br>
understanding in this area, not less.  It is precisely because of the<br>
low participation rates we've had in these i18n issues that we keep<br>
discovering problems late.<br>
<br>
Best regards,<br>
<span><br>
A<span class="HOEnZb"><font color="#888888"><br>
<br>
--<br>
Andrew Sullivan<br>
<a href="mailto:ajs@anvilwalrusden.com" target="_blank">ajs@anvilwalrusden.com</a><br>
</font></span></span><span class="HOEnZb"><font color="#888888"><div><div>_______________________________________________<br>
Idna-update mailing list<br>
<a href="mailto:Idna-update@alvestrand.no" target="_blank">Idna-update@alvestrand.no</a><br>
<a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
</div></div></font></span></blockquote></div><br></div></div>
</blockquote></div><br></div>