<div dir="ltr">To help show the similarity of the cases, please see the note under the U+0654 ARABIC HAMZA ABOVE character in Unicode 7.0 charts:<div><br></div><div><div>• restricted to hamza and ezafe semantics</div><div>
• is not used as a diacritic to form new letters</div></div><div><br></div><div>This is similar to U+0615 ARABIC SMALL HIGH TAH:</div><div><br></div><div><div>• should not be confused with the small TAH</div><div>sign used as a diacritic for some letters such as</div>
<div>0679 ٹ</div></div><div><br></div><div>... and various other characters, such as U+065A and U+065B.</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Mon, Aug 11, 2014 at 12:09 PM, Roozbeh Pournader <span dir="ltr"><<a href="mailto:roozbeh@google.com" target="_blank">roozbeh@google.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div class="gmail_extra"><div class="gmail_quote"><div class="">On Mon, Aug 11, 2014 at 11:11 AM, Paul Hoffman <span dir="ltr"><<a href="mailto:paul.hoffman@vpnc.org" target="_blank">paul.hoffman@vpnc.org</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div>Until two months ago, they couldn't use the character in question in any written text.<br></div></blockquote>

<div><br></div></div><div>That's not true.</div><div><br></div><div>The character was approved at the UTC meeting of February 2011. The SIL representatives who needed the character urgently were promised at the meeting that Unicode would not change the codepoint, so they could start using the character immediately. So in reality, they had three years and a half.</div>

<div><br></div><div>Also, the character has been a part of ISO/IEC 10646 since Amendment 1 to the 2012 edition which was published in April 2013. It was frozen in that standard much earlier before that too.</div><div class="">
<div><br>
</div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div>
> Unicode is full of confusable characters and character sequences (with no canonical or compatibility decomposition pointing to them). Using a canonical or compatibility decomposition mechanism only for finding such cases doesn't make sense, nor does singling out some more obvious cases of such confusables.<br>


<br>
</div>That seems like a non sequitur because the draft never talks about "confusable". It talks about issues of composition. Given that difference, do you still highly object to the draft based on its contents?<br>

</blockquote><div><br></div></div><div>Definitely. There is no difference. The issue that the draft is calling "composition" existed with the Arabic characters (and characters in several other scripts) long before this character, and several other new Unicode 7.0 characters expose such a behavior.</div>

<div><br></div><div>In short, U+08A1 is not exposing a composition issue, but a confusability issue. The draft does not reflect the problem with a good understanding of the Unicode model (for Arabic and other scripts). The problem with U+08A1 is no different than, say, U+0692, used in Kurdish that could be perceived to be composed of U+0631 and U+065A.</div>

<div><br></div><div>Please explain how U+08A1 is different from U+0692 with regard to "composition".</div></div></div></div>
</blockquote></div><br></div>