<br><br><div><span class="gmail_quote">On 6/13/07, <b class="gmail_sendername">Harald Tveit Alvestrand</b> &lt;<a href="mailto:harald@alvestrand.no">harald@alvestrand.no</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
The intent of &quot;MAYBE YES&quot; and &quot;MAYBE NO&quot; was:<br><br>- ALWAYS: We guarantee that these codepoints will be permitted in IDNs (at<br>this level of the standard).<br>- NEVER: We guarantee that these codepoints will never be permitted in IDNs
</blockquote><div>...<br><br>This is precisely the kind of information that belongs in Patrik&#39;s <span id="st" name="st" class="st">draft</span>.
Without a model of the intended usage, it is impossible to assess the
structure of the document. At least with this kind of information we
can begin to sensibly discuss the pros and cons of the changes over
what we had last December.
<br><br>However, it needs even more background information and
justification. Without knowing what you and Patrik meant by &quot;Stable&quot;,
it is also impossible to assess how scripts should be assigned to that
category. After all, Thai is just as stable as Latin, if not more so,
depending on what is meant, yet you exclude Thai but keep Latin. I was originally
guessing that what you mean by &quot;stable&quot; is &quot;has no characters that are
problematic for IDN&quot;, but in that case, Latin itself is not stable
because of the potential confusability between &quot;1&quot; and &quot;l&quot;. Or, if
confusability is not the issue, then you really need to have some
examples of what exactly are the problems you are trying to prevent.
<br><br>That is, you need to provide more information as to what you
intend by &quot;stable&quot;, with specific examples of scripts that you consider
stable and why, and scripts that you consider unstable and why. Failing
that, I don&#39;t see why every non-archaic script would not be stable,
thus obviating the need for your <span id="st" name="st" class="st">new</span> 4 distinctions instead of the 3 that we had up until a few days ago.
<br><br>Now, I found a hint of what <span style="font-style: italic;">may </span>be at issue in Patrik&#39;s further response:<br>
<br>
&gt; Secondly, the ALWAYS and NEVER property values are only allowed on<br>
unproblematic scripts if we have a rough consensus that the<br>
codepoints will not move from ALWAYS to NEVER or vice versa given the<br>
algorithm we have to calculate the property value itself.<br>
<br>
If <span style="font-style: italic;">*that* </span>notion of stability is all that is being talked about, then it is very easy, and we have done it with a number of Unicode properties. Define the following:<br><br><div style="margin-left: 40px;">
Grandfathered_Always to be all characters that were Always under any previous Unicode version back to some base level  (say 5.0)<br>Grandfathered_Never to be all characters that were Never under any previous Unicode version back to some base level (say 
5.0)<br></div><br>Then modify the end of my message of June 13 to be:<br><br><div style="margin-left: 40px;">Then derive the following sets:<br></div><ul style="margin-left: 40px;"><li>Always = Grandfathered | (Favored &amp; 
<span>Functional) | Grandfathered_Always<br></span></li><li><span>Maybe_Yes = !Favored &amp; Functional &amp; !(Always | Grandfathered_Never)</span><span></span><span></span>
</li><li><span>Maybe_Not = (Archaic | (!Favored &amp; !Functional)) </span><span>&amp; !(Always | Grandfathered_Never)</span><span></span></li><li>Never = everything else<br></li></ul><br>Harald said a bit later:<span class="q">
<br><br>&gt; So far, I&#39;ve seen a lot of hand-wringing about the list of scripts being<br>too short, the list of scripts being Europe-centric, the arguments for<br>the list of scripts being too weak, the list of scripts including
<br>worrisome characters (IPA), but I have NOT seen ANY flat statement<br>&quot;script XXX is unproblematic and should be included&quot;.<br><br></span>My response would be:<br><br>Each
script other than the archaic ones is no more problematic overall than
the Latin, Greek, and Cyrillic you have already included. Thus if you
include Latin, Greek, and Cyrillic, you should include them:
<br><br>Arab&nbsp;&nbsp;&nbsp; Arabic<br>Armn&nbsp;&nbsp;&nbsp; Armenian<br>Bali&nbsp;&nbsp;&nbsp; Balinese<br>
Beng&nbsp;&nbsp;&nbsp; Bengali<br>Bopo&nbsp;&nbsp;&nbsp; Bopomofo<br>

Buhd&nbsp;&nbsp;&nbsp; Buhid<br>Cans&nbsp;&nbsp;&nbsp; Canadian_Aboriginal<br>Cher&nbsp;&nbsp;&nbsp; Cherokee<br>Cyrl&nbsp;&nbsp;&nbsp; Cyrillic<br>Deva&nbsp;&nbsp;&nbsp; Devanagari<br>Ethi&nbsp;&nbsp;&nbsp; Ethiopic<br>Geor&nbsp;&nbsp;&nbsp; Georgian<br>Grek&nbsp;&nbsp;&nbsp; Greek
<br>Gujr&nbsp;&nbsp;&nbsp; Gujarati<br>Guru&nbsp;&nbsp;&nbsp; Gurmukhi<br>Hang&nbsp;&nbsp;&nbsp; Hangul<br>Hani&nbsp;&nbsp;&nbsp; Han<br>Hebr&nbsp;&nbsp;&nbsp; Hebrew<br>Hira&nbsp;&nbsp;&nbsp; Hiragana<br>Kana&nbsp;&nbsp;&nbsp; Katakana<br>Khmr&nbsp;&nbsp;&nbsp; Khmer<br>Knda&nbsp;&nbsp;&nbsp; Kannada<br>Laoo&nbsp;&nbsp;&nbsp; Lao<br>Latn&nbsp;&nbsp;&nbsp; Latin<br>Limb&nbsp;&nbsp;&nbsp; Limbu<br>
Mlym&nbsp;&nbsp;&nbsp; Malayalam
<br>Mong&nbsp;&nbsp;&nbsp; Mongolian<br>Mymr&nbsp;&nbsp;&nbsp; Myanmar<br>Nkoo&nbsp;&nbsp;&nbsp; Nko<br>Orya&nbsp;&nbsp;&nbsp; Oriya<br>Sinh&nbsp;&nbsp;&nbsp; Sinhala<br>Tale&nbsp;&nbsp;&nbsp; Tai_Le<br>Talu&nbsp;&nbsp;&nbsp; New_Tai_Lue<br>Taml&nbsp;&nbsp;&nbsp; Tamil<br>Telu&nbsp;&nbsp;&nbsp; Telugu<br>Tfng&nbsp;&nbsp;&nbsp; Tifinagh<br>Thaa&nbsp;&nbsp;&nbsp; Thaana<br>Thai&nbsp;&nbsp;&nbsp; Thai
<br>Tibt&nbsp;&nbsp;&nbsp; Tibetan<br>Yiii&nbsp;&nbsp;&nbsp; Yi<br><br></div></div>