Having looked this over, it&#39;s clear that the first line was inappropriate, for which I&#39;m sorry. I should avoid trying to be lighthearted, since it is too easy to get wrong.<br><br><span class="q">Unicode is big and complex, and I wouldn&#39;t expect
anyone who is not deeply immersed in the topic to know all the details.
Many of the issues are not obvious to someone who isn&#39;t a specialist in the subject, and there is a lot of history behind the structure and documentation that makes it sometimes difficult to approach. I meant no disparagement at all by my phrasing, which was just meant to indicate that it is sometimes a difficult area to get a handle on.
<br><br>Mark<br><br></span><div><span class="gmail_quote">On 12/19/06, <b class="gmail_sendername">Mark Davis</b> &lt;<a href="mailto:mark.davis@icu-project.org">mark.davis@icu-project.org</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<span class="q"><span><br></span><div style="direction: ltr;">&gt; I take it this means the answer to my question is &quot;no&quot;, since the script<br>&gt; names in Scripts.txt and the ISO 15924 codes don&#39;t match up.
<br><br>
<br></div></span>We need to drag you, kicking and screaming, into ever deeper understanding of how Unicode works.<br><br>Each Unicode property name, and property value name may have aliases. These aliases, as you would expect, are encapsulated in a machine-readable file, such as 
<a href="http://www.unicode.org/Public/UNIDATA/PropertyValueAliases.txt" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://www.unicode.org/Public/UNIDATA/PropertyValueAliases.txt</a><br><br>So, for example, you see there:
<br><span><br><span style="font-family: courier new,monospace;">
sc ; Arab&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;; Arabic</span><br style="font-family: courier new,monospace;"><span style="font-family: courier new,monospace;">sc ; Armn&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;; Armenian</span><br style="font-family: courier new,monospace;"><span style="font-family: courier new,monospace;">

sc ; Bali&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;; Balinese</span><br style="font-family: courier new,monospace;"><span style="font-family: courier new,monospace;">sc ; Beng&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;; Bengali</span><br>...<br><br>The first field, sc, is the short name for the &quot;script&quot; property; Armn is the short name for one of its values (which corresponds to the 15924 code), and Armenian is the long name used in the data file 
Script.txt. If you look at the site for the 15924 Registration Authority (<a href="http://www.unicode.org/iso15924/" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://www.unicode.org/iso15924/
</a>), you&#39;ll find also in the tables such as <a href="http://www.unicode.org/iso15924/iso15924-codes.html" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">
http://www.unicode.org/iso15924/iso15924-codes.html</a> a listing of both the long and short value names.<br><br></span><span>The Unicode script property (</span>2001-02-06) actually predated first publication of ISO 15924 (2004-01-09), however, it was done in the knowledge that 15924 was coming, and they have been kept in sync since. 
<br><span class="sg"><span><br>Mark<br><br></span></span><div><span class="q"><span class="gmail_quote">On 12/19/06, <b class="gmail_sendername">Harald Alvestrand</b> &lt;<a href="mailto:harald@alvestrand.no" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">
harald@alvestrand.no</a>&gt; wrote:</span></span><div><span class="e" id="q_10f9cbea2966ef09_5"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">

Thanks for pointing out the relevant TR for the use of script codes, and<br>the special status of &quot;Common&quot; and &quot;Inherited&quot;. The algorithm grows....<br><br>--On 19. desember 2006 12:45 -0800 Kenneth Whistler &lt;
<a href="mailto:kenw@sybase.com" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">kenw@sybase.com</a>&gt; wrote:<br><br>&gt;&gt; Is there a list of the Unicode codepoints known to be used in each of
<br>&gt;&gt; the ISO 15924 script codes?<br>&gt;<br>&gt; That is an ill-formed question. ISO 15924 defines script codes.
<br>&gt; It does not define repertoires or associate code points with<br>&gt; those script codes. So you can&#39;t have sets of Unicode code points<br>&gt; &quot;in each ISO 15924 script code&quot;.<br>&gt;<br>&gt; The closest you are going to get to an repertoire partitioning
<br>&gt; of Unicode into scripts is Scripts.txt, the very file we have<br>&gt; been talking about and using for the development of the<br>&gt; inclusions file.<br><br>I take it this means the answer to my question is &quot;no&quot;, since the script
<br>names in Scripts.txt and the ISO 15924 codes don&#39;t match up.<br><br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Harald<br><br><br><br><br>_______________________________________________<br>Idna-update mailing list<br><a href="mailto:Idna-update@alvestrand.no" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">

Idna-update@alvestrand.no</a><br><a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://www.alvestrand.no/mailman/listinfo/idna-update
</a><br></blockquote></span></div></div><br>

</blockquote></div><br>