I'm inclined towards #2 also, for the reasons you cite. My primary concern, however, is to get a definitive statement from the RA as to which of the policies is true. That, for me, is far more important than which policy is actually used.
<br><br>Mark<br><br><div><span class="gmail_quote">On 2/15/07, <b class="gmail_sendername">Peter Constable</b> &lt;<a href="mailto:petercon@microsoft.com">petercon@microsoft.com</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">















<div link="blue" vlink="blue" lang="EN-US">

<div>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">Adopting 1 would mean adopting generally
across all of ISO 639-3: all entries of individual-language scope encompass
corresponding historic varieties. But then, note that historic varieties are
relevant only in cases of languages with a long literary tradition that is
preserved. For instance, there may have been an old Naskapi that is distinct
from the modern descendent, but there never have been and never will be any
records in this putative language, so there is zero need for an identifier that
encompasses it.</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">&nbsp;</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">(Btw, please note: we do *<b><span style="font-weight: bold;">not</span></b>* code reconstructed protolanguages. ISO
639-3 is explicit about that. So please don't anybody suggest we'd be coding
proto-Naskapi.)</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">&nbsp;</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">So really we're just talking about some
limited set of cases with a literary tradition. </span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">&nbsp;</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">Note that we're also only talking about
cases in which languages were well-enough developed to maintain a single
identify over several hundred years. That's what distinguishes a "historic"
language from an "extinct" language. For instance, there are historic documents
in a pre-Columbian Mixtec variety, but that language identity is not preserved
by one specific modern Mixtec variety. And I reject the notion that
pre-Columbian Mixtec together with all the modern Mixtec varieties is a
macrolanguage unless someone makes the case that there's a user scenario in
which it is appropriate to treat all those varieties as one language.</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">&nbsp;</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">So the number of relevant cases is fairly
constrained. I don't know just how many there would be, but it's going to be a
small fraction of all modern languages for which this is relevant.</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">&nbsp;</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">I have a concern with 1 that it would detract
from interoperability, for the kinds of reasons Anthony mentions. There is a
very large amount of usage in which "eng" is intended to mean specifically
modern English, and a very large amount of usage in which "ces" is intended to
mean specifically modern Czech. I don't see who it would help to decide that
these IDs encompass Old English and Old Czech respectively: the average modern-language
user isn't likely going to be cataloguing content in Old English and Old Czech,
and they certainly aren't going to be helped by having queries return records
in the historic varieties. As for the specialist, they certainly don't want to
catalog content as all "eng" and "ces", as Anthony has made clear. The only
scenario in which maybe someone is helped is when the specialist wants a query
to return records for all historic varieties. I don't see why they can't use a Boolean
operator for that, but even if there was enough need for a single ID, I wouldn't
be inclined to use "eng' and "ces" for that purpose: that would be helping the 0.01%
scenario at the detriment of 99.99% of users.</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">&nbsp;</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">Thus, I'm inclined towards 2. There is
certainly willingness in general on the part of the ISO 639 JAC to code historic
languages, so I have no doubt that IDs for things like Old Czech etc. would be
provided so long as the need is clear and there's a sense that the historic
boundaries deemed appropriate by philologists, research librarians, etc. are
appropriate.</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">&nbsp;</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">&nbsp;</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">&nbsp;</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">Peter</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">&nbsp;</span></font></p>

<p><font color="navy" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: navy;">&nbsp;</span></font></p>

<div style="border-style: none none none solid; border-color: -moz-use-text-color -moz-use-text-color -moz-use-text-color blue; border-width: medium medium medium 1.5pt; padding: 0in 0in 0in 4pt;">

<div>

<div style="text-align: center;" align="center"><font face="Times New Roman" size="3"><span style="font-size: 12pt;">

<hr align="center" size="2" width="100%">

</span></font></div>

<p><b><font face="Tahoma" size="2"><span style="font-size: 10pt; font-family: Tahoma; font-weight: bold;">From:</span></font></b><font face="Tahoma" size="2"><span style="font-size: 10pt; font-family: Tahoma;"> Mark Davis
[mailto:<a href="mailto:mark.davis@icu-project.org" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">mark.davis@icu-project.org</a>] <br>
<b><span style="font-weight: bold;">Sent:</span></b> Thursday, February 15, 2007
8:55 AM<br>
<b><span style="font-weight: bold;">To:</span></b> Anthony Aristar<br>
<b><span style="font-weight: bold;">Cc:</span></b> LTRU Working Group;
<a href="mailto:ietf-languages@alvestrand.no" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">ietf-languages@alvestrand.no</a><br>
<b><span style="font-weight: bold;">Subject:</span></b> [Ltru] Re: Ietf-languages
Digest, Vol 50, Issue 15</span></font></p>

</div><div><span class="e" id="q_110c72993ac3cb15_1">

<p><font face="Times New Roman" size="3"><span style="font-size: 12pt;">&nbsp;</span></font></p>

<p><font face="Times New Roman" size="3"><span style="font-size: 12pt;">Your quotation below omits the true author, and may leave the
impression that I wrote a number of paragraphs that I do not agree with and did
not write. I only wrote &quot;Assume that old Czech ...&quot; -- someone else
wrote the &quot;But is this a real problem....&quot; <br>
<br>
&gt; Mark Davis wrote:<br>
&gt;<br>
&gt; &gt; Assume that old Czech is as different from modern as fro is from fr.<br>
&gt;<br>
&gt; But is this a real problem?&nbsp;&nbsp;How much total literature is
written<br>
...<br>
<br>
That being said, there are two models that ISO could be using. </span></font></p>

<ol start="1" type="1">
 <li><b><font face="Times New Roman" size="3"><span style="font-size: 12pt; font-weight: bold;">Overlapping. </span></font></b>&#39;eng&#39;
     means any English, modern or historic. &#39;ang&#39; means specifically Old
     English, a subset of &#39;eng&#39;. &#39;ces&#39; means any Czech. There is no tag
     specifically for Old Czech. </li>
</ol>

<ol start="1" type="1">
 <ol start="1" type="1">
  <li><font face="Times New Roman" size="3"><span style="font-size: 12pt;">so I could tag Beowulf with &#39;ang&#39; or &#39;eng&#39;, but
      Shakespeare, Austen, and Robin Williams only with &#39;eng&#39;.</span></font></li>
  <li><font face="Times New Roman" size="3"><span style="font-size: 12pt;">Smil Flaška z Pardubic and Václav Havel are both
      tagged with &#39;ces&#39;. </span></font></li>
  <li><font face="Times New Roman" size="3"><span style="font-size: 12pt;">Requests for BCP 47 variant tags for
      Shakespearean English (en-SHAKESPR) or old Czech (cs-OLDCZECH) would be
      legitimate.</span></font></li>
  <li><font face="Times New Roman" size="3"><span style="font-size: 12pt;">A request for a variant tag for only modern English
      (en-MODENGL), thus excluding Old English, would be legitimate. </span></font></li>
 </ol>
</ol>

<ol start="2" type="1">
 <li><b><font face="Times New Roman" size="3"><span style="font-size: 12pt; font-weight: bold;">Disjoint. </span></font></b>&#39;eng&#39;
     means only modern English, &#39;ang&#39; means Old English, &#39;ces&#39; means only
     modern Czech.
     There is no tag at all (currently) for Old Czech. </li>
</ol>

<ol start="2" type="1">
 <ol start="1" type="1">
  <li><font face="Times New Roman" size="3"><span style="font-size: 12pt;">so I could tag Beowulf with &#39;ang&#39; only.</span></font></li>
  <li><font face="Times New Roman" size="3"><span style="font-size: 12pt;">and there is no valid current code for tagging
      for Smil Flaška z Pardubic</span></font></li>
  <li><font face="Times New Roman" size="3"><span style="font-size: 12pt;">A request for BCP 47 variant tags for
      Shakespearean English (en-SHAKESPR) would be legitimate </span></font></li>
  <li><font face="Times New Roman" size="3"><span style="font-size: 12pt;">A request for a registered old Czech language
      tag (oldczech) would be legitimate. (However &quot;primary languages are
      strongly RECOMMENDED for registration with ISO 639, and proposals
      rejected by ISO 639/RA will be closely scrutinized before they are
      registered with IANA.&quot; )</span></font></li>
 </ol>
</ol>

<p style="margin-bottom: 12pt;"><font face="Times New Roman" size="3"><span style="font-size: 12pt;">I don&#39;t think they are
using model number one, but we need to find out.<br>
<br>
Mark</span></font></p>

<div>

<p><span><font face="Times New Roman" size="3"><span style="font-size: 12pt;">On 2/15/07, <b><span style="font-weight: bold;">Anthony
Aristar</span></b> &lt;<a href="mailto:aristar@linguistlist.org" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">
aristar@linguistlist.org</a>&gt; wrote:</span></font></span></p>

<p><font face="Times New Roman" size="3"><span style="font-size: 12pt;">With all due respect, this seems like a very odd discussion from my <br>
perspective&nbsp;&nbsp;as a linguistics professor.&nbsp;&nbsp;The discussion
seems to<br>
presuppose that all that matters is whether Microsoft is going to one<br>
day produce a version of Word in Middle High German or Old English, or<br>
how many texts exist in a language. <br>
<br>
But the ISO 639 codes are used for much more than this.&nbsp;&nbsp;In
particular,<br>
they are used to ensure interoperability, allowing material of the same<br>
linguistic nature to be found in searches, and to be compared using the <br>
linguistic ontologies that are now being developed.&nbsp;&nbsp;If I am a
scholar<br>
searching for texts in Old English (or Old High German, for that<br>
matter) and everyone has been cavalier enough to code such material<br>
with eng and deu, what the search engines return will be utterly <br>
useless to me.&nbsp;&nbsp;I am going to be flooded with such a quantity of<br>
material in Modern English and Modern German that searching through it<br>
will be essentially impossible.<br>
<br>
So if you really believe that it doesn&#39;t matter if you code English <br>
material as eng, whatever its period, what you&#39;re really saying is that<br>
you don&#39;t really care about interoperability, and that you don&#39;t really<br>
care about scholarship.<br>
<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;**************************************
<br>
Anthony Aristar, Director, Institute for Language Information &amp; Technology<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
Professor of Linguistics<br>
Moderator, LINGUIST&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
Principal Investigator, EMELD Project<br>
Linguistics Program <br>
Dept. of
English&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<a href="mailto:aristar@linguistlist.org" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">aristar@linguistlist.org</a><br>
Eastern Michigan
University&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;2000
Huron River Dr, Suite 104<br>
Ypsilanti, MI 48197<br>
U.S.A.<br>
<br>
URL: <a href="http://linguistlist.org/aristar/" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://linguistlist.org/aristar/</a><br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;**************************************<br>
<br>
&gt; Mark Davis wrote:<br>
&gt;<br>
&gt; &gt; Assume that old Czech is as different from modern as fro is from fr. <br>
&gt;<br>
&gt; But is this a real problem?&nbsp;&nbsp;How much total literature is
written<br>
&gt; and available in different variations of Czech?&nbsp;&nbsp;My prejudice
says<br>
&gt; that as a nation with a language and literature of its own, Czech <br>
&gt; is about as young as Finnish, Norwegian or Serbian, i.e. 19th<br>
&gt; century.&nbsp;&nbsp;Can you give any concrete examples when not having a<br>
&gt; separate *code* for pre-renaissance Czech is a practical problem?<br>
&gt; <br>
&gt; Linguists of course have *names* for Swedish of all ages, but I<br>
&gt; see no real use for having ISO or the IETF specify language<br>
&gt; *codes*.&nbsp;&nbsp;I could be wrong, but if so please enlighten and
correct<br>
&gt; me.&nbsp;&nbsp;Nobody is going to translate OpenOffice or Mozilla to the <br>
&gt; language spoken by vikings (Old Norse) or the Swedish used during<br>
&gt; the Lutheran reformation (called New Swedish, ironically).<br>
&gt;<br>
&gt; Yes, there is now a branch of Wikipedia in Old English<br>
&gt; ( <a href="http://ang.wikipedia.org" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">ang.wikipedia.org</a>), but that is a
rare exception.&nbsp;&nbsp;I don&#39;t expect<br>
&gt; this to happen in other languages.&nbsp;&nbsp;Ang has now 744 articles,<br>
&gt; compared to the 11,000 articles of the Latin Wikipedia. <br>
<br>
<br>
<br>
<br>
<br>
_______________________________________________<br>
Ietf-languages mailing list<br>
<a href="mailto:Ietf-languages@alvestrand.no" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">Ietf-languages@alvestrand.no</a><br>
<a href="http://www.alvestrand.no/mailman/listinfo/ietf-languages" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://www.alvestrand.no/mailman/listinfo/ietf-languages</a></span></font></p>

</div>

<p><font face="Times New Roman" size="3"><span style="font-size: 12pt;"><br>
<br clear="all">
<br>
-- <br>
Mark </span></font></p>

</span></div></div>

</div>

</div>


<br>_______________________________________________<br>Ltru mailing list<br><a onclick="return top.js.OpenExtLink(window,event,this)" href="mailto:Ltru@ietf.org">Ltru@ietf.org</a><br><a onclick="return top.js.OpenExtLink(window,event,this)" href="https://www1.ietf.org/mailman/listinfo/ltru" target="_blank">
https://www1.ietf.org/mailman/listinfo/ltru</a><br><br></blockquote></div><br><br clear="all"><br>-- <br>Mark