<span>&gt; I don't expect to see .cxx, .h, etc. files tagged with language tags any time soon<br><br>Well, every file available on the web, like <a href="http://www.cs.duke.edu/csed/tapestry/win/date.h">http://www.cs.duke.edu/csed/tapestry/win/date.h
</a> (chosen at random) gets some language tag when processed at Google (I can&#39;t say what MSN, Yahoo, and other search engines do). So right under your nose millions of pages of source code are getting tagged, all the time. We are faced with the practical problem of what the best thing to do is according to the standard.
<br><br>Mark<br></span><span style="font-size: 11pt; color: rgb(31, 73, 125);"></span><br><div><span class="gmail_quote">On 4/20/07, <b class="gmail_sendername">Peter Constable</b> &lt;<a href="mailto:petercon@microsoft.com">
petercon@microsoft.com</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">










<div link="blue" vlink="purple" lang="EN-US">

<div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">I say your programming code example is a boundary case in the
sense that I don't expect to see .cxx, .h, etc. files tagged with language tags
any time soon, and I don't expect to see a book on programming concepts tagged
as anything other than en, no matter how many pages of source code samples it
has. </span></p>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">&nbsp;</span></p>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">(Granted, in an XML representation of that book there may be a
question as to how individual elements should be tagged, but it's not clear to
me in that scenario what difference it really makes whether you have &lt;code sample
xml:lang="en"&gt; or &lt;code sample xml:lang="zxx"&gt; or &lt;code sample
xml:lang="und"&gt; or &lt;code sample xml:lang=""&gt; or whatever.)</span></p>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">&nbsp;</span></p>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">&nbsp;</span></p>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">Peter</span></p>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">&nbsp;</span></p>

<div style="border-style: solid none none; border-color: rgb(181, 196, 223) -moz-use-text-color -moz-use-text-color; border-width: 1pt medium medium; padding: 3pt 0in 0in;">

<p><b><span style="font-size: 10pt;">From:</span></b><span style="font-size: 10pt;">
<a href="mailto:mark.edward.davis@gmail.com" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">mark.edward.davis@gmail.com</a> [mailto:<a href="mailto:mark.edward.davis@gmail.com" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">
mark.edward.davis@gmail.com</a>] <b>On Behalf
Of </b>Mark Davis<br>
<b>Sent:</b> Friday, April 20, 2007 8:59 AM<br>
<b>To:</b> Peter Constable<br>
<b>Cc:</b> <a href="mailto:ietf-languages@alvestrand.no" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">ietf-languages@alvestrand.no</a>; <a href="mailto:ltru@lists.ietf.org" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">
ltru@lists.ietf.org</a><br>
<b>Subject:</b> Re: [Ltru] Re: &quot;mis&quot; update review request</span></p>

</div>

<p>&nbsp;</p>

<p style="margin-bottom: 12pt;">I don&#39;t think the programming
language fragment is really a boundary condition. Most code source nowadays are
not just random hex, there typically, not exceptionally, some real linguistic
content. I would agree with you that a hex dump of a <i>compiled</i> program,
such as perhaps you used for your example, is sensible to tag as zxx, but based
on the wording of the standards, I don&#39;t think we can expect zxx to apply to typical
code source. Yet, while there may be is some embedded English, we don&#39;t want to
call it &quot;en&quot; either. <br>
<br>
It looks to me like the best choice <i>currently </i>would be &quot;und&quot;;
as I said, I think it might be useful to have a special tag for this just
because it is a reasonably common case that is otherwise difficult to
categorize. An alternative would be to <i>explicitly </i>broaden the
description of &quot;zxx&quot; to be &quot;no linguistic content, or
programming source code&quot;. That would be a compatible change to 4646bis,
since it is a broadening. <br>
<br>
Mark</p>

<div>

<p><span>On 4/20/07, <b>Peter Constable</b>
&lt;<a href="mailto:petercon@microsoft.com" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">petercon@microsoft.com</a>&gt;
wrote:</span></p>

<div>

<div>

<div style="border-style: solid none none; border-color: -moz-use-text-color; border-width: 1pt medium medium; padding: 3pt 0in 0in;">

<p style="margin-bottom: 12pt;"><b><span style="font-size: 10pt;">From:</span></b><span style="font-size: 10pt;"> Mark Davis [mailto:<a href="mailto:mark.davis@icu-project.org" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">
mark.davis@icu-project.org</a>]
</span></p>

<p><b><span style="font-size: 10pt; color: rgb(31, 73, 125);">&gt; </span></b>As in
example #9 of <a href="http://docs.google.com/Doc?id=dfqr8rd5_11g425c9" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://docs.google.com/Doc?id=dfqr8rd5_11g425c9 </a>, </p>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">&gt; </span>to think that the
following contains &quot;no linguistic content&quot; is bizarre. </p>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">&gt; </span>It obviously
contains linguistic content.</p>

</div>

<table border="1" cellpadding="0" cellspacing="0">
 <tbody><tr>
  <td style="padding: 1.95pt;" valign="top">
  <p>if (linguisticContent == null) { throw new Exception(&quot;&quot;); }</p>
  </td>
 </tr>
</tbody></table>

<p style="margin-bottom: 12pt;">&nbsp;</p>

<p style="margin-bottom: 12pt;"><span style="font-size: 11pt; color: rgb(31, 73, 125);">You
could say the same of this:</span></p>

<p style="margin-bottom: 12pt;"><span style="font-size: 11pt; color: rgb(31, 73, 125);">MZ
</span></p>

<div><span style="font-size: 11pt; color: rgb(31, 73, 125);">

<hr align="left" size="1" width="33%">

</span></div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">&nbsp;&nbsp; </span></p>

<div><span style="font-size: 11pt; color: rgb(31, 73, 125);">

<hr align="left" size="1" width="100%">

</span></div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">&nbsp;&nbsp;
ÿÿ&nbsp; ¸&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
@&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
à&nbsp;&nbsp; <br clear="all">
­º<br clear="all">
&nbsp;´&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
Í!¸LÍ!This program cannot be run in DOS mode.</span></p>

<p style="margin-bottom: 12pt;"><span style="font-size: 11pt; color: rgb(31, 73, 125);">$&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
Tbï› </span></p>

<div><span style="font-size: 11pt; color: rgb(31, 73, 125);">

<hr align="left" size="1" width="33%">

</span></div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">È </span></p>

<div><span style="font-size: 11pt; color: rgb(31, 73, 125);">

<hr align="left" size="1" width="33%">

</span></div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">È </span></p>

<div><span style="font-size: 11pt; color: rgb(31, 73, 125);">

<hr align="left" size="1" width="33%">

</span></div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">È7ÅïÈ </span></p>

<div><span style="font-size: 11pt; color: rgb(31, 73, 125);">

<hr align="left" size="1" width="33%">

</span></div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">È7ÅüÈ </span></p>

<div><span style="font-size: 11pt; color: rgb(31, 73, 125);">

<hr align="left" size="1" width="33%">

</span></div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">È7ÅúÈ</span></p>

<div><span style="font-size: 11pt; color: rgb(31, 73, 125);">

<hr align="left" size="1" width="33%">

</span></div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">È </span></p>

<div><span style="font-size: 11pt; color: rgb(31, 73, 125);">

<hr align="left" size="1" width="33%">

</span></div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">€ÈÉ </span></p>

<div><span style="font-size: 11pt; color: rgb(31, 73, 125);">

<hr align="left" size="1" width="33%">

</span></div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">È7ÅìÈ3 </span></p>

<div><span style="font-size: 11pt; color: rgb(31, 73, 125);">

<hr align="left" size="1" width="33%">

</span></div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">È7ÅýÈ </span></p>

<div><span style="font-size: 11pt; color: rgb(31, 73, 125);">

<hr align="left" size="1" width="33%">

</span></div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">È7ÅùÈ </span></p>

<div><span style="font-size: 11pt; color: rgb(31, 73, 125);">

<hr align="left" size="1" width="33%">

</span></div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">ÈRich </span></p>

<div><span style="font-size: 11pt; color: rgb(31, 73, 125);">

<hr align="left" size="1" width="33%">

</span></div>

<p><span style="font-size: 11pt; color: rgb(31, 73, 125);">È&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span></p>

<p style="margin-bottom: 12pt;"><span style="font-size: 11pt; color: rgb(31, 73, 125);">&nbsp;</span></p>

<p style="margin-bottom: 12pt;"><span style="font-size: 11pt; color: rgb(31, 73, 125);">We
could probably come up with all kinds of boundary cases for which there is no
&quot;right&quot; answer. I don&#39;t know what use it would be.</span></p>

<p style="margin-bottom: 12pt;"><span style="font-size: 11pt; color: rgb(31, 73, 125);">Peter</span></p>

</div>

</div><span class="q">

<p style="margin-bottom: 12pt;"><br>
_______________________________________________<br>
Ltru mailing list<br>
<a href="mailto:Ltru@ietf.org" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">Ltru@ietf.org</a><br>
<a href="https://www1.ietf.org/mailman/listinfo/ltru" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">https://www1.ietf.org/mailman/listinfo/ltru</a></p>

</span></div>

<p><br>
<br clear="all">
<br>
-- <br>
Mark </p>

</div>

</div>


<br>_______________________________________________<br>Ltru mailing list<br><a onclick="return top.js.OpenExtLink(window,event,this)" href="mailto:Ltru@ietf.org">Ltru@ietf.org</a><br><a onclick="return top.js.OpenExtLink(window,event,this)" href="https://www1.ietf.org/mailman/listinfo/ltru" target="_blank">
https://www1.ietf.org/mailman/listinfo/ltru</a><br><br></blockquote></div><br><br clear="all"><br>-- <br>Mark