I agree with you about the stability issue.<br><br>I think part of the problem in communicating about this is that people may have somewhat different usage scenarios in mind. If you think of tagging as something that a person does with content that they originate or have control over, then it is (probably) fairly straightforward for that person to tag as specifically as possible.
<br><br>Another scenario is where you have incoming content, and you need to tag it for use by other components. This might be done, for example, in a search engine, where you fetch and process a page, and use that information later in doing searches. The tag serves to communicate language between the different components.
<br><br>In that case, you have far from perfect information about the content: what you have being typically the result of some level statistical analysis, plus other factors about the document. You need to tag with as much information as you have, *but no more*. It is in that case where you need to have the tags that indicate some level of imperfect knowledge about the source, such as &quot;I have no idea what this is&quot;, or &quot;It looks like linguistic content, but I don&#39;t know which language&quot;, or &quot;it doesn&#39;t look like linguistic content&quot;. (You may also have more detailed knowledge, like that some document appears to have 70% English content (probability 95%) and 20% French content (probability 65%)).
<br><br>Both scenarios are equally valid use cases for BCP 47 (in fact, as a percentage of data flow on the web, I&#39;d wager strongly that the second scenario completely swamps the first).<br><br>Mark<br><br><div><span class="gmail_quote">
On 4/13/07, <b class="gmail_sendername">Randy Presuhn</b> &lt;<a href="mailto:randy_presuhn@mindspring.com">randy_presuhn@mindspring.com</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hi -<br><br>The thing that bothers me about the comment &quot;A collection of languages which<br>don&#39;t belong to any other collection&quot; is that it isn&#39;t compatible with the<br>possibility that one or more of those languages might eventually be included
<br>in another (possibly new) collection.&nbsp;&nbsp;If that langauage were left in the mis<br>collection as well, the comment would be incorrect.&nbsp;&nbsp;If the language were<br>removed from the mis collection, stability goes out the window.&nbsp;&nbsp;Either way,
<br>changing the comment wouldn&#39;t help the situation.<br><br>However, unlike some other collections, I find it very difficult to imagine<br>a case where &quot;mis&quot; would be useful in tagging data.&nbsp;&nbsp;Without a clear use case
<br>for &quot;mis&quot; in constructing a language tag, perhaps we could conclude that this<br>whole debate is really academic, and that no action is needed.<br><br>Randy<br><br><br>_______________________________________________
<br>Ltru mailing list<br><a href="mailto:Ltru@ietf.org">Ltru@ietf.org</a><br><a href="https://www1.ietf.org/mailman/listinfo/ltru">https://www1.ietf.org/mailman/listinfo/ltru</a><br></blockquote></div><br><br clear="all">
<br>-- <br>Mark