<html><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div>I would like to hear specific comments about this. I asked for it first on 2008-09-17.</div><div><br></div><div>Right. So we need to be able to tag data so that people know that the &nbsp;</div>language is Mandarin and the specific Romanization is Hanyu Pinyin, a &nbsp;<br>Latin-based orthography. However, the orthographic conventions behind &nbsp;<br>Pinyin are applied to other Chinese languages, and in a variant used &nbsp;<br>in Taiwan.<br><br>zh-pinyin<br>zh-CN-pinyin<br>zh-Latn-pinyin<br>zh-Latn-CN-pinyin<br>These are formally ambiguous as to which Chinese language (in terms of &nbsp;<br>the set of languages written in Han characters) it is. However, in &nbsp;<br>this registration, I think we ought to SPECIFY that the string zh- <br>pinyin refers to Mandarin Chinese in Hanyu Pinyin orthography--not to &nbsp;<br>any other form of Chinese nor any other orthography.<br><br>zh-cmn-pinyin<br>zh-cmn-Latn-pinyin<br>zh-cmn-CN-pinyin<br>zh-cmn-Latn-CN-pinyin<br>cmn-pinyin<br>cmn-Latn-pinyin<br>cmn-CN-pinyin<br>cmn-Latn-CN-pinyin<br>All of these can only mean Mandarin Chinese in Hanyu Pinyin &nbsp;<br>romanization; they are not yet permitted but will be (one supposes). &nbsp;<br>Other Chinese languages might be listed with 639-3 in due course.<div>For the present, this set doesn't matter to us. It's a large set though.<br><br>zh-TW-pinyin<br>zh-Latn-TW-pinyin<br>This is Tongyong Pinyin orthography, also to be defined as Mandarin &nbsp;<br>Chinese language.<br><br>zh-cmn-TW-pinyin<br>zh-cmn-Latn-TW-pinyin<br>cmn-TW-pinyin<br>cmn-Latn-TW-pinyin<br>All of these can only mean Mandarin Chinese in Tongyong Pinyin &nbsp;<br>romanization; they are not yet permitted but will be (one supposes).<br>For the present, this set doesn't matter to us.</div><div><br>bo-pinyin<br>bo-Latn-pinyin<br>Both of these mean Tibetan language in Tibetan Pinyin romanization (as &nbsp;<br>opposed to Wiley for instance).<br><br>Peter says he would like the recommended prefix to contain -Latn-. &nbsp;<br>Mark said he could live with or without it but thought that "with" &nbsp;<br>should be recommended. Should we assist users of this subtag by having &nbsp;<br>some redundancy in the registration? At this stage I think that "best &nbsp;<br>practice" (with -Latn-) being the only one specified might be &nbsp;<br>insufficient.<br><br></div><div><span class="Apple-style-span" style="font-family: -webkit-monospace; ">Michael Everson *&nbsp;<a href="http://www.evertype.com/">http://www.evertype.com</a></span></div><div apple-content-edited="true"> </div><br></body></html>