Yes, it should say something like:<div><br></div><blockquote class="webkit-indent-blockquote" style="margin: 0 0 0 40px; border: none; padding: 0px;"><div>The Unicode string MUST NOT begin with a character having a General Category property value of Mark (M).</div>
<div><br></div></blockquote>Mark is defined to be the same as: Spacing_Mark OR Nonspacing_Mark OR Enclosing_Mark. Note that because of the restrictions in <a href="http://tools.ietf.org/html/rfc5892">http://tools.ietf.org/html/rfc5892</a>, the above is equivalent to saying:<div>
<div><br></div><blockquote class="webkit-indent-blockquote" style="margin: 0 0 0 40px; border: none; padding: 0px;"><div>The Unicode string MUST NOT begin with a character having a General Category property value equal to Nonspacing_Mark (Mn) or Spacing_Mark (Mc).</div>
</blockquote><div><div><div><font class="Apple-style-span" face="georgia, serif"><br></font></div><div><font face="georgia, serif">Mark<br><br><i>— Il meglio è l’inimico del bene —</i></font><br>
<br><br><div class="gmail_quote">On Wed, Jan 5, 2011 at 06:20, Simon Josefsson <span dir="ltr"><<a href="mailto:simon@josefsson.org">simon@josefsson.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
Thank you for clear answer!<br>
<br>
In a revision of the documents, it would help to say this explicitly, so<br>
there is a normative description.  Right now there is an informative<br>
reference to a section in Unicode that doesn't give enough detail.<br>
<font color="#888888"><br>
/Simon<br>
</font><div><div></div><div class="h5"><br>
Vint Cerf <<a href="mailto:vint@google.com">vint@google.com</a>> writes:<br>
<br>
> yes, having general category M seems to encompass both "mark" and<br>
> "character" - at least for IDNA2008 purposes.<br>
><br>
> v<br>
><br>
><br>
> On Wed, Jan 5, 2011 at 9:07 AM, Simon Josefsson <<a href="mailto:simon@josefsson.org">simon@josefsson.org</a>> wrote:<br>
><br>
>> Vint Cerf <<a href="mailto:vint@google.com">vint@google.com</a>> writes:<br>
>><br>
>> > Simon,<br>
>> ><br>
>> > I am pretty sure that the terms "combining mark" and "combining<br>
>> character"<br>
>> > as used in IDNA2008 mean the same thing.<br>
>> ><br>
>> > neither are permitted as the initial character of a Unicode domain label<br>
>><br>
>> Thanks.  And the practical definition of what a combining mark&character<br>
>> is that it has a General Category of M as explained in section 3.6 of<br>
>> Unicode 5.0 quoted below?<br>
>><br>
>> Note that this is different than having a non-0 Combining Class value.<br>
>><br>
>> /Simon<br>
>><br>
>> > vint<br>
>> ><br>
>> ><br>
>> ><br>
>> ><br>
>> > On Wed, Jan 5, 2011 at 5:06 AM, Simon Josefsson <<a href="mailto:simon@josefsson.org">simon@josefsson.org</a>><br>
>> wrote:<br>
>> ><br>
>> >> Hi,<br>
>> >><br>
>> >> I need a clarification regarding this paragraph in section 4.2.3.2 of<br>
>> >> RFC 5891:<br>
>> >><br>
>> >>   The Unicode string MUST NOT begin with a combining mark or combining<br>
>> >>   character (see The Unicode Standard, Section 2.11 [Unicode] for an<br>
>> >>   exact definition).<br>
>> >><br>
>> >> And this in section 5.4:<br>
>> >><br>
>> >>   Putative U-labels with any of the following characteristics MUST be<br>
>> >>   rejected prior to DNS lookup:<br>
>> >> ...<br>
>> >>   o  Labels whose first character is a combining mark (see The Unicode<br>
>> >>      Standard, Section 2.11 [Unicode]).<br>
>> >><br>
>> >> The reference to [Unicode] is not normative, which would be a problem<br>
>> >> for any implementer.<br>
>> >><br>
>> >> Reading section 2.11 of Unicode 5.0 discuss "combining character" but<br>
>> >> not "combining mark".<br>
>> >><br>
>> >> There is a section 7.9 in Unicode 5.0 called "Combining Marks".<br>
>> >><br>
>> >> A section that discuss both Combining Marks and Combining Characters in<br>
>> >> the same section is section 3.11 on "Canonical Ordering Behaviour".<br>
>> >><br>
>> >> There is one section 3.6 on "Combination" that gives the precice<br>
>> >> definition of a "Combining character":<br>
>> >><br>
>> >>   Combining character: A character with the General Category of<br>
>> >>   Combining Mark (M).<br>
>> >><br>
>> >> Is this the intended definition of Combining character by RFC 5891?<br>
>> >><br>
>> >> Questions:<br>
>> >><br>
>> >> 1) Does RFC 5891 refer to "combining mark" and "combining character" as<br>
>> >> the same thing?<br>
>> >><br>
>> >> 2) Is there a significant difference between the requirement in 4.2.3.2<br>
>> >> and 5.4?  The latter section only mentions "combining mark" and not<br>
>> >> "combining character".<br>
>> >><br>
>> >> 3) What is the precice definition of a "combining mark"?<br>
>> >><br>
>> >> /Simon<br>
>> >> _______________________________________________<br>
>> >> Idna-update mailing list<br>
>> >> <a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
>> >> <a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
>> >><br>
>> > _______________________________________________<br>
>> > Idna-update mailing list<br>
>> > <a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
>> > <a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
>><br>
> _______________________________________________<br>
> Idna-update mailing list<br>
> <a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
> <a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
_______________________________________________<br>
Idna-update mailing list<br>
<a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
<a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
</div></div></blockquote></div><br></div></div></div></div>