yes, having general category M seems to encompass both "mark" and "character" - at least for IDNA2008 purposes.<div><br></div><div>v</div><div><br><div><br><div class="gmail_quote">On Wed, Jan 5, 2011 at 9:07 AM, Simon Josefsson <span dir="ltr"><<a href="mailto:simon@josefsson.org">simon@josefsson.org</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;"><div class="im">Vint Cerf <<a href="mailto:vint@google.com">vint@google.com</a>> writes:<br>
<br>
> Simon,<br>
><br>
> I am pretty sure that the terms "combining mark" and "combining character"<br>
> as used in IDNA2008 mean the same thing.<br>
><br>
> neither are permitted as the initial character of a Unicode domain label<br>
<br>
</div>Thanks.  And the practical definition of what a combining mark&character<br>
is that it has a General Category of M as explained in section 3.6 of<br>
Unicode 5.0 quoted below?<br>
<br>
Note that this is different than having a non-0 Combining Class value.<br>
<font color="#888888"><br>
/Simon<br>
</font><div><div></div><div class="h5"><br>
> vint<br>
><br>
><br>
><br>
><br>
> On Wed, Jan 5, 2011 at 5:06 AM, Simon Josefsson <<a href="mailto:simon@josefsson.org">simon@josefsson.org</a>> wrote:<br>
><br>
>> Hi,<br>
>><br>
>> I need a clarification regarding this paragraph in section 4.2.3.2 of<br>
>> RFC 5891:<br>
>><br>
>>   The Unicode string MUST NOT begin with a combining mark or combining<br>
>>   character (see The Unicode Standard, Section 2.11 [Unicode] for an<br>
>>   exact definition).<br>
>><br>
>> And this in section 5.4:<br>
>><br>
>>   Putative U-labels with any of the following characteristics MUST be<br>
>>   rejected prior to DNS lookup:<br>
>> ...<br>
>>   o  Labels whose first character is a combining mark (see The Unicode<br>
>>      Standard, Section 2.11 [Unicode]).<br>
>><br>
>> The reference to [Unicode] is not normative, which would be a problem<br>
>> for any implementer.<br>
>><br>
>> Reading section 2.11 of Unicode 5.0 discuss "combining character" but<br>
>> not "combining mark".<br>
>><br>
>> There is a section 7.9 in Unicode 5.0 called "Combining Marks".<br>
>><br>
>> A section that discuss both Combining Marks and Combining Characters in<br>
>> the same section is section 3.11 on "Canonical Ordering Behaviour".<br>
>><br>
>> There is one section 3.6 on "Combination" that gives the precice<br>
>> definition of a "Combining character":<br>
>><br>
>>   Combining character: A character with the General Category of<br>
>>   Combining Mark (M).<br>
>><br>
>> Is this the intended definition of Combining character by RFC 5891?<br>
>><br>
>> Questions:<br>
>><br>
>> 1) Does RFC 5891 refer to "combining mark" and "combining character" as<br>
>> the same thing?<br>
>><br>
>> 2) Is there a significant difference between the requirement in 4.2.3.2<br>
>> and 5.4?  The latter section only mentions "combining mark" and not<br>
>> "combining character".<br>
>><br>
>> 3) What is the precice definition of a "combining mark"?<br>
>><br>
>> /Simon<br>
>> _______________________________________________<br>
>> Idna-update mailing list<br>
>> <a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
>> <a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
>><br>
> _______________________________________________<br>
> Idna-update mailing list<br>
> <a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
> <a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
</div></div></blockquote></div><br></div></div>