My understanding is that this restriction is to reserve all subsets of octet sequences of the form "ab--" for arbitrary octets "a", "b" for possible use as prefixes.<div><br></div><div>You bring up an interesting point since the xn-- sequence appears only AFTER conversion of a UNICODE string into ACE. Moreover, the reserved subset uses only ASCII, in fact, because it is affixed to the ACE form of the UNICODE string. So in some ways, the restriction is broader than is absolutely necessary. On the other hand, it is far easier to state and to test for than something more precise. </div>
<div><br></div><div>vint</div><div><br></div><div><br></div><div><br><div><br><div class="gmail_quote">On Wed, Jan 5, 2011 at 1:18 AM, Yoshiro YONEYA <span dir="ltr"><<a href="mailto:yoshiro.yoneya@jprs.co.jp">yoshiro.yoneya@jprs.co.jp</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Hi, all,<br>
<br>
I need clarification of RFC5891 section 4.2.3.1, which says:<br>
<br>
4.2.3.1.  Hyphen Restrictions<br>
<br>
   The Unicode string MUST NOT contain "--" (two consecutive hyphens) in<br>
   the third and fourth character positions and MUST NOT start or end<br>
   with a "-" (hyphen).<br>
<br>
My question is that what "the third and fourth character positions" means.<br>
Does it mean third and fourth octet from the beginning of the string?<br>
For example:<br>
  beginning of the string<br>
    |<br>
    v 1   2   3   4   5 <-- position of octet<br>
    +---+---+---+---+---+<br>
    | a | b | - | - | c |<br>
    +---+---+---+---+---+<br>
              ^   ^<br>
              |   |<br>
      two consecutive hyphens<br>
<br>
Or does it mean third and fourth character from the beginning of the string?<br>
For example:<br>
  beginning of the string<br>
    |<br>
    v 1   2   3   4   5 <-- position of character<br>
    +---+---+---+---+---+<br>
    |<A>|<B>| - | - |<C>| here <A>, <B> and <C> stands for non-ASCII (multi-<br>
    +---+---+---+---+---+ octets) character<br>
              ^   ^<br>
              |   |<br>
      two consecutive hyphens<br>
<br>
My understanding for this restrictions is to preserve future ACE prefix,<br>
so I expect the answer for my question is former one.  Is that right?<br>
<br>
Regards,<br>
<font color="#888888"><br>
--<br>
Yoshiro YONEYA <<a href="mailto:yoshiro.yoneya@jprs.co.jp">yoshiro.yoneya@jprs.co.jp</a>><br>
<br>
_______________________________________________<br>
Idna-update mailing list<br>
<a href="mailto:Idna-update@alvestrand.no">Idna-update@alvestrand.no</a><br>
<a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
</font></blockquote></div><br></div></div>