When you build an index, you follow links <i>as if the user clicked on them</i>. When the choice is determinant, this is not a problem. So consider href=&#39;<a href="http://schloss.de">schloß.de</a>&#39;? If all browsers go to <a href="http://schloss.de">schloss.de</a> (or fail), your choice is easy. That is the current situation. During the transition period (of years), the choice is hard, because the answer is not determinant.<br>
<br clear="all">Mark<br>
<br><br><div class="gmail_quote">On Tue, Dec 1, 2009 at 12:22, Georg Ochsner <span dir="ltr">&lt;<a href="mailto:g.ochsner@revolistic.com">g.ochsner@revolistic.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">









<div link="blue" vlink="purple" lang="DE">

<div>

<p class="MsoNormal"><span style="font-size: 11pt; color: rgb(31, 73, 125);">Hello Mark,</span></p>

<p class="MsoNormal"><span style="font-size: 11pt; color: rgb(31, 73, 125);"> </span></p>

<p class="MsoNormal"><span style="font-size: 11pt; color: rgb(31, 73, 125);" lang="EN-US">I don’t understand why it would cause problems for search
engines. Which would they be more in detail? In the organic Google results you
can link to the punycode version for the new ß hosts. And you can still link to
ASCII ss domains as well. I think this is very clean actually, really everybody
will get to the same hosts from the same search results. Or is it about
crawling or duplicate content, what you mean?</span></p>

<p class="MsoNormal"><span style="font-size: 11pt; color: rgb(31, 73, 125);" lang="EN-US"> </span></p>

<p class="MsoNormal"><span style="font-size: 11pt; color: rgb(31, 73, 125);" lang="EN-US">Thanks</span></p>

<p class="MsoNormal"><span style="font-size: 11pt; color: rgb(31, 73, 125);" lang="EN-US">Georg</span></p>

<p class="MsoNormal"><span style="font-size: 11pt; color: rgb(31, 73, 125);" lang="EN-US"> </span></p>

<p class="MsoNormal"><span style="font-size: 11pt; color: rgb(31, 73, 125);" lang="EN-US"> </span></p>

<p class="MsoNormal"><span style="font-size: 11pt; color: rgb(31, 73, 125);" lang="EN-US"> </span></p>

<div style="border-style: none none none solid; border-color: -moz-use-text-color -moz-use-text-color -moz-use-text-color blue; border-width: medium medium medium 1.5pt; padding: 0cm 0cm 0cm 4pt;">

<div>

<div style="border-style: solid none none; border-color: rgb(181, 196, 223) -moz-use-text-color -moz-use-text-color; border-width: 1pt medium medium; padding: 3pt 0cm 0cm;">

<p class="MsoNormal"><b><span style="font-size: 10pt;">Von:</span></b><span style="font-size: 10pt;"> <a href="mailto:mark.edward.davis@gmail.com" target="_blank">mark.edward.davis@gmail.com</a>
[mailto:<a href="mailto:mark.edward.davis@gmail.com" target="_blank">mark.edward.davis@gmail.com</a>] <b>Im Auftrag von </b>Mark Davis ?<br>
<b>Gesendet:</b> Dienstag, 1. Dezember 2009 21:03<div><div></div><div class="h5"><br>
<b>An:</b> Georg Ochsner<br>
<b>Cc:</b> Alexander Mayrhofer; Patrik Fältström; Michael Everson; IDNA update
work; Andreas Stötzner<br>
<b>Betreff:</b> Re: Mappings - some examples</div></div></span></p>

</div>

</div><div><div></div><div class="h5">

<p class="MsoNormal"> </p>

<p class="MsoNormal" style="margin-bottom: 12pt;">I think this is somewhat like
the TRANSITIONAL strategy that I suggested. The intermediate browser feature
you suggest wouldn&#39;t work, however.<br>
<br>
A UI would be really ugly in practice. The venders have found that simple icons
don&#39;t alert people - what you have to do is go to a special intermediate page
with strong warnings, and have a Continue and Back button.<br>
<br>
If you are on an old browser, of course, you&#39;d still go to &#39;ss&#39;.<br>
<br>
And it won&#39;t work with search engines (we don&#39;t have little men in our servers
at Google who can decide what&#39;s real and what&#39;s not.<br>
<br>
And it won&#39;t work for email (without some really ugly bounceback).<br>
<br clear="all">
Mark<br>
<br>
</p>

<div>

<p class="MsoNormal">On Tue, Dec 1, 2009 at 06:45, Georg Ochsner &lt;<a href="mailto:g.ochsner@revolistic.com" target="_blank">g.ochsner@revolistic.com</a>&gt; wrote:</p>

<p class="MsoNormal">Hello Mark,<br>
<br>
what about a fourth scenario?<br>
<br>
1. IDNA2008 clearly says that ß is PVALID an shall not be mapped to ss anymore.<br>
2. Browsers get an additional feature. It informs users when typing a hostname
with ß that previously they would have been redirected to the ss sibling. And
that they now need to use ss in order to get to the old destination.</p>

<blockquote style="border-style: none none none solid; border-color: -moz-use-text-color -moz-use-text-color -moz-use-text-color rgb(204, 204, 204); border-width: medium medium medium 1pt; padding: 0cm 0cm 0cm 6pt; margin-left: 4.8pt; margin-right: 0cm;">


<p class="MsoNormal">3. Registries wait until IDNA2008 is spread, let’s say more
widely than IDNA2003 is until now. (That is 6 years and with still xx% IE6s out
there)<br>
4. Registries inform the registrants and offer a grandfathering registration
(like the .mx registry recently did) that allows all registrants of domain
names with ss to register the ß sibling if they like.<br>
5. Registration is opened to the public and people realize that
&quot;machines&quot; now distinguish ß from ss like humans do.<br>
<br>
Please add more useful steps between 1. and 5. :-)<br>
<br>
Best regards<br>
Georg<br>
<br>
<br>
<br>
-----Ursprüngliche Nachricht-----<br>
Von: <a href="mailto:mark.edward.davis@gmail.com" target="_blank">mark.edward.davis@gmail.com</a>
[mailto:<a href="mailto:mark.edward.davis@gmail.com" target="_blank">mark.edward.davis@gmail.com</a>]
Im Auftrag von Mark Davis ?<br>
Gesendet: Montag, 30. November 2009 19:01<br>
An: Georg Ochsner<br>
Cc: Alexander Mayrhofer; Patrik Fältström; Michael Everson; IDNA update work;
Andreas Stötzner<br>
Betreff: Re: Mappings - some examples</p>

<div>

<p class="MsoNormal"><br>
Even for English, IDNA does not permit all valid words: &quot;Joe&#39;s Bar&quot;
will not work, because of both the space and the apostrophe and
&quot;Joe&#39;sBar&quot; because of the apostrophe. IDNA2008 explicitly does not
permit all sequences that would be valid words in all languages; nor could it
do otherwise.<br>
<br>
There are two compatibility problems:</p>

</div>

<p class="MsoNormal">1. Existing web pages and other documents that contain ß and
expect to go to location X and not Y.<br>
2. There is still an existing body of billions of browsers that will take years
to disappear (as Erik points out, something like 20% of browsers are still
IE6).</p>

<div>

<div>

<p class="MsoNormal" style="margin-bottom: 12pt;">Let&#39;s suppose that IDNA2008
allows ß, and that the newer browsers use it (and not a compatibility scheme
like <a href="http://unicode.org/reports/tr46/" target="_blank">http://unicode.org/reports/tr46/</a>).
The only real purpose to allowing ß is so that you can distinguish from ss. But
what happens when Herr Stosser gets <a href="http://stosser.at" target="_blank">stosser.at</a>
and Herr Stoßer gets <a href="http://stosser.at" target="_blank">stoßer.at</a>?<br>
<br>
Initially, 100% of all browsers will go to the ss form. Nobody will go to
Stoßer&#39;s site; his email won&#39;t work, etc.: href=&quot;<a href="http://stosser.at" target="_blank">stoßer.at</a>&quot; goes directly to
&quot;<a href="http://stosser.at" target="_blank">stosser.at</a>&quot;. Even on
Stoßer&#39;s site, absolute intrapage links will go to the &#39;wrong&#39; place. After a
while, some newer browsers will take page href=&quot;<a href="http://stosser.at" target="_blank">stoßer.at</a>&quot; and go to <a href="http://stosser.at" target="_blank">stoßer.at</a>, while all the other browsers will go to
href=&quot;<a href="http://stosser.at" target="_blank">stosser.at</a>&quot;.
The same goes for email. So access to all of those links (and mail, etc.) will
be unreliable, and the subject of security and compatibility problems. As a
result, practically, people would be unable to use href=&quot;<a href="http://stosser.at" target="_blank">stoßer.at</a>&quot; in their web pages
or in email until essentially all existing browsers were supplanted, which will
be maybe 5 years down the line. And during that time, these will also bollux up
all the search engines, since indexing assumes that links don&#39;t have ambiguous
targets.<br>
<br>
And that assumes that nobody does use a compatibility mechanism. Another, more
likely, alternative based on our conversations with vendors is that people
disregard that part of IDNA2008, and use a compatibility mechanism like <a href="http://unicode.org/reports/tr46/" target="_blank">http://unicode.org/reports/tr46/</a>;
that allows the browsers, emailers, search engines and others to keep
functioning correctly - there is no transition. The downside is that you can&#39;t
register both <a href="http://stosser.at" target="_blank">stosser.at</a> and <a href="http://stosser.at" target="_blank">stoßer.at</a>. So of the thousand Herr
Stoßers, instead of one of them getting that name, none of them do; it&#39;s like
&quot;Joe&#39;sBar&quot;. And, of course, there is the disadvantage of having UTS46
have to exist in the first place.<br>
<br>
The third alternative is the really awful one: the &quot;let a thousand flowers
bloom&quot; scenario. In this scenario, there is no single compatibility
mechanism like <a href="http://unicode.org/reports/tr46/" target="_blank">http://unicode.org/reports/tr46/</a>;
instead, we get different variants from different vendors, and the situation is
chaotic. That is the scenario that the Unicode consortium&#39;s members are really
concerned with. While the ideal solution would be an IDNA2008 that maintained
compatibility with IDNA2003, the second best solution is only one compatibility
mechanism; not dozens.<br>
<br>
Mark<br>
<br>
On Mon, Nov 30, 2009 at 07:55, Georg Ochsner &lt;<a href="mailto:g.ochsner@revolistic.com" target="_blank">g.ochsner@revolistic.com</a>&gt; wrote:<br>
&gt; -----Ursprüngliche Nachricht-----<br>
&gt; Von: <a href="mailto:idna-update-bounces@alvestrand.no" target="_blank">idna-update-bounces@alvestrand.no</a>
[mailto:<a href="mailto:idna-update-" target="_blank">idna-update-</a><br>
&gt; <a href="mailto:bounces@alvestrand.no" target="_blank">bounces@alvestrand.no</a>] Im
Auftrag von Alexander Mayrhofer<br>
&gt; Gesendet: Montag, 30. November 2009 15:57<br>
<br>
&gt; &gt; I would though be more &quot;on your side&quot; if the number of
domain<br>
&gt; &gt; names that contained ß where say 100 times higher than today<br>
&gt; &gt; in published documents. Because then people would be TOLD to<br>
&gt; &gt; type in something (ß) that mapped to something else (ss) that<br>
&gt; &gt; was registered. That, I claim, is not the case. At least not<br>
&gt; &gt; &quot;heavily&quot;.<br>
&gt;<br>
&gt; I understand that. And i&#39;m saying that the potential of around 500<br>
&gt; useful &quot;ß&quot; registrations (based on looking through our inventory
of 900k<br>
&gt; domains) is by far not worth the effort.<br>
In several talks with people from the Austrian registry I&#39;ve now heard this<br>
argument. But I think this decision should not be made depending on<br>
commercial factors. IDNA is in my eyes not a question of return on<br>
investment but about the native use of language in domain names around the<br>
globe. Once more, the Austrian registry can still refuse to have sharp s<br>
registered within their namespace, but maybe other registries pay more<br>
attention to the language aspect than to commercial calculations.<br>
<br>
Best regards<br>
Georg<br>
<br>
_______________________________________________<br>
Idna-update mailing list<br>
<a href="mailto:Idna-update@alvestrand.no" target="_blank">Idna-update@alvestrand.no</a><br>
<a href="http://www.alvestrand.no/mailman/listinfo/idna-update" target="_blank">http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
<br>
</p>

</div>

</div>

</blockquote>

</div>

<p class="MsoNormal"> </p>

</div></div></div>

</div>

</div>


</blockquote></div><br>