<html>
<body>
The problem we face seem to consists in having men and computers writing
and communicating together along a common standard: there are constraints
on the three sides involed. <br>
- Patrick supports the <b>computer</b>, <br>
- Michael the <b>man</b> side, <br>
- and Debbie the <b>standard</b> side. <br>
The need is for a practical, stable and secure interintelligibility among
them.<br><br>
Question: where are the blocking factors we did not identified (we would
have addressed them). I suggest two: <br><br>
- <b>our conceptal confusion. <br><br>
</b>We deal with countries, scripts, and languages is if they were the
same everywhere, based on the same attributes, with the same
characteristics, wherever they are and used. IMHO, to help clarifying
this belongs to the Debbie's standard (metadata) side she already has to
address with ISO 639-4/-6 and her proposed TC46 NWIP.<br><br>
-<b> the lack of conceptual interoperability between man and computer.
<br><br>
</b>We need an interreadibility solution which <b>will not change</b> (so
the network can constantly support it without being delayed by its 10
years hysteresis) <b>but extend</b> (so Michael can support every new
script and writing system he may discover). I think this is possible.
However, the first problem is not with the IETF (which takes care of the
pipe) but with Unicode/ISO (which take care of the UCS). The second
problem will be with IETF: to support a registry architecture for them
(no update, but dated additions). In a nutshell: the current UCS is for
people. We need an UCS for people-and-machines that can span
revisions.<br><br>
This is a challenge. <b>Can Unicode/ISO come with an UCS system Patrick
can work with</b> in using registry based algorithms? Until then I am
afraid all Patrick/IETF can do is to match the current Unicode version.
<br><br>
To better explain what I mean, I introduced the example of the
<b>UCSSEC</b> idea (one code for one secure glyph for several characters
in different script/languages) to extend UCS (one code for one character
for several general glyphs). This means a unique grapheme oriented table,
documented with language/script oriented metadata. Michael can use the
whole data/metadata spectrum, and Patrick use algorithms on the data
layer only. The Internet will only have to work out an adapted
presentation layer mechanism to rebuild the current Unicode set from the
UCSSEC data+matadata. IDNA presently puts it at application level, I
would prefer to put it at OPES level (on the inner edge) for the updates
to be carried by the ISP.<br><br>
<b>This is just an example</b>, there might be simpler and more stable
solutions?<br>
jfc<br><br>
PS. I am glad to see that progressively the points I was denied are going
through (eg. IETF/Unicode MoU would be of great help to formalize the
different inter relational aspects and responsibilities). <br><br>
At 11:12 20/06/2007, Debbie Garside wrote:<br>
<blockquote type=cite class=cite cite="">Hi <br>
I see both sides of this and I think there could be a compromise.&nbsp; I
like<br>
Patrik's &quot;rules&quot; but I can see that they will not work without
some human<br>
intervention.&nbsp; Is there a way forward that will utilise the rules as
a<br>
starting point to produce a base list which is then revised by<br>
UNICODE/script experts?<br><br>
For me, as Editor if ISO 639-6, I would like to see Unicode
Codepoints<br>
allocated to the language writing system (alpha4) code within ISO 639-6
-<br>
that's why I put them there! I put this to the CLDR group last
year.&nbsp; A lot<br>
of work but it would be a beautiful result.&nbsp; Subsets of the
codepoints<br>
allocated to a writing system could be created for IDN purposes.<br><br>
Best regards<br><br>
Debbie<br><br>
&gt; -----Original Message-----<br>
&gt; From: idna-update-bounces@alvestrand.no <br>
&gt;
[<a href="mailto:idna-update-bounces@alvestrand.no" eudora="autourl">
mailto:idna-update-bounces@alvestrand.no</a>] On Behalf Of <br>
&gt; Michael Everson<br>
&gt; Sent: 20 June 2007 09:52<br>
&gt; To: Patrik Fältström<br>
&gt; Cc: idna-update@alvestrand.no<br>
&gt; Subject: Re: New version, <br>
&gt; draft-faltstrom-idnabis-tables-02.txt, available<br>
&gt; <br>
&gt; At 10:27 +0200 2007-06-20, Patrik Fältström wrote:<br>
&gt; <br>
&gt; &gt;&gt;I don't think you can get away with updating without human
<br>
&gt; &gt;&gt;intervention, discussion, and decision. The writing systems
of the <br>
&gt; &gt;&gt;world are not tidy.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;If you take this notion on board and embrace it, I think
<br>
&gt; you will be <br>
&gt; &gt;&gt;more comfortable about updating to future versions of
Unicode.<br>
&gt; &gt;<br>
&gt; &gt;The Unicode Consortium have already today a process when adding
<br>
&gt; &gt;codepoints to decide on the property values that today
exists.<br>
&gt; <br>
&gt; Yes, they do.<br>
&gt; <br>
&gt; &gt;I see a big difference between:<br>
&gt; &gt;<br>
&gt; &gt;&nbsp; - Having the IETF use those properties and calculate what
<br>
&gt; codepoints <br>
&gt; &gt;can be used in IDN<br>
&gt; <br>
&gt; Um, that would be a bad idea. The IETF must work together <br>
&gt; with the Unicode Consortium to do this work. There must be <br>
&gt; cooperation... now and in future... between the two
organizations.<br>
&gt; <br>
&gt; &gt;&nbsp; - Having IETF ask Unicode Consortium to define a new
property,<br>
&gt; &gt;&nbsp;&nbsp;&nbsp; and learn how to evaluate for every codepoint
added what property<br>
&gt; &gt;&nbsp;&nbsp;&nbsp; value it should have<br>
&gt; <br>
&gt; I don't see why IETF would be asking for new property <br>
&gt; definitions. What properties do you have in mind?<br>
&gt; <br>
&gt; Again, the IETF has to build into its IDN process a healthy <br>
&gt; liaison with the UTC. Script and character expertise is on <br>
&gt; the side of those who develop the UCS. That's where you can <br>
&gt; ask questions and get clarification. I doubt that IETF has <br>
&gt; the competence to evaluate what property values a character <br>
&gt; &quot;should have&quot;. That's not a problem, so long as there is a
<br>
&gt; good liaison process.<br>
&gt; <br>
&gt; &gt;So, starting to have rules for individual codepoints will be a
<br>
&gt; &gt;completely different kind of thing than an algorithm based <br>
&gt; on existing <br>
&gt; &gt;properties, and one of the reasons IDNA is locked today to <br>
&gt; Unicode 3.2.<br>
&gt; <br>
&gt; Patrick.<br>
&gt; <br>
&gt; Of course you have no particular reason to listen to me. I am <br>
&gt; only a linguist and expert in the writing systems of the <br>
&gt; world, who am mostly concerned with adding new scripts and <br>
&gt; characters to the UCS. But I have said for a long time now <br>
&gt; that YOU CANNOT DO THIS WORK ALGORITHMICALLY. Six months? A <br>
&gt; year? I don't know how long. You're going to have to grasp <br>
&gt; this nettle. The writing systems of the world can't be <br>
&gt; reduced to an algorithm. There will ALWAYS be some exception. <br>
&gt; That is why Ken and Mark and Michel have worked on a table <br>
&gt; for use. You can't generate that table from properties. You <br>
&gt; have to choose the table based on intelligent analysis.<br>
&gt; <br>
&gt; Perhaps IDNA is locked on Unicode 3.2 because the IETF is <br>
&gt; uncomfortable with human-selected tables. <br>
&gt; Well, that's IETF's problem, and it is easily solved. Remove <br>
&gt; the pre-condition which you have set, that &quot;an algorithm <br>
&gt; based on existing properties&quot; is the way in which the table
<br>
&gt; is &quot;generated&quot;. Then you will be able to make progress.
But <br>
&gt; it's *your* pre-condition.<br>
&gt; <br>
&gt; &gt;I.e. I am extremely nervous implications will be that <br>
&gt; IDNA200x vill be <br>
&gt; &gt;locked to Unicode 5.0 because of this (or 5.1 or whatever
fixed<br>
&gt; &gt;version) just like IDNA we have today.<br>
&gt; <br>
&gt; Write into the rules a joint IETF/UTC process for evaluating <br>
&gt; and agreeing updates as the character set grows in time.<br>
&gt; <br>
&gt; &gt;I was hoping the existing properties would be enough for doing
<br>
&gt; &gt;IDNA200x, and I have still not given up. If the Unicode <br>
&gt; people tell me <br>
&gt; &gt;that is not possible, then things changes quite
drastically.<br>
&gt; <br>
&gt; It is not dramatic. It is simple. You (IETF/UTC) agree a <br>
&gt; table which has a certain content. When Unicode 6.0 comes <br>
&gt; out, you (IETF/UTC) sit together and agree a revised table.<br>
&gt; <br>
&gt; &gt;Yes, I have heard you personally (and others) say that one <br>
&gt; have to have <br>
&gt; &gt;exceptions here and there, but I have still been hoping we <br>
&gt; do not have <br>
&gt; &gt;to have that.<br>
&gt; <br>
&gt; At what point will you give up this hope? You will have to do <br>
&gt; so, I believe. In fact I think (if you will forgive me for <br>
&gt; saying so) that *your<br>
&gt; hope* is the primary stumbling block which has prevented this <br>
&gt; IETF/UTC group from making progress. If *you* give up this <br>
&gt; &quot;hope&quot; we should be able to make progress.<br>
&gt; <br>
&gt; That is my opinion. Perhaps others share it. I am independent <br>
&gt; enough to say it out loud. I am sorry if my opinion finds <br>
&gt; disfavour with you.<br>
&gt; <br>
&gt; &gt;We have sort of had this discussion before, but never really
<br>
&gt; dived into <br>
&gt; &gt;the question of &quot;what happens if we do NOT have the <br>
&gt; exceptions, how bad <br>
&gt; &gt;is that&quot; and compare with the implications of doing
inspection on <br>
&gt; &gt;codepoint level. Is it worth it (regardless of what path we
choose)?<br>
&gt; <br>
&gt; We are here now. We can look at the list of characters in the <br>
&gt; table and inspect them. Did you think an algorithm was going <br>
&gt; to know about writing systems? PLEASE jog yourself out of <br>
&gt; your current abstractions. Writing systems are untidy. <br>
&gt; The table has to be selected by PEOPLE. By this group of
people.<br>
&gt; <br>
&gt; &gt;This is definitely the time when we should have the
discussion.<br>
&gt; <br>
&gt; OK. My take on this hasn't changed for six months or more. <br>
&gt; But if the discussion is now, then it is now.<br>
&gt; --<br>
&gt; Michael Everson *
<a href="http://www.evertype.com/" eudora="autourl">
http://www.evertype.com</a> <br>
&gt; _______________________________________________<br>
&gt; Idna-update mailing list<br>
&gt; Idna-update@alvestrand.no<br>
&gt;
<a href="http://www.alvestrand.no/mailman/listinfo/idna-update" eudora="autourl">
http://www.alvestrand.no/mailman/listinfo/idna-update</a><br>
&gt; <br>
&gt; <br><br>
<br><br>
_______________________________________________<br>
Idna-update mailing list<br>
Idna-update@alvestrand.no<br>
<a href="http://www.alvestrand.no/mailman/listinfo/idna-update" eudora="autourl">
http://www.alvestrand.no/mailman/listinfo/idna-update</a></blockquote>
</body>
</html>