<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=us-ascii"><meta name=Generator content="Microsoft Word 14 (filtered medium)"><style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p
        {mso-style-priority:99;
        mso-margin-top-alt:auto;
        margin-right:0in;
        mso-margin-bottom-alt:auto;
        margin-left:0in;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
span.EmailStyle17
        {mso-style-type:personal;
        font-family:"Arial","sans-serif";
        color:windowtext;}
span.EmailStyle19
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page Section1
        {size:8.5in 11.0in;
        margin:1.0in 1.25in 1.0in 1.25in;}
div.Section1
        {page:Section1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]--></head><body lang=EN-US link=blue vlink=purple><div class=Section1><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>A generic tag (&#8220;machxlat&#8221;?) doesn&#8217;t seem like a terrible idea. But it&#8217;s also not clear to me how it would be used: would it only be reported to users in some UI, or would other automated processes be used on tags containing this subtag? Is MT important to distinguish from native speakers with bad (non-conventional) spelling and grammar, or from 2<sup>nd</sup>-language speakers with bad spelling and grammar, or even from non-standard dialects (which may differ considerably from standard usage)?<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Peter<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span></p><div><div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in'><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>From:</span></b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'> ietf-languages-bounces@alvestrand.no [mailto:ietf-languages-bounces@alvestrand.no] <b>On Behalf Of </b>Debbie Garside<br><b>Sent:</b> Wednesday, September 09, 2009 6:25 AM<br><b>To:</b> 'ietflang IETF Languages Discussion'<br><b>Subject:</b> Machine Translation<o:p></o:p></span></p></div></div><p class=MsoNormal><o:p>&nbsp;</o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>Hi<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>The following is part of a conversation I have been having with a couple of colleagues and I was wondering if anyone had any ideas on whether a generic tag could be registered for machine translated text?&nbsp; In the past we have steered away from generic tags (such as western).<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>****<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt'>However, we are concerned that a lot of MT produced Welsh could appear<br>on the web. Google's translation into Welsh isn't perfect by a long<br>shot. Previous so-called attempts have been a lot worse but have been used :<br><br>&nbsp;&nbsp;&nbsp; <a href="http://www.flickr.com/photos/benbore/240597433/" title="http://www.flickr.com/photos/benbore/240597433/">http://www.flickr.com/photos/benbore/240597433/</a> (just one of many)<br><br>and blogs MT'ed into Welsh outnumber those originally written in Welsh<br>when searching in Google.<br><br>&nbsp;&nbsp;&nbsp; e.g. <a href="http://www.google.com/search?q=chyfieitha+dudalen&amp;ie=utf-8&amp;oe=utf-8" title="http://www.google.com/search?q=chyfieitha+dudalen&amp;ie=utf-8&amp;oe=utf-8">http://www.google.com/search?q=chyfieitha+dudalen&amp;ie=utf-8&amp;oe=utf-8</a><br><br>This would not be great news. We hope with this development that some<br>can be educated to use such a service responsibly :<br><br>&nbsp;&nbsp;&nbsp; <a href="http://murmur.bangor.ac.uk/?p=99" title="http://murmur.bangor.ac.uk/?p=99">http://murmur.bangor.ac.uk/?p=99</a><br><br>However, at the very least, this could frustrate our (and others) work<br>and efforts e.g. collecting original Welsh texts from the web as a corpus.<br><br>An idea we had, if this does not already exists for other languages<br>(though languages supported by MT to date have been 'larger' and more<br>robust), was whether ISO 639 could be used in the future to produce<br>codes (or extensions) for tagging text/language as being from an MT<br>system. Hopefully the provision of codes or meta data could facilitate<br>MT providers to implement these so that such texts can be excluded in<br>certain applications. (including search engines!)<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt'>And further&#8230;.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt'>****<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal>However, in our case we would welcome a further distinction of MT for Welsh. Clearly there must be a distinction&nbsp; made between 'MT' from InterTrans and original/proper Welsh. <br><br>But we might want to one day want to distinguish even between MT providers - cy-mt-intertrans, cy-mt-google and cy-mt-apertium. Some might be more reliable than the others.<span style='font-size:10.0pt'><o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>Your thoughts would be appreciated.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>Best regards<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>Debbie<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>Debbie Garside<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><o:p>&nbsp;</o:p></p><p class=MsoNormal><o:p>&nbsp;</o:p></p><p><span style='font-size:10.0pt'>Internal Virus Database is out-of-date.<br>Checked by AVG.<br>Version: 7.5.560 / Virus Database: 270.12.26/2116 - Release Date: 15/05/2009 06:16</span><o:p></o:p></p></div></body></html>