<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=windows-1250">


<meta name=Generator content="Microsoft Word 11 (filtered medium)">
<style>
<!--
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman";}
a:link, span.MsoHyperlink
        {color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:Arial;
        color:windowtext;}
@page Section1
        {size:612.0pt 792.0pt;
        margin:72.0pt 90.0pt 72.0pt 90.0pt;}
div.Section1
        {page:Section1;}
-->
</style>

</head>

<body lang=EN-US link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>Hi<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'><o:p>&nbsp;</o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>The following is part of a conversation I have been having
with a couple of colleagues and I was wondering if anyone had any ideas on
whether a generic tag could be registered for machine translated text?&nbsp; In the
past we have steered away from generic tags (such as western).<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'><o:p>&nbsp;</o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>****<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face="Times New Roman"><span style='font-size:
10.0pt'>However, we are concerned that a lot of MT produced Welsh could appear<br>
on the web. Google's translation into Welsh isn't perfect by a long<br>
shot. Previous so-called attempts have been a lot worse but have been used :<br>
<br>
&nbsp;&nbsp;&nbsp; <a href="http://www.flickr.com/photos/benbore/240597433/"
title="http://www.flickr.com/photos/benbore/240597433/" moz-do-not-send=true>http://www.flickr.com/photos/benbore/240597433/</a>
(just one of many)<br>
<br>
and blogs MT'ed into Welsh outnumber those originally written in Welsh<br>
when searching in Google.<br>
<br>
&nbsp;&nbsp;&nbsp; e.g. <a
href="http://www.google.com/search?q=chyfieitha+dudalen&amp;ie=utf-8&amp;oe=utf-8"
title="http://www.google.com/search?q=chyfieitha+dudalen&amp;ie=utf-8&amp;oe=utf-8"
moz-do-not-send=true>http://www.google.com/search?q=chyfieitha+dudalen&amp;ie=utf-8&amp;oe=utf-8</a><br>
<br>
This would not be great news. We hope with this development that some<br>
can be educated to use such a service responsibly :<br>
<br>
&nbsp;&nbsp;&nbsp; <a href="http://murmur.bangor.ac.uk/?p=99"
title="http://murmur.bangor.ac.uk/?p=99" moz-do-not-send=true>http://murmur.bangor.ac.uk/?p=99</a><br>
<br>
However, at the very least, this could frustrate our (and others) work<br>
and efforts e.g. collecting original Welsh texts from the web as a corpus.<br>
<br>
An idea we had, if this does not already exists for other languages<br>
(though languages supported by MT to date have been 'larger' and more<br>
robust), was whether ISO 639 could be used in the future to produce<br>
codes (or extensions) for tagging text/language as being from an MT<br>
system. Hopefully the provision of codes or meta data could facilitate<br>
MT providers to implement these so that such texts can be excluded in<br>
certain applications. (including search engines!)<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face="Times New Roman"><span style='font-size:
10.0pt'><o:p>&nbsp;</o:p></span></font></p>

<p class=MsoNormal><font size=2 face="Times New Roman"><span style='font-size:
10.0pt'>And further&#8230;.<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face="Times New Roman"><span style='font-size:
10.0pt'><o:p>&nbsp;</o:p></span></font></p>

<p class=MsoNormal><font size=2 face="Times New Roman"><span style='font-size:
10.0pt'>****<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face="Times New Roman"><span style='font-size:
10.0pt'><o:p>&nbsp;</o:p></span></font></p>

<p class=MsoNormal><font size=3 face="Times New Roman"><span style='font-size:
12.0pt'>However, in our case we would welcome a further distinction of MT for
Welsh. Clearly there must be a distinction&nbsp; made between 'MT' from
InterTrans and original/proper Welsh. <br>
<br>
But we might want to one day want to distinguish even between MT providers - cy-mt-intertrans,
cy-mt-google and cy-mt-apertium. Some might be more reliable than the others.</span></font><font
size=2><span style='font-size:10.0pt'><o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face="Times New Roman"><span style='font-size:
10.0pt'><o:p>&nbsp;</o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>Your thoughts would be appreciated.<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'><o:p>&nbsp;</o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>Best regards<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'><o:p>&nbsp;</o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>Debbie<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'><o:p>&nbsp;</o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>Debbie Garside<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'><o:p>&nbsp;</o:p></span></font></p>

<p class=MsoNormal><font size=3 face="Times New Roman"><span style='font-size:
12.0pt'><o:p>&nbsp;</o:p></span></font></p>

</div>

</body>

</html>
<BR>

<P><FONT SIZE=2>Internal Virus Database is out-of-date.<BR>
Checked by AVG.<BR>
Version: 7.5.560 / Virus Database: 270.12.26/2116 - Release Date: 15/05/2009 06:16<BR>
</FONT> </P>