English as she is spoke

From: [email protected]
Date: Thu Jun 22 2000 - 18:17:27 EDT


I got some amusing results when I tried out the Altavista translation
service on segments of the new language descriptions in
http://www.unicode.org/unicode/standard/WhatIsUnicode.html

Original (English):

   What is Unicode? Unicode provides a unique number for every character,
   no matter what the platform, no matter what the program, no matter what
   the language.

   Fundamentally, computers just deal with numbers. They store letters and
   other characters by assigning a number for each one. Before Unicode was
   invented, there were hundreds of different encoding systems for
   assigning these numbers. No single encoding could contain enough
   characters: for example, the European Union alone requires several
   different encodings to cover all its languages. Even for a single
   language like English no single encoding was adequate for all the
   letters, punctuation, and technical symbols in common use.

   These encoding systems also conflict with one another. That is, two
   encodings can use the same number for two different characters, or use
   different numbers for the same character. Any given computer (especially
   servers) needs to support many different encodings; yet whenever data is
   passed between different encodings or platforms, that data always runs
   the risk of corruption.

Hand-translated into German, on that page:

   Was ist Unicode? Unicode gibt jedem Zeichen seine eigene Nummer,
   platformunabh�ngig, programmunabh�ngig, sprachunabh�ngig.

   Grunds�tzlich arbeiten Computer nur mit Zahlen. Buchstaben und andere
   Zeichen werden daher Zahlen zugeordnet, um sie zu speichern. Vor der
   Erfindung von Unicode gab es hunderte unterschiedlicher
   Kodierungssysteme. Keines dieser Kodierungssyteme umfasste je genug
   Zeichen: so braucht die Europ�ische Union allein mehrere
   Kodierungssysteme, um damit den Bedarf f�r die Sprachen aller
   Mitgliedsl�nder abzudecken. Nicht einmal f�r eine einzelne Sprache wie
   Englisch oder Deutsch gab es ein Kodierungssystem das wirklich alle
   Buchstaben, Interpunktionszeichen und alle gebr�uchlichen technischen
   Zeichen umfasste.

   Diese Kodierungssysteme sind untereinander unvertr�glich, denn
   unterschiedliche Kodierungen k�nnen dieselbe Zahl f�r verschiedene
   Zeichen benutzen, oder verschiedene Zahlen f�r dasselbe Zeichen. Jeder
   Rechner (vor allem Server) mu� viele verschiedene Kodierungssysteme
   unterst�tzen; und wenn Text zwischen verschiedenen Kodierungssystemen
   oder Rechnersystemen ausgetauscht wird, l�uft dieser Text Gefahr,
   verst�mmelt zu werden.

Altavista: German to English:

   What is university code? University code gives its own number,
   platformunabh�ngig, to each character programmunabh�ngig,
   sprachunabh�ngig. Grunds�tzlich operate computers only with numbers.
   Letters and other characters are assigned numbers in order to store it.
   Before the invention of university code there were hundred different
   coding systems. None this Kodierungssyteme covered ever enough
   characters: thus the Europ�i union needs alone several coding systems,
   in order to cover with it the requirement f�r the languages of all
   Mitgliedsl�nder. Not even f�r an individual language such as English or
   German gave it a coding system that really all letters, punctuation
   characters and all gebr�uchlichen technical characters covered. These
   coding systems are among themselves unvertr�glich, because different
   coding k�nnen the same number f�r different characters use, or different
   numbers f�r the same character. Each computer (above all server) mu�
   many different coding systems unterst�tzen; and if text between
   different coding systems or computer systems is exchanged, this text
   danger l�uft to be verst�mmelt.

Altavista: English to German:

   Was ist Unicode? Unicode stellt eine eindeutige Zahl f�r jedes Zeichen,
   egal was die Plattform, egal was das Programm, egal was die Sprache zur
   Verf�gung. Grundlegend besch�ftigen Computer gerade Zahlen. Sie
   speichern Zeichen und andere Zeichen, indem sie eine Zahl f�r jede
   zuweisen. Bevor Unicode erfunden wurde, gab es Hunderte der
   unterschiedlichen verschl�sselsysteme f�r das Zuweisen dieser Zahlen.
   Keine kodierung konnte gen�gende Zeichen enthalten: z.B. ben�tigt der
   europ�ische Anschlu� alleine einige unterschiedliche Encodings, alle
   seine Sprachen zu umfassen. Sogar f�r eine einzelne Sprache wie Englisch
   war keine kodierung f�r alle Zeichen, Interpunktion und technischen
   Symbole in allgemeinem Gebrauch ausreichend. Diese verschl�sselsysteme
   widersprechen auch miteinander. Das hei�t, k�nnen zwei Encodings die
   gleiche Zahl f�r zwei unterschiedliche Zeichen verwenden, oder verwenden
   Sie unterschiedliche Zahlen f�r das gleiche Zeichen. Irgendwelche
   gegebenen Notwendigkeiten des Computers (besonders Servers),viele
   unterschiedliche Encodings zu unterst�tzen; dennoch, wann immer Daten
   zwischen unterschiedliche Encodings oder Plattformen �bermittelt werden,
   lassen diese Daten immer die Gefahr von Korruption laufen.

Altavista: English to German to English:

   What is university code? University code places a unique number f�r each
   character, all the same which the platform, all the same which the
   program, all the same which the language to the Verf�gung. Fundamentally
   besch�ftigen computer even numbers. They store characters and other
   characters, by assigning a number f�r everyone. Before university code
   was invented, there were hundreds the different verschl�sselsysteme f�r
   assigning these numbers. No coding could contain gen�gende characters:
   e.g. the europ�ische Anschlu� ben�tigt alone some different Encodings to
   cover all its languages. F�r an individual language such as English was
   not even sufficient coding f�r all characters, pointing and technical
   symbols in general use. This verschl�sselsysteme contradicts also
   together. Hei�t, k�nnen two Encodings the same number f�r two different
   characters use, or use you different numbers f�r the same character. Any
   given necessities for the computer (particularly Servers) to
   unterst�tzen many different Encodings; whenever data between different
   Encodings or platforms are �bermittelt, these data nevertheless have the
   risk always run by corruption.

Mark
___
Mark Davis, IBM Center for Java Technology, Cupertino
(408) 777-5850 [fax: 5891], [email protected], [email protected]
http://maps.yahoo.com/py/maps.py?Pyt=Tmap&addr=10275+N.+De+Anza&csz=95014



This archive was generated by hypermail 2.1.2 : Tue Jul 10 2001 - 17:21:04 EDT