English as she is spoke

From: mark.davis@us.ibm.com
Date: Thu Jun 22 2000 - 18:17:27 EDT


I got some amusing results when I tried out the Altavista translation
service on segments of the new language descriptions in
http://www.unicode.org/unicode/standard/WhatIsUnicode.html

Original (English):

   What is Unicode? Unicode provides a unique number for every character,
   no matter what the platform, no matter what the program, no matter what
   the language.

   Fundamentally, computers just deal with numbers. They store letters and
   other characters by assigning a number for each one. Before Unicode was
   invented, there were hundreds of different encoding systems for
   assigning these numbers. No single encoding could contain enough
   characters: for example, the European Union alone requires several
   different encodings to cover all its languages. Even for a single
   language like English no single encoding was adequate for all the
   letters, punctuation, and technical symbols in common use.

   These encoding systems also conflict with one another. That is, two
   encodings can use the same number for two different characters, or use
   different numbers for the same character. Any given computer (especially
   servers) needs to support many different encodings; yet whenever data is
   passed between different encodings or platforms, that data always runs
   the risk of corruption.

Hand-translated into German, on that page:

   Was ist Unicode? Unicode gibt jedem Zeichen seine eigene Nummer,
   platformunabhängig, programmunabhängig, sprachunabhängig.

   Grundsätzlich arbeiten Computer nur mit Zahlen. Buchstaben und andere
   Zeichen werden daher Zahlen zugeordnet, um sie zu speichern. Vor der
   Erfindung von Unicode gab es hunderte unterschiedlicher
   Kodierungssysteme. Keines dieser Kodierungssyteme umfasste je genug
   Zeichen: so braucht die Europäische Union allein mehrere
   Kodierungssysteme, um damit den Bedarf für die Sprachen aller
   Mitgliedsländer abzudecken. Nicht einmal für eine einzelne Sprache wie
   Englisch oder Deutsch gab es ein Kodierungssystem das wirklich alle
   Buchstaben, Interpunktionszeichen und alle gebräuchlichen technischen
   Zeichen umfasste.

   Diese Kodierungssysteme sind untereinander unverträglich, denn
   unterschiedliche Kodierungen können dieselbe Zahl für verschiedene
   Zeichen benutzen, oder verschiedene Zahlen für dasselbe Zeichen. Jeder
   Rechner (vor allem Server) muß viele verschiedene Kodierungssysteme
   unterstützen; und wenn Text zwischen verschiedenen Kodierungssystemen
   oder Rechnersystemen ausgetauscht wird, läuft dieser Text Gefahr,
   verstümmelt zu werden.

Altavista: German to English:

   What is university code? University code gives its own number,
   platformunabhängig, to each character programmunabhängig,
   sprachunabhängig. Grundsätzlich operate computers only with numbers.
   Letters and other characters are assigned numbers in order to store it.
   Before the invention of university code there were hundred different
   coding systems. None this Kodierungssyteme covered ever enough
   characters: thus the Europäi union needs alone several coding systems,
   in order to cover with it the requirement für the languages of all
   Mitgliedsländer. Not even für an individual language such as English or
   German gave it a coding system that really all letters, punctuation
   characters and all gebräuchlichen technical characters covered. These
   coding systems are among themselves unverträglich, because different
   coding können the same number für different characters use, or different
   numbers für the same character. Each computer (above all server) muß
   many different coding systems unterstützen; and if text between
   different coding systems or computer systems is exchanged, this text
   danger läuft to be verstümmelt.

Altavista: English to German:

   Was ist Unicode? Unicode stellt eine eindeutige Zahl für jedes Zeichen,
   egal was die Plattform, egal was das Programm, egal was die Sprache zur
   Verfügung. Grundlegend beschäftigen Computer gerade Zahlen. Sie
   speichern Zeichen und andere Zeichen, indem sie eine Zahl für jede
   zuweisen. Bevor Unicode erfunden wurde, gab es Hunderte der
   unterschiedlichen verschlüsselsysteme für das Zuweisen dieser Zahlen.
   Keine kodierung konnte genügende Zeichen enthalten: z.B. benötigt der
   europäische Anschluß alleine einige unterschiedliche Encodings, alle
   seine Sprachen zu umfassen. Sogar für eine einzelne Sprache wie Englisch
   war keine kodierung für alle Zeichen, Interpunktion und technischen
   Symbole in allgemeinem Gebrauch ausreichend. Diese verschlüsselsysteme
   widersprechen auch miteinander. Das heißt, können zwei Encodings die
   gleiche Zahl für zwei unterschiedliche Zeichen verwenden, oder verwenden
   Sie unterschiedliche Zahlen für das gleiche Zeichen. Irgendwelche
   gegebenen Notwendigkeiten des Computers (besonders Servers),viele
   unterschiedliche Encodings zu unterstützen; dennoch, wann immer Daten
   zwischen unterschiedliche Encodings oder Plattformen übermittelt werden,
   lassen diese Daten immer die Gefahr von Korruption laufen.

Altavista: English to German to English:

   What is university code? University code places a unique number für each
   character, all the same which the platform, all the same which the
   program, all the same which the language to the Verfügung. Fundamentally
   beschäftigen computer even numbers. They store characters and other
   characters, by assigning a number für everyone. Before university code
   was invented, there were hundreds the different verschlüsselsysteme für
   assigning these numbers. No coding could contain genügende characters:
   e.g. the europäische Anschluß benötigt alone some different Encodings to
   cover all its languages. Für an individual language such as English was
   not even sufficient coding für all characters, pointing and technical
   symbols in general use. This verschlüsselsysteme contradicts also
   together. Heißt, können two Encodings the same number für two different
   characters use, or use you different numbers für the same character. Any
   given necessities for the computer (particularly Servers) to
   unterstützen many different Encodings; whenever data between different
   Encodings or platforms are übermittelt, these data nevertheless have the
   risk always run by corruption.

Mark
___
Mark Davis, IBM Center for Java Technology, Cupertino
(408) 777-5850 [fax: 5891], mark.davis@us.ibm.com, president@unicode.org
http://maps.yahoo.com/py/maps.py?Pyt=Tmap&addr=10275+N.+De+Anza&csz=95014



This archive was generated by hypermail 2.1.2 : Tue Jul 10 2001 - 17:21:04 EDT