I got some amusing results when I tried out the Altavista translation
service on segments of the new language descriptions in
http://www.unicode.org/unicode/standard/WhatIsUnicode.html
Original (English):
What is Unicode? Unicode provides a unique number for every character,
no matter what the platform, no matter what the program, no matter what
the language.
Fundamentally, computers just deal with numbers. They store letters and
other characters by assigning a number for each one. Before Unicode was
invented, there were hundreds of different encoding systems for
assigning these numbers. No single encoding could contain enough
characters: for example, the European Union alone requires several
different encodings to cover all its languages. Even for a single
language like English no single encoding was adequate for all the
letters, punctuation, and technical symbols in common use.
These encoding systems also conflict with one another. That is, two
encodings can use the same number for two different characters, or use
different numbers for the same character. Any given computer (especially
servers) needs to support many different encodings; yet whenever data is
passed between different encodings or platforms, that data always runs
the risk of corruption.
Hand-translated into German, on that page:
Was ist Unicode? Unicode gibt jedem Zeichen seine eigene Nummer,
platformunabhängig, programmunabhängig, sprachunabhängig.
Grundsätzlich arbeiten Computer nur mit Zahlen. Buchstaben und andere
Zeichen werden daher Zahlen zugeordnet, um sie zu speichern. Vor der
Erfindung von Unicode gab es hunderte unterschiedlicher
Kodierungssysteme. Keines dieser Kodierungssyteme umfasste je genug
Zeichen: so braucht die Europäische Union allein mehrere
Kodierungssysteme, um damit den Bedarf für die Sprachen aller
Mitgliedsländer abzudecken. Nicht einmal für eine einzelne Sprache wie
Englisch oder Deutsch gab es ein Kodierungssystem das wirklich alle
Buchstaben, Interpunktionszeichen und alle gebräuchlichen technischen
Zeichen umfasste.
Diese Kodierungssysteme sind untereinander unverträglich, denn
unterschiedliche Kodierungen können dieselbe Zahl für verschiedene
Zeichen benutzen, oder verschiedene Zahlen für dasselbe Zeichen. Jeder
Rechner (vor allem Server) muß viele verschiedene Kodierungssysteme
unterstützen; und wenn Text zwischen verschiedenen Kodierungssystemen
oder Rechnersystemen ausgetauscht wird, läuft dieser Text Gefahr,
verstümmelt zu werden.
Altavista: German to English:
What is university code? University code gives its own number,
platformunabhängig, to each character programmunabhängig,
sprachunabhängig. Grundsätzlich operate computers only with numbers.
Letters and other characters are assigned numbers in order to store it.
Before the invention of university code there were hundred different
coding systems. None this Kodierungssyteme covered ever enough
characters: thus the Europäi union needs alone several coding systems,
in order to cover with it the requirement für the languages of all
Mitgliedsländer. Not even für an individual language such as English or
German gave it a coding system that really all letters, punctuation
characters and all gebräuchlichen technical characters covered. These
coding systems are among themselves unverträglich, because different
coding können the same number für different characters use, or different
numbers für the same character. Each computer (above all server) muß
many different coding systems unterstützen; and if text between
different coding systems or computer systems is exchanged, this text
danger läuft to be verstümmelt.
Altavista: English to German:
Was ist Unicode? Unicode stellt eine eindeutige Zahl für jedes Zeichen,
egal was die Plattform, egal was das Programm, egal was die Sprache zur
Verfügung. Grundlegend beschäftigen Computer gerade Zahlen. Sie
speichern Zeichen und andere Zeichen, indem sie eine Zahl für jede
zuweisen. Bevor Unicode erfunden wurde, gab es Hunderte der
unterschiedlichen verschlüsselsysteme für das Zuweisen dieser Zahlen.
Keine kodierung konnte genügende Zeichen enthalten: z.B. benötigt der
europäische Anschluß alleine einige unterschiedliche Encodings, alle
seine Sprachen zu umfassen. Sogar für eine einzelne Sprache wie Englisch
war keine kodierung für alle Zeichen, Interpunktion und technischen
Symbole in allgemeinem Gebrauch ausreichend. Diese verschlüsselsysteme
widersprechen auch miteinander. Das heißt, können zwei Encodings die
gleiche Zahl für zwei unterschiedliche Zeichen verwenden, oder verwenden
Sie unterschiedliche Zahlen für das gleiche Zeichen. Irgendwelche
gegebenen Notwendigkeiten des Computers (besonders Servers),viele
unterschiedliche Encodings zu unterstützen; dennoch, wann immer Daten
zwischen unterschiedliche Encodings oder Plattformen übermittelt werden,
lassen diese Daten immer die Gefahr von Korruption laufen.
Altavista: English to German to English:
What is university code? University code places a unique number für each
character, all the same which the platform, all the same which the
program, all the same which the language to the Verfügung. Fundamentally
beschäftigen computer even numbers. They store characters and other
characters, by assigning a number für everyone. Before university code
was invented, there were hundreds the different verschlüsselsysteme für
assigning these numbers. No coding could contain genügende characters:
e.g. the europäische Anschluß benötigt alone some different Encodings to
cover all its languages. Für an individual language such as English was
not even sufficient coding für all characters, pointing and technical
symbols in general use. This verschlüsselsysteme contradicts also
together. Heißt, können two Encodings the same number für two different
characters use, or use you different numbers für the same character. Any
given necessities for the computer (particularly Servers) to
unterstützen many different Encodings; whenever data between different
Encodings or platforms are übermittelt, these data nevertheless have the
risk always run by corruption.
Mark
___
Mark Davis, IBM Center for Java Technology, Cupertino
(408) 777-5850 [fax: 5891], mark.davis@us.ibm.com, president@unicode.org
http://maps.yahoo.com/py/maps.py?Pyt=Tmap&addr=10275+N.+De+Anza&csz=95014
This archive was generated by hypermail 2.1.2 : Tue Jul 10 2001 - 17:21:04 EDT