I got some amusing results when I tried out the Altavista translation
service on segments of the new language descriptions in
http://www.unicode.org/unicode/standard/WhatIsUnicode.html
Original (English):
What is Unicode? Unicode provides a unique number for every character,
no matter what the platform, no matter what the program, no matter what
the language.
Fundamentally, computers just deal with numbers. They store letters and
other characters by assigning a number for each one. Before Unicode was
invented, there were hundreds of different encoding systems for
assigning these numbers. No single encoding could contain enough
characters: for example, the European Union alone requires several
different encodings to cover all its languages. Even for a single
language like English no single encoding was adequate for all the
letters, punctuation, and technical symbols in common use.
These encoding systems also conflict with one another. That is, two
encodings can use the same number for two different characters, or use
different numbers for the same character. Any given computer (especially
servers) needs to support many different encodings; yet whenever data is
passed between different encodings or platforms, that data always runs
the risk of corruption.
Hand-translated into German, on that page:
Was ist Unicode? Unicode gibt jedem Zeichen seine eigene Nummer,
platformunabh�ngig, programmunabh�ngig, sprachunabh�ngig.
Grunds�tzlich arbeiten Computer nur mit Zahlen. Buchstaben und andere
Zeichen werden daher Zahlen zugeordnet, um sie zu speichern. Vor der
Erfindung von Unicode gab es hunderte unterschiedlicher
Kodierungssysteme. Keines dieser Kodierungssyteme umfasste je genug
Zeichen: so braucht die Europ�ische Union allein mehrere
Kodierungssysteme, um damit den Bedarf f�r die Sprachen aller
Mitgliedsl�nder abzudecken. Nicht einmal f�r eine einzelne Sprache wie
Englisch oder Deutsch gab es ein Kodierungssystem das wirklich alle
Buchstaben, Interpunktionszeichen und alle gebr�uchlichen technischen
Zeichen umfasste.
Diese Kodierungssysteme sind untereinander unvertr�glich, denn
unterschiedliche Kodierungen k�nnen dieselbe Zahl f�r verschiedene
Zeichen benutzen, oder verschiedene Zahlen f�r dasselbe Zeichen. Jeder
Rechner (vor allem Server) mu� viele verschiedene Kodierungssysteme
unterst�tzen; und wenn Text zwischen verschiedenen Kodierungssystemen
oder Rechnersystemen ausgetauscht wird, l�uft dieser Text Gefahr,
verst�mmelt zu werden.
Altavista: German to English:
What is university code? University code gives its own number,
platformunabh�ngig, to each character programmunabh�ngig,
sprachunabh�ngig. Grunds�tzlich operate computers only with numbers.
Letters and other characters are assigned numbers in order to store it.
Before the invention of university code there were hundred different
coding systems. None this Kodierungssyteme covered ever enough
characters: thus the Europ�i union needs alone several coding systems,
in order to cover with it the requirement f�r the languages of all
Mitgliedsl�nder. Not even f�r an individual language such as English or
German gave it a coding system that really all letters, punctuation
characters and all gebr�uchlichen technical characters covered. These
coding systems are among themselves unvertr�glich, because different
coding k�nnen the same number f�r different characters use, or different
numbers f�r the same character. Each computer (above all server) mu�
many different coding systems unterst�tzen; and if text between
different coding systems or computer systems is exchanged, this text
danger l�uft to be verst�mmelt.
Altavista: English to German:
Was ist Unicode? Unicode stellt eine eindeutige Zahl f�r jedes Zeichen,
egal was die Plattform, egal was das Programm, egal was die Sprache zur
Verf�gung. Grundlegend besch�ftigen Computer gerade Zahlen. Sie
speichern Zeichen und andere Zeichen, indem sie eine Zahl f�r jede
zuweisen. Bevor Unicode erfunden wurde, gab es Hunderte der
unterschiedlichen verschl�sselsysteme f�r das Zuweisen dieser Zahlen.
Keine kodierung konnte gen�gende Zeichen enthalten: z.B. ben�tigt der
europ�ische Anschlu� alleine einige unterschiedliche Encodings, alle
seine Sprachen zu umfassen. Sogar f�r eine einzelne Sprache wie Englisch
war keine kodierung f�r alle Zeichen, Interpunktion und technischen
Symbole in allgemeinem Gebrauch ausreichend. Diese verschl�sselsysteme
widersprechen auch miteinander. Das hei�t, k�nnen zwei Encodings die
gleiche Zahl f�r zwei unterschiedliche Zeichen verwenden, oder verwenden
Sie unterschiedliche Zahlen f�r das gleiche Zeichen. Irgendwelche
gegebenen Notwendigkeiten des Computers (besonders Servers),viele
unterschiedliche Encodings zu unterst�tzen; dennoch, wann immer Daten
zwischen unterschiedliche Encodings oder Plattformen �bermittelt werden,
lassen diese Daten immer die Gefahr von Korruption laufen.
Altavista: English to German to English:
What is university code? University code places a unique number f�r each
character, all the same which the platform, all the same which the
program, all the same which the language to the Verf�gung. Fundamentally
besch�ftigen computer even numbers. They store characters and other
characters, by assigning a number f�r everyone. Before university code
was invented, there were hundreds the different verschl�sselsysteme f�r
assigning these numbers. No coding could contain gen�gende characters:
e.g. the europ�ische Anschlu� ben�tigt alone some different Encodings to
cover all its languages. F�r an individual language such as English was
not even sufficient coding f�r all characters, pointing and technical
symbols in general use. This verschl�sselsysteme contradicts also
together. Hei�t, k�nnen two Encodings the same number f�r two different
characters use, or use you different numbers f�r the same character. Any
given necessities for the computer (particularly Servers) to
unterst�tzen many different Encodings; whenever data between different
Encodings or platforms are �bermittelt, these data nevertheless have the
risk always run by corruption.
Mark
___
Mark Davis, IBM Center for Java Technology, Cupertino
(408) 777-5850 [fax: 5891], [email protected], [email protected]
http://maps.yahoo.com/py/maps.py?Pyt=Tmap&addr=10275+N.+De+Anza&csz=95014
This archive was generated by hypermail 2.1.2 : Tue Jul 10 2001 - 17:21:04 EDT