[Unicode]   Common Locale Data Repository : Bug Tracking Home | Site Map | Search
 

source: trunk/common/collation/de.xml @ 5129

Revision 5125, 6.1 KB checked in by pedberg, 9 years ago (diff)

cldrbug 3037: Korean search collator: Add modern vowel decomps, put all modern rules in root etc.

  • Property mime-type set to text/xml
  • Property svn:eol-style set to native
  • Property svn:keywords set to Author Date Id Revision
  • Property svn:mime-type set to text/xml
Line 
1<?xml version="1.0" encoding="UTF-8" ?>
2<!DOCTYPE ldml SYSTEM "../../common/dtd/ldml.dtd">
3<ldml>
4        <identity>
5                <version number="$Revision$" />
6                <generation date="$Date$" />
7                <language type="de" />
8        </identity>
9        <collations validSubLocales="de_AT de_BE de_CH de_DE de_LI de_LU">
10                <collation type="search" >
11                        <settings normalization="on"/>
12                        <!-- root search, suppress contractions for Thai, Lao -->
13                        <suppress_contractions>[เ-ไ ເ-ໄ]</suppress_contractions>
14                        <rules>
15                                <!-- root search rules for Arabic, Hebrew -->
16                                <reset>ا</reset>
17                                        <s>آ</s>
18                                        <s>أ</s>
19                                        <s>إ</s>
20                                <reset>و</reset>
21                                        <s>ؤ</s>
22                                <reset>ي</reset>
23                                        <s>ئ</s>
24                                        <s>ى</s>
25                                <reset>ه</reset>
26                                        <s>ة</s>
27                                <reset><last_primary_ignorable/></reset>
28                                        <s>׳</s>
29                                        <s>״</s>
30                                        <s>ـ</s>
31                                        <s>ٌ</s>
32                                        <s>ٍ</s>
33                                        <s>َ</s>
34                                        <s>ُ</s>
35                                        <s>ِ</s>
36                                        <s>ّ</s>
37                                        <s>ْ</s>
38                                        <s>ฺ</s>
39                                <!-- root search rules for modern Korean jamos -->
40                                <!-- Korean modern complex consonants, decompose: x(L) = CHOSEONG x, x(T) = JONGSEONG x -->
41                                <reset>ᄀ</reset>        <!-- 1100 KIYEOK(L) = 11A8 KIYEOK(T) -->
42                                        <i>ᆨ</i>
43                                <reset>ᄀᄀ</reset>       <!-- 1100 KIYEOK(L) + 1100 KIYEOK(L) = 1101 SSANGKIYEOK(L) = 11A9 SSANGKIYEOK(T) -->
44                                        <i>ᄁ</i>
45                                        <i>ᆩ</i>
46                                <reset>ᄀᄉ</reset>       <!-- 1100 KIYEOK(L) + 1109 SIOS(L) = 11AA KIYEOK-SIOS(T) -->
47                                        <i>ᆪ</i>
48                                <reset>ᄂ</reset>        <!-- 1102 NIEUN(L) = 11AB NIEUN(T) -->
49                                        <i>ᆫ</i>
50                                <reset>ᄂᄌ</reset>       <!-- 1102 NIEUN(L) + 110C CIEUC(L) = 11AC NIEUN-CIEUC(T), also archaic 115C NIEUN-CIEUC(L) -->
51                                        <i>ᆬ</i>
52                                <reset>ᄂᄒ</reset>       <!-- 1102 NIEUN(L) + 1112 HIEUH(L) = 11AD NIEUN-HIEUH(T), also archaic 115D NIEUN-HIEUH(L) -->
53                                        <i>ᆭ</i>
54                                <reset>ᄃ</reset>        <!-- 1103 TIKEUT(L) = 11AE TIKEUT(T) -->
55                                        <i>ᆮ</i>
56                                <reset>ᄃᄃ</reset>       <!-- 1103 TIKEUT(L) + 1103 TIKEUT(L) = 1104 SSANGTIKEUT(L) -->
57                                        <i>ᄄ</i>
58                                <reset>ᄅ</reset>        <!-- 1105 RIEUL(L) = 11AF RIEUL(T) -->
59                                        <i>ᆯ</i>
60                                <reset>ᄅᄀ</reset>       <!-- 1105 RIEUL(L) + 1100 KIYEOK(L) = 11B0 RIEUL-KIYEOK(T) -->
61                                        <i>ᆰ</i>
62                                <reset>ᄅᄆ</reset>       <!-- 1105 RIEUL(L) + 1106 MIEUM(L) = 11B1 RIEUL-MIEUM(T) -->
63                                        <i>ᆱ</i>
64                                <reset>ᄅᄇ</reset>       <!-- 1105 RIEUL(L) + 1107 PIEUP(L) = 11B2 RIEUL-PIEUP(T) -->
65                                        <i>ᆲ</i>
66                                <reset>ᄅᄉ</reset>       <!-- 1105 RIEUL(L) + 1109 SIOS(L) = 11B3 RIEUL-SIOS(T) -->
67                                        <i>ᆳ</i>
68                                <reset>ᄅᄐ</reset>       <!-- 1105 RIEUL(L) + 1110 THIEUTH(L) = 11B4 RIEUL-THIEUTH(T) -->
69                                        <i>ᆴ</i>
70                                <reset>ᄅᄑ</reset>       <!-- 1105 RIEUL(L) + 1111 PHIEUPH(L) = 11B5 RIEUL-PHIEUPH(T) -->
71                                        <i>ᆵ</i>
72                                <reset>ᄅᄒ</reset>       <!-- 1105 RIEUL(L) + 1112 HIEUH(L) = 11B6 RIEUL-HIEUH(T), also archic 111A RIEUL-HIEUH(L) -->
73                                        <i>ᆶ</i>
74                                <reset>ᄆ</reset>        <!-- 1106 MIEUM(L) = 11B7 MIEUM(T) -->
75                                        <i>ᆷ</i>
76                                <reset>ᄇ</reset>        <!-- 1107 PIEUP(L) = 11B8 PIEUP(T) -->
77                                        <i>ᆸ</i>
78                                <reset>ᄇᄇ</reset>       <!-- 1107 PIEUP(L) + 1107 PIEUP(L) = 1108 SSANGPIEUP(L) -->
79                                        <i>ᄈ</i>
80                                <reset>ᄇᄉ</reset>       <!-- 1107 PIEUP(L) + 1109 SIOS(L) = 11B9 PIEUP-SIOS(T), also archaic 1121 PIEUP-SIOS(L) -->
81                                        <i>ᆹ</i>
82                                <reset>ᄉ</reset>        <!-- 1109 SIOS(L) = 11BA SIOS(T) -->
83                                        <i>ᆺ</i>
84                                <reset>ᄉᄉ</reset>       <!-- 1109 SIOS(L) + 1109 SIOS(L) = 110A SSANGSIOS(L) = 11BB SSANGSIOS(T) -->
85                                        <i>ᄊ</i>
86                                        <i>ᆻ</i>
87                                <reset>ᄋ</reset>        <!-- 110B IEUNG(L) = 11BC IEUNG(T) -->
88                                        <i>ᆼ</i>
89                                <reset>ᄌ</reset>        <!-- 110C CIEUC(L) = 11BD CIEUC(T) -->
90                                        <i>ᆽ</i>
91                                <reset>ᄌᄌ</reset>       <!-- 110C CIEUC(L) + 110C CIEUC(L) = 110D SSANGCIEUC(L) -->
92                                        <i>ᄍ</i>
93                                <reset>ᄎ</reset>        <!-- 110E CHIEUCH(L) = 11BE CHIEUCH(T) -->
94                                        <i>ᆾ</i>
95                                <reset>ᄏ</reset>        <!-- 110F KHIEUKH(L) = 11BF KHIEUKH(T) -->
96                                        <i>ᆿ</i>
97                                <reset>ᄐ</reset>        <!-- 1110 THIEUTH(L) = 11C0 THIEUTH(T) -->
98                                        <i>ᇀ</i>
99                                <reset>ᄑ</reset>        <!-- 1111 PHIEUPH(L) = 11C1 PHIEUPH(T) -->
100                                        <i>ᇁ</i>
101                                <reset>ᄒ</reset>        <!-- 1112 HIEUH(L) = 11C2 HIEUH(T) -->
102                                        <i>ᇂ</i>
103                                <!-- Korean modern complex vowels, decompose -->
104                                <reset>ᅡᅵ</reset>       <!-- 1161 A(V) + 1175 I(V) = 1162 AE(V) -->
105                                        <i>ᅢ</i>
106                                <reset>ᅣᅵ</reset>       <!-- 1163 YA(V) + 1175 I(V) = 1164 YAE(V) -->
107                                        <i>ᅤ</i>
108                                <reset>ᅥᅵ</reset>       <!-- 1165 EO(V) + 1175 I(V) = 1166 E(V) -->
109                                        <i>ᅦ</i>
110                                <reset>ᅧᅵ</reset>       <!-- 1167 YEO(V) + 1175 I(V) = 1168 YE(V) -->
111                                        <i>ᅨ</i>
112                                <reset>ᅩᅡ</reset>       <!-- 1169 O(V) + 1161 A(V) = 116A WA(V) -->
113                                        <i>ᅪ</i>
114                                <reset>ᅩᅡᅵ</reset>      <!-- 1169 O(V) + 1161 A(V) + 1175 I(V) = 116B WAE(V) -->
115                                        <i>ᅫ</i>
116                                <reset>ᅩᅵ</reset>       <!-- 1169 O(V) + 1175 I(V) = 116C OE(V) -->
117                                        <i>ᅬ</i>
118                                <reset>ᅮᅴ</reset>       <!-- 116E U(V) + 1174 YI(V) = 116F WEO(V) -->
119                                        <i>ᅯ</i>
120                                <reset>ᅮᅴᅵ</reset>      <!-- 116E U(V) + 1174 YI(V) + 1175 I(V) = 1170 WE(V) -->
121                                        <i>ᅰ</i>
122                                <reset>ᅮᅵ</reset>       <!-- 116E U(V) + 1175 I(V) = 1171 WI(V) -->
123                                        <i>ᅱ</i>
124                                <!-- Above are the standard root search collator rules. -->
125                                <!-- Below are the rules specific to de. -->
126                                <!-- Per Apple language group, these rules match phonebook collation below. -->
127                                <reset>a</reset>
128                                <x>
129                                        <s>ä</s>
130                                        <extend>e</extend>
131                                </x>
132                                <reset>A</reset>
133                                <x>
134                                        <s>Ä</s>
135                                        <extend>E</extend>
136                                </x>
137                                <reset>o</reset>
138                                <x>
139                                        <s>ö</s>
140                                        <extend>e</extend>
141                                </x>
142                                <reset>O</reset>
143                                <x>
144                                        <s>Ö</s>
145                                        <extend>E</extend>
146                                </x>
147                                <reset>u</reset>
148                                <x>
149                                        <s>ü</s>
150                                        <extend>e</extend>
151                                </x>
152                                <reset>U</reset>
153                                <x>
154                                        <s>Ü</s>
155                                        <extend>E</extend>
156                                </x>
157                        </rules>
158                </collation>
159                <collation type="standard">
160                </collation>
161                <collation type="phonebook">
162                        <rules>
163                                <reset>a</reset>
164                                <x>
165                                        <s>ä</s>
166                                        <extend>e</extend>
167                                </x>
168                                <reset>A</reset>
169                                <x>
170                                        <s>Ä</s>
171                                        <extend>E</extend>
172                                </x>
173                                <reset>o</reset>
174                                <x>
175                                        <s>ö</s>
176                                        <extend>e</extend>
177                                </x>
178                                <reset>O</reset>
179                                <x>
180                                        <s>Ö</s>
181                                        <extend>E</extend>
182                                </x>
183                                <reset>u</reset>
184                                <x>
185                                        <s>ü</s>
186                                        <extend>e</extend>
187                                </x>
188                                <reset>U</reset>
189                                <x>
190                                        <s>Ü</s>
191                                        <extend>E</extend>
192                                </x>
193                        </rules>
194                </collation>
195        </collations>
196</ldml>
Note: See TracBrowser for help on using the repository browser.