[Unicode]   Common Locale Data Repository : Bug Tracking Home | Site Map | Search
 

source: trunk/common/collation/sv.xml @ 5129

Revision 5125, 7.0 KB checked in by pedberg, 8 years ago (diff)

cldrbug 3037: Korean search collator: Add modern vowel decomps, put all modern rules in root etc.

  • Property mime-type set to text/xml
  • Property svn:eol-style set to native
  • Property svn:keywords set to Author Date Id Revision
  • Property svn:mime-type set to text/xml
Line 
1<?xml version="1.0" encoding="UTF-8" ?>
2<!DOCTYPE ldml SYSTEM "../../common/dtd/ldml.dtd">
3<ldml>
4        <identity>
5                <version number="$Revision$"/>
6                <generation date="$Date$"/>
7                <language type="sv"/>
8        </identity>
9        <collations validSubLocales="sv_FI sv_SE">
10                <default type="reformed"/>
11                <collation type="search" >
12                        <settings normalization="on"/>
13                        <!-- root search, suppress contractions for Thai, Lao -->
14                        <suppress_contractions>[เ-ไ ເ-ໄ]</suppress_contractions>
15                        <rules>
16                                <!-- root search rules for Arabic, Hebrew -->
17                                <reset>ا</reset>
18                                        <s>آ</s>
19                                        <s>أ</s>
20                                        <s>إ</s>
21                                <reset>و</reset>
22                                        <s>ؤ</s>
23                                <reset>ي</reset>
24                                        <s>ئ</s>
25                                        <s>ى</s>
26                                <reset>ه</reset>
27                                        <s>ة</s>
28                                <reset><last_primary_ignorable/></reset>
29                                        <s>׳</s>
30                                        <s>״</s>
31                                        <s>ـ</s>
32                                        <s>ٌ</s>
33                                        <s>ٍ</s>
34                                        <s>َ</s>
35                                        <s>ُ</s>
36                                        <s>ِ</s>
37                                        <s>ّ</s>
38                                        <s>ْ</s>
39                                        <s>ฺ</s>
40                                <!-- root search rules for modern Korean jamos -->
41                                <!-- Korean modern complex consonants, decompose: x(L) = CHOSEONG x, x(T) = JONGSEONG x -->
42                                <reset>ᄀ</reset>        <!-- 1100 KIYEOK(L) = 11A8 KIYEOK(T) -->
43                                        <i>ᆨ</i>
44                                <reset>ᄀᄀ</reset>       <!-- 1100 KIYEOK(L) + 1100 KIYEOK(L) = 1101 SSANGKIYEOK(L) = 11A9 SSANGKIYEOK(T) -->
45                                        <i>ᄁ</i>
46                                        <i>ᆩ</i>
47                                <reset>ᄀᄉ</reset>       <!-- 1100 KIYEOK(L) + 1109 SIOS(L) = 11AA KIYEOK-SIOS(T) -->
48                                        <i>ᆪ</i>
49                                <reset>ᄂ</reset>        <!-- 1102 NIEUN(L) = 11AB NIEUN(T) -->
50                                        <i>ᆫ</i>
51                                <reset>ᄂᄌ</reset>       <!-- 1102 NIEUN(L) + 110C CIEUC(L) = 11AC NIEUN-CIEUC(T), also archaic 115C NIEUN-CIEUC(L) -->
52                                        <i>ᆬ</i>
53                                <reset>ᄂᄒ</reset>       <!-- 1102 NIEUN(L) + 1112 HIEUH(L) = 11AD NIEUN-HIEUH(T), also archaic 115D NIEUN-HIEUH(L) -->
54                                        <i>ᆭ</i>
55                                <reset>ᄃ</reset>        <!-- 1103 TIKEUT(L) = 11AE TIKEUT(T) -->
56                                        <i>ᆮ</i>
57                                <reset>ᄃᄃ</reset>       <!-- 1103 TIKEUT(L) + 1103 TIKEUT(L) = 1104 SSANGTIKEUT(L) -->
58                                        <i>ᄄ</i>
59                                <reset>ᄅ</reset>        <!-- 1105 RIEUL(L) = 11AF RIEUL(T) -->
60                                        <i>ᆯ</i>
61                                <reset>ᄅᄀ</reset>       <!-- 1105 RIEUL(L) + 1100 KIYEOK(L) = 11B0 RIEUL-KIYEOK(T) -->
62                                        <i>ᆰ</i>
63                                <reset>ᄅᄆ</reset>       <!-- 1105 RIEUL(L) + 1106 MIEUM(L) = 11B1 RIEUL-MIEUM(T) -->
64                                        <i>ᆱ</i>
65                                <reset>ᄅᄇ</reset>       <!-- 1105 RIEUL(L) + 1107 PIEUP(L) = 11B2 RIEUL-PIEUP(T) -->
66                                        <i>ᆲ</i>
67                                <reset>ᄅᄉ</reset>       <!-- 1105 RIEUL(L) + 1109 SIOS(L) = 11B3 RIEUL-SIOS(T) -->
68                                        <i>ᆳ</i>
69                                <reset>ᄅᄐ</reset>       <!-- 1105 RIEUL(L) + 1110 THIEUTH(L) = 11B4 RIEUL-THIEUTH(T) -->
70                                        <i>ᆴ</i>
71                                <reset>ᄅᄑ</reset>       <!-- 1105 RIEUL(L) + 1111 PHIEUPH(L) = 11B5 RIEUL-PHIEUPH(T) -->
72                                        <i>ᆵ</i>
73                                <reset>ᄅᄒ</reset>       <!-- 1105 RIEUL(L) + 1112 HIEUH(L) = 11B6 RIEUL-HIEUH(T), also archic 111A RIEUL-HIEUH(L) -->
74                                        <i>ᆶ</i>
75                                <reset>ᄆ</reset>        <!-- 1106 MIEUM(L) = 11B7 MIEUM(T) -->
76                                        <i>ᆷ</i>
77                                <reset>ᄇ</reset>        <!-- 1107 PIEUP(L) = 11B8 PIEUP(T) -->
78                                        <i>ᆸ</i>
79                                <reset>ᄇᄇ</reset>       <!-- 1107 PIEUP(L) + 1107 PIEUP(L) = 1108 SSANGPIEUP(L) -->
80                                        <i>ᄈ</i>
81                                <reset>ᄇᄉ</reset>       <!-- 1107 PIEUP(L) + 1109 SIOS(L) = 11B9 PIEUP-SIOS(T), also archaic 1121 PIEUP-SIOS(L) -->
82                                        <i>ᆹ</i>
83                                <reset>ᄉ</reset>        <!-- 1109 SIOS(L) = 11BA SIOS(T) -->
84                                        <i>ᆺ</i>
85                                <reset>ᄉᄉ</reset>       <!-- 1109 SIOS(L) + 1109 SIOS(L) = 110A SSANGSIOS(L) = 11BB SSANGSIOS(T) -->
86                                        <i>ᄊ</i>
87                                        <i>ᆻ</i>
88                                <reset>ᄋ</reset>        <!-- 110B IEUNG(L) = 11BC IEUNG(T) -->
89                                        <i>ᆼ</i>
90                                <reset>ᄌ</reset>        <!-- 110C CIEUC(L) = 11BD CIEUC(T) -->
91                                        <i>ᆽ</i>
92                                <reset>ᄌᄌ</reset>       <!-- 110C CIEUC(L) + 110C CIEUC(L) = 110D SSANGCIEUC(L) -->
93                                        <i>ᄍ</i>
94                                <reset>ᄎ</reset>        <!-- 110E CHIEUCH(L) = 11BE CHIEUCH(T) -->
95                                        <i>ᆾ</i>
96                                <reset>ᄏ</reset>        <!-- 110F KHIEUKH(L) = 11BF KHIEUKH(T) -->
97                                        <i>ᆿ</i>
98                                <reset>ᄐ</reset>        <!-- 1110 THIEUTH(L) = 11C0 THIEUTH(T) -->
99                                        <i>ᇀ</i>
100                                <reset>ᄑ</reset>        <!-- 1111 PHIEUPH(L) = 11C1 PHIEUPH(T) -->
101                                        <i>ᇁ</i>
102                                <reset>ᄒ</reset>        <!-- 1112 HIEUH(L) = 11C2 HIEUH(T) -->
103                                        <i>ᇂ</i>
104                                <!-- Korean modern complex vowels, decompose -->
105                                <reset>ᅡᅵ</reset>       <!-- 1161 A(V) + 1175 I(V) = 1162 AE(V) -->
106                                        <i>ᅢ</i>
107                                <reset>ᅣᅵ</reset>       <!-- 1163 YA(V) + 1175 I(V) = 1164 YAE(V) -->
108                                        <i>ᅤ</i>
109                                <reset>ᅥᅵ</reset>       <!-- 1165 EO(V) + 1175 I(V) = 1166 E(V) -->
110                                        <i>ᅦ</i>
111                                <reset>ᅧᅵ</reset>       <!-- 1167 YEO(V) + 1175 I(V) = 1168 YE(V) -->
112                                        <i>ᅨ</i>
113                                <reset>ᅩᅡ</reset>       <!-- 1169 O(V) + 1161 A(V) = 116A WA(V) -->
114                                        <i>ᅪ</i>
115                                <reset>ᅩᅡᅵ</reset>      <!-- 1169 O(V) + 1161 A(V) + 1175 I(V) = 116B WAE(V) -->
116                                        <i>ᅫ</i>
117                                <reset>ᅩᅵ</reset>       <!-- 1169 O(V) + 1175 I(V) = 116C OE(V) -->
118                                        <i>ᅬ</i>
119                                <reset>ᅮᅴ</reset>       <!-- 116E U(V) + 1174 YI(V) = 116F WEO(V) -->
120                                        <i>ᅯ</i>
121                                <reset>ᅮᅴᅵ</reset>      <!-- 116E U(V) + 1174 YI(V) + 1175 I(V) = 1170 WE(V) -->
122                                        <i>ᅰ</i>
123                                <reset>ᅮᅵ</reset>       <!-- 116E U(V) + 1175 I(V) = 1171 WI(V) -->
124                                        <i>ᅱ</i>
125                                <!-- Above are the standard root search collator rules. -->
126                                <!-- Below are the rules specific to sv. -->
127                                <!-- These rules match standard collation below. -->
128                                <reset>D</reset>
129                                <s>đ</s>
130                                <t>Đ</t>
131                                <s>ð</s>
132                                <t>Ð</t>
133                                <reset>t</reset>
134                                <x><t>þ</t><extend>h</extend></x>
135                                <reset>T</reset>
136                                <x><t>Þ</t><extend>H</extend></x>
137                                <reset>v</reset>
138                                <t>V</t>
139                                <s>w</s>
140                                <t>W</t>
141                                <reset>Y</reset>
142                                <s>ü</s>
143                                <t>Ü</t>
144                                <s>ű</s>
145                                <t>Ű</t>
146                                <reset before="primary">ǀ</reset>
147                                <p>å</p>
148                                <t>Å</t>
149                                <p>ä</p>
150                                <t>Ä</t>
151                                <s>æ</s>
152                                <t>Æ</t>
153                                <s>ę</s>
154                                <t>Ę</t>
155                                <p>ö</p>
156                                <t>Ö</t>
157                                <s>ø</s>
158                                <t>Ø</t>
159                                <s>ő</s>
160                                <t>Ő</t>
161                                <s>œ</s>
162                                <t>Œ</t>
163                                <s>ô</s>
164                                <t>Ô</t>
165                        </rules>
166                </collation>
167                <collation type="standard">
168                        <rules>
169                                <reset>D</reset>
170                                <s>đ</s>
171                                <t>Đ</t>
172                                <s>ð</s>
173                                <t>Ð</t>
174                                <reset>t</reset>
175                                <x><t>þ</t><extend>h</extend></x>
176                                <reset>T</reset>
177                                <x><t>Þ</t><extend>H</extend></x>
178                                <reset>v</reset>
179                                <t>V</t>
180                                <s>w</s>
181                                <t>W</t>
182                                <reset>Y</reset>
183                                <s>ü</s>
184                                <t>Ü</t>
185                                <s>ű</s>
186                                <t>Ű</t>
187                                <reset before="primary">ǀ</reset>
188                                <p>å</p>
189                                <t>Å</t>
190                                <p>ä</p>
191                                <t>Ä</t>
192                                <s>æ</s>
193                                <t>Æ</t>
194                                <s>ę</s>
195                                <t>Ę</t>
196                                <p>ö</p>
197                                <t>Ö</t>
198                                <s>ø</s>
199                                <t>Ø</t>
200                                <s>ő</s>
201                                <t>Ő</t>
202                                <s>œ</s>
203                                <t>Œ</t>
204                                <s>ô</s>
205                                <t>Ô</t>
206                        </rules>
207                </collation>
208                <collation type="reformed">
209                        <rules>
210                                <reset>D</reset>
211                                <s>đ</s>
212                                <t>Đ</t>
213                                <s>ð</s>
214                                <t>Ð</t>
215                                <reset>t</reset>
216                                <x><t>þ</t><extend>h</extend></x>
217                                <reset>T</reset>
218                                <x><t>Þ</t><extend>H</extend></x>
219                                <reset>Y</reset>
220                                <s>ü</s>
221                                <t>Ü</t>
222                                <s>ű</s>
223                                <t>Ű</t>
224                                <reset before="primary">ǀ</reset>
225                                <p>å</p>
226                                <t>Å</t>
227                                <p>ä</p>
228                                <t>Ä</t>
229                                <s>æ</s>
230                                <t>Æ</t>
231                                <s>ę</s>
232                                <t>Ę</t>
233                                <p>ö</p>
234                                <t>Ö</t>
235                                <s>ø</s>
236                                <t>Ø</t>
237                                <s>ő</s>
238                                <t>Ő</t>
239                                <s>œ</s>
240                                <t>Œ</t>
241                                <s>ô</s>
242                                <t>Ô</t>
243                        </rules>
244                </collation>
245        </collations>
246</ldml>
Note: See TracBrowser for help on using the repository browser.