[Unicode]   Common Locale Data Repository : Bug Tracking Home | Site Map | Search
 

source: trunk/common/collation/nn.xml @ 5129

Revision 5125, 6.4 KB checked in by pedberg, 8 years ago (diff)

cldrbug 3037: Korean search collator: Add modern vowel decomps, put all modern rules in root etc.

  • Property mime-type set to text/xml
  • Property svn:eol-style set to native
  • Property svn:keywords set to Author Date Id Revision
  • Property svn:mime-type set to text/xml
Line 
1<?xml version="1.0" encoding="UTF-8" ?>
2<!DOCTYPE ldml SYSTEM "../../common/dtd/ldml.dtd">
3<ldml>
4        <identity>
5                <version number="$Revision$"/>
6                <generation date="$Date$"/>
7                <language type="nn" />
8        </identity>
9                <collations  validSubLocales="nn_NO">
10                        <collation type="search" >
11                                <settings normalization="on"/>
12                                <!-- root search, suppress contractions for Thai, Lao -->
13                                <suppress_contractions>[เ-ไ ເ-ໄ]</suppress_contractions>
14                                <rules>
15                                        <!-- root search rules for Arabic, Hebrew -->
16                                        <reset>ا</reset>
17                                                <s>آ</s>
18                                                <s>أ</s>
19                                                <s>إ</s>
20                                        <reset>و</reset>
21                                                <s>ؤ</s>
22                                        <reset>ي</reset>
23                                                <s>ئ</s>
24                                                <s>ى</s>
25                                        <reset>ه</reset>
26                                                <s>ة</s>
27                                        <reset><last_primary_ignorable/></reset>
28                                                <s>׳</s>
29                                                <s>״</s>
30                                                <s>ـ</s>
31                                                <s>ٌ</s>
32                                                <s>ٍ</s>
33                                                <s>َ</s>
34                                                <s>ُ</s>
35                                                <s>ِ</s>
36                                                <s>ّ</s>
37                                                <s>ْ</s>
38                                                <s>ฺ</s>
39                                        <!-- root search rules for modern Korean jamos -->
40                                        <!-- Korean modern complex consonants, decompose: x(L) = CHOSEONG x, x(T) = JONGSEONG x -->
41                                        <reset>ᄀ</reset>        <!-- 1100 KIYEOK(L) = 11A8 KIYEOK(T) -->
42                                                <i>ᆨ</i>
43                                        <reset>ᄀᄀ</reset>       <!-- 1100 KIYEOK(L) + 1100 KIYEOK(L) = 1101 SSANGKIYEOK(L) = 11A9 SSANGKIYEOK(T) -->
44                                                <i>ᄁ</i>
45                                                <i>ᆩ</i>
46                                        <reset>ᄀᄉ</reset>       <!-- 1100 KIYEOK(L) + 1109 SIOS(L) = 11AA KIYEOK-SIOS(T) -->
47                                                <i>ᆪ</i>
48                                        <reset>ᄂ</reset>        <!-- 1102 NIEUN(L) = 11AB NIEUN(T) -->
49                                                <i>ᆫ</i>
50                                        <reset>ᄂᄌ</reset>       <!-- 1102 NIEUN(L) + 110C CIEUC(L) = 11AC NIEUN-CIEUC(T), also archaic 115C NIEUN-CIEUC(L) -->
51                                                <i>ᆬ</i>
52                                        <reset>ᄂᄒ</reset>       <!-- 1102 NIEUN(L) + 1112 HIEUH(L) = 11AD NIEUN-HIEUH(T), also archaic 115D NIEUN-HIEUH(L) -->
53                                                <i>ᆭ</i>
54                                        <reset>ᄃ</reset>        <!-- 1103 TIKEUT(L) = 11AE TIKEUT(T) -->
55                                                <i>ᆮ</i>
56                                        <reset>ᄃᄃ</reset>       <!-- 1103 TIKEUT(L) + 1103 TIKEUT(L) = 1104 SSANGTIKEUT(L) -->
57                                                <i>ᄄ</i>
58                                        <reset>ᄅ</reset>        <!-- 1105 RIEUL(L) = 11AF RIEUL(T) -->
59                                                <i>ᆯ</i>
60                                        <reset>ᄅᄀ</reset>       <!-- 1105 RIEUL(L) + 1100 KIYEOK(L) = 11B0 RIEUL-KIYEOK(T) -->
61                                                <i>ᆰ</i>
62                                        <reset>ᄅᄆ</reset>       <!-- 1105 RIEUL(L) + 1106 MIEUM(L) = 11B1 RIEUL-MIEUM(T) -->
63                                                <i>ᆱ</i>
64                                        <reset>ᄅᄇ</reset>       <!-- 1105 RIEUL(L) + 1107 PIEUP(L) = 11B2 RIEUL-PIEUP(T) -->
65                                                <i>ᆲ</i>
66                                        <reset>ᄅᄉ</reset>       <!-- 1105 RIEUL(L) + 1109 SIOS(L) = 11B3 RIEUL-SIOS(T) -->
67                                                <i>ᆳ</i>
68                                        <reset>ᄅᄐ</reset>       <!-- 1105 RIEUL(L) + 1110 THIEUTH(L) = 11B4 RIEUL-THIEUTH(T) -->
69                                                <i>ᆴ</i>
70                                        <reset>ᄅᄑ</reset>       <!-- 1105 RIEUL(L) + 1111 PHIEUPH(L) = 11B5 RIEUL-PHIEUPH(T) -->
71                                                <i>ᆵ</i>
72                                        <reset>ᄅᄒ</reset>       <!-- 1105 RIEUL(L) + 1112 HIEUH(L) = 11B6 RIEUL-HIEUH(T), also archic 111A RIEUL-HIEUH(L) -->
73                                                <i>ᆶ</i>
74                                        <reset>ᄆ</reset>        <!-- 1106 MIEUM(L) = 11B7 MIEUM(T) -->
75                                                <i>ᆷ</i>
76                                        <reset>ᄇ</reset>        <!-- 1107 PIEUP(L) = 11B8 PIEUP(T) -->
77                                                <i>ᆸ</i>
78                                        <reset>ᄇᄇ</reset>       <!-- 1107 PIEUP(L) + 1107 PIEUP(L) = 1108 SSANGPIEUP(L) -->
79                                                <i>ᄈ</i>
80                                        <reset>ᄇᄉ</reset>       <!-- 1107 PIEUP(L) + 1109 SIOS(L) = 11B9 PIEUP-SIOS(T), also archaic 1121 PIEUP-SIOS(L) -->
81                                                <i>ᆹ</i>
82                                        <reset>ᄉ</reset>        <!-- 1109 SIOS(L) = 11BA SIOS(T) -->
83                                                <i>ᆺ</i>
84                                        <reset>ᄉᄉ</reset>       <!-- 1109 SIOS(L) + 1109 SIOS(L) = 110A SSANGSIOS(L) = 11BB SSANGSIOS(T) -->
85                                                <i>ᄊ</i>
86                                                <i>ᆻ</i>
87                                        <reset>ᄋ</reset>        <!-- 110B IEUNG(L) = 11BC IEUNG(T) -->
88                                                <i>ᆼ</i>
89                                        <reset>ᄌ</reset>        <!-- 110C CIEUC(L) = 11BD CIEUC(T) -->
90                                                <i>ᆽ</i>
91                                        <reset>ᄌᄌ</reset>       <!-- 110C CIEUC(L) + 110C CIEUC(L) = 110D SSANGCIEUC(L) -->
92                                                <i>ᄍ</i>
93                                        <reset>ᄎ</reset>        <!-- 110E CHIEUCH(L) = 11BE CHIEUCH(T) -->
94                                                <i>ᆾ</i>
95                                        <reset>ᄏ</reset>        <!-- 110F KHIEUKH(L) = 11BF KHIEUKH(T) -->
96                                                <i>ᆿ</i>
97                                        <reset>ᄐ</reset>        <!-- 1110 THIEUTH(L) = 11C0 THIEUTH(T) -->
98                                                <i>ᇀ</i>
99                                        <reset>ᄑ</reset>        <!-- 1111 PHIEUPH(L) = 11C1 PHIEUPH(T) -->
100                                                <i>ᇁ</i>
101                                        <reset>ᄒ</reset>        <!-- 1112 HIEUH(L) = 11C2 HIEUH(T) -->
102                                                <i>ᇂ</i>
103                                        <!-- Korean modern complex vowels, decompose -->
104                                        <reset>ᅡᅵ</reset>       <!-- 1161 A(V) + 1175 I(V) = 1162 AE(V) -->
105                                                <i>ᅢ</i>
106                                        <reset>ᅣᅵ</reset>       <!-- 1163 YA(V) + 1175 I(V) = 1164 YAE(V) -->
107                                                <i>ᅤ</i>
108                                        <reset>ᅥᅵ</reset>       <!-- 1165 EO(V) + 1175 I(V) = 1166 E(V) -->
109                                                <i>ᅦ</i>
110                                        <reset>ᅧᅵ</reset>       <!-- 1167 YEO(V) + 1175 I(V) = 1168 YE(V) -->
111                                                <i>ᅨ</i>
112                                        <reset>ᅩᅡ</reset>       <!-- 1169 O(V) + 1161 A(V) = 116A WA(V) -->
113                                                <i>ᅪ</i>
114                                        <reset>ᅩᅡᅵ</reset>      <!-- 1169 O(V) + 1161 A(V) + 1175 I(V) = 116B WAE(V) -->
115                                                <i>ᅫ</i>
116                                        <reset>ᅩᅵ</reset>       <!-- 1169 O(V) + 1175 I(V) = 116C OE(V) -->
117                                                <i>ᅬ</i>
118                                        <reset>ᅮᅴ</reset>       <!-- 116E U(V) + 1174 YI(V) = 116F WEO(V) -->
119                                                <i>ᅯ</i>
120                                        <reset>ᅮᅴᅵ</reset>      <!-- 116E U(V) + 1174 YI(V) + 1175 I(V) = 1170 WE(V) -->
121                                                <i>ᅰ</i>
122                                        <reset>ᅮᅵ</reset>       <!-- 116E U(V) + 1175 I(V) = 1171 WI(V) -->
123                                                <i>ᅱ</i>
124                                        <!-- Above are the standard root search collator rules -->
125                                        <!-- Below are the rules specific to nn. -->
126                                        <!-- These match standard rules below. -->
127                                        <reset>D</reset>
128                                        <s>đ</s>
129                                        <t>Đ</t>
130                                        <s>ð</s>
131                                        <t>Ð</t>
132                                        <reset>t</reset>
133                                        <x><t>þ</t><extend>h</extend></x>
134                                        <reset>T</reset>
135                                        <x><t>Þ</t><extend>H</extend></x>
136                                        <reset>Y</reset>
137                                        <s>ü</s>
138                                        <t>Ü</t>
139                                        <s>ű</s>
140                                        <t>Ű</t>
141                                        <reset before="primary">ǀ</reset>
142                                        <p>æ</p>
143                                        <t>Æ</t>
144                                        <s>ä</s>
145                                        <t>Ä</t>
146                                        <s>ę</s>
147                                        <t>Ę</t>
148                                        <p>ø</p>
149                                        <t>Ø</t>
150                                        <s>ö</s>
151                                        <t>Ö</t>
152                                        <s>ő</s>
153                                        <t>Ő</t>
154                                        <s>œ</s>
155                                        <t>Œ</t>
156                                        <p>å</p>
157                                        <t>Å</t>
158                                </rules>
159                        </collation>
160                        <collation type="standard" >
161                                <rules>
162                                        <reset>D</reset>
163                                        <s>đ</s>
164                                        <t>Đ</t>
165                                        <s>ð</s>
166                                        <t>Ð</t>
167                                        <reset>t</reset>
168                                        <x><t>þ</t><extend>h</extend></x>
169                                        <reset>T</reset>
170                                        <x><t>Þ</t><extend>H</extend></x>
171                                        <reset>Y</reset>
172                                        <s>ü</s>
173                                        <t>Ü</t>
174                                        <s>ű</s>
175                                        <t>Ű</t>
176                                        <reset before="primary">ǀ</reset>
177                                        <p>æ</p>
178                                        <t>Æ</t>
179                                        <s>ä</s>
180                                        <t>Ä</t>
181                                        <s>ę</s>
182                                        <t>Ę</t>
183                                        <p>ø</p>
184                                        <t>Ø</t>
185                                        <s>ö</s>
186                                        <t>Ö</t>
187                                        <s>ő</s>
188                                        <t>Ő</t>
189                                        <s>œ</s>
190                                        <t>Œ</t>
191                                        <p>å</p>
192                                        <t>Å</t>
193                                </rules>
194                        </collation  >
195                </collations>
196</ldml>
Note: See TracBrowser for help on using the repository browser.