[Unicode]   Common Locale Data Repository : Bug Tracking Home | Site Map | Search
 

Changeset 11202


Ignore:
Timestamp:
02/16/15 23:26:25 (4 years ago)
Author:
pedberg
Message:

cldrbug 7979: Yiddish search tailoring should import root search

File:
1 edited

Legend:

Unmodified
Added
Removed
  • trunk/common/collation/yi.xml

    r10671 r11202  
    1414                <collations> 
    1515                        <collation type="search" > 
    16                                 <settings normalization="on"/> 
    17                                 <!-- root search, suppress contractions for Thai, Lao --> 
    18                                 <suppress_contractions>[เ-ไ ເ-ໄ]</suppress_contractions> 
     16                                <import source="und" type="search"/> 
    1917                                <cr><![CDATA[ 
    20                                         # root search rules for Symbols 
    21                                         &'='<'≠' 
    22                                         # root search rules for Arabic, Hebrew, plus two Hebrew-specific additions 
    23                                         &ا      # 0627 ARABIC LETTER ALEF 
    24                                                         <<<ﺎ<<<ﺍ        # FE8E, FE8D: FINAL FORM, ISOLATED FORM 
    25                                                 <<آ             # 0622 ARABIC LETTER ALEF WITH MADDA ABOVE 
    26                                                         <<<ﺂ<<<ﺁ        # FE82, FE81: FINAL FORM, ISOLATED FORM 
    27                                                 <<أ             # 0623 ARABIC LETTER ALEF WITH HAMZA ABOVE 
    28                                                         <<<ﺄ<<<ﺃ        # FE84, FE83: FINAL FORM, ISOLATED FORM 
    29                                                 <<إ             # 0625 ARABIC LETTER ALEF WITH HAMZA BELOW 
    30                                                         <<<ﺈ<<<ﺇ        # FE88, FE87: FINAL FORM, ISOLATED FORM 
    31                                         &و      # 0648 ARABIC LETTER WAW 
    32                                                         <<<ۥ    # 06E5: SMALL WAW 
    33                                                         <<<ﻮ<<<ﻭ        # FEEE, FEED: FINAL FORM, ISOLATED FORM 
    34                                                 <<ؤ             # 0624 ARABIC LETTER WAW WITH HAMZA ABOVE 
    35                                                         <<<ﺆ<<<ﺅ        # FE86, FE85: FINAL FORM, ISOLATED FORM 
    36                                         &ي      # 064A ARABIC LETTER YEH 
    37                                                         <<<ۦ    # 06E6: ARABIC SMALL YEH 
    38                                                         <<<ﻳ<<<ﻴ<<<ﻲ<<<ﻱ        # FEF3, FEF4, FEF2, FEF1: INITIAL FORM, MEDIAL FORM, FINAL FORM, ISOLATED FORM 
    39                                                 <<ئ             # 0626 ARABIC LETTER YEH WITH HAMZA ABOVE 
    40                                                         <<<ﺋ<<<ﺌ<<<ﺊ<<<ﺉ        # FE8B, FE8C, FE8A, FE89: INITIAL FORM, MEDIAL FORM. FINAL FORM, ISOLATED FORM 
    41                                                 <<ى             # 0649 ARABIC LETTER ALEF MAKSURA 
    42                                                         <<<ﯨ<<<ﯩ        # FBE8, FBE9: UIGHUR KAZAKH KIRGHIZ ALEF MAKSURA INITIAL FORM, MEDIAL FORM 
    43                                                         <<<ﻰ<<<ﻯ        # FEF0, FEEF: FINAL FORM, ISOLATED FORM 
    44                                         &ه      # 0647 ARABIC LETTER HEH 
    45                                                         <<<ﻫ<<<ﻬ<<<ﻪ<<<ﻩ        # FEEB, FEEC, FEEA, FEE9: INITIAL FORM, MEDIAL FORM, FINAL FORM;, ISOLATED FORM 
    46                                                 <<ة             # 0629 ARABIC LETTER TEH MARBUTA 
    47                                                         <<<ﺔ<<<ﺓ        # FE94, FE93: FINAL FORM, ISOLATED FORM 
    48                                         &[last primary ignorable]<<׳    # 05F3 HEBREW PUNCTUATION GERESH, ignorable 
    49  
     18                                        ‎&׳     # 05F3 HEBREW PUNCTUATION GERESH, ignorable 
    5019                                                <<''    # APOSTROPHE, Hebrew-specific addition, should match GERESH 
    51                                                 <<״     # 05F4 HEBREW PUNCTUATION GERSHAYIM, ignorable 
     20                                        ‎&״     # 05F4 HEBREW PUNCTUATION GERSHAYIM, ignorable 
    5221                                                <<'\"'  # QUOTATION MARK, Hebrew-specific addition, should match GERSHAYIM  
    53                                                 <<ـ     # 0640 ARABIC TATWEEL 
    54                                                 # Don't need explicit entries for 064B - 0652 ARABIC FATHATAN - ARABIC SUKUN; 
    55                                                 # these are already ignorable at level 1, and are not involved in contractions 
    56                                                 <<ฺ     # 0E3A THAI CHARACTER PHINTHU 
    57                                         # root search rules for modern Korean jamos 
    58                                         # Korean modern complex consonants, decompose: x(L) = CHOSEONG x, x(T) = JONGSEONG x 
    59                                         &ᄀ      # 1100 KIYEOK(L) = 11A8 KIYEOK(T) 
    60                                                 =ᆨ 
    61                                         &ᄀᄀ     # 1100 KIYEOK(L) + 1100 KIYEOK(L) = 1101 SSANGKIYEOK(L) = 11A9 SSANGKIYEOK(T) 
    62                                                 =ᄁ=ᆩ 
    63                                         &ᄀᄉ     # 1100 KIYEOK(L) + 1109 SIOS(L) = 11AA KIYEOK-SIOS(T) 
    64                                                 =ᆪ 
    65                                         &ᄂ      # 1102 NIEUN(L) = 11AB NIEUN(T) 
    66                                                 =ᆫ 
    67                                         &ᄂᄌ     # 1102 NIEUN(L) + 110C CIEUC(L) = 11AC NIEUN-CIEUC(T), also archaic 115C NIEUN-CIEUC(L) 
    68                                                 =ᆬ 
    69                                         &ᄂᄒ     # 1102 NIEUN(L) + 1112 HIEUH(L) = 11AD NIEUN-HIEUH(T), also archaic 115D NIEUN-HIEUH(L) 
    70                                                 =ᆭ 
    71                                         &ᄃ      # 1103 TIKEUT(L) = 11AE TIKEUT(T) 
    72                                                 =ᆮ 
    73                                         &ᄃᄃ     # 1103 TIKEUT(L) + 1103 TIKEUT(L) = 1104 SSANGTIKEUT(L) 
    74                                                 =ᄄ 
    75                                         &ᄅ      # 1105 RIEUL(L) = 11AF RIEUL(T) 
    76                                                 =ᆯ 
    77                                         &ᄅᄀ     # 1105 RIEUL(L) + 1100 KIYEOK(L) = 11B0 RIEUL-KIYEOK(T) 
    78                                                 =ᆰ 
    79                                         &ᄅᄆ     # 1105 RIEUL(L) + 1106 MIEUM(L) = 11B1 RIEUL-MIEUM(T) 
    80                                                 =ᆱ 
    81                                         &ᄅᄇ     # 1105 RIEUL(L) + 1107 PIEUP(L) = 11B2 RIEUL-PIEUP(T) 
    82                                                 =ᆲ 
    83                                         &ᄅᄉ     # 1105 RIEUL(L) + 1109 SIOS(L) = 11B3 RIEUL-SIOS(T) 
    84                                                 =ᆳ 
    85                                         &ᄅᄐ     # 1105 RIEUL(L) + 1110 THIEUTH(L) = 11B4 RIEUL-THIEUTH(T) 
    86                                                 =ᆴ 
    87                                         &ᄅᄑ     # 1105 RIEUL(L) + 1111 PHIEUPH(L) = 11B5 RIEUL-PHIEUPH(T) 
    88                                                 =ᆵ 
    89                                         &ᄅᄒ     # 1105 RIEUL(L) + 1112 HIEUH(L) = 11B6 RIEUL-HIEUH(T), also archic 111A RIEUL-HIEUH(L) 
    90                                                 =ᆶ 
    91                                         &ᄆ      # 1106 MIEUM(L) = 11B7 MIEUM(T) 
    92                                                 =ᆷ 
    93                                         &ᄇ      # 1107 PIEUP(L) = 11B8 PIEUP(T) 
    94                                                 =ᆸ 
    95                                         &ᄇᄇ     # 1107 PIEUP(L) + 1107 PIEUP(L) = 1108 SSANGPIEUP(L) 
    96                                                 =ᄈ 
    97                                         &ᄇᄉ     # 1107 PIEUP(L) + 1109 SIOS(L) = 11B9 PIEUP-SIOS(T), also archaic 1121 PIEUP-SIOS(L) 
    98                                                 =ᆹ 
    99                                         &ᄉ      # 1109 SIOS(L) = 11BA SIOS(T) 
    100                                                 =ᆺ 
    101                                         &ᄉᄉ     # 1109 SIOS(L) + 1109 SIOS(L) = 110A SSANGSIOS(L) = 11BB SSANGSIOS(T) 
    102                                                 =ᄊ=ᆻ 
    103                                         &ᄋ      # 110B IEUNG(L) = 11BC IEUNG(T) 
    104                                                 =ᆼ 
    105                                         &ᄌ      # 110C CIEUC(L) = 11BD CIEUC(T) 
    106                                                 =ᆽ 
    107                                         &ᄌᄌ     # 110C CIEUC(L) + 110C CIEUC(L) = 110D SSANGCIEUC(L) 
    108                                                 =ᄍ 
    109                                         &ᄎ      # 110E CHIEUCH(L) = 11BE CHIEUCH(T) 
    110                                                 =ᆾ 
    111                                         &ᄏ      # 110F KHIEUKH(L) = 11BF KHIEUKH(T) 
    112                                                 =ᆿ 
    113                                         &ᄐ      # 1110 THIEUTH(L) = 11C0 THIEUTH(T) 
    114                                                 =ᇀ 
    115                                         &ᄑ      # 1111 PHIEUPH(L) = 11C1 PHIEUPH(T) 
    116                                                 =ᇁ 
    117                                         &ᄒ      # 1112 HIEUH(L) = 11C2 HIEUH(T) 
    118                                                 =ᇂ 
    119                                         # Korean modern complex vowels, decompose 
    120                                         &ᅡᅵ     # 1161 A(V) + 1175 I(V) = 1162 AE(V) 
    121                                                 =ᅢ 
    122                                         &ᅣᅵ     # 1163 YA(V) + 1175 I(V) = 1164 YAE(V) 
    123                                                 =ᅤ 
    124                                         &ᅥᅵ     # 1165 EO(V) + 1175 I(V) = 1166 E(V) 
    125                                                 =ᅦ 
    126                                         &ᅧᅵ     # 1167 YEO(V) + 1175 I(V) = 1168 YE(V) 
    127                                                 =ᅨ 
    128                                         &ᅩᅡ     # 1169 O(V) + 1161 A(V) = 116A WA(V) 
    129                                                 =ᅪ 
    130                                         &ᅩᅡᅵ    # 1169 O(V) + 1161 A(V) + 1175 I(V) = 116B WAE(V) 
    131                                                 =ᅫ 
    132                                         &ᅩᅵ     # 1169 O(V) + 1175 I(V) = 116C OE(V) 
    133                                                 =ᅬ 
    134                                         &ᅮᅴ     # 116E U(V) + 1174 YI(V) = 116F WEO(V) 
    135                                                 =ᅯ 
    136                                         &ᅮᅴᅵ    # 116E U(V) + 1174 YI(V) + 1175 I(V) = 1170 WE(V) 
    137                                                 =ᅰ 
    138                                         &ᅮᅵ     # 116E U(V) + 1175 I(V) = 1171 WI(V) 
    139                                                 =ᅱ 
    14022                                ]]></cr> 
    14123                        </collation> 
Note: See TracChangeset for help on using the changeset viewer.