<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Sun, Nov 26, 2017 at 6:02 PM, Kip Cole <span dir="ltr"><<a href="mailto:kipcole9@gmail.com" target="_blank">kipcole9@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div style="word-wrap:break-word"><div>So now I understand better about the application of the radical data and I need to decide where to place them. You note: "For ICU, I move the implicit-weight lead bytes much higher, to make more room for large Han tailorings. You can choose your implicit-weight allocation freely” </div><div><br></div><div>Where do you place them? (I know, I should read the code and I will but the learning curve is steep!)</div></div></blockquote><div><br></div><div>I have a piece of code in the ICU "genuca" tool (not one of the installed ICU tools) that takes the number of Han characters for which we need implicit primaries (from one of the early lines in FractionalUCA.txt) and calculates the number of lead bytes for 3-byte weights with a certain gap size (for tailoring between Han characters). Given the current gap size, it uses three lead bytes FB..FD. FE is for 4-byte unassigned-implicit primaries, and FF is for "trailing weights" where there are currently only a couple including for U+FFFD and U+FFFF.</div><div>See <a href="https://sites.google.com/site/icusite/design/collation/bytes">https://sites.google.com/site/icusite/design/collation/bytes</a></div><div><br></div><div>These may move in the future when there are more Han characters, we decide on a different gap size, leave more room for trailing weights, etc.</div><div><br></div><div>The primary lead bytes from somewhere near 80 to currently FA are used for large CJK tailorings, so that we get a decent number of two-byte weights.</div><div><br></div><div>markus</div></div></div></div>