<div dir="ltr"><div>I think it would be good to be able add years to the language data so if Tagalog was not offical because it became to expensive for Calefornia we could say it was official until 2016.</div><div><br></div><div>I think also this would be helpful to add for language population as this can be collected from different years, and it can be easier to see if the numbers are really outdated:<br><a href="http://www.unicode.org/cldr/charts/latest/supplemental/language_territory_information.html">http://www.unicode.org/cldr/charts/latest/supplemental/language_territory_information.html</a></div><div><br></div><div>I opened two tickets in CLDR:<br><a href="http://unicode.org/cldr/trac/ticket/9916">http://unicode.org/cldr/trac/ticket/9916</a></div><div><a href="http://unicode.org/cldr/trac/ticket/9915">http://unicode.org/cldr/trac/ticket/9915</a></div></div><div class="gmail_extra"><br><div class="gmail_quote">On 16 November 2016 at 18:42, Hugh Paterson <span dir="ltr"><<a href="mailto:hugh_paterson@sil.org" target="_blank">hugh_paterson@sil.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Also, after thinking about this some more: If as is the stated case with <span style="color:rgb(0,0,0);font-size:13px">San Francisco, <br></span><span><div><span style="color:rgb(0,0,0);font-size:13px">"San Francisco</span><span style="color:rgb(0,0,0);font-size:13px"> requires documents in 4 languages but provides telephone help for 200 languages.  Where's the line?"</span></div><div><span style="color:rgb(0,0,0);font-size:13px"><br></span></div></span><div><font color="#000000">How would you propose that Unicode database maintainers, de-list institutional support for languages when institutional support ceases.</font></div><div><font color="#000000"><br></font></div><div><font color="#000000">i.e. lets say that San Francisco falls on some hard times finically, and can not afford to operate in 4 languages, and reduces their support to two languages, How is this to be reflected in this proposal?</font></div><div><font color="#000000"><br></font></div><div><font color="#000000">- Hugh Paterson III</font></div></div><div class="gmail_extra"><br><div class="gmail_quote"><span>On Thu, Nov 10, 2016 at 2:54 PM, Mats Blakstad <span dir="ltr"><<a href="mailto:mats.gbproject@gmail.com" target="_blank">mats.gbproject@gmail.com</a>></span> wrote:<br></span><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid"><div><div class="h5"><div dir="ltr"><div>I'm continuing the discussion I started on <a href="mailto:unicode@unicode.org" target="_blank">unicode@unicode.org</a> here;<br><a href="http://unicode.org/pipermail/unicode/2016-September/003964.html" target="_blank">http://unicode.org/pipermail/u<wbr>nicode/2016-September/003964.h<wbr>tml</a><br></div>Sorry for posting in wrong email list!<div class="gmail_extra"><br><div class="gmail_quote">On 10 November 2016 at 20:34, Shawn Steele <span dir="ltr"><<a href="mailto:Shawn.Steele@microsoft.com" target="_blank">Shawn.Steele@microsoft.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">I didn't really say anything because this is kinda a hopeless task, but it seems like some realities are being overlooked.  I'm as curious about cataloguing everything as the next OCD guy, but a general solution doesn't seem practical.<br>
<br></blockquote><div>Maybe in addition to number of speakers we could give each language different values for the different territories like official / unofficial, lingua franca / home language, recognized / not recognized, etc<br></div><div>Maybe we could manage to work out some more objective categories?<br>Then the dataset could cover more different needs from those that want to use it to extract the list they want, as example they could make a list of only the official languages in the world sorted by country/territory, or maybe a list of all non-recognized languages in different countries.<br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">
* There are a *lot* of languages<br></blockquote><div>Yes :) We would not get all in the start, but if we could start add data for all the languages it can be done a little by little.<br></div><div>For myself I have many contacts that I think could be interested to help add information.<br></div><div> <br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">
* Many countries have speakers of several languages.<br>
        * In the US it's "obvious" that a list of languages for the US should include "English"<br></blockquote><div>For sure! The amount of speakers and that it is the primary language used speakse for it.<br></div><div>Beside, is not "US English" considered a variant of English?<br> <br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">
        * Spanish in the US is less obvious, however it is often considered important.<br></blockquote><div>It is interesting issue. Wasn't Spanish the primary language in southern US while being a part of Mexico?<br></div><div>And is there not a lot of Spanish newspapsers/media in the US?<br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">
        * However, that's a slippery slope as there are many other languages with large groups of speakers in the US.  If such a list includes Spanish, should it not include some of the others?  San Francisco requires documents in 4 languages but provides telephone help for 200 languages.  Where's the line?<br>
* Some languages happen in many places.  There are a disproportionate # of Englishes in CLDR, however Chinese is also spoken in lots of the countries that have English available in CLDR.  Yet CLDR doesn't provide data for those.<br></blockquote><div>Could you elaborate a little bit on this?<br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">
* Some language/region combinations could encounter geopolitical issues.  Like "it's not legal for that language to be spoken in XX" (but it happens).  Or "that language isn't YY country's language, it's ours!!!"<br></blockquote><div>We could add documented amount of speakers and tag it as "not recognized" <br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">
<br>
* The requirement "where the language has been spoken traditionally" is really, really subjective.  "Traditionally" the US is an English speaking country.  However, "Traditionally", there are hundreds of languages that have been spoken in the US.  What could be more "traditional" than the native American languages?  Yet those often have low numbers of speakers in the modern world, many are even dying languages.  There are also a number of "traditional" languages spoken by the original settlers.  Which differ than the set of languages spoken by modern immigrants.  So your data is going to be very skewed depending on the person collecting the data's definition of "traditional".<br></blockquote><div>I agree "traditional" is not a good way to collect the data.<br></div><div>Native american languages should of course be mapped with territories despite having few speakers. The point is to map all languages.<br></div><div>We could also map languages with years, English is then spoken in what is USA today since 1607.<br></div><div>Urdu is spoken in what is today Norway since the 1970th.<br></div><div> <br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">
<br>
Ethnologue has done a decent job of identifying languages and the number of speakers in various areas, but it would be very difficult to draw a line that selected "English and Spanish in the US" and was consistent with similar real-life impacts across the other languages.  Do you pick the top n languages for each country?  Languages with > x million speakers (that would be very different in small and big countries).  Languages with > y% of the speakers in the different countries?<br></blockquote><div><br></div><div>If Ethnologue have done it, I guess it should also be possible for CLDR also?<br></div><div>However they operate with a category "Immigrant Languages", I'm not sure what that means, ss exmaple Turkish, the second most spoken language of Germany, is marked it as "Immigrant Language", I'm not sure how they make that distinction.<br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">
<br>
And then you end up with each application having to figure out it's own bar.  Applications will have different market considerations and other reasons to target different regions/languages.  That would skew any list for their purposes.<br></blockquote><div><br></div><div>Okay, at least it could be possible to add number of speakers for other "6,300 lesser-known living languages", or why do we cut the list to 675 languages?<br></div><br></div><br></div></div>
<br></div></div><span>______________________________<wbr>_________________<br>
CLDR-Users mailing list<br>
<a href="mailto:CLDR-Users@unicode.org" target="_blank">CLDR-Users@unicode.org</a><br>
<a href="http://unicode.org/mailman/listinfo/cldr-users" target="_blank" rel="noreferrer">http://unicode.org/mailman/lis<wbr>tinfo/cldr-users</a><br>
<br></span></blockquote></div><br></div>
</blockquote></div><br></div>